Дисципліни:
Курсова робота
На тему:

Моделювання внутрішніх станів технічних запитів агентно-орієнтованих систем, створених на основі програм i* та КАМС.

Дисципліна: Системи автоматизованого перекладу
ВНЗ:НУ «ЛП»
Формат: Word Doc

Переглядів: 1307 Додано: 2013-07-15




Частина тексту

Зміст

  1. Вступ
  2. Формулювання задачі автоматизованого перекладу
  3. Методи та засоби автоматизованого перекладу
  4. Алгоритм автоматизованого пекладу
  5. Приклад комп’ютерного перекладу
  6. Висновки
  7. Список використаної літератури
  8. Додаток

Класифікація лінгвістичного ПЗ:

PROMT Professional 7.0 (розробник - ПРОМТ, Росія)
Одне з основних достоїнств цієї програми, що відразу впадає в очі, - її багатий інтерфейс. Працюючи з перекладачем, користувач може підключати велику кількість додаткових настройок, а потім зберігати їх у вигляді шаблонів для подальшого використання. Крім того, PROMT вбудовується в основні офісні застосування і уміє розпізнавати графічні файли за допомогою інтегрованої OCR-системи.

У текстах, на яких тестувався даний перекладач, практично не залишилося нерозпізнаних слів, а всі непереведені слова виявилися назвами і адресами. До речі, програма дозволяє занести всі подібні слова в список «Зарезервованих слів» і тоді при перекладі вони залишаться без змін. Слова, що не вимагають перекладу, можна або транслітеріровать, або зберегти мову оригіналу. У випадку якщо програма пропонує відразу декілька варіантів перекладу слова, його основне значення виділяється підкресленням, а варіанти приводяться в дужках.

Однією з важливих переваг даної програми є функція підключення тематичних словників. Це, звичайно, не нововведення, проте на практиці далеко не у всіх тестованих програм підключення словників впливає на якість перекладу. Користуватися словниками ПРОМТ виявилося зручнішим, ніж тематичними словарними базами інших програм, а якість перекладеного тексту після підключення словників значно змінювалася в кращу сторону. Наприклад, словосполучення «Court costs» тільки PROMT перевів як «судові витрати» (у юридичній термінології існує саме таке визначення судових витрат). Systran запропонував варіант «судові витрати» (також прийнятний варіант, але не точний), а Pragma вигадала «королівський» переклад - «придворні витрати». Після підключення Юридичного словника PROMT 7.0 грамотно перевів фразу «This Agreement may be terminated» як «Договір може бути розірваний» (до застосування словника фраза звучала досить безглуздо: «Угода може бути закінчена»).

При роботі з текстами однакової тематичної спрямованості користувач може зберегти всі настройки, задані їм при перекладі, у вигляді шаблонів тематик. Це зручно в тому випадку, якщо, наприклад, співробітникові компанії доводиться перекладати документи на одну і ту ж тему або по декількох темах, що періодично повторюються.

Pragma 4.0 (розробник - Trident, Україна)
Компанія Trident, український конкурент ПРОМТ, позиціонує свій продукт як допоміжне застосування, яке не є самостійною програмою, а інтегрується практично в будь-яке комп'ютерне застосування. Дійсно, відразу після інсталяції програми додаткове меню Pragma з'явилося справа на інформаційній панелі Word, а також в програмах Outlook, Internet Explorer, Wordpad і навіть в Блокноті.

>Крім того, остання версія Pragma містить майже сотню тематичних словників. Вибрати необхідну для перекладу тематику можна у випадному діалоговому вікні відразу після натиснення опції «Переклад». Користувач може також створювати власні словники. Для роботи із словниками розроблена спеціальна утиліта - «Коректор». У комплект Pragma також входить спеціальне застосування для швидкого перекладу - Pragma Fast Translation, але під час роботи з ним не можна вводити текст або змінювати його.

Хоча алгоритм роботи з програмою досить простий, іноді виникали деякі складнощі. Наприклад, в керівництві користувача Pragma написано, що програма виділяє зеленим кольором слова, декілька варіантів перекладу, що мають, а червоним кольором - незнайомі слова. Проте при перекладі трудового договору виділеними виявилися тільки слова з альтернативними варіантами перекладу.

З погляду якості перекладу було виявлено декілька неточностей. По-перше, поняття «Занесення автомобіля» було переведене як «гальмівна колодка». Звичайно, цей термін теж відноситься до автомобільної тематики, проте використання його в даному тексті абсолютно недоречно, а інших варіантів перекладу програма не запропонувала.

Дивно, але при перекладі трудового договору після підключення тематичного словника «Право» в тексті не змінилося жодне слово! Слово «parties» Pragma перевела як «партії» (у юриспруденції цей термін означає «сторони»), тоді як решта програм справилася з перекладом цього слова.

Разом з тим Pragma, єдина з програм, що тестувалися, після підключення тематичного словника змогла правильно перевести словосполучення «rear-wheel» - «задні колеса». У першому випадку Pragma запропонувала варіант «тильні колеса».

З незрозумілих причин в різних офісних додатках Pragma пропонує різні додаткові функції перекладу. Наприклад, користуючись Pragma в Microsoft Outlook, можна транслітеріровать слова. А ось в програмі Word можна встановлювати інші додаткові настройки перекладу, але функція транслітерациі тут відсутня.

Pragma містить менше мовних напрямів перекладу, чим PROMT і Systran. У її активі - англійська, російська, німецька, українська і латиська мови.

Systran 5.0 (розробник - Systran, Франція)
Французький перекладач Systran працює як з додатків Word, Excel, Outlook, Internet Explorer, PowerPoint, так і як самостійна програма.

Слід зазначити, що інтерфейс Systran надає користувачеві безліч можливостей для поліпшення якості перекладу. Проте при роботі з ним виникли певні труднощі. Виявилось, що деякі кнопки, розташовані на панелі інструментів, не дублюються командами основного меню програми. Складність роботи полягає також в тому, що програма зберігає задані настройки перекладеного тексту для всіх документів, що знов відкриваються. В результаті текст звичайного електронного листа може містити, наприклад, терміни з області авіації або автомобілебудування. Щоб цього не відбулося, необхідно відключити в новому документі тематичні настройки попереднього документа.

Недолік Systran, який відразу впадає в очі, - це створення програмою власних слів, що складаються з букв російського алфавіту. Замість того щоб залишити слово непереведеним, система «придумує» неіснуюче слово або додає зайві букви. Так, простий вираз «So that» був переведений як «ТАК, СТО», написано через кому і заголовними буквами. А слово «перший» Systran чомусь пише з буквою «а» на кінці - «первийа». Особливо «вдало» програма винаходить прикметники - «ледістий», «штільовий». А переведене слово «якщо» чомусь було написане великими латинськими буквами.

У перекладі Systran набагато частіше, ніж у інших програм-перекладачів, зустрічаються непереведені слова (так, в текстах-завданнях непереведеними залишилися слова «paid», «following», «front-wheel» і ін.). Слова, написані заголовними буквами, програма не розпізнає і залишає на мові оригінала. У деяких пропозиціях не були враховані особливості граматичних конструкцій російської мови і використаний невірний порядок слів (наприклад, пропозиція закінчувалася словами «напрям, котор колеса дивляться на»), а також не були дотримані часи дієслів («ви не будете управляли»).

Англо-російський перекладач SKIIN 2.0 (розробник - SKIIN, Росія)
Компанії ПРОМТ, Trident і Systran є безперечними лідерами в розробці систем машинного перекладу з іноземних мов на російський, проте в Інтернеті нам вдалося знайти ще одну програму, можливості якої нам також захотілося протестувати. Йдеться про російського перекладача SKIIN, який має єдиний напрям перекладу, - з англійського на російський. По своїх можливостях цій програмі ще далеко до визнаних лідерів. SKIIN здійснює підрядковий переклад тексту без урахування синтаксичних і морфологічних особливостей мови.

До достоїнств програми можна віднести простоту інтерфейсу і інструкцію по роботі з перекладачем, викладену на однойменному сайті. Після перекладу тексту можна подивитися статистику незнайомих слів, що повторюються. У переведеному варіанті тексту повністю були відсутні граматичні конструкції, програма обмежилася підставлянням перекладу кожного слова із словника. Очевидним плюсом програми SKIIN є те, що будь-який охочий може безкоштовно викачати її з Інтернету.

Програми порівнювалися по критеріях, приведених в таблиці (вищий бал - 5).

Лідером змагання виявилася російська система перекладу PROMT, яка без зусиль справилася з перекладом різних з тематики текстів, а якість її перекладу підвищилася за рахунок підключення додаткових настройок. В цілому переклад PROMT можна назвати цілком професійним.

Друге місце за якістю перекладу отримала українська програма Pragma. На жаль, функція підключення тематичних словників не завжди дає бажаний результат, в деяких випадках переклад тексту без словника коректніший, ніж після його підключення. Невеликий набір мовних напрямів також можна віднести до мінусів цієї програми.

Не дивлячись на свою популярність і великий запас мовних напрямів, французька система Systran справилася з англо-російським перекладом тексту гірше за конкурентів. Розробникам Systran необхідно в першу чергу працювати над узгодженням в процесі перекладу граматичних конструкцій англійської і російської мов. Крім того, програма залишає велику кількість слів непереведеною і часто пропонує варіанти перекладу, що не існують в російській мові, що говорить про необхідність поповнення її словарного запасу і додавання в бази перекладів специфічних термінів з різних тематичних областей.

Причини низької якості САП у рамках другого напрямку такі:

Існує як мінімум два варіанти застосування САП, коли вони можуть надати значну допомогу, не дивлячись на всі свої обмеження. По-перше, такі системи корисні в ситуаціях, коли необхідно швидко ознайомитися з великим текстом на іноземній мові і в цілому оцінити його зміст. Успішно вирішити поставлену задачу цілком здатні системи, які мають достатньо великий і орієнтований на дану ПО словник і можуть працювати з вхідними текстами складної структури — які містять таблиці, іншорідні частини тексту, абревіатури і т. п. По-друге, САП, при її вмілому використанні, може в декілька разів збільшити продуктивність праці професіональних перекладачів, які використовують ПК. При такому застосуванні програма-перекладач служить для отримання проміжного результату, який потім підлягає постредагуванню.

Рекомендації для якісної роботи із САП

При підготовці тексту для машинного перекладу на іноземну мову варто враховувати дві умови. По-перше, усі тексти повинні відноситися до однієї вузької тематики (ПО), для якої створений і налагоджений спеціалізований словник. По-друге, писати тексти спрощеною мовою. Тому: Крім того, для одержання якісного перекладу має сенс використовувати програму перекладу тричі. Перший раз —для виявлення нових слів і поповнення словника, другий — щоб визначити складні для машинного перекладу місця оригіналу для наступного редагування у вихідному тексті. Третій раз -для одержання остаточного перекладу. Але навіть кращі електронні перекладачі ще далекі від досконалості, тому і після третього «проходу» текст виникає потреба постредагування перекладу.

Типові помилки машинного перекладу

Аналіз типових помилок, що допускаються існуючими САП, вказав на таку низку категорій: І. Неперекладені слова. У вихідному тексті української та російською мовами дуже часто вживаються англійські словоформи. Причини: відсутність англійського слова в автоматичному словнику, наявність орфографічної помилки в написанні слова або неправильно, не повністю зроблений морфологічний аналіз англійської словоформи та ін. Урахування цієї категорії помилок є поки що справою людини. Людина повинна додатково заповнювати користувацький словник, але при цьому вона повинна вивірити морфологічну структуру внесеного слова.