Дисципліни:
Реферат
На тему:

Машинний переклад.

Дисципліна: Інше
ВНЗ:НУ «ЛП»
Формат: Word Doc

Переглядів: 2553 Додано: 2015-09-26




Частина тексту

1.Машинний переклад: елементи хронології

 Початок робіт з машинного перекладу (МП) або автоматичного перекладу (АП) відносять до 50 - х рр. XX ст. Ідея машинного перекладу виникла чисто через практичні потреби. На початку 50 -х рр. відбувається інформаційний вибух - істотно зростають обсяги науково -технічної інформації . Переклад всієї наукової та технологічної періодики виявляється неможливим. Додатковий імпульс дослідженням у галузі МП дала «холодна війна» : 2 суспільно - політичні системи уважно стежили за розвитком науково -технічного потенціалу одна одної. Саме з цієї причини багато перших закордонних систем МП працюють з російською мовою.

Формальна дата початку ери машинного перекладу – 1949 р. Цього року відомий американський фахівець з дешифрування Уоррен Уівер склав меморандум, в якому теоретично обгрунтував принципову можливість створення систем МП. Він виходив з того, що структурна подібність між мовами може бути формально описаною, а це є необхідною умовою розробки алгоритмів для ЕОМ. Меморандум був розісланий двомстам фахівцям в галузі лінгвістики, дешифрування і теорії програмування . З цього часу в США з'являються колективи розробників МП ( в Массачусетському технологічному інституті -МІТ, в Каліфорнійському університеті, в Національному бюро стандартів у Лос-Анджелесі , в Техаському університеті).Перша міжнародна конференція з МП організовується в 1952 р. в MIT . Нарешті , в 1954 р. проводиться відомий Джорджтаунський експеримент , в процесі якого здійснюється переклад з російської мови на англійську. Хоча програма працювала зі словником всього лише в 250 слів, успіх цього експерименту стимулював подальші дослідження в області МП.

У СРСР перший експеримент з МП пройшов в 1955 р. Було здійснено переклад на російську мову текстів з прикладної математики. До цього часу відноситься початок робіт з МП в Інституті прикладної математики АН СРСР під керівництвом О. С. Кулагіної та І. А. Мельчук . Колектив розробників створив три експериментальні системи МП - з французької мови на російську ( ФР- 1 ) , з англійської на російську і з французької на російську (у новому варіанті). У 1959 р. відкривається Лабораторія машинного перекладу в МГПИ - ІЄ ім. М. Тореза ( нині Московський державний лінгвістичний університет), в якої виникли ідеї, які багато в чому передбачили подальший розвиток теорії МП і якоюсь мірою систем штучного інтелекту - концепція мови -посередника, поняття моделі управління слова, роль словника в МП і т.д. Серія публікацій цій лабораторії під загальною назвою «МП і ПЛ » ( Машинний переклад і прикладна лінгвістика) , зробила істотний вплив не тільки на прикладну, а й на теоретичну лінгвістику . Багато з цих ідей знайшли відображення в проекті системи англо-російського автоматичного перекладу ( АРАП ), яка, однак, не була завершена.

Спочатку передбачалося, що системи МП не повинні бути обмежені проблемною сферою. Іншими словами, машинний переклад повинен здійснюватися на текстах будь-яких типів - від науково-технічних до художніх. Однак досить швидко виявилося, що це неможливо. Виявилися дві групи причин - лінгвістичні та екстралінгвістичні. Лінгвістичні - зводилися до того, що для розробки систем МП недостатньо наявних знань про функціонування мовної системи. Потрібні фундаментальні теоретичні розробки в області вивчен ня мови, оскільки традиційній лінгвістиці (за дуже невеликими винятками) була чужа сама постановка завдання машинного перекладу, яка передбачала створення комп'ютерних моделей аналізу і синтезу висловлювань. Крім того, різноманіття функцій мови, переважно імпліцитний характер мовної здатності людини істотно ускладнювали формалізацію знань про мовну систему . До екстралінгвістичних причин можна віднести усвідомлення того факту, що процес розуміння - найважливіша складова природного перекладу - далеко не забезпечується чисто лінгвістичним аналізом мовного повідомлення. Розуміння грунтується на знаннях адресата, його здатності робити висновки, крім того воно пов'язане з комунікативною установкою адресата в даній ситуації спілкування і т. д.

Виникнення розчарувань було навіть формально зафіксовано в 1966 р. в доповіді консультативного комітету з автоматичної обробки природних мов ( ALPAC ) при Національній академії наук США. Основний акцент в доповіді робився на тому, що жодна з систем МП не виправдала сподівань, які на неї покладались ні в аспекті якості перекладу, ні в аспекті економічності. За наведеним там даними, «природний» переклад виявився істотно дешевшим від машинного. Доповідь привела до згортання державного фінансування проектів створення систем МП в США, що прямо вплинуло на позицію державних структур по відношенню до підтримки розробок в області машинного перекладу в усьому світі. Однак незважаючи на скепсис щодо перспектив МП , багато з перших систем МП, створених в 60 -і рр , продовжували експлуатуватися замовниками. Більшість кінцевих користувачів мало цікавила якість перекладу (низька якість - один з найважливіших пунктів звинувачення в доповіді комітету ALPAC). Для споживачів було важливіше швидко в загальних рисах оцінити інформаційний потік в науковій і технічній періодиці, а потім матеріал, який викликав інтерес, перекладався звичайним способом - за участю перекладача. Крім того, не припинилося фінансування досліджень у сфері МП приватними компаніями, зацікавленими не тільки у відстеженні світових тенденцій науково -технічного прогресу, але і в перекладі величезних обсягів технічної документації, що вимагається при експорті та імпорті різної продукції, в тому числі і високотехнологічної.

З середини сімдесятих років у всьому світі спостерігається стійке зростання інтересу до МП. У Москві в 1974 р. в інституті ІНФОРМ- ЕЛЕКТРО почалися роботи зі створення системи франко- російського перекладу ( ЕТАП - 1) та системи англо- російського перекладу ( ЕТАП -2). У цьому ж році створюється Всесоюзний центр перекладів (ВЦП), в якому ряд наукових колективів працює над системами машинного перекладу - Ампару (англо- російський переклад) , НЕРПА (німецько- російський переклад) і ФРАП (французько- російський переклад). З цього часу промислові системи машинного перекладу розробляються і широко використовуються в США , Європі і Японії.

 

2.Основні ділянки використання машинного перекладу

Початкові ілюзії про універсальність застосування МП швидко розсіялися . Власне, і попит на машинний переклад художніх текстів практично був відсутній. Тим часом область текстів науково-технічної інформації настільки велика, що людський переклад просто не в змозі її охопити. У службах науково-технічної інформації різних відомств і організацій використання систем МП показало високу ефективність. Вимоги до якості перекладу виявилися досить низькими, що дозволило використовувати в цій сфері системи МП першого покоління. Друга сфера застосування МП - великі міжнародні організації, що використовують документи на багатьох мовах . До числа таких організацій належить, наприклад, ООН і офіційні структури Європейського Союзу, в яких документи повинні з'являтися практично одночасно на всіх мовах членів ЄС. Проте вимоги до якості перекладу тут досить високі і етап постредагування необхідний навіть для систем МП з гарними характеристиками .

Третя велика область використання МП - технічна документація. Експорт продукції - особливо високотехнологічної - вимагає перекладу великих масивів технічних описів та інструкцій. Так, експлуатаційна документація до літаків досягає 100 і більше тис. сторінок. Компанії, пов'язані з експортом, готові навіть нормалізувати внутрішню мову, яка використовується для технічної документації, щоб полегшити автоматичний переклад цих документів на вихідну мову. Наприклад, в Європейській асоціації авіавиробників (European Association of Aerospace Manufactures) під керівництвом Ван Дейка був розроблений спеціальний стандарт АЕСМА « спрощеної англійськї мови» , що накладає серйозні обмеження на використовувану в документації лексику та синтаксичні конструкції. Цей стандарт використовується, зокрема , в корпорації « Боїнг».

В цілому можна зробити висновок, що в даний час системи МП успішно функціонують в тих областях, де або не потрібна абсолютна точність перекладу, або існують суттєві обмеження на використання структур природної мови, де вхідна мова нормована і спрощена. До числа проблемних областей останнього типу належить, наприклад, підмова метеозведень . У Канаді з 1975 р. в промисловому режимі функціонує система МП Taum - Метео, яка перекладає тексти метеозведень з англійської мови на

французьку.

 

3.Типові помилки машинного перекладу

Якість машинного перекладу визначає ступінь складності науково-технічного тексту: чим складніший текст, тим більше помилок траплятиметься в здійсненому машиною перекладі. Такі помилки значною мірою дезінформують перекладача щодо предметно-логічного та прагматичного значення у вихідному тексті, неточно окреслюють предмет висловлення.

Існує ряд типових помилок, що виникають у ході машинного перекладу.

До граматичних проблем перекладу можна віднести неправильне розпізнавання типів зв'язків між членами речення, що в свою чергу порушує порядок членів речення, заміна одного члена речення на інший, комп'ютерному перекладачеві досить складно дається розпізнавання родової та відмінкової форм.

До лексичних проблем, перш за все, відноситься неправильний принцип відбору словникових відповідників, повна або часткова неперекладність, неправильний переклад термінології.

Практика використання машинного перекладу показує, що 20 % речень вихідного тексту перекладається неправильно. Причинами такої низької якості систем автоматизованого перекладу є недоліки словника і недосконалий алгоритмічний синтез пропозицій з неправильною синтаксичною структурою.Для подолання цих недоліків потрібні серйозні зміни в лінгвістичному ПЗ шляхом збільшення лексичних одиниць словника, постійного удосконалювання лінгвістичних описів синтаксичних конструкцій та правил кодування та перекодування.

Насамперед машинний переклад виконує функцію допоміжного інструмента в роботі перекладача, оптимізує процес перекладу, обробляє великі обсяги інформації. Результати машинного перекладу неодмінно підлягають редагуванню з метою запобігти проникненню помилок у кінцевий текст перекладу.

 

4.Сучасний стан машинного перекладу

Протягом багатьох років науковці в галузях лінгвістики, кібернетики, інформатики вели інтенсивні пошуки моделей і алгоритмів людського мислення і розробок програм, але так сталося, що жодна з наук – філософія, психологія, лінгвістика – не в змозі запропонувати такого алгоритму. Таким чином, штучний інтелект як “генератор знань” ще не створений, машинний переклад є частково структурованим завданням, а тому втручання людини в створення  досконалих перекладів буде потрібне завжди і її треба, як слід, цього навчати.

Від проблеми перекладу нам нікуди не піти ; вирішити ж її скільки-небудь задовільним чином за рахунок людської праці(без повної автоматизації процесу перекладу) ні зараз , ні коли -або в майбутньому не вдасться. Системи МП вже почали завойовувати визнання в середовищі користувачів , і тенденція до цього швидше за все збережеться і буде набирати силу , по мірі того як користувачі пред'являтимуть все більш високі вимоги до якості роботи і швидкодії систем МП, а постачальники цих систем будуть йти їм назустріч. Ті півмільйона сторінок текстів , які були перекладені за допомогою ЕОМ в 1984 р., - це при існуючому попиті на переклад всього лише крапля в морі. Звичайно, потреба в наукових дослідженнях дуже велика, але деякі з сучасних і майбутніх систем МП, що мають практичне значення , будуть і надалі користуватися успіхом виключно з економічних міркувань - а в середовищі користувачів це фактично єдине мірило успіху або невдачі .