Форми організації взаємодії ЕОМ і людини при машинному перекладі
автоматизований переклад
Замість «машинний» іноді вживається слово автоматичний. що не впливає на зміст. Однак термін автоматизований переклад має зовсім інше значення - при ньому програма просто допомагає людині перекладати тексти.
Автоматизований переклад передбачає такі форми взаємодії:
- Частково автоматизований переклад: наприклад, використання перекладачем-людиною комп'ютерних словників.
- Системи з поділом праці: комп'ютер навчений переводити тільки фрази жорстко заданої структури (але робить це так, щоб виправляти за ним не було потрібно), а все, не вклався в схему, віддає людині.
В англомовній термінології також розрізняються терміни англ. machine translation, MT (повністю автоматичний переклад) і англ. machine-aided або англ. machine-assisted translation (MAT) (автоматизований); якщо ж треба позначити і те, і інше, пишуть M (A) T.
Існують два принципово різних підходи до побудови алгоритмів машинного перекладу: заснований на правилах (rule-based) і статистичний, або заснований на статистиці (statistical-based). Перший підхід є традиційним і використовується більшістю розробників систем машинного перекладу (ПРОМТ в Росії, SYSTRAN у Франції, Linguatec в Німеччині та ін.) [1] До другого типу відносяться популярний сервіс Перекладач Google [2]. а також новий сервіс від ABBYY [3]
Статистичний машинний переклад
Статистичний машинний переклад - це різновид машинного перекладу тексту, заснована на порівнянні великих обсягів мовних пар. Мовні пари - тексти, що містять пропозиції на одній мові і відповідні їм пропозиції на другому, можуть бути як варіантами написання двох пропозицій людиною - носієм двох мов, так і набором пропозицій і їх перекладів, виконаних людиною. Таким чином статистичний машинний переклад має властивість «самонавчання». Чим більше в розпорядженні є мовних пар і чим точніше вони відповідають один одному, тим краще результат статистичного машинного перекладу. Під поняттям «статистичного машинного перекладу» мається на увазі загальний підхід до вирішення проблеми перекладу, який заснований на пошуку найбільш ймовірного перекладу пропозиції з використанням даних, отриманих з двомовної сукупності текстів. Як приклад двомовної сукупності текстів можна назвати парламентські звіти, які представляють собою протоколи дебатів в парламенті. Двомовні парламентські звіти видаються в Канаді, Гонконгу та інших країнах; офіційні документи Європейського економічного співтовариства видаються на 11 мовах; а Організація об'єднаних націй публікує документи на декількох мовах. Як виявилося, ці матеріали являють собою безцінні ресурси для статистичного машинного перекладу.
Історія машинного перекладу
Думка використовувати ЕОМ для перекладу була висловлена в 1947 році в США. відразу після появи перших ЕОМ. Перша публічна демонстрація машинного перекладу (так званий Джорджтаунський експеримент) відбулася в 1954 році. Незважаючи на примітивність тієї системи (словник в 250 слів, граматика з 6 правил, переклад кількох простих фраз), цей експеримент отримав широкий резонанс: почалися дослідження в Англії. Болгарії. НДР. Італії. Китаї. Франції. ФРН. Японії та інших країнах; в тому ж 1954 року й в СРСР.
До середини 1960-х в США для практичного використання було надано дві системи російсько-англійського перекладу:
- MARK (у Департаменті іноземної техніки ВПС США);
- GAT (розробка Джорджтаунського університету, використовувалася в Національній лабораторії атомної енергії в Окридже і в центрі Євратому в м Іспра, Італія).
Однак створена для оцінки подібних систем комісія ALPAC прийшла до висновку, що в силу низької якості машинно перекладених текстів ця діяльність в умовах США нерентабельна. Хоча комісія рекомендувала продовжувати і поглиблювати теоретичні розробки, в цілому її висновки привели до зростання песимізму. зниження фінансування, часто до повного припинення робіт з цієї тематики.
Проте, в ряді країн дослідження тривали, чому сприяв постійний прогрес обчислювальної техніки. Особливо істотним чинником стала поява міні-і персональних комп'ютерів. а з ними все більш складних словникових, пошукових і т. п. систем, орієнтованих на роботу з природномовної даними. Росла і необхідність в перекладі як такому зважаючи на зростання міжнародних зв'язків. Все це призвело до нового підйому цієї галузі, яка відбулась приблизно з середини 1970-х. У 1980-і настав час широкого практичного використання перекладацьких систем, склався ринок комерційних розробок по цій темі.
Втім, мрії, з якими людство півстоліття тому взялося за завдання машинного перекладу, в значній мірі залишаються мріями: високоякісний переклад текстів широкої тематики, як і раніше недосяжний. Однак безсумнівним є прискорення роботи перекладача при використанні систем машинного перекладу: за оцінками кінця 1980-х, до п'яти разів.
В даний час існує безліч комерційних проектів машинного перекладу. Одним з піонерів в області машинного перекладу була компанія Systran. У Росії великий внесок в розвиток машинного перекладу внесла група під керівництвом проф. Р. Г. Піотровського (Російський державний педагогічний університет імені А. І. Герцена. Санкт-Петербург).
якість перекладу
Можливо, цей розділ містить оригінальне дослідження.
Додайте посилання на джерела, в іншому випадку він може бути видалений.
Додаткові відомості можуть бути на сторінці обговорення.
Найчастіше подібні жарти пов'язані з тим, що ваша програма розпізнає контекст фрази і переводить терміни дослівно, до того ж не відрізняючи власних імен від звичайних слів. Той же перекладач ПРОМТ перетворює «Лев Толстой» в «Lion Thick» ( «товстий лев»), «bra-ket notation» в «примітка Кеті ліфчика», «Lie algebra» - в «алгебру Брехні», «eccentricity vector» - в «вектор оригінальності», «Shawnee Smith» в «індіанець племені Шоні Сміт» і т. п. Перекладач Google. навпаки, слово «rice» часто брав за прізвище держсекретаря США.
Примітки
- ↑ Машинний переклад: правила проти статистики
- ↑ Перекладач Google
- ↑ Новий підхід ABBYY до перекладу текстів
- ↑ Втім, це не так: Polyglossum (sic) - це електронний словник [1]. програма того ж класу, що і Lingvo. самостійно перекладати не здатна. У той час він існував у версіях для DOS і Windows 3.x і, поступаючись Lingvo і Context за якістю загального словника, мав рекордний обсяг спеціалізованих словників. До того ж окремі помилки перекладу видають підробку - після машинного перекладу текст редагувався вручну [2]. «Чудовий приклад тексту, отриманого нібито за допомогою медико-біологічного словника в результаті перекладу керівництва по роботі з драйверами миші, називається" гуртівника Миші "... не вірю в чистоту експерименту: напевно там не обійшлося без поправок, внесених до тексту рукою людини.»
- ↑ Наш кіт народив трьох кошенят - двох білих і одного афроамериканця