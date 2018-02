OT 16:52:01 23-02-2018AM1651OT.007УАСГ- преподавател - Соти Мицова - научна публикацияТЕОРЕТИЧНИ АСПЕКТИНА МАШИННИЯПРЕВОДI. ВъведениеВ съвременното общество процесите на глобализацията водят до нарастване на обмена на информация в реално време. Разширяването на географския обхват на страните, активно участващи в интернационални и мултинационални мултиезикови икономически структури, изисква активна работна комуникация на различни езици. Това предполага превод в много кратки срокове на големи обеми информация (кореспонденция, материали, документация и т.н.) и е сериозно предизвикателство за професионалните преводачи. Обемите често надвишават възможностите им бързо и качествено да отговорят на нарастващите изисквания към тяхната услуга. В търсене на адекватно решение, вниманието се насочва към възможностите, които предлага машинният превод (МП).Целта на настоящото проучване е да се направи кратък исторически обзор на теоретичните аспекти и методите на МП от възникването на идеята през 17 в. до днес.II. Исторически обзор на научните изследвания в областта на МП.Идеята за търсене на механични методи за превод се заражда още през 17 в., когато с развитието на националните езици, латинският започва постепенно да отпада като универсално средство за научна комуникация. МП обаче започва да се оформя като дисциплина от началото на 20 в. с появата на електронно изчислителните машини (ЕИМ). Развитието на МП можем да разделим условно на няколко основни периода.Период от 17 в. до края на 19 в.Интересът на учените към преодоляване на езиковата бариера чрез използване на различни методи и машинни устройства, за да се намали зависимостта от човешкия фактор, датира още от 17 в. Тогава се засилва необходимостта да се подобри международната комуникация и да се търсят нови "рационални" и "логически" средства и да се замени зависимостта от латинския език в научната сфера. Първоначално, вниманието на учени като Лайбниц и Декарт е насочено към създаване на "универсален език". Според тях така ще се създадат специални "речници", където думите от различни езици, имащи еднакво значение, ще получат един и същ цифров код/шифър. За първи път такива "механични речници" са публикувани от Кейв Бек (1657), Йоаким Бехер(1661) и Атанасиус Кирхер(1663). Особено важни за развитието на тази идея са заслугите на английския философ Джон Уилкинс, който публикува своя труд върху оригиналния смисъл и философския език през 1668 г. В него той прави опит да даде логическа и рационална основа за създаването на междуезикови еквиваленти (Хътчинс,1986). На практика той прави опит чрез кодификация, обхващаща универсални понятия и символи, да се достигне до универсален "посредник в превода" или т.нар. интерлингва. Опитите за търсене на "единно кодиране" на езиците продължават през вековете, като всички учени се сблъскват с проблема за съществените различия между отделните езици, които не могат да бъдат преодолени и чрез добре структурирани лексикални съответствия. До края на 19 в. обаче, няма принципно нови идеи.Период от началото на 20 в. до 1949 г.В началото на 20 в. интересът към МП се възражда. Френските математици Луи Котюра и Леополд Ло публикуват своя труд "История на универсалния език"(1903), в който представят редица примери за теоретичните достижения през вековете в търсене на "механични универсални речници" и на "кодова граматика". През 1924 г. естонският в. "Vabamaa" публикува съобщение за пишеща машина-преводач, демонстрирана от изобретателя А. Вахер (Илиев,2014). По-сериозни резултати се появяват през 30-те години с появата на механичните калкулатори. През 1933 г. са издадени два независими патента за механичен превод - във Франция на Аструни, и в Русия - на Троянски, (Хътчинс и Ловцкий, 2000). Прототипът на Аструни е представен през 1937 г. и предизвиква огромен интерес сред администрациите на френските железници и пощи. Проектът на Троянски е за тристепенен превод, в който електро-механична машина участва във втория етап като автоматизиран речник. Въпреки че се явява предвестник на компютърния преводач и предвижда възможност на двуезиков и мултиезиков превод, той не получава подкрепа.В този период основна цел е постигане на превод от различни естествени езици чрез автоматизирани механични средства.Тогава се формира и теорията на информацията, която става основа на декодиращите алгоритми, които започват да се прилагат в редица системи за МП. Важен е приносът на разработките по теория на информацията на Клод Шенънот 40-те години (Журафски и Мартин, 2008).След Втората световна война, с появата на ЕИМ, МП навлиза в нов етап. За първи път идеята да се използва ЕИМ за превод на документи от един език на друг е лансирана през 1947 г. от американския учен Уорън Уивър. Публикуваният от него манифест за проблемите на автоматичния МП, озаглавен "Превод" (1949), се явява крайъгълен камък за последващото развитие на МП.Периодът на 50-те и 60-те годиниСъщинската история на МП реално започва през втората половина на 20 век. Основните центрове за научни изследвания и експериментални разработки са в САЩ. През 1954 г. в университета в Джорджтаун се провежда първото публично представяне на резултатите от съвместния им проект с IBM в областта на МП. Преводът е от руски на английски език, като се използват опростени граматични правила и словесен обхват. Екипът дава надежди, че в рамките на 5 години МП ще бъде масово използван. Огромният интерес към проекта води и до сериозно финансиране, което дава силен тласък на развитието на МП. През 50-те години вниманието е насочено главно към директния метод (directapproach) и МП, основан на правила (rule-based), но се пренебрегва ролята на синтаксиса и групирането на думите във фрази и словосъчетания за подобряване на превода.От началото на 60-те години в изследванията започват да навлизат активно трансферните и статистическите методи, при които важна роля се отдава на назависимостта на МП от синтаксиса и словесния контекст. Езиците, с които се работи, са основно английски (като изходен) и руски, френски и немски (като целеви). МП е обявен от САЩ за приоритет в сфери като ВВС, армията и ЦРУ. През 1964 г. е създаден и Специален комитет по приложна лингвистика (ALPAC) към Американската национална академия на науките. Две години по-късно Комитетът публикува доклад, чиито констатации и прогнози попарват ентусиазма и очакванията за бърз напредък в МП. Той става известен като "Черната книга на машинния превод", заради изключително скептична оценка на постиженията и на перспективите за внедряване на МП в приоритетните сфери в обозримо бъдеще. След него финансирането на проекти в тази област рязко спада не само в САЩ, но и във Великобритания, Канада и Франция. Руските учени обаче продължават да работят много интензивно, като изследователските им методи не се различават принципно от тези на чуждестранните им колеги, но за разлика от тях, те включват по-голям набор от целеви езици - румънски, турски, арабски, японски и др. Български учени също участват в различни проекти, но българският език не е целеви. В Чехия се работи основно върху английско-чешки МП.Периодът между 70-те и 80-те годиниПрез този период се разраства международната търговия и се засилва интересът към МП като средство за оптимизиране на време и разходи за превод на административна и техническа документация от и на множество езици. Крайъгълен камък в развитието на МП се явява системата Систран (Systran), внедрена от ВВС на САЩ (1970) и от Европейската комисия (ЕК) през 1976 г. Тогава е финализирана канадската система за автоматизиран превод на климатични прогнози от английски на френски, която се използва в Канада и до днес. Японските учени също работят по създаване на нови системи за МП. В продължение на над 20 години ЕК финансира проекта Eurotra за превод между езиците на ЕС. За съжаление, той не дава краен практически приложим продукт, но има положително въздействие върху изследванията и разработките в областта на МП в партньорските страни.В края на 80-те години се наблюдава значително поевтиняване на универсалните ЕИМ и увеличаване на техния капацитет. Появяват се и микро/персонални компютри и софтуер за текстообработка. Те навлизат бързо в структурите на администрацията и бизнеса. Това се явява предпоставка, изследователите да се насочат към търсене на нови подходи за МП. Развиват се статистическите и трансферните модели, търсят се решения, съответстващи на динамиката на потребителските нужди.Периодът на 90-те години и началото на 21 в.През 90-те години се оформят и първите електронно оборудвани работни места за преводачи с цел подобряване на качеството и продуктивността при превода. Интернет навлиза и се налага като основна среда за комуникация, а това от своя страна води до разработването и на нови продукти за превод онлайн. Фокусът е към създаване на различни приложения, които улесняват работата на преводачите, като все повече се предлагат възможности за мултиезиков превод. Развитието на софтуера за персоналните компютри и спадът в цените на техниката от началото на 21 в. отварят пътя на масовото им използване не само в големите корпорации, но и в по-малки фирми, опериращи на международния пазар. Изследванията се насочват основно към разработване на кастъмизирани висококачествени комерсиални продукти за МП в реално време. Технологиите за разпознаване и синтез на говор също навлизат в продуктите за превод в реално време.Модерните технологии на МП имат за цел да се преодолеят бариерите за използването на МП от крайните потребители, да се минимизира необходимостта от въвеждащо обучение в програмата, а машинният преводач автоматично да определя контекста при превода, за да се намали времето за последваща човешка редакция.III. Развитие на методите за МП от началото на 20 в. до днесРанните системи за превод се основават главно на директния превод от зададена двойка езици, единият от които е английски. Първоначално се използват системи от речници, които постепенно се развиват чрез добавяне на смислов и синтактични анализи. Прилага се подход основан на правила, при който е трудно машината да определи контекста в изходния материал и да го пресъздаде съответно на целевия език. Друг широко използван метод е интерлингвалният, при който преводът е на два етапа и се използва система "посредник", която включва общи за обхванатите езици семантични и синтактични елементи. Трансферният подход е близък до интерлигвалния, но при него преводът е на 3 етапа и се предлага по-голяма дълбочина на анализа и абстракцията. Тези методи, водещи началото си от 50-60 години, продължават да се развиват и усъвършенстват и през следващите десетилетия, но, като цяло, вниманието се насочва приоритетно към отделяне на семантичния от синтактичния анализ.През последните десетилетия на 20 в. обемите за текстообработка нарастват значително и това дава възможност да се развиват корпусните методи за МП, които водят до нова епоха в развитието на технологиите. Те позволяват преводната информация да се извлича направо от вече съществуващи преводни текстове (успоредни корпуси) и това ги прави в голяма степен езиково независими (Хътчинс, 1997).Тенденциите в МП от началото на 21 в. са за комбиниране на различни подходи. При този хибриден метод успоредно се използват множество системи за МП. Крайният вариант на превода е комбинация от резултатите от работата на различни подсистеми. При съвременните невронни (neural) системи са преодолени редица недостатъци при МП. Те обаче все още са доста скъпи и имат проблеми с превода на редки думи и термини.С напредъка на технологиите за разпознаване и синтез на говор започват изследвания за превод на реч в реално време. Една от главните задачи пред МП днес е той звуково максимално да се доближава до човешкия - когато се чете, да не личи, че текстът е написан от машина.IV. Програми за МПНай общо можем да разделим превода с помощта на софтуер на две основни групи:неспециализиран превод - не изисква използване на специална терминологияспециализиран превод: изисква се отлично качество и прецизност в конкретна област, като напр. архитектура, медицина, право и т.н.Сред най-популярните и масово достъпни програми-преводачи са Google Translate, Bing Translator, Prompt, Free translation,Reverso, Babel Fish и др. Сред българските програми за машинен превод са Translat, Bultra и WebTrance. Много добри резултати при неспециализирания превод дават редица платени софтуерни продукти като Babylon 10 Translator Pro, Power Translator Premium 14, Prompt Standard 9, White Smoke 2011 и др. За нуждите на специализирания превод обаче се изисква разработване на специализирани приложения, съобразени с нуждите на конкретния потребител и със спецификата на текстовете и използваната терминология. Качеството на софтуера предопределя и качеството на превода.V. ИзводиОт направения исторически преглед се вижда, че темповете на развитие и усъвършенстване на МП са изключително интензивни през последните 20 години и са предопределени от напредъка в ИТ и от нарасналото търсене на преводачески услуги вследствие на глобализацията. МП продължава да се развива като дисциплина, инкорпорираща достиженията на лингвистиката, теорията на превода, информатиката и компютърната лингвистика.Кръгът от потребители на МП в наши дни непрекъснато се разширява и обхваща както работещите в сферата на администрацията на национално и международно ниво, така и тези в сферата на търговията, индустрията, маркетинга, науката, литературата и т.н. Всички те очакват от продуктите за МП да им осигурят качествен бърз превод и на ниска цена. Превод, в който да има логическа свързаност на текста и смислова (семантична) и синтактична адекватност, и да минимизира необходимостта от последваща човешка редакция.Библиография:ALPAC (1966): ALPAC. Language andmachines: computers intranslation andlinguistics. A report by the Automatic Language Processing Advisory Committee, Division of Behavioral Sciences, National Academy of Sciences, National Research Council, Washington, 1966.Hutchins, John. MachineTranslation: Past, Present, Future. Ellis Horwood/ Wiley,Chichester/NewYork,1986.Hutchins, John. First steps in mechanical translation.paper given at MTSummit VI, San Diego,1997Hutchins,Johnand Evgenii Lovtskii."Petr Petrovich Troyanskii (1894-1950): A forgotten pioneer of mechanical translation". In: Machine Translation 15.3,2000Jurafsky, Danieland James H. Martin. Speechand Language Processing 2nded. Prentice Hall, 2008.Соти Мицова преподавател в УАСГ/АМ/