Навука і тэхналогіі33

Як гэта працуе: машынны пераклад з розных моваў

7 студзеня 1954 года ў штаб-кватэры карпарацыі IBM у Нью-Ёрку адбыўся так званы «Джорджтаўнскі эксперымент», падчас якога быў паспяхова прадэманстраваны цалкам аўтаматычны пераклад некалькіх дзясяткаў розных сказаў з рускай мовы на ангельскую.

Той пераклад быў вельмі просты: у слоўніку было ўсяго 250 словаў і 6 правілаў, таму сістэма магла перакласці толькі некалькі самых прымітыўных фраз. Але мэтай было прыцягненне ўвагі да машыннага перакладу і дэманстрацыя яго перспектыўнасці.

Цяпер, дзякуючы інтэрнэту, кожнае незнаёмае слова ці сказ можна за некалькі секунд перакласці на родную мову, і гэты пераклад атрымаецца даволі дакладны. Што ж змянілася з тых часоў? Які цяпер прынцып працы аўтаматычных перакладчыкаў і якая будучыня ў жывых перакладчыкаў-прафесіяналаў?

Сучасныя анлайн-перакладчыкі (самы вядомы з якіх — Google Translate) выкарыстоўваюць статыстычны машынны пераклад, у працэсе якога камп’ютарная праграма аналізуе велізарны масіў тэкстаў, перакладзеных людзьмі, і перакладае слоўнік і граматыку адной мовы на іншую ў лічбавым фармаце. Гучыць складана? Давайце разбірацца.

Велізарны масіў тэкстаў складаецца з вялікай колькасці моўных пар — тэкстаў, якія маюць дзве дакладныя моўныя версіі (перакладзеныя чалавекам). У якасці такіх тэкстаў звычайна выкарыстоўваюцца афіцыйныя дакументы шматмоўных краін, дзе пераклад дакументацыі ёсць абавязковым на ўсе дзяржаўныя мовы. Такія пераклады заўсёды найбольш дасканалыя, бо дзяржаўныя дакументы вырашаюць лёс асобных людзей і краіны ў цэлым. Таксама вельмі карыснымі аказаліся шматмоўныя дакументы, якія выпускаюцца ААН. 

Аналізуючы пары розных тэкстаў, сістэма «вучыцца», засвойваючы з кожным разам усё больш новых правілаў. Такім чынам будуецца мадэль мовы.

Таксама кожная сістэма аўтаматычнага перакладу мае мадэль перакладу — «слоўнік», у якім для ўсіх словаў і фраз на адной мове пералічаныя магчымыя пераклады на іншую мову з указаннем верагоднасці гэтых перакладаў. Мадэлі перакладу для кожнай пары моваў утрымліваюць мільёны пар слоў і словазлучэнняў.

Калі вы перакладаеце з англійскай мовы на беларускую, задзейнічаюцца дзве моўныя пары: беларуская-руская і руская-англійская. То бок спачатку тэкст перакладаецца с англійскай на рускую, а потым — з рускай на беларускую.

Такі шлях найбольш рацыянальны, бо дакументаў, якія б мелі дасканалыя англійскую і беларускую версіі — няшмат, і просты пераклад з англійскай на беларускую атрымліваўся б вельмі няякасным праз недастатковую «навучанасць» сістэмы.

Непасрэдна перакладам займаецца дэкодар — алгарытм, які праводзіць аналіз тэксту і для кожнага слова падбірае ўсе варыянты перакладу, упарадкоўваючы іх па змяншэнні верагоднасці. Затым усе атрыманыя варыянты дэкодар ацэньвае з дапамогай мадэлі мовы на частату ўжывання і выбірае прапанову з найлепшым спалучэннем верагоднасці і частаты.

На жаль, цяпер няма сэрвісу аўтаматычнага перакладу, які б мог перакласці тэкст з такой жа дакладнасцю, як і чалавек-перакладчык. Але ўжо цяпер некаторыя кампаніі ўкараняюць у машынны пераклад нейронныя сеткі, якія значна паляпшаюць яго якасць.

Таму можна меркаваць, што з цягам часу спецыялісты-перакладчыкі будуць патрэбныя толькі для стварэння складаных мастацкіх перакладаў, што значна скароціць колькасць людзей, занятых у гэтай сферы. Але наўрад ці гэта вельмі блізкая перспектыва. А як лічыце вы?

Чытайце таксама: Наступная рэвалюцыя ў інфарматыцы — нейронныя сеткі (распавядаем пра нейронныя сеткі простымі словамі)

Каментары3

Сірыйскія паўстанцы ўвайшлі ў Алепа. Эрдаган ізноў усадзіў ятаган у спіну Пуціна1

Сірыйскія паўстанцы ўвайшлі ў Алепа. Эрдаган ізноў усадзіў ятаган у спіну Пуціна

Усе навіны →
Усе навіны

Упершыню за паўстагоддзя вучоныя зрабілі прарыў у лекаванні астмы і хранічнага бранхіту

У Вялікабрытаніі судзяць групу грамадзян Балгарыі, якіх падазраюць у шпіянажы на Расію

Калі ў Заходняй Еўропе не крызіс, то што такое крызіс?69

Лакалізавалі дакладнае месца знаходжання расійскага фільтрацыйнага лагера ў Нароўлі, у якім катавалі ўкраінскіх палонных15

Някляеў: Вельмі шмат было зроблена памылак — і ўладай, і апазіцыяй20

Расійскія ваенкары пішуць пра «крах абароны» расійска-сірыйскіх сілаў пад Алепа. Асад спешна вылецеў у Маскву17

У Магілёве прадаюць 23-гадовы VW Golf 4 за 9000 даляраў. Што ў ім такога?1

Стала вядома, колькі сёлета давядзецца заплаціць за натуральную навагоднюю ялінку1

«Я тая яшчэ памідорка». Што Ігар Тур піша ў тэлеграм-чатах са свайго асноўнага акаўнта16

больш чытаных навін
больш лайканых навін

Сірыйскія паўстанцы ўвайшлі ў Алепа. Эрдаган ізноў усадзіў ятаган у спіну Пуціна1

Сірыйскія паўстанцы ўвайшлі ў Алепа. Эрдаган ізноў усадзіў ятаган у спіну Пуціна

Галоўнае
Усе навіны →