Ar įmanoma sulaužyti kalbos barjerą? „Google“ tvirtai tiki savo galimybėmis įveikti žmones skiriančias kalbines kliūtis. Pasitelkusi informacinių technologijų mokslininkus iš Vokietijos bendrovė tikisi sukurti universalų vertimo įrankį. Vis dėlto „Google“ ant kulnų mina „Microsoft“ ir „Facebook“, rašo „Der Spiegel“.
Mokslinės fantastikos kūriniuose nuolatos kartojasi keletas tų pačių žmonijos pasiekimų: neriboti energijos ištekliai, kosminės kelionės ir universalūs vertėjai. Pastarąją fantaziją „Google“ tikisi paversti realybe.
Franzas Josefas Ochas ilgą laiką svajojo sukurti tobulą kompiuterinį vertėją, galintį versti realiu laiku ir beveik tobulai perteikti pašnekovo mintis pasirinkta kalba.
F. J. Ochui toks vertėjas nėra vien tik paprastas pagalbininkas turistams, tačiau rimtas žingsnis link dirbtinio intelekto kūrimo.
Apgynęs daktaro laipsnį vokietis buvo pakviestas darbuotis JAV Pažangių gynybos projektų tyrimų agentūroje (DARPA). 2004 metais F. J. Ochas sulaukė skambučio iš „Google“ bendraįkūrėjo Larry Page'o bei gavo pasiūlymą vadovauti „Google Translate“ departamentui.
Per metus, praleistus „Google Translate“ departamente, F. J. Ocho komandai pavyko pasiekti visai nemažai. Šiuo metu „Google Translate“ sugeba versti iš 71 kalbos.
Keliautojui tereikia nufotografuoti japonišką hieroglifą autbusų stotyje ir programa akimirksniu pateiks jo reikšmę pasirinkta kalba. Skaitytojai iš viso pasaulio gali versti užsienio naujienų portalų tekstus į jiems suprantamas kalbas.
Pernai „Google Translate“ paslaugomis klientai pasinaudojo maždaug 200 mln. kartų. Kol kas „Google“ leidžia nemokamai naudotis vertimo paslauga, tačiau ateityje bendrovė vienaip ar kitaip bandys atsiriekti savo pelno dalį iš investicijų į „Google Translate“. Kol kas bendrovė siekia ištobulinti paslaugą.
Progreso smaigalyje – išmanieji telefonai. F. J. Ocho komanda sukūrė mobiliąją programėlę, kuri paverčia telefoną kalbančiu vertimo įrenginiu. Kol kas programėlė atpažįsta porą tuzinų kalbų.
Programa puikiai susidoroja su paprastais sakiniais. Šios programėlės dėka keliautojas Pekine gali gimtaja kalba paprašyti taksisto nuvešti iki artimiausios vaistinės. Netrukus telefonas šį prašymą garsiai pakartos vairuotojui suprantama kalba.
F. J. Ocho teigimu, programėlė tebėra nerangi ir kiek nepatogi, nes vartotojui vis dar tenka spaudyti mygtukus, o pati vertimo kokybė ne visada tenkina ir pačius kūrėjus.
Vis dėlto vos prieš keletą būtų buvę sunku patikėti, kad taip greitai atsiras panaši technologija.
Milžiniškas šuolis
IBM dar prieš keletą dešimtmečių bandė plėtoti automatizuoto vertimo projektą, tačiau dėl prastų pasiekimų tyrimus teko nutraukti.
Pirmaisiais metais „Google Translate“ tebuvo tyrimų projektas. Anot F. J. Ocho, tik visai neseniai pavyko pasiekti persilaužimą.
„Google Translate“ komanda ženkliai išsiplėtė, tačiau iki šiol joje nėra nė vieno lingvisto. Pats F. J. Ochas pripažįsta nesantis itin gabus užsienio kalboms.
Anot jo, kuriant kompiuterinį vertėją pakanka gerai išmanyti matematiką, statistiką ir programavimą.
„Google Translate“ vengia tradicinio požiūrio į vertimo programas ir stengiasi apsieiti be griežtų žodyno ar gramatinių taisyklių struktūrų, nes pastarosios yra nelanksčios ir verčia kompiuterius pasimesti vertime.
Vietoje to „Google Translate“ remiasi visuotinai prieinamų duomenų gausa bei statistika. Gavusi užklausą vertimų programa lygina tekstą su internete esamais vertimais ir mokosi kaip geriausiai išversti milijardus jai siunčiamų žodžių.
F. J. Ocho teigimu, „Google Translate“ paprasčiausiai statistiškai vertina vertimo galimybes ir parenka tą, kuri gali būti teisingiausia.
Kuo didesnė kompiuterinio vertėjo duomenų bazė, tuo didesnė galimybės, kad pastarajam pavyks parinkti tinkamą vertimą. Dėl šios priežasties kompiuteriniai vertėjo gali vystytis tik interneto dėka. Pastarojo apimtis kasmet auga, gausėja išverstų tekstų skaičius, todėl kasmet „Google Translate“ vertimai darosi vis tikslesni.
Iki tobulumo dar toli
„Google Translate“ algoritmai internetiniame triukšme ieško egzistuojančios frazės ar žodžio vertimo ir stengiasi atrastas frazes sudėlioti į reikiamą sakinį.
Šis metodas veikia, tačiau jo toli gražu negalima vadinti tobulu.
Didžiausias problemas kompiuteriniam vertėjui kelia sintaksė, perkeltinės prasmės bei intonacija. Dažniausiai „Google Translate“ pateiktas vertimas yra daugiau ar mažiau suprantamas, tačiau kupinas rašybos ir skyrybos klaidų, nes kompiuteriams kalbos estetika iki šiol tebėra neįveikiama užduotis.
Ar tai reiškia, kad „Google Translate“ privalės išmokti būti kūrybiška?
F. J. Ocho įsitikinimu kompiuteriniai vertėjai gali apsieiti be šio iššūkio, jiem tereikia kur kas geriau įvaldyti jau dabar praktikuojamą imitavimo meną.
„Google Translate“ geriausia susidoroja su tomis kalbomis, kurios yra struktūriškai panašios. Dėl šios priežasties vertimai tarp anglų ir ispanų kalbų vyskta sklandžiau nei tarp anglų ir japonų ar anglų ir vokiečių kalbų.
Konkurentai nesnaudžia
Prieš keletą savaičių „Facebook“ įsigijo nedidelę bendrovę, kuriančią kompiuterinio vertimo sistemą. Bendrovė siekia palengvinti bendravimą tarp savo klientų iš 200 šalių.
Europos sąjunga sukūrė savo vertimo sistemą MT@EC, kurios tikslas – susidoroti su biurokratiniu žargonu. Dėl taupymo ES planuoja per artimiausius metus atleisti apie 10 proc. vertėjų.
Savo ruožtu „Microsoft“ taip pat kuria vertimų programą. Praėjusį rudenį vienas iš bendrovės vadovų Rickas Rashidas kalbėdamas Kinijoje pademonstravo programos galimybes. R. Rashidas klausytojams kalbėjo angliškai, tuo tarpu programa atliko sinchroninį vertimą į mandarinų kalbą. Be to, kompiuteris, pasinaudodams duomenų bazėje sukauptais balso pavyzdžiais, atkartojo kalbančiojo balsą. Ši savybė suteikė kompiuteriniam vertėjui šiokio tokio žmogiškumo.