Lietuviai pasitelkė dirbtinį intelektą, kad sukurtų e. vertyklę, pranokstančią „Google“ vertėją. Vilniaus universiteto mokslininkai kartu su partneriais kuria sistemą, sugebančią automatiškai versti tekstus iš (į) 5 kalbų poras. Projektą, finansuojamą ES struktūrinių fondų ir Lietuvos Respublikos lėšomis, planuojama užbaigti iki 2021 metų. Į jį bus investuota 3,8 mln. eurų.
Asociatyvi nuotr.
Neuroninių tinklų technologijas taikanti vertimo sistema bus apmokyta „sumaitinant“ jai dešimtis milijonų sakinių turinčių tekstų duomenis – iš grožinės, mokslinės literatūros, specializuotų tekstų ir žiniasklaidos šaltinių. Dirbtinis intelektas tokiu būdu išmoksta ne tik išversti pažodžiui, bet ir, įvertinus kontekstą, suteikti verčiamam žodžiui tikslesnę prasmę. Pasitelkus šią technologiją, bus gerokai patobulinta prieš ketverius metus Vilniaus universiteto mokslininkų sukurta automatinė vertyklė. Taip pat įvedamos naujos kalbų poros, iš viso bus verčiama iš (į) penkias kalbų poras: lietuvių–anglų, lietuvių–prancūzų, lietuvių–rusų, lietuvių–lenkų ir lietuvių–vokiečių.
VU mašininio vertimo grupėje dirba aštuonių žmonių komanda, kuriai vadovauja Vilniaus universiteto mokslininkas dr. Arūnas Samuilis.
„Gyvename dirbtinio intelekto revoliucijos amžiuje, todėl ši technologija yra tinkamiausia automatiniam vertimui. Pasitelkę geriausias vertimo praktikas, apmokysime šį intelektą. Be to, suteiksime jam lokalią terpę – tai yra išmokysime geriau atpažinti Lietuvai būdingą terminiją, informaciją ir jos kontekstą: terminus, sąvokas, vietovardžius, pavardes ir pan. Mūsų tikslas, kad lietuvių kalbos terpėje ši vertyklė verstų net geriau nei „Google“ vertėjas“, – sakė Vilniaus universiteto Taikomųjų mokslų instituto mokslininkas dr. Arūnas Samuilis.
Nepriklausoma technologija, valdoma valstybės
Pasak A. Samuilio, ši dirbtiniu intelektu grindžiama vertyklė svarbi ir dėl jos nepriklausomumo aspekto.
„Jau seniai kalbame, kiek daug svarbių duomenų yra koncentruojama vienos korporacijos rankose, šis projektas šaliai suteikia galimybę turėti nepriklausomą vertimo sistemą, šimtu procentu kontroliuojamą valstybės, nešališką ir užtikrinančią, jog duomenys nenutekės į privačių korporacijų rankas“, – sakė mokslininkas.
Projekto įgyvendinimo technologinius darbus atlieka konkursą laimėjusi specializuota kalbos technologijų bendrovė UAB „Tilde IT“. Ji jau anksčiau yra sukūrusi dirbtinio intelekto technologijomis paremtą šnekos atpažintuvą. Šią technologiją planuojama integruoti ir į naująją vertyklę.
„Naudojant šią technologiją, bus galima lietuviškai įkalbėti tekstą ir automatiškai gauti tą tekstą, išverstą į prancūzų ar anglų kalbą. Ji gali būti pritaikyta kad ir universitetų auditorijose – dėstytojas gali įrašyti savo paskaitą lietuviškai ir pateikti jau išverstą tekstą užsienio studentams. Taip pat pravers konferencijų dalyviams, kai pranešimai skaitomi lietuvių kalba, o kitakalbiams nėra galimybės pasinaudoti profesionalių vertėjų pagalba“, – pritaikymo būdus minėjo vertimo sistemos kūrėjų komandos vadovas A.Samuilis.
Pravers tautinėms mažumoms, vertėjams, ieškantiems informacijos, žurnalistams
Pasak projekto kūrėjų, pagrindinis pritaikymas – tai gyventojai, kuriems reikia išversti tekstus ar internetinių svetainių turinį į kitas kalbas.
„Manome, kad jis labai pravers Lietuvoje gyvenančių tautinių mažumų atstovams, kuriems kartais gali būti keblu suvokti oficialiose svetainėse skelbiamą, tarkime, mokesčių ar teisinę, informaciją. Naudodami šią vertyklę, jie galės lengvai suprasti skaitomą turinį. Taip pat bus patogu versti užklausas, kai ieškoma informacijos, ir gauti paieškos rezultatus norima kalba. Planuojama, kad vertimo įskiepis bus įdiegtas ir į e. paslaugas teikiančias svetaines, tarkime, VMI ar kitas, taip suteikiant galimybę lankytojams informaciją gauti viena iš 5 užsienio kalbų“, – sakė A. Samuilis.
E. vertyklė galės versti iškart visą dokumentą ar svetainę
Sistema suteiks galimybę versti visą dokumentą. Tai yra, įkelti į sistemą, pvz., „MS Office“ paketo dokumentą ir gauti jo išverstą analogą viena iš 5 pasirinktų kalbų.
„Kaip ir dabartinėje vertyklėje, bus galimybė versti visą dokumentą ar svetainę. Sistema paliks išverstame tekste visus formatavimus – šriftą, paryškinimą, pabrauktus žodžius. Tai didelė pagalba ir tiems, kurie iki šiol tekstus turėdavo išsiversti patys, nes sistema automatiškai atliks pradinį darbą, o verčiančiajam beliks tik pagražinti ar patikslinti“, – sakė vienas programos kūrėjų.
Sutaupo laiko
Skaičiuojama, kad dirbtinis intelektas, atlikęs pradinį vertimą, padidina automatinių vertimo sistemų produktyvumą maždaug 15–30 proc., o palyginti su savarankišku vertimu – net 2–3 kartus.
„Tai yra pagalba žmonėms, kurie verčia ilgus tekstus, įstatymus, sutartis – pasitelkus šią technologiją, darbas atliekamas žymiai greičiau, visą „juodąjį“ darbą atlieka technologija, žmogus gali koncentruotis į detales, teksto grožį ir niuansus“, – pasakojo A. Samuilis.
Vertyklė turės ir 3 specializuotas sistemas, kurios padės gauti dar tikslesnį vertimą: bendrinės, teisinės ir informacinių technologijų srities tekstų. Projekto kūrėjai sako, kad e. vertyklė bus naudinga visiems, kurie dirba su skaitmeniniu turiniu keliomis kalbomis: seminarų, mokymų kūrėjams, renginių ar diskusijų vedėjams bei dalyviams, valstybinėms institucijoms, teisininkams ir kitiems. Ji taip pat bus vertinga klausos negalią turintiems žmonėms, nes garsinius įrašus galės ne tik išversti, bet ir pateikti tekstu.
„Praktiškai visiems, kurie dirba su tekstiniu turiniu keliomis kalbomis – komunikacijos specialistams, žurnalistams, tarptautinių bendrovių darbuotojams – gali praversti dirbtinio intelekto vertimai. Žinoma, viso žmogiškojo darbo e. vertyklė neatstos – bet tikrai palengvins, pagreitins ir daugiau laiko liks kitiems darbams“, – e. vertyklės naudą apibendrino Vilniaus universiteto mokslininkas dr. Arūnas Samuilis.