Milijonai žmonių kalba įvairiomis kalbomis, kurios iki šiol menkai tepasirodo pasauliniame voratinklyje. Ir tai vyksta tuo metu, kai audringai vystosi internetas bei sparčiai tobulėja automatinio kalbų vertimo technologijos. Šią situaciją nusprendė pakeisti korporacijos „Google“ ir „Microsoft“ – turbūt populiariausių interneto vertėjų kūrėjai.
Šių korporacijų produktai – tai milžiniško duomenų rinkimo principo triumfas. Vietoj to, jog Silicio slėnio protams dėstyti gramatiką ir algoritmus, kūrėjai pasikliovė milijonais žmonių išverstų el. dokumentų statistiniu palyginimu.
Žinoma, toks metodas negalioja, kai susiduriama su žymiai mažiau populiariomis kalbomis. Todėl paskutiniu metu „Google“ pradėjo eksperimentuoti: jos automatinis vertėjas ėmė palaikyti penkias Indijoje vartojamas kalbas (bengalų, gudžarati, kannada, tamilų ir telugų). Tam reikalui „Google“ programinė įranga buvo apmokyta gramatinių taisyklių, o „Microsoft“, savo ruožtu, sukūrė interneto tarnybą, kuri leidžia sukurti bet kurios kalbos automatinį vertėją.
„Google“ ekspertai suprato, jog laikas pradėti mokintis gramatikos, bandant „išblizginti“ japonų kalbą, prisimena kompanijos atstovas Ašišas Venugopalas. „Mes pateikdavome teiginį su veiksmažodžiu frazės viduryje, tuo tarpu japonų kalboje jis turi būti pabaigoje“, – aiškina specialistas. Pasirodo, visa sistema didžiąja dalimi tiesiog „plaukiodavo“ gramatikoje, nesugebėdama surasti reikiamo varianto. Įdiegti pakeitimai suteikia penkių kalbų palaikymą, kuriomis kalba milijonai Indijos gyventojai ir kurių praktiškai nebuvo internete.
Gramatikos mokymas buvo vykdomas tokiu būdu: sistemai būdavo „sušeriama“ didelės kolekcijos sakinių su specialiomis žymomis. Įprastuose „Google“ algoritmuose nieko panašaus nebūdavo.
Paieškos giganto ekspertas A. Venugopalas pripažįsta, jog stebuklo, deja, neįvyko: automatinis vertėjas ir šiandien geriau susitvarko su gerai atstovaujamomis internete kalbomis, pavyzdžiui, vokiečių ar prancūzų. Tačiau labai svarbus žingsnis jau padarytas. Galbūt tai paskatins kitų kalbų „nešiotojus“ dažniau savo tinklaraštyje rašyti gimtąja kalba, o ne anglų.
Kompanija „Microsoft“ taip pat suinteresuota padėti ne itin populiarioms internete pasaulio kalboms, kad šios neatsidurtų šunkeliuose ir realiame gyvenime, teigė Kristin Tolle, „Microsoft“ tyrimų padalinio direktorė. Jos vadovaujama grupė atvėrė visuomenės teismui puslapį „Translator Hub“, kuris padeda vartotojams sukurti nuosavas vertimo programas. Čia reikia praeiti registraciją, vėliau bus galima įkrauti medžiagą dvejomis skirtingomis kalbomis. Vėliau sistema savaime besimokančių algoritmais bandys savarankiškai išversti tekstą, parašytą nauja kalba.
Beje, ponia Telle pažymi, jog yra dar vienas niuansas. Komercinės įstaigos nelabai nori patikėti slaptos medžiagos vertimą žmonėms, todėl joms patogiau naudotis virtualiais automatiniais vertėjais, tačiau šie, deja, nelabai gerai susitvarko su specifiniais techniniais terminais ir įvairiais žargonais. „Microsoft“ sukurtas „Translator Hub“ taip pat turėtų išspręsti šią problemą. Susidomėjimą naujos interneto tarnybos testavimu jau pareiškė tokios kompanijos, kaip „Mercedes“ ir „Volvo“ (kodėl būtent automobilių gigantai, sužinoti nepavyko).
Taigi mes dar kartą norime paraginti dažniau naudoti lietuvių kalbą (taisyklingą, be šveplavimų) savo tinklaraščiuose, taip pat socialiniuose tinkluose ar rašant komentarus, kad neatsidurtume interneto paraštėse. Juo labiau, kad nors ir esame atstovaujami, pavyzdžiui, „Google Translate“ sistemoje, tačiau jos vertimo kokybė vis dar patenkinama. O gal kas turi nenaudojamų lietuvių kalbos gramatikos vadovėlių? Būtinai perduotume „Google“ ir „Microsoft“.