Šnekos atpažinimo technologijos: ar namų asistentai prabils lietuviškai?

Įvairią techniką siūlančios parduotuvės vilioja kalėdinėmis nuolaidomis. Gal ir jūs dairotės artimiesiems naudingos ir praktiškos dovanos? Ar norėtumėte mamai, sutuoktiniui ar broliui į pagalbą dovanoti lietuviškai kalbantį virtualų namų asistentą? O gal ir patys neatsisakytumėte tokios dovanos? Lietuvių mokslininkai įsitikinę – jei norime, kad lietuvių kalba neišnyktų, ja kalbėti privalome ne tik mes patys, bet ir šiuolaikinės technologijos. Tam, kad namų asistentai prabiltų lietuviškai, gali pagelbėti šnekos atpažinimo technologijos, kurių srityje mūsų mokslininkai jau smarkiai pasistūmėję. Kas tai yra? Šnekos atpažinimas – kai kompiuteris atpažįsta, ką sakome. Šių technologijų nereikėtų maišyti su kitomis, pavyzdžiui, balso atpažinimu – kai įrenginys atpažįsta ir identifikuoja konkretaus asmens balsą – ir kalbos atpažinimu – kas reiškia, kad mašina identifikuoja, kokia kalba (lietuvių, anglų ir pan.) žmogus kalba.

Šnekos technologijos: kaip tai veikia?

Gediminas Navickas. VU/Justino Auškelio nuotr.

Vilniaus universiteto Matematikos ir informatikos fakulteto (VU MIF) mokslininkas Gediminas Navickas sako, kad šnekos atpažinimas – tai kompiuterio, roboto ar kitos mašinos gebėjimas iššifruoti, ką žmogus sako, ir paversti tai tekstu. „Paskui tekstas gali būti interpretuojamas kaip tam tikra komanda robotui ar kitai mašinai, toliau jis gali būti naudojamas skaitmeninėje terpėje, kaip ir bet koks kitas tekstas“, – pasakoja mokslininkas. Tokį šnekos technologijų paruoštą tekstą straipsnio, socialinių tinklų įrašo ar kitu pavidalu galite skaityti nesuprasdami, kad jį tekstu pavertė kompiuteris, o ne žmogus. Kitas ekspertas, VU MIF docentas Gintautas Tamulevičius patikslina, kad automatinis šnekos atpažinimas savo universalumu ir tikslumu vis dar negali prilygti žmogiškiesiems gebėjimams. Tačiau šnekos atpažinimo technologijos, kaip ir bet kokios kitos, nuolatos vystosi ir tobulėja. Dėl to jos vis labiau gali palengvinti tokių profesijų atstovų kaip, pavyzdžiui, žurnalistai darbą.

„Kuriant lietuvių šnekos atpažintuvus, visų pirma reikia surinkti daug šnekos pavyzdžių – garso įrašų. Tada reikia tuos įrašus aprašyti – anotuoti, t. y. labai tiksliai surašyti, kas ir kuriuo metu tame įraše buvo pasakyta. Tokių įrašų visuma vadinama garsynu. Garsynai gali būti bendro pobūdžio ar specializuoti – pavyzdžiui, skirti roboto valdymui, pokalbiams medicinos ar kokioje kitoje specializuotoje srityje“, – šnekos technologijų veikimo principą aiškina ekspertas. „Vėliau tokie garsynai naudojami atpažintuvų mokymui, kompiuteris apmokomas susieti garso signalą su tekstu. Tam naudojami dirbtinių neuronų tinklai, t. y. tai, ką šiuo metu vadiname ant populiarumo bangos esančiu dirbtiniu intelektu“, – apie technologijas, kurios atpažįsta, ką mes kalbame, pasakoja VU mokslininkas. Jį papildo doc. G. Tamulevičius: „Dirbtinio intelekto metodai leidžia pasiekti ypač didelį atpažinimo tikslumą netgi ir ne itin tam palankiomis sąlygomis, pavyzdžiui, esant dideliam aplinkos triukšmui, aidui patalpoje, neaiškiai tarsenai.“

Lietuviai technologijų srityje neatsilieka

Gintautas Tamulevičius. VU/Justino Auškelio nuotr.

Kaip pasakoja doc. G. Tamulevičius, lietuvių šnekos atpažinimo tyrimai pradėti dar praėjusio amžiaus 8–9 dešimtmetį, kai pradėtos skelbti pirmosios mokslo publikacijos lietuvių šnekos pavienių žodžių atpažinimo tema. Ir nors tyrimų apimtys ar rezultatai nebuvo tokie įspūdingi kaip tyrimai anglų ar prancūzų kalbų srityje, tačiau jie vis tiek atliko svarbų vaidmenį išlaikant lietuvių kalbą panašiu technologiniu lygiu su didžiosiomis kalbomis.

Du didžiausi šnekos atpažinimo darbus įgyvendinę projektai yra LIEPA ir LIEPA-2. Tarp jų iniciatorių buvo VU profesorius Laimutis Telksnys, būrys kitų VU mokslininkų – ne tik informacinių technologijų specialistai, bet ir filologai, mokytojai, robotikos specialistai. Projektų rezultatai – itin reikšmingi. „Projektų LIEPA ir LIEPA-2 metu buvo sukurti lietuvių šnekos atpažinimo ištekliai, infrastruktūriniai sprendimai ir šnekos atpažinimu grįstos paslaugos. Pirmasis projektas buvo orientuotas į asmeninių kompiuterių naudotojus, antrasis, LIEPA-2 – į mobiliųjų ir išmaniųjų įrenginių naudotojus, robotiką“, – pasakoja doc. G. Tamulevičius.

Šių projektų rezultatai sudarė puikias sąlygas ir toliau tobulinti ir diegti lietuvių šnekos atpažinimą. O ypatingo dėmesio verti LIEPA-2 projekto metu sukurti du humanoidiniai robotai: Ąžuolas ir Liepa. Kuriant robotus buvo paruošti ir įdiegti pokalbių scenarijai, leidžiantys robotams bendrauti ir atsakinėti į klausimus konkrečiomis temomis, pavyzdžiui, kelių eismo taisyklių. „Šių scenarijų tikslas – žaismingo bendravimo forma išdėstyti vaikams taisykles, principus, kitą mokomąją medžiagą, pratinti vaikus naudotis technologijomis ir robotikos sprendimais“, – apie robotukų pritaikymą pasakoja doc. G. Tamulevičius. Robotai tapo savotišku VU MIF simboliu ir yra itin populiarūs tiek tarp vaikų, tiek tarp suaugusiųjų: jie dalyvauja įvairiuose renginiuose, važinėja po mokyklas, prisideda ir prie lietuvių šnekos atpažinimo, robotikos vystymo darbų. Ąžuolas ir Liepa sulaukė dėmesio net iš prezidentūros, ministerijų, Europos Komisijos. „VU MIF tyrėjai ir studentai ir toliau dirba siekdami robotus dar labiau priartinti prie žmonių – padidinti robotų gebėjimus išgirsti, suprasti ir atsakyti į mūsų gimtąja kalba pateikiamus klausimus bei užklausas. Ir kodėl gi nepasvajojus apie žmonių ir robotų bendruomenes, bendraujančias tokia sudėtinga ir gražia lietuvių kalba?“ – sako docentas.

Ar „Alexa“ prabils lietuviškai?

Šnekos išteklių ir technologijų kūrimas turėtų būti nuolatinis procesas, nes pačios technologijos, jų poreikis keičiasi ir reikalavimai joms didėja. „Anksčiau vien kalbanti mašina buvo kažkas tokio, o šiandien jau norime, kad ji ne tik šnekėtų, bet ir darytų tai kokybiškai“, – sako G. Navickas. VU mokslininkai jau ruošiasi LIEPA-3 projektui ir planuoja plėtoti lietuvių šnekos atpažinimo ir sintezės sprendimus, taip pat ir robotiką. „Labai svarbu ir toliau tęsti lietuvių kalbos projektus, kurti lietuviškus kalbos išteklius ir technologijas. Net stovėjimas vietoje šioje srityje reiškia žingsnį atgal, kadangi kitos kalbos tuo metu juda pirmyn“, – įsitikinęs mokslininkas.

Kalbant apie šnekos technologijas ir būtinybę mašinoms kalbėti lietuviškai, natūraliai gali kilti klausimas: ar šios technologijos kada nors bus pritaikytos lietuvių buičiai pagerinti? Ar gerai žinomi namų asistentai, tokie kaip „Alexa“, „Siri“ ir kt., prabils lietuviškai? Su Liepos projektais dirbantis G. Navickas sako, kad virtualių namų asistentų sulietuvinimas yra ne tik technologinis, bet ir verslo klausimas. „Lietuvos rinka yra nedidelė, tad tokių asistentų gamintojai neturi intereso, o gal tiksliau reiktų sakyti, neteikia prioriteto lietuvių kalbai.“ G. Navickas atvirauja: bandymų „prakalbinti“ populiariuosius namų asistentus lietuvių kalba būta, tačiau užsienio kompanijos Lietuvoje sukurtų technologijų įsileisti nenori, o jiems patiems asistentų pritaikymas lietuvių kalbai šiuo metu nėra labai svarbus. Visgi mokslininkas išlieka optimistiškas – išsprendus šias problemas, su namų asistentais kalbėti lietuviškai galėtume pradėti nors ir šiandien, ir galbūt tai įvyks jau netolimoje ateityje.