Įsivaizduokite: atsidarote el. pašto programėlę ketindami parašyti laišką ir, užuot spaudę klaviatūrą, turinį diktuojate savo telefonui, planšetiniam ar nešiojamajam kompiuteriui. Viskas, ką sakote, sugula į taisyklingą lietuvišką tekstą su skyrybos ženklais. Netrukus tai galėsite daryti atsisiuntę mobiliąją programėlę, kurią kuria kalbininkų, tyrėjų ir programuotojų komandą, sėkmingai apmokanti neuroninius tinklus atpažinti lietuvių kalbą, rašoma pranešime.
„Programėlė „Tildės Balsas“ bus plačiai prieinama visiems Android ir iOS operacinių sistemų vartotojams. Šiuo metu programėlės beta versiją jau galima rasti Google Play parduotuvėje. Ją atsisiuntus ir atsidarius laiško rašymo lauką, įrenginio klaviatūroje rodomas mikrofono mygtukas. Paspaudę, diktuojate tekstą ar frazę ir programėlė paverčia tai lietuvišku tekstu“, – pasakoja Renata Špukienė, UAB „Tilde informacinės technologijos“ direktorė. Šiuo metu įmonė įgyvendina milijono eurų vertės Europos Sąjungos investicijų projektą „Speech Cloud“, skirtą moksliniams tyrimams, eksperimentinei plėtrai ir inovacijoms skatinti.
Projekto metu, pritaikant neuroninių tinklų technologijas, kuriama automatinės šnekos atpažinimo sistema, garso failų transkribavimo paslaugos ir kiti inovatyvūs produktai. Pasak R. Špukienės, kalbos atpažinimo sistemos pasaulyje yra ne naujiena – jos plačiai naudojamos įvairių šalių valstybinėse institucijose susitikimų protokolams rengti, teismų, verslo ar kituose procesuose. Lietuvių kuriama sistema, tikimasi, taps patogiu įrankiu ir specialistams, ir visuomenei – bet kurio išmaniojo įrenginio vartotojams. Tam, kad produktas būtų kuo universalesnis, mokslininkai projekto metu kuria garsynus bei terminynus specialiomis sąlygomis.
„Diktuojame įvairius žodžius natūralioje biuro ar posėdžio aplinkoje, kad sistema galėtų atpažinti žodžius, fone skambant klaviatūros garsams ar pašaliniams pokalbiams. Šis projektas yra ne tik informacinių technologijų kūrimo, bet ir mokslinių tyrimų plėtros – atliekame įvairius tyrimus ir siekiame surasti tinkamiausias priemones“, – pasakoja R. Špukienė.
Moteris pastebi, kad mokant kompiuterinius neuroninius tinklus atpažinti ne bendrinės kalbos faktus, reikia specialių tyrimų ir įvairių sričių profesionalų – lingvistų, inžinierių, programuotojų – susitelkimo.
„Kuriama sistema jau geba sėkmingai atpažinti ir užrašyti taisyklingą, ramiu tonu dėstomą bendrinę kalbą beveik 98 proc. tikslumu. Tačiau, jei kalbėtojas diktuoja tarmiškus posakius, žargoną, svetimybes ar techninius terminus, kalbos transkribavimas sistemai kol kas yra iššūkis“, – apie projekto eigą pasakoja R. Špukienė.