Lietuvių kalba ir matematika – dvi skirtingos, iš pirmo žingsnio nieko bendro neturinčios sritys, šiandien žengia koja kojon, bandydamos kartu įveikti kalbos skaitmenizacijos iššūkius. Apie vienos seniausių pasaulyje lietuvių kalbos ateitį skaitmeninėje erdvėje, projektą LIEPA-2 bei lietuvių šneka valdomas technologijas ir daiktus pasakoja Vilniaus universiteto (VU) Matematikos ir informatikos fakulteto Duomenų mokslo ir skaitmeninių technologijų instituto mokslininkas Gediminas Navickas.
G. Navickas ir humanoidinis robotas Ąžuolas-NAO
Prie projekto prisidėjo daugiau nei 3500 dalyvių
G. Navickas, pristatydamas seniau vykdytą projektą LIEPA, apimantį Lietuvių šneka valdomos paslaugas ir visai neseniai pasibaigusį projektą LIEPA-2, skirtą Lietuvių šneka valdomų paslaugų plėtrai, išskyrė esminius šių projektų skirtumus.
„Projekte LIEPA kuriami sprendimai buvo skirti daugiausia asmeniniams kompiuteriams, o projekte LIEPA-2 perėjome į mobiliąją terpę: mobilius, išmaniuosius telefonus, planšetinius kompiuterius ir net robotus. Tad projekto LIEPA-2 rezultatus galima suskirstyti į dvi dalis: infrastruktūrines paslaugas bei paslaugas skirtas vartotojams“, – pasakoja mokslininkas.
Šie projektai bendram darbui suvienijo visą ekspertų būrį. Projekto LIEPA-2 veiklas vykdė ne tik informatikai, filologai, edukologai ir robotikos specialistai, bet ir 3500 žmonių, kurie prisidėjo prie garsyno sudarymo.
„Projekto metu filologai buvo atsakingi už garsyno sudarymą ir šnekos pavyzdžių surinkimą. 3500 žmonių dėka, turėjome daugiau nei 1000 valandų įrašų, kuriuos reikėjo anotuoti – surašyti, kas tuose garso įrašuose yra sakoma, pažymėti pauzes, triukšmus ir aplinkos garsus, girdimus kiekvieną sekundę. Vėliau, jau anotuotą medžiagą, informatikai integravo į kuriamus šnekos sintezės ir atpažintuvo variklius. Mokymų programą naudojamą robote padėjo parengti edukologai, o robotikos specialistai programavo roboto veiksmus“, – platų projekto darbuotojų kompetencijų spektrą vardija mokslininkas.
Siūlomi sprendimai pranašesni už „Google“ paslaugas
Projekto LIEPA-2 rezultatus galima skirstyti į dvi dideles dalis: informacinių technologijų sprendimus, skirtus kurti kitas paslaugas bei paslaugas skirtas naudoti kiekvienam iš mūsų. Infrastruktūriniai sprendiniai apima lietuvių šnekos garsyną, mobilųjį sintezatorių ir mobilųjį šnekos atpažintuvą.
„Mobilusis sintezatorius tekstą paverčia šneka ir leidžia kompiuteriui su mumis komunikuoti lietuviškai. Atpažintuvas leidžia kompiuteriui suprasti, ką mes jam sakome. Na, o didžiulis 1000 valandų garsynas (kartu su projekto LIEPA garsynu iš viso 1100 valandų) su šnekos pavyzdžiais, reikalingas šiems dviem varikliams apmokyti“, – teigia G. Navickas.
Kuriant paslaugas galutiniams vartotojams buvo svarbu užtikrinti, jog jų veikimui nereikės interneto ryšio. Tad reikėjo atsižvelgti, jog tiek kompiuteriai, tiek mobilieji telefonai turi ribotus atminties resursus ir mokslininkų kuriami sprendimai turėjo tilpti jų atmintyje. Projekto vykdytojai juokauja, kad veikdamos be interneto ryšio, šiuo aspektu jų programos yra pranašesnės už milžino „Google“ siūlomas programas. Projektu metu buvo sukurtas interneto naujienų skaitytuvas, kuris leidžia klausytis iš keleto portalų surinktų naujienų, bei skambintuvas, kuris reaguodamas į balso komandas surenka reikiamą telefono numerį.
Iš visų projekto metu pasiūlytų paslaugų, šiandien plačiausiai naudojamas mobilusis sintezatorius akliesiems. Tai integruota programėlė, leidžianti akliesiems savo telefoną valdyti prisilietimais ir girdint, kas tuo metu rodoma telefono ekrane.
„Kadangi išmanieji telefonai šiandien nebeturi iškiliųjų mygtukų, akliesiems yra sunku suprasti, koks bus atsakas spaudžiant vieną ar kitą vietą telefono ekrane. Tad palietus pirštu ekraną, programėlė balsu perskaito, kokią ikonėlę pasirinkome. Pavyzdžiui, pasirenkame „nustatymų“ piktogramą ir ją paspaudus, programėlė perskaito visus joje esančius punktus. Tokiu būdu, aklieji gali naviguoti telefone klausos pagalba. Siekdami užtikrinti, kad programėlė kaip įmanoma labiau atitiktų aklųjų lūkesčius, tarpines jos versijas davėme testuoti akliesiems, kurie siūlė pakeitimus ir patobulinimus“, – sprendimą pristato mokslininkas.
Kelių eismo taisyklių moksleivius moko robotas
Dar viena projekto metu sukurta paslauga – ugdančiojo roboto valdytuvas. Mokslininkai, kurdami programinę įrangą, pasitelkė programavimui pritaikytus ir pasaulyje populiarius NAO robotus.
„Šiame projekte dirbome su dviem robotais – Ąžuolu ir Liepa. Mūsų tikslas buvo juos prakalbinti lietuvių kalba ir naudoti kaip edukacines priemones mokyklose. Tad parengėme 45 minučių programą robotui, kuris moko pirmos klasės vaikus kelių eismo taisyklių: kaip pereiti gatvę, naudotis šviesoforais ir t.t. Naudojame integruotą mokymą, kur vaikai ne tik klauso ir kalba su robotu, bet ir skaičiuoja, piešia bei dainuoja“, − pasakoja mokslininkas.
Nepaisant to, kad programinė įranga jau sukurta, edukacinio roboto mokyklos dar nenaudoja dėl didelės jo kainos. G. Navicko teigimu, mokykloms pirmiausia reikėtų pademonstruoti šio roboto galimybes.
„Šiandien mokyklų atstovų paklausus, ar jiems reikia edukacinio roboto, jie tikriausiai atsakytų neigiamai arba tik pagūžčiotų pečiais, nes nėra tokio roboto bandę. Jeigu robotą išbandytų viena mokykla, tuomet ir kitos, pamačiusios jo privalumus, nuspręstų jį įsigyti. Tuomet reikėtų ir daugiau mokymo programų, kurias, pavyzdžiui, galėtų kurti vyresnių klasių mokiniai, o su robotais jas testuotų pradinukai. Tokias programas galėtų pasiūlyti ir įmonės, kurioms reikėtų specialistų, tad susidarytų visa ekosistema, kuri robotiką stumtu į priekį“, – teigia mokslininkas.
Sprendimai pritaikomi ir Vilkaviškio autobusų stotyje, ir teatro spektaklyje
LIEPA ir LIEPA-2 projektų rezultatai yra laisvai prieinami ir gali būti naudojami tiek mokslo institucijų, tiek ir verslo įmonių. Nepaisant to, kad dalis sukurtų sprendimų jau yra orientuoti į galutinį vartotoją, verslas juos patobulinęs gali siūlyti kaip savo produktą ir jį komercinti.
„Abiejų projekto rezultatus jau spėjo pastebėti ir pradėjo naudoti verslo įmonės. Didelę vertę turi didžiulis 1100 valandų garsynas, kurį jau naudoja daugiau kaip 10 lietuviškų verslo įmonių ir mokslo institucijų. Pirmojo projekto metu sukurtas sintezatorius naudojamas informacijos portale „Delfi“ ir Vilniaus miesto savivaldybės naujienų portale straipsnių įgarsinimui, o taip pat pranešinėja skelbimus Vilkaviškio autobusų stotyje“, – platų pritaikymą pažymi G. Navickas.
Ko gero netikėčiausias projekto rezultatų pritaikymas buvo meno srityje, kai projekto metu sukurto sintezatoriaus balsai dalyvavo teatro spektaklyje „Remote Vilnius“ festivalio „Sirenos“ metu.
„Interaktyviame spektaklyje žiūrovai buvo susodinti į autobusą ir nuvežti į Vilniaus miesto centrą. Ten jiems uždėtos ausinės, per kurias mūsų sintezatoriaus balsai vedžiojo dalyvius po visą miestą ir nurodė, ką jie turi daryti. Spektaklio pabaigoje per ausines pranešta, kad dalyviai visą valandą klusniai vykdė neegzistuojančio žmogaus įsakymus“, − pasakoja mokslininkas.
Su daiktais privalome kalbėtis lietuvių kalba
Mokslininkų ateities planuose ir LIEPA-3 projektas, kuriam idėjų ir polėkio komandai netrūksta. Jame būtų susitelkiama į lietuvių kalbos puoselėjimą ir išlikimą.
„Tik atsiradus kompiuteriams buvo svarstoma, ar juose bus lietuviški rašmenys. Tuo metu pasaulyje jau buvo paplitusi mintis, kad kalba, kuri nepasklis elektroninėje terpėje, tiesiog išnyks. Tokių kalbų yra nemažai, bet lietuvių kalba joje pasklido ir turime lietuviškas interneto svetaines. Šiandien klausimų kelia tai, ar kalbėsimės su kompiuteriais ir robotais lietuvių kalba. Tai tarsi dar vienas mūšis už lietuvių kalbos išlikimą. Tad šnekos technologijų srityje atsiranda labai daug iššūkių ir įdomių sričių mokslininkams tyrinėti“, – pažymi G. Navickas.
Kartu su technologijų naudojimu keičiasi ir mūsų kalba. Jai įtaką daro ne tik diakritinių ženklų vartojimas ar jų atsisakymas, bet ir šnekos technologijų paskatintas per didelis oficialumas ir tikslumas jaučiamas kalboje.
„Anksčiau buvo ribojamas trumpųjų žinučių ženklų skaičius, tad norėdami taupyti pinigus, žmonės trumpindavo žodžius, rašydami tik po vieną ar dvi raides. Yra žmonių, kurie taip rašo iki šiol. Panašiai buvo ir su lietuvių kalbos diakritiniais ženklais: pirmuosiuose kompiuteriuose jų nebuvo, tad žmonės įprato rašyti be jų. Bėda ta, kad žmonėms tapo sunku atskirti, kur tuos lietuviškus diakritinius ženklus naudoti būtina, o kur ne. Dėl to labai išauga klaidų skaičius net oficialiuose dokumentuose.
Dėka šiandien naudojamų technologijų, žinutę diktuojant balsu jums nereikia trumpinti teksto ir jis yra užrašomas su lietuviškomis raidėmis. Bet kol kas, naudojant dabartinį garsyną, žinutės tampa labai oficialios, nes naudojama bendrinė kalba be šnekamosios kalbos sąvokų, tarmiškų žodžių, profesinio žargono. Tad šioje srityje dar turime kur tobulėti“, – pasakoja G. Navickas.
Išmaniais tapo ne tik mūsų laikrodžiai ar telefonai, bet ir mūsų namai. Juose integruotos valdymo balsu funkcijos, kurios junginėja šviesą ar užtraukia užuolaidas.
„Į mus kreipėsi išmaniųjų namų gamintojai, kurie pabrėžia, jog minėtos funkcijos retai naudojamos, nes žmogus nenori su daiktais kalbėtis anglų kalba. Vietoj įsakymo balsu, jis mieliau atlieka fizinį veiksmą – nueina ir užtraukia užuolaidas ar įjungia šviesą. Tad esminis klausimas šiandien yra, ar mes norime su daiktais kalbėtis lietuviškai? Jeigu mes priimame, kad tarpusavyje ir su daiktais toliau kalbame lietuvių kalba, tuomet nelieka klausimo, ar mūsų kuriamų kalbos technologijų reikia“, − pabrėžia G. Navickas.