Parodoje INFOBALT 2005 pristatomas VDU Kompiuterinės lingvistikos centre sukurta automatinė tekstų analizavimo priemonė. Ši nemokama, laisvai internete prieinama (http://donelatis.vdu.lt/) paslauga leidžia vartotojui be specialių kalbos analizės programų ištirti pasirinktą tekstą trimis lygmenimis: sudaryti žodžių dažnumų sąrašą, gauti statistines teksto charakteristikas ir patikrinti teksto prototipiškumą 6 funkcijoms.
Ši priemonė praktiškai įgyvendina originalią tekstų funkcijų nustatymo metodologiją, kuri pagrįsta moksliniu tyrimu, aprašytu 2004 m. VDU apgintoje Andriaus Utkos disertacijoje „Statistinis tekstų funkcijų nustatymas“. Analogų neturintis tekstų funkcijų nustatymo metodas remiasi prielaida, kad tam tikrų labai dažnų lietuvių kalbos žodžių formų pasiskirstymas tekstuose ir statistiniai tekstų požymiai lemia tekstų funkcijas. Skiriamos šešios tekstų funkcijos: spontaniškas ekspresyvumas, naratyvumas, direktyvumas, nespontaniškas ekspresyvumas, apeliatyvumas ir deskriptyvumas. Analizuojamo teksto prototipiškumas priklauso nuo funkcijai būdingų požymių vartosenos intensyvumo. Pavyzdžiui, spontaniška ekspresyvi kalba yra būdinga šnekamosios kalbos tekstams, kuriuose vyrauja ekspresyvūs trumpi žodžiai (pvz., tai, jau, čia), pertarai ir jiems būdingas neturtingas žodynas. Taigi pagal šiuos požymius bet kuris tekstas bus įvertintas kaip daugiau ar mažiau prototipiškas šnekamajai kalbai.
Automatinė tekstų funkcijų nustatymo priemonė galėtų sudominti lietuvių kalbos tyrėjus, lingvistus besidominčius stilistika ir teksto funkcijomis; informatikus, tiriančius automatinį tekstų klasifikavimą; įmones, kuriančias kompiuterinius lietuvių kalbos produktus ir kt.
Šios paslaugos sukūrimą parėmė prof. Viktorijos Skrupskelytės įsteigta stipendija.