Parodoje INFOBALT 2005 VDU Kompiuterinės lingvistikos centras pristato vieną iš ilgiausiai kaupiamų lietuvių kalbos lingvistinių resursų – Dabartinės lietuvių kalbos tekstyną internete.
Nuo 1995 m. tekstyno duomenų bazėje jau sukaupta per 160 mln. žodžių periodikos, grožinės, mokslinės, mokomosios bei mokslo populiarinimo literatūros tekstų. Internetinėje tekstyno versijoje pateikti visi iki 2003 m. sukaupti tekstai, kurių apimtis – 100 mln. žodžių (tai sudaro apie 350 tūkst. A4 formato puslapių).
Tekstyno paieškos sistema leidžia analizuoti, kaip žodis ar frazė yra vartojami dideliame tekstų kiekyje arba atskirose tekstyno dalyse, sužinoti žodžių pavartojimo dažnumą, gauti informacijos apie pasirinkto žodžio kontekstą bei stabiliųjų junginių vartoseną.
Dabartinės lietuvių kalbos tekstyno dydis, žanrų ir temų įvairovė lemia plačias jo pritaikymo galimybes: jis gali būti naudojamas ir kaip enciklopedinis arba kontekstinis žodynas, ir kaip praktinė lietuvių kalbos mokymo ar mokymosi priemonė, ieškantiems gausių autentiškos lietuvių kalbos pavyzdžių.
Iš tekstyno gauta informacija apie rašomosios kalbos vartoseną dažniausiai tampa mokslinių tyrimų pagrindu (kompiuterinės lingvistikos, leksikografijos, sociologijos ir kt.), duomenų šaltiniu žodynų sudarytojams (pvz., Dabartinės lietuvių kalbos tekstynu naudojasi Lietuvių kalbos instituto darbuotojai, rengdami Bendrinės lietuvių kalbos žodyną), tačiau gali būti naudinga ir įvairių sričių praktikams: leidėjams, žurnalistams, redaktoriams, pedagogams, informacijų technologijų kūrėjams ir kt.
1998 m. įdiegus internetinę tekstyno versiją (http://donelaitis.vdu.lt), paieškų skaičiaus augimas pastebėtas 2001 m. po viešo tekstyno pristatymo INFOBALT parodoje. 2005 m. viduryje, palyginti su 2001 m., užklausų skaičius tekstyne padidėjo 40 kartų (nuo 200 paieškų per mėnesį 2001 m. pradžioje iki 8000 paieškų per mėnesį 2005 m. viduryje).
Dabartinės lietuvių kalbos tekstyno rengimą remia Valstybinė lietuvių kalbos komisija pagal Valstybinės kalbos norminimo. Visuomenės švietimo programą ir Valstybinis mokslo ir studijų fondas pagal Lietuvos prioritetinių mokslo krypčių ir eksperimentinės plėtros programos projektą Lietuvių kalbos išlikimas globalizacijos sąlygomis: anotuotas lietuvių kalbos tekstynas. Ši parama sudaro sąlygas ne tik tobulinti ir gausinti esamą tekstyną, bet ir kurti jo pagrindu kitus autentiškos kalbos vartosenos tyrimais pagrįstus produktus (pvz., morfologiškai anotuotus tekstynus, kolokacijų žodynus ir pan.).