2005 metais VDU Kompiuterinės lingvistikos centrasparodoje „Infobalt“ pristato naują viešąją paslaugą – lygiagretųjį tekstyną. Lygiagretusis tekstynas yra pirmasis internete prieinamas teoretikams ir praktikams skirtas tekstynas, vertinga priemonė kalboms lyginti, mokytis, automatiniam vertimui kurti, dvikalbiams, keliakalbiams ir terminų žodynams sudaryti.
Lygiagretusis tekstynas yra sudarytas iš čekų ir anglų kalbų tekstų ir jų lietuviškųjų vertimų. Kol kas šio tekstyno apimtis nėra didelė. Ateityje anglų–lietuvių kalbų lygiagrečiojo tekstyno dalis bus papildyta administracinio stiliaus ir kt. tekstais, o visas tekstynas – kitomis kalbų poromis. Iš viso lygiagrečiajame tekstyne yra 49342 lygiagretūs sakiniai, sudaryti daugiau negu iš 1 mln. žodžių.
Lygiagretusis tekstynas gali būti ypač naudingas gerinant vertimo kokybę. Dirbant su paieškos programa (jos aprašas pateiktas Kompiuterinės lingvistikos centro puslapyje internete http://donelaitis.vdu.lt) išryškėja dažniausios vertimo problemos: skirtumai tarp žodyne pateikiamų ir realiame tekste pavartotų vertimo reikšmių; įvairūs kalbiniai neatitikimai, kai, pavyzdžiui, vienas originalo kalbos žodis vertimo kalboje išverčiamas keliais arba atvirkščiai.
Žodynų rengėjai ir kalbos mokymo specialistai lygiagretųjį tekstyną gali panaudoti kaip objektyvų kalbos vartosenos šaltinį. Šis tekstynas pravers ir studijuojantiems užsienio kalbas, ir rašantiems palyginamuosius ar kitus kalbų skirtumų analize pagrįstus darbus. Gausinant ir tobulinant lygiagretųjį tekstyną jame daugės įvairių žanrų tekstų, kalbų porų, ir tai bus naudinga ne tik vertėjams (teoretikams, praktikams), bet ir redaktoriams, stilistams, leidėjams bei žurnalistams.
Lygiagretieji tekstynai plačiai naudojami praktiškai, tačiau yra svarbūs ir moksliniams tyrimams. Viena iš svarbiausių lygiagrečiųjų tekstynų panaudojimo sričių yra mašininio vertimo sistemos kūrimas.
Lygiagretusis tekstynas rengiamas nuo 2000 metų. Projekto įgyvendinimą remia Valstybinė Lietuvių kalbos komisija pagal 2000–2006 metų programą Lietuvių kalba informacinėje visuomenėje.
Norintys sužinoti daugiau apie šią naujovę yra laukiami „Infobalt“ parodoje, prie VDU Kompiuterinės lingvistikos centro stendo nr. 5G.18.