Tyrėjai Vilniuje diskutuos apie kalbos duomenų siejimo iššūkius ir kalbos duomenų reikšmę dirbtinio intelekto ir robotikos plėtotei

Publikuota:	2022-09-20 09:40
Tematika:	Mokslo naujienos

Inf. šaltinis:

Pranešimas žiniasklaidai

2022 m. rugsėjo 21-23 d. Mykolo Romerio universiteto Žmogaus ir visuomenės fakulteto Humanitarinių mokslų institutas organizuoja tarptautinę mokslinę konferenciją, skirtą lingvistinių susietųjų atvirų duomenų technologijų taikymui kalbos duomenų tyrimams ir tvarkybai (angl. LLOD Approaches for Language Data Research and Management), rašoma pranešime žiniasklaidai.

Renginyje dalyvaus daugiau kaip 90 ekspertų iš viso pasaulio. Planuojamos konferencijos temos apima įvairias aktualijas: „kada turėsime lietuviškai kalbančią skaitmeninę asistentę Alexa?“, „kaip efektyviai mokytis lietuvių kalbos su dirbtiniu intelektu?“, „kuo gali padėti Twitteris vystant kalbos duomenų mokslą?“, „kokių duomenų gali suteikti karo Ukrainoje komunikacijos lingvistinės raiškos priemonių analizė?“. Šių klausimų sprendimų paieškos skatina kalbininkų, informatikų, terminologų ir kitų specialistų bendradarbiavimą ir siekį kartu plėtoti kalbos duomenų mokslą bei jo praktinį taikymą įvairiose srityse. Konferencijos metu bus dalinamasi naujausiais tyrimų rezultatais, patirtimi ir įžvalgomis.

Kalbos duomenų mokslas – būtinas dirbtinio intelekto ir robotikos vystymui

Susietųjų duomenų technologijos jau dabar naudojamos įvairiose institucijose visame pasaulyje, pavyzdžiui, nacionalinėse bibliotekose, muziejuose, žiniasklaidos įmonėse, viešojo administravimo institucijose ir kt. Kalbos duomenų mokslas yra besiformuojanti duomenų mokslo sritis, kurioje pagrindinis dėmesys skiriamas sisteminei kalbos duomenų analizei bei metodams, kaip iš šių duomenų išgauti naujas žinias ir panaudoti jas įvairiems tyrimams bei praktinėms veikloms. Kalbos duomenų (sintaksės, morfologijos, leksikos ir kt.) sisteminimas, integravimas ir panaudojimas yra būtinas dirbtinio intelekto ir robotikos pramonės vystymui bei įvairių paslaugų kūrimui (pvz., mašininio vertimo, šnekos atpažinimo, šnekos sintezavimo ir kt.).

Dalyvaus žymūs tyrėjai iš viso pasaulio

Konferencijoje dalyvaus dr. Dagmar Gromann, Vienos universiteto (Austrija) Vertimo studijų centro docentė. Jos pagrindinis mokslinių tyrimų laukas apima dvi dažnai persipynusias sritis – žinių ištraukimą iš tekstų ir mašininį vertimą. Pavyzdžiui, ji dirbo su natūralios kalbos klausimų automatiniu vertimu į struktūrizuotas užklausas ir terminų bei jų semantinių ryšių traukimu iš tekstų, naudojant neuroninius mašininio vertimo modelius. Pastaruoju metu dr. D. Gromann didelį dėmesį skiria kalbos technologijų socialiniam ir techniniam poveikiui, įskaitant lyčių lygybe paremtą mašininį vertimą peržengiant binarinę lyties sampratą ir kalbos technologijų įtaką skaitmeninei kalbų lygybei. Ji yra žurnalų „Semantic Web“ ir „Journal of Applied Ontologies“ redakcinių kolegijų narė, daugiau kaip 47 publikacijų bendraautorė ir daugelio mokslinių renginių, įskaitant semantinio giliojo mokymosi seminarų ciklą, organizatorė.

Taip pat laukiamas dr. Jorge Gracia, Saragosos universiteto (Ispanija) Kompiuterių mokslo ir sistemų inžinerijos katedros vyriausiasis mokslo darbuotojas. Jis taip pat yra Aragono inžinerinių tyrimų instituto (I3A) ir Paskirstytųjų informacinių sistemų tyrimų grupės narys. J. Gracia vadovauja COST (angl. European Cooperation in Science and Technology) veiklai NEXUS LINGUARUM – Europos tinklui, skirtam lingvistinių duomenų mokslo plėtotei. Ši COST veikla jungia daugiau kaip 200 tyrėjų iš 42 šalių. Pagrindiniai jo mokslinių tyrimų interesai apima semantinį žiniatinklį, ontologijų dermės problematiką, daugiakalbį duomenų žiniatinklį ir užklausų interpretavimą. Pastaraisiais metais jis prisidėjo prie lingvistinių susietųjų duomenų mokslinių tyrimų, ypatingą dėmesį skirdamas leksikografiniams ištekliams. J. Gracia yra vienas iš W3C „Ontology Lexica“ bendruomenės grupės pirmininkų. Dr. J. Gracia paskelbė daugiau kaip 80 mokslinių darbų, dalyvavo organizuojant daugiau kaip 20 mokslinių renginių.

Konferencija vyks kartu su COST veiklos CA18209 „European Network for Web-Centred Linguistic Data Science (NEXUS LINGUARUM)“ renginiais. NEXUS LINGUARUM veikoje daugiausia dėmesio skiriama lingvistinių duomenų tyrimams ir LLOD (lingvistinių susietųjų atvirų duomenų) technologijų taikymui kuriant, dalijantis ir pakartotinai naudojant kalbos išteklius.