Šneką tekstu paverčiantis dirbtinis intelektas parodė, kurie šalies TV žinių vedėjai kalba aiškiausiai. Tyrimą trečiąkart inicijavusi bendrovė „Kantar“ išanalizavo robotų šifruotą žinių medžiagą ir sudarė raiškiausiai kalbančių TV vedėjų topą. LRT kanale pirmavo Marijus Žiedas, LNK – Lina Kairytė, TV3 – Rokas Petkevičius, Lietuvos rytas TV – Marius Jančius, Info TV / BTV – Arnas Mazėtis.
Asociatyvi „Pixabay“ nuotr.
Atpažįsta apie 99 proc. žodžių
„Visi šalies televizijų vedėjai yra tikri kalbos profesionalai – dešimtbalėje sistemoje jie gautų 10 balų. Tad kalbėdami apie topą, turėkime minty, kad lyginame geriausius su geriausiais. Matome, kad dirbtinis intelektas paslydo tik ties pavieniais žodžiais, absoliučią daugumą žinių vedėjų pateikiamo turinio jis atpažino sklandžiai“, – sakė „Kantar Komunikacijos monitoringo ir analizės skyriaus vadovas Deividas Butkus.
Pasak jo, pirmose šešiose pozicijose esančių žinių vedėjų šneką dirbtinis intelektas atpažino daugiau nei 99 proc. tikslumu, o itin lengvai susidorojo su Marijaus Žiedo (LRT) ir Linos Kairytės (LNK) pateikta informacija (apie 99.5 tikslumu).
„Šalies žinių vedėjai turi neabejotinai puikią dikciją, be to, ir dirbtinis intelektas nuolat tobulinamas, pvz., kai startavome 2018 metais, jis atpažindavo vidutiniškai 95,55 % žinių vedėjų šnekos, o šiemet – jau 98,56. Kai kuriais atvejais, vedėjams yra pritrūkę vos pusės procento iki 100, kaip kad Marijui Žiedui. O visų laikų geriausią rekordą kol kas yra pasiekusi Justė Tamošaitienė (LRT), 99,85 proc. Tokius balsus galima naudoti kaip lietuvių šnekos etaloną“, – komplimentų žinių vedėjų šnekai negailėjo ekspertas D. Butkus.
Greitakalbiai – LNK
Didžiausi greitakalbiai tarp žinių vedėjų – LNK kanale. Jų žinių vedėjai Karolina Liukaitytė, Eglė Šantaraitė, Paulius Skučas ir Aurelijus Bezekavičius per 5 minutes sugeba perskaityti daugiau kaip 720 žodžių, išlaikydami maždaug 98 proc. šnekos atpažįstamumą. Pvz., Lina Kairytė per penkias minutes pasako trečdaliu žodžių mažiau nei Karolina Lukaitytė, tačiau jos šnekos atpažįstamumas yra tarp rekordinių, apie 99,5 %. Nedaug jai nusileidžia ir taip pat ramesniu tempu kalbantis kolega Gintaras Deksnys (99,38 %).
Sūrskio ir Mauzerio naujadarų intelektui dar reikia mokytis
Įdomumo dėlei, „Kantar“ išanalizavo kaip dirbtiniam intelektui sekasi atpažinti ne tokia nugludinta šneka kalbančių žinių vedėjų, Sūrskio ir Mauzerio iš LRT „Dviračio žinių“, tartį. Net ir šių vedėjų atveju, nors klydo labiau, žodžių atpažinimo procentas siekė apie 90 proc.: robotas atpažino 92,53 proc. Algio Ramanausko ir 88,21 % Rimo Šapausko įkūnytų personažų šnekos.
„Šie personažai nevengia naudoti nenorminių žodžių, įterpia vieną kitą žargoną ar svetimybę, turi savotišką speficinę tartį, tad natūralu, kad tokią prieskoningą originalią kalbą dirbtiniam intelektui sekėsi atpažinti sunkiau. Kita vertus, dėl to ši sistema ir vadinasi intelektu, kad ji mokosi – apdorojusi tam tikrą kiekį peliukų dialogų, ji išmoktų tinkamai atpažinti ir jų šneką“, – sakė „Kantar ekspertas.
Balso atpažinimas supurtys industriją
„Kantar“ grupės ekspertų teigimu, balso atpažinimo technologijos padarys rinkai panašų poveikį kaip kažkada padarė išmanieji telefonai – sukels dar vieną didžiulį perversmą visoje industrijoje.
„Skaičiuojama, kad daugiau nei ketvirtadalis paieškų per „Google“ atliekama balsu ir jog ilgai netruks, kol šis skaičius pasieks pusę, tad visi verslai tam turi būti pasirengę. Balso paieška bus naujoji įprasta paieška, o balso technologijos taps nauja nūdiena. Mes tam pradėjome ruoštis prieš kelerius metus, kai įdiegėme automatinio šnekos atpažinimo ir pavertimu tekstu technologiją TV bei radijo naujienų monitoringui, dabar pradėsime naudoti socialinių medijų tinklalaidėms stebėti. Ilgainiui be šios technologijos negalės apsieiti dauguma verslų“, – sako D. Butkus.
Technologija šneką paverčia tekstu
Naujovišką žinių monitoringo sprendimą rinkos tyrimų bendrovė „Kantar“ sukūrė kartu su kalbos technologijų bendrove „Tilde IT“. Be šios srities, ši dirbtinio intelekto technologija taip gali būti naudojama virtualiųjų asistentų („chatbots“) ir šnekos vertimui iš vienos kalbos į kitą („speech-to-speech“).
Automatinio šnekos atpažinimo technologija yra pagrįsta giluminių neuroninių tinklų modeliu, kuris dirbtinį intelektą išmoko atpažinti žodžius ir tam tikras jų struktūras. Robotų mokymui panaudota daugiau kaip 250 valandų garsynas, apie 70 milijonų lietuviškų sakinių ir per 700 tūkstančių žodžių. Ypatingas dėmesys skirtas raktažodžiams, susijusiems su verslo komunikacija. Neuroniniai tinklai yra nuolat tobulinami.
Apie tyrimą
Atlikdama šį tyrimą, „Kantar“ išanalizavo 5 šalies televizijų, transliuojančių žinių laidas, žinių vedėjų šneką. Buvo analizuoti 5 min. trukmės žinių fragmentai su kiekvieno vedėjo skaitoma informacija. Vėliau suskaičiuotas WER (word error rate) procentas – kiek iš perskaityto teksto dirbtinis intelektas žodžių atpažino teisingai, o kiek suklydo. Tyrimas atliktas šių metų vasario mėnesį.