Vaizdų atpažinimo technologijos šiais laikais plačiai naudojamos daugelyje mus supančių sričių. Dar 70-jame dešimtmetyje ši technologija buvo skirta robotikos industrijai. Tuo metu naudodamiesi vaizdų atpažinimu mokslininkai bandė imituoti žmogaus regėjimą, kuris turėjo padėti robotams orientuotis erdvėje. Skirtos robotams, dabar šios technologijos supa mus ir kasdienybėje – padeda gamyboje, yra naudojamos atpažįstant ligas, rašoma pranešime žiniasklaidai. Kas jos iš tiesų ir kur baigiasi šių technologijų pritaikymo ribos?
Vaizdų atpažinimo technologijos. „LinkMenų fabriko“ arch. nuotr.
„70-jame dešimtmetyje pirmiesiems universitetams pradėjus dirbti su dirbtinio intelekto idėja, sukurti algoritmai suformavo pamatus šių laikų vaizdų atpažinimo metodams. Šiais laikais šie metodai naudojami įvairiose srityse – pradedant nuo automatizuotų gamybos ar siuntų skirstymo linijų, baigiant medicininiais tyrimais, skirtais atpažinti klastingas ligas, kurias anksčiau galėdavo pamatyti tik įgudusio ir didelę patirtį turinčio gydytojo akis“, – apie vaizdų atpažinimo technologijas pasakoja Vilniaus Gedimino technikos universiteto („Vilnius Tech“) Kūrybiškumo ir inovacijų centro „LinkMenų fabrikas“ virtualios realybės specialistas ir projektų vadovas Leonardas Žilinskas.
Pasak jo, dažniausiai šiais laikais vaizdų atpažinimo (angl. computer vision) technologija naudojama siekiant greitai ir tiksliai atpažinti gamybos broką, trūkstamą detalę gaminyje, reikalingą užrašą ant pakuotės, galiojimo datą ir kitus svarbius gamybos kokybei aspektus. Ši technologija taip pat naudojama įvairiuose papildytos bei išplėstos realybės sprendimuose.
„Vienas iš plačiausiai žinomų vaizdų atpažinimo sprendimų – ant pakuočių esančio brūkšninio kodo skenavimas“, – teigia L. Žilinskas.
Vaizdų atpažinimo technologija ir kompiuterinis matymas
„Vaizdų atpažinimo technologija – tik viena iš daugelio sudėtinių kompiuterinio matymo dalių. Pavyzdžiui, pažvelgus į dabar jau daugelio namuose esantį robotą-siurblį galime matyti, kaip jis važinėja po namus vengdamas kliūčių, kačių ir puikiai įsimena visą namų planą“, – sako virtualios realybės specialistas ir projektų vadovas.
Anot jo, tokiuose įrenginiuose kaip robotas-siurblys naudojamos skirtingos kompiuterinio matymo technologijos: viena žvelgia į vaizdą pro mums įprastas vaizdo kameras, kita „apšaudo“ aplinką lazerio spinduliais. Tačiau abi jos vadinamos kompiuteriniu matymu.
Kalbėdamas apie virtualią realybę L. Žilinskas pabrėžia, kad kompiuterinis matymas virtualioje realybėje naudojamas spręsti daugeliui uždavinių, tokių kaip rankų judesių sekimas, kur naudotojas gali valdyti virtualią aplinką nenaudodamas jokių papildomų valdiklių, arba veido išraiškų atpažinimas, kad virtualus pašnekovas galėtų atsakyti į žmogaus šypseną ir taip pat nusišypsoti.
Kur galima pamatyti vaizdų atpažinimo technologiją?
Kaip gali būti pritaikoma vaizdų atpažinimo technologija, galima pamatyti ir Lietuvos nacionalinėje Martyno Mažvydo bibliotekoje. Joje eksponuojamas Lietuvos gyvybės mokslų industrijos pasiekimų stendas, kurį Mokslo, inovacijų ir technologijų agentūros (MITA) užsakymu sukūrė „Vilnius Tech“ „LinkMenų fabrikas“ specialistai.
Lietuvos gyvybės mokslų industrijos pasiekimų stende demonstruojamos ir pristatomos septynios Lietuvoje gimusios inovacijos ir technologiniai sprendimai bei interaktyvus viktorinos stiliaus žaidimas.
„Stende pateikta informacija leidžia interaktyviai susipažinti su Lietuvos gyvybės mokslų inovacijomis. Jame galima pamatyti kiekvienos inovacijos trimatį modelį, peržiūrėti apie inovaciją pasakojantį vaizdo įrašą ir perskaityti trumpą aprašymą. Šis skaitmeninis grafinis turinys pateikiamas projektuojant vaizdą apskrito stendo paviršiuje pasitelkiant papildytos realybės sprendimą ir naudojant projektorius. Stende įrengtos kameros fiksuoja stendo detalių pozicijas pasitelkiant vaizdų atpažinimo algoritmą“, – pasakoja prie stendo kūrimo proceso prisidėjęs„Vilnius Tech“ „LinkMenų fabriko“ virtualios realybės specialistas ir projektų vadovas.
Pamatyti, kaip vaizdų atpažinimo technologija gali būti pritaikoma praktikoje, susipažinti su Lietuvos mokslininkų inovacijomis, galima apsilankius Lietuvos nacionalinėje Martyno Mažvydo bibliotekoje (Gedimino pr. 51, Vilnius) iki birželio 3 d.
Vaizdų atpažinimo technologijų rinka Lietuvoje
Rinkos tyrimų įmonės „MarketsandMarkets“ duomenimis, vaizdų atpažinimo technologijų rinkos vertė 2020 m. siekė 26,2 mlrd. JAV dolerių. Prognozuojama, kad iki 2025 m. šios rinkos vertė pakils iki 53,0 mlrd. JAV dolerių, su 15,1 proc. siekiančiu bendru metiniu augimo tempu.
Tokie skaičiai tik patvirtina šių technologijų potencialą ir svarbą netolimoje ateityje. Įdomu, kaip vaizdų atpažinimo rinka atrodo Lietuvoje.
„Lietuva taip pat nestovi vietoje, kuriasi nemažai labai perspektyvių startuolių. Vienas jų gyvuoja vos keletą metų, o jau gavo CE ženklo sertifikatą už krūtinės ląstos rentgeno analizės algoritmą, 94 proc. tikslumu atpažįstantį patologinius pakitimus”, – teigia virtualios realybės specialistas L. Žilinskas.
Pasak jo, jau dabar šios technologijos naudojamos gana plačiai, tik galbūt ne visi sprendimai taip gerai pastebimi. Pavyzdžiui, vaizdo atpažinimo technologijos padeda Vilniaus mieste prižiūrėti tvarką, keliose vietose vaizdo kameros stebi atliekų konteinerius, o dirbtinis intelektas tikrina ir sprendžia ar atliekos buvo išmestos į konteinerį ar padėtos šalia jo.
Tačiau kaip ir kiekviena technologija, vaizdų atpažinimas turi ir stipriąsias, ir silpnąsias puses. L. Žilinsko teigimu, apie 70 proc. naujų projektų, kuriuose buvo planuojama panaudoti vaizdų atpažinimo ar kompiuterinio matymo technologijas, žlunga.
„Dažniausiai tai nutinka dėl to, kad geriau išanalizavus uždavinio reikalavimus ir tikslus kyla kliūčių. Jos pasitaiko įvairios – pradedant netinkamais atmosferiniais reiškiniais, baigiant tuo, kad paaiškėja, jog tam tikruose projektuose kompiuterinio matymo technologijos visiškai nėra būtinos, nes tą gali pakeisti patikimesnės ir paprastesnės priemonės“, – įsitikinęs L. Žilinskas.
Visgi, anot virtualios realybės specialisto, Lietuva turi potencialo išplėsti vaizdų atpažinimo technologijų rinką.
Technologijos panaudojimo ribos – kokios jos?
Vaizdų atpažinimo technologijoms populiarėjant pasaulyje, vis dažniau kalbama apie šios technologijos panaudojimo ribas. Juk, pavyzdžiui, naudojant kai kuriuos technologinius sprendimus yra skenuojamas žmogaus atvaizdas. Kaupiant šiuos atvaizdus kyla klausimas – ar taip pažeidžiamas žmogaus privatumas? Ar Lietuvoje reikia diskutuoti apie vaizdų atpažinimo technologijų panaudojimo ribas? Ar šiai diskusijai dar yra per anksti?
„Pirmiausia ribas reikėtų vertinti protingumo principais ir kaskart šie principai gali būti kitokie, nelygu kokią problemą technologija sprendžia, kiek gyvybių ji gali išgelbėti. Tokios technologijos dažniausia sprendžia tam tikrą užduotį – tam jos ir yra užprogramuotos. Visa vaizdinė medžiaga virsta į informaciją, skirtą problemai spręsti, bet nėra kaupiama, nes saugoti neapdorotą vaizdinę medžiagą būtų per brangu“, – pasakoja L. Žilinskas.