Kompiuteriai gali atpažinti objektus beveik tokiu pat tikslumu, kaip ir žmonės, tad jie gali atlikti viską, nuo paveikslėlių pavadinimų kūrimo iki automobilių vairavimo. Bet keistų optinių iliuzijų rinkinys atskleidė, kad mašinos mato ne taip, kaip mes, tad jos darosi pažeidžiamos.
Vaizdo atpažinimo algoritmai mokosi atpažinti objektus, analizuodami daug atvaizdų ir identifikuodami bruožus, skiriančius, tarkime, katę nuo kavos puodelio. Jeffas Clune'as iš Wyomingo universiteto Laramie'yje su kolegomis siekė išsiaiškinti, ar tam tikras vaizdo atpažinimo algoritmas, vadinamasis DNN (deep neural network – gilusis nervinis tinklas) gali būti susietas su genetiniu algoritmu, naudojančiu natūraliąją atranką primenantį procesą paveikslų vertinimui.
Tokie algoritmai, naudodami žmonių vertinimą rezultatų koregavimui, anksčiau yra sukūrę obuolių ir veidų atvaizdus, tad Clune'as tikėjosi, kad pakeitus žmogų DNN, viskas veiks taip pat gerai. „Vietoje to gavome gan keistus atvaizdus: gepardas nė iš tolo nepriminė gepardo“, – sako Clune'as.
Clune'as naudojo vieną iš geriausių DNN – „AlexNet“, kurią 2012-aisiais sukūrė Toronto (Kanada) universiteto mokslininkai. Jo veikimas buvo toks įspūdingas, kad „Google“ pernai pasamdė ją kūrusią komandą.
Pasirodė, kad genetinis algoritmas kuria atvaizdus, atrodančiu kaip atsitiktinis triukšmas, kurį „AlexNet“ paskelbė vaizduojant įvairius gyvūnus didesniu, nei 99 % užtikrintumu. Kiti atvaizdai, sukurti kitaip, žmonėms atrodo kaip abstraktusis menas, tačiau apgauna „AlexNet“ ir ji mato beisbolą, elektrinę gitarą ar kitą įprastą daiktą.
Algoritmą trikdo jo ir žmonių pasaulio matymo skirtumai, sako Clune'as. Mes gepardą atpažįstame, žiūrėdami į visumą – tinkamą kūno formą, kailio raštą ir pan., – o DNN domisi tik tomis objekto dalimis, kurios labiausiai skiriasi nuo kitų. Susitelkimas į šiuos objektus, o ne į paveikslą kaip visumą, nuveda DNN klaidingu keliu. „Beveik atrodo, kad DNN yra didžiuliai kubizmo fanai“, – sako Clune'as.
Šių iliuzijų ir skirtumų tarp algoritmų bei žmonių tyrinėjimas gali mus daugiau išmokyti apie save pačius, pažymi Jürgenas Schmidhuberis iš Dalle Molle Dirbtinio intelekto tyrimų instituto Manno'e, Šveicarijoje. „Šie tinklai daro prognozes, apie tai, ką neurologai išsiaiškins po poros dešimtmečių, kai gebės iššifruoti ir perskaityti žmogaus smegenų sinapses.“
Kiek anksčiau Clune norėtų išsiaiškinti, kaip išmokyti DNN ignoruoti iliuzijas. Jei DNN gali apmauti beprasmiai paveikslėliai, užpuolikui gali pavykti apeiti veido atpažinimo saugumo sistemas ar net priversti nepilotuojamus automobilius matyti klaidinančius kelio ženklus. „Taip kyla bet kokios programos, naudojančios šį kompiuterinį matymą, saugumo pažeidimo grėsmė“, – įspėja jis.