Sukurtas dirbtinio intelekto dekoderis, galintis smegenų veiklą paversti nenutrūkstamu teksto srautu, – tai yra proveržis, leidžiantis pirmą kartą neinvaziniu būdu perskaityti žmogaus mintis, rašo „The Guardian“.
Asociatyvi „Pixabay“ nuotr.
Naudojant vien tik fMRT skenavimo duomenis, dekoderiui pavyko neįtikėtinai tiksliai atkurti kalbą, kai žmonės klausėsi istorijos ar tiesiog ją įsivaizdavo. Ankstesnėms kalbos dekodavimo sistemoms reikėjo chirurginių implantų, o naujausia technologija leidžia tikėtis naujų būdų atkurti kalbą pacientams, kuriems dėl insulto ar motorinių neuronų ligos sunku bendrauti.
„Mes buvome šiek tiek nustebę, kad ji taip gerai veikia. Aš prie šios technologijos dirbau 15 metų... todėl buvau maloniai nustebintas ir sujaudintas, kai tai suveikė“, – sakė šiam tyrimui vadovavęs Teksaso universiteto Ostine neurologas dr. Alexanderis Huthas.
Šis pasiekimas padėjo įveikti pagrindinį fMRT ribotumą – nors šiuo metodu galima neįtikėtinai dideliu raiškumu atvaizduoti smegenų aktyvumą tam tikroje vietoje, jo veikimas paprastai šiek tiek atsilieka, todėl neįmanoma stebėti aktyvumo realiuoju laiku.
Atsilikimas atsiranda todėl, kad atliekant fMRT skenavimą, matuojama kraujotakos reakcija į smegenų veiklą, kuri pasiekia maksimumą ir grįžta į pradinę padėtį maždaug per 10 sekundžių, todėl net galingiausias skeneris negali nieko padaryti. „Tai triukšmingas ir lėtas nervų veiklos tarpininkas, – sakė dr. A. Huthas.
Technologijos ribotumas trukdė interpretuoti smegenų veiklą reaguojant į natūralią kalbą, nes gaunama „informacijos mišrainė“, išsibarsčiusi per kelias sekundes.
Tačiau atsiradus dideliems kalbos modeliams – tokiam dirbtiniam intelektui, kuriuo grindžiamas „OpenAI“ sukurtas „ChatGPT“ – atsirado naujų galimybių. Šie modeliai gali skaičiais atvaizduoti semantinę kalbos prasmę, todėl mokslininkai turi galimybę stebėti, kokie neuronų aktyvumo modeliai atitinka tam tikros reikšmės žodžių eilutes, užuot bandę pažodžiui perskaityti smegenų aktyvumą.
Mokymosi procesas buvo labai intensyvus – trys savanoriai turėjo 16 valandų gulėti skeneryje ir klausytis tinklalaidžių. Dekoderis buvo išmokytas susieti smegenų veiklą su reikšme, naudojant didelį kalbos modelį GPT-1, „ChatGPT“ pirmtaką.
Vėliau vėl buvo skenuojamos tų pačių dalyvių smegenys, jiems klausantis naujos istorijos arba įsivaizduojant, kad patys pasakoja istoriją, – dekoderis buvo naudojamas tekstui generuoti vien iš smegenų veiklos. Maždaug pusę atvejų tekstas labai tiksliai, o kartais ir visiškai tiksliai atitiko numatytą pradinių žodžių reikšmę.
„Mūsų sistema veikia idėjų, semantikos, prasmės lygmeniu, – sakė dr. A. Huthas. – Dėl šios priežasties gauname ne tikslius žodžius, o esmę.“
Pavyzdžiui, kai dalyviui buvo paleisti žodžiai „Aš dar neturiu vairuotojo pažymėjimo“, jis juos perteikė kaip „Ji dar net nepradėjo mokytis vairuoti“. Kitu atveju perskaityti žodžiai „Nežinojau, ar šaukti, ar verkti, ar bėgti. Vietoj to pasakiau: „Palik mane ramybėje!“ buvo iššifruoti kaip „Pradėjo rėkti ir verkti, o tada tiesiog pasakė: „Sakiau tau, kad paliktum mane ramybėje“.
Skeneryje gulinčių dalyvių taip pat buvo paprašyta peržiūrėti keturis trumpus begarsius vaizdo įrašus, o dekoderis, naudodamasis jų smegenų veikla, sugebėjo tiksliai apibūdinti, kas juose buvo rodoma, rašoma žurnale „Nature Neuroscience“ paskelbtame straipsnyje.
„Neinvaziniam metodui tai yra didžiulis šuolis į priekį, palyginti su tuo, kas buvo daroma anksčiau – paprastai tai tebūdavo pavieniai žodžiai arba trumpi sakiniai“, – sakė dr. A. Huthas.
Kartais dekoderis ne taip suprasdavo, jam būdavo sunku iššifruoti tam tikrus kalbos aspektus, įskaitant įvardžius. „Jis nežino, ar tai pirmas, ar trečias asmuo, vyras, ar moteris, – aiškino dr. A. Huthas. – Kol kas nežinome, kodėl jis šioje vietoje stringa.“
Tyrime nedalyvavęs Oksfordo universiteto neurobiologas prof. Timas Behrensas apibūdino jį kaip „techniškai labai įspūdingą“ ir sakė, kad jis atveria daugybę eksperimentinių galimybių, įskaitant sapnuojančio žmogaus minčių skaitymą arba naujų idėjų, kylančių iš foninės smegenų veiklos, tyrimą. „Tokie generatyviniai modeliai leidžia nauju lygmeniu pamatyti, kas vyksta smegenyse, – sakė jis. – Tai reiškia, kad pasitelkus fMRT galima iš tikrųjų perskaityti kažką gilesnio.“