Dirbtinio intelekto algoritmai, kuriuos sukūrė Berklio universiteto, „Facebook“ ir Karnegio Mellono universiteto tyrėjų komanda, suteik robotams geresnius gebėjimus prisitaikyti prie nepažįstamos vietovės ir joje judėti realiuoju laiku. Dabar jie gali įveikti sniegą, lietų, karštį ir nakties tamsą.
Pirmieji žingsniai
Bandomasis robotas sėkmingai įveikė smėlį, pėsčiųjų takus, aukštą žolę ir purvo krūvas nenukrisdamas. Jis taip pat geriau nei alternatyvios sistemos prisitaikė prie sunkios kuprinės, užmestos ant jo viršaus, arba prie slidžių, aliejingų šlaitų. Eidamas laiptais žemyn ir lipdamas per cemento ir akmenukų krūvas, jis pasiekė atitinkamai 70 proc. ir 80 proc. sėkmės rodiklius.
Robotas ne tik galėjo prisitaikyti prie naujų aplinkybių, bet ir padaryti tai per sekundės dalį. Tai labai svarbus žingsnis praktinio panaudojimo srityje.
Tyrėjų komanda naująją dirbtinio intelekto sistemą, pavadintą „Rapid Motor Adaptation“ (RMA), pristatys kitą savaitę vyksiančioje 2021 m. Robotikos konferencijoje.
„Mūsų įžvalga yra ta, kad pokyčiai yra visur, todėl nuo pat pirmos dienos RMA politikoje daroma prielaida, kad aplinka keisis“, – sakė pagrindinis tyrėjas Jitendra Malikas, Berklio universiteto Elektros inžinerijos ir kompiuterių mokslų katedros profesorius ir „Facebook“ dirbtinio intelekto tyrimų grupės (FAIR) mokslininkas.
Įspūdingas našumas
Anksčiau robotai ant kojų paprastai būdavo iš anksto programuojami tikėtinoms aplinkos sąlygoms, su kuriomis jie gali susidurti, arba mokomi naudojant kompiuterines simuliacijas ir ranka koduojamas taisykles, diktuojančias jų veiksmus.
„Kompiuterinis modeliavimas vargu ar viską atspindi“, – sakė pagrindinis autorius Ashishas Kumaras, Berklio universiteto doktorantas iš Maliko laboratorijos. „Mūsų robotas su RMA pasižymi stipriu prisitaikymo prie anksčiau nematytos aplinkos našumu ir šio prisitaikymo išmoksta visiškai sąveikaudamas su aplinka ir mokydamasis iš patirties. Tai yra nauja.“
RMA sistema sujungia bazinę politiką – algoritmą, pagal kurį robotas nustato, kaip judėti, – su prisitaikymo moduliu. Bazinė politika naudoja mokymąsi iš pastiprinimo, kad sukurtų išorinių aplinkos kintamųjų rinkinių valdymą. To išmokstama imituojant, tačiau vien to nepakanka, kad vaikštantis robotas būtų paruoštas realiam pasauliui, nes robote įmontuoti jutikliai negali tiesiogiai išmatuoti visų galimų aplinkos kintamųjų.
Karnegio Mellono universitetas / Dirbtinio intelekto valdomas robotas įveikia skirtingus išbandymus vaikščiojant
Norint tai išspręsti, adaptacijos modulis nukreipia robotą mokyti save apie aplinką naudojant informaciją, pagrįstą jo paties kūno judesiais. Pavyzdžiui, jei robotas pajunta, kad jo kojos tolsta, jis gali numanyti, kad paviršius, ant kurio jis stovi, yra minkštas, ir atitinkamai pritaikys kitus savo judesius.
Bazinė politika ir adaptacijos modulis veikia asinchroniškai ir skirtingais dažniais, todėl RMA gali patikimai veikti turėdamas tik nedidelį bortinį kompiuterį.