Viena dirbtinio intelekto programa gali įveikti žmones žaidžiant šachmatais, „Go“, pokerį ir kitus žaidimus, pergalę kuriuose lemia įvairių strategijų įvertinimas ir pasirinkimas. „Student of Games“ pavadintą dirbtinį intelektą sukūrė „Google DeepMind“, kuri teigia, kad tai – reikšmingas žingsnis link dirbtinio bendrojo intelekto, galinčio kur kas geriau už žmogų atlikti bet kokią užduotį, skelbia „New Scientist“.
Asociatyvi „Pixabay“ nuotr.
„DeepMind“ dirbtinio intelekto srityje dirbęs, tačiau vėliau į startuolį „EquiLibre Technologies“ perėjęs Martinas Schmidas sako, kad „Student of Games“ (SoG) modelio ištakos siekia du projektus. Vienas iš jų buvo „DeepStack“ – dirbtinis intelektas, kurį Albertos universitete (Kanada) su kolegomis kūrė ir M. Schmidas ir kuris pirmasis įveikė profesionalius pokerio žaidėjus. Kitas – „DeepMind“ projektas „AlphaZero“, įveikęs geriausius šachmatų ir „Go“ žaidėjus.
Šie du modeliai skiriasi tuo, kad vienas iš jų yra orientuotas į neišsamių žinių žaidimus, t. y. į žaidimus, kuriuose žaidėjai nežino kitų žaidėjų būsenos, pavyzdžiui, kitiems žaidėjams tekusių kortų pokeryje, o kitas – į išsamių žinių žaidimus, pavyzdžiui, šachmatus, kuriuose abu žaidėjai visą laiką mato visų figūrų padėtį lentoje. Kuriant šiuos du modelius buvo naudojama absoliučiai skirtinga metodika. Siekdama sukurti modelį, kuris galėtų apibendrinti abiejų tipų žaidimus, bendrovė „DeepMind“ pasamdė visą „DeepStack“ komandą – taip gimė „SoG“.
M. Schmido teigimu, „SoG“ pagrindas yra tobulinimasis per praktiką. Pradinį modelį galima paleisti žaisti skirtingus žaidimus ir mokytis, žaidžiant su kita savo versija, išmokstant naujų strategijų ir palaipsniui tampant vis pajėgesniu.
Tyrėjai išbandė „SoG“ gebėjimus, žaidžiant šachmatus, „Go“, „Teksaso Hold`em“ pokerį ir „Scotland Yard“ vadinamą stalo žaidimą, taip pat „Leduc Hold`em“ pokerį ir pagal užsakymą sukurtą „Scotland Yard“ versiją su kitokia lenta, ir nustatė, kad „SoG“ yra pajėgus įveikti keletą esamų dirbtinio intelekto modelių ir šiuos žaidimus puikiai žaidžiančius žmones.
„Žaidžiant tokį žaidimą kaip pokeris, daug sunkiau išsiaiškinti, kaip ieškoti geriausio strateginio ėjimo, kai nežinai, kokias kortas turi varžovas – sako M. Schmidas. – Taigi, kai kurios „AlphaZero“ idėjos ir kai kurios „DeepStack“ idėjos buvo sujungtos į bendrą derinį, kuris ir tapo „Student of Games“.
Tyrime nedalyvavęs mokslininkas Michaelas Rovatsosas iš Edinburgo universiteto Jungtinėje Karalystėje sako, kad, nors šis modelis pakankamai įspūdingas, dar reikia nueiti labai ilgą kelią, kol dirbtinį intelektą bus galima laikyti protingu, nes skirtingai nei realiame pasaulyje, žaidimuose taisyklės ir elgesio principai yra aiškiai apibrėžti.