„OpenAI“ išleido naujausią generatyvinį modelį, pavadintą „o1“. Tai yra pirmasis numatytos „mąstančių“ neuroninių tinklų serijos atstovas, apmokytas atsakinėti į sudėtingus klausimus greičiau nei žmonės.
Kartu buvo pristatyta ir mažesnė bei pigesnė versija pavadinimu „o1-mini“. Atrodo, kad tai yra ilgai laukta ir reklamuota „Strawberry“ projekto versija. Tai dar vienas „ChatGPT“ kūrėjų žingsnis link pagrindinio tikslo – sukurti dirbtinį intelektą, prilygstantį žmogaus protui.
Kalbant apie praktines naujoves, šis modelis geriau atlieka kodavimo užduotis ir sprendžia daugiažingsnes užduotis, palyginti su savo pirmtakais. Tačiau jis taip pat yra brangesnis ir lėtesnis, todėl kasdieniams darbams geriau naudoti senesnius įrankius.
Modelis taip pat sugeba savarankiškai taisyti klaidas, naudodamas pastiprinimo mokymosi (Reinforcement Learning, RL) techniką – atlygiais ir bausmėmis pagrįstą sistemą. Be to, jis geba pradėti „minčių grandinę“, apdorodamas užklausas taip, kaip žmonės sprendžia problemas – žingsnis po žingsnio. Kitaip tariant, modelis gali pats save tikrinti ir daryti tam tikras išvadas ateičiai, išsaugodamas jas savo atmintyje.
Nepaisant viso to, kūrėjai pripažįsta, kad visiškai atsikratyti „klaidų“ dar nepavyko. Tačiau ši problema sumažėjo.
Tuo tarpu matematikos srityje modelis jau yra beveik nepriekaištingas. Pavyzdžiui, GPT-4o teisingai išsprendė tik 13 % Tarptautinės matematikos olimpiados užduočių, o „o1“ gavo 83 %.
„OpenAI“ tyrimų vadovas Džeris Tvorekas paaiškino, kad mokymosi metodai, naudoti „o1“, iš esmės skiriasi nuo ankstesnių. Buvo naudojami kiti algoritmai ir naujas duomenų rinkinys. Kompanija šio modelio išleidimą vadina „ankstyvuoju peržiūrėjimu“, siekdama pabrėžti, kad jis dar jaunas.
„ChatGPT Plus“ ir „Team“ vartotojai jau šiandien gali naudotis „o1“ ir „o1-mini“. „Enterprise“ ir „Edu“ klientai galės išbandyti juos kitą savaitę. Vėliau „OpenAI“ planuoja padaryti „mini“ versiją viešai prieinamą.