Dabartinė dirbtinio intelekto infrastruktūra daugiausia kuriama plečiant ją remiantis grafikos procesorių serveriais. „Google“ pažymėjo, kad procesoriai vis dar yra pagrindinis AI/ML darbo krūviams skirtas skaičiavimo įrenginys, pagal jų „Google Cloud Services“ debesijos vidinę analizę.
Renginio „TechFieldDay“ metu „Google Cloud“ produktų vadovo Brandon Royal pranešime buvo paaiškinta procesorių padėtis šiandieniniame DI žaidime. DI gyvavimo ciklas skirstomas į dvi dalis: mokymą ir išvadų darymą. Mokymo metu reikia didžiulių skaičiavimo pajėgumų ir milžiniškos atminties talpos, kad į atmintį tilptų vis didėjantys dirbtinio intelekto modeliai. Naujausiuose modeliuose, pavyzdžiui, GPT-4 ir „Gemini“, yra milijardai parametrų, todėl, norint juos efektyviai apmokyti, reikia tūkstančių lygiagrečiai veikiančių grafikos procesorių ar kitų greitintuvų.
Kita vertus, išvadų darymui reikia mažesnio skaičiavimo intensyvumo, tačiau vis tiek naudingas spartinimas. Iš anksto apmokytas modelis optimizuojamas ir diegiamas atliekant išvadą, kad būtų galima prognozuoti naujus duomenis. Nors reikia mažiau skaičiavimų nei mokant, pateikimui realiuoju laiku labai svarbus vėlavimas ir pralaidumas. „Google“ nustatė, kad nors grafikos procesoriai idealiai tinka mokymo etapui, modeliai dažnai optimizuojami ir išvada atliekama naudojant procesorius. Tai reiškia, kad yra klientų, kurie dėl įvairių priežasčių dirbtinio intelekto išvadų darymo terpe pasirenka centrinius procesorius.
Tai gali būti kainos ir prieinamumo klausimas. Procesoriai paprastai yra pigesni ir lengviau prieinami nei aukštos klasės grafikos procesoriai ar specializuoti dirbtinio intelekto greitintuvai. Daugeliui taikomųjų programų procesoriai užtikrina pakankamą našumą išvadoms daryti mažesnėmis sąnaudomis. Centriniai procesoriai taip pat pasižymi lankstumu. Kadangi dauguma sistemų jau turi centrinius procesorius, jie suteikia galimybę lengvai diegti mažesnius dirbtinio intelekto modelius. Grafikos procesoriams dažnai reikia specializuotų bibliotekų ir tvarkyklių, o procesoriais grindžiama išvada gali būti gaunama su esama infrastruktūra. Dėl to dirbtinį intelektą paprasčiau integruoti į esamus produktus ir darbo eigą. Taip pat susiduriama su vėlavimo ir pralaidumo kompromisais. Grafikos procesoriai pasižymi dideliu lygiagrečiu pralaidumu išvadų darymui. Tačiau procesoriai dažnai gali užtikrinti mažesnį vėlavimą realaus laiko užklausoms. Procesoriaus išvadų darymas gali būti priimtinesnis tokioms taikomosioms programoms, kaip internetinės rekomendacijos, kurioms reikia reaguoti po sekundės.