Įsivaizduokite, kad gyvybingus, itin tikroviškus vaizdo įrašus galite sukurti tiesiog aprašydami juos žodžiais. Šis viliojantis pažadas jau tampa realybe – plačiai naudojamo dirbtinio intelekto (DI) įrankio „ChatGPT“ kūrėjai „OpenAI“ ką tik pristatė naują vaizdo kūrimo įrankį „Sora“. Pasak Luko Keraičio, „Tele2“ Inovacijų eksperto, nors įrankis kol kas testuojamas, tikėtina, ateityje bus prieinamas visiems ir suteiks galimybę pagal kelias žodines užklausas kurti net ištisus filmus.
Asociatyvi „Pixabay“ nuotr.
Prieinamas ne visiems
„Praėjusiais metais stebėjomės paveikslėlių generavimo įrankiais. Jie tobulėjo itin greitai – tapo įmanoma pasiekti didelę kokybę ir gauti tai, ko nori, nors tam vis tiek reikės specifinių žinių. Buvo tikimasi, kad greitai tobulės ir vaizdo įrašų generavimo įrankiai, o metų pradžia kol kas pranoksta visus lūkesčius. Galima sakyti, kad „OpenAI“ vėl tai padarė – privertė technologijų entuziastų žandikaulius kaboti iš nuostabos“, – sako L. Keraitis.
„Stilinga moteris pasitikėdama savimi eina Tokijo gatve, aplink ją – šiltos neonų šviesos, miesto ženklai, praeiviai. Ji vilki juodą odinę striukę, ilgą raudoną suknelę, akinius nuo saulės, juodus batus, raudoną lūpdažį ir nešasi juodą rankinę“, – tokią užklausą naujajam įrankiui davę jo kūrėjai iškart pateikia ir gautą rezultatą. Įrašas – neįtikėtinai realistiškas, o tai, kad jis sukurtas DI išduoda tik ne iki galo ryškios aplinkos detalės.
Skelbiama, kad kol kas „Sora“ leis generuoti iki minutės trukmės vaizdo įrašus. Tiesa, kol kas įrankis prieinamas tik saujelei žmonių. Jo testavimo metu bus siekiama išsiaiškinti, kokios galimos šio įrankio naudojimo grėsmės – ar jis negali būti naudojamas misinformacijai, neapykantos turiniui, pateikti šališkų rezultatų.
„Puikiai prisimenu 2022-ųjų rugsėjį, kai „Meta“ pademonstravo tai, apie ką technologijų pasaulyje jau kurį laiką sklandė gandai – vieną pirmųjų kokybiškesnių vaizdo generavimo modelių „Make-a-video”. Tris sekundes ore skrendantis šuo supermeno kostiumu ir kiti į „GIF“ formatą panašūs vaizdo įrašai buvo pilni artefaktų, labai netobuli. Bet jau tuomet supratau, kiek daug tai keičia, kad ateityje, pavyzdžiui, Holivudo filmo gimimui tereiks scenarijaus“, – sako L. Keraitis.
Progreso greitis
Pasak L. Keraičio, įrankio „Sora“ pristatymą galima laikyti vienu retų atvejų, kai per vieną naktį pamatomas stiprus technologinis šuolis. Vos prieš mėnesį „Google“ pristatė savo vaizdo įrašų kūrimo modelį „Lumiere“, kuris jau atrodė pažangesnis už konkurentus, nors jo generuojami vaizdo įrašai primena pirmųjų išmanių telefonų vaizdo kokybę ir, kaip ir konkurentai, generuoja tik iki 5-10 sekundžių trukmės įrašus.
„Sora“ kokybė atrodo išties geriau, daug mažiau artefaktų, daugiau nuoseklumo vaizde. Žiūrint kai kuriuos kadrus galima patikėti, kad tai yra filmuoti vaizdai. Galima įtarti, kad „Sora“ modelis buvo apmokomas sintetiniais duomenimis iš kompiuterinių žaidimų. Tai spėjama dėl jo kuriamų vaizdų panašumo į „Unreal Engine 5“ žaidimų grafikos variklio panašumą“, – pastebi „Tele2“ Inovacijų ekspertas.
Anot jo, galima tikėtis, kad anksčiau ar vėliau „Sora“ modelio principu sukurtas vaizdo įrašų generavimo įrankis taps viešas ir prieinamas visuomenei. Tiesa, kol kas niekas nežino kada tai galėtų nutikti – galbūt jį technologijų entuziastai galės išbandyti jau šiemet.
„Tai „OpenAI“ suteiktų svarbų konkurencinį pranašumą. Vis dėlto, nesunku įsivaizduoti, kaip toks įrankis galėtų būti panaudotas plačioms melagystėms ir propagandai – „OpenAI“ teks atsakomybė ieškoti išeičių iš šių klausimų. Tikėtina, kad įmonė šį galingą įrankį norės paleisti tik po lapkritį vyksiančių JAV prezidento rinkimų. O galbūt jų nelauks ir paviešins įrankį anksčiau? Nekantrauju išbandyti“, – sako L. Keraitis.
Ekspertas priduria, kad jau laukiama ir kito svarbaus žingsnio, susijusio su DI galimybėmis suprasti vaizdą – įrašų redagavimo įrankio.