„Google“ dirbtinio intelekto platformoje „Vertex“ pristatomi du nauji dirbtinio intelekto modeliai – „Imagen 3“ ir „Veo“. Jie gali veikti atskirai, bet taip pat gali būti naudojami kartu. Pirmasis gali generuoti vaizdą pagal teksto užklausą, o antrasis priima vaizdą ir teksto užklausą bei jį animuoja.
„Imagen 3“ pranoksta ankstesnes versijas detalumu, apšvietimu ir artefaktų mažinimu. Nuo kitos savaitės ji bus prieinama visiems „Vertex AI“ naudotojams. Pateikiame keletą pavyzdinių vaizdų, kurie buvo sukurti naudojant modelį, ir naudotas užuominas.
Papildomos funkcijos prieinamos naudotojams, įtrauktiems į leidžiamųjų sąrašą. Tai yra „inpainting“ – esamo vaizdo papildymas elementais, „outpainting“ – vaizdo išplėtimas už jo pradinių ribų ir „product background“ – fonas pakeičiamas automatiškai.
Įmonės gali pateikti etaloninius vaizdus, kurie bus naudojami kartu su raginimu. „Google“ teigia, kad „Imagen 3 Customization“ leidžia naudotojams generuojant naujus vaizdus įterpti savo prekės ženklą, stilių, logotipą, temą ar produkto savybes.
Naudodamiesi „Veo“, kuris šiuo metu prieinamas privačioje peržiūroje, naudotojai gali paimti statišką vaizdą ir pateikti scenos nurodymus, kaip jį animuoti. Be to, „Veo“ gali kurti vaizdo įrašus visiškai nuo nulio, pateikdama tik tekstinę užuominą.
Tiek „Imagen“, tiek „Veo“ rezultatai yra nematomai paženklinti „DeepMind SynthID“ vandens ženklu, todėl dirbtinio intelekto sukurtų vaizdų negalima laikyti tikrais. Saugos filtrai užtikrina, kad dirbtinis intelektas negalėtų sukurti kenksmingo turinio. Be to, „Google“ savo dirbtiniam intelektui apmokyti nenaudojo klientų duomenų ir siūlo autorių teisių apsaugą.