Mona Liza dabar gali ne tik šypsotis. „Microsoft“ tyrėjai pristatė savo sukurtą dirbtinio intelekto modelį, kuris priverčia nuotrauką ar paveikslėlį kalbėti, skelbia CNN.
Dirbtinio intelekto įrankis, vadinamas „VASA-1“, veikia sujungdamas nejudančią nuotrauką ar paveikslėlį su kalbančio asmens garso įrašu – taip nuotrauka virsta vaizdo įrašu.
Įrankis jau dabar pasižymi įtikinama lūpų sinchronizacija ir natūraliais veido bei galvos judesiais.
Viename demonstraciniame vaizdo įraše tyrėjai privertė Moną Lizą repuoti taip, kaip tai daro aktorė Anne Hathaway.
„VASA-1“ rezultatai yra linksmi, tačiau ir šiek tiek trikdantys savo tikrumu.
„Microsoft“ teigia, kad ši technologija galėtų būti naudojama švietimui, kaip pagalba asmenims, turintiems bendravimo problemų, arba kuriant virtualius žmonių draugus. Tačiau taip pat nesunku suprasti, kad šia priemone būtų galima piktnaudžiauti ir panaudoti kuriant netikrus tikrų asmenų vaizdo įrašus.
Kol kas „Microsoft“ teigia neplanuojanti „VASA-1“ modeliu leisti naudotis visiems. Šis žingsnis panašus į tai, kaip „Microsoft“ partnerė „OpenAI“ sprendžia problemas, susijusias su jos vaizdo įrašus iš teksto galinčio kurti dirbtinio intelekto įrankiu „Sora“: „OpenAI“ apie „Sora“ pranešė vasario mėnesį, tačiau kol kas prieigą prie jos suteikė tik kai kuriems profesionaliems naudotojams ir kibernetinio saugumo profesoriams bandymų tikslais.
„Prieštaraujame bet kokiam elgesiui, kuriuo siekiama sukurti klaidinantį ar kenkiantį realių asmenų turinį“, – pranešime teigė „Microsoft“ tyrėjai. Jie pridūrė, kad bendrovė „neplanuoja viešai skelbti“ produkto, „kol nebus įsitikinta, kad ši technologija bus naudojama atsakingai ir laikantis tinkamų taisyklių“.