Výskumníci spoločnosti Microsoft vyvinuli nový nástroj AI s názvom VASA-1, ktorý dokáže zo statických obrázkov vytvárať presvedčivé videá hovoriacich ľudí.

Nástroj funguje tak, že nasníma fotografiu ľudskej tváre a zvukový súbor, Následne vytvorí synchronizované video, ktoré obsahuje nuansy tváre a prirodzene vyzerajúci pohyb, informoval Microsoft.

Aj keď sú videá celkovo pôsobivé, zuby na vygenerovaných tvárach často vyzerajú ako kreslené a úplne nezodpovedajú hyperrealistickej kvalite všetkého ostatného, akú Microsoft od generátora sľuboval.

Stále má však ísť len o začiatočnú verziu. Výskumníci poznamenávajú, že VASA-1 bude už čoskoro vedieť veľmi rýchlo produkovať vysokokvalitné videá, čo by mohlo byť užitočné pre aplikácie v reálnom čase, ako sú prekladateľské služby. Na druhej strane, niečo podobné môže výrazne uškodiť na scéne dezinformácií.

Na teraz je ale také niečo nepravdepodobné. Spoločnosť Microsoft nemá zatiaľ žiadne okamžité plány sprístupniť nástroj verejnosti. Dôvodom sú spomínané obavy z možného zneužitia a potrebu zodpovedného vývoj, ktorý sa môže pretiahnuť až do roku 2025.

Pošli nám TIP na článok



Teraz čítajú