Microsoft opracowaƂ technologię VASA, ktĂłra pozwala tworzyć realistyczne materiaƂy deepfake na podstawie jednego zdjęcia i ƛcieĆŒki dĆșwiękowej.

Oprogramowanie obsƂuguje synchronizację ust z dĆșwiękiem, gesty twarzy, ruchy gƂowy, a nawet niewidoczne ruchy ciaƂa w czasie rzeczywistym.

Microsoft Research opublikowaƂ dokument na temat aplikacji AI, ktĂłrą rozwija. Program nosi nazwę VASA-1 i potrafi tworzyć bardzo realistyczne wideo na podstawie tylko jednego zdjęcia twarzy i ƛcieĆŒki dĆșwiękowej. Co jeszcze bardziej imponujące, oprogramowanie generuje wideo i zamienia twarze w czasie rzeczywistym.

SprawdĆș: PoƂączenie nie jest prywatne

Visual Affective Skills Animator, czyli VASA, to ramy uczenia maszynowego, ktĂłre analizują zdjęcie twarzy, a następnie animują je do gƂosu, synchronizując ruchy ust i ust z dĆșwiękiem. Symuluje rĂłwnieĆŒ mimikę twarzy, ruchy gƂowy i nawet niewidoczne ruchy ciaƂa.

Zobacz jak dziaƂa Microsoft VASA:

Jak wszystkie generatywne AI, nie jest doskonaƂe. Maszyny wciÄ…ĆŒ mają problemy z drobnymi szczegóƂami, takimi jak palce czy — w przypadku VASA — zęby. Zwracając uwagę na zęby awatara, moĆŒna zauwaĆŒyć, ĆŒe zmieniają one rozmiary i ksztaƂt, co nadaje im niewƂaƛciwy wygląd. Jest to stosunkowo subtelne i wydaje się zmieniać w zaleĆŒnoƛci od iloƛci ruchu w animacji.

Są teĆŒ pewne manieryzmy, ktĂłre nie wyglądają do koƄca naturalnie. Trudno jest je opisać sƂowami. To raczej tak, jakby mĂłzg rejestrowaƂ, ĆŒe coƛ jest nieco nie tak z mĂłwcą. Jednak jest to zauwaĆŒalne tylko przy dokƂadnej obserwacji. Dla przypadkowego obserwatora twarze mogą wyglądać jak nagrane, mĂłwiące osoby.

Deepfake z VASA powaĆŒnym zagroĆŒeniem

Twarze uĆŒyte w demonstracjach badaczy są rĂłwnieĆŒ generowane przez AI za pomocą StyleGAN2 lub DALL-E-3. Jednak system dziaƂa z dowolnym obrazem — rzeczywistym lub wygenerowanym. MoĆŒe nawet animować malowane lub rysowane twarze.

Zobacz: Brak ID dzwoniącego

Narzędzie moĆŒe zapewnić wiele rozrywki, ale istnieją powaĆŒne obawy, ĆŒe cyberprzestępcy mogą uĆŒyć tej technologii do rozpowszechniania propagandy lub prĂłb oszustwa poprzez podszywanie się pod czƂonkĂłw rodziny. Biorąc pod uwagę, ĆŒe wielu uĆŒytkownikĂłw mediĂłw spoƂecznoƛciowych publikuje zdjęcia czƂonkĂłw rodziny na swoich kontach, byƂoby Ƃatwo dla kogoƛ zdobyć obraz i naƛladować tego czƂonka rodziny. Mogliby nawet poƂączyć to z technologią klonowania gƂosu, aby uczynić to bardziej przekonującym.

MateriaƂ deepfake stworzony w VASA na podstawie jednego zdjęcia:

ZespóƂ badawczy Microsoftu przyznaje, ĆŒe istnieje potencjaƂ naduĆŒyć, ale nie podaje odpowiedniej odpowiedzi na zwalczanie tego zjawiska — poza dokƂadną analizą wideo. Wskazuje na wczeƛniej wspomniane artefakty, ignorując trwające badania i ciągƂe doskonalenie systemu.

Jedynym namacalnym wysiƂkiem zespoƂu mającym na celu zapobieganie naduĆŒyciom jest nieudostępnianie go publicznie. “Nie planujemy wydania publicznej demonstracji online VASA, czy teĆŒ API, produktu, dodatkowych szczegóƂów implementacji ani ĆŒadnych powiązanych ofert, dopĂłki nie będziemy pewni, ĆŒe technologia zostanie wykorzystana odpowiedzialnie i zgodnie z odpowiednimi przepisami — powiedzieli badacze.

Praktyczne zastosowania

Technologia ma jednak kilka intrygujących i praktycznych zastosowaƄ. Jednym z nich byƂoby wykorzystanie VASA do tworzenia realistycznych awatarĂłw wideo, ktĂłre renderowane są lokalnie w czasie rzeczywistym, eliminując potrzebę zuĆŒywania pasma na transmisję wideo. Apple juĆŒ robi coƛ podobnego z dostępnymi w Vision Pro “przestrzennymi personami”. Dostrzegalne jest teĆŒ szerokie zastosowanie w grach wideo.

SzczegóƂy techniczne znajdują się w dokumencie whitepaper w repozytorium arXiv. Więcej demonstracji wideo znajduje się na stronie internetowej Microsoftu.

Autor: Kamil GliƄski, dziennikarz Vault-Tech.pl

Kamil GliƄski wykazuje się gƂęboką wiedzą i doƛwiadczeniem w dziedzinie cyberbezpieczeƄstwa, co jest kluczowe dla ochrony danych i systemĂłw w dynamicznie zmieniającym się ƛrodowisku cyfrowym. Jego umiejętnoƛć identyfikowania potencjalnych zagroĆŒeƄ i stosowania najnowszych technologii ochrony sprawiają, ĆŒe jest cenionym ekspertem. Ponadto jego zaangaĆŒowanie w ciągƂe doskonalenie umiejętnoƛci i aktualizowanie wiedzy o nowych zagroĆŒeniach oraz rozwiązaniach w cyberbezpieczeƄstwie podkreƛla profesjonalizm w zapewnianiu wysokiego poziomu bezpieczeƄstwa. WspóƂpracuje z Vault-Tech.pl od samego początku istnienia serwisu.

Czytaj teĆŒ: