Microsoft VASA genererar talande ansikten i realtid

Postat:

11:37 - 2024-04-19

Skribent:

Kommentarer:

Microsoft VASA genererar talande ansikten i realtid

Microsoft har introducerat VASA: ett ramverk för att generera talande ansikten i realtid. Exemplen nedan visar personer som inte existerar. De talande ansiktena har skapats utifrån en enda bild och ett enda ljudklipp.

Bild-till-video-modellen kan simulera mänskliga ansiktsuttryck och får munnarna att röra sig korrekt tillsammans med talet. I realtidsläget kan VASA-1 generera videor med 40 bildrutor per sekund och med en latens på bara 170ms.

Microsoft skriver att tekniken både har stor potential och risker. Därför kommer inte VASA släppas förrän utvecklarna är säkra på att tekniken kommer användas på ett ansvarsfullt vis som följer lagar och regelverk.

vasa-1-microsoft-1-mp4

vasa-1-microsoft-2-mp4

vasa-1-microsoft-3-mp4

vasa-1-microsoft-4-mp4

vasa-1-microsoft-5-mp4

Our premiere model, VASA-1, is capable of not only producing lip movements that are exquisitely synchronized with the audio, but also capturing a large spectrum of facial nuances and natural head motions that contribute to the perception of authenticity and liveliness.

Källa: Microsoft

LÄS MER OM:
AI: artificiell intelligens

Fyndtips från Prisjakt

JBL Endurance Race 2

590 kr ⬇ 19 %

Philips TAH8506 Wireless Over Ear

690 kr ⬇ 10 %

Nästa artikel →

← Föregående artikel

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Nästa artikel →

← Föregående artikel

Microsoft VASA genererar talande ansikten i realtid

Aktuellt

Aktuellt på Prisjakt

Populära ämnen

Undersökningar

Mest kommenterat

Mest läst

Undersökningar

Hur nöjd är du med Googles kvalitetskontroll överlag?

Microsoft VASA genererar talande ansikten i realtid

Mer Swedroid

Aktuellt

Aktuellt på Prisjakt

Populära ämnen

Undersökningar

Mest kommenterat

Mest läst

Undersökningar

Hur nöjd är du med Googles kvalitetskontroll överlag?