Microsoft VASA genererar talande ansikten i realtid

Postat:
11:37 - 2024-04-19
Skribent:
| Lars A
Kommentarer:
17

Microsoft har introducerat VASA: ett ramverk för att generera talande ansikten i realtid. Exemplen nedan visar personer som inte existerar. De talande ansiktena har skapats utifrån en enda bild och ett enda ljudklipp.

Bild-till-video-modellen kan simulera mänskliga ansiktsuttryck och får munnarna att röra sig korrekt tillsammans med talet. I realtidsläget kan VASA-1 generera videor med 40 bildrutor per sekund och med en latens på bara 170ms.

Microsoft skriver att tekniken både har stor potential och risker. Därför kommer inte VASA släppas förrän utvecklarna är säkra på att tekniken kommer användas på ett ansvarsfullt vis som följer lagar och regelverk.

Our premiere model, VASA-1, is capable of not only producing lip movements that are exquisitely synchronized with the audio, but also capturing a large spectrum of facial nuances and natural head motions that contribute to the perception of authenticity and liveliness.

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Mest kommenterat

  1. Var med och rösta fram årets Androidtelefon 2025
  2. Vilket märke har din Androidmobil 2025?
  3. OBS: Du kan kanske ladda hem en ny systemuppdatering via Google Play
  4. Ikea introducerar billiga Qi2-laddarna Västmärke
  5. 2026 kan bli ett surt år för smartphones
  6. Googles framtvingade ikonteman är bisarra

Mest läst

  1. OBS: Du kan kanske ladda hem en ny systemuppdatering via Google Play
  2. Vilket märke har din Androidmobil 2025?
  3. 2026 kan bli ett surt år för smartphones
  4. Nya modellen Gemini 3 Flash släpps globalt idag
  5. Googles framtvingade ikonteman är bisarra
  6. Google har ändrat sökningen på Pixel

  7. Visa topplistan

Undersökningar

Vilken är årets Androidtelefon 2025?

Visa resultatet

Loading ... Loading ...