Utvecklare visar upp Her-liknande framsteg för syntetiska röster

Postat:
10:09 - 2022-02-19
Skribent:
| Lars A
Kommentarer:
1

En utvecklare kallad Sonantic har presenterat framsteg för syntetiska röster. Enligt Sonantic kan deras AI-genererade röster nu vara mer nyanserade och efterlikna mänskliga känslor genom ändrade tonlägen.

Det går att ange att rösterna ska låta arga, rädda, ledsna eller glada. Senaste tillskottet är en röst som är tänkt att låta flörtig. Sonantic säger att en viktig del av framstegen är att införliva annat än tal i ljudet, likt små skratt och andetag.

Företagets mjukvara är dock ingen ren text-till-tal-motor utan kan mer anses vara en ”deepfake” för ljud. Sonantics vd Zeena Qureshi beskriver mjukvaran som ”Photoshop för röster”. Videon ovan, deras försök att skapa en flörtig röst, kan föra tankarna till Samantha i sci-fi-filmen Her.

Rösten har en syntetisk klang men är ändå kusligt trovärdig. Exemplen på Sonantics hemsida är dock långt ifrån lika imponerande och låter mer som en allmän text-till-tal-motor. Sonantic riktar sig till spel- och filmbranschen.

Vidare framsteg för de digitala assistenternas röster är dock att räkna med och de kommer sannolikt låta ännu mer mänskliga i framtiden.