OpenAI introducerar GPT-4o som kan tolka ljud, bild och text i realtid

Kusligt mänskliga röster

Postat:
19:43 - 2024-05-13
Skribent:
| Lars A
Kommentarer:
4

OpenAI har nyss presenterat sin senaste och mest avancerade språkmodell GPT-4o som kan tolka ljud, bild och text i realtid (något Google nyss visade att Gemini klarar). Tillägget av bokstaven ”o” i namnet på språkmodellen står för ”omni”.

Enligt utvecklaren kan modellen svara på ljudinput på bara 232 millisekunder med ett snitt på 320 millisekunder, vilket ska likna mänsklig svarstid under samtal. Tack vare den snabbare responsen kommer det gå att ha mer naturliga röstsamtal med ChatGPT. Modellen matchar prestandan för GPT-4 Turbo för engelska och programkod och sägs prestera betydligt bättre än Turbo för andra språk än engelska.





GPT-4o ska vara mycket bättre på att tolka och förstå visuell input än tidigare modeller. OpenAI skriver att modellen inte bara accepterar kombinationer av text, ljud och bild som input – den kan även generera kombinationer av text, ljud och bild.

OpenAI har börjat skicka ut GPT-4o i ChatGPT stegvis. Nya språkmodellen kommer vara tillgänglig för gratisanvändare. De nya snabbare och förbättrade röstsamtalen dröjer lite längre och kommer alfatestas för betalande kunder under de kommande veckorna.

GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time in a conversation.

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Mest kommenterat

  1. Var med och rösta fram årets Androidtelefon 2025
  2. Vilket märke har din Androidmobil 2025?
  3. OBS: Du kan kanske ladda hem en ny systemuppdatering via Google Play
  4. Ikea introducerar billiga Qi2-laddarna Västmärke
  5. 2026 kan bli ett surt år för smartphones
  6. Google släpper första betaversionen av Android 16 QPR3 för Pixel – här är nyheterna

Mest läst

  1. OBS: Du kan kanske ladda hem en ny systemuppdatering via Google Play
  2. Vilket märke har din Androidmobil 2025?
  3. 2026 kan bli ett surt år för smartphones
  4. Google Translate får bättre översättningar, språklektionerna kommer till Sverige
  5. Nya modellen Gemini 3 Flash släpps globalt idag
  6. Google har ändrat sökningen på Pixel

  7. Visa topplistan

Undersökningar

Vilken är årets Androidtelefon 2025?

Visa resultatet

Loading ... Loading ...