OpenAI introducerar GPT-4o som kan tolka ljud, bild och text i realtid

Kusligt mänskliga röster

Postat:
19:43 - 2024-05-13
Skribent:
| Lars A
Kommentarer:
4

OpenAI har nyss presenterat sin senaste och mest avancerade språkmodell GPT-4o som kan tolka ljud, bild och text i realtid (något Google nyss visade att Gemini klarar). Tillägget av bokstaven ”o” i namnet på språkmodellen står för ”omni”.

Enligt utvecklaren kan modellen svara på ljudinput på bara 232 millisekunder med ett snitt på 320 millisekunder, vilket ska likna mänsklig svarstid under samtal. Tack vare den snabbare responsen kommer det gå att ha mer naturliga röstsamtal med ChatGPT. Modellen matchar prestandan för GPT-4 Turbo för engelska och programkod och sägs prestera betydligt bättre än Turbo för andra språk än engelska.





GPT-4o ska vara mycket bättre på att tolka och förstå visuell input än tidigare modeller. OpenAI skriver att modellen inte bara accepterar kombinationer av text, ljud och bild som input – den kan även generera kombinationer av text, ljud och bild.

OpenAI har börjat skicka ut GPT-4o i ChatGPT stegvis. Nya språkmodellen kommer vara tillgänglig för gratisanvändare. De nya snabbare och förbättrade röstsamtalen dröjer lite längre och kommer alfatestas för betalande kunder under de kommande veckorna.

GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time in a conversation.

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Mest kommenterat

  1. Galaxy S26-serien kan få prishöjning på upp till 560 kronor
  2. Rea i Google Store igen
  3. Honor Power 2 är första normalstora mobilen med över 10 000 mAh
  4. OBS: Senaste systemuppdateringen via Google Play kan orsaka problem för Pixel
  5. Gemini kommer kunna styra tevens inställningar
  6. Oneplus 15T påstås kombinera 6,3-tumsskärm med 7500 mAh

Mest läst

  1. Rea i Google Store igen
  2. OBS: Senaste systemuppdateringen via Google Play kan orsaka problem för Pixel
  3. Anledningen till att din Galaxy inte får systemuppdateringar via Google Play
  4. Gemini kommer kunna styra tevens inställningar
  5. Samsungs smartklockor kommer varna om demens
  6. Så här fungerar integritetsdisplayen i Galaxy S26 Ultra

  7. Visa topplistan

Undersökningar

Vilken är årets Androidtelefon 2025?

  • Samsung Galaxy S25 Ultra (16%, 325 röster)
  • Google Pixel 10 Pro (15%, 310 röster)
  • Google Pixel 10 Pro XL (11%, 216 röster)
  • Oneplus 15 (10%, 205 röster)
  • Samsung Galaxy Fold 7 (7%, 140 röster)
  • Samsung Galaxy S25 (5%, 107 röster)
  • Xiaomi 17 Pro Max (4%, 91 röster)
  • Google Pixel 9a (4%, 90 röster)
  • Annan smartphone (ange i kommentar) (4%, 80 röster)
  • Oneplus 13 (4%, 74 röster)
  • Sony Xperia 1 VII (3%, 58 röster)
  • Google Pixel 10 (3%, 53 röster)
  • Fairphone 6 (3%, 51 röster)
  • Samsung Galaxy S25 Plus (2%, 34 röster)
  • Samsung Galaxy S25 Edge (1%, 28 röster)
  • Motorola Razr 60 Ultra (1%, 26 röster)
  • Samsung Galaxy Flip 7 (1%, 26 röster)
  • Nothing Phone 3 (1%, 25 röster)
  • Xiaomi 17 Pro (1%, 24 röster)
  • Google Pixel 10 Pro Fold (1%, 24 röster)
  • Nothing Phone 3a (1%, 21 röster)
  • Sony Xperia 10 VII (1%, 20 röster)
  • Oneplus 13R (1%, 11 röster)

Antal som röstat: 2 039

Loading ... Loading ...