GPT-5 blev inte det stora klivet framåt vissa förväntat sig när Open AI introducerade modellen i augusti. Många vanliga användare ansåg rentav att GPT-5 utgjorde en försämring, även om prestandan rent objektivt hade förbättrats. Utvecklaren har sedan dess släppt den finslipade varianten GPT-5.1.
Googles nya modell Gemini 3 har som kontrast redan väckt rabalder, vilket tas upp av The Verge. Gemini 3 dominerar topplistorna på LM Arena. Sam Altman har offentligt gratulerat Google och Salesforce vd Marc Benioff verkar förbluffad av framstegen:
Wei-Lin Chiang från LM Arena menar att det inte bara handlar om att topplistorna tillfälligt blandats om. Gemini 3 har ett klart försprång i kategorier likt programmering, kreativt skrivande och visuell förståelse.
Modellen ska ha presterat särdeles bra i ett test kring resonemang kallat ARC-AGI-2, där Gemini 3 fick nästan dubbelt så hög poäng som GPT-5 Pro samtidigt som Gemini var en tiondel så kostsam per uppgift. I testet Simple QA som handlar om frågor inom en lång rad ämnen och kräver specialkunskaper ska Gemini 3 ha fått dubbelt så många poäng som GPT-5.1. Många programmerare verkar dock fortfarande föredra Claude från Anthropic.
1
