I somras hävdades att OpenAI arbetar på en ny mer självständig modell som är bättre på att resonera. Utvecklaren har nyss introducerat nyheten som heter ”O1”. Enligt OpenAI ”tänker” modellerna i O1-serien mer innan de svarar och de kan hantera komplexa uppgifter och lösa svårare problem än tidigare modeller.
O1 har till en början specifikt fokus på vetenskap, programmering och matematik. Modellerna har tränats för att ”förfina sin egen tankeprocess, prova nya strategier och inse misstag”. OpenAI påstår att O1 i tester presterat ungefär i nivå med filosofie doktor-studenter inom områden som fysik, kemi och biologi.
I testet för att kvalificera till matematikolympiaden (IMO) ska GPT-4o ha lyckats lösa endast 13 procent av frågorna, medan O1 klarade av 83 procent. I en programmeringstävling arrangerad av Codeforces lyckades modellen prestera bättre än 89 procent av deltagarna.
O1 hallucinerar mindre än tidigare modeller men hallucinationer förekommer fortfarande. OpenAI påpekar att GPT-4o kommer fortsätta vara mer lämplig för de allra flesta tills vidare, eftersom O1 än så länge har ett snävare användningsområde. Nya modellen riktar sig mer till forskare och fysiker och släpps som en förhandsversion.
Företaget har lagt upp en mängd videor på Youtube om O1 för de som är intresserade. Några av videorna är infogade nedan.