Google har nyss lanserat Gemini 2.0 som öppnar upp nya möjligheter för AI-agenter och multimodal AI. Gemini 2.0 närmar sig Googles vision för en ”allomfattande AI-assistent”.
Utvecklare och betatestare kan prova Gemini 2.0 med start idag. Därefter kommer den förbättrade modellen implementeras i Googles produkter vartefter. Chattbotten Gemini och sökmotorn får första tjing. Från och med idag kommer Gemini 2.0 Flash – en experimentell variant av Gemini 2.0 – bli tillgänglig för alla globalt. Användare behöver välja 2.0 Flash manuellt i chattbottens webbappar. Modellen kommer ”snart” till mobilapparna.
Gemini 2.0 Flash erbjuder förbättringar likt lägre latens och förbättrad prestanda. Enligt Google är 2.0 Flash dubbelt så snabb som 1.5 Pro. En ny funktion kallad Deep Research ska kunna agera som en slags forskningsassistent och vara bättre på att resonera och hantera en stor mängd data samtidigt. Deep Research är också tillgänglig med start idag men finessen kräver prenumerationen Gemini Advanced.
Google skriver att Gemini 2.0 kommer möjliggöra en ny klass av AI-agenter. En AI-agent är ett system som kan interagera med olika miljöer självständigt, på uppdrag av användaren. En av de mer spännande aspekterna av tillkännagivandet är att vi fått höra mer om Project Astra: den sci-fi-liknande universella AI-assistenten Google arbetar på.
Vi fick en försmak av Project Astras multimodala förmågor under försommaren. Gemini 2.0 har gjort att Project Astra bättre kan förstå dialekter, ovanliga ord och samtal på flera olika språk samtidigt. Tack vare 2.0 kan Astra även använda sökmotorn, Lens och Maps på egen hand eller åt användaren.
Astras minne har samtidigt förbättrats. Assistenten kan komma ihåg saker den sett eller saker som sagts i upp till tio minuter bakåt i tiden. Modellen har dessutom blivit bättre på att minnas tidigare konversationer, så att assistenten blir mer personlig och anpassad för användaren. Enligt Google kan Astra nu förstå språk helt i realtid, med ungefär samma latens som ett mänskligt samtal. Project Astra är dock inte en befintlig eller kanske inte ens en framtida produkt. Google verkar istället planera att integrera den här typen av förmågor i vanliga Gemini på sikt.
Nästa stora nyhet är Project Mariner – en forskningsprototyp som skapats med hjälp av Gemini 2.0. Kontentan är att Mariner kan förstå och resonera kring innehållet i din webbläsare, via ett insticksprogram för Chrome. Idén är att Mariner kan utföra uppgifter åt användaren inuti webbläsaren.
Med tanke på hur mycket som går att göra med en webbläsare är förstås användningsområdet enormt: om man nu litar på att en AI ska göra saker åt en istället för att göra det själv. I dagsläget är dock Mariner långsam och den prickar inte alltid rätt, men enligt Google kommer Mariner förbättras i rask takt.