Meta smusslade med benchmarks för senaste Llama-modellen

Postat:

15:54 - 2025-04-08

Skribent:

Kommentarer:

Meta smusslade med benchmarks för senaste Llama-modellen

Meta introducerade nyligen nya språkmodellen Llama 4. Den större versionen av Llama 4, vid namn Maverick, påstods slå Open AI:s GPT-4o och Gemini 2.0 Flash i ett stort antal benchmarks. Modellen hamnade därtill högt i rankningen på LM Arena som ställer olika språkmodeller mot varandra.

AI-forskare uppdagade dock att Meta smusslat eftersom modellen på LM Arena inte är samma version av Llama 2 som släppts offentligt. Istället använder Meta en ”experimentell chattversion” av Maverick som optimerats för konversationer för att nå en högre ranking – vilken endast framkom i en finstilt fotnot.

Efter avslöjandet kommer LM Arena uppdatera sin topplistor: ”We are updating our leaderboard policies to reinforce our commitment to fair, reproducible evaluations so this confusion doesn’t occur in the future”.

Källa: The Verge

LÄS MER OM:
AI: artificiell intelligens

#ai #llama #llama 4 #lmarena #meta

Fyndtips från Prisjakt

Nothing Phone (2a) 5G Dual SIM 8GB RAM 128GB

2490 kr ⬇ 24 %

Sony LinkBuds True Wireless In-ear

599 kr ⬇ 25 %

Nästa artikel →

← Föregående artikel

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Nästa artikel →

← Föregående artikel

Meta smusslade med benchmarks för senaste Llama-modellen

Aktuellt

Aktuellt på Prisjakt

Populära ämnen

Undersökningar

Mest kommenterat

Mest läst

Undersökningar

Hur nöjd är du med Googles kvalitetskontroll överlag?

Meta smusslade med benchmarks för senaste Llama-modellen

Mer Swedroid

Aktuellt

Aktuellt på Prisjakt

Populära ämnen

Undersökningar

Mest kommenterat

Mest läst

Undersökningar

Hur nöjd är du med Googles kvalitetskontroll överlag?