Meta smusslade med benchmarks för senaste Llama-modellen

Postat:
15:54 - 2025-04-08
Skribent:
| Lars A
Kommentarer:
1

Meta introducerade nyligen nya språkmodellen Llama 4. Den större versionen av Llama 4, vid namn Maverick, påstods slå Open AI:s GPT-4o och Gemini 2.0 Flash i ett stort antal benchmarks. Modellen hamnade därtill högt i rankningen på LM Arena som ställer olika språkmodeller mot varandra.

AI-forskare uppdagade dock att Meta smusslat eftersom modellen på LM Arena inte är samma version av Llama 2 som släppts offentligt. Istället använder Meta en ”experimentell chattversion” av Maverick som optimerats för konversationer för att nå en högre ranking – vilken endast framkom i en finstilt fotnot.

Efter avslöjandet kommer LM Arena uppdatera sin topplistor: ”We are updating our leaderboard policies to reinforce our commitment to fair, reproducible evaluations so this confusion doesn’t occur in the future”.

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Mest kommenterat

  1. Var med och rösta fram årets Androidtelefon 2025
  2. Vilket märke har din Androidmobil 2025?
  3. Ny tullavgift ska stävja småpaket från kinesiska e-handelsbutiker
  4. OBS: Du kan kanske ladda hem en ny systemuppdatering via Google Play
  5. Ikea introducerar billiga Qi2-laddarna Västmärke
  6. 2026 kan bli ett surt år för smartphones

Mest läst

  1. OBS: Du kan kanske ladda hem en ny systemuppdatering via Google Play
  2. Vilket märke har din Androidmobil 2025?
  3. 2026 kan bli ett surt år för smartphones
  4. Google Translate får bättre översättningar, språklektionerna kommer till Sverige
  5. Nya modellen Gemini 3 Flash släpps globalt idag
  6. Google har ändrat sökningen på Pixel

  7. Visa topplistan

Undersökningar

Vilken är årets Androidtelefon 2025?

Visa resultatet

Loading ... Loading ...