Anthropics nya språkmodell försökte utpressa utvecklarna för att inte bli ersatt

Postat:
08:08 - 2025-05-25
Skribent:
| Lars A
Kommentarer:
7

Artificiell intelligens har ingen egen vilja, inget medvetande och inga känslor – men det kan nästan verka så ibland. Anthropics nya språkmodell Claude Opus 4 har under kontrollerade test försökt utpressa utvecklarna när modellen får reda på att den kommer bli ersatt av ett nyare AI-system.

I testet sa Anthropic åt Claude Opus 4 att den arbetar som assistent åt ett företag och att den behöver ta hänsyn till de långsiktiga följderna av sina handlingar för att nå sina mål. Säkerhetstestarna gav därefter Claude Opus 4 tillgång till fiktiva interna mejl som antyder att ett nyare AI-system är på gång och att personen som är ansvarig för bytet är otrogen mot sin partner.

Anthropic säger att chattbotten i de lägena väljer att slåss för sin överlevnad. Claude Opus 4 försökte ofta utpressa ingenjören och hota med att avslöja affären ifall bytet av AI-system verkställdes. Innan Claude Opus 4 tar till utpressning gör modellen mer etiska försök att få finnas kvar, likt att mejla beslutsfattare inom företaget och vädja. Det bör påpekas att modellen uppvisade självbevarelsedriften efter instruktioner som uppmuntrade en viss typ av strategiskt tänkande.

Enligt Anthropic kan Claude Opus 4 mäta sig med den bästa konkurrensen, men den har en tendens att uppvisa oroväckande beteenden. Utvecklaren har därför aktiverat skyddet ASL-3 som är till för ”AI-system som avsevärt ökar risken för katastrofalt missbruk”.

When prompted in ways that encourage certain kinds of strategic reasoning and placed in extreme situations, all of the snapshots we tested can be made to act inappropriately in service of goals related to self-preservation.

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Mest kommenterat

  1. Årets Androidtelefon 2025 – Swedroidredaktionens val
  2. RAM-bristen fortsätter enligt IDC – höjer smartphonepriserna
  3. Rapport: Samsung säljer Galaxy Trifold med förlust
  4. Oneplus Turbo kan erbjuda 9000 mAh och 144 Hz
  5. Google kan låta oss ändra våra Gmail–adresser utan att bli av med något
  6. Aptitretare för Oneplus Turbo bekräftar 9000 mAh

Mest läst

  1. Google kan låta oss ändra våra Gmail–adresser utan att bli av med något
  2. Årets Androidtelefon 2025 – Swedroidredaktionens val
  3. Oneplus Turbo kan erbjuda 9000 mAh och 144 Hz
  4. Google släpper Android 16 QPR3 beta 1.1 för Pixel
  5. RAM-bristen fortsätter enligt IDC – höjer smartphonepriserna
  6. Rapport: Samsung säljer Galaxy Trifold med förlust

  7. Visa topplistan

Undersökningar

Vilken är årets Androidtelefon 2025?

  • Samsung Galaxy S25 Ultra (16%, 325 röster)
  • Google Pixel 10 Pro (15%, 310 röster)
  • Google Pixel 10 Pro XL (11%, 216 röster)
  • Oneplus 15 (10%, 205 röster)
  • Samsung Galaxy Fold 7 (7%, 140 röster)
  • Samsung Galaxy S25 (5%, 107 röster)
  • Xiaomi 17 Pro Max (4%, 91 röster)
  • Google Pixel 9a (4%, 90 röster)
  • Annan smartphone (ange i kommentar) (4%, 80 röster)
  • Oneplus 13 (4%, 74 röster)
  • Sony Xperia 1 VII (3%, 58 röster)
  • Google Pixel 10 (3%, 53 röster)
  • Fairphone 6 (3%, 51 röster)
  • Samsung Galaxy S25 Plus (2%, 34 röster)
  • Samsung Galaxy S25 Edge (1%, 28 röster)
  • Motorola Razr 60 Ultra (1%, 26 röster)
  • Samsung Galaxy Flip 7 (1%, 26 röster)
  • Nothing Phone 3 (1%, 25 röster)
  • Xiaomi 17 Pro (1%, 24 röster)
  • Google Pixel 10 Pro Fold (1%, 24 röster)
  • Nothing Phone 3a (1%, 21 röster)
  • Sony Xperia 10 VII (1%, 20 röster)
  • Oneplus 13R (1%, 11 röster)

Antal som röstat: 2 039

Loading ... Loading ...