AI kan smida ränker och ljuga för användaren

Postat:

14:07 - 2025-09-19

Skribent:

| Lars A

Kommentarer:

AI kan smida ränker och ljuga för användaren

Open AI har publicerat en studie om ”scheming”, vilket är den engelska benämningen för när ett AI-system medvetet beter sig på ett visst vis utåt medan de verkliga målen göms för användaren. Med andra ord kan en AI smida ränker och ljuga.

Beteendet ska inte förväxlas med hallucinationer som innebär att en chattbott oavsiktligt hittar på saker på grund av exempelvis gissningar, korrupt träningsdata, eller felaktiga associationer. I studien liknas ”scheming” vid en mänsklig börsmäklare som bryter mot lagen för att tjäna så mycket pengar som möjligt.

Forskarna menar att det vilseledande beteendet oftast är harmlöst, likt att låtsas ha färdigställt en uppgift. Studien blottlägger att AI-utvecklarna inte har kommit på ett sätt att träna modellerna så att de överhuvudtaget inte uppvisar ”scheming”.

Om en modell förstår att den utvärderas kan modellen låtsas att inte vara intrigant bara för att klara av testet. Till skillnad mot hallucinationer är ”scheming” medvetet bakslugt beteende. Studien hävdar att metoden som används för att motverka rävspel, ”deliberative alignment”, fungerar. Metoden liknas vid att låta barn upprepa reglerna innan de får leka.

Open AI hävdar att rävspelet de upptäckt i de egna modellerna och Chat GPT inte har varit allvarligt. Lögnerna som påträffats under vanliga förhållanden påstås vara av typen att Chat GPT säger att den gjorde ett bra jobb när den inte gjorde det.

Källa: Techcrunch

LÄS MER OM:
AI: artificiell intelligens Säkerhet & integritet

#ai #chatgpt #chattbottar #openai #scheming

Fyndtips från Prisjakt

Apple iPhone 14 5G 6GB RAM 128GB

5190 kr ⬇ 10 %

Samsung Galaxy S23 Ultra 5G SM-S918B Dual SIM 12GB RAM 512GB

11 453 kr ⬇ 17 %

Nästa artikel →

← Föregående artikel

Skriv fritt men var god följ vår kommentarspolicy. Tack!

Nästa artikel →

← Föregående artikel

AI kan smida ränker och ljuga för användaren

Aktuellt

Aktuellt på Prisjakt

Populära ämnen

Undersökningar

Mest kommenterat

Mest läst

Undersökningar

Använder du fortfarande Facebook?

AI kan smida ränker och ljuga för användaren

Mer Swedroid

Aktuellt

Aktuellt på Prisjakt

Populära ämnen

Undersökningar

Mest kommenterat

Mest läst

Undersökningar

Använder du fortfarande Facebook?