Enligt Wall Street Journal har OpenAI i runt ett år haft möjligheten att vattenmärka texten ChatGPT skriver, så att det går att upptäcka huruvida en människa eller en chattbott skrivit texten. Utvecklarens text-id sägs justera hur modellen väljer ut ord och fraser. På så vis skapas ett mönster.
Genom mönstret – som är osynligt för det mänskliga ögat – kan ett verktyg upptäcka att en text skrivits av ChatGPT och inte av en människa, vilket exempelvis skulle vara användbart på webben rent allmänt, för lärare och i skolväsendet, och så vidare.
Det ansvarsfulla hade förstås varit att vattenmärka allt AI-genererat innehåll. Google gör redan detta genom en teknik kallad SynthID. Enligt Wall Street Journal har dock OpenAI inte tagit steget än av rädsla för att ChatGPT då kommer användas mindre.
Efter att WSJ publicerade sin artikel har OpenAI bekräftat att företaget arbetar på en vattenmärkning av AI-skriven text. Utvecklaren menar att lösningen är ”tekniskt lovande” men samtidigt har ”viktiga risker”. OpenAI säger att det vore en enkel sak att ta bort vattenmärket på flera olika sätt, bland annat genom maskinöversättningar eller att be en annan chattbott omformulera texten.
The text watermarking method we’re developing is technically promising, but has important risks we’re weighing while we research alternatives, including susceptibility to circumvention by bad actors and the potential to disproportionately impact groups like non-English speakers. – OpenAI