Etter lanseringen av ChatGPT i november 2022, har den fenomenale AI-chatboten dukket opp som et av de mest pålitelige skriveverktøyene på internett. Det er enkelt å bruke; beskriv hva du trenger å bli skrevet, og ChatGPT skriver det ut på skjermen i løpet av sekunder.

Men i en tid hvor AI-generert tekst sendes som menneskeskrevet og brukes til å oppnå en urettferdig fordel, er det svært viktig å identifisere AI-innhold. Men ChatGPT kan ikke nøyaktig oppdage AI-innhold, selv ikke sitt eget arbeid – men hvorfor?

Er det en forskjell mellom AI-tekst og menneskelig skriving?

En forutsetning for at ChatGPT skal oppdage sin egen skriving eller en hvilken som helst AI-generert tekst, er at det må være en forskjell mellom den og menneskeskreven tekst. Så, er det noen vesentlig forskjell mellom menneskeskrevet tekst og AI-generert innhold? Hvis det er det, bør et verktøy som ChatGPT være i stand til å skjelne det.

Vi skrev en novelle uten innspill fra noe AI-verktøy og spurte deretter ChatGPT om historien var AI-skrevet innhold. ChatGPT flagget det trygt som en AI-generert tekst.

instagram viewer

Vi ba deretter ChatGPT om å generere en historie, og i den samme chattråden kopierte vi den genererte teksten og spurte ChatGPT om teksten var AI-skapt. ChatGPTs svar? Et selvsikkert "Nei."

ChatGPT mislyktes i å identifisere menneskeskrevet eller AI-generert tekst i begge tilfeller. Så hvorfor kan ChatGPT ikke oppdage sin egen tekst? Betyr dette at det ikke er noen forskjell mellom AI og menneskelig tekst?

Vel, det er det. Vi kunne skrevet en hel bok om forskjellen mellom de to, men det spiller ingen rolle. Så hvis det er en forskjell, hvorfor er ikke ChatGPT eller noe annet AI-verktøy i stand til å identifisere disse forskjellene og nøyaktig peke ut AI-generert tekst fra en menneskeskrevet tekst? Svaret ligger i hvordan ChatGPT fungerer og hvordan det genererer tekst.

Hvordan ChatGPT genererer tekst

Når du ber ChatGPT om å generere tekst, prøver den å etterligne den menneskelige skriveprosessen. For det første har modellen bak ChatGPT – Generative Pre-trained Transformer (GPT) – blitt trent på et stort korpus av menneskelig tekst. Alt fra e-poster, helseartikler, tekniske artikler, essays fra videregående skole og omtrent hvilken som helst tekst du kan finne på nettet har blitt matet til modellen under treningen. Så ChatGPT forstår hvordan hver av disse typene tekster skal skrives.

Hvis du ber ChatGPT om å skrive en e-post til sjefen din, vet den hvordan en slik e-post skal se ut fordi den har blitt trent på lignende e-poster – sannsynligvis tusenvis av dem. På samme måte, hvis du ber den om å skrive en videregående essay, vet den også hvordan en videregående essay skal høres ut. ChatGPT vil prøve å skrive hva du vil at den skal skrive på en måte som et menneske ville gjort.

Men det er en hake. I motsetning til hvordan mennesker skriver, forstår ikke ChatGPT egentlig hva det skriver på en måte som et menneske ville gjort. I stedet prøver chatboten å forutsi hva som vil være det mest plausible neste ordet i en setning til den fullfører oppskriften.

Hvordan ChatGPT skriver etter prediksjon

La oss si at du ber ChatGPT om å skrive en historie om en fiktiv by som heter Volkra. Det er en stor mulighet for at chatboten starter historien med ordene «Once upon». Dette er fordi chatboten ikke tenker på seg selv, men prøver å forutsi hva et menneske ville skrive basert på hva det har lært fra de tusenvis av historiene det har blitt matet i løpet av opplæring.

Så, å tro at et menneske sannsynligvis vil starte historien med ordene "Once upon", ville ChatGPT deretter prøve å forutsi det neste logiske ordet, som ville være "a" etterfulgt av "tid". Så du ville da ha "Det var en gang..." etterfulgt av det neste logiske ordet og det neste til historien er fullført. ChatGPT skriver i utgangspunktet ved å forutsi hvilket ord naturlig (eller i det minste har størst sannsynlighet) for å komme neste i en setning og sette det inn.

Så når et AI-verktøy prøver å oppdage om en tekst er AI-generert, er et av kriteriene det prøver å veie forutsigbarheten til teksten siden AI-verktøyene skriver etter prediksjon. Dette målet på forutsigbarhet kalles forvirring på AI-språk. Nå, når det presenteres med en tekst, blant andre kriterier, prøver et AI-verktøy som ChatGPT å analysere teksten for å måle hvor forutsigbar rekkefølgen av ord eller setninger i teksten er. Større forutsigbarhet eller lav forvirring betyr vanligvis at teksten sannsynligvis er AI-generert. Mindre forutsigbarhet eller høyere forvirring betyr vanligvis at teksten sannsynligvis er skrevet av mennesker.

Disse kriteriene, sammen med andre faktorer som kreativitetsnivået til en tekst, er dessverre ikke nok til å fastslå med sikkerhet om en tekst er skrevet av et AI-verktøy eller ikke. Dette er fordi mennesker kan skrive med større varians, som i eksempelteksten vi brukte til demonstrasjon i begynnelsen av denne artikkelen.

AI chatbots som ChatGPT er designet for å etterligne naturlig menneskelig språk så mye som mulig. Så selv om AI-tekst kan ha merkbare mønstre, er disse mønstrene ikke så åpenbare selv for et kraftig verktøy som ChatGPT. Dette er grunnen til at ChatGPT ikke kan oppdage sin egen skriving, så vel som hvorfor AI-tekstdetektorverktøy ikke fungerer.

Vil ChatGPT gjenkjenne sin egen skriving i fremtiden?

Foreløpig kan ikke verktøy som ChatGPT oppdage om en tekst er skrevet av seg selv eller noe annet AI-verktøy fordi det ikke er noe klart, merkbart mønster i AI-generert innhold. Det er imidlertid en god sjanse for at dette kan endre seg snart. Med innsats fra selskaper som ChatGPT for å introdusere digitale vannmerker i ChatGPT-generert innhold, vil det være et mer merkbart mønster til teksten generert av chatboten.