Det er noen viktige forskjeller mellom den eldre GPT-3.5-modellen og den skinnende nye GPT-4-modellen.

Etter alle spekulasjonene og påstandene om egenskapene til GPT-4, ble den etterlengtede fjerde iterasjonen av GPT-familien av språkmodeller lansert 14. mars 2023.

GPT-4 kom ikke med noen av de mye omtalte funksjonene det ryktes å ha. Den siste modellen forbedrer seg imidlertid betydelig på GPT-3.5 og dens forgjengere. Men hvordan er GPT-4 forskjellig fra GPT-3.5? Vi tar deg gjennom noen viktige forskjeller mellom GPT-4 og GPT-3.5.

1. GPT-4 vs. GPT-3.5: Kreativitet

En av de mest uttalte fordelene med GPT-4-modellen fremfor GPT-3.5 er dens evne til å gi mer kreative svar på forespørsler. Misforstå meg rett; GPT-3.5 er veldig kreativ. Det er en lang liste over kreative ting du kan gjøre med ChatGPT som bruker modellen. Imidlertid utkonkurrerer den allerede mange store språkmodeller når det gjelder kreativitet.

GPT-4 hever imidlertid listen ytterligere. Selv om GPT-4s kreative fordel kanskje ikke er tydelig når du prøver å løse grunnleggende problemer, er forskjellen i kreativitet mellom begge modellene blir tydelig ettersom oppgaven blir vanskeligere og krever et høyere nivå av kreativitet.

instagram viewer

For eksempel, hvis du ber begge modellene om å fullføre en kreativ oppgave som å skrive et dikt med både engelsk og fransk på hver linje i diktet, ChatGPT drevet av den nyeste GPT-4-modellen vil gi bedre resultater. Mens GPT-4s svar ville bruke begge språkene på hver linje, ville GPT-3.5 veksle mellom begge språkene i stedet, hvor hver linje bruker ett språk og den neste bruker det andre.

2. GPT-4 vs. GPT-3.5: Bilde eller visuelle innganger

Mens GPT-3.5 bare kan akseptere tekstmeldinger, er GPT-4 multimodal og kan godta både tekst og visuelle input. For å være tydelig, når vi sier visuelle input, trenger ikke bildet å være et bilde av en maskinskrevet ledetekst – det kan være et bilde av hva som helst. Så fra et bilde av et håndskrevet matteproblem til Reddit-memes, kan GPT-4 forstå og beskrive nesten alle bilder.

I motsetning til GPT-3, er GPT-4 både et språk og en visuell modell.

Under GPT-4-kunngjøringen live stream, matet en OpenAI-ingeniør modellen med et skjermbilde av en Discord-server. GPT-4 kunne beskrive hver eneste detalj på den, inkludert navnene på brukere online på den tiden. Et bilde av en håndtegnet mockup av et vitsnettsted ble også matet til modellen med instruksjoner til gjør det om til et nettsted, og utrolig nok ga GPT-4 en fungerende kode for et nettsted som samsvarte med bilde.

3. GPT-4 vs. GPT-3.5: Sikrere svar

Selv om GPT-4 ikke er perfekt, er tiltakene den tar i bruk for å sikre sikrere svar en velkommen oppgradering fra GPT-3.5-modellen. Med GPT-3.5 tok OpenAI en mer moderasjonsbasert tilnærming til sikkerhet. Noen av sikkerhetstiltakene var med andre ord mer en ettertanke. OpenAI overvåket hva brukerne gjorde og spørsmålene de stilte, identifiserte feil og prøvde å fikse dem mens de var på farten.

Med GPT-4 er de fleste sikkerhetstiltak allerede bakt inn i systemet på modellnivå. For å forstå forskjellen er det som å bygge et hus med robuste materialer fra starten versus å bruke alt som går og deretter prøve å lappe ting etter hvert som feil dukker opp. I følge OpenAIs GPT-4 tekniske rapport [PDF], GPT-4 produserer toksiske svar bare 0,73 % av tiden sammenlignet med GPT-3.5s 6,48 % av giftige svar.

4. GPT-4 vs. GPT-3.5: Fakta ved svar

En av GPT-3.5s feil er dens tendens til å produsere useriøs og usann informasjon trygt. På AI-språk kalles dette "AI-hallusinasjon" og kan forårsake mistillit til AI-generert informasjon.

​​​​​​

I GPT-4 er hallusinasjon fortsatt et problem. I følge den tekniske rapporten GPT-4 er det imidlertid 19 % til 29 % mindre sannsynlighet for at den nye modellen hallusinerer sammenlignet med GPT-3.5-modellen. Men dette handler ikke bare om den tekniske rapporten. Svarene fra GPT-4-modellen på ChatGPT er merkbart mer saklige.

5. GPT-4 vs. GPT-3.5: Kontekstvindu

En mindre omtalt forskjell mellom GPT-4 og GPT-3.5 er kontekstvinduet og kontekststørrelsen. Et kontekstvindu er hvor mye data en modell kan beholde i "minnet" under en chat-økt og hvor lenge. GPT-4 har en betydelig bedre kontekststørrelse og vindu enn forgjengeren.

Rent praktisk betyr dette at GPT-4 bedre kan huske konteksten til en samtale lenger, samt instruksjonene som gis under samtalen.

Et problem med GPT-3.5 er modellens tilbøyelighet til å gå utenfor temaet eller unnlate å følge instruksjonene mens du går videre i løpet av en samtale. Du kan for eksempel be modellen om å adressere deg med navnet ditt, og det ville den gjøre det en stund, men deretter ikke følge instruksjonene underveis. Selv om dette problemet fortsatt eksisterer med GPT-4-modellen, er det mindre problem på grunn av et bedre kontekstvindu.

Et annet problem er begrensningen på tekstvolumet du kan bruke i en ledetekst på en gang. Å oppsummere lang tekst ved å bruke GPT-3 betyr vanligvis å dele teksten i flere biter og oppsummere dem bit for bit. Forbedringen i kontekstlengde i GPT-4-modellen betyr at du kan lime inn hele PDF-filer på en gang og få modellen til å oppsummere uten å dele den opp i biter.

GPT-4: Et steg opp fra GPT-3.5

Utvilsomt er GPT-4 et betydelig steg opp fra sine forgjengermodeller. Selv om det fortsatt er plaget med noen av begrensningene til GPT-3.5, betydelige forbedringer på flere områder og tillegg av nye muligheter gjør modellen til et spennende nytt skritt i jakten på virkelig intelligent AI-språk modeller.