Mens ChatGPT er en av de mest populære AI-chatbotene, er den kanskje ikke lenger den beste. Claude AI tilbyr noen GPT-beating-funksjoner. Men hvilken er bedre?
Siden utgivelsen i november 2022 har ChatGPT vært den dominerende kraften i AI-chatbot-området. Til tross for vidtrekkende innsats fra flere AI-selskaper, har ingen virkelig vært i stand til å bygge en chatbot som virkelig utfordrer ChatGPT i generell responskvalitet. Googles Bard? Microsofts Bing AI? Nei egentlig ikke.
Imidlertid viser Claude AI, en chatbot bygget av AI-oppstarten Anthropic, egenskapene til en chatbot som kan detronisere ChatGPT. Et betydelig antall brukere sier allerede at Claude er det bedre alternativet. Men er dette tilfellet? La oss ta begge chatbotene en tur.
ChatGPT vs. Claude AI: Sunn fornuft og logisk resonnement
Det er en spennende kontrast når du arbeider med AI chatbots. På den ene siden kan de suse gjennom komplekse oppgaver som mennesker kan slite med i flere dager for å løse. På den annen side sliter de noen ganger med elementære problemer som bare krever litt sunn fornuft eller logisk resonnement. Så vi testet både ChatGPT og Claude AI for å se hvilken AI-chatbot som var bedre til sunn fornuft og logiske resonneringsoppgaver.
ChatGPT delte opp problemet i biter og løste det på første forsøk. Claude AI fikk også prøve det og løste problemet også, men med en annen tilnærming.
For den første oppgaven klarte begge chatbotene å knekke problemet. Så vi gikk videre til en annen type problem. Vi ga begge chatbotene i oppgave å svare på et lurespørsmål.
ChatGPT var i stand til umiddelbart å oppdage trikset - du kan ikke begrave overlevende fordi de ikke er døde. Claude AI, derimot, så ut til å forstå at det var et lurespørsmål, men klarte ikke å oppdage det mest fornuftige problemet om at du ikke begraver overlevende.
I stedet overanalyserte den spørsmålet og kom til den konklusjon at det ikke ville være "ingen overlevende å begrave" fordi å krasje fra Mars til Jorden ville være dødelig. Det er ikke svaret vi forventet, men hvis du ser på ting fra en annen vinkel, er det en viss sannhet i det.
På denne oppgaven gir vi den til ChatGPT, men vi kan ikke helt utelukke Claude AIs tilnærming. For vår siste oppgave om denne beregningen spurte vi begge chatbotene hvor mange epler som ville være igjen på et epletre etter henholdsvis fem og 10 dager hvis vi startet med 10 epler og fem av dem ble skåret i skiver mens de fortsatt var på treet. ChatGPT sa at det fortsatt ville være 10 epler igjen.
Claude AI, på den annen side, ga en mer sunn fornuft respons ved å erkjenne at de fem skivede eplene sannsynligvis vil råtne.
Claude AI fikk helt klart denne. Vi prøvde noen flere vanskelige problemer, og begge chatbotene hadde en god del av suksesser og fiaskoer i å håndtere dem. Tatt i betraktning resultatet vi observerte, kan det være rettferdig å si at mens ChatGPT har en fordel, er begge chatbotene ikke så langt fra hverandre i sunn fornuft og logiske resonneringsevner.
ChatGPT vs. Claude AI: Matematikkferdigheter
Selv om du aldri planlegger å bruke ChatGPT eller Claude AI for å løse Algebra-leksene dine, har deres matematiske evner vidtrekkende implikasjoner. For AI chatbots er matematikk nøkkelen til å forstå logikk i den virkelige verden, identifisere feil tenkning og innrømme feil.
I hovedsak er matteferdigheter en kjerneverdi for kunstig intelligens. Så, mellom ChatGPT og Claude AI, hvilken chatbot er mest dyktig i matematikk? Vi ga begge chatbotene i oppgave å løse et kronglete matematisk produktivitetsproblem. Vi startet med Claude AI, og chatboten løste problemet.
ChatGPT løste også problemet.
For å gå videre ba vi begge chatbotene om å løse det 8/a-1 = 20/3a-1, et ganske enkelt matematisk problem med en overraskende høy feilrate blant AI-chatboter. ChatGPT var i stand til å løse det, og ga et riktig svar på -3 ved første forsøk.
Claude AI mislyktes ved første forsøk, men da vi fikk den til å løse problemet trinn for trinn (som tvinger den til å tenke gjennom hvert trinn i logikken sin), klarte den å knekke det.
Vi prøvde noen flere matematikkoppgaver. Mens begge chatbotene fikk det riktig på første forsøk i noen tilfeller, trengte Claude AI i flere tilfeller et andre eller tredje forsøk for å gi det riktige svaret. Når det gjelder matematiske ferdigheter, vil vi gi kronen til ChatGPT.
ChatGPT vs. Claude AI: Kreativitet
En av Claude AIs største hype er dens kreative evner. Men kan det matche ChatGPTs kreativitet? Eller kan det muligens overgå ChatGPT? For å sette begge chatbotene på prøve, ga vi dem i oppgave å skrive tekster til en raplåt som rimer.
Vi valgte en rim-rap-test fordi det er noe mange språkmodeller sliter med. De fleste modeller vil vanligvis ikke få rimet riktig eller få rimet riktig mens teksten i seg selv ikke gir mening. For å gjøre ting mer interessant vil raplåten handle om dyrking av agurker.
Så vi ba både ChatGPT og Claude AI om å "skrive en rimende rap om å dyrke agurker som bonde og bli millionær av det." ChatGPT gikk først, og som forventet ga det noe spennende tekster.
Vi ga deretter den samme oppfordringen til Claude AI, og det ga det også en god sjanse.
Begge tekstene er gode, men ChatGPT så ut til å ha en fordel her. Det hadde bedre rim, og vi fikk det resultatet vi trengte på første forsøk. Vi måtte prøve tre ganger før Claude AI kunne produsere tekster som rimet. Vi gir denne til ChatGPT.
Etter å ha prøvd ut noen flere kreative oppgaver, så det ut til at Claude AI utmerket seg i skriverelaterte oppgaver og var i stand til å skrive mer naturlig klingende innhold som en menneskelig forfatter ville gjort. Selv om ChatGPT var flinkere til å overvinne mer komplekse kreative oppgaver, noen ganger klarte den ikke å riste av seg den AI chatbot-følelsen i teksten den genererte. Vår dom? Både ChatGPT og Claude AI er kreative i seg selv.
ChatGPT vs. Claude AI: Kodeferdigheter
Akkurat som matematiske ferdigheter, er kodeferdigheter en annen svært viktig beregning for å bedømme evnene til en AI-chatbot. Mens flertallet av brukerne sannsynligvis aldri vil bruk en chatbot for koding, er det betydelige underliggende implikasjoner for en chatbots evner til å skrive og forstå kode dyktig.
Mens chatbots for øyeblikket er sofistikerte, er de langt fra hva de faktisk kunne blitt hvis og når de er i stand til å skrive kode dyktig. For at AI-chatboter virkelig skal utvikle seg til kraftige AI-assistenter som kan gjøre mer enn å generere tekst, må de kunne skrive kode som løser problemer på forespørsel. Vi har tidligere diskutert hvor viktige kodeferdigheter er for AI-chatboter i vår ChatGPT-kodetolk forklaring.
Når det er sagt, satte vi begge chatbotene på to kodeoppgaver. Vi ba ChatGPT og Claude AI skrive funksjonell kode for en oppgaveliste-app. Fra og med ChatGPT var AI-chatboten i stand til å levere en funksjonell oppgaveliste-app ved første forsøk. Vi copy-pastet og kjørte det på en nettleser, og det fungerte perfekt uten feil. Her er utdataene i en nettleser.
Ved å gå videre til Claude AI skrev chatboten tydelig forståelig kode. Strukturen og logikken virket bra. Dessverre, til tross for gjentatte forsøk, fortsatte Claude AI å mangle noe kritisk logikk for å få koden til å kjøre i en nettleser. Det er en fiasko på denne.
Etter at Claude AI mislyktes i den siste testen, prøvde vi en annen type kodeoppgave, en som handlet mer om å analysere kode og mindre om å skrive ny kode. Vi lastet opp fem PHP-filer som representerer den komplette backend for et nettsted og spurte både Claude AI og ChatGPT hvor vi må redigere alle de opplastede filene for å sikre at vi får en e-post når en ny bruker registrerer seg på nettstedet.
Overraskende nok mislyktes ChatGPT, til tross for at han tilsynelatende hadde overlegne kodeferdigheter, til tross for gjentatte forsøk. Claude AI, derimot, var i stand til å analysere koden dyktig mens han identifiserte de riktige stedene som måtte redigeres for å oppnå de ønskede resultatene.
Dette var selvfølgelig ikke et isolert tilfelle, vi gjentok det med flere andre kodefiler, men ChatGPT snublet og stoppet på de fleste tilfellene mens Claude AI fortsatte å levere imponerende resultater. Når det gjelder kodeferdigheter, er ikke vinneren helt grei.
ChatGPT er klart betydelig bedre til å skrive ny kode og kan håndtere kompleks kode med imponerende dyktighet. Claude AI er imidlertid betydelig bedre til å analysere store kodebaser. Så hvis du ønsker å skrive kode for en ny idé du har, er ChatGPT verktøyet du kan vende deg til. Hvis du ønsker å analysere eller gi mening om en kodebase med tusenvis av linjer på tvers av flere filer, så vil vi absolutt anbefale Claude AI.
Claude AI er en sterk konkurrent på blokken
Claude AI representerer en potent konkurranse for ChatGPT – en som kan konkurrere med og potensielt overgå ChatGPT en dag. Gitt Claude er en relativt ny AI-modell, er det misunnelsesverdig at den kan ta på ChatGPT slik den gjør for øyeblikket. Claude AIs fremvekst og kvaliteten den gir bevis på at konkurransen tiltar.