Ønsker du å gi ChatGPT de tilpassede dataene dine? Her er en trinn-for-trinn for hvordan du gjør nettopp det!
Ved å tilby GPT-teknologi i en kraftig og brukervennlig chatbot, har ChatGPT blitt verdens mest populære AI-verktøy. Mange bruker ChatGPT for å gi engasjerende samtaler, svare på spørsmål, tilby kreative forslag og hjelpe til med koding og skriving. ChatGPT er imidlertid begrenset ettersom du ikke kan lagre dataene dine for langsiktig personlig bruk, og dets skjæringspunkt for kunnskapsdata fra september 2021.
Som en løsning kan vi bruke OpenAIs API og LangChain for å gi ChatGPT tilpassede data og oppdatert informasjon etter 2021 for å lage en tilpasset ChatGPT-forekomst.
Hvorfor gi ChatGPT med tilpassede data?
Å mate ChatGPT med tilpassede data og gi oppdatert informasjon utover dens kunnskapsgrense, gir flere fordeler fremfor bare å bruke ChatGPT som vanlig. Her er noen av dem:
- Personlig tilpassede interaksjoner: Ved å gi ChatGPT tilpassede data, kan brukere skape en mer tilpasset opplevelse. Modellen kan trenes på spesifikke datasett som er relevante for individuelle brukere eller organisasjoner, noe som resulterer i svar skreddersydd til deres unike behov og preferanser.
- Domenespesifikk ekspertise: Tilpasset dataintegrasjon lar ChatGPT spesialisere seg på bestemte domener eller bransjer. Den kan trenes på bransjespesifikk kunnskap, terminologi og trender, noe som muliggjør mer nøyaktige og innsiktsfulle svar innenfor de spesifikke områdene.
- Aktuell og nøyaktig informasjon: Tilgang til oppdatert informasjon sikrer at ChatGPT holder seg oppdatert med den siste utviklingen og kunnskapen. Det kan gi nøyaktige svar basert på nylige hendelser, nyheter eller forskning, noe som gjør det til en mer pålitelig informasjonskilde.
Nå som du forstår viktigheten av å gi tilpassede data til ChatGPT, her er en trinn-for-trinn for hvordan du gjør det på din lokale datamaskin.
Trinn 1: Installer og last ned programvare og ferdiglaget skript
Vær oppmerksom på at følgende instruksjoner er for en Windows 10- eller Windows 11-maskin.
For å gi tilpassede data til ChatGPT, må du installere og laste ned de nyeste Python3, Git, Microsoft C++ og ChatGPT-hentingsskriptet fra GitHub. Hvis du allerede har noe av programvaren installert på PC-en, sørg for at de er oppdatert med den nyeste versjonen for å unngå hikke under prosessen.
Start med å installere:
- Nedlasting:Python3 (Gratis)
- Nedlasting:Git (Gratis)
- Nedlasting:Microsoft Visual Build-verktøy (Gratis)
Installasjonsmerknader for Python3 og Microsoft C++
Når du installerer Python3, sørg for at du huker av Legg til python.exe til PATH alternativet før du klikker Installere nå. Dette er viktig siden det lar deg få tilgang til Python i hvilken som helst katalog på datamaskinen din.
Når du installerer Microsoft C++, vil du installere Byggeverktøy for Microsoft Visual Studio først. Når den er installert, kan du krysse av Desktop utvikling med C++ alternativet og klikk Installere med alle valgfrie verktøy automatisk krysset av på høyre sidefelt.
Nå som du har installert de nyeste versjonene av Python3, Git og Microsoft C++, kan du laste ned Python-skriptet for enkelt å spørre etter tilpassede lokale data.
Nedlasting: ChatGPT-hentingsskript (Gratis)
For å laste ned skriptet, klikk på Kode, velg deretter Last ned ZIP. Dette bør laste ned Python-skriptet til din standard eller valgte katalog.
Når den er lastet ned, kan vi nå sette opp et lokalt miljø.
Trinn 2: Sett opp det lokale miljøet
For å sette opp miljøet, må du åpne en terminal i chatgpt-retrieval-main-mappen du lastet ned. For å gjøre det, åpne chatgpt-henting-main mappe, høyreklikk og velg Åpne i terminal.
Når terminalen er åpen, kopier og lim inn denne kommandoen:
pip installer langkjede openai chromadb tiktoken ustrukturert
Denne kommandoen bruker Pythons pakkebehandling for å opprette og administrere det virtuelle Python-miljøet behov for.
Etter å ha opprettet det virtuelle miljøet, må vi levere en OpenAI API-nøkkel for å få tilgang til tjenestene deres. Vi må først generere en API-nøkkel fra Nettsted for OpenAI API-nøkler ved å klikke på Opprett ny hemmelig nøkkel, legger til et navn for nøkkelen, og trykker deretter på Opprett hemmelig nøkkelknapp.
Du vil bli utstyrt med en streng med tegn. Dette er din OpenAI API-nøkkel. Kopier den ved å klikke på kopiikonet på siden av API-nøkkelen. Vær oppmerksom på at denne API-nøkkelen skal holdes hemmelig. Ikke del det med andre med mindre du virkelig har tenkt at de skal bruke det med deg.
Når den er kopiert, gå tilbake til chatgpt-retrieval-hovedmappen og åpne konstanter med Notisblokk. Erstatt nå plassholderen med API-nøkkelen din. Husk å lagre filen!
Nå som du har konfigurert det virtuelle miljøet og lagt til OpenAI API-nøkkelen som en miljøvariabel. Du kan nå gi dine egendefinerte data til ChatGPT.
Trinn 3: Legge til egendefinerte data
For å legge til egendefinerte data, plasser alle dine egendefinerte tekstdata i data mappe i chatgpt-retrieval-main. Formatet på tekstdataene kan være i form av en PDF, TXT eller DOC.
Som du kan se fra skjermbildet ovenfor, har jeg lagt til en tekstfil som inneholder en personlig timeplan, en artikkel jeg skrev på AMDs instinktakseleratorer, og et PDF-dokument.
Trinn 4: Spørre ChatGPT gjennom terminalen
Python-skriptet lar oss spørre etter data fra de tilpassede dataene vi har lagt til i datamappen og internett. Med andre ord vil du ha tilgang til den vanlige ChatGPT-backend og all data som er lagret lokalt i datamappen.
For å bruke skriptet, kjør python chatgpt.py script og legg deretter til spørsmålet eller spørringen som argument.
python chatgpt.py "DITT SPØRSMÅL"
Sørg for å sette spørsmålene dine i anførselstegn.
For å teste om vi har matet ChatGPT dataene våre, vil jeg stille et personlig spørsmål angående Personlig Sched.txt fil.
Det funket! Dette betyr at ChatGPT var i stand til å lese den personlige Sched.txt som ble gitt tidligere. La oss nå se om vi har lykkes med å matet ChatGPT med informasjon den ikke kjenner på grunn av sperringsdatoen for kunnskapen.
Som du kan se, beskrev den riktig AMD Instinct MI250x, som ble utgitt etter ChatGPT -3s kunnskapsavbruddsdato.
Begrensninger for Custom ChatGPT
Selv om mating av GPT-3.5 med tilpassede data åpner for flere måter å bruke og bruke LLM på, er det noen få ulemper og begrensninger.
For det første må du oppgi alle dataene selv. Du kan fortsatt få tilgang til all kunnskapen om GPT-3.5 frem til sperringsdatoen for kunnskapen; du må imidlertid oppgi alle ekstra data. Dette betyr at hvis du vil at din lokale modell skal være kunnskapsrik om et bestemt emne på internett som GPT-3.5 ikke allerede vet, du må gå til internett og skrape dataene selv og lagre dem som en tekst i datamappen til chatgpt-retrieval-main.
Et annet problem er at å spørre ChatGPT som dette tar mer tid å laste sammenlignet med å spørre ChatGPT direkte.
Til slutt er den eneste tilgjengelige modellen GPT-3.5 Turbo. Så selv om du har tilgang til GPT-4, vil du ikke kunne bruke den til å drive din egendefinerte ChatGPT-forekomst.
Tilpasset ChatGPT er fantastisk, men begrenset
Å gi tilpassede data til ChatGPT er en kraftig måte å få mer ut av modellen på. Gjennom denne metoden kan du mate modellen med alle tekstdata du ønsker og spørre den akkurat som vanlig ChatGPT, om enn med noen begrensninger. Dette vil imidlertid endre seg i fremtiden ettersom det blir enklere å integrere dataene våre med LLM, sammen med tilgang til den nyeste GPT-4-modellen.