Pandas er et åpen kildekode Python-bibliotek som hovedsakelig brukes til datamanipulering og analyse. Den er bygget på toppen av NumPy-biblioteket og gir høyytelses, brukervennlige datastrukturer og dataanalyseverktøy for Python-programmeringsspråket.
I denne artikkelen lærer du hvordan du utfører 6 grunnleggende operasjoner med Pandas.
Bruke Panda-eksempler
Du kan kjøre eksemplene i denne artikkelen ved å bruke databaserte notatbøker som Jupyter notatbok, Google Colab, etc. Du kan også kjøre eksemplene ved å skrive inn koden direkte i Python-tolken i interaktiv modus.
Hvis du vil ta en titt på den fullstendige kildekoden som brukes i denne artikkelen, kan du få tilgang til Python Notebook-filen fra denne GitHub-depot.
1. Hvordan importere pandaer som pd og skrive ut versjonsnummeret
Du må bruke import nøkkelord for å importere et hvilket som helst bibliotek i Python. Pandaer importeres vanligvis under pd alias. Med denne tilnærmingen kan du referere til Pandas-pakken som pd i stedet for pandaer.
importer pandaer som pd
print (pd.__versjon__)
Produksjon:
1.2.4
2. Hvordan lage en serie i pandaer
Pandas-serien er en endimensjonal matrise som inneholder data av enhver type. Det er som en kolonne i en tabell. Du kan lage en serie ved å bruke numpy-matriser, numpy-funksjoner, lister, ordbøker, skalarverdier, etc.
Verdiene til serien er merket med deres indeksnummer. Som standard har den første verdien indeks 0, den andre verdien har indeks 1, og så videre. For å navngi dine egne etiketter, må du bruke indeks argument.
Hvordan lage en tom serie
s = pd. Serie (dtype='float64')
s
Produksjon:
Series([], dtype: float64)
I eksemplet ovenfor er en tom serie med flyte datatypen er opprettet.
Hvordan lage en serie ved hjelp av NumPy Array
importer pandaer som pd
import numpy som np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s
Produksjon:
0 1
1 2
2 3
3 4
4 5
dtype: int32
I slekt: NumPy-operasjoner for nybegynnere
Hvordan lage en serie med liste
d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s
Produksjon:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Hvordan lage en serie med indeks
For å lage en serie med en indeks, må du bruke indeks argument. Antall indekser må være lik antall elementer i serien.
d = [1, 2, 3, 4, 5]
s = pd. Serier (d, indeks=["en", "to", "tre", "fire", "fem"])
s
Produksjon:
en 1
to 2
tre 3
fire 4
fem 5
dtype: int64
Hvordan lage en serie ved hjelp av ordbok
Nøklene til ordboken blir etikettene til serien.
d = {"one": 1,
"to": 2,
"tre": 3,
"fire": 4,
"fem": 5}
s = pd. Serie (d)
s
Produksjon:
en 1
to 2
tre 3
fire 4
fem 5
dtype: int64
Hvordan lage en serie ved å bruke skalarverdi
Hvis du vil lage en serie ved hjelp av en skalarverdi, må du oppgi indeks argument.
s = pd. Serie (1, indeks = ["a", "b", "c", "d"])
s
Produksjon:
en 1
b 1
c 1
d 1
dtype: int64
3. Hvordan lage en dataramme i Pandas
En DataFrame er en todimensjonal datastruktur der data er justert i form av rader og kolonner. En DataFrame kan lages ved hjelp av ordbøker, lister, en liste over ordbøker, numpy arrays, etc. I den virkelige verden lages DataFrames ved å bruke eksisterende lagring som CSV-filer, Excel-filer, SQL-databaser, etc.
DataFrame-objektet støtter en rekke attributter og metoder. Hvis du vil vite mer om dem, kan du sjekke ut den offisielle dokumentasjonen til pandas dataramme.
Hvordan lage en tom dataramme
df = pd. Dataramme()
print (df)
Produksjon:
Tom DataFrame
Kolonner: []
Indeks: []
Hvordan lage en dataramme ved hjelp av liste
listObj = ["MUO", "teknologi", "forenklet"]
df = pd. DataFrame (listObj)
print (df)
Produksjon:
0
0 MUO
1 teknologi
2 forenklet
Hvordan lage en dataramme ved hjelp av ordbok for ndarray/lister
batmanData = {'Movie Name': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'År for utgivelse': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
print (df)
Produksjon:
Filmnavn Utgivelsesår
0 Batman begynner 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012
Hvordan lage en dataramme ved hjelp av liste over lister
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, kolonner = ['Navn', 'Rullnr.'])
print (df)
Produksjon:
Navnerull nr.
0 Alex 601
1 Bob 602
2 Cataline 603
Hvordan lage en dataramme ved hjelp av liste over ordbøker
data = [{'Name': 'Alex', 'Rull No.': 601},
{'Name': 'Bob', 'Rull No.': 602},
{'Navn': 'Cataline', 'Rulle nr.': 603}]
df = pd. DataFrame (data)
print (df)
Produksjon:
Navnerull nr.
0 Alex 601
1 Bob 602
2 Cataline 603
I slekt: Hvordan konvertere en liste til en ordbok i Python
Hvordan lage en dataramme ved hjelp av zip()-funksjonen
Bruke glidelås() funksjon for å slå sammen lister i Python.
Navn = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = liste (zip (navn, rullenummer))
df = pd. DataFrame (listOfTuples, columns = ['Navn', 'Rullnr.'])
print (df)
Produksjon:
Navnerull nr.
0 Alex 601
1 Bob 602
2 Cataline 603
4. Hvordan lese CSV-data i Pandas
En "kommaseparerte verdier" (CSV)-fil er en avgrenset tekstfil som bruker komma for å skille verdier. Du kan lese en CSV-fil ved å bruke read_csv() metode i pandaer. Hvis du vil skrive ut hele DataFrame, bruk to_string() metode.
I dette og de neste eksemplene, dette CSV-fil vil bli brukt til å utføre operasjonene.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())
Produksjon:
5. Hvordan analysere datarammer ved å bruke metodene hode(), hale() og info().
Slik viser du data ved å bruke head()-metoden
De hode() metoden er en av de beste måtene å få en rask oversikt over DataFrame. Denne metoden returnerer overskriften og spesifisert antall rader, fra toppen.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head (10))
Produksjon:
Hvis du ikke spesifiserer antall rader, vil de første 5 radene bli returnert.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())
Produksjon:
Slik viser du data ved å bruke tail()-metoden
De hale() metoden returnerer overskriften og spesifisert antall rader, fra bunnen.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))
Produksjon:
Hvis du ikke spesifiserer antall rader, vil de siste 5 radene bli returnert.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())
Produksjon:
Hvordan få informasjon om dataene
De info() metoder returnerer et kort sammendrag av en DataFrame, inkludert indeksen dtype og kolonne dtypes, ikke-nullverdier og minnebruk.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())
Produksjon:
6. Hvordan lese JSON-data i Pandas
JSON (JavaSskript Object Notation) er et lett datautvekslingsformat. Du kan lese en JSON-fil ved å bruke read_json() metode i pandaer. Hvis du vil skrive ut hele DataFrame, bruk to_string() metode.
I eksemplet nedenfor, dette JSON-fil brukes til å utføre operasjonene.
I slekt: Hva er JSON? En lekmannsoversikt
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())
Produksjon:
Oppdater Python-kunnskapen din med innebygde funksjoner og metoder
Funksjoner bidrar til å forkorte koden og forbedre effektiviteten. Funksjoner og metoder som redusere(), dele(), enumerate(), eval(), rund(), etc. kan gjøre koden din robust og lett å forstå. Det er alltid godt å vite om innebygde funksjoner og metoder, da de kan forenkle programmeringsoppgavene dine i stor grad.
Python Standard Library inneholder mange funksjoner som hjelper deg med programmeringsoppgavene dine. Lær om det mest nyttige og lag mer robust kode.
Les Neste
- Programmering
- Python
- Webutvikling
- Programmering
- Dataanalyse
Yuvraj er en informatikkstudent ved University of Delhi, India. Han er lidenskapelig opptatt av Full Stack Web Development. Når han ikke skriver, utforsker han dybden av forskjellige teknologier.
Abonner på vårt nyhetsbrev
Bli med i vårt nyhetsbrev for tekniske tips, anmeldelser, gratis e-bøker og eksklusive tilbud!
Klikk her for å abonnere