Pandas er et åpen kildekode Python-bibliotek som hovedsakelig brukes til datamanipulering og analyse. Den er bygget på toppen av NumPy-biblioteket og gir høyytelses, brukervennlige datastrukturer og dataanalyseverktøy for Python-programmeringsspråket.

I denne artikkelen lærer du hvordan du utfører 6 grunnleggende operasjoner med Pandas.

Bruke Panda-eksempler

Du kan kjøre eksemplene i denne artikkelen ved å bruke databaserte notatbøker som Jupyter notatbok, Google Colab, etc. Du kan også kjøre eksemplene ved å skrive inn koden direkte i Python-tolken i interaktiv modus.

Hvis du vil ta en titt på den fullstendige kildekoden som brukes i denne artikkelen, kan du få tilgang til Python Notebook-filen fra denne GitHub-depot.

1. Hvordan importere pandaer som pd og skrive ut versjonsnummeret

Du må bruke import nøkkelord for å importere et hvilket som helst bibliotek i Python. Pandaer importeres vanligvis under pd alias. Med denne tilnærmingen kan du referere til Pandas-pakken som pd i stedet for pandaer.

instagram viewer
importer pandaer som pd
print (pd.__versjon__)

Produksjon:

1.2.4

2. Hvordan lage en serie i pandaer

Pandas-serien er en endimensjonal matrise som inneholder data av enhver type. Det er som en kolonne i en tabell. Du kan lage en serie ved å bruke numpy-matriser, numpy-funksjoner, lister, ordbøker, skalarverdier, etc.

Verdiene til serien er merket med deres indeksnummer. Som standard har den første verdien indeks 0, den andre verdien har indeks 1, og så videre. For å navngi dine egne etiketter, må du bruke indeks argument.

Hvordan lage en tom serie

s = pd. Serie (dtype='float64')
s

Produksjon:

Series([], dtype: float64)

I eksemplet ovenfor er en tom serie med flyte datatypen er opprettet.

Hvordan lage en serie ved hjelp av NumPy Array

importer pandaer som pd
import numpy som np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s

Produksjon:

0 1
1 2
2 3
3 4
4 5
dtype: int32

I slekt: NumPy-operasjoner for nybegynnere

Hvordan lage en serie med liste

d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s

Produksjon:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Hvordan lage en serie med indeks

For å lage en serie med en indeks, må du bruke indeks argument. Antall indekser må være lik antall elementer i serien.

d = [1, 2, 3, 4, 5]
s = pd. Serier (d, indeks=["en", "to", "tre", "fire", "fem"])
s

Produksjon:

en 1
to 2
tre 3
fire 4
fem 5
dtype: int64

Hvordan lage en serie ved hjelp av ordbok

Nøklene til ordboken blir etikettene til serien.

d = {"one": 1,
"to": 2,
"tre": 3,
"fire": 4,
"fem": 5}
s = pd. Serie (d)
s

Produksjon:

en 1
to 2
tre 3
fire 4
fem 5
dtype: int64

Hvordan lage en serie ved å bruke skalarverdi

Hvis du vil lage en serie ved hjelp av en skalarverdi, må du oppgi indeks argument.

s = pd. Serie (1, indeks = ["a", "b", "c", "d"])
s

Produksjon:

en 1
b 1
c 1
d 1
dtype: int64

3. Hvordan lage en dataramme i Pandas

En DataFrame er en todimensjonal datastruktur der data er justert i form av rader og kolonner. En DataFrame kan lages ved hjelp av ordbøker, lister, en liste over ordbøker, numpy arrays, etc. I den virkelige verden lages DataFrames ved å bruke eksisterende lagring som CSV-filer, Excel-filer, SQL-databaser, etc.

DataFrame-objektet støtter en rekke attributter og metoder. Hvis du vil vite mer om dem, kan du sjekke ut den offisielle dokumentasjonen til pandas dataramme.

Hvordan lage en tom dataramme

df = pd. Dataramme()
print (df)

Produksjon:

Tom DataFrame
Kolonner: []
Indeks: []

Hvordan lage en dataramme ved hjelp av liste

listObj = ["MUO", "teknologi", "forenklet"]
df = pd. DataFrame (listObj)
print (df)

Produksjon:

 0
0 MUO
1 teknologi
2 forenklet

Hvordan lage en dataramme ved hjelp av ordbok for ndarray/lister

batmanData = {'Movie Name': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'År for utgivelse': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
print (df)

Produksjon:

 Filmnavn Utgivelsesår
0 Batman begynner 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012

Hvordan lage en dataramme ved hjelp av liste over lister

data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, kolonner = ['Navn', 'Rullnr.'])
print (df)

Produksjon:

 Navnerull nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Hvordan lage en dataramme ved hjelp av liste over ordbøker

data = [{'Name': 'Alex', 'Rull No.': 601},
{'Name': 'Bob', 'Rull No.': 602},
{'Navn': 'Cataline', 'Rulle nr.': 603}]
df = pd. DataFrame (data)
print (df)

Produksjon:

 Navnerull nr.
0 Alex 601
1 Bob 602
2 Cataline 603

I slekt: Hvordan konvertere en liste til en ordbok i Python

Hvordan lage en dataramme ved hjelp av zip()-funksjonen

Bruke glidelås() funksjon for å slå sammen lister i Python.

Navn = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = liste (zip (navn, rullenummer))
df = pd. DataFrame (listOfTuples, columns = ['Navn', 'Rullnr.'])
print (df)

Produksjon:

 Navnerull nr.
0 Alex 601
1 Bob 602
2 Cataline 603

4. Hvordan lese CSV-data i Pandas

En "kommaseparerte verdier" (CSV)-fil er en avgrenset tekstfil som bruker komma for å skille verdier. Du kan lese en CSV-fil ved å bruke read_csv() metode i pandaer. Hvis du vil skrive ut hele DataFrame, bruk to_string() metode.

I dette og de neste eksemplene, dette CSV-fil vil bli brukt til å utføre operasjonene.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())

Produksjon:

5. Hvordan analysere datarammer ved å bruke metodene hode(), hale() og info().

Slik viser du data ved å bruke head()-metoden

De hode() metoden er en av de beste måtene å få en rask oversikt over DataFrame. Denne metoden returnerer overskriften og spesifisert antall rader, fra toppen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head (10))

Produksjon:

Hvis du ikke spesifiserer antall rader, vil de første 5 radene bli returnert.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())

Produksjon:

Slik viser du data ved å bruke tail()-metoden

De hale() metoden returnerer overskriften og spesifisert antall rader, fra bunnen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))

Produksjon:

Hvis du ikke spesifiserer antall rader, vil de siste 5 radene bli returnert.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())

Produksjon:

Hvordan få informasjon om dataene

De info() metoder returnerer et kort sammendrag av en DataFrame, inkludert indeksen dtype og kolonne dtypes, ikke-nullverdier og minnebruk.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())

Produksjon:

6. Hvordan lese JSON-data i Pandas

JSON (JavaSskript Object Notation) er et lett datautvekslingsformat. Du kan lese en JSON-fil ved å bruke read_json() metode i pandaer. Hvis du vil skrive ut hele DataFrame, bruk to_string() metode.

I eksemplet nedenfor, dette JSON-fil brukes til å utføre operasjonene.

I slekt: Hva er JSON? En lekmannsoversikt

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())

Produksjon:

Oppdater Python-kunnskapen din med innebygde funksjoner og metoder

Funksjoner bidrar til å forkorte koden og forbedre effektiviteten. Funksjoner og metoder som redusere(), dele(), enumerate(), eval(), rund(), etc. kan gjøre koden din robust og lett å forstå. Det er alltid godt å vite om innebygde funksjoner og metoder, da de kan forenkle programmeringsoppgavene dine i stor grad.

DelekvitringE-post
20 Python-funksjoner du bør kjenne til

Python Standard Library inneholder mange funksjoner som hjelper deg med programmeringsoppgavene dine. Lær om det mest nyttige og lag mer robust kode.

Les Neste

Relaterte temaer
  • Programmering
  • Python
  • Webutvikling
  • Programmering
  • Dataanalyse
Om forfatteren
Yuvraj Chandra (69 artikler publisert)

Yuvraj er en informatikkstudent ved University of Delhi, India. Han er lidenskapelig opptatt av Full Stack Web Development. Når han ikke skriver, utforsker han dybden av forskjellige teknologier.

Mer fra Yuvraj Chandra

Abonner på vårt nyhetsbrev

Bli med i vårt nyhetsbrev for tekniske tips, anmeldelser, gratis e-bøker og eksklusive tilbud!

Klikk her for å abonnere