Artikkel i Neste knapp: 899988

Jupyter Notebook er det viktigste verktøyet for dataforskere. Den tilbyr et interaktivt webgrensesnitt som kan brukes til datavisualisering, enkel analyse og samarbeid.

Datavisualisering lar deg finne kontekst for dataene dine gjennom kart eller grafer. Denne opplæringen gir en innsiktsfull guide til samhandling med grafer i Jupyter Notebook.

Forutsetninger

Du trenger å har Jupyter installert på maskinen din. Hvis ikke, kan du installere den ved å skrive inn følgende kode på kommandolinjen:

 $ pip install jupyter

Du trenger også pandaer og matplotlib bibliotek:

$ pip installere pandaer
$ pip installer matplotlib

Når installasjonene er fullført, starter du Jupyter Notebook-serveren. Skriv inn kommandoen nedenfor i terminalen din for å gjøre det. En Jupyter-side som viser filer i den gjeldende katalogen, åpnes i datamaskinens standardleser.

$ jupyter notatbok

Merk: Ikke lukk terminalvinduet du kjører denne kommandoen i. Serveren din vil stoppe hvis du gjør det.

Enkel plott

Kjør denne koden på en ny Jupyter-side:

importer matplotlib.pyplot som plt
x = [1,2,3,4,5,6,7,8]
y = [2,4,6,8,10,12,14,16]
plt.plott (x, y)
plt.show ()

Koden er for en enkel linjeplott. Første linje importerer pyplott grafbibliotek fra matplotlib API. Den tredje og fjerde linjen definerer henholdsvis x- og y-aksen.

De plott() metoden kalles for å plotte grafen. De vise fram() metoden blir deretter brukt til å vise grafen.

Anta at du ønsker å tegne en kurve i stedet. Prosessen er den samme. Bare endre verdiene til python-liste for y-aksen.

importer matplotlib.pyplot som plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.plott (x, y)
plt.show ()

Legg merke til noe viktig: i begge grafene er det ingen eksplisitt skala-definisjon. Vekten beregnes automatisk og påføres. Dette er en av de mange interessante funksjonene som Juypter tilbyr, som kan få deg til å fokusere på arbeidet ditt (dataanalyse) i stedet for å bekymre deg for kode.

Hvis du også er årvåken, kan du observere at antall verdier for x- og y-aksene er det samme. Hvis noen av dem er mindre enn den andre, vil en feil bli flagget når du kjører koden, og ingen graf vises.

Typer tilgjengelig

I motsetning til linjediagrammet og kurven ovenfor, må andre grafvisualiseringer (f.eks. Et histogram, søylediagram osv.) Defineres eksplisitt for å kunne vises.

Søylediagram

For å vise en barplott må du bruke bar() metode.

importer matplotlib.pyplot som plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.bar (x, y)
plt.show ()

Spredningsplott

Alt du trenger å gjøre er å bruke spre() metode i forrige kode.

importer matplotlib.pyplot som plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.spredning (x, y)
plt.show ()

Kake diagram

En kakeplott er litt forskjellig fra resten over. Linje 4 er av spesiell interesse, så ta en titt på funksjonene der.

figurstørrelse brukes til å stille inn størrelsesforholdet. Du kan sette dette til alt du vil (f.eks. (9,5)), men de offisielle Pandas-dokumentene anbefaler at du bruker et sideforhold på 1.

importer matplotlib.pyplot som plt
x = [4,9,16,25,36]
fig = plt. figur (figsize = (9, 5)) # linje 4
plt.pie (x)
plt.show ()

Det er noen parametere som sektordiagrammet har som er bemerkelsesverdige:

etiketter - Dette kan brukes til å gi en etikett til hvert stykke i kakediagrammet.

farger - Dette kan brukes til å gi forhåndsdefinerte farger til hver av skivene. Du kan spesifisere farger både i tekstform (f.eks. “Gul”) eller i hex-form (f.eks. “# Ebc713”).

Se eksemplet nedenfor:

importer matplotlib.pyplot som plt
x = [4,9,16,25,36]
fig = plt. figur (figsize = (5.5, 5.5))
plt.pie (x, labels = ("Guavaer", "Bær", "Mango", "Epler", "Avokado"),
farger = ("# a86544", "# eb5b13", "# ebc713", "# bdeb13", "# 8aeb13"))
plt.show ()

Det er også andre tomter som hist, område og kde det kan du les mer om Pandas-dokumenter.

Plottformatering

I plottene ovenfor er det ingen aspekter som etiketter. Slik gjør du det.

For å legge til en tittel, inkluder koden nedenfor i Jupyter Notebook:

matplotlib.pyplot.title ("Min graftittel")

X- og y-aksene kan merkes henholdsvis nedenfor:

matplotlib.pyplot.xlabel ("min x-akselabel")
matplotlib.pyplot.ylabel ("min y-akselabel")

Lære mer

Du kan kjøre hjelp() kommandoen i notatboken for å få interaktiv assistanse om Jupyter-kommandoer. For å få mer informasjon om et bestemt objekt, kan du bruke hjelp (objekt).

Du vil også finne det en god praksis å prøve å tegne grafer ved hjelp av datasett fra csvfiles. Å lære å visualisere data er et kraftig verktøy for å kommunisere og analysere funnene dine, så det er verdt å ta litt tid å bygge ferdighetene dine.

E-post
Hvordan importere Excel-data til Python-skript ved hjelp av pandaer

For avansert dataanalyse er Python bedre enn Excel. Slik importerer du Excel-dataene dine til et Python-skript ved hjelp av Pandas!

Les Neste

Relaterte temaer
  • Programmering
  • Python
  • Koding opplæringsprogrammer
  • Dataanalyse
Om forfatteren
Jerome Davidson (5 artikler publisert)

Jerome er Staff Writer på MakeUseOf. Han dekker artikler om programmering og Linux. Han er også en kryptoentusiast og holder alltid øye med kryptoindustrien.

Mer fra Jerome Davidson

Abonner på vårt nyhetsbrev

Bli med på nyhetsbrevet vårt for tekniske tips, anmeldelser, gratis e-bøker og eksklusive tilbud!

Ett steg til…!

Bekreft e-postadressen din i e-posten vi nettopp sendte deg.

.