Mens du bruker Google Regneark til å jobbe med to datasett, kan det være lurt å sammenligne de to ved å bestemme i hvilken grad det ene påvirker det andre.

Korrelasjoner kan gi innsikt i om det er en prediktiv sammenheng mellom x- og y-plan, men de indikerer ikke nødvendigvis kausalitet. Slik kan du bruke Google Regneark til å identifisere sammenhenger i dataene dine.

Hva er korrelasjon, og hva kan du bruke det til?

Når to variabler er korrelert, kan den ene bestemme hvordan en variabel påvirker den andre. Men det er viktig å huske at korrelasjon ikke innebærer tillit i dette tilfellet; det viser bare hvor tett og raskt to variabler sammenligner eller relaterer seg.

Statistiske beregninger hjelper til med å forstå underliggende trender i dataanalyse. Korrelasjon er blant de mest brukte statistiske beregningene, og den bestemmer hvor nært beslektede eller avhengige to variabler er.

Forstå korrelasjonskoeffisient i Google Sheets

I Google Sheets beregnes en korrelasjonskoeffisient ved å bruke CORREL-funksjonen. Korrelasjonskoeffisienten fungerer som en måler for hvor tett sammenkoblede datasettene er. Den kan brukes til å få Pearson produkt-øyeblikk-korrelasjonskoeffisienten (r) hvis du har to variable sett med data. Hvis du vil lære mer om denne koeffisienten, kan du lese mer i denne veiledningen fra

instagram viewer
Statistikk hos Leard.

Man kan komme over en av tre korrelasjonsmålinger. Hver måling definerer forholdet mellom variabler annerledes. Verdien er mellom -1 og +1:

  • -1 angir en perfekt negativ korrelasjon: Når en korrelasjon har en korrelasjonskoeffisient som er lik eller under -0,9, oppgis den å være sterkt negativ. Det er en indikasjon på at data korrelerer. Variabelen x fortsetter imidlertid å øke, mens variabel y fortsetter å avta.
  • 0 angir ingen forbindelse: Variabler anses ikke å korrelere hvis korrelasjonskoeffisienten er større enn 0,01, men mindre enn 0,1 siden det ikke er et merkbart forhold mellom hver variabel. De er uavhengige av hverandre.
  • +1 angir en perfekt positiv korrelasjon: Når en korrelasjons koeffisient faller mellom 0,9 og 1, anses den som svært positiv. Det tyder på at det har vært en økning i de to variabelsettene.

Den høyeste verdien av en koeffisient kan ha vært en korrelasjonskoeffisient på 1. Når korrelasjonsverdien er 1, betyr det at hvis du skulle tegne dataene, ville de være fullstendig justert for å lage en rett linje.

Hvis du fortsatt er litt borte, ikke bekymre deg. Vi vil forklare syntaksen til CORREL-funksjonen og deretter dykke ned i noen eksempler fra den virkelige verden for å hjelpe deg å forstå den bedre. Forstå linjer med best passform og hvordan lage trendlinjer i Google Sheets vil hjelpe deg med dette.

CORREL-funksjonssyntaks i Google Sheets

=CORREL(data_y; data_x) 

La oss dele dette ned i sine deler og bedre forstå hva hver setning betyr:

  • =CORREL: Dette er Google Sheet-funksjonen som bestemmer r, (datasettets Pearson-produkt-øyeblikk-korrelasjonskoeffisient).
  • data_y: Dette refererer til gruppen av celler som inneholder de avhengige dataene eller verdiområdet for disse cellene.
  • data x: Dette er enten en referanse til utvalget av celler med uavhengige data eller verdiområdet for disse cellene.

Hvis du skulle tegne datapunktene, ville data_y være Y-aksen og data_x X-aksen. Du vil legge merke til at det er to forskjellige måter å angi dataområdet på. Enten et referansecelleområde eller rett dataregistrering i funksjonen er alternativer.

I de fleste tilfeller er bruk av referansecelleområde å foretrekke. Det er fordi regnearket mest sannsynlig allerede inneholder dataene dine. Bruk av et referansecelleområde kan unngå overdreven inntasting som kan føre til brukerfeil.

CORREL-funksjonseksempler i Google Sheets

La oss ta en titt på noen eksempler for å forstå hvordan du bruker CORREL-funksjonen i Google Sheets.

Eksempel 1: En sterk positiv korrelasjon

For dette første eksempelet, la oss late som om vi jobber i eiendomsbransjen. I regnearket nedenfor har vi partisjoner med hektar land du selger og antall solgte enheter av dataene til de forskjellige landområdene i Google-arket ditt.

  1. Hvis du følger med i et ark, begynner du med å taste inn dataene til variablene i regnearket ditt, som vist nedenfor:
  2. Klikk på celle C2
  3. Type =CORREL(
  4. Du vil deretter fortsette til å skrive data_y, som i vårt tilfelle er det refererte celleområdet A2:A6, skriv deretter inn et komma.
  5. Fortsett til skriv data_x, som i vårt tilfelle er referert til som B2:B6.
  6. Avslutt med en lukkebeslag, som vist nedenfor:
  7. Trykk til slutt Tast inn for å returnere korrelasjonskoeffisienten til de to dataene i cellen C2.

Ved å bruke eksemplet som nettopp er vist ovenfor, har du fått en korrelasjonskoeffisient på 0,90, som er en sterk positiv korrelasjon siden verdien faller mellom 0,9 og 1. Derfor indikerer dette at når y endres, endres x også på en vesentlig sammenlignbar måte.

Nedenfor er en representasjon av eksempeldataene våre på en XY-spredningsgraf. Som du kan se, er linjen med beste tilpasning nær datapunktene på grafen, noe som støtter ideen om at tallene er sterkt korrelerte.

Du kan lære mer om lage XY-spredningsgrafer i Google Sheets i vår andre artikkel.

Eksempel 2: En svak negativ korrelasjon

Denne gangen vil vi bruke et mer generisk eksempel på "variabel x og y" i regnearket vårt. Vi har målrettet inkludert tall for å demonstrere en negativ korrelasjon, som CORREL-funksjonen demonstrerer nedenfor:

Det er ikke en sterk sammenheng mellom variablene y og x, så resultatet vi får er en mindre signifikant korrelasjonskoeffisient enn i forrige eksempel. Resultatet vi oppnådde er -0,47. Dette betyr imidlertid ikke at det ikke er noen sammenheng i det hele tatt. La oss se på en linje med best passform igjen for å forstå det.

Som du kan se av spredningsplottet, er datapunktene lenger fra linjen med best passform. Det er derfor mindre korrelasjon enn i det første eksemplet, men ikke ingen. Du vil også legge merke til at linjen for best passform avtar. Dette viser en negativ korrelasjon, en verdi synker når den andre øker.

Eksempel 3: Ingen tilkobling

Her har vi et sett med helt tilfeldige tall. La oss raskt ta en titt på hvordan du bruker CORREL-funksjonen igjen:

  1. Skriv inn celle C2 CORREL-formelen
  2. Våre argumenter er A2:A10 og B2:B10
  3. Trykk Enter

Verdien returnert på C2 er 0,02. Hvis en korrelasjonskoeffisient faller mellom 0,01 og 0,1, fastslås det at de aktuelle variablene ikke korrelerer siden det ikke er noen merkbar sammenheng mellom dem. Forholdet mellom variabler er helt uavhengige.

Nedenfor er representasjonen av det samme på en spredningsgraf. Linjen med best passform er nesten flat, noe som indikerer liten korrelasjon mellom de to datasettene.

Korreler enkelt dataene dine i Google Sheets

Korrelasjon kan være et utfordrende tema hvis du ikke jobbet mye med det på videregående. Denne veiledningen dekket alt det grunnleggende, men du må fortsette å bruke CORREL-funksjonen i Google Sheets for å holde deg frisk i minnet.

Dette er en kraftig funksjon siden den hjelper til med å unngå å bygge spredningsgrafer og raskt kan finne trender i dataene dine. Ikke vær redd for å legge til diagrammer for å hjelpe andre brukere bedre å forstå dataene i regnearkene dine.