Slik bruker du Excels innebygde verktøy for å gjøre statistisk analyse enklere.

Restplott spiller en viktig rolle i regresjonsanalyse. De forteller deg hvor nøyaktig regresjonslinjen din representerer forholdet mellom to variabler. Følgende veiledning forklarer hvordan du beregner og plotter Excel-rester ved å bruke to metoder.

Men før vi kommer til de gode tingene, la oss kort forstå rester og deres betydning i en regresjonsanalyse.

Hva er rester, og hvorfor er de viktige?

En residual er en forskjell mellom den observerte (faktiske) verdien og den predikerte verdien. I enklere termer er en rest en feil. For eksempel, hvis den observerte verdien er 10, og modellen din ga en verdi på 8, vil restverdien være 2.

På den annen side er et residualplott et spredningsplot der den uavhengige variabelen (alder) er plottet på den horisontale aksen, og residualene (feilene) er plottet på den vertikale aksen.

Ok, du vet hva rester er, men hvorfor er de viktige? For å forstå det, vurder følgende tilfelle:

instagram viewer

Vi ønsker å forstå sammenhengen mellom alder og sparerater. For det vil vi plotte en regresjonslinje. Vi er imidlertid usikre på om regresjonslinjen nøyaktig representerer forholdet mellom de to variablene. Det er der rester kommer inn. Vi bruker et restplott for å sjekke nøyaktigheten til regresjonslinjen.

Nå som du vet hva rester er, la oss lære hvordan du lager et restplott i Excel:

Hvordan lage et gjenværende plott ved hjelp av trendlinjeligning

Den første metoden for å plotte residualer i Excel bruker en trendlinjeligning for å beregne de predikerte verdiene for dataene våre. Når vi har det, kan vi beregne residualene ved å trekke de predikerte verdiene fra de observerte verdiene. Til slutt lager vi et spredningsplot med prediktorene på den horisontale aksen og residualene på den vertikale aksen.

Selv om denne metoden krever flere trinn enn den andre metoden, er det en fin måte å forstå konseptet på. Når du har fått en anstendig forståelse, kan du bruke den andre metoden, som krever mindre tid og krefter.

La oss lede deg gjennom prosessen, ett trinn om gangen:

Trinn 1: Skriv inn dataene

Vi starter med å skrive inn verdiene for prediktoren (under X kolonne) og de observerte verdiene (under Y kolonne):

Trinn 2: Lag et spredningsplott av dataene

Nå lager vi et spredningsplott av dataene ved å følge trinnene nedenfor:

Hvis du ikke er kjent med spredningsplott, her er en omfattende artikkel om lage et spredningsplott i Excel og presentere dataene dine. Du kan også lære å bruk et spredningsplott i Excel for å forutsi dataoppførsel.

  1. Velg dataene (under X og Y kolonner).
  2. Gå til Excel-bånd og klikk Sett inn.
  3. I Diagrammer klikker du på pilen under Scatterplot alternativ.
  4. Velg det første spredningsdiagrammet (Spred med kun markører).
  5. Du får et spredningsplott som ligner på følgende diagram:

Trinn 3: Legg til en trendlinje og vis trendlinjeligningen på scatterplot

Følg trinnene nedenfor for å legge til en trendlinje i spredningsplottet:

  1. Klikk på spredningsplottet.
  2. Gå til Excel-bånd og klikk Oppsett.
  3. I Bakgrunn klikker du på pilen under Trendlinje ikon.
  4. Velg Lineær trendlinje alternativ.

Du vil nå se en linje (trendlinje) som skjærer punktene på spredningsplottet ditt. Følg trinnene nedenfor for å vise trendlinjeligningen på spredningsdiagrammet:

  1. Gå igjen til Trendlinje ikonet og klikk på pilen under det.
  2. Klikk Flere alternativer for trendlinje.
  3. EN Formater trendlinje dialogboksen vises.
  4. Undersøk Vis ligning på diagrammet alternativet nederst på Formater trendlinje dialogboks. Trendlinjeligningen vil vises på grafen.

Trinn 4: Beregn de anslåtte verdiene

For å beregne de anslåtte verdiene, opprette en annen kolonne (Z) ved siden av dataene dine og følg trinnene nedenfor:

  1. Skriv inn trendlinjeformelen vist på grafen og lim den inn under Z-kolonnen (celle C2). Endre x i formelen med verdier under X-kolonnen.
  2. Så for den første anslåtte verdien, vil formelen bli gitt som følger:
    =1,5115*A2+23,133
  3. Erstatte A2 med A3 i trendlinjeformelen for den andre predikerte verdien.
  4. For den tredje anslåtte verdien, erstatt A3 med A4, og så videre, til du får alle de predikerte verdiene for deres tilsvarende prediktorer.

Trinn 5: Finn restverdiene

Nå som vi har de predikerte verdiene, kan vi finne restverdiene ved å trekke de predikerte verdiene fra de observerte (faktiske) verdiene under Y-kolonnen. Formelen for den første restverdien vil være =B2-C2. For den andre ville formelen være =B3-C3, og så videre.

Trinn 6: Lag gjenværende plot

For å lage et restplott trenger vi prediktoren og restverdiene. Nå som vi har begge deler, følg trinnene nedenfor:

  1. Velg kolonner Y og Z.
  2. Høyreklikk og velg Gjemme seg.
  3. Velg nå X og Rester kolonner.
  4. Gå til Sett inn fanen i Excel-båndet.
  5. Klikk på pilen under Spre ikon.
  6. Velg Spred med kun markører alternativ.
  7. Du får din gjenværende tomt, som vist nedenfor.

For den andre metoden er alt du trenger å gjøre å gi Excel dataene, og den gjør alt arbeidet. Du kan lage et gjenstående plot med bare noen få klikk. Men for det må du laste Excels analyseverktøypakke. La oss komme i gang:

  1. Gå til Fil fanen og klikk Alternativer.
  2. De Excel-alternativer dialogboksen vises.
  3. Gå til Få til boksen (nederst), velg Excel-tillegg, og klikk .
  4. An Tillegg dialogboksen vises.
  5. Undersøk Analyse ToolPak boksen og klikk ok.
  6. Gå nå til Excel-bånd og klikk Data.
  7. Du finner Dataanalyse ikonet i Analyse seksjon.

Trinn 2: Skriv inn dataene

  1. Velg kolonner EN og D, og høyreklikk med musen. Klikk Vis frem.
  2. Kopier nå X og Y kolonner.

    Du vil legge merke til at grafen har endret seg etter at du har vist kolonnene. For å endre det tilbake til det opprinnelige gjenværende plottet, må vi skjule Y og Z kolonner (ved å velge Y og Z kolonner, høyreklikk med musen og velg Gjemme seg).

  3. Åpne et nytt Excel-ark og lim inn X og Y kolonner.
  4. Klikk på den nylig dukkede opp Dataanalyse alternativet i Analyse delen av Data fanen.
  5. EN Dataanalyse dialogboksen vises.
  6. Finn og velg Regresjon under Analyseverktøy.
  7. Klikk OK. De Regresjon dialogboksen vises.
  8. Skriv inn verdiene i Y kolonne (prediktorene, B2:B11) i Inndata Y-område felt.
  9. Skriv inn celleområdet i X kolonne (de uavhengige variablene, A2:A11) i Inngang X-område felt.

Trinn 3: Lag restplottet

I Regresjon dialogboksen under Utgangsalternativer, Sjekk Nytt arbeidsarklag, og klikk OK.

Excel vil automatisk opprette gjenværende plot sammen med følgende utdata som du kan bruke for å sjekke påliteligheten til regresjonsmodellen din:

  • Regresjonsstatistikk
  • ANOVA bord
  • Koeffisienttabell
  • Restutgang

Excels Analysis ToolPak tilbyr en rekke verdifulle statistikkfunksjoner som du kan bruke til å analysere datasettene dine. Etter å ha laget gjenværende plott gjennom Excels Analysis ToolPak, kan du begynne å klø deg i hodet mens du ser på alle de kompliserte tabellene. Men når du først lærer hvordan du gjør grunnleggende dataanalyse i Excel, ser tallene ikke så skumle ut.