Varians og standardavvik
Gjennomsnitt og forventningsverdi sier noe om sentrum i et tallmateriale og kalles sentralmål. Ulike datasett kan ha lik forventningsverdi, samtidig som fordelingen av de enkelte observasjonene er veldig ulike. Vi har tidligere sett på sannsynlighetsfordelingen og forventningsverdien til kast med én terning, med og
La oss sammenlikne med karakterfordelingen på skriftlig eksamen i matematikk R1 skoleåret 2014/2015. Her fordeler karakterene seg slik (tall fra Utdanningsdirektoratets karakterstatistikk):
Karakteren 1 | Karakteren 2 | Karakteren 3 | Karakteren 4 | Karakteren 5 | Karakteren 6 | |
---|---|---|---|---|---|---|
Andel | 0,045 | 0,201 | 0,260 | 0,250 | 0,212 | 0,032 |
Vi regner ut forventningsverdien (her står
Dette er samme forventningsverdi som ved kast med én terning. Men vi ser at fordelingen av de enkelte dataene er forskjellig. Vi trenger noe å beskrive dette med, uten at man må vise fram hele tabellen. Vi trenger et spredningsmål. Det finnes flere ulike spredningsmål, men i matematikk S2 skal vi konsentrere oss om varians og standardavvik. Les gjerne mer i fagartikkelen om ulike spredningsmål.
Varians i et datamateriale
Varians er det vi kan kalle for gjennomsnittlig kvadratavvik. Vi viser først hvordan man finner variansen i observerte data, med utgangspunkt i eksemplene over.
Vi har kjørt en simulering (du finner programmet i den klikkbare boksen under tabellen) hvor vi har kastet en terning 10 000 ganger og fått følgende tabell (som gir gjennomsnitt = 3,50):
Antall øyne ( | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Antall kast | 1 678 | 1 661 | 1 671 | 1 621 | 1 670 | 1 699 |
Vi finner variansen for kastene ved å finne avviket fra gjennomsnittet for hver enkelt observasjon, kvadrere det og finne gjennomsnittet av disse avvikene:
Vi finner tilsvarende varians i karakterfordelingen over. Her er antall observasjoner (karakterer) oppgitt i andeler, derfor deler vi på 1. Vi kunne selvsagt ha latt være å dele på 1, men vi gjør det for å vise at det er den samme utregningen som over:
Her kan vi legge merke til at variansen i karakterfordelingen er ganske mye mindre enn variansen i terningkastforsøket. Dette betyr, som vi også kan lese ut av tabellen, at mens utfallene i terningkastforsøket er tilnærmet jevnt fordelt, er karakterene på R1-eksamen mer konsentrert i nærheten av gjennomsnittskarakteren.
Varians i sannsynlighetsfordelinger
Når vi regner med varians i sannsynlighetsfordelinger, tar vi utgangspunkt i sannsynligheten i stedet for antallet forekomster. Da får vi en utregning som likner på den vi fikk da vi fant variansen i karakterfordelingen. Vi tar utgangspunkt i sannsynlighetsfordelingen for kast med én terning i stedet for simuleringen:
Terningkast 1 | Terningkast 2 | Terningkast 3 | Terningkast 4 | Terningkast 5 | Terningkast 6 | |
---|---|---|---|---|---|---|
andel |
Vi ser at variansen i sannsynlighetsfordelingen er nokså nær den variansen vi fikk i simuleringen.
Standardavvik
Det aller vanligste spredningsmålet er standardavvik. Standardavviket har, som forventningsverdien, fått tildelt sin egen greske bokstav. Vi kaller standardavviket (forkortet
Dette gir følgende standardavvik for situasjonene over:
Forsøket med kast med én terning:
Karakterfordelingen på eksamen i R1:
Sannsynlighetsfordelingen for kast med én terning:
I oppgavene skal du i tillegg til å regne for hånd også få lage programmer som kan finne varians og standardavvik.
Formel for varians
Formel for standardavvik
Relatert innhold
Her definerer vi hva vi mener med spredning i et datamateriale, og vi ser på spredningsmålene variasjonsbredde, kvartilbredde og standardavvik.