Varians og standardavvik
Gjennomsnitt og forventningsverdi seier noko om sentrum i eit talmateriale og blir kalla sentralmål. Ulike datasett kan ha lik forventningsverdi, samtidig som fordelinga av dei enkelte observasjonane er veldig ulike. Vi har tidlegare sett på sannsynsfordelinga og forventningsverdien til kast med éin terning, med og
La oss samanlikne med karakterfordelinga på skriftleg eksamen i matematikk R1 skuleåret 2014/2015. Her fordeler karakterane seg slik (tal frå Utdanningsdirektoratets karakterstatistikk):
Karakteren 1 | Karakteren 2 | Karakteren 3 | Karakteren 4 | Karakteren 5 | Karakteren 6 | |
---|---|---|---|---|---|---|
Andel | 0,045 | 0,201 | 0,260 | 0,250 | 0,212 | 0,032 |
Vi reknar ut forventningsverdien (her står
Dette er den same forventningsverdien som ved kast med éin terning. Men vi ser at fordelinga av dei enkelte dataa er forskjellig. Vi treng noko å beskrive dette med, utan at ein må vise fram heile tabellen. Vi treng eit spreiingsmål. Det finst fleire ulike spreiingsmål, men i matematikk S2 skal vi konsentrere oss om varians og standardavvik. Les gjerne meir i fagartikkelen om ulike spreiingsmål.
Varians i eit datamateriale
Varians er det vi kan kalle for gjennomsnittleg kvadratavvik. Vi viser først korleis ein finn variansen i observerte data, med utgangspunkt i døma over.
Vi har køyrt ei simulering (du finn programmet i den klikkbare boksen under tabellen) der vi har kasta ein terning 10 000 gonger og fått følgande tabell (som gir gjennomsnitt = 3,50):
Tal på auge ( | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Tal på kast | 1 678 | 1 661 | 1 671 | 1 621 | 1 670 | 1 699 |
Vi finn variansen for kasta ved å finne avviket frå gjennomsnittet for kvar enkelt observasjon, kvadrere det og finne gjennomsnittet av desse avvika:
Vi finn tilsvarande varians i karakterfordelinga over. Her er talet på observasjonar (karakterar) gitt i andelar, derfor deler vi på 1. Vi kunne sjølvsagt ha latt være å dele på 1, men vi gjer det for å vise at det er den same utrekninga som over:
Her kan vi legge merke til at variansen i karakterfordelinga er ganske mye mindre enn variansen i terningkastforsøket. Dette betyr, som vi òg kan lese ut av tabellen, at mens utfalla i terningkastforsøket er tilnærma jamt fordelt, er karakterane på R1-eksamen meir konsentrerte i nærleiken av gjennomsnittskarakteren.
Varians i sannsynsfordelingar
Når vi reknar med varians i sannsynsfordelingar, tek vi utgangspunkt i sannsynet i staden for talet på førekomstar. Då får vi ei utrekning som liknar på det vi fekk då vi fann variansen i karakterfordelinga. Vi tek utgangspunkt i sannsynsfordelinga for kast med éin terning i staden for simuleringa:
Terningkast 1 | Terningkast 2 | Terningkast 3 | Terningkast 4 | Terningkast 5 | Terningkast 6 | |
---|---|---|---|---|---|---|
Andel |
Vi ser at variansen i sannsynsfordelinga er nokså nær den variansen vi fekk i simuleringa.
Standardavvik
Det aller vanlegaste spreiingsmålet er standardavvik. Standardavviket har, som forventningsverdien, fått tildelt sin eigen greske bokstav. Vi kallar standardavviket (forkorta
Dette gir følgande standardavvik for situasjonane over:
Forsøket med kast med éin terning:
Karakterfordelinga på eksamen i R1:
Sannsynsfordelinga for kast med éin terning:
I oppgåvene skal du i tillegg til å rekne for hand òg få lage program som kan finne varians og standardavvik.
Formel for varians
Formel for standardavvik
Relatert innhald
Her definerer vi kva vi meiner med spreiing i eit datamateriale, og vi ser på spreiingsmåla variasjonsbreidde, kvartilbreidde og standardavvik.