Hypotesetesting
Hva er hypotesetesting?
De aller fleste oppgavene du har jobbet med i sannsynlighet til nå, tar utgangspunkt i sannsynlighetsmodeller. I S2 har vi i stor grad laget disse modellene ut fra datasett, men vi har ikke sett så mye på hvor sannsynlig det er at disse modellene er gyldige. Vi skal nå se på en metode for å sjekke om en sannsynlighetsmodell faktisk passer med virkeligheten. Denne metoden kaller vi for hypotesetesting.
Vi vil illustrere med et eksempel der vi gjør en hypotesetest i en normalfordeling. Den første oppgaven i oppgaveartikkelen, 4.3.1, vil også ta deg gjennom prosedyren trinn for trinn, men her i en binomisk fordeling. Man kan gjøre hypotesetest i alle slags sannsynlighetsfordelinger, men her skal vi holde oss til disse to. Prosedyren er uansett den samme.
Det er vanlig å bruke litt tid på bli komfortabel med hypotesetesting. Husk også at den versjonen vi viser fram i S2, er en litt forenklet versjon. Dersom du velger å studere statistikk videre, vil du kunne lære enda mye mer!
Hypotesetesting trinn for trinn
Hvert år oppgir alle nordmenn mellom 17 og 18 år høyden sin på et egenerklæringsskjema i forbindelse med innkalling til sesjon. Disse dataene gir et godt bilde av hvor høye nordmenn er, siden nesten alle i hver generasjon leverer dette skjemaet. I 2021 var gjennomsnittshøyden til norske menn på sesjon 180,6 cm. Vi antar at standardavviket er 6 cm.
Marius spiller volleyball. På laget hans, Frisk og freidig, er det 12 medlemmer. De morer seg med å regne ut gjennomsnittshøyden på laget og kommer fram til at den er 184 cm. Noen av spillerne mener at det er naturlig at gjennomsnittshøyden er større på et volleyballag enn ellers i befolkningen, men Marius er ikke overbevist. Han mener at siden de bare er en kompisgjeng som har spilt sammen siden de var små, er det bare tilfeldig. Siden Marius tar S2, har han lært å gjøre hypotesetest, og dermed vil han prøve å bevise for medspillerne sine at de tar feil.
Trinn 1: Sette opp hypoteser
Marius setter opp to hypoteser som skal testes mot hverandre. Den ene kaller han for en nullhypotese, . Denne hypotesen sier at høyden til volleyballspillerne ikke er ulik resten av befolkningen, at det bare er tilfeldig at de 12 volleyballspillerne er høyere i gjennomsnitt. Dette betyr at vi antar at
Den andre hypotesen er den alternative hypotesen,
Matematisk skriver vi det slik:
Trinn 2: Utføre en test
I denne hypotesetesten er det å regne ut gjennomsnittshøyden til spillerne i Frisk og freidig som er testen. Gjennomsnittet her var 184 cm.
Trinn 3: Regne ut testens P-verdi
Vi må nå regne ut hvor sannsynlig det er at vi finner en gjennomsnittshøyde på 184 cm i et tilfeldig utvalg på 12 norske menn. Denne sannsynligheten kaller vi testens P-verdi.
Ifølge sentralgrensesetningen er gjennomsnittet,
Vi regner ut ved hjelp av Python. (Vi kunne også ha valgt å bruke GeoGebra. Dette får du se eksempler på i oppgaveartikkelen.)
Når vi kjører dette programmet, får vi utskriften "P(X>184)=0,025". Det betyr at testens
Trinn 4: Konkludere
Nå må Marius bestemme seg for om den
Marius velger å sette signifikansnivået til 1 %, eller 0,01. Dette innebærer at dersom sannsynligheten for at 12 tilfeldig valgte norske menn har en gjennomsnittshøyde på mer enn 184 cm, er lavere enn 0,01, må nullhypotesen forkastes, og Marius må innrømme at han har tatt feil.
🤔 Tenk over: Finnes det noen svakheter ved måten Marius gjennomførte denne hypotesetesten på?
Forklaring
Marius regnet ut
Kilde
Statistisk sentralbyrå. (2023, 20. januar). Helseforhold, levekårsundersøkelsen. Hentet 16. februar 2024 fra https://www.ssb.no/helse/helseforhold-og-levevaner/statistikk/helseforhold-levekarsundersokelsen