Hopp til innhald
Oppgave

Hypotesetesting

Øv på hypotesetesting med desse oppgåvene.

4.3.1

I denne oppgåva går vi gjennom ein hypotesetest steg for steg, slik som på teorisida.

Ein skule har 500 elevar. Fråværet på skulen har lege på 8 % i lengre tid. Rektor på skulen har observert at fråværet har vore større den siste tida. Ei veke var fråværet plutseleg på 10 %. Rektor ønsker å gjere berekningar for å finne ut om det er grunn til å seie at det auka fråværet denne veka er eit teikn på at fråværet vil komme til å auke framover, eller om det berre er ein tilfeldig topp denne veka.

a) Set opp ein nullhypotese H0 som rektor kan bruke i testen.

Løysing

Hypotesen H0 skal seie noko om korleis det har vore tidlegare. Då kan vi skrive følgande:

Fråværet f på skulen ligg på 8 %, det vil seie f=0,08.

Det gir

H0:f=0,08

b) Set opp ein alternativ hypotese H1.

Løysing

Den alternative hypotesen H1 kan gjelde dersom H0 ikkje gjeld, og må seie noko om i kva retning vi mistenker at fråværsprosenten går. Her er den alternative hypotesen at fråværet er større enn 8 %.

H1: f>0,08.

c) Kva er det som er testdata i denne oppgåva?

Løysing

Testdata her er fråværet på 10 % i den eine veka.

d) Kva er meint med testen sin P-verdi her?

Løysing

Testen sin P-verdi betyr her sannsynet for at fråværet er 10 % eller større.

e) Forklar at rektor kan velje ein binomisk sannsynsmodell i denne testen.

Løysing

Det er tre krav til ein binomisk sannsynsmodell:

To moglege utfall: Her er ein elev anten til stades eller borte.

Likt sannsyn heile tida: Sidan sannsynet er rekna ut frå delen av elevar som er borte, kan vi gå ut frå at dette sannsynet gjeld for heile skulen.

Uavhengige forsøk: Her går vi ut frå at fråværet til elevane er uavhengig av kvarandre, noko som kanskje kan vere litt usannsynleg med tanke på smitte og liknande. Men sidan det er såpass mange elevar på skulen, kan vi velje å likevel gå ut frå at fråværet til kvar elev er uavhengig av fråværet til dei andre elevane.

f) Kva er naturleg å bruke som stokastisk variabel X i denne testen?

Løysing

Her lar rektor X stå for talet på elevar som er borte.

g) Hjelp rektor med å rekne ut testen sin P-verdi.

Løysing

Frå oppgåve d) har vi at vi må rekne ut sannsynet for at fråværet er på minst 10 %, eller minst 50 elevar. Matematisk skriv vi at vi ønsker å finne PX50. Vi bruker sannsynskalkulatoren i GeoGebra med binomisk fordeling. Sidan det totalt er 500 elevar, har vi at n=500. Frå nullhypotesen H0 har vi at p=0,08.

Testen sin P-verdi er 0,062 2.

h) Rektor bruker eit signifikansnivå på 0,05. Kva betyr det for utfallet av hypotesetesten?

Løysing

Det betyr at dersom testen sin P-verdi er mindre enn 0,05, så forkastar rektor nullhypotesen H0. Det er han ikkje, derfor kan ikkje rektor seie ut ifrå denne testen at fråværet på skulen har auka.

Sagt med andre ord: Det er 6,22 % sjanse for at fråværet på skulen er 10 % eller større. Det er for stort sannsyn for at dette skal skje når fråværet normalt er på 8 % ut ifrå at signifikansnivået skal vere på 5 %, til at vi kan forkaste nullhypotesen. Rektor konkluderer med at det originale sannsynet er gjeldande.

4.3.2

a) P-verdien i ein test med ein nullhypotese H0 og ein alternativ hypotese H1 er 0,04. Signifikansnivået er 0,02. Forkastar vi H0?

Løysing

Sidan P-verdien er større enn signifikansnivået, kan vi ikkje forkaste nullhypotesen.

b) P-verdien i ein test med ein nullhypotese H0 og ein alternativ hypotese H1 er 0,04. Signifikansnivået er 0,05. Forkastar vi H0?

Løysing

Sidan P-verdien er mindre enn signifikansnivået, forkastar vi nullhypotesen.

4.3.3

Maren har 5 vanlege terningar som ho bruker til ulike spel. Over lengre tid har ho hatt ein mistanke om at éin eller fleire av terningane gir seksar for ofte. Ho vil undersøke dette nærmare ved å bruke hypotesetesting med eit signifikansnivå på 5 %.

a) Set opp ein nullhypotese H0 og ein alternativ hypotese H1 for situasjonen ovanfor.

Løysing

Nullhypotesen er at terningen er i orden. Dette gir følgande:

H0: Sannsynet for å få ein seksar ved å kaste terningen er 16, det vil seie at p=16.

H1: Sannsynet for å få ein seksar ved å kaste terningen er større enn 16, det vil seie at p>16.

Kvar av terningane blir kasta 1 200 gonger. La X vere talet på seksarar i dei 1 200 kasta. Maren får følgande resultat:

Resultat av terningkast

Terning nr.

12345

Tal på seksarar

208195225185220

b) Vurder om ho kan karakterisere éin eller fleire av terningane som "jukseterning". Bruk binomisk sannsynsfordeling. Løys oppgåva ved hjelp av GeoGebra.

Løysing

Dette er fem binomiske situasjonar der alle har p=16 og n=1 200.

Vi bruker sannsynskalkulatoren i GeoGebra. Terning 1:

Testen sin P-verdi er 0,279. Dette resultatet betyr at ved å kaste ein terning som det ikkje er noko gale med, 1 200 gonger, vil det i 27,9 % av tilfella bli 208 eller fleire seksarar. Med eit signifikansnivå på 5 % gir dette ikkje noko grunnlag for å forkaste H0 for denne terningen – det er altfor sannsynleg at det skal bli 208 eller fleire seksarar i dette forsøket.

Ved å gjere likeins med dei andre terningane får vi følgande resultat:

P-verdi for terningane med binomisk modell

Terning nr.

12345

P-verdi

0,2790,6620,0300,8860,067

Det er berre for terning nummer 3 vi får ein P-verdi som er mindre enn signifikansnivået. Sannsynet for å få 225 eller fleire seksarar er berre 0,030, så resultatet med terning 3 er lite sannsynleg. Ut frå signifikansnivået kan vi dermed forkaste nullhypotesen her og konkludere med at Maren har ein "jukseterning", terning nummer 3.

c) Kor mange seksarar må eit slikt forsøk med 1 200 terningkast gi for å ligge akkurat på grensa til at vi kan forkaste nullhypotesen?

Løysing

Vi skriv inn 0,05 på høgre side i kalkulatoren.

Dersom resultatet med ein terning er 221 seksarar, er vi akkurat på grensa til at vi kan forkaste nullhypotesen for denne terningen.

d) Er det greitt å løyse oppgåve b) ved å gå ut frå at den stokastiske variabelen X er normalfordelt? Gjer i så fall dette.

Løysing

Vi sjekkar om normaltilnærming kan brukast, det vil seie at både forventningsverdien, np, og n1-p er større enn 10.

μ=np=1 200·16=200

n1-p=1 200·56=1 000

Det betyr at krava er innfridde. For å bruke sannsynskalkulatoren i GeoGebra med normalfordeling må vi rekne ut standardavviket σ.

Standardavvik: σ=np1-p=200·56=166,7

Vi set inn resultatet for terning nummer 1.

Sannsynet for å få 208 eller fleire seksarar er 0,268, testen sin P-verdi. Dette er nokså nært det vi fekk ved å bruke ein binomisk modell. Som i den binomiske modellen får vi at P-verdien er mykje høgare enn signifikansnivået, så vi kan ikkje forkaste nullhypotesen.

Ved å gjere det same for dei andre terningane får vi dette resultatet:

P-verdi for terningane med normalfordeling

Terning nr.

12345

P-verdi

0,2680,6510,0260,8770,061

Alle P-verdiane er omtrent som ved bruk av binomisk modell, men ligg litt under. Vi kjem til den same konklusjonen: På grunn av resultatet for terning nummer 3 må vi forkaste nullhypotesen og seie at terning nummer 3 er ein "jukseterning".

e) Kor mange seksarar må eit slikt forsøk med 1 200 terningkast gi for å ligge akkurat på grensa til at vi kan forkaste nullhypotesen når vi bruker normalfordeling?

Løysing

Vi skriv inn 0,05 på høgre side i kalkulatoren.

Dette betyr at dersom resultatet med ein terning er 222 seksarar, må vi forkaste nullhypotesen for denne terningen. Dette er eitt kast meir enn resultatet vi fekk ved å bruke binomisk fordeling, så det er ikkje avgjerande kva for ei av dei to fordelingane vi bruker.

Ein slik hypotesetest vil uansett innehalde ei viss usikkerheit, og P-verdiar heilt i nærleiken av signifikansnivået bør i det verkelege liv innebere at ein utvidar forsøket slik at ein kan vere tryggare på å ta rett avgjerd.

f) Løys oppgåve b) og c) ved å bruke programmering.

Løysing

Vi bruker funksjonen "pmf()" frå modulen "binom" i biblioteket "scipy.stats". Funksjonen gir sannsynsfordelinga innanfor det området vi spesifiserer.

python
1from scipy.stats import binom
2
3p = 1/6
4n = 1200
5X = list(range(n+1))
6signifikans = 0.05
7
8resultat = [208,195, 225, 185, 220]
9
10fordeling = binom.pmf(X,n,p)
11
12for i in range(len(resultat)):
13    P = fordeling[resultat[i]:] #Dette hentar ut fordelinga frå og med talet i resultat[i].
14    Pverdi = sum(P)
15    print(f'Sannsynet er {Pverdi:.3f} for å få {resultat[i]} seksarar med ein rettferdig terning.')
16    if Pverdi <signifikans:
17        print(f'Vi kan forkaste nullhypotesen for terning nummer {i+1}.')
18    
19while 1-sum(fordeling[:n]) < signifikans:
20    n = n-1
21print(f'Grensa for å forkaste nullhypotesen er når resultatet er {n} seksarar.')

Programmet skriv ut:

"Sannsynet er 0.279 for å få 208 seksarar med ein rettferdig terning.

Sannsynet er 0.662 for å få 195 seksarar med ein rettferdig terning.

Sannsynet er 0.030 for å få 225 seksarar med ein rettferdig terning.

Vi kan forkaste nullhypotesen for terning nummer 3.

Sannsynet er 0.886 for å få 185 seksarar med ein rettferdig terning.

Sannsynet er 0.067 for å få 220 seksarar med ein rettferdig terning.

Grensa for å forkaste nullhypotesen er når resultatet er 221 seksarar."

Alternativ løysing: Vi kan bruke funksjonen "cdf()", som gir det kumulative binomiske sannsynet. Då må vi hugse at vi er interesserte i det motsette sannsynet av den kumulative.

python
1from scipy.stats import binom
2
3p = 1/6
4n = 1200
5signifikans = 0.05
6
7resultat = [208,195, 225, 185, 220]
8
9for i in range(len(resultat)):
10    Pverdi = 1-binom.cdf(resultat[i]-1,n,p)
11    print(f'Sannsynet er {Pverdi:.3f} for å få {resultat[i]} seksarar med ein rettferdig terning.')
12    if Pverdi <signifikans:
13        print(f'Terning nummer {i+1} må forkastast.')
14X = n  
15while 1-binom.cdf(X,n,p) < signifikans:
16    X = X-1
17print(f'Grensa for å forkaste nullhypotesen er når resultatet er {X+1} seksarar.')

Programmet gir den same utskrifta som det første.

4.3.4

(Oppgåve 5 del 2 eksamen S2 våren 2012)

PISA er ei internasjonal undersøking som blir gjennomført kvart tredje år blant skuleelevar i ei rekke land. Ved undersøkinga i 2009 var det med 4 700 elevar frå Noreg. I naturfag skåra dei norske elevane 500 poeng i gjennomsnitt. Det var nøyaktig likt det internasjonale gjennomsnittet. Standardavviket for norske elevar var 90 poeng.

Vi trekker tilfeldig ut ein elev blant dei norske deltakarane. I oppgåvene a) og b) kan du rekne med at poengsummen til eleven er normalfordelt med forventningsverdi på 500 poeng og standardavvik lik 90 poeng.

a) Bestem sannsynet for at eleven skåra minst 650 poeng.

Løysing

Vi bruker sannsynskalkulatoren i GeoGebra og vel normalfordeling. Vi set forventningsverdien μ=500 og standardavviket σ=90. Så vel vi høgresidig sannsyn med 650 poeng som nedre grense.

Sannsynet for at eleven skåra minst 650 poeng, er 4,78 %.

Vi kan òg løyse med Python:

python
1from scipy.stats import norm
2
3P = 1-norm.cdf(650,500,90)
4print(f'Sannsynet for at eleven skåra minst 650 poeng, er {P:.4f}.')

Utskrifta blir:

"Sannsynet for at eleven skåra minst 650 poeng, er 0.0478."

b) Bestem sannsynet for at eleven skåra mellom 475 og 535 poeng.

Løysing

Vi vel no intervall i sannsynskalkulatoren og set inn nedre og øvre grense i poengintervallet.

Sannsynet for at eleven skåra mellom 475 og 535 poeng, er 26,1 %.

Alternativ med Python:

python
1from scipy.stats import norm
2
3P = norm.cdf(535,500,90)-norm.cdf(475,500,90)
4print(f'Sannsynet for at eleven skåra mellom 475 og 535 poeng, er {P:.4f}.')

I verkelegheita kjenner vi ikkje den forventa poengsummen for norske elevar. Vi veit berre at gjennomsnittet var 500 poeng for dei 4 700 elevane som var med i undersøkinga.

c) Er det grunnlag for å seie at norske elevar var betre enn elevar frå land som skåra 495 poeng? Vel signifikansnivå sjølv.

Løysing

Vi må setje opp hypotesar.

Nullhypotese: Norske elevar var like gode som elevar frå land som skåra 495 poeng.

Alternativ hypotese: Norske elevar var betre enn elevar frå land som skåra 495 poeng.

Matematisk skriv vi slik:

H0:μ=495

H1:μ>495

Vi vel eit signifikansnivå på 0,1 %. Vi bør vere rimeleg sikre før vi konkluderer med at vi er betre. Vi går altså ut frå at poengsummen til elevane er normalfordelt med forventningsverdi lik 495 poeng og med standardavvik på 90 poeng. Ifølge sentralgrensesetninga er gjennomsnittet for eit utval av 4 700 elevar normalfordelt med μ=495 og σ=904 700.

Vi finn så sannsynet for å få eit gjennomsnitt på 500 i eit slikt utval:

python
1from scipy.stats import norm  #importerer normalfordelingsfunksjonen
2import numpy as np
3                               
4my = 495
5sigma = 90/(np.sqrt(4700))
6snitt = 500
7
8print(f"P(X > {snitt}) = {1-norm.cdf(snitt, my, sigma):.4f}")

Utskrifta gir: P(X > 500) = 0.0001

P-verdien på 0,01 % er mindre enn signifikansnivået på 0,1 % og gir dermed grunnlag for å forkaste nullhypotesen. Det er derfor grunn til å seie at norske elevar er betre enn elevar frå land som skåra 495 poeng.

4.3.5

(Basert på oppgåve 4 del 2 eksamen S2 våren 2010)

Ein grossist som sel jordbær, har over tid registrert at 10 % av jordbærkassane inneheld bær som er øydelagde. Ein dag tek grossisten imot 50 kassar. Vi går ut frå at 10 % av kassane inneheld bær som er øydelagde.

a) Kva er sannsynet for at akkurat 5 av kassane har øydelagde bær?

Løysing

Vi lar X vere talet på kassar med øydelagde bær og går ut frå at X er binomisk fordelt med p=0,1. Vi har at n=50.

Sannsynet for at akkurat 5 av 50 kassar har øydelagde bær, blir som følger:

Det er 18,5 % sannsyn for at akkurat 5 av de 50 kassane med jordbær inneheld øydelagde bær.

b) Finn sannsynet for at minst 5 kassar inneheld øydelagde bær.

Løysing

Sannsynet for at minst 5 kassar inneheld øydelagde bær, er 0,57.

Grossisten får mistanke om at meir enn 10 % av kassane inneheld øydelagde bær. For å undersøke forholdet nærare kontrollerer han 90 kassar. Ved denne kontrollen viser det seg at 15 av dei 90 kassane inneheld bær som er øydelagde.

Vi lar p vere sannsynet for at ein tilfeldig vald kasse inneheld øydelagde bær.

c) Set opp ein nullhypotese og ein alternativ hypotese som passar til denne problemstillinga. Forklar korleis du har tenkt.

Løysing

Kontrollen grossisten gjer, viser at 1590=16=16,7 % av kassane inneheld øydelagde bær. Vi skal undersøke om denne kontrollen gir grunnlag for å seie at det generelt er meir enn 10 % av jordbærkassane som inneheld øydelagde bær. Det kan jo vere tilfeldig at det akkurat var så mange som 15 av de 90 kontrollerte kassane som inneheldt øydelagde bær.

Vi set opp ein nullhypotese H0 der vi går ut frå at prosentandelen på 10 % gjeld, og ein alternativ hypotese H1 der vi går ut frå at prosentandelen har auka.

H0: Andelen jordbærkassar med øydelagde bær er 10 %, det vil seie p=0,1.

H1: Andelen jordbærkassar med øydelagde bær er meir enn 10 %, det vil seie p>0,1.

d) Undersøk om resultatet av kontrollen gir grunnlag for å seie at kvaliteten på jordbæra har blitt dårlegare. Vel eit signifikansnivå på 5 %.

Løysing

Eit signifikansnivå på 5 % seier at dersom vi forkastar nullhypotesen, er det 5 % sjanse for at vi gjer det på feil grunnlag.

Vi bruker binomisk fordeling i GeoGebra og finn sannsynet for at minst 15 av dei 90 kassane inneheld øydelagde bær når p=0,1. Sidan vi har totalt 90 kassar, er n=90.

Testen sin P-verdi er 0,0333. Det betyr at det er 3,3 % sannsyn for at 15 kassar eller fleire i ein stikkprøve på 90 kassar heilt tilfeldig vil innehalde øydelagde bær når p=0,1. Vi sette eit signifikansnivå på 5 %. Det betyr at vi forkastar nullhypotesen H0 og godtek den alternative hypotesen H1. Kvaliteten på jordbæra har blitt dårlegare.

e) Kor mange kassar med øydelagde bær må det minst vere for at vi skal forkaste nullhypotesen?

Løysing

Vi må finne ut kva for verdi den stokastiske variabelen X har når P-verdien er lik signifikansnivået på 0,05. Vi skriv inn 0,05 til høgre for likskapsteiknet i sannsynskalkulatoren.

Resultatet er at når signifikansnivået er 0,05, må minst 14 kassar innehalde øydelagde bær for at vi skal forkaste nullhypotesen, det vil seie for at vi skal kunne seie at jordbæra har blitt dårlegare.

4.3.6

(Basert på oppgåve 6 del 2 eksamen S2 våren 2009)

a) Leiinga i eit fylke ønsker å auke andelen seksarar til eksamen. Tidlegare har i gjennomsnitt 4,3 % av eksamenskarakterane vore seksarar. Etter ei omlegging av undervisningsmetodane viste ein stikkprøve at 29 av 500 eksamenskarakterane var seksarar. Fylkesleiinga og elevorganisasjonen var ueinige i om det gode resultatet var på grunn av omlegginga av undervisningsmetodane eller om det var tilfeldig.

Bruk kunnskapane dine i statistikk og sannsynsrekning, og undersøk spørsmålet nærare. Gjer greie for kva metodar du bruker, og kva føresetnader du legg til grunn.

Løysing

Vi vil sjekke om det gode eksamensresultatet var tilfeldig, eller om det vart slik på grunn av ei omlegging av undervisningsmetodane. Vi set opp ein nullhypotese H0 som seier at vi ikkje kan gå ut frå at dei nye undervisningsmetodane har hatt innverknad på talet på seksarar, og ein alternativ hypotese H1 som seier at dei nye undervisningsmetodane har hatt innverknad på talet på seksarar.

H0: Andelen seksarar til eksamen er p=0,043.

H1: Andelen seksarar til eksamen er p>0,043.

Vi lar X vere talet på eksamensresultat av dei 500 resultata i stikkprøven som er seksarar. Vi går ut frå at X er binomisk fordelt med p=0,043 og n=500.

I stikkprøven ovanfor var 29 av 500 eksamenskarakterane seksarar, det vil seie 5,8 %. Vi skal finne ut om dette resultatet gir grunnlag til å forkaste nullhypotesen. 5,8 % er høgare enn 4,3 %, som tidlegare har vore prosentandelen med seksarar. Er dette tilfeldig, eller kan vi med rimeleg sikkerheit seie at dei nye undervisningsmetodane har gitt utteljing? Vi vel eit signifikansnivå på 5 % og bruker binomisk fordeling i GeoGebra.

Vi finn at det er 6,6 % sannsyn for at 29 eksamenskarakterar eller fleire i ein stikkprøve på 500 eksamenskarakterar vil vere seksarar, sjølv om den verkelege prosentandelen seksarar ikkje hadde auka.

Vi sette eit signifikansnivå på 5 %. Det betyr at vi ikkje forkastar nullhypotesen.

b) I eit anna fylke var 31 av 500 eksamenskarakterar seksarar. Dette var akkurat på grensa til å forkaste ein nullhypotese om at andelen seksarar er uforandra når signifikansnivået er 0,05.

Kor mange elevar er det vanlegvis som får seksar på eksamen i dette fylket?

Tips til oppgåva

Bruk programmering til å løyse oppgåva. La programmet rekne ut P-verdien for aukande verdiar for p (den vanlege andelen seksarar). Kontroller svaret med sannsynskalkulatoren i GeoGebra.

Løysing

Vi set p, den vanlege andelen seksarar, til ein veldig låg verdi i første omgang (0,000 1) og lar programmet rekne ut P(X31), det vil seie testen sin P-verdi, med stadig større og større verdiar for p inntil P-verdien blir like stor som signifikansnivået. Den verdien p har då, vil tilsvare den andelen seksarar det vanlegvis er på eksamen, og vi kan rekne ut kor mange elevar dette tilsvarer ved å rekne ut n·p.

Forslag til kode:

python
1from scipy.stats import binom
2n = 500
3X = 31
4signifikans = 0.05
5p = 0.0001
6trinn = 0.00001
7P_verdi = 0
8while P_verdi < signifikans:
9    P_verdi = 1 - binom.cdf(X - 1, n, p)
10    p = p + trinn
11antal_seksarar = (p + trinn)*n
12print(f"Talet på elevar som vanlegvis får seksar på eksamen, er {antal_seksarar:.0f}.")

Programmet gir denne utskrifta:

"Talet på elevar som vanlegvis får seksar på eksamen, er 23."

Dersom vi set p=23500 i sannsynskalkulatoren til GeoGebra, får vi at P(X31)=0,059 5, noko som er litt høgare enn 0,05. Dersom vi prøver med p=22500, får vi at P(X31)=0,037. Sidan vi kjem nærast signifikansnivået på 0,05 når p=23500, stemmer det med det vi fekk frå programmet.

Skrive av Bjarne Skurdal, Olav Kristensen, Stein Aanensen og Utdanningsdirektoratet.
Sist fagleg oppdatert 09.02.2024