Sentralgrensesetningen
Hva er sentralgrensesetningen?
Sentralgrensesetningen forteller oss at selv om en variabel ikke er normalfordelt i utgangspunktet, kan vi likevel bruke normalfordeling til å tilnærme sannsynlighetsfordelingen til . Vi anbefaler at du gjør oppgave 4.2.21 på oppgavesiden om sentralgrensesetningen før du leser videre, fordi det er en oppgave der du får utforske denne sammenhengen.
Sentralgrensesetningen sier at dersom vi gjør tilstrekkelig mange forsøk, vil sannsynlighetsfordelingen til alle stokastiske variabler kunne tilnærmes med en normalfordeling.
Matematisk kan vi formulere det slik:
Vi har en stokastisk variabel med forventningsverdi og standardavvik . La være summen av uavhengige forsøk med . For store verdier av er tilnærmet normalfordelt.
Forventningsverdien til er og standardavviket er .
Vi illustrerer med et eksempel:
Vi ser på den stokastiske variabelen som antall øyne ved kast av én terning. I tabellen nedenfor har vi regnet ut forventningsverdien og variansen til .
1 | 2 | 3 | 4 | 5 | 6 | Sum | |
|---|---|---|---|---|---|---|---|
| 0,167 | 0,167 | 0,167 | 0,167 | 0,167 | 0,167 | 1,000 |
0,167 | 0,333 | 0,500 | 0,667 | 0,833 | 1,000 | 3,500 | |
1,042 | 0,375 | 0,042 | 0,042 | 0,375 | 1,042 | 2,917 |
Vi ser at vi har og . La være summen av antall øyne ved kast av hundre terninger.
Da kan vi bruke sentralgrensesetningen. Sentralgrensesetningen sier at da er normalfordelt med forventningsverdi og standardavvik
I oppgavene skal du få simulere dette forsøket og sjekke om du får praksis til å stemme med teorien.
Gjennomsnittet i en normalfordeling
I artikkelen om normalfordelingen undersøkte vi høyden til 500 håndballspillere. Vi lot den stokastiske variabelen være høyden til en tilfeldig valgt håndballspiller.
🤔 Tenk over: Hva skjer om vi måler høyden til bare noen av disse håndballspillerne? Hva vil skje med forventningsverdien og standardavviket i dette utvalget?
Vi kan formulere denne sammenhengen slik:
La være en normalfordelt variabel med forventningsverdi og standardavvik .
Hvis vi trekker ut et utvalg av størrelse fra denne fordelingen, vil gjennomsnittet, , selv være en normalfordelt variabel. Denne variabelen vil ha
🤔 Tenk over: Hvordan henger formelen for standardavviket til gjennomsnittet sammen med standardavviket til et multiplum av stokastiske variabler?
Tilnærming av binomiske forsøk med normalfordeling
I oppgave 4.2.21 så du at hvis vi gjorde flere og flere forsøk i en binomisk fordeling, ville fordelingen nærme seg normalfordelt. I teksten over har vi skrevet: "For store verdier av er tilnærmet normalfordelt". Men hvor stor må være for at vi skal kunne bruke normalfordelingen som tilnærming? Det er dessverre ikke noe fast svar på det i alle tilfeller, men når det gjelder binomiske forsøk, har man kommet fram til følgende sammenheng:
La være antall suksesser i ei binomisk forsøksrekke med uavhengige delforsøk, hvert med sannsynlighet p for "suksess".
Da er tilnærmet normalfordelt hvis
Denne normalfordelingen vil da ha samme forventningsverdi og standardavvik som den tilsvarende binomiske sannsynlighetsfordelingen, det vil si:
Dette blir vist i oppgave 4.2.21 i).
Oppsummering
La være en stokastisk variabel med og .
La
Hvis er tilstrekkelig stor, sier sentralgrensesetningen at er tilnærmet normalfordelt, med
I tillegg har vi at gjennomsnittet, , av et utvalg av størrelse selv er en tilnærmet normalfordelt variabel, med