Sentralgrensesetningen
Hva er sentralgrensesetningen?
Sentralgrensesetningen forteller oss at selv om en variabel ikke er normalfordelt i utgangspunktet, kan vi likevel bruke normalfordeling til å tilnærme sannsynlighetsfordelingen til
Sentralgrensesetningen sier at dersom vi gjør tilstrekkelig mange forsøk, vil sannsynlighetsfordelingen til alle stokastiske variabler kunne tilnærmes med en normalfordeling.
Matematisk kan vi formulere det slik:
Vi har en stokastisk variabel
Forventningsverdien til
Vi illustrerer med et eksempel:
Vi ser på den stokastiske variabelen
1 | 2 | 3 | 4 | 5 | 6 | Sum | |
---|---|---|---|---|---|---|---|
| 0,167 | 0,167 | 0,167 | 0,167 | 0,167 | 0,167 | 1,000 |
0,167 | 0,333 | 0,500 | 0,667 | 0,833 | 1,000 | 3,500 | |
1,042 | 0,375 | 0,042 | 0,042 | 0,375 | 1,042 | 2,917 |
Vi ser at vi har
Da kan vi bruke sentralgrensesetningen. Sentralgrensesetningen sier at
I oppgavene skal du få simulere dette forsøket og sjekke om du får praksis til å stemme med teorien.
Gjennomsnittet i en normalfordeling
I artikkelen om normalfordelingen undersøkte vi høyden til 500 håndballspillere. Vi lot den stokastiske variabelen
🤔 Tenk over: Hva skjer om vi måler høyden til bare noen av disse håndballspillerne? Hva vil skje med forventningsverdien og standardavviket i dette utvalget?
Forklaring
Forventningsverdien til gjennomsnittet vil være den samme som i hovedutvalget, uansett størrelse på utvalget. Men siden vi bare vil ha et utvalg, vil standardavviket bli mindre i de fleste mulige utvalgene. Vi kan trekke mange forskjellige kombinasjoner, og noen ganger vil gjennomsnittet og standardavviket være langt unna de opprinnelige verdiene.
Vi vil ikke gå i dybden på disse sammenhengene her, men vi vil oppgi formlene.
Vi kan formulere denne sammenhengen slik:
La
Hvis vi trekker ut et utvalg av størrelse
🤔 Tenk over: Hvordan henger formelen for standardavviket til gjennomsnittet sammen med standardavviket til et multiplum av stokastiske variabler?
Forklaring
Hvis vi i stedet for å tenke på gjennomsnittet ser på summen,
Tilnærming av binomiske forsøk med normalfordeling
I oppgave 4.2.21 så du at hvis vi gjorde flere og flere forsøk i en binomisk fordeling, ville fordelingen nærme seg normalfordelt. I teksten over har vi skrevet: "For store verdier av
La
Da er
Denne normalfordelingen vil da ha samme forventningsverdi og standardavvik som den tilsvarende binomiske sannsynlighetsfordelingen, det vil si:
Dette blir vist i oppgave 4.2.21 i).
Oppsummering
La
La
Hvis
I tillegg har vi at gjennomsnittet,