Sentralgrensesetninga
Kva er sentralgrensesetninga?
Sentralgrensesetninga fortel oss at sjølv om ein variabel ikkje er normalfordelt i utgangspunktet, kan vi likevel bruke normalfordeling til å tilnærme sannsynsfordelinga til . Vi tilrår at du gjer oppgåve 4.2.21 på oppgåvesida om sentralgrensesetninga før du les vidare, fordi det er ei oppgåve der du får utforske denne samanhengen.
Sentralgrensesetninga seier at dersom vi gjer tilstrekkeleg mange forsøk, vil sannsynsfordelinga til alle stokastiske variablar kunne tilnærmast med ei normalfordeling.
Matematisk kan vi formulere det slik:
Vi har ein stokastisk variabel med forventningsverdi og standardavvik . La vere summen av uavhengige forsøk med . For store verdiar av er tilnærma normalfordelt.
Forventningsverdien til er og standardavviket er .
Vi illustrerer med eit døme:
Vi ser på den stokastiske variabelen som talet på auge ved kast av éin terning. I tabellen nedanfor har vi rekna ut forventningsverdien og variansen til .
1 | 2 | 3 | 4 | 5 | 6 | Sum | |
|---|---|---|---|---|---|---|---|
| 0,167 | 0,167 | 0,167 | 0,167 | 0,167 | 0,167 | 1,000 |
0,167 | 0,333 | 0,500 | 0,667 | 0,833 | 1,000 | 3,500 | |
1,042 | 0,375 | 0,042 | 0,042 | 0,375 | 1,042 | 2,917 |
Vi ser at vi har og . La vere summen av talet på auge ved kast av hundre terningar.
Då kan vi bruke sentralgrensesetninga. Sentralgrensesetninga seier at då er normalfordelt med forventningsverdi og standardavvik
I oppgåvene skal du få simulere dette forsøket og sjekke om du får praksis til å stemme med teorien.
Gjennomsnittet i ei normalfordeling
I artikkelen om normalfordelinga undersøkte vi høgda til 500 handballspelarar. Vi let den stokastiske variabelen vere høgda til ein tilfeldig vald handballspelar.
🤔 Tenk over: Kva skjer om vi måler høgda til berre nokre av desse handballspelarane? Kva vil skje med forventningsverdien og standardavviket i dette utvalet?
Vi kan formulere denne samanhengen slik:
La vere ein normalfordelt variabel med forventningsverdi og standardavvik .
Dersom vi trekker ut eit utval av storleik frå denne fordelinga, vil gjennomsnittet, , sjølv vere ein normalfordelt variabel. Denne variabelen vil ha
🤔 Tenk over: Korleis heng formelen for standardavviket til gjennomsnittet saman med standardavviket til eit multiplum av stokastiske variablar?
Tilnærming av binomiske forsøk med normalfordeling
I oppgåve 4.2.21 såg du at dersom vi gjorde fleire og fleire forsøk i ei binomisk fordeling, ville fordelinga nærme seg normalfordelt. I teksten over har vi skrive: "For store verdiar av er tilnærma normalfordelt". Men kor stor må vere for at vi skal kunne bruke normalfordelinga som tilnærming? Det er dessverre ikkje noko fast svar på det i alle tilfelle, men når det gjeld binomiske forsøk, har ein komme fram til denne samanhengen:
La vere talet på suksessar i ei binomisk forsøksrekke med uavhengige delforsøk, kvart med sannsyn p for "suksess".
Då er tilnærma normalfordelt dersom
Denne normalfordelinga vil då ha same forventningsverdi og standardavvik som den tilsvarande binomiske sannsynsfordelinga, det vil seie:
Dette blir vist i oppgåve 4.2.21 i).
Oppsummering
La vere ein stokastisk variabel med og .
La
Dersom er tilstrekkeleg stor, seier sentralgrensesetninga at er tilnærma normalfordelt, med
I tillegg har vi at gjennomsnittet, , av eit utval av storleik sjølv er ein tilnærma normalfordelt variabel, med