Fagstoff

Sentralgrensesetninga

Ikkje alle variablar er normalfordelte, men dersom vi gjennomfører mange nok forsøk, vil vi sjå at normalfordelinga i dei fleste tilfelle kan brukast til å rekne ut eit tilnærma sannsyn for at noko skal skje. Dette skal vi sjå nærmare på i denne artikkelen.

Kva er sentralgrensesetninga?

Sentralgrensesetninga fortel oss at sjølv om ein variabel $X$ ikkje er normalfordelt i utgangspunktet, kan vi likevel bruke normalfordeling til å tilnærme sannsynsfordelinga til $X$ . Vi tilrår at du gjer oppgåve 1 på oppgåvesida om sentralgrensesetninga før du les vidare, fordi det er ei oppgåve der du får utforske denne samanhengen.

Sentralgrensesetninga seier at dersom vi gjer tilstrekkeleg mange forsøk, vil sannsynsfordelinga til alle stokastiske variablar kunne tilnærmast med ei normalfordeling.

Matematisk kan vi formulere det slik:

Vi har ein stokastisk variabel $X$ med forventningsverdi $μ$ og standardavvik $σ$ . La $\sum_{n} X$ vere summen av $n$ uavhengige forsøk med $X$ . For store verdiar av $n$ er $\sum_{n} X$ tilnærma normalfordelt.

Forventningsverdien til $\sum_{n} X$ er $n \cdot μ$ og standardavviket er $\sqrt{n} \cdot σ$ .

Vi illustrerer med eit døme:

Vi ser på den stokastiske variabelen $X$ som talet på auge ved kast av éin terning. I tabellen nedanfor har vi rekna ut forventningsverdien og variansen til $X$ .

kast med Éin terning
$x$	1	2	3	4	5	6	Sum
$P (X = x)$	0,167	0,167	0,167	0,167	0,167	0,167	1,000
$x \cdot P (X = x)$	0,167	0,333	0,500	0,667	0,833	1,000	3,500
$(x - μ)^{2} \cdot P (X = x)$	1,042	0,375	0,042	0,042	0,375	1,042	2,917

Vi ser at vi har $μ = 3, 5$ og $σ = \sqrt{2, 917}$ . La $S$ vere summen av talet på auge ved kast av hundre terningar.

$S = X_{1} + X_{2} + . . . + X_{100}$

Då kan vi bruke sentralgrensesetninga. Sentralgrensesetninga seier at $S$ då er normalfordelt med forventningsverdi og standardavvik

$\begin{array}{l} μ = 100 \cdot 3, 5 = 350 \\ σ = \sqrt{100} \cdot \sqrt{2, 917} = \sqrt{291, 7} \approx 17 \end{array}$

I oppgåvene skal du få simulere dette forsøket og sjekke om du får praksis til å stemme med teorien.

Gjennomsnittet i ei normalfordeling

I artikkelen om normalfordelinga undersøkte vi høgda til 500 handballspelarar. Vi let den stokastiske variabelen $Y$ vere høgda til ein tilfeldig vald handballspelar.

🤔 Tenk over: Kva skjer om vi måler høgda til berre nokre av desse handballspelarane? Kva trur du gjennomsnittet av desse høgdene vil bli?

Forklaring

Forventningsverdien til gjennomsnittet vil vere den same som i hovudutvalet. Sannsynet for at gjennomsnittet blir akkurat det same, er ikkje så veldig stor, og gjennomsnittet vil variere frå gong til gong dersom vi vel ut ulike grupper av spelarar.

Følgande gjeld for gjennomsnitt i eit utval frå ei normalfordeling:

La $X$ vere ein normalfordelt variabel med forventningsverdi $μ$ og standardavvik $σ$ .

Dersom vi trekker ut eit utval av storleik $n$ frå denne fordelinga, vil gjennomsnittet, $\bar{X}$ , sjølv vere ein normalfordelt variabel. Denne variabelen vil ha

$E (\bar{X}) = μ$

$S D (\bar{X}) = \frac{σ}{\sqrt{n}}$

🤔 Tenk over: Korleis heng formelen for standardavviket til gjennomsnittet saman med standardavviket til eit multiplum av stokastiske variablar?

Forklaring

Dersom vi i staden for å tenke på gjennomsnittet ser på summen, $S = X_{1} + X_{2} + . . . + X_{n}$ , av utvalet vi trekker ut, har vi samanhengen $S D (S) = \sqrt{n} \cdot σ$ . Dersom vi så dividerer dette standardavviket på $n$ , får vi

$S D (\bar{X}) = \frac{S D (S)}{n} = \frac{\sqrt{n} \cdot σ}{n} = \frac{σ}{\sqrt{n}}$

Tilnærming av binomiske forsøk med normalfordeling

I oppgåve 1 såg du at dersom vi gjorde fleire og fleire forsøk i ei binomisk fordeling, ville fordelinga nærme seg normalfordelt. I teksten over har vi skrive: "For store verdiar av $n$ er $\sum_{n} X$ tilnærma normalfordelt". Men kor stor må $n$ vere for at vi skal kunne bruke normalfordelinga som tilnærming? Det er dessverre ikkje noko fast svar på det i alle tilfelle, men når det gjeld binomiske forsøk, har ein komme fram til denne samanhengen:

La $X$ vere talet på suksessar i ei binomisk forsøksrekke med uavhengige delforsøk, kvart med sannsyn p for "suksess".

Då er $X$ tilnærma normalfordelt dersom

$n p > 10 og n \cdot (1 - p) > 10$

Denne normalfordelinga vil då ha same forventningsverdi og standardavvik som den tilsvarande binomiske sannsynsfordelinga, det vil seie:

$μ = n p og σ = \sqrt{n p (1 - p)}$

Dette blir vist i oppgåve 1 i).

Oppsummering

La $X$ vere ein stokastisk variabel med $E (X) = μ$ og $S D (X) = σ$ .

$S = \underset{n}{\sum X}$

Dersom $n$ er tilstrekkeleg stor, seier sentralgrensesetninga at $S$ er tilnærma normalfordelt, med

$\begin{array}{rcl} E (S) & = & n \cdot μ \\ S D (S) & = & \sqrt{n} \cdot σ \end{array}$

I tillegg har vi at gjennomsnittet, $\bar{X}$ , av eit utval av storleik $n$ sjølv er ein tilnærma normalfordelt variabel, med

$\begin{array}{rcl} E (\bar{X}) & = & μ \\ S D (\bar{X}) & = & \frac{σ}{\sqrt{n}} \end{array}$