Oppgåve

Sentralgrensesetninga

Her kan du jobbe med oppgåver om sentralgrensesetninga.

4.2.21

Utforsking!

To tikronestykke som viser myntsida til venstre og kronesida til
høgre. Foto. — Krone og mynt med eit tikronestykke. Mynten til høgre viser den sida vi kallar krone. Bilete: Anne Seland Skailand / CC BY-SA 4.0

a) Vi kastar to myntar. Vi speler eit spel der to kroner gir gevinst. Kva er sannsynet, $p$ , for å vinne i dette spelet? Kva er sannsynet for å ikkje vinne?

Løysing

Vi lar $X$ vere talet på kroner og får denne tabellen:

sannsynsfordeling myntkast
Tal på kroner (X)	0	1	2
Sannsyn	$\frac{1}{4}$	$\frac{1}{2}$	$\frac{1}{4}$

Dette gir

$P (t o k r o n e r) = \frac{1}{4}$

$P (i k k j e t o k r o n e r) = 1 - \frac{1}{4} = \frac{3}{4}$

b) Finn forventningsverdien og standardavviket for dette spelet.

Løysing

Vi kan sjå på dette som eit binomisk forsøk med $n = 1$ og $p = \frac{1}{4}$ . Dette gir

$μ = n \cdot p = 1 \cdot \frac{1}{4} = \frac{1}{4}$

$σ = \sqrt{n \cdot p \cdot (1 - p)} = \sqrt{\frac{1}{4} \cdot \frac{3}{4}} = \sqrt{\frac{3}{16}} = \frac{\sqrt{3}}{4} \approx 0, 43$

c) Vi utfører no myntkastet vårt fem gonger, altså kastar vi to myntar fem gonger etter kvarandre. Vi lar $Y$ vere talet på gonger vi får to kroner. Forklar at vi kan sjå på dette som eit binomisk forsøk med $n = 5$ og $p = \frac{1}{4}$ . Finn forventningsverdien $E (Y)$ og standardavviket $S D (Y)$

Løysing

Vi har her eit binomisk forsøk fordi vi har $n$ uavhengige forsøk med likt sannsyn, der vi anten kan få to kroner eller ikkje få to kroner. Fem kast med myntane gir $n = 5$ ,og fra b) får vi at $p = \frac{1}{4} = 0, 25$ .

$\begin{array}{rcl} E (Y) = n p = 5 \cdot 0, 25 = 1, 25 \\ S D (Y) = \sqrt{n p (1 - p)} = \sqrt{5 \cdot \frac{1}{4} \cdot \frac{3}{4}} = \sqrt{\frac{15}{16}} = \frac{\sqrt{15}}{4} \approx 0, 97 \end{array}$

d) Lag eit program som skriv ut sannsynsfordelinga til $Y$ .

Løysing

python

1import numpy as np
2from scipy.stats import binom
3
4n = 5
5p = 0.25
6Y = np.arange(0,n+1)       #lagar ei liste med verdiane til den stokastiske variabelen Y
7
8tokroner = binom.pmf(Y,n,p)  #lagar ein array med sannsynsfordelinga
9
10print("y","P(Y=y)")       #lagar overskrifter til sannsynsfordelinga
11
12antal = 0
13for i in tokroner:
14    print(antal,i)                 #skriv sannsynsfordelinga i ein kolonne
15    antal = antal + 1

e) Endre programmet i d) slik at det teiknar eit søylediagram over sannsyna i staden for å skrive ut tabellen.

Tips til koden

Kommandoen bar(X,sannsyn) frå biblioteket matplotlib.pyplot vil lage eit søylediagram. Du kan òg setje inn breidda du ønsker på søylene, og legge inn edgecolor = "black".

Løysing

python

1import numpy as np
2from scipy.stats import binom
3import matplotlib.pyplot as plt
4
5n = 5
6p = 0.25
7Y = np.arange(0,n+1)        #lagar ei liste med verdiane til den stokastiske variabelen Y
8
9tokroner = binom.pmf(Y,n,p) #lagar ein array med sannsynsfordelinga
10
11plt.bar(Y,tokroner,1,edgecolor="black") #lagar eit søylediagram med breidde 1, 
12                                        #slik at søylene ligg inntil kvarandre
13plt.show()

f) Endre nå talet på forsøk først til 10, så til 50 og til slutt til 500. Kva observerer du når du ser på forma til søylediagrammet?

Løysing

Vi kan observere at jo fleire gonger vi kastar to myntar, jo meir vil sannsynet for å få to kroner fordele seg symmetrisk om forventningsverdien.

g) Finn forventningsverdi og standardavvik i dei tre fordelingane i f).

Løysing

Vi har tre forsøk med $n$ lik høvesvis 10, 50 og 500.

Det vil seie at vi får

$n = 10$ :

$\begin{array}{rcl} E (Y) & = & n p = 10 \cdot 0, 25 = 2, 5 \\ S T (Y) & = & \sqrt{n p (1 - p)} = \sqrt{10 \cdot \frac{1}{4} \cdot \frac{3}{4}} = \sqrt{\frac{30}{16}} = \frac{\sqrt{30}}{4} \approx 1, 37 \end{array}$

$n = 50$ :

$\begin{array}{rcl} E (Y) & = & n p = 50 \cdot 0, 25 = 12, 5 \\ S T (Y) & = & \sqrt{n p (1 - p)} = \sqrt{50 \cdot \frac{1}{4} \cdot \frac{3}{4}} = \sqrt{\frac{150}{16}} = \frac{\sqrt{150}}{4} \approx 3, 06 \end{array}$

$n = 500$ :

$\begin{array}{rcl} E (Y) & = & n p = 500 \cdot 0, 25 = 125 \\ S T (Y) & = & \sqrt{n p (1 - p)} = \sqrt{500 \cdot \frac{1}{4} \cdot \frac{3}{4}} = \sqrt{\frac{1500}{16}} = \frac{\sqrt{1500}}{4} \approx 9, 68 \end{array}$

h) Utvid programmet i d) slik at du teiknar grafen til ein normalfordelt variabel med $μ = n p$ og $σ = \sqrt{n p (1 - p)}$ . Køyr programmet med $n = 5$ , $n = 10$ , $n = 50$ og $n = 500$ . Kommenter resultatet.

Løysing

python

1import numpy as np
2from scipy.stats import binom, norm
3import matplotlib.pyplot as plt
4
5n = 5
6p = 0.25
7Y = np.arange(0,n+1)       #lagar ei liste med verdiane til den stokastiske variabelen Y
8
9tokroner = binom.pmf(Y,n,p) #lagar ein array med sannsynsfordelinga
10
11mu = n*p
12sigma = np.sqrt(n*p*(1-p))
13
14Y_2 = np.linspace(mu-3*sigma, mu+3*sigma,100)
15normalfordeling = norm.pdf(Y_2,mu,sigma)
16
17plt.bar(Y,tokroner,1,edgecolor = "black")
18plt.plot(Y_2,normalfordeling)
19plt.show()

Vi legg merke til at jo større $n$ blir, jo større blir samanfallet mellom den binomiske fordelinga og normalfordelinga.

i) Vi har ei binomisk fordeling der ein stokastisk variabel $X$ står for talet på suksessar i løpet av $n$ forsøk, der $S D = σ_{0}$ for kvart enkelt forsøk. Vis at $S D (X) = σ = \sqrt{n} \cdot σ_{0} = \sqrt{n p (1 - p)}$ .

Løysing

Vi har at for ei binomisk fordeling er $σ = \sqrt{n p (1 - p)}$ . Vi kan alltid sjå på eit enkeltforsøk i ei binomisk fordeling som ei binomisk fordeling i seg sjølv, med $n = 1$ . Då er standardavviket $σ_{0} = \sqrt{p \cdot (1 - p)}$ .

Vi har då at

$S D (X) = σ = \sqrt{n} \cdot σ_{0} = \sqrt{n} \cdot \sqrt{p (1 - p)} = \sqrt{n p (1 - p)}$

4.2.22

På teorisida bruker vi kast av mange terningar som døme. Her skal vi lage ei simulering der du kan teste ut om det stemmer at eit slikt forsøk kan tilnærmast med ei normalfordeling.

a) Lag eit program som simulerer kast med éin terning. La terningen bli kasta 10 000 gonger. Skriv ut summen av terningkasta.

Løysing

Forslag til program:

python

1from numpy.random import default_rng         # importerer default_rng
2rng = default_rng()                          # lagar ein rng (random number generator)
3
4N = 10000
5terning = rng.integers(1, 7, size = N)      # lagar ein array med N terningkast
6
7print(f'Summen av {N} terningkast er {sum(terning)}.')       # skriv ut summen

b) Utvid programmet frå a) slik at forsøket (altså å kaste terningen 10 000 gonger) blir utført 1 000 gonger. Finn gjennomsnittet og standardavviket i dei 1 000 forsøka. Bruk simuleringa til å berekne sannsynet for at summen av 10 000 terningkast er over 3 500.

Løysing

Forslag til program:

python

1import numpy as np
2rng = np.random.default_rng()                # lagar ein rng (random number generator)
3
4
5N = 10000                                    # talet på kast i kvart forsøk
6n = 1000                                     # talet på forsøk
7resultat = np.zeros(n)                       # ein array til resultata
8
9for i in range(n):
10    terning = rng.integers(1, 7, size = N)   # lagar ein array med N terningkast
11    resultat[i] = sum(terning)
12
13sanns = sum(resultat >= 35000)/n           # tel opp talet på resultat større enn eller
14                                           # lik 35000
15
16print(f'Gjennomsnittet er {np.mean(resultat):.1f}.')
17print(f'Standardavviket er {np.std(resultat):.1f}.')
18print(f'Sannsynet er {sanns:.2f}.')

c) Kommenter svara med bakgrunn i sentralgrensesetninga.

Løysing

Når vi køyrer programmet, ser vi at

gjennomsnittet av dei 1 000 forsøka blir veldig nært 35 000
sannsynet for at summen av eit tilfeldig forsøk er over 35 000, er nær 0,5
standardavviket er nær 170

Dette underbygger at vi kunne ha brukt ei normalfordeling til å tilnærme sannsyn for kast med 10 000 terningar. Denne normalfordelinga ville ha hatt

$μ = n \cdot 3, 5 = 10 000 \cdot 3, 5 = 35 000$

$σ = \sqrt{n} \cdot 1, 70 = \sqrt{10 000} \cdot 1, 70 = 100 \cdot 1, 70 = 170$

4.2.23

Svein dyrkar morellar. Vi lar $X$ vere vekta i gram til ein tilfeldig vald morell. Svein har funne ut at $X$ har forventningsverdien $μ = 10$ , og at standardavviket $σ = 1, 0$ . Vi lar $S$ vere samla vekt av 50 tilfeldig valde morellar.

a) Finn forventningsverdien $μ_{S}$ til $S$ . Forklar kva du har funne.

Løysing

Ifølge sentralgrensesetninga har vi at $μ_{S} = n \cdot μ = 50 \cdot 10 = 500$ . Dette betyr at forventa vekt til 50 morellar er 500 gram.

b) Finn standardavviket $σ_{S}$ til $S$ .

Løysing

Vi bruker formelen for standardavvik gitt ved sentralgrensesetninga:

$σ_{S} = \sqrt{n} \cdot σ = \sqrt{50} \cdot 1 = 7, 07 \approx 7, 1$

c) Finn $P (S > 510)$ og forklar kva du har funne.

Løysing

Vi vel å bruke Python:

python

1from scipy.stats import norm
2
3Sannsynet = 1 - norm.cdf(510,500,7.1)
4print(f"Sannsynet for at 50 morellar veg meir enn 510 g, er {Sannsynet:.3f}.")

Utskrifta av programmet blir "Sannsynet for at 50 morellar veg meir enn 510 g, er 0,079."

d) Finn $P (S < 490)$ og $P (490 < S < 510)$ utan å bruke noko anna enn svaret i c).

Løysing

Sidan ei normalfordeling er symmetrisk om forventningsverdien, veit vi at

$P (X < 490) = P (X > 510) = 0, 079$

Det siste sannsynet finn vi ved

$\begin{array}{rcl} P (490 < X < 510) & = & 1 - P (X < 490) - P (X > 510) \\ = & 1 - 2 \cdot 0, 079 = 0, 842 \end{array}$

e) Svein sel korger med 500 gram morellar. Han veg ikkje alle korgene, men sjekkar 10 korger med 50 morellar kvar dag. Kva er forventningsverdien og standardavviket til gjennomsnittet av desse ti korgene?

Løysing

Vekta til ei korg morellar er det same som variabelen $S$ . Vi kan sjå på dette som at vi trekk ut eit utval frå den normalfordelte variabelen $S$ , der $n = 10$ . Vi har då at

$\begin{array}{rcl} E (\bar{S}) & = & μ_{S} = 500 \\ S D (\bar{S}) & = & \frac{σ_{S}}{\sqrt{n}} = \frac{7, 1}{\sqrt{10}} = 2, 24 \approx 2, 2 \end{array}$

4.2.24

Våren 2023 var det 2 957 elevar som avla skriftleg eksamen i matematikk R1. Av desse var det 4,8 % som strauk. Vi trekker ut 300 elevar heilt tilfeldig.

a) Forklar at vi kan sjå på desse 300 som binomiske forsøk med $p = 0, 048$ .

Løysing

1) Vi har to moglege utfall, stryk eller ikkje stryk.

2) Vi kan seie at det er likt sannsyn for stryk for kvar elev, sidan vi trekker ut så få av det totale talet.

3) Vi kan seie at forsøka er uavhengige av kvarandre, av same grunn som i punkt 2.

b) Finn sannsynet for at meir enn 15 av desse tilfeldige elevane strauk på eksamen ved hjelp av ein binomisk sannsynsmodell.

Løysing

Vi vel igjen å løyse i Python (men hugs at GeoGebra òg er eit godt verktøy her).

python

1import numpy as np
2from scipy.stats import binom
3
4n = 300
5p = 0.048
6X = np.arange(16,n+1)     # lagar ein array med tala [16,300]
7
8stryk = binom.pmf(X,n,p)  # får ein array med dei tilhøyrande sannsyna
9
10print(f'Sannsynet for at fleire enn 15 stryk, er {sum(stryk):.3f}.')  
11                          # skriv ut sannsynet

Utskrifta blir "Sannsynet for at fleire enn 15 stryk, er 0.369.".

c) Bruk normalfordelinga som tilnærming og rekn ut sannsynet for at meir enn 15 av elevane strauk. Samanlikn med svaret i b) og kommenter.

Løysing

Først sjekkar vi at vi kan bruke normalfordelinga som tilnærming:

$\begin{array}{rcl} n p & = & 300 \cdot 0, 048 = 14, 4 > 10 \\ n (1 - p) & = & 300 \cdot 0, 952 = 285, 6 > 10 \end{array}$

Vi får då følgande forventningsverdi og standardavvik:

$\begin{array}{rcl} μ & = & n p = 14, 4 \\ σ & = & \sqrt{n p (1 - p)} = \sqrt{14, 4 \cdot 0, 952} = 3, 70 \end{array}$

Vi løyser i Python ved å utvide programmet frå b) (her lar vi Python rekne ut $μ$ og $σ$ ):

python

1import numpy as np
2from scipy.stats import binom, norm
3
4n = 300
5p = 0.048
6X = np.arange(16,n+1)     # lagar ein array med tala [16,300]
7
8strykbinom = binom.pmf(X,n,p)  # får ein array med dei tilhøyrande sannsyna
9
10my = n*p
11sigma = np.sqrt(n*p*(1-p)) # reknar ut my og sigma
12stryknormal = 1 - norm.cdf(16,my,sigma)   #finn sannsynet 
13                
14print(f'Sannsynet for at fleire enn 15 stryk, er ifølge binomisk fordeling {sum(strykbinom):.3f}.')   
15print(f'Sannsynet for at fleire enn 15 stryk, er ifølge normalfordeling {stryknormal:.3f}.')

Utskrifta blir:
"Sannsynet for at fleire enn 15 stryk, er ifølge binomisk fordeling 0.369.
Sannsynet for at fleire enn 15 stryk, er ifølge normalfordeling er 0.333."

Vi ser at dei ligg nokså nær kvarandre.

4.2.21

4.2.22

4.2.23

4.2.24

Reglar for bruk av teksten "Sentralgrensesetninga"