Hopp til innhald
Fagartikkel

Hypergeometrisk sannsynsmodell

Når vi skal trekkje eit utval frå ei mengde der elementa kan delast inn i grupper etter visse kriterium, får vi ei sannsynsfordeling som vi kallar hypergeometrisk.

Kuler av to fargar

Det ligg ni kuler i ein boks. Tre av kulene er blå. Resten er raude. Vi skal trekkje fem kuler frå boksen tilfeldig.

Kva er sannsynet for at vi trekkjer to blå og tre raude kuler?

Manuell utrekning

Vi må her rekne med at utvalet frå boksen er uordna (rekkjefølgja betyr ikkje noko), og vi har ikkje tilbakelegging. Talet på moglege måtar å trekkje 5 kuler frå boksen på er 9C5, som gir

95=9!5!·9-5!=93·82·7·63·5·4!1·2·3·4·5·4!=3·2·7·3=63·2=126

Kor mange gunstige måtar finst det?

Vi skal trekkje to blå kuler av i alt tre blå kuler.

Dette kan gjerast på 32=3·21·2=3 ulike måtar.

Vi skal trekkje tre raude kuler av i alt seks raude kuler.

Dette kan gjerast på 6C3=63=6·5·41·2·3=2·2·5=20 ulike måtar.

Etter produktregelen for kombinasjonar er det då 3·20=60 ulike gunstige måtar å trekkje ut tre raude og to blå kuler på.

Vi definerer hendinga A:

A: Av dei fem uttrekte kulene er to blå og tre raude.

Sannsynet for A blir

PA=32·6395=3·201260,476

Formel for hypergeometrisk sannsynsfordeling

Framgangsmåten over kan brukast generelt når vi skal trekkje ut eit tilfeldig utval frå ei mengde med element av to ulike typar. Mange situasjonar frå røynda vil svare til situasjonen med kulene, til dømes ei gruppe med 3 gutar og 6 jenter, ei skål med 3 øydelagde nøtter og 6 gode nøtter og så vidare.

Felles for desse er at vi har ei mengde med n element (9 kuler i ein boks). m av desse elementa er av éin type (3 av kulene er blå, 3 gutar, 3 øydelagde nøtter), og n-m av elementa er av ein annan type (9-3=6 kuler er raude, 6 jenter, 6 gode nøtter).

Vi skal trekkje r element tilfeldig. (Vi trekkjer 5 kuler/barn/nøtter tilfeldig.)

La X vere den stokastiske variabelen som viser til kor mange av dei uttrekte kulene som skal vere blå. Vi skal ha 2 blå kuler (eller gutar / dårlege nøtter), som betyr at k=2. Vi kan då finne sannsynet for at X=2, slik:

PX=2=mk·n-mr-knr=32·9-35-295=32·6395=0,476

Vi får ein generell formel, som vi kan bruke til å rekne ut sannsynet i dei tilfella der vi har to ulike mengder vi skal trekkje frå:

Hypergeometrisk fordeling

PX=k=mkn-mr-knr

At vi sette den stokastiske variabelen X til å vise til talet på blå kuler, er tilfeldig. Vi kunne latt talet på raude kuler stå først i formelen. Tenk gjennom korleis formelen i så fall ville ha sett ut!

Tips

Då ville vi fått at den stokastiske variabelen X viste til talet på raude kuler som blei trekte ut. n og r ville framleis ha vore høvesvis 9 og 5, men dei andre tala i formelen ville ha «skifta plass». Det vil seie at m ville ha blitt 6, og n-m ville ha blitt 3. k ville no ha blitt 3, og formelen ville sett slik ut:

PX=3=mk·n-mr-knr=63·9-65-395=63·3295=0,476

Vi ser at den brøken vi endar med til sist, er den same som over, berre at rekkjefølgja på faktorane i teljaren har endra seg.

Hypergeometrisk fordeling i GeoGebra

Du kan bruke sannsynskalkulatoren i GeoGebra til å rekne ut hypergeometrisk sannsyn. Då vel du «Hypergeometrisk fordeling» og fyller inn som forklart og vist nedanfor.

Her kallar vi det samla talet på element for «populasjon». Det svarer til n i formelen, det vil seie 9 kuler i dømet vårt.

Talet på element av «ein spesiell type» heiter n i sannsynskalkulatoren. Obs! Det svarer til m i formelen, altså dei 3 blå kulene.

Talet på element som blir trekte ut, blir kalla for «utval». Det svarer til r i formelen, altså dei 5 kulene vi skal trekkje ut.

Den stokastiske variabelen X viser òg her til talet på element i utvalet som er av «ein spesiell type».

Hypergeometrisk fordeling i Python

På same måte som med binomisk fordeling kan vi importere hypergeom frå scipy.stats. Også her bruker vi metoden .pmf(). I hypergeometrisk fordeling har vi fire argument. Først har vi ei liste for dei verdiane av den stokastiske variabelen vi vil finne sannsynet for, tilsvarande k i formelen vår. Det andre argumentet er n, altså talet på element totalt. Tredje argument er m, altså talet på element av ein spesiell type. Til slutt har vi r, som er talet vi skal trekkje ut til saman. Vi bruker Python og ser på sannsynsfordelinga der vi skal trekkje ut 5 kuler av 9, der 3 er blå:

Python
1from scipy.stats import hypergeom
2
3X = [] #ei liste for verdiane av X
4n = 9
5m = 3
6r = 5
7
8for i in range(m+1):                
9    X.append(i)                  #lagar ei liste for dei moglege verdiane X kan ha
10    
11kuler = hypergeom.pmf(X,n,m,r)  #finn sannsyna
12
13for i in (kuler):
14    print(i)                    #skriv sannsyna i ein kolonne. 

Ønskjer vi å rekne ut sannsynet for å trekkje 2 blå kuler direkte utan å skrive ut heile fordelinga, kan vi gjere slik:

Python
1from scipy.stats import hypergeom
2
3toblaa = hypergeom.pmf(2,9,3,5)
4
5print(toblaa)

Køyr programma i editoren din!

Døme med fleire enn to element

Vi kan òg bruke hypergeometrisk fordeling om vi har fleire enn to ulike element i ei mengde.

Elevrådet ved ein skule består av åtte elevar frå Vg1, seks elevar frå Vg2 og to elevar frå Vg3. Seks elevar frå elevrådet skal vere med på å arrangere OD-dagen. Dei seks elevane blir valde ut tilfeldig.

Finn sannsynet for at to elevar frå kvart klassetrinn blir valde ut.

Talet på uordna utval utan tilbakelegging på 2 av dei 8 frå Vg1:82

Talet på uordna utval utan tilbakelegging på 2 av dei 6 frå Vg2:62

Talet på uordna utval utan tilbakelegging på 2 av dei 2 frå Vg3:22

Den siste veit vi med ein gong at må vere 1, sidan det berre er eitt mogleg utval når begge tredjeklassingane skal vere med.

Talet på uordna utval utan tilbakelegging på 6 av dei totalt 16 elevane:166

Då kan vi setje opp uttrykket for sannsynet oppgåva spør etter. Vi definerer hendinga A: 2 elevar frå kvart klassetrinn blir valde ut.

P(A) = 82·62·22166=28·15·180080,052

Å dele ei mengde inn i ulike grupper

Vi avsluttar med eit døme henta frå ei eksamensoppgåve. Her deler vi opp gruppa ulikt når kriteria endrar seg i dei ulike deloppgåvene.

Eksamen 2T, hausten 2009:
I klassen til Kåre, Janne og Ane er det 15 jenter og 10 gutar. Klassen har vunne ein tur til Hellas for 6 elevar. Dei 6 elevane blir trekte ut ved loddtrekking.

1) Finn sannsynet for at Ane får vere med på turen.

Løysing

Her deler vi elevane inn i Ane og resten. Vi skal altså trekkje 1 Ane og 5 av dei andre elevane.

Vi definerer den stokastiske variabelen A som talet på Aner i utvalet. Då får vi n=25, m=1, r=6 og k=1.

PA=1=11·245256=0,24

Her kunne vi òg funne svaret ved å tenkje «gunstige delt på moglege».

PAne får vere med  turen=gm=625=0,24


2) Finn sannsynet for at akkurat 3 jenter og 3 gutar får vere med på turen.

Løysing

Her deler vi elevane inn i gutar og jenter, og vi skal ha tre av kvar. Vi set den stokastiske variabelen J til å vere talet på jenter. Vi får n=25, m=15, r=6 og k=3.

PJ = 3=153·103256=782530,308

3) Kåre og Janne er kjærastar. Finn sannsynet for at berre éin av dei får vere med på turen.

Løysing

Her deler vi elevane inn i kjærastar og ikkje-kjærastar. Vi set den stokastiske variabelen K til å vere talet på kjærastar som får vere med. Som før får vi n=25 og r=6. m blir 2, sidan vi har to kjærastar. k blir 1, sidan vi skal finne sannsynet for at berre den eine kjærasten får vere med.

PK=1=21·235256=1950=0,38

For å oppsummere:

Eit hypergeometrisk forsøk har vi om vi skal trekkje ut eit utval av ei mengde og vi kan dele mengda opp i to (eller fleire) ulike delmengder etter gitte kriterium.

Kor mange vi får av éi delmengde, er gitt ved ein stokastisk variabel.

Vi set den stokastiske variabelen lik X.
Vi set verdien til den stokastiske variabelen lik k.
Vi set mengda lik n.
Vi set den eine delmengda lik m.
Vi set utvalet lik r.

Dette gir oss formelen for hypergeometrisk sannsyn med to delmengder:

PX=k=mkn-mr-knr

CC BY-SA 4.0Skrive av Olav Kristensen, Tove Annette Holter og Stein Aanensen.
Sist fagleg oppdatert 08.01.2021