Hypergeometrisk sannsynlighetsmodell
Det ligger ni kuler i en boks. Tre av kulene er blå. Resten er røde. Vi skal trekke fem kuler fra boksen tilfeldig.
Hva er sannsynligheten for at vi trekker to blå og tre røde kuler?
Manuell utregning
Vi må her regne med at utvalget fra boksen er uordnet (rekkefølgen betyr ikke noe), og at vi ikke har tilbakelegging. Antallet mulige måter å trekke 5 kuler fra boksen på er , som gir
Hvor mange gunstige måter finnes det?
Vi skal trekke to blå kuler av i alt tre blå kuler.
Dette kan gjøres på forskjellige måter.
Vi skal trekke tre røde kuler av i alt seks røde kuler.
Dette kan gjøres på forskjellige måter.
Etter produktregelen for kombinasjoner er det da forskjellige gunstige måter å trekke ut tre røde og to blå kuler på.
Vi definerer hendelsen :
Sannsynligheten for
Framgangsmåten over kan brukes generelt når vi skal trekke ut et tilfeldig utvalg fra en mengde med elementer av to ulike typer. Mange situasjoner fra virkeligheten vil tilsvare situasjonen med kulene, for eksempel en gruppe med 3 gutter og 6 jenter, en skål med 3 ødelagte nøtter og 6 gode nøtter og så videre.
Felles for disse er at vi har en mengde med
Vi skal trekke
La
Vi får en generell formel, som vi kan bruke til å regne ut sannsynligheten i de tilfellene der vi har to ulike mengder vi skal trekke fra:
Hypergeometrisk fordeling
At vi satte den stokastiske variabelen
Du kan bruke sannsynlighetskalkulatoren i GeoGebra til å regne ut hypergeometrisk sannsynlighet. Da velger du «Hypergeometrisk fordeling» og fyller inn som forklart og vist nedenfor.
Her kaller vi det samlede antallet elementer for «populasjon». Det svarer til
Antall elementer av «en spesiell type» kalles i sannsynlighetskalkulatoren for
Antall elementer som trekkes ut, kalles for «utvalg». Det svarer til
Den stokastiske variabelen
På samme måte som med binomisk fordeling kan vi importere hypergeom
fra scipy.stats
. Også her bruker vi metoden .pmf()
. I hypergeometrisk fordeling har vi fire argumenter. Først har vi en liste for de verdiene av den stokastiske variabelen vi vil finne sannsynligheten for, tilsvarende
Ønsker vi å regne ut sannsynligheten for å trekke 2 blå kuler direkte uten å skrive ut hele fordelingen, kan vi gjøre slik:
Kjør programmene i editoren din!
Vi kan også bruke hypergeometrisk fordeling hvis vi har flere enn to ulike elementer i en mengde.
Elevrådet ved en skole består av åtte elever fra Vg1, seks elever fra Vg2 og to elever fra Vg3. Seks elever fra elevrådet skal være med på å arrangere OD-dagen. De seks elevene velges ut tilfeldig.
Finn sannsynligheten for at to elever fra hvert klassetrinn blir valgt ut.
Antall uordnede utvalg uten tilbakelegging på 2 av de 8 fra Vg1:
Antall uordnede utvalg uten tilbakelegging på 2 av de 6 fra Vg2:
Antall uordnede utvalg uten tilbakelegging på 2 av de 2 fra Vg3:
Den siste vet vi med en gang at må være 1, siden det bare er ett mulig utvalg når begge tredjeklassingene skal være med.
Antall uordnede utvalg uten tilbakelegging på 6 av de totalt 16 elevene:
Da kan vi sette opp uttrykket for sannsynligheten oppgaven spør etter. Vi definerer hendelsen
Vi avslutter med et eksempel hentet fra en eksamensoppgave. Her deler vi inn gruppa ulikt når kriteriene endrer seg i de ulike deloppgavene.
Eksamen 2T, høsten 2009:
I klassen til Kåre, Janne og Ane er det 15 jenter og 10 gutter. Klassen har vunnet en tur til Hellas for 6 elever. De 6 elevene trekkes ut ved loddtrekning.
1) Finn sannsynligheten for at Ane får være med på turen.
2) Finn sannsynligheten for at akkurat 3 jenter og 3 gutter får være med på turen.
3) Kåre og Janne er kjærester. Finn sannsynligheten for at bare én av dem får være med på turen.
For å oppsummere:
Et hypergeometrisk forsøk har vi hvis vi skal trekke ut et utvalg av en mengde og vi kan dele mengden opp i to (eller flere) ulike delmengder etter gitte kriterier.
Antallet vi får av én delmengde, er gitt ved en stokastisk variabel.
Vi setter den stokastiske variabelen lik
Vi setter verdien til den stokastiske variabelen lik
Vi setter mengden lik
Vi setter den ene delmengden lik
Vi setter utvalget lik
Dette gir oss formelen for hypergeometrisk sannsynlighet med to delmengder: