Hypergeometrisk sannsynsmodell
Det ligg ni kuler i ein boks. Tre av kulene er blå. Resten er raude. Vi skal trekkje fem kuler frå boksen tilfeldig.
Kva er sannsynet for at vi trekkjer to blå og tre raude kuler?
Manuell utrekning
Vi må her rekne med at utvalet frå boksen er uordna (rekkjefølgja betyr ikkje noko), og vi har ikkje tilbakelegging. Talet på moglege måtar å trekkje 5 kuler frå boksen på er , som gir
Kor mange gunstige måtar finst det?
Vi skal trekkje to blå kuler av i alt tre blå kuler.
Dette kan gjerast på ulike måtar.
Vi skal trekkje tre raude kuler av i alt seks raude kuler.
Dette kan gjerast på ulike måtar.
Etter produktregelen for kombinasjonar er det då ulike gunstige måtar å trekkje ut tre raude og to blå kuler på.
Vi definerer hendinga :
Sannsynet for
Framgangsmåten over kan brukast generelt når vi skal trekkje ut eit tilfeldig utval frå ei mengde med element av to ulike typar. Mange situasjonar frå røynda vil svare til situasjonen med kulene, til dømes ei gruppe med 3 gutar og 6 jenter, ei skål med 3 øydelagde nøtter og 6 gode nøtter og så vidare.
Felles for desse er at vi har ei mengde med
Vi skal trekkje
La
Vi får ein generell formel, som vi kan bruke til å rekne ut sannsynet i dei tilfella der vi har to ulike mengder vi skal trekkje frå:
Hypergeometrisk fordeling
At vi sette den stokastiske variabelen
Du kan bruke sannsynskalkulatoren i GeoGebra til å rekne ut hypergeometrisk sannsyn. Då vel du «Hypergeometrisk fordeling» og fyller inn som forklart og vist nedanfor.
Her kallar vi det samla talet på element for «populasjon». Det svarer til
Talet på element av «ein spesiell type» heiter
Talet på element som blir trekte ut, blir kalla for «utval». Det svarer til
Den stokastiske variabelen
På same måte som med binomisk fordeling kan vi importere hypergeom
frå scipy.stats
. Også her bruker vi metoden .pmf()
. I hypergeometrisk fordeling har vi fire argument. Først har vi ei liste for dei verdiane av den stokastiske variabelen vi vil finne sannsynet for, tilsvarande
Ønskjer vi å rekne ut sannsynet for å trekkje 2 blå kuler direkte utan å skrive ut heile fordelinga, kan vi gjere slik:
Køyr programma i editoren din!
Vi kan òg bruke hypergeometrisk fordeling om vi har fleire enn to ulike element i ei mengde.
Elevrådet ved ein skule består av åtte elevar frå Vg1, seks elevar frå Vg2 og to elevar frå Vg3. Seks elevar frå elevrådet skal vere med på å arrangere OD-dagen. Dei seks elevane blir valde ut tilfeldig.
Finn sannsynet for at to elevar frå kvart klassetrinn blir valde ut.
Talet på uordna utval utan tilbakelegging på 2 av dei 8 frå Vg1:
Talet på uordna utval utan tilbakelegging på 2 av dei 6 frå Vg2:
Talet på uordna utval utan tilbakelegging på 2 av dei 2 frå Vg3:
Den siste veit vi med ein gong at må vere 1, sidan det berre er eitt mogleg utval når begge tredjeklassingane skal vere med.
Talet på uordna utval utan tilbakelegging på 6 av dei totalt 16 elevane:
Då kan vi setje opp uttrykket for sannsynet oppgåva spør etter. Vi definerer hendinga
Vi avsluttar med eit døme henta frå ei eksamensoppgåve. Her deler vi opp gruppa ulikt når kriteria endrar seg i dei ulike deloppgåvene.
Eksamen 2T, hausten 2009:
I klassen til Kåre, Janne og Ane er det 15 jenter og 10 gutar. Klassen har vunne ein tur til Hellas for 6 elevar. Dei 6 elevane blir trekte ut ved loddtrekking.
1) Finn sannsynet for at Ane får vere med på turen.
2) Finn sannsynet for at akkurat 3 jenter og 3 gutar får vere med på turen.
3) Kåre og Janne er kjærastar. Finn sannsynet for at berre éin av dei får vere med på turen.
For å oppsummere:
Eit hypergeometrisk forsøk har vi om vi skal trekkje ut eit utval av ei mengde og vi kan dele mengda opp i to (eller fleire) ulike delmengder etter gitte kriterium.
Kor mange vi får av éi delmengde, er gitt ved ein stokastisk variabel.
Vi set den stokastiske variabelen lik
Vi set verdien til den stokastiske variabelen lik
Vi set mengda lik
Vi set den eine delmengda lik
Vi set utvalet lik
Dette gir oss formelen for hypergeometrisk sannsyn med to delmengder: