Median i eit gruppert materiale
Medianen er den midtarste observasjonsverdien når alle observasjonsverdiane er sorterte i stigande rekkjefølgje. Vi ser på dømet vårt med 1 000 rekruttar (sjå lenkje nedst på sida). Vi har lagt til ein kolonne med kumulativ frekvens i tabellen.
Rekrutthøgder 1910 | ||
---|---|---|
Høgde i cm | Frekvens | Kumulativ |
[155, 165⟩ | 128 | 128 |
[165, 170⟩ | 260 | 388 |
[170, 175⟩ | 323 | 711 |
[175, 180⟩ | 204 | 915 |
[180, 185⟩ | 68 | 983 |
[185, 190⟩ | 17 | 1 000 |
[190, 200⟩ | 0 | 1 000 |
Medianen vil etter vanleg definisjon vere høgda til rekrutt nummer
I utgangspunktet skal derfor medianen vere gjennomsnittshøgda til rekrutt nummer 500 og rekrutt nummer 501 dersom vi sorterer alle rekruttane i stigande rekkjefølgje etter høgda.
I kva for ein av klassane ligg rekrutt nummer 500 og nummer 501?
Tips til oppgåva
Bruk kolonnen med kumulative frekvensar.
Løysing
Ut frå kolonnen med kumulative frekvensar ser vi at 388 rekruttar har høgde lågare enn 170 cm og 711 rekruttar har høgde som er lågare enn 175 cm.
Medianen må altså liggje i klassen
Det er mogleg å finne ein meir presis verdi for medianen, men då må vi leggje nokre føresetnader til grunn. Vi går ut frå at rekruttane i klassen
I klassen
GeoGebra har dessverre ingen kommando for å finne medianen i eit gruppert datamateriale.
Gjennomsnitt i eit gruppert datamateriale
Gjennomsnittshøgda i eit gruppert datamateriale blir heller ikkje ein eksakt verdi. For å finne ein tilnærma riktig verdi lèt vi alle rekruttar i den same klassen ha den same høgda, nemleg klassemidtpunktet. Klassemidtpunktet blir rekna ut som middelverdien av nedre og øvre klassegrense.
Kva blir klassemidtpunktet i klassen
Løysing
Klassemidtpunktet i klassen frå og med 175 cm til 180 cm er gitt ved
Det betyr at når vi skal rekne ut gjennomsnittet, går vi ut frå at vi har 204 rekruttar med høgde 177,5 cm. Vi gjer tilsvarande for dei andre klassane.
For å finne ein tilnærma riktig verdi for gjennomsnittshøgda kan vi bruke tilsvarande metode som vi har brukt for å finne gjennomsnittskarakteren i klassen til Mary Ann.
| Klassemidtpunkt | Frekvens | x · f |
---|---|---|---|
[155, 165⟩ | 160 | 128 | 20 480 |
[165, 170⟩ | 167,5 | 260 | 43 550 |
[170, 175⟩ | 172,5 | 323 | 55 717,5 |
[175, 180⟩ | 177,5 | 204 | 36 210 |
[180, 185⟩ | 182,5 | 68 | 12 410 |
[185, 190⟩ | 187,5 | 17 | 3 187,5 |
[190, 200⟩ | 195 | 0 | 0 |
Sum | 1 000 | 171 555 |
Kva blir gjennomsnittshøgda ut frå tala i tabellen over?
Løysing
Gjennomsnittet blir på vanleg måte summen av alle høgdene delt på talet på rekruttar:
Bruk reknearkdelen i GeoGebra til å lage tabellen over. Du kan laste ned ein mal nedanfor.
Filer
Tips til oppgåva
Det er lurt å lage kolonnen med klassemidtpunkta ut frå kolonnen med klassegrenser ved hjelp av ein reknearkformel. For å summere cellene B1 til og med B6 skriv du Sum(B1:B6)
. Skriv celleadressene med store bokstavar i GeoGebra. Alternativt kan du markere dei cellene som skal summerast og trykkje på verktøyknappen "Sum"
Rekn ut i reknearkdelen gjennomsnittet i det grupperte materialet. Kontroller at du får det same svaret som i utrekninga over.
Det er enklare å bruke den innebygde kommandoen "gsnitt()" i GeoGebra til å finne gjennomsnittsverdien. Lag dei listene du treng, og bruk denne kommandoen til å finne gjennomsnittshøgda til rekruttane. Får du framleis det same svaret?
Tips til oppgåva
Du treng ei liste med tala for klassemidtpunkt og ei med frekvensane.
Løysing
Dersom du kallar lista med klassemidtpunkta "klassemidtpunkt" og lista med frekvensane "frekvensar", blir kommandoen
gsnitt(klassemidtpunkt,frekvensar)
Dette blir som å rekne ut gjennomsnittet for eit ugruppert datamateriale sidan vi går ut frå at alle tala i ein klasse har klassemidtpunktet som verdi.
Nedst på sida kan du laste ned eit ferdig GeoGebra-ark til oppgåvene på denne sida.
I kommandoen "gsnitt()" kan du erstatte lista med klassemidtpunkta med ei liste med klassegrensene, dersom du ønskjer det. Korleis veit GeoGebra kva slags liste du legg inn?
Svar
Lista med klassemidtpunkt inneheld like mange tal som lista med frekvensar. Lista med klassegrenser inneheld eitt tal meir. Så dersom GeoGebra finn at dei to listene som er skrivne inn i kommandoen "gsnitt()" har like mange tal, går programmet ut frå at den første lista er ei liste med verdiar. Dersom den første lista har eitt tal meir enn den andre, går programmet ut frå at det er ei liste med klassegrenser.
Standardavvik i eit gruppert datamateriale
Når vi skal finne standardavviket i eit gruppert datamateriale, har vi den same tilnærminga som då vi rekna ut gjennomsnittet over, nemleg å seie at alle tala i ein klasse har den same verdien: klassemidtpunktet. Derfor kan vi rekne ut standardavviket for eit gruppert datamateriale på den same måten som standardavviket for eit ugruppert datamateriale. Det er bra, for GeoGebra har ingen eigen funksjon for å finne standardavvik i eit gruppert datamateriale. Framgangsmåten for å finne standardavviket i eit ugruppert datamateriale er vist på teorisida "Spreiingsmål" (sjå lenkje nedst på sida).
Vi ønskjer no å finne standardavviket i dømet med høgda på rekruttane i 1910. Kva for eit av dei to typane standardavvik skal vi bruke?
Svar
Vi går ut frå at statistikken omfattar alle rekruttane. Det går ikkje fram nokon stad i originalkjelda om det er alle, men vanlegvis blir høgda på alle rekruttar målte, så dataa finst. Det betyr at vi skal bruke det vi kallar "vanleg" standardavvik (populasjonsstandardavvik).
Kva blir kommandoen for å rekne ut standardavviket i det grupperte datamaterialet over høgda til rekruttane i 1910? Vi går ut frå at du har laga ei liste "klassemidtpunkt" med klassemidtpunkta og ei liste "frekvensar" med frekvensane.
Løysing
standardavvik=stavvp(klassemidtpunkt,frekvensar)
Nedanfor kan du laste ned eit GeoGebra-ark der vi har funne gjennomsnittet og standardavviket på måtane vist ovanfor.