Statistiske storleikar i eit gruppert datamateriale

Median i eit gruppert materiale
Medianen er den midtarste observasjonsverdien når alle observasjonsverdiane er sorterte i stigande rekkjefølgje. Vi ser på dømet vårt med 1 000 rekruttar frå teorisida "Gruppert datamateriale. Histogram". Vi har lagt til ein kolonne med kumulativ frekvens i tabellen.
Rekrutthøgder 1910 | ||
|---|---|---|
Høgde i cm | Frekvens | Kumulativ |
[155, 165⟩ | 128 | 128 |
[165, 170⟩ | 260 | 388 |
[170, 175⟩ | 323 | 711 |
[175, 180⟩ | 204 | 915 |
[180, 185⟩ | 68 | 983 |
[185, 190⟩ | 17 | 1 000 |
[190, 200⟩ | 0 | 1 000 |
Medianen vil etter vanleg definisjon vere høgda til rekrutt nummer
I utgangspunktet skal derfor medianen vere gjennomsnittshøgda til rekrutt nummer 500 og rekrutt nummer 501 dersom vi sorterer alle rekruttane i stigande rekkjefølgje etter høgda.
🤔 Tenk over: I kva for ein av klassane ligg rekrutt nummer 500 og nummer 501?
Det er mogleg å finne ein meir presis verdi for medianen, men då må vi leggje nokre føresetnader til grunn. Vi går ut frå at rekruttane i klassen er jamt fordelte på alle høgdene i klassen. Dette er ikkje sikkert, men jo større tal det er i klassen, jo meir sannsynleg er det. Den medianen vi no finn, er derfor berre den medianen som er mest sannsynleg. Derfor gir det heller ikkje meining å rekne ut medianen som gjennomsnittet av tal nummer 500 og 501. I slike tilfelle med to tal i midten vel vi at medianen er det første talet. Medianen blir derfor høgda til rekrutt nummer 500.
I klassen er det 323 rekruttar. Rekrutt nummer 500 er rekrutt nummer frå venstre klassebreidde. Vi tenkjer oss framleis at det er like mange rekruttar på kvar høgde i klassen. Medianrekrutten må då ha høgde ein brøkdel av 5 cm (klassebreidda) ut frå nedre klassegrense. Ein tilnærma verdi for medianhøgda blir då
GeoGebra har dessverre ingen kommando for å finne medianen i eit gruppert datamateriale.
Gjennomsnitt i eit gruppert datamateriale
Gjennomsnittshøgda i eit gruppert datamateriale blir heller ikkje ein eksakt verdi. For å finne ein tilnærma riktig verdi lèt vi alle rekruttar i den same klassen ha den same høgda, nemleg klassemidtpunktet. Klassemidtpunktet blir rekna ut som middelverdien av nedre og øvre klassegrense.
🤔 Tenk over: Kva blir klassemidtpunktet i klassen ?
Det betyr at når vi skal rekne ut gjennomsnittet, går vi ut frå at vi har 204 rekruttar med høgde 177,5 cm. Vi gjer tilsvarande for dei andre klassane.
For å finne ein tilnærma riktig verdi for gjennomsnittshøgda kan vi bruke tilsvarande metode som vi har brukt for å finne gjennomsnittskarakteren i klassen til Mary Ann på teorisida "Sentralmål".
Høgde i cm | Klassemidtpunkt | Frekvens | x · f |
|---|---|---|---|
[155, 165⟩ | 160 | 128 | 20 480 |
[165, 170⟩ | 167,5 | 260 | 43 550 |
[170, 175⟩ | 172,5 | 323 | 55 717,5 |
[175, 180⟩ | 177,5 | 204 | 36 210 |
[180, 185⟩ | 182,5 | 68 | 12 410 |
[185, 190⟩ | 187,5 | 17 | 3 187,5 |
[190, 200⟩ | 195 | 0 | 0 |
Sum | 1 000 | 171 555 |
Kva blir gjennomsnittshøgda ut frå tala i tabellen over?
Bruk reknearkdelen i GeoGebra til å lage tabellen over. Du kan laste ned ein mal nedanfor.
- Rekrutthøgde, mal(GGB)
Rekn ut i reknearkdelen gjennomsnittet i det grupperte materialet. Kontroller at du får det same svaret som i utrekninga over.
Det er enklare å bruke den innebygde kommandoen "gsnitt()" i GeoGebra til å finne gjennomsnittsverdien. Lag dei listene du treng, og bruk denne kommandoen til å finne gjennomsnittshøgda til rekruttane. Får du framleis det same svaret?
Nedst på sida kan du laste ned eit ferdig GeoGebra-ark til oppgåvene på denne sida.
I kommandoen "gsnitt()" kan du erstatte lista med klassemidtpunkta med ei liste med klassegrensene, dersom du ønskjer det. Korleis veit GeoGebra kva slags liste du legg inn?
Standardavvik i eit gruppert datamateriale
Når vi skal finne standardavviket i eit gruppert datamateriale, har vi den same tilnærminga som då vi rekna ut gjennomsnittet over, nemleg å seie at alle tala i ein klasse har den same verdien: klassemidtpunktet. Derfor kan vi rekne ut standardavviket for eit gruppert datamateriale på den same måten som standardavviket for eit ugruppert datamateriale. Det er bra, for GeoGebra har ingen eigen funksjon for å finne standardavvik i eit gruppert datamateriale. Framgangsmåten for å finne standardavviket i eit ugruppert datamateriale er vist på teorisida "Spreiingsmål" (sjå lenkje nedst på sida).
🤔 Tenk over: Vi ønskjer no å finne standardavviket i dømet med høgda på rekruttane i 1910. Kva for eit av dei to typane standardavvik skal vi bruke?
Kva blir kommandoen for å rekne ut standardavviket i det grupperte datamaterialet over høgda til rekruttane i 1910? Vi går ut frå at du har laga ei liste "klassemidtpunkt" med klassemidtpunkta og ei liste "frekvensar" med frekvensane.
Nedanfor kan du laste ned eit GeoGebra-ark der vi har funne gjennomsnittet og standardavviket på måtane vist ovanfor.