Statistiske storleikar i eit gruppert datamateriale
Medianen er den midtarste observasjonsverdien når alle observasjonsverdiane er sorterte i stigande rekkjefølgje. Vi ser på dømet vårt med 1 000 rekruttar (sjå lenkje nedst på sida). Vi har lagt til ein kolonne med kumulativ frekvens i tabellen.
Rekrutthøgder 1910 | ||
---|---|---|
Høgde i cm | Frekvens | Kumulativ |
[155, 165⟩ | 128 | 128 |
[165, 170⟩ | 260 | 388 |
[170, 175⟩ | 323 | 711 |
[175, 180⟩ | 204 | 915 |
[180, 185⟩ | 68 | 983 |
[185, 190⟩ | 17 | 1 000 |
[190, 200⟩ | 0 | 1 000 |
Medianen vil etter vanleg definisjon vere høgda til rekrutt nummer
I utgangspunktet skal derfor medianen vere gjennomsnittshøgda til rekrutt nummer 500 og rekrutt nummer 501 dersom vi sorterer alle rekruttane i stigande rekkjefølgje etter høgda.
I kva for ein av klassane ligg rekrutt nummer 500 og nummer 501?
Det er mogleg å finne ein meir presis verdi for medianen, men då må vi leggje nokre føresetnader til grunn. Vi går ut frå at rekruttane i klassen
I klassen
GeoGebra har dessverre ingen kommando for å finne medianen i eit gruppert datamateriale.
Gjennomsnittshøgda i eit gruppert datamateriale blir heller ikkje ein eksakt verdi. For å finne ein tilnærma riktig verdi lèt vi alle rekruttar i den same klassen ha den same høgda, nemleg klassemidtpunktet. Klassemidtpunktet blir rekna ut som middelverdien av nedre og øvre klassegrense.
Kva blir klassemidtpunktet i klassen
Det betyr at når vi skal rekne ut gjennomsnittet, går vi ut frå at vi har 204 rekruttar med høgde 177,5 cm. Vi gjer tilsvarande for dei andre klassane.
For å finne ein tilnærma riktig verdi for gjennomsnittshøgda kan vi bruke tilsvarande metode som vi har brukt for å finne gjennomsnittskarakteren i klassen til Mary Ann.
| Klassemidtpunkt | Frekvens | x · f |
---|---|---|---|
[155, 165⟩ | 160 | 128 | 20 480 |
[165, 170⟩ | 167,5 | 260 | 43 550 |
[170, 175⟩ | 172,5 | 323 | 55 717,5 |
[175, 180⟩ | 177,5 | 204 | 36 210 |
[180, 185⟩ | 182,5 | 68 | 12 410 |
[185, 190⟩ | 187,5 | 17 | 3 187,5 |
[190, 200⟩ | 195 | 0 | 0 |
Sum | 1 000 | 171 555 |
Kva blir gjennomsnittshøgda ut frå tala i tabellen over?
Bruk reknearkdelen i GeoGebra til å lage tabellen over. Du kan laste ned ein mal nedanfor.
Filer
- Rekrutthøgde, mal(GGB)
Rekn ut i reknearkdelen gjennomsnittet i det grupperte materialet. Kontroller at du får det same svaret som i utrekninga over.
Det er enklare å bruke den innebygde kommandoen "gsnitt()" i GeoGebra til å finne gjennomsnittsverdien. Lag dei listene du treng, og bruk denne kommandoen til å finne gjennomsnittshøgda til rekruttane. Får du framleis det same svaret?
Nedst på sida kan du laste ned eit ferdig GeoGebra-ark til oppgåvene på denne sida.
I kommandoen "gsnitt()" kan du erstatte lista med klassemidtpunkta med ei liste med klassegrensene, dersom du ønskjer det. Korleis veit GeoGebra kva slags liste du legg inn?
Når vi skal finne standardavviket i eit gruppert datamateriale, har vi den same tilnærminga som då vi rekna ut gjennomsnittet over, nemleg å seie at alle tala i ein klasse har den same verdien: klassemidtpunktet. Derfor kan vi rekne ut standardavviket for eit gruppert datamateriale på den same måten som standardavviket for eit ugruppert datamateriale. Det er bra, for GeoGebra har ingen eigen funksjon for å finne standardavvik i eit gruppert datamateriale. Framgangsmåten for å finne standardavviket i eit ugruppert datamateriale er vist på teorisida "Spreiingsmål" (sjå lenkje nedst på sida).
Vi ønskjer no å finne standardavviket i dømet med høgda på rekruttane i 1910. Kva for eit av dei to typane standardavvik skal vi bruke?
Kva blir kommandoen for å rekne ut standardavviket i det grupperte datamaterialet over høgda til rekruttane i 1910? Vi går ut frå at du har laga ei liste "klassemidtpunkt" med klassemidtpunkta og ei liste "frekvensar" med frekvensane.
Nedanfor kan du laste ned eit GeoGebra-ark der vi har funne gjennomsnittet og standardavviket på måtane vist ovanfor.
Filer
Relatert innhald
Dersom ein frekvenstabell blir veldig stor, deler vi talmaterialet inn i grupper eller klassar.
Her definerer vi kva vi meiner med spreiing i eit datamateriale, og vi ser på spreiingsmåla variasjonsbreidde, kvartilbreidde og standardavvik.