Lage, forstå og presentere statistikk - Problemet med gjennomsnittet - Medie- og informasjonskunnskap 1 - NDLA

Hopp til innhold
Læringssti

Du er nå inne i en læringssti:
Lage, forstå og presentere statistikk

Fagartikkel

Problemet med gjennomsnittet

En forsker undersøker hvor mange snapper ungdom får klokka 18.00 til 19.00. To gutter får fire snapper hver, ei jente får en. Snittet blir tre. Gjennomsnittet er midtpunktet for de innsamlede tallene. Spredning sier noe om hvor langt unna tallene ligger midtpunktet.

Når vi bearbeider og leser statistikker er det viktig å vite at et gjennomsnitt bare er et gjennomsnitt. Noen ganger er et gjennomsnitt veldig nær den faktiske sannheten, mens i andre tilfeller er det større avstand til sannheten.


Både i illustrasjonsbildet og i ingressen er snittet tre. Hvilket av de to gjennomsnittene er nærmest sannheten, tenker du?

Spredning

Begrepet spredning brukes om avstanden mellom tall det blir laget et gjennomsnitt av. Avstanden mellom tall er ikke synlig dersom vi bare snakker om gjennomsnittet.

Når du leser og lager statistiske tabeller og grafer, må du huske å at tallene som ligger bak gjennomsnittet kan være så spredt at de ikke ligger tett opp til gjennomsnittet.

Mens gjennomsnittet sier noe om midtpunktet til tallene, sier spredning noe om hvor langt unna tallene ligger fra midtpunktet.

Når gjennomsnittet gir feil inntrykk

Nedenfor ser du to eksempler på mulig resultater fra en undersøkelse om bruk av Snapchat.

Det første eksempelet svarer til følgende beskrivelse:

Norsk ungdom bruker Snapchat i gjennomsnitt 6-11 ganger hver dag. Vi forstår at noen bruker Snapchat litt mer og noen litt mindre enn dette, men de fleste bruker appen mellom 6 og 11 ganger hver dag.


Snapchat-bruk.......(totalt 20)

En gang hver dag..................0
2-5 ganger om dagen............5
6-11 ganger om dagen.........10
12-15 ganger om dagen........5
16 ganger eller mer...............0


Her ser du helt tydelig at tallene er samlet rundt midtpunktet, altså 6-11 ganger om dagen, og det er få og små variasjoner fra dette midtpunktet. Gjennomsnittet (6-11 ganger om dagen) gir altså et godt bilde på hva man har funnet ut i undersøkelsen.

Men hva om resultatene ser annerledes ut?

Her er det andre eksempelet:

Midtpunktet er fortsatt 6-11 ganger om dagen, men gjennomsnittet gir likevel ikke et riktig bilde av det undersøkelsen har funnet ut.


Snapchat-bruk.......(totalt 20)

En gang hver dag..................9
2-5 ganger om dagen............0
6-11 ganger om dagen..........2
12-15 ganger om dagen........0
16 ganger eller mer................9


Sammenlignet med det første eksemplet ser vi tall som viser at flere ungdommer bruker Snapchat mye eller mindre. Men gjennomsnittet er det samme som i det første eksempelet.

I begge eksemplene er altså gjennomsnittet det samme. Men i eksempel to er gjennomsnittet et dårlig mål på ungdoms Snapchat-bruk. Det forteller oss ikke noe som gjelder for ungdommer flest.

Vi trenger derfor å måle spredning på tall, i tillegg til gjennomsnittet, dersom tall fra en undersøkelse skal kunne brukes fornuftig.

Utregning av spredning i et gjennomsnitt, kalles for standardavvik.

Standardavvik

Spredningen blir konkret og synlig dersom du regner ut standardavviket. Når vi regner ut standardavviket, får vi et mål på hvor mye tallene gjennomsnittlig sett skiller seg fra gjennomsnittstallet.

I eksemplene om Snapchat-bruk forteller et standardavvik oss i hvor stor grad ungdommers bruk stemmer over ens med gjennomsnittet på tallene fra undersøkelsen.

For første eksempelet vil standardavviket være lavt, og for det andre vil standardavviket være høyt. Gjennomsnittet i det første eksempelet sier altså mer om ungdommenes bruk av Snapchat enn gjennomsnittet i det andre eksempelet.

Relatert innhold

Fagstoff
Spredningsmål

Her definerer vi hva vi mener med spredning i et datamateriale, og vi ser på spredningsmålene variasjonsbredde, kvartilbredde og standardavvik.

Skrevet av Joachim Laberg.
Sist faglig oppdatert 09.01.2019