Hopp til innhold
Fagartikkel

Gruppert datamateriale. Histogram

Dersom det vi måler kan ha veldig mange verdier, vil det være lurt å gruppere måleverdiene.

Eksempel på gruppert datamateriale

I Norge blir det hvert år foretatt en statistisk undersøkelse av høyden til vernepliktige rekrutter. Her ville frekvenstabellen ha blitt veldig stor dersom man tar med alle mulige høyder, og derfor er høydene inndelt i grupper eller klasser.

Tallene i tabellen nedenfor er hentet fra Statistisk sentralbyrå: 4.22 Vernepliktige, etter høyde. Prosent (ssb.no).

Prosentvis fordeling av vernepliktige etter høyde

År

Gjennomsnitts-
høyde (cm)

Under
165 cm

165–
169 cm

170–
174 cm

175–
179 cm

180–
184 cm

185–
189 cm

190–
194 cm

195 cm
og over

1910

171

12,8

26

32,3

20,4

6,8

1,7

..

..

1920

171,4

12,3

24,4

32,6

21,3

7,7

1,7

..

..

1937

173,8

6,5

17,3

30,8

27,4

13,2

4,8

..

..

1952

176,2

3

10,5

25,4

30,4

21,5

7,4

1,6

0,2

1960

177,1

2,4

8,3

22,8

31,1

23,4

9,6

2,1

0,3

1970

178,7

1,4

5,6

17,2

28,9

29,2

13,5

3,7

0,5

1980

179,4

1

4,8

15,6

27,6

29,9

15

5,2

0,8

1990

179,7

1,1

4,7

15,1

27,1

28,9

16,2

5,7

1,3

2000

179,9

1,4

4,5

14,5

25,9

29,2

16,9

6,1

1,5

2008

179,7

1,2

4,9

15,4

26,8

28,2

16,5

5,7

1,3

Vi ser nærmere på tallene for 1910. I tabellen nedenfor har vi latt som om det var akkurat 1 000 rekrutter i 1910. Siden det var 32,3 prosent mellom 170 og 155 cm, betyr det at det var 323 vernepliktige i denne klassen, og tilsvarende for de andre klassene. Vi har valgt å plassere alle med høyde under 165 cm i en klasse med høyder fra 155 cm til 165 cm.

Rekrutthøyder 1910

Høyde i cm

Frekvens

[155, 165⟩

128

[165, 170⟩

260

[170, 175⟩

323

[175, 180⟩

204

[180, 185⟩

68

[185, 190⟩

17

[190, 200⟩

0

Klassene er markert som halvåpne intervaller. For eksempel er klassen fra og med 175 cm til 180 cm markert med det halvåpne intervallet [175, 180. En rekrutt med høyden 175 cm tilhører denne klassen, men ikke en rekrutt med høyde 180 cm. For denne klassen er 175 cm nedre klassegrense, og 180 cm er øvre klassegrense.

I hvilken klasse skal en rekrutt med høyde 185 cm plasseres?

Løsning

Denne rekrutten skal plasseres i klassen [185, 190⟩ siden denne klassen er fra og med 185 cm til 190 cm (men ikke med 190 cm) .

Histogram

Vi ønsker å presentere datamaterialet fra tabellen i et diagram. Da får vi et problem. Den første klassen, som går fra 155 cm til 165 cm, er nemlig dobbelt så bred som den neste. Et vanlig søylediagram vil gi en søyle som er dobbelt så høy i forhold til om vi hadde fordelt de 128 rekruttene i to klasser med lik klassebredde.

I stedet for å dele den store klassen i to klasser, løser vi problemet ved å regne ut "hvor mange rekrutter det er på hver centimeter" i de forskjellige klassene. I klassen [155, 165 er det 128 rekrutter. Klassebredden er 10 cm. Det vil si at det i gjennomsnitt er  12810=12,8  rekrutter per centimeter i denne klassen. I klassen [165, 170 er det 260 rekrutter. Klassebredden er 5 cm. Det vil si at det er  2605=52  rekrutter per centimeter i denne klassen.

Hvor mange rekrutter er det per centimeter for klassen [180, 185⟩?

Løsning

685=13,6

I denne klassen er det 13,6 rekrutter per centimeter.

Antall rekrutter per centimeter kaller vi for histogramhøyde (frekvens dividert på klassebredde), og vi bruker dette som høyde på søyler i et spesielt diagram som vi kaller histogram.

Rekrutthøyder 1910

Høyde i cm

Frekvens

Histogramhøyde

[155, 165⟩

128

12,8

[165, 170⟩

260

52

[170, 175⟩

323

64,6

[175, 180⟩

204

40,8

[180, 185⟩

68

13,6

[185, 190⟩

17

3,4

[190, 200⟩

0

0

Histogrammet tegner vi i GeoGebra med kommandoen "Histogram(<Liste med klassegrenser>,<Liste med høyder>)" i algebrafeltet. Listen med klassegrenser må inneholde tallene 155, 165, 170 og så videre til og med 200. Vi bruker regnearkdelen i GeoGebra til å regne ut histogramhøydene. Hvis vi lager listene med tallene og kaller dem "klassegrenser" og "høyder", lager vi histogrammet med kommandoen

Histogram(klassegrenser,høyder)

Merk at det blir ett tall mer i lista over klassegrenser enn i lista over histogramhøyder.

I et histogram må vi multiplisere histogramhøyden med klassebredden for å finne antall rekrutter i klassen.

I klassen [155, 165 er histogramhøyden 12,8. Antall rekrutter i klassen er

12,8·10=128

I klassen [165, 170 er histogramhøyden 52. Antall rekrutter i klassen er

52·5=260

Lag histogrammet over med GeoGebra. Bruk regnearkdelen i GeoGebra til å regne ut histogramhøydene.

Tips til oppgaven

Du trenger en kolonne med klassegrensene for å regne ut klassebreddene.

Løsning

Reknearkdelen i GeoGebra kan se slik ut:

Formelvisningen av regnearket ser slik ut:

Nå kan vi lage lister av klassegrensene i kolonne B og histogramhøydene i kolonne E og bruke kommandoen "Histogram()" som vist lenger opp.

For å få til histogrammet på bildet over der y-aksen krysser x-aksen for  x=150  i stedet for i origo, har vi gått til innstillinger for grafikkfeltet, valgt fanen "yAkse" og latt y-aksen krysse ved 150. Det er også under fanene "xAkse" og "yAkse" vi kan skrive på aksetitler ("Navn på aksen:").

Nedenfor kan du laste ned et GeoGebra-ark med tallene i regnearkdelen og det ferdige histogrammet.

Kilde

Statistisk sentralbyrå (u.å.). 4.22 Vernepliktige, etter høyde. Prosent [Tabell]. Hentet 30. september 2021 https://www.ssb.no/a/histstat/tabeller/4-22.html