Bargobihttá

Statistikk – blandede oppgaver

Regn ulike typer oppgaver med statistikk her.

Du kan bruke GeoGebra til å løse disse oppgavene. Om du trenger hjelp med GeoGebra, kan du se lenka nederst på sida. Løsningene finner du under alle oppgavene.

ST-101

Marie har sommerjobb der hun tar med turister på turer med hest og kjerre. Det er plass til 6 passasjerer, men det er ikke alltid kjerra er full når hun skal kjøre. Ei uke hadde hun de følgende passasjertallene på turene:

3, 5, 5, 6, 6, 4, 6, 5, 6, 3, 6, 4, 5, 6, 6, 2, 4, 3, 5, 6, 4, 6, 5, 6

a) Finn gjennomsnitt, median og typetall i dette tallmaterialet.

b) Hvilket av sentralmålene synes du forteller mest om hvor mange passasjerer Marie hadde på turene sine?

c) Finn variasjonsbredde, kvartilbredde og standardavvik.

d) Tegn et boksplott over dataene. Kommenter utseendet på boksplottet, og forklar hvorfor det blir slik.

ST-102

Zelda står på kjøpesenteret en lørdag ettermiddag og teller hvor mange kunder som går inn i en av klesbutikkene hvert minutt. På det travleste var det 8 kunder som gikk inn i løpet av ett minutt, men det var også noen minutter der det ikke kom noen. Zelda står i én time og samler resultatene i tabellen nedenfor.

Antall kunder per minutt	Frekvens
0	4
1	6
2	10
3	8
4	9
5	7
6	6
7	6
8	4

a) Hva kaller vi en slik tabell?

b) Finn gjennomsnitt, median og typetall i dette tallmaterialet.

c) Finn variasjonsbredde, kvartilbredde og standardavvik. Tegn boksplott over dataene.

d) Hvordan kan Zelda rapportere inn resultatene fra undersøkelsen til butikkeieren på en god måte?

Tips til oppgave d)

Tallene Zelda har kommet fram til, gjelder i utgangspunktet for en enkelt time på lørdagen. Hun bør oppgi mellom hvilke klokkeslett målingene ble gjort. I tillegg til å presentere de ulike statistiske størrelsene kan hun regne ut hvor mange kunder som var innom i løpet av timen, og hun kan for eksempel framstille frekvenstabellen i et søylediagram.

I presentasjonen av de statistiske størrelsene bør hun si at hun har funnet det vanlige standardavviket. Dersom tallene skal brukes til å si noe generelt om besøket på lørdager, bør egentlig utvalgsstandardavviket brukes i stedet for det vanlige standardavviket.

ST-103

Sondre hadde sommerjobb som turguide opp til Storfossen. Tabellen nedenfor viser hvor mange turister som var med hver uke denne sommeren.

Uke nr.	25	26	27	28	29	30	31	32	33
Antall turister	14	29	37	41	40	32	49	36	21

a) Finn gjennomsnittet og medianen i dette tallmaterialet.

b) Hvorfor ble det ikke spurt om typetallet i oppgave a)?

c) Finn variasjonsbredden, kvartilbredden og standardavviket. Tegn boksplott.

ST-104

Tabellen viser antall feriereiser med fly nordmenn gjorde i årene 2014–2020. Tallene er hentet fra statistikkbanken til Statistisk sentralbyrå.

År	2014	2015	2016	2017	2018	2019	2020
Antall feriereiser med fly (millioner)	6,84	6,49	6,27	6,71	6,17	6,60	2,02

a) Hva er det gjennomsnittlige antallet feriereiser med fly for disse årene?

b) Hva er medianen?

c) Finn variasjonsbredden, kvartilbredden og standardavviket. Tegn boksplott. Kommenter utseendet til boksplottet.

d) Lag et linjediagram som viser hvordan det gjennomsnittlige antallet feriereiser med fly per person har utviklet seg. Kommenter utviklingen.

e) Gjør oppgaven på nytt ved å inkludere nyere tall på antall flyreiser. Se tabellen 06921: Reiseundersøkelsen (ssb.no). Hvordan utvikler antallet feriereiser med fly seg etter at det sank mye i 2020?

Tips til oppgave e)

Velg statistikkvariabelen "Reiser".
Velg kvartalene 2021K1 og nyere.
Under "Transportmåte" velger du "Fly".
Under "Reisetype" velger du "Korte feriereiser i alt" og "Lange feriereiser i alt".
Trykk på "Vis tabell".
Velg "Lagre data som ..." og "Excel". Åpne regnearket i et vanlig regnearkprogram, og legg sammen tallene så du får totalt antall feriereiser med fly for hvert år. Kopier tallene over i regnearkdelen til GeoGebra.

ST-105

Tabellen nedenfor viser omsetningen per innbygger i detaljhandelen i kroner for årene 2010 til 2020. Tallene er hentet fra statistikkbanken til Statistisk sentralbyrå.

År	2010	2011	2012	2013	2014	2015	2016	2017	2018	2019	2020
Kr/innbygger	71 919	73 229	74 916	75 802	78 244	80 180	82 379	83 667	84 896	86 295	97 052

a) Hva er den gjennomsnittlige omsetningen per innbygger i detaljhandelen for disse årene?

b) Hva er medianen?

c) Finn variasjonsbredden, kvartilbredden og standardavviket.

d) Hvordan har omsetningen per innbygger i detaljhandelen i kroner for årene 2010 til 2020 utviklet seg? Kommenter resultatene.

e) Bruk regresjon og lag to matematiske modeller for hvordan detaljhandelen har utviklet seg i dette tidsrommet. La $x$ være antall år etter 2010.

f) Hva vil omsetningen per innbygger i detaljhandelen i kroner være i 2030 med disse modellene? Hvilken modell tror du er mest riktig?

Tips til oppgaven

For å svare bedre på hvilken modell som er mest riktig, kan du finne nyere tall for detaljhandelen hvis det er mulig. Se "Kilder" nederst på sida.

ST-106

Kine drev kiosk på hjemplassen to uker sommeren 2020. Hun registrerte dagsomsetningen i en tabell.

	Mandag	Tirsdag	Onsdag	Torsdag	Fredag	Lørdag	Søndag
Uke 28	740	800	910	635	1090	350	810
Uke 29	630	480	290	605	1230	410	900

Tallene er i kroner.

Beskriv omsetningen ved hjelp av sentralmål og spredningsmål.

(Dette er oppgave 13 fra eksempeloppgavene fra eksamen i 1P-Y, publisert av Utdanningsdirektoratet desember 2020.)

ST-107

Tabellen viser antall overnattinger i Trøndelag i forbindelse med feriereiser i årene 2019 og 2020. Tallene er hentet fra statistikkbanken til Statistisk sentralbyrå, se kilder nederst på sida.

	Jan.	Feb.	Mars	April	Mai	Juni	Juli	Aug.	Sept.	Okt.	Nov.	Des.
2019	33 887	47 158	52 998	52 944	55 554	98 655	155 400	113 976	66 960	61 665	60 367	48 132
2020	46 238	62 002	23 145	3 351	13 470	72 550	218 211	117 474	66 914	71 125	32 044	24 373

a) Bruk sentralmål og spredningsmål til å sammenlikne tallene for de to årene.

b) Lag et diagram der du sammenlikner tallene for de to årene. Prøv å bruke diagrammet til å forklare at spredningen er større på tallene i 2020 enn i 2019. Hva kan denne spredningen skyldes?

c) Finn tilsvarende tall for 2021 og kommenter utviklingen.

ST-108

Tabellen viser aldersfordelingen på registrerte personbiler i Norge i 2020 for de bilene som var maksimalt 20 år. Tallene er hentet fra statistikkbanken til Statistisk sentralbyrå.

Alder	Under 4 år	4–7 år	8–11 år	12–15 år	16–20
Antall	442 718	645 300	610 487	479 434	342 372

a) Hva er klassegrensene til gruppa 4–7 år?

b) Finn medianalderen, gjennomsnittlig alder på bilene og standardavviket. Lag også et histogram av tallene.

c) Sjekk at histogrammet er riktig ved å sjekke at du kan regne deg fram til frekvensen i den første klassen ved hjelp av histogramhøyden og klassebredden til klassen.

Tips til oppgaven

Husk at vi regner ut histogramhøyden til en klasse ved å ta frekvensen til klassen og dele på klassebredden.

d) Hvorfor har vi ikke tatt med biler som er eldre enn 20 år?

ST-109

Noen elever ved en skole holdt på i tre uker og målte hver dag klokka 12 hvor mye vann som strømmet i bekken ved skolen. De målte i liter per sekund (L/s). De fikk de følgende resultatene:

	Mengde, L/s
Ukenummer	Mandag	Tirsdag	Onsdag	Torsdag	Fredag	Lørdag	Søndag
1	13,4	17,3	19,4	21,0	18,9	15,3	14,9
2	16,1	14,2	13,9	11,8	10,1	9,8	9,1
3	11,2	15,2	13,8	12,6	12,1	13,4	11,9

Du kan laste ned et GeoGebra-ark med tallene nedenfor.

Fiillat

Vannmengde i bekken(GGB)

a) Finn en fornuftig måte å gruppere dataene på.

b) Tegn et histogram over de grupperte dataene.

c) Bruk de grupperte dataene og finn gjennomsnittlig vannstrøm i bekken. Finn også medianverdien og standardavviket på tilsvarende måte.

d) Bruk de ugrupperte dataene og finn gjennomsnittlig vannstrøm i bekken. Finn også medianverdien og standardavviket på denne måten. Sammenlign med tallene fra oppgave c).

e) Hvilke andre måter kan du framstille disse dataene grafisk på enn ved å bruke histogram? Lag en slik framstilling.

Tips til oppgave e)

Siden dette er dataverdier over tid, er det aktuelt å lage et linjediagram over enkeltmålingene med tid på den vannrette aksen og vannmengde i L/s på den loddrette. Da er det kanskje enklest å kopiere dataene over til et regnearkprogram som Excel eller Google Regneark.

ST-110

Elevene i klasse 2ST2 fikk i oppdrag å undersøke hvor mye penger elevene på skolen brukte i kantina en uke i september. De spurte 4 av de 20 klassene på skolen, totalt 105 elever. Etter å ha gruppert tallene, kom de fram til den følgende tabellen:

Kroner brukt i skolekantina	Frekvens
[0, 20⟩	13
[20, 40⟩	25
[40, 80⟩	25
[80, 120⟩	36
[120, 200⟩	6

a) Hva slags type standardavvik bør vi bruke på disse tallene?

b) Tegn histogram og finn gjennomsnitt, median og standardavvik.

ST-111

Vi skal lage et program som regner ut gjennomsnittet i et ugruppert datamateriale der vi har en rekke med rådata (for eksempel alle karakterene på en prøve i en klasse). Brukeren av programmet skal taste inn tallene.

a) Lag en algoritme for et slikt program.

Tips til oppgaven

Tenk gjennom hvordan du vil at brukeren av programmet skal taste inn tallene. Det enkleste er kanskje at brukeren trykker entertasten mellom hvert tall. Alternativt må det legges inn for eksempel et komma mellom hvert tall dersom alle tallene skal skrives inn på én gang.

b) Skriv programkoden til algoritmen og test den.

c) Skriv algoritme og lag et tilsvarende program der dataene er ordnet i en frekvenstabell slik at brukeren først taster inn de mulige måleverdiene og deretter frekvensene. Programmet skal regne ut gjennomsnittet.

d) Utvid programmet slik at det kan finne noen av de andre statistiske størrelsene.

ST-112

a) Skriv algoritme og lag et program som regner ut gjennomsnittet i et gruppert datamateriale. Brukeren av programmet skal taste inn klassegrensene og frekvensene, og det skal være mulig å skrive inn alle klassegrensene på én gang og alle frekvensene på én gang.

Tips til oppgaven

Du kan ta utgangspunkt i algoritmen til den alternative løsningen i oppgave ST-111 c). Utfordringen er å få lagd ei liste med klassemidtpunktene.

b) Utfordring: Nå skal vi prøve oss på det GeoGebra ikke klarer: Vi skal lage et program som regner ut medianen i et gruppert materiale. Brukeren av programmet skal som i oppgave a) taste inn klassegrensene og frekvensene.

Tips til oppgaven

Studer regnearkdelen i GeoGebra-arket i for eksempel oppgave ST-110, der medianen er regnet ut. Vi anbefaler at du bruker tid på å lage en god algoritme før du begynner med selve kodingen.

Løsninger

ST-101 a)

Vi kan kopiere tallene direkte inn i regnearkdelen i GeoGebra. Da havner tallene for eksempel cellene A1 til og med X1. Vi lager lista med kommandoen

data = A1:X1

Så bruker vi kommandoene "gsnitt", "Median" og "Typetall", alle med argumentet "data", og vi gir resultatet logiske navn.

gjennomsnittet = gsnitt(data)

medianen = Median(data)

typetallet = Typetall(data)

Fasit

Gjennomsnittet er 4,88.

Medianen er 5.

Typetallet er 6.

ST-101 b)

Her spørs det hva man vil legge vekt på. Gjennomsnittet og medianen er ganske nær hverandre. Vi kan si at i gjennomsnitt hadde Marie 5 passasjerer. Samtidig er det absolutt flest turer med full kjerre, altså 6 passasjerer. Så det går også an å hevde at "den typiske" turen er med 6 passasjerer.

ST-101 c)

Her bruker vi kommandoene "Maks", "Min", "Q3", "Q1" og "stavvp". Vi bruker "stavvp" (vanlig standardavvik) siden vi har tilgang på alle tallene i tallmaterialet.

variasjonsbredden = Maks(data) - Min(data)

kvartilbredden = Q3(data) - Q1(data)

standardavviket = stavvp(data)

Fasit

Variasjonsbredden er 4.

Kvartilbredden er 2.

Standardavviket er 1,2.

ST-101 d)

Vi tegner boksplottet med kommandoen

BoksPlott(2,1,data,false)

Boksplott der det lengst til venstre er en loddrett strek for antall passasjerer lik 2. Det er et rektangel som går fra antall passasjerer lik 4 til antall passasjerer lik 6. Gjennom rektangelet går det en loddrett strek for antall passasjerer lik 5. Det er ingen loddrett strek til høyre for rektangelet. Illustrasjon. — Govva: Bjarne Skurdal / CC BY-SA 4.0

Her stikker det ikke ut noe på høyre side av boksen som markerer kvartilbredden. Det er fordi øvre kvartil er lik den største verdien (6). Årsaken til det er at Marie har hatt mange nok turer med full kjerre, altså 6 passasjerer.

Fiillat

GeoGebra-fil til oppgave ST-101(GGB)

ST-102 a)

Dette er en frekvenstabell.

ST-102 b)

Her er det kanskje enklest å bruke regnearkdelen i GeoGebra og skrive antall kunder per minutt i cellene A2 til A10 og frekvensene i cellene B2 til B10. Skriv overskrifter i cellene A1 og B1.

Så lager vi lister av tallene.

tall = A2:A10

frekvenser = B2:B10

Deretter bruker vi kommandoene "gsnitt" og "Median", denne gangen med to lister som argument ("tall" og "frekvenser"). Typetallet er det tallet som har den største frekvensen, og dette leser vi rett av tabellen.

gjennomsnittet = gsnitt(tall,frekvenser)

medianen = Median(tall,frekvenser)

Fasit

Gjennomsnittet er 3,85.

Medianen er 4.

Typetallet er 2.

ST-102 c)

Her bruker vi kommandoene "Maks", "Min", "Q3", "Q1" og "stavvp" for vanlig standardavvik.

variasjonsbredden = Maks(tall) - Min(tall)

kvartilbredden = Q3(tall, frekvenser) - Q1(tall, frekvenser)

standardavviket = stavvp(tall, frekvenser)

Fasit

Variasjonsbredden er 8.

Kvartilbredden er 4.

Standardavviket er 2,29.

Kommandoen for boksplottet er

BoksPlott(2,1,tall,frekvenser,false)

Fiillat

GeoGebra-fil til oppgave ST-102(GGB)

ST-103 a)

Gjennomsnittet er 33,22.

Medianen er 36.

Se ellers den nedlastbare GeoGebra-fila.

ST-103 b)

I dette tallmaterialet er det ingen tall som forekommer flere enn én gang. Derfor blir det meningsløst å snakke om typetallet her.

Vi kan også si at i et tallmateriale der antallet målinger er mye mindre enn antall mulige måleverdier, vil det stort sett bare være én forekomst av tallene. Dersom det tilfeldigvis skulle være to forekomster av et tall, vil ikke det gi noe nyttig informasjon om tallmaterialet om vi oppgir dette som typetall.

ST-103 c)

Variasjonsbredden er 35.

Kvartilbredden er 15,5.

Standardavviket er 10,09.

Fiillat

GeoGebra-fil til oppgave ST-103(GGB)

ST-104 a)

Vi skriver tallene inn i regnearkdelen til GeoGebra og lager lista "data" av tallene. Så bruker vi kommandoen gsnitt(data). Gjennomsnittlig antall feriereiser med fly er 5,87 millioner.

ST-104 b)

Med kommandoen Median(data) får vi at medianen for antall feriereiser med fly er 6,49 millioner.

ST-104 c)

Vi bruker kommandoene

Maks(data)-Min(data) Q3(data)-Q1(data) stavvp(data)

og får dette resultatet:

Variasjonsbredden for antall flyreiser er 4,82.
Kvartilbredden for antall flyreiser er 0,54.
Standardavviket for antall flyreiser er 1,59.

Kommandoen

BoksPlott(2,1,data,false)

gir boksplottet nedenfor.

Boksplott der det lengst til venstre er en loddrett strek for antall flyreiser i millioner lik 2. Det er et rektangel som går fra antall flyreiser i millioner lik cirka 6,2 til antall flyreiser i millioner lik cirka 6,7. Gjennom rektangelet går det en loddrett strek for antall flyreiser i millioner lik cirka 6,5. Helt til høyre er det en loddrett strek for antall flyreiser i millioner lik cirka 6,8. Illustrasjon. — Govva: Bjarne Skurdal / CC BY-SA 4.0

Boksplottet blir veldig "skeivt" siden alle tallene unntatt ett er samlet mellom 6 og 7.

ST-104 d)

Linjeediagrammer kan vi lage ved å kopiere tallene inn i et vanlig regnearkprogram som Excel eller Google Regneark.

Søylediagram over tallene i tabellen i oppgaven. Illustrasjon. — Govva: Bjarne Skurdal / CC BY-SA 4.0

ST-105 a)

Den gjennomsnittlige omsetningen per innbygger i detaljhandelen er 80 780 kroner.

ST-105 b)

Medianen for omsetningen per innbygger i detaljhandelen er 80 180 kroner.

ST-105 c)

Variasjonsbredden er 25 133 kroner.

Kvartilbredden er 9 980 kroner.

Standardavviket er 6 905 kroner.

ST-105 d)

Vi ser at omsetningen per innbygger har økt jevnt og trutt med ett til to tusen fra år til år unntatt fra 2019 til 2020. Da økte den plutselig med mer enn 10 000. Årsaken kan være at folk reiste mindre og handlet mer det første året av koronapandemien.

ST-105 e)

Vi lager en ny kolonne for antall år etter 2010 i regnearkdelen i GeoGebra og bruker regresjonsverktøyet på denne kolonnen og kolonnen med tallene for detaljhandelen.

Vi velger lineær og eksponentiell modell i regresjonsverktøyet. En lineær modell gir funksjonen

$g (x) = 2070, 31 x + 70428$

En eksponentiell modell gir funksjonen

$h (x) = 70943 \cdot 1, 03^{x}$

ST-105 f)

Året 2030 betyr at $x = 20$ . Vi regner ut $g (20)$ og $h (20)$ i algebrafeltet eller med CAS og får

$\begin{array}{rcl} g (20) & = & 111 835 \\ h (20) & = & 117 592 \end{array}$

Omsetningen vil være 111 835 kroner med en lineær modell og 117 592 med en kroner med en eksponentiell modell.

Grafen til funksjonen g av x er lik 2070,31 x pluss 70428 og grafen til funksjonen h av x er lik 70943,14 multiplisert med 1,03 opphøyd i x er tegnet for x-verdier mellom 0 og 24. Punktene som de to funksjonene er basert på, er også tegnet inn. Punktet på g med koordinatene 20 og 111835 og punktet på h med koordinatene 20 og 117592 er tegnet inn. Illustrasjon. — Govva: Bjarne Skurdal / CC BY-SA 4.0

Hvis vi ser bort fra tallet for 2020, har utviklingen vært nokså jevn. Begge modellene spår at det skal øke mer enn dette. Slik sett vil den lineære modellen kanskje passe best i tida framover. Tallet for 2020 er kanskje påvirket av at det var koronapandemi, og at folk brukte mer penger på å handle enn å reise. At det skal fortsette å øke like mye i årene etter 2020, virker litt usannsynlig.

Fiillat

GeoGebra-fil til oppgave ST-105(GGB)

ST-106

I denne oppgaven er det ikke noe eksakt svar på hva som må være med for å få full uttelling på en prøve eller en eksamen. Løsningen nedenfor er et forslag til hva som kan gjøres.

Vi skriver inn tallene i regnearkdelen i GeoGebra i cellene A1 til A14 og lager lister både av hver uke og av begge ukene sett under ett. Så bruker vi diverse statistiske kommandoer for å finne de ulike størrelsene. Nedenfor har vi avskrift av algebrafeltet i GeoGebra av dataene for de to ukene sett under ett.

data = A1:A14 → {740, 800, 910, 635, 1090, 350, 810, 630, 480, 290, 605, 1230, 410, 900}

antall = Lengde(data) → 14

gjennomsnitt = gsnitt(data) → 705.71

kvartilbredde = Q3(data) – Q1(data) → 420

median = Median(data) → 687.5

standardavvik = stavvp(data) → 264.79

sum = Sum(data) → 9880

variasjonsbredde = Maks(data) – Min(data) → 940

Totalt sett for de to ukene ble salget på 9 880 kroner med et standardavvik på 265 kroner. Gjennomsnittlig salg per dag var 706 kroner. Salgstallene for en dag har variert med 940 kroner.

Avskrift av algebrafeltet for tallene for uke 28

data = A1:A7 → {740, 800, 910, 635, 1090, 350, 810}

antall = Lengde(data) → 7

gjennomsnitt = gsnitt(data) → 767.14

kvartilbredde = Q3(data) – Q1(data) → 275

median = Median(data) → 800

standardavvik = stavvp(data) → 213.67

sum = Sum(data) → 5335

variasjonsbredde = Maks(data) – Min(data) → 740

Avskrift av algebrafeltet for tallene for uke 29

data = A8:A14 → {630, 480, 290, 605, 1230, 410, 900}

antall = Lengde(data) → 7

gjennomsnitt = gsnitt(data) → 649.29

kvartilbredde = Q3(data) – Q1(data) → 490

median = Median(data) → 605

standardavvik = stavvp(data) → 296.99

sum = Sum(data) → 4545

variasjonsbredde = Maks(data) – Min(data) → 940

Vi ser at salget var best i uke 28 med et totalt salg på 5 335 kroner. Se tallet "sum". Samtidig er spredningen i salgstallene størst i uke 29. Både kvartilbredde, variasjonsbredde og standardavvik er størst i uke 29. Av tallene for variasjonsbredde ser vi at salget har variert med 940 kroner i uke 29 og 740 kroner i uke 28. Vi ser også at medianen for uke 29 ligger nesten 200 under medianen for uke 28, mens gjennomsnittet bare ligger cirka 110 under. Det tyder på at i uke 29 var det flere dager med lavt salg og noen få dager med høyt salg. Det passer godt med at salgsrekorden for de to ukene var fredagen i uke 29, mens dagen med lavest salg var onsdagen i den samme uka.

Medianen for uke 28 ligger over gjennomsnittsverdien mens det er omvendt for uke 29. Det betyr at i uke 28 er det noen få dager med veldig lavt salg som trekker gjennomsnittet ned, mens det er motsatt for uke 29.

Oppgaven kan også løses ved å bruke verktøyet for analyse av en variabel i GeoGebra.

ST-107 a)

Vi legger tallene inn i GeoGebra og finner følgende statistiske tall:

	Gjennomsnitt	Median	Standardavvik	Variasjonsbredde
2019	70 641	57 961	33 301	121 513
2020	62 575	54 120	55 945	214 860

Vi ser av gjennomsnittet at det var flere overnattinger i forbindelse med feriereiser i 2019 enn i 2020. Samtidig er standardavviket og variasjonsbredden større for 2020 enn for 2019. Det betyr at variasjonen mellom de 12 månedene i 2020 var stor.

Fiillat

GeoGebra-fil til oppgave ST-107 a)(GGB)

ST-107 b)

Vi velger å lage et søylediagram over tallene. Da er det kanskje enklest å bruke et vanlig regnearkprogram. Vi har brukt regnearket vi kan laste ned fra Statistisk sentralbyrå på denne statistikken som utgangspunkt.

Vi ser at i april 2020 var det svært få overnattinger. Tre måneder senere, i juli, har vi det største antallet overnattinger i en måned for de to årene. Det tyder på at spredningen var større i 2020 enn i 2019.

Årsaken til det er nok at i store deler av mars og april 2020 var Norge nedstengt på grunn av koronapandemien. Samme sommer var det ikke mulig å gjøre feriereiser til utlandet, noe som førte til at folk reiste på ferie hjemme. Dette kan forklare det høye antallet overnattinger i Trøndelag i juli 2020.

Fiillat

Regneark eksportert fra sidene til SSB(XLSX)

ST-108 a)

Klassegrensene er 4 år og 8 år. Med intervaller skriver vi det som [4, 8⟩.

ST-108 b)

Statistikken omfatter alle bilene som er 20 år eller yngre. Derfor bruker vi vanlig standardavvik. Vi nevner likevel at det er liten forskjell på de to standardavvikene når summen av frekvensene er så stor som her. (Prøv selv!)

Du kan laste ned et GeoGebra-ark med løsningen nedenfor.

Fiillat

GeoGebra-fil til oppgave ST-108(GGB)

ST-108 c)

Hvis vi snur på formelen i tipset til oppgave b), får vi frekvensen ved å multiplisere histogramhøyden med klassebredden. Histogramhøyden til den første klassen er 110 679,5 og klassebredden er 4. Frekvensen blir

$110 679, 5 \cdot 4 = 442 718$

Dette stemmer med tabellen øverst i oppgaven.

ST-108 d)

Mange har biler som er veldig gamle. I tabellen til Statistisk sentralbyrå (se kilder nederst på siden) opererer de med kategorien "Over 20 år", og vi får problemer med hvor vi skal sette den øvre grensen i denne klassen.

ST-109 a) og b)

Tallmaterialet kan grupperes på mange måter. Vi velger å gruppere tallene i grupper der klassebredden er 2. Ved å kjøre opptelling, får vi den følgende tabellen:

Vannmengde, L/s	Frekvens
[8, 10⟩	2
[10, 12⟩	4
[12, 14⟩	6
[14, 16⟩	4
[16, 18⟩	2
[18, 20⟩	2
[20, 22⟩	1

Histogrammet får vi ved å lage liste av klassegrensene og av histogramhøydene. Histogramhøydene finner vi på vanlig måte ved å dele frekvensene på klassebredden.

Histogram over de grupperte tallene i oppgaven. Illustrasjon. — Govva: Bjarne Skurdal / CC BY-SA 4.0

ST-109 c) og d)

Fra GeoGebra får vi

	Gjennomsnitt	Median	Standardavvik
Gruppert datamateriale	14,0	13,7	3,2
Ugruppert datamateriale	14,1	13,8	3,1

Vi ser at forskjellen på de grupperte og de ugrupperte statistiske størrelsene er omtrent 0,1, altså liten.

Fiillat

Vannmengde i bekken, ferdig løst(GGB)

ST-109 e)

Tallene er målinger foretatt med jevne tidsrom. Da kan det være aktuelt å lage et linjediagram for å se bedre hvordan utviklingen i vannmengde har vært.

Et slikt linjediagram lager du kanskje enklest med et vanlig regnearkprogram ved å kopiere enkeltmålingene fra regnearkdelen til GeoGebra. Diagrammet kan se ut som nedenfor.

Linjediagram over enkeltmålingene i oppgaven. Illustrasjon. — Govva: Bjarne Skurdal / CC BY-SA 4.0

Fiillat

Regneark med linjediagrammet(XLSX)

ST-110 a)

Her er det gjort en undersøkelse der det er gjort et utvalg av alle elevene. Derfor blir det riktigst å bruke utvalgsstandardavvik (empirisk standardavvik) her.

ST-110 b)

Nedenfor kan du laste ned et GeoGebra-ark med ferdig løsning.

Fiillat

Pengebruk i skolekantina(GGB)

ST-111 a)

Forslag til algoritme som tar utgangspunkt i at hvert tall mates inn separat:

Skriv til skjermen: "Dette programmet regner ut gjennomsnittet av de tallene som blir tastet inn."
Skriv til skjermen: "Skriv inn ett og ett tall og trykk enter for hvert tall. Skriv inn "x" når du er ferdig."
Så lenge vi ikke er ferdige med å skrive inn tall:
- Skriv til skjermen: "Nytt tall: "
- Ta imot input fra brukeren.
- Hvis det som kommer inn er et tall, legg til tallet i en sum og øk en teller for antall tall med 1.
- Hvis ikke (og brukeren har skrevet en "x"), er vi ferdige.
Del summen på antall tall.
Skriv til skjermen "Gjennomsnittet av tallene er <resultatet av utregningen i forrige punkt>."

Kommentar: Dersom du velger å skrive inn alle tallene samtidig med for eksempel komma mellom hvert tall, må du lage en rutine for å plukke ut tallene fra den lange tekststrengen vi da får. Dette gjør vi i den alternative løsningen nedenfor.

Alternativ løsning

Løsningen tar utgangspunkt i at alle tallene skrives inn på én gang med komma (,) mellom hvert tall (husk at desimaltall må skrives med punktum i Python).

Skriv til skjermen: "Dette programmet regner ut gjennomsnittet av de tallene som blir tastet inn."
Skriv til skjermen: "Skriv inn tallene med ett komma mellom hvert tall."
Ta imot lista med tall fra brukeren og lagre i en tekstvariabel.
Gå gjennom tekstvariabelen og legg det som står mellom hvert komma (altså hvert tall) til ei liste.
Legg sammen tallene i lista og del på antall tall.
Skriv til skjermen: "Gjennomsnittet av tallene er <resultatet av utregningen i forrige punkt>."

ST-111 b)

Kode som tar utgangspunkt i at tallene skrives inn ett og ett:

python

1print("Dette programmet regner ut gjennomsnittet "
2    "av de tallene som blir tastet inn.")
3print("Skriv inn ett og ett tall og trykk enter for hvert tall."
4    " Skriv inn 'x' når du er ferdig.")
5summen = 0           # skal bli summen av alle tallene
6antall = 0           # skal inneholde antall tall
7ferdig = False       # brukes for å stoppe innlesingen av tall
8           
9while ferdig == False:         # så lenge ferdig har verdien False
10    tall = input("Nytt tall: ")
11
12    if tall != "x":         # hvis tallet ikke er "x", dvs. et "ekte" tall
13        summen = summen + float(tall)  # legger tallet til summen
14        antall = antall + 1           # øker antall tall med 1
15    else:         # hvis tallet er en "x"    
16        ferdig = True         # med dette vil while-løkka stoppe
17
18gjsnitt = summen/antall     # regner ut gjennomsnittet
19print(f"Gjennomsnittet av tallene er {gjsnitt:.2f}.")

Alternativ løsning

Koden nedenfor tar utgangspunkt i at alle tallene skrives inn på én gang med komma mellom hvert tall. Til å skille tallene og legge dem i ei liste, bruker vi funksjonen "split", se nederst på sida.

python

1print("Dette programmet regner ut gjennomsnittet "
2    "av de tallene som blir tastet inn.")
3print("Skriv inn alle tallene med komma ',' imellom. Unngå mellomrom.")
4
5tekstinput = input()          # tar imot alle tallene
6    # konverterer tekststrengen til liste med tall (som fortsatt er tekst)
7talliste = tekstinput.split(",")
8
9for i in range(len(talliste)):
10    talliste[i] = float(talliste[i])    # konverterer alle tallene til ekte tall
11
12gjsnitt = sum(talliste)/len(talliste)   # regner ut gjennomsnittet
13print(f"Gjennomsnittet er {gjsnitt:.2f}.")

ST-111 c)

Forslag til algoritme som tar utgangspunkt i at tallene skrives inn ett og ett:

Skriv til skjermen: "Dette programmet regner ut gjennomsnittet av tall sortert i en frekvenstabell."
Skriv til skjermen: "Skriv inn ett og ett av de ulike forekomstene av måleverdier og trykk enter for hvert tall. Skriv inn "s" når du er ferdig."
Skriv til skjermen: "Nytt tall: "
Ta imot tallet fra brukeren. Hvis tallet er et tall: Legg til tallet i ei liste.
Repeter de to forrige punktene over helt til brukeren skriver en "s".
Skriv til skjermen: "Skriv inn en og en av frekvensene og trykk enter for hvert tall. Skriv inn "s" når du er ferdig."
Skriv til skjermen: "Ny frekvens: "
Ta imot tallet fra brukeren. Hvis tallet er et tall: Legg til tallet i ei liste.
Repeter de to forrige punktene over helt til brukeren skriver en "s".
Multipliser sammen tilhørende verdier for måleverdi og frekvens, summer disse og del på summen av frekvensene i frekvenslista.
Skriv til skjermen: "Gjennomsnittet er <svaret fra forrige punkt>."

Forslag til kode i Python:

python

1print("Dette programmet regner ut gjennomsnittet "
2"av tall sortert i en frekvenstabell.")
3print("Skriv inn ett og ett av de ulike forekomstene " 
4"av måleverdier, og trykk enter for hvert tall."
5" Skriv inn 's' når du er ferdig.")
6tall = 0
7talliste = []    # lager ei tom liste
8           # tar imot tall helt til det skrives en "s"
9while tall != "s":
10  tall = input("Nytt tall: ")
11  if tall != "s":             
12    tall = float(tall)
13    talliste.append(tall)  # legger tallet til i tallista
14
15frekvens = 0
16frekvensliste = []    # lager ei tom liste
17           # tar imot tall helt til det skrives en "s"
18while frekvens != "s":
19  frekvens = input("Ny frekvens: ")
20  if frekvens != "s":             
21    frekvens = float(frekvens)
22    frekvensliste.append(frekvens)  # legger tallet til i frekvenslista
23    
24summen = 0
25for i in range(len(frekvensliste)):
26  summen = summen + talliste[i] * frekvensliste[i]  # multipliserer sammen verdi og frekvens
27    
28gsnitt = summen/sum(frekvensliste)    # regner ut gjennomsnittet
29print(f"Gjennomsnittet av tallene er {gsnitt:.2f}.")

Alternativ løsning

Vi tar utgangspunkt i den alternative løsningen i oppgave b). Først skriver vi inn de ulike forekomstene av måleverdier. Så skriver vi inn frekvensene. Algoritmen kan da se slik ut:

Skriv til skjermen: "Dette programmet regner ut gjennomsnittet av tall sortert i en frekvenstabell."
Skriv til skjermen: "Skriv inn de ulike måleverdiene med ett komma mellom hvert tall."
Ta imot tallene og konverter dem til ei liste.
Skriv til skjermen: "Skriv inn frekvensene med ett komma mellom hvert tall."
Ta imot tallene og konverter dem til ei liste.
Multipliser sammen tilhørende verdier for måleverdi og frekvens, summer disse, og del på summen av frekvensene i frekvenslista.
Skriv til skjermen: "Gjennomsnittet er <svaret fra forrige punkt>."

Forslag til kode:

python

1print("Dette programmet regner ut gjennomsnittet "
2    "av tall sortert i en frekvenstabell.")
3              # tar imot alle tallene
4tallstreng = input("Skriv inn måleverdiene med ett komma mellom hvert tall: ")
5frekvensstreng = input("Skriv inn frekvensene med ett komma mellom hvert tall: ")
6        # konverterer strengene til lister med tall (som fortsatt er tekst)
7talliste = tallstreng.split(",")
8frekvensliste = frekvensstreng.split(",")
9        # konverterer alle tallene til ekte tall
10for i in range(len(talliste)):
11    talliste[i] = float(talliste[i])
12for i in range(len(frekvensliste)):
13    frekvensliste[i] = float(frekvensliste[i])
14        # multipliserer sammen måleverdi og frekvens
15summen = 0
16for i in range(len(frekvensliste)):
17    summen = summen + talliste[i] * frekvensliste[i]
18  
19gjsnitt = summen/sum(frekvensliste)    # regner ut gjennomsnittet
20
21print(f"Gjennomsnittet er {gjsnitt:.2f}.")

ST-112 a)

Forslag til algoritme:

Skriv til skjermen: "Dette programmet regner ut gjennomsnittet av et gruppert tallmateriale."
Skriv til skjermen: "Skriv inn klassegrensene med ett komma mellom hvert tall."
Ta imot tallene og konverter dem til ei liste.
Skriv til skjermen: "Skriv inn frekvensene med ett komma mellom hvert tall."
Ta imot tallene og konverter dem til ei liste.
For hvert tall unntatt det siste i lista med klassegrensene: Regn ut klassemidtpunktene ved å finne gjennomsnittet av tallet og det neste tallet i lista. Legg resultatene til i ei ny liste.
Multipliser sammen tilhørende verdier for klassemidtpunkt og frekvens, summer disse, og del på summen av frekvensene i frekvenslista.
Skriv til skjermen: "Gjennomsnittet er <svaret fra forrige punkt>."

Forslag til kode:

python

1print("Dette programmet regner ut gjennomsnittet "
2    "av et gruppert tallmateriale.")
3              # tar imot alle tallene
4klgrensestreng = input("Skriv inn klassegrensene med ett komma mellom hvert tall: ")
5frekvensstreng = input("Skriv inn frekvensene med ett komma mellom hvert tall: ")
6        # konverterer strengene til lister med tall (som fortsatt er tekst)
7klgrenseliste = klgrensestreng.split(",")
8frekvensliste = frekvensstreng.split(",")
9        # konverterer alle tallene til ekte tall
10for i in range(len(klgrenseliste)):
11    klgrenseliste[i] = float(klgrenseliste[i])
12for i in range(len(frekvensliste)):
13    frekvensliste[i] = float(frekvensliste[i])
14        # lager liste med klassemidtpunkt
15klmidtpunktliste = []
16for i in range(len(frekvensliste)):
17    klmidtpunktliste.append((klgrenseliste[i] + klgrenseliste[i+1])/2)
18        # multipliserer sammen klassemidtpunkt og frekvens
19summen = 0
20for i in range(len(frekvensliste)):
21    summen = summen + klmidtpunktliste[i] * frekvensliste[i]
22  
23gjsnitt = summen/sum(frekvensliste)    # regner ut gjennomsnittet
24
25print(f"Gjennomsnittet er {gjsnitt:.2f}.")

ST-112 b)

Her må vi se nøye på hvordan vi har funnet medianen i det nevnte regnearket. Vi må

finne hvilket tall nummer medianen er i tallrekka
finne ut hvilken klasse dette plassnummeret hører til i ved hjelp av de kumulative frekvensene
finne hvilket plassnummer medianen har i denne klassen
regne ut medianen ved hjelp av nedre klassegrense i klassen, klassebredden, plassnummeret fra forrige punkt og frekvensen i klassen

Forslag til algoritme:

Skriv til skjermen: "Dette programmet regner ut medianen i et gruppert tallmateriale."
Skriv til skjermen: "Skriv inn klassegrensene med ett komma mellom hvert tall."
Ta imot tallene og konverter dem til ei liste.
Skriv til skjermen: "Skriv inn frekvensene med ett komma mellom hvert tall."
Ta imot tallene og konverter dem til ei liste.
Regn ut hvilket nummer ("totalnummer") medianen er i hele tallrekka ved å summere frekvensene, legge til 1 og heltallsdividere på 2.
Sett kumulativ frekvens lik 0.
Sett klassenummer lik 0.
Repeter så lenge totalnummeret er større enn kumulativ frekvens pluss frekvensen til klassen med nummer lik klassenummeret.
- Øk den kumulative frekvensen med frekvensen til klassen med nummer lik klassenummeret.
- Øk klassenummeret med 1.
Finn plasseringsnummeret i klassen ved å ta totalnummeret og trekke fra kumulativ frekvens.
Regn ut medianen ved å ta nedre klassegrense og legge til klassebredden multiplisert med plassnummer i klassen delt på frekvensen til klassen.

python

1print("Dette programmet regner ut gjennomsnittet "
2    "av et gruppert tallmateriale.")
3              # tar imot alle tallene
4klgrensestreng = input("Skriv inn klassegrensene med ett komma mellom hvert tall: ")
5frekvensstreng = input("Skriv inn frekvensene med ett komma mellom hvert tall: ")
6        # konverterer strengene til lister med tall (som fortsatt er tekst)
7klgrenseliste = klgrensestreng.split(",")
8frekvensliste = frekvensstreng.split(",")
9        # konverterer alle tallene til ekte tall
10for i in range(len(klgrenseliste)):
11    klgrenseliste[i] = float(klgrenseliste[i])
12for i in range(len(frekvensliste)):
13    frekvensliste[i] = float(frekvensliste[i])
14        # regner ut hvilken plassering medianen har i tallrekka
15totalnummer = (sum(frekvensliste) + 1)//2
16
17kumfrekvens = 0
18klasse = 0
19    # finner rett klasse og kumulativ frekvens for klassen over
20while kumfrekvens + frekvensliste[klasse] < totalnummer:
21    kumfrekvens = kumfrekvens  + frekvensliste[klasse]
22    klasse = klasse + 1
23    
24         # regner ut plassering i klassen     
25klasseplassnummer = totalnummer - kumfrekvens
26        # regner ut medianen
27median = klgrenseliste[klasse] + (klgrenseliste[klasse+1] - klgrenseliste[klasse]) \
28    * klasseplassnummer /frekvensliste[klasse]
29    
30print(f"Medianen er {median:.2f}.")

Guoskevaš sisdoallu

Fágaávdnasat

Sentralmål og spredningsmål med GeoGebra

Her ser vi hvordan vi kan bruke GeoGebra til å finne ulike statistiske størrelser i et tallmateriale ved bruk av såkalte lister.

Fágaávdnasat

Strenger

Her får du en kort innføring i strenger og strengesøk.

Kilder

Statistisk sentralbyrå (u.å.). Statistikkbanken. Omsetning i varehandel. Hentet 27. januar 2021 fra https://www.ssb.no/statbank/table/04776

Statistisk sentralbyrå (u.å.). Statistikkbanken. Overnattingar. Hentet 27. januar 2021 fra https://www.ssb.no/statbank/table/08403/

Statistisk sentralbyrå (u.å.). Statistikkbanken. Reiseundersøkelsen. Hentet 27. januar 2021 fra https://www.ssb.no/statbank/table/06921/

Statistisk sentralbyrå (u.å.). Statistikkbanken. Bilparken. Hentet 7. september 2021 fra https://www.ssb.no/statbank/table/08581/

ST-101

ST-102

ST-103

ST-104

ST-105

ST-106

ST-107

ST-108

ST-109

Fiillat

ST-110

ST-111

ST-112

Løsninger

Fasit

Fasit

Fiillat

Fasit

Fasit

Fiillat

Fiillat

Fiillat

Fiillat

Fiillat

Fiillat

Avskrift av algebrafeltet for tallene for uke 28

Avskrift av algebrafeltet for tallene for uke 29

Fiillat

Fiillat

Fiillat

Fiillat

Fiillat

Fiillat

Alternativ løsning

Alternativ løsning

Alternativ løsning

Guoskevaš sisdoallu

Kilder

Njuolggadusat teavstta geavaheapmái "Statistikk – blandede oppgaver"