Oppgaver med store datasett
Før du prøver deg på oppgavene, bør du gå gjennom fagstoffsiden som hører til teorisiden "Behandling av store datamengder i Python".
Når vi jobber med en dataframe i Python, har vi av og til bruk for kommandoen transpose().
a) Hva gjør kommandoen transpose()?
b) Vi har en dataframe som ser ut som tabellen nedenfor dersom du skriver den ut:
Ski | Sykler | Skøyter | |
---|---|---|---|
2018 | 1 | 2 | 3 |
2019 | 4 | 5 | 6 |
2020 | 7 | 8 | 9 |
Hvordan ser denne dataframen ut dersom du bruker transpose() på den?
c) Gir tabellen i løsningsforslaget til oppgave b) den samme informasjonen som tabellen i oppgaveteksten?
Koronaviruset påvirket nordmenns reisevaner i stor grad. I denne oppgaven skal vi se på hvordan reisevanene våre har endret seg fra perioden like før koronaviruset begynte å spre seg, og fram til i dag.
I fila "Reiser" nedenfor finner du en oversikt over ulike reiser nordmenn har gjennomført mellom juli 2018 og juni 2020. I oppgaven kan du bruke fila vi har lagt ut, eller hente tallene selv fra Statistisk sentralbyrå. (Pass på at du ikke velger noen av variablene som handler om kjønn, da kan du få problemer med å lage diagrammer.)
a) Last ned datafila. Den har et kryptisk navn, så døp om filnavnet til "Reiser" og pass på at filetternavnet er "csv". Importer fila i programmet ditt. Bruk print()-funksjonen for å se hvordan den ser ut.
Fiillat
- Reiser(CSV)
b) Lag en grafisk framstilling som viser hvordan nordmenns reisevirksomhet har endret seg i denne perioden.
c) Kommenter utviklingen av reiser.
Fila Kulturskoleutgifter.csv gir en oversikt over netto driftsutgifter til kommunale kulturskoler for noen tilfeldig utvalgte kommuner i Norge. Både store og små kommuner er med i utvalget. Tallene viser utgiftene per innbygger mellom 6 og 15 år i tidsrommet 2015 til 2019. Fila er hentet fra SSBs statistikkbank.
Fiillat
- Kulturskoleutgifter(CSV)
a) Les fila inn i Python.
b) Endre overskriftene slik at de bare inneholder årstallene.
c) Finn ut hvor mye de utvalgte kommunene bruker i snitt per innbygger.
d) Lag en grafisk framstilling som viser hvordan utgiftene til kulturskole har endret seg i de fem årene fra 2015 til 2019.
e) Følg lenka i a) til SSB. Der finner du grunnlagstallene til denne oppgaven. Velg ut ti (eller flere) kommuner. Vær oppmerksom på at kommuner kan stå oppført to ganger, eller de kan ha blitt slått sammen med andre kommuner. Gjør nå det samme med dine egne tall som du har gjort i deloppgavene a) til d).
f) Prøv å lage ulike framstillinger som viser to og to kommuner mot hverandre.
g) Ser du noen forskjeller mellom store og små kommuner? Kan du lage en framstilling som viser dette?
Finn en statistikk på ssb.no om et emne du er interessert i. Last ned ei csv-fil. Lag ulike statistikker og prøv deg fram. Presenter funnene dine skriftlig eller muntlig.