Hopp til innhold
Veiledning

Bearbeiding av datamaterialet

Dersom dere har gjennomført en kvantitativ undersøkelse, må datamaterialet systematiseres i en matrise.

Datamatriser

En datamatrise er en tabell som inneholder informasjon om verdiene på variablene for hver enkelt enhet.

Verdiene
er svarene personene har gitt.
Variablene
er egenskapene dere undersøker.
Enhetene
er personene som har blitt spurt.

Dersom dere gjennomfører en undersøkelse basert på eksisterende statistikk, er ofte datamatrisen utgangspunktet for prosjektet. Har dere imidlertid selv gjennomført en spørreundersøkelse, så må de utfylte spørreskjemaene først bearbeides til en datamatrise.

Eksempel på datamatrise

Svarene i spørreskjemaet plottes inn på følgende måte i datamatrisen:

  • Nummerer spørreskjemaene, og skriv inn nummet til det spørreskjemaet (enheten) du behandler.
  • Skriv et 1-tall for menn og 2-tall for kvinner.
  • Skriv 1-tall for lønnet deltidsarbeid og 2-tall for ikke lønnet deltidsarbeid.
  • Skriv beløp i kroner for gjennomsnittelig brutto månedslønn (det informanten får utbetalt).
  • Skriv et tall for det skoletrinnet informanten går på (8 for åttende klasse, 9 for niende klasse osv.)

Når du er ferdig, plotter du inn neste spørreskjema (enhet).

DATAMATRISE – VARIABLER

Enhet

Kjønn

Deltidsarbeid

Månedslønn

Skoletrinn

1

2

2

0

10

2

1

1

1200

9

3

1

1

900

8

4

2

2

0

9

5

2

1

2000

10

6

1

2

0

8

7

osv.

osv.

osv.

osv.

8

osv.

osv.

osv.

osv.

Alt skal bli tall

Når vi lager en datamatrise, legger vi inn tallverdiene som personene har oppgitt i spørreskjemaet, som for eksempel månedslønn og klassetrinn i matrisen ovenfor. Også alle svaralternativene som ikke er tall i utgangspunktet (ja/nei, mann/kvinne), blir definert om til tall.

Dette arbeidet kan gjøres i et regneark eller i et statistikkprogram som NSDstat. Vi lager matriser for at datamaterialet skal bli enklere å analysere. Ved å legge inn de besvarte spørreskjemaene i en matrise slik illustrasjonen viser, blir det for eksempel enkelt å regne ut hva som er gjennomsnittlig månedslønn for alle som har deltidsarbeid, og hva som er gjennomsnittet for de ulike skoletrinnene.

Dersom dere har valgt å ta utgangspunkt i eksisterende statistikk, er gjerne datamaterialet ferdig bearbeidet i en datamatrise. Dere bør da bruke tid på å sette dere inn i dokumentasjonen som skal følge med datasettet. Her skal det framgå hvilke spørsmål som er stilt, hvordan materialet er samlet inn og så videre.

Omkoding

Det er vanlig at en må kode om enkelte av variablene i datasettet for å få svar på bestemte spørsmål. Dette gjelder analyser av både egenproduserte og eksisterende datasett. Å kode om en variabel betyr at en endrer verdiene som er mulig å ha på den.

Variabelen "brutto månedslønn" i eksempelmatrisen vår består i utgangspunktet av det kronebeløpet respondentene har oppgitt i spørreskjemaet. Dersom analysen eller problemstillingen krever det, kan vi imidlertid definere alle beløp over for eksempel 2000 kroner til verdien "høy lønn". Alle beløp mellom 1000 og 1999 kroner kan defineres som "middels lønn", og alle beløp under 1000 kroner som "lav lønn". På denne måten får variabelen maksimalt tre ulike verdier. Ved å kode om variabelen på denne måten kan vi også bruke den i krysstabeller.

Systematisering av kvalitative data

I kvalitative forskningsopplegg er bearbeiding og systematisering av datamaterialet i større grad en del av selve analysearbeidet. Vi skal derfor komme nærmere inn på dette på fagsida om analyse. Blant forskere er det vanlig å transkribere intervjuer, det vil si å skrive ut ordrett det som blir sagt på lydopptaket.

Dette er en ganske tidkrevende prosess fordi det tar mange ganger lengre tid enn opptaket i seg selv varer. Vi anbefaler derfor ikke at dere transkriberer intervjuene. Istedenfor bør dere høre på dem – gjerne flere ganger. Underveis kan dere gjøre notater om særskilt interessante ting som blir sagt. Når dere skal skrive forskningsrapporten, kan dere så transkribere de sekvensene som dere vil sitere.