Bearbeiding av datamaterialet
Ei datamatrise er ein tabell som inneheld informasjon om verdiane på variablane for kvar enkelt eining.
- Verdiane
- er svara personane har gitt.
- Variablane
- er eigenskapane de undersøker.
- Einingane
- er personane som har blitt spurde.
Dersom de gjennomfører ei undersøking basert på eksisterande statistikk, er ofte datamatrisa utgangspunktet for prosjektet. Men har de sjølv gjennomført ei spørjeundersøking, må de bearbeide dei utfylte spørjeskjemaa til ei slik matrise.
Eksempel på datamatrise
Svara i spørjeskjemaet plottar du inn på følgande måte i datamatrisa:
- Nummerer spørjeskjemaa og skriv inn nummeret til det spørjeskjemaet (den eininga) du behandlar.
- Skriv eit 1-tal for menn og eit 2-tal for kvinner.
- Skriv 1-tal for lønna deltidsarbeid og 2-tal for ikkje-lønna deltidsarbeid.
- Skriv beløp i kroner for gjennomsnitteleg brutto månadslønn (det informanten får utbetalt).
- Skriv eit tal for det skuletrinnet informanten går på (8 for åttande klasse, 9 for niande klasse osv.)
Når du er ferdig, plottar du inn det neste spørjeskjemaet (den neste eininga).
Eining | Kjønn | Deltidsarbeid | Månadslønn | Skuletrinn |
---|---|---|---|---|
1 | 2 | 2 | 0 | 10 |
2 | 1 | 1 | 1200 | 9 |
3 | 1 | 1 | 900 | 8 |
4 | 2 | 2 | 0 | 9 |
5 | 2 | 1 | 2000 | 10 |
6 | 1 | 2 | 0 | 8 |
7 | osv. | osv. | osv. | osv. |
8 | osv. | osv. | osv. | osv. |
Alt skal bli tal
Når vi lagar ei datamatrise, legg vi inn talverdiane som personane har oppgitt i spørjeskjemaet, som for eksempel månadslønn og klassetrinn i matrisa ovanfor. Også alle svaralternativa som ikkje er tal i utgangspunktet (ja/nei, mann/kvinne), blir definerte om til tal.
Dette arbeidet kan gjerast i eit rekneark eller i eit statistikkprogram som NSDstat. Vi lagar matriser for at datamaterialet skal bli enklare å analysere. Ved å legge inn svara frå spørjeskjemaet i ei matrise slik illustrasjonen viser, blir det for eksempel enkelt å rekne ut kva som er gjennomsnittleg månadslønn for alle som har deltidsarbeid, og kva som er gjennomsnittet for dei ulike skuletrinna.
Dersom de har valt å ta utgangspunkt i eksisterande statistikk, er datamaterialet gjerne ferdig bearbeidd i ei datamatrise. De bør då bruke tid på å setje dykk inn i dokumentasjonen som skal følge med datasettet. Her skal det gå fram kva for spørsmål som er stilte, korleis materialet er samla inn og så vidare.
Omkoding
Det er vanleg at ein må kode om enkelte av variablane i datasettet for å få svar på bestemte spørsmål. Dette gjeld analysar av både eigne og eksisterande datasett. Å kode om ein variabel vil seie at ein endrar verdiane som er mogleg å ha på han.
Variabelen "brutto månadslønn" i eksempelmatrisa vår inneheld i utgangspunktet det kronebeløpet respondentane har oppgitt i spørjeskjemaet. Men dersom analysen eller problemstillinga krev det, kan vi definere alle beløp over for eksempel 2000 kroner til verdien "høg lønn". Alle beløp mellom 1000 og 1999 kroner kan definerast som "middels lønn", og alle beløp under 1000 kroner som "låg lønn". På denne måten får variabelen maksimalt tre ulike verdiar, noko som gjer det lettare å få oversikt over resultata. Ved å kode om variabelen på denne måten kan vi også bruke han i krysstabellar.
I kvalitative forskingsopplegg er bearbeiding og systematisering av datamaterialet i større grad ein del av sjølve analysearbeidet. Vi skal derfor komme nærmare inn på dette på fagsida om analyse. Blant forskarar er det vanleg å transkribere intervju, det vil seie å skrive ut ordrett det som blir sagt på lydopptaket.
Dette er ein ganske tidkrevjande prosess fordi det tek mange gonger lengre tid enn opptaket i seg sjølv varer. Vi tilrår derfor ikkje at de transkriberer intervjua. I staden bør de høyre på dei – gjerne fleire gonger. Undervegs kan de gjere notat om særskilt interessante ting som blir sagde. Når de skal skrive forskingsrapporten, kan de så transkribere dei sekvensane som de vil sitere.