Fagstoff

Datakvalitet og feilkilder

Publisert: 23.07.2010, Oppdatert: 03.03.2017
  • Innbygg
  • Enkel visning
  • Lytt til tekst
  • Skriv ut

Datakvalitet og feilkilder i GIS er nevnt i ulike sammenhenger. I forbindelse med datafangst blir det sagt at dette er en avveining mellom behov for kvalitet og kostnader. I forhold til kostnader, er det viktig på forhånd å vurdere brukerbehovene for å fastsette kvalitetskravene til GIS. Hensynet til kostnadene kan medføre at det velges dårligere datakvalitet enn det som ville vært optimalt ut fra brukerens behov.

 

GIS kartlagGIS kartlag.
Opphavsmann: Statens kartverk

 

BrannKartdata brukes i forbindelse med brann.
Opphavsmann: ESRI

 

Kunnskap om datakvalitet er svært viktig i forbindelse med kartografiske analyser. Gjennom analysegangen vil kvaliteten forandre seg og normalt svekkes. Data med lav kvalitet vil gjennom en analyse resultere i like lav eller lavere kvalitet.

De viktigste feilkildene kan generelt beskrives som feil knyttet til geometrien og posisjoneringen av et objekt, og feil i egenskapene som er knyttet til objektet eller en celle. Ved bruk av GIS er det derfor viktig å være klar over feilene som gjøres, og ta potensielle feilkilder i betraktning når GIS brukes.

Metadata

I tillegg kan informasjon om dataenes opprinnelse og formål være nyttig for å vurdere hvordan dataene bør anvendes. Denne type informasjon om de geografiske dataene betegnes som metadata. Metadata er data om data. I denne sammenheng informasjon om geografiske data.
Metadata kan for eksempel gi informasjon om hvordan og når dataene er innsamlet, format, nøyaktighet, hvem som har samlet inn dataene, eller eier, formålet med innsamlingen og hva slags informasjon som finnes i dataene.
Gjennom metadata vil brukerne kunne vurdere om de data som er tilgjengelige er egnet til sitt bruk og sitt formål.

Originale feilkilder uavhengig av GIS-behandlingen

Det er her snakk om feilkilder som kan være oppstått ved registreringer og målinger i felt, ved bearbeiding av dataene, ved endringer i felt eller på grunn av manglende fullstendighet og oppløsning i dataene.
Dette omfatter feil og unøyaktigheter i måleinstrumenter som GPS og satellittsensorer. Videre oppstår det feil under selve kartfremstillingen. Dette omfatter unøyaktighet i kartkonstruksjonsinstrumenter eller i forbindelse med rentegning av kart. Det er viktig å være oppmerksom på om kartet er oppdatert. Kartet gir vanligvis øyeblikksbilder, mens virkeligheten er i stadig forandring. Feil kan oppstå ved at nye fenomener oppstår i felt, fenomener som ikke er ivaretatt i kartet.

Eksempel på en slik feil kan være ved endring av veiadresser etter at kartet er tilrettelagt. I det tilgjengelige kartet er denne veiadressen plassert med en nøyaktig geografisk posisjon på opprinnelig sted. Den nøyaktige posisjonen er oppgitt i egenskapsdataene (attributtene). Dersom kartet brukes i forbindelse med ambulanseutrykning eller ved brann, så kan dette få store konsekvenser.

Feil oppstår i samband med GIS-behandlingen

Ofte er et strekkart utgangspunktet for de digitale kartdata. Under den digitale datainnsamlingsprosessen vil unøyaktigheter i posisjoneringen av geometriske objekter forplantes videre. Et vanlig mål for posisjonsnøyaktighet er middelfeilen. Dette er et statistisk mål som avgrenser et område. Innenfor dette området er det en viss sannsynlighet for at det virkelige punktet befinner seg.

Digitaliseringsbord og -plater skal gi nøyaktig posisjonering for manuell digitalisering fra analoge kart, tegninger og bilder. Men i praksis kan følgende feilkilder oppstå: 
* interne defekter i digitaliseringsbordet
* feil i elektronikken i digitaliseringsbordet (f.eks. interpolasjonsrutiner)
* eksterne elektromagnetiske felter (kraftlinjer, magnetiske objekter, dataskjermer og annet datautstyr)
* magnetiske partikler eller andre forstyrrende partikler på tegningen, bildet eller kartet (blyantstreker kan forstyrre digitaliseringsbord)

Under prosesseringen av kartdata i datamaskinen vil nye feil oppstå og eksisterende feil forplantes og forsterkes. Et GIS-system antar imidlertid at datakilden er entydig, digitaliseringen skjer feilfritt, grenser er klart definerte, feilfrie, riktig tegnet og at eventuelle definerte intervaller for klasser er de beste og like riktige over hele kartbladet.

Brukeren av geografiske data må derfor kunne vurdere feilene, særlig under prosesseringen og analyseprosessen. Denne kunnskapen om feilforplantning er avgjørende for å kunne vurdere kvaliteten av et digitalt kartprodukt.

De viktigste feil som skjer under prosesseringen er:

Konvertering av vektordatasett til raster.Konvertering av vektordatasett til raster.
Opphavsmann: Narom


Overlagringsprosess_smaa_polygonerSmå polygoner uten mening oppstår under overlagringsprosessen.
Opphavsmann: Narom


1. Geometriske feil som oppstår under digitaliseringen. Hovedkildene er feil i kildekartene (målestokk, strektykkelse) og med den digitale representasjonen av digitaliserte linjer. Rette linjer kan digitaliseres med små feil, mens det i sterkt kurvede linjer innføres mye feil, avhengig av hvor mange punkter som registreres.
2. Geometriske feil som oppstår under rastrering eller vektorisering. Eksemplet er et vektordatasett som konverteres til raster med en gitt oppløsning. Dette gir en viss svekking av datakvaliteten på grunn av den grove oppløsningen. Det vektoriserte rasterbilde fremtrer som et meget generalisert kart i forhold til utgangspunktet.
3. Geometriske feil som oppstår ved overlagring av polygongrenser. Ved overlay-prosesser vil det dannes en mengde små polygoner som er resultat av feil i de opprinnelige temalagene.
4. Problemer med grensesettingen. En virkelig skarpt definert grense eksisterer ikke i mange sammenhenger. Det skyldes hovedsakelig at naturlige variasjoner er kontinuerlige, mens vi vanligvis bare greier å ta prøver eller observere i diskrete punkter. Det er ofte vanskelig å vite hvordan grensene som er funnet, skal trekkes. En rett linje i en liten målestokk vil gjerne bli til en hakkete linje i en større målestokk hvor flere detaljer kan fremstilles.
5. Egenskapsfeil som oppstår under en digital kartanalyse. Eksempel på dette kan være at hovedkilden av feil i en folie er posisjoneringsfeil og feil innenfor egenskapstabellen, det vil si at enkelte polygoner har fått tilordnet feil egenskap. Dette kan også uttrykkes som sannsynligheter, nemlig sannsynligheten for at en bestemt verdi ved en bestemt lokalisering i et temalag henholdsvis er korrekt eller ikke korrekt.

Det er viktig å huske at all kartlegging er en forenkling av virkeligheten. I virkeligheten er de fleste grenser mellom arealkategorier uklare og flytende. Dette skaper et problem i forhold til digital fremstilling, som gjerne er en svart-hvit-fremstilling med klare grenser mellom kategoriene. De innsamlede grunnlagsdataene har også en usikkerhet knyttet til seg. Som kritisk bruker er det viktig å legge opp faste kontrollrutiner underveis i prosessen. Først og fremst fordi datamodeller gir et misvisende forenklet bilde av virkeligheten. Dette innebærer at data fremstilles som mer presise og sikrere enn de egentlig er, noe som fører til at en kan tillegge datamodellen større pålitelighet enn det egentlig er grunnlag for.

Relatert innhold

Generelt