Tanker (og noen fakta) om kartdata

Under og etter paneldebatten på GeoForum om “Gratis kartdata og fri programvare – hvilken påvirkning kan dette ha på geomatikkbransjen?” har jeg tenkt endel rundt temaet kartdata, kartverket, frigivelse og OpenStreetMap (OSM). Dette er et tema jeg også har vært inne på før, som startet en ganske god debatt i kommentarfeltet. Jeg ser dog at jeg selv kanskje har fått både litt mer innsikt og blitt litt mer nyansert, samt at jeg sitter med enda flere spørsmål, derfor tar jeg opp tråden igjen. Håpet er å opplyse noen, men kanskje like mye bringe på banen folk som kan mer enn meg, slik at de kan bidra med ytterligere informasjon.

Noen overordnede spørsmål:

  1. OpenStreetMap blir ofte trukket frem i denne diskusjonen. Hva er fordelene og ulempene med disse dataene i forhold til “indrefileten” Kartverket (med flere, se under) sitter på?
  2. Er det egentlig Kartverket som sitter på alle dataene man ønsker å frigi? Hvilke data vil man ha frigjort når man sier at kartdataene fra kartverket burde være fritt tilgjengelige?

Men, først av alt vil jeg understreke, som vi så både på GeoForum og som Martin Bekkelund har påpekt: avgjørelsen om hvorvidt kartverket skal frigi kartdataene “sine” er en politisk beslutning.

Kvalitet
Hva skiller “kartverkets data” fra dataene til OpenStreetMap? Kvalitet vil mange i “kartbransjen” si. Hva er så kvalitet? ISO 9000 (Wikipedia) definerer kvalitet som:

Helheten av egenskaper en enhet har og som vedrører dens evne til å tilfredsstille uttalte og underforståtte behov.

Vi ser jo fort at kvalitet må tolkes i sammenheng med hva man skal bruke kartdataene til. Men, jeg tror også jeg begynner å skjønne mer hva “kartmenneskene” (i motsetning til det jeg, for enkelhets skyld, vil kalle “datamenneskene” i det vidre) legger i “kvalitet”. De tenker nøyaktighet, alså at du kan sette et tall på hvor nøyaktig f.eks et hus er tegnet inn, hvor en elv går eller hvordan norges kystlinje ser ut.

Et viktig spørsmål er jo hva som er viktig. Er det “bedre kvalitet” å ha et hus med på et kart, men med en unøyaktighet på 3-4 meter? Er det best at en vei er på centimeteren nøyaktig tegnet inn på kartet slik den ble bygget for 10 år siden, eller er det best med en vei basert på et GPS-track fra i går? Jeg tror mye avhenger av brukssituasjonen, og det ser vi jo også i definisjonen på kvalitet fra ISO.

Typer kartdata
I tillegg burde man tenke over følgende: kartdata (som i “det du ser når du tar opp et norgeskart”) består av minst tre-fire-fem ganske distinkte typer data (selv om jeg ikke kan huske å ha sett dette nevnt i noe pensum), here goes:

  • “Informasjon om bakken”: Her tenker jeg på informasjon som: elver, bekker, vann, kystlinjer, skoger, høydekurver, kort og godt det som hadde vært der uavhengig om vi mennesker hadde gjort noe med verden (dog, jeg vil vel også inkludere ting som dyrka mark, tettskog, myrer og oppdemte vann etc etc i denne kategorien).
  • Infrastruktur. Typisk veier. Og jernbanelinjer, trikkelinjer, gang og sykkelveier, parkeringsplasser, stier, ferjeruter, bygninger og den type ting. Altså ting vi mennesker har lagd, men som tar opp plass i geografien.
  • Administrative inndelinger. Det som egentlig ikke finnes i naturen. Eiendomsgrenser, samt kommune-, fylkes- og riksgrenser er vel det beste eksempelet her. Dette er konsepter vi mennesker har kommet opp med og som (så lenge vi ikke markerer med gjerder eller har latt gå langs naturlige skillelinjer som elver) elger og ulver gir pokker i.
  • Det vi liker å kalle POIer, altså Points Of Interest. Dette kan være eksempelvis severdigheter, bensinstasjoner, bussholdeplasser, utsiktspunkter eller fotobokser, alt etter hva du finner “interessant”.
  • Ortofoto, eller det “vanlige dødelige” kaller flybilder. Dette er jo egentlig ikke kart, og tidligere ble disse dataene nesten bare brukt i prosessen med å lage et kart. Dog, i dag forventer man å finne dette på et nettkart. Her er en kilde norgeibilder.no, som vi jo ser er et samarbeid mellom Kartverket, Skog og Landkap og Statens Vegvesen

Et poeng mange påpeker (med rette) er at OpenStreetMap har mye mer POIer enn kartverkets data. Og POIer er bra. Det er flott at disse samles inn, noe man kan dra nytte av i mange sammenhenger. Spørsmålet er bare om det kan forventes at kartverkets data skal inneholde dette?

Hvilke data har kartverket?
Landdivisjonen i kartverket opererer med en rekke produkter, fra N5000 til FKB. Dette er datasett med varierende generalisering og detaljgrad. I tillegg finnes det jo (som man kanskje ofte glemmer, ihvertfall gjør desverre ofte jeg det), en Sjødivisjon i kartverket. Disse har også en rekke produkter: Offisielle elektroniske sjøkart (ENC-er), Hovedkartserien, Havnekartserien, Kystkartserien, Overseilingskartserien og Fiskerikartserien.

Ser vi på de WMS-tjenestene kartverket tilbyr finner vi en rekke “kartlag” her også, i hovedsak: “Topografisk norgeskart” som baserer seg på N50, N250, N500 og N1000 samt FKB, i tillegg til rasterkart (“scannede papirkart”), sjøkart, dybdatata, administrative grenser, sjøgrenser samt endel “organisatoriske data”.

Hvor kommer “kartverkets” data fra?
Kartverkets data, hvis vi nå tenker på det kartet vi finner på norgeskart.no kommer fra en rekke kilder. Som vi ser nederst i kartet står det en attribution til: Statens kartverk, Geovekst og kommuner.

Statens kartverk er greit: det er jo de som står for kartdataene her i landet? Hva gjør så de to andre der? Geovekst og kommuner? Geovekst er et sammarbeid mellom Statens vegvesen, Energiforsyningen, Kommunene, Statens kartverk, Telenor og Landbruket. Disse arbeider for det formål å:

[..] gjennomføre felles kartleggingsprosjekter, etablere og vedlikeholde et felles sett av geografiske data som tilfredstiller et bredt brukerbehov. Gjennom samfinansiering kan det produseres større mengder data samtidig som det blir rimeligere for hver av partene.

Vi legger merke til at det er 6 (store) kommuner som står utenfor Geovekst, dette er Bærum, Drammen, Stavanger, Bergen og Trondheim samt Oslo. Men Oslo er ikke nevnt vi attribution linken engang: dog, det står på siden: “Dataene for Oslo kommune er ikke like detaljerte som for resten av landet”. Noe som kort og godt betyr at Oslo har valgt å holde seg unna samarbeidet om produktet FKB (Felles KartdataBase, bedre kjent som “de mest detaljerte dataene”).

Så, “kartverkets data” holder ikke helt spør du meg. Ja, kartverket koordinerer mye, men de eier ikke alle dataene. Dette er viktig å ha i bakhodet når man snakker om frislipp av data.

Kan OpenStreetMap måle seg?
Ja! Og nei! Dette er et vanskelig tema, ref spørsmålet om “hva er kvalitet”. På rene adminstrative data kan nok OSM måle seg, gitt at de får tak i de samme dataene som kartverket. På veier er OSM meget gode i mange deler av landet. De er OPPDATERTE! Bygninger har de imponerende mye av, og i konteksten “bakgrunnskart” er de absolutt nøyaktige nok. Stedsnavn er de gode på (folk med lokalkjennskap kan jo legge inn!). Stier, sykkelveger etc er de også gode på. POIer er de særdeles gode på! 3 av 5 av mine kategorier altså. Men hva med de andre to? Flybilder og “bakkedata”? Jeg tror dette er veldig enkelt: dette er data som er vanskelig å samle inn med GPS. Det er sliktsomt å gå eller kjøre langs Mjøsa for å finne den nøyaktige formen på dette, og det å tegne høydekurver, eller finne det nøyaktige elveleiet til Glomma med en GPS høres slitsomt ut. Og, flyfotoene og disse dataene henger nøye sammen. De fleste kartdataene blir nemlig produsert på grunnlag av flyfoto. Dog, i dag blir høydedata mer og mer produsert på grunnlag av laserscanninger, men man kan (og har i mange år fått) dette fra flyfoto også. Jeg tror dermed vi er inne på noe viktig i Vegard Engens kommentar til mitt forrige innlegg om temaet, når han skriver:

Det jeg ønsker meg mest fra Statens Kartverk, er egentlig høydedataene samt markslags-data (skoger, vann, fjell) osv. Dette er ting som er litt vanskelig å samle inn selv.

Her vil jeg gjerne få føye til: nesten umulig å samle inn helt selv uten dyrt og profesjonelt utstyr.

Så, hva burde deles?
Som sagt over: det viktigste er kanskje å dele markslags (eller i vidre forstand det jeg kalte) bakkedata, samt høydekurver og orthofoto. Får man frigitt dette kommer man langt. Da kan mange smarte folk lage smarte tjenester. Men, jeg er litt skeptisk når Engen kommenterer vidre:

Det første jeg ville brukt høydedataene til, var å produsere ortorektifiserte flyfoto over Bergen på dugnadsbasis Dette ville vært en flott kilde å bruke i OSM. Spesielt for bygninger er

Ikke fordi jeg mener at OSM-gjengen ikke ville klart å lage meget gode data basert på dette (og ikke for bare Bergen får vi håpe), men fordi denne jobben sitter det folk som er finansiert (på en eller annen måte) over skatteseddelen min og produserer i dag. Dermed synes jeg disse burde gjøre det, og vi alle burde nyte godt av det! Dog, intill dette blir gjort synes jeg det er flott at noen ildsjeler tar seg bryet med å jobbe med det.

Kilder til kartdata (mer eller mindre frie)
Sånn helt til slutt: Jeg nevnte Skog og Landskap sitt produkt “Kilden til arealinformasjon” i inlegget om GeoForum, men kilden er til mer enn arealinformasjon. Ved å ta en titt på mulige kartlag i klienten her finner vi en rekke offentlige institusjoner som tilbyr data som WMS:

Og såklart OpenStreetMap

PS: i arbeidet med denne listen aner jeg en oppfølgingspost! Følg med!

Konklusjon
Dette er ikke et enkelt, oversiktlig tema, og jeg har nok ikke vært utdypende i det hele tatt. Håper dog at noen har nytte av å lese gjennom her, og har jeg bomma på detaljer på vær så snill å si fra. Jeg påberoper meg ikke å kunne eller vite alt, så finner du feil si fra. Har du synspunkter, kommentarer eller vil diskutere saken nærmere er kommentarfeltet åpent for alle som makter å føre en diskusjon på sakling nivå. Det pleier ikke å være noe problem her på bloggen, så fyr løs!

10 thoughts on “Tanker (og noen fakta) om kartdata

  1. Alexander S. Nossum

    Som vanlig bra post!

    Temaet er absolutt verdig diskusjon. Det er uten tvil en vrien situasjon at det er mange “eiere” innblandet og at noen velger å stå utenfor hele opplegget.

    I en ideell verden kunne deler av geovekst sin rådata vært sluppet, men da ville det umiddelbart kommet “vil ha mer/alt”.

    Geovekst/norgedigitalt har uten tvil den beste dataen iforhold til at de faktisk gir en kvalitetsgodkjenning på det – noe fks osm ikke gjør. Dette er noe som blir viktigere og viktigere tror jeg. Men, det er ikke alltid behov for denne kvaliteten, jf. Google maps og OSM. Kartverrket har jo sluppet “rådata” til N5000-kartene sine i både shape, sosi og tilogmed powerpoint(!). Det holder for noen, ofte privatpersoner på mobil og nett som egentlig har kravene; er veien der? Er huset der? Og ikke; er veien plassert med 1 cm nøyaktighet. Hvordan et frislipp av noe slikt kan skje i praksis vet jeg ikke, men jeg tror det snart må skje en differansiering på privat/bedrift og nøyaktighet på dataen. Kanskje en slags “freemium”-løsning hadde fungert?

    Btw. Rediger litt på posten din og send til Posisjon!

  2. Knut Jetlund

    Det er interessante problemstillinger du drar opp her, såpass at jeg får lyst til å kommentere. Først og fremst de to overordnede spørsmålene, men også litt generelt rundt dette med kvalitet. For det første så er det heldigvis ikke slik at alle i “kartverdenen” ser på kvalitet kun som stedfestingsnøyaktighet. Det er kun en av 16 typer kvalitet vi opererer med i ISO 19100-standardene for geografisk informasjon, der ISO 19157 definerer prinsipper for kvalitet på geografisk informasjon. Av andre typer kan jeg blant annet nevne fullstendighet (manglende data og overskytende data), som du jo også er inne på. Fullstendighet kan i mange sammenhenger være vel så viktig som stedfestingsnøyaktighet, ikke minst for vegnettverk.

    Og nettopp fullstendighet anser jeg også som et av ankepunktene mot OpenStreetMap. Da vi i Statens vegvesen skulle gjennomføre et testprosjekt med en ruteplanlegger for syklister i Hamarområdet (se http://www.sykkelveg.no/Hamar) tok vi naturlig nok utgangspunkt i våre egne data fra NVDB, supplert med stier, traktorveger osv fra FKB. Vi tok også ut et datasett fra OpenStreetMap for vurdering, men konkluderte fort med at vi ikke kunne bruke det. Årsaken var usystematisk manglende veger og stier og deler av disse, feil klassifisering, dårlig topologi, samt dårlig geometri. For eksempel mangler dataene jevnt over høyder, noe som er en viktig parameter for syklister. Biler kjører gjerne like fort uavhengig av stigning/fall, mens det er de færreste syklister som klarer det. En sentral utfordring med crowdsourcing er også at du ikke vet hva slags folk som har samlet og bearbeidet dataene, og hvor bra det er gjort. Med de offentlige dataene kan du forvente at det er fagfolk som har gjort jobben, etter fastsatte spesifikasjoner. Så selv om crowdsourcing er interessant vil jeg nok si at i land som Norge, der vi har gode offentlige data, har det kun en begrenset nytteverdi. Da er det bedre om en del offentlige dataene gjøres fritt tilgjengelige, men det er som du nevner en politisk beslutning, ikke noe som er opp til den enkelte fagetat.
    For også å kommentere spørsmålet ditt om “kartverkets” data så er jo det en formulering som vi fra andre geodataproduserende etater liker dårlig. Som du helt korrekt er inne på så er en stor del av dataene eid av Geovekstpartene eller av enkeltkommuner. Mens vegnettet du har i bil-GPS-en din opprinnelig kommer fra NVDB, som forvaltes i samarbeid mellom Statens vegvesen og Statens kartverk. Og så må jeg på egen etats vegne be om unskyldning for at våre data ikke er med i listen din over WMS-er. Men det kommer snart!

  3. Mats Taraldsvik

    Siden OpenStreetMap på mange måter er et «Wikipedia for kart», sitter man igjen med mange av de samme fordelene og ulempene. Slik det er her i Norge, er det vel slik at de største byene er ganske bra, men deretter avhenger det av hvor mange bidragsytere som holder til i nærheten. Følgelig blir datakvaliteten og -fullstendigheten mildt sagt varierende. Dermed blir det vanskelig å skaffe like gode data som f.eks Tyskland for oss i Norge, som foreløpig er så få.

    Det er vel også slik at det er et enormt antall tjenester som klarer seg uten den nøyaktigheten Kartverket/Geovekst/Statens vegvesen/… tilbyr. Det er klart at fagfolk gjør jobben mye bedre, og med høyere kvalitet, presisjon og nøyaktighet, men kanskje til en pris ikke alle er villige til å betale?

    Ortofoto fra Microsoft/Bing Maps ble for ikke veldig lenge siden tilgjengelig (som i «vi har nå lov til å bruke») for OpenStreetMap, i en stedvis langt høyere oppløsning enn tidligere.

    Dataene i OpenStreetMap er både fritt og gratis lisensiert, og dermed mye mer tilgjengelig for alle. Det er også viktig å huske på.

  4. Atle Post author

    Takk for gode kommentarer fra dere alle tre. Det klør i fingrene mine etter å fortsette denne diskusjonen, men jeg må desverre (?) også jobbe litt. Derfor: dere er ikke glemt, og jeg har allerede tenkt endel over flere av momentene som nevnes her. Dog: gi meg litt tid til å formulere noen flere setninger som svar.

  5. Atle Post author

    Alexander: Dette med en slags differensiering på pris høres umiddelbart ut som en god tanke. Men hvor skal grensen gå? Hvor stor må man være før man må betale for dataene? Dog, det inntrykket jeg satt igjen med var ikke at “bransjen” (representert ved Norkart, ikke IKT Norge) ikke nødvendigvis krever gratis, men lavere og mer forutsigbar pris. IKT Norge virka ganske klare på at de burde være gratis (for alle). Og, som jeg også kom til å tenke på OSM er ikke helt fritt for alle til å bruke til hva man vil, det legges begrensninger her (skal dog inrømme at dette er “noe jeg har hørt”, og ikke gjennomresearcha) på hva man kan gjøre med dataene i en komersiell sammenheng. Skal “kartverksdataene” slippes må de gjøres helt frie.

    Knut: takk for inspill fra en det offentlige! Jeg må bare legge meg flat og inrømme at jeg ikke har hørt om ISO 19157, men jeg burde visst at det finnes en slik standard. Dog, jeg står inne ved det jeg sa om nøytaktighet, mitt inntrykk er at det er mange som mener dette er det viktigste. Et utsagn under debatten under GeoForum: “jeg har bodd i Oslo i xx år og ville aldri” brukt det kartet der (om et kart basert på OSM-data) synes jeg er illustrerende (desverre).

    Så: sykkelveg.no ser ut som et stilig konsept, artig at du lenker til det. Når kommer denne tjenesten for hele Norge?

    Også artig å høre at dere vurderte OSM-dataene, selv om jeg synes konklusjonen din blir litt feil. Dere sitter jo på egne data, mens andre ikke gjør dette. Jeg vil ikke bli overrasket om noen ildsjeler hadde klart å få til noe av det samme basert på OSM-data, denne bruken hadde igjen kanskje inspirert folk til å bidra til OSM enda mer. Og, høyde kunne man lagt til basert på en høydemodell. Og, jeg har jo hørt at NVDB-dataene sliter med endel problemer de også, spesielt sammenkobling av veglenker.

    Det du sier om crowdsourcing har jeg ikke annet enn: helt enig å si til, men vil understreke (som jeg skrev i selve innlegget) at så lenge de offentlige dataene IKKE er tilgjengelige synes jeg det er knakandes flott at noen ildsjeler gjør denne jobben, og på noen områder tror jeg nok crowdsourcing kan måle seg med, eller forbigå, profesjonelle.

    Også godt å høre at resten av geovekst-partene liker begrepet “kartverkets data” dårlig, men jeg tror eierforholdet her er underkommunisert til publikum (eller så går publikum for enkle løsninger). Det virka på meg som om IKT Norges representant i paneldebatten forholdt seg til “kartverkets data”. Og: WMS fra Vegvesnet høre utmerket ut, hold meg oppdatert!

    Mats: Sammenligningen mellom Wikipedia og OSM er god, jeg tenkte endel på denne i sammenheng med Store Norske Leksikon-saken i fjor, men en ting er forskjellig: Wikipedia og store norske produseres på (mer eller mindre) samme måte (skrive tekst), mens det offentlige og OSM produserer data på meget forskjellig måte (med unntak av bruk av ortofoto, men der har jo noen gjor forarbeid for OSM).

    Dette at komplettheten til OSM er avhengig av ildsjelstettheten er også et ankepunkt, og det kan som du sier ha sammenheng med at vi er få her i landet. Men, hadde de offentlige kartdataene vært åpent tilgjengelig kunne OSM-entusiaster fokusert på det OSM kan best.

    Dette med kvalitet vs. pris er også et godt spørsmål, og for mange (f.eks hobbyprosjekter) står valget mellom OSM og ingenting. Da gir svaret seg lett! Men igjen, hadde de offentlige kartataene vært fritt tilgjengelig hadde ikke dette vært noe argument. Min påstand er uansett at endel hadde fortsatt å bruke OSM-data (som da er beriket med det offentlige), nettopp fordi OSM har endel ekstra features som de offentlige dataene ikke har.

    Dette med lisens er også et godt spørsmål, men som jeg skrev over, jeg mener det er en begrensning av typen: “du kan ikke blande OSM og andre data for å kjøre en ruteberegning på dataene”. Dog, arrester meg gjerne her.

    Og til alle: takk for gode inspill, jeg blir alltid klokere av å gå ut med noen påstander. Synes også det er fint å ha en debatt om dette temaet uten å havne “i skyttergravene”, slik det ofte blir.

  6. OttoS

    Hei alle saman.

    Kvalitet? Som Atle skriv så er alt for mange i kartbransjen for opptatt i centimetere og millimetere. Eg kjenner til kommunar som har fått stopp frå SK på digitalisering frå ferske ortofoto for oppdatering av fire år gamle kartdata på grunn av for dårleg “kvalitet” les nøyaktighet… Som kartmann (som sikkert KnutJ godt kjenner til etter mange timar FO12 samen med meg), som privatperson og ikkje minst politikar som skal forhalde meg til kart og kartinnhald ved ulike vedtak, her er innhaldet mykje viktigare enn millimetrane.

    Kartbransjen er fro navlebeskuande, sit og lagar flotte prektige kart – for det kan dei! – til seg sjølve, utan å tenkje på kven som skal bruke dataene og kva dei skal/bør brukast til. Dersom kartbransjen byrjar å produsere kart til den store hopen av kartbrukarara som Google har greid å få opp, så vil det bli mykje lettare å få midlar til produksjon og verdiauking av karta.

    Nøyaktighet er viktigst – men da med tanke på at dataene vert koda med riktig klasse. Gjerne 5 meter middelfeil på det som er dårlegast og 16 cm på det som er frå fotogrammetrisk innsamling. Innhaldet vil da koma som ein god nummer to, for det er klart at alt innhald skal med, og kodast riktig etter nøyaktighet.

    Den dagen vi får samla alle desse dataene, med rikig koding, så vil nytteverdien auke veldig. Brukarane blir fleire, og det vert produsert meir kart.

    Det å gå på OSM og seie at det er for dårleg kvalitet – ikkje heilt riktig. Utfordringa med OSM er at alt der er basert på dugnad. Det er ikkje finansiert gjennom statlege overføringar. Hadde “våre” kartdata som SK forvalter på vegne av oss skatteytarar vore tilgjengelige for oss alle, så hadde det ikkje vore noko behov for OSM…

  7. Atle Post author

    Takk for god kommentar Otto, er enig med det meste, med unntak av siste setningen din. Jeg tror vi uansett har “behov” for OSM. Da spesielt på de områdene som de offentlige dataene enten er 1) ikke oppdaterte nok, eller 2) ikke opptatt av å samle inn informasjonen. Typisk er dette i kategorien POIer, her er det mye det offentlige ikke samler inn (og ikke burde samle inn?) som fortsatt er interessant.

  8. Mats Taraldsvik

    En rask titt på FAQen til osm (openstreetmap), gir vel svar på betingelsene rundt databruk :

    http://wiki.openstreetmap.org/wiki/Legal_FAQ#Using

    Ellers er vel lisensen Creative Commons Share-Alike, og enkelte bidragsytere velger å lisensiere som “public domain”.
    OpenStreetMap er i en prosess for å migrere lisens til Open Database License.

    Når du blander data, klassifiseres dette som et “derivative work”, og at du da må slippe dette under samme lisens. Så lenge du følger lisensen, kan du gjøre det meste (inkludert å selge det).

    Otto påpeker jo (indirekte) at større grad av nøyaktighet koster mer penger! Dersom brukeren ikke trenger denne nøyaktigheten, blir dataene mye dyrere enn de kunne ha vært.

    Relevansen til OpenStreetMap, selv om det ikke kan brukes til alt, er i alle fall udiskutabel. Fordelen av mange, frivillige øyne (eller crowdsourcing), er åpenbar når dataene endrer seg raskt. http://opengeodata.org/openstreetmap-recognized-by-un-foundation

  9. Pingback: HC SVNT DRACONES » GeomatikkNorge på nettet

  10. Pingback: HC SVNT DRACONES » Apple og kart, en tragedie?

Leave a Reply

Your email address will not be published. Required fields are marked *