SSB melder at de kommer med et API slik at tredjeparter enkelt kan hente ut data selv iløpet av 2010 (se også NRK Beta). Dette vil bety at journalister, gründere og alle som føler for det enkelt kan hente ut offentlige, ferdig anonymiserte data. Dette er i tråd med den rimelige ideen om at informasjon som folk og bedrifter allerede har betalt for gjennom skatt- og avgifter, skal være fritt tilgjengelig. Lovdata.no er et eksempel på denne tankegangen, uten at API-er er fritt tilgjengelig på den måten SSB planlegger. Kart og værdata er også i svært stor grad betalt av det offentlige, og yr.no og google maps er tjenester som gir fri tilgang på slike data (også uten at API-er er fritt tilgjengelig).

En vanlig reaksjon blant samfunnsvitenskapelige akademikere på denne nyheten, er selvsagt at lekmenn ikke kan håndtere statistiske data på en fornuftige måte. Dette var også min første reaksjon på nyheten. Ord som reliabilitet og spuriøsitet er viktige for å tolke grunnleggende statistikk, og for å lære disse begrepene skikkelig trenger man metodeundervisning fra universitet eller høyskole. Allerede under beta-testingen av SSB-API-et vil vi garantert få drøssevis med nye webtjenester som vil vise rare sammenhenger uten relevans til virkeligheten. Vi vil også få en oppblomstring av foretak og bedrifter som henter ut alskens demografiske data koblet med info om f.eks. mobilbruk etc., med den hensikt å selge dette videre til markedsføringsformål.

Dette betyr ikke at API-kallet mot SSBs data er en dårlig idé. På sikt vil dette f.eks. bety at det vil bli et større behov for samfunnsvitere i det private næringslivet. For å kunne tilby de beste tjenestene, må man ha noen som kan sikre at dataene er pålitelige. Det er derfor meget bra at SSB nå kommer med et API.

Men jeg håper samtidig at SSB vil lisensiere dataene på en måte som krever at tilbyderne lenker tilbake til pålitelige kilder hos SSB, og som bidrar til at informasjonen som det offentlige har betalt for, også vil forbli tilgjengelige. Yr.no oppfordrer til dette, og SSB bør kreve det samme. Lisensen Creative Commons Navngivelse-Del på samme vilkår er et godt utgangspunkt for den lisensen jeg ønsker at SSBs data skulle ha. Da vil det vederlagsfritt være lov å selge tjenester og produkter basert på dataene (f.eks. til markedsføring/næringslivet), men samtidig må tjenestene lenke til SSB, og foreligge åpent tilgjengelig på en eller annen måte.

Ønsker man å fristille seg fra lisensen, burde man selvsagt kunne kjøpe tilgang til dette gjennom SSB. Det er også inntjeningsmuligheter gjennom en valideringstjeneste for aktører som ønsker å vise at de har troverdige data – et stempel for “rett bruk av statistikk” – enten gjennom SSB selv eller gjennom en autorisert tredjepart.

Dette kan bli meget bra.

  • Print
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • Identi.ca
  • LinkedIn
  • Twitter