Statistisk sentralbyrå (SSB) med API – CC-lisensiering?

SSB mel­der at de kom­mer med et API slik at tredje­par­ter enkelt kan hente ut data selv ilø­pet av 2010 (se også NRK Beta). Dette vil bety at jour­na­lis­ter, grün­dere og alle som føler for det enkelt kan hente ut offent­lige, fer­dig ano­ny­mi­serte data. Dette er i tråd med den rime­lige ideen om at infor­ma­sjon som folk og bedrif­ter alle­rede har betalt for gjen­nom skatt– og avgif­ter, skal være fritt til­gjen­ge­lig. Lovdata.no er et eksem­pel på denne tanke­gan­gen, uten at API-er er fritt til­gjen­ge­lig på den måten SSB plan­leg­ger. Kart og vær­data er også i svært stor grad betalt av det offent­lige, og yr.no og google maps er tje­nes­ter som gir fri til­gang på slike data (også uten at API-er er fritt tilgjengelig).

En van­lig reak­sjon blant sam­funns­vi­ten­ska­pe­lige aka­de­mi­kere på denne nyhe­ten, er selv­sagt at lek­menn ikke kan hånd­tere sta­tis­tiske data på en for­nuf­tige måte. Dette var også min første reak­sjon på nyhe­ten. Ord som reli­a­bi­li­tet og spu­riø­si­tet er vik­tige for å tolke grunn­leg­gende sta­ti­stikk, og for å lære disse begre­pene skik­ke­lig tren­ger man metode­un­der­vis­ning fra uni­ver­si­tet eller høy­skole. Alle­rede under beta-testingen av SSB-API-et vil vi garan­tert få drøsse­vis med nye web­tje­nes­ter som vil vise rare sam­men­hen­ger uten rele­vans til vir­ke­lig­he­ten. Vi vil også få en opp­blomst­ring av fore­tak og bedrif­ter som hen­ter ut als­kens demo­gra­fiske data kob­let med info om f.eks. mobil­bruk etc., med den hen­sikt å selge dette videre til markedsføringsformål.

Dette betyr ikke at API-kallet mot SSBs data er en dår­lig idé. På sikt vil dette f.eks. bety at det vil bli et større behov for sam­funns­vi­tere i det pri­vate nærings­li­vet. For å kunne tilby de beste tje­nes­tene, må man ha noen som kan sikre at data­ene er påli­te­lige. Det er der­for meget bra at SSB nå kom­mer med et API.

Men jeg håper sam­ti­dig at SSB vil lisen­siere data­ene på en måte som kre­ver at til­by­derne len­ker til­bake til påli­te­lige kil­der hos SSB, og som bidrar til at infor­ma­sjo­nen som det offent­lige har betalt for, også vil for­bli til­gjen­ge­lige. Yr.no opp­ford­rer til dette, og SSB bør kreve det samme. Lisen­sen Crea­tive Com­mons Navngivelse-Del på samme vil­kår er et godt utgangs­punkt for den lisen­sen jeg ønsker at SSBs data skulle ha. Da vil det veder­lags­fritt være lov å selge tje­nes­ter og pro­duk­ter basert på data­ene (f.eks. til markedsføring/næringslivet), men sam­ti­dig må tje­nes­tene lenke til SSB, og fore­ligge åpent til­gjen­ge­lig på en eller annen måte.

Ønsker man å fri­stille seg fra lisen­sen, burde man selv­sagt kunne kjøpe til­gang til dette gjen­nom SSB. Det er også inn­tje­nings­mu­lig­he­ter gjen­nom en vali­de­rings­tje­neste for aktø­rer som ønsker å vise at de har tro­ver­dige data – et stem­pel for “rett bruk av sta­ti­stikk” – enten gjen­nom SSB selv eller gjen­nom en auto­ri­sert tredjepart.

Dette kan bli meget bra.

Del gjerne videre

    2 kommentarer

    • Jeg job­ber med et stort pro­sjekt i SSB som heter Nye ssb.no — og ønsker å knytte noen kom­men­ta­rer til blogginnlegget:

      En vik­tig del av pro­sjek­tet vi er midt inne i er å gjøre tal­lene våre enk­lere til­gjen­ge­lige for tredje­par­ter, og åpne API-er er et av flere stikk­ord. Dette betyr ikke nød­ven­dig­vis at det vi kal­ler “Mikro­data” (http://www.ssb.no/mikrodata/), som er våre “ano­ny­mi­serte data”, blir en del av dette med det første.

      Men det er vik­tig at alle tall på sidene våre — om de lig­ger i tabel­ler eller som gra­fer — er objek­ter som kan dis­tri­bu­eres uten­for ssb.no. Målet er at bru­kerne ved hjelp av “embed­ded kode” kan inklu­dere slike objek­ter på en enkel måte. Der­som det er ønske­lig for bru­ke­ren, kan slike tabeller/grafer endre seg når det kom­mer nye til. Dette vil også gjelde tabel­ler bru­ke­ren selv hen­ter fra SSBs Sta­ti­stikk­bank (http://statbank.ssb.no/statistikkbanken/). Det er dette som er SSBs masse­la­ger for aggre­gert data, dvs. sta­ti­stikk, og det er disse tal­lene som i første omgang vil åpnes med API-er.

      Ideen om til­bake­len­king til kil­den blir som du nev­ner svært vik­tig, og CC kan løse dette.

      For øvrig gjør vi flere grep i pro­sjek­tet som skal gjøre det let­tere for bor­gerne å finne fram til rett sta­ti­stikk og gode ana­ly­ser basert på sta­ti­stikk. SSB har all­tid vært tid­lig ute på nett, men de senere år ser vi at våre tek­niske løs­nin­ger begyn­ner å bli gam­mel­dagse — ikke minst for oss selv i pub­li­se­rin­gen. Vi vel­ger der­for nå å løse mange ting på en gang, og der­for må fak­tisk bru­kerne være litt tål­mo­dige når det gjel­der tids­punkt for de nye løs­nin­gene. I løpet av 2010 håper vi å være på lufta med noe nytt.

      Tho­mas Bjørn­skau, pro­sjekt­le­der “Nye ssb.no”

    • Takk for en klar­gjø­rende kommentar.

    Legg igjen en kommentar

    Din epostadresse vil aldri bli delt med andre.Obligatoriske felt er merket med *