Forskningsservice gennem et kvart århundrede
1. januar 1988 er en mærkedag i Danmarks Statistiks historie. Fra det tidspunkt har danske forskningsinstitutioner haft mulighed for at grave sig ned i den uendelige mængde af data om Danmark og danskerne, som Danmarks Statistik ligger inde med. Her blev nemlig åbnet op for Danmarks statistiks forskningsservice. I dag benytter mere end 1.400 forskere om året sig af denne mulighed.
2. december 2014 kl. 9:00
UDEN DENNE ÅBNE TILGANG til data ville meget forskning ikke kunne lade sig gøre og meget viden om vores samfund og land ville ikke eksistere. Mængdemæssigt har brugen af Damarks Statistiks forskningsdata være konstant stigende fra dag et. Det skyldes, at der er et behov, og at der er mange tilfredse kunder i butikken. På sundhedsområdet er det fx muligt at lave effektstudier, som både lægevidenskaben og industrien har glæde af, idet man kombinerer sociale data med data fra Lægemiddelstyrelsens kæmpe database over danskernes medicinforbrug.
DEN NÆSTEN DANSKE NOBELPRIS I ØKONOMI. Også ude i den store verden her ordningen givet genlyd. En amerikansk forsker, Dale T. Mortensen, har modtaget en Nobelpris i økonomi bl.a. på grund af sit arbejde med IDA, den Integrerede Database for arbejdsmarkedsforskning. Hans modeller beskriver sammenhængen mellem virksomheders vækst, arbejdsløshed, ledige jobs og lønninger. Disse modeller blev udbygget med danske data i 1980’erne og 1990’erne, og dette var stærkt medvirkende til den flotte pris. I 2010 blev modellerne så fundet værdige til Nobelprisen i økonomi.
TRE KRITIKPUNKTER FRA FORSKERNE. Forskerne var da også fra starten meget tilfredse med, at de nu havde bedre muligheder for at anvende den guldgrube af data om danske samfundsforhold, som Danmarks Statistik ligger inde med. Men forskerordningen var ikke en rendyrket succes fra starten af.
”Kravet om den fysiske tilstedeværelse var den ene ting, forskerne var utilfredse med. Og så var de utilfredse med priserne på data og utilfredse med priserne for at køre på forskermaskinen. Det var sådan set de tre centrale kritikpunkter af os,” siger daværende rigsstatistiker Jan Plovsing.
Denne kritik mundede ud i, at Danmarks Statistik fra 2000 stillede en webopkobling til rådighed, så forskerne ikke længere behøvede bevæge sig hen til Danmarks Statistik, når de skulle arbejde med data. Det var et kæmpe fremskridt. Fra 2002 fik Danmarks Statistik en bevilling, der muliggjorde, at data blev stillet gratis til rådighed.
SIKKERHED, SIKKERHED, SIKKERHED. Forskerne var også utilfredse med, at de ikke kunne få udleveret data med identificerbare personoplysninger, fx med cpr-nummer. Men en helt central forudsætning for, at ordningen kan eksistere er netop, at datasikkerheden er helt i top. Forskerne må under ingen omstændigheder kunne identificere enkeltindivider og enkeltvirksomheder. Dette punkt er der aldrig blevet gået på kompromis med.
Sikkerheden af borgernes og virksomhedernes data blev både dengang og nu vægtet højere end forskernes tilfredshed. Man har dog fundet løsninger, så forskerne alligevel har mulighed for at gennemføre analyser med udgangspunkt i individdata.
FOR AT SIKRE EN MAKSIMAL DATASIKKERHED tages flere forholdsregler. Danmarks Statistik erstatter personnumre og andet, der kan identificere enkeltindivider, med nogle projektspecifikke løbenumre, der ikke siger, hvem personen er, men stadig gør det muligt at koble data fra flere kilder. Samtidig sikres, at de samkøringer af registrerede oplysninger, som er nødvendige, sker under lukkede og kontrollerede forhold. Endelig forpligter forskerne sig til kun at trække generelle resultater og ikke individuelle oplysninger ud, og de underkaster sig kontrol heraf. På den måde kan forskerne eksempelvis stadig følge forskellige udvalgte gruppers livsforløb uden at få kendskab til personernes identiteter.
DATASIKKERHED ER HJERTEBLOD. Danmark og de øvrige nordiske lande er i hele verden berømte for deres liberale tilgang til national statistik. Dette kan kun lade sig gøre, hvis man har befolkningens tillid.
”Det er det vigtigste. For uden at folk har tillid til, at vi passer godt på data, og de ikke kommer ud og bliver brugt mod folk, så kan vi ikke have nogen statistik. Så det er simpelthen et kernepunkt for Danmarks Statistik. Det er hjerteblod,” siger Lars Thygesen, som er afdelingsdirektør for bl.a. forskerservice og formand i Danmarks Statistiks datafortrolighedsudvalg.
Borgernes tillid har stor betydning for, at der kan laves så god statistik af så høj kvalitet som muligt – og Danmarks Statistik har aldrig nogensinde haft uheld med udslip af data indeholdende deres personnumre eller personlige oplysninger.
FOR AT FÅ ADGANG TIL DATA SOM FORSKER skal man være en del af et forskningsmiljø, som er tilstrækkeligt stort og anerkendt til at blive autoriseret, som bruger af Danmarks Statistiks forskerordning. Den ansvarlige chef skal skrive under på en erklæring om vilkårene for behandling af data, samt at forskerne på stedet aldrig vil søge efter enkeltpersoner eller virksomheder. Det samme skriver de enkelte forskere også under på.
STRAMME SANKTIONER er i vente, hvis forskerne bryder dette regelsæt. Hvis en forsker fra en autoriseret institution bryder reglerne, udelukker Danmarks Statistik enhver dataadgang for alle forskere fra den pågældende institution i kortere eller længere perioder. Det vil være meget alvorligt for de berørte institutioner, der alle er afhængige af at have adgang til data.
Danmarks Statistik har i alt 88 gange siden 2010 oplevet brud på de krav Danmarks Statistik stiller til datafortroligheden i forskerordningen. Næsten alle disse brud har handlet om, at forskerne har sendt analyseresultater, der indeholder afidentificerede oplysninger, til deres egen computer. Forskeren gør det primært for at tjekke, om de har kodet rigtigt.
Da alle oplysninger i forvejen er afidentificerede, kan en forsker ikke vide, hvilke konkrete personer oplysningerne vedrører. Men da Danmarks Statistik kræver, at man tjekker koder i det sikrede miljø, Danmarks Statistik stiller til rådighed, er dette imod Danmarks Statistiks sikkerhedskrav. Derfor opfattes og behandles det på Danmarks Statistik som et brud på datafortroligheden. Og ethvert brud er alvorligt – derfor betyder det også sanktioner.
”Vi tager brud på forskerordningens datasikkerhed meget alvorligt, og vi følger hele tiden op på kontrollen med forskernes adfærd og har strammet kraftigt op på de sanktioner, vi iværksætter, når vi opdager brud på reglerne”, siger Ivan Thaulow, der er Kontorchef i Forskning og Metode.
”I dag er det sådan, at vi, så snart vi får mistanke om et brud lukker for al dataadgang – ikke alene for den forsker, der har forårsaget bruddet, men også for hele den institution, der er ansvarlig for pågældende forsker. Hvis den nærmere undersøgelse viser, at mistanken var begrundet, forbliver hele institutionens adgang til data lukket i mindst en måned. Sanktionerne strammes ved gentagende overtrædelser,” siger han.
ET FESTSKRIFT er blevet udarbejdet i anledning af 25-året for Danmarks Statistiks forskningsservice. Festskriftet kommer også ind på alle de udfordringer, som en sådan forskerordning stiller i forhold til datasikkerheden og beskyttelsen af enkeltindivider og virksomhedernes oplysninger. Festskriftet findes på Danmarks Statistiks hjemmeside, hvor man også kan læse endnu mere om de unikke muligheder, som ordningen har givet forskere.