Data
Data fra Danmarks Statistik
Danmarks Statistik har samlet en lang række historiske registerdata i en grunddatabank i Forskningsservice. Registrene opdateres mindst én gang om året når Danmarks Statistik har offentliggjort de statistikker, der bygger på registrene. Oversigten nedenfor, viser registrene i Forskningsservice. Variabler i de enkelte registre kan hentes fra oversigten. Dokumentation af variablerne findes i Danmarks Statistiks dokumentationssystem.
Referencetyper
Registre i grunddataoversigten opgøres ved hjælp af forskellige referencetyper. Ud for hvert register i grunddataoversigten kan man se, hvilken referencetype et register har: ”Status”, ”Statusperiode”, ”Forløb” eller ”Hændelse”.
Status
Status for en given dato. Fx LONN (lønstruktur), som viser hvad en borger tjener pr. registerdatoen (fx 31.12.2021). Eller BEF, som viser befolkningen pr. en kvartalsdato (herunder status for bopæl, alder, familie m.fl.).
Statusperiode
Periodestatus, hvor populationen er afgrænset pr. en given dato, men variablerne indeholder summerede data for en bestemt periode. Fx IND, som indeholder lønindkomst for et år (perioden fremgår af Opdateringsfrekvens i grunddataoversigten). Andre eksempler på statusperiode-registre: PERSBEST (bestyrelsesmedlemmer og direktører), MFR (medicinsk fødselsregister), HANDICB (støtte til handicapbiler), DMRB (motorkøretøjer). Det er ikke altid let at se hvad der summeres.
Forløb
Data beskriver et forløb. Der vil altid kun være én udgave af registeret tilgængelig. Fx UDDF, som indeholder Højeste fuldførte uddannelse. Eller BEFADR, som er et adressenøgleregister (hvor fx 1,4 mio. adresser ændrede nøgle 1.1.2007 ved kommunesammenlægningen). Når et forløbsregister opdateres, opdateres det enkelte datasæt. Derfor er der altid kun et datasæt til et forløbsregister.
Hændelse
Data beskriver en hændelse. Fx UDFK, som indeholder grundskolekarakterer (indeholder ikke en dato men et skoleår), eller OPHGIN (opholdsgrundlag for indvandrede). Når et hændelsesregister opdateres, opdateres det enkelte datasæt med nye hændelser. Derfor er der altid kun et datasæt.
Det Erhvervsstatistiske Datavarehus
Fra januar 2024 lancerer Danmarks Statistik det nye Erhvervsstatistiske Datavarehus. Det nye varehus sikrer en større og bedre adgang til anonymiseret microdata om virksomheder og giver forskere mulighed for at trække unikke data ved at sammenkoble data på tværs af mange statistiske registre. Datavarehuset gør det også muligt at sammenkoble erhvervs- og socialstatistik på micro-niveau, det såkaldte ’Linked Employer-Employee Data’ (LEED).
Læs mere om Det Erhvervsstatistiske Datavarehus (engelsk)
Oplæg ved præsentationen af Erhvervsstatistisk Datavarehus 30. november 2023
Kontakt Forskningsservice for adgang
Særligt om erhvervsdata
Der gælder særlige regler for adgangen til erhvervsdata i Danmarks Statistik. Adgangen afhænger af såvel af typen af erhvervsdata som af institutions- og brugertype. For nogle typer af erhvervsdata er der begrænset adgang for nogle institutions- og brugertyper. I nogle tilfælde er det muligt at søge om dispensation.
Brug af eksterne data
Har du behov for at koble datamateriale, der ikke er en del af Danmarks Statistiks registerdata, til dit forskningsprojekt fx udtræk fra registre, som findes uden for Danmarks Statistik eller dine egne survey-oplysninger, er det også muligt. Det eneste du skal gøre er at levere data sikkert til Danmarks Statistik.
Læs mere om indsendelse af egne data
Data fra andre statistikmyndigheder
Danmarks Statistik har indgået aftale med andre statistikmyndigheder om at give statistiske og videnskabelige undersøgelser adgang til deres data via Forskningsservice. Se hvilke data du kan få adgang til her:
Data fra andre statistikmyndigheder
Dokumentation til brugen af registre
Danmarks Statistik har udarbejdet et notat, der beskriver sammenhæng mellem flere af de mest anvendte forskningsregistre i Danmarks Statistiks Mikrodataordning.
Personstatistikregistrene i Danmarks Statistik består af omfattende datasamlinger, som er op- og udbygget siden begyndelsen af 1980’erne. Data er af høj kvalitet og omfatter hele befolkningen. Dette giver unikke analysemuligheder for brugerne af data - det være sig på et bestemt tidspunkt og over tid.
Dette notat giver indsigt i sammenhængen mellem flere af de mest anvendte forskningsregistre i Danmarks Statistiks Mikrodataordning og deres forbindelse med den offentliggjorte statistik. Notatet henvender sig derfor primært til forskere, analytikere og andre brugere af mikrodata, som ønsker at opnå et bedre indblik i kvaliteten af sammenhængen mellem de forskellige registre.