Statistisk behandling

Kontaktinfo

Priser og Forbrug, Økonomisk Statistik
A Solange Lohmann Rasmussen
61 15 17 93

Hent som PDF

Forbrugsundersøgelsen er en stikprøveundersøgelse, hvor antallet af husstande udgør ca. 2.600 ud af Danmarks i alt ca. 2,9 millioner private husstande. Fra 2024 indsamles der årligt data fra omkring 1.300 husstande, og stikprøven til et års forbrugsundersøgelse baseres på data indsamlet over to år.

I undersøgelsen indgår oplysninger fra tre datakilder: Regnskab, interviews og registre.

Alle forbrugsudgifter, indkomster osv. omregnes til bedst muligt at svare til pris- og mængdeniveauet i slutåret.

Kilder

Forbrugsundersøgelsen er baseret på data indsamlet via en stikprøveundersøgelse, som er opdelt i en interviewdel og en regnskabsdel, kombineret med data fra administrative registre.

Stikprøven udtrækkes simpelt tilfældigt fra ca. 5.000 adresser hvert kvartal, der tilsammen udgør ca. 20.000 årligt. Adresserne fordeles ligeligt på uger. I interviewdelen indhentes oplysninger om husstanden 12 måneder tilbage i tid. Det er primært oplysninger om større faste udgifter fx husleje, forsikringer, hårde hvidevarer, tjenesteydelser samt sundhedsbesøg mv., som indhentes i interviewdelen.

I regnskabsdelen indhentes oplysninger om husstandens daglige indkøb igennem 14 dage. De daglige indkøb omfatter fx dagligvarer, benzin, tøj samt restaurantbesøg mv.

Data fra administrative registre omfatter oplysninger om indkomst, boligforhold, husstandens sammensætning, uddannelse og sygehusbenyttelse. I Forbrugsundersøgelsen for 2024 kommer oplysningerne fra følgende registre:

Indkomststatistikregistret
Bygnings- og Boligregistret, BBR
Befolkningsstatistikregistret
Uddannelses- og arbejdsklassifikationsregistret
Sygehusbenyttelsesstatistikken

Indsamlingshyppighed

Forbrugsundersøgelsen gennemføres årligt. Husstande deltager løbende i undersøgelsen hen over året.

Indsamlingsmetode

En eksternt tjenesteyder varetager dataindsamlingen til Forbrugsundersøgelsen. Husstande, som er tilfældig udvalgt, får tilsendt et brev om deltagelse i undersøgelsen via E-boks og kontaktes efterfølgende telefonisk med henblik på at få husstanden til at deltage. Når en husstand accepterer at deltage, skal den føre et 14‑dages regnskab over sit forbrug og udfylde et spørgeskema (12-mdr.-regnskab) om husstandens faste udgifter samt større udgiftsposter inden for det seneste år 14-dages-regnskabet er digitalt, men kan dog også blive udfyldt på papir. Fra 1994 til 2019 blev 12-mdr.-regnskabet udelukkende foretaget som et interview (CAPI) af en interviewer. Fra 2019-2021 blev data indsamlet via en kombination af telefoninterviews (CATI), webbaseret interviews (CAWI) og personlige interviews (CAPI). Siden 2022 er data udelukkende indsamlet via telefoninterviews (CATI) og webbaseret interviews (CAWI).

I 2024 blev indsamlingsværktøjet udvidet, så husstandene kan scanne eller fotografere deres kvitteringer, som uploades automatisk. Varer og beløb kategoriseres efter formål ved hjælp af AI.

Data fra administrative registre hentes pr. 31. december i referenceåret, eller det nyeste tilgængelige år. Hvis data hentes fra et tidligere år end referenceåret, pris- og mængdeomregnes data til prisniveauet for referenceåret.

Datavalidering

Interviewdata valideres både under og umiddelbart efter besøgsinterviewet. Valideringen under interviewet består dels af logiske og dels af sandsynlige kontroller, mens valideringen efter interviewet foretages manuelt. En logisk kontrol kan fx være, om husstanden har tv, men ikke har rapporteret udgifter til licens eller antenneforening, eller at husstanden har bil, men ikke rapporterer udgifter til vægtafgift, bilforsikring mv. En sandsynlig kontrol kan fx være, at meget høje eller lave beløb undersøges direkte i det program, som anvendes til interviewet, og at husstanden konfronteres med dette og skal forholde sig til, om det er korrekt.

Når data kommer ind til Danmarks Statistik gennemgår de en validering, som fx går ud på at vurdere husstandens forbrug i forhold til dens størrelse. Hvis der fx kun er én person og et meget højt vandforbrug, eller der fx er to voksne med børn, hvor der ikke er rapporteret, hvor mange måneder, der er benyttet til daginstitution og skole vil husstanden blive kontaktet for at afklare rigtigheden af oplysningerne. Nogle rettelser laves uden at kontakte husstanden, hvor beskrivelsen af indkøbet og beløbet virker modstridende. Det kan fx være en liter mælk er registreret med et beløb på 1.000 kr. Dette vil blive rettet til 10,00 kr.

14-dages-regnskaberne valideres løbende, når de kommer ind, og valideres samlet, når indsamlingen af regnskaber for et år er afsluttet. I den samlede validering vil der fx tjekkes, om alle indkøb er kodet korrekt ift. klassifikationen.

Databehandling

orbrugsundersøgelsen er baseret på en 2-årig stikprøve, dvs. Forbrugsundersøgelsen for 2024 er sat sammen af stikprøver trukket i 2023 og 2024. Når data for 2023 indgår som en del af Forbrugsundersøgelsen 2024, bliver de justeret for udviklingen i det generelle prisniveau. Til denne justering anvendes den samme justeringsfaktor, som anvendes til at beregne det private forbrug i faste priser i nationalregnskabet.

Når alle regnskaber, interviews og adressekort for et år er indkommet samles alle disse oplysninger for hver enkel husstand. Husstande, som ikke har fået indsendt et regnskab, interview eller adressekort, betragtes som ikke gennemført og bliver sorteret fra. For at kunne indhente oplysninger fra registre, skal hver person i husstanden have et CPR-nummer. Mangler CPR-nummeret forsøger man at finde oplysningerne. Hvis de ikke kan findes, sorteres husstanden fra.

Husstandssammensætningen skal være identisk i både interview og journal (intern administrationsdatabase). Er personsammensætningen ikke identisk, rettes oplysningerne i journalen med oplysningerne fra interviewet.

En husstand kan fx være udvalgt som bestående af én mand og er opført som dette i det administrative system. Når intervieweren kommer, kan det vise sig, at personen er sammenboende med en, og at der er fælles økonomi. I dette tilfælde vil oplysningerne rettes til i journalen, og regnskabsdataene vil kobles til den opdaterede husstand. Hvis der har været kodeændringer, vil alle data, som anvendes, få de opdaterede koder, også selvom data hentes tilbage i tid.

Optræder den samme oplysning om indkøb i både regnskabet og i interviewet, er det som udgangspunkt oplysningerne fra interviewet, som vil blive brugt. Der er dog undtagelser som fx udøvelse af sport, hvor oplysningen kommer fra regnskabet og ikke interviewet. I interviewskemaet er der nogle tekstfelter, som respondenten kan udfylde med beskrivelser af indkøb. Beskrivelserne oversættes til udgiftsposter, og indkøbet gives den relevante kode. Et eksempel er fællesudgifter til en ejerlejlighed, som også indeholder renovation. Hvis der i de øvrige oplysninger for husstanden er oplysninger om udgifter til renovation, skal oplysningerne trækkes ud af fællesudgifterne og kodes som udgifter til renovation. Et andet eksempel kan være forbrugskoder, der dækker en større varegruppe fx brød, alle slags. Brød skal fordeles ud på, om det er rugbrød, franskbrød, boller mv. Hvis en husstand således har opgivet indkøb af brød, vil det blive fordelt på undergrupperne ved en proportionalfordeling baseret på fordelingen i det foregående år.

I Forbrugsundersøgelsen 2024 indgår registeroplysninger for 2023 og 2024, da det er en toårig stikprøve som anvendes. Registeroplysningerne skal knyttes til de enkelte individer i husstanden. For nogle personer vil der mangle oplysninger i registrene. I tilfælde af manglende oplysninger hentes de fra et tidligere år eller ved imputering.

Opregning I stikprøveundersøgelser vil hver observation repræsentere flere elementer i populationen. Til hver observation beregnes derfor en vægt, der anvendes, når der skal beregnes resultater for hele befolkningen (populationen) på baggrund af stikprøveundersøgelsen. Vægtene til Forbrugsundersøgelsen beregnes med en metode, der udnytter oplysninger fra en række registervariable. De umiddelbare udvalgsvægte kalibreres ved at justere vægtene, så de marginale fordelinger for registervariablene genskabes. Informationen fra registervariablene bruges således, i den grad det er muligt, til at rette op på eventuelle skævheder, som følger af bortfaldet. Registervariablene er korrelerede med forbrug og bortfaldsmønstrene (fordelingen af hvem, der har svaret fra stikprøven, og hvem der ikke har svaret). De kalibrerede vægte bruges til at opregne fra de, som har svaret i stikprøven (respondenterne) til hele populationen. Opregningen i Forbrugsundersøgelsen foregår på adresseniveau. Der tilordnes således en kalibreret vægt til hver adresse, hvor en person har besvaret undersøgelsen for husstanden.

Følgende registeroplysninger medtages i vægtningen af Forbrugsundersøgelsen:

Alderen på den person på adressen som har højest indkomst (5-års aldersgrupper)
Kønnet på den person på adressen som har højest indkomst
Socioøkonomisk gruppe for den person på adressen som har højest indkomst (8 grupper)
Boligtype på adressen (5 grupper)
Antal personer på adressen (5 kategorier)
Regioner
Familietype på adressen
Højeste anciennitet på adressen (5 kategorier)
Samlet adresseindkomst (9 kategorier)
Antal personer på adressen
Etnicitet (2 grupper)

Ved opregningen behandles respondenterne fra begge år i den toårige stikprøve under ét. For respondenterne beholdes registeroplysninger for det år interviewet er foregået i. Det er registeroplysninger for hele populationen ved udgangen af 2024, der anvendes til beskrivelse af populationen i den endelige Forbrugsundersøgelse for 2024.

Korrektion

Der laves ikke korrektioner af data udover, hvad der allerede er beskrevet under Datavalidering og Databehandling.

Indhold

Relevans