Gå til sidens indhold

Statistisk behandling

Kontaktinfo

Priser og Forbrug, Økonomisk Statistik
America Solange Lohmann Rasmussen
61 15 17 93

slr@dst.dk

Hent som PDF

Forbrugsundersøgelsen

Forbrugsundersøgelsen er en stikprøveundersøgelse, hvor antallet af husstande udgør 2.200 ud af Danmarks i alt ca. 2,8 millioner private husstande.

I undersøgelsen indgår oplysninger fra tre datakilder: Regnskab, CAPI-interviews og registre.

Der indsamles årligt data fra omkring 1.100 husstande og stikprøven til et års forbrugsundersøgelse baseres på data indsamlet over to år. Alle forbrugsudgifter, indkomster osv. omregnes til bedst muligt at svare til pris- og mængdeniveauet i slutåret.

Kilder

Forbrugsundersøgelsen er baseret på data indsamlet via en stikprøveundersøgelse, som er opdelt i en interviewdel og en regnskabsdel, kombineret med data fra administrative registre.

Stikprøven udtrækkes simpelt tilfældigt fra ca. 2.000 adresser hvert kvartal, der tilsammen udgør ca. 82.000 årligt. Adresserne fordeles ligeligt på uger. I interviewdelen indhentes oplysninger om husstanden 12 måneder tilbage i tid. Det er primært oplysninger om større faste udgifter fx husleje, forsikringer, hårde hvidevarer, tjenesteydelser samt sundhedsbesøg mv., som indhentes i interviewdelen.

I regnskabsdelen indhentes oplysninger om husstandens daglige indkøb igennem 14 dage. De daglige indkøb omfatter fx dagligvarer, benzin, tøj samt restaurantbesøg mv.

Data fra administrative registre omfatter oplysninger om indkomst, boligforhold, husstandens sammensætning, uddannelse og sygehusbenyttelse. I Forbrugsundersøgelsen for 2022 kommer oplysningerne fra følgende registre:

  • Indkomststatistikregistret
  • Bygnings- og Boligregistret, BBR
  • Befolkningsstatistikregistret
  • Uddannelses- og arbejdsklassifikationsregistret
  • Sygehusbenyttelsesstatistikken

Indsamlingshyppighed

Forbrugsundersøgelsen gennemføres årligt. Husstande deltager løbende i undersøgelsen hen over året.

Indsamlingsmetode

En eksternt tjenesteyder varetager dataindsamlingen til Forbrugsundersøgelsen. Husstande som er tilfældig udvalgt, får tilsendt et brev om deltagelse i undersøgelsen via E-boks og kontaktes efterfølgende telefonisk med henblik på at få husstanden til at deltage. Takker husstanden ja til deltagelse, skal husstanden føre et 14 dages regnskab over deres forbrug og efterfølgende få besøg af en interviewer der stiller spørgsmål vedr. husstandens faste udgifter samt større udgiftsposter et år tilbage i tid. 14 dages regnskabet er digitalt kan dog også blive udfyldt på papir. Interviewet fortages i CAPI (et computerbaseret personligt interview) af en interviewer.

Data vedr. 2021 er indsamlet via besøgsinterviews (CAPI), telefoninterviews (CATI) og webbaseret interviews (CAWI), mens data vedr. 2022 udelukkende er indsamlet via CATI og CAWI.

Data fra administrative registre hentes pr. 31. december i referenceåret, eller det nyeste tilgængelige år. Hvis data hentes fra et tidligere år end referenceåret, pris- og mængdeomregnes data til prisniveauet for referenceåret.

Datavalidering

Interviewdata valideres både under og umiddelbart efter besøgsinterviewet. Valideringen under interviewet består dels af logiske og dels af sandsynlige kontroller, mens valideringen efter interviewet foretages manuelt. En logisk kontrol kan fx være om husstanden har tv, men ikke har rapporteret udgifter til licens eller antenneforening eller, at husstanden har bil, men ikke rapporterer udgifter til vægtafgift, bilforsikring mv. En sandsynlig kontrol kan fx være at meget høje eller lave beløb undersøges direkte i det program, som anvendes til interviewet og at husstanden konfronteres med dette og skal forholde sig til, om det er korrekt.

Når data kommer ind til Danmarks Statistik gennemgår de en validering, som fx går ud på at vurdere husstandens forbrug i forhold til dens størrelse. Hvis der fx kun er én person og et meget højt vandforbrug, eller der fx er to voksne med børn, hvor der ikke er rapporteret, hvor mange måneder der er benyttet til daginstitution og skole vil husstanden blive kontaktet for at afklare rigtigheden af oplysningerne. Nogle rettelser laves uden at kontakte husstanden, hvor beskrivelsen af indkøbet og beløbet virker modstridende. Det kan fx være en liter mælk er registreret med et beløb på 1.000 kr. Dette vil blive rettet til 10,00 kr.

14-dages-regnskaberne valideres løbende, når de kommer ind, og samlet når indsamlingen af regnskaber for et år er afsluttet. I den samlede validering vil der fx tjekkes, om alle indkøb er kodet korrekt ift. klassifikationen, ECOICOP.

Databehandling

Forbrugsundersøgelsen er baseret på en 2-årig stikprøve, dvs. Forbrugsundersøgelsen for 2022 er sat sammen af stikprøver trukket i 2021 og 2022. Når data for 2021 indgår som en del af Forbrugsundersøgelsen 2022, bliver de justeret for udviklingen i det generelle prisniveau. Til denne justering anvendes den samme justeringsfaktor, som anvendes til at beregne det private forbrug i faste priser i nationalregnskabet.

Når alle regnskaber, interviews og adressekort for et år er indkommet samles alle disse oplysninger for hver enkel husstand. Husstande som ikke har fået indsendt et regnskab, interview eller adressekort, betragtes som ikke gennemført og bliver sorteret fra. For at kunne indhente oplysninger fra registre, skal hver person i husstanden have et CPR-nummer. Mangler CPR-nummeret forsøger man at finde oplysningerne. Hvis de ikke kan findes sorteres husstanden fra.

Husstandssammensætningen skal være identisk i både interview og journal. Er personsammensætningen ikke identisk, rettes oplysningerne i journalen med oplysningerne fra interviewet.

En husstand kan fx være udvalgt som bestående af én mand og er opført som dette i det administrative system. Når intervieweren kommer, kan det vise sig, at personen er sammenboende med en og at der er fælles økonomi. I dette tilfælde vil oplysningerne rettes til i journalen og regnskabsdataene vil kobles til den opdaterede husstand. Hvis der har været kodeændringer, vil alle data som anvendes få de opdaterede koder, også selvom data hentes tilbage i tid.

Optræder den samme oplysning om indkøb i både regnskabet og i interviewet, er det som udgangspunkt oplysningerne fra interviewet, som vil blive brugt. Der er dog undtagelser som fx udøvelse af sport, hvor oplysningen kommer fra regnskabet og ikke interviewet. I interviewskemaet er der nogle tekstfelter, som intervieweren kan udfylde med beskrivelser af indkøb. Beskrivelserne oversættes til udgiftsposter og indkøbet gives den relevante kode. Et eksempel er fællesudgifter til en ejerlejlighed, som også indeholder renovation. Hvis der i de øvrige oplysninger for husstanden er oplysninger om udgifter til renovation, skal oplysningerne trækkes ud af fællesudgifterne og kodes som udgifter til renovation. Et andet eksempel kan være forbrugskoder der dækker en større varegruppe fx brød, alle slags. Brød skal fordeles ud på om det er rugbrød, franskbrød, boller mv. Hvis en husstand således har opgivet indkøb af brød, vil det blive fordelt på undergrupperne ved en proportionalfordeling baseret på fordelingen i det foregående år.

I Forbrugsundersøgelsen 2022 indgår registre oplysninger for 2021 og 2022, da det er en toårig stikprøve som anvendes. Registeroplysningerne skal knyttes til de enkelte individer i husstanden. For nogle personer vil der mangle oplysninger i registrene. I tilfælde af manglende oplysninger hentes de fra et tidligere år eller ved imputering.

Opregning I stikprøveundersøgelser vil hver observation repræsentere flere elementer i populationen. Til hver observation beregnes derfor en vægt, der anvendes når der skal beregnes resultater for hele befolkningen (populationen) på baggrund af stikprøveundersøgelsen. Vægtene til Forbrugsundersøgelsen beregnes med en metode, der udnytter oplysninger fra en række registervariable. De umiddelbare udvalgsvægte kalibreres, ved at justere vægtene så de marginale fordelinger for registervariablene genskabes. Informationen fra registervariablene bruges således, i den grad det er muligt, til at rette op i eventuelle skævheder som følger af bortfaldet. Registervariablene som anvendes er korrelerede med forbrug og bortfaldsmønstrene (fordelingen af hvem, der har svaret fra stikprøven og hvem der ikke har svaret). De kalibrerede vægte bruges til at opregne fra de som har svaret i stikprøven (respondenterne) til hele populationen. Dette gøres på adresseniveau. Opregningen i Forbrugsundersøgelsen foregår på adresseniveau. Der tilordnes således en kalibreret vægt til hver adresse, hvor en person har besvaret undersøgelsen for husstanden.

Følgende registre oplysninger medtages i vægtningen af Forbrugsundersøgelsen:

  • Alderen på den person på adressen som har højest indkomst (5-års aldersgrupper)
  • Kønnet på den person på adressen som har højest indkomst
  • Socioøkonomisk gruppe for den person på adressen som har højest indkomst (8 grupper)
  • Boligtype på adressen (5 grupper)
  • Antal personer på adressen (5 kategorier)
  • Regioner - dog udgør København og Frederiksberg to separate regioner
  • Familietype på adressen
  • Højeste anciennitet på adressen (5 kategorier)
  • Samlet adresseindkomst (9 kategorier)
  • Antal personer på adressen
  • Etnicitet (2 grupper)

Ved opregningen behandles respondenterne fra begge år i den toårige stikprøve under ét. For respondenterne beholdes registre oplysninger for det år interviewet er foregået i. Det er registre oplysninger for hele populationen ved udgangen af 2022, der anvendes til beskrivelse af populationen i den endelige Forbrugsundersøgelse for 2022.

Korrektion

Der laves ikke korrektioner af data udover, hvad der allerede er beskrevet under Datavalidering og Databehandling.