Wohnen Methodik - Datenaufbereitung

Im Zuge der Datenaufbereitung wurden die Informationen validiert, die im Rahmen der Haushalt­sbefragungen des Mikrozensus zum Zusatz­programm Wohnen erhoben wurden. Außerdem werden die aus Erhebungs­merkmalen abgeleiteten Variablen gebildet, wie zum Beispiel die Mietbelastungs­quote.

Das Zusatzprogramm Wohnen erfasst neben Informationen zu Haushalten und den Personen, aus denen sich diese zusammen­setzen, auch Angaben zu den Wohnungen und Gebäuden. Diese Angaben liefern alle befragten Haushalte, die in der jeweiligen Wohnung beziehungsweise dem Gebäude leben. Um eine kohärente Datenbasis zu gewährleisten, prüfen wir die Angaben verschiedener Haushalte daher innerhalb einer Wohnung beziehungsweise eines Gebäudes auf Einheitlichkeit. Bei Abweichungen korrigieren wir die Angaben einzelner Haushalte auf Basis fachlich abgestimmter Plausibilisierung­sverfahren und nach festen Regeln. Dadurch wird sichergestellt, dass gebäude- und wohnungs­bezogene Merkmale, wie die Baualtersklasse oder die Wohnfläche, für alle Haushalte, die innerhalb desselben Gebäudes beziehungsweise der Wohnung leben, die gleiche Ausprägung haben.

Anschließend überprüfen wir, wie auch für andere Erhebungsteile des Mikrozensus, die Daten auf Konsistenz innerhalb des Haushalts. Das heißt, es werden bestimmte logische Beziehungen zwischen verschiedenen Variablen des Zusatz- und Kernprogramms des Mikrozensus getestet. Außerdem nehmen wir unterschiedliche deduktive und verteilungsbasierte Plausibilitäts­prüfungen vor. Auch abhängig vom Ergebnis dieser Tests und Prüfungen korrigieren wir vereinzelte fehlerhafte und inkonsistente Datensätze. Die Plausibilisierungs­maßnahmen sind dabei so gewählt, dass die Datenqualität des Zusatzprogramms Wohnen verbessert wird ohne dabei jedoch übermäßig invasiv zu sein.

Zudem imputieren wir im Rahmen der Datenaufbereitung des Zusatzprogramms Wohnen auch verschiedene fehlende Werte. Zur Vervollständigung der Datenbasis sind Imputationen insbesondere für die unterschiedlichen Merkmale zu den Mietkosten notwendig. Um die Befragten zu entlasten, ist die Erfassung dieser Merkmale im Fragebogen so gestaltet, dass Datenlücken in den Rohdaten zunächst zulässig sind. Diese werden nachträglich mithilfe multivariater Imputations­verfahren aufgefüllt.

Seit der Neugestaltung des Mikrozensus mit dem Erhebungsjahr 2020 werden für diese Statistik zwei Ergebnisarten – Erst- und Endergebnisse – unterschieden. Das dient der Verkürzung des Zeitraums zwischen Ende des Erhebungsjahres und Ergebnisbereitstellung. Sowohl Erst- als auch Endergebnisse beruhen auf vollständig aufbereiteten und validierten Daten. Das bedeutet, dass auch der beschriebene Datenaufbereitungs­prozess für das Zusatzprogramm Wohnen zweimal mit leicht unterschiedlichem Datenmaterial durchlaufen wird. Die Endergebnisse basieren im Gegensatz zu den Erstergebnissen auf einer höheren Anzahl befragter Haushalte. Dies erklärt sich dadurch, dass auch nach Ende eines Erhebungsjahres fehlende auskunftspflichtige Haushalte noch Auskunft geben. Dieses Datenmaterial wird zudem an einem aktualisierten Bevölkerungs­eckwert hochgerechnet. Durch den größeren Stichprobe­numfang und die aktualisierten Bevölkerungseckwerte entstehen Abweichungen gegenüber den Erstergebnissen.

Weitere Informationen zum Datenaufbereitungs­prozess des gesamten Mikrozensus können Sie dem Qualitätsbericht entnehmen.