Publikation
Imputation zur maschinellen Behandlung fehlender und unplausibler Werte in der amtlichen Statistik
Datum 21. Oktober 2021
Theoretische Grundlagen und praktische Umsetzung.
Fehlende Werte in den Erhebungsdaten stellen für die amtliche Statistik eine Herausforderung dar. Ein falscher Umgang mit ihnen kann die Ergebnisse verzerren. Zudem machen große Datenmengen und hohe Anforderungen an die Aktualität der Daten zunehmend automatisierte Plausibilisierungs- und Imputationsverfahren notwendig. Um eine hohe Qualität der Ergebnisse erreichen zu können ist es daher wichtig, sich mit diesen Themen auseinanderzusetzen. Der Aufsatz beschreibt, warum fehlende Werte ein Problem darstellen können und zeigt einige Behandlungsoptionen auf. Er stellt verschiedene Klassen von Imputationsverfahren und Möglichkeiten zur Evaluation der Imputationsergebnisse vor und ergänzt sie mit Beispielen aus der amtlichen Statistik.
Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", 5/2021
Autoren: Marcel Preising, Kerstin Lange, Florian Dumpert