Publikation Kodierung des Geburtsstaats in der Wanderungsstatistik

Datum 15. Juni 2020

Ein Vergleich regelbasierter Signierung mit Verfahren des maschinellen Lernens

Seit dem Berichtsjahr 2008 enthalten die Datenlieferungen zur deutschen amtlichen Wanderungsstatistik Angaben zum Geburtsstaat von zu-, fort- und umziehenden Personen. Wegen unzureichender Qualität wurden diese Daten bislang nur für Schätzungen nach Geburtsstaatengruppen im Rahmen europäischer Lieferverpflichtungen genutzt. Künftig sollen auch Aussagen über die einzelnen Geburtsstaaten der Wandernden möglich sein. Daher wurden im Jahr 2019 verschiedene Methoden untersucht, um ein Verfahren zur automatisierten Plausibilisierung und Signierung des Merkmals zu entwickeln. Der Beitrag stellt zwei Ansätze vor und vergleicht sie miteinander: eine regelbasierte Geburtsstaatssignierung basierend auf Leitdateien und den Einsatz von maschinellen Lernverfahren.

Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", 3/2020

Autoren: Jörg Feuerhake, Kerstin Lange, Annelen Siegismund, Elsa Vigneau