Publikation
Kodierung des Geburtsstaats in der Wanderungsstatistik
Datum 15. Juni 2020
Ein Vergleich regelbasierter Signierung mit Verfahren des maschinellen Lernens
Seit dem Berichtsjahr 2008 enthalten die Datenlieferungen zur deutschen amtlichen Wanderungsstatistik Angaben zum Geburtsstaat von zu-, fort- und umziehenden Personen. Wegen unzureichender Qualität wurden diese Daten bislang nur für Schätzungen nach Geburtsstaatengruppen im Rahmen europäischer Lieferverpflichtungen genutzt. Künftig sollen auch Aussagen über die einzelnen Geburtsstaaten der Wandernden möglich sein. Daher wurden im Jahr 2019 verschiedene Methoden untersucht, um ein Verfahren zur automatisierten Plausibilisierung und Signierung des Merkmals zu entwickeln. Der Beitrag stellt zwei Ansätze vor und vergleicht sie miteinander: eine regelbasierte Geburtsstaatssignierung basierend auf Leitdateien und den Einsatz von maschinellen Lernverfahren.
Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", 3/2020
Autoren: Jörg Feuerhake, Kerstin Lange, Annelen Siegismund, Elsa Vigneau