6. Juli 2022 - Kleinräumige und aktuelle Bevölkerungszahlen sind für politische Entscheidungsfindungen unerlässlich. Die Bevölkerungsfortschreibung ermöglicht die Angabe aktueller Einwohnerzahlen auf geografischer Ebene der Gemeinden. Die Einwohnerzahl wird hierbei auf Basis des Zensus 2011 anhand von Angaben der Statistiken zu Geburten und Sterbefällen sowie der Wanderungsstatistik laufend fortgeschrieben. Um den wachsenden Bedarf an kleinräumigeren Bevölkerungszahlen kurzfristig zu decken, wird die Bevölkerungsfortschreibung mit einem neuen experimentellen Lösungsansatz ergänzt.
Die bisherigen Analysen zur Bevölkerungsdarstellung mit Mobilfunkdaten zeigen grundsätzlich, dass die Verteilung der Bevölkerung mit den vorliegenden Mobilfunkdaten gut und zeitnah abgebildet werden kann (Hadam et al. 2020). Im Projekt "experimentelle georeferenzierte Bevölkerungszahl auf Basis der Bevölkerungsfortschreibung und Mobilfunkdaten" wird darauf aufbauend erforscht, ob und inwieweit anhand der Mobilfunkdaten die vorhandenen Einwohnerzahlen aus der Bevölkerungsfortschreibung von der Gemeindeebene bundesweit auf 1x1 km Gitterzellen umverteilt werden kann. Bis die ersten amtlichen georeferenzierten Bevölkerungszahlen Ende 2022 für das Berichtsjahr 2021 vorliegen und neue Datenquellen und Methoden für eine jährliche Aktualisierung erschlossen werden können, wird die zeitliche Lücke behelfsweise durch die Nutzung von Mobilfunkdaten geschlossen und als experimentelles Ergebnis genutzt.
Datengrundlage
Zu diesem Zweck werden Mobilfunkdaten aus dem Netz der Telefónica Deutschland verwendet, welche vom Datenanbieter Teralytics aufbereitet und zur Verfügung gestellt werden. Die Mobilfunkdaten liegen flächendeckend für ganz Deutschland auf einem INSPIRE-konformen 1x1 km Raster vor. Für die bundesweite Abbildung der Wohnbevölkerung mittels Mobilfunkdaten wird der Herkunftsort aller erfassten Mobilfunksignale anhand des ersten und des letzten Signals innerhalb von 24 Stunden ermittelt. Wenn das erste und letzte Mobilfunksignal eines Tages in derselben Gitterzelle erfolgt, dann wird diese als Wohnort festgelegt. Dies ermöglicht die Ermittlung der potentiellen Wohnbevölkerung in den Mobilfunkdaten. Die Mobilfunkaktivitäten wurden weiterhin anhand der Bevölkerungsfortschreibung desselben Jahres extrapoliert. Aufgrund datenschutzrechtlicher Regelungen werden nur anonymisierte Wertangaben ab einer Mindestzahl von fünf mobilen Aktivitäten pro Gitterzelle an das Statistische Bundesamt übermittelt, sodass ein Rückschluss auf einzelne Geräte oder Personen verhindert wird. Die Auswertung liegt für alle Wochentage als Durchschnittswert aus mindestens acht ausgewählten Wochen exklusive Ferien und Feiertage eines Jahres vor.
Methode
Im Rahmen eines Verteilungsverfahrens werden die Ergebnisse der Bevölkerungsfortschreibung von der Gemeindeebene auf eine kleinräumigere Ebene umverteilt.
Dafür werden zunächst die 1x1 km Gitterzellen der Mobilfunkdaten anhand ihrer flächenmäßigen Abdeckung entsprechend den Gemeinden in Deutschland zugeordnet. Hierbei werden auch die Mobilfunkaktivitäten anhand der Flächenproportionen bzw. -anteile auf die überlappenden Gemeinden verteilt und damit nicht zu 100 Prozent einer Gemeinde zugeteilt. Dadurch werden weniger Verzerrungen bzw. Unsicherheiten in den Ergebnissen durch grenzüberlappende Gitterzellen verursacht, weil die Mobilfunkdaten anteilsmäßig den Gemeinden zugeordnet werden, in welchen diese flächenmäßig liegen.
Darauf aufbauend werden die gruppenspezifischen Ziehungswahrscheinlichkeiten für die kleinräumigeren 1x1 km Gitterzellen aus der potentiellen Wohnbevölkerung aus den Mobilfunkdaten ermittelt. Die gruppenspezifischen Ziehungswahrscheinlichkeiten der Mobilfunkdaten pro Gitterzelle ergeben sich aus dem Verhältnis der Mobilfunkaktivitäten je Gitterzelle zu der Summe aller Mobilfunkaktivitäten in der zugrundeliegenden Gemeinde und damit der "Gruppe" und stellen damit vereinfachend die Anteile der Mobilfunkaktivitäten pro Gitterzelle zur Gruppe dar. Somit ergibt sich pro Gemeinde bzw. pro Gruppe eine Ziehungswahrscheinlichkeit oder auch Anteil von 1 basierend auf den einzelnen Ziehungswahrscheinlichkeiten der zugehörigen Gitterzellen. Die Einwohnerzahl je Gemeinde der Bevölkerungsfortschreibung wird daraufhin mit den errechneten Ziehungswahrscheinlichkeiten multipliziert und anhand dessen kleinräumig auf die 1x1 km Gitterzellen verteilt. Damit liefern die Mobilfunkdaten eine räumliche Verteilung der Bevölkerung innerhalb einer Gemeinde, mit der die bestehende Bevölkerungsfortschreibung ergänzt werden kann.
Um nun den Wert der Einwohnerzahl je Gemeinde aus der Bevölkerungsfortschreibung durch Addition der kleinräumig verteilten Bevölkerungszahlen pro Gemeinde zu erhalten, werden diese in einem letzten Schritt anhand der jeweiligen amtlichen Bevölkerungszahl der zugrundeliegenden Gemeinde gerundet. Daraus ergibt sich eine experimentelle georeferenzierte Bevölkerungszahl, dessen Eckwerte denen der amtlichen Bevölkerungsfortschreibung entsprechen.
Experimentelle georeferenzierte Bevölkerungszahl
Die experimentelle georeferenzierte Bevölkerungszahl liegt auf Basis von 1x1 km sowie zusätzlich von 10x10 km Gitterzellen vor und wird kartografisch in Form einer interaktiven Rasterkarte visualisiert. Dabei wird für jede Gitterzelle die ermittelte experimentelle georeferenzierte Bevölkerungszahl ausgewiesen, sofern die Zellen zum aktuellen Zeitpunkt mit mobilen Aktivitäten gefüllt sind und zusätzlich nicht der Anonymisierung unterliegen. Zusätzlich werden Gitterzellen mit experimentellen georeferenzierten Bevölkerungszahlen kleiner gleich 3 geheim gehalten und die Werte als Intervalle von 0 bis 3 ausgegeben.
Die interaktive Karte zeigt die experimentelle georeferenzierte Bevölkerungszahl auf kleinräumiger Ebene. Dargestellt werden die experimentellen georeferenzierten Bevölkerungszahlen mit ansteigender Anzahl: In hell eingefärbten Zellen fällt die experimentelle georeferenzierte Bevölkerungszahl gering aus, in dunklen Zellen ist sie höher. Dies ermöglicht zusätzlich einen regionalen Vergleich der aktuellen Bevölkerungsverteilung. Erwartungsgemäß zeigen sich deutliche Unterschiede in der regionalen Verteilung der experimentellen georeferenzierten Bevölkerungszahl zwischen städtischen und ländlichen Gebieten.
Ein Datendownload der experimentellen georeferenzierten Bevölkerungszahlen für 1x1 km Gitterzellen ist innerhalb der Anwendung zur interaktiven Rasterkarte nur für das jeweils ausgewählte Teilgebiet möglich. Daher wird das für Gesamtdeutschland zugrundeliegende Bevölkerungsraster von 1x1 km Gitterzellen hier zusätzlich als Download-Datei Stand Dezember 2019 sowie Download-Datei Stand Dezember 2020 bereitgestellt.
Fazit
Anhand der experimentell georeferenzierten Bevölkerungszahl kann der Bedarf an aktuellen und georeferenzierten Bevölkerungszahlen gedeckt werden. Der experimentelle Charakter erlaubt die Vorteile der Mobilfunkdaten und ihrer flächendeckenden kleinräumigen Verfügbarkeit zur Verteilung der Bevölkerungszahlen unterhalb der Gemeindeebene zu nutzen.
Die resultierende, nahezu perfekte Korrelation (Pearson-Korrelationskoeffizient von 0,999) zwischen den Bevölkerungszahlen der Bevölkerungsfortschreibung und den extrapolierten Mobilfunkaktivitäten auf Gemeindeebene, lässt auf eine hohe Aussagekraft der Mobilfunkdaten auf die Gesamtbevölkerung schließen und unterstützt die Verlässlichkeit dieser Datenquelle. Insgesamt deutet dies auf eine gute Qualität der Ergebnisse hin. Jedoch kann die Qualitätseinschätzung der Ergebnisse abschließend erst anhand einer eingängigen und noch durchzuführenden Validierungs- bzw. Plausibilitätsprüfung erfolgen.
Um die Plausibilität der Ergebnisse besser beurteilen zu können, werden verschiedene Geodaten der deutschen Landesvermessung verwendet und miteinander kombiniert. Das Ziel ist zu ermitteln, welche Gitterzellen Wohnflächen bzw. eine Wohnnutzung aufweisen und ob folglich eine Wohnbevölkerung in dieser zu erwarten ist oder ausgeschlossen werden kann. Hierzu werden vom Bundesamt für Kartographie und Geodäsie (BKG) der Datensatz „Amtliche Hausumringe Deutschland“ (HU-DE) sowie „Haushalte-Einwohner-Bund“ (HH-EW-Bund) verwendet. Der HU-DE-Datensatz ermöglicht, Gebäudegrundrisse explizit nach Wohngebäuden zu filtern. Die Geodaten des HH-EW-Bund, welche durch die infas 360 GmbH erstellt werden, stellen eine Schätzung der Anzahl der Haushalte und Einwohnerinnen und Einwohner pro Adresspunkt zur Verfügung.
Durch Betrachtung der beiden Datenquellen kann pro Gitterzelle ermittelt werden, ob die zugewiesene experimentelle georeferenzierte Bevölkerungszahl sowie die Höhe plausibel ist oder diese falsch zugeordnet wurde. Insgesamt resultieren für das Berichtsjahr 2019 in 27,5 % der Gitterzellen plausibel zugeordnete experimentelle georeferenzierte Bevölkerungszahlen, 37,2 % der Ergebnisse werden als teils plausibel angeführt und rund 35,3 % als unplausibel. Letztere ist vor allem in gering besiedelten Regionen der Fall. Unsicherheiten ergeben sich in Abbildung 1 (2019) nachweislich bei Zuordnungen in ländlichen, weniger dicht besiedelten Gebieten durch die kleinräumige Aufbereitung der mobilen Aktivitäten beim Datenanbieter (detaillierte Ergebnisse und weitere Informationen siehe Hadam (2022)).
Auf Grundlage dieser Erkenntnisse wird in Zusammenarbeit mit dem Datenanbieter eine Anpassung des Aufbereitungsprozesses der Mobilfunkdaten für das nachfolgende Berichtsjahr 2020 umgesetzt. Bei der kleinräumigen Aufbereitung der Mobilfunkaktivitäten von der Ebene der originären Mobilfunkzellen auf die hier verwendeten 1x1 km Gitterzellen werden unbewohnte Flächen durch die Verwendung zusätzlicher Landnutzungsinformationen nicht weiter berücksichtigt. Für die Filterung dieser Flächen wurde das "Digitale Landbedeckungsmodell für Deutschland (LBM-DE)" genutzt.
Im Ergebnis werden deutlich plausiblere Ergebnisse durch die Verwendung von Landnutzungsinformationen im Rahmen der Mobilfunkdatenaufbereitung erzeugt (siehe Abbildung 1 (2020)). Insgesamt werden nun 67,8 % der Gitterzellen und die zugeordneten experimentellen Bevölkerungszahlen als plausibel eingestuft, 22,1 % als teils plausibel und nur noch 10,1 % als unplausibel.
Abb. 1 Visualisierung der Plausibilitätsprüfung für die Berichtsjahre 2019 und 2020
Weiterhin wurde untersucht, inwieweit sich das beschriebene Verteilungsverfahren auf die soziodemografischen Angaben, wie Alter und Geschlecht, anwenden lässt. Wie durch das Statistische Bundesamt (2021) bereits dargestellt wurde, unterliegen die soziodemografischen Angaben der Mobilfunkanbieter starken Verzerrungen, die sich auch in dem hier beschrieben Verfahren wiederfinden lassen. Besonders ein Fehlen der Nicht-Vertragsmündigen sowie der Prepaid-Kundinnen und -Kunden erlauben keine plausible Darstellung der experimentellen georeferenzierten Bevölkerungszahl differenziert nach Altersgruppen sowie Geschlecht.
Insgesamt bleiben jedoch Einschränkungen in der Qualitätseinschätzung der Ergebnisse bestehen. Da nur Mobilfunkaktivitäten eines Netzanbieters in Deutschland verwendet wurden, werden dadurch entstehende Abweichungen und Unsicherheiten in den Ergebnissen einerseits durch die jeweiligen regionalen Marktanteile und andererseits durch die verwendete und nicht im Detail offen gelegte Methodik des Datenanbieters bei der Datenaufbereitung bedingt.
Für weitere Machbarkeitsstudien aber, insbesondere hinsichtlich einer grundsätzlich angestrebten Nutzung von Mobilfunkdaten für die Produktion amtlicher Statistiken, müssen möglichst anonymisierte Einzeldaten von allen Mobilfunkanbietern in Deutschland zur Verfügung stehen, um die bundesweite Repräsentativität und Qualität der Daten weiter zu steigern. Ebenso müssen Rechtsgrundlagen geschaffen werden, um den Zugang zu privat gehaltenen Daten dauerhaft zu sichern und diese langfristig in die amtliche Statistikproduktion integrieren zu können.
Literatur
Hadam, S., Schmid, T., Simm, J. (2020): Kleinräumige Prädiktion von Bevölkerungszahlen basierend auf Mobilfunkdaten aus Deutschland. In: Klumpe, B., Schröder, J., Zwick, M. (Hrsg.) Qualität bei zusammengeführten Daten – Befragungsdaten, Administrative Daten, Neue digitale Daten: Miteinander besser? Springer, Wiesbaden, S 27-44 DOI-Fundstelle
Statistisches Bundesamt (2021): Strukturvergleich von Mobilfunkdaten zweier Mobilfunkanbieter
Hadam, S. (2023) Experimentelle georeferenzierte Bevölkerungszahl auf Basis der Bevölkerungsfortschreibung und Mobilfunkdaten. AStA Wirtschafts- und Sozialstatistisches Archiv DOI-Fundstelle