Experimentelle Statistiken Experimentelle georeferenzierte Bevölkerungszahl auf Basis der Bevölkerungs­fortschreibung und Mobilfunkdaten

EXSTAT

6. Juli 2022 - Kleinräumige und aktuelle Bevölkerungs­zahlen sind für politische Entscheidungs­findungen unerlässlich. Die Bevölkerungs­fortschreibung ermöglicht die Angabe aktueller Einwohner­zahlen auf geografischer Ebene der Gemeinden. Die Einwohnerzahl wird hierbei auf Basis des Zensus 2011 anhand von Angaben der Statistiken zu Geburten und Sterbefällen sowie der Wanderungs­statistik laufend fort­geschrieben. Um den wachsenden Bedarf an klein­räumigeren Bevölkerungs­zahlen kurzfristig zu decken, wird die Bevölkerungs­fortschreibung mit einem neuen experimentellen Lösungs­ansatz ergänzt.

Die bisherigen Analysen zur Bevölkerungs­darstellung mit Mobilfunk­daten zeigen grundsätzlich, dass die Verteilung der Bevölkerung mit den vorliegenden Mobilfunk­daten gut und zeitnah abgebildet werden kann (Hadam et al. 2020). Im Projekt "experimentelle georeferenzierte Bevölkerungs­zahl auf Basis der Bevölkerungs­fortschreibung und Mobilfunk­daten" wird darauf aufbauend erforscht, ob und inwieweit anhand der Mobilfunk­daten die vorhandenen Einwohner­zahlen aus der Bevölkerungs­fortschreibung von der Gemeinde­ebene bundesweit auf 1x1 km Gitterzellen umverteilt werden kann. Bis die ersten amtlichen geo­referenzierten Bevölkerungs­zahlen Ende 2022 für das Berichtsjahr 2021 vorliegen und neue Daten­quellen und Methoden für eine jährliche Aktualisierung erschlossen werden können, wird die zeitliche Lücke behelfs­weise durch die Nutzung von Mobilfunk­daten geschlossen und als experimentelles Ergebnis genutzt.

Datengrundlage

Zu diesem Zweck werden Mobilfunk­daten aus dem Netz der Telefónica Deutschland verwendet, welche vom Daten­anbieter Teralytics aufbereitet und zur Verfügung gestellt werden. Die Mobilfunkdaten liegen flächendeckend für ganz Deutschland auf einem INSPIRE-konformen 1x1 km Raster vor. Für die bundesweite Abbildung der Wohnbevölkerung mittels Mobilfunk­daten wird der Herkunfts­ort aller erfassten Mobilfunk­signale anhand des ersten und des letzten Signals innerhalb von 24 Stunden ermittelt. Wenn das erste und letzte Mobilfunk­signal eines Tages in derselben Gitterzelle erfolgt, dann wird diese als Wohnort festgelegt. Dies ermöglicht die Ermittlung der potentiellen Wohn­bevölkerung in den Mobilfunk­daten. Die Mobilfunk­aktivitäten wurden weiterhin anhand der Bevölkerungs­fortschreibung desselben Jahres extrapoliert. Aufgrund datenschutz­rechtlicher Regelungen werden nur anonymisierte Wertangaben ab einer Mindestzahl von fünf mobilen Aktivitäten pro Gitterzelle an das Statistische Bundesamt übermittelt, sodass ein Rück­schluss auf einzelne Geräte oder Personen verhindert wird. Die Auswertung liegt für alle Wochen­tage als Durchschnitts­wert aus mindestens acht ausgewählten Wochen exklusive Ferien und Feiertage eines Jahres vor.

Methode

Im Rahmen eines Verteilungs­verfahrens werden die Ergebnisse der Bevölkerungs­fortschreibung von der Gemeinde­ebene auf eine klein­räumigere Ebene umverteilt.

Dafür werden zunächst die 1x1 km Gitterzellen der Mobilfunk­daten anhand ihrer flächen­mäßigen Abdeckung entsprechend den Gemeinden in Deutschland zugeordnet. Hierbei werden auch die Mobilfunk­aktivitäten anhand der Flächen­proportionen bzw. -anteile auf die über­lappenden Gemeinden verteilt und damit nicht zu 100 Prozent einer Gemeinde zugeteilt. Dadurch werden weniger Verzerrungen bzw. Unsicher­heiten in den Ergebnissen durch grenz­überlappende Gitterzellen verursacht, weil die Mobilfunk­daten anteils­mäßig den Gemeinden zugeordnet werden, in welchen diese flächen­mäßig liegen.

Darauf aufbauend werden die gruppen­spezifischen Ziehungs­wahrschein­lichkeiten für die klein­räumigeren 1x1 km Gitterzellen aus der potentiellen Wohn­bevölkerung aus den Mobilfunk­daten ermittelt. Die gruppen­spezifischen Ziehungs­wahrschein­lichkeiten der Mobilfunk­daten pro Gitterzelle ergeben sich aus dem Verhältnis der Mobilfunk­aktivitäten je Gitterzelle zu der Summe aller Mobilfunk­aktivitäten in der zugrundeliegenden Gemeinde und damit der "Gruppe" und stellen damit verein­fachend die Anteile der Mobilfunk­aktivitäten pro Gitterzelle zur Gruppe dar. Somit ergibt sich pro Gemeinde bzw. pro Gruppe eine Ziehungs­wahrschein­lichkeit oder auch Anteil von 1 basierend auf den einzelnen Ziehungs­wahrschein­lichkeiten der zugehörigen Gitterzellen. Die Einwohner­zahl je Gemeinde der Bevölkerungs­fortschreibung wird daraufhin mit den errechneten Ziehungs­wahrschein­lichkeiten multipliziert und anhand dessen kleinräumig auf die 1x1 km Gitterzellen verteilt. Damit liefern die Mobilfunk­daten eine räumliche Verteilung der Bevölkerung innerhalb einer Gemeinde, mit der die bestehende Bevölkerungs­fortschreibung ergänzt werden kann.

Um nun den Wert der Einwohner­zahl je Gemeinde aus der Bevölkerungs­fortschreibung durch Addition der kleinräumig verteilten Bevölkerungs­zahlen pro Gemeinde zu erhalten, werden diese in einem letzten Schritt anhand der jeweiligen amtlichen Bevölkerungs­zahl der zugrunde­liegenden Gemeinde gerundet. Daraus ergibt sich eine experimentelle geo­referenzierte Bevölkerungs­zahl, dessen Eckwerte denen der amtlichen Bevölkerungs­fortschreibung entsprechen.

Experimentelle georeferenzierte Bevölkerungszahl

Die experimentelle geo­referenzierte Bevölkerungs­zahl liegt auf Basis von 1x1 km sowie zusätzlich von 10x10 km Gitterzellen vor und wird karto­grafisch in Form einer interaktiven Raster­karte visualisiert. Dabei wird für jede Gitterzelle die ermittelte experimentelle geo­referenzierte Bevölkerungs­zahl ausgewiesen, sofern die Zellen zum aktuellen Zeitpunkt mit mobilen Aktivitäten gefüllt sind und zusätzlich nicht der Anonymisierung unterliegen. Zusätzlich werden Gitterzellen mit experimentellen geo­referenzierten Bevölkerungs­zahlen kleiner gleich 3 geheim gehalten und die Werte als Intervalle von 0 bis 3 ausgegeben.

Die interaktive Karte zeigt die experimentelle geo­referenzierte Bevölkerungs­zahl auf klein­räumiger Ebene. Dargestellt werden die experimentellen geo­referenzierten Bevölkerungs­zahlen mit ansteigender Anzahl: In hell eingefärbten Zellen fällt die experimentelle geo­referenzierte Bevölkerungs­zahl gering aus, in dunklen Zellen ist sie höher. Dies ermöglicht zusätzlich einen regionalen Vergleich der aktuellen Bevölkerungs­verteilung. Erwartungs­gemäß zeigen sich deutliche Unterschiede in der regionalen Verteilung der experimentellen geo­referenzierten Bevölkerungs­zahl zwischen städtischen und ländlichen Gebieten.

Ein Datendownload der experimentellen geo­referenzierten Bevölkerungs­zahlen für 1x1 km Gitterzellen ist innerhalb der Anwendung zur interaktiven Raster­karte nur für das jeweils ausgewählte Teilgebiet möglich. Daher wird das für Gesamt­deutschland zugrunde­liegende Bevölkerungs­raster von 1x1 km Gitterzellen hier zusätzlich als Download-Datei Stand Dezember 2019 sowie Download-Datei Stand Dezember 2020 bereitgestellt.

Fazit

Anhand der experimentell geo­referenzierten Bevölkerungs­zahl kann der Bedarf an aktuellen und geo­referenzierten Bevölkerungs­zahlen gedeckt werden. Der experimentelle Charakter erlaubt die Vorteile der Mobilfunk­daten und ihrer flächen­deckenden klein­räumigen Verfüg­barkeit zur Verteilung der Bevölkerungs­zahlen unterhalb der Gemeinde­ebene zu nutzen.

Die resultierende, nahezu perfekte Korrelation (Pearson-Korrelationskoeffizient von 0,999) zwischen den Bevölkerungs­zahlen der Bevölkerungs­fortschreibung und den extra­polierten Mobilfunk­aktivitäten auf Gemeinde­ebene, lässt auf eine hohe Aussage­kraft der Mobilfunk­daten auf die Gesamt­bevölkerung schließen und unterstützt die Verläss­lichkeit dieser Datenquelle. Insgesamt deutet dies auf eine gute Qualität der Ergebnisse hin. Jedoch kann die Qualitäts­einschätzung der Ergebnisse abschließend erst anhand einer eingängigen und noch durch­zuführenden Validierungs- bzw. Plausibilitäts­prüfung erfolgen.

Um die Plausibilität der Ergebnisse besser beurteilen zu können, werden verschiedene Geodaten der deutschen Landes­vermessung verwendet und miteinander kombiniert. Das Ziel ist zu ermitteln, welche Gitter­zellen Wohn­flächen bzw. eine Wohn­nutzung aufweisen und ob folglich eine Wohn­bevölkerung in dieser zu erwarten ist oder ausge­schlossen werden kann. Hierzu werden vom Bundesamt für Kartographie und Geodäsie (BKG) der Datensatz „Amtliche Hausumringe Deutschland“ (HU-DE) sowie „Haushalte-Einwohner-Bund“ (HH-EW-Bund) verwendet. Der HU-DE-Datensatz ermöglicht, Gebäude­grundrisse explizit nach Wohn­gebäuden zu filtern. Die Geodaten des HH-EW-Bund, welche durch die infas 360 GmbH erstellt werden, stellen eine Schätzung der Anzahl der Haushalte und Einwohne­rinnen und Einwohner pro Adress­punkt zur Verfügung.

Durch Betrachtung der beiden Daten­quellen kann pro Gitter­zelle ermittelt werden, ob die zugewiesene experimentelle geo­referenzierte Bevölkerungs­zahl sowie die Höhe plausibel ist oder diese falsch zuge­ordnet wurde. Insgesamt resultieren für das Berichtsjahr 2019 in 27,5 % der Gitter­zellen plausibel zugeordnete experimentelle geo­referenzierte Bevölkerungs­zahlen, 37,2 % der Ergebnisse werden als teils plausibel angeführt und rund 35,3 % als unplausibel. Letztere ist vor allem in gering besiedelten Regionen der Fall. Unsicher­heiten ergeben sich in Abbildung 1 (2019) nachweislich bei Zuord­nungen in ländlichen, weniger dicht besiedelten Gebieten durch die klein­räumige Aufbereitung der mobilen Aktivitäten beim Daten­anbieter (detaillierte Ergebnisse und weitere Informationen siehe Hadam (2022)).

Auf Grundlage dieser Erkenntnisse wird in Zusammen­arbeit mit dem Daten­anbieter eine Anpassung des Aufbereitungs­prozesses der Mobil­funk­daten für das nach­folgende Berichts­jahr 2020 umgesetzt. Bei der klein­räumigen Aufbereitung der Mobil­funk­aktivitäten von der Ebene der originären Mobil­funk­zellen auf die hier verwendeten 1x1 km Gitter­zellen werden unbewohnte Flächen durch die Verwendung zusätzlicher Land­nutzungs­informationen nicht weiter berück­sichtigt. Für die Filterung dieser Flächen wurde das "Digitale Landbedeckungs­modell für Deutschland (LBM-DE)" genutzt.

Im Ergebnis werden deutlich plausiblere Ergebnisse durch die Verwendung von Land­nutzungs­informationen im Rahmen der Mobil­funk­daten­aufbereitung erzeugt (siehe Abbildung 1 (2020)). Insgesamt werden nun 67,8 % der Gitter­zellen und die zugeordneten experimentellen Bevölkerungs­zahlen als plausibel eingestuft, 22,1 % als teils plausibel und nur noch 10,1 % als unplausibel.

Abb. 1 Visualisierung der Plausibilitätsprüfung für die Berichtsjahre 2019 und 2020

Weiterhin wurde untersucht, inwieweit sich das beschriebene Verteilungs­verfahren auf die sozio­demografischen Angaben, wie Alter und Geschlecht, anwenden lässt. Wie durch das Statistische Bundesamt (2021) bereits dargestellt wurde, unterliegen die sozio­demografischen Angaben der Mobilfunk­anbieter starken Verzerrungen, die sich auch in dem hier beschrieben Verfahren wiederfinden lassen. Besonders ein Fehlen der Nicht-Vertragsmündigen sowie der Prepaid-Kundinnen und -Kunden erlauben keine plausible Darstellung der experimentellen geo­referenzierten Bevölkerungs­zahl differenziert nach Alters­gruppen sowie Geschlecht.

Insgesamt bleiben jedoch Einschrän­kungen in der Qualitäts­einschätzung der Ergebnisse bestehen. Da nur Mobilfunk­aktivitäten eines Netz­anbieters in Deutschland verwendet wurden, werden dadurch entstehende Abweichungen und Unsicher­heiten in den Ergebnissen einerseits durch die jeweiligen regionalen Markt­anteile und andererseits durch die verwendete und nicht im Detail offen gelegte Methodik des Daten­anbieters bei der Daten­aufbereitung bedingt.

Für weitere Machbarkeits­studien aber, insbesondere hinsichtlich einer grundsätzlich angestrebten Nutzung von Mobilfunk­daten für die Produktion amtlicher Statistiken, müssen möglichst anonymisierte Einzeldaten von allen Mobilfunk­anbietern in Deutschland zur Verfügung stehen, um die bundes­weite Repräsen­tativität und Qualität der Daten weiter zu steigern. Ebenso müssen Rechts­grundlagen geschaffen werden, um den Zugang zu privat gehaltenen Daten dauer­haft zu sichern und diese lang­fristig in die amtliche Statistik­produktion integrieren zu können.

Literatur

Hadam, S., Schmid, T., Simm, J. (2020): Kleinräumige Prädiktion von Bevölkerungszahlen basierend auf Mobilfunkdaten aus Deutschland. In: Klumpe, B., Schröder, J., Zwick, M. (Hrsg.) Qualität bei zusammengeführten Daten – Befragungsdaten, Administrative Daten, Neue digitale Daten: Miteinander besser? Springer, Wiesbaden, S 27-44 DOI-Fundstelle

Statistisches Bundesamt (2021): Strukturvergleich von Mobilfunkdaten zweier Mobilfunkanbieter

Hadam, S. (2023) Experimentelle georeferenzierte Bevölkerungszahl auf Basis der Bevölkerungsfortschreibung und Mobilfunkdaten. AStA Wirtschafts- und Sozialstatistisches Archiv DOI-Fundstelle

Dies könnte Sie auch interessieren

Mehr zum Thema "Wohnbevölkerung" aus der amtlichen Statistik

Mehr zum Thema "kleinräumige Bevölkerungszahlen" aus der amtlichen Statistik: Zensus in Deutschland 2011

Mehr zum Thema "Gemeindeebene" aus der amtllichen Statistik