27.05.2025 - Die Verwendungsmöglichkeiten für Daten aus der Fernerkundung für Zwecke der amtlichen Statistik sind so vielfältig wie die Systeme und Sensoren, mit denen sie gewonnen werden. Sie liegen unter anderem in den Themenbereichen Wirtschaft, Konjunktur, Landwirtschaft und Energie. Die Zusammenführung und automatisierte Auswertung von Datenquellen aus der Fernerkundung kann relevante Potentiale für die Nutzung im Prozess der amtlichen Statistikproduktion bieten, beispielsweise hinsichtlich der Aktualität und der Kleinräumigkeit statistischer Informationen.
Im Rahmen des von der Europäischen Kommission geförderten Projekts "Earth Observation Data and AI for Construction Statistics" (EO4ConStat) wird von 2024 bis 2026 die Anwendungsmöglichkeit für die Qualitätssicherung der Bautätigkeitsstatistik geprüft. Das Projekt ist eine Zusammenarbeit zwischen dem Bundesamt für Kartographie und Geodäsie (BKG), dem Statistischen Bundesamt (Destatis) und dem Deutschen Zentrum für Luft- und Raumfahrt (DLR). Das BKG entwickelt und testet automatisierte Auswertungsmethoden und nutzt dabei künstliche Intelligenz. Die Ergebnisse werden anschließend durch das Statistische Bundesamt validiert. Das DLR berät im Rahmen des Projekts mit seiner fachlichen Expertise. Mithilfe von Datenquellen und Methoden aus der Fernerkundung sollen Baustellen sowie der Zeitpunkt des Baubeginns und die Fertigstellung des Vorhabens ermittelt werden. Die so gewonnenen Daten zum Status von Baustellen können gewinnbringend zur Qualitätssicherung der Daten in der Bautätigkeitsstatistik genutzt werden. Permanent verbesserte Daten im Bereich der Fernerkundung und elaboriertere Methoden aus den Bereichen künstliche Intelligenz und Deep Learning ermöglichen die automatisierte Erkennung der Flächen.
Die Hochbaustatistik als Spiegel der Bautätigkeit
Die (Hoch-)Baustatistik ist als Vollerhebung konzipiert und kann damit das Baugeschehen in Deutschland methodisch sehr gut abbilden. Das Hochbaustatistikgesetz (HBauStatG) benennt sowohl die Bauverantwortlichen als auch die Bauaufsichtsbehörden als meldepflichtig für die statistische Erhebung von Bauvorhaben. Die Erhebung erfolgt aktuell auf verschiedenen Wegen von rein papierbasierter Erfassung bis hin zu teildigitalisierten Verfahren. Die papierbasierte Erhebung erfordert eine manuelle Bearbeitung der Vorgänge und kann damit das Bereitstellen der Daten für die Statistik verzögern. Abhängig von den Kapazitäten und den jeweils etablierten Fachverfahren in den zuständigen administrativen Einheiten können Meldungen aus den vorgesehenen Berichtszeiträumen herausfallen. Zudem kann es zu Untererfassungen kommen, wenn Erhebungsbögen versehentlich mit der restlichen Vorgangsakte in das Archiv der Bauaufsicht übernommen werden. Neben der ungenauen Periodenzuordnung und der fehlenden Vollzähligkeitskontrolle sollen auch neue Konjunkturstatistiken zu Baubeginnen und Baufertigstellungen eingeführt werden. Eine Erfassung der Baubeginne und höhere Taktung der Veröffentlichung zu Baufertigstellungen würde die Möglichkeiten zur Bewertung von Fördermaßnahmen im Wohnungsbau und der konjunkturellen Dynamik im Bausektor maßgeblich verbessern. Dies wurde in den vergangenen Jahren von verschiedener Seite auf EU- und Bundesebene (Deutsche Bundesbank, Bundesministerium für Wohnen, Stadtentwicklung und Bauwesen) eingefordert.1
Bezeichnung | Veröffentlichung (aktuell) | Veröffentlichung (angestrebt) | Tiefste Regionalgliederung |
---|---|---|---|
31111 Statistik der Baugenehmigungen | monatich | monatlich | Landkreise |
(31151 Statitik der Baubeginne) | / | quartalsweise Veröffentlichung von Monatswerten | Landkreise |
31132 Statistik des Bauüberhangs | jährlich | jährlich | Landkreise |
31121 Statistik der Baufertigstellungen | jährlich | quartalsweise Veröffentlichung von Monatswerten | Landkreise |
31141 Statistik des Bauabgangs | jährlich | jährlich | Landkreise |
Datenquellen für die Erkennung und Terminierung von Baustellen
Im Projekt EO4ConStat erfolgt die Auswertung der Fernerkundungsdaten schrittweise und es werden hierbei verschiedene Datenquellen genutzt. Die Zusammenführung der Informationen ermöglicht die Nutzung der spezifischen Vorteile der jeweiligen Datenquelle. Die meist aus Flugzeugen aufgenommenen, digitalen Orthofotos (kurz: DOP) bieten die für die Klassifizierung von Baustellen benötigte hohe Bodenauflösung. Der hohe Detailgrad der Aufnahmen ermöglicht eine gute Erkennung von Strukturen und in der Folge auch deren Klassifizierung. Abbildung 1 zeigt beispielhaft vier DOP der gleichen Fläche im Großraum Hannover zu unterschiedlichen Zeitpunkten. In der Zeitabfolge sind die Veränderungen auf der Fläche, jeweils im Abstand von zwei bis drei Jahren aufgenommen, gut zu erkennen.
Abbildung 1: Die digitalen Orthofotos zeigen einen Schulneubau im Raum Hannover (A) vor Baubeginn (2019), (B) zu Beginn der Bauphase (2022) und (D) nach Fertigstellung des Gebäudes (2024). In (C) ist die als Baustelle klassifizierte Fläche farblich markiert. (Bildquellen: A-C - ©GeoBasis-DE/LGLN 2025; D - ©Google Maps 2025)
Da der Aufwand für die Erstellung von DOP hoch ist und zudem von guten Wetterbedingungen abhängt, werden diese in einem Rhythmus von zwei bis drei Jahren aufgenommen und decken eine begrenzte räumliche Fläche ab. Um Veränderungen am Boden zeitlich besser aufgelöst darstellen zu können, werden zusätzlich Aufnahmen aus anderen Quellen benötigt. Hierzu können Satellitenbilder verwendet werden. Im EO4ConStat werden frei zugängliche Aufnahmen aus dem Copernicus-Programm der Europäischen Union, speziell den Sentinel-Missionen genutzt.2 Die Sentinel-2-Satelliten nehmen über Europa Bilder der gleichen Bodenfläche in einem Abstand von fünf Tagen auf. Neben dem für Menschen sichtbaren Lichtspektrum werden hierbei zusätzliche Spektralinformationen gesammelt, aus denen Indizes berechnet werden können. Aus ihnen lassen sich thematische Informationen zu Materialien, Stoffklassen oder der Unterscheidung zwischen unbelebten und belebten Objekten am Boden ableiten. Neben den Bildinformationen aus der Fernerkundung werden administrative Datenquellen aus der Landesvermessung und der Katasterverwaltung genutzt, um die Qualität und Effizienz der Auswertung zu erhöhen. Die Auswertung der Bilddaten in EO4ConStat erfolgt exemplarisch und wird aufgrund des Datenumfangs, des Speicherbedarfs und der Verfügbarkeit von hochauflösenden DOP zunächst nicht für das gesamte Bundesgebiet bearbeitet. Als Untersuchungsgebiet für EO4ConStat wurde das Bundesland Nordrhein-Westfalen ausgewählt. Es ist das bevölkerungsreichste Bundesland und bietet eine breite strukturelle Vielfalt hinsichtlich von Siedlungsgebieten, um die Funktionalität der Erkennungsalgorithmen breit zu trainieren und zu optimieren. Zusätzlich sind die DOP für Nordrhein-Westfalen in einer besonders hohen Auflösung von 10 x 10 cm2 flächendeckend verfügbar. Bei der späteren Anwendung der entwickelten Datenprozessierung auf andere Bundesländer sollte die räumliche und zeitliche Auflösung der jeweils verfügbaren DOP genau berücksichtigt werden.
Anwendung von Methoden der künstlichen Intelligenz
Die schrittweise Bearbeitung der oben beschriebenen Datenquellen liefert Informationen zur Lage der Baugrundstücke und der Datierung von Baubeginn- und Bauabschluss. Die automatisierte Erkennung von Baustellen erfolgt mithilfe künstlicher Intelligenz aus den DOP. Dazu wird ein Computermodell trainiert, das auf dieser Basis selbstständig Strukturen in Bildern erkennt. Genutzt wird das von der Firma Meta AI in 2023 veröffentlichte Segment Anything Model (kurz: SAM).3 Es handelt sich hierbei um ein Basismodell, das auf großen Datenmengen vortrainiert wurde. Um das Modell zu spezifizieren und auf Bautätigkeit zu trainieren, müssen möglichst präzise Trainingsdaten zusammengestellt werden. Hierfür werden Baustellen gesucht und auf den DOP (händisch) markiert (vergleiche Abbildung 1). Um das Auffinden der Baustellen zu erleichtern, werden aus administrativen Datensätzen (beispielsweise Hausumringe aus der Landesvermessung, Katasterdaten der Städte und Gemeinden) Gebiete mit hoher Bautätigkeit identifiziert. Mit dem spezifisch-trainierten Modell kann eine systematische Suche nach Baustellen durchgeführt werden. Diese werden markiert und die Informationen zur Lage für die nächsten Prozessschritte übernommen. Aufgrund der niedrigen zeitlichen Abdeckung der DOP werden für die Zeitreihenanalyse weitere Datenquellen hinzugezogen.
Der nächste Prozessschritt nutzt optische Sentinel-2-Satellitendaten. Die von den Satelliten aufgenommenen Rohdaten werden von der Europäischen Raumfahrtagentur (ESA) vorprozessiert und öffentlich zur Verfügung gestellt. Dabei werden spektrale Indizes errechnet, die verschiedene Charakteristika der Bodenbedeckung hervorheben können. Die in Abbildung 2 gezeigten Aufnahmen stellen den Normalized Difference Vegetation Index (NDVI) dar. In der gewählten Darstellung visualisiert er in abgestuften Grüntönen lebende Vegetation und grenzt sie gegen unbelebte Objekte in Beige, Weiß, Grau und Schwarz ab. Die Bildreihe dokumentiert die Nutzungsänderung des bereits in Abbildung 1 gezeigten Grundstücks von zunächst landwirtschaftlicher Bewirtschaftung hin zu einer Baustelle und schließlich zum fertigen Gebäudekomplex. Aus der Änderung der Werte für den NDVI kann das Verschwinden der Vegetation und der Wechsel zu unbelebten Materialien abgeleitet werden. In Abbildung 2 D ist eine Rückkehr der Farbwerte zu Grüntönen und damit Vegetation innerhalb der Gebäudegrenzen zu erkennen, was auf die Nutzung einer Dachbegrünung hindeutet.
Abbildung 2: Zeitreihe des in Abbildung 1 gezeigten Bauvorhabens im Raum Hannover. (A) Entwicklung von landwirtschaftlich genutzter Fläche (2019) zu (D) fertigem Gebäude (2025). In (B) ist die Herstellung des Baufelds erkennbar (2022). In (C) sind bereits Teile des Gebäudes erstellt (2023). Darstellung als prozessierter Index (NDVI = Normalized Difference Vegetation Index). Grüne Farbwerte kennzeichnen lebende Vegetation. (Bildquelle: European Union, modified Copernicus Sentinel data 2025)
Für eine zuverlässige Erfassung der Baustellen müssen die aus verschiedenen Indizes abgeleiteten Ergebnisse kombiniert werden. Die Verschneidung mit den Informationen aus dem ersten Auswertungsschritt vermeidet die Fehlerkennung von Flächen, die für Bautätigkeit nicht infrage kommen oder die für die Hochbaustatistik nicht relevant sind. Abbildung 3 enthält eine Zeitreihe der zwischen 2017 und 2023 verfügbaren Daten für einen Bildausschnitt. Die Kurven zeigen die Werte von den themenspezifischen Indizes: Normalized Difference Built-up Index (NDBI), Index-based Built-up Index (IBI) und New Built-up Index (NBI). Diese sind in der Lage die Zunahme von Versiegelung zu erkennen. Im Kurvenverlauf sind im zweiten Drittel bleibende Abweichungen vom vorher beobachteten Reflektionsverhalten erkennbar und weisen damit auf einen Baubeginn hin. Trotz der hohen Aufnahmefrequenz sind nicht alle Satellitenbilder nutzbar. Bewölkung und atmosphärische Störungen können Aufnahmen verfälschen, die aus der Auswertung ausgeschlossen werden. Dennoch lassen sich verschiedene Baustadien mit diesem Verfahren zeitlich gut eingrenzen.
Abbildung 3: Zeitreihe für die Indizes NDBI, IBI und NBI für einen Zeitraum von 2017 bis 2023. Die obere Grafik zeigt absolute Werte pro Aufnahme. In der unteren Grafik repräsentiert jeder Datenpunkt den Durchschnitt der zurückliegenden 30 Tage für diesen Index. Die vertikalen Balken markieren den Zeitpunkt des aktuellsten DOP und damit die Erkennung durch das trainierte Bildsegmentierungs-Modell.
Sicherstellung der Datenqualität
Um die Verwendung der erarbeiteten Daten auch über die Methodenentwicklung im Projekt hinaus in Betracht zu ziehen, muss die Qualität der Baustellenerkennung geprüft werden. Die Datenvalidierung erfolgt durch Vergleich mit den aus der Statistik zur Verfügung stehenden Informationen zu Baugenehmigungen und Baufertigstellungen. Dazu werden unter Einhaltung der vorgeschriebenen Geheimhaltung, anonyme Informationen der Statistik zur Lage der Baugrundstücke mit den Daten aus der Fernerkundungsauswertung verglichen. Um die Daten gewinnbringend einsetzen zu können, müssen im Rahmen der Validierung sehr hohe Erkennungsquoten festgestellt werden. Erste Prüfungen in ausgewählten Teilgebieten von Nordrhein-Westfalen zeigen vielversprechende, vorläufige Ergebnisse mit einer sehr hohen Erkennungsrate. Bei besonders aktuellen DOP wurden teilweise Baustellen erkannt, die der Statistik durch den noch nicht abgeschlossenen Berichtszeitraum noch nicht bekannt sein konnten.
Anwendbarkeit und Perspektiven
Durch die sehr weit entwickelten Verfahren der automatisierten Bilderkennung können Gebäude und Veränderungen am Boden sehr gut erkannt werden. Aufgrund der Vielfalt der zu detektierenden Gebäude und Szenarien in der realen Umwelt, ist die Weiterentwicklung und Qualitätssicherung der angewandten Methoden von großer Bedeutung. Das gilt besonders im Hinblick auf die verlässliche automatisierte Erfassung von Daten. Ziel ist eine fehlerminimierte automatisierte Erkennung von Bauvorhaben und deren Abschluss, um eine Nutzung in der amtlichen Statistik zu ermöglichen. Die Erkennung von Bauvorhaben mithilfe von Daten aus der Fernerkundung soll die klassischen Erhebungsverfahren der Bautätigkeitsstatistik nicht ersetzen. Vielmehr kann sie zur Qualitätssicherung eingesetzt werden und im Idealfall Daten verfügbar machen, die näher am aktuellen Rand liegen.
Die räumliche Verortung von Bauvorhaben aus den Fernerkundungsdaten erleichtert auch die geografische Darstellung von Bautätigkeit. Es ergeben sich Darstellungsmöglichkeiten als Rasterkarten in einem Onlineatlas, wie sie bereits für andere Fachstatistiken oder auf Länderebene umgesetzt wurden. Diese könnten beispielsweise auf einem interaktiven Kartendashboard dargestellt werden und damit eine visuell intuitive räumliche Dokumentation der Bautätigkeit ermöglichen. Die Nutzung von Gitterzellen in den thematischen Karten gewährleistet die Einhaltung der aktuell bestehenden gesetzlichen Rahmenbedingungen.
Neben den Ergebnissen des Projekts EO4ConStat sollen auch die verwendeten Methoden und Arbeitsschritte öffentlich verfügbar gemacht werden. Die Testung und gegebenenfalls die Integration der Verfahren sollen für interessierte Institutionen niedrigschwellig möglich sein. Dies gilt explizit auch für statistische Ämter anderer europäischer Staaten, die an der technischen Umsetzung für ihre eigene Fachstatistik interessiert sind.
Förderhinweis:
Das Projekt "Earth Observation Data and AI for Construction Statistics (EO4ConStat)" wird im Rahmen des Single Market Programms der EU im Themenfeld SMP-ESS-2023-GEOS-IBA-REGIO durch Eurostat gefördert.
Fußnoten:
1: Schumann, Carsten / Schepers, Marianne / Weigert, Alexander 2023: Eine zukunftsfähige Bautätigkeitsstatistik In: Wirtschaft und Statistik. Ausgabe 2/2023
2: CDSE - Copernicus Data Space Environment
3: Kirillov, Alexander / Mintun, Eric / Ravi, Nikhila / Mao, Hanzi / Rolland, Chloe / Gustafson, Laura / Xiao, Tete / Whitehead, Spencer / Berg, Alexander C. / Lo, Wan-Yen / Dollár, Piotr / Girshick, Ross 2023: Segment Anything