Maschinelles Lernen ist ein Teilgebiet des Forschungsfeldes "Künstliche Intelligenz". Es beschreibt Herangehensweisen, bei denen ein Algorithmus Muster in Lerndaten erkennt, also gleichsam erlernt. Die erkannten Muster werden dann unter anderem auf unbekannte (z. B. neu eingehende) Daten übertragen, um beispielsweise auf Dauer nicht oder nur händisch durchführbare Klassifikationsaufgaben in der amtlichen Statistik zu automatisieren. Die zentralen Qualitätsversprechen der Statistischen Ämter des Bundes und der Länder erfordern dabei einen besonders sorgfältigen Umgang mit den Daten.
Das Statistische Bundesamt sammelt seit ca. 2015 kontinuierlich Erfahrung im Einsatz von Verfahren der Künstlichen Intelligenz und des Maschinellen Lernens (KI/ML) beispielsweise zur Codierung (Einordnung in die standardisierten Klassifikationssysteme für wirtschaftliche Tätigkeiten, Konsumgüter usw.), Plausibilisierung (Finden und Korrigieren fehlerhafter Werte) und Imputation (Ersetzen fehlender Werte). Insbesondere Aufgabenstellungen, die mit Natural Language Processing zur Textverarbeitung bearbeitet werden, treten in der amtlichen Statistik zunehmend häufiger auf. Die Ziele des Einsatzes von KI/ML sind dabei stets effizientere Prozesse (beispielsweise in der Datenaufbereitung), umfangreichere Analyseoptionen (beispielsweise durch Zuschätzung von Merkmalen an bestehende Erhebungen ohne Mehrbelastung der Auskunftgebenden) oder eine höhere Qualität (beispielsweise durch automatisierte Durchführung von andernfalls nicht erfolgten Plausibilisierungen).
Das Statistische Bundesamt ist zuverlässiger Statistikproduzent, digitaler Datenmanager und Datenkompetenzzentrum sowie kundenorientierter Informationsdienstleister. Der qualitätsgesicherte Einsatz von modernen Methoden und Techniken aus dem Bereich KI/ML ist hierbei unerlässlich. Neben der regelmäßigen Durchführung zugehöriger methodischer Untersuchungen modernisiert das Statistische Bundesamt dafür außerdem seine IT- und Dateninfrastruktur und qualifiziert seine Beschäftigten für den Umgang mit neuen Technologien und digitalen Arbeitsformen.
Beispiele für unsere Aktivitäten zu Künstlicher Intelligenz und Maschinellem Lernen:
- Video zum internationalen Hackathon 2022
- Maschinelles Lernen in der deutschen amtlichen Statistik (Vortrag anlässlich des 32. Wissenschaftlichen Kolloquiums "Zukunft der Statistik" 2023)
- Internationale Konferenz zu Foundations and Advances of Machine Learning in Official Statistics 2024
- Maschinelles Lernen im Statistischen Bundesamt – Ein Überblick über die Historie seit 2015 und aktuelle Entwicklungen (Auszug aus WISTA 04/24).