Veranstaltungen Dr. Florian Dumpert
Statistisches Bundesamt

Zur Person:

Die qualitätsgesicherte Einführung und Nutzung von maschinellem Lernen in der amtlichen Statistik im Rahmen und als Voraussetzung für Digitalisierung, Standardisierung und Automatisierung ist ein Schwerpunkt der Arbeit von Florian Dumpert. Der Mathematiker leitet das Referat "Künstliche Intelligenz, Big Data" im Statistischen Bundesamt. Zu seinen Interessen gehören statistisches maschinelles Lernen sowie statistische Datenaufbereitung und Imputation. Er beteiligt sich regelmäßig an nationalen und internationalen Projekten zu diesen Themen und vertritt die Disziplinen in einschlägigen Arbeitsgruppen und Gremien.

Und darum geht es:

Die amtliche Statistik steht vor einer Vielzahl von Herausforderungen. Angetrieben durch die erweiterten Möglichkeiten der Informationsbeschaffung und den Fortschritt in der Informationstechnologie ändert sich die Nachfrage nach Informationen aus Politik, Wirtschaft und Gesellschaft zu den verschiedensten Themenbereichen der amtlichen Statistik. Um diese Nachfrage angemessen befriedigen zu können, muss auch die Produktion von Statistiken weiterentwickelt werden. Dabei geht es auch darum, die Produktionsprozesse effizienter zu gestalten. Dies gilt insbesondere für Schritte im Bereich der Datenaufbereitung (GMAS-Phase 5), wie Klassifizieren und Codieren, Prüfen und Validieren sowie Plausibilisieren und Imputieren. In vielen nationalen statistischen Ämtern werden daher Lösungen zur (Teil-)Automatisierung der Verarbeitungsschritte getestet und implementiert. Im ersten Teil wird der Vortrag auf ausgewählte Ansätze eingehen.
Während die (Teil-)Automatisierung auf die Effizienz der Statistikproduktion abzielt und unter Umständen neue Möglichkeiten der Datenaufbereitung eröffnet, darf der Aspekt der Qualität gerade in der amtlichen Statistik nicht vernachlässigt werden. Schlechte Qualität führt sehr schnell zu einem Vertrauensverlust. Bestehende Rahmenwerke auf Ebene der Vereinten Nationen, auf supranationaler Ebene (z. B. für die Europäische Union) oder auf nationaler Ebene berücksichtigen häufig und zu Recht allgemeine Anforderungen an die statistische Institution, die Prozesse und die statistischen Produkte. Allerdings ist eine Konkretisierung für spezielle Situationen, wie den Einsatz von maschinellem Lernen, notwendig. Es gibt erste internationale und nationale Arbeiten, die sich mit dieser Konkretisierung befassen. Der Vortrag wird im zweiten Teil auf den Qualitätsaspekt eingehen.