Über uns Forschungsstränge

Anonymisierung durch synthetische Daten

Synthetische Datensätze, welche die Kennwerte und gemeinsame Verteilungen von Datensätzen ohne tatsächliche Beobachtungen reproduzieren, stellen eine innovative Option für die Bereitstellung von anonymisierten Einzeldaten für die Forschung und die Öffentlichkeit bei Wahrung eines hohen Analysenutzens dar. Im Rahmen dieses Teilprojekts werden bestehende Verfahren und Methoden zur Generierung synthetischer Daten weiterentwickelt und auf Grundlage von Kriterien wie Verteilungserhalt und Analysenutzen, Anonymisierung und Offenlegungsrisiko und Aufwand der Anwendung evaluiert. Ziel ist die Prüfung des Einsatzes synthetischer Daten für Forschungsdatenzentren und die Entwicklung und Veröffentlichung von Skripten zur Erstellung synthetischer Daten, die entsprechende Anforderungen erfüllen.

Beteiligte Institute:

  • Institut für Arbeitsmarkt- und Berufsforschung - Kompetenzzentrum Empirische Methoden
  • Statistisches Bundesamt - Forschungsdatenzentrum, Methoden der Datenanalyse
  • Statistisches Bundesamt - Künstliche Intelligenz, Big Data
  • Statistisches Bundesamt - Statistische Geheimhaltung

Anonymisierung georeferenzierter Daten

Georeferenzierte Daten entfalten ein außerordentliches Potential für Forschung und Lehre, öffentliche Verwaltung und Wirtschaft. Wesentliche Fragen zur Zukunft und Nachhaltigkeit unserer Gesellschaft können nur mit qualitativ hochwertigen und zugänglichen georeferenzierten Daten beantwortet werden. Im Rahmen dieses Forschungsstrangs werden zum einen neue Datenbestände mit erheblichem Potential für Regionalanalysen wie Mobilfunkdaten betrachtet. Zum anderen werden bestehende Verfahren und Methoden zur Anonymisierung von georeferenzierten Daten evaluiert und neue Ansätze entwickelt.

Beteiligte Institute:

  • Deutsche Universität für Verwaltungswissenschaften, Speyer
  • Statistisches Bundesamt - Erforschung neuer digitaler Daten
  • Statistisches Bundesamt - Forschungsdatenzentrum, Methoden der Datenanalyse
  • Statistisches Bundesamt - Künstliche Intelligenz, Big Data
  • Statistisches Bundesamt - Statistische Geheimhaltung
  • Technische Hochschule Köln

Partner:

  • Telekom Deutschland GmbH
  • Universität Duisburg-Essen

Evaluierung anonymisierter Daten anhand formeller Kriterien

Die Rechtswissenschaft tut sich bislang schwer damit, die Grenzen zwischen rechtlich besonders schützenswerten Daten und anonymisierten Daten abzustecken. Das Ziel dieses Forschungsstrangs ist die Formalisierung der von der Rechtsordnung vorgegebenen materiellen Kriterien für den Erfolg einer Anonymisierung. Zur Erreichung des Ziels sind verschiedene Bereiche zu bearbeiten, wie beispielsweise die Analyse des materiellen Rechtsrahmens oder die Zusammenführung und Überführung vielfältiger Arbeitsergebnisse aus anderen Forschungssträngen in eine Dokumentation.

Beteiligtes Institut:

  • Deutsche Universität für Verwaltungswissenschaften, Speyer

Offene Software-Tools

Der Forschungsstrang beschäftigt sich mit der Nutzung von anonymisierten georeferenzierten Daten sowie den Grenzen, die durch die Anonymisierung gesetzt werden. Es sollen statistische Analyseverfahren entwickelt werden, welche Anonymisierungseffekte berücksichtigen und eine präzisere Auswertung von anonymisierten georeferenzierten Daten ermöglichen. Diese Vorgehensweise soll für verschiedene Anwendungsfelder demonstriert werden. Zugleich soll eine nutzerfreundliche und verbesserte Open-Source Software zur Tabellengeheimhaltung unter Verwendung von Daten der amtlichen Statistik getestet und weiterentwickelt werden.

Beteiligte Institute:

  • Statistisches Bundesamt - Statistische Geheimhaltung
  • Freie Universität Berlin

Partner:

  • Max-Planck-Institut für Softwaresysteme