Publikation Geheimhaltungs­methoden auf dem Prüf­stand – eine Analyse anhand der Umsatz­steuer­statistik

Datum 15. Juli 2004

In der wissenschaftlichen Diskussion zur Geheimhaltungs­problematik von Einzel­daten ist bisher relativ wenig über die Möglichkeit bekannt, unter realitäts­nahen Bedingungen anonymisierten Merkmals­trägern mit Hilfe von so genanntem Zusatz­wissen direkte Identifikatoren korrekt zuzuordnen. Ebenso ist unzureichend geklärt, in welchem Umfang Geheimhaltungs­methoden unter realen Bedingungen in der Lage sind, richtige Zuordnungen zu verhindern. Realitätsnah bedeutet dabei, Einzeldaten einer externen Datei als Zusatz­wissen zu verwenden und dieses mit einem verfügbaren Zuordnungs­algorithmus einer anonymisierten Zieldatei zuzuordnen.

Dieser Beitrag nimmt sich dieser beiden Frage­stellungen an und will mit seinen Resultaten die Diskussion zu den Fragen weiter voranbringen. Hierzu wird im Rahmen von Simulations­experimenten eine externe Datei als Zusatzwissen einem Teilbereich der Umsatz­steuer­statistik 2000 zugeordnet. Die verschiedenen Ergebnisse zeigen, welche Chancen bestehen, Merkmalsträger zu "reidentifizieren“ bzw. ob die Daten durch einen "natürlichen Schutz“ bereits so sicher sind, dass die statistische Geheimhaltung bereits durch "formale“ Anony­misierung gewahrt bleibt.

Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", Juni 2004

Autoren: Dr. Rainer Lenz, Dr. Daniel Vorgrimler