Publikation
Partielle Synthetisierung zur Anonymisierung der verknüpften Verdienststrukturerhebung 2018 - Teil 1: Methodik und Evaluation der Datennützlichkeit (Teil 2 in 5/2025)
Datum 15. August 2025
Der Einsatz von synthetischen Daten wird als Alternative gehandelt, um das Spannungsfeld zwischen Erhalt des Analysepotenzials bei gleichzeitiger Gewährleistung des Schutzes der Daten optimal aufzulösen. Der Beitrag geht dieser Frage nach mit der Verdienststrukturerhebung 2018 als Datenbasis. Sie setzt sich aus einem Betriebsdatensatz und einem Angestelltendatensatz zusammen und bildet damit einen Linked-Employer-Employee-Datensatz. Bei verknüpften Datensätzen besteht die Schwierigkeit für die unabhängige Synthetisierung darin, die gewohnte Konsistenz zwischen den Datensätzen zu gewährleisten. Mithilfe eines schrittweisen partiellen multiplen Synthetisierungsansatzes konnte diese Konsistenz sichergestellt werden. Die Ergebnisse bezüglich der Nützlichkeit der generierten Daten sind vielversprechend.
Auszug aus der Publikation "WISTA - Wirtschaft und Statistik", 4/2025
Autoren: Dr. Hanna Brenzel, Yannik Garcia Ritz