DC FieldValueLanguage
dc.contributor.advisorTempl, Matthias-
dc.contributor.authorTotter, Marius-
dc.date.accessioned2020-06-29T04:13:20Z-
dc.date.issued2014-
dc.date.submitted2015-03-
dc.identifier.urihttps://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-88794-
dc.identifier.urihttp://hdl.handle.net/20.500.12708/5213-
dc.descriptionAbweichender Titel laut Übersetzung der Verfasserin/des Verfassers-
dc.description.abstractDie vorliegende Diplomarbeit beschäftigt sich mit der Schätzung des Re-identifizierungsrisikos für Stichprobendaten. Es ist wichtig, dass veröffentlichte vertrauliche Daten ein sehr geringes Identifizierungsrisiko besitzen, um Gesetze und Richtlinien des Datenschutzes nicht zu verletzen. Das Ziel der Datenanonymisierung besteht aus der Minimierung des Informationsverlustes und der Maximierung der Datensicherheit. In dieser Arbeit werden verschiedene Anonymisierungsmethoden und das Re-identifizierungsrisiko vorgestellt. Das Hauptaugenmerk liegt in der Schätzung von zwei Risikomaßen mittels log-linearen Modellen. Anhand von Simulationen werden die log-linearen Modelle getestet, wobei die Stichproben unterschiedlichen Ziehungsmethoden unterliegen. Die wahren Risikomaße können mit dem geschätzten Risiko verglichen werden, da eine synthetische Population aus Testzwecken generiert wird, aus der die Stichproben gezogen werden. Alle log-linearen Modelle werden zusätzlich in einem Softwarepaket implementiert.de
dc.description.abstractThe estimation of the re-identification risk of individuals in survey microdata is in main focus of this master thesis. For released confidential data it is mandatory that individuals have very low risk of identification, otherwise laws on data privacy are violated. Many different anonymisation methods exist and their aim is both, to reduce the disclosure risk and to minimize information loss at the same time. The disclosure risk itself is described mathematically and the corresponding methods are implemented in software. One approach for estimating disclosure risk measures of categorical variables is based on log-linear models, which are used for modeling frequency counts. Knowing the truth by using synthetic population data and sampling from it, four log-linear models are tested on four different sampling designs and three different categorical variable scenarios in order to evaluate the performance of the methods. Within a simulation study the influence of different sampling designs on the disclosure risk methods is under consideration.en
dc.formatII, 65 Bl.-
dc.languageEnglish-
dc.language.isoen-
dc.subjectStatistical Disclosure Controlen
dc.subjectMicrodataen
dc.subjectDisclosure Risken
dc.subjectSimulationen
dc.titleDisclosure risk estimation for survey microdataen
dc.title.alternativeSchätzung des Re-identifizierungsrisikos für Stichprobendatende
dc.typeThesisen
dc.typeHochschulschriftde
tuw.publication.orgunitE105 - Institut für Statistik und Wahrscheinlichkeitstheorie-
dc.type.qualificationlevelDiploma-
dc.identifier.libraryidAC12232788-
dc.description.numberOfPages65-
dc.identifier.urnurn:nbn:at:at-ubtuw:1-88794-
dc.thesistypeDiplomarbeitde
dc.thesistypeDiploma Thesisen
item.fulltextwith Fulltext-
item.cerifentitytypePublications-
item.cerifentitytypePublications-
item.openaccessfulltextOpen Access-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.grantfulltextopen-
item.openairetypeThesis-
item.openairetypeHochschulschrift-
Appears in Collections:Thesis

Files in this item:


Page view(s)

22
checked on Nov 27, 2021

Download(s)

77
checked on Nov 27, 2021

Google ScholarTM

Check


Items in reposiTUm are protected by copyright, with all rights reserved, unless otherwise indicated.