<div class="csl-bib-body">
<div class="csl-entry">Totter, M. (2014). <i>Disclosure risk estimation for survey microdata</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2014.26125</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2014.26125
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/5213
-
dc.description
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
-
dc.description.abstract
Die vorliegende Diplomarbeit beschäftigt sich mit der Schätzung des Re-identifizierungsrisikos für Stichprobendaten. Es ist wichtig, dass veröffentlichte vertrauliche Daten ein sehr geringes Identifizierungsrisiko besitzen, um Gesetze und Richtlinien des Datenschutzes nicht zu verletzen. Das Ziel der Datenanonymisierung besteht aus der Minimierung des Informationsverlustes und der Maximierung der Datensicherheit. In dieser Arbeit werden verschiedene Anonymisierungsmethoden und das Re-identifizierungsrisiko vorgestellt. Das Hauptaugenmerk liegt in der Schätzung von zwei Risikomaßen mittels log-linearen Modellen. Anhand von Simulationen werden die log-linearen Modelle getestet, wobei die Stichproben unterschiedlichen Ziehungsmethoden unterliegen. Die wahren Risikomaße können mit dem geschätzten Risiko verglichen werden, da eine synthetische Population aus Testzwecken generiert wird, aus der die Stichproben gezogen werden. Alle log-linearen Modelle werden zusätzlich in einem Softwarepaket implementiert.
de
dc.description.abstract
The estimation of the re-identification risk of individuals in survey microdata is in main focus of this master thesis. For released confidential data it is mandatory that individuals have very low risk of identification, otherwise laws on data privacy are violated. Many different anonymisation methods exist and their aim is both, to reduce the disclosure risk and to minimize information loss at the same time. The disclosure risk itself is described mathematically and the corresponding methods are implemented in software. One approach for estimating disclosure risk measures of categorical variables is based on log-linear models, which are used for modeling frequency counts. Knowing the truth by using synthetic population data and sampling from it, four log-linear models are tested on four different sampling designs and three different categorical variable scenarios in order to evaluate the performance of the methods. Within a simulation study the influence of different sampling designs on the disclosure risk methods is under consideration.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Statistical Disclosure Control
en
dc.subject
Microdata
en
dc.subject
Disclosure Risk
en
dc.subject
Simulation
en
dc.title
Disclosure risk estimation for survey microdata
en
dc.title.alternative
Schätzung des Re-identifizierungsrisikos für Stichprobendaten
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2014.26125
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Marius Totter
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E105 - Institut für Statistik und Wahrscheinlichkeitstheorie
-
dc.type.qualificationlevel
Diploma
-
dc.identifier.libraryid
AC12232788
-
dc.description.numberOfPages
65
-
dc.identifier.urn
urn:nbn:at:at-ubtuw:1-88794
-
dc.thesistype
Diplomarbeit
de
dc.thesistype
Diploma Thesis
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
item.fulltext
with Fulltext
-
item.grantfulltext
open
-
item.cerifentitytype
Publications
-
item.cerifentitytype
Publications
-
item.languageiso639-1
en
-
item.openairecristype
http://purl.org/coar/resource_type/c_18cf
-
item.openairecristype
http://purl.org/coar/resource_type/c_18cf
-
item.openairetype
Thesis
-
item.openairetype
Hochschulschrift
-
item.openaccessfulltext
Open Access
-
crisitem.author.dept
E101 - Institut für Analysis und Scientific Computing