Kraft, S. (2009). Simulation of a population for the European Living and Income Conditions Survey [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-31945
EU-SILC; AMELI; Laeken Indicators; simulation; population
en
Abstract:
Diese Arbeit ist ein Beitrag zum Forschungsprojekt AMELI (=Advanced Methodology for European Laeken Indicators), an dem das Institut für Statistik und Wahrscheinlichkeitstheorie der TU Wien beteiligt ist. Das Ziel dieses Projekts ist die Methodik zur Schätzung von Armut und sozialer Ausgrenzung zu verbessern und Empfehlungen für politische Entscheidungsträger zu liefern.<br />Für den Vergleich und die Bewertung unterschiedlicher Methoden ist eine möglichst realitätsnahe Umgebung erforderlich. Das beinhaltet vor allem eine Grundgesamtheit, von der Stichproben gezogen werden können. In den meisten Fällen sind Daten allerdings nicht für die ganze Grundgesamtheit verfügbar oder können aus Datenschutzgründen nicht verwendet werden.<br />Daher müssen Daten für die Grundgesamtheit simuliert werden, basierend auf realen Stichproben.<br />Die Hauptaufgabe dieser Diplomarbeit bestand in der Entwicklung von Programmen für die Simulation von Grundgesamtheiten mit der Statistiksoftware R. Ausgangspunkt für die Entwicklung war ein Paper von Münnich und Schürle (2003), welches ein allgemeines Modell für die Simulation von Grundgesamtheiten sowie dessen Anwendung auf die Daten des deutschen Mikrozensus. Um die Anforderungen des AMELI-Projekts zu erfüllen wurde dieses allgemeine Modell sowohl angepasst als auch erweitert.<br />Die Diplomarbeit beschreibt das Simulationsschema und seine Anwendung auf die EU-SILC (= European Survey of Income and Living Conditions) Daten, welche die Basis für das AMELI-Projekt bilden. Die zugrundeliegende Theorie der statistischen Methoden wird ebenso behandelt wie ihre Anwendung. Um die Resultate bewerten zu können wird ein Vergleich zwischen den Daten der Stichprobe und den simulierten Daten der Grundgesamtheit präsentiert. Die Dokumentation der entwickelten Software sowie Teile des Quellcodes finden sich im Appendix.<br />
de
This thesis is a contribution to the AMELI (=Advanced Methodology for European Laeken Indicators) project, in which the Department of Statistics and Probability Theory of the TU Wien participates. The aim of this project is to improve methods for the estimation and the monitoring of poverty and social exclusion as well as to deliver recommendations for policy makers.<br />For the comparison and the evaluation of different methods a close-to-reality environment is needed. Above all, this includes a population from which samples can be drawn. However, in most cases population data are not available or cannot be used due to disclosure risks. Therefore, population data are simulated based on real datasets.<br />The main task of this thesis was the development of programs for the simulation of populations with the statistical environment R. The initial point for this development was a paper by Münnich and Schürle (2003) which described a general simulation model and its application to the German Microcensus data. To meet the requirements of the AMELI project, this general model had to be adapted and extended.<br />This thesis describes the simulation scheme and its application to the EU-SILC (= European Survey of Income and Living Conditions) data, which provide a basis for the AMELI project. The theory of the different statistical methods is discussed as well as their implementation. To evaluate the results, a comparison between sample and simulated population data is presented. The documentation of the developed software and parts of the source code can be found in the appendix.<br />