Title: Optimizing realism in synthetic data for training 2D human pose estimation algorithms
Other Titles: Optimierung des Realismus in synthetischen Daten für das Training von Algorithmen zur menschlichen 2D-Posenschätzung
Language: English
Authors: Stiedl, Fabian 
Qualification level: Diploma
Advisor: Gelautz, Margrit  
Issue Date: 2020
Number of Pages: 63
Qualification level: Diploma
Abstract: 
Das Generieren von synthetischen Daten, die Menschen enthalten, ist ein immer wichtiger werdendes Thema in der Bildverarbeitung. Im Kontext von Deep Learning werden große Mengen an annotierten Daten für das Trainieren von Algorithmen benötigt. Das Problem fehlender realer Trainingsdaten kann mithilfe von synthetischen Daten gelöst werden, da beim Generieren dieser synthetischen Daten als Nebenprodukt Annotierungen erzeugt werden. Die vorliegende Arbeit untersucht die Generierung synthetischer Bilder, die Menschen enthalten, im Zusammenhang mit der Schätzung menschlicher 2D Körperhaltung. Der Fokus dieser Arbeit liegt auf dem Design und der Implementierung eines mit der Spiel-Engine Unity entwickelten Frameworks, das synthetische Trainingsdaten für das Trainieren eines Deep Learning Algorithmus und dessen Benchmarks auf dem COCO Datensatz erzeugt. Im Mittelpunkt des Frameworks steht die Möglichkeit, eine Reihe von Parametern bei der Generierung synthetischer Daten zu ändern. Insbesondere evaluieren wir, wie sich Veränderungen von Haaren, Hintergründen und Texturen der menschlichen Modelle auf die Genauigkeit des trainierten Algorithmus auswirken. Unsere Ergebnisse zeigen, dass die Vielfalt der Variationen der ausgewerteten Aspekte bis zu einem gewissen Punkt von Bedeutung sind.

Generating synthetic data containing humans is a subject of growing importance in computer vision. In the context of deep learning algorithms, large amounts of annotated data are needed for training. Synthetic data can help overcome a frequent lack of real annotated training data with ground truth annotations, which are produced as a by-product of the data synthesis process. This thesis examines the generation of synthetic images containing human characters in connection with human 2D joint estimation algorithms. The focus of this work lies in designing and implementing a framework using the game engine Unity for generating synthetic training data for training and benchmarking a deep learning algorithm on the COCO dataset. We develop the framework in a way that allows us to change a number of parameters when generating synthetic data. In particular, we evaluate the impact of hair, background and human model textures on the accuracy of our estimator. Our evaluations show that increasing the variability of clothing textures, hairstyles and background images clearly improves the results up to a certain point.
Keywords: menschliche Posenschätzung; Simulation; Machinelles Lernen
human pose estimation; simulation; machine learning
URI: https://doi.org/10.34726/hss.2020.80161
http://hdl.handle.net/20.500.12708/16504
DOI: 10.34726/hss.2020.80161
Library ID: AC16111708
Organisation: E193 - Institut für Visual Computing and Human-Centered Technology 
Publication Type: Thesis
Hochschulschrift
Appears in Collections:Thesis

Files in this item:

Show full item record

Google ScholarTM

Check


Items in reposiTUm are protected by copyright, with all rights reserved, unless otherwise indicated.