Title: Better end-to-end object detection in low SNR environments with time-of-flight cameras
Language: English
Authors: Müllner, Bernhard 
Keywords: Neuronale Netze; Time-of-Flight; Datensatz
neural networks; time-of-flight; dataset
Advisor: Grosu, Radu 
Assisting Advisor: Mohammad Hasani, Ramin
Issue Date: 2019
Number of Pages: 73
Qualification level: Diploma
Abstract: 
Diese Diplomarbeit beschäftigt sich mit dem Problem, dass es keine Datensätze zum Trainieren von neuronalen Netzen gibt, welche mit einer Time-of-Flight Kamera aufgenommen wurden. Solche Datensätze sind aber unerlässlich, um bessere End-zu-End Objekterkennungssysteme, die auf Time-of-Flight Daten basieren, zu entwickeln. Daher wird in dieser Arbeit ein neuer, klar strukturierter Datensatz mit einer Time-of-Flight Kamera aufgenommen, welcher elektrische Handwerkzeuge zeigt. 32 Werkzeuge werden auf drei unterschiedlichen Hintergründen in zwei oder drei verschiedenen Positionen von verschiedenen Winkeln aus aufgenommen. Neben der Klassifizierung der Werkzeuge wird für die circa 100 000 Bilder auch ein Begrenzungsrechteck zur Verfügung gestellt. Zum Testen des aufgenommenen Datensatzes werden zwei Faltungsnetze (englisch: Convolutional Neural Networks) mit diesem trainiert. Des Weiteren wird die Kombination aus Time-of-Flight Daten mit Farbbildern analysiert und implementiert.

This diploma thesis deals with the problem, that there is no big dataset available yet, which is usable to train neural networks and is recorded with a time-of-flight camera. Such datasets are necessary to develop better end-to-end object detection networks which use time-of-flight data as input. Therefore, a new, big and clear structured dataset showing electrical handheld power tools is generated. It shows 32 tools on three backgrounds in two or three positions, recorded from different angles. Beside a mapping to a class, a bounding box for each of the nearly 100 000 instances is provided. Additionally, for each recorded time-of-flight depth image, a synchronously taken color image is given. For testing the newly generated dataset, two state of the art convolutional neural networks are trained on it. Moreover, the combination of the time-of-flight sensor and the color sensor is discussed and implemented.
URI: https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-129856
http://hdl.handle.net/20.500.12708/2676
Library ID: AC15486298
Organisation: E191 - Institut für Computer Engineering 
Publication Type: Thesis
Hochschulschrift
Appears in Collections:Thesis

Files in this item:

Show full item record

Google ScholarTM

Check


Items in reposiTUm are protected by copyright, with all rights reserved, unless otherwise indicated.