Diese Diplomarbeit beschäftigt sich mit dem Problem, dass es keine Datensätze zum Trainieren von neuronalen Netzen gibt, welche mit einer Time-of-Flight Kamera aufgenommen wurden. Solche Datensätze sind aber unerlässlich, um bessere End-zu-End Objekterkennungssysteme, die auf Time-of-Flight Daten basieren, zu entwickeln. Daher wird in dieser Arbeit ein neuer, klar strukturierter Datensatz mit einer Time-of-Flight Kamera aufgenommen, welcher elektrische Handwerkzeuge zeigt. 32 Werkzeuge werden auf drei unterschiedlichen Hintergründen in zwei oder drei verschiedenen Positionen von verschiedenen Winkeln aus aufgenommen. Neben der Klassifizierung der Werkzeuge wird für die circa 100 000 Bilder auch ein Begrenzungsrechteck zur Verfügung gestellt. Zum Testen des aufgenommenen Datensatzes werden zwei Faltungsnetze (englisch: Convolutional Neural Networks) mit diesem trainiert. Des Weiteren wird die Kombination aus Time-of-Flight Daten mit Farbbildern analysiert und implementiert.
de
This diploma thesis deals with the problem, that there is no big dataset available yet, which is usable to train neural networks and is recorded with a time-of-flight camera. Such datasets are necessary to develop better end-to-end object detection networks which use time-of-flight data as input. Therefore, a new, big and clear structured dataset showing electrical handheld power tools is generated. It shows 32 tools on three backgrounds in two or three positions, recorded from different angles. Beside a mapping to a class, a bounding box for each of the nearly 100 000 instances is provided. Additionally, for each recorded time-of-flight depth image, a synchronously taken color image is given. For testing the newly generated dataset, two state of the art convolutional neural networks are trained on it. Moreover, the combination of the time-of-flight sensor and the color sensor is discussed and implemented.