Pegoraro, J. (2019). Visual odometry with D2CO : an edge-based visual odometry method using a directional chamfer distance tensor ; eine kantenbasierte visual Odometry Methode mit Directional Chamfer Distance Tensor [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.61260
Visual Odometry (VO) ist der Prozess die Bewegung einer Kamera zu berechnen, indem nur Eingabebilder verwendet werden. Dabei besteht eine solche Bewegung aus Translation und Rotation der Kamera zwischen den beiden Kamerapositionen. Herkömmliche VO-Methoden basieren auf Features, die aus zwei Frames berechnet und abgeglichen werden, um die Kamerabewegung zu bestimmen. In den letzten Jahren wurden diverse Ansätze entwickelt, die sich auf die Intensitätswerte der Bilder stützen, welche sehr gute Ergebnisse liefern. Die Idee hinter dieser Diplomarbeit ist die Erstellung eines VO-Tools, welches von der Methode von Imperoli et al. inspiriert wurde. Imperoli et al. entwickelten ein Tool zur Objekterkennung und 3D-Posenschätzung mit dem Namen Direct Directional Chamfer Optimisation (D2CO). Um ein Objekt mit D2CO zu erkennen, ist ein 3D CAD-File notwendig. Die Position des Objekts kann schließlich durch ein Directional Chamfer Distance (DCD) bestimmt werden. Der Prozess vergleicht Bildkanten mit den Kanten des 3D-Modells und kann dadurch die Position des Objektes im Bild berechnen. In dieser Diplomarbeit wird die Hypothese untersucht, dass die D2CO Methode, nicht nur zur Schätzung der Position von Objekten in einem Bild verwendet werden kann, sondern auch als Tool für VO, indem der DCD-Tensor verwendet wird, um die Kanten in einem Video zu finden. Weiters wird die Struktur der D2CO-Methode geändert, um ein Bild anstelle einer CAD-Datei als Eingabe zu verwenden. Der Tensor wird wie bei D2CO erstellt, jedoch werden die Kantenpunkte anstatt aus einer CAD-Datei extrahiert zu werden, durch einem Kantendetektor aus dem ersten Bild extrahiert. Diese Kantenpunkte werden anschließend in den das zweite Bild projiziert. Zur Optimierung der Pose wird der DCD-Tensor verwendet. Schlussendlich wird das Ergebnis mit State-of-the-Art Methoden verglichen und zukünftige Arbeiten diskutiert.
de
Visual Odometry (VO) is the process of calculating the motion of a camera using only input images. Such a movement consists of translation and rotation of the camera between the two camera positions. Conventional VO methods are based on features that are calculated from two frames and adjusted to determine the camera movement. In recent years, various approaches have been developed based on the intensity values of the images, which provide very good results. The idea behind this diploma thesis is to create a VO tool inspired by the method of Imperoli et al. Imperoli et al. developed a tool for object recognition and 3D pose estimation called Direct Directional Chamfer Optimisation (D2CO). To recognize an object with D2CO, a 3D CAD file is required. The position of the object can finally be determined by a Directional Chamfer Distance (DCD). The process compares image edges with the edges of the 3D model and can thus calculate the position of the object in the image. This thesis examines the hypothesis that the D2CO method can be used not only to estimate the position of objects in an image, but also as a tool for VO by using the DCD tensor to find the edges in a video. Furthermore, the structure of the D2CO method is changed to use an image as input instead of a CAD file. The tensor is created as in D2CO, but instead of being extracted from a CAD file, the edge points are extracted from the first image by an edge detector. These edge points are then projected into the second image. The DCD tensor is used to optimize the pose. Finally, the result is compared with state-of-the-art methods and future work is discussed. Translated with www.DeepL.com/Translator