dc.description.abstract
Stereo Vision ermöglicht die Erstellung von 3D Modellen der Umgebung mit Hilfe von nur zwei starr miteinander verbundenen Kameras. Um eine fehlerhafte 3D Rekonstruktion im Bezug auf dynamische Objekte in der aufgenommenen Szene zu verhindern, werden Stereo-Kameras typischerweise zeitlich synchronisiert. Sollte dies nicht möglich sein, können dynamische Objekte auch in den Bildern detektiert werden. In dieser Arbeit werden zwei solcher Algorithmen, welche auf der Analyse des dichten optischen Flusses zwischen zwei Bildern basieren, vorgestellt. Die Genauigkeit von 3D Modellen hängt auch stark von den Kamerakalibrierungsparametern ab. Diese werden in die Kategorien intrinsische und extrinsische Kameraparameter unterteilt, wobei letztere auch unter dem Begriff relative Stereo-Orientierung bekannt sind. Die Kamerakalibrierung wird typischerweise offline durchgeführt und die ermittelten Parameter werden dann während des Betriebes konstant gehalten. Durch verschiedene Umwelteinflüsse wie Temperatur oder Erschütterungen können sich diese Parameter jedoch ändern, was zu einer verminderten Qualität der rekonstruierten 3D Szene führt. Um diesem Effekt vorzubeugen, werden des öfteren Online-Kalibrierungsverfahren verwendet, um Kameraparameter nachzuführen. Diese Methoden der Nachführung und Kalibrierung sind das Kernthema dieser Dissertation. Dazu wurde die gesamte Pipeline, welche zur Schätzung der extrinsischen Kameraparameter mit Hilfe von Korrespondenzen zwischen zwei Bildern notwendig ist, analysiert. Des Weiteren wird in dieser Arbeit eine neuartige Methode, um hochgenaue relative Stereo-Orientierungen zu schätzen, vorgestellt. Da Kameraorientierungsschätzalgorithmen stark von Bildkorrespondenz-Genauigkeiten abhängen, wurde eine tiefgreifende Analyse von verschiedenen Korrespondenz-Typen durchgeführt. Diese bestehen aus markanten Bildpunkten und einer Beschreibung der lokalen Bildumgebung. Letztere werden als Deskriptoren bezeichnet. Dazu wurden verschiedene Algorithmus-Kombinationen zur Berechnung von markanten Bildpunkten und Deskriptoren evaluiert. Dazu wurden öffentlich verfügbare Datensätze, welche die zu erzielenden Ergebnisse (Ground Truth (GT)) beinhalten, verwendet. Da die meisten Datensätze aber keine GT für Bildkorrespondenzen enthalten, wurde eine Methode entwickelt, welche diese aus anderen GT-Daten berechnet. Die Genauigkeit und Eindeutigkeit dieser sogenannten Ground Truth Matches (GTM) wurde über manuelle Annotierungen ermittelt. Diese erlaubten es auch, eine tiefgreifende Analyse der zugrundeliegenden Datensätze durchzuführen, welche dieser Arbeit entnommen werden kann. Um Bildkorrespondenzen von korrelierenden Bildern zu berechnen, wird ein Korrespondenzanalyse-Algorithmus benötigt, welcher Deskriptoren von diesen Bildern miteinander vergleicht. In dieser Arbeit wird ein neuartiger Korrespondenzanalyse-Algorithmus vorgestellt und mit aktuellen Algorithmen verglichen, welcher den Suchraum im Bildraum einschränkt, um die Korrespondenzanalyse zu beschleunigen und gleichzeitig hochgenaue Ergebnisse zu liefern. Berechnete Bildkorrespondenzen können dazu verwendet werden, um relative Orientierungen zwischen Kameras zu berechnen. Da Korrespondenzen üblicherweise Ausreißer beinhalten, welche eine inkorrekte Orientierungsberechnung verursachen, sollte eine solche Berechnung mittels robuster Methoden durchgeführt werden. Die Genauigkeit einer berechneten Kameraorientierung hängt aber auch stark von anderen Faktoren, wie der Positionsgenauigkeit von markanten Bildpunkten und der Tiefe von triangulierten Punkten im dreidimensionalen Raum ab. Um die Leistungsfähigkeit und Genauigkeit von robusten Methoden, Lineargleichungslösern und Verfeinerungsalgorithmen zu bestimmen, werden Datensätze benötigt, welche GT und eine bestimmte and bekannte Varianz der obengenannten Dateneigenschaften besitzen. Leider sind solche Datensätze nur schwer zu finden bzw. zu beschaffen. Daher stellt diese Arbeit ein System vor, um Datensätze mit verschiedensten Eigenschaften aus realen Bildern zu generieren. Diese Datensätze enthalten virtuelle Stereo-Bildpaarkorrespondenzen, welche aus realen Bildern extrahiert werden, sowie alle anderen notwendigen Informationen um diverse Algorithmen, welche auf Bildkorrespondenzen basieren, miteinander vergleichen zu können. Dieses System wurde genutzt, um verschiedene robuste Methoden, Lineargleichungslöser und Verfeinerungsalgorithmen auf Basis verschiedener Szenen-, Orientierungs- und Korrespondenzeigenschaften miteinander zu vergleichen. Abschließend wurde dieses System genutzt um einen neuartigen Algorithmus, welcher in dieser Arbeit vorgestellt wird, zu testen. Dieser Algorithmus ermöglicht die kontinuierliche Bestimmung von hochgenauen Stereo-Kameraorientierungen basierend auf Bildkorrespondenzen, welche über mehrere Stereo-Bildpaare gesammelt und gefiltert werden.
de