dc.description.abstract
Das Thema dieser Arbeit ist der Trifokal-Tensor, der die relative Orientierung (oder Epipolargeometrie) von drei unkalibrierten Bildern beschreibt. In diesem Sinne ist der Tensor eine Erweiterung der Fundamental-Matrix, welche die relative Orientierung von zwei unkalibrierten Bildern beschreibt. Der Trifokal-Tensor ist ein homogener Tensor der Stufe 3; dem gemäß kann er als 3×3×3 Zahlenwürfel dargestellt werden. Aufgrund der folgenden Eigenschaften ist dieser Tensor von besonderem Interesse: ? Der Trifokal-Tensor kann in linearer Weise aus gegebenen Punkt- und Linienkorrespondenzen in drei Bildern bestimmt werden; letztere sind für die Bestimmung der Fundamental- Matrix nicht verwendbar. Aus diesem Grund stellt der Trifokal-Tensor ein Werkzeug für die Bestimmung der relativen Orientierung von drei Bildern dar, für das keine Näherungswerte benötigt werden. Diese so gefundene Orientierung kann dann als Startwert für eine anschließende Bündelblockausgleichung verwendet werden.Weiters ist dieWahrscheinlichkeit auf eine gefährliche Konfiguration zu treffen, die keine eindeutige Bestimmung des Tensors erlaubt, wesentlich geringer als für zwei Bilder und ihre Fundamental-Matrix. Die einzige praktisch relevante gefährliche Situation entsteht nur dann, wenn alle korrespondierenden Bildpunkte und -linien von einer gemeinsamen Ebene stammen. Nachdem der Trifokal-Tensor bestimmt wurde, können die Basisvektoren und Rotationsmatrizen der relativen Orientierung der drei Bilder einfach extrahiert werden ? wenn die innere Orientierung bekannt ist. Ist diese unbekannt, aber ident für alle drei Bilder, so kann diese gemeinsame innere Orientierung ebenfalls im Allgemeinen bestimmt werden. Sind n = 3 Bilder gegeben, so werden mehrere unzusammenhängende Trifokal-Tensoren berechnet. Bevor alle n Bilder gemeinsam weiterverarbeitet werden können, müssen die einzelnen unzusammenhängenden Basisvektoren und Rotationsmatrizen in ein gemeinsames System transformiert werden. ? Die sogenannten Transferbeziehungen, die sich aus dem Trifokal-Tensor ableiten lassen, können verwendet werden, um den Inhalt (Punkte und Geraden) von zwei Quellbildern in ein anderes Bild ? das Zielbild ? zu transferieren. Falls dieses Zielbild eine echtes Bild ist, dann können die transferierten Positionen verwendet werden um ein Matching-Verfahren zu starten. Falls dieses Zielbild eine virtuelles Bild mit gegebener Orientierung darstellt, dann kann der Inhalt dieses neuen Bildes mit Hilfe der Transferrelationen Pixel für Pixel aus den beiden Quellbildern aufgebaut werden. Dieser Vorgang wird im Englischen als novel view synthesis oder image formation bezeichnet. In dieser Arbeit wird der erste Punkt ? die Berechnung des Trifokal-Tensors ? näher behandelt. Jedes Triple von korrespondierenden Punkten liefert 4 Gleichungen, die sogenannten Trilinearitäten, welche linear in den 27 Tensorelementen sind. Jedes Tripel von korrespondierenden Geraden liefert 2 lineare Gleichungen. Demzufolge benötigt man mindestens 7 Punkte, 13 Geraden oder eine passende Kombination um den Trifokal-Tensor direkt bestimmen zu können. Mit dieser direkten linearen Lösung für den Trifokal-Tensor sind allerdings ein paar Nachteile verbunden. Der Trifokal-Tensor besteht zwar aus 27 Elementen, jedoch besitzt er nur 18 Freiheitsgrade. Aus diesem Grund müssen die Tensorelemente 8 interne Bedingungen erfüllen, neben der Festlegung des Tensormaßstabes, um einen gültigen Trifokal-Tensor zu repräsentieren. Diese Bedingungen werden im Allgemeinen von der direkten linearen Lösung nicht erfüllt. Ein weiterer Nachteil ist, dass die direkte lineare Lösung nicht die Fehler in den originalen Bildbeobachtungen minimiert (die sogenannten Residuen), sondern den sogenannten algebraischen Fehler. Diese Nachteile kann man beseitigen, wenn man einen gültigen Trifokal-Tensor über die Minimierung der Bildresiduen berechnet. Das sogenannte Gauß-Helmert Modell stellt eine allgemeine Umgebung für derartige bedingte Ausgleichungsaufgaben dar. Die Berechnung eines gültigen Trifokal-Tensor im Gauß-Helmert Modell kann in zwei Arten realisiert werden: Indem der Trifokal-Tensor durch seine 27 Elemente repräsentiert wird und die 8 internen Bedingungen gemeinsam mit der Festlegung des Maßstabes zusätzlich ins Gauß-Helmert Modell aufgenommen werden; oder indem der Trifokal-Tensor durch eine andere alternative Parametrisierung, die genau 18 Freiheitsgrade hat, dargestellt wird. Verschiedene Gruppen von Bedingungen und unterschiedliche Parametrisierungen wurden in der Vergangenheit publiziert, und die wichtigsten davon werden in dieser Arbeit zusammengefasst. Die meisten dieser Bedingungen und Parametrisierungen leiten sich aus den sogenannten Tensorschnitten ab. Dabei handelt es sich um 3×3 Matrizen, die aus dem Tensor sozusagen herausgeschnitten werden können. Aufgrund ihrer hohen Bedeutung werden diese Tensorschnitte in dieser Arbeit sehr genau untersucht. Mit ihrer Hilfe werden zwei neue Gruppen von Bedingungen, die auch eine einfache geometrische Interpretation erlauben, und eine neue alternative Parametrisierung für den Trifokal-Tensor hergeleitet. Um nun einen gültigen Trifokal-Tensor im Gauß-Helmert Modell über die Minimierung der Bildresiduen berechnen zu können, ist es wichtig eine konsistente Repräsentierung für den Tensor zu besitzen. Die von Hartley vorgeschlagene Parametrisierung mit Hilfe der Projektionsmatrizen ist die einfachste Möglichkeit für solch eine konsistente Repräsentierung. Diese Parametrisierung ist anwendbar solange (i) nicht alle drei Projektionszentren zusammenfallen und (ii) das erste Projektionszentrum verschieden von den anderen beiden ist. Wenn alle Korrespondenzen in den drei Bildern von einer gemeinsamen Ebene stammen, dann kann der Trifokal-Tensor nicht eindeutig bestimmt werden. Aus diesem Grund wird in dieser Arbeit die minimaler Dicke der Objektpunkte untersucht; d.h. was ist die minimal notwendige Abweichung von einer gemeinsamen Ebene, sodass der Trifokal-Tensor immer noch erfolgreich berechnet werden kann? Diese Untersuchung wird empirisch anhand verschiedener Bildkonfigurationen und unterschiedlicher Punktanzahl durchgeführt. In diesen Untersuchungen werden weiters die Unterschiede im berechneten Trifokal-Tensor behandelt, die entstehen wenn die internen Bedingungen berücksichtigt werden oder nicht, und wenn algebraische Fehler oder Bildresiduen minimiert werden. Die Erkenntnisse dieser empirischen Untersuchungen können wie folgt zusammengefasst werden: Für Bildkonfigurationen mit guter Geometrie, wie im Fall von konvergenten terrestrischen Aufnahmen oder im Fall von Luftbildern, stimmt die direkte lineare Lösung (algebraischer Fehler ohne Bedingungen) für den Tensor praktisch mit dem gültigen Tensor, der im Gauß- Helmert Modell (Bildresiduen mit Bedingungen) geschätzt wird überein. Für diese Konfigurationen mit guter Geometrie wurden auch erstaunlich geringe minimale Dicken bereits bei der Verwendung von 10 korrespondierenden Punkten gefunden. Nimmt die Anzahl der Punkte zu, so wird auch die minimale Dicke kleiner. Für die erwähnten Konfigurationen und 15 Punkttripel war die Berechung des Tensors für eine minimale Dicke von etwa 1% der Aufnahmeentfernung immer noch erfolgreich (Normalwinkel Aufnahmen und angenommenes Bildrauschen von 1 Pixel). Für Bildkonfigurationen mit schwacher Geometrie, wie im Fall von kollinearen Projektionszentren mit zusammenfallenden Blickrichtungen, ist eine deutlich größere Punkteanzahl ist notwendig und die direkte lineare Lösung versagt viel häufiger bei kleinen Objektdicken als die gültige Lösung übers Gauß-Helmert Modell. Diese empirischen Untersuchungen führen uns zum Schluss, dass für Konfigurationen mit guter Geometrie die Minimierung der Bildresiduen und die Berücksichtigung der internen Bedingungen eigentlich nicht notwendig ist ? besonders dann nicht, wenn man nur an Näherungswerten für eine anschließende Bündelblockausgleichung interessiert ist. Benötigt man jedoch ein allgemeines Werkzeug, das Näherungswerte für die Bildorientierungen liefert und keine Einschränkungen an die Bildkonfiguration setzt und auch bei schwächerer Geometrie funktioniert, so ist die Lösung übers Gauß-Helmert Modell zu realisieren.
de