Müller, A. (2008). PRIP3V: Construction and Evaluation of a Vision Based Range Sensor [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/179727
E183 - Institut für Rechnergestützte Automation (Automatisierungssysteme. Mustererkennung)
-
Date (published):
2008
-
Number of Pages:
58
-
Keywords:
Abstandsanalyse; Oberflächenrekonstruktion; Kalibrierung; Verdeckung; Stereobildanalyse; Rekonstruktion durch strukturierte Beleuchtung
de
computer vision; range sensor; calibration; occlusion; stereo vision; shape from structured light
en
Abstract:
Die Abstandsanalyse und Oberflächenrekonstruktion mit Hilfe von visuellen Sensoren findet Anwendung in Bereichen wie zum Beispiel dem Reverse Engineering, der Qualitätskontrolle, der Navigation von Robotern, dem Entwurf von Computerspielen, der Werbung, der Bewahrung und Dokumentation des Kulturerbes und der Medizin. Man findet in diesen Anwendungen verschieden große Objekte mit unterschiedichen Oberflächeneigenschaften und Aufnahmeorten. Weiters sind die Anforderungen an die Genauigkeit und die Aulösung der gewünschten dreidimensionalen Daten unterschiedlich. Ein Problem mit dem alle, auch handelsübliche, Aufnahmesysteme zu kämpfen haben, sind Löcher in den dreidimensionalen Daten auf Grund von Verdeckungen.<br />Die Löcher werden üblicherweise durch Daten aus zusätzlichen Aufnahmen aus anderen Positionen gefüllt. Zusätzliche Aufnahmen müssen registriert werden, das heißt, die Daten müssen so ausgerichtet werden, daß sie verschmolzen werden können. Dieser Vorgang wird meist manuell durchgeführt und führt zu zusätzlichen Ungenauigkeiten in den daraus resultierenden Daten. Das in dieser Arbeit vorgestellte System namens PRIP3V verwendet zur Aufnahme zwei Kameras und einen Projektor. Eine Sequenz von kodierten Lichtstreifen wird in die Szene projiziert, welche wiederum von beiden Kameras aufgenommen wird.<br />Durch die Lichtstreifen werden künstlich Punkte in der Szene markiert. Die Markierungen werden dazu verwendet, in beiden Kameras eindeutig korrespondierende Punkte zu finden. Dieser Aufbau erlaubt die dreidimensionale Rekonstruktion von drei Ansichten in einem Aufnahmevorgang. Die Daten der drei Ansichten werden automatisch registriert. Eine Ansicht ergibt sich durch die Stereobildanalyse aus beiden Kameras und zwei Ansichten aus der Rekonstruktion durch strukturierte Beleuchtung zwischen dem Projektor und jeweils einer Kamera. Löcher in den Daten der Stereobildanalyse können durch Punkte aus der Rekonstruktion durch strukturierte Beleuchtung gefüllt werden, wenn diese in nur einer Kamera sichtbar sind. Die Regionen, die zusätzliche Daten durch die Rekonstruktion durch strukturierte Beleuchtung liefern, werden Halbverdeckungen genannt, da sie nur für die Hälfte der vorhandenen Kameras sichtbar sind. Der Zuwachs an Daten im Vergleich zu der aktiven Stereobildanalyse beträgt 10 %. PRIP3V hat eine Auflösung von 0.76 mm in einem Aufnahmebereich von 120 mm × 120 mm × 50 mm mit einer Genauigkeit von 0.15 mm.<br />
de
Vision based range sensors are used for measuring and reconstruction purposes in, for example, reverse engineering, product inspection, robot navigation, computer game design, advertising, cultural heritage conservation and medical applications.<br />Each of these applications deals with different object sizes, surface properties, occlusions, scan locations, accuracy and resolution requirements. Even with commercially available range sensors, holes in 3D data due to occluded regions are filled with data from additional scans. These scans have to be registered, i.e., the point clouds have to be aligned, to replace holes with data from other scans. In most cases this has to be done manually and introduces additional uncertainty into the resulting 3D data. The range sensor presented in this work, named PRIP3V, uses two cameras and a projector. A coded sequence of light stripes is projected into the scene and captured by both cameras. The light stripes introduce artificial feature points that are used to find unique matching points in both cameras. This allows the reconstruction of three different views with one scan. The views are registered automatically. There is one view from stereo vision with both cameras and two views from shape from structured light with the projector and each camera. Holes in the data of the stereo vision sensor can be filled with data from the shape from structured light sensor if the feature point is seen by only one camera. These regions with additional data from shape from structured light are called half occlusions as they are only seen by half of the cameras. The gain in additional points is 10 % with respect to active stereo vision. PRIP3V has a resolution of 0.76 mm in an optimized scanning volume of 120 mm × 120 mm × 50 mm with an accuracy of 0.15 mm.