<div class="csl-bib-body">
<div class="csl-entry">Zillich, M. (2007). <i>Making sense of images: parameter-free perceptual grouping</i> [Dissertation, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-15072</div>
</div>
Perceptual grouping is a well studied area in visual psychophysics and offers a principled, general way to study vision in sighted animals and humans as well as machines. Computational approaches in the past however have often been hampered by complexity issues and brittleness in the presence of clutter and noise.<br />Especially the reliance on tuning parameters renders many approaches impractical for real world applications.<br />This work aims to address complexity and robustness issues by proposing an incremental processing scheme for the perceptual grouping of edges, where the only parameter is runtime. This allows interrupting processing at any time, returning the most significant perceptual groups that could be found up to that point and leads to graceful degradation with increasing amounts of noise or clutter.<br />We furthermore propose a probabilistic measure of visual significance based on the principle of non-accidentalness. This significance measure is used to guide grouping of convex contours as well as a relative depth ordering of contours.<br />Varying the significance measure of edges, for example based on regions of interest, allows to focus attention on specific parts of the scene, which will subsequently be allocated a larger share of the available processing time.<br />Experiments were carried out on a wide range of real world images with varying scene content and complexity. For detection of convex contours we could show that identifying candidate edges and junctions for grouping can be performed in runtime linear to the number of edges. More significant contours typically popped out faster with less significant ones appearing as runtime progresses. We demonstrated how two attentional mechanisms, based on regions of interest and colour, lead to faster detection of objects of interest. Relative depth ordering of contours based on energy minimisation in a Markov Random Field was presented as an initial form of finding a globally consistent scene interpretation and was shown to work for scenes of limited complexity.<br />
de
dc.description.abstract
Perzeptuelles Gruppieren ist ein gut untersuchtes Gebiet der Psychophysik und bietet eine solide, formale Grundlage für das Studium von biologischem und maschinellem Sehen. Maschinelle Ansätze in der Vergangenheit hatten üblicherweise mit Problemen in der Laufzeit-Komplexität und mit der Empfindlichkeit der Methoden gegenüber Störungen (fehlende Daten oder ein Übermaß an irrelevanten Daten) zu kämpfen. Insbesondere die Abhängigkeit von einer Vielzahl adjustierbarer Parameter bedeutet nur allzuoft, daß solche Methoden für den praktischen Einsatz ungeignet sind.<br />Diese Arbeit versucht Problemen von Komplexität und Robustheit beim perzeptuellen Gruppieren von Kanten mit einer inkrementellen Methode zu begegnen, wobei der einzige Parameter die Laufzeit ist. Dies erlaubt die Berechnung jederzeit zu unterbrechen und die bis dahin signifikantesten perzeptuellen Gruppen zu finden und führt zu einer wohldefinierten graduellen Verschlechterung mit zunehmender Szenenkomlexität oder Störungen, anstatt ab einem gewissen Punkt schlagartig zu versagen. Weiters wird ein probabilistisches Maß für visuelle Signifikanz basierend auf dem Helmholtz Prinzip von Nicht-Zufälligkeit vorgeschlagen. Dieses Signifikanzmaß wird verwendet zum Gruppieren von konvexen, geschlossenen Konturen und zum relativen Tiefen-Sortieren von Konturen. Variieren des Signifikanzmaßes von Kanten, zum Beispiel basierend auf Aufmerksamkeits-Regionen, erlaubt es die Aufmerksamkeit, und damit Rechner-Ressouren des Systems auf bestimmte Teile der Szene zu lenken, Experimente wurden durchgeführt auf einer Vielzahl von Bildern unterschiedlichster Szenen mit verschiedener Komplexität. Für die Detektion von konvexen Konturen konnte gezeigt werden, daß die Identifikation von Kanten-Relationen in linearer Laufzeit (bezüglich der Anzahl der Kanten) gelingt. Signifikantere Konturen werden typischerweise schneller gefunden, während weniger signifikante Konturen erst mit zunehmender Laufzeit erscheinen. Es konnte gezeigt werden, daß Aufmerksamkeit, basierend auf Bild-Regionen und Farbe, zu einer schnelleren Detektion von "interessanten" Objekten führt. Relatives Tiefen-Sortieren von Konturen, basierend auf einer Energie-Minimierung in einem Markov Random Field, wurde vorgestellt als ein Versuch um eine global konsistente Interpretation der Szene zu finden und erwies sich als erfolgreich zumindest für einfache Szenen.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
maschinelles Sehen
de
dc.subject
Bildverarbeitung
de
dc.subject
perzeptuelles Gruppieren
de
dc.subject
Markov Random Field
de
dc.subject
machine vision
en
dc.subject
computer vision
en
dc.subject
perceptual grouping
en
dc.subject
anytime algorithm
en
dc.subject
Markov Random Field
en
dc.title
Making sense of images: parameter-free perceptual grouping
en
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Michael Zillich
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
dc.contributor.assistant
Hlavac, Vaclav
-
tuw.publication.orgunit
E376 - Institut für Automatisierungs- und Regelungstechnik