Making sense of images: parameter-free perceptual grouping

Zillich, Michael

DC Field

Value

Language

dc.contributor.advisor

Vincze, Markus

dc.contributor.author

Zillich, Michael

dc.date.accessioned

2020-06-30T20:53:34Z

dc.date.issued

2007

dc.date.submitted

2007-05

dc.identifier.citation

<div class="csl-bib-body"> <div class="csl-entry">Zillich, M. (2007). <i>Making sense of images: parameter-free perceptual grouping</i> [Dissertation, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-15072</div> </div>

dc.identifier.uri

https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-15072

dc.identifier.uri

http://hdl.handle.net/20.500.12708/14166

dc.description.abstract

Perceptual grouping is a well studied area in visual psychophysics and offers a principled, general way to study vision in sighted animals and humans as well as machines. Computational approaches in the past however have often been hampered by complexity issues and brittleness in the presence of clutter and noise.<br />Especially the reliance on tuning parameters renders many approaches impractical for real world applications.<br />This work aims to address complexity and robustness issues by proposing an incremental processing scheme for the perceptual grouping of edges, where the only parameter is runtime. This allows interrupting processing at any time, returning the most significant perceptual groups that could be found up to that point and leads to graceful degradation with increasing amounts of noise or clutter.<br />We furthermore propose a probabilistic measure of visual significance based on the principle of non-accidentalness. This significance measure is used to guide grouping of convex contours as well as a relative depth ordering of contours.<br />Varying the significance measure of edges, for example based on regions of interest, allows to focus attention on specific parts of the scene, which will subsequently be allocated a larger share of the available processing time.<br />Experiments were carried out on a wide range of real world images with varying scene content and complexity. For detection of convex contours we could show that identifying candidate edges and junctions for grouping can be performed in runtime linear to the number of edges. More significant contours typically popped out faster with less significant ones appearing as runtime progresses. We demonstrated how two attentional mechanisms, based on regions of interest and colour, lead to faster detection of objects of interest. Relative depth ordering of contours based on energy minimisation in a Markov Random Field was presented as an initial form of finding a globally consistent scene interpretation and was shown to work for scenes of limited complexity.<br />

dc.description.abstract

Perzeptuelles Gruppieren ist ein gut untersuchtes Gebiet der Psychophysik und bietet eine solide, formale Grundlage für das Studium von biologischem und maschinellem Sehen. Maschinelle Ansätze in der Vergangenheit hatten üblicherweise mit Problemen in der Laufzeit-Komplexität und mit der Empfindlichkeit der Methoden gegenüber Störungen (fehlende Daten oder ein Übermaß an irrelevanten Daten) zu kämpfen. Insbesondere die Abhängigkeit von einer Vielzahl adjustierbarer Parameter bedeutet nur allzuoft, daß solche Methoden für den praktischen Einsatz ungeignet sind.<br />Diese Arbeit versucht Problemen von Komplexität und Robustheit beim perzeptuellen Gruppieren von Kanten mit einer inkrementellen Methode zu begegnen, wobei der einzige Parameter die Laufzeit ist. Dies erlaubt die Berechnung jederzeit zu unterbrechen und die bis dahin signifikantesten perzeptuellen Gruppen zu finden und führt zu einer wohldefinierten graduellen Verschlechterung mit zunehmender Szenenkomlexität oder Störungen, anstatt ab einem gewissen Punkt schlagartig zu versagen. Weiters wird ein probabilistisches Maß für visuelle Signifikanz basierend auf dem Helmholtz Prinzip von Nicht-Zufälligkeit vorgeschlagen. Dieses Signifikanzmaß wird verwendet zum Gruppieren von konvexen, geschlossenen Konturen und zum relativen Tiefen-Sortieren von Konturen. Variieren des Signifikanzmaßes von Kanten, zum Beispiel basierend auf Aufmerksamkeits-Regionen, erlaubt es die Aufmerksamkeit, und damit Rechner-Ressouren des Systems auf bestimmte Teile der Szene zu lenken, Experimente wurden durchgeführt auf einer Vielzahl von Bildern unterschiedlichster Szenen mit verschiedener Komplexität. Für die Detektion von konvexen Konturen konnte gezeigt werden, daß die Identifikation von Kanten-Relationen in linearer Laufzeit (bezüglich der Anzahl der Kanten) gelingt. Signifikantere Konturen werden typischerweise schneller gefunden, während weniger signifikante Konturen erst mit zunehmender Laufzeit erscheinen. Es konnte gezeigt werden, daß Aufmerksamkeit, basierend auf Bild-Regionen und Farbe, zu einer schnelleren Detektion von "interessanten" Objekten führt. Relatives Tiefen-Sortieren von Konturen, basierend auf einer Energie-Minimierung in einem Markov Random Field, wurde vorgestellt als ein Versuch um eine global konsistente Interpretation der Szene zu finden und erwies sich als erfolgreich zumindest für einfache Szenen.

dc.language

English

dc.language.iso

dc.rights.uri

http://rightsstatements.org/vocab/InC/1.0/

dc.subject

maschinelles Sehen

dc.subject

Bildverarbeitung

dc.subject

perzeptuelles Gruppieren

dc.subject

Markov Random Field

dc.subject

machine vision

dc.subject

computer vision

dc.subject

perceptual grouping

dc.subject

anytime algorithm

dc.subject

Markov Random Field

dc.title

Making sense of images: parameter-free perceptual grouping

dc.type

Thesis

dc.type

Hochschulschrift

dc.rights.license

In Copyright

dc.rights.license

Urheberrechtsschutz

dc.contributor.affiliation

TU Wien, Österreich

dc.rights.holder

Michael Zillich

tuw.version

vor

tuw.thesisinformation

Technische Universität Wien

dc.contributor.assistant

Hlavac, Vaclav

tuw.publication.orgunit

E376 - Institut für Automatisierungs- und Regelungstechnik

dc.type.qualificationlevel

Doctoral

dc.identifier.libraryid

AC05034872

dc.description.numberOfPages

149

dc.identifier.urn

urn:nbn:at:at-ubtuw:1-15072

dc.thesistype

Dissertation

dc.thesistype

Dissertation

dc.rights.identifier

In Copyright

dc.rights.identifier

Urheberrechtsschutz

tuw.advisor.staffStatus

staff

tuw.advisor.staffStatus

staff

tuw.assistant.staffStatus

external

item.cerifentitytype

Publications

item.openairecristype

http://purl.org/coar/resource_type/c_db06

item.openaccessfulltext

Open Access

item.grantfulltext

open

item.openairetype

doctoral thesis

item.fulltext

with Fulltext

item.languageiso639-1

item.mimetype

application/pdf

crisitem.author.dept

E376 - Institut für Automatisierungs- und Regelungstechnik

crisitem.author.parentorg

E350 - Fakultät für Elektrotechnik und Informationstechnik

Appears in Collections:

Thesis

Fulltext (Version of Record (published version))

Adobe PDF

(43.75 MB)

In Copyright

Show simple item record

Page view(s)

278

checked on Dec 1, 2023

Download(s)

101

checked on Dec 1, 2023

Google Scholar^TM

Check

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM