Robust object localization under fragmented occlusion

Auer, Jonas

doi:10.34726/hss.2022.99125

DC Field

Value

Language

dc.contributor.advisor

Sablatnig, Robert

dc.contributor.author

Auer, Jonas

dc.date.accessioned

2022-02-25T12:38:20Z

dc.date.issued

2022

dc.date.submitted

2022-02

dc.identifier.citation

<div class="csl-bib-body"> <div class="csl-entry">Auer, J. (2022). <i>Robust object localization under fragmented occlusion</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2022.99125</div> </div>

dc.identifier.uri

https://doi.org/10.34726/hss.2022.99125

dc.identifier.uri

http://hdl.handle.net/20.500.12708/19637

dc.description.abstract

Die Herausforderung der Objektdetektion stellt einen wesentlichen Baustein in vielen Anwendungsbereichen wie z.B. autonomes Fahren, Robotik und Überwachung dar. Aus diesem Grund hat das Thema in letzter Zeit durch umfangreiche Forschung rasante Verbesserungen erfahren. Aktuelle Objektdetektoren basieren meist auf neuronalen Netzen und übertreffen konkurrierende Lösungen bei weitem. Trotz der bemerkenswerten Verbesserungen durch Deep Learning steht die Objektdetektion weiterhin vor großen Herausforderungen. Ein Problem besteht darin, dass die Zielobjekte oft verdeckt sind, wodurch räumliche Information verloren geht und die Merkmalsextraktion dadurch gestört wird. Hierbei tritt Verdeckung sowohl in urbanen (z.B. durch Häuser, Fahrzeuge und Straßenschilder) als auch in ländlichen (z.B. durch Bäume und Sträucher) Umgebungen gleichermaßen auf. Aus diesem Grund erforschen wir eine robuste Objektdetektion unter Verdeckung, mit besonderem Fokus auf fragmentierte Verdeckung. Wir basieren unsere Lösung auf räumlich-zeitlichen Netzwerken und beschränken uns auf das Problem der Personenlokalisierung. Wir behaupten, dass der räumliche Informationsverlust zum Zeitpunkt t0 durch die Aggregation der Komplementär-Information zu den benachbarten Zeitpunkten t−n + ... + tn kompensiert werden kann. Wir stützen unsere Hypothese mit Experimenten basierend auf synthetischen Daten, welche die Grundlage für unsere Lösung bilden. Zusätzlich schlagen wir eine Methode zur Reduktion der räumlichen Information vor, welche die Netzwerke dazu bringt, räumlich-zeitliche Daten stärker zu berücksichtigen, indem zeitlich angrenzende Informationsbruchstücke akkumuliert werden. Da es derzeit einen Mangel an Daten gibt, erstellen und annotieren wir einen neuartigen Datensatz, der sich auf fragmentierte Verdeckung konzentriert. Die Auswertung auf den annotierten Sequenzen zeigt eine erhöhte Genauigkeit (0.955 F1) im Vergleich zum Stand der Technik.

dc.description.abstract

The task of object detection represents an essential building block in many application areas like autonomous driving, robotics and surveillance. Therefore, the topic has recently experienced rapid improvements through significant amount of research. Current object detectors are mostly based on neural networks, outperforming competing solutions by a wide margin. Despite the notable improvements with deep learning, object detection still faces major challenges. One issue originates from target objects being occluded, causing spatial information loss and therefore disrupting feature extraction. Here, occlusion occurs equally in urban (e.g. through houses, vehicles and street signs) and rural (e.g. through trees and shrubs) environments. To address this problem, we explore robust object detection under occlusion, with the special focus on fragmented occlusion. We base our solution on spatio-temporal networks and limit ourselves to person localization. We argue that the spatial information loss at time t0 can be compensated by aggregating the complementary information at the neighbouring time frames t−n + ... + tn. We support our hypothesis with experiments based on synthetic data, which build the foundation of our final solution. Additionally we propose a method to reduce spatial information, which forces the networks to consider spatio-temporal data more heavily, by accumulating temporal adjacent information-fractals. As there is currently a lack of data, we create and annotate a novel dataset focusing on fragmented occlusion. Evaluation on the annotated sequences shows increased performance (0.955 F1) compared to the state of the art.

dc.language

English

dc.language.iso

dc.rights.uri

http://rightsstatements.org/vocab/InC/1.0/

dc.subject

Objektlokalisierung

dc.subject

Fragmentierte Verdeckung

dc.subject

Räumlich-zeitliche Netzwerke

dc.subject

Deep Learing

dc.subject

Neuronale Netze

dc.subject

object localization

dc.subject

fragmented occlusion

dc.subject

spatio-temporal networks

dc.subject

deep learning

dc.subject

neural networks

dc.title

Robust object localization under fragmented occlusion

dc.title.alternative

Robuste Objektlokalisierung unter fragmentierter Verdeckung

dc.type

Thesis

dc.type

Hochschulschrift

dc.rights.license

In Copyright

dc.rights.license

Urheberrechtsschutz

dc.identifier.doi

10.34726/hss.2022.99125

dc.contributor.affiliation

TU Wien, Österreich

dc.rights.holder

Jonas Auer

dc.publisher.place

Wien

tuw.version

vor

tuw.thesisinformation

Technische Universität Wien

tuw.publication.orgunit

E193 - Institut für Visual Computing and Human-Centered Technology

dc.type.qualificationlevel

Diploma

dc.identifier.libraryid

AC16454258

dc.description.numberOfPages

dc.thesistype

Diplomarbeit

dc.thesistype

Diploma Thesis

dc.rights.identifier

In Copyright

dc.rights.identifier

Urheberrechtsschutz

tuw.advisor.staffStatus

staff

tuw.advisor.orcid

0000-0003-4195-1593

item.languageiso639-1

item.openairetype

master thesis

item.grantfulltext

open

item.fulltext

with Fulltext

item.cerifentitytype

Publications

item.mimetype

application/pdf

item.openairecristype

http://purl.org/coar/resource_type/c_bdcc

item.openaccessfulltext

Open Access

crisitem.author.dept

E192 - Institut für Logic and Computation

crisitem.author.parentorg

E180 - Fakultät für Informatik

Appears in Collections:

Thesis

Fulltext (Version of Record (published version))

Adobe PDF

(3.38 MB)

In Copyright

Show simple item record

Page view(s)

977

checked on Nov 23, 2023

Download(s)

152

checked on Nov 23, 2023

Google Scholar^TM

Check

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM