Omenitsch, P. (2016). Gesichtserkennung in uneingeschränkten Video streams [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.33981
E186 - Institut für Computergraphik und Algorithmen
-
Date (published):
2016
-
Number of Pages:
67
-
Keywords:
Gesichtserkennung; Videosuche
de
Face recognition; video search
en
Abstract:
Das Thema Gesichtserkennung ist gibt es schon lange in der Mustererkennung. Die jüngsten Fortschritte versprechen erfolgreiche Anwendungen für Videoüberwachung in großem Maßstab. Das Erkennen von Millionen von Menschen aufgenommen von tausenden Kameras birgt aber auch signifikante Kosten bezüglich Rechenleistung und Datenkommunikation. Diese Arbeit versucht die Komplexität von Gesichtserkennung in Videos zu reduzieren und verfolgt zwei komplementäre Strategien. Einerseits untersuchen Gesichtserkennung im "whitened"Deskriptorraum und verbessern die Komplexität der state-of-the-art Matched Background Similarity (MBGS) Methode. Andererseits untersuchen wir den Effekt den das Auswählen einer Teilmenge von Videobildern auf die Erkennungsgenauigkeit hat und zeigen, dass es möglich ist mit einem Bruchteil von Videobildern robuste Resultate zu erzielen. Für ein besseres Verständnis von Tiefen Faltenden Neuralen Netzwerken geben wir eine Einführung in das Thema und fassen aktuelle Entwicklungen zusammen, speziell im Bezug auf den weitbekannten ImageNet Wettbewerb. Wir evaluieren unsere Methoden und präsentieren konkurrenzfähige Resultate für den YTF und TSFT Benchmark mit signifikant niedrigerer Komplexität im Vergleich zu anderen Methoden.
de
Face recognition is a long-standing topic in machine learning. Recent advances promise successful applications in large-scale video surveillance. Recognizing millions of people in thousands of streaming cameras, however, implies significant costs in terms of computations and communication bandwidth. This work aims to reduce the complexity of face recognition in video and pursues two complementary strategies. We first investigate face recognition in the whitened descriptor space and improve the complexity of the state-of-the-art Matched Background Similarity (MBGS) approach. Second, we study frame selection and demonstrate robust recognition performance from a small fraction of video frames. For a better understanding of the advancing Deep Convolution Neural Networks field, we give a thorough introduction to the topic and briefly summarize the recent development with a focus on the ImageNet classification challenge. We evaluate our methods and present competitive results for the YTF and TSFT benchmarks while significantly reducing the complexity of previous methods.
en
Additional information:
Zusammenfassung in deutscher Sprache Text in englischer Sprache