<div class="csl-bib-body">
<div class="csl-entry">Bajones, M. (2013). <i>Natural multimodal human robot interaction performed on a low cost robot head</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-62815</div>
</div>
Im Rahmen dieser Diplomarbeit wurde untersucht, welche Möglichkeiten für eine multimodale Mensch-Roboter-Interaktion mit aktueller Technologie bestehen. Dazu wurde ein bestehender Low-Cost Roboterkopf, genannt Eva, genutzt und ein Softwaresystem entwickelt welches State of the Art Algorithmen der Bereiche Spracherkennung, Personendetektion, Personenidentifikation und Objektklassifizierung integriert. Besondere Aufmerksamkeit galt der möglichst natürlichen Kommunikation zwischen Eva und den Anwendern. Dafür wurde auf die Möglichkeit eingegangen Spracherkennungssoftware der aktuellen Generation für die Kommunikation zu nutzen. Mehrere Systeme wurden dafür implementiert und deren Fähigkeiten evaluiert bevor sie im Gesamtsystem zum Einsatz kamen. Zum Auffinden und Identifizieren der Anwender wurden gängige Verfahren gegenüber gestellt. Dazu zählen Viola-Jones in zwei unterschiedlichen Varianten zur Gesichtsdetektion sowie Eigenfaces, Fisherfaces und Local Binary Pattern Histogramme zur Personenidentifizierung. Diese Methoden, sowie die Nachverfolgung von Gesichtern mit Hilfe eines Kalman Filter und eines Lucas-Kanade Trackers dienen der multimodalen Kommunikation mit den Anwendern. Außerdem wird ein System zur Klassifizierung von Objekten unter Verwendung von random decision forests erläutert, welcher in weiteren Folgen genutzt werden könnte um mit diesen Gegenständen sinnvoll zu interagieren.<br />
de
dc.description.abstract
Within the scope of this diploma thesis we investigated the possibilities of mulitmodal human robot interaction with current technologies. For this, a pre-built low-cost robot head, called Eva, has been used and a software system was developed which includes state of the art algorithms from the fields of speech recognition, face detection, face recognition and object classification. Special attention was given to provide natural communication between users and the robot by using current speech recognition technology. Multiple systems were evaluated after integrating them in our implementation, before using one of them in our complete set-up. For the ability to find and identify individual people known algorithms were implemented and compared to each other. These include two variations of the Viola-Jones algorithm for face detection as well as Eigenfaces, Fisherfaces and Local Binary Pattern histograms for face recognition. These, in combination with face tracking by coupling the Viola-Jones algorithm with either a Kalman filter or a Lucas-Kanade optical flow estimation, provide one more part of the multimodal interaction between Eva and the user. Object classification provides the robot with the ability to perform further analysis in the field of interaction with objects. One method for this, using random decision forests, is explained as well.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Roboter
de
dc.subject
Gesichtserkennung
de
dc.subject
Spracherkennung
de
dc.subject
Objektklassifizierung
de
dc.subject
Gesichtsverfolgung
de
dc.subject
Personenidentifikation
de
dc.subject
robot
en
dc.subject
face detection
en
dc.subject
face recognition
en
dc.subject
object classification
en
dc.subject
face tracking
en
dc.subject
speech recognition
en
dc.title
Natural multimodal human robot interaction performed on a low cost robot head
en
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Markus Bajones
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E376 - Institut für Automatisierungs- und Regelungstechnik
-
dc.type.qualificationlevel
Diploma
-
dc.identifier.libraryid
AC10775306
-
dc.description.numberOfPages
66
-
dc.identifier.urn
urn:nbn:at:at-ubtuw:1-62815
-
dc.thesistype
Diplomarbeit
de
dc.thesistype
Diploma Thesis
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
item.mimetype
application/pdf
-
item.cerifentitytype
Publications
-
item.openairetype
master thesis
-
item.languageiso639-1
en
-
item.fulltext
with Fulltext
-
item.openaccessfulltext
Open Access
-
item.grantfulltext
open
-
item.openairecristype
http://purl.org/coar/resource_type/c_bdcc
-
crisitem.author.dept
E376 - Institut für Automatisierungs- und Regelungstechnik
-
crisitem.author.parentorg
E350 - Fakultät für Elektrotechnik und Informationstechnik