<div class="csl-bib-body">
<div class="csl-entry">Gindl, S. (2015). <i>Context-aware sentiment analysis : a lexicon-based machine learning approach</i> [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2015.29770</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2015.29770
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/3745
-
dc.description
Zsfassung in dt. Sprache
-
dc.description.abstract
Sentimentanalyse ist jenes Forschungsfeld, dass sich mit der Konzeption, Implementierung und Evaluierung von Systemen beschäftigt, die menschliche Stimmungen verstehen sollen. Durch die breite Verfügbarkeit von stimmungsgeladenen Aussagen im World-Wide-Web und leistungsstarken Algorithmen zu deren Analyse, hat sich das Forschungsfeld von seinem Nischendasein zu einem zentralen Bestandteil vieler Forschungsprojekte entwickelt. Sein hoher wirtschaftlicher Wert ergibt sich aus seiner zentralen Rolle in Media-Intelligence-Systemen. Diese unterstützen Marketing-Kampagnen und sammeln KundInnenfeedback aus dem großen Pool von online verfügbaren, geschriebenen Meinungen. Entscheidungsträger können dadurch aktuelle Markttrends leichter nachvollziehen und Marketingstrategien dementsprechend anpassen. Sentimentanalyse erweist sich auch im politischen Bereich als nützliches Werkzeug. Politische Kampagnen lassen sich damit evaluieren und sie unterstützt dabei, die Stimmung bei Ereignissen von öffentlichem Interesse zu messen, etwa dem Klimawandel oder einem Krieg. Meinungsforschung wird dadurch in einem so großen Stil möglich, wie sie vor Zeiten des World-Wide-Web undenkbar gewesen wäre. Die Verfügbarkeit leistungsstarker Rechner gestattet es, komplexe Algorithmen, etwa aus dem maschinellen Lernen oder der natürlichen Sprachverarbeitung, in angemessener Zeit auszuführen. Die vorliegende Arbeit beschäftigt sich damit, eine zentrale Ressource der Sentimentanalyse zu verbessern: das Sentimentlexikon. Dieses Lexikon enthält stimmungstragende Terme zusammen mit einer Einschätzung ihrer Polarität. Diese Stimmungsladung wird händisch ermittelt und ist statisch, selbst in Fällen, wo sich die Ladung eines Wortes durch den Kontext, in dem es verwendet wird, verändern kann. Das Wort "kühl" löst beispielsweise in "ein kühler Kopf" oder "ein kühler Blick" entgegengesetzte Empfindungen aus. Diese Ladungsveränderungen limitieren die Leistungsfähigkeit von Systemen, die von statischen Ladungen ausgehen. In der vorliegenden Arbeit werden Sentimentlexikons mit Kontexttermen erweitert, d.h. mit Termen, die häufig gemeinsam mit bestimmten Sentimenttermen vorkommen. Die Wahrscheinlichkeit des gemeinsamen Auftretens wird im Lexikon mitgespeichert, wodurch aus dem klassischen Sentimentlexikon ein kontextualisiertes Lexikon entsteht. Mit so einem Werkzeug ausgestattet ist ein Sentimentanalysesystem in der Lage, sich flexibel an unterschiedliche Kontexte anzupassen. Eine formelle Evaluierung zeigte die Wirksamkeit des vorgestellten Ansatzes. Sie folgte dabei einer in der Sentimentanalyse üblichen Vorgehensweise, bei der Produkt- und Servicekritiken aus unterschiedlichen Domänen als Evaluierungskorpus herangezogen werden. Durch die Berechnung von Recall, Precision und F-Measure in einer zehnfachen Kreuzvalidierung konnte gezeigt werden, dass der vorgestellte Ansatz einen Schlagwortansatz mit statischen Ladungen übertrifft.
de
dc.description.abstract
Sentiment analysis, the research area focusing on the creation, implementation, and evaluation of systems for the analysis of human attitudes, has become increasingly interesting for researchers of diverse special fields such as artificial intelligence, computational linguistics, or psychology. With the wide availability of opinionated statements on the Web and the creation of ever more powerful algorithms, the research area has gotten off the sidelines and moved into the focal point of many scientific projects. It has a significant business value, as it is a central component of media intelligence systems, supporting decisions for marketing campaigns and collecting customer feedback from the large pool of opinions on the Web. It helps decision makers to understand trends on the market, which eventually helps to adapt current marketing strategies. Sentiment analysis also proves beneficial in the political area, by evaluating a political campaign or to measure public awareness towards events of public interest, e.g. climate change or wars. An elicitation of opinions on such a large scale was inconceivable in the era before the World Wide Web and becomes feasible merely because of the existence of powerful technologies, such as machine learning and natural language processing. This work aims at improving a central resource crucial in sentiment analysis, the sentiment lexicon. These collections of opinionated terms store a-priori charges for each term, indicating whether a term conveys positive or negative sentiment. The charges are bound to manual assessment, even in cases where a term is ambiguous and might change its charge depending on the context. For instance, the term "cool" triggers opposite emotions in the sentence "the cool car" and "she mustered him with a cool glance". These polarity changes limit approaches which depend on static a-priori charges. The present work expands the sentiment lexicon with context terms, i.e. terms frequently co-occurring with the sentiment term. Analysing their frequency of co-occurrence in positive and negative contexts and storing the probability of co-occurrence results in the creation of contextualized lexicons. The probabilities for positive and negative con- text supersede the fixed a-priori values. A system armed with such a tool is capable of flexibly adapting the sentiment value of one and the same term based on the context it is used in. A formal evaluation shows the efficacy of the approach. The evaluation follows a method well-established in sentiment analysis: a corpus consisting of product and service reviews from different domains is the basis for the evaluation. Calculating recall, precision, and f-measure in a ten-fold cross-validation shows that the proposed approach outperforms a traditional keyword lookup algorithm with fixed polarities.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Sentimentanalyse
de
dc.subject
Maschinelles Lernen
de
dc.subject
Produktreview
de
dc.subject
Sentiment Analysis
en
dc.subject
Machine Learning
en
dc.subject
Product Reviews
en
dc.title
Context-aware sentiment analysis : a lexicon-based machine learning approach
en
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2015.29770
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Stefan Gindl
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
tuw.publication.orgunit
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
dc.type.qualificationlevel
Doctoral
-
dc.identifier.libraryid
AC12260782
-
dc.description.numberOfPages
108
-
dc.identifier.urn
urn:nbn:at:at-ubtuw:1-86015
-
dc.thesistype
Dissertation
de
dc.thesistype
Dissertation
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
item.fulltext
with Fulltext
-
item.grantfulltext
open
-
item.cerifentitytype
Publications
-
item.cerifentitytype
Publications
-
item.languageiso639-1
en
-
item.openairecristype
http://purl.org/coar/resource_type/c_18cf
-
item.openairecristype
http://purl.org/coar/resource_type/c_18cf
-
item.openairetype
Thesis
-
item.openairetype
Hochschulschrift
-
item.openaccessfulltext
Open Access
-
crisitem.author.dept
E188 - Institut für Softwaretechnik und Interaktive Systeme