Lesslhumer, S. (2011). Sentiment analysis : feature-based sentiment analysis in the area of technical product reviews [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-50145
Die kontinuierliche Verbreitung von Breitbandanschlüssen, sowie die damit einhergehende verstärkte Internetnutzung haben in den letzten Jahren zu einem starken Anstieg des sogenannten "user generated content" geführt. Internetnutzer verwenden vielfach die Möglichkeit in Blogs, auf Foren und "E-Commerce"-Seiten, sowie in sozialen Netzwerken ihre Erfahrungen und Eindrücke mit anderen Benutzern zu teilen. Aufgrund der Popularität, sowie der bereits erwähnten Verfügbarkeit, ist das Internet zu einer der wichtigsten Informationsquellen geworden. Dies wirkt sich auch sehr stark auf den menschlichen Entscheidungsprozess aus. Eine Entscheidung wird sehr stark von den Eindrücken und Erfahrungen anderer beeinflusst. Besonders bei Kaufentscheidungen verlässt sich der Mensch auf die Erfahrungen anderer Benutzer. Mittlerweile kann man im Internet zu fast jedem Produkt eine Vielzahl von Kundenrezessionen finden. Jedoch sind die Suche und das Lesen dieser Rezessionen eine oft zeitintensive und anstrengende Aufgabe. Um diesen Prozess zu vereinfachen und zu beschleunigen verwendet man sogenannte Sentiment Analysis Systeme.<br />Sentiment Analysis, das in der Literatur auch als Opinion Mining bezeichnet wird, beschreibt den rechnergestützte Prozess um in Textdokumenten subjektive Eindrücke und Meinungen zu analysieren. Das Ziel ist es zu bestimmen, ob das gesamte Dokument, einzelne Sätze oder einzelne Phrasen eine positive beziehungsweise eine negative Stimmung ausdrücken.<br />Aufgrund der Vielzahl an Möglichkeiten, die ein solches System bietet, hat Sentiment Analysis nicht nur bei Forschern, sondern auch in der Wirtschaft großes Interesse erweckt. In dieser Master's Thesis wird ein neuartiger Ansatz für Feature-based Sentiment Analysis vorgestellt. Das postulierte System wurde für die Analyse von Textdokumenten in der deutschen Sprache konzipiert. Es unterstützt die automatische Identifikation von Meinungen sowie von Produktmerkmalen. Ein Produktmerkmal kann ein Teil eines Produktes, eine Produkteigenschaft oder das Produkt selbst sein. Das System wurde als hybrider Ansatz realisiert. Es verwendet "machine learning" Algorithmen sowie ein umfassendes Regelwerk, um die Orientierung (positiv, neutral, negativ) der Produktmerkmale zu bestimmen. Das System wurde ursprünglich entwickelt um Rezensionen technischer Produkte zu analysieren. Aufgrund der unterstützten Lernfähigkeit kann es auch auf andere Domänen (z.B. Filmrezensionen) erfolgreich angewendet werden.<br />
de
The continuous widespread availability of broadband Internet access accompanied by a more excessive usage has lead to an enormous growth of user generated content in the last years. People use blogs, e-commerce websites and social networks to share their experiences on a daily basis. Based on its popularity and the availability the Internet has become one, if not the most important source of information in recent years. This has great impacts on human decision making process. People's decision is strongly influenced by the experiences of other ones.<br />Especially when it comes to buying decisions, the World Wide Web, has become a fundamental decision making instrument. For almost every product several reviews and blog entries exist. Given the amount of information hidden in the depths of the World Wide Web it is a very time consuming and wearisome task to find relevant product reviews and consequently read and compare them. In order to automate and accelerate this process sentiment analysis systems are used. Sentiment analysis, which is also referred to as opinion mining is the computational task to automatically find sentiment and subjectivity in written text documents.<br />The goal is to determine whether a whole document, a sentence or just a single phrase expresses a positive or negative opinion. Sentiment analysis has not only gained significant popularity in the research community but has also made its way to the perception of business people who have realized the value of such systems. In this thesis a novel approach for feature-based sentiment analysis of the German language is presented. The objective of the proposed system is to automatically detect sentiment in product reviews and to set them in relation to specific product features. A product feature can be a part or an attribute of a product or even the product itself. The system is realized via a hybrid approach that combines machine learning techniques for resolving the sentence structure and identifying product features together with a comprehensive set of rules for determining the feature orientation as being either positive, negative or neutral. The system is designed for analyzing documents in the field of technical product reviews. Because of its learning component the system can also be successfully applied to other domains (e.g. movie reviews).