Dubsky, J. (2012). Opinion mining : sentiment analysis for cultural institutions [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-47321
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2012
-
Number of Pages:
100
-
Keywords:
Data mining; Text mining; Feature-based Sentiment Analysis; Cultural Institution; Museum; Opinion Mining; Sentiment Analysis; Subjectivity Classification; Lexical Analysis; Language Parsing
de
Abstract:
Die stetig wachsende Verbreitung von sozialen Netzwerken im Internet und die damit einhergehende aktive Beteiligung der Menschen, führte zu einem starken Anstieg des sogenannten "user-generated content". Internetnutzer veröffentlichen und teilen neben persönlichen Informationen auch ihre Erfahrungen und Meinung über verschiedenste Themen. Dies gilt natürlich auch für kulturelle Institutionen. Museen und deren Ausstellungen werden aus vielerlei Gesichtspunkten beurteilt und rezensiert. Diese Informationen stellen einen wichtigen Aspekt bei dem menschlichen Entscheidungsprozess dar. In der heutigen Zeit nutzen viele Menschen das Internet um schnellst möglichst Erfahrungsberichte zu erhalten. Die Meinung anderer kann folglich die Wahl des zu besuchenden Museums stark beeinflussen. Um eine möglichst vollständige und objektive Meinung mehrere Menschen zu erhalten, ist eine Vielzahl von Rezessionen notwendig. Jedoch ist das Suchen und Lesen eine anstrengende und zeitintensive Aufgabe.<br />Um diesen Prozess für den Menschen zu vereinfachen, werden sogenannten Sentiment Analysis Systeme verwendet. Dabei werden in Textdokumenten automatisiert subjektive Meinungen extrahiert. Das gesamte Dokument, einzelne Sätze innerhalb eines Dokumentes oder einzelne Aspekte innerhalb von Sätzen können gefiltert und bewertet werden.<br />Diese Master's Thesis entwickelt ein "Feature-based Sentiment Analysis" Model für kulturelle Institutionen. Dabei werden deutschsprachige Textdokumente aus verschiedensten sozialen Netzwerken und Online-Communitys analysiert. Dabei werden zunächst besprochene Aspekte von Museen (z.B. Ausstellungen, Eintrittspreis, etc.) extrahiert.<br />Anschließend werden die dazugehörigen, subjektiven Meinungen (positiv, neutral, negativ) bestimmt. Zur Automatisierung verwendet das konzipierte System Algorithmen aus dem Bereich des maschinellen Lernens und ein selbstgenerierendes Opinion Lexikon. Der entwickelte Prototyp visualisiert die extrahierten Themen mittels Diagrammen.<br />
de
The increasing distribution of social networks in the Web and the associated active participation of people results to a strong increase of so called "user-generated content". Internet users publish and share personal information, experiences and opinions about various topics. Obviously, this is also true for cultural institutions. Museums and their exhibitions are evaluated and reviewed from many points of view. This information represents an important aspect of the human decision process. At the present time many people use the Internet to obtain quickly reviews. Other opinions can therefore strongly influence the choice to visit a museum. However, to obtain the most complete and objective opinion of several people, a number of recessions is necessary. However, the search and reading is an exhausting and time-consuming task.<br />To simplify this process, so-called sentiment analysis systems are used.<br />It will automatically scan documents on subjective opinions and filter these out. This can be accomplished at three levels of detail: The entire document, individual sentences within a document or individual aspects within sentences can be extracted and evaluated as positive or negative. This master's thesis developed a "Feature-Based Sentiment Analysis" model for cultural institutions. German-language text documents from a variety of social networks and online communities are analyzed. Initially, discussed aspects and properties of museums (e.g., exhibitions, entrance fee, etc.) are extracted. Afterwards, the corresponding subjective opinions are determined (positive, neutral, negative). The designed system uses algorithms from the field of machine learning and semantic rules to automate this process. The developed prototype visualizes the extracted topics with the help of diagrams.