Annau, M. (2011). Financial news mining and sentiment analysis using R [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/160181
Die im Rahmen dieser Diplomarbeit vorgestellten- und in R implementierten Programmpakete tm.plugin.webcorpus und tm.plugin.sentiment definieren ein Framework sowohl für den Retrieval von Text Korpora von Internet Datenfeeds, als auch für die Sentimentanalyse von Textnachrichten. Das Paket tm.plugin.webcorpus unterstützt bereits eine breite Palette von Datenfeeds, wie Google News, Yahoo BOSS oder Reuters Spotlight. Das flexible Framework ermöglicht es dem Benutzer darüber hinaus auf einfache Weise zusätzliche Feeds hinzuzufügen. Bereits integrierte Extraktionsfunktionen bieten weiters die Möglichkeit, Nachrichteninhalte von beliebigen Internetseiten zu gewinnen. tm.plugin.sentiment implementiert Funktionen, um das Sentiment von Textdokumenten zu bestimmen. Das Paket ermöglicht die Generierung und grafische Darstellung von Zeitserien, die die Entwicklung des Sentiments zu einem bestimmten Thema im Zeitablauf darstellen.
The focus of this thesis are the packages tm.plugin.webcorpus and tm.plugin.sentiment implemented in R. They define a framework for the retrieval of text corpora from the Internet as well as the sentiment analysis of news texts. The package tm.plugin.webcorpus itself supports a wide range of data feed providers like Google News, Yahoo BOSS or Reuters Spotlight. The flexibility of the framework enables the user to extend tm.plugin.webcorpus with a variety of additional data feeds. Integrated extraction functions offer the opportunity to gain news content from arbitrary Internet pages. tm.plugin.sentiment does not only implement functions to determine the sentiment of text documents, it also supports the generation and visualization of time series showing the development of sentiment concerning a specific topic.