Murturi, B. (2021). Top CO2 emission firms stock market exchange rate prediction using Twitter [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2021.77940
E194 - Institut für Information Systems Engineering
-
Date (published):
2021
-
Number of Pages:
64
-
Keywords:
sentiment analysis; Twitter; CO2 emission firms; stock markets
en
Abstract:
Die weit verbreitete Nutzung des Internets hat es mehr Menschen ermöglicht, ihre Meinung zu verschiedenen Themen zu äußern. Twitter ist eine der am häufigsten genutzten Plattformen zur Meinungsäußerung und öffentlichen Diskussion und generiert eine Vielzahl von Daten, mit denen die Börsenbewegungen für verschiedene Bereiche vorhergesagt werden können. In dieser Arbeit befassen wir uns mit den Methoden, mit denen der Börsenkurs der führenden CO2-Emissionsunternehmen mithilfe einer Stimmungsanalyse anhand der von Twitter gesammelten Daten vorhergesagt werden kann.Wir analysieren Daten im Zeitraum von zwei Monaten von Juli 2020 bis August 2020.Die gesammelten Tweets haben einen Stimmungswert für jeden Tweet, der mit Valence Aware Dictionary for Sentiment Reasoning (VADER) berechnet wird. Da es sich bei dem Börsenkurs um Zeitreihendaten handelt, berechnen wir die Stimmung über den Zeitraum,d. H. Über eine Zeitspanne von einer Minute, um die Stimmung als Zeitreihenprädiktor zu verwenden. Darüber hinaus berechnen wir die zeitversetzte Stimmung innerhalb der Zeit.Diese Methode richtet die Stimmung im Zeitverlauf an den stark korrelierten Schlusswert der Aktie aus, was bedeutet, dass die Gesamtstimmung innerhalb einer bestimmten Zeit dazu führt, dass die Aktienkurse infolge des Schlusskurses für die gegebene Zeit schwanken.Wir summieren die Stimmung der Tweets über den gegebenen Zeitrahmen (stündlich) als Maß für das gesamte Stimmungsmaß innerhalb der Zeit, da es sowohl die Häufigkeit alsauch die Summe der Tweets darstellt. Dieser kumulative Wert wird dann als beabsichtigter Indikator verwendet. In Anbetracht der Tatsache, dass gleitende Durchschnitte im Allgemeinen als Indikator für den Aktienhandel verwendet werden, berechnen wir gleitende Durchschnitts- und exponentielle gleitende Durchschnitte für die Stimmung innerhalb der Zeitwerte, die aus den Tweets berechnet wurden, die sich auf die Hashtags bezüglich Ölproduzenten und Klimawandel beziehen. Der gleitende Stimmungsdurchschnitt wird für die Zeitspanne von 120 Minuten berechnet, und der exponentielle gleitende Durchschnitt wird für eine Zeitspanne von 120 Minuten berechnet, die die beste Korrelation mitdem engen Aktienkurs aufweist. Dies impliziert, dass gleitende Durchschnittswerte der Stimmung innerhalb der Zeit von Tweets vor zwei Stunden mit dem aktuellen Aktienkurs korrelieren. Am Ende nehmen die Regressionsmodelle Support Vector Regression (SVR), Bayesian Ridge Regression (BRR) und Kernel Ridge Regression (KRR) die Prädiktoren auf, die als gleitende Durchschnittswerte, exponentielle gleitende Durchschnittswerte berechnet und nahe verschoben wurden, um die Aktienkurse vorherzusagen.Unsere Ergebnisse in dieser Arbeit zeigen, dass die Stimmungsanalyse von Tweets von Twitter verwendet werden kann, um den Wechselkurs der Top-CO2-Emissionsunternehmen erfolgreich vorherzusagen.
de
The widespread usage of internet has made it possible for more people to be able to express their opinions about different topics. Twitter being one of the most used platforms for expressing opinions and public discussions, generates a vast amount of data which can be used to predict the stock market movements for different areas. In this work, we tackle the methods that can be used to predict top CO2 emission firms stock market exchangerate with the help of sentiment analysis performed on data gathered from Twitter.We analyze data in the course of two months period, from July 2020 until August 2020.The collected tweets have sentiment score for each Tweet which is calculated using VADER. Since stock market price is a time-series data, in-order to use sentiment as time-series predictor we compute sentiment across the time period i.e over the time spanof a minute. Furthermore, we proceed to compute time-shifted sentiment within time.This method aligns the sentiment over time to highly correlated close value of the stockimplying that overall sentiment within a time causes the stock prices to fluctuate as there sult of closing price for the given time. We sum the sentiment of the tweets across thegiven time-frame (hourly) as measure of the overall sentiment measure within the time as it represents both frequency and sum of the tweets. This cumulative value is then taken as the intended indicator. Considering that moving averages are generally used as stock trading indicator, we compute moving average and exponential moving averages for sentiment within the time values computed from the tweets related to the hashtags regarding oil producers and climate change. The sentiment moving average is computed for the span of 120 minutes, as well as the exponential moving average is computed inspan of 120 minutes which has best correlation with close price of stocks. This implies that moving averages of sentiment within time of tweets before two hours correlate tothe current stock price. In the end, the regression models SVR, BRR and KRR ingest the predictors computed as moving averages, exponential moving averages and shifted close in order to predict the stock prices.Our findings in this thesis, demonstrate that sentiment analysis performed on tweets gathered from Twitter can be used to successfully predict the top CO2 emission firmsexchange rate.