Ivljanin, V. (2019). Bitcoin exchange rate prediction using Twitter and Google Trends [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.48520
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2019
-
Number of Pages:
116
-
Keywords:
bitcoin; price; exchange rate; twitter; google
en
Abstract:
Die Allgegenwärtigkeit des Internets macht es zu einer wertvollen Datenquelle. Produkte wie Twitter und Google Trends implementieren APIs die es erlauben diese Daten zu nützen. Da diese zwei Produkte große Mengen von Nutzerdaten speichern, kann man Sie nützen um Vorhersagen über das Benutzerverhalten in bestimmten Bereichen zu machen. In dieser Arbeit, beschreiben und implementieren wir statistische Method um Vorhersagen über den Bitcoin Wechselkurs mittels Stimmungsanalyse, der Frequenz von Tweets über Bitcoin und dem Interessenniveau zum Suchbegriff Bitcoin. Weiters zeigen wir wie das stündliche Handelsvolumen von Bitcoin mittels der stündlichen Rate von Tweets über Bitcoin und Google Trends Daten vorhergesagt werden kann. In dieser Arbeit analysieren wir Daten aus dem Zeitraum Juli 2018 bis August 2018, d.h. zwei Monate. Erstens benützen wir die stündlichen Informationen über Tweet Stimmung, Tweet Frequenz und Google Suchdaten über Bitcoin um eine kausale Verbindung zwischen diesen Daten und dem aktuellen Preis von Bitcoin. Zweitens entwickeln wir ein vektorautoregressives Modell (VAR) dass erfolgreich den Bitcoin Wechselkurs und das Bitcoin Handelsvolumen vorhersagt. Weiters, verwenden wir zwei unterschiedliche Algorithmen, SentiStrength and Stanford Core NLP, um Stimmungsinformation zu erhalten. Wir zeigen dass mit dem SentiStrength Algorithmus welcher für kurze Nachrichten wie Tweets geeignet ist unser Modell bessere Resultate erzielt. Spezifisch, zeigen wir dass unser Modell wenn kombiniert mit SentiStrength eine Genauigkeit von 63% für Vorhersagen bezüglich dem Anstieg und Abstieg des Bitcoin Wechselkurses aufweist. Auf der anderen Seite, wenn man unser Modell mit Stanford Core NLP kombiniert erhalten wir eine Genauigkeit von 59%. Drittens, benutzen wir die Tweet-Frequenz und Suchinformationen um das Bitcoin Handelsvolumen mit einem mittleren quadratischen Fehler von 172.76 vorherzusagen. Zusammenfassend, zeigen wir in dieser Arbeit dass Informationen von Twitter und Google Trends sehr hilfreich sind wenn es um die Vorhersage zwei wichtiger Bitcoin Eigenschaften, Wechselkurs und Handelsvolumen, geht.
de
Ubiquity of the Internet has made it a valuable data source, and products such as Twitter and Google Trends implement APIs that make that data available to us. Because these two services capture an abundance of data about their users, they can be used to predict user behavior in some areas. In this work, we describe and implement statistical methods that can be used to predict the bitcoin exchange rate by using sentiment analysis, frequency of tweets related to bitcoin, and level of interest in search term bitcoin. Also, we show how bitcoin hourly trading volume can be forecast by using hourly number of tweets about bitcoin and Google Trends data about bitcoin. We analyse data for period of two months during July 2018 and August 2018. By observing hourly information about tweet sentiment, tweet frequency, and Google searches on bitcoin, we first show causality between these time series and impact of historical values on the current values. Also, we build a vector autoregression model that is used to successfully forecast bitcoin exchange rate and bitcoin trading volume. Furthermore, two different algorithms, SentiStrength and Stanford Core NLP, are used in order to extract the sentiment information. We show that SentiStrength which is optimized for short messages such as tweets does perform better. The model we developed using SentiStrength sentiment algorithm achieves accuracy of 63% in predicting increase or decrease in bitcoin exchange rate. On the other hand, VAR model with Stanford CoreNLP algorithm achieves an accuracy of 59%. Also, bitcoin trading volume is predicted by using tweet frequency and search information with root mean square error of 172.76. Our work shows that Twitter and Google Trends is very useful when predicting two important bitcoin properties, the exchange rate and trading volume.