Müllner, A. (2015). Twitter usage in Austria : a behavioral analysis about the Twitter usage in Austria and the surrounding border areas [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2015.25451
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2015
-
Number of Pages:
76
-
Keywords:
Social Media; Twitter; Text Mining; Sentiment Detection; Keyword Extraction
de
Social Media; Twitter; Text Mining; Sentiment Detection; Keyword Extraction
en
Abstract:
Die Nutzung von Social Media steigt stetig an. Eine Plattform, die in der Vergangenheit große Wachstumszahlen hatte, ist Twitter. Speziell, wenn man die Nutzungszahlen mit anderen Plattformen vergleicht, wird dieser Anstieg deutlich. In Österreich gibt es bei den Twitter-Nutzerzahlen noch Wachstumspotenzial. Deshalb ist es sehr interessant, zu analysieren, wie Twitter in Österreich genutzt wird. Twitter ist eine Microblogging Plattform, deshalb sind die Anwendungsbereiche ein wenig anders als bei klassischem Blogging. Die Nutzung von Twitter ist eher eine Kombination aus der Nutzung eines klassischen Sozialen Netzwerks und eines Blogs. In meiner Diplomarbeit analysiere ich die Nutzung von Twitter in Österreich. Dafür habe ich Twitter Daten aus Österreich und dem nahen Ausland heruntergeladen. Dies passierte in zwei unterschiedlichen Zeiträumen (April 2014, Juni 2014). Um aus diesen Daten Trends und Stimmungen zu extrahieren, habe ich unterschiedliche Text Mining Algorithmen benutzt. Die Ergebnisse wurden dann in weiterer Folge analysiert. Als Erstes wurden die gesamten Daten analysiert. Hier wurde ersichtlich, dass Tweets um größere Städte gruppiert sind. Auch konnte ich feststellen, dass die meisten Tweets zwar in Deutsch oder Englisch veröffentlicht wurden, jedoch werden sehr viele weitere Sprachen für das Posten verwendet. Die Plattformen, die benutzt werden um zu twittern, unterscheiden sich sehr stark von der Verteilung der mobilen Plattformen unter Personen. Zum Beispiel werden mehr als die Hälfte aller Tweets mit einem iOS-Client veröffentlicht. Aufgrund dieser Tatsachen sind Twitter-Daten nicht repräsentativ für Gesamtbevölkerungen, weil der Benutzerkreis von Twitter ein eingeschränkter ist. In weiterer Folge wurden auch die Stimmungen und Trends näher analysiert. Generell ist die Stimmung der Posts eher positiv. Dies liegt jedoch daran, dass der Algorithmus zur Definition der Stimmung Tweets eher positiv bewertet. Deshalb ist dieses Ergebnis ein wenig ungenau. Die Trends innerhalb der Twitter-Daten bestehen zum Großteil aus Orten und Plätzen, es sind aber auch Trends ersichtlich, die reale Vorfälle beschreiben. Um die regionalen Unterschiede zu analysieren wurden die Daten in acht Regionen geteilt. Dafür wurde ein quadratischer Raster angewendet, der acht gleich große Quadranten definiert. Die Anzahl wurde so gewählt, weil bei einer größeren Anzahl von Quadranten einige zu wenig Daten für die Analyse beinhaltet hätten. Jede Region wurde dann gleich analysiert wie die Gesamtdaten. Eine Beobachtung hier ist, dass Trends und Stimmungen in jeder Region variieren. Einige Trends sind zwar in mehr Regionen ersichtlich. Hier kann jedoch keine Regelmäßigkeit erkannt werden. Diese Ergebnisse zeigen, dass die Nutzung von Twitter sehr stark von der Region abhängt und in jeder Region andere Themen relevant sind. Das Ende dieser Arbeit bildet ein Fazit dieser Arbeit und eine Zusammenfassung der Ergebnisse.
de
Social Media is a phenomenon which has increasing user numbers. One interesting platform to investigate is Twitter, as the usage is not that high as the usage of other platforms. But as the numbers are rising in the past, it is interesting how this platform is used within a specified area like Austria. Although Twitter is a microblogging platform there are only some characteristics of normal blogging valid for Twitter. Moreover the usage of Twitter is a combination of the usage of classic social networks and blogs. In my thesis I crawled Twitter data from Austria and the surrounding border areas within two timeframes (April 2014, June 2014). To define trends and sentiments for the dataset I used several text mining methods. To get insights into the data, I performed several analyses: First, I performed an overall analysis on the dataset. I found out, that tweets are clustered around big cities. Another observation is, that most tweets are published in English or German, but overall many different languages are used to publish a tweet. The platforms used for publishing a tweet do not represent the real life mobile market share. Because of these two observations Twitter data is not representative for real world populations as the people using Twitter are a special user group and no reflection of the real world population. I also analyzed sentiments and trends for the Twitter data. The overall sentiment is positive, but as the sentiment algorithm more likely classifies posts as positive, and the positive sentiment value is quite low, this observation is a little bit imprecise. The trends for the dataset mostly contain location terms but also represent real life events. To perform regional analysis the data was clustered into eight regions. The regions were defined as quadrants, each of equal size. When defining more smaller regions, there would be some of them with too less data. Each region then was analyzed equally as the overall dataset. One observation of the regional analysis is, that trends and sentiment differ in each region. Only a few trends are present in more regions, but also there no regularity can be observed. The results proof that the usage of Twitter is highly dependent on the region where the tweets are posted. In the end of the work I conclude the results and summarize the results from this work.
en
Additional information:
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers Zsfassung in dt. Sprache