Elashkr, T. (2019). Reading between the lines of travelers: : Gained insights from user-generated content for destination marketing using text mining and predictive analytics [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.43692
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Datum (veröffentlicht):
2019
-
Umfang:
107
-
Keywords:
Social media analytics; machine learning; tourism
en
Abstract:
Die Nutzung des Internets im Tourismusbereich hat sich über die Jahre entwickelt, sodass Reisende nicht mehr nur Informationen konsumieren, sondern auch viele Inhalte selbst produzieren, die in verschiedenen Kanälen wie Social Media, Forums, Blogs, usw. zu finden sind. Diese Inhalte werden als unstrukturierte Daten kategorisiert und sind in Form von Beiträgen, Nachrichten und Kommentaren verfügbar. Unternehmen können dadurch mehr über ihre Kunden und deren Interessen erfahren. Die Analyse einer solchen Menge an Informationen kann sehr zeit -und kostenaufwendig sein. Daher werden diese Inhalte durch die Verwendung von Text Mining Techniken mit Hilfe von Machine Learning Methoden, und Predictive Analytics untersucht. Die vorliegende Arbeit richtet sich auf Inhalte, die in TripAdvisor United Kingdom erstellt wurden, speziell im Österreich-Forum. Die Daten werden verwendet, um neue Erkenntnisse für Reiseveranstalter, die für das Tourismusmarketing zuständig sind, zu gewinnen. Darüber hinaus werden die Daten auch verwendet, um den Zusammenhang zu den historischen Ankunftsdaten zu verstehen und um herauszufinden, wie diese Daten zur Vorhersage der zukünftigen Ankünfte nach Österreich beitragen können. Ebenso wird der Google-Suchvolumenindex auch als zusätzliche Datenquelle für die Vorhersageanalyse verwendet. Die Ergebnisse zeigen, dass Reisende das TripAdvisor-Forum nicht nur für ihre Reiseplanung nutzen und um Antworten für ihre Fragen vor Ort zu finden, sondern auch um Inspiration und Unterstützung bei der Wahl ihres nächsten Urlaubszieles, zu erhalten. Außerdem beginnen Reisende bereits drei Monate im Voraus mit der Recherche für ihre Reise. Bei Sommerreisen beginnt die Planung früher. Die geteilten Inhalte in den Foren spiegeln die Interessen der Reisende je nach Herkunftsland wider. Das Ergebnis der Zeitreihenanalyse für die Vorhersage der Ankünfte zeigte, dass das Erweitern der Modelle mit nutzergenerierten Inhalten, einschließlich Goolge-Suchdaten und TripAdvisor-Daten, die Prognose der Touristenankünfte für einige Zeitreihen verbessert, jedoch nicht für alle. Dennoch kann dieser vom Nutzer generierte Inhalt dazu verwendet werden, zukünftige Trends und Nachfragemuster zu erkennen. Der in dieser Arbeit vorgestellte Ansatz kann für andere Foren und Länder in TripAdvisor, sowie für ähnliche Datenquellen angewendet werden.
de
The usage of the Internet in the tourism field has developed over the years, so that travelers do not only consume information, but also produce a lot of content themselves, which is shared in various channels including social media, travel review sites, blogs, etc. This generated content is categorized as unstructured data, which is available in forms of posts, messages, and comments. Businesses can use this content to enrich their understanding of their customers' needs. Analyzing such an amount of information can take a lot of effort and time. Therefore, text mining techniques using machine learning, and predictive analytics are used to investigate the information. This work focuses on the content created in TripAdvisor United Kingdom, particularly in the Austria forum. The data is used to gain new insights that can support travel professionals responsible for the destinations marketing of Austria. Additionally, the data is also used to understand the relationship to the historical arrivals data in order to determine how these data can contribute to the prediction of future arrivals (number of visitors) to Austria. Likewise, the Google search volume index is used as an additional data source in the prediction analyses. The results show that travelers use the TripAdvisor forum not only to get answers for questions related to their trip planning but also to get inspiration and support in choosing their next holiday destination. Additionally, travelers begin researching for their trip three months in advance, except for summer trips, for which planning starts earlier. Moreover, the forums' content reflects the travelers' interests depending on their country of origin. The outcome of the time series analysis for the prediction of arrivals showed that extending the models with the user generated content, including Google search data and TripAdvisor data, improved the forecasting of the tourist arrivals for some of the time series but not all. Nevertheless, this user generated content can be used to detect future trends and demand patterns. Finally, the approach introduced in the thesis at hand can be applied for other forums and countries in TripAdvisor, as well as for other similar data sources.