Sertkan, M. (2018). Classifying and mapping e-Tourism data sets [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2018.16569
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2018
-
Number of Pages:
146
-
Keywords:
text mining; machine learning; e-tourism
de
text mining; machine learning; e-tourism
en
Abstract:
Heutzutage kann die Online-Recherche vor der Buchung eines Urlaubs als übliche Ge- wohnheit der Kunden angesehen werden. In diesem Zusammenhang zielen Recommender Systeme darauf ab, die Kunden bei ihrer Suche nach den richtigen Produkten zu unterstüt- zen. Jedoch stehen solche Systeme domänenspezifischen Herausforderungen gegenüber, da Tourismusprodukte typischerweise sehr komplex und mit Emotionen verbunden sind. Um diesen Herausforderungen entgegen zu treten, wurden umfassende Benutzermodelle entwickelt, welche die Präferenzen, die Anforderungen und die Persönlichkeit von Kunden berücksichtigen. Eines dieser Modelle ist das sogenannte Sieben-Faktoren-Modell. In dieser Arbeit werden verschiedene Methoden zur automatisierten Bestimmung der Sieben- Faktoren von Tourismusdestinationen und Hotels untersucht, um Recommender Systeme zu ermöglichen die passendsten Produkte vorzuschlagen. Insbesondere werden explorative Datenanalysen, Clusteranalysen und Regressionsanalysen durchgeführt, um nicht nur die Sieben-Faktoren von Tourismusdestinationen und Hotels zu bestimmen, sondern auch ausschlaggebende Attribute von Tourismusdestinationen und Hotels zu identifizieren. Die Resultate der Clusteranalysen zeigen, dass ähnliche Tourismusdestinationen und auch ähnliche Hotels gruppiert werden können. Die identifizierten Gruppen können mit den Sieben-Faktoren assoziiert werden. Die Ergebnisse der Clusteranalysen ermöglichen es nicht einzelne Faktoren des Sieben-Faktoren-Modells zu bestimmen, aber können für eine direkte Zuordnung verwendet werden. Im Gegensatz zu den Clusteranalysen liefern die Regressionsanalysen einen klaren Beweis dafür, dass die Sieben-Faktoren von Tourismusdestinationen und Hotels unter Berücksichtigung der jeweiligen Attribute bestimmt werden können. Grundsätzlich variiert die Qualität der entwickelten Modelle für verschiedene Faktoren des Sieben-Faktoren-Modells und auch für verschiedene Touris- musprodukte (Destination und Hotels). Der in dieser Arbeit vorgestellte Ansatz kann für neue Datenquellen und auch Produkttypen leicht nachvollzogen werden.
de
Nowadays, researching online before booking a vacation can be seen as a common habit of customers. In this context, Recommender Systems (RSs) are aiming to support the customers to find the right products, but they face domain specific challenges since tourism products are typically very complex and related to emotional experiences. To counteract these challenges, comprehensive user models for capturing the preferences and personality of travelers have been introduced. One of these models is the so-called Seven-Factor Model. This work introduces an automated way for determining the Seven- Factor representation of tourism destinations and hotels to enable a matchmaking for RSs. In particular, exploratory data analyses, cluster analyses, and regression analyses are conducted not only to find a mapping of tourism destinations and hotels onto the Seven- Factors, but also to foster a better understanding of the relationship between destination attributes and the Seven-Factors, and between hotel attributes and the Seven-Factors. The main results show that conceptually meaningful groups of destinations and hotels as well can be identified and associated with the Seven-Factors, but they can only be used for direct allocations rather than for determining each factor of the Seven-Factor Model. Furthermore, the regression analyses provide clear evidence that a tourism destination’s Seven-Factor representation and a hotel’s Seven-Factor representation can be determined by taking the respective attributes into account. In general, the quality of the developed models varies for different factors of the Seven-Factor Model and also for different tourism products (i.e., destination and hotels). Finally, the introduced approach can easily be followed for new data sources and product types.