Scholz, F. (2023). Classification of users in an online news forum - a data analysis of user types and user interaction in the online forum of an Austrian newspaper [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.50989
E194 - Institut für Information Systems Engineering
-
Date (published):
2023
-
Number of Pages:
87
-
Keywords:
Usermodeling; Social Network Analysis; Data mining
en
Abstract:
Online news forums provide a longstanding way for the exchange of opinions with other users. These often-large user bases consist of a cross-section of all people with various opinions and motivations. By classifying recurring types of behaviors common in such a context, an effort is made to provide an understanding about the composition of even large user bases. Additionally, long-time observations could provide insights into the composition and development over time. This thesis creates a classification model for users of an online news forum. The model is created by combining exploratory and statistical data analysis and attempts to explain recurring behaviors found in such an online community context. Such a model can be used to analyze how the user base of a large community develops and provides a quick overview of the composition of its users.In order to keep the model generally applicable, and not too tied to the provided data, the thesis proposes six roles for actively participating users and one additional role for non-participating readers. These active roles are Taciturn, Silent Voter, Regular, Conversationalist, Power User, and Celebrity. The inactive role is called Lurker. The model performance was tested for its predictive power and achieved a macro F1 score of 0.8632.Applying the model to a set of long-term data, provided by the online news forum of derStandard.at, role distribution over time was analyzed, showing a gradual trend towards higher activity of forum users. Additionally, co-occurrences of roles in the long term behavior of users and the frequency of role switches were measured in order to evaluate whether users have inherent roles or show signs of various roles, which could be dependent on time or context.
en
Online News Foren bieten Nutzern die Möglichkeit, sich mit anderen Nutzern zum aktuellen Tagesgeschehen auszutauschen. Diese, oftmals sehr großen Plattformen bilden einen Querschnitt der Bevölkerung ab, mit unterschiedlichen Meinungen und Motivationen. In dem wiederkehrende Verhaltensmuster durch Klassifizierung in einem derartigen Kontext erkennbar gemacht werden, soll die Analyse der Zusammensetzung von selbst umfangreichen Nutzerbasen ermöglicht werden. Darüber hinaus können Untersuchungen mit Langzeitdaten Einblicke in die Zusammensetzung und Entwicklung im Verlauf der Zeit bieten.Diese Diplomarbeit erstellt ein Klassifizierungsmodell für Benutzer eines Online News Forums. Das Model entsteht durch die Kombination einer explorativen sowie einer statistischen Datenanalyse und versucht die wiederkehrenden Verhaltensmuster in solch einem Umfeld zu bestimmen. Ein derartiges Modell kann dazu benutzt werden die Entwicklung von großen Benutzerbasen zu analysieren und ermöglicht es schnell einen Überblick über die Zusammensetzung zu schaffen.In dem Versuch das Modell allgemeingültig zu halten, ohne die Ergebnisse zu stark an die verwendeten Daten zu koppeln, werden sechs Rollen für aktiv an der Diskussion teilenehmende Benutzer, sowie eine zusätzliche Rolle für nicht teilnehmende Leser, vorgeschlagen. Die aktiven Rollen sind: Taciturn, Silent Voter, Regular, Conversationalist und Celebrity. Die inaktive Rolle heißt Lurker. Die Leistungsfähigkeit des Modells wurde getestet und seine Vorhersagekraft erreicht einen F1 Wert von 0.8632.Auf Langzeitdaten, die von derStandard.at bereitgestellt wurden, angewandt, wurde die Rollenverteilung über einen längeren Zeitraum analysiert, welche einen kontinuierlichen Trend zu aktiv am Forum teilnehmenden Rollen beschreibt. Darüber hinaus wurde bestimmt welche Rollen gemeinsam im Langzeitverhalten von Benutzern auftreten, sowie die Frequenz von Rollenwechseln, um zu evaluieren, ob Benutzer einzelnen Rollen zugehören oder Anzeichen von unterschiedlichen Rollen zeigen, die von Faktoren wie Zeit oder Kontext abhängig sein können.
de
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers