Riegler, A. (2020). Erkennung von Hasspostings aus dem sozialen Netzwerk Facebook mittels multimodaler Analyse von Text- und Bild-Postings [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/78415
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2020
-
Number of Pages:
130
-
Keywords:
machine learning; supervised learning; text classification; image classification; hate speech; facebook
de
machine learning; supervised learning; text classification; image classification; hate speech; facebook
en
Abstract:
Das soziale Netzwerk Facebook bietet Raum für Diskussionen zu verschiedensten Themen. Menschen reagieren auf aktuelle Geschehnisse und häufig treffen dabei grundlegend verschiedene Meinungen aufeinander. Ein Beispiel hierfür sind die Ereignisse rund um die Flüchtlingskrise, die vor allem ab 2015 und bis heute noch für zahlreiche Debatten sorgt. Die Emotionen schaukeln sich hoch und immer häufiger führt dies zu Beleidigungen und Hassreden. Sogenannte Hasspostings stellen ein Problem dar und die Erkennung dieser mittels manueller Verfahren ist aufgrund der enormen Datenmengen unmöglich. In dieser Arbeit soll ein Machine Learning Ansatz zur automatisierten Identifizierung von Text- und Bild-Hasspostings präsentiert werden. Einerseits werden dabei linguistische, lexikalische und grammatikalische Aspekte von Text-Postings betrachtet, andererseits kommen lokale und globale Bildmerkmale sowie Vorhersagen von Deep Convolutional Neural Networks für Bild-Postings zum Einsatz. Darüber hinaus werden bei beiden Varianten spezielle Facebook-Funktionen als Features berücksichtigt. Ziel ist es, jeweils für Text- und Bild-Postings ein optimales Featureset zu ermitteln, das in Kombination mit einem geeigneten Klassifikator das bestmögliche Klassifizierungsresultat liefert.
The social network Facebook offers room for discussions on various topics. But when people react to current events, they often have different opinions. One example of this are the events around the refugee crisis, which is causing many debates, especially from 2015 and until today. Emotions are running high and increasingly often, this leads to insults and hate speech. So-called hate postings are a problem and the recognition of these by manual methods is impossible due to the enormous amounts of data. In this thesis a machine learning approach for the automated identification of text and image hate postings is presented. On the one hand, linguistic, lexical and grammatical aspects of text postings are considered, on the other hand, local and global image features as well as predictions of Deep Convolutional Neural Networks are used for image postings. In addition, specific facebook features are included in both versions. The aim is to determine an optimal feature set for text and image postings, which, in combination with a suitable classifier, provides the best possible classification result.