Kleedorfer, F. (2008). Automatic topic detection in song lyrics [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-26790
E184 - Institut für Computational Perception der Johannes Kepler Universität Linz
-
Date (published):
2008
-
Number of Pages:
154
-
Keywords:
Text Mining; Themenerkennung; Clustering; Maschinelles Lernen; Musik; Information Retrieval; Suche; Liedtexte
de
text mining; topic detection; clustering; machine learning; music; information retrieval; search; song lyrics
en
Abstract:
In der vorliegenden Arbeit wird ein Algorithmus zur automatischen Erkennung von Themen in Liedtexten vorgestellt. Dieser besteht haupts¨achlich aus der Anwendung von Methoden des Textmining und dem anschließenden Einsatz von Clustering mittels non-negative matrix factorization (NMF).<br />Die dabei entstehenden Cluster werden h¨andisch benannt. Diese Benennung wird in einer kleinen Studie von Versuchspersonen vorgenommen. Die Studie belegt, dass die identifizerten Themen konsistent und erkennbar sind.<br />Durch die Anwendung der pr¨asentierten Methode auf eine Musiksammlung wird ein Information Retrieval System erstellt, das es erlaubt, die Sammlung nach Themen und Themenkombinationen zu durchsuchen.<br />
de
We propose an algorithm for the automatic detection of topics in song lyrics.<br />It mainly consists in the application of basic text mining techniques on a lyrics collection and clustering the terms found in the lyrics into topics by using non-negative matrix factorization (NMF). The resulting clusters are labeled by hand. A small-scale evaluation is used in order to create these labels.<br />The study proves that the identified topics are coherent and recognizable.<br />The result of applying our method to a collection of songs is an information retrieval system which can be queried for topics and topic combinations.