Filipović, A. (2008). Musik-Genreklassifikation mit Hilfe von Hidden Markov Modellen [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/185648
Music; Hidden Markov Models; Classification; Acoustic Features; Features; Music genre; Information Retrieval; Musik Information Retrieval
en
Abstract:
Musik ist ein Bestandteil unseres täglichen Lebens. Sie verfolgt uns von morgens bis abends, über die Sendungen unseres liebsten Radiosenders, auf dem Weg zur Arbeit, zur Bildungsstätte oder in den Urlaub mit Hilfe von Autoradios oder tragbaren Geräten, beim Sport, in Restaurants usw. Musikinformationsretrieval als Subdomäne des Informationsretrievals gewann seit der Verbreitung des Internets und heute gängigen Audioformaten wie z.B. MP3 immer größere Aufmerksamkeit. Seit Jahren werden immer mehr und mehr wissenschaftliche Arbeiten in diesem Themengebiet veröffentlicht. Es wird viel Aufwand in die Entwicklung effizienter Algorithmen und Datenbanken für das Management großer Musiksammlungen gesteckt. Eine für Menschen geeignete Form der Musikorganisation ist die Klassifikation nach ihren Genres. Durch den zunehmenden Bedarf nach dieser Art der Organisation und auf Grund kostspieliger manueller Zuordnung entstand die Idee der automatischen Musikgenreklassifikation. In dieser Arbeit wird eine häufig genutzte Methode zur Musikgenreklassifikation untersucht. Zudem wird ein Überblick über das Themengebiet des Musikinformationretrievals und der heutzutage genutzten Techniken sowie der Quellen verschiedener wichtiger Informationen, verwendeter Daten und Implementierungen gegeben. Im Zentrum dieser Arbeit steht die Untersuchung von Musikgenreklassifikation mit Hilfe der "Hidden Markov Modelle" und die Anwendung dieser zur Klassifikation von Musikstücken aus der Dateisammlung des Jahres 2004 der "Internationalen Symposien über Musikinformationsretrieval" (ISMIR). Aus diesen Musikdateien wurden Ausschnitte von 30 Sekunden von mp3 zu Wave Format mit CD-Qualität konvertiert und sechs vorklassifizierten Musikgenres zugeordnet. Für das Extrahieren der Merkmale wird die - von der Abteilung für Musik der University of Jyväskyläda in Finnland - für Musikinformationsretrieval entwickelte MIRtoolbox als installierbare Toolbox für MATLAB verwendet. Mit Hilfe dieser Merkmale, die als zeitbasierte charakteristische Eigenschaften des Audiosignals verstanden werden, werden alle möglichen Kombinationen der erwähnten Merkmale erstellt. Durch sechs ausgewählte psychoakustische Merkmale entstanden 63 verschiedene Kombinationen von Merkmalen, die mit Hilfe von "Hidden Markov Models Toolbox" (HMM Toolbox) für MATLAB eintrainiert und klassifiziert worden sind. Die Experimente zeigen, welche Merkmale oder Merkmalkombinationen für die Musikgenreklassifikation gut bzw. nicht so gut geeignet sind. Da die Musikklassifikation mit drei verschiedenen Größen der Stichproben (33%, 50% und 100%) vorgenommen worden ist, soll hier gezeigt werden, wie diese prozentuellen Anteile die Klassifikation mit Hilfe von HMM beeinflussen. Die Resultate zeigen, wie erwartet, dass gut ausgewählte Kombination von Merkmalen zur besseren Klassifikation führen als jedes einzelnes Merkmal, so wie dass die Hidden Markov Modellen sehr gut für die Klassifikation von Musik geeignet sind. Die höchste hier erreichte Klassifikationsrate beträgt 75%.<br />
de
Music is part of our everyday life. With the help of car radios and mobile devices we listen to music from early in the morning until late in the evening, not only with on the way to work and school, but also during exercise, in restaurants and on vacation. Music information retrieval as a sub domain of information retrieval gains its popularity with the growth of the internet and the spread of music audio formats like MP3. In the last few years we have faced a lot of scientific work that has been published in this area and another kind of work which concentrates in development of efficient algorithms and databases for management of large music collections. A popular form of music organization is the classification of genres. The idea of automatic music classification has been born because of the need for this kind of organization and costs involved by manual classification.<br /> In this work we inspect an often used method for music genre classification. Besides that, we try to give an overview of the music information retrieval, used techniques and also point to the sources of important information, data and existing implementations. The goal of this work is to study the music genre classification with help of Hidden Markov Models and the application of this to classify music provided at International Symposium for Music Information Retrieval (ISMIR) in the year 2004. The 30 seconds of music has been converted from MP3 compressed to wave audio format at CD-Quality. To extract the features we use the MIRToolbox implemented by the University of Jyväskyläda (Finland) - Department of Music as an installable toolbox for MATLAB.<br />Out of six extracted features, as a time-dependent characteristic trait of an audio signal, we build 63 different combinations, which are then trained and classified with help from Kevin Murphy's "Hidden Markov Toolbox" for MATLAB. Because we trained the models with three different training sets (33%, 50%, 100%), we could see how the size of the training set influences the classification with HMMs. The results here show, as expected, that a well chosen combination of features leads to better classification results then any feature individually and that Hidden Markov Models face the classification of music genres very well.<br />In this work we reached the classification accuracy of 75%.
en
Additional information:
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers Zsfassung in engl. Sprache