Platzgummer, G. (2008). Evaluierung von Qualitätsmaßen für Selbstorganisierende Karten [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/183760
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2008
-
Number of Pages:
127
-
Keywords:
Selbstorganisierende Karten; Qualität
de
Self-Organizing Maps; quality
en
Abstract:
Selbstorganisierende Karten (Self-Organizing Maps, SOMs) sind ein wirksames und populäres Mittel, um große Datenmengen zu analysieren, zu interpretieren und die Ergebnisse in weiterer Folge zu visualisieren.<br />Sie projizieren hochdimensionale Grunddaten in einen vom Menschen leichter zu verstehenden niedrigdimensionalen Raum mit der Aufgabe, die Komprimierung mit möglichst wenig Informationsverlust zu verbinden. Es existiert eine Vielzahl an verschiedenartigen Methoden zur Messung der Qualität Selbstorganisierender Karten beziehungsweise einzelner Eigenschaften von SOMs. Diese Arbeit beschreibt sieben populäre Qualitätsmaße zur Messung von Topologieerhaltung und Vektorquantisierung Selbstorganisierender Karten. Darauf aufbauend wird der Versuch unternommen, diese Maße anhand eines speziellen künstlichen Datensets zu evaluieren. Dies wird durch Variation der Kartengröße, der Trainingsiterationen und unter Berücksichtigung der Datenbeschaffenheit des Datensets erreicht. Die resultierenden Beobachtungen fließen anschließend in die Qualitätsuntersuchung von Karten auf Real-World-Daten ein. Diese Experimente dienen der Untersuchung der Frage, inwiefern die vorgestellten Maße Rückschlüsse auf die Beschaffenheit der Eingabedaten und die Charakteristik der daraus resultierenden Karte beziffern können. Zusätzlich wird der allgemeine Einfluss der Eigenschaften "Kartengröße" und "Anzahl der Trainingsiterationen" auf die Fehlerwerte für die gesamte Karte beziffert und interpretiert.<br />
de
Self-Organizing Maps (SOMs) are a powerful and popular tool for analyzing and interpreting large amounts of data, and are also suited for visualization purposes. They project high-dimensional data to lower-dimensional space, which can be interpreted more easily by humans, while preserving essential information. A large number of different methods for determining the quality of SOMs or some of their properties exist. This thesis describes seven commonly known quality measures used to quantify topology preservation and vector quantization of SOMs. These quality measures are then evaluated using a special artificial data set by considering the constitution of input data and varying map size and training iterations. The findings of this process are then used to interpret similar experiments on real-world input data. These experiments should answer the question to what extent the presented quality measures allow for drawing conclusions relevant for data mining purposes. In addition, the overall influence of the pameters "variations of map size" and "number of training iterations" on the error values for the entire map is quantified and interpreted.