Eckelt, K. W. (2018). Data-driven user guidance in multi-attribute data exploration [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2018.45046
E193 - Institut für Visual Computing and Human-Centered Technology
-
Date (published):
2018
-
Number of Pages:
108
-
Keywords:
Visualisierung; Untersuchung Klinischer Daten
de
Visualization; clinical data research
en
Abstract:
Das Finden von Beziehungen in großen Datensammlungen ist eine immer wiederkehrende Aufgabe, welche jedoch durch ständig wachsende Datenmengen und deren Heterogenität komplexer wird. Zur Visualisierung multivariater Daten gibt es mehrere Ansätze: Projektionstechniken, Überblickstechnicken, und tabellarische Visualisierungen. Doch während die Analyse einzelner Datensätze in Tabellen einfach ist, wird das Finden von Ähnlichkeiten in der restlichen Datensammlung mühevoll. Auch bei Überblickstechnicken stößt man beim Vergleich großer Datenmengen schnell an Grenzen. In der vorliegenden Arbeit wird ein Prozess zur Führung von Nutzerinnen und Nutzern präsentiert, um sie bei der Datenexploration zu unterstützen. Ausgehend von einer selektierten Teilmenge an Daten, werden Attribute vorgeschlagen, welche Ähnlichkeiten zu jenen aufweisen. Attribute oder Datensätze können ausgewählt und anhand mehrerer Ähnlichkeitsmaße mit der gesamten Datensammlung verglichen werden. Ein selektiertes Attribut wird mit allen weiteren Attributen verglichen. Datensätze werden allerdings mit sämtlichen Gruppierungen aller Attribute verglichen. Numerische Attribute werden so diskretisiert, dass eine der resultierenden Gruppen möglichst hohe Ähnlichkeit aufweist. In hierarchischen Attributen wird nach dem ähnlichsten Teilbaum gesucht. Die vorgestellte Benutzerführung ist nicht nur unabhängig vom Datentyp, sondern auch von der Domäne und der Visualisierung der Daten. Demonstriert wird dies durch die Verwendung verschiedener Datensammlungen und der Integration des Prozesses in zwei Visual Analytics (VA) Systeme.
de
Seeking relationships in multi-dimensional datasets is a common task, but can quickly become tedious due to the heterogeneity and increasing size of the data. Its visualization can be approached in a variety of ways: with projection techniques, overview techniques, and tabular techniques. However, while the interactive selection of a data subset during exploration is most easily done with tabular visualizations, finding relationships and patterns is not. Also, with overview techniques the number of attribute combinations quickly outgrows reasonable dimensions. In this thesis, a data-driven touring process for Visual Analytics (VA) tools is presented that guides users in discovering relationships for a data subset of their interest. Based on the users selection, attributes that show some kind of similarity are presented. The selection can be done on attribute and item level. While a selected attribute is compared to all other attributes in the dataset, item sets are compared to the individual categories of attributes. This comparison can be based on a number of similarity measures. To cope with heterogeneity of data types, numerical attributes are discretized to achieve maximum similarity. In hierarchical attributes, the most similar subtree is sought. The touring process is also independent of the data domain and its visualization. This independence is demonstrated by the use of three different datasets and the integration of the touring process into two VA systems.