Wortschack, M. (2016). A scalable visualization of set-typed data [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.27526
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2016
-
Number of Pages:
89
-
Keywords:
Informationsvisualisierung; Set
de
Information Visualization; Set
en
Abstract:
Mengenbasierte Daten spielen in der Informationsvisualisierung eine wichtige Rolle. Sie werden hauptsächlich genutzt, um Beziehungen zwischen Sets und Elementen zu repräsentieren, wie zum Beispiel welche Länder (Sets) ein bestimmtes Produkt (Element) exportieren, oder welchen Genres (Sets) ein Film (Element) angehört. Mengenbasierte Daten kommen in unterschiedlicher Form vor und dienen als Datenmodell in verschiedenen Analyse-Szenarien. Skalierbarkeit ist eine der größten Herausforderungen im Zusammenhang mit mengenbasierten Daten. Euler- und Venn-Diagramme zählen zu den bekanntesten Visualisierungen in diesem Zusammenhang, da sie auf einfache Weise die grundlegenden Konzepte der Mengenlehre abbilden. Trotz ihrer Beliebtheit und der weiten Verbreitung in unterschiedlichen wissenschaftlichen Feldern, sind diese Diagramme nicht in der Lage, mehr als drei Sets darzustellen, ohne dabei enorm an Komplexität zuzulegen. Dadurch eignen sie sich im Allgemeinen nicht, um Daten zu analysieren und zu visualisieren, die hunderte Sets beinhalten. Dies trifft jedoch auf eine Vielzahl von Daten aus der realen Welt zu. Neben Euler- und Venn-Diagrammen wurden in der Vergangenheit etliche Visualisierungen für mengenbasierte Daten entwickelt. Die meisten dieser Visualisierungen skalieren allerdings entweder mit der Anzahl der Elemente oder mit der Anzahl der Sets. Ziel dieser Arbeit ist die Entwicklung eines funktionellen Prototyps, der Skalierbarkeit sowohl in der Anzahl der Elemente, als auch in der Anzahl der Sets bietet. Die vorgestellte Visualisierung, auch Scets genannt, nutzt verschiedene Methoden zur Aggregation und stellt die aggregierten Daten in einer übersichtlichen Matrix dar. Weiters ermöglicht diese Visualisierung Nutzern die Daten interaktiv zu untersuchen. Der entwickelte Prototyp setzt auf moderne Web-Technologien. Mit Hilfe eines serverseitigen Backends können große Datenmenge verarbeitet werden und einer Menge an Benutzern über eine webbasierte Oberfläche zugänglich gemacht werden. Zwei Anwendungsfällen veranschaulichen, wie die Visualisierung genutzt werden kann, um Echtdaten zu untersuchen und inwiefern der Nutzer dabei unterstützt wird, neue Erkenntnisse aus den visualisierten Daten zu gewinnen.
de
In information visualization set-typed data refers to datasets that represent element-set memberships, such as which countries (sets) produce a certain product (element), or which genres (sets) a movie (element) belongs to. Set-typed data appears in various forms and can serve as a data models in various data analysis scenarios. One of the main challenges in the context of set-typed data visualization is scalability. Traditionally, Euler and Venn diagrams count as two of the most popular set visualizations that depict the concepts from set theory. However, despite the widespread usage of these diagrams across several scientific fields they lack the ability of visualizing more than three sets without becoming too complex. This limits their applicability to data analysis scenarios that involve hundreds of sets such as the world countries. Besides Euler and Venn diagrams a variety of visualization techniques for set-typed data has been developed over the past. Typically, existing techniques scale well with either an increasing number of elements or an increasing number of sets. The goal of this thesis is to develop a set visualization technique which offers high scalability in both the number of sets and elements. The proposed technique, called Scets, employs different aggregations of set-type data, and uses a matrix layout to visualize the aggregated information. Furthermore, it allows users to explore the aggregated information interactively. The implemented prototype uses modern web technologies which make the visualization both able to handle a large amount of data using server-side backend, and accessible to a wide range of users using web-based frontend. Two different use cases demonstrate how the proposed visualization technique helps to investigate real-world data and enables users in an intuitive way to reveal several patterns which could not be easily detected by other visualization techniques.