Steinböck, D. (2018). Interactive visual exploration interface for large bipartite networks [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2018.50140
E193 - Institut für Visual Computing and Human-Centered Technology
-
Date (published):
2018
-
Number of Pages:
96
-
Keywords:
Information Visualization; Graph Data
de
Informationsvisualisierung; Graph-Daten
en
Abstract:
In dieser Arbeit präsentieren wir BiCFlows, einen neuartigen Ansatz zur interaktiven Exploration großer bipartiter Graphen. Die Entwicklung wurde durch die Medientransparenz-Datenbank angeregt. Diese öffentlich zugängliche Datenbank wurde von der österreichischen Bundesregierung eingerichtet, um Informationen über staatliche Werbeund Subventionsausgaben bereitzustellen. Diese Datenbank weist dabei die Eigenschaften eines großen, gewichteten bipartiten Graphen auf. Aktuelle Ansätze, die sich mit der Visualisierung der Medientransparenz-Datenbank befassen, sind dadurch limitiert, dass sie keinen ausreichenden Überblick über den gesamten Datensatz bieten. Andere Ansätze, die nicht speziell für die Medientransparenz-Datenbank entwickelt wurden, sich jedoch mit der Visualisierung von bipartiten Graphen befassen, sind zusätzlich durch ihre mangelnde Skalierbarkeit bei großen Datensätze begrenzt. Aggregation ist ein häufig verwendetes Konzept, um die Datenmenge durch Gruppieren ähnlicher Datenobjekte zu reduzieren. Dies funktioniert nur, wenn die entsprechenden Eigenschaften in den Daten vorhanden sind, um sie für die Aggregation zu verwenden. Wenn diese zusätzlichen Informationen, wie in der Medientransparenz-Datenbank fehlen, müssen andere Aggregationstechniken verwendet werden. Da wir uns in unserem Ansatz mit bipartiten Graphen beschäftigen, verwenden wir das Konzept des Biclusterns um eine hierarchische Struktur innerhalb der Daten zu erstellen, die vom Benutzer interaktiv erkundet werden kann. Wir haben gezeigt, dass BiCFlows nicht nur für die Medientransparenz-Datenbank, sondern auch für andere Datensätze verwendet werden kann, die die Eigenschaften eines gewichteten bipartiten Graphen aufweisen. Darüber haben wir eine Benutzerstudie durchgeführt, um BiCFlows mit bestehenden Konzepten zu vergleichen und Vorund Nachteile zu diskutieren. Wir haben gezeigt, dass BiCFlows die Anwender in ihrem Explorationsprozess unterstützt und ihnen mehr Einblicke als mit bestehenden Ansätzen ermöglicht.
de
In this thesis we introduce BiCFlows, a novel interactive visualization approach to explore large bipartite graphs. We were motivated by the Media Transparency Database, a public database established by the Austrian government to provide information about governmental advertising and subsidies expenses, which holds the characteristics of a large, weighted bipartite graph. Current approaches that deal with the visualization of the Media Transparency Database are limited by the fact that they do not offer a sufficient overview of the whole dataset. Other existing approaches that are not particularly designed for the Media Transparency Database, but deal with the visualization of bipartite graphs are in addition limited by their lack of scalability for large datasets. Aggregation is an often used concept in reducing the amount of data by grouping together similar data objects. This only works if the appropriate object properties are present in the data to use them for the aggregation. If this additional information is missing, like in the Media Transparency Database, other aggregation techniques have to be used. Since we are dealing with bipartite graphs in our approach, we use the concept of biclustering to establish a hierarchical structure within the data that can be interactively explored by the user. We showed that BiCFlows cannot only be used for the Media Transparency Database, but also for other datasets that share the characteristics of a weighted bipartite graph. Furthermore, we conducted an insight-based user study to compare BiCFlows with existing concepts and discussed advantages and drawbacks. We showed that BiCFlows supported users in their exploration process and let them gain more insight than with existing approaches.