Schmidt, J. (2016). Scalable comparative visualization : visual analysis of local features in different dataset ensembles [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.37561
Die Möglichkeit, Daten schnell, interaktiv und visuell vergleichen zu können, wird für die Datenanalyse eine immer wichtigere Aufgabe. In der Visualisierung sind immer mehr Systeme gefragt, die sich nicht nur für die Repräsentation von einzelnen Datensätzen, sondern für die Analyse von ganzen Sequenzen von Datensätzen eignen. Der Benutzer kann beim Vergleichen von Daten auf zwei Arten unterstützt werden. Zuvorderst ist es sehr hilfreich, wenn Benutzer die Datensätze, die verglichen werden sollen, im System passend zueinander anordnen können. Das unterstützt die intuitive Vorgangsweise von Menschen beim Vergleichen von Daten. Weiters können Visualisierungssysteme die Unterschiede in den Daten selbst berechnen und dann in geeigneter Form dem Benutzer präsentieren. Die Vergleichende Visualisierung beschäftigt sich mit neuen Techniken, wie man in der Visualisierung Benutzer am besten beim Vergleichen von Daten unterstützen kann. Solche Techniken können üblicherweise einfach für zwei oder mehrere Objekte angewendet werden, stoßen aber an ihre Grenzen, sobald die Datenmenge entsprechend groß wird (z.B. 100 Objekte oder mehr). Solche Datensammlungen, die eine große Anzahl an individuellen, aber doch zusammengehörigen, Datensätzen enthalten, werden Ensembles genannt. Die einzelnen Datensätze, genannt die Mitglieder, beschreiben dabei dasselbe Phänomen, weisen aber kleine lokale Unterschiede auf. Ursprünglich stammen Ensembles aus dem Bereich der Simulationsanalyse, meist für Wetter- und Klimadaten. In diesen Bereichen werden sie schon seit einiger Zeit verwendet, da mehrere Simulationsläufe immer zu einer großen Anzahl von Resultaten führen, die anschließend analysiert werden müssen. Die Simulationsanalyse war daher ein starker treibender Faktor im Bereich der EnsembleVisualisierung. Leistbare Rechenkapazitäten und die Verfügbarkeit von unterschiedlichsten Analysealgorithmen (z.B. für die Segmentierung) haben aber dazu geführt, dass sich auch andere Anwendungsbereiche heutzutage mit der Analyse von Ensembles beschäftigen müssen. Ensembles werden üblicherweise entweder basierend auf Datenmerkmalen (feature-based), oder basierend auf lokalen räumlichen Regionen (location-based) analysiert. Im Falle der Analyse basierend auf lokalen räumlichen Regionen müssen Visualisierungssysteme Möglichkeiten anbieten, dass Benutzer ihre Analyse auf lokale Regionen konzentrieren können. In Rahmen dieser Arbeit wurden verschiedene Techniken für das visuelle Vergleichen von komplexen Daten entwickelt. Ein spezielles Augenmerk wurde dabei auf die Skalierbarkeit der Techniken gelegt, und zwar im Bezug auf die mögliche Anzahl von Mitgliedern pro Datensatz. Die Techniken operieren auf unterschiedlichen Arten von Datensätzen in 2D und 3D. Im ersten Teil dieser Arbeit wird eine Technik für die Analyse von 2D Bilddaten vorgestellt, die nicht nur die Berechnung von lokalen Unterschieden in den Daten ermöglicht, sondern auch eine genauere Einsicht in die Daten erlaubt. Dadurch kann, im Unterschied zu bestehenden Methoden, sehr schnell festgestellt werden, wo sich die Daten unterscheiden, und auf welchen Merkmalen diese Unterschiede beruhen. Dadurch werden Muster in den Daten sichtbar, und es können sehr schnell Sonderfälle lokalisiert werden. Der zweite Teil der Arbeit befasst sich mit einem System, das die Analyse von einem Ensemble bestehend aus dreidimensionalen Objekten (meshes) ermöglicht. Solche Ensembles werden beispielsweise beim Testen von Rekonstruktionsalgorithmen für Punktwolken mit unterschiedlichen Parametern generiert. Ähnlich wie die vorgestellte Technik zum Vergleichen von 2D Bilddaten kann das System auf eine große Anzahl an Datensätzen angewendet werden und ermöglicht sowohl die Berechnung der Unterschiede, als auch die lokale Analyse von einzelnen Regionen in den Daten. Die lokale Analyse erfolgt in diesem Fall im 3D, da es sich um 3D-Datensätze handelt. Das vorgestellte System bietet auch die Möglichkeit, lokale Unterschiedein den Daten mittels paralleler Koordinaten zu visualisieren. Vorher selektierte und vom Benutzer selbst gewählte Regionen dienen dabei als Koordinatenachsen, und die 3D-Datensätze (meshes) werden als Polylinien in den Plot eingetragen. Dadurch kann sehr schnell abgelesen werden, welche Datensätze in welchen Regionen gute/schlechte Ergebnisse liefern. Aufbauend auf dieser Idee wird im dritten und letzten Teil dieser Arbeit eine weitere 3D-Technik vorgestellt, die die Analyse von lokalen Regionen in einem Ensemble von Volumsdatensätzen ermöglicht. Benutzer können in diesem Fall lokale Regionen, die für die Analyse von Interesse sind, selbst wählen. Basierend auf der Ähnlichkeit der Regionen, können diese in einem Graphen angeordnet werden. Durch den Graphen können Regionen mit einer ähnlichen Charakteristik im Ensemble gefunden werden, und einzelne Mitglieder gegen den Rest des Ensembles verglichen werden. Alle vorgestellten Techniken wurden auf aktuelle Datensätze aus verschiedenen Anwendungsgebieten angewandt, und die Resultate der Analyse belegen die Nützlichkeit der Techniken für die vergleichende Analyse von Ensembles.
de
The comparison of two or more objects is getting an increasingly important task in data analysis. Visualization systems successively have to move from representing one phenomenon to allowing users to analyze several datasets at once. Visualization systems can support the users in several ways. Firstly, comparison tasks can be supported in a very intuitive way by allowing users to place objects that should be compared in an appropriate context. Secondly, visualization systems can explicitly compute differences among the datasets and present the results to the user. In comparative visualization, researchers are working on new approaches for computer-supported techniques that provide data comparison functionality. Techniques from this research field can be used to compare two objects with each other, but often reach their limits if a multitude of objects (i.e., 100 or more) have to be compared. Large data collections that contain a lot of individual, but related, datasets with slightly different characteristics can be called ensembles. The individual datasets being part of an ensemble are called the members. Ensembles have been created in the simulation domain, especially for weather and climate research, for already quite some time. These domains were greatly driving the development of ensemble visualization techniques. Due to the availability of affordable computing resources and the multitude of different analysis algorithms (e.g., for segmentation), other domains nowadays also face similar problems. All together, this shows a great need for ensemble visualization techniques in various domains. Ensembles can either be analyzed in a feature-based or in a location-based way. In the case of a location-based analysis, the ensemble members are compared based on certain spatial data positions of interest. For such an analysis, local selection and analysis techniques for ensembles are needed. In the course of this thesis different visual analytics techniques for the comparative visualization of datasets have been researched. A special focus has been set on providing scalable techniques, which makes them also suitable for ensemble datasets. The proposed techniques operate on different dataset types in 2D and 3D. In the first part of the thesis, a visual analytics approach for the analysis of 2D image datasets is introduced. The technique analyzes localized differences in 2D images. The approach not only identifies differences in the data, but also provides a technique to quickly find out what the differences are, and judge upon the underlying data. This way patterns can be found in the data, and outliers can be identified very quickly. As a second part of the thesis, a scalable application for the comparison of several similar 3D mesh datasets is described. Such meshes may be, for example, created by point-cloud reconstruction algorithms, using different parameter settings. Similar to the proposed technique for the comparison of 2D images, this application is also scalable to a large number of individual datasets. The application enables the automatic comparison of the meshes, searches interesting regions in the data, and allows users to also concentrate on local regions of interest. The analysis of the local regions is in this case done in 3D. The application provides the possibility to arrange local regions in a parallel coordinates plot. The regions are represented by the axes in the plot, and the input meshes are depicted as polylines. This way it can be very quickly spotted whether meshes produce good/bad results in a certain local region. In the third and last part of the thesis, a technique for the interactive analysis of local regions in a volume ensemble dataset is introduced. Users can pick regions of interest, and these regions can be arranged in a graph according to their similarity. The graph can then be used to detect similar regions with a similar data distribution within the ensemble, and to compare individual members against the rest of the ensemble. All proposed techniques and applications have been tested with real-world datasets from different domains. The results clearly show the usefulness of the techniques for the comparative analysis of ensembles.