El-Sherbiny, S. (2023). Visual analytics to support correlative exploration and sensemaking in radiogenomics analysis [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.102442
E193 - Institut für Visual Computing and Human-Centered Technology
-
Date (published):
2023
-
Number of Pages:
136
-
Keywords:
Visual Analytics; Big Data; Radiomics; Genomics; Cancer
en
Abstract:
Unter Radiogenomik versteht man die kombinierte Erforschung von bildgebenden Merkmalen namens Radiomik und Gen-Sequenzierungsdaten, der sogenannten Genomik. Zu den Herausforderungen der Datenanalyse zählen die Größe, Heterogenität und Komplexität der Datensätze. Diese Herausforderungen machen die Analyse des verfügbaren Informationsraums für Krebsexpert_innen zu einer mühseligen Aufgabe und behindern die Erforschung sowie den Erkenntnissgewinn von Informationen. Dies wird zusätzlich erschwert, wenn klinische Informationen in die Analysen miteinbezogen werden müssen. Visual Analytics (VA) kombiniert automatisierte Analysetechniken, wie maschinelles Lernen oder Statistik, mit interaktiven visuellen Schnittstellen. VA ermöglicht es Einblicke in komplexe Daten zu gewinnen, um effektive Entscheidungen zu treffen. Im Kontext der Radiogenomik-Analyse in Kombination mit klinischen Daten bieten VA-Ansätze vielversprechende Ergebnisse für die Erstellung von Tumorprofilen. Allerdings wurden VA-Ansätze, die radiogenomische und klinische Daten in einem interaktiven, flexiblen, visuellen Tool vereinen, bisher nicht untersucht. In dieser Arbeit ermöglichen wir die integrierte Erforschung und Analyse von Radiogenomik-Daten und klinischen Informationen zur Wissensfindung und Hypothesenbewertung in einer großen Kohorte von Prostatakrebs-Patient_innen. Wir behandeln fehlende Daten durch Imputationstechniken und wenden unüberwachtes maschinelles Lernen für die Dimensionalitätsreduktion und das Clustering der Daten an, um die Datenverarbeitung und Visualisierung zu vereinfachen. Als Ergebnis präsentieren wir ein interaktives visuelles Tool für zwei Zielgruppen: Krebsexpert_innen, sowie biomedizinischen Datenwissenschaftler_innen. Unser Tool ermöglicht es Krebsexpert_innen, Einblicke in die Daten zu gewinnen, indem neue Muster oder Korrelationen in den Datensätzen aufgedeckt werden. Diese können Hypothesen, die ihnen zu den zugrunde liegenden Datensätzen vorschweben, interaktiv bewerten und verfeinern. Für biomedizinische Datenwissenschaftler_innen bietet unser Framework die Möglichkeit, die Analysekomponenten zu verstehen und ihre Auswirkungen auf das Ergebnis interaktiv zu erforschen. Wir bewerten die unbeaufsichtigten maschinellen Lernmodelle anhand von Ähnlichkeitsmaßen wie dem Silhouettenkoeffizienten. Um die Funktionalität des Frameworks zu evaluieren, führen wir Anwendungsszenarien durch, die von Krebsexpert_innen bestätigt werden. Das Feedback unserer Fachpersonen zeigt, dass unser Tool flexibel und geeignet ist, um Einblicke in große heterogene radiogenomische Daten in Kombination mit klinischen Daten zu erlangen. Es fördert den Wissensgewinn und unterstützt bei der Aufstellung, Überprüfung, sowie Verfeinerung von Hypothesen. Unser Tool umfasst die Integration von interaktiver Visualisierung und automatisierten Analysekomponenten. Es unterstützt die mit uns kooperierenden Fachexpert_innen der Medizinischen Universität Wien dabei, neue Einblicke in ihre Daten zu erhalten und gleichzeitig ihre Hypothesen zu untersuchen.
de
Radiogenomics refers to the combined study of imaging-derived features, called radiomics and gene sequencing data, called genomics. Challenges in the analysis of radiogenomic data include the size, heterogeneity, and complexity of the datasets. These challenges make the analysis of the available information space tedious for cancer experts and hinder the exploration and sensemaking of patient information. This is further hampered when additional clinical information needs to be included in the analyses. Visual Analytics (VA) combines automated analysis techniques, such as machine learning or statistics, together with interactive visual interfaces. It allows users to gain insights into complex data and make effective decisions. In the context of radiogenomics analysis with respect to clinical data, VA approaches offer promising directions in tumor profiling. However, VA approaches that bridge radiogenomic and clinical data in an interactive and flexible visual framework have not been investigated before. In this work, we enable the integrated exploration and analysis of radiogenomic data and clinical information for knowledge discovery and hypothesis assessment in a large cohort of prostate cancer patients. We handle missingness in the data through imputation techniques and apply unsupervised machine learning for the dimensionality reduction and clustering of the data to facilitate data handling and visualization. As a result, we present an interactive visual interface for two target audiences: cancer experts and biomedical data scientists. Our framework enables cancer experts to gain insights into the data by revealing new patterns or correlations in the datasets. It allows them to interactively assess and refine any hypothesis in mind for the underlying datasets. For biomedical data scientists, our framework offers the possibility to understand the analysis components and interactively explore their impact on the outcome. We evaluate the unsupervised machine learning models through similarity measures such as the silhouette coefficient. To assess the usability of the framework, we perform usage scenarios that we confirm by our cancer experts. The feedback from our domain experts reveals that our framework is a suitable and flexible technique to gain insights into large and heterogenous radiogenomic data with respect to clinical data. It promotes knowledge discovery as well as hypothesis creation, assessment, and refinement. Interacting with the different visualization and analysis components enhances the understanding of the data and the resulting visual representations. Our approach incorporates the integration of interactive visualization and automated analysis components. It supports our collaborating domain experts at the Medical University of Vienna to obtain new insights into their data, while investigating hypotheses at hand.