Roth, R. O. (2018). Reproduzierbarkeit via ontologischer Darstellung der Provenance [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2018.50731
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2018
-
Number of Pages:
84
-
Keywords:
Reproduzierbarkeit; Prozesskontext; Provenance
de
Reproducibility; Process Context Information; Provenance
en
Abstract:
Die Fähigkeit, Ergebnisse zu reproduzieren, welche aus Computerrecherche resultieren, ist unerlässlich für den Erfolg und die Glaubwürdigkeit des Faches. Diese wird jedoch durch zunehmend größer werdende Datensätze und verschiedenster Kombinationen von Hardware und Software Umgebungen deutlich erschwert. Bereits existierende Lösungen fokussieren darauf Workflows erneut auszuführen, durch welche die ursprünglichen Ergebnisse erzielt wurden. Allerdings sind diese Lösungen begrenzt, da sie sich nur mit limitierten Prozessausführungen beschäftigen. Diese Arbeit befasst sich damit dieses Problem durch die kontinuierliche und autonome Erfassung der systemweiten Provenance zu beheben und dies in einer ontologischen Form darzustellen. Auf diese Weise, implementieren wir eine vollständige Systemlösung mit welcher Benutzer ihre Recherchen ausführen können, ohne den zusätzlichen Mehraufwand der manuellen Verfolgung und Manipulation dieser Informationen in Kauf nehmen zu müssen. In dieser wissenschaftlichen Arbeit, beschreiben wir unseren Lösungsvorschlag dies zu erzielen und die Technologien die ihn umfassen. Zusätzlich veranschaulichen wir zwei Methoden mittels welcher Benutzer die resultierende Ontologie visualisieren und mit ihr interagieren können. Schlussendlich, wird untersucht inwieweit unsere vorgeschlagene Lösung die erforderlichen Informationen bereitstellt um die Reproduzierbarkeit von Ergebnissen der Computerrecherche sowie ihrer zugehörigen Anwendungen zu ermöglichen.
de
The ability to reproduce results stemming from computational research is paramount to the field’s success and its credibility. Making this task difficult are the increasingly large data sets and assorted combinations of hardware and software environments being employed by researchers. Existing solutions focus on re-executing the workflows from which the original results were obtained. However, these solutions are limited in the sense that they address only confined process executions. This work aims to rectify this problem by continuously and autonomously capturing system wide provenance and representing it in ontological form. In doing so, we implement a complete system solution on which users can perform their research without the additional overhead of having to manually track and manipulate this information themselves. In this paper, we explore our proposed solution and the technologies it is comprised of. Additionally, we illustrate two methods in which users can visualize and interact with the resulting ontology. Finally, we examine to what extent our proposed solution provides the necessary information to better enable the reproducibility of computational research results and its viable applications.