Wapp, M. (2019). Performance of paradigms for storing and querying multidisciplinary engineering models [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2019.58145
E194 - Institut für Information Systems Engineering
-
Date (published):
2019
-
Number of Pages:
101
-
Keywords:
Data storage; benchmark; performance
en
Abstract:
Im Bereich der multidisziplinären Produktionssystemplanung werden Daten zwischen den verschiedenen beteiligten Ingenieuren ausgetauscht. Dieser Datenaustausch muss möglichst effektiv und effizient sein, um einen erfolgreichen Projektablauf zu gewährleisten. Gewöhnlich wird dieser Datenaustauschprozess von multidisziplinären Modelldaten, wie etwa Automation Markup Language (AML), mit Technologien wie E-Mail durchgeführt. AML ist ein maschinen-lesbares Datenaustauschformat, das auf der Extensible Markup Language (XML) basiert und von verschiedensten Ingenieursdisziplinen verwendet werden kann. Historisch betrachtet war AML als reines Austauschformat geplant, erhält aber immer mehr Aufmerksamkeit als Modell um ingenieurstechnische Information zu beschreiben. Dies führt dazu, dass die Darstellung und Speicherung von AML in XML in Hinsicht auf Zugreifbarkeit und Lesbarkeit oft nicht ausreicht. Deshalb ist es notwendig, passende Speichertechnologien zu finden, um AML Modelle effizient persistieren zu können. Diese Arbeit greift dieses Problem auf und schlägt eine Lösung die Einsicht in Datenspeicherungsmöglichkeiten für multidisziplinäre Modelldaten ermöglicht, vor. Weiters werden zwei Datenbanklösungen für AML Modelldaten für das Speichern und Auslesen der Daten evaluiert. Um diese Performanzevaluierung durchzuführen, werden folgende Schritte ausgeführt. Zu Beginn werden zwei Datenspeicherungsparadigmen und -lösungen basierend auf Kriterien, welche sich Multidisciplinary Engineering (MDE) Modelldaten ergeben, ausgewählt. Danach wird eine Softwarearchitektur vorgeschlagen, die es ermöglicht, Datenbanklösungen flexibel auszutauschen und AML Modelldaten zu speichern und auszulesen. Zusätzlich wird ein Prozess definiert, welcher in der Durchführung der Evaluierung der zwei gewählten Datenspeicherungslösungen angewendet wird. Die gewählten Datenbanken sind BaseX als XML-basierte und Neo4J als graph-basierte Datenspeicherungslösung. Die Ergebnisse der Evaluierung werden analysiert und diskutiert, um einen erweiterten Einblick zu bekommen, welcher definiert, welche Datenbank unter welchen Konditionen für AML Modelldaten geeignet ist. Im Detail ergeben sich daraus Erkenntnisse, die für die Entscheidung welche der Datenbanken besser geeignet ist, genutzt werden können. Die Analyse der Ergebnisse zeigt, dass BaseX für das Erzeugen, Aktualisieren und Löschen und Neo4J für lesende Operation besser geeignet ist. Es wird festgestellt, dass es keine klare Empfehlung gibt, welche der beiden Datenbanken in multidisziplinären Projekten verwendet werden soll, da immer die situationsabhängige Nutzung im Projekt beachtet werden muss. Die Erkenntnisse der Arbeit können verwendet werden, um Datenbanken für das Speichern und Auslesen von AML Modelldaten zu ermitteln.
de
In Multidisciplinary Engineering (MDE), projects rely on the effective and efficient coordination and collaboration of participating project members from various engineering disciplines such as electrical and mechanical engineering. Therefore, an effective and efficient exchange of engineering information and artifacts is vital for a successful project execution. Usually, engineers exchange MDE data such as Automation Markup Language (AML) files by sharing them via common data sharing processes such as email. AML is a machine-readable data format which is based on the Extensible Markup Language (XML) allowing engineers from various disciplines to describe engineering data. Historically, AML was only meant as a data exchange format, but nowadays receives more and more attention as a general model to describe engineering information. This, however, leads to the problem that the representation and storage of AML as XML file is often insufficient in the sense of, e.g., querying or access control. Hence, it is important to find suitable storage technologies to persist the AML engineering model efficiently. This thesis addresses this problem and proposes a solution to compare and evaluate storage solutions for MDE model data. Moreover, the thesis evaluates two selected data storage solutions for AML model data for their storing and querying performance. In order to carry out this performance evaluation, the following steps are executed. At first, two data storage paradigms and solutions are selected based on elicited criteria from MDE model data and related work. Then, a prototypical layered software architecture is designed and built which allows for a flexible exchange of the underlying data storage solution as well as storing and querying of AML model data. Furthermore, a performance evaluation process is established and used to execute a performance evaluation benchmark on the two selected data storage solutions, i.e. BaseX as an XML data store and Neo4J as a graph data store. The results of the evaluation are analyzed and discussed in order to provide deeper insight into the capabilities of the data storage paradigms to store and query AML model data. In particular, the results provide findings which can be used to determine whether one of the selected data storage solutions is better suited under certain conditions. The analysis of the performance results showed that BaseX performs better for use cases which involve create, update and delete operations while Neo4J performs better for use cases involving read operations. In conclusion, a clear recommendation for MDE projects using AML as a data exchange format cannot be provided as it depends on the intended usage of the data storage solution. Yet, the gained insight can be used to determine a data storage solution for a MDE project.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers