Schreder, B. (2013). Legacy datasource interoperability for the Semantic Web [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2013.21702
interoperability; semantic mediation; legacy data sources; schema lifting; linked data; heterogeneous data sources
en
Abstract:
Diese Diplomarbeit behandelt das Problem der Integration von existierenden Datenquellen mit anderen Applikationen und Systemen innerhalb eines Unternehmens. Die Integration heterogener Systeme und Datenquellen stellt eine der zentralen Herausforderungen in Bereichen wie beispielsweise der Enterprise Application Integration dar. Diese Arbeit untersucht einen möglichen Lösungsweg dieses Problems, unter Verwendung semantischer Technologien. Abbildungen zwischen Ontologien, welche die verschiedenen Datenquellen beschreiben, werden genutzt um die Integration der unterschiedlichen Systeme zu ermöglichen. Die Mediation zwischen Ontologien stellt einen flexiblen und leicht wartbaren Weg dar, um unterschiedliche Datenquellen zu verbinden.<br />In dieser Arbeit werden zunächst verschiedene Mediationstechniken, welche auf semantischen Technologien basieren, untersucht. Unter Berücksichtigung verschiedener Anforderungen werden Entwurf und Umsetzung spezieller Mechanismen für die Integration heterogener Datenquellen geschildert, inklusive der dazu notwendigen Verfahren zur Extraktion und Normalisierung der jeweiligen ursprünglichen Datenmodelle. Eine Implementierung dieser Methoden als eigenständige Transformationsdienste wurde durchgeführt und als Teil eines Mediationstools realisiert, welches auf dem Mapping Frameworks MAFRA der Universität Karlsruhe basiert. Relationale Datenbanken und XML Dokumente sind hierbei die zentral unterstützten Datenformate.<br />Verschiedene Fallstudien und Anwendungsbeispiele für diese Transformationsdienste werden geschildert, und die Anwendbarkeit sowie die Flexibilität dieser Dienste werden evaluiert.<br />
de
This master thesis discusses the problem of integrating legacy data sources with other connected applications and data sources, one of the key issues of processes such as Enterprise Application Integration. This work examines one possible solution to this problem by leveraging semantic technologies, specifically, by mapping between ontologies which describe the legacy data sources.<br />This solution necessitates the mediation and alignment between a data source's or application's data format and the format prescribed by the central, shared ontology. Utilizing ontologies is assumed to provide a flexible and light-weight solution to the data integration problem.<br />In this thesis several semantic mediation approaches are surveyed, including the requisite preprocessing steps such as schema lifting and normalization. Using the Mapping Framework of the University of Karlsruhe as the underlying architecture, a comprehensive mediation tool has been developed, which supports the creation and execution of mappings between different ontologies. Several new methods of importing legacy data sources, such as relational databases and XML data, are developed and introduced as new services for the mediation tool. Finally, a number of case studies and application scenarios for these mediation services are detailed and their applicability and flexibility are evaluated.