Sallinger, E. (2014). Foundations of information integration : analyzing, managing and reasoning about schema mappings [Dissertation, Technische Universität Wien]. reposiTUm.
Die Menge an Information, die in Datenbanken und im Internet zur Verfügung steht, nimmt stetig zu, oder, wie es manche gerne ausdrücken, wir stehen am Beginn der Ära von "Big Data". Die Quelle dieser Information ist vielfältig, unter anderem stammt sie von Unternehmen, privaten Organisationen, Universitäten und Regierungen. Der Zugriff auf Daten, die aus verschiedenen Quellen integriert werden, wird immer wichtiger für Entscheidungsträger auf allen Ebenen - Personen, Unternehmen und Regierungen gleichermaßen. Daher ist es nicht verwunderlich, dass Informationsintegration eines der Top-Themen in der Datenbankforschung der letzten Dekade war und weiterhin ein Kernthema ist. Der Bereich der Datenbanken hat in den letzten Jahren erstaunliche Fortschritte im Bereich der Informationsintegration gemacht. Eine starke formale Basis für Informationsintegration wurde durch das Konzept der "Schema Mappings" gelegt - das sind Spezifikationen der Beziehung zwischen Datenbanken. Um effiziente Systeme auf der Basis von Schema Mappings zu entwickeln ist die Analyse und Optimierung von Schema Mappings eine essentielle Aufgabe. Darüber hinaus ensteht aus der stetig zunehmenden Anzahl und Komplexität von Schema Mappings das starke Bedürfnis für das Management von Schema Mappings. Zusammen genommen bilden die Analyse, Optimierung und das Management von Schema Mappings den Kern des vielfältigen Felds des "Reasoning" über Schema Mappings. In dieser Dissertation nehmen wir uns der systematischen Studie von Analyse, Management und dem Reasoning über Schema Mappings an. Wir tragen wesentlich zum Stand der Technik bei und vervollständigen das Wissen über viele Bereiche klassischer Schema Mappings. Wir stellen ebenso neue Konzepte jenseits klassischer Schema Mappings vor und eröffnen damit neue Bereiche der Forschung. Dadurch zeigen wir, dass Schema Mappings eine solide Grundlage für Informationsintegration bilden und einer der Schlüssel dafür sind, die stetig zunehmende Informationsvielfalt in der Zukunft zu nützen.
Today, we are witnessing a rapid growth of information available in databases and on the web or, as some like to call it, we are the beginning of the era of "big data". The sources of this information are manifold, among them companies and private organizations, universities and governments. Access to data integrated from many different sources is becoming increasingly important for decision makers at all levels - individual persons, companies, and governments alike. It is thus not surprising that information integration has been on top of the agenda of database research over the past decade, and continues to be a key issue. The database community has recently made remarkable progress in the area of information integration. Strong formal foundations have been laid for many aspects of information integration through the concept of schema mappings, which are high-level descriptions of the relationship between databases. For building effective systems based on schema mappings, analyzing and optimizing schema mappings is an essential task. Beyond that, with the number and complexity of schema mappings growing, there is a strong need for managing schema mappings. Taken together, the areas of analyzing, optimizing and managing schema mappings form the core of the diverse field of reasoning about schema mappings. In this thesis, we embark on a systematical study of analyzing, managing and reasoning about schema mappings. We advance the state of the art, completing the picture for many areas of classical schema mappings. We also introduce a number of new concepts that go beyond classical schema mappings, opening up new lines of research. In doing this, we show that schema mappings offer a solid foundation for information integration and promise to be one of the keys for taking advantage of the rapidly growing amount of information in the future.