Westermann, G. U. (2004). PTDOM : a persistent typed document object model for the management of MPEG-7 media descriptions [Dissertation, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-12712
MPEG-7 is a promising metadata standard for the extensive description of multimedia content. The amount of MPEG-7 media descriptions available is continuously increasing and adequate database support for the management of larger numbers of such descriptions is gaining more and more importance. Since MPEG-7 media descriptions essentially are XML documents following media description schemes defined with an extension of XML Schema named MPEG-7 DDL, employing XML database solutions for their management is an idea that lies close at hand. It is the aim of the present thesis to explore this idea in detail. It develops an extensive set of requirements that should be met by any XML database solution employed for the management of MPEG-7 media descriptions. Against these requirements, it thoroughly examines 21 representative state-of-the-art XML database solutions: native XML database solutions as well as XML extensions of traditional database management systems -- commercial systems, research prototypes, as well as open source projects. The examination unveils considerable deficiencies of existing XML database solutions that seriously limit their suitability for the management of MPEG-7 media descriptions. One of the major problems is that the analyzed solutions largely ignore schema and type information that is available within media description schemes for the storage of MPEG-7 media descriptions. As a consequence, large amounts of complex non-textual data typically contained in MPEG-7 media descriptions, such as frequency spectrums, color distributions, and object motion vectors, are inadequately stored and represented as text hindering reasonable access to these data and their appropriate processing. Facing these problems, this thesis sets out to develop an XML database solution which suits the needs of the management of MPEG-7 media descriptions. In this regard, it makes several important contributions: Firstly, the thesis proposes the Typed Document Object Model (TDOM) as a generic data model for XML documents that pays particular attention to the representation of non-textual contents. TDOM provides the notion of typed representations to treat the contents of an XML document in a way that is adequate to the respective content type specified in the schema definition to which the document complies. On the basis of TDOM, applications can reasonably access and process even complex non-textual data contained in MPEG-7 media descriptions. Secondly, the thesis proposes typing automata as a formalism for the intermediary representation of schema definitions for XML documents that is independent of any particular XML schema definition language. A typing automaton is not only able to validate TDOM-represented XML documents against a schema definition; it is also able to infer and produce appropriate typed representations of the contents of these documents. As typing automata can be extended up to the expressiveness of MPEG-7 DDL, they constitute an adequate foundation for the intermediary representation of arbitrary MPEG-7 media description schemes. Thirdly, the thesis describes the implementation of the Persistent Typed Document Object Model (PTDOM), a prototypical XML database solution. PTDOM features an MPEG-7 DDL-compliant schema catalog that is based on typing automata and a document management component that employs TDOM for the representation of XML documents. Using the schema catalog, PTDOM takes advantage of TDOM for the typed storage of XML document contents. Furthermore considering its profound support for datatypes, user-defined routines, and index structures and its profound extensibility, PTDOM satisfies most of the requirements for the management of MPEG-7 media descriptions and is thus highly suited for this purpose. The impact of this thesis is not just limited to the domain of MPEG-7. Since TDOM, typing automata, and the implemented prototype are usable for the representation and management of arbitrary XML documents in principle, the thesis lays the foundations for a new generation of general XML database solutions that exploit available schema and type information for the adequate storage of XML documents. The availability of such solutions is very desirable in any application domain in which data-centric XML documents with large amounts of non-textual data are encountered.
en
MPEG-7 ist ein vielversprechender Metadatenstandard, der eine umfassende Beschreibung multimedialer Inhalte ermoeglicht. Mit einer zunehmenden Zahl an verfuegbaren MPEG-7-Medienbeschreibungen wird eine angemessene Datenbankunterstuetzung zur Verwaltung solcher Beschreibungen immer wichtiger. Da MPEG-7-Medienbeschreibungen im wesentlichen XML-Dokumente sind, welche Medienbeschreibungsschemata folgen, die in einer Erweiterung der XML Schema-Sprache namens MPEG-7 DDL verfasst sind, ist es ein naheliegender Gedanke, XML-Datenbankloesungen fuer diese Aufgabe einzusetzen. Die vorliegende Dissertation will diesen Ansatz naeher untersuchen. Sie stellt zunaechst einen ausfuehrlichen Anforderungskatalog auf, der von einer zur Verwaltung von MPEG-7 Medienbeschreibungen eingesetzten XML-Datenbankloesung erfuellt werden sollte. Gegen diese Anforderungen werden 21 repraesentative, dem Stand der Technik entsprechende XML-Datenbankloesungen gruendlich geprueft: native XML-Datenbankloesungen und XML-Erweiterungen klassischer Datenbank-Management-Systeme -- kommerzielle Systeme, Forschungsprototypen ebenso wie Open-Source-Projekte. Die Untersuchung foerdert betraechtliche Defizite heutiger XML-Datenbankloesungen zutage, die ernsthaft deren Eignung zur Verwaltung von MPEG-7-Medienbeschreibungen beeintraechtigen. Ein zentrales Problem der betrachteten Loesungen ist, dass sie groesstenteils die in Medienbeschreibungsschemata vorhandene Schema- und Typinformation bei der Speicherung von MPEG-7-Medienbeschreibungen ignorieren. Als Konsequenz werden die grossen Mengen nicht-textueller Daten wie bspw. Frequenzspektren, Farbverteilungen und Bewegungsvektoren von Bildobjekten, die ueblicherweise in MPEG-7-Medienbeschreibungen enthalten sind, unzulaenglicherweise als Text gespeichert. Dies behindert den sinnvollen Zugriff auf diese Daten und deren Verarbeitung. Angesichts solcher Probleme ist es das Ziel dieser Arbeit, eine XML-Datenbankloesung zu entwickeln, welche den Anforderungen zur Verwaltung von MPEG-7-Medienbeschreibungen besser genuegt. Diesbezueglich leistet die Arbeit drei wesentliche Beitraege: Erstens stellt sie das Typed Document Object Model (TDOM) vor, ein generisches Datenmodell fuer XML-Dokumente mit besonderem Augenmerk auf die Repraesentation nicht-textueller Inhalte. TDOM bietet sogenannte typisierten Repraesentationen zur adequaten Darstellung von XML-Dokumentinhalten gemaess ihres jeweiligen, in der Schemadefinition des Dokuments spezifizierten Typs. Auf Basis von TDOM koennen Anwendungen auch auf nicht-textuelle Daten innerhalb von MPEG-7-Medienbeschreibungen geeignet zugreifen und diese typkonform verarbeiten. Zweitens stellt diese Arbeit Typisierungsautomaten vor, ein sprachunabhaengiger Formalismus zur Zwischenrepraesentation von Schemadefinitionen fuer XML-Dokumente. Ein Typisierungsautomat ist nicht nur in der Lage, mittels TDOM dargestellte XML-Dokumente gegen die von ihm repraesentierte Schemadefinition zu validieren. Er ist ebenfalls in der Lage, geeignete typisierte Repraesentationen der Inhalte dieser Dokument herzuleiten und zu erzeugen. Da der Mechanismus der Typisierungsautomaten bis zur Ausdrucksstaerke von MPEG-7 DDL erweiterbar ist, stellt er eine adequate Grundlage zur Zwischenrepraesentation beliebiger MPEG-7-Medienbeschreibungsschemata dar. Drittens beschreibt die Arbeit die Implementierung des Persistent Typed Document Object Model (PTDOM), einer prototypischen XML-Datenbankloesung. Diese verfuegt ueber einen MPEG-7 DDL-konformen Schemakatalog, der Typisierungsautomaten verwendet, und eine Dokument-Management-Komponente, die auf TDOM zur Repraesentation von XML-Dokumenten aufbaut. Unter Verwendung des Schemakatalogs nutzt PTDOM die Vorteile von TDOM zur typgerechten Speicherung von XML-Dokumentinhalten. Beruecksichtigt man zudem die weitreichende Unterstuetzung von Datentypen, benutzerdefinierten Routinen und Indexstrukturen sowie wie seine durchgehende Erweiterbarkeit, so stellt PTDOM eine XML-Datenbankloesung dar, welche die meisten Anforderungen zur Verwaltung von MPEG-7-Medienbeschreibungen erfuellt und sich deshalb hervorragend zu diesem Zweck eignet. Die Relevanz der Beitraege dieser Dissertation ist nicht nur auf das Gebiet von MPEG-7 beschraenkt. Da TDOM, Typisierungsautomaten und der implementierte Prototyp prinzipiell zur Verwaltung beliebiger XML-Dokumente verwendbar sind, legt diese Arbeit auch einen Grundstein fuer eine neue Generation allgemeiner XML-Datenbankloesungen, die verfuegbare Schema- und Typinformation zur Speicherung von XML-Dokumenten nutzen. Die Verfuegbarkeit solcher Loesungen ist in all jenen Anwendungsgebieten aeusserst wuenschenswert, in denen datenzentrierte XML-Dokumente mit grossen Anteilen nicht-textueller Daten auftreten.