Momeni Roochi, E. (2009). Semantic web-based integration of heterogeneous e-commerce product and service descriptions [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/186553
Eine unglaubliche Menge an Informationen von Millionen verschiedenen, öffentlichen Webportalen ist praktisch von jedem Computer auf der Welt virtuell zugänglich. Wir können das als ein enormes Informations-Repository betrachten, das auf e-commerce fokussierten Unternehmen einen signi kanten ökonomischen Wert liefert. Allerdings sind mit der Verwendung dieser Informationen mehrere massgebliche Probleme verbunden. Es sind dies: (I) Die Informationen werden in unterschiedlichen, nicht automatisiert verarbeitbaren Formaten veröffentlicht (II) Es besteht ein Mangel an Diensten, die Informationen aus verschiedenen Quellen in einer homogenen, verarbeitbaren Struktur speichern (III) Zugängliche Datasets werden nur selten vor dem Hintergrund eines e-commerce Konzepts zur Verfügung gestellt, was deren Verwendung durch e-commerce Applikationen wiederum schwierig macht. Das primäre Ziel dieser Diplomarbeit ist es, die Methodik und die Komponenten für die Kombination und Integration von Informationen aus verschiedenen Web Datenquellen in automatisiert verarbeitbare Datensätze auf Basis von geeigneten e-commerce Ontologien vorzustellen.<br />Die Primärkomponente ist ein intelligenter Matching Agent für die Suche von produktspezischen Informationen aus mehreren verfügbaren Quellen.<br />Weitere benötigte Komponenten sind so genannte Wrapper, die die Daten aus den verschiedenen Quellen in ein automatisiertes Datenverarbeitungsformat transformieren. Jede Produktkategorie in einem RDF Dataset wird einer individuellen Ontologie entsprechend erstellt, die wiederum auf einer Hauptontologie basiert. Das Beziehungsge echt zwischen den Geschäfts entit äten für jede Produktkategorie wird durch URIs strukturiert, die auf der entsprechenden Ontologie basieren. Um die angebotene Methodik zu demonstrieren, wird der Wrapping- und Matching-Prozess anhand des Beispiels zweier bedeutender öffentlicher Datasets im Detail diskutiert.<br />
de
Incredible volumes of information from millions of public Web portals are readily accessible from virtually any computer in the world. We can see this as an enormous repository of information, which brings signifficant business value for companies dedicated to e-commerce activities. However, the main problems with using this information are (I) information is published in different, not machine-processable formats, (II) lack of services that match and store information from various sources in a homogenous processable structure, and (III) accessible datasets are rarely provided with e-commerce concepts in mind, which makes them difficult to use by e-commerce applications.<br />The main goal of this thesis is to investigate the methodologies and components required for combining and integrating information into machine-processable dataset from dierent Web data sources, based on suitable e-commerce ontologies. The main proposed component is an intelligent matching agent for finding information about a particular product from various available sources, as well as wrappers that extract the data from different sources to a machine-processable format. Each product category in an RDF dataset is created according to an individual ontology, which in turn is based on a main ontology. Relations between all business entities for each product category are described by URIs, which are also taken from a related ontology. In order to demonstrate proposed methodology, the process of wrapping and matching the data from two major public datasets will be discussed in detail as an example.