Mustofa, K. (2007). Ontology-based annotation: an approach to bring more semantic metadata in a personal digital memory framework [Dissertation, Technische Universität Wien]. reposiTUm.
Heutzutage koennen reichlich vorhandene Informationen im elektronischen Format gefunden werden. Das World Wide Web stellt die groesste allgemeine elektronische Informationsquelle dar. Umfangreiche Informationen werden in vielen Formaten dargestellt, und sind, entlang verschiedenster Dimensionen, wie etwa:<br />Inhaber, Autor, Themen, Host miteinander verbunden. Analog zur Praxis klassischer Informationen auf Printmedien, sollte das Bilden von Annotationen zu elektronischer Information ermoeglicht werden. Leider sind die meisten Ressourcen auf dem Netz naturgemaess "read-only". Diese Eigenschaft hindert den Benutzern Annotationen direkt auf diesen Ressourcen zu bilden. Die Idee des Semantic Web, welches alle Ressourcen auf dem Netz durch unique identifiers (URI) eindeutig identifiziert, ebnet den Weg fuer die konsistente Konstruktion von Annotationen.<br />Wenn Annotationen auf feinere Granularitaetsstufen angewendet werden sollen, so kann dies dazu f¨uhren, dass man von einem Web der Dokumente zu einem Web der Daten, das durch eine feinere Granularitaet charakterisieert ist, gelangt.<br />SemanticLIFE ist ein Projekt, das die Vision einer moeglichst vollstaendigen Sammlung aller Dokumente bzw. Informationenseinheiten waehrend der gesamten Lebenszeit einer Person zum Inhalt hat. Alle gesammelten Informationseinheiten werden eindeutig Referenzen zugewiesen. Annotationen werden dann auf diese Referenzen bezogen und angewendet.<br />Zwei wichtige Komponenten im semantischen Netz sind Ontologien und Metadaten.<br />Diese Dissertation behandelt eine Praxis des Semantic Web, indem sie den Vorteil der Verwendung von Ontologien, und die Ansammlung von Metadaten entweder durch die Benutzerannotationen oder automatische Extraktion erforscht. Als Bezugssystem wird das System SemanticLIFE herangezogen .<br />Die Dissertation liefert einen Ueberblick ueber den Gebrauch von Ontologien, wo die Informationssuche einschlieich,der Benutzerschnittstelle zur Bildung von Annotationen behandelt wird. Darber hinaus werden viele Beispiele der (halb)- automatischen Metadatenextraktionprozesse dargestellt. Die in dieser Dissertation relevanten Metadaten betreffen Email, Dokumente (PDF, Audio, Bilder, Microsoft Dokument) und Extraktionen aus Google Desktop.<br />Die herkoemmliche Metadatenextraktion stellt nur eine Form des Einspeisungsprozesses dar. In dieser Dissertation werden fuer Benutzerannotationen eine zweite Form der Einspeisung von Metadaten behandelt. Diese Art von Annotationen basiert auf Ontologien und bildet daher eine sinnvolle Erweiterung des Semantic Web.<br />Diese Dissertation soll die Diskussion dar¨uber er¨offnen in wie weit Ontologien eine wichtige Rolle fuer semantische Annotationen in Personal Information Management Systemen wie SemanticLIFE spielen sollten und in wie weit Anforderungen der semantischen Annotationswerkzeuge hier anwendabar sind.<br />
Nowadays abundant information can be found in electronic format.<br />The world wide web seems to turn becoming the biggest electronic information source. Voluminous informations are presented in many formats; they are potentially related or even interconnected one with the others when be viewed from several axis:<br />owner, author, topics, host. Analogous to the practice of on-paper information, making annotation for electronic information should be enabled.<br />Unfortunately, most of the resources on the web, although be shared, are of read-only nature. This characteristic hinders users from making annotation directly on the resources. Making annotation on separate place requires proper reference management.<br />The idea of Semantic Web which considers all resources on the web be possibly represented as unique identifiers (URI) paves the way of making such annotation in a rather uniform way. If the resources on the web are logically interconnected, then the annotation of the resources are connected in such a way.<br />When annotation is applicable to some smaller granularity, such as being made for a part of the resources (like a person name mentioned in a web page), this can lead the web to change from web of documents into web of data.<br />SemanticLIFE is a project which has a vision of collecting documents or information items during the span of someone's lifetime by harvesting the emergence of the Semantic Web technology. All of the information items collected are assigned unique references. The annotation are then applied by using this references.<br />Two of the role players in Semantic Web are the ontology and metadata.<br />This thesis discusses the practice of the Semantic Web by exploring the advantage of using ontology, the collection of metadata either through user annotations or automatic extraction based on the SemanticLIFE framework. The discussion includes the overview of the ontology usage in information traversal, user interface creation and annotation making. Besides, many examples of (semi)-automatic metadata extraction processes are presented in the framework or relationships with the use of ontology. Among the metadata are data about web page collected during web browsing session, email, documents (PDF, audio, images, Microsoft Document), and Google Desktop. As metadata extraction is only one of metadata collection processes, the thesis discloses also the user annotation process as another way of metadata collection. The annotation is so far as kept in the view of Semantic Web vision by implementing ontology-based annotation.<br />The thesis concludes with the discussion on how far the ontology plays its roles in support of semantic annotation within the SemanticLIFE framework and how far the requirements of the semantic annotation tools are followed.