Benevolenskiy, A. (2009). Extending an ontology by extraction of concepts from Wikipedia [Diploma Thesis, Technische Universität Wien]. reposiTUm.
Web data extraction/Semantic web/Ontology updating
Im Zuge dieser Diplomarbeit werden die Möglichkeiten der Konzeptextraktion aus der freien Online-Enzyklopädie Wikipedia behandelt. Auf Basis des Breadth-First Algorithmus werden mit verschiedenen Ansätzen thematische Kategorien Wikipedias durchsucht, analysiert und neue Vorschläge für die Aufnahme in die TechScreen Ontologie generiert. Schwerpunkte dieser Forschungsarbeit sind: 1) Erstellung einer Ontologie auf Basis von Vorschlägen von AnwenderInnen. 2) Analyse von modernen Ansätzen zur Konzeptextraktion und Generierung von Ontologien und Evaluierung der Ergebnisse. 3) Entwicklung eines Dienstes zur Suche in Wikipedia. 4) Analyse der verwendeten Suchalgorithmen. 5) Entwicklung einer Schnittstelle zur Erweiterung einer bestehender Ontologie um gefundene Konzepte. 6) Evaluierung und Diskussion der Ergebnisse aus verschiedenen Versuchsanordnungen.
In this research the possibilities of concept extraction from Wikipedia are considered. This involves the breadth-first search algorithm through the category's system of Wikipedia and different approaches for concept analysis and recommendations for the TechScreen ontology. Emphases of investigation of this master thesis: 1)Creating the base ontology for the system based on users contributions; 2)Analysis of the state-of-the-art of different approaches for extraction concepts and deriving ontologies; 3)Designing the service that searches in Wikipedia; 4)Analysis of the search method used in the system; 5)Designing the mechanism of adding new concept to the ontology; 6)Evaluation of solution and some test experiments.