Prangnawarat, N. (2009). Realizing Web accessibility based on understanding the visual structure of grocery Web portals [Master Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/186098
Web Accessibility; Information Extraction; World Wide Web
de
Web Accessibility; Information Extraction; World Wide Web
en
Abstract:
Diese Masterarbeit beschäftigt sich mit dem Verstehen und der Erkennung der inhaltlichen Struktur von Webseiten in der Supermarkt-Domäne, um sie für Sehbehinderte zugänglich und leichter handhabbar zu machen. Heutzutage sind viele Websites für Blinde und Sehbehinderte nicht zugänglich. Es gibt zwar eine große Anzahl an Screenreadern und anderen Werkzeugen, die Blinden und Sehbehinderten bei der Erkundung des Internets helfen, jedoch werden insbesondere Webapplikationen durch den verstärkten Einsatz von JavaScript und komplizierter Struktur für Screenreader immer schwieriger zu verstehen.<br />Zudem verlangt die Reihenfolge, in der Screenreader Seiten vorlesen bzw.<br />transkribieren, den Benutzern sehr viel Zeit ab, um für sie relevante Inhalte zu finden. Wir möchten Websites zugänglich machen und Webseiten so restrukturieren, daß sehbehinderte Menschen einfacher mit dem Internet umgehen können. Anstelle Extraktionstechniken zu verwenden, die auf der Baumstruktur von HTML aufsetzen, extrahieren wir Daten von Webseiten auf einer visuellen Ebene, der Gestalt-Ontologie, die auch dem entspricht, wie ein sehender Mensch eine Seite wahrnimmt. Die Gestalt-Ontologie wurde von der DBAI-Gruppe am Institut für Informationssysteme der TU Wien entwickelt, basiert auf der Gestalt-Theorie und setzt deren Konzepte ein.<br />Supermarkt-Webseiten werden untersucht, um gemeinsame Konzepte, Strukturen, Funktionen und Interaktionen zu identifizieren. Das Layout von Webseiten wird verstanden und in Blöcke segmentiert; jeder Block wird in eine Inhaltshierarchie klassifiziert, die dem Muster von Titeln und Inhalt entspricht. Elemente, die für Blinde ohne Bedeutung sind, werden eliminiert. Anschließend werden Algorithmen zur Bestimmung des Leseflusses und zur verbesserten Verwendbarkeit mit Screenreadern beschrieben. Ein Teil der Web-Supermarkt-Ontologie faßt den Inhalt von Webseiten in einem semantischen Modell. Inhaltsblöcke gleicher semantischer Kategorien werden gruppiert und beschriftet, um den Benutzern Einstiegspunkte zu offerieren und es ihnen zu ermöglichen, zwischen ihnen herumzuspringen. Zum Beispiel können Benutzer direkt von einem Produktkategorien-Block zu einer Produktliste navigieren ohne alle Kategorien im Block durchkämmen zu müssen. Schließlich werden auch Formular-Interaktionselemente erfaßt, um den Benutzern die Interaktion mit Seiten zu ermöglichen. Die Implementierung eines Prototypen wird beschrieben, und es folgt die Evaluierung von Experimenten, die damit durchgeführt wurden. Das Ergebnis dieser Arbeit ist ein Beitrag zu einem intelligenteren Web-Browser, der dabei hilft, Inhalt und Interaktionen für Screenreader und mobile Geräte adäquat zu repräsentieren.
de
This Master's thesis focuses on understanding online web pages in the grocery domain and recognizing their content structure to make them accessible and easier to explore by visually impaired people. As of today, many websites are not accessible to blind or visually impaired people. There are a large number of screenreaders and other tools that help blind and visually impaired people to explore the Internet.<br />However, due to increased use of JavaScript and complicated structure, Web applications are becoming more difficult to understand by screenreaders. Also, the reading order of screenreaders causes users to spend a long time to find the content that they are looking for. We want to make web sites accessible and to restructure web pages so that visually impaired people can explore the Internet more easily. Instead of using extraction techniques which rely on the tree structure of HTML, we extract data from web pages on the visual level, which corresponds to how a human would perceive a page, using the Gestalt Ontology; an ontology developed by the Database and Artificial Intelligence Group which uses concepts based on Gestalt theory.<br />Grocery web pages are studied to understand the common concepts, structures, functions and interactions. The layouts of web pages are understood and segmented into blocks using the Gestalt Ontology, each block is classified into content hierarchy that reflect the patterns of headers and contents. Elements which do not make sense to blind people are eliminated. Then, algorithms to detect the reading order and improve usability with screenreaders, are described. Part of the online grocery domain ontology captures the content of web pages leveraged to a semantic model. Content blocks of the same semantic are grouped and labelled so that users are offered entry points and are able to jump between them. For example, users can jump from the product categories block to a list of products without exploring all categories in the block. Finally, interaction form elements are also captured so that users are able to interact with the page. The implemented prototype is described and an experimental evaluation is given. The output is a contribution towards a more intelligent web browser that will help screenreaders or mobile devices to represent the content and interaction in a more usable way.