<div class="csl-bib-body">
<div class="csl-entry">Dabernig, J. (2013). <i>Geocluster: server-side clustering for mapping in Drupal based on Geohash</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/159731</div>
</div>
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/159731
-
dc.description
Zsfassung in dt. Sprache
-
dc.description
http://dasjo.at/thesis
-
dc.description.abstract
Diese Diplomarbeit erforscht die technische Möglichkeit zur Erstellung einer Geohash- basierten, server-seitigen Cluster-Lösung für Kartenanwendungen in Drupal. Land- karten visualisieren Daten auf intuitive Weise. Die Performanz und Lesbarkeit von digitalen Kartenanwendungen nimmt jedoch ab, sobald umfangreiche Datenmengen dargestellt werden. Mittels JavaScript gruppiert client-seitiges Clustering überlappende Punkte zwecks Lesbarkeit, ab einer gewissen Datenmenge verlangsamt sich jedoch die Verarbeitungsgeschwindigkeit und die Netzwerkverbindung stellt einen Flaschenhals dar. Die zentrale Forschungsfrage ist daher: Implementierung von server-seitigem Clustering in Echtzeit für bis zu 1.000.000 Punkten innerhalb einer Sekunde und die Visualisierung von Clustern auf einer interaktiven Karte.<br />Clustering ist ein Verfahren zur automatisierten Gruppierung in Datenbeständen. Algorithmen der Clusteranalyse werden evaluiert um einen geeigneten Algorithmus für das server-seitige Clustering auf Landkarten zu schaffen. Der entworfene Algorithmus nutzt Geohash zur Erstellung eines hierarchischen Spatialindex, welcher das Clustering unterstützt.<br />Geohash kodiert Latitude/Longitude Koordinaten in Zeichenketten mit räumlich-hierarchischer Struktur unter Beihilfe der Morton-Kurve. Durch Einsatz des Geohash-basierten Index kann die Zeitkomplexität des Echtzeit-Clusterings drastisch reduziert werden.<br />3 Varianten des Clustering Algorithmus wurden als Geocluster Modul für das Content Management System und Framework Drupal implementiert. Die erste, PHP-basierte Variante skaliert nicht. Die zweite Variante mittels MySQL konnte in Tests bis 100.000 Punkte unter 1 Sekunde clustern.<br />Schlussendlich skaliert das Clustering mit Apache Solr bis über 1.000.000 Elemente und erfüllt somit das primäre Forschungsziel.<br />Neben der Performance-Analyse wurden auch Techniken zur Visualisierung von Clustern auf Karten erforscht und im Rahmen einer explorativen Studie verglichen. Verschiedene Kartentypen, als auch Visualisierungsformen von Clustern werden präsentiert. Die Evaluierung klassifiziert die Techniken zwecks der Darstellung auf Karten und bildet somit die Grundlage für die Diskussion der Geocluster-Implementierung.<br />
de
dc.description.abstract
This thesis investigates the possibility of creating a server-side clustering solution for mapping in Drupal based on Geohash.<br />Maps visualize data in an intuitive way. Performance and readability of digital mapping applications decreases when displaying large amounts of data. Client-side clustering uses JavaScript to group overlapping items, but server-side clustering is needed when too many items slow down processing and create network bottle necks. The main goals are:<br />implement real-time, server-side clustering for up to 1,000,000 items within 1 second and visualize clusters on an interactive map.<br />Clustering is the task of grouping unlabeled data in an automated way.<br />Algorithms from cluster analysis are researched in order to create an algorithm for server-side clustering with maps. The proposed algorithm uses Geohash for creating a hierarchical spatial index that supports the clustering process. Geohash is a latitude/longitude geocode system based on the Morton order. Coordinates are encoded as string identifiers with a hierarchical spatial structure. The use of a Geohash-based index allows to significantly reduce the time complexity of the real-time clustering process.<br />Three implementations of the clustering algorithm are realized as the Geocluster module for the free and open source content management system and framework Drupal. The first algorithm implementation based on PHP, Drupal's scripting language, doesn't scale well. A second, MySQL-based clustering has been tested to scale up to 100,000 items within one second. Finally, clustering using Apache Solr scales beyond 1,000,000 items and satisfies the main research goal of the thesis.<br />In addition to performance considerations, visualization techniques for putting clusters on a map are researched and evaluated in an exploratory analysis. Map types as well as cluster visualization techniques are presented. The evaluation classifies the stated techniques for cluster visualization on maps and provides a foundation for evaluating the visual aspects of the Geocluster implementation.<br />
en
dc.language
English
-
dc.language.iso
en
-
dc.subject
Clusteranalyse
de
dc.subject
Web mapping
de
dc.subject
Geohash
de
dc.subject
Drupal
de
dc.subject
Clustering
de
dc.subject
Kartographie
de
dc.subject
Informationsvisualisierung
de
dc.subject
Freie Software
de
dc.subject
cluster analysis
en
dc.subject
web mapping
en
dc.subject
Geohash
en
dc.subject
Drupal
en
dc.subject
clustering
en
dc.subject
cartography
en
dc.subject
information visualization
en
dc.subject
open source
en
dc.title
Geocluster: server-side clustering for mapping in Drupal based on Geohash
en
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.contributor.affiliation
TU Wien, Österreich
-
tuw.thesisinformation
Technische Universität Wien
-
dc.contributor.assistant
Anjomshoaa, Amin
-
tuw.publication.orgunit
E188 - Institut für Softwaretechnik und Interaktive Systeme