<div class="csl-bib-body">
<div class="csl-entry">Erhart, O. (2017). <i>Grooviler: ein Visual Analytics Ansatz zur Bereinigung von Qualitätsproblemen von Zeit-Orientierten Daten</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2017.32206</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2017.32206
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/7392
-
dc.description.abstract
In wissenschaftlichen Disziplinen, wie Klimaforschung oder Elementarteilchenphysik enstehen oft große Datenmengen von Zeitreihen. Um diese Daten für explorative Analyse oder Data Mining verwenden zu können, muss die Datenqualität und -integrität gegeben sein. Mithilfe von Data Cleansing können unerwünschte und irreführende Datenanomalien bereinigt werden. Data Profiling hilft dabei Datenqualitätsprobleme zu entdecken und darzustellen. Bestehende Data Profiling Tools bieten Mechanismen zur Identifizierung von Datenqualitätsproblemen an, unterstützen jedoch keine zeit-orientierten Datenqualitätsprobleme. Meist liefern diese Werkzeuge nur textuelle Statistiken über das Datenset und bieten keine Interaktionsmöglichkeiten an. Auf der technischen Universität Wien wird bereits ein Prototyp entwickelt der fehlerhafte Datensätze erkennt, teilweise bereinigt oder kennzeichnet. Diese Arbeit handelt vom Design, Implementierung und Evaluierung eines prototypischen Moduls, bereits festgestellte Fehler darzustellen. Zusätzlich sollen mithilfe von interaktiven Visualisierungen weitere Datenqualitätsprobleme entdeckt werden können.
de
dc.description.abstract
Scientific disciplines like climate research or high-energy physics build up large repositories of time series data. In order to process big data sets for data mining or explorative analysis, data integrity and quality has to be guaranteed. To increase data quality, Data Cleansing is performed to remove unwanted and misleading data anomalies before executing the analytical process. Data Profiling also helps to identify and communicate data quality problems, which can then be cleansed. Existing Data Profiling tools provide mechanisms to identify invalid data but without prior focus on time-oriented data. Often those tools are limited providing simple statistics about a given data set and do not offer interactive operations. There is already a prototype being developed at the Technical University of Vienna which detects, partially cleanses, and annotates erroneous data entries. This thesis is about designing, implementing and evaluating a prototypical module of this prototype, visualizing detected errors and providing visualizations to find further data problems with a focus on time-oriented quality checks.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
data cleansing
de
dc.subject
time-oriented data
de
dc.subject
interactive visualization
de
dc.subject
visual cleansing
de
dc.title
Grooviler: ein Visual Analytics Ansatz zur Bereinigung von Qualitätsproblemen von Zeit-Orientierten Daten
en
dc.title.alternative
Grooviler: a visual analytics approach to communicate and identify time-oriented data quality problems
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2017.32206
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Oliver Erhart
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
dc.contributor.assistant
Gschwandtner, Theresia
-
tuw.publication.orgunit
E188 - Institut für Softwaretechnik und Interaktive Systeme