Redl, P. (2022). Creation and evaluation of a database for the Austrian precipitation sampling network [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2022.100323
In dieser Arbeit wird die Implementierung einer Datenbank für Niederschlagsproben aus dem Österreichische Messnetz zur Nassen Deposition präsentiert und mögliche Anwendungen dieser Datenbank gezeigt.Die Datenbank enthält alle verfügbaren Proben des Messnetzes seit seinem Start im Jahr 1984. Ein Flaggensystem wurde eingerichtet, um den laufenden Datenprüfungsprozess abzubilden. Der neuen Arbeitsablauf gewährleistet Datenintegrität von der Messung bis zum Bericht. Der zusammengetragene Datensatz ermöglichte die Erstellung eines Random Forest Klassifikators, welcher die aktuellen Standards der Datenüberprüfung auf ältere Teile übertrug. Die Klassifizierung zeigte, dass möglicherweise übersehene Kontaminationen nur geringe Auswirkungen auf die beobachteten Trends haben. Weitere gezeigte Anwendungen für die Datenbank beziehen sich auf Saisonalitäten und Trends. Die entwickelten Arbeitsabläufe erwiesen sich als effizient bezüglich der Datenprüfung, der Berichterstellung und der Analyse im Allgemeinen. Durch den verringerten Datenverarbeitungsaufwand wird Zeit für die eigentliche Analyse gewonnen. Die Einrichtung der Datenbank war ein wichtiger Schritt in Richtung einer zukünftigen Ausweitung der Datenberichterstattung.
de
This work focusses on the implementation of a new database for precipitation data collected within the Austrian Precipitation Sampling Network and it presents several use cases.The created database includes all available samples processed by the Austrian Precipitation Sampling Network since its start in 1984. A flag system is used to reflect the ongoing data review process. The developed workflow ensures data integrity from measurement to reporting. Based on the merged dataset it was possible to create a random forest classifier, that transfers the current standard of data reviewing on older parts of the dataset. The classification showed that possibly overlooked contaminated samples allow only minor changes to the observed trends. Further examples of database applications focus on seasonality and trends. The developed workflows proofed to be effective in facilitating data reviewing, reporting and analysis in general. By reducing the data wrangling effort, they free time for actual analysis. The creation of the database was an important step that will lead to the expansion of data reporting in the future.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers