Greifeneder, F. (2022). Data-driven soil moisture estimations based on earth observation data and machine learning [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2022.76189
Obwohl ihre Ursprünge im militärischen Bereich liegen, hat sich die Satellitenfernerkundung in den letzten Jahrzehnten als wesentliche Methode zur Beobachtung unserer Umwelt erwiesen, da sie relevante Parameter wie Landbedeckung, Oberflächentemperatur, Biomasse der Vegetation, Salzgehalt der Ozeane oder Bodenfeuchtigkeit räumlich kontinuierlich und global misst. Darüber hinaus spielt sie eine wesentliche Rolle bei der Beobachtung der Atmosphäre, der Kartierung von Landbedeckung und Landnutzungsänderungen, der Erstellung digitaler Höhenmodelle und vielen anderen Anwendungen.In dieser Arbeit geht es um die Schätzung der Bodenfeuchte, die vom Globalen Klimabeobachtungssystem der Weltorganisation für Meteorologie als eine wesentliche Klimavariable anerkannt wurde. Sie ist für das Verständnis vieler meteorologischer und hydrologischer Prozesse unerlässlich. Räumliche und zeitliche Veränderungen des Bodenfeuchtegehalts können helfen, Naturgefahren wie Erdrutsche, Überschwemmungen oder Dürren zu verstehen und vorherzusehen. Die Fernerkundung des Bodenfeuchtigkeitsgehalts mit optischen und Mikrowellensensoren hat eine lange Geschichte, die bis in die 1970er Jahre zurückreicht. Seitdem haben sich verschiedene Ansätze herausgebildet und etabliert. In dieser Arbeit haben wir uns auf die jüngste Gruppe von Ansätzen, das maschinelle Lernen, konzentriert.Obwohl die meisten der zugrundeliegenden Methoden bereits in den 1980er und 1990er Jahren entwickelt wurden, erlebte das maschinelle Lernen im letzten Jahrzehnt einen Popularitätsschub, auch für Fernerkundungs- und Erdbeobachtungsanwendungen. Dieser Popularitätsanstieg wurde durch den Paradigmenwechsel in der Erdbeobachtung weiter vorangetrieben, der es den Nutzern heute ermöglicht, problemlos auf große Datenmengen von verschiedenen Sensoren zuzugreifen und diese zu nutzen.Das übergeordnete Ziel dieser Arbeit ist die Nutzung von Erdbeobachtungsdaten in Kombination mit Methoden des maschinellen Lernens zur Schätzung des Bodenfeuchtegehalts. Um die Absichten dieser Arbeit zu erfassen, haben wir drei Hauptfragen formuliert: Wie können wir von standortspezifischen, datengesteuerten Machine-Learning-Modellen zu einer allgemeinen Anwendbarkeit in großflächigen Anwendungen übergehen?; Wie können wir das Potenzial der verfügbaren Daten nutzen und Daten von verschiedenen Sensoren und Datenquellen mit unterschiedlichen räumlichen und zeitlichen Auflösungen zusammenführen?; Wie können wir Bodenfeuchtemessungen über Skalen hinweg (räumlich und zeitlich) miteinander verknüpfen?Die im ersten Teil der Arbeit vorgestellte Analyse konzentrierte sich auf ein besseres Verständnis der Wechselwirkungen zwischen Mikrowellen, Bodenfeuchte, Topographie, Landbedeckung und Vegetation, untereinander und über räumliche Skalen hinweg. Durch die Entwicklung einer räumlichen Skalierungsmethode für In-situ-Messungen waren wir in der Lage, diese Wechselwirkungen zu untersuchen und die starke zeitliche Korrelation der Bodenfeuchte über räumliche Skalen hinweg zu bestätigen. Ein wesentliches Ziel dieser Arbeit war auch die Untersuchung der Anwendbarkeit datengesteuerter Methoden auf globaler Ebene. Zu diesem Zweck haben wir Tests mit unterschiedlichen räumlichen Auflösungen durchgeführt und verschiedene Referenzdatentypen verwendet. Die Ergebnisse zeigen, dass eine genaue Schätzung sowohl bei grober als auch bei hoher räumlicher Auflösung möglich ist. Die Studien zeigten auch bestimmte Einschränkungen in Bezug auf das Potenzial von Modellen, die sich nur auf Satellitendaten stützen, die Unsicherheiten heterogener Referenzdaten oder die Validierung hochaufgelöster räumlicher Muster.Eines der wichtigsten Ergebnisse dieser Arbeit ist ein Ansatz und ein Modell für die hochauflösende Kartierung der Bodenfeuchte, welches wir als Teil einer Software namens PYSMM veröffentlicht haben. Die praktische Anwendung des Ansatzes haben wir im Rahmen der Arbeit zur Kartierung von Bodenfeuchteanomalien demonstriert. Seine Relevanz wurde weiter unterstrichen, da er von Wissenschaftlern der FAO und des USGS aufgegriffen wurde, um Informationen über die Bodenfeuchte zur Erkennung von Feuchtgebieten bzw. zur Assimilation in ein hydrologisches Modell einzubeziehen.
de
Although its origins lie in military applications, satellite remote sensing was established over the last decades as an essential method for observing our environment through the spatially continuous and global measurement of relevant parameters like land-cover, land-surface temperature, vegetation biomass, ocean salinity, or surface soil moisture. Furthermore, it plays an essential role in observing the atmosphere, mapping land-cover and land-use changes, generating digital elevation models, and many other applications.This thesis focuses on estimating the surface soil moisture content, which was recognised as an essential climate variable by the Global Climate Observing System of the World Meteorological Organization. It is essential for the understanding of many meteorological and hydrological processes. Spatial and temporal changes of the soil moisture content can help understand and anticipate natural hazards like landslides, floods, or drought. The remote sensing of the soil moisture content, using optical and microwave sensors, has a long history dating back to the 1970s. Different approaches have emerged and established themselves since then. With this thesis, we concentrated on the latest group of approaches, machine learning.Even though most of the underlying methodologies were already developed during the 1980s and 1990s, machine learning experienced a surge of popularity during the last decade, also for remote sensing and earth observation applications. This increase in popularity was further pushed by the paradigm shift in earth observation, which allows users today to easily access and exploit large quantities of data from different sensors.The overall goal of this thesis is to use earth observation data combined with machine learning methods to estimate the soil moisture content. To capture the aims of this thesis, we formulated three main questions: How can we go from site-specific, data-driven machine-learning models to general applicability in large scale applications?; How can we harness the potential of available data and merge data from different sensors and data sources with different spatial and temporal resolutions?; How can we link soil moisture measurements across scales (spatial and temporal)?The analysis presented by the thesis in its first part focused on a better understanding of the interactions between microwaves, soil moisture, topography, land-cover, and vegetation, between each other and across spatial scales. By developing a spatial upscaling method for in-situ measurements, we were able to study these interactions and confirm the solid temporal correlation of soil moisture across spatial scales. An essential ambition of this work was also to study the applicability of data-driven methods on a global scale. For this purpose, we performed tests based on different spatial resolutions and used different reference data types. The results demonstrate that accurate estimation is possible, with coarse as well as with high spatial resolutions. The studies also revealed certain limitations related to the potential of retrieval models relying only on satellite data, the uncertainties of heterogenous reference data, or the validation of high-resolution spatial patterns.One of the thesis’ main outputs is an approach and a model for the high-resolution mapping of surface soil moisture, which we published as part of a software called PYSMM. The practical use of the approach we demonstrated as part of the thesis for mapping soil moisture anomalies. Its relevance was further underlined as it was picked up by scientists at FAO and the USGS to incorporate soil moisture information for wetland detection and assimilation in a hydrological model, respectively.