Mühlmann, C. (2021). Advances in blind source separation for spatial data [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2021.72251
Viele Datensaetze bestehen aus multivariaten Messungen, die an verschiedenen geographischen Orten durchgefuehrt wurden. Typischerweise besitzen solche Datensaetze die Eigenschaft, dass Messungen in unmittelbarer Naehe aehnlicher sind als Messungen, die eine hohe Entfernung aufweisen. In der statistischen Analyse solcher raeumlichen Daten sollte diese spezielle Eigenschaft beruecksichtigt werden. In letzter Zeit wurde in der statistischen Literatur die sogenannte Blind Source Separation Methode auf raeumliche Daten erweitert. In diesem Model wird angenommen, dass die Daten aus Linearkombinationen von unbeobachteten Variablen bestehen, und das Ziel ist diese latenten Variablen zu bestimmen. Die weitere Analyse der Daten kann nun mit Hilfe dieser unbeobachteten Variablen durchgefuehrt werden. Dies bietet einige Vorteile: die latenten Variablen sind unkorreliert und zeigen oft physikalische Prozesse, welche die Daten generieren und in den meisten Faellen sind nicht alle latenten Variablen von Interesse. All diese Vorteile wurden anhand eines geochemischen Datensatzes eindrucksvoll nachgewiesen. Die originale raeumliche Blind Source Separation Methode ist nur fuer latente Komponenten formuliert, die invariant unter raeumlicher Translation (schwach stationaer) und von gleichem Interesse sind. In dieser Dissertation wird die raeumliche Blind Source Separation Methode fuer weitere Eigenschaften von raeumlichen Daten adaptiert. Der Fokus liegt auf in erster oder zweiter Ordnung nicht stationaeren Daten und Daten die von Rauschen beeinflusst sind. Weiters zeigt diese Arbeit den Nutzen der raeumlichen Blind Source Separation Methode fuer raeumliche Prognosen und Regression.
de
Multivariate data where each measurement is taken at a different location in space are encountered in many practical applications. Typical features of such data are that measurements in close proximity tend to be more similar than the ones further separated. Proper statistical tools need to account for this fact. Recently, the popular blind source separation methodology was formulated for such spatial data denoted as spatial blind source separation (SBSS). Specifically, it is assumed that the observed data is formed by linear combinations of unobserved components. Recovering these latent components is very beneficial as they are uncorrelated, most often show underlying physical processes that generated the data and for domain experts it is highly likely that only a few components are of interest. All advantages were proven on a geochemical dataset. However, the original SBSS only considers the case when all components are of equal interest and are invariant under translation in space (second-order stationarity). This thesis extends these methods for various features commonly present in spatial data. Namely, first and second order non-stationarity or noisy spatial data. Furthermore, the usefulness of blind source separation in spatial regression as well as spatial prediction is investigated.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers Kumulative Dissertation aus sechs Artikeln