Zehetgruber, J. (2013). Classical and robust regression for compositional data analysis [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-52559
Diese Diplomarbeit befasst sich mit der Entwicklung von klassischer und robuster Regression mit Kompositionsdaten. Um die Ergebnisse auch interpretieren zu können, wurden zuerst geeignete Transformationen vom Raum der Kompositionen, dem Simplex, in den euklidischen Raum angewandt. Aufgrund der theoretischen Eigenschaften ist die "isometric log-ratio"-Transformation dabei zu bevorzugen. Die daraus resultierenden, transformierten Daten heißen Koordinaten. Ein Spezialfall davon sind die sogenannten "balances", die die Interpretation erleichtern sollen. Bei der Regressionsanalyse wurden schließlich drei verschiedene Fälle betrachtet. Zuerst beschäftigte man sich mit einem Modell, wo nur die zu erklärenden Variablen kompositionell waren. Weiters wurde ein Modell mit kompositionellen erklärenden Variablen untersucht und schließlich untersuchten wir auch noch den Fall von einem Modell, wo sowohl abhängige, als auch unabhängige Variable von kompositioneller Struktur waren. In allen Fällen wurden Regressionsschätzer mit Hilfe von klassischen und robusten Verfahren berechnet, im multivariaten Fall wurde der MLTS (multivariate least-trimmed squares) Schätzer verwendet.<br />Implementiert wurde dieser durch einen schnellen MLTS Algorithmus. Schlussendlich wurden die beschriebenen Verfahren auf Daten aus der Geochemie angewandt, um Schlüsse von Anteilen von Elementen im Boden auf gewisse abhängige Variable (wie zum Beispiel das Wetter) zu ziehen.<br />Inferenzstatistiken über geschätzte Parameter und Ausreißerdiagnostik sollten zur Beschreibung der Daten helfen.<br />
de
In this diploma thesis, classical and robust multivariate regression for compositions is developed. Therefore, proper transformations from the simplex to the usual Euclidean space have to be applied on the compositional variables for being able to interpret the results in terms of coordinates. Consequently, special kinds of balances are proposed to obtain reasonable results, that are easy to interpret.<br />The regression analysis is divided into three parts. A model with just a compositional response is considered, as well as a model with compositional explanatory variables and finally a model with both, compositional response and compositional explanatory variables is taken into account. Special attention has to be paid to the ilr transformations of the original variables as well as to the resulting models given in coordinates. Further, classical and robust regression analysis can be applied and coefficients are computed. In the robust case, the multivariate least-trimmed squares estimator is used and a fast mlts algorithm has been used for the computations. Geochemical data was available to present the results. Inference statistics on the one hand and diagnostic plots on the other hand are used to display the properties of the data and the models that have been observed.