Mert, M. C. (2016). Theoretical and practical aspects in compositional data analysis [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.23640
E105 - Institut für Stochastik und Wirtschaftsmathematik
-
Date (published):
2016
-
Number of Pages:
96
-
Keywords:
error propagation; balances; risk rate
de
error propagation; balances; risk rate
en
Abstract:
Kompositionsdaten stellen die relative Information zwischen den Variablen, die Teile eines Ganzen sind, dar. Die relevante Information ist nicht in den absoluten Werten enthalten, sondern in den Verhältnissen der kompositionellen Variablen. Diese relative Information kann mit dem in den 1980er Jahren vorgeschlagenen Log-Ratio Ansatz analysiert werden. Aus geometrischer Sicht befinden sich die Kompositionsdaten im Simplex, einer Teilmenge des euklidischen Raums. Der Log-Ratio Ansatz repräsentiert die Daten in Form von Koordinaten in der üblichen euklidischen Geometrie. Die bekannten Koordinaten sind die additive Log-Ratio (alr), die centered Log-Ratio (clr), und die isometric Log-Ratio Koordinaten (ilr). Die clr und ilr Koordinaten werden bevorzugt, da die ilr Darstellung orthonormale Koordinaten erstellt und die clr Darstellung eine Interpretation in Bezug auf die ursprünglichen Variablen ermöglicht. Diese Dissertation legt den Schwerpunkt auf die verschiedenen Aspekte der Kompositionsdaten: Ein Interessensgebiet sind die hoch-dimensionalen Kompositionsdaten, wobei die Interpretation der extrahierten Koordinaten eine komplexe Aufgabe sein kann. Ein weiteres Anliegen ist die Ausbreitung von Messfehlern bei der Darstellung der Kompositionen in Form von orthonormalen Koordinaten. Anwendungen in der Geochemie sowie in der Epidemiologie, ein neues Feld für diese Art von Analyse, heben die Brauchbarkeit des Log-Ratio Ansatzes hervor.
de
Compositional data represent the relative information between variables that are parts of some whole. The relevant information is contained only in the ratios between the measured variables, and not in the absolute values. A common procedure how to analyze this relative information is to use the so-called log-ratio approach, proposed by John Aitchison in the 1980s. From a geometrical point of view, the compositions live in the simplex sample space, and the log-ratio approach enables a representation in terms of coordinates in the usual Euclidean geometry. The well known coordinates are the additive log-ratio (alr), the centered log-ratio, and the isometric log-ratio (ilr) coordinates. The clr and ilr coordinates are preferred, since the ilr representation constructs orthonormal coordinates and the clr representation allows for an interpretation in terms of the original variables. We focus on different aspects of compositional data: One field of interest are high-dimensional compositional data, where the interpretation of the resulting coordinates can become a complex task. Another concern is the propagation of measurement errors in the construction of the orthonormal coordinates. Applications in geochemistry, but also in epidemiology, which is a new field for this kind of analysis, underline the usefulness of this approach.
en
Additional information:
Zusammenfassung in deutscher Sprache Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers