Mair, E. (2015). Generalized linear models with compositional data [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2015.33495
In dieser Diplomarbeit wurden generalisierte lineare Modelle für Kompositionsdaten angepasst. Kompositionsdaten beschreiben Teile einer Gesamtheit und tragen nur relative Informationen in sich. Sie sollten nicht direkt mit generalisierten linearen Modellen verwendet werden, da damit die Interpretation des Modells zu verfälschten Ergebnissen führen kann. Die Kompositionsdaten müssen vor Anwendung im generalisierten linearen Modell in angemessener Weise transformiert werden. Wir verwenden die ilr (isometric logratio) - Transformation nach Hron et al. (2010, 2012). In Anwendung dieser speziellen Transformation ist eine sinnvolle Interpretation der unbekannten Parameter und der Inferenzstatistik möglich. Generalisierte lineare Modelle für Kompositionsdaten wurden auch in der Statistiksoftware R implementiert. Jeweils ein praktisches Modell für binäre Daten und für Zähldaten wurde angepasst. Dazu wurden zunächst Kompositionsdaten aus dem GEMAS (Geochemical mapping of agricultural and grazing land soils) - Projekt verwendet, um die chemische Bodenzusammensetzung in Nord- und Südeuropa zu untersuchen. Daten aus einem Biomonitoringprojekt in der Tschechischen Republik (Biogeochemical exploration of forests as a base for the long-term landscape exploitation in the Czech Republic) wurden dazu verwendet, um einen Zusammenhang zwischen dem Verkehrsaufkommen und der chemischen Bodenzusammensetzung zu finden.
de
In this diploma thesis generalized linear models are adapted to compositional data. Compositional data describe the parts of some whole and carry only relative information. They should not be used directly with generalized linear models as the interpretation of the model can become misleading. The data need to be appropriately transformed. We use the isometric logratio (ilr) transformation proposed by Hron et al. (2010, 2012). In application of this special ilr transformation a meaningful interpretation of the unknown parameters and the inference statistics is possible. We implemented generalized linear models with compositional data sets in the statistical software R. A model for binary data and a model for count data were adapted. We used a compositional data set resulting from the GEMAS (Geochemical mapping of agricultural and grazing land soils) project to investigate the difference in soil composition in northern and southern Europe. Furthermore we used another compositional data set from the project "Biogeochemical exploration of forests as a base for the long-term landscape exploitation in the Czech Republic" to find a relation between traffic volume and chemical composition of moss and thus model traffic induced pollution in Czech Republic.