Parzer, R. (2021). Sufficient dimension reduction for longitudinal data [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2021.91800
E105 - Institut für Stochastik und Wirtschaftsmathematik
-
Date (published):
2021
-
Number of Pages:
57
-
Keywords:
Dimension Reduction; Matrix valued data
en
Abstract:
In dieser Arbeit wird ein neuer Ansatz zur suffizienten Dimensionsreduktion für longitudinal gemessene Prädiktoren und eine reellwertige Zielvariable untersucht. Die meisten bestehenden Reduktionsverfahren, die die longitudinale Struktur ignorieren, können zu einem Informationsverlust führen, da die Zeitinformation nicht genutzt wird.Wir stellen zunächst eine der ersten linearen Reduktionsmethoden, den Sliced Inverse Regression (SIR) Algorithmus, und seine Anpassung für Longitudinaldaten (LSIR) vor. Letztere wird als Benchmark für die Prognoseleistungen der Reduktionen dienen.Anschließend definieren wir das Structured Time-Dependent Inverse Regression (STIR) Modell, das den bedingten Mittelwert der Prädiktoren in Abhängigkeit von der Zielvariable mit Hilfe von Funktionen der Zeit und der Zielvariable modelliert.Für dieses Modell leiten wir Kleinste-Quadrate und Maximum-Likelihood-Schätzer der Parameter her und finden eine Reduktion der Marker, wobei der Zeiteffekt im Modell berücksichtigt wird. Die Vorteile des Modells liegen darin, dass verschiedene Zeitpunkte für jedes Individuum modelliert werden können und dass eine einfachere Interpretation der Reduktion ermöglicht wird, da nur die Marker reduziert werden.Wir untersuchen die Genauigkeit der Parameterschätzer und die Prognosefähigkeit der Reduktionen für dieses Modell in einer umfangreichen Simulationsstudie.In den meisten Simulationsszenarien und für einen realen Datensatz ist STIR konkurrenzfähig mit dem longitudinal angepassten SIR-Algorithmus und mit Standardregressionsmethoden, die die vektorisierten, nicht reduzierten Prädiktoren verwenden.In bestimmten Simulationsszenarien für eine binäre Zielvariable, bei denen das erste und zweite Moment der Prädiktoren von der Zielvariable abhängen, übertrifft STIR die anderen Methoden in der Vorhersageleistung deutlich.
de
This thesis explores a new sufficient dimension reduction approach for longitudinally measured predictors and a real response. Most existing reduction techniques ignore the longitudinal structure and can lead to a loss of information, since the time information is not used.We first introduce one of the first linear reduction methods, the Sliced Inverse Regression (SIR) algorithm, and its adaptation for longitudinal data (LSIR), which serves as benchmark for the predictive performance of the reductions.Then, we define the Structured Time-Dependent Inverse Regression (STIR) model, which models the conditional mean of the predictors given the response using functions of time and the response. For this model we derive least squares and maximum likelihood based parameter estimates, and find a reduction of the markers that accounts for the time effect. Advantages of the model are that different time points for individuals can be modeled and the reduction of markers only allows an easier interpretation of the reduction.We assess the estimation accuracy of the parameter estimates and the predictive ability of the reductions for this model in extensive simulation studies.Throughout most of the simulation settings and on a real data set, STIR is competitive with the longitudinally adapted SIR algorithm and to standard regression methods using the vectorized unreduced predictors.In certain simulation settings for a binary response, where the first and second moment of the predictors relate with the response, STIR excels in predictive performance against the other methods.