Freund, P. (2025). Vorhersage der Fließgrenze bei Rotorbauteilen unter Einfluss fehlender Daten [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.135142
E105 - Institut für Stochastik und Wirtschaftsmathematik
-
Date (published):
2025
-
Number of Pages:
85
-
Keywords:
fehlende Werte; Imputation
de
missing values; imputation
en
Abstract:
In der Luftfahrt ist eine präzise Bewertung von Materialeigenschaften essenziell, um die notwendigen Sicherheitsstandards gewährleisten zu können. Mit dem Ziel, Prüfversuche und damit verbundene Kosten zu reduzieren sowie experimentell nicht zugängliche Kennwerte im Inneren eines Bauteils zu bestimmen, gewinnen sowohl die Vorhersage von Werkstoffkennwerten wie der Fließgrenze metallischer Rotorscheiben als auch der Umgang mitunvollständigen Datensätzen an Bedeutung.Um diesen praxisnahen Problemstellungen nachzugehen, wird in dieser Arbeit eine Modellpipeline zur detaillierten Datenaufbereitung und präzisen Vorhersage entwickelt. Der Fokus liegt dabei insbesondere auf der Analyse und Imputation fehlender Werte. Zur Simulation ausgelassener Zugversuche werden künstlich unterschiedliche Anteile fehlender Werte erzeugt. Zur Minimierung des Vorhersagefehlers werden verschiedene Imputationsmethoden - Mittelwertimputation sowie Methoden basierend auf k-Nearest-Neighbor (KNN-Imputation) und Random Forest (MissForest) - und unterschiedliche Vorhersagemodelle - Lineare Regression, Ridge Regression, Lasso Regression, k-Nearest-Neighbor, Random Forest, XG-Boost - sowie deren Zusammenspiel verglichen. Zusätzlich wird ein Gewichtungsansatz untersucht, bei dem der Einfluss einzelner Beobachtungen abhängig von der Anzahl ihrer fehlenden Werte gesteuert wird. Dieser zeigt jedoch nur geringe Vorteile gegenüber den Standardmodellen. Die KNN-Imputation erzielt über alle Fehldatenanteile hinweg die geringsten Imputationsfehler und liefert in Kombination mit Random Forest die höchste Vorhersagegenauigkeit. Durch die Optimierung der Modellparameter konnte ein mittlerer absoluter Fehler(MAE) von 17,6 MPa erreicht werden. Diese vielversprechenden Ergebnisse geben Anlass zur Integration in einen datenbasierten Entscheidungsprozess zur Qualitätsbewertung von Rotorbauteilen.
de
In the aerospace industry, the precise evaluation of material properties is essential to ensure the required safety standards. In order to reduce the number of experimental tests and the associated costs, as well as to estimate material parameters that cannot be measured in the interior of components, both the prediction of material properties such as the yield strength of metallic rotor discs and the handling of incomplete datasets are gaining increasing importance.To address these practical challenges, this thesis presents a modeling pipeline for de-tailed data preprocessing and accurate prediction. The main focus is on the analysis and imputation of missing values. To simulate omitted tensile tests, various levels of missing data are artificially introduced into the dataset.To minimize the prediction error, different imputation techniques - mean imputation as well as methods based on k-Nearest-Neighbor (KNN-imputation) and Random Forest (MissForest) - and regression models - Linear Regression, Ridge Regression, Lasso Regression, k-Nearest-Neighbor, Random Forest, XGBoost - as well as their combinations are compared. In addition, a weighting approach is investigated, in which the influence of individual observations is controlled based on the number of their missing values. However, this approach shows only limited improvements over the standard models.KNN-Imputation yields the lowest imputation error across all levels of missing data and achieves the highest prediction accuracy when combined with the Random Forest model.By optimizing the model parameters, a mean absolute error (MAE) of 17.6 MPa is achieved.These promising results suggest that the proposed pipeline can be integrated into a data-driven decision-making process for the quality assessment of rotor components.
en
Additional information:
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers