<div class="csl-bib-body">
<div class="csl-entry">Helm, S. (2025). <i>Pattern Recognition for Data-Driven Maintenance in Metro Trains: A Comparative Analysis of Supervised and Unsupervised Approaches on Time-Series Data</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.130344</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2025.130344
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/226544
-
dc.description
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft
-
dc.description
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
-
dc.description.abstract
Bahnbetreiber stehen zunehmend vor der Herausforderung, kostspielige Störungen durch frühzeitige Fehlererkennung zu verhindern. Predictive Maintenance (PdM) bietet hierfür einen vielversprechenden Ansatz, jedoch stützen sich viele bestehende Studien auf stark kuratierte Benchmark-Datensätze, nutzen Asset-Kontextinformationen unzureichend und vernachlässigen häufig den Einfluss des zeitlichen Designs auf die Modellleistung. Dadurch bleibt ihre Anwendbarkeit auf reale Zugflotten begrenzt. Diese Arbeit adressiert diese Defizite durch die Untersuchung überwachter und unüberwachter Machine Learning (ML) Ansätze zur Anomalieerkennung in der V-Zugflotte eines europäischen U-Bahn Systems. Ein Random Forest (RF) wurde auf fensteraggregierten Sensorsignalen trainiert, die mit Asset Historien angereichert wurden, während ein Long Short Term Memory Autoencoder (LSTM-AE) auf Rohsignalsequenzen angewandt wurde. Ein zeitbewusstes Evaluationsprotokoll variierte systematisch Feature-/Sequenzfenster sowie vorausschauende Label Horizonte und ein neuer ereignisbezogener Datensatz wurde durch die Verknüpfung von Sensordaten mit dokumentierten Fehlern und Revisionen erstellt. Die Ergebnisse zeigen, dass der RF aufgrund seiner überlegenen Precision eine höhere Gesamtleistung in der PdM erreichte (F1 = 0.21), während das LSTM-AE einen sehr hohen Recall (0.92) erzielte und in mehreren Fällen frühere Warnsignale lieferte. Die Leistung erwies sich als stark abhängig vom zeitlichen Design. Der RF profitierte von fein granulierten Feature Fenstern und längeren Horizonten, während das LSTM-AE längere Sequenzen mit kürzeren Horizonten benötigte. Besonders bedeutsam war, dass Asset Historienvariablen zu den einflussreichsten Prädiktoren zählten, was den Wert kontextueller Features unterstreicht. Zusammenfassend zeigt diese Arbeit, dass PdM auf realen Metrodaten möglich ist, wenn zeitliche Konfiguration und Asset Kontext explizit berücksichtigt werden. Sie hebt die komplementären Stärken überwachter und unüberwachter ML Modelle hervor und stellt sowohl einen kuratierten operativen Datensatz als auch empirische Erkenntnisse bereit, die das Design zukünftiger hybrider und erklärbarer PdM Systeme unterstützen können.
de
dc.description.abstract
Rail operators increasingly face the challenge of preventing costly disruptions by detecting failures in advance. Predictive Maintenance (PdM) offers a promising approach, yet many existing studies rely on highly curated benchmark datasets, underutilize asset-context information, and often neglect the impact of temporal design on model performance. As a result, their applicability to real-world metro fleets remains limited.This thesis addresses these shortcomings by investigating supervised and unsupervised Machine Learning (ML) approaches for anomaly detection in a European metro provider’s V-train fleet. A Random Forest (RF) was trained on window-aggregated sensor features enriched with asset history, while an Long Short Term Memory Autoencoder (LSTM-AE) was applied to raw sensor sequences. A time-aware evaluation protocol systematically varied feature/sequence windows and anticipatory label horizons, and a new event-aware dataset was curated by aligning sensor data with documented failures and revisions.The results show that RF achieved higher overall PdM (F1 = 0.21) due to superior Precision, while the LSTM-AE reached very high Recall (0.92) and in several cases provided earlier warning signals. Performance proved highly sensitive to temporal design, whereas RF benefited from fine-grained feature windows and longer horizons, while the LSTM-AE required longer sequences with shorter horizons. Importantly, asset history variables ranked among the most influential predictors, underscoring the value of contextual features.In conclusion, this work demonstrates that PdM on real-world metro data is feasible when temporal configuration and asset context are explicitly considered. It highlights the complementary strengths of supervised and unsupervised ML models and provides both a curated operational dataset and empirical insights that can guide the design of future hybrid and explainable PdM systems.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Prädiktive Wartung (PdM)
de
dc.subject
Maschinelles Lernen (ML)
de
dc.subject
Anomalieerkennung
de
dc.subject
Überwachtes & Unüberwachtes Lernen
de
dc.subject
U-Bahn-Fahrzeugdaten
de
dc.subject
Sensor- & Asset-Daten
de
dc.subject
Zeitliche Auflösung
de
dc.subject
Predictive Maintenance (PdM)
en
dc.subject
Machine Learning (ML)
en
dc.subject
Anomaly Detection
en
dc.subject
Supervised & Unsupervised Learning
en
dc.subject
Metro Vehicle Data
en
dc.subject
Sensor & Asset Data
en
dc.subject
Temporal Resolution
en
dc.title
Pattern Recognition for Data-Driven Maintenance in Metro Trains: A Comparative Analysis of Supervised and Unsupervised Approaches on Time-Series Data
en
dc.title.alternative
Mustererkennung für datengetriebene Wartung in U-Bahn-Zügen: Eine vergleichende Analyse überwachter und unüberwachter Ansätze auf Zeitreihendaten