A Framework for Operational Performance and Reliability in Freight Rail Arrival Time Prediction

Illich, Nico

doi:10.34726/hss.2026.140470

Record link:

https://doi.org/10.34726/hss.2026.140470
http://hdl.handle.net/20.500.12708/228895

Title:

A Framework for Operational Performance and Reliability in Freight Rail Arrival Time Prediction

Citation:

Illich, N. (2026). A Framework for Operational Performance and Reliability in Freight Rail Arrival Time Prediction [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2026.140470

reposiTUm DOI:

10.34726/hss.2026.140470

CatalogPlus:

AC17902051

Publication Type:

Thesis - Diplomarbeit

Language:

English

Authors:

Illich, Nico

Advisor:

Matyas, Kurt

Co-advisor:

Scheffer, Sara Elisabeth

Organisational Unit:

E330 - Institut für Managementwissenschaften

Date (published):

2026

Number of Pages:

Keywords:

Rail Freight Transportation; Arrival Time Prediction; Modular Prediction Frame work; Uncertainty Quantification; Ensemble Learning; Operational Reliability; RNE Guidelines

Abstract:

Eine zuverlässige Vorhersage von Ankunftszeiten ist eine zentrale Voraussetzung für die Verbesserung der operativen Wettbewerbsfähigkeit des Schienengüterverkehrs. Obwohl die europäische Verkehrspolitik darauf abzielt, die Schiene als nachhaltigen Güterverkehrsträger zu stärken, bleibt der Schienengüterverkehr aufgrund heterogener Datenverfügbarkeit, infrastruktureller Einschränkungen, stochastischer Störungen und begrenzter Transparenz betrieblicher Entscheidungen schwer vorhersagbar. Diese Arbeit entwickelt und evaluiert ein modulares Machine-Learning-Framework zur Vorhersage von Ankunftszeiten und Verspätungen im Schienengüterverkehr unter realistischen Informationsständen zum Zeitpunkt der Abfahrt und unter Berücksichtigung von Prognoseunsicherheit. Auf Basis einer Design-Science-Research-Methodik integriert das Framework heterogene Datenquellen, eine Vorverarbeitung der Daten unter Vermeidung von Data Leakage, modulares Feature Engineering, austauschbare Vorhersagemodelle sowie Unsicherheitsschätzung mittels Conformal Prediction. Das Framework wird als Python-basierte Pipeline implementiert und in zwei komplementären Untersuchungsszenarien evaluiert: einem synthetischen Benchmark-Datensatz mit kontrollierten Verspätungsmechanismen und einer finnischen Eisenbahn-Fallstudie, die reale Datenbeschränkungen abbildet. Die Modelle werden anhand chronologischer Aufteilungen in Trainings-, Validierungs-, Kalibrierungs- und Testdaten sowie mithilfe statistischer Fehlermetriken, operativer Schwellenwertindikatoren und Zuverlässigkeitsmaßen für Vorhersageintervalle bewertet. Der synthetische Benchmark zeigt, dass Machine-Learning-Modelle fahrplanbasierte und historische Baselines übertreffen, wobei baumbasierte Ensemble-Methoden die stärkste Gesamtleistung erzielen. Die Unterschiede zwischen fortgeschrittenen Modellklassen bleiben jedoch vergleichsweise gering, was darauf hindeutet, dass mehrere Modellfamilien ähnliche prädiktive Strukturen erfassen. Experimente mit gestuften Feature-Sets zeigen, dass Topologie-, Zugzusammensetzungs- und Wettervariablen komplementäre Informationen liefern. Sensitivitätsexperimente deuten zudem darauf hin, dass die Vorhersageschwierigkeit nicht durch einen einzelnen isolierten Verspätungsmechanismus bestimmt wird, sondern aus mehreren interagierenden Mechanismen und verbleibender stochastischer Variabilität entsteht. Die finnische Fallstudie bestätigt, dass das Framework strukturell auf heterogene reale Bahnbetriebsdaten übertragbar ist. Die Verbesserungen gegenüber starken streckenbasierten historischen Median-Baselines bleiben jedoch begrenzt. Dies deutet darauf hin, dass streckenspezifische historische Verspätungsmuster bereits einen wesentlichen Teil der vorhersagbaren Variation erfassen. Der verbleibende Fehler ist vor allem durch fehlende operative Variablen begrenzt, insbesondere detaillierte Informationen zur Zugzusammensetzung, zum Infrastrukturzustand, zu Terminalprozessen, zu Echtzeit-Verkehrskonflikten und zu Dispositionsentscheidungen. Die mittels Conformal Prediction erzeugten Vorhersageintervalle liefern nützliche Informationen zur Prognosezuverlässigkeit, bleiben jedoch relativ breit und nur eingeschränkt zustandsspezifisch. Dies verdeutlicht die Grenzen globaler, residuenbasierter Unsicherheitsschätzung in zeitlich variierenden Bahnbetriebssystemen. Insgesamt zeigt die Arbeit, dass modulare Machine-Learning-Frameworks unter Berücksichtigung von Prognoseunsicherheit reproduzierbare und operativ relevante Ankunftszeitprognosen im Schienengüterverkehr unterstützen können. Die Ergebnisse legen nahe, dass zukünftige Verbesserungen weniger durch eine reine Erhöhung der Modellkomplexität, sondern vor allem durch umfangreichere operative Daten, eine bessere Verfügbarkeit aussagekräftiger Merkmale und adaptivere Verfahren zur Unsicherheitsschätzung erzielt werden können.

Reliable arrival time prediction is essential for improving the operational competitiveness of rail freight. Despite European policy ambitions to strengthen rail as a sustainable freight mode, freight operations remain difficult to predict due to heterogeneous data availability, infrastructure constraints, stochastic disruptions and limited visibility into operational decisions. This thesis develops and evaluates a modular, uncertainty-aware prediction framework for freight rail arrival time and delay prediction under realistic pre-departure conditions. Following a Design Science Research Methodology, the framework integrates heterogeneous data sources, leakage-safe preprocessing, modular feature engineering, exchangeable prediction models and conformal uncertainty estimation. The framework is implemented as a Python-based pipeline and evaluated in two complementary settings: a synthetic benchmark dataset with controlled delay-generating mechanisms and a Finnish railway case study representing real-world data constraints. Models are evaluated using chronological training, validation, calibration and test splits, statistical error metrics, operational threshold indicators and prediction interval reliability measures. The synthetic benchmark shows that machine-learning models outperform schedule-based and historical baselines, with tree-based ensemble methods achieving the strongest overall accuracy. However, differences among advanced model classes remain small, indicating that several model families capture similar predictive structure. Feature-set experiments show that topology, train composition and weather variables provide complementary information, while sensitivity experiments indicate that prediction difficulty emerges from multiple interacting mechanisms and residual stochastic variability rather than from a single isolated delay driver. The Finnish case study confirms that the framework is structurally transferable to heterogeneous real-world railway data. However, improvements over strong route-based historical medians remain limited, suggesting that route-specific delay regularities already capture a substantial share of predictable variation. The remaining error is largely constrained by missing operational variables, such as detailed train composition, infrastructure state, terminal readiness, real-time traffic conflicts and dispatching decisions. Conformal prediction intervals provide useful information on reliability, but remain relatively wide and only partly condition-specific, reflecting the limitations of global residual-based uncertainty estimation. Overall, the thesis demonstrates that modular and uncertainty-aware machine-learning frameworks can support reproducible and operationally relevant freight rail ETA prediction. The results indicate that future improvements are likely to depend more on richer operational data and adaptive uncertainty estimation than on increased model complexity alone. Keywords: Rail Freight Transportation, Arrival Time Prediction, Modular Prediction Framework, Uncertainty Quantification, Ensemble Learning, Operational Reliability, RNE Guidelines

Additional information:

Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft

License:

In Copyright

Appears in Collections:

Thesis