<div class="csl-bib-body">
<div class="csl-entry">Viehauser, M. (2024). <i>Simulation-Based Disaggregation of Train Delay Data</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2024.115824</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2024.115824
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/202247
-
dc.description
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft
-
dc.description
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers
-
dc.description.abstract
Diese Arbeit untersucht, wie sich aggregierte Zugverspätungen (AGD) mithilfe simulationsbasierter Ansätze und Graph Neural Networks (GNN) in primäre (PD) und sekundäre (SD) Verspätungsanteile zerlegen lassen. Dabei wird untersucht, ob Gated Graph Convolutional Networks (GatedGCN), eine spezielle Form von GNN, geeignet sind, um AGD zuverlässig zu disaggregieren.Für die Reduzierung von Zugverspätungen ist es von Bedeutung, zwischen PD und SD zu unterscheiden, da sich diese Verspätungstypen durch unterschiedliche Interventionen minimieren lassen. PD sind Verspätungen, die durch externe Faktoren wie Wetter oder Infrastrukturprobleme verursacht werden, während SD durch Interaktionen innerhalb des Bahnnetzes entstehen. Obwohl ein Großteil der Zugbetreiber Verspätungen dokumentieren, wird jedoch nicht erfasst, ob es sich um PD oder SD handelt. Um verspätungsrobuste Fahrpläne zu erstellen, ist es wichtig zu wissen, in welchem Umfang eine Verspätung auf PD oder SD zurückzuführen ist. Dementsprechend würde ein Algorithmus, der es ermöglicht, AGD zuverlässig zu disaggregieren, wesentlich zur Optimierung des Verspätungsmanagements beitragen und die Grundlage für präzisere und effektivere Fahrplananpassungen schaffen.Die Kernfragen der Forschung drehen sich darum, ob ein datenbasierter Ansatz mit GNN zur Aufschlüsselung von AGD geeignet ist. Da keine historischen Daten mit einer verlässlichen Grund Truth verfügbar waren, wurden für die Untersuchung künstlich erzeugte Daten verwendet. Diese wurden mit einem agentenbasierten Simulationsmodell des österreichischen Eisenbahnnetzes generiert. Ein Schwerpunkt der Arbeit lag auf der sorgfältigen Kalibrierung dieses Modells, die es ermöglicht hat, realistische Verspätungsdaten nach der Eingabe eines Zugfahrplans und der primären Verspätungen zu erzeugen.Die Resultate der Experimente zeigen, dass das GNN die AGD auf den synthetischen Daten in PD und SD effizient und zuverlässig aufteilen kann. In weiteren Experimenten, bei denen das trainierte Modell auf echte Daten angewandt wurde, zeigte das GNN eine geringere Performance als ein naives Vergleichsmodell. Dies deutet darauf hin, dass das GNN eine Überanpassung an die synthetischen Daten aufweist, wodurch es Schwierigkeiten hat, auf die realen Verspätungsdaten zu generalisieren. Zudem wurde deutlich, dass die generierten Daten zu stark von den tatsächlichen historischen Verspätungen abweichen, um allein als Trainingsgrundlage zu dienen. Die Studie kommt zu dem Schluss, dass GNNs grundsätzlich gut zur Aufschlüsselung von AGD geeignet sind, vorausgesetzt, es stehen präzise Daten zu PD und SD zur Verfügung. Bei der Verwendung synthetischer Daten ist jedoch Vorsicht geboten, da diese die Gefahr einer Überanpassung bergen.
de
dc.description.abstract
Primary Delays (PD) refer to delays caused by external factors, such as weather conditions or infrastructure problems, while Secondary Delays (SD) are caused by interactions within the railway network. The majority of train operators record when delays occur but do not differentiate between PD and SD. In order to create delay-robust timetables, it is important to know the extent to which a delay is attributable to PD or SD. Accordingly, an algorithm that makes it possible to disaggregate Aggregated Delays (AGD) reliably would significantly contribute to the optimization of delay management and create the basis for more precise and effective timetable adjustments. The central research questions aim to determine whether a data-driven approach using Gated Graph Convolutional Neural Networks (GatedGCN) is suitable for disaggregating AGD. This was investigated using synthetic data generated by an agent-based simulation model of the Austrian railway network due to the absence of real-world data with ground truth. A significant part of the research involved calibrating this agent-based model. The model is capable of generating synthetic delay data after receiving a train timetable and PD as input values. The experimental results indicate that the GatedGCN can efficiently and reliably disaggregate AGD into PD and SD when applied to synthetic data. However, in subsequent experiments where the trained model was applied to real-world delay data, the GatedGCN performed worse than a naive comparison model. This suggests that the GatedGCN overfitted the synthetic data, making it difficult to generalize to real delay data. In addition, the results show that the generated data significantly deviates from the historical delay data, making it unsuitable as the sole data source for GatedGCN training. The study suggests that GatedGCNs are well-suited for the disaggregation of AGD as long as data with ground truth, i.e., precise information on PD and SD, is available. However, synthetic data should be used with caution, as it entails an increased risk of overfitting.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Disaggregation
de
dc.subject
Zugverspätungsdaten
de
dc.subject
Primärverspätungen
de
dc.subject
Sekundärverspätungen
de
dc.subject
Fahrplanplanung
de
dc.subject
Neuronale Netze
de
dc.subject
Parametrisierung
de
dc.subject
agentenbasiertes Modell
de
dc.subject
Disaggregation
en
dc.subject
Train delay data
en
dc.subject
Primary delays (PDs)
en
dc.subject
Secondary delays (SDs)
en
dc.subject
Timetable planning
en
dc.subject
Artificial neural networks (ANNs)
en
dc.subject
Transformers
en
dc.subject
Graph neural networks (GNNs)
en
dc.subject
Parameterization
en
dc.subject
agent-based model
en
dc.title
Simulation-Based Disaggregation of Train Delay Data
en
dc.title.alternative
Simulationsgestützte Disaggregation von Zugverspätungsdaten
de
dc.type
Thesis
en
dc.type
Hochschulschrift
de
dc.rights.license
In Copyright
en
dc.rights.license
Urheberrechtsschutz
de
dc.identifier.doi
10.34726/hss.2024.115824
-
dc.contributor.affiliation
TU Wien, Österreich
-
dc.rights.holder
Maximilian Viehauser
-
dc.publisher.place
Wien
-
tuw.version
vor
-
tuw.thesisinformation
Technische Universität Wien
-
dc.contributor.assistant
Bicher, Martin
-
tuw.publication.orgunit
E194 - Institut für Information Systems Engineering
-
dc.type.qualificationlevel
Diploma
-
dc.identifier.libraryid
AC17333353
-
dc.description.numberOfPages
98
-
dc.thesistype
Diplomarbeit
de
dc.thesistype
Diploma Thesis
en
dc.rights.identifier
In Copyright
en
dc.rights.identifier
Urheberrechtsschutz
de
tuw.advisor.staffStatus
staff
-
tuw.assistant.staffStatus
staff
-
tuw.advisor.orcid
0000-0003-4615-2774
-
tuw.assistant.orcid
0000-0002-1362-6868
-
item.openaccessfulltext
Open Access
-
item.fulltext
with Fulltext
-
item.grantfulltext
open
-
item.openairecristype
http://purl.org/coar/resource_type/c_bdcc
-
item.languageiso639-1
en
-
item.openairetype
master thesis
-
item.cerifentitytype
Publications
-
crisitem.author.dept
E194 - Institut für Information Systems Engineering