Grazulis, D. (2025). Internal/External breathing motion correlation in the field of tumor motion monitoring [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2025.115091
Radiation therapy; Tumour motion prediction; Respiratory motion compensation; 4D-CT data; Surface scanner signal; Image-guidance; Gaussian Process Regression (GPR); Real-time tumour tracking; Machine learning in medical imaging; Meta-learning for model adaptation
en
Abstract:
Strahlentherapie zählt zu den wichtigsten Methoden zur Behandlung von Lungen- und Leberkrebs. Eine große Herausforderung stellen die Atembewegungen dar, die zu Unsicherheiten bei der Position des Tumors führen. Derzeit wird diesem Problem dadurch Rechnung getragen, dass die zu bestrahlende Fläche vergrößert wird, um die Bewegung des Tumors selbst zu erfassen. Dies führt dazu, dass mehr gesundes Gewebe bestrahlt wird. Die Entwicklungen in der Bildführung und im Bereich des maschinellen Lernens, insbesondere in der Computer Vision, bieten die Möglichkeit, dieses Problem durch Überwachung und Verfolgung des Tumors während der Atembewegung in Echtzeit zu lösen.In dieser Arbeit schlagen wir eine Modellarchitektur zur Schätzung der Tumorposition 500 ms für die Zukunft vor, um Latenzen bei der Tumorverfolgung zu berücksichtigen. Unser Ansatz verwendet eine multimodale Methode, die auf Transformator-Komponenten basiert und Cross-Attention und adaptive Gating Fusion einschließt. Durch die Kodierung von 4D-CT-Daten (intern) auf das Signal des Oberflächenscanners (extern), stützen wir uns bei der Vorhersage der Tumorbewegung hauptsächlich auf die kodierten Signalmerkmale. Wir experimentieren mit verschiedenen Vorhersageköpfen und evaluieren zwei Strategien zur Anpassung dieser Modelle an neue Patientendaten (Feinabstimmung und Meta-Lernen) und zeigen, dass einige Modellkonfigurationen einen RMSE unter 1 mm erreichen können. Unsere Ergebnisse zeigen die Herausforderungen bei der Datenqualität, die Beziehung zwischen 4D-CT- und Oberflächenscanner-Signalen und die Komplexität der Nutzung multimodaler Daten. Wir wenden die Gaußsche Prozessregression (GPR) an, um zehn diskrete 4D-CT-Atemphasen in kontinuierliche Tumorbewegungsmarken umzuwandeln - diese Interpolation kann die Amplituden-Bewegungs-Korrelation künstlich verstärken. Obwohl eine Variante einen durchschnittlichen RMSE von 0.7 ± 0.3 mm im gesamten Testsatz erreicht, wobei die durchschnittliche Tumorverschiebung im Testsatz 2.9 mm beträgt, zeigt die mittlere GPR-Standardabweichung von 3.1 mm die Grenzen des Verlassens auf interpolierte Bezeichnungen, die von der Grundwahrheit abweichen können. Darüber hinaus konnten wir keinen konsistenten Nutzen durch das Hinzufügen visueller Informationen (Brust-CT oder Tumormasken) feststellen, was möglicherweise auf die GPR-Interpolation oder suboptimale Architekturkonfigurationen zurückzuführen ist.
de
Radiation therapy is one of the main approaches for lung and liver cancer treatment. A big challenge is respiratory motion leading to uncertainties in tumour position. Currently, this problem is accounted for by increasing the area to be irradiated to encompass the motion of the tumour itself. This leads to more healthy tissue being irradiated. Developments in image guidance and the machine learning field, especially in the computer vision, provides an opportunity to tackle this problem by monitoring and tracking the tumour during the respiratory motion in real time.Through this work, we experiment with different models with the goal of estimating the position of the tumour 500 ms in the future to address latencies in tumour tracking. Some of our tested approaches employ a multi-modal transformer architecture with cross-attention and adaptive gating fusion. By encoding 4D-CT (internal) data onto the surface scanner signal (external), we rely primarily on the encoded signal features for tumour motion prediction. We experiment with different prediction models and evaluate two strategies for adapting these models to new patient data (fine-tuning and meta-learning), demonstrating that some model setups can achieve an RMSE below 1 mm.Our findings highlight challenges in data quality, the relationship between 4D-CT and surface scanner signals, and the complexity of utilizing multi-modal data. We apply Gaussian Process Regression (GPR) to transform ten discrete 4D-CT breathing phases into continuous tumour motion labels. However, this interpolation may artificially reinforce the correlation between respiratory amplitude and tumour motion. One model variant achieves an average RMSE of 0.7 ± 0.3 mm across the test set, where the tumour’s average displacement is 2.9 mm. The mean GPR standard deviation across the test set is 3.1 mm, which shows the uncertainty and limitations of relying on interpolated labels that may deviate from the actual ground truth tumour positions. Moreover, we observed no consistent advantage from including visual information (chest CT and/or tumour masks) when predicting tumour positions 500 ms into the future, potentially due to limitations of interpolation or suboptimal model architectures.
en
Additional information:
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers