Böröndy, A. (2023). Exploring and understanding the impact of machine learning choices on radiotherapy decision making [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.91282
Bei der Planung der Strahlentherapie für Prostatakrebs ist eine genaue Beschreibung der Lage und Form der Beckenorgane ein entscheidender Faktor für die erfolgreiche Behandlung der Patienten. Die Behandlung erstreckt sich jedoch über einen längeren Zeitraum, in dem sich die Lage und Form der Organe erheblich verändern kann. Darüber hinaus ist das Ausmaß der Abweichungen von Person zu Person unterschiedlich. Aktuelle Publikationen haben dies untersucht, indem vorherige Patienten in Gruppen mit ähnlicher Organvariabilität unterteilt wurden. Die Verwendung dieser Erkenntnisse als Teil einer Vorhersage für die Organvariabilität bei neuen Patienten könnte die Behandlungsplanung verbessern und weiter personalisieren. Die statistischen und maschinellen Lernmethoden die in diesen Arbeiten eingesetzt werden, wurden bisher jedoch noch nicht gründlich und quantitativ ausgewertet und ihre Auswirkungen auf die abschließenden Vorhersagen wurden noch nicht genau untersucht. Diese Arbeit konzentriert sich auf eine bestimmte, von Furmanová et al. [FMCM+21] vorgeschlagene Implementierung dieser Ansätze und auf die quantitative Auswertung verschiedener Alternativen bei den verwendeten Methoden. Wir konzentrieren uns auf zwei Aspekte: die Auswirkungen der Verwendung verschiedener Methoden um den Form der Organe mathematisch zu beschreiben und die Auswirkungen von Änderungen bei den verwendeten Clustering-Algorithmen. Durch die Bereitstellung eines zusätzlichen Analyse Dashboards zur visuellen Bewertung der Auswirkungen der oben genannten Alternativen wollen wir eine mühelose und interaktive visuelle Interpretation der Auswirkungen der verschiedenen Änderungen ermöglichen. Dies soll den Entwicklern solcher Vorhersagealgorithmen dabei helfen, robustere Ansätze zu entwerfen. Als Fazit stellen wir fest, dass beim derzeitigen Stand der für die Analyse verwendeten Patientengruppe der Schwerpunkt auf der Auswahl geeigneter Methoden zur Beschreibung der Organformen liegen sollte, während die Auswirkungen der verschiedenen Clustering-Einstellungen auf die Vorhersage der extremsten Fälle von Varietät beschränkt sind.
de
In prostate cancer radiotherapy planning, the accurate description of the position and shape of pelvic organs is a crucial part of successful patient treatment. However, the treatment is conducted throughout a long period of time, during which the position and shape of the organs might significantly vary. In addition, the amount of variation tends to differ for each individual. Recent visual analytics publications investigated this by partitioning past patients into clusters with similar variability. Using this as part of a prediction for the organ variability of new patients could improve and further personalize therapy planning. However, the statistical and machine learning methods employed in these works have not been thoroughly and quantitatively evaluated so far and their impact on the final predictions has not been assessed. This thesis focuses on taking a particular implementation of these approaches, proposed by Furmanová et al. [FMCM+21], and quantitatively evaluating the effects of using different alternatives for the employed methods. We focus on two aspects: the effect of using different shape descriptor methods and the impact of modifications in the clustering methods employed. By providing an additional visual analytics framework to visually assess the effect of the aforementioned alternatives, we aim to ensure an effortless and interactive visual interpretation of the impact of various modifications. This is anticipated to support the developers of said predictive algorithms in designing more robust approaches. As a result of our investigation we have highlighted potential issues and improved the initial implementation of the proposed workflow. We conclude that at the current stage of the patient cohort used for the analysis, the selection of appropriate shape description methods should be of main focus, while a notable impact of using different clustering methods is limited to the prediction of the most extreme cases of organ shape variations.