Röthlin, B. E. (2024). Deep-Learning based Identification of Suspicious Areas in Breast MRIs [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2024.117627
Brustkrebs ist die häufigste Krebserkrankung bei Frauen und macht 23,8 % aller weiblichen Krebserkrankungen aus. Um das individuelle Risiko zu bewerten und Patientinnen entsprechenden Risikogruppen mit spezifischen Screening-Protokollen zuzuordnen, werden genetische Tests und auf kategorischen Variablen basierte Modelle verwendet. Hochrisikopatientinnen wird in der Regel empfohlen, jährliche Vorsorgeuntersuchungen, einschließlich Mammographien und Brust-DCE-MRTs, durchzuführen. Dennoch besteht das Risiko, dass frühe Läsionen übersehen werden oder sich zwischen den Untersuchungen Krebs entwickelt. Dies hat zur Entwicklung von Deep-Learning-Methoden geführt, die Risikobewertungen auf Basis von Daten der medizinischen Bildgebung durchführen oder Bilddaten in bestehende Methoden integrieren. Jedoch konzentrieren sich bestehende bildbasierte Ansätze vorwiegend auf Mammographien von Frauen mit durchschnittlichem Risiko und identifizieren keine spezifischen Risikobereiche im Brustgewebe. Ziel dieser Masterarbeit ist einerseits die Entwicklung einer Segmentation-Pipeline zur Identifizierung von Hochrisikobereichen in negativ befundeten Brust-DCE-MRTs. Andererseits wird untersucht, ob MRT-Schnittbilder in jene mit und ohne Risiko für die Entwicklung zukünftiger Läsionen klassifiziert werden können, basierend auf statistischen Features, die aus den entstehenden Segmentierungs-Wahrscheinlichkeitskarten berechnet werden. Zu diesem Zweck werden DCE-MRT-Daten von Hochrisikopatientinnen aus zwei aufeinanderfolgenden Screenings am AKH Wien verwendet. Mit diesen Daten werden mehrere Segmentierungsarchitekturen, darunter U-Net, nnU-Net und DeepLabv3+, hinsichtlich ihrer Fähigkeit verglichen, auffällige Bereiche zu identifizieren, die mit einem erhöhten Risiko für die Entwicklung von Läsionen innerhalb von 6 bis 24 Monaten verbunden sind. Zur Verbesserung der Segmentierung werden Datenaugmentation und domänenspezifisches Transfer-Learning eingesetzt und deren Effekt untersucht. Für die Klassifizierung werden Random-Forest-Ensemble-Modelle mit statistischen Features trainiert, die aus den Segmentierungswahrscheinlichkeitskarten extrahiert wurden (Mittelwert, Median, Maximalwert, 95. Perzentil und Anzahl der Läsionspixel). Zusätzlich wird die Klassifizierungsleistung der einzelnen Features analysiert. DeepLabv3+ übertrifft die anderen Architekturen bei der Segmentierung von Hochrisikobereichen, insbesondere in Kombination mit Datenaugmentation und domänenspezifischem Transfer-Learning. Das Modell zeigt auch Potenzial für die Risikostratifizierung, mit einer Klassifikationsgenauigkeit von 0,61, einer Präzision von 0,68 und einem Recall von 0,41. Der Mittelwert, der Maximalwert und die Anzahl der Läsionspixel erweisen sich dabei als besonders aussagekräftige Features für die Risikostratifizierung (max. ROC-AUC: 0,68, 0,69, 0,66). Allerdings verdeutlichen die Kompromisse zwischen Genauigkeit, Präzision und Recall die Notwendigkeit weiterer Modelloptimierungen. Insgesamt zeigt diese Masterarbeit das Potenzial der Integration segmentierungsbasierter statistischer Features aus DCE-MRTs zur Risikostratifizierung bei Hochrisikopatientinnen mit Brustkrebs. Trotz der begrenzten Segmentierungsleistung liefern die Wahrscheinlichkeitskarten wertvolle Informationen für die nachfolgende Risikoklassifizierung. Obwohl die Ergebnisse vielversprechend sind, bedarf es weiterer Forschung, um die Generalisierbarkeit zu verbessern und den Merkmalsextraktionsprozess für eine höhere Vorhersagegenauigkeit zu optimieren.
de
Breast cancer is the most common cancer in women, accounting for 23.8% of female cancers. Genetic testing or risk models using categorical variables are used to evaluate an individual’s risk, categorising patients into corresponding risk groups with predefined screening protocols. Those at high-risk are advised to participate in annual screenings that include mammograms and breast DCE-MRI scans. However, early-stage lesions can be missed, and cancer may develop between screenings. This has led to the exploration of Deep Learning methodologies that integrate medical imaging data into risk assessment. However, existing image-based approaches are mostly based on mammograms of individuals at average risk and do not identify suspicious areas in breast tissue. This thesis develops a segmentation pipeline to identify high-risk areas in negatively evaluated breast DCE-MRI scans and evaluates the effectiveness of classifying MRI slices as at risk or not at risk for future lesion development based on features derived from segmentation probability maps. DCE-MRI data of high-risk patients from two consecutive screenings at the AKH Wien was used to compare several segmentation architectures, namely U-Net, nnU-Net and DeepLabv3+, in their ability to delineate areas at risk of developing lesions within 6 to 24 months. Data augmentation and transfer learning were explored to improve performance. For classification, Random Forest ensemble models were trained using statistical features (mean, median, maximum value, 95th percentile, and lesion pixel count) extracted from segmentation probability maps, and the individual features’ effectiveness in risk stratification was evaluated. DeepLabv3+ outperformed other architectures in segmenting future lesion areas, particularly when combined with data augmentation and domain-specific transfer learning. The segmentation backbone also proved useful for future risk stratification, with a classification accuracy of 0.61, a precision of 0.68, and a recall of 0.41. The mean, maximum value, and lesion pixel count were identified as features with a strong discriminative power for risk stratification (max ROC-AUC: 0.68, 0.69, 0.66). However, trade-offs between accuracy, precision, and recall highlight the need for further refinement. In conclusion, this master’s thesis demonstrates the potential of integrating segmentation-derived features from breast DCE-MRI scans for breast cancer risk stratification in high-risk populations. While the segmentation performance based on binary masks was limited, the probability maps proved to be highly informative for downstream classification. While initial results are promising, further research is required to enhance generalisability and to refine the feature extraction process to improve predictive accuracy.
en
Additional information:
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft