Temme, J. (2023). Classification of tumor cells in childhood cancer using automated microscopy and deep learning [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.93784
E193 - Institut für Visual Computing and Human-Centered Technology
-
Date (published):
2023
-
Number of Pages:
118
-
Keywords:
Visual Computing; Klassifikation; Modelbeurteilung; Variablenselektion; Deep Learning; Neuronales Netzwerk; Wassersteindistanz
de
visual computing; classification; model evaluation; feature extraction; deep learning; neural network; Wasserstein distance
en
Abstract:
Alternative Telomerverlängerung (ALT) ist ein Mechanismus in Krebszellen, der Telomerverkürzung unterbindet, die bei der Teilung normaler Zellen stattfinden würde. Bei Neuroblastomen, einer Krebserkrankung bei Kindern und Jugendlichen, ist ein positiver ALT Status prognostisch für einen ungünstigen Verlauf. Mit Hilfe der Telomer PNA (telPNA) Fluoreszenz-in-situ-Hybridisierung werden Telomere in Mikroskopiebildern als helle punktförmige Signale dargestellt. Längere Telomere weisen dabei hellere und größere Punkte (ultrahelle Punkte) in den telPNA Bildern auf. Klinisch wird der ALT Status derzeit vor allem expertenbasiert und mit Faustregeln visuell über die ultrahellen Punkte in den Bildern bestimmt. Es existieren bisher keine bildbasierten Ansätze, die den ALT Status anhand automatisierter und eindeutiger Regeln mit hoher Konfidenz und auch für ALT-positive Zellen, die keine ultrahellen Punkte aufweisen, bestimmen.Unter der Verwendung von Mikroskopiebildern der St. Anna Kinderkrebsforschung (Wien) werden in dieser Masterarbeit verschiedene Klassifikationsmodelle zweier Ansätze zur Vorhersage des ALT Status verglichen. Im ersten Ansatz diskutiert die Arbeit die manuelle Erzeugung von Prädiktoren, um sie in Klassifikationsmodellen zu verwenden. Die Arbeit führt dafür mit dem sogenannten Wassersteindistanzmodell auch ein neues Modell ein, das auf Wasserstein-Metriken zwischen Prädiktorverteilungen beruht. Im zweiten Ansatz werden Deep Learning Methoden verwendet, in denen die Bilder direkt genutzt werden, um Prädiktoren automatisch zu finden und die Zellen zu klassifizieren. Die Masterarbeit behandelt zwei zentrale Fragen. Die erste Frage klärt, welches Modell der zwei Ansätze den ALT Status von Zellen am Besten voraussagt. Die zweite Frage erörtert, welche bildbasierten Prädiktoren am Ehesten geeignet sind, den ALT Status von Zellen zu bestimmen. In dieser Arbeit beantworten wir die Fragen, indem wir zeigen, dass das Wassersteindistanzmodell die mit Abstand genauesten Ergebnisse bei der Vorhersage des ALT Status liefert. Mit Ausnahme des Wassersteindistanzmodells übertreffen Deep Learning Methoden Ansätze der manuellen Prädiktorerzeugung. Zudem weist die Masterarbeit nach, dass Prädiktoren, die auf der Größe von Telomerpunkten, auf visuellen telPNA Clustern und der Schiefe und Wölbung der telPNA Intensitäten basieren, sehr gut für die Vorhersage des ALT Status von Zellen geeignet sind. Auch wenn weitere Forschung notwendig ist, um unsere Erkenntnisse für zusätzliche Zellinien und Gewebeschnitte zu bestätigen, zeigen die Resultate, dass Computer-gestützte Diagnoseverfahren zur Unterstützung von Experten bei ALT-Klassifizierungen möglich sind.
de
Alternative lengthening of telomeres (ALT) is a mechanism in cancer cells that stops telomere shortening, which would accompany proliferation of normal cells. Diagnosing whether the cell’s chromosomes are ALT+ or not (i.e. ALT-) is a key determinant for a poor outcome in childhood neuroblastoma tumors. Using telomere PNA (telPNA) fluorescence in-situ-hybridisation, telomeres can be visualised as spots in microscopy images. Longer telomeres exhibit brighter and more pronounced (so-called ultra-bright) spots. Currently, clinical staff determines the ALT status of cells in telPNA images based on expert judgement or rules-of-thumb on visible ultra-bright spots. To date, there are no image-derived, clear-cut objective or automated rules for determining the ALT status with high confidence, especially for ALT+ cells that do not show ultra-bright spots.Using microscopy imaging of the Children's Cancer Research Institute (Vienna, Austria), in this master’s thesis different classification models for the prediction of the cells' ALT status are designed and evaluated following two streamlines: (1) image feature-based classification approaches (2) image-based classification approaches. In the first approach, the master’s thesis discusses feature generation that shall serve as explanatory variables for classification models (such as logistic regressions) to predict the ALT status. To that end, the master's thesis also first introduces a so-called Wasserstein distance model to classify the ALT status using Wasserstein distances between distributions of explanatory variables. In the second approach, the master’s thesis uses deep learning to classify cells using microscopy images as direct inputs. This master's thesis addresses two main research questions: first, we are interested which model of the two approaches predicts the ALT status of cells best. Second, we want to find image-derived features of both approaches that are best suited for determining the ALT status. We answer theses questions by showing that the Wasserstein distance model provides by far the best results when predicting the ALT status of cells. Apart from the Wasserstein distance model, image-based classification approaches outperform image feature-based approaches. Furthermore, we find that features that build on spot sizes, the presence of clusters as well as the skewness and kurtosis of telPNA intensities are best suited for predicting the ALT status. While further research is necessary to foster our findings on additional cell lines and tissues, the results show that computer-aided diagnostics of ALT is feasible and may support experts when predicting the ALT status.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers