Weingant, M. (2016). Quantification of nuclei in synthetic Ki-67 histology images of the breast : image analysis in digital pathology [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.22680
Digital Pathology; Classification; ROI selection; Image Analysis
de
Abstract:
Brustkrebs ist eine häufige Erkrankung und sowohl die Diagnose, als auch die Entscheidung für die bestmögliche Behandlung basieren zu einem großen Teil auf einer Reihe an Untersuchungen durch Pathologen und Pathologinnen. Diese Untersuchungen werden traditionellerweise an Gewebsproben durchgeführt, die hierfür in dünne Scheiben geschnitten werden. Die im letzten Jahrzehnt aufgekommene Digitale Pathologie erlaubt es, eingescannte Gewebsschnitte digital zu betrachten und zu analysieren, die zuvor manuell unter dem Mikroskop begutachtet wurden. Eine der Untersuchungen in der Brustkrebsdiagnose berücksichtigt die Messung der Proliferationsaktivität der Zellkerne, welche einen Indikator für Tumorwachstum darstellt. Die Proliferationsaktivität wird als Labeling Index bezeichnet (LI, Verhältnis an sich teilenden vs. sich nicht teilenden Zellkernen) und kann durch eine Färbemethode namens Ki-67 auf dem Gewebsschnitt sichtbar gemacht werden. Das Ziel der vorliegenden Arbeit ist es, einen Algorithmus zu entwickeln und zu evalulieren, der den Ki-67 LI auf einem digitalen Schnitt automatisch misst. Der Algorithmus fußt auf der Farbzerlegung der Bilder, der sie in zwei Kanäle aufteilt: einen Farbkanal, der die in Teilung befindlichen (Ki-67 positiven) und einen, der die nicht in Teilung befindlichen (Ki-67 negativen) Zellkerne zeigt. Dafür werden drei Ansätze zur Farbzerlegung implementiert und getestet. Jeder Kanal wird hiernach in mehreren Schritten weiterverarbeitet, wobei etablierte Bildverarbeitungsschritte angewandt werden, und in einer Segmentierung aller Kerne in jedem Kanal resultiert. Die Anzahl der Kerne in jedem Kanal wird gezählt und daraus ergibt sich der LI für jedes Bild. Vor der Bildanalyse sind keine überwachten Lernschritte auf annotierten Daten vonnöten. Um das Ergebnis des Algorithmus zu evaluieren wird ein vollständig annotiertes Datenset von Ki-67 gefärbten Bildern der Brust benötigt. Da kein solches Vergleichs-Datenset dieses Gewebe- und Färbetyps existiert, wird ein synthetisches Datenset erstellt, das manuell extrahierte Zellkerne von digitalisierten, klinischen Ki-67 Schnitten verwendet und anhand einer neuartigen Synthese-Methode die Definition von variablen Kernverteilungen, LIs und Färbungseigenschaften erlaubt. Die so generierten Bilder stellen eine detaillierte Grundwahrheit dar. Eine ausführliche, auf den synthetischen Bildern basierende Evaluierung ergibt, dass der vorgestellte Algorithmus in der Lage ist, den LI in einem Bild bis auf einen absoluten Fehler von 1.5% zu messen.
de
Breast cancer is a common disease and the diagnosis as well as treatment decisions are among other factors largely based on a number of examinations by the pathologist. They are traditionally conducted on tissue samples sliced into thin slides. In the last decade the field of Digital Pathology has emerged, which after scanning of the tissue slides allows the digital viewing and analysis of tissue slides formerly manually examined under the microscope. One of the exams in breast cancer diagnosis includes the quantification of the proliferative activity of nuclei, which is an indicator of tumor growth. The proliferative activity is expressed as the Labeling Index (LI, rate of dividing vs. non-dividing nuclei) and is made visible on a tissue slide with a stain called Ki-67. The aim of the work presented is to develop and evaluate an algorithm for the automatic quantification of the Ki-67 LI on a digitized slide. The algorithm is based on the color deconvolution of the images, dividing the image into two channels: one showing the dividing (Ki-67 positive) and one showing the non-dividing (Ki-67 negative) nuclei. Three deconvolution approaches are implemented and tested. Each channel is hereafter postprocessed using a pipeline of well-established image processing steps and the result is a segmentation of all nuclei found in each channel. The amount of nuclei in each channel is quantified and yields the LI for each image. No supervised training on labeled data is required prior to the image analysis. In order to evaluate the performance of the algorithm, a fully labeled dataset of Ki-67 stained images of the breast is required. Because no benchmark dataset of this tissue and stain type is available, a synthetic dataset is built, using nuclei manually extracted from digitized clinical Ki-67 slides and a novel synthesis method, allowing the definition of varying nuclear arrangement, LIs and stain appearances. The images in the datasets generated provide detailed ground truth information. An in-depth evaluation based on the synthetic images points out that the presented algorithm is able to estimate the LI in an image with an absolute error of 1.5%.