Lettner, M. (2010). On the combination of spatial and spectral features for image restoration [Dissertation, Technische Universität Wien]. reposiTUm. https://resolver.obvsg.at/urn:nbn:at:at-ubtuw:1-36154
Digitale Dokumentenanalyse; Markov Random Field; Belief Propagation für MRF höherer Ordnung
de
Document Image Analysis; Markov Random Field; Image Binarization; higher order Belief Propagation
en
Abstract:
Die Anwendung der multispektralen Bildgebung ist eine bekannte Methode zur Analyse und Digitalisierung von alten Handschriften. Der Vorteil bei der Analyse von mehreren Spektralbereichen, einschließlich des ultravioletten und infraroten Bereichs, ist die zusätzliche Information, die für das menschliche Auge unsichtbar ist. Die multispektralen Bilder werden nicht nur für eine visuelle Inspektion verwendet, sie dienen auch als Grundlage für eine computergestützte Analyse, wie zB. einer Bildverbesserung. Diese Dissertation behandelt zwei Aspekte für die digitale Bild-Restaurierung in multispektrale Bildern von Dokumenten. Das erste Problem behandelt eine Verbesserung der Lesbarkeit in multispektralen Bildern von historischen Dokumenten.<br />Aufgrund von Schimmel, Luftfeuchtigkeit, Wasser, etc., können auf Pergament und dem Text teilweise Beschädigungen auftreten, welche die Lesbarkeit der Dokumente einschränken. Die vorgeschlagene Methodik für die Verbesserung der Lesbarkeit basiert auf einer räumlichen und spektralen multivariaten Analyse der Bilddaten. Der Hauptvorteil der Methode ist, dass insbesondere Textregionen berücksichtigt werden. Der zweite Teil dieser Dissertation beschäftigt sich mit der Trennung von Text und Hintergrund, was ein wesentlicher Schritt in der digitalen Bildanalyse ist. Allerdings ist diese die Trennung in Dokumenten mit schlechter Qualität problematisch. Diese Arbeit stellt eine robuste Methode für die Vordergrund-Hintergrund-Trennung in multispektralen Bildern vor, welche räumliche und spektrale Informationen zur Bearbeitung verwendet. Im Gegensatz zu Studien, die entweder spektrale oder räumliche Merkmale verwenden, konzentriert sich die vorgestellte Methode auf beides gleichzeitig, um die Segmentierung zu verbessern und zu verfeinern. Die vorgeschlagene statistische Methode integriert räumliche und spektrale Eigenschaften im Rahmen eines higher-order Markov Random Field und nutzt eine neue effiziente Methode zur statistischen Auswertung. Die spektrale Information wird aus dem spektralen Verhalten der multispektralen Bilder extrahiert und die räumlichen Abhängigkeiten werden durch Eigenschaften der vorhandenen Buchstaben und Striche erfasst. Durch das Auffinden von lokalen Minima und die Möglichkeit verschiedenste Funktionen zu verwendenden, wird Belief Propagation für die Optimierung der higher-order Energie-Funktion implementiert. Wir passen die Standard-Formulierung von Belief Propagation für Modelle höherer Ordnung an, welche wir als BPn bezeichnen. Die vorgeschlagene Methode erfordert kein Training und ist unabhängig von Schrift, Größe und Stil der Buchstaben.<br />
de
The application of multispectral imaging is a well known method for the analysis and digitization of decayed manuscripts. The main advantage in analyzing multiple spectral ranges, including the ultraviolet and infrared range, is the additional information which is invisible to the human eye. The multispectral images obtained are not only used for a visual inspection, they also serve as input for a computer based analysis, like image enhancement.This dissertation focuses on two aspects for image restoration in multispectral images of degraded documents.<br />The first problem relates to the general enhancement of the readability in multispectral images of historical documents. Due to mold, air humidity, water, etc., parchment and text may partially be damaged and consequently hard to read. The proposed methodology for readability enhancement is based on a spatial and spectral analysis of the multivariate image data. The main advantage of the method is that especially text regions are enhanced which is provided by generating a mask image. The second part of this dissertation deals with the separation of text from background. However, degraded documents complicate the separation.<br />We propose a robust method for foreground-background separation in multispectral images, which incorporates spatial and spectral information. In contrast to related studies which exploit either spectral or spatial features, the proposed method will focus on both simultaneously to improve and refine the separation results. The proposed statistical framework incorporates spatial and spectral features in the context of a higher-order Markov Random Field and takes advantage of a new efficient method for statistical inference. Spectral information is extracted from the spectral behavior of the multispectral images and the spatial dependencies are captured by means of stroke properties. Providing a strong local minimum and the potential of using arbitrary potential functions, belief propagation is applied for the optimization of the higher-order energy function. In order to include the higher-order stroke model, we adapt the standard formulation of belief propagation to higher-order models, which will be abbreviated as BPn.