Gschaider, N. (2016). Automatische Klassifikation von Herzschlägen im Elektrokardiogramm durch die Support Vektor Maschine und Selbst Organisierte Karte [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.36867
E101 - Institut für Analysis und Scientific Computing
-
Date (published):
2016
-
Number of Pages:
81
-
Keywords:
Klassifizierung; Self Organizing Maps; Support Vector Machines; Elektrokardiogramm; Extrasystolen
de
Classification; Self Organizing Maps; Support Vector Machines; Electrocardiogram; Extrasystoles
en
Abstract:
Herz-Kreislauf-Erkrankungen sind in Österreich die häufigste Ursache für einen frühzeitigen Tod. Diese Tatsache gibt Medizinern und Forschern Anlass, bestehende Früherkennungssysteme zu verbessern oder mithilfe von Modellbildung neu zu entwickeln. Da Herzrhythmusstörungen oft ein Indiz für Herzkrankheiten sind, stellen sie einen guten Ausgangspunkt dar, eine genauere Untersuchung des Patienten einzuleiten. Mittels Elektrokardiogramm (EKG) aufgezeichnete Daten können dafür so ausgewertet werden, dass diese Rhythmusstörungen klassifiziert werden können. Störungen sind durch Abweichungen der regelmäßigen Herzschlagfolge oder der üblichen Form des EKG-Signals der einzelnen Herzschläge gekennzeichnet. Dabei gilt es, Arten von Herzschlägen zu bestimmen und in weiterer Folge Herzrhythmusstörungen von gesunden Herzrhythmen zu unterscheiden. Die einzelnen Klassen stellen Anhaltspunkte für bestimmte Herzkrankheiten dar. Das Ziel dieser Arbeit ist, auf Basis von von Medizinern annotierten EKG-Daten einen Algorithmus zu entwickeln, der EKG-Aufzeichnungen von verschiedenen Herzpatienten analysiert und klassifiziert. Die Entwicklung der Software und die Implementierung verschiedener Klassifizierungsmethoden erfolgen in der Entwicklungsumgebung MATLAB®. Es gibt verschiedenste Möglichkeiten und Modelle, diese Klassifikation vorzunehmen. In dieser Arbeit werden dafür Self Organizing Maps (SOM), Support Vector Machines (SVM) und eine Kombination daraus angewendet. Zunächst werden die entsprechenden Daten vorverarbeitet und für die Klassifikation aufbereitet. Dafür werden Statistiken höherer Ordnung (HOS) und Hermitesche Basisfunktionen (HER) zur Merkmalsextraktion angewendet und die EKG-Signale in eine Matrix von Merkmalstupeln transformiert. Diese entspricht dann einer Repräsentation der originalen EKG-Daten. Eine Support Vektor Maschine klassifiziert zuvor zugeordnete Daten, indem die optimale Hyperebene gefunden wird, die alle Daten einer Klasse von denen einer anderen trennt. Sie gehört zu den Verfahren des überwachten Lernens. Im Vergleich dazu wird die Selbst Organisierte Karte als Bespiel für ein Verfahren unüberwachten Lernens auf die Daten angewendet. Diese entscheidet automatisch nach Ähnlichkeit der Daten die Zugehörigkeit zu Clusters. Die Evaluierung der Resultate erfolgt durch einen Vergleich mit den Annotationen der Daten. Die Algorithmen sollen diese entsprechende Klassifikation mit hohem Exaktheitsgrad, also minimalem Fehler, vornehmen. Simulation der Klassifikation mit annotierten Daten ergab eine Erkennungsrate von 74.7% für die Selbst Organisierte Karte. Die Support Vektor Maschine wies unter Verwendung der beiden vorverarbeitenden Methoden HOS und HER eine Erkennungsrate von 88.4% für HOS und 87% für HER auf. Diese werden durch ein Verfahren zur Kombination (gewichtetes Voting Prinzip) mit einem durchschnittlichem Wert von 92.8% deutlich verbessert. Abschließend kann diese Kombination damit als Basis für eine automatische EKG-Annotation dienen.
de
Cardiovascular diseases are the leading cause of premature death in Austria. This fact gives doctors and researchers a reason to improve existing early warning systems or develop new ones, some with the help of modeling. Since arrhythmias are often an indicator for heart diseases, they are a good starting point for a detailed investigation of the patient's conductive system of the heart. The electrocardiogram (ECG) is a graphic representation of the function of the conductive system. Disorders are characterized by deviations of the regular heartbeat sequence or the usual shape of the ECG signal of the individual heartbeats. It can be evaluated using classification methods to identify types of heartbeats associated with disorders. The aim is to distinguish between cardiac arrhythmias and healthy heart rhythms. The aim of this work is to develop an algorithm on the basis of medical annotated ECG data that analyzes and classifies the recordings from different cardiac patients. The development of software and the implementation of different classification methods are performed in the development environment MATLAB®. There are many different methods and models for this classification. In this work, Self Organizing Maps, Support Vector Machines, and a combination thereof are applied. First, the corresponding data is preprocessed and prepared for classification by using Higher Order Statistics (HOS) and Hermite Basis Functions Expansion (HER) for feature extraction. Cardiac signals are transformed into a feature matrix which represents the original ECG data. A Support Vector Machine classifies annotated data by an optimal hyperplane that separates all data of one class from data of another class. It belongs to the group of methods of supervised learning. In contrast, a Self Organizing Map is applied as an example of unsupervised learning. It automatically assigns the data to cluster due to similarity. The evaluation of the results is performed by comparison with the annotations of the data. The algorithms have to be designed with a high accuracy level, so that they show minimal error. Simulation of the classification using annotated data showed an accuracy of 74.7% for the Self Organizing Map. By using the two preprocessing methods HOS and HER, the Support Vector Machine showed an accuracy rate of 88.4% for HOS and 87% for HER. These are significantly improved by a method of combination (weighted voting principle) with an average value of 92.8%. In conclusion, this combination can serve as a basis for annotating ECG signals automatically.
en
Additional information:
Zusammenfassung in englischer Sprache Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers