Edthofer, A. (2023). Model-based approaches for sleep stage classification using time-domain EEG analysis [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.111723
E101 - Institut für Analysis und Scientific Computing
-
Date (published):
2023
-
Number of Pages:
75
-
Keywords:
Schlafstadienklassifikation; EEG; Elektroenzephalogramm; Permutation Entropy; Entropy of Difference; Kullback-Leibler Divergenz; Granger Causality; Lineare Support Vector Machine; Linear Discriminant Analysis
de
Sleep Stage Classification; EEG; Electroencephalogram; Permutation Entropy; Entropy of Difference; Kullback-Leibler Divergence; Granger Causality; Linear Support Vector Machine; Linear Discriminant Analysis
en
Abstract:
Diagnose von Schlafstörungen ist aufgrund der Regeneration des Körpers während des Schlafs von enormer Wichtigkeit für unsere Gesellschaft. Dies passiert mittels Untersuchungen im Schlaflabor und anschließender Schlafstadienklassifikation, welche manuell ausgeführt bis zu zwei Stunden dauern kann. Daher wird nach semiautomatisierten oder au- tomatisierten Prozessen geforscht, um die Klassifikation zu beschleunigen. In den letzten Jahren ist diesbezüglich vor allem maschinelles Lernen federführend, was jedoch noch nicht in breiter klinischer Verwendung ist. In dieser Arbeit wird daher ein einfaches interpretierbares Modell zur Schlafstadienklassifikation gesucht, das Forschenden, Ärzt:innen wie auch Patient:innen leicht zu erklären ist. Für Modellierung der Hirnaktivität gibt es aufgrund mangelnder Kenntnisse darüber keine beschreibenden Gleichungen, stattdessen müssen Parameter gefunden werden, die uns die komplexen Vorgänge im Gehirn modellieren. Grundlegende Messung dazu ist das Elektroenzephalogramm. Von diesem Signal werden Features berechnet, diese Arbeit beschäftigt sich vor allem mit Entropie-basierten, wie der Permutation Entropy, der Entropy of Difference und der Kullback-Leibler Divergenz, sowie der Granger Causality. Diese werden mathematisch detailliert erläutert. Abgesehen davon werden noch statistische Parameter sowie das Alter verwendet, um verschiedene Modelle basierend auf Algorithmen des maschinellen Lernens mit der CAP Sleep Database zu trainieren. Die Implementierung erfolgt in MATLAB. Die Ergebnisse zeigen, dass einfache lineare Modelle mit komplexeren in Bezug auf Genauigkeit mithalten können. Diese sind leichter interpretierbar und daher auch besser Laien zu erklären. Durch Erhöhung der Feature Anzahl kann die Genauigkeit sogar noch verbessert werden, auch wenn die gewünschte Genauigkeit nicht erreicht werden konnte. Somit hat diese Arbeit dazu beigetragen zu zeigen, dass die Klassifikation von Schlafstadien nicht auf Black-Box Modellen beruhen muss, sondern auch mit einfachen EEG-basierten Modellen durchgeführt werden kann.
de
Classification of different levels of consciousness is of great importance in the diagnosis of sleep disorders. Semi-automated or automated strategies are advised to facilitate and accelerate the procedure. Different methods which achieve a good accuracy have been proposed in research, most of them are based on machine learning algorithms. However, none of them is in widespread use in the clinical or preclinical field so far. For acceptance in the medical sector, a model has to be interpretable, which many of these artificial intelligence-based models lack. Our approach aims to create an explainable model for understanding and analysing electroencephalogram (EEG) data. Due to the complex structure of the brain, a modelling strategy that is based on rules and equations is not possible in neuroscience. Classical modelling combined with machine learning supports the development of a mathematical and computational framework for classification of sleep stages. For a given EEG signal, features are extracted from the signal that should predict the level of consciousness. The focus lies on entropy-based parameters, such as Permutation Entropy, Entropy of Difference and Kullback-Leibler Divergence, as well as Granger Causality is used. These are explained in every detail and used, in combination with statistical features and a personal parameter of the patient, for the creation of different machine learning models. They are trained, tested and compared regarding their performance and interpretability. The training dataset is the CAP Sleep Database. The implementation and tests are all run on MATLAB. The results show that linear models, which are much more explainable and easier to interpret, can compete with more complex ones regarding the performance. The desired accuracy cannot be achieved, but it is presented, how enhancements of the models can improve the results. Therefore, this thesis has contributed to show that sleep stage classification does not have to rely on black-box modelling, but can also work with plain EEG-based models.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers