Gadermaier, T. (2023). A time-series classification approach to error prediction in hybrid fiber-coaxial networks [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.91268
Die vorliegende Arbeit behandelt die Vorhersagbarkeit gewisser Fehler in HFC-Datennetzen, welche in weiten Teilen Österreichs für Internetzugänge genutzt werden. Diese Fehler betreffen überwiegend den Kanal von den Modems der Kunden zum Provider. Die für diese Netze genutzten Kabelmodems sammeln für den Betrieb notwendige die Übertragungsqualität betreffende Daten welche beim Provider zusammenlaufen (Telemetrie). Die Vorhersage von Fehlern soll dem Betreiber des Netzes ermöglichen, Ressourcen für die Wartung von Netzwerkkomponenten besser planen zu können. Ausgehend von den Telemetriedaten der Modems (multivariate Zeitreihen) soll die zeitliche Entwicklung einer dieser Variablen, die als Proxy für die Übertragungsqualität und Abwesenheit von Fehlern dient, vorhergesagt werden. Als Vereinfachung des Problems wird nicht der eigentliche zeitliche Verlauf selbst, sondern das Überschreiten eines Schwellwertes vorhergesagt, was einer binären Klassifikation entspricht.Dafür werden dem Stand der Technik entsprechende Modelle des maschinellen Lernens für die Klassifikation von multivariaten Zeitreihen auf die Daten angewandt. Dabei handelt es sich um zwei auf Zeit\-reihen spezialisierte tiefe künstliche neuronale Netze und ein Modell welches zufällig generierte Faltungskerne zur Ableitung von Merkmalen aus den Daten mit klassischen Klassifizierungsmodellen kombiniert. Ein wichtiger Aspekt ist das in den Daten stark vorherrschende Ungleichgewicht zwischen den beiden Klassen, der Abwesenheit und Anwesenheit der Fehlerfälle, welches sich stark negativ auf die Leistungsfähigkeit von Klassifizierungsmodellen auswirken kann. Daher werden Methoden zur Behandlung des Ungleichgewichts zunächst theoretisch beleuchtet und dann in praktischen Experimenten angewandt. Eine Serie von Experimenten überprüft die Eignung der genannten Modelle für die vorliegende Klassifizierungsaufgabe, unter Anwendung weitreichender automatischer Anpassung von Hyper-Parametern sowie Methoden der Regularisierung. Es zeigt sich eine prinzipielle Eignung der Modelle für die Vorhersage von Fehlerfällen, wobei eine weitere Steigerung des positiven Vorhersagewertes (Precision) wünschenswert wäre. Für eine abschließende Beurteilung, welche im Rahmen dieser Arbeit nicht durchgeführt wird, ist die Kenntnis von Kosten für die Fehlerfälle notwendig.
de
This thesis investigates the suitability of machine learning methods for predicting specific types of errors in HFC-networks that are used throughout Austria for access to the internet.These errors occur mostly in the upstream path, from customer's modems towards the provider.The modems gather data related to the transmission quality required for the network operation, these are collected further up the network.Predicting errors aims at enabling the network operator to schedule resources for the (future) maintenance of network components.Among the telemetry data collected from the modems is one variable that serves as proxy for the network transmission quality.The temporal evolution, especially the exceeding of a threshold, of the proxy variable is of particular interest.The problem is thus formulated as a binary classification problem, where exceeding the threshold is the target event to be predicted.To this end, state of the art machine learning models for the classification of multivariate time-series are employed.In particular, two deep-learning models specialized to the time-series classification task are applied, in addition to a model that generates random convolution kernels for generating features from the data, combined with classical classifiers.An important property of the data is the strong imbalance between the two classes that are the presence or absence of errors.Strong class imbalance can lead to catastrophically bad performance of classifier models.Thus, methods for treating class imbalance are discussed and applied during experiments.A series of experiments investigates the suitability of the mentioned models for the given binary classification task, employing extensive automatic tuning of hyper-parameters as well as methods for regularization.The experiments reveal that the models are in general suitable for the task of predicting error cases, but a further improvement of precision is desirable. A final evaluation, requiring concrete cost factors for the error cases, is beyond the scope of this thesis.