Title: Learning Representations from Crowdsourced Network Benchmarks
Language: English
Authors: Eller, Lukas 
Qualification level: Diploma
Keywords: Machine Learning; NN; LTE; Matlab; Crowdsourcing
Advisor: Rupp, Markus  
Assisting Advisor: Svoboda, Philipp  
Issue Date: 2020
Number of Pages: 145
Qualification level: Diploma
Abstract: 
Zur Erstellung von Benchmarks von Mobilfunknetzen wird seit einigen Jahren verstärktauf Crowdsourcing zurückgegriffen. Da Crowdsourcing per Definition nicht unter kontrolliertenBedingungen durchgeführt wird, ist es jedoch erforderlich den Kontext einerMessung zu berücksichtigen um faire Network-Benchmarks zu erhalten. Ausgehend voneiner Sammlung an selbst-durchgeführten Messungen an einem Referenz LTE eNodeB,befasst sich diese Arbeit mit einem der kritischen Aspekte im Bereich der Kontextbestimmung- die Klassifizierung einzelner Messungen in tarif-limitert oder unlimitiert.Dafür werden zunächst die relevanten Merkmale einzelner Messungen in einem Feature-Vector mit niedriger Dimension gebündelt. Es stellt sich heraus, dass diese Merkmalebereits eine annährend fehlerfreie Klassifizierung des Trainingsdatensatzes ermöglichen.Dieser Feature-Vector fungiert ferner als Grundlage für eine Klassifizierung basierend aufLabel-Spreading. Als Semi-Supervised Algorithmus bietet Label-Spreading die Möglichkeitauch nicht-gelabelte Daten während des Trainingsprozess zu berücksichtigen. Durch diesomit erhöhte Anzahl an Trainingsdaten kann eine Accuracy von 99% erreicht werden.Die Anschliessende Klassifizierung der Crowdsourcing-Daten ermöglicht die Entfernungtarif-limitierted Messungen — die übrigen Tests dienen somit als Grundlage für einNetzbetreiber Ranking, das unabhängig von der jeweilgen Tarifstruktur ist.Der zweite Teil dieser Arbeit beschäftigt sich mit der Verarbeitung von Crowdsourcing-Messungen mithilfe von Autoencodern. Die Verwendung von Deep-Learning-Techniken zurVerarbeitung von Network-Benchmarks in einem Unsupervised-Setup adressiert die begrenzteVerfügbarkeit von gelabelten Messungen. Die erhaltene Latent-Space Darstellungermöglicht die Auswertung von hochdimensionalen Datensätzen und kann als Grundlagefür nachfolgende Inference-Tasks dienen. Die Auswertung eines 2-D-Latent-Space zeigt,dass der Autoencoder eine Darstellung lernt, die die gesammelten Datensätze in limitierteund unlimitierte Tests unterteilt. Des Weiterene, hebt der Autoencoder bei Anwendungauf Crowdsourcing-Daten die Tarifstruktur verschiedener Mobilfunknetzbetreiber hervor.Durch diesen zweistufigen Ansatz wird das Thema umfassend behandelt. Neben derKlassifizierung von Tarifflimitierungen in Crowdsourcing Network-Benchmarks dient dieArbeit somit auch als Fallstudie zur Durchführung von Regressions- oder Klassifizierungs-Aufgaben in einer Umgebung mit nur wenig gelabelten Datensätzen und einer begrenzterVerfügbarkeit von Parametern.

In recent years there has been increased adoption of crowdsourced approaches in the realmof mobile network benchmarking. Compared to controlled drive tests, such approachesoffer increased coverage — both in the spatial and temporal domain. However, obtainingfair network benchmarks from user measurements requires additional context information,as crowdsourced measurements are, by definition, not conducted under controlled conditions.Such context information might include tariff-limits, indoor/outdoor detection,or whether a user was static or moving during the measurement. The inference of suchindicators tends to be challenging due to the limited availability of parameters and thetedious process of collecting labeled measurements.Based on a data set I collect in a reference LTE eNodeB, this work tackles one ofthe critical aspects in the realm of context inference — the detection of tariff-limitedmeasurements. This is achieved following a two-step approach: First, I process theraw measurements into a vector consisting of carefully selected features that allow forseparation of the training data set almost without error. I further deploy a semi-supervisedmachine learning algorithm operating on this feature vector. This approach based on labelspreading can also make use of unlabeled tests — thus tackling the limited availabilityof labeled measurements. Results show that the classifier achieves an accuracy of 99%when validated on a self-collected representative outdoor data set. After applying theclassifier to a crowdsourced data set and removing the limited tests, I obtain an operatorbenchmark from the network view.In a second step, I evaluate the application of autoencoders for representation learningin this field. Using deep learning techniques to process network measurements in anunsupervised setup, tackles the limited availability of labeled samples in a comprehensiveway. The obtained latent space representation allows for large scale analysis of highdimensionaldata sets and can act as the basis for a subsequent learning task. Evaluationof the 2D latent space shows that the autoencoder learns a representation that separatesthe collected data sets into limited and unlimited tests. When applied to crowdsourceddata, the autoencoder highlights the tariff-structure of different mobile network operators.By following this two-step approach, this work covers the topic comprehensively. Besidestackling the particular challenge of tariff-detection in crowdsourced network benchmark,it also acts as a case study on how to conduct inference in an environment with only asmall number of labeled samples and a limited availability of parameters.
URI: https://doi.org/10.34726/hss.2020.78925
DOI: 10.34726/hss.2020.78925
Library ID: AC15703914
Organisation: E389 - Telecommunications 
Publication Type: Thesis
Hochschulschrift
Appears in Collections:Thesis

Files in this item:

Show full item record

Page view(s)

38
checked on Feb 22, 2021

Download(s)

11
checked on Feb 22, 2021

Google ScholarTM

Check


Items in reposiTUm are protected by copyright, with all rights reserved, unless otherwise indicated.