Raida, V. (2021). Data-driven estimation of spatiotemporal performance maps in cellular networks [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2021.80644
5G; LTE; Performance Map; Mobile Broadband; Estimation; Measurement
en
Abstract:
Bei vielen laufzeitunempfindlichen Anwendungen (z.B. gepuffertes Video, Datenübertragung von einer Cloud) ist der End-to-End-Datendurchsatz der wesentlichste Key-Performance-Indicator (KPI). In zellulären Netzwerken ist der erreichbare Endkundendurchsatz (der Durchsatz, den der Kunde erfährt, wenn er versucht, größtmögliche Datenvolumen herunterzuladen) eine raumzeitliche Funktion, deren Schätzung ein anspruchsvolles bisher ungelöstes Problem darstellt. Eine genaue Vorhersage des erreichbaren Durchsatzes an einem bestimmten Standort in einem bestimmten Zeitintervall würde den Mobilfunknetzbetreibern erlauben, ihre Netze weiter zu optimieren und ihren Kunden besser personalisierte Dienstleistungen anzubieten. Die Vorhersage würde den Kunden ermöglichen, fundiertere Entscheidungen bei der Betreiberauswahl zu treffen. Diese Dissertation bewertet die Einwirkung der individuellen Parameter auf den erreichbaren Durchsatz in zellulären Netzwerken und analysiert die Machbarkeit und Limitierungen von realistischer raumzeitlicher KPI-Kartenerstellung. Um die Beziehungen zwischen den KPIs zu modellieren, habe ich stationäre LTE-Downlink-Messkampagnen im Labor und im betrieblichen Netz durchgeführt und die Ergebnisse mit Daten vom Mobilfunknetzbetreiber kombiniert. Ich entwickle ein Modell, das die Zelllast aus reference signal received quality (RSRQ) schätzt. Ein weiteres Model sagt reference signal-signal to interference plus noise ratio (RS-SINR) aufgrund von reference signal received power (RSRP) der versorgenden Zelle und von RSRPs und Zelllasten der Interferenzzellen vorher. Ich simuliere den Einfluss der Nutzerpopulation auf die Resourcenverteilung und auf den erreichbaren Durchsatz in der versorgenden Zelle. Das Trainieren eines Modells, das alle Input-KPIs gemeinsam berücksichtigt, ist wegen des sogenannten "Fluchs der Dimensionalität" nicht möglich. Als Ausweg schlage ich eine Trennung des Modells in mehrere sequenzielle Komponenten vor. Trotzdem benötigen die einzelnen Komponenten eine ausreichende Menge von Daten aus verschiedenen Standorten und Zeitpunkten. Eine Methode zur Erfassung großer Datenmengen ist das sogenannte "Crowdsensing" - eine Vorgehensweise, bei der anonyme Endkunden verteilte Messungen beitragen. Meine Analyse jedoch zeigt, dass in den derzeitigen Crowdsensing-Datenquellen KPIs fehlen, von denen der erreichbare Durchsatz abhängt. Deshalb konzentriere ich mich ausführlicher auf die raumzeitliche Modellierung von RS-SINR. Die zeitliche Analyse von Crowdsourced-RSRP-Messungen bestätigt, dass RSRP an einem festen Ort als zeitinvariant modelliert werden kann. Die raumzeitlichen RS-SINR-Karten ergeben sich daher aus zeitinvarianten RSRP-Werten und ortsunabhängigen Zelllastzeitreihen. Da sich der kleinräumige RSRP-Schwund im Laufe der Zeit nicht ausgleicht, sind mobile Messungen notwendig, um Pfadverluste und Abschattungen zu erfassen. Wiederholte Fahrtests sind entscheidend für die Abschätzung der Zuverlässigkeit der gemessenen RSRP. Aufgrund von GPS-Lokalisierungsfehlern und unterschiedlichen Geschwindigkeitsprofilen während der einzelnen Fahrten stellt die Synchronisierung mehrerer Wiederholungen eine Herausforderung dar, die ich durch eine Modifikation des Dynamic Time Warping (DTW)-Algorithmus löse. Das modifizierte DTW ermöglicht eine optimale Ausrichtung der wiederholten Messungen entlang eines vordefinierten Pfades. Wiederholte DTW-ausgerichtete Fahrtests ergeben mehrere Abtastwerte pro Ort. Daher leite ich eine effiziente Lösung der Gaußschen Prozessregression (GPR) mit wiederholten Trainingsorten ab, deren Rechenkomplexität kubisch mit der Anzahl der unterschiedlichen Trainingsorte skaliert, anstatt mit der Gesamtzahl der Trainingsstichproben. Abschließend wende ich das vorgeschlagene modifizierte DTW und die GPR auf selbst durchgeführte Fahr- und Gehtests in einem betrieblichen LTE-Netz an.
de
For a large class of non-delay-critical applications (e.g., buffered video streaming or data transfer from cloud services to local devices), end-to-end throughput becomes the most crucial key performance indicator (KPI). In cellular networks, the achievable end-user throughput (the maximum throughput a user will get when attempting to download as much data as possible) is a spatiotemporal function, and its estimation poses a challenging and as-yet unsolved problem. The ability to accurately predict achievable throughput in a given location and time interval would, for example, allow mobile operators to further optimize their networks and design more personalized offers for the customers, or allow end-users with mobile broadband modems to make more informed decisions when selecting a provider. This work investigates the impact of individual parameters on the end-user achievable throughput in cellular networks and analyzes the feasibility and limitations of constructing realistic spatiotemporal KPI maps. To allow for the modeling of dependencies between individual KPIs, I conducted multiple static real-world and lab-measurement campaigns in LTE downlink and combined them with data provided by a mobile network operator. I propose and evaluate a model that estimates cell load from reference signal received quality (RSRQ), and another model that predicts reference signal-signal to interference plus noise ratio (RS-SINR) from a serving cell's reference signal received power (RSRP) and interfering cells' RSRPs and cell loads. Further, I simulate the influence of the user population on resource sharing in the serving cell and its impact on the achievable throughput. End-to-end training of a throughput model that jointly considers all input parameters would be hindered by the "curse of dimensionality." Hence, I propose a separation into multiple sequential model components. Despite this separation, the individual components still require sufficient data from different times and locations to reconstruct realistic spatiotemporal maps. One possible approach for obtaining large amounts of heterogeneous data is crowdsensing - a method in which anonymous end-users contribute distributed measurements. However, my analysis shows that current crowdsensing solutions lack essential KPIs on which achievable throughput depends. I therefore focus in greater detail on spatiotemporal modeling of RS-SINR. My temporal analysis of crowdsourced RSRP measurements confirms that RSRP can be modeled as time-invariant in a static location. RS-SINR spatiotemporal maps can therefore be obtained by fusing time-invariant RSRP maps and location-independent (if a specific cell is considered) cell-load time series. Because small-scale RSRP characteristics do not even out over time, mobile measurements are necessary to capture path loss and shadowing. Repeated drive tests are crucial for estimating the reliability of the measured RSRP. Due to GPS localization errors and varying speed profiles of the individual drives, the alignment of multiple repetitions introduces another challenge, which I solve by proposing a modification of the dynamic time warping (DTW) algorithm. The modified DTW allows for optimum alignment of the repeated measurements along a predefined path. Repeated DTW-aligned drive tests yield multiple samples per location. Therefore, I derive an efficient solution of Gaussian process regression (GPR) with repeated training locations, the computational complexity of which scales cubically with the number of distinct training locations, instead of the total number of training samples. Finally, I apply the proposed modified DTW and GPR to self-conducted drive tests and walk tests in an operational LTE network.