Lučanin, D. (2016). Energy efficient cloud control and pricing in geographically distributed data centers [Dissertation, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.26105
large-scale distributed computing; cloud computing; energy efficiency; geographically distributed data centers; scheduling; optimisation; pricing
en
Abstract:
Der schnelle Fortschritt im Bereich von Internet-Anwendungen hat es erforderlich gemacht, Rechenressourcen on-demand zur Verfügung zu stellen ohne Computer-Hardware manuell managen zu müssen. Cloud Computing hat sich als sehr beliebtes Paradigma herauskristallisiert, um Ressourcen wie virtuelle Maschinen mannigfaltigen Anwendungen skalierbar in Form eines "Pay-as-you-goServices zugänglich zu machen. Andererseits hat das rapide Wachstum von Cloud Computing den Energieverbrauch von Datenzentren, die die Cloud-Hardware betreiben, zu einem globalen Umweltproblem und einem gewichtigen Kostenfaktor gemacht. Man schätzt, dass Datenzentren 1,5% des globalen Elektrizitätsverbrauchs ausmachen. Gleichzeitig betreiben moderne Cloud-Provider mehrere geographisch verteilte Datenzentren, um steigenden Nutzeranforderungen gerecht zu werden. Eine verteilte Infrastruktur von Datenzentren verändert die Cloud-Kontrollregeln, da Energiekosten von den aktuellen regionalen Elektrizitätspreisen und Temperaturen (sog. geozeitliche Einflussfaktoren) abhängen. Zusätzlich hängt die Preispolitik, über die Cloud-Provider Rechenressourcen anbieten, vom Quality-of-Service (QoS) ab. Auf Grund dieser Preisschemata und der steigenden Energiekosten in Datenzentren, ist das Austarieren zwischen Energieersparnissen und damit einhergehenden Verlusten an Leistung und Gewinnen ein herausforderndes Problem für Cloud-Provider. Bestehende Cloud-Kontrollmethoden existieren nur für einzelne Datenzentren oder berücksichtigen die verfügbaren Cloud-Kontrollaktionen nicht, die zur Reduzierung von Energiekosten in geographisch verteilten Datenzentren führen können. In dieser Dissertation schlagen wir eine durchdringende Cloud-Kontrollmethode vor, die aus mehreren Methoden für dynamische Resourcereallokation und Hardwarekonfiguration basierend auf volatilen geozeitlichen Einflussfaktoren besteht. Die vorgestellten Methoden betrachten den QoS-Einfluss von Cloud-Kontrollaktionen, sowie Limits für die Datenqualität von Vorhersagemethoden von Zeitreihen. Wir präsentieren einen Cloud-Kontrollmechanismus, der zukünftige Erweiterungen, falls neue Komponenten zur Entscheidungsfindung hinzugefügt werden müssen, ermöglicht. Außerdem stellen wir neuartige Preisschemata vor, die die Verfügbarkeit der Rechenressourcen, sowie die Kosten, die durch unsere Cloud-Kontrollmethode entstehen, in Betracht ziehen, um flexibles, energiebewusstes und hochperformantes Cloud-Computing zu ermöglichen. Die Cloud-Kontrollmethoden werden empirisch und durch Simulationen evaluiert, die u.a. auf historischen Daten von Elektrizitätspreisen, Temperaturen und Auslastung beruhen. Die potentiellen Energiekostenersparnisse werden geschätzt, indem unsere Methoden mit Methoden, die Stand der Technik sind, verglichen werden. Wir untersuchen eine Vielzahl an Einflussparametern, vii um eine Reihe von Empfehlungen für die praktische Verwendung unserer Methoden in Cloud- Systemen abzugeben. Die Resultate zeigen, dass signifikante Energiekostenersparnisse möglich sind, ohne das QoS oder die Gewinne von Services im geographisch verteilten Cloud-Computing zu beeinträchtigen.
de
The fast pace of progress in the domain of applications provided over the Internet has created a need for computational resources delivered as an on-demand utility, without having to manually manage computer hardware. Cloud computing has emerged as a very popular paradigm where resources such as virtual machines are provided as a scalable, pay-as-you-go service, catering to applications in a multitude of fields. On the other hand, the rapid cloud computing growth has turned the energy consumption of data centers hosting the cloud-s hardware infrastructure into a global environmental problem and a major cost factor. It is estimated that data centers constitute 1.5% of global electricity usage. At the same time, to serve increasing user requirements, modern cloud providers are operating multiple geographically distributed data centers. Distributed data center infrastructure changes the rules of cloud control, as energy costs depend on current regional electricity prices and temperatures that we call geotemporal inputs. Furthermore, pricing policies at which cloud providers can offer computational resources depend on the quality of service (QoS). With such pricing schemes and the increasing energy costs in data centres, balancing energy savings with performance and revenue losses is a challenging problem for cloud providers. Existing cloud control methods are suitable only for a single data center or do not consider all the available cloud control actions that can reduce energy costs in geographically distributed data centers. In this thesis, we propose a pervasive cloud control approach consisting of multiple methods for dynamic resource reallocation and hardware configuration adapted to volatile geotemporal inputs. The proposed methods consider the QoS impact of cloud control actions and the data quality limits of time series forecasting methods. We offer a cloud controller design that supports future extensions when new decision support components need to be added. We also propose novel pricing schemes which account for the computational resource availability and costs that arise from our cloud control approach to enable both flexible, energy-aware and high performance cloud computing. We evaluate our cloud control methods empirically and in a number of simulations using historical traces of electricity prices, temperatures, workloads and other data. We estimate the potential energy cost savings by comparing our methods to state-of-the-art baseline methods. We explore a variety of input parameters to provide a range of guidelines for practical application of our methods in cloud systems. Our results show that significant energy cost savings are possible without harming the QoS or service revenue in geographically distributed cloud computing.