Steinbrecher, M. (2023). Using machine learning to predict Photovoltaic energy production [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2023.110584
Machine Learning; Photovoltaics; Neural Network; Linear Regression; Support Vector Machine; Regression Tree; Renewable Energy; Digital Twin; Solar power forecast
en
Abstract:
Erneuerbare Energien wie Photovoltaik spielen bereits eine wichtige Rolle in der heutigen Energieversorgung. Das werden sie auch in Zukunft tun, vor allem in Anbetracht auf den Klimawandel. Vorhersagen über die Produktionsmengen sind aus mehreren Gründen wichtig, zum Beispiel um Netzstabilität zu gewährleisten, Handelsbedingungen zu verbessern oder Instandhaltung zu planen.Das Ziel dieser Arbeit ist es, herauszufinden, welche Machine Learning Methoden gut geeignet sind, um die Energieproduktion von Photovoltaikanlagen auf kurze Zeit vorauszusagen. Des Weiteren wurden die Einflüsse von Features in den Daten, wie zum Beispiel Einstrahlung, Regen oder Modultemperatur, erforscht.Ein wichtiger Teil dieser Arbeit war die Vorverarbeitung der Daten. Die Rohdaten der Photovoltaikanlagen wurden dabei so aufbereitet, dass sie von Machine Learning Modelle gut verarbeitet werden können. Dies beinhaltet mehrere Schritte, wie das Auswählen von Features, das Filtern bestimmter Werte und das Hinzufügen von Metafeatures.Es gibt viele Machine Learning Modelle mit unterschiedlicher Komplexität, die ihre jeweiligen Stärken und Schwächen haben. Wir führten Experimente mit verschiedenen Modellen durch, nämlich mit linearer Regression, Regression Trees, neuronalen Netzen und Support Vector Maschinen.Um festzustellen, welche der erprobten Modelle am besten geeignet sind um photovoltaische Energieproduktion vorherzusagen, wurden Experimente mit mehreren Konfigurationen durchgeführt. Dabei wurden zwei Datensätze von zwei unterschiedlichen Kraftwerken in Österreich untersucht, eines in Burgenland und eines in Bisamberg. Darüber hinaus wurde der Einfluss einzelner Features aus den Daten auf die Qualität der Vorhersagen geprüft, indem bestimmte Features entfernt oder isoliert wurden. Die Modelle aus den Experimenten wurden getestet und basierend auf Metriken, die aus der Vorhersagen dieser Tests berechnet wurden, bewertet. Diese Metriken ermöglichen es, die erprobten Modelle zu vergleichen sowie diese Arbeit mit ähnlichen gegenüberzustellen.In unseren Experimenten haben mehrlagige Perzeptronen die besten Ergebnisse in den meisten Metriken erzielt. Regression Trees und lineare Regression konnten auch gute Vorhersagen treffen.Bezüglich der Relevanz von Features ist eine gute Einstrahlungsvorhersage das wichtigste Feature, um die Energieproduktion genau vorherzusagen. Für einen der Datensätze war es allerdings auch möglich, gute Vorhersagen zu treffen, wenn alle anderen Features verwendet wurden.
de
Renewable energy resources such as photovoltaics already play a significant role in our energy supply and will continue to do so in the future, especially with regards to fighting climate change. Forecasting the amount of production is important for multiple reasons such as ensuring grid stability, improving trading conditions or scheduling maintenance.The aim of this work is to find out which machine learning methods are well suited for predicting short term photovoltaic power production. Moreover, we aim to investigate the effects that features such as radiation, rain or module temperature have.A major part of this work was doing preprocessing, i.e$.$ making the data provided by power plants more suitable to be used for learning. This includes multiple steps such as selecting features, filtering certain values and adding meta features. There are multiple machine learning models with varying complexity and unique strengths and weaknesses. We experimented with different models, namely linear regression, regression trees, neural networks and support vector machines.To determine which of the tried models are best suited for predicting photovoltaic energy production, experiments with multiple configurations were run to build different models. These experiments were run on datasets from two seperate power plants in Austria, one from Burgenland and the other from Bisamberg. Furthermore, the influence of different features on the prediction quality was assessed by isolating and removing certain features. The models are tested and evaluated based on metrics caluclated by the predictions obtained from our tests. This allows us to compare them to each other and enables comparisons to similar works.In our experiments, multi-layer perceptrons ended up generally performing the best among most metrics. Regression trees and linear regression also produced good results. Regarding the impact of features, a good radiation forecast is the most important feature in making high quality predictions on produced energy. For one of the datasets, however, it was still possible to make decent predictions using all other features.