Deep learning based stock price prediction

Tang, Fung Yee

doi:10.34726/hss.2026.140129

Record link:

https://doi.org/10.34726/hss.2026.140129
http://hdl.handle.net/20.500.12708/227287

Title:

Deep learning based stock price prediction

Citation:

Tang, F. Y. (2026). Deep learning based stock price prediction [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2026.140129

reposiTUm DOI:

10.34726/hss.2026.140129

CatalogPlus:

AC17826205

Publication Type:

Thesis - Diplomarbeit

Language:

English

Authors:

Tang, Fung Yee

Advisor:

Neidhardt, Julia

Organisational Unit:

E105 - Institut für Stochastik und Wirtschaftsmathematik

Date (published):

2026

Number of Pages:

105

Keywords:

Stock Price Prediction; Recurrent Neural Networks; Ensemble Learning

Abstract:

Seit vielen Jahren stellt die Aktienkursprognose aufgrund der Marktvolatilität und der komplexen, nichtlinearen Faktoren, die Finanzmärkte beeinflussen, eine herausfordernde Aufgabe dar. Während traditionelle Methoden wie die Fundamental- und technische Analyse weit verbreitet sind, gelingt es ihnen oft nicht, die komplexen Muster in modernen Finanzdaten zu erfassen. Obwohl fortgeschrittene Varianten von Recurrent Neural Networks (RNNs) und Ensemble-Learning-Methoden einzeln vielversprechend sind, haben nur wenige Studien ihr kombiniertes Potenzial für die Aktienkursprognose untersucht.Diese Masterarbeit entwickelt und evaluiert RNN-basierte Ensemble-Learning-Modelle für die tägliche Aktienkursprognose, insbesondere Long Short-Term Memory (LSTM) und Gated Recurrent Unit (GRU) Architekturen. Der Ansatz bestimmt systematisch die optimalen Lookback-Fenstergrößen, führt eine umfassende Hyperparameter-Optimierung durch und verwendet einfache Mittelwertbildung der Vorhersagen verschiedener Modelle als Ensemble-Methode. Die Modellleistung wird anhand von R-Quadrat-Metriken, Mean Squared Error (MSE) und Mean Absolute Error (MAE) bewertet.Die Ergebnisse zeigen unterschiedliche Verhaltensmuster verschiedener RNN-Architekturen hinsichtlich zeitlicher Abhängigkeiten. LSTM-Modelle erreichen optimale Leistung mit kurzen Lookback-Fenstergrößen (L= 1–2), während GRU-Modelle mit längeren Lookback-Fenstergrößen am besten abschneiden und den niedrigsten skalierten MAE von 0,0271 bei L= 59 in der manuell optimierten Konfiguration erreichen. Hybride LSTM-GRU- und 1D-CNN-GRU-Modelle boten keine zusätzlichen Vorhersagevorteile gegenüber reinen GRU-Architekturen. Zunächst zeigten Ensemble-Modelle, die aus einzelnen RNN-Varianten bestanden, eine verringerte Leistung im Vergleich zu einzelnen Modellen, während diejenigen mit zwei Varianten nur geringfügige Leistungseinbußen aufwiesen. Alle Ensemble-Modelle übertrafen durchwegs lineare Regressionsbaselines, was die Überlegenheit RNN-basierter Ansätze bei der Erfassung zeitlicher Abhängigkeiten und nichtlinearer Dynamiken von Finanzzeitseriendaten unterstreicht. Zusätzlich wurde eine zeitliche Verzögerung zwischen den vorhergesagten und tatsächlichen Aktienkursen beobachtet.Daher wurde ein Offline-Experiment unter Verwendung der Empirical Mode Decomposition (EMD) integriert, um die zeitliche Verzögerung zu kompensieren. Dies milderte die zeitliche Verzögerung in den RNN-basierten Modellen ab und reduzierte ihre Auswirkung erheblich. Mit dieser Verbesserung übertrafen alle Ensemble-Konfigurationen im Offline-Experiment die optimale Leistung des manuell optimierten GRU-Modells. Die Offline-Methode verwendet jedoch den gesamten Datensatz, einschließlich der zukünftigen Aktienkurse. Daher ist sie in ihrer aktuellen Form nicht für echte Prognosen geeignet. Stattdessen zeigt sie Potenzial für verbesserte Vorhersagen und kann zur nachträglichen Korrektur bei Anwendung der EMD-Methode verwendet werden. Die Ergebnisse zeigen, dass RNN-basierte Ensemble-Modelle, insbesondere in Kombination mit Techniken zur Reduzierung zeitlicher Verzögerungen, deutlich besser als traditionelle lineare Methoden zur Vorhersage von Aktienkursen abschneiden. Dies weist auf einen vielversprechenden Weg für zukünftige Forschung im Bereich der Finanzprognose hin.

For many years, stock price prediction has been a challenging task due to market volatility and the complex, nonlinear factors that influence financial markets. While traditional methods such as fundamental and technical analysis are widely used, they often fail to capture the intricate patterns in modern financial data. Although advanced variants of Recurrent Neural Networks (RNNs) and ensemble learning methods have shown promise individually, limited research has examined their combined potential for stock price prediction.This master's thesis develops and evaluates RNN-based ensemble learning models for daily stock price prediction, specifically Long Short-Term Memory (LSTM) and Gated Recurrent Unit (GRU) architectures. The approach systematically determines the optimal lookback window sizes, performs comprehensive hyperparameter tuning, and employs simple averaging of predictions from different models as an ensemble method. Model performance is evaluated using R-squared metrics, Mean Squared Error (MSE) and Mean Absolute Error (MAE).The findings reveal distinct behavioral patterns across different RNN architectures regarding temporal dependencies. LSTM models achieve optimal performance with short lookback window sizes (L = 1–2), whereas GRU models perform best with longer lookback window sizes, reaching the lowest scaled MAE of 0.0271 at L = 59 in the manually tuned configuration. Hybrid LSTM-GRU and 1D-CNN-GRU models did not provide additional predictive advantages over pure GRU architectures. Initially, ensemble models comprising single RNN variants showed decreased performance compared to individual models, while those with two variants exhibited only marginal reductions.All ensemble models consistently outperformed linear regression baselines, highlighting the superiority of RNN-based approaches in capturing the temporal dependencies and nonlinear dynamics of financial time series data. Additionally, a time lag was observed between the predicted and actual stock prices.Therefore, an offline experiment using Empirical Mode Decomposition (EMD) was incorporated to compensate for the time lag. This mitigated the temporal lag in the RNN-based models and significantly reduced its impact. With this enhancement, all ensemble configurations in the offline experiment surpassed the optimal performance of the manually tuned GRU model. However, the offline method uses the whole dataset, including the future stock prices. Thus, in its current form, it is not appropriate for real forecasting. Instead, it demonstrates potential for improved prediction and may be used for subsequent correction when applying the EMD method. The results show that RNN-based ensemble models, especially when combined with techniques to reduce temporal lag, perform significantly better than traditional linear methods for predicting stock prices. This points to a promising path for future financial forecasting research.

Additional information:

Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers

License:

In Copyright

Appears in Collections:

Thesis