<div class="csl-bib-body">
<div class="csl-entry">Tayari, H. (2026). <i>Tiny deep reinforcement learning for compute constrained agents : solving the inverted pendulum problem on less than 520kB SRAM using skill-oriented autonomous real-world E2E deep reinforcement learning</i> [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2026.128166</div>
</div>
-
dc.identifier.uri
https://doi.org/10.34726/hss.2026.128166
-
dc.identifier.uri
http://hdl.handle.net/20.500.12708/227472
-
dc.description.abstract
Deep Reinforcement Learning (DRL) löst das Skalierbarkeitsproblem von Reinforcement Learning durch die Verwendung von Artificial Deep Neural Networks (DNN) als Repräsentation des gelernten Verhaltens. Bis heute ist DRL die stabilste und am meisten erforschte Problemformulierung des maschinellen Lernens für autonomes, durchgehendes und lebenslanges Lernen. Wegen des rechen- und speicherintensiven Designs sind die meisten DRL-Ansätze auf hochperformante Rechenarchitekturen angewiesen (wie z.B. high-end GPUs). Indem wir DRL als Lösungsmethode eines representativen Echtzeitproblems, des invertierten Pendels, verwenden, geben wir in dieser Arbeit eine Perspektive auf DRL in Bezug auf Speichereffizienz, Autonomie während der Lernphase und unvollständige Beobachtbarkeit der Umgebung (partial observability).
de
dc.description.abstract
Deep Reinforcement Learning (DRL) solves the scalability problem of Reinforcement Learning (RL) by employing a Deep Artificial Neural Network (DNN) as a function approximator to represent the learned policy. To date, DRL provides the most robust and well-established machine learning paradigm for enabling autonomous, continuous, and open-ended learning. Due to its compute- and memory-intensive nature, DRL is limited to high-power platforms such as high-end GPUs. In this work, we present an examination of the DRL paradigm with a perspective on its potential in a low-power environment, for full learning autonomy, and partial observability, at the representative example of solving a real-time control problem, the inverted pendulum.
en
dc.language
English
-
dc.language.iso
en
-
dc.rights.uri
http://rightsstatements.org/vocab/InC/1.0/
-
dc.subject
Deep Reinforcement Learning
en
dc.subject
Deep Neural Networks
en
dc.subject
Reinforcement learning
en
dc.subject
Inverted Pendulum Problem
en
dc.subject
Resource Efficient Learning
en
dc.subject
Embedded Systems
en
dc.subject
Autonomous Learning
en
dc.title
Tiny deep reinforcement learning for compute constrained agents : solving the inverted pendulum problem on less than 520kB SRAM using skill-oriented autonomous real-world E2E deep reinforcement learning