Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-48015
Titel: Continuous time reinforcement learning: A random measure approach
VerfasserIn: Bender, Christian
Thuan, Nguyen Tran
Sprache: Englisch
Titel: Stochastic Processes and their Applications
Bandnummer: 194 (2026)
Verlag/Plattform: Elsevier
Erscheinungsjahr: 2025
Freie Schlagwörter: Exploratory control
Orthogonal martingale measures
Poisson random measures
Reinforcement learning
Weak convergence
DDC-Sachgruppe: 510 Mathematik
Dokumenttyp: Journalartikel / Zeitschriftenartikel
Abstract: We present a random measure approach for modeling exploration, i.e., the execution of measure valued controls, in continuous-time reinforcement learning with controlled diffusion and jumps. We begin with the case when sampling the randomized control in continuous time takes place on a discrete-time grid and reformulate the resulting SDE as an equation driven by suitable random measures. Our main result is a limit theorem for these random measures as the mesh-size of the sampling grid goes to zero. The resulting limit SDE can be applied for the theoretical analysis of exploratory control problems and for the derivation of learning algorithms.
DOI der Erstveröffentlichung: 10.1016/j.spa.2025.104848
URL der Erstveröffentlichung: https://doi.org/10.1016/j.spa.2025.104848
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-480157
hdl:20.500.11880/42000
http://dx.doi.org/10.22028/D291-48015
ISSN: 0304-4149
Datum des Eintrags: 11-Jun-2026
Bezeichnung des in Beziehung stehenden Objekts: Supplementary materials
In Beziehung stehendes Objekt: https://ars.els-cdn.com/content/image/1-s2.0-S0304414925002923-mmc1.pdf
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Mathematik
Professur: MI - Prof. Dr. Christian Bender
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
1-s2.0-S0304414925002923-main.pdf4,69 MBAdobe PDFÖffnen/Anzeigen


Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons