A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks / Felizardo, Leonardo Kanashiro; Fadda, Edoardo; Brandimarte, Paolo; Del-Moral-Hernandez, Emilio; Nascimento, Mariá Cristina Vasconcelos. - (2025), pp. 1-8. (Intervento presentato al convegno 2025 International Joint Conference on Neural Networks (IJCNN) tenutosi a Roma (ITA)) [10.1109/ijcnn64981.2025.11227565].
A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks
Fadda, Edoardo;Brandimarte, Paolo;
2025
File in questo prodotto:
Non ci sono file associati a questo prodotto.
Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/11583/3005268
Attenzione
Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo
