Domain Randomization via Entropy Maximization

Tiboni, Gabriele; Klink, Pascal; Peters, Jan; Tommasi, Tatiana; D'Eramo, Carlo; Chalvatzaki, Georgia

Varying dynamics parameters in simulation is a popular Domain Randomization (DR) approach for overcoming the reality gap in Reinforcement Learning (RL). Nevertheless, DR heavily hinges on the choice of the sampling distribution of the dynamics parameters, since high variability is crucial to regularize the agent's behavior but notoriously leads to overly conservative policies when randomizing excessively. In this paper, we propose a novel approach to address sim-to-real transfer, which automatically shapes dynamics distributions during training in simulation without requiring real-world data. We introduce DOmain RAndomization via Entropy MaximizatiON (DORAEMON), a constrained optimization problem that directly maximizes the entropy of the training distribution while retaining generalization capabilities. In achieving this, DORAEMON gradually increases the diversity of sampled dynamics parameters as long as the probability of success of the current policy is sufficiently high. We empirically validate the consistent benefits of DORAEMON in obtaining highly adaptive and generalizable policies, i.e. solving the task at hand across the widest range of dynamics parameters, as opposed to representative baselines from the DR literature. Notably, we also demonstrate the Sim2Real applicability of DORAEMON through its successful zero-shot transfer in a robotic manipulation setup under unknown real-world parameters.

Domain Randomization via Entropy Maximization / Tiboni, G., Klink, P., Peters, J., Tommasi, T., D'Eramo, C., Chalvatzaki, G.. - (2024). (The Twelfth International Conference on Learning Representations (ICLR) Vienna (Austria) 05-12 May 2024).

Domain Randomization via Entropy Maximization

Gabriele Tiboni;Pascal Klink;Jan Peters;Tatiana Tommasi;Carlo D'Eramo;Georgia Chalvatzaki

2024

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Anno del prodotto

2024

Appare nelle tipologie

4.1 Contributo in Atti di convegno

File in questo prodotto:

File	Dimensione	Formato
DORAEMON_ICLR24_CameraReady.pdf accesso aperto Tipologia: 2. Post-print / Author's Accepted Manuscript Licenza: Pubblico - Tutti i diritti riservati Dimensione 4.94 MB Formato Adobe PDF Visualizza/Apri	4.94 MB	Adobe PDF	Visualizza/Apri

Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11583/2992385

PORTO @ Archivio Istituzionale della Ricerca

Domain Randomization via Entropy Maximization

Gabriele Tiboni;Pascal Klink;Jan Peters;Tatiana Tommasi;Carlo D'Eramo;Georgia Chalvatzaki

2024

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Pubblicazioni consigliate

Informazioni

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)