BRL Quasi-Optimal à l'aide de Transitions Locales Optimistes

Mauricio Araya; Vincent Thomas; Olivier Buffet

Communication Dans Un Congrès Année : 2012

BRL Quasi-Optimal à l'aide de Transitions Locales Optimistes

(1) , (1) , (1)

Mauricio Araya

Fonction : Auteur correspondant
PersonId : 881106

Connectez-vous pour contacter l'auteur

Autonomous intelligent machine

Vincent Thomas

Fonction : Auteur
PersonId : 16368
IdHAL : vincent-thomas
ORCID : 0000-0003-3401-4649

Autonomous intelligent machine

Olivier Buffet

Fonction : Auteur
PersonId : 1407
IdHAL : olivier-buffet
ORCID : 0000-0002-5072-5857

Autonomous intelligent machine

Résumé

L'apprentissage par renforcement bayésien basé modèle (BRL) permet une formalisation saine du problème consistant à agir optimalement face à un environnement inconnu, c'est-à-dire en évitant le dilemme exploration-exploitation. Toutefois, les algorithmes s'attaquant explicitement au BRL souffrent d'une telle explosion combinatoire qu'un grand nombre de travaux repose sur des algorithmes heuristiques. Cet article introduit BOLT, un algorithme heuristique simple et (presque) déterministe pour le BRL qui est optimiste vis à vis de la fonction de transition. Nous analysons la complexité d'échantillon de BOLT et montrons que, pour certains paramètres, l'algorithme est quasi-optimal au sens bayésien avec une grande probabilité. Puis, des résultats expérimentaux mettent en valeur les principales différences entre cette méthode et des travaux antérieurs.

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

jfpda6.pdf (468.3 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Olivier Buffet : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00735602

Soumis le : mercredi 26 septembre 2012-10:54:39

Dernière modification le : jeudi 1 février 2024-10:04:39

Archivage à long terme le : vendredi 16 décembre 2016-17:34:18

Dates et versions

hal-00735602 , version 1 (26-09-2012)

Identifiants

HAL Id : hal-00735602 , version 1

Citer

Mauricio Araya, Vincent Thomas, Olivier Buffet. BRL Quasi-Optimal à l'aide de Transitions Locales Optimistes. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 16 p. ⟨hal-00735602⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA IRISA JFPDA2012 UNIV-LORRAINE INRIA2 LORIA LORIA-AIS UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

125 Consultations

64 Téléchargements

BRL Quasi-Optimal à l'aide de Transitions Locales Optimistes

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager