Vers des architectures acteur-critique neuronales efficaces en données - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Vers des architectures acteur-critique neuronales efficaces en données

Matthieu Zimmer
Yann Boniface
  • Fonction : Auteur
  • PersonId : 778629
  • IdRef : 140410805
Alain Dutech

Résumé

Un nouvel algorithme d'apprentissage par renforcement, traitant à la fois des espaces conti-nus d'états et d'actions, est proposé. Il ne nécessite pas de connaître a priori des états buts ou de bonnes trajectoires pour fonctionner. Les besoins en connaissances expertes sur le domaine appliqué sont mi-nimales grâce à l'emploi d'estimateur non-linéaire : des réseaux de neurones. Ce nouvel algorithme est on-policy, hors-ligne, sans modèle de l'environnement. Il produit des politiques stationnaires en temps discret et déterministes en maximisant la somme actualisée des récompenses. Des résultats ex-périmentaux montrant la bonne performance de l'algorithme sont présentés sur deux environnements déterministes : acrobot et cartpole.
Fichier principal
Vignette du fichier
jfpda_2016_paper_12.pdf (353.01 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01344905 , version 1 (12-07-2016)

Identifiants

  • HAL Id : hal-01344905 , version 1

Citer

Matthieu Zimmer, Yann Boniface, Alain Dutech. Vers des architectures acteur-critique neuronales efficaces en données. Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2016, Grenoble, France. ⟨hal-01344905⟩
181 Consultations
525 Téléchargements

Partager

Gmail Facebook X LinkedIn More