Online Regret Bounds for Undiscounted Continuous Reinforcement Learning - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Daniil Ryabko
  • Fonction : Auteur
  • PersonId : 848126
Fichier non déposé

Dates et versions

hal-00765441 , version 1 (14-12-2012)

Identifiants

  • HAL Id : hal-00765441 , version 1

Citer

Ronald Ortner, Daniil Ryabko. Online Regret Bounds for Undiscounted Continuous Reinforcement Learning. NIPS 2012, 2012, Lake Tahoe, United States. pp.1772--1780. ⟨hal-00765441⟩
6800 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More