Apprentissage par renforcement développemental

Matthieu Zimmer

Thèse Année : 2018

Developmental reinforcement learning

Apprentissage par renforcement développemental

(1)

Matthieu Zimmer

Fonction : Auteur
PersonId : 786507
IdRef : 224947869

Department of Complex Systems, Artificial Intelligence & Robotics

Résumé

Reinforcement learning allows an agent to learn a behavior that has never been previously defined by humans. The agent discovers the environment and the different consequences of its actions through its interaction: it learns from its own experience, without having pre-established knowledge of the goals or effects of its actions. This thesis tackles how deep learning can help reinforcement learning to handle continuous spaces and environments with many degrees of freedom in order to solve problems closer to reality. Indeed, neural networks have a good scalability and representativeness. They make possible to approximate functions on continuous spaces and allow a developmental approach, because they require little a priori knowledge on the domain. We seek to reduce the amount of necessary interaction of the agent to achieve acceptable behavior. To do so, we proposed the Neural Fitted Actor-Critic framework that defines several data efficient actor-critic algorithms. We examine how the agent can fully exploit the transitions generated by previous behaviors by integrating off-policy data into the proposed framework. Finally, we study how the agent can learn faster by taking advantage of the development of his body, in particular, by proceeding with a gradual increase in the dimensionality of its sensorimotor space

L'apprentissage par renforcement permet à un agent d'apprendre un comportement qui n'a jamais été préalablement défini par l'homme. L'agent découvre l'environnement et les différentes conséquences de ses actions à travers des interactions avec celui-ci : il apprend de sa propre expérience, sans avoir de connaissances préétablies des buts ni des effets de ses actions. Cette thèse s'intéresse à la façon dont l'apprentissage profond peut aider l'apprentissage par renforcement à gérer des espaces continus et des environnements ayant de nombreux degrés de liberté dans l'optique de résoudre des problèmes plus proches de la réalité. En effet, les réseaux de neurones ont une bonne capacité de mise à l'échelle et un large pouvoir de représentation. Ils rendent possible l'approximation de fonctions sur un espace continu et permettent de s'inscrire dans une approche développementale nécessitant peu de connaissances a priori sur le domaine. Nous cherchons comment réduire l'expérience nécessaire à l'agent pour atteindre un comportement acceptable. Pour ce faire, nous avons proposé le cadre Neural Fitted Actor-Critic qui définit plusieurs algorithmes acteur-critique efficaces en données. Nous examinons par quels moyens l'agent peut exploiter pleinement les transitions générées par des comportements précédents en intégrant des données off-policy dans le cadre proposé. Finalement, nous étudions de quelle manière l'agent peut apprendre plus rapidement en tirant parti du développement de son corps, en particulier, en procédant par une augmentation progressive de la dimensionnalité de son espace sensorimoteur

Mots clés

Reinforcement learning Actor-critic Neural networks Continuous environment Developmental approach Deep learning

Apprentissage par renforcement Acteur-critique Réseaux de neurones Environnement continu Approche développementale Apprentissage profond

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG]

Fichier principal

DDOC_T_2018_0008_ZIMMER.pdf (24.01 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-01735202

Soumis le : jeudi 15 mars 2018-15:36:10

Dernière modification le : lundi 11 septembre 2023-17:41:19

Archivage à long terme le : lundi 10 septembre 2018-21:37:21

Dates et versions

tel-01735202 , version 1 (15-03-2018)

Identifiants

HAL Id : tel-01735202 , version 1

Citer

Matthieu Zimmer. Apprentissage par renforcement développemental. Intelligence artificielle [cs.AI]. Université de Lorraine, 2018. Français. ⟨NNT : 2018LORR0008⟩. ⟨tel-01735202⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA STAR GRID5000 UNIV-LORRAINE LORIA LORIA-AIS THESES-UL SILECS

1185 Consultations

2357 Téléchargements

Developmental reinforcement learning

Apprentissage par renforcement développemental

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager