Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée) - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Hdr Année : 2010

Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)

Alain Dutech

Résumé

Ce document présente mon ``projet de recherche'' sur le thème de l'embodiment (``cognition incarnée'') au croisement des sciences cognitives, de l'intelligence artificielle et de la robotique. Plus précisément, je montre comment je compte explorer la façon dont un agent, artificiel ou biologique, élabore des représentations utiles et pertinentes de son environnement. Dans un premier temps, je positionne mes travaux en explicitant notamment les concepts de l'embodiment et de l'apprentissage par renforcement. Je m'attarde notamment sur la problématique de l'apprentissage par renforcement pour des tâches non-Markoviennes qui est une problématique commune aux différents travaux de recherche que j'ai menés au cours des treize dernières années dans des contextes mono et multi-agents, mais aussi robotique. L'analyse de ces travaux et de l'état de l'art du domaine me conforte dans l'idée que la principale difficulté pour l'agent est bien celle de trouver des représentations adaptées, utiles et pertinentes. J'argumente que l'on se retrouve face à une problématique fondamentale de la cognition, intimement liée aux problèmes de ``l'ancrage des symboles'', du ``frame problem'' et du fait ``d'être en situation'' et qu'on ne pourra y apporter des réponses que dans le cadre de l'embodiment. C'est à partir de ce constat que, dans une dernière partie, j'aborde les axes et les approches que je vais suivre pour poursuivre mes travaux en développant des techniques d'apprentissage robotique qui soient incrémentales, holistiques et motivationnelles.
Fichier principal
Vignette du fichier
dutech_hdr_2010.pdf (1.42 Mo) Télécharger le fichier
dutech_hdr_annexes_2010.pdf (2.13 Mo) Télécharger le fichier
Format : Autre
Loading...

Dates et versions

tel-00549108 , version 1 (21-12-2010)

Identifiants

  • HAL Id : tel-00549108 , version 1

Citer

Alain Dutech. Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée). Autre [cs.OH]. Université Nancy II, 2010. ⟨tel-00549108⟩
602 Consultations
1571 Téléchargements

Partager

Gmail Facebook X LinkedIn More