Processus décisionnels de Markov possibilités à observabilité mixte

Nicolas Drougard; Florent Teichteil-Konigsbuch; Jean-Loup Farges; Didier Dubois

doi:10.3166/RIA.29.629-653

Article Dans Une Revue Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle Année : 2015

Processus décisionnels de Markov possibilités à observabilité mixte

(1) , (1) , (1) , (2, 3)

1
2
3

Nicolas Drougard

Fonction : Auteur
PersonId : 749638
IdHAL : nicolas-drougard
ORCID : 0000-0003-0002-9973

ONERA - The French Aerospace Lab [Toulouse]

Florent Teichteil-Konigsbuch

Fonction : Auteur

ONERA - The French Aerospace Lab [Toulouse]

Jean-Loup Farges

Fonction : Auteur

ONERA - The French Aerospace Lab [Toulouse]

Didier Dubois

Fonction : Auteur
PersonId : 743301
IdHAL : didier-dubois
ORCID : 0000-0002-6505-2536
IdRef : 026839482

Argumentation, Décision, Raisonnement, Incertitude et Apprentissage

Centre National de la Recherche Scientifique

Résumé

Les processus décisionnels de Markov partiellement observables possibilistes qualita- tifs (π-PDMPO) constituent une alternative aux PDMPO classiques (probabilistes) : ils sont utilisés dans les situations où l’état de croyance initial de l’agent et les probabilités définissant le problème sont imprécises du fait d’un manque de connaissance ou de données. Cependant, tout comme les PDMPO, le calcul d’une stratégie optimale demande un grand nombre d’opé- rations : le nombre d’états de croyance grandit exponentiellement avec le nombre d’états du système. Dans cet article, une version possibiliste des processus décisisionnels de Markov à observabilité mixte est présentée pour simplifier ce calcul : la complexité de résolution d’un π-PDMPO, dont certaines variables d’état sont complètement observables, peut être consi- dérablement réduite. Un algorithme d’itération sur les revenus optimaux pour cette nouvelle formulation est ensuite proposé pour le cas de l’horizon infini, et l’optimalité de la stratégie calculée pour un critère donné est démontrée, lorsqu’il existe une action "rester" dans certains états buts. Les expérimentations montrent finalement que ce modèle possibiliste est plus perfor- mant que le modèle PDMPO probabiliste, utilisé classiquement en robotique, pour un problème de reconnaissance de cible, dans certaines situations où les capacités d’observation de l’agent ne sont pas précises.

Mots clés

Paramètres imprécis Observabilité mixte PDMPO Théorie des possibilités

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG] Logique en informatique [cs.LO] Informatique et langage [cs.CL]

Fichier principal

drougard_16980.pdf (426.31 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Open Archive Toulouse Archive Ouverte (OATAO) : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01530407

Soumis le : mercredi 31 mai 2017-16:40:22

Dernière modification le : lundi 20 novembre 2023-11:44:22

Archivage à long terme le : mercredi 6 septembre 2017-17:29:09

Dates et versions

hal-01530407 , version 1 (31-05-2017)

Identifiants

HAL Id : hal-01530407 , version 1
DOI : 10.3166/RIA.29.629-653
OATAO : 16980

Citer

Nicolas Drougard, Florent Teichteil-Konigsbuch, Jean-Loup Farges, Didier Dubois. Processus décisionnels de Markov possibilités à observabilité mixte. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2015, vol. 29 (n° 6), pp. 629-653. ⟨10.3166/RIA.29.629-653⟩. ⟨hal-01530407⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 ONERA CNRS SMS UT1-CAPITOLE IRIT IRIT-ADRIA IRIT-IA TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

122 Consultations

306 Téléchargements

Processus décisionnels de Markov possibilités à observabilité mixte

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager