Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2008

An outranking approach to the control of a natural language processing chain

Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique

Résumé

Natural Language Processing (NLP) systems are continuously faced with the problem of generating concurrent hypotheses, of which some can be erroneous. In order to avoid the propagation of erroneous hypotheses, it appears to be essential to apply specific control strategies, which aim to distinguishing concurrent hypotheses based on their relevance. On most of observed indetermination cases, we have noticed that multiple heterogeneous knowledge sources have to be combined to determine the hypotheses relative relevance. According to this observation, we show that the control of the indetermination cases can be formalised as a decisional process based on multiple criteria. This decisional formalisation and our research of an adapted methodology have conducted us toward an outranking approach issued from the MultiCriteria Decision Aid (MCDA) paradigm. This approach differs from alternative methods by the importance granted to knowledge and preferences that an expert can express about a given problem. From this innovative intersection between NLP and MCDA, our work has been focalised on the development of a decisional module dedicated to multicriteria control. The integration of this module into a complete NLP system has allowed us to attest the feasibility of our approach and to perform experimentation on concrete indetermination cases.
Les systèmes de Traitement Automatique des Langues Naturelles (TALN) sont de manière récurrente confrontés au problème de la génération et de la propagation d’hypothèses concurrentes et erronées. Afin d’écarter ces erreurs d’interprétation du processus d’analyse, il apparaît indispensable d’avoir recours à des stratégies spécifiques de contrôle dont l’objectif est de différencier les hypothèses concurrentes selon leur degré de pertinence. Sur la plupart des cas d’indétermination observés, on constate que cette évaluation de la pertinence relative des hypothèses repose sur l’exploitation de plusieurs sources de connaissances hétérogènes, qui doivent être combinées pour garantir un contrôle robuste et fiable. À partir de ce constat, nous avons montré que le traitement des indéterminations répondait à une formalisation générique en tant que problème décisionnel basé sur de multiples critères de comparaison. Cette formalisation et la recherche d’une méthodologie adaptée nous ont conduit vers une approche par surclassement issue des travaux en Aide MultiCritère à la Décision (AMCD). Par rapport aux méthodes alternatives, cette approche se différentie notamment par l’importance qu’elle accorde aux connaissances et préférences qu’un expert est en mesure d’apporter sur le problème traité. À partir de cette intersection novatrice entre le TALN et l’AMCD, nos travaux se sont focalisés sur le développement d’un module décisionnel de contrôle multicritère. L’intégration de ce module au sein d’un système complet de TALN nous a permis d’attester d’une part la faisabilité de notre approche et d’autre part de l’expérimenter sur différents cas concrets d’indétermination.
Fichier principal
Vignette du fichier
these_main.pdf (3.42 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01759840 , version 1 (05-04-2018)

Identifiants

  • HAL Id : tel-01759840 , version 1

Citer

Grégory Smits. Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique. Intelligence artificielle [cs.AI]. Université de Caen (France), 2008. Français. ⟨NNT : ⟩. ⟨tel-01759840⟩
168 Consultations
349 Téléchargements

Partager

Gmail Facebook X LinkedIn More