Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique

Grégory Smits

Thèse Année : 2008

An outranking approach to the control of a natural language processing chain

Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique

(1)

Grégory Smits

Fonction : Auteur
PersonId : 967948

Symbolic and Human-centric view of dAta MANagement

Résumé

Natural Language Processing (NLP) systems are continuously faced with the problem of generating concurrent hypotheses, of which some can be erroneous. In order to avoid the propagation of erroneous hypotheses, it appears to be essential to apply specific control strategies, which aim to distinguishing concurrent hypotheses based on their relevance. On most of observed indetermination cases, we have noticed that multiple heterogeneous knowledge sources have to be combined to determine the hypotheses relative relevance. According to this observation, we show that the control of the indetermination cases can be formalised as a decisional process based on multiple criteria. This decisional formalisation and our research of an adapted methodology have conducted us toward an outranking approach issued from the MultiCriteria Decision Aid (MCDA) paradigm. This approach differs from alternative methods by the importance granted to knowledge and preferences that an expert can express about a given problem. From this innovative intersection between NLP and MCDA, our work has been focalised on the development of a decisional module dedicated to multicriteria control. The integration of this module into a complete NLP system has allowed us to attest the feasibility of our approach and to perform experimentation on concrete indetermination cases.

Les systèmes de Traitement Automatique des Langues Naturelles (TALN) sont de manière récurrente confrontés au problème de la génération et de la propagation d’hypothèses concurrentes et erronées. Afin d’écarter ces erreurs d’interprétation du processus d’analyse, il apparaît indispensable d’avoir recours à des stratégies spécifiques de contrôle dont l’objectif est de différencier les hypothèses concurrentes selon leur degré de pertinence. Sur la plupart des cas d’indétermination observés, on constate que cette évaluation de la pertinence relative des hypothèses repose sur l’exploitation de plusieurs sources de connaissances hétérogènes, qui doivent être combinées pour garantir un contrôle robuste et fiable. À partir de ce constat, nous avons montré que le traitement des indéterminations répondait à une formalisation générique en tant que problème décisionnel basé sur de multiples critères de comparaison. Cette formalisation et la recherche d’une méthodologie adaptée nous ont conduit vers une approche par surclassement issue des travaux en Aide MultiCritère à la Décision (AMCD). Par rapport aux méthodes alternatives, cette approche se différentie notamment par l’importance qu’elle accorde aux connaissances et préférences qu’un expert est en mesure d’apporter sur le problème traité. À partir de cette intersection novatrice entre le TALN et l’AMCD, nos travaux se sont focalisés sur le développement d’un module décisionnel de contrôle multicritère. L’intégration de ce module au sein d’un système complet de TALN nous a permis d’attester d’une part la faisabilité de notre approche et d’autre part de l’expérimenter sur différents cas concrets d’indétermination.

Mots clés

NATURAL LANGUAGE MULTICRITERIA DECISION AMBIGUITY

LANGAGE NATUREL TRAITEMENT DU (INFORMATIQUE) DÉCISION MULTICRITÈRE AMBIGUÏTÉ SYSTÈMES INFORMATIQUES - - ÉVALUATION

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

these_main.pdf (3.42 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Grégory SMITS : Connectez-vous pour contacter le contributeur

https://inria.hal.science/tel-01759840

Soumis le : jeudi 5 avril 2018-17:30:09

Dernière modification le : vendredi 24 mars 2023-14:53:07

Dates et versions

tel-01759840 , version 1 (05-04-2018)

Identifiants

HAL Id : tel-01759840 , version 1

Citer

Grégory Smits. Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique. Intelligence artificielle [cs.AI]. Université de Caen (France), 2008. Français. ⟨NNT : ⟩. ⟨tel-01759840⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA IRISA-D7 UR1-THESES UR1-MATH-STIC UR1-UFR-ISTIC THESES-NU UNIV-RENNES UR1-MATH-NUM

168 Consultations

349 Téléchargements

An outranking approach to the control of a natural language processing chain

Une approche par surclassement pour le contrôle d'un processus d'analyse linguistique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager