SemTAG : une plate-forme pour le calcul sémantique à partir de Grammaires d'Arbres Adjoints - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2007

SemTAG: a platform for semantic construction with Tree Adjoining Grammars

SemTAG : une plate-forme pour le calcul sémantique à partir de Grammaires d'Arbres Adjoints

Résumé

In this thesis, we propose a software architecture (namely SemTAG) allowing for semantic construction with Tree Adjoining Grammars (TAG). SemTAG provides with an environment allowing to build an underspecified semantic representation (Predicate Logic Unplugged (Bos, 95)) from a TAG lexicon and a sentence.

In order to facilitate lexicon management, the SemTAG platforms uses a metagrammar compiler. The goal of the compiler is to automatically produce a TAG from a reduced description. This description corresponds to (a) a hierarchy of tree fragments and (b) combinations of these fragments defined using a control language. Furthermore, each tree produced may be equipped with a syntax / semantic interface following (Gardent and Kallmeyer, 03).

The semantic construction is based on the result of the syntactic parsing. Parsing is done by a tabular TAG parser generated automatically from the input TAG by the DyALog system of (De La Clergerie, 05). This parser outputs a derivation forest, which encodes all TAG derivations, and from which the unifications of semantic indices are extracted.

This platforms has been evaluated in terms of semantic coverage on the TSNLP test-suite.
Dans cette thèse, nous proposons une architecture logicielle (SemTAG) permettant de réaliser un calcul sémantique pour grammaires d'Arbres Adjoints. Plus précisément, cette architecture fournit un environnement permettant de construire une représentation sémantique sous-spécifiée (Predicate Logic Unplugged (Bos, 1995)) à partir d'une grammaire et d'un énoncé.

Afin de faciliter la gestion de grammaires de taille réelle, la plate-forme SemTAG intègre un compilateur de métagrammaires. Le rôle de ce compilateur est de produire semi-automatiquement une grammaire à partir d'une description factorisée. Cette description correspond à (a)~une hiérarchie de fragments d'arbres et (b)~des combinaisons de ces fragments au moyen d'un langage de contrôle. De plus, chaque arbre ainsi produit peut être équipé d'une interface syntaxe / sémantique à la (Gardent et Kallmeyer, 2003).

La construction sémantique est réalisée à partir du résultat de l'analyse syntaxique. Cette analyse est fournie par un analyseur syntaxique tabulaire généré automatiquement à partir de la grammaire d'entrée au moyen du système DyALog (De La Clergerie, 2005). Cet analyseur produit une forêt de dérivation, qui encode toutes les dérivations, et à partir desquelles les unifications des indexes sémantiques sont extraites.

Cette plate-forme a été évaluée en termes de couverture sémantique sur la test-suite TSNLP.
Fichier principal
Vignette du fichier
these-yp.pdf (1.95 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00142543 , version 1 (19-04-2007)

Identifiants

  • HAL Id : tel-00142543 , version 1

Citer

Yannick Parmentier. SemTAG : une plate-forme pour le calcul sémantique à partir de Grammaires d'Arbres Adjoints. Autre [cs.OH]. Université Henri Poincaré - Nancy I, 2007. Français. ⟨NNT : ⟩. ⟨tel-00142543⟩
274 Consultations
1066 Téléchargements

Partager

Gmail Facebook X LinkedIn More