Conversion et améliorations de corpus du français annotés en Universal Dependencies - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2019

Conversion et améliorations de corpus du français annotés en Universal Dependencies

Résumé

This paper describes an effort to improve the consistency of two French corpora annotated with the Universal Dependencies (UD) scheme. The Universal Dependencies project aims at building a syntactic dependency scheme which allows similar analyses for several different languages. We improved the annotations of the two French corpora to render them closer to the UD scheme, and evaluated the changes done to the corpora in terms of closeness to the UD scheme as well as of internal corpus consistency.
Cet article décrit l'effort d'amélioration de deux corpus du français annotés en dépendances syntaxiques, qui s'inscrit dans le cadre du projet Universal Dependencies (UD) qui vise à élaborer un schéma d'annotation syntaxique permettant d'analyser de façon similaire plusieurs langues différentes. Nous avons cherché à rendre plus conformes au schéma UD ces deux corpus du français, et nous avons évalué l'impact des modifications apportées aux corpus sur la conformité avec le schéma UD et la cohérence interne de leur annotation.
Fichier principal
Vignette du fichier
UD_French.pdf (712.23 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02267418 , version 1 (19-08-2019)

Identifiants

  • HAL Id : hal-02267418 , version 1

Citer

Bruno Guillaume, Marie-Catherine de Marneffe, Guy Perrier. Conversion et améliorations de corpus du français annotés en Universal Dependencies. Revue TAL : traitement automatique des langues, 2019, 60 (2), pp.71-95. ⟨hal-02267418⟩
277 Consultations
599 Téléchargements

Partager

Gmail Facebook X LinkedIn More