Expériences d'analyse syntaxique statistique du français - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Expériences d'analyse syntaxique statistique du français

Résumé

We show that we can acquire satisfactory parsing results for French from data induced from the French Treebank using an unlexicalised parsing algorithm, that learns a probabilistic contex-free grammar with latent annotations. We investigate various instantiations of the treebank, in order to improve the performance of the learnt parser.
Nous montrons qu'il est possible d'obtenir une analyse syntaxique statistique satisfaisante pour le français sur du corpus journalistique, à partir des données issues du French Treebank du laboratoire LLF, à l'aide d'un algorithme d'analyse non lexicalisé.
Fichier principal
Vignette du fichier
crabbecandi-taln2008-final.pdf (104.13 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00341093 , version 1 (07-09-2010)

Identifiants

  • HAL Id : hal-00341093 , version 1

Citer

Benoît Crabbé, Marie Candito. Expériences d'analyse syntaxique statistique du français. 15ème conférence sur le Traitement Automatique des Langues Naturelles - TALN'08, Jun 2008, Avignon, France. pp. 44-54. ⟨hal-00341093⟩
451 Consultations
1018 Téléchargements

Partager

Gmail Facebook X LinkedIn More