Acquisition semi-automatique de collocations à partir de corpus monolingues et multilingues comparables - IMAG Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Acquisition semi-automatique de collocations à partir de corpus monolingues et multilingues comparables

Résumé

Cet article présente une méthode d'acquisition semi-automatique de colloca- tions. Notre extraction monolingue estime pour chaque co-occurrence sa capacité à être une collocation, d'après une mesure statistique modélisant une caractéristique essentielle (le fait qu'une collocation se produit plus souvent que par hasard), effectue ensuite un filtrage auto- matique (en utilisant les vecteurs conceptuels) pour ne retenir que des collocations d'un certain type sémantique, puis effectue enfin un nouveau filtrage à partir de données entrées manuel- lement. Notre extraction bilingue est effectuée à partir de corpus comparables, et a pour but d'extraire des collocations qui ne soient pas forcément traductions mot-à-mot l'une de l'autre. Notre évaluation démontre l'intérêt de mêler extraction automatique et intervention manuelle pour acquérir des collocations et ainsi permettre de compléter les bases lexicales multilingues.
Fichier principal
Vignette du fichier
ARCHER_Recital06.pdf (71.39 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00983425 , version 1 (25-04-2014)

Identifiants

  • HAL Id : hal-00983425 , version 1

Citer

Vincent Archer. Acquisition semi-automatique de collocations à partir de corpus monolingues et multilingues comparables. RECITAL 2006, Apr 2006, Leuven, Belgique. pp.651-660. ⟨hal-00983425⟩
199 Consultations
185 Téléchargements

Partager

Gmail Facebook X LinkedIn More