Corpus de registres différents pour le développement d’un aligneur d’unités polylexicales - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Corpus de registres différents pour le développement d’un aligneur d’unités polylexicales

Résumé

Comment trouver des données exprimant les mêmes concepts dans des registres de langue différents ? Après un essai infructueux d'extraction terminologique a partir de corpus comparables spécialisés dans le domaine du médical dans trois langues différentes (anglais, allemand, français), l'idée est d'ajouter pour chaque langue des sous-corpus du registre vulgarisé afin d'y détecter des relations de synonymie. Or ce type de ressources n'existe pas pour l'allemand de spécialité dans le domaine du médical. Nous présentons la constitution d'un corpus de 400 000 mots en allemand dans le domaine de la cancérologie, subdivisé en deux sous-corpus de même taille. A partir d'équivalents en allemand du mot-clé "cancer du sein", nous avons recueilli pour un premier sous-corpus, des textes qui s'adressent a des patientes (et des patients) ou a leurs familles, et pour un second sous-corpus, des textes qui s'adressent a des médecins ou des chercheurs en médecine.
Fichier principal
Vignette du fichier
Lemaire_Guilbaud_2020a_LTT_actes_p13-24.pdf (601.12 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03014909 , version 1 (18-12-2020)

Identifiants

  • HAL Id : hal-03014909 , version 1

Citer

Claire Lemaire, Jean-Philippe Guilbaud. Corpus de registres différents pour le développement d’un aligneur d’unités polylexicales. 11èmes Journées du Réseau LTT - Lexicologie, Terminologie, Traduction, Sep 2018, Grenoble, France. ⟨hal-03014909⟩
34 Consultations
30 Téléchargements

Partager

Gmail Facebook X LinkedIn More