Classification automatique du langage de données du service hospitalier des urgences - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Classification automatique du langage de données du service hospitalier des urgences

Résumé

Des modèles basés sur l'architecture Transformer qui intègrent une étape de pré-entrainement non supervisé à objectif prédictif, tels que le GPT-2 (Generative Pretrained Transformer 2) ont atteint récemment des succès remarquables. Nous avons adapté et mis en oeuvre un modèle de traitement automatique du langage naturel (NLP pour Natural Language Processing) permettant de déterminer si un texte libre clinique est de nature traumatique ou non. Nous avons comparé cette approche, nécessitant un nombre d'échantillons annotés réduit, à une approche entièrement supervisée. Nos résultats (basés sur l'AUC et le F1-score) montrent qu'il est possible d'adapter un modèle polyvalent tel que le GPT-2 pour créer un outil puissant de classification de notes de texte libre en français avec seulement un très faible nombre d'échantillons labélisés.
Fichier principal
Vignette du fichier
POPULATIONHEALTH.pdf (74.7 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02615327 , version 1 (22-05-2020)

Identifiants

  • HAL Id : hal-02615327 , version 1

Citer

Binbin Xu, Loïck Bourdois, Cédric Gil-Jardine, Eric Tellier, Frantz Thiessard, et al.. Classification automatique du langage de données du service hospitalier des urgences. 3e Journée Dataquitaine : IA, RO et Data Science, Feb 2020, Talence, France. ⟨hal-02615327⟩
312 Consultations
221 Téléchargements

Partager

Gmail Facebook X LinkedIn More