Approches statistiques et sémantiques pour la recherche des signaux faibles - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Approches statistiques et sémantiques pour la recherche des signaux faibles

Résumé

Nous présentons dans cet article une méthode d’extraction de signaux faibles basée sur une double approche. Dans un premier temps un traitement sémantique permet de détecter tous les multi-termes utilisés dans l’ensemble des documents analysés qu’ils soient issus d’une base homogène ou de la fusion de plusieurs bases hétérogènes et ce par traitement du texte libre enrichi par le vocabulaire contrôlé (mots clés, thésaurus, …). Dans un second temps, ne sont retenus que les termes récents à forte densité dans certains documents. Ce vocabulaire retenu est ensuite croisé avec lui-même dans une matrice de cooccurrences qui est ensuite triée par blocs afin d’en extraire des clusters sémantiques cohérents et nouveaux. Ces clusters correspondent à des signaux faibles qu’il est ensuite facile de valider en les croisant avec les autres champs : auteurs, laboratoires, pays, journaux, reste du vocabulaire.
Fichier principal
Vignette du fichier
dousset_22147.pdf (759.39 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02779970 , version 1 (04-06-2020)

Identifiants

  • HAL Id : hal-02779970 , version 1
  • OATAO : 22147

Citer

Bernard Dousset. Approches statistiques et sémantiques pour la recherche des signaux faibles. VSST 2016 : Veille Stratégique Scientifique & Technologique, Oct 2016, Rabat, Maroc. pp.0. ⟨hal-02779970⟩
47 Consultations
41 Téléchargements

Partager

Gmail Facebook X LinkedIn More