Agrégation de sac-de-sacs-de-mots pour la recherche d'information par modèles vectoriels - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Agrégation de sac-de-sacs-de-mots pour la recherche d'information par modèles vectoriels

Vincent Claveau

Résumé

Cet article étudie l'intérêt de représenter les documents textuels non plus comme des sacs-de-mots, mais comme des sacs-de-sacs-de-mots. Au cœur de l'utilisation de cette représentation, le calcul de similarité entre deux objets nécessite alors d'agréger toutes les similarités entre sacs de chacun des objets. Nous évaluons cette représentation dans un cadre de recherche d'information, et étudions les propriétés attendues de ces fonctions d'agrégation. Les expériences rapportées montrent l'intérêt de cette représentation lorsque les opérateurs d'agrégation respectent certaines propriétés, avec des gains très importants par rapport aux représentations standard.
Fichier principal
Vignette du fichier
Claveau_BoBow_EGC14.pdf (167.15 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01027719 , version 1 (22-07-2014)

Identifiants

  • HAL Id : hal-01027719 , version 1

Citer

Vincent Claveau. Agrégation de sac-de-sacs-de-mots pour la recherche d'information par modèles vectoriels. 14 ème conférence Extraction et Gestion des Connaissances, EGC 2014, Jan 2014, Rennes, France. 6 p. ⟨hal-01027719⟩
179 Consultations
757 Téléchargements

Partager

Gmail Facebook X LinkedIn More