De la recherche de granules documentaires à l'agrégation d'information - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Hdr Année : 2018

De la recherche de granules documentaires à l'agrégation d'information

Résumé

L'expansion du Web depuis la fin des années 90 a modifié en profondeur le fonctionnement des Systèmes de Recherche d'Information (SRI). Côté documents, des données sons, images et vidéos sont venues s'ajouter au texte traditionnellement traité par les SRI. Le texte lui-même s'est transformé, cette mutation étant soutenue par l'expansion des réseaux sociaux et les contenus générés par les utilisateurs. Côté modèles et présentation des résultats, les moteurs de recherche Web, après avoir longtemps proposé aux utilisateurs les fameux 10 liens bleus en réponse à leur requête, incluent maintenant dans leurs pages de résultats des images, des vidéos ou encore des actualités. Lorsque la requête est une entité, un cadre séparé peut également présenter des informations liées. L'idée n'est plus de restituer des documents relatifs à une requête, mais de donner directement à l'utilisateur un aperçu global de l'information liée à son besoin.C'est autour de cette dernière idée que la recherche d'information agrégée a été définie dès 2008, avec pour but de chercher et d'assembler dans une seule interface de l'information utile sous forme de granules d'information provenant d'une ou plusieurs sources. Dans ce cadre, mes recherches se sont plus particulièrement orientées vers:- la recherche de granules d'information. Cet axe porte sur des questions de Recherche d'Information adhoc classique relatives à la sélection de granules pertinents répondant à une requête. Nous avons considéré trois sources d'information spécifiques: (i) les collections de documents semi-structurés de type XML, afin de retrouver des granules textuels ou image; (ii) les plateformes de microblogging de type Twitter, nécessitant un traitement temps-réel des informations; (iii) le Web, pour des problématiques liées aux requêtes de type entité (recherche de relations autour de l'entités et d'informations nouvelles la concernant). - l'agrégation des résultats. Plus particulièrement, nous avons travaillé sur l'agrégation des relations liées à des entités, ainsi que sur le résumé temporel d'informations provenant de documents pertinents autour des entités.Enfin, une dernière partie de mes travaux concerne de façon transverse l'évaluation des systèmes, à travers le montage de collections de test ou la définition de protocoles d'évaluation.
Fichier principal
Vignette du fichier
2018_HDR_KPS.pdf (8.89 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-01865051 , version 1 (30-08-2018)
tel-01865051 , version 2 (14-01-2021)

Identifiants

  • HAL Id : tel-01865051 , version 2

Citer

Karen Pinel-Sauvagnat. De la recherche de granules documentaires à l'agrégation d'information. Recherche d'information [cs.IR]. Université Paul Sabatier (Toulouse 3), 2018. ⟨tel-01865051v2⟩
269 Consultations
291 Téléchargements

Partager

Gmail Facebook X LinkedIn More