Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Poster De Conférence Année : 2015

Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio

Résumé

L’analyse d'expériences bioinformatiques comprend la comparaison des nouveaux résultats obtenus aux données existantes. Durant ces trente dernières années, les scientifiques ont du faire face à une avalanche de données, de différents types, et présentes dans une multitude de bases de données publiques. L’accès aux données publiques se fait par l’interrogation de portails (tels que le portail Entrez du NCBI) au moyen de mots clés. Cependant, deux requêtes très similaires peuvent fournir des ensembles de réponses différents conduisant l’utilisateur à devoir tester différentes reformulations de ses requêtes (termes synonymes, variantes orthographiques, abréviations).... Les résultats obtenus doivent ensuite être filtrés, comparés... En outre, chaque ensemble de résultats est classé par le portail (en utilisant le nombre d'occurrences du mot-clé dans chaque résultat). Cependant, lorsque plusieurs reformulations sont considérées, il n'est pas simple de produire un classement triant par ordre de pertinence l'ensemble des résultats recueillis séparément, d'autant que ces résultats peuvent être fournis par centaines. Dans cette démonstration, nous présentons ConQuR-Bio (http://conqur-bio.lri.fr) qui permet aux utilisateurs d'interroger les bases de données publiques du NCBI tout en générant automatiquement toutes les reformulations possibles et fournit des réponses triées en utilisant des techniques de consensus de classement (ou agrégation de classements). Notre démonstration montrera l’intérêt de notre approche pour des requêtes biomédicales, lors de la recherche de gènes issus d’EntrezGene et impliqués dans des maladies.
Fichier non déposé

Dates et versions

hal-01167840 , version 1 (01-12-2015)

Identifiants

  • HAL Id : hal-01167840 , version 1
  • PRODINRA : 312420

Citer

Bryan Brancotte, Bastien Rance, Alain Denise, Sarah Cohen-Boulakia. Interrogation de bases de données biologiques publiques par reformulation de requêtes et classement des résultats avec ConQuR-Bio. JOBIM: Journées Ouvertes Biologie Informatique Mathématiques, Jul 2015, Clermont-Ferrand, France. , pp.35 slides, 2015. ⟨hal-01167840⟩
583 Consultations
2 Téléchargements

Partager

Gmail Facebook X LinkedIn More