Extraction de motifs dans les graphes de workflows scientifiques - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Mémoire D'étudiant Année : 2014

Extraction de motifs dans les graphes de workflows scientifiques

Résumé

La quantité de données données biologiques est en pleine croissance. Une fois ces données brutes collectées, il faut les analyser et les comparer aux données existantes pour obtenir de nouvelles connaissances. Cette analyse se fait grâce à l'utilisation de différents outils, scripts ou programmes que l'on peut aujourd'hui utiliser et enchaîner en utilisant un système de gestion de workflows scientifique. L'utilisation des systèmes de workflows est en plein essor, donnant lieu à un important développement des bases de données pour stocker ces workflows. Cependant, très peu de techniques ont été mises en œuvre pour pouvoir aider les utilisateurs dans la conception des workflows scientifiques, notamment pour les aider à tirer au mieux partie des workflows existants dans les bases qui pourraient être réutilisés. Un besoin fort est présent dans la communauté bioinformatique pour proposer des techniques pour guider les utilisateurs dans leur choix d'ensemble d'outils à (ré)utiliser. C'est dans ce cadre que s'articule les travaux de mon stage académique. Plus précisément, notre objectif est d'extraire des workflows scientifiques des sous-structures fréquentes et intéressantes et constituer des librairies de motifs. Dans nos travaux, nous avons étudié de façon approfondie les structures (grands graphes) des workflows scientifiques et nous avons fait un état de l'art des approches existantes d'extraction de motifs à base de graphes. Nous avons choisi d'étudier plus particulièrement les résultats fournis par deux algorithmes d'extraction qui ont fait leurs preuves sur des données réelles. Nous avons proposé d'utiliser et nous avons adapté au contexte plusieurs métriques pour rendre compte de la qualité des motifs extraits. Nos contributions sont les suivantes : (i) nous avons mis en évidence des caractéristiques structurelles des workflows scientifiques ayant un impact sur le problème de l'extraction de motifs dans les workflows ; (ii) nous proposons une étude comparative quantitative et qualitative des résultats obtenus par deux algorithmes d'extraction de motifs.
Fichier principal
Vignette du fichier
mri20132014_submission_82.pdf (4.33 Mo) Télécharger le fichier
Loading...

Dates et versions

dumas-01088813 , version 1 (04-01-2015)

Licence

Paternité

Identifiants

  • HAL Id : dumas-01088813 , version 1

Citer

Stéphanie Kamgnia Wonkap. Extraction de motifs dans les graphes de workflows scientifiques. Bio-informatique [q-bio.QM]. 2014. ⟨dumas-01088813⟩
353 Consultations
551 Téléchargements

Partager

Gmail Facebook X LinkedIn More