ABClass : Une approche d'apprentissage multi-instances pour les séquences - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

ABClass : Une approche d'apprentissage multi-instances pour les séquences

Résumé

In Multiple Instance Learning (MIL) problem for sequence data, the learning data consist of a set of bags where each bag contains a set of instances/sequences. In some real world applications such as bioinformatics comparing a random couple of sequences makes no sense. In fact, each instance of each bag may have structural and/or functional relationship with other instances in other bags. Thus, the classification task should take into account the relation between semantically related instances across bags. In this paper, we present ABClass, a novel MIL approach for sequence data classification. Each sequence is represented by one vector of attributes extracted from the set of related instances. For each sequence of the unknown bag, a discriminative classifier is applied in order to compute a partial classification result. Then, an aggregation method is applied in order to generate the final result. We applied ABClass to solve the problem of bacterial Ionizing Radiation Resistance (IRR) prediction. The experimental results were satisfactory.
Dans le cas du problème de l'apprentissage multi-instances (MI) pour les séquences, les données d'apprentissage consistent en un ensemble de sacs où chaque sac contient un ensemble d'instances/séquences. Dans certaines applications du monde réel, comme la bioinformatique, comparer un couple aléatoire de séquences n'a aucun sens. En fait, chaque instance de chaque sac peut avoir une relation structurelle et/ou fonctionnelle avec d'autres instances dans d'autres sacs. Ainsi, la tâche de classification doit prendre en compte la relation entre les instances sémantiquement liées à travers les sacs. Dans cet article, nous présentons ABClass, une nouvelle approche de classification MI des séquences. Chaque séquence est représentée par un vecteur d'attributs extraits à partir de l'en-semble des instances qui lui sont liées. Pour chaque séquence du sac à prédire, un classifieur discriminant est appliqué afin de calculer un résultat de classification partiel. Ensuite, une méthode d'agrégation est appliquée afin de générer le résultat final. Nous avons appliqué ABClass pour résoudre le problème de la prédiction de la résistance aux rayonnements ionisants (RRI) chez les bactéries. Les résultats expérimentaux sont satisfaisants.
Fichier principal
Vignette du fichier
Zoghlami_et_al_RJCIA_2018_FR_v5.pdf (559.24 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01835432 , version 1 (11-07-2018)

Identifiants

  • HAL Id : hal-01835432 , version 1

Citer

Manel Zoghlami, Sabeur Aridhi, Mondher Maddouri, Engelbert Mephu Nguifo. ABClass : Une approche d'apprentissage multi-instances pour les séquences. RJCIA 2018 - 16èmes Rencontres des Jeunes Chercheurs en Intelligence Artificielle, Jul 2018, Nancy, France. pp.1-9. ⟨hal-01835432⟩
166 Consultations
315 Téléchargements

Partager

Gmail Facebook X LinkedIn More