Contextualisation, Visualisation et Evaluation en Apprentissage Non Supervisé - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2006

Contextualisation, Visualisation et Evaluation en Apprentissage Non Supervisé

Résumé

Cette thèse se place dans le cadre de l'apprentissage non supervisé, qui consiste à former différents groupes à partir d'un ensemble de données, de telle manière que les données considérées comme les plus similaires soient associées au même groupe et qu'au contraire les données considérées comme différentes se retrouvent dans des groupes distincts, permettant ainsi d'extraire de la connaissance à partir de ces données. Nous proposons d'abord deux nouvelles méthodes qui prennent en compte le contexte dans lequel les groupes sont créés, c'est-à-dire le fait que les caractéristiques des différents groupes peuvent être définies sur différents sous-ensembles des attributs décrivant les données. Dans la mise en oeuvre de ces méthodes, nous avons également considéré les problématiques de la minimisation du nombre de connaissances a priori requises de la part de l'utilisateur et de la présentation des résultats sous forme compréhensible et visuelle. Nous présentons ensuite plusieurs extensions possibles de ces méthodes, dans le cadre de l'apprentissage supervisé puis face à des données semi-structurées représentées sous forme arborescente. Différentes expérimentations sur données artificielles puis sur données réelles sont présentées qui mettent en avant l'intérêt de ces méthodes. Le problème de l'évaluation des résultats produits par une méthode d'apprentissage non supervisé, et de la comparaison de telles méthodes, restant aujourd'hui un problème ouvert, nous proposons enfin une nouvelle méthode d'évaluation plus objective et quantitative que celles utilisées traditionnellement, et dont la pertinence est montrée expérimentalement.

Domaines

Autre [cs.OH]
Fichier principal
Vignette du fichier
these-9.pdf (2.56 Mo) Télécharger le fichier

Dates et versions

tel-00617420 , version 1 (29-08-2011)

Identifiants

  • HAL Id : tel-00617420 , version 1

Citer

Laurent Candillier. Contextualisation, Visualisation et Evaluation en Apprentissage Non Supervisé. Autre [cs.OH]. Université Charles de Gaulle - Lille III, 2006. Français. ⟨NNT : ⟩. ⟨tel-00617420⟩
972 Consultations
1364 Téléchargements

Partager

Gmail Facebook X LinkedIn More