Méthodes de carte auto-organisatrice par mélange de lois contraintes. Application à l'exploration dans les tableaux de contingence textuels - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2003

Méthodes de carte auto-organisatrice par mélange de lois contraintes. Application à l'exploration dans les tableaux de contingence textuels

Rodolphe Priam
  • Fonction : Auteur
  • PersonId : 1038360

Résumé

This thesis is concerned with exploratory analysis of multidimensional data, which are often qualitative or textual, in particular Kohonen's self-organizing map models. The goal is to cluster and project simultaneously lines or columns of a data matrix. The result of these methods is a reduction in the form of a discrete surface of regression. We study more precisely mixture models of probabilistic laws: the parameters corresponding to means of clustered vectors are constrained by setting them at the nodes of a rectangular mesh. After an overview of these methods, and of the learning algorithms based on EM (Expectation - Maximization), we introduce two new approaches. The first one aims at generalizing the Correspondence Analysis method to large matrices: the CASOM algorithm is a naive Bayes classifier, which is constrained as a TPEM (Topology Preserving EM) for a contingency table. The second one consists in mutating image-clustering algorithms into map algorithms. As an illustration, we modify a clustering algorithm based on mean-field, and we get an algorithm named TNEM. We use these methods to ease the navigation in a textual corpus. Indeed, we provide objective criteria and cartographies.
Cette thèse d'intéresse à l'analyse exploratoire des données multimdimensionnelles souvent qualitatives voire textuelles par des modèles particuliers de carte auto-organisatrice de Kohonen. Il s'agit d'effectuer une classification et une projection simultanées des lignes ou colonnes d'une matrice de données. Le résultat de ces méthodes est une réduction sous la forme d'une surface de régression discrète. Nous étudions plus particulièrement les modèles de mélange de lois de probabilité : les paramètres correspondant aux espérances des vecteurs classés sont contraints en les plaçant aux nœuds d'une grille rectangulaire. Après une présentation de ces méthodes, et des algorithmes d'estimation basés sur l'EM (Expectation - Maximization), nous introduisons essentiellement deux nouvelles approches. La première vise à "généraliser la méthode d'Analyse Factorielle des Correspondances" aux grandes matrices : l'algorithme CASOM est un classifieur naïf de Bayes contraint en un TPEM (Topology Preserving EM) pour tableau de contingence. La seconde consiste en un schéma général d'adaptation des méthodes de segmentation d'image en carte auto-organisatrice. Pour l'illustrer, nous modifions un algorithme de segmentation par champs moyens, et obtenons un algorithme appelé TNEM. Nous utilisons ces méthodes pour aider à la navigation dans un corpus textuel. En effet, nous aboutissons à des critères et des moyens de représentation objectifs.
Fichier principal
Vignette du fichier
these_Rodolphe_Priam.pdf (3.09 Mo) Télécharger le fichier

Dates et versions

tel-00532832 , version 1 (04-11-2010)

Identifiants

  • HAL Id : tel-00532832 , version 1

Citer

Rodolphe Priam. Méthodes de carte auto-organisatrice par mélange de lois contraintes. Application à l'exploration dans les tableaux de contingence textuels. Interface homme-machine [cs.HC]. Université Rennes 1, 2003. Français. ⟨NNT : ⟩. ⟨tel-00532832⟩
227 Consultations
345 Téléchargements

Partager

Gmail Facebook X LinkedIn More