Clustering of Multiple Dissimilarity Data Tables for Documents Categorization

Yves Lechevallier; Francisco de A.T. de Carvalho; Thierry Despeyroux; Filipe M. de Melo

doi:10.1007/978-3-7908-2604-3

Communication Dans Un Congrès Année : 2010

Clustering of Multiple Dissimilarity Data Tables for Documents Categorization

(1) , (1, 2) , (1) , (2)

1
2

Yves Lechevallier

Fonction : Auteur

Usage-centered design, analysis and improvement of information systems

Francisco de A.T. de Carvalho

Fonction : Auteur
PersonId : 845635

Usage-centered design, analysis and improvement of information systems

Centro de Informatica UFPE [Recife]

Thierry Despeyroux

Fonction : Auteur
PersonId : 830028

Usage-centered design, analysis and improvement of information systems

Filipe M. de Melo

Fonction : Auteur
PersonId : 899358

Centro de Informatica UFPE [Recife]

Résumé

This paper introduces a clustering algorithm that is able to partition objects taking into account simultaneously their relational descriptions given by multiple dissimilarity matrices. These matrices could have been generated using different sets of variables and a fixed dissimilarity function, using a fixed set of variables and different dissimilarity functions or using different sets of variables and dissimilarity functions. This method, which is based on the dynamic hard clustering algorithm for relational data, is designed to provided a partition and a prototype for each cluster as well as to learn a relevance weight for each dissimilarity matrix by optimizing an adequacy criterion that measures the fit between clusters and their representatives. These relevance weights change at each algorithm iteration and are different from one cluster to another. Experiments aiming at obtaining a categorization of a document data base demonstrate the usefulness of this partitional clustering method.

Mots clés

Clustering Analysis Relational Data Documents Categorization

Domaines

Recherche d'information [cs.IR]

Fichier principal

Yves-Francisco-COMPSTAT2010.pdf (195.11 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Thierry Despeyroux : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00586225

Soumis le : vendredi 15 avril 2011-14:06:36

Dernière modification le : mercredi 15 mars 2023-08:58:08

Archivage à long terme le : jeudi 8 novembre 2012-16:36:33

Dates et versions

inria-00586225 , version 1 (15-04-2011)

Identifiants

HAL Id : inria-00586225 , version 1
DOI : 10.1007/978-3-7908-2604-3
PRODINRA : 51306

Citer

Yves Lechevallier, Francisco de A.T. de Carvalho, Thierry Despeyroux, Filipe M. de Melo. Clustering of Multiple Dissimilarity Data Tables for Documents Categorization. COMPSTAT 2010 - 19th International Conference on Computational Statistics, Aug 2010, Paris, France. pp.1263-1270, ⟨10.1007/978-3-7908-2604-3⟩. ⟨inria-00586225⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INRIA INRIA2

146 Consultations

359 Téléchargements

Clustering of Multiple Dissimilarity Data Tables for Documents Categorization

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager