Classement de données binaires lorsque les populations d'apprentissage et de test sont différentes - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Chapitre D'ouvrage Année : 2007

Classement de données binaires lorsque les populations d'apprentissage et de test sont différentes

Résumé

L'analyse discriminante généralisée suppose que l'échantillon d'apprentissage et l'échantillon test, qui contient les individus à classer, sont issus d'une même population. Lorsque ces échantillons proviennent de populations pour lesquelles les paramètres des variables descriptives sont différents, l'analyse discriminante généralisée consiste à adapter la règle de classification issue de la population d'apprentissage à la population test, en estimant un lien entre ces deux populations. Ce papier étend les travaux existant dans un cadre gaussien au cas des variables binaires. Afin de relever le principal défi de ce travail, qui consiste à déterminer un lien entre deux populations binaires, nous supposons que les variables binaires sont issues de la discrétisation de variables gaussiennes latentes. Une méthode d'estimation puis des tests sur simulations sont présentés, et une application dans un contexte biologique illustre ce travail.
Fichier non déposé

Dates et versions

hal-00851019 , version 1 (11-08-2013)

Identifiants

  • HAL Id : hal-00851019 , version 1

Citer

Julien Jacques, Christophe Biernacki. Classement de données binaires lorsque les populations d'apprentissage et de test sont différentes. Data Mining et apprentissage statistique : application en assurance, banque et marketing, Cépadues, pp.109-130, 2007, Revue des Nouvelles Technologies de l'Information, 9782854287943. ⟨hal-00851019⟩
264 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More