Actes du groupe de travail en biostatistiques NANCY septembre 2005-juin 2006 - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2007

Actes du groupe de travail en biostatistiques NANCY septembre 2005-juin 2006

Résumé

A l'aide d'un spectromètre de masse, on détermine à partir d'un échantillon de sang d'un individu les quantités de protéines de différents types présentes. Le problème est alors de voir si l'on peut distinguer par cette analyse (les statisticiens disent "discriminer") un individu sain d'un individu atteint d'un certain type de cancer, de déterminer des protéines qui sont des "biomarqueurs" de ce cancer (il s'agit de déterminer des caractères discriminants), puis, pour un individu dont on ne sait pas s'il est sain ou cancéreux, de le classer dans l'une de ces catégories à partir de l'observation des biomarqueurs (c'est le problème du classement, encore appelé classification supervisée). L'intérêt statistique de l'étude est que l'on peut observer dans un spectre 15000 quantités de protéines différentes, alors que le nombre d'individus observés n'est que de deux ou trois centaines : on a un tableau de données avec peu d'individus et un très grand nombre de caractères (c'est le "fléau de la dimension").

Mots clés

Fichier principal
Vignette du fichier
ActesBiostat_06.pdf (2.73 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00135156 , version 1 (30-06-2011)

Identifiants

  • HAL Id : hal-00135156 , version 1

Citer

Pierre P. Vallois, Jean-Marie Monnez. Actes du groupe de travail en biostatistiques NANCY septembre 2005-juin 2006. 2007. ⟨hal-00135156⟩
155 Consultations
136 Téléchargements

Partager

Gmail Facebook X LinkedIn More