Détection par boosting de données aberrantes en régression - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2008

Détection par boosting de données aberrantes en régression

Résumé

Nous proposons une méthode basée sur le boosting, pour la détec-tion des données aberrantes en régression. Le boosting privilégie naturellement les observations difficiles à prévoir, en les surpondérant de nombreuses fois au cours des itérations. La procédure utilise la réitération du boosting pour sélec-tionner parmi elles les données effectivement aberrantes. L'idée de base consiste à sélectionner l'observation la plus fréquemment rééchantillonnée lors des itéra-tions du boosting puis de recommencer après l'avoir retirée. Le critère de sélec-tion est basé sur l'inégalité de Tchebychev appliquée au maximum du nombre moyen d'apparitions dans les échantillons bootstrap. Ainsi, la procédure ne fait pas d'hypothèses sur la loi du bruit. Des exemples tests bien connus sont consi-dérés et une étude comparative avec deux méthodes classiques illustrent le com-portement de la méthode.
Fichier principal
Vignette du fichier
1000722.pdf (308.89 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01633701 , version 1 (21-11-2017)

Identifiants

  • HAL Id : hal-01633701 , version 1

Citer

Nathalie Chèze, Jean-Michel Poggi. Détection par boosting de données aberrantes en régression. Revue des Nouvelles Technologies de l'Information, 2008, pp.159--171. ⟨hal-01633701⟩
104 Consultations
545 Téléchargements

Partager

Gmail Facebook X LinkedIn More