Une méthode de sélection de caractéristiques fondées sur l'intégrale de Choquet et l'analyse des typicalités
Résumé
Cet article expose une méthode itérative de sélection de caractéristiques fondée sur l'intégrale de Choquet et l'analyse des typicalités. La méthode proposée est appliquée à la reconnaissance de défauts sur des planches de bois, domaine dans lequel peu de données sont disponibles en apprentissage. Le choix d'un sous-ensemble de caractéristiques parmi ceux extraits d'une image n'est pas aisé pour un non expert du domaine. Il apparaît, à l'usage, que même un expert du domaine choisi un jeu de caractéristiques plus par habitude que par une analyse du problème. Ainsi, pour pallier ce manque de connaissances du domaine ou cette routine, nous proposons une méthode permettant de sélectionner automatiquement le jeu de caractéristiques le mieux adapté au problème considéré. Le module de reconnaissance mis en place repose sur une base de règles qui est automatiquement générée à partir d'un lot d'apprentissage. Choisir un jeu de caractéristiques quasi optimal doit permettre de réduire la complexité de la base de règles et ainsi garder une bonne interprétabilité du mécanisme de reconnaissance. Pour l'application testée, la méthode itérative implémentée a déterminé un choix de caractéristiques très similaire au choix de l'expert. La légère différence entre les deux jeux de caractéristiques entraîne une différence non négligeable en terme de taux de reconnaissance, la méthode itérative améliorant de 4% les performances. Cependant, en terme de complexité du modèle, la base de règles générée est deux fois plus importante que celle obtenue avec le choix par expertise.