De l'induction confirmatoire à la classification : contribution à l'apprentissage automatique - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 1997

De l'induction confirmatoire à la classification : contribution à l'apprentissage automatique

Résumé

Confirmatory generalisation consists in determining the most general laws confirmed by a set of observations. Confirmatory induction is based on the similarity assumption: unknown individuals behave like known individuals. We show that a circumscription of individuals is more appropriate to model this assumption than a circumscription of properties. Compared to existing approaches, the model we propose can produce more general clauses and avoids the production of unwanted generalisations. We specialise this model defined in first-order logic to attribute-value languages and show that it cornes down, in this case, to the calculation of prime implicates. Considering the problem of classification of objects from examples, we show that the minimal consistent and relevant rules are not, in general, confirmatory generalisations. We propose a new classification technique, called scope classification, which consists of building the set of examples from which a consistent and relevant rule can be built, so it is an instance-based approach of rule-based classification. We present several adaptations of the logical basements of the scope classification to better deal with real data. Scope classification is also extended to instances generalised into rules. The generalisation strategies we introduce, and especially the search of the neighbours, clearly differ from those of existing techniques. We show that, whereas hypotheses built by the scope classification and by the disjunctive version space differ, both techniques leads to the same classification . Though, in addition to a more efficient implementation, our original point of view allows us to propose sorne developments specifie to a rule-based approach. Our system obtains on average a better accuracy and a similar execution time to sorne of the most used instance-based or rule-based systems on an usual set of benchmarks.
La généralisation confirmatoire consiste à déterminer les lois les plus générales confirmées par un ensemble d'observations. L'induction confirmatoire repose sur l'hypothèse des similarités : les individus inconnus se comportent comme les individus connus. Nous montrons qu'une circonscription des individus modélise mieux cette hypothèse qu'une circonscription des propriétés. Nous proposons un modèle capable d'obtenir des clauses plus générales et d'éviter des généralisations indésirables par rapport aux approches existantes. Ce modèle défini en logique des prédicats se spécialise dans le cas propositionnel en un calcul des premiers impliqués. Considérant le problème de la classification, ou classement, d'objets à partir d'exemples, nous montrons que les règles minimales cohérentes et pertinentes ne sont pas, dans le cas général, des généralisations confirmatoires. Nous proposons une nouvelle technique de classification, dite par portée, qui consiste à chercher l'ensemble des exemples à partir desquels une règle cohérente et pertinente peut être construite. Elle a donc une approche à base d'instances de la classification à base de règles. Nous présentons un ensemble d'adaptations des fondements logiques de la classification par portée aux données réelles. Nous étendons également notre technique aux instances généralisées en règles. Les stratégies de généralisation que nous proposons, et surtout la recherche des voisins diffèrent nettement de celles existantes. Nous montrons que, bien que les hypothèses construites diffèrent, notre approche et celle de l'espace des versions disjonctives conduisent au même classement. Notre point de vue original permet cependant de proposer, au delà d'une implantation plus efficace, des développements propres à une approche à base de règles. Notre approche a en moyenne une meilleure précision et un temps d'exécution semblable à ceux les approches les plus utilisées à base d'instances ou à base de règles sur des ensembles de test usuels.
Fichier principal
Vignette du fichier
SCD_T_1997_0267_LACHICHE.pdf (20.87 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-01747518 , version 1 (29-03-2018)

Identifiants

  • HAL Id : tel-01747518 , version 1

Citer

Nicolas Lachiche. De l'induction confirmatoire à la classification : contribution à l'apprentissage automatique. Informatique [cs]. Université Henri Poincaré - Nancy 1, 1997. Français. ⟨NNT : 1997NAN10267⟩. ⟨tel-01747518⟩
45 Consultations
19 Téléchargements

Partager

Gmail Facebook X LinkedIn More