Traitement intelligent de données par réseaux de neurones artificiels : application à la valorisation des systèmes d'information géographiques - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2006

Intelligent Data Processing using Artificial Neural Networks : Mineral exploration Application

Traitement intelligent de données par réseaux de neurones artificiels : application à la valorisation des systèmes d'information géographiques

Résumé

The purpose of this thesis is: (i) establish predictive maps on ore deposits, (ii) select a subset of descriptive features that effectively contribute to the building of these predictive maps, (iii) identify and interpret dependencies between the selected features, (iv) place the features into a hierarchy that indicates their importance. A real-life data of Geographical Information System provided by the French geological survey (BRGM) have been used in the accomplished experiments. In order to establish predictive maps, we have used neural network ensemble which is a very successful technique where outputs of a set of separately trained neural network are combined to form one unified prediction. This technique generates several predictive maps following the used aggregation function. In addition, to understand domain data, we have focused on selecting a subset of relevant features. We have proposed an improvement of existing features selection techniques that are based on the principle of Optimal Brain Damage (OBD) as well as those of Optimal Brain Surgeon (OBS) and Mutual Information (MI). We have also proposed novel solutions to understand data that combine ensemble feature selection approach with either concept lattices or statistic techniques. The latter solutions help discovering all relevant features and organizing them into hierarchy according to their concurrencies in the selected subsets of features. Moreover, we have addressed the problem of clustering-based analysis of data provided with multiple labels. The proposed approach uses new measures that extend the scope of the recall and precision measures in information retrieval (IR) to the processing of multi-label data. Experiments have been carried out on data pertaining to geographical information system and documentary system have highlighted the accuracy of our approach for knowledge extraction.
Les travaux de recherche présentés dans cette thèse rentrent dans le cadre de la problématique de l'Extraction de Connaissances à partir des Données (ECD) que nous avons illustrée à travers le traitement des données du Système d'Information Géographique établi par le Bureau de Recherches Géologiques et Minières (BRGM). Les objectifs de cette thèse sont d'établir des cartes prédictives de substances, d'avoir une interprétation sur les critères permettant d'établir cette décision, et de fournir une hiérarchisation des attributs descriptifs. Pour atteindre ces objectifs, nous avons proposé étape par étape un ensemble d'améliorations que nous allons présenter comme suit : Dans un premier temps, nous avons proposé d'utiliser l'approche ensemble de classifieurs de réseaux de neurones offrant des réponses probabilistes afin de construire des cartes prédictives complémentaires pour une meilleure interprétation. Nous avons également proposé d'utiliser les techniques de détermination des " outliers " pour détecter les zones qui ne présentent pas les conditions de minéralisation. Dans un deuxième temps, nous avons proposé des améliorations de techniques pour la sélection de variables, en particulier pour les deux familles de sélection Optimal Brain Damage et Optimal Brain Surgeon, et pour des critères d'évaluation des méthodes de sélection de variables basées sur l'information mutuelle. Nous avons proposé d'utiliser l'approche ensembliste en sélection de variables pour déterminer les variables les plus pertinentes, hiérarchiser de manière globale l'ensemble des variables, permettre aux experts de choisir la ou les solutions qui apparaissent comme étant les plus compréhensibles, et enfin pour se focaliser uniquement sur une combinaison de règles décrivant le concept-cible issue d'un sous-ensemble pertinent de variables. Les deux premiers objectifs visés ci-dessus ont été abordés en utilisant les treillis de Galois et l'analyse statistique de distribution.
Fichier non déposé

Dates et versions

tel-01754272 , version 1 (30-03-2018)

Identifiants

  • HAL Id : tel-01754272 , version 1

Lien texte intégral

Citer

Mohammed Attik. Traitement intelligent de données par réseaux de neurones artificiels : application à la valorisation des systèmes d'information géographiques. Autre [cs.OH]. Université Henri Poincaré - Nancy 1, 2006. Français. ⟨NNT : 2006NAN10211⟩. ⟨tel-01754272⟩
69 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More