Intégration des connaissances ontologiques dans la fouille de motifs séquentiels avec application à la personnalisation web - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2008

Intégration des connaissances ontologiques dans la fouille de motifs séquentiels avec application à la personnalisation web

Mehdi Adda
  • Fonction : Auteur

Résumé

Data mining aims at extracting knowledge from large sets of data such as association rules, clusters and patterns. When both associations and temporal order between items are sought, the discovered knowledge are called sequential patterns. Existing studies were conducted mainly on sequential patterns involving objects and in some cases object categories. While patterns based on objects are too specific, non frequent patterns based on categories (concepts) may have different levels of abstraction and be possibly less precise. Taking into account a given domain ontology during a data mining process allows the discovery of more compact and relevant patterns than in case of the absence of such source of knowledge. Moreover, objects may not be only expressed by the concepts they are attached to, but also by the semantic links that hold between concepts. However, related studies that exploited domain knowledge are restrictive with regard to the expressive power offered by ontology. Our contribution consists to define the syntax and the semantics of a pattern lan- guage which exploits knowledge embedded in an ontology during the process of mining sequential patterns. The language offers a set of primitives for pattern description and manipulation. Our data mining technique explores the pattern space level by level using a set of navigation primitives which take into account the generalization/spécialization links that hold between concepts (and relationships) contained in patterns at different abstraction levels. In order to validate our approach and analyze the performance and scalability of the proposed algorithm, we developed the OntoMiner plateform. Throughout this thesis, the potential of our mining approach was illustrated with an ex- ample of Web recommendation. We came to the conclusion that taking into account con- cepts and relationships of an ontology during the process of data mining allows the dis- covery of more relevant patterns and leads to better recommendations than those found without using background knowledge.
La fouille de données vise à extraire des connaissances à partir d'un grand volume de données. Lorsque les associations et l'ordre chronologique d'apparition des items sont recherchés, les connaissances extraites sont appelées motifs séquentiels. Les travaux de recherche existants ont porté principalement sur l'étude de motifs séquentiels composés d'objets et dans un certain nombre de cas, de catégories d'objets (concepts). Alors que les motifs d'objets sont trop spécifiques, et de ce fait peuvent être peu fréquents, les motifs de concepts ont divers niveaux d'abstraction et risquent d'être moins précis. La prise en compte d'une ontologie du domaine dans le processus de fouille de données permet de découvrir des motifs plus compacts et plus pertinents qu'en l'absence d'une telle source de connaissance. En outre, les objets peuvent non seulement être décrits par les concepts auxquels ils se rattachent mais aussi par les liens sémantiques qui existent entre concepts. Cependant, les approches de fouille existantes restent restrictives par rapport aux modes d'expression offerts par une ontologie. La contribution de ce travail est de définir la syntaxe et la sémantique d'un langage de motifs qui prend en considération les connaissances incorporées dans une ontologie lors de la fouille de motifs séquentiels. Ce langage offre un ensemble de primitives pour la description et la manipulation de motifs. La méthode de fouille sous-jacente procède au parcours de l'espace de motifs par niveau en se basant sur un ensemble de primitives de navigation. Ces primitives tiennent compte de la relation de généralisation/spécialisation qui existe entre les concepts (et les relations) des motifs. Afin de valider notre approche et analyser la performance et la mise à l'échelle de l'algorithme proposé, nous avons développé la plateforme OntoMiner. Tout au long de la thèse, le potentiel de notre approche de fouille a été illustré à travers un cas de recom- mandation Web. Il ressort que l'inclusion des concepts et des relations dans le processus de fouille permet d'avoir des motifs plus pertinents et de meilleures recommandations que les approches classiques de fouille de motifs séquentiels ou de recommandation.
Fichier principal
Vignette du fichier
phd-thesis_adda_mehdi.pdf (2.45 Mo) Télécharger le fichier

Dates et versions

tel-00842475 , version 1 (08-07-2013)

Identifiants

  • HAL Id : tel-00842475 , version 1

Citer

Mehdi Adda. Intégration des connaissances ontologiques dans la fouille de motifs séquentiels avec application à la personnalisation web. Web. Université des Sciences et Technologie de Lille - Lille I; Université de Montréal, 2008. Français. ⟨NNT : ⟩. ⟨tel-00842475⟩
289 Consultations
320 Téléchargements

Partager

Gmail Facebook X LinkedIn More