Des séquences aux tendances - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Des séquences aux tendances

Résumé

Temporal data can be handled by different techniques for discovering specific knowl- edge. Sequential pattern mining allows discovering frequent sequences embedded in temporally annotated records. In the access data of a Web site, one may, for instance, discover that “5% of the users request the page register.php and then request the page help.html”. However, se- quential patterns do not allow extracting temporal tendencies. By means of temporal tendency mining, one may discover in the same access data that “An increasing number of requests to registration.php during a short period preceeds an increasing number of requests to faq.html, after a very short period”. In this paper, we define evolution patterns that allow discovering such knowledge. We define evolution patterns and introduce our algorithms TED and EVA.
Les données temporelles peuvent être traitées de nombreuses façons afin d'en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d'enregistrements annotés temporellement. L'analyse des accès à un site web permet par exemple de découvrir que "5% des utilisateurs accèdent à la page register.php puis à la page help.html". Cependant, les motifs séquentiels ne permettent pas d'extraire des tendances temporelles, du type "une augmentation du nombre de requêtes au formulaire d'inscription précède souvent une augmentation des requêtes à la page d'aide quelques secondes plus tard". Dans cet article, nous proposons d'extraire des motifs caractérisant ces évolutions fréquentes grâce à deux algorithmes, TED et EVA. Nous présentons notre approche, implémentée et testée sur des données réelles.
Fichier principal
Vignette du fichier
lirmm-00273920v1.pdf (253.11 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-00273920 , version 1 (09-10-2019)

Identifiants

  • HAL Id : lirmm-00273920 , version 1

Citer

Céline Fiot, Florent Masseglia, Anne Laurent, Maguelonne Teisseire. Des séquences aux tendances. INFORSID: INFormatique des ORganisations et Systèmes d’Information et de Décision, May 2008, Fontainebleau, France. ⟨lirmm-00273920⟩
245 Consultations
29 Téléchargements

Partager

Gmail Facebook X LinkedIn More