Generalized k-means based clustering for temporal data under time warp - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2016

Generalized k-means based clustering for temporal data under time warp

K-means généralisé pour la classification non supervisée de séries temporelles sous des distances et kernels élastiques

Résumé

Temporal data naturally arise in various emerging applications, such as sensor networks, human mobility or internet of things. Clustering is an important task, usually applied a priori to pattern analysis tasks, for summarization, group and prototype extraction; it is all the more crucial for dimensionality reduction in a big data context. Clustering temporal data under time warp measures is challenging because it requires aligning multiple temporal data simultaneously. To circumvent this problem, costly k-medoids and kernel k-means algorithms are generally used. This work investigates a different approach to temporal data clustering through weighted and kernel time warp measures and a tractable and fast estimation of the representative of the clusters that captures both global and local temporal features. A wide range of public and challenging datasets, encompassing images, traces and ecg data that are non-isotropic (i.e., non-spherical), not well-isolated and linearly non-separable, is used to evaluate the efficiency of the proposed temporal data clustering. The results of this comparison illustrate the benefits of the method proposed, which outperforms the baselines on all datasets. A deep analysis is conducted to study the impact of the data specifications on the effectiveness of the studied clustering methods.
L'alignement de multiples séries temporelles est un problème important non résolu dans de nombreuses disciplines scientifiques. Les principaux défis pour l'alignement temporel de multiples séries comprennent la détermination et la modélisation des caractéristiques communes et différentielles de classes de séries. Cette thèse est motivée par des travaux récents portant sur l'extension de la DTW pour l'alignement de séries multiples issues d'applications diverses incluant la reconnaissance vocale, l'analyse de données micro-array, la segmentation ou l'analyse de mouvements humain. Ces travaux fondés sur l'extension de la DTW souffrent cependant de plusieurs limites : 1) Ils se limitent au problème de l'alignement par pair de séries 2) Ils impliquent uniformément les descripteurs des séries 3) Les alignements opérés sont globaux. L'objectif de cette thèse est d'explorer de nouvelles approches d'alignement temporel pour la classification non supervisée de séries. Ce travail comprend d'abord le problème de l'extraction de prototypes, puis de l'alignement de séries multiples multidimensionnelles...
Fichier principal
Vignette du fichier
soheily-phdthesis(bien forme).pdf (5.52 Mo) Télécharger le fichier
thesis_rapport.pdf (481.69 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01394280 , version 1 (16-11-2016)
tel-01394280 , version 2 (13-11-2017)

Identifiants

  • HAL Id : tel-01394280 , version 2

Citer

Saeid Soheily-Khah. Generalized k-means based clustering for temporal data under time warp. Artificial Intelligence [cs.AI]. Universite Grenoble Alpes, 2016. English. ⟨NNT : ⟩. ⟨tel-01394280v2⟩
566 Consultations
2701 Téléchargements

Partager

Gmail Facebook X LinkedIn More