Clustering incrémental de signaux audio - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Mémoire D'étudiant Année : 2015

Clustering incrémental de signaux audio

Résumé

This report aims to study different methods of online clustering, mainly applied to audio signals. We will first detail the state-of-the art algorithms for clustering, as well as the theory behind them. Then we will extend this methods to incremental clustering, and present different online algorithms. These algorithms are based on the hidden markov models, which are classic art representations of data and hidden states in signal processing, and hidden semi-markov models, which extend them to a semi-markov representation of the states. We present this within the context of audio segmentation – the task of segmenting audio sources in homogenous chunks – and classification – the task of identifying these chunks – applied to audio event detection. We will also set an experimental protocol, with a view to evaluate them and compare the result to a state-of-the art algorithm for the same task.
Ce rapport de stage vise à l’étude de méthodes de partitionnement incrémentales, principalement appliquées à des signaux audio. Nous détaillons tous d’abord les algo- rithmes de partitionnement classiques de la littérature, ainsi que les bases théoriques permettant d’y aboutir. Puis nous présentons des méthodes étendant ces algorithmes de partitionnement au calcul en ligne. Nous utilisons pour cela les hmm, qui sont une modélisation classique de données et états latents en traitement du signal. Nous utili- sons aussi les hsmm, qui sont une extension des hmm, permettant une représentation semi-markovienne des états cachés. Ces algorithmes sont présentés dans le cadre de la segmentation audio – visant à séparer un fichier en fragments homogènes – et de la classification – visant à identifier les différents fragments – pouvant être appliquées à la détection d’événements sonores. On proposera aussi un protocole d’évaluation pour ces méthodes, afin de comparer leurs performances par rapport à une autre méthode de l’état de l’art en leur faisant effectuer les mêmes tâches.
Fichier principal
Vignette du fichier
memoire.pdf (2.42 Mo) Télécharger le fichier
Loading...

Dates et versions

hal-01196455 , version 1 (09-09-2015)

Identifiants

  • HAL Id : hal-01196455 , version 1

Citer

Maxime Sirbu. Clustering incrémental de signaux audio. Apprentissage [cs.LG]. 2015. ⟨hal-01196455⟩
192 Consultations
265 Téléchargements

Partager

Gmail Facebook X LinkedIn More