Méthode Structurée de décomposition en matrices non- négatives appliquéè a la séparation de sources audio - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Méthode Structurée de décomposition en matrices non- négatives appliquéè a la séparation de sources audio

Résumé

Dans cet article, nous proposons une méthode structurée de décomposition en matrices non-négatives visant a utiliser la structure multi-couche des signaux audio. Les signaux audio peuvent etre vus comme une superposition de deux couches : la couche tonale (modélisée par des sommes de sinuso¨des evoluant lentement en fréquence et en temps) et la couche transitoire (les sons percussifs, ´ ev enements de courtes durées etalés en fréquence). Notre méthode décompose une partie du signal en composantes orthogonales parcimonieuses, bien adaptées pour l'extraction tonale tandis que la partie transitoire est représentée par des bases de décomposition classiques. Les résultats de séparation de sources obtenus sur des signaux réels de musique ont montré que notre approche obtient des résultats similaires a ceux de l'´ etat de l'art. Abstract – In this paper, we propose a new unconstrained nonnegative matrix factorization method designed to utilize the multilayer structure of audio signals to improve the quality of the source separation. The tonal layer is sparse in frequency and temporally stable, while the transient layer is composed of short term broadband sounds. Our method has a part well suited for tonal extraction which decomposes the signals in sparse orthogonal components, while the transient part is represented by a regular nonnegative matrix factorization decomposition. Experiments on real music data in a source separation context show that such decomposition is suitable for audio signal. Compared with three state-of-the-art harmonic/percussive decomposition algorithms, the proposed method shows competitive performances.
Fichier principal
Vignette du fichier
Laroche_gretsi.pdf (190.02 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01199648 , version 1 (15-09-2015)

Identifiants

  • HAL Id : hal-01199648 , version 1

Citer

Clément Laroche, Matthieu Kowalski, Hélène Papadopoulos, Gael Richard. Méthode Structurée de décomposition en matrices non- négatives appliquéè a la séparation de sources audio. 25eme Colloque GRETSI 2015, Sep 2015, Lyon, France. ⟨hal-01199648⟩
287 Consultations
403 Téléchargements

Partager

Gmail Facebook X LinkedIn More