Systèmes de reconnaissance de la parole revisités : réseaux bayésiens dynamiques et nouveaux paradigmes - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2004

Revisiting speech recognition systems : dynamic Bayesian networks and new computational paradigms

Systèmes de reconnaissance de la parole revisités : réseaux bayésiens dynamiques et nouveaux paradigmes

Résumé

In this thesis we focus on four principle components of a speech recognition system: acoustic modeling, language modeling, speech feature extraction and noise compensation. We propose novel modeling approaches for acoustic and linguistic modeling within the Bayesian networks formalism. Bayesian networks are a subset of probabilistic graphical models that include the most widely used probability models in speech recognition. Therefore rethinking the modeling problems in this formalism provides new perspectives that were not considered previously. Besides novel modeling approaches we also address new speech feature extraction schemes. Our main motivation in this direction is to seek for robust features that are not bound to be used in classical hidden Markov modeling (HMM) approach. Finally, we address the robustness problem for varying application conditions and propose a novel supervised compensation scheme.
Dans cette thèse nous élaborons quatre composantes fondamentales d'un système de reconnaissance automatique de la parole : la modélisation acoustique, la modélisation du langage, la paramétrisation du signal acoustique et la compensation du bruit. Nous proposons des techniques nouvelles dans chacun de ces domaines, et nous apportons des perspectives novatrices. Nous traitons les problèmes de modélisation acoustique et modélisation du langage avec un outil statistique puissant : les modèles probabilistes graphiques. Ce formalisme généralise la plupart des techniques probabilistes utilisées dans le traitement de la parole. La reformulation des modules de modélisation dans ce formalisme, nous ouvre de nouvelles perspectives inexploitées auparavant. En plus des nouvelles approches pour la modélisation, nous proposons également de nouvelles stratégies pour l'extraction des paramètres acoustiques. Notre motivation principale dans ce domaine est de chercher des paramètres robustes qui ne sont pas liés à la modélisation par des HMMs. Nous abordons aussi le problème de robustesse au bruit par adaptation des modèles acoustiques et nous proposons une nouvelle méthode de compensation prédictive supervisée.
Fichier non déposé

Dates et versions

tel-01746769 , version 1 (29-03-2018)

Identifiants

  • HAL Id : tel-01746769 , version 1

Lien texte intégral

Citer

Murat Deviren. Systèmes de reconnaissance de la parole revisités : réseaux bayésiens dynamiques et nouveaux paradigmes. Autre [cs.OH]. Université Henri Poincaré - Nancy 1, 2004. Français. ⟨NNT : 2004NAN10161⟩. ⟨tel-01746769⟩
21 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More