Class-based speech recognition using a maximum dissimilarity criterion and a tolerance classification margin

Arseniy Gorin; Denis Jouvet

Communication Dans Un Congrès Année : 2012

Class-based speech recognition using a maximum dissimilarity criterion and a tolerance classification margin

(1) , (1)

Arseniy Gorin

Fonction : Auteur
PersonId : 767294
IdRef : 182505596

Analysis, perception and recognition of speech

Denis Jouvet

Fonction : Auteur
PersonId : 15904
IdHAL : denis-jouvet
IdRef : 029418666

Analysis, perception and recognition of speech

Résumé

One of the difficult problems of Automatic Speech Recognition (ASR) is dealing with the acoustic signal variability. Much state-of-the-art research has demonstrated that splitting data into classes and using a model specific to each class provides better results. However, when the dataset is not large enough and the number of classes increases, there is less data for adapting the class models and the performance degrades. This work extends and combines previous research on unsupervised splits of datasets to build maximally separated classes and the introduction of a tolerance classification margin for a better training of the class model parameters. Experiments, carried out on the French radio broadcast ESTER2 data, show an improvement in recognition results compared to the ones obtained previously. Finally, we demonstrate that combining the decoding results from different class models leads to even more significant improvements.

Mots clés

speech recognition acoustic modeling clustering maximally separated classes classification tolerance margin

Domaines

Traitement du signal et de l'image [eess.SP] Traitement du signal et de l'image [eess.SP]

Denis Jouvet : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00753454

Soumis le : lundi 19 novembre 2012-11:27:26

Dernière modification le : lundi 11 septembre 2023-17:41:19

Dates et versions

hal-00753454 , version 1 (19-11-2012)

Identifiants

HAL Id : hal-00753454 , version 1

Citer

Arseniy Gorin, Denis Jouvet. Class-based speech recognition using a maximum dissimilarity criterion and a tolerance classification margin. SLT 2012 - 4th IEEE Workshop on Spoken Language Technology, Dec 2012, Miami, United States. ⟨hal-00753454⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE INRIA2 LORIA LORIA-NLPKD

117 Consultations

0 Téléchargements

Class-based speech recognition using a maximum dissimilarity criterion and a tolerance classification margin

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager