Utilisation d'algorithmes de Goodness of Pronunciation pour l'évaluation de la compréhensibilité de la parole pathologique (JCP 2015) - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Utilisation d'algorithmes de Goodness of Pronunciation pour l'évaluation de la compréhensibilité de la parole pathologique (JCP 2015)

Résumé

L'évaluation des capacités de production de la parole de locuteurs ayant une pathologie de la parole d'origine motrice repose presque exclusivement sur des tests subjectifs tels que des tests d'intelligibilité. Ces tests consistent à demander à un locuteur de lire des listes de mots ou de phrases tandis qu'un ou plusieurs juge(s) évaluent leur production. Ils ont deux inconvénients principaux : ils sont très coûteux en temps et, de plus, ils sont subjectifs par nature. Dans ce contexte, des méthodes automatiques peuvent constituer des solutions pratiques pour l'évaluation des locuteurs. Les progrès récents dans la reconnaissance automatique de la parole (RAP) − en particulier dans le domaine de l'apprentissage des langues assisté par ordinateur − ont contribué au développement de techniques qui peuvent être d'un grand intérêt à cette fin. Dans des études précédentes, nous avons montré que l'algorithme du Goodness Of Pronunciation (GOP) [1, 2] pouvait être adapté et utilisé dans le contexte de la parole pathologique [3, 4]. Cet algorithme consiste 1) à aligner une séquence de phones attendue, de référence, à un signal audio de parole et 2) à comparer cet alignement à la séquence de phones obtenue lors d'une phase de reconnaissance dite \guillemotleft libre \guillemotright, c'est-à-dire sans contraindre le système de RAP à reconna\^ıtre une séquence de phones donnée. Dans le présent article, nous décrivons l'application d'une nouvelle méthode (Forced-Aligned GOP ou F-GOP [2]) qui vise à prédire des mesures de tests subjectifs à partir des scores de prononciation obtenus automatiquement. Nous avons utilisé un corpus de parole enregistré par 12 locuteurs souffrant de pathologies de production de la parole d'origine neurologique ou anatomique. Chaque locuteur a prononcé dix phrases correspondant à des commandes verbales telles que \guillemotleft Mettez l'ours à gauche du kangourou \guillemotright. Deux juges experts ont évalué les productions des locuteurs sur une échelle de 1 (compréhensibilité nulle) à 7 (compréhensibilité parfaite). La moitié du corpus a été utilisée comme corpus de développement et l'autre de corpus de test. Dans le corpus de développement, une forte corrélation entre les mesures subjectives et automatiques (F-GOP moyen) a été trouvée (r=0,81). Un modèle de régression linéaire a permis de définir des valeurs attendues pour la seconde moitié du corpus. Les valeurs prédites s'écartent des valeurs des juges de 16.3% relatifs. Le modèle utilisé a globalement tendance à sous-estimer la compréhensibilité des locuteurs. Cela pourrait être dû à une quantité de données insuffisante pour estimer le modèle linéaire. Ces résultats très encourageants, sous réserve de confirmation sur un panel plus important de locuteurs, sont un premier pas vers la mise en place d'un outil d'évaluation automatique destiné au domaine clinique.
Fichier non déposé

Dates et versions

hal-03193136 , version 1 (08-04-2021)

Identifiants

  • HAL Id : hal-03193136 , version 1

Citer

Thomas Pellegrini, Lionel Fontan. Utilisation d'algorithmes de Goodness of Pronunciation pour l'évaluation de la compréhensibilité de la parole pathologique (JCP 2015). 6èmes Journées de Phonétique Clinique (JPC 2015), Le Laboratoire Praxiling (CNRS UMR 5267, Université Paul-Valéry); Le Département Universitaire d?Orthophonie (Université Montpellier 1); L'Institut des Neurosciences de Montpellier (INSERM U1051); Le CHU Gui de Chauliac de Montpellier (Service des troubles de la voix et de la déglutition), Jun 2015, Montpellier, France. ⟨hal-03193136⟩
38 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More