De l'utilisation de mesures de confiance en traduction automatique : évaluation, post-édition et application à la traduction de la parole - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2012

On the use of confidence measures in machine translation : evaluation, post edition and application to speech translation

De l'utilisation de mesures de confiance en traduction automatique : évaluation, post-édition et application à la traduction de la parole

Résumé

In this thesis I shall deal with the issues of confidence estimation for machine translation and statistical machine translation of large vocabulary spontaneous speech translation. I shall first formalize the problem of confidence estimation. I present experiments under the paradigm of multivariate classification and regression. I review the performances yielded by different techniques, present the results obtained during the WMT2012 internation evaluation campaign and give the details of an application to post edition of automatically translated documents. I then deal with the issue of speech translation. After going into the details of what makes it a very specific and particularly challenging problem, I present original methods to partially solve it, by using phonetic confusion networks, confidence estimation techniques and speech segmentation. I show that the prototype I developped yields performances comparable to state-of-the-art of more standard design.
Cette thèse de doctorat aborde les problématiques de l'estimation de confiance pour la traduction automatique, et de la traduction automatique statistique de la parole spontanée à grand vocabulaire. J'y propose une formalisation du problème d'estimation de confiance, et aborde expérimentalement le problème sous le paradigme de la classification et régression multivariée. Je propose une évaluation des performances des différentes méthodes évoquées, présente les résultats obtenus lors d'une campagne d'évaluation internationale et propose une application à la post-édition par des experts de documents traduits automatiquement. J'aborde ensuite le problème de la traduction automatique de la parole. Après avoir passé en revue les spécificités du medium oral et les défis particuliers qu'il soulève, je propose des méthodes originales pour y répondre, utilisant notamment les réseaux de confusion phonétiques, les mesures de confiances et des techniques de segmentation de la parole. Je montre finalement que le prototype propose rivalise avec des systèmes état de l'art à la conception plus classique.
Fichier principal
Vignette du fichier
DDOC_T_2012_0260_RAYBAUD.pdf (2.61 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01749642 , version 2 (08-02-2016)
tel-01749642 , version 1 (29-03-2018)

Identifiants

  • HAL Id : tel-01749642 , version 2

Citer

Sylvain Raybaud. De l'utilisation de mesures de confiance en traduction automatique : évaluation, post-édition et application à la traduction de la parole. Informatique et langage [cs.CL]. Université de Lorraine, 2012. Français. ⟨NNT : 2012LORR0260⟩. ⟨tel-01749642v2⟩
304 Consultations
730 Téléchargements

Partager

Gmail Facebook X LinkedIn More