Annotation et synthèse basée données des expressions faciales de la Langue des Signes  Française

Clément Reverdy

Thèse Année : 2019

Data-driven annotation and synthesis of facial expres- sions in French sign language

Annotation et synthèse basée données des expressions faciales de la Langue des Signes Française

(1)

Clément Reverdy

Fonction : Auteur
PersonId : 989056
IdHAL : clement-reverdy
ORCID : 0009-0009-9686-0227
IdRef : 252377117

Institut de Recherche en Informatique et Systèmes Aléatoires

Résumé

French Sign Language (LSF) represents part of the identity and culture of the deaf community in France. One way to promote this language is to generate signed content through virtual characters called signing avatars. The system we propose is part of a more general project of gestural synthesis of LSF by concatenation that allows to generate new sentences from a corpus of annotated motion data captured via a marker-based motion capture device (MoCap) by editing existing data. In LSF, facial expressivity is particularly important since it is the vector of numerous information (e.g., affective, clausal or adjectival). This thesis aims to integrate the facial aspect of LSF into the concatenative synthesis system described above. Thus, a processing pipeline is proposed, from data capture via a MoCap device to facial animation of the avatar from these data and to automatic annotation of the corpus thus constituted. The first contribution of this thesis concerns the employed methodology and the representation by blendshapes both for the synthesis of facial animations and for automatic annotation. It enables the analysis/synthesis scheme to be processed at an abstract level, with homogeneous and meaningful descriptors. The second contribution concerns the development of an automatic annotation method based on the recognition of expressive facial expressions using machine learning techniques. The last contribution lies in the synthesis method, which is expressed as a rather classic optimization problem but in which we have included.

La Langue des Signes Française (LSF) représente une part de l'identité et de la culture de la communauté des sourds en France. L'un des moyens permettant de promouvoir cette langue est la génération de contenu par le biais de personnages virtuels appelés avatars signeurs. Le système que nous proposons s’intègre dans un projet plus général de synthèse gestuelle de la LSF par concaténation qui permet de générer de nouvelles phrases à partir d'un corpus de données de mouvements annotées et capturées via un dispositif de capture de mouvement basé marqueurs (MoCap) en éditant les données existantes. En LSF, l'expressivité faciale est le vecteur de nombreuses informations (e.g., affectives, clausales ou adjectivales), d'où son importance. Cette thèse a pour but d'intégrer l'aspect facial de la LSF au système de synthèse concaténative décrit précédemment. Ainsi, nous proposons une chaîne de traitement de l'information allant de la capture des données via un dispositif de MoCap jusqu'à l'animation faciale de l'avatar à partir de ces données et l'annotation automatique des corpus ainsi constitués. La première contribution de cette thèse concerne la méthodologie employée et la représentation par blendshapes à la fois pour la synthèse d'animations faciales et pour l'annotation automatique. Elle permet de traiter le système d'analyse / synthèse à un certain niveau d'abstraction, avec des descripteurs homogènes et signifiants. La seconde contribution concerne le développement d'une approche d'annotation automatique qui s'appuie sur la reconnaissance d'expressions faciales émotionnelles par des techniques d'apprentissage automatique. La dernière contribution réside dans la méthode de synthèse qui s'exprime comme un problème d'optimisation assez classique mais au sein duquel nous avons inclus une énergie basée laplacien quantifiant les déformations d'une surface en tant qu'énergie de régularisation.

Mots clés

Facial expressions French Sign Language (LSF) Motion capture (mocap) Datadriven synthesis Annotation through machine learning Perceptual evaluation

Évaluation perceptuelle Synthèse basée données Capture de mouvement

Domaines

Intelligence artificielle [cs.AI] Synthèse d'image et réalité virtuelle [cs.GR]

Fichier principal

2019theseReverdyC.pdf (59.93 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-03100925

Soumis le : mercredi 6 janvier 2021-19:35:08

Dernière modification le : jeudi 20 juillet 2023-10:01:09

Dates et versions

tel-03100925 , version 1 (06-01-2021)

Identifiants

HAL Id : tel-03100925 , version 1

Citer

Clément Reverdy. Annotation et synthèse basée données des expressions faciales de la Langue des Signes Française. Intelligence artificielle [cs.AI]. Université de Bretagne Sud, 2019. Français. ⟨NNT : 2019LORIS550⟩. ⟨tel-03100925⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA STAR UR1-THESES UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

666 Consultations

9 Téléchargements