Traitement automatique de vidéos en LSF Modélisation et exploitation des contraintes phonologiques du mouvement

Thèse Année : 2010

(1)

1 (118 Route de Narbonne, F-31062 Toulouse Cedex 9 - France) 34499

UT Capitole - Université Toulouse Capitole (2 rue du Doyen-Gabriel-Marty - 31042 Toulouse Cedex 9 - France) 81148
- UT - Université de Toulouse (41 Allée Jules Guesde, 31000 Toulouse - France) 443875
UT2J - Université Toulouse - Jean Jaurès (5 allées Antonio Machado - 31058 Toulouse Cedex 9 - France) 116256
- UT - Université de Toulouse (41 Allée Jules Guesde, 31000 Toulouse - France) 443875
UT3 - Université Toulouse III - Paul Sabatier (118 route de Narbonne - 31062 Toulouse - France) 217752
- UT - Université de Toulouse (41 Allée Jules Guesde, 31000 Toulouse - France) 443875
CNRS - Centre National de la Recherche Scientifique : UMR5505 (France) 441569
Toulouse INP - Institut National Polytechnique (Toulouse) (France) 448187
- UT - Université de Toulouse (41 Allée Jules Guesde, 31000 Toulouse - France) 443875
TMBI - Toulouse Mind & Brain Institut (CHU Purpan, Pavillon Baudot, 31059 Toulouse cedex 9 - France) 1149079
- UT2J - Université Toulouse - Jean Jaurès (5 allées Antonio Machado - 31058 Toulouse Cedex 9 - France) 116256
  - UT - Université de Toulouse (41 Allée Jules Guesde, 31000 Toulouse - France) 443875
- UT3 - Université Toulouse III - Paul Sabatier : FED4171 (118 route de Narbonne - 31062 Toulouse - France) 217752
  - UT - Université de Toulouse (41 Allée Jules Guesde, 31000 Toulouse - France) 443875

"> IRIT - Institut de recherche en informatique de Toulouse

François Lefebvre-Albaret

Fonction : Auteur
PersonId : 905576
IdRef : 159013747

Institut de recherche en informatique de Toulouse

Résumé

There are a lot of differences between sign languages and vocal languages. Among them, we can underline the simultaneity of several parameters, the important role of the face expression, the recurrent use of iconic gestures and the use of signing space to structure utterances. As a consequence, new methods have to be developed and adapted to those languages. At first, we detail a method based on a particle filter to estimate at any time, the position of the signer's head, hands, elbows and shoulders in a monoview video. This method has been adapted to the French Sign Language in order to make it more robust to occlusion, inversion of the signer's hands or disappearance of hands from the video frame. Then, we propose a classification of the motion patterns that are frequently involved in the sign production, thanks to the analysis of motion capture data. The parametric models associated to each sign pattern are used in the frame of automatic sign retrieval in a video from a filmed sign example. We finally include those models in two applications. The first one helps an user in creating sign pictures. The second one is dedicated to computer aided sign segmentation.

Dans le domaine du Traitement Automatique des Langues Naturelles, l'exploitation d'énoncés en langues des signes occupe une place à part. En raison des spécificités propres à la Langue des Signes Française (LSF) comme la simultanéité de plusieurs paramètres, le fort rôle de l'expression du visage, le recours massif à des unités gestuelles iconiques et l'utilisation de l'espace pour structurer l'énoncé, de nouvelles méthodes de traitement doivent être adaptées à cette langue. Nous exposons d'abord une méthode de suivi basée sur un filtre particulaire, permettant de déterminer à tout moment la position de la tête, des coudes, du buste et des mains d'un signeur dans une vidéo mono-vue. Cette méthode a été adaptée à la LSF pour la rendre plus robuste aux occultations, aux sorties de cadre et aux inversions des mains du signeur. Ensuite, l'analyse de données issues de capture de mouvement nous permet d'aboutir à une catégorisation de différents mouvements fréquemment utilisés dans la production de signes. Nous en proposons un modèle paramétrique que nous utilisons dans le cadre de la recherche de signes dans une vidéo, à partir d'un exemple vidéo de signe. Ces modèles de mouvement sont enfin réutilisés dans des applications permettant d'assister un utilisateur dans la création d'images de signe et la segmentation d'une vidéo en signes.

Mots clés

French Sign Language phonology FSL motion pattern

phonologie segmentation video patron de mouvement LSF

Domaines

Sciences de l'ingénieur [physics] Informatique [cs] Sciences de l'Homme et Société

Fichier principal

These.pdf (7 Mo)

François Lefebvre-Albaret : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00608768

Soumis le : jeudi 14 juillet 2011-18:28:53

Dernière modification le : lundi 20 novembre 2023-11:44:19

Archivage à long terme le : lundi 12 novembre 2012-11:05:23

Dates et versions

tel-00608768 , version 1 (14-07-2011)

Identifiants

HAL Id : tel-00608768 , version 1

Citer

François Lefebvre-Albaret. Traitement automatique de vidéos en LSF Modélisation et exploitation des contraintes phonologiques du mouvement. Sciences de l'ingénieur [physics]. Université Paul Sabatier - Toulouse III, 2010. Français. ⟨NNT : ⟩. ⟨tel-00608768⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS UT1-CAPITOLE IRIT TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

428 Consultations

1190 Téléchargements