Traitement automatique de vidéos en LSF Modélisation et exploitation des contraintes phonologiques du mouvement - TEL - Thèses en ligne
[go: up one dir, main page]

Thèse Année : 2010
Traitement automatique de vidéos en LSF Modélisation et exploitation des contraintes phonologiques du mouvement
1 IRIT - Institut de recherche en informatique de Toulouse (118 Route de Narbonne, F-31062 Toulouse Cedex 9 - France)
"> IRIT - Institut de recherche en informatique de Toulouse

Résumé

There are a lot of differences between sign languages and vocal languages. Among them, we can underline the simultaneity of several parameters, the important role of the face expression, the recurrent use of iconic gestures and the use of signing space to structure utterances. As a consequence, new methods have to be developed and adapted to those languages. At first, we detail a method based on a particle filter to estimate at any time, the position of the signer's head, hands, elbows and shoulders in a monoview video. This method has been adapted to the French Sign Language in order to make it more robust to occlusion, inversion of the signer's hands or disappearance of hands from the video frame. Then, we propose a classification of the motion patterns that are frequently involved in the sign production, thanks to the analysis of motion capture data. The parametric models associated to each sign pattern are used in the frame of automatic sign retrieval in a video from a filmed sign example. We finally include those models in two applications. The first one helps an user in creating sign pictures. The second one is dedicated to computer aided sign segmentation.
Dans le domaine du Traitement Automatique des Langues Naturelles, l'exploitation d'énoncés en langues des signes occupe une place à part. En raison des spécificités propres à la Langue des Signes Française (LSF) comme la simultanéité de plusieurs paramètres, le fort rôle de l'expression du visage, le recours massif à des unités gestuelles iconiques et l'utilisation de l'espace pour structurer l'énoncé, de nouvelles méthodes de traitement doivent être adaptées à cette langue. Nous exposons d'abord une méthode de suivi basée sur un filtre particulaire, permettant de déterminer à tout moment la position de la tête, des coudes, du buste et des mains d'un signeur dans une vidéo mono-vue. Cette méthode a été adaptée à la LSF pour la rendre plus robuste aux occultations, aux sorties de cadre et aux inversions des mains du signeur. Ensuite, l'analyse de données issues de capture de mouvement nous permet d'aboutir à une catégorisation de différents mouvements fréquemment utilisés dans la production de signes. Nous en proposons un modèle paramétrique que nous utilisons dans le cadre de la recherche de signes dans une vidéo, à partir d'un exemple vidéo de signe. Ces modèles de mouvement sont enfin réutilisés dans des applications permettant d'assister un utilisateur dans la création d'images de signe et la segmentation d'une vidéo en signes.
Fichier principal
Vignette du fichier
These.pdf (7 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00608768 , version 1 (14-07-2011)
Identifiants
  • HAL Id : tel-00608768 , version 1

Citer

François Lefebvre-Albaret. Traitement automatique de vidéos en LSF Modélisation et exploitation des contraintes phonologiques du mouvement. Sciences de l'ingénieur [physics]. Université Paul Sabatier - Toulouse III, 2010. Français. ⟨NNT : ⟩. ⟨tel-00608768⟩
428 Consultations
1190 Téléchargements

Partager

More