Thèse
Année : 2010
Résumé
There are a lot of differences between sign languages and vocal languages. Among them, we can underline the simultaneity of several parameters, the important role of the face expression, the recurrent use of iconic gestures and the use of signing space to structure utterances. As a consequence, new methods have to be developed and adapted to those languages. At first, we detail a method based on a particle filter to estimate at any time, the position of the signer's head, hands, elbows and shoulders in a monoview video. This method has been adapted to the French Sign Language in order to make it more robust to occlusion, inversion of the signer's hands or disappearance of hands from the video frame. Then, we propose a classification of the motion patterns that are frequently involved in the sign production, thanks to the analysis of motion capture data. The parametric models associated to each sign pattern are used in the frame of automatic sign retrieval in a video from a filmed sign example. We finally include those models in two applications. The first one helps an user in creating sign pictures. The second one is dedicated to computer aided sign segmentation.
Dans le domaine du Traitement Automatique des Langues Naturelles, l'exploitation d'énoncés en langues des signes occupe une place à part. En raison des spécificités propres à la Langue des Signes Française (LSF) comme la simultanéité de plusieurs paramètres, le fort rôle de l'expression du visage, le recours massif à des unités gestuelles iconiques et l'utilisation de l'espace pour structurer l'énoncé, de nouvelles méthodes de traitement doivent être adaptées à cette langue. Nous exposons d'abord une méthode de suivi basée sur un filtre particulaire, permettant de déterminer à tout moment la position de la tête, des coudes, du buste et des mains d'un signeur dans une vidéo mono-vue. Cette méthode a été adaptée à la LSF pour la rendre plus robuste aux occultations, aux sorties de cadre et aux inversions des mains du signeur. Ensuite, l'analyse de données issues de capture de mouvement nous permet d'aboutir à une catégorisation de différents mouvements fréquemment utilisés dans la production de signes. Nous en proposons un modèle paramétrique que nous utilisons dans le cadre de la recherche de signes dans une vidéo, à partir d'un exemple vidéo de signe. Ces modèles de mouvement sont enfin réutilisés dans des applications permettant d'assister un utilisateur dans la création d'images de signe et la segmentation d'une vidéo en signes.
Loading...
François Lefebvre-Albaret : Connectez-vous pour contacter le contributeur
https://theses.hal.science/tel-00608768
Soumis le : jeudi 14 juillet 2011-18:28:53
Dernière modification le : lundi 20 novembre 2023-11:44:19
Archivage à long terme le : lundi 12 novembre 2012-11:05:23
Dates et versions
- HAL Id : tel-00608768 , version 1
Citer
François Lefebvre-Albaret. Traitement automatique de vidéos en LSF Modélisation et exploitation des contraintes phonologiques du mouvement. Sciences de l'ingénieur [physics]. Université Paul Sabatier - Toulouse III, 2010. Français. ⟨NNT : ⟩. ⟨tel-00608768⟩
Collections
428
Consultations
1190
Téléchargements