Geoffrey BESNARD

Année d'inscription / Beginning of the PhD
2025
Thème / Theme
Sourds et langues des signes
Titre de la thèse / PhD title
Vers un cadre de lemmatisation pour la langue des signes française : modélisation, conventions d’étiquetage et banque des signes.
Directeur(s) / Direction

Marie-Anne Sallandre - Université Paris 8

Christophe Parisse - Université Paris Nanterre   

Site Internet personnel / Personal website

LindekIn : Geoffrey Besnard

 

Résumé de la thèse / PhD abstract

La question de la lemmatisation — regrouper les variantes d’un signe sous une forme lexicale de référence — reste largement inexplorée pour la LSF. Or sans lemmatisation fiable, les corpus annotés demeurent difficilement exploitables : recherches incohérentes, comparaisons inter-corpus impossibles, outillage computationnel inapplicable.

Cette thèse porte sur le développement d'un cadre de lemmatisation pour la LSF, en s'appuyant sur les modèles internationaux de SignBank (Johnston/Auslan, BSL, DGS, NGT) et sur Lex-LSFB (Meurant, Université de Namur).

Le cadre tient compte des particularités typologiques des langues des signes et de ses types d'unités : les unités lexicales, les unités iconicité (non lexicales, donc peut-être moins facilement lemmatisables), et les unités mixtes. Le cadre classique des ID-gloss peut-il rendre compte convenablement de tous cet types d'unités ?

La méthodologie est participative et multi-sites, impliquant laboratoires de linguistique, communautés sourdes, équipes techniques et institutions de formation.

Mots clés en français :

Langue des signes française (LSF), Linguistique de corpus, Annotation, Logiciel Elan, Segmentation, Lemmatisation, SignBank, Étiquetage, ID-Gloss

 

Valorisation de la recherche / Science outreach