Sarra EL AYARI

Présentation / Presentation
Ingénieure de Recherche Hors Classe (PhD) en production et analyse de données linguistiques, spécialisée en ingénierie pour l'acquisition des langues secondes
Langues : français (native), anglais (fluent), allemand (B1) et LSF (A2)

 

Compétences / Skills
  • Création et développement d'interfaces ludiques pour l'apprentissage des langues (CALL/iCALL)
  • Outillage, exploration, annotation et visualisation de corpus
  • Développement web
  • Valorisation des données de la recherche
  • Enrichissement et interrogation de corpus et bases de données multimodales et multilingues
  • Documentation (métadonnées), formatage, archivage

 

Domaines de recherche :

  • Acquisition des langues secondes
  • Corpus d'apprenants
  • Linguistique de corpus
  • Reconnaissance automatique de la parole
  • Traitement automatique des langues
  • IA

 

Expertise
  • Participation à des jurys de concours CNRS et Universités (campagnes externes et internes) en tant que présidente de jury et membre experte (2023 ; 2025 ; 2026)
  • Relecture et évaluation de soumissions pour conférences (JE réseau RéAL2, EUROCALL) et journal (Data & Corpus)

 

Projets / Projects
  • TranSLA : projet de recherche de transcription automatique de données orales d'apprenants L2 du français
  • PhonoFLES : projet de type "recherche-action" pour développer des interfaces ludiques autour de la prononciation du français
  • LudiLang : projet de recherche pour le développement d'outils informatiques ludiques et ergonomiques ayant vocation à être utilisés en cours de langue
  • Sarramanka : plateforme en ligne d'exploration et d'annotation de corpus
  • CotaSigne - en collaboration avec M. Blondel et S. Caët
  • BabyMorPhon - en collaboration avec S. Wauquier, M. Philippart De Foy et Naomi Yamaguchi
  • LGMEF (responsable technique)
  • Dynascript
  • Membre de l'ANR DINLANG (2021-2022)
  • Membre de l'ANR Demonext - en collaboration avec G. Duboisdindien (2020-2021)
  • Otil (Outil de traitement des informations langagières) - en collaboration avec A.-C. Demagny, SFL & A. Arslangul, CRLAO

 

Avant 2018 :

  • Participation au projet "Computational Exploration of the Linguistic Structures of Future-Oriented Expression" (voir)
  • Développement de la plateforme InteRessources au sein du LabEx EFL

 

Enseignements / Teachings

A l'INALCO :

  • Langages web dans le cadre du MASTER 1 Ingénierie multilingue (2023-2025)
  • Web, bases de données et localisation dans le cadre des MASTER 2 Tetradom et Ingénierie multilingue (2012-2024)
  • Conception et développement web dans le cadre du MASTER 2 Communication, Organisations et nouveaux médias en Contexte Interculturel (2022-2025)

 

A l'Université Paris 8

  • Octobre 2023 : intervention dans le cours "Diversités linguistiques" (M. Watorek) : La chaîne de traitements linguistiques.

 

Encadrement / Supervision

Encadrement de stagiaires :

  • B. Zang (2026 - GT Multilinguisme, CORLI) ; A. Skrzyniarz (2025 - AAP VILLA-IA) ; Z. Li (2024 - AAP tranSLA) ; L. Bessac (2024 - Inalco) ; O. Elomari (2022 - AAP Sarramanka) ; S. Michel, M1P8 (2019-2020) et M2 P8 (2020-2021), I. Deme, M2- P8 (2022-2023 / 2023-2024), C. Richard - M1- P8 (2023-2024) ; A. Pierredon, M1 INALCO (2019)
  • Projet LGMEF (2014 - auj.) : C. Onambélé, Y. Shen, T. Rosenberg, O. Richard, T. Kiseleva, H. Farah, M. Ray, S. Jabali, N. Gerasymenko, H. Qiu, M. Belarbi

 

Encadrement de mémoires

  • A. Skrzyniarz (M2 Recherche et développement INALCO) - 2025 ; C. Kuroiwa (M2 Ingénierie multilingue INALCO) - 2021 ; Suhaib Etarhuni (M2 Ingénierie multilingue INALCO) - 2019

 

Comités de suivi de thèses

  • M. Accattoli, M. Al-Hjouj, M. Barqach, A. Béton, J. Bordes, C. Ceccaldi, N. Demir, C. Kamissoko, S. Liu, H. Majdoub, N. Michit

 

Valorisation de la recherche / Science outreach

 

Consortiums :

  • Membre du comité de pilotage du consortium CORLI
  • Participation au groupe-projet Multilinguisme du consortium CORLI (2023-auj.)
  • Co-responsable de l'axe transversal Recensement des ressources  du consortium "Corpus, Langues et Interactions" (CORLI - TGIR Huma-Num), 2016-2019
  • Co-pilote du groupe de travail Dépôt, conservation et diffusion des corpus oraux et multimodaux du consortium Corpus Oraux et Multimodaux (IRCOM- TGIR Huma-Num), 2015-2016

 

Podcast :

 

Invitations :

  • 10 avril 2026 : Participation à la 242e journée Filles+Math+Informatique (Sorbonne Université, Faculté des Sciences et Ingénierie)
  • 19 mars 2026 - Intervention au Multilingual Workshop on Artificial Intelligence and Language Education (INALCO, Paris)
  • 17 octobre 2023 - Présentation au séminaire de l'action Corpus d'apprenants et acquisition L2 du LIDILEM (Université Grenoble Alpes)
  • 15 mai 2023 - Présentation au séminaire Lundis de LIDILE (Université Rennes 2)

 

Comités scientifiques :

 

Organisation d'événements

 

Responsabilités :

  • Membre du bureau du GIS RéAL2
  • Membre du groupe de recherche "Metadata in Learner Corpus Research" (Learner Corpus Association & CLARIN K-centre for Learner Corpora)
  • Assistante prévention de SFL
  • Correpondante archives de SFL
  • Responsable ORTOLANG & COCOON pour SFL
  • Responsable HAL pour SFL
  • Correspondante Valorisation à l'INSHS
  • Organisatrice du Café-signe (2019-2021)

 

Publications récentes / Recent publications
  • Sarra El Ayari & Timea Kadas Pickel. CALL for Allophones’ integration: the case of French pronunciation based on native languages. European Association for Computer Assisted Language Learning (EUROCALL), Aug 2025, Milan, Italy.
  • Sarra El Ayari & Marzena Watorek. What has Automatic Speech Recognition to offer for the study of learners' corpora? 3rd conference of the european Second Language Association (EuroSLA), July 2024, Montpellier, France.
  • Stéphanie Caët, Marion Blondel, Sarra El Ayari, Claire Danet, Christelle Pepin, Jeanne Butel Mouillard et Clémence Beirnaert . CotaSigne, une expérience de recherche à plusieurs mains. La main de Thôt : théories, enjeux et pratiques de la traduction, 11.
  • Sarra El Ayari. Assisting Language Teaching at the Crossroads of Didactics and Second Language Acquisition. 11th European Conference on Language Learning, July 2023, London, UK.
  • Sarra El Ayari. Sarramanka, une plateforme outillée de transcription, d’annotation et d’exploration de corpus. SHS Web of Conferences, EDP Sciences, 2022, 138, pp.10006.

 

Liste complète des publications / Publication list