A. Michaud (LACITO): L'articulation phonétique/phonologie au miroir de l'intelligence artificielle : analyse des résultats de la transcription automatique de la langue Na (famille sino-tibétaine) par le logiciel Persephone

nov.

2018.

10h00
12h00

TBA

Cf. le site de l'Atelier de phonologie.

L'articulation phonétique/phonologie au miroir de l'intelligence artificielle : analyse des résultats de la transcription automatique de la langue Na (famille sino-tibétaine) par le logiciel Persephone

Les systèmes de reconnaissance automatique de la parole permettent désormais d'entraîner un modèle acoustique sur la base de deux ou trois heures d'enregistrements transcrits (pour un système mono-locuteur), au lieu de dizaines d'heures pour les outils antérieurs. Au-delà de l'intérêt pratique que présentent ces avancées technologiques pour les tâches de documentation linguistique, se pose la question de la mise en correspondance entre les modèles phonologiques et les modèles statistiques construits par les logiciels d'intelligence artificielle. En effet, l'algorithme réalise son entraînement sur la base de transcriptions fournies en entrée par le linguiste, transcriptions qui reposent sur un ensemble – plus ou moins élaboré, et plus ou moins explicite – d'hypothèses phonologiques. Le modèle acoustique, décalqué (par des méthodes statistiques) des transcriptions du phonéticien/phonologue jointes au signal acoustique, peut-il être interrogé par le chercheur, en un jeu de miroir ? Que peut nous apprendre la confrontation ainsi renouvelée avec le signal acoustique ?

L'exposé vise à ouvrir des pistes pour élaborer une perspective phonologique sur ces questions nées à l'intersection de plusieurs disciplines. L'exposé, qui ne présuppose pas de connaissances préalables en traitement automatique des langues, commencera par une présentation du logiciel Persephone et de son application à la langue na de Yongning (famille sino-tibétaine). Des exemples précis de divergences entre la notation du linguiste et celle du logiciel seront offerts à la sagacité des participants, pour un exercice partagé de phono-philologie (ou philo-phonologie) numérique.

Références :

Adams, Oliver, Trevor Cohn, Graham Neubig, Hilaria Cruz, Steven Bird & Alexis Michaud. 2018. Evaluating phonemic transcription of low-resource tonal languages for language documentation. Proceedings of LREC 2018 (Language Resources and Evaluation Conference), 3356–3365. Miyazaki. https://halshs.archives-ouvertes.fr/halshs-01709648/

Michaud, Alexis, Oliver Adams, Trevor Cohn, Graham Neubig & Séverine Guillaume. 2018. Integrating automatic transcription into the language documentation workflow: experiments with Na data and the PERSEPHONE toolkit. Language Documentation and Conservation 12. https://halshs.archives-ouvertes.fr/halshs-01841979/

Outil : https://persephone.readthedocs.io/ et https://github.com/persephone-tools/

Données : https://github.com/alexis-michaud/na/tree/master/Persephone