Corpus PLPNat

Corpus de Productions Langagières Précoces en situation Naturelle

(D. Bassano, I. Maillochon, M. Lavielle & S. Yaiche)

Cette base, dont je coordonne la constitution depuis plus de 20 ans, est formée de corpora de jeunes enfants (entre 1 et 4 ans) enregistrés en vidéo, en situation de production naturelle et en interaction avec leur entourage. Les sessions d’enregistrements durent de 30 minutes à 2h. Les enregistrements sont transcrits en conformité avec les standards du réseau international CHILDES (MacWhinney, 2000, 2010), informatisés et numérisés.

La base est composée actuellement de trois ensembles de données :

  • Corpus longitudinaux : deux enfants francophones tout-venant, Benjamin, enregistré de 24 à 48 mois (D. Bassano & J. Weissenborn, années 1986-1990), Pauline, enregistrée de 14 à 48 mois (I. Maillochon & D. Bassano, années 1991-1995) ; un enfant arabophone tunisien tout-venant, Yassine, enregistré de 18 à 48 mois (S. Yaiche & D. Bassano, avec la participation de S. Mejri, années 2009-2014).
  • Corpus francophones transversaux ou mixtes : 80 enfants tout-venant, enregistrés à 20, 30, 39 et 48 mois, avec 20 enfants par groupe d’âge (I. Maillochon & D. Bassano, années 1993-1996)
  • Corpus francophones dit « Autisme », transversaux ou mixtes : 16 enfants atteints d’autisme, dont 8 enregistrés à 30 mois d’ADV et 8 à 39 mois ; 4 enfants sont suivis à trois reprises à 9 mois d’intervalle (M. Lavielle-Guida & D. Bassano, années 2000-2005)

La base est accompagnée d’un « Guide pour l’étude de la production naturelle » consacré à la transcription et au codage des données françaises.

En accord avec mes collaborateurs, j’engage actuellement les démarches pour déposer cette base sur la plateforme ORTOLANG (Outils et Ressources pour un Traitement Optimisé de la LANGue), selon les modalités d’usage pour protéger la propriété et la sécurité des données tout en les mettant le plus possible à la disposition de la communauté (lien à venir).