Séminaire de recherche : Les corpus annotés en syntaxe, du 18e siècle aux treebanks d’aujourd'hui : pour quoi faire ? Comment faire ? (Sylvain Kahane, Modyco, Université Paris Nanterre & CNRS)

L'Équipe ERTIM de l'INALCO a le plaisir de vous inviter à son prochain séminaire de recherche, le jeudi 10 février à 10h au 2 rue de Lille, Paris 7ème :

Les corpus annotés en syntaxe, du 18e siècle aux treebanks d’aujourd'hui : pour quoi faire ? Comment faire ? (Sylvain Kahane, Modyco, Université Paris Nanterre & CNRS)

Résumé
Si les treebanks ont été un moment essentiellement développés dans le but d’entraîner des parsers, ils connaissent aujourd’hui une réappropriation par les linguistes. La base de données Universal Dependencies, qui comprend après 7 années d’existence des treebanks dans 140 langues, permet à présent d’envisager des études typologiques sérieuses. Nous montrerons deux applications : l’existence de contraintes universelles sur la complexité syntaxique (thèse de Chunxiao Yan 2021) et la possibilité d’étendre les universaux à la Greenberg (Gerdes, Kahane, Chen 2021). Nous présenterons aussi le projet ANR Autogramm (2022-2025) dont l’objectif est d’extraire automatiquement des grammaires (quantitatives) à partir de treebanks. Nous proposerons également un rapide aperçu des différentes représentations proposées pour l’analyse syntaxique, comme Buffier 1709, Barnard 1832 ou Clark 1847. Enfin nous donnerons quelques éléments sur la chaîne de traitement qui permet de passer d’un corpus (brut ou glosé) à un treebank, puis à une description syntaxique du corpus, et notamment les outils ArboratorGrew, Grew-tranform et Grew-match (Gerdes 2013, Guillaume 2021, Guibon et al. 2020).
Bio
Sylvain Kahane est actuellement professeur en sciences du langage à l'Université Paris Nanterre. Pour plus d'information sur son parcours, ses thèmes de recherches et ses publications, se réferer à https://kahane.fr/.
Informations pratiques
Le séminaire aura lieu jeudi 10 février 2022, de 10h à 12h, à l'auditorium de la maison de la recherche de l'INALCO, 2 rue de Lille, 75007 Paris.
Accès : Musée d'Orsay (RER C), Saint Germain des Prés (ligne 4), Rue du Bac (ligne 12), Palais Royal (ligne 1), Saint-Michel (RER B et C).

Il sera également diffusé en ligne (lien à venir).
Lieu
2 rue de Lille, Paris 7ème
Date