DEMETER

Il existe aujourd’hui quelques grammaires électroniques à large couverture syntaxique, comme ParGram, CoreGram et LinGO, systèmes couvrant de nombreuses langues, ou FRMG et XMG pour le français. Certaines sont générées par des “métagrammaires” (des ensembles modulaires de règles plus compactes), pour traiter des langues ou des états de langues spécifiques. Cette abstraction facilite le développement et la maintenance de tels systèmes.

Cependant, à l’exception du consortium DELPH-IN, leurs développeurs communiquent rarement, ralentissant leur développement. Peu d’échanges ont également lieu avec les linguistes de terrain, dont les ressources limitées se prêtent mal à l’utilisation de modèles coûteux comme les réseaux de neurones, aujourd’hui au centre de la recherche en traitement automatique du langage.

Les grammaires électroniques offrent pourtant la possibilité de traiter de petites quantités de données, pour annoter des corpus ou fournir des exempliers, permettant ainsi d’outiller des langues habituellement délaissées. Avec le projet Déméter (Des MÉTagrammaires de TERrain), nous avons la volonté de rapprocher les communautés de linguistes computationnels et de terrain avec les spécialistes des corpus et des langues peu dotées pour mettre au point une plate-forme commune de développement de grammaires.

Mathilde Regnault
Mathilde Regnault
Postdoctoral Researcher

My research interests include general and cognitive linguistics, language resources and grammars.