Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique

Corpus 16 (2017)
  Copy   BIBTEX

Abstract

Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse est que la connaissance du contexte de production facilite ce processus. Nous mesurons cet apport au travers d’un exemple de traitement, à savoir le développement d’un outil d’aide à l’annotation de certaines erreurs orthographiques. Après une rapide présentation du projet et des caractéristiques du corpus élaboré, l’article propose un exposé détaillé du module d’annotation de ces erreurs. Il en expose la méthode d’identification et de correction au moyen d’une ressource lexicale de formes phonologiques ainsi que le modèle d’annotation élaboré.

Other Versions

No versions found

Links

PhilArchive



    Upload a copy of this work     Papers currently archived: 101,394

External links

Setup an account with your affiliations in order to access resources via your University's proxy server

Through your library

Similar books and articles

Analytics

Added to PP
2020-10-09

Downloads
20 (#1,040,651)

6 months
7 (#710,381)

Historical graph of downloads
How can I increase my downloads?