Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique

2017 
Le travail presente dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le developpement d’un outil d’aide a son exploitation a partir de l’annotation de phenomenes linguistiques saillants. Nous nous concentrerons ici sur les ecrits produits en fin de classe de CP par des scripteurs encore debutants. L’objet de ce travail est d’explorer les possibilites qu’offre le traitement automatique des langues pour apprehender ces ecrits particulierement eloignes de la norme. L’hypothese est que la connaissance du contexte de production facilite ce processus. Nous mesurons cet apport au travers d’un exemple de traitement, a savoir le developpement d’un outil d’aide a l’annotation de certaines erreurs orthographiques. Apres une rapide presentation du projet et des caracteristiques du corpus elabore, l’article propose un expose detaille du module d’annotation de ces erreurs. Il en expose la methode d’identification et de correction au moyen d’une ressource lexicale de formes phonologiques ainsi que le modele d’annotation elabore.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    6
    References
    1
    Citations
    NaN
    KQI
    []