L'analyse syntaxique de l'oral : problèmes et méthodes

2004 
Cette etude expose les resultats de plusieurs mois de reflexion et d'experimentation liees a la constitution d'un corpus oral de reference dans le cadre du projet d'evaluation des analyseurs syntaxiques Easy. La plupart des travaux sur l'analyse syntaxique automatique au cours des dernieres decennies ont porte sur l'ecrit, et l'on dispose de tres peu de corpus oraux syntaxiquement annotes (a notre connaissance aucun pour le francais). Or, de tels corpus seraient extremement interessants, tant pour les etudes linguistiques, que pour l'evolution des technologies de la parole, dont les « modeles de langage » sont souvent mis au point a partir de textes ecrits refletant assez mal le langage parle (par exemple le journal Le Monde). L'oral constitue un defi majeur pour l'analyse syntaxique, mais nous montrerons que les phenomenes que l'on y observe se retrouvent egalement pour beaucoup a l'ecrit, meme si c'est avec des frequences moindres. Nous faisons donc l'hypothese que l'etude de l'oral peut aussi amener quelque lumiere dans les zones d'ombre, souvent negligees par commodite, de l'ecrit.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []