Discourse and Prosody in spoken French: Why, what and how should one count? A comparative statistical perspective

2014 
Resume Dans cet article, nous presentons un resume de certains aspects methodologiques et statistique de notre recent travail sur un corpus de francais parle. Pourquoi compter? Nous montrons comment une etude basee sur des donnees linguistiques de l’oral, peut avoir une visee technique, ou l’objectif serait par exemple d’obtenir des erreurs de classification faibles, ou bien avoir une visee plutot interpretative, ou l’objectif serait d’etudier les relations entre niveaux linguistique afin d’en tirer des conclusions. Comment compter? En fonction de cette distinction, on montre que certaines methodes statistiques sont parfois plus ou moins adequates. Par exemple, les methodes de classification automatique de machine learning s’averent souvent tres efficaces, mais peuvent se reveler beaucoup moins satisfaisante lorsqu’il s’agit de comprendre et d’expliquer l’influence d’une variable linguistique sur une autre. De la meme maniere, nous montrons qu’une analyse statistique peut etre utile pour evaluer et meme reduire la tâche d’annotation, en permettant par exemple l’identification des variables redondantes qui pourraient alors etre evitees. La discussion est basee sur de nombreux exemples tires de notre recent travail sur le corpus Rhapsodie, qui est un corpus de francais ordinaire, annote en syntaxe, discours et en prosodie.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    37
    References
    0
    Citations
    NaN
    KQI
    []