CMC-core: a schema for the representation of CMC corpora in TEI

2020 
Dans cet article, nous decrivons un schema et des modeles de representation developpes pour structurer les corpus de communication mediee par ordinateur (CMC) en suivant les recommandations de la Text Encoding Initiative (TEI). Nous considerons le discours CMC comme un echange dialogique entre humains, organise de maniere sequentielle. Nous insistons d’abord sur le fait que de nombreuses caracteristiques de la CMC ne sont pas traitees de maniere adequate par les schemas et les outils actuels d’encodage de corpus. Nous formulons donc un ensemble de recommandations pour representer la CMC avec des schemas d’encodage, en insistant sur le fait que la TEI nous semble etre un cadre particulierement approprie pour l’encodage des corpus CMC. Nous proposons une modelisation des unites de base de la CMC (enonces, messages et actions non verbales) ainsi que des structures de niveaux macro- et micro des interactions dans les environnements de la CMC. A partir de ces modeles, nous introduisons le CMC-core, un noyau TEI pour l’encodage des corpus CMC, qui definit un ensemble de traits d’encodage specifiques a la CMC sur quatre niveaux: (i) elements, (ii) classes de modeles, (iii) classes d'attributs et (iv) modules de l'infrastructure TEI. La description du noyau propose est illustree au moyen d’exemples extraits des corpus des chercheurs du groupe SIG TEI CMC, representant une grande variete de genres de la CMC (le chat, le wiki talk, le tweet, le blog, les interactions Second Life…). Le materiel decrit, i.e. les schemas, les exemples d’encodage et la documentation, est disponible sur le Wiki du SIG CMC TEI et accompagnera une demande d’enrichissement de la TEI (TEI feature request) au conseil de la TEI a la fin de l’annee 2019.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    1
    Citations
    NaN
    KQI
    []