À la croisée des langues. Annotation et fouille de corpus plurilingues

2014 
Un programme de recherche en cours sur l'etude des phenomenes de contact de langues et de leur role dans le changement linguistique s'attache a recueillir des corpus plurilingues, temoignant d'une grande variete de phenomenes de contact sur un echantillon suffisamment varie de langues genetiquement et typologiquement distinctes. Cet effort a implique le developpement d'une chaine de traitement des corpus numeriques qui tienne compte des specificites des corpus plurilingues, pour la representation des donnees linguistiques, leur stockage, leur annotation, leur visualisation, et les traitements de recherche d'information. Les normes existantes ont du etre etendues pour prendre en compte l'appartenance potentielle d'unites a plusieurs langues dans les pratiques langagieres plurilingues. Dans cet article, nous decrivons la maniere dont a ete definie la structure de ces corpus plurilingues, et la conception technique de l'unite linguistique multilingue qui preside a la fouille de donnees dans ces corpus.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []