Impact de la structure logique des documents sur les modèles distributionnels : expérimentations sur le corpus TALN (Impact of document structure on distributional semantics models: a case study on NLP research articles )

2020 
Nous presentons une experience visant a mesurer en quoi la structure logique d’un document impacte les representations lexicales dans les modeles de semantique distributionnelle. En nous basant sur des documents structures (articles de recherche en TAL) nous comparons des modeles construits sur des corpus obtenus par suppression de certaines parties des textes du corpus : titres de section, resumes, introductions et conclusions. Nous montrons que malgre des differences selon les parties et le lexique pris en compte, ces zones reputees particulierement informatives du contenu d’un article ont un impact globalement moins significatif que le reste du texte sur la construction du modele.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []