Représentation sémantique distributionnelle et alignement de conversations par chat

2019 
Les mesures de similarite textuelle ont une place importante en TAL, du fait de leurs nombreuses applications, en recherche d'information et en classification notamment. En revanche, le dialogue fait moins l'objet d'attention sur cette question. Nous nous interessons ici a la production d'une similarite dans le contexte d'un corpus de conversations par chat a l'aide de methodes non-supervisees, exploitant a differents niveaux la notion de semantique distributionnelle, sous forme d'embeddings. Dans un meme temps, pour enrichir la mesure, et permettre une meilleure interpretation des resultats, nous etablissons des alignements explicites des tours de parole dans les conversations, en exploitant la distance de Wasserstein, qui permet de prendre en compte leur dimension structurelle. Enfin, nous evaluons notre approche a l'aide d'une tâche externe sur la petite partie annotee du corpus, et observons qu'elle donne de meilleurs resultats qu'une variante plus na\"ive a base de moyennes.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []