Ajuster l'analyse distributionnelle à un corpus spécialisé de petite taille

2014 
L'analyse distributionnelle sur des corpus specialises de taille modeste constitue un objectif applicatif important pour cette famille de methodes d'extraction des relations semantiques. Dans ce cadre, nous cherchons a optimiser le calcul distributionnel pour traiter un corpus de 2 millions de mots compose d'articles de la conference TALN. Notre expertise dans ce champ nous permet de constituer des donnees d'evaluation adaptees au corpus et a la tâche, et fait de cette configuration experimentale un lieu ideal pour observer precisement les mecanismes distributionnels a l'œuvre. Un parametrage precis du calcul distributionnel, depuis l'analyse syntaxique jusqu'aux mesures de proximite semantique, met en evidence la variete des resultats obtenus, particulierement selon les categories grammaticales des mots cibles, et permet de degager des combinaisons performantes en jouant sur le nombre, la nature et la qualite des contextes pris en compte dans le calcul.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    1
    Citations
    NaN
    KQI
    []