Compression de vocabulaire de sens grâce aux relations sémantiques pour la désambiguïsation lexicale

2019 
En Desambiguisation Lexicale (DL), les systemes supervises dominent largement les campagnes d'evaluation. La performance et la couverture de ces systemes sont cependant rapidement limites par la faible quantite de corpus annotes en sens disponibles. Dans cet article, nous presentons deux nouvelles methodes qui visent a resoudre ce probleme en exploitant les relations semantiques entre les sens tels que la synonymie, l'hyperonymie et l'hyponymie, afin de compresser le vocabulaire de sens de WordNet, et ainsi reduire le nombre d'etiquettes differentes necessaires pour pouvoir desambiguiser tous les mots de la base lexicale. Nos methodes permettent de reduire considerablement la taille des modeles de DL neuronaux, avec l'avantage d'ameliorer leur couverture sans donnees supplementaires, et sans impacter leur precision. En plus de nos methodes, nous presentons un systeme de DL qui tire parti des recents travaux sur les representations vectorielles de mots contextualisees, afin d'obtenir des resultats qui surpassent largement l'etat de l'art sur toutes les tâches d'evaluation de la DL.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []