Constitution d’une ressource sémantique issue du treillis des catégories de Wikipedia

2010 
Le travail presente dans cet article s’inscrit dans le theme de l’acquisition automatique de ressources semantiques s’appuyant sur les donnees de Wikipedia. Nous exploitons le graphe des categories associees aux pages de Wikipedia a partir duquel nous extrayons une hierarchie de categories parentes, semantiquement et thematiquement liees. Cette extraction est le resultat d’une strategie de plus court chemin appliquee au treillis global des categories. Chaque page peut ainsi etre representee dans l’espace de ses categories propres, ainsi que des categories parentes. Nous montrons la possibilite d’utiliser cette ressource pour deux applications. La premiere concerne l’indexation et la classification des pages de Wikipedia. La seconde concerne la desambiguisation dans le cadre d’un traducteur de requetes francais/anglais. Ce dernier travail a ete realise en exploitant les categories des pages anglaises.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    3
    Citations
    NaN
    KQI
    []