Interopérabilité Sémantique Multi-lingue des Ressources Lexicales en Données Liées Ouvertes

2016 
Lorsqu’il s’agit la construction de ressources lexico-semantiques multilingues, la premiere chose qui vient a l’esprit, et la necessite que les ressources a alignees partagent le meme format de donnees et la meme representations (interoperabilite representationnelle). Avec l’apparition de standard tels que LMF et leur adaptation au web semantique pour la production de ressources lexico- semantiques multilingues en tant que donnees lexicales liees ouvertes (Ontolex), l’interoperabilite representationnelle n’est plus un verrou majeur. Cependant, en ce qui concerne l’interoperabilite des alignements multilingues, le choix et la construction du pivot interlingue est l’un des obstacles principaux. Pour nombre de ressources (par ex. BabelNet, EuroWordNet), le choix est fait d’utiliser l’Anglais, ou une autre langue comme pivot interlingue. Ce choix mene a une perte de contraste dans les cas ou des sens du Pivot ont des lexicalisations differentes dans la meme acception dans plusieurs autres langues. L’utilisation d’une pivot a acceptions interlingues, solution proposee il y a deja plus de 20 ans, pourrait etre viable. Neanmoins, leur construction manuelle est trop ardue du fait du manque d’experts parlant assez de langues et leur construction automatique pose probleme du fait de l’absence d’une formalisation et d’une caracterisation axiomatique permettant de garantir leur proprietes. Nous proposons dans cette these de d’abord formaliser l’architecture a pivot interlingue par acceptions, en developpant une axiomatisation garantissant leurs proprietes. Nous proposons ensuite des algorithmes de construction initiale automatique en utilisant les proprietes combinatoires du graphe des alignements bilingues, mais aussi des algorithmes de mise a jour garantissant l’interoperabilite dynamique. Dans un deuxieme temps, nous etudions de maniere plus pratique sur DBNary, un extraction periodique de Wiktionary dans de nombreuses editions de langues, afin de cerner les contraintes pratiques a l’application des algorithmes proposes.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []