Accès à l'information biomédicale : vers une approche d'indexation et de recherche d'information conceptuelle basée sur la fusion de ressources termino-ontologiques

2012 
La recherche d'information (RI) est une discipline scientifique qui a pour objectif de produire des solutions permettant de selectionner a partir de corpus d'information celle qui sont dites pertinentes pour un utilisateur ayant exprime une requete. Dans le contexte applicatif de la RI biomedicale, les corpus concernent differentes sources d'information du domaine : dossiers medicaux de patients, guides de bonnes pratiques medicales, litterature scientifique du domaine medical etc. Les besoins en information peuvent concerner divers profils : des experts medicaux, des patients et leurs familles, des utilisateurs neophytes etc. Plusieurs defis sont lies specifiquement a la RI biomedicale : la representation "specialisee" des documents, bases sur l'usage des ressources terminologiques du domaine, le traitement des synonymes, des acronymes et des abreviations largement pratiquee dans le domaine, l'acces a l'information guide par le contexte du besoin et des profils des utilisateurs. Nos travaux de these s'inscrivent dans le domaine general de la RI biomedicale et traitent des defis de representation de l'information biomedicale et de son acces. Sur le volet de la representation de l'information, nous proposons des techniques d'indexation de documents basees sur : 1) la reconnaissance de concepts termino-ontologiques : cette reconnaissance s'apparente a une recherche approximative de concepts pertinents associes a un contenu, vu comme un sac de mots. La technique associee exploite a la fois la similitude structurelle des contenus informationnels des concepts vis-a-vis des documents mais egalement la similitude du sujet porte par le document et le concept, 2) la desambiguisation des entrees de concepts reconnus en exploitant la branche liee au sous-domaine principal de la ressource termino-ontologique, 3) l'exploitation de differentes ressources termino-ontologiques dans le but de couvrir au mieux la semantique du contenu documentaire. Sur le volet de l'acces a l'information, nous proposons des techniques d'appariement basees sur l'expansion combinee de requetes et des documents guidees par le contexte du besoin en information d'une part et des contenus documentaires d'autre part. Notre analyse porte essentiellement sur l'etude de l'impact des differents parametres d'expansion sur l'efficacite de la recherche : distribution des concepts dans les ressources ontologiques, modele de fusion des concepts, modele de ponderation des concepts, etc. L'ensemble de nos contributions, en termes de techniques d'indexation et d'acces a l'information ont fait l'objet d'evaluation experimentale sur des collections de test dediees a la recherche d'information medicale, soit du point de vue de la tâche telles que TREC Medical track, CLEF Image, Medical case ou des collections de test telles que TREC Genomics.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    7
    Citations
    NaN
    KQI
    []