Principes de conception de systèmes hypertextes pour la fouille de données bibliographiques multibases

2001 
Le besoin en information est primordial pour la recherche et la veille scientifiques et techniques. L'importante quantite de donnees disponibles actuellement sur un domaine d'activite necessite de mettre en oeuvre des moyens adaptes pour exploiter ces donnees. Le but de ce travail de recherche est de fournir un environnement pour exploiter les donnees d'un domaine (references bibliographiques et Web) pour des besoins de recherches bibliographiques ou d'analyses de domaines. Dans ce cadre une approche generale pour construire un systeme hypertexte de fouille de donnees bibliographiques est propose. L'hypertexte favorise l'acces exploratoire des donnees. Des fonctionnalites de fouille (denombrements, classifications, extractions de regles) sont declenchees a la demande pour analyser plus precisement les donnees. L'idee principale de cette these est que la fouille de donnees et la recherche d'information sont deux approches complementaires pour apprehender des donnees : la fouille de donnees permet de guider la recherche d'information a partir des connaissances extraites des donnees. Inversement, la recherche d'information permet de guider la fouille de donnees par l'exploitation des connaissances issues de la fouille. La fouille de donnees favorise egalement l'acces a l'information sur le Web. Concretement, les connaissances extraites des donnees bibliographiques fournissent une aide a la formulation de requetes et permettent d'ameliorer la precision des reponses obtenues lors de l'interrogation de moteurs de recherche. La mise en place d'un tel systeme necessite d'exploiter les travaux de recherche en fouille de donnees, recherche d'information et bases de donnees. D'un point de vue technique, les outils de ces differents domaines sont combines grâce a une approche modulaire exploitant XML pour la representation et l'echange des donnees manipulees, et un traitement par flux de donnees.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    1
    Citations
    NaN
    KQI
    []