language-icon Old Web
English
Sign In

Réhabilitons les doublons

2001 
Les doublons designent toutes les references bibliographiques, au sein d'une ou de plusieurs bases de donnees, qui font reference a la meme publication : meme(s) auteur(s), titre et support de publication. La prise en compte des doublons est une necessite dans le cadre d'analyses bibliometriques car les doublons expriment une certaine redondance d'information qui fausse les denombrements de concepts et, par extension, les analyses de donnees qui se fondent sur ces denombrements. l'approche documentaire classique, appelee dedoublonnage, vise a resoudre ce probleme en ne conservant qu'une seule occurrence de reference a un meme document. Cependant, dans un contexte multibases, les doublons ne contiennent pas exactement les memes informations. On peut noter la presence variable de certains champs, des representations differentes d'un meme element d'information, et particulierement des descriptions differentes sur le contenu des documents a travers les indexations propres a chacune des sources. Nous traitons dans cet article plusieurs aspects de la prise en compte des doublons dans un contexte multibases. Nous decrivons tout d'abord les particularites de l'identification des doublons dans un tel contexte, puis nous proposons une approche pour prendre en compte ces particularites. Nous montrons alors comment il est possible d'exploiter explicitement les informations contenues dans doublons pour extraire de nouvelles connaissances.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []