Conciliation des données du PMSI et de la base REA-RAISIN par correspondance approximative

2016 
Introduction Les etudes basees sur des cohortes telles que REA-RAISIN peuvent beneficier de l’apport des donnees du PMSI. Cependant, la fusion de ces deux sources de donnees est complexe, car les memes variables d’un sejour saisies manuellement dans REA-RAISIN peuvent etre differentes de celles retrouvees dans le PMSI. Notre objectif etait de developper un algorithme permettant de faciliter la fusion d’une base de donnees de grand volume avec le PMSI en l’absence de cle de fusion explicite. Methodes Onze annees de donnees du service de reanimation medicale du CHU de Strasbourg ont ete extraites du PMSI et de REA-RAISIN. Nous avons implemente dans le logiciel R un algorithme de conciliation des donnees base sur la distance de Levensthein. Un score de distance pondere etait calcule en utilisant les informations communes disponibles dans les deux bases de donnees. Un seuil etait fixe au-dela duquel les correspondances etaient validees manuellement. Resultats Parmi les 7479 sejours decrits dans la base REA-RAISIN, 7465 (99,8 %) ont pu etre fusionnes avec les 10 605 sejours du PMSI. La majorite (72,8 %) avait une correspondance parfaite (score de distance = 0). Un quart ( n  = 1897) des sejours avait un score compris entre 0 et le seuil de tolerance ce qui a permis de les fusionner automatiquement. Aucune erreur n’a ete detectee parmi un echantillon aleatoire de 100 de ces correspondances imparfaites. Parmi les 134 correspondances de sejours avec un score superieur au seuil qui ont ete verifiees manuellement, 14 (0,2 %) ont ete exclues, car nous n’avons pas trouve de correspondance avec le PMSI. Discussion Cet algorithme nous a permis de rapprocher deux bases de donnees avec une intervention humaine reduite. Sans cet algorithme, 27 % des donnees n’auraient pas ete utilisees, ce qui aurait provoque une diminution de puissance de notre etude et un risque de biais.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []