Désidentification de comptes-rendus hospitaliers dans une base de données OMOP

2019 
En medecine, la recherche sur les donnees de patients vise a ameliorer les soins. Pour preserver la vie privee des patients, ces donnees sont usuellement desidentifiees. Les documents textuels contiennent de nombreuses informa-tions presentes uniquement dans ce materiel et representent donc un attrait important pour la recherche. Cependant ils representent aussi un challenge technique lie au processus de desidentification. Ce travail propose une methode hybride de desidentification evaluee sur un echantillon des textes de l'entrepot de donnees de sante de l'Assistance Publique des Hopitaux de Paris. Les deux apports principaux sont des performances de desi-dentification superieures a l'etat de l'art en langue francaise, et l'implementation d'une chaine de traitement standardisee librement accessible implementee sur OMOP-CDM, un mo-dele commun de representation des donnees medicales large-ment utilise dans le monde.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []