Pré-screening et études de faisabilité : l’apport des entrepôts de données de cliniques

2019 
Introduction Le projet ONCOSHARe (« ONCOlogy big data SHAring for Research ») vise a demontrer, au sein du canceropole Grand-Ouest, la valeur ajoutee des donnees de cancerologie centrees patient pour la recherche. Nous proposons d’ameliorer le recrutement dans les etudes d’oncologie via eHOP, un Entrepot de donnees cliniques (EDC), pour faciliter le pre-screening. Methodes L’automatisation du pre-screening pose trois difficultes : l’extraction des criteres d’eligibilite (CE), l’extraction d’entites cliniques depuis les comptes-rendus (CR) textuels, l’export des donnees vers un standard de reutilisation. Nous avons aborde ces problemes au travers d’etudes cliniques d’onco-pneumologie du registre d’OncoBretagne et de l’EDC du CHU de Rennes. Les CE en texte libre ont ete convertis en requetes, les variables impliquees ont ete decrites. Lorsque ces variables n’etaient pas structurees au sein d’eHOP, elles etaient extraites des CR a l’aide d’algorithmes de Traitement automatique du langage (TAL) qui ont ete evalues par rapport a une extraction manuelle. Les donnees etaient exportees dans un format standardise. Resultats La conversion des CE en requetes revele certaines limitations : certains ne pouvaient etre evalues (ex : compliance), devaient etre reevalues a l’inclusion (ex : biologie standard), etaient trop ambigus ou trop specifiques. Au total, 361 CE au sein de 49 etudes ont ete convertis en 464 requetes, impliquant 23 variables distinctes. Dix variables n’etaient pas pertinentes pour le pre-screening, 4 etaient deja structurees dans l’EDC. Le TAL a permis l’extraction des codes morphologiques CIM-O (rappe : 97,8 %, precision : 100 %), du score OMS (rappel : 100 %, precision : 100 %), du TNM (rappel : 98,0 %, precision : 97,6 %) et du stade (rappel : 99,7 %, precision : 97,5 %). Les donnees etaient exportees aux formats OSIRIS et OMOP common-data-model. Discussion/Conclusion La conversion des CE en requetes demeure complexe. En attendant l’adoption d’un standard structure, leur conversion manuelle semble inevitable. Les principales variables d’eligibilite ont ete extraites d’eHOP vers un standard de reutilisation, sur lequel les requetes sont executees. Nous avons decrit un pipeline complet, de l’integration des donnees dans l’EDC a leur reutilisation pour le pre-screening.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []