Élaboration d’un procédé de classification automatique basé sur l’Intelligence artificielle des comptes rendus de consultation selon l’organe d’intérêt

2021 
Introduction La detection des patients en fonction de la pathologie d’interet est la premiere etape de toute exploitation de donnees. Les techniques actuelles pour constituer des cohortes semblent actuellement insuffisantes (mots-cles ? CONSORE ?). Notre objectif etait donc d’etablir un procede automatique de tri des comptes rendus de premiere consultation (CRPC) selon l’organe d’interet dans le service de chirurgie cervico-faciale. Methodes L’ensemble des comptes rendus de consultation (CRC) a ete extrait pour tous les patients ayant consulte dans le service de chirurgie cervico-faciale de 2000 a 2020. Pour chaque patient, nous avons selectionne le CRPC. Nous avons manuellement trie les CRPC selon 10 groupes d’interet pour 6559 patients, correspondant a des localisations anatomiques distinctes. Nous avons ensuite utilise la bibliotheque open source Keras, permettant d’utiliser l’algorithme de deep learning TensorFlow. Cet algorithme s’entraine sur 80 % des CRPC et realise un test sur les 20 % restant. Pour optimiser ce systeme, nous avons procede a des regroupements de categories coherents d’un point de vue clinique. Nous avons ainsi dans un premier temps applique l’algorithme afin de classifier les CRPC en cinq grandes categories, puis de l’appliquer a nouveau pour realiser six sous-groupes au sein de la categorie [cancers des VADS]. Resultats Au total, 107 282 CRC ont ete initialement extraits, 24 434 CRPC ont ete selectionnes. Pour le premier tri, 5247 fichiers ont ete utilises pour l’entrainement et 1312 pour le test. Sur le test, 148 erreurs ont ete identifies (11,3 %). La matrice de confusion est ici presentee. Pour le second tri, 1740 fichiers ont ete utilises pour l’entrainement et 435 pour le test. Sur le test, 85 erreurs ont ete identifies (19,5 %). Pour la pathologie la plus representee du premier tri (531/1312 patients) [tumeur thyroide-parathyroide], les performances de sensibilite, specificite, valeur predictives positives et negatives etaient respectivement de : 96,2, 96,5, 95,0 et 97,4 %. Pour la pathologie la moins representee du second tr [nez-sinus] (8/435), ils etaient de 72,7, 100, 100 et 99,3 %. L’ensemble des performances de l’algorithme sera expose. Conclusion La bibliotheque Keras est un outil de classification fiable basee sur du deep learning, notamment pour identifier une pathologie frequente au sein d’une large cohorte. Il parait cependant moins adapte pour identifier les pathologies rares. Nous allons tenter d’elargir le procede a l’ensemble des patients ayant consulte dans notre centre. Figure : http://extranet.insight-outside.fr/upload/compte1352/Base/inscriptions_projets/image/100078-image.pdf
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []