language-icon Old Web
English
Sign In

Modélisation des trous de données

2017 
Introduction En astronomie, on peut identifier le nombre de planetes et leurs orbites autour d’un soleil par l’observation de l’irregularite de la lumiere percue venant de l’astre. En appliquant ce raisonnement aux donnees biomedicales, nous pouvons identifier des facteurs d’interet, inconnus et absents de nos bases de donnees. A travers trois exemples, nous proposons de decrire la strategie et la methode d’identification des trous de donnees, appeles « Facteurs Fantomes » (FF). Methodes ROP (Regression Optimisee) est une classification-regression dans laquelle chaque nœud est gere un score de risque incluant l’ensemble des predicateurs. L’analyse de la variation des coefficients des predicateurs des scores de risque permet d’identifier des observations pour lesquelles un predicateur change completement le sens de son effet. Nous faisons l’hypothese que ces observations ont une information differente des autres observations, que nous appelons FF, qui expliquerait le changement radical du sens du predicateur. Identifier ce FF revient a modeliser des trous d’informations. L’interet statistique de ce FF est verifie par un modele multivarie classique en l’ajustant sur l’ensemble des variables. L’identification de la nature de ce FF est realisee avec des donnees independantes et non impliquees dans sa construction. Resultats Il n’etait pas possible de demontrer de maniere experimentale que les delais operatoires pour le curage ganglionnaire des melanomes augmentaient le risque de recidive. Nous avons modelise la prise de decision des chirurgiens par un FF et le modele de Cox ajuste sur ce FF a pu demontrer l’augmentation du risque de recidive avec l’augmentation des delais operatoires. L’effraction capsulaire ganglionnaire d’un melanome augmente le risque de sa recidive. Cependant cette effraction permet aussi de presenter les antigenes tumoraux au systeme immunitaire. Nous avons demontre que l’effet paradoxal « protecteur » de l’effraction capsulaire serait positivement lie a l’antigene de Melan-A et negativement a anti-PDL1 exprime par les cellules melanique et qui inhibe l’activite des lymphocytes T specifiques de la tumeur. Nous avons ote de la base analysee un facteur de pronostic significatif. Nous avons ensuite demontre que le FF que nous avons cree etait tres correle a la variable initialement otee. Conclusion Dans le modele ROP, le changement de signe de regression d’un predicateur dans un cluster permet de deduire la presence d’un effet specifique et independant des autres predicateurs analyses, puisque tous les predicateurs etaient deja inclus. Le modele ROP ouvre de nouvelles perspectives pour identifier de nouvelles pistes.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []