Données fantômes et régression optimisée (ROP)

2016 
Introduction Nous definissons une donnee fantome comme etant une variable non colligee et dont la nature et l’identite sont inconnues. Il n’existe pas de methode permettant d’imputer une information totalement inconnue. Notre hypothese est que dans un systeme biologique, toutes les variables sont reliees entre-elles, mais cette relation n’est pas forcement lineaire. Notre objectif est de demontrer qu’un modele non lineaire comme le modele regression optimisee (ROP) est capable de reconstruire une information inconnue a partir des autres variables existantes, sans utiliser des variables de confusion. Methodes Comme il semble impossible de trouver une information qui n’existe pas, la demonstration necessite de retirer une variable pertinente pour simuler cette donnee fantome, de modeliser ce trou d’information par le modele ROP, d’evaluer la pertinence de cette nouvelle information par la regression logistique. Les donnees publiques ICU.dat seront utilisees. La variable « TYP » sera supprimee et simulera la donnee fantome qui sera modelisee par le modele ROP. Resultats Le modele de regression logistique incluant les variables PO2 et « TYP » ainsi que leur interaction montre un effet significatif de la variable PO2 ( p  = 0,0189), alors que le modele excluant la variable « TYP » confirme que la variable PO2 n’est plus significative ( p  = 0,168). Le modele ROP identifie un cluster de 117 patients pour lesquels le coefficient de regression du modele ROP pour la variable PO2 est negative, alors que l’effet moyen de cette variable augment le risque de l’etat Y. Ces 117 patients sont donc porteurs d’une information expliquant la variabilite de l’effet de la variable PO2 et donc en lien avec la variable « TYP » absente des donnees analysees. Une nouvelle information dichotomique est cree pour traduire l’information portee par le cluster des 117 patients et introduite dans le modele de regression logistique qui montre un effet significatif de la variable « PO2 » ( p  = 0,020). De plus, il existe une relation significative entre la nouvelle information creee par ROP et la variable « TYP » initialement otee des donnees analysees ( p  = 0,003). Conclusion La nouvelle information cree par le modele ROP a permis de retrouver l’effet significatif de la variable PO2. Cette information est correlee a la variable otee. Tout se passe comme si ROP etait capable de creer une nouvelle information pertinente en lien avec un facteur inconnu et non collige.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []