G-computation et intelligence artificielle en inférence causale

2021 
Introduction Tandis que les approches d’apprentissage automatique (c.-a-d., « machine learning ») sont de plus en plus utilisees en prediction, leurs applications en inference causale sont plus recentes. Nous proposons une approche combinant la G-computation et l’apprentissage automatique pour estimer l’effet causal d’une exposition binaire sur un evenement binaire. Methodes Nous avons evalue et compare, via une etude de simulation, les performances de regressions logistiques penalisees, d’un reseau de neurones, d’une machine a vecteurs de support, d’une classification renforcee, d’arbres de regression et d’un « super learner ». Nous avons etudie six scenarios differents faisant varier les tailles d’echantillon et les relations entre les covariables, l’exposition binaire et l’evenement binaire. Resultats L’utilisation du super learner pour specifier le modele de nuisance de la G-computation surpassait les autres approches en termes de biais ou de variance lors de l’estimation de l’effet causal, particulierement pour les tailles d’echantillon moderees. L’utilisation de la machine a support de vecteurs permettait egalement d’obtenir des estimations causales performantes, bien que le biais moyen fut legerement plus eleve qu’avec le super learner. Conclusion L’utilisation d’approches d’apprentissage automatique peut etre pertinente en inference causale. Contrairement a une idee recue, ceci est egalement vrai pour des tailles d’echantillon constituees d’une centaine d’individus comme dans la majorite des etudes medicales. La G-computation avec le super learner est disponible dans le package R RISCA.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []