Inférence statistique bayésienne pour les modélisations donnant lieu à un calcul de vraisemblance impossible

2019 
Dans un processus d'inference statistique, lorsque le calcul de la fonction de vraisemblance associee aux donnees observees n'est pas possible, il est necessaire de recourir a des approximations. C'est un cas que l'on rencontre tres frequemment dans certains champs d'application, notamment pour des modeles de genetique des populations. Face a cette difficulte, nous nous interessons aux methodes de calcul bayesien approche (ABC, Approximate Bayesian Computation) qui se basent uniquement sur la simulation de donnees, qui sont ensuite resumees et comparees aux donnees observees. Ces comparaisons necessitent le choix judicieux d'une distance, d'un seuil de similarite et d'un ensemble de resumes statistiques pertinents et de faible dimension. Dans un contexte d'inference de parametres, nous proposons une approche melant des simulations ABC et les methodes d'apprentissage automatique que sont les forets aleatoires. Nous utilisons diverses strategies pour approximer des quantites a posteriori d'interets sur les parametres. Notre proposition permet d'eviter les problemes de reglage lies a l'ABC, tout en fournissant de bons resultats ainsi que des outils d'interpretation pour les praticiens. Nous introduisons de plus des mesures d'erreurs de prediction a posteriori (c'est-a-dire conditionnellement a la donnee observee d'interet) calculees grâce aux forets. Pour des problemes de choix de modeles, nous presentons une strategie basee sur des groupements de modeles qui permet, en genetique des populations, de determiner dans un scenario evolutif les evenements plus ou moins bien identifies le constituant. Toutes ces approches sont implementees dans la bibliotheque R abcrf. Par ailleurs, nous explorons des manieres de construire des forets aleatoires dites locales, qui prennent en compte l'observation a predire lors de leur phase d'entrainement pour fournir une meilleure prediction. Enfin, nous presentons deux etudes de cas ayant beneficie de nos developpements, portant sur la reconstruction de l'histoire evolutive de population pygmees, ainsi que de deux sous-especes du criquet pelerin Schistocerca gregaria.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []