Contribution à la sélection de modèle via pénalisation Lasso en Épidémiologie

2018 
Mes travaux portent principalement sur le developpement, l’adaptation, l’implementation et l’application de methodes statistiques de selection de modele. Ma principale contribution consiste a adapter des methodes de l'apprentissage statistique supervise qui sont devenues tres populaires lors de la derniere decennie, les regressions penalisees de type Lasso, a l'analyse de donnees issues d'etudes epidemiologiques. L'enjeu est de s'attaquer aux problemes des donnees volumineuses (\textit{Big Data}) tout en respectant les objectifs et specificites de la discipline. Le volume important se refere ici au fait que le nombre d'observations et/ou le nombre de variables est bien plus important que celui qui etait classique dans le domaine, sans exclure le cas ou le nombre de variables est superieur au nombre d'observations (donnees de grande dimension). Le contexte de la pratique epidemiologique est en plein changement avec les evolutions technologiques et la consequente disponibilite croissante des Big Data. Le Systeme National des Donnees de Sante (SNDS), regroupant les principales bases de donnees de sante publique existantes en France, constitue un exemple de Big Data en sante. Le donnees ``omiques'' (genomiques, transcriptomiques, proteomiques, metabolomiques, microbiomiques, mycobiomiques, viromiques,$\ldots$) issues des avancees des techniques de sequencage a haut debit constituent un autre exemple de Big Data en sante. Enfin, les mesures de l'\textit{exposome} (par opposition aux facteurs genetiques), qui designe en epidemiologie l’ensemble des expositions environnementales que subit un individu au long de sa vie peut egalement constituer une source de Big Data. Ce document s'articule autour de trois chapitres. Il resume mon activite de recherche depuis 2005, soit depuis mon recrutement a l’Universite de Bordeaux apres ma these. Le premier chapitre est une introduction generale dans laquelle je contextualise, motive et enonce la problematique abordee tout au long de mes recherches. Le deuxieme chapitre est consacre a mes travaux en lien avec les etudes sur les traumatismes accidentels et expositions medicamenteuses a partir des donnees du SNDS. Le troisieme chapitre est consacre a mes travaux en lien avec des etudes biomedicales: la prediction de la charge virale censuree par un seuil de detection a partir des mutations du VIH, d'une part, et l'automatisation de la detection des seuils d'anomalie des hemogrammes en population generale, d'autre part.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []