Motifs exceptionnels dans des séquences hétérogènes. Contributions à la théorie et à la méthodologie des tests multiples

2007 
La premiere partie de la these presente des nouvelles methodes statistiques pour detecter les motifs de frequence exceptionnelle dans un genome. La principale contribution de ce travail est de proposer une mesure de l'exceptionnalite d'un motif qui tient compte d'une certaine heterogeneite dans la sequence. Pour cela, nous etablissons plusieurs approximations de Poisson composee pour la loi du comptage d'un motif râre lorsque la sequence suit un modele markovien heterogene, avec une heterogeneite fixe ou aleatoire. Nous proposons aussi des procedures permettant de tester simultanement l'exceptionnalite de plusieurs motifs, ce qui introduit la thematique de la seconde partie de la these. Cette derniere est consacree au probleme statistique general consistant a tester simultanement un ensemble d'hypotheses nulles. Nous proposons notamment un nouvel eclairage sur les mathematiques mises en jeu dans les resultats classiques du controle du taux moyen de fausses decouvertes (FDR), ainsi que de nouvelles procedures par reechantillonnage pour controler non-asymptotiquement la probabilite d'avoir fait au moins une fausse decouverte (FWER)
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []