Modélisation des arbres onco-généalogiques et application à la détermination de phénotypes cancéreux spécifiques favorisant une exploration génotypique ciblée

2020 
En oncogenetique, c’est l’etude des cas de cancer dans l’arbre genealogique familial qui permet d’orienter le diagnostic vers certaines mutations voire certaines associations de mutations, ou bien de rejeter l’hypothese d’une susceptibilite genetique de cancer dans la famille. Si ce diagnostic repose d’ordinaire sur l’oncogeneticien, il est possible de proposer une approche algorithmique pour traiter les informations contenues dans ces arbres. Trois methodes ont ete developpees a cette fin : • Utilisation de l’arbre genealogique tel quel comme modele puis calcul du risque mutationnel selon diverses hypotheses et conservation de celle la plus probable au vu du modele.•Generation de sous-arbres (squelette contenant par ex. toutes les occurrences pere-mere-fils-fille d’un arbre) resumant l’information oncogenetique et constitution par agregation de profils familiaux. Determination du risque mutationnel par calcul de distance entre les sous-arbres et les profils.• Utilisation du resume statistique denombrant les cas par type de cancer, par âge de diagnostic ainsi que d’autres donnees demographiques synthetiques (taux de celibat, indices de fertilite, precocite de la procreation…). Traitement de ces resumes a l’aide d’analyse en composantes principales (ACP) et de clustering afin de mettre en evidence des groupes de familles de phenotype similaire, susceptibles de correspondre a des genotypes specifiques.Ces approches ont ete testees tantot sur des arbres generes aleatoirement a partir des risques connus de cancers sein/ovaire induits par les mutations sur les genes BRCA, tantot sur la base de donnees oncogenetique du Centre de lutte contre le cancer Jean Perrin qui contient plusieurs milliers d’arbres de familles predisposees au cancer. Cela nous a permis de determiner en particulier une taille optimale pour les arbres onco-genealogiques. La generation de sous-arbres n’a pas montre un interet superieur a l’utilisation des resumes statistiques. A l’aide de ces derniers, nous avons developpe un modele de classement automatique doublement hierarchique (CAH²), le premier niveau correspondant aux familles elles-memes et le second aux membres des familles. Ce CAH² necessite encore quelques validations. Enfin les ACP sur les resumes nous ont permis de regrouper les familles de maniere efficace, en discriminant bien, parmi les familles a risque sein/ovaire, les familles avec des mutations tres penetrantes (genes BRCA) des autres familles chez lesquelles les mutations deleteres devraient etre sur un ou plusieurs autres genes mais non encore repertories comme tels.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []