Computational geometry for the determination of biomolecular structures

2017 
En bioinformatique structurale, une partie des methodes computationnelles qui calculent les structures de proteines a l'aide de donnees experimentales, effectuent une optimisation de la position des atomes sous les contraintes experimentales mesurees sur le systeme etudie, ainsi que sous des contraintes provenant de la connaissance generique de la stereochimie organique. Ces methodes d'optimisation presentent l'inconvenient de ne pas garantir la determination de la meilleure solution. De plus, la validation de l'optimisation se fait en comparant les resultats obtenus pour des calculs repetes, et le resultat d'un calcul est accepte dans la mesure ou le meme resultat est obtenu plusieurs fois. Par cette approche, on rend plus difficile la detection de conformations alternatives de proteines, qui sont pourtant le sujet d'un vif interet dans la litterature. En effet, le developpement de la sensibilite des techniques de resonance magnetique nucleaire (RMN) a permis de mettre en evidence plusieurs cas d'echange conformationnel relies a la fonction des proteines. Dans ce projet de these, nous avons etudie une nouvelle approche pour le calcul de structures des proteines et l'exploration de leurs espaces conformationnels, basee sur la resolution du probleme de Geometrie de Distance associe aux contraintes de distances dans une proteine par l'algorithme "interval Branch and Prune". Le logiciel implementant cette methode est appelee iBPprot, il incarne l'une des premieres tentatives d'echantillonnage exhaustive des espaces conformationnels des proteines. Dans un premier temps, on s'est interesse a l'application de la methode en utilisant exclusivement des constraintes de distances exactes. Les resultats ont demontre que iBPprot etait capable de reconstruire des structures references en s'appuyant seulement sur quelques contraintes a courte portee. De plus, la reconstruction a ete d'une precision telle que la conformation generee presentait un RMSD de 1 Angstrom maximum avec la structure reference. L'exploration exhaustive de l'espace conformationnel a ete possible pour une bonne partie des proteines cibles. Les temps de calcul pour l'exploration des espaces conformationnels ont ete tres variables allant de quelques secondes pour quelques proteines jusqu'a des semaines pour d'autres. L'evaluation de la qualite des structures obtenues a demontre qu'au moins 68% des valeurs de phi et psi sont localisees dans la zone 'core' du diagramme de Ramachandran. Cependant, des clash steriques ont ete detectees dans plusieurs conformations mettant en jeu jusqu'a 7% d'atomes dans quelques unes de ces conformations. Dans un deuxieme temps, on s'est interesse a l'application de la methode en incluant des intervalles de distances comme contraintes dans les calculs. Dans ce cas de figure, la methode a reussi a reconstruire des structures references avec un RMSD inferieur a 5 Angstrom pour plus de la moitie des proteines cibles. En contre partie, le parcours complet de l'espace conformationnel n'a ete possible que pour la plus petite proteine de l'ensemble des proteines etudiees. Pour la moitie des autres proteines, plus de 70% des atomes ont vu leurs positions echantillonnees. La qualite des structures obtenues a regresse en comparaison avec les simulations faites avec des distances exactes. En effet, seulement 53% des valeurs de phi et psi etaient localisees dans la zone 'core' du diagramme de Ramachandran, et le pourcentage d'atomes impliques dans un clash sterique s'elevait jusqu'a 22% pour quelques proteines. Concernant le temps de calcul, le taux de generation de conformations a ete determine pour chaque proteine cible, et il s'est avere que globalement sa valeur etait competitive par rapport aux valeurs des taux observables dans la litterature...
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []