Défis algorithmiques pour les simulations biomoléculaires et la conception de protéines

2016 
Le dessin computationnel de proteine, ou CPD, est une technique qui permet de modifier les proteines pour leur conferer de nouvelles proprietes, en exploitant leurs structures 3D et une modelisation moleculaire. Pour rendre la methode de plus en plus predictive, les modeles employes doivent constamment progresser. Dans cette these, nous avons aborde le probleme de la representation explicite de la flexibilite du squelette proteique. Nous avons developpe une methode de dessin "multi-etats", qui se base sur une bibliotheque discrete de conformations du squelette, etablie a l'avance. Dans un contexte de simulation Monte Carlo, le paysage energetique d'une proteine etant rugueux, les changements de squelettes ne peuvent etre acceptes que moyennant certaines precautions. Aussi, pour explorer ces conformations, en meme temps que des mutations et des mouvements de chaines laterales, nous avons introduit un nouveau type de deplacement dans une methode Monte Carlo existante. Il s'agit d'un deplacement "hybride", ou un changement de squelette est suivi d'une courte relaxation Monte Carlo des chaines laterales seules, apres laquelle un test d'acceptation est effectue. Pour respecter une distribution de Boltzmann des etats, la probabilite doit avoir une forme precise, qui contient une integrale de chemin, difficile a calculer en pratique. Deux approximations sont explorees en detail: une basee sur un seul chemin de relaxation, ou chemin "generateur" (Single Path Approximation, ou SPA), et une plus complexe basee sur un ensemble de chemins, obtenus en permutant les etapes elementaires du chemin generateur (Permuted Path Approximation, ou PPA). Ces deux approximations sont etudiees et comparees sur deux proteines. En particulier, nous calculons les energies relatives des conformations du squelette en utilisant trois methodes differentes, qui passent reversiblement d'une conformation a l'autre en empruntent des chemins tres differents. Le bon accord entre les methodes, obtenu avec de nombreuses parametrisations differentes, montre que l'energie libre se comporte bien comme une fonction d'etat, suggerant que les etats sont bien echantillonnes selon la distribution de Boltzmann. La methode d'echantillonnage est ensuite appliquee a une boucle dans le site actif de la tyrosyl-ARNt synthetase, permettant d'identifier des sequences qui favorisent une conformation, soit ouverte, soit fermee de la boucle, permettant en principe de controler ou redessiner sa conformation. Nous decrivons enfin un travail preliminaire visant a augmenter encore la flexibilite du squelette, en explorant un espace de conformations continu et non plus discret. Ce changement d'espace oblige a restructurer completement le calcul des energies et le deroulement des simulations, augmente considerable le cout des calculs, et necessite une parallelisation beaucoup plus agressive du logiciel de simulation.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []