Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais

2015 
Corynebacterium pseudotuberculosis (Cp) pertence ao grupo CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), e uma bacteria patogenica intracelular facultativa, gram-positiva, possui fimbrias, porem nao se move, nao forma capsulas e nao esporula, apresenta-se nos biovares ovis e equi. O biovar equi infecta equinos e bovinos. O biovar ovis infecta principalmente rebanhos de ovinos e caprinos, sendo o agente etiologico de linfadenite caseosa (LC). Cp e prevalente em diversos paises, causando significantes perdas economicas devido a baixa qualidade de carcacas, queda na producao de carne, la e leite. Os metodos para diagnostico e tratamento de LC ainda nao sao suficientemente eficazes devido Cp apresentar baixa resposta terapeutica e habilidade em persistir no meio ambiente e no hospedeiro, sendo importante entender a biologia deste patogeno a nivel sistemico. Neste aspecto, conhecer as proteinas e suas interacoes e fundamental para compreender os mecanismos moleculares da celula, sendo as redes de interacao proteina-proteina uma boa ferramenta para este tipo de estudo. Visando gerar a rede de interacao para Cp, nos preocupamos em validar uma metodologia para a predicao de interacoes com dados experimentais e curados disponiveis publicamente. Como resultado, alem de aumentarmos a cobertura da rede, obtivemos uma area sobre a curva (AUC) entre 0,93 e 0,96, cujo ponto de corte de 0,70 representa uma especificidade de 0,95 e a uma sensibilidade de 0,90. Com a metodologia validada, foram geradas as redes de interacao para nove linhagens do biovar ovis de Cp, sendo ~99% das interacoes mapeadas do genero Corynebacterium e possuindo 15.495 interacoes conservadas entre as linhagens. Validacao quanto ao menor caminho e distribuicao do grau de interacao sugerem que as redes preditas possuem caracteristicas de redes biologicas. Adicionalmente, comparamos os valores do Coeficiente de Clusterizacao, Correlacao e R2 contra redes geradas aleatoriamente e submetemos as redes geradas ao teste de normalidade Shapiro-Wilk. Todos os resultados demonstraram que as redes de interacao preditas nao possuem uma distribuicao aleatoria, sugerindo que as redes nao foram formadas por interacoes espurias, existindo uma influencia biologica em sua predicao. Com as redes validadas, selecionamos os primeiros 15% das proteinas com maior numero de interacoes e identificamos 181 proteinas essenciais. Apenas a proteina DNA repair protein (RecN) nao teve homologia com a base de dados de genes essenciais (DEG) e outras tres tiveram homologia em apenas um organismo em DEG: Catalase (KatA), Endonuclease III (Nth) e Trigger factor (Tig), sugerindo que podem ser bons alvos para diagnostico ou desenvolvimento de drogas.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []