Similaridade entre sequências genômicas aplicada na inferência de redes de regulação gênicas

2020 
Este trabalho tem como intuito a producao de um metodo eficaz para a classificacao de   sequencias de RNA, e determinar se sao codificantes ou nao-codificantes. O algoritmo facilita a analise destes dados geralmente brutos e em enorme quantidade.METODOS: Para cada sequencia de RNA foi gerado grafo com base em 2 parâmetros: passo e tamanho da palavra. Apos a producao dos grafos, e realizada uma filtragem das arestas mais exclusivas de cada classe, e assim abstrair medidas que descrevem a rede e partir dessas medidas foram feitas as classificacoes com o algoritmos Random Forest. RESULTADOS: Apos aplicado a metodologia deste trabalho, os resultados finais foram muito positivos, com media de 99,78%  de acerto para o classificador Random Forest, e superiores aos metodos comparados.  CONCLUSOES: Os resultados indicaram uma alta distincao entre as classes de RNA devido a filtragem das arestas exclusivas. A aplicacao e estudo mais aprofundado deste metodo pode levar a um melhor entendimento do RNA nao codificante.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []