Similaridade entre sequências genômicas aplicada na inferência de redes de regulação gênicas
2020
Este trabalho tem como intuito a producao de um metodo eficaz para a classificacao de sequencias de RNA, e determinar se sao codificantes ou nao-codificantes. O algoritmo facilita a analise destes dados geralmente brutos e em enorme quantidade.METODOS: Para cada sequencia de RNA foi gerado grafo com base em 2 parâmetros: passo e tamanho da palavra. Apos a producao dos grafos, e realizada uma filtragem das arestas mais exclusivas de cada classe, e assim abstrair medidas que descrevem a rede e partir dessas medidas foram feitas as classificacoes com o algoritmos Random Forest. RESULTADOS: Apos aplicado a metodologia deste trabalho, os resultados finais foram muito positivos, com media de 99,78% de acerto para o classificador Random Forest, e superiores aos metodos comparados. CONCLUSOES: Os resultados indicaram uma alta distincao entre as classes de RNA devido a filtragem das arestas exclusivas. A aplicacao e estudo mais aprofundado deste metodo pode levar a um melhor entendimento do RNA nao codificante.
Keywords:
- Correction
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI