Uma metodologia para seleção de parâmetros em modelos de classificação de proteínas.

2006 
Os principais desafios relacionados ao problema de classificacao de enzimas em banco de dados de estruturas de proteinas sao: 1) o ruido presente nos dados; 2) o grande numero de variaveis; 3) o numero nao-balanceado de membros por classe. Para abordar esses desafios, apresenta-se uma metodologia para selecao de parâmetros, que combina recursos de matematica (ex: Transformada Discreta do Cosseno) e da estatistica (ex:.g., correlacao de variaveis e amostragem com reposicao). A metodologia foi validada considerando-se os tres principais metodos de classificacao da literatura, a saber; arvore de decisao, classificacao Bayesiana e redes neurais. Os experimentos demonstram que essa metodologia e simples, eficiente e alcanca resultados semelhantes aqueles obtidos pelas principais tecnicas para selecao de parâmetros na literatura.Termos para indexacao classificacao de enzimas,predicao de funcao de proteinas, estruturas de proteinas, banco de dados de proteinas, selecao de parâmetros, metodos para classsificacao de dados.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []