Desarrollo de un sistema para medir similitud entre clases

2015 
Resumen. El incremento continuo de informacion en formato digital obliga a contar con nuevos metodos y tecnicas para acceder, recopilar y organizar estos volumenes de informacion textual. Una de las tecnicas mas utilizadas para organizar dicha informacion es la clasificacion de documentos. Los sistemas de clasificacion automatica de textos tienen una baja eficiencia cuando las clases son muy parecidas, y en este caso es muy importante el poder identificar aquellos atributos que nos permiten separar una clase de otra. En este trabajo se presenta un sistema para generar graficas de similitud entre documentos pertenecientes a clases de un corpus dado, tarea previa al proceso de clasificacion automatica. Estas graficas son utilizadas como un metodo de refinamiento auxiliandose de las similitudes entre los documentos no clasificados. Con esto se busca poder anticipar el desempeno de un metodo de clasificacion automatica. Los resultados obtenidos permiten ver la viabilidad de la metodologia propuesta.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    6
    References
    0
    Citations
    NaN
    KQI
    []