STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Hugo Ordoñez Eraso,Carlos Alberto Cobos-Lozada

STEMMING EN ESPAÑOL PARA DOCUMENTOS RECUPERADOS DE LA WEB

2014

La recuperacion de informacion en internet, hoy en dia se ha convertido en una importante area de investigacion, debido al crecimiento acelerado de las fuentes de informacion que en la web se encuentran. La investigacion en este campo se ha centrado en crear mecanismos, metodos y herramientas como los algoritmos de stemming y los meta-buscadores, que optimizan la precision en este tipo de tareas, mejorando asi los resultados retornados al usuario que utiliza el sistema. En este articulo se presenta y describe a nivel general, los componentes de un algoritmo denominado Filtro Espanol, que permite realizar stemming a documentos escritos en espanol en un sistema de busqueda web. Este se disena, con el fin de ampliar automaticamente la busqueda a todas las variaciones morfologicas de las palabras digitadas por los usuarios en las consultas y el contenido de los documentos. Para validar la eficiencia del analizador, se realizo un calculo de similitud entre los documentos, aplicando el metodo de n-gramas. La evaluacion contempla la precision del filtro donde los resultados de la primera valoracion son interesantes.

Keywords:

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations