Preprocesamiento de un corpus empleando corrección probabilística para precisar el vocabulario

2015 
Resumen. La Organizacion Internacional del Trabajo estimo que en el 2012 existian 20.9 millones de victimas de explotacion laboral y sexual forzada en el mundo. Mexico ocupa el tercer lugar en trata de personas en America Latina y el Caribe. Particularmente, Puebla se encuentra entre los estados donde hay mayor vinculacion de desaparicion de mujeres y ninas con la trata y feminicidio. Ante esta situacion estamos interesados en desarrollar herramientas que puedan ser utilizadas por padres y autoridades para la prevencion de delitos ligados a trata de personas por Internet. El presente trabajo representa uno de los primeros pasos en esta direccion, se explora el preprocesamiento de un corpus de chats con contenido sexual empleando correccion probabiĺistica, mediante teorema de Bayes. Para medir los efectos del procesamiento realizado, se trabajo en el agrupamiento de los documentos mencionados, empleando mapas auto-organizados. Los resultados obtenidos muestran que el procesamiento realizado mejora la efectividad del agrupamiento.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    5
    References
    0
    Citations
    NaN
    KQI
    []