Análisis semántico latente para la detección de noticias falsas sobre COVID-19 utilizando computación heterogénea

2021 
La deteccion de noticias falsas hoy en dia es un gran reto para los sistemas de prediccion debido a la gran cantidad de informacion que se tiene actualmente, en especial, en fuentes de informacion como las redes sociales, blogs o sitios de web. En adicion, la capacidad de procesamiento que se requiere para analizar grandes cantidades de datos es muy grande por lo que el tiempo de ejecucion tiende a ser alto. En este articulo se propone un sistema de aprendizaje utilizando paradigmas de procesamiento en paralelo a nivel de CPU y GPU usando el dataset COVID-19 Open Research Dataset Challenge (CORD-19) para un primer enfoque a la deteccion de noticias falsas sobre COVID-19. El sistema de prediccion esta basado en tecnicas de procesamiento de lenguaje natural utilizando como modelo de entrenamiento el analisis semantico latente o LSA, por sus siglas en ingles. Tambien, se utilizan tecnicas de multiprocesamiento a nivel de CPU para el preprocesamiento de texto, obtencion de terminos o palabras claves, obtencion de matriz termino por documento, normalizacion de valores utilizando TF-IDF y obtencion de la similitud de coseno, mientras que para la parte de reduccion de la dimensionalidad utilizando la descomposicion de valores singulares o SVD, por sus siglas en ingles se ha utilizado la arquitectura de CUDA para el procesamiento a nivel de la GPU.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []