Análisis de rendimiento de algoritmos de resolución de problemas de matrices dispersas para GP-GPU Computing mediante el uso de profiling de hardware

2015 
Las arquitecturas many-core proveen un gran potencial, para la optimizacion de algoritmos cientificos gracias a su alto nivel de paralelismo y simplicidad. En este caso particular se utilizara programacion de procesamiento general para clusters de computadoras con placas GPU . Primeramente, el proyecto se enfoca en el analisis de matrices dispersas, donde la mayor parte de los datos que contiene, no son relevantes al calculo final deseado. Por lo tanto, utilizando ciertas tecnicas de representacion en las matrices, se puede evitar realizar operaciones sobre datos a los cuales se les puede determinar su resultado a priori. En la segunda etapa, se utilizan y analizan implementaciones de biblioteca que aprovechen diferentes sistemas de representacion de estas matrices, buscando realizar las optimizaciones oportunas de ser posible, siendo necesario realizar pruebas en las dos tecnologias de GPU mas reconocidas buscando identificar posibles deficiencias en la implementacion de cada solucion. Finalmente mediante contadores de hardware se analizan en forma precisa, si las optimizaciones a realizar, y las ya realizadas, realmente producen una diferencia apreciable en los tiempos de ejecucion y uso de recursos de las bibliotecas. En este articulo se presentan las tres etapas que componen este proyecto de investigacion.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    3
    References
    0
    Citations
    NaN
    KQI
    []