Distance-based clustering methods for large datasets

2018 
Este trabalho apresenta uma metodologia direcionada a problemas de agrupamentos com grandes volumes de dados. O objetivo ´e projetar algoritmos que tenham a capacidade de processar grandes volumes de dados sem a perda de qualidade do agrupamento. Dois novos m´etodos de agrupamento sao propostos. O primeiro ´e o m´etodo de agrupamento GPIC, que realiza tanto o c´alculo da matriz de afinidades quanto dos autovetores com o aux´lio de Unidades de Processamento Gr´afico GPUs, do ingles Graphics Processing Unit. O segundo m´etodo, denominado bdrFCM, reduz o volume de dados utilizando como princ´pio b´asico a borda dos agrupamentos resultantes. Resultados encontrados com bases de dados sint´eticas e reais demonstram que as abordagens propostas por este trabalho conseguem processar grande quantidade de dados em tempo menor e reduzir o volume de dados, mantendo a qualidade do agrupamento
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []