Distance-based clustering methods for large datasets
2018
Este trabalho apresenta uma metodologia direcionada a problemas de agrupamentos com grandes volumes de dados. O objetivo ´e projetar algoritmos que tenham a capacidade de processar grandes volumes de dados sem a perda de qualidade do agrupamento. Dois novos m´etodos de agrupamento sao propostos. O primeiro ´e o m´etodo de agrupamento GPIC, que realiza tanto o c´alculo da matriz de afinidades quanto dos autovetores com o aux´lio de Unidades de Processamento Gr´afico GPUs, do ingles Graphics Processing Unit. O segundo m´etodo, denominado bdrFCM, reduz o volume de dados utilizando como princ´pio b´asico a borda dos agrupamentos resultantes. Resultados encontrados com bases de dados sint´eticas e reais demonstram que as abordagens propostas por este trabalho conseguem processar grande quantidade de dados em tempo menor e reduzir o volume de dados, mantendo a qualidade do agrupamento
Keywords:
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI