Artigo - Open Access.

Idioma principal

UM ESTUDO DA APLICAÇÃO DE TÉCNICAS DE COMBINAÇÃO DE AGRUPAMENTOS

Fadel, Augusto César ; Semaan, Gustavo da Silva ; Brito, José André de Moura ;

Artigo:

A combinação de agrupamentos é um método altamente promissor para melhorar a qualidade de soluções de agrupamento, combinando diferentes partições (soluções) em uma única partição consenso. Nesse sentido, o presente estudo considera a aplicação desse método para dados do Censo Demográfico 2010, Produto Interno Bruto dos municípios brasileiros em 2010 e Índice de Desenvolvimento Humano dos municípios brasileiros em 2010. Além desses, foram consideradas algumas instâncias tradicionais da literatura de agrupamentos, cujos grupos foram construídos a partir da aplicação dos algoritmos k-means, PAM e DBSCAN. As soluções obtidas foram validadas mediante a aplicação do índice silhueta e submetidas a um comitê de agrupamento, com função consenso baseada em coassociação. A partir da aplicação dessa função, foi possível produzir uma solução consenso, cuja similaridade com as partições base foi quantificada através da informação mútua normalizada, o índice mais utilizado na literatura para esse fim.

Artigo:

The clustering ensembles is a very promising method to improve the quality of clustering solutions, combining different partitions in a single consensus partition. In this sense, this study consider the appliance of this method to data from the 2010 Brazilian census, 2010 Brazilian cities Gross Product and 2013 Brazilian cities Human Development Index. Besides these, some instances from the clustering literature were considered, whose clusters were constructed by the appliance of the algorithms k-means, PAM and DBSCAN. The obtained solutions were validated by a silhouette index criteria and were submitted to a cluster ensemble method with consensus function based on coassociation. Applying this function, it was possible to produce a consensus solution, whose similarity with the partitions was measured by the Normalized Mutual Information, the most commonly used index for this purpose in the literature.

Palavras-chave: Agrupamento, Combinação de agrupamento, Algoritmo, Particional, Densidade, K-means, PAM, DBSCAN, Cluster,

Palavras-chave:

DOI: 10.5151/marine-spolm2014-126207

Referências bibliográficas
  • [1] Gordon, A.; Vichi, M. Fuzzy Partition Models for Fittind a Set of Partitions. Psychometrika, vol. 66, 200
  • [2] Han, J.; Kamber, M.; Pei, J. Data Mining: Concepts and Techniques. 3. ed. Morgan Kaufmann Publishers, 201 ISBN 978-0-12-381479-1.
  • [3] Hee, Y. E. Speeding up performance with multicore programming [Internet]. National University of Singapore, Computer Centre; [citado em 11 de abr. de 2013]. Disponível em: Andlt;http://comcen.nus.edu.sg/technus/hpc/speeding-up-performance-with-multicore-programming/Andgt;. Acesso em: 13 de nov. 201
  • [4] Kaufman, L.; Rousseeuw, P. J. Clustering Large Data Sets. E. S. Gelsema and L. N. Kanal (Eds.), Pattern Recognition in Pratice 2, 1986.
  • [5] Naldi, M. C. Técnicas de Combinação para Agrupamento Centralizado e Distribuído de Dados. Tese (Doutorado). São Carlos: USP, 2011.
  • [6] Retzer, J.; Shan, M. Cluster Ensemble Analysis and Graphical Depiction of Cluster Partitions. Proceedings of the 2007 Sawtooth Software Conference. Sequim WA, 2007.
  • [7] Rousseeuw, P. J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, vol. 20, 198
  • [8] Semaan, G. et al. Proposta de um método de classificação baseado em densidade para a determinação do número ideal de grupos em problemas de clusterização. Learning Andamp;
  • [9] Nonlinear Models (LAndamp;NLM), vol. 10, n. 4, 2012.
Como citar:

Fadel, Augusto César; Semaan, Gustavo da Silva; Brito, José André de Moura; "UM ESTUDO DA APLICAÇÃO DE TÉCNICAS DE COMBINAÇÃO DE AGRUPAMENTOS", p. 188-200 . In: Anais do XVII Simpósio de Pesquisa Operacional e Logística da Marinha - SPOLM 2014. São Paulo: Blucher, 2014.
ISSN 2175-6295, ISBN: 2175-6295
DOI 10.5151/marine-spolm2014-126207

últimos 30 dias | último ano | desde a publicação


downloads


visualizações


indexações