Algoritme Quick RObust Clustering using linKs (QROCK) untuk Clustering Data Kategorik
Main Article Content
Abstract
Data mining adalah proses ekstraksi dari suatu informasi pengetahuan atau pola yang bersifat penting dan bermanfaat dalam suatu basis data yang memiliki ukuran besar dan merupakan bagian integral dari Knowledge Discovery in Databases (KDD). Clustering merupakan salah satu proses data mining yang digunakan untuk melihat pola pendistribusian data yang akan digunakan sesuai dengan karakteristik data. Metode clustering hirarki dan non hirarki dikatakan tidak cocok digunakan untuk data kategorik sehingga dikembangkan Metode RObust Clustering using linKs (ROCK) dan berikutnya Quick ROCK. ROCK, metode yang di dalamnya membangun link untuk menggabungkan cluster-cluster-nya dan memiliki robustness yang baik sehingga dapat mengelompokkan data secara efektif. Sementara QROCK menghitung cluster dengan menentukan komponen yang terhubung dari grafik, diduga hal ini lebih efisien untuk mendapatkan cluster yang memberikan pengurangan waktu komputasi dibandingkan algoritme ROCK. Tujuan penelitian ini untuk mengkaji algoritme QROCK dari aspek akurasi dan efisiensinya. Hasil menunjukkan bahwa Quick RObust Clustering using linKs (QROCK) lebih efisien dan lebih akurat karena dapat mendeteksi outlier pada data kategorik.
Article Details
References
Alamsyah, M. (2006). Pengelompokan Data Kategorik Dengan Algoritma QROCK (Doctoral Dissertation). Universitas Airlangga.
Agresti, A. (1990). Categorical Data Analysis. John Willey & Sons Inc. New York.
Ariawan, P. A. (2019). Optimasi Pengelompokkan Data Pada Metode K-Means dengan Analisis Outlier. Jurnal Nasional Teknologi dan Sistem Informasi, 5(2), 88-95.
Chatfield, C., & Collins, A. J (2013). Introduction to multivariate analysis. Springer.
Dewangan, R. R., Sharma, L. K., & Akasapu, A. K. (2010). Fuzzy Clustering Technique for Numerical and Categorical dataset. International Journal on Computer Science and Engineering (IJCSE), NCICT Special Issue, 75-80.
Dutta, M., Mahanta, A. K., & Pujari, A. K. (2005). QROCK: A quick version of the ROCK algorithm for clustering of categorical data. Pattern Recognition Letters, 26(15), 2364-2373.
Goharian, N., & Grossman, D. (2003). Introduction to Data Mining. (Online). (http://www.ir.iit.edu/~nazli/cs422/CS422-Slides/DMintroduction.pdf, diakses 8 Oktober 2020).
Guha, S., Rastogi, R., & Shim, K. (2000). ROCK: A robust clustering algorithm for categorical attributes. Information systems, 25(5), 345-366.
Guha, S. (1999). ROCK: A clustering algorithm for categorical attributes. In 15th Int. Conf. on IEEE Data Engineering. Sydney, Australia, 1999.
Han, J., Kamber, M., & Pei, J. (2011). Data mining concepts and techniques third edition. The Morgan Kaufmann Series in Data Management Systems, 83-124.
He, Z., Xu, X., & Deng, S. (2005). Clustering mixed numeric and categorical data: A cluster ensemble approach. arXiv preprint cs/0509011.
Johnson, R. A., & Wichern, D. W. (2002). Applied multivariate statistical analysis (Vol. 5, No. 8). Upper Saddle River, NJ: Prentice hall.
Kantardzic, M. (2011). Data Mining: Conceptss, Models, methods and Algorithms. John Wiley & Sons.
Kusrini, E. T. E., & Luthfi. (2009). Algoritma Data Mining.
Mujiasih, S. (2011). Pemanfatan Data Mining Untuk Prakiraan Cuaca. Jurnal Meteorologi dan Geofisika, 12(2).