Clustering Data Campuran Numerik Dan Kategorik Menggunakan Algoritme K-Prototype
Main Article Content
Abstract
Terdapat berbagai teknik dalam data mining dimana setiap teknik memiliki hasil yang berbeda, yaitu klasifikasi, asosiasi, clustering, prediksi, estimasi dan analisis deviasi. Clustering merupakan proses yang digunakan untuk mengelompokkan objek dalam dataset sehingga objek yang mempunyai kemiripan ditempatkan pada cluster yang sama. Ukuran kemiripan antar objek satu dengan objek lainnya diketahui dari ukuran jarak. Semakin kecil ukuran jarak, semakin kecil perbedaan antar objek satu dengan objek lainnya. Metode elbow merupakan metode untuk menentukan jumlah cluster optimal yang diperoleh dengan melihat presentase hasil perbandingan antara jumlah cluster yang akan membentuk siku pada suatu titik. Pada umumnya proses clustering hanya untuk data numerik atau kategorik saja, akan tetapi kerap kali ditemui kasus data campuran numerik dan kategorik. Algoritme K-Means merupakan salah satu metode clustering konvensional yang efisien untuk data yang berukuran besar, tetapi tidak untuk data kategorikal. Algoritme K-Prototype merupakan pengembangan dari algoritme K-Means yang dapat menangani data yang bertipe campuran numerik dan katagorik. Tujuan dari penelitian ini untuk mengkaji algoritme K-Prototype dengan inisialisasi menggunakan metode elbow dalam menentukan jumlah cluster. Hasil penelitian menunjukkan bahwa metode elbow dapat digunakan untuk menentukan jumlah cluster optimal yang selanjutnya digunakan pada algoritme K-Prototype.
Article Details
References
Amalia, D., dan Sumargo, B., Pengelompokan Pengguna Internet Dengan Metode K-Means Clustering, Journal Statistic dan Aplikasinya, 3(1), 2620-8369, 2019
Bhatia, S. K., dan Louis, S., Adaptive K-Means Clustering, 2004.
Gates, A. J., and Ahn, Y. Y., The Impact of Random Models on Clustering Similarity, Journal of Machine Learning Research, 18, 1-28, 2017.
Han and Kamber. Data Mining: Concepts and TechniquesI, 2nd ed., 2006.
Hartanti, N., Metode Elbow dan –Means Guna Menguukur Kesiapan Siswa SMK Dalam Ujian Nasional. Jurnal Nasional Teknologi dan Sistem Informasi, 2(6), 82-89, 2020.
Iriawan, N., Fithriasari, K., Ulama, B. S. S., Suryaningtyas, W., Susanto, I., and Pravitasari, A. A., Ensemble Fuzzy, K-Prototypes Density Peaks Clustering Mixed) pada Pengelompokan Data Pelamar Bidikmisi Sejawa-Timur Tahun 2016-2017., Jurnal Ilmu Komputer Dan Informasi, 11(2), 67, 2018.
Irwansyah, E., & Faisal, M. (2015). Advanced Clustering: Teori dan Aplikasi. DeePublish.
Kumara, I. N. S, Optimasi Pusat Cluster K-Prototype Dengan Algoritme Genetika, Majalah Ilmiah Teknik Elektro, 13(2), 201.
Nooraeni, R., Tinggi, S., dan Statistik, I., Metode Cluster Menggunakan Kombinasi Algoritma Cluster K-Prototype Dan Algoritma Genetika Untuk Data Bertipe Campuran Cluster, Jurnal Aplikasi Statistika Komputasi Statistik, 7(2), 17-17, 2015.
Xu, J., and Lange, K., Power K-Means Clustering, 36th International Conference on Machine Learning, ICML 2019, 2019-June, 11977-11991, 2019.
Yunita, F., Enerapan Data Mining Menggunkan Algoritma K-Means Clustering Pada Penerimaan Mahasiswa Baru, Sistemasi, 7(3), 238, 2018.