Algoritme Clustering Large Application (CLARA) untuk MenanganiData Outlier

Main Article Content

Pravasta Rama Fitrayana
Dewi Retno Sari Saputro

Abstract

Clustering merupakan salah satu metode pengelompokkan dalam data mining. Clustering mengelompokkan objek yang mempunyai kesamaan kedalam satu cluster. Outlier merupakan objek yang memiliki nilai menyimpang jauh dengan objek-objek lainnya sehingga terlihat tidak mengikuti pola dari sebagian besar objek. Padaclustering terdapat dua metode pendekatan yang dapat digunakan yaitu pendekatan non-hierarki (partisi) dan pendekatan hierarki. K-Medoids atau algoritme Partitioning Around Medoid (PAM) merupakan algoritme dari pendekatan partisi yang digunakan untuk pengelompokkan data yang mengandung outlier.Algoritme PAM menggunakan median (medoid) sebagai pusatcluster, sehingga tidak terpengaruh oleh adanya outlier. Algoritme PAM hanya dapat digunakan untuk pengelompokkan data berskala kecil dan perhitungan jarak antara objek terhadap pusat cluster menggunakan jarak euclidean, namun hasil perhitungan jaraknya dapat terpengaruh adanya outlier.Algoritme Clustering Large Application (CLARA) merupakan algoritme untuk mengelompokkan data berskala besar yang mengandung outlier menggunakan teknik pengambilan sampelkemudian menerapkan algoritme PAMdengan perhitungan jarak antara objek terhadap pusat clustermenggunakan jarak manhattan. Pada penelitian ini dilakukan kajian ulang terhadap algoritme CLARA dari aspek kompleksitas dan perhitungan jarak yang digunakan. Hasil menunjukkan bahwa algoritme CLARA dengan jarak manhattan lebih efisien dan akurat dalam mengelompokkan data berskala besar yang mengandung outlier.

Article Details

How to Cite
Fitrayana, P., & Saputro, D. (2022). Algoritme Clustering Large Application (CLARA) untuk MenanganiData Outlier. PRISMA, Prosiding Seminar Nasional Matematika, 5, 721-725. Retrieved from https://journal.unnes.ac.id/sju/prisma/article/view/54585
Section
Articles

References

Barnett, V., & Lewis, T. (1994). Outliers in Statistical Data. John Wiley & Sons.
Chu, S.-C., Roddick, J. F., & Pan, J. S. (2002). Efficient K-Medoids Algorithms Using Multi-Centroids With Multi-Runs Sampling Scheme. In Workshop on Mining Data for CRM (pp. 14–25).
Hair, J., Black, W., Babin, B., & Anderson, R. (2014). Pearson New International Edition. Multivariate Data Analysis. Pearson Education Limited Harlow.
Halkidi, M., Batistakis, Y., & Vazirgiannis, M. (2001). On Clustering Validation Techniques. Journal of Intelligent Information Systems, 17(2), 107–145. https://doi.org/10.1007/978-3-642-48618-0_7
Han, J., & Kamber, M. (2012). Data Mining: Concepts and Techniques. Morgan Kaufmann Publisher.
Johson, R., & Wichern, D. (2014). Applied Multivariate Statistical Analysis. Pearson.
Kaufmaan, L., & Rousseeuw, P. (2009). Finding Groups in Data : an Introduction to Cluster Analysis (Vol. 148). John Wiley & Sons.
Lailiyah, S., & Hafiyusholeh, M. (2016). Perbandingan Antara Metode K-Means Clustering Dengan Gath-Geva Clustering. Jurnal Matematika “MANTIK,”1(2), 26–37. https://doi.org/10.15642/mantik.2016.1.2.26-37
Mohibullah, M., Hossain, M. Z., & Hasan, M. (2015). Comparison of Euclidean Distance Function and Manhattan Distance Function Using K-Mediods. International Journal of Computer Science and Information Security (IJCSIS), 13(10), 61–71.
Nyoman, N., & Smrti, E. (2015). Otomatisasi Klasifikasi Buku Perpustakaan Dengan Menggabungkan Metode K-Nn Dengan K-Medoids. Lontar Komputer : Jurnal Ilmiah Teknologi Informasi, 4(1), 201–214.
Sagvekar, V., Sagvekar, V., & Deorukhkar, K. (2013). Performance assessment of CLARANS: A Method for Clustering Objects for Spatial Data Mining. Global Journal of Engineering, Design & Technology/Global Institute for Reserach & Education, 2(6), 1–8. http://gifre.org/library/upload/volume/1-8-vol-2-6-13-gjedt.pdf
Tan, P. N., Steinbach, M., & Kumar, V. (2016). Introduction to Data Mining. Pearson Education.
Taruna R, S., & Hiranwal, S. (2013). Enhanced Naïve Bayes Algorithm for Intrusion Detection in Data Mining. International Journal of Computer Science and Information Technologies (IJCSIT), 4(6), 960–962.
Utami, D. S., & Saputro, D. R. S. (2018). Pengelompokkan Data yang Memuat Pencilan dengan Kriteria Elbow dan Koefisien Silhouette (Algoritme K-Medoid). Konferensi Nasional Penelitian Matematika Dan Pembelajaran (KNPMP) III, 448–456.