K-Nearset Neighbor (K-NN) dan Support Vector Machine (SVM) untuk Klasifikasi Indeks Pembangunan Manusia Provinsi Jawa Tengah

F Fauzi(1),


(1) Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Muhammadiyah Semarang, Indonesia

Abstract

Indeks pembangunan manusia (IPM) adalah salah satu alat ukur pencapaian kualitas hidup satu wilayah bahkan negara. Terdapat  3 komponen dasar peyusun IPM yaitu dimensi kesehatan, pengetahuan, dan hidup layak. IPM menurut BPS dibagi menjadi 4 kategori yaitu IPM rendah (IPM<60), sedang (60≤IPM<70), tinggi (70≤IPM<80), dan sangat tinggi (≥80). Salah satu metode klasifikasi yang terdapat dalam data mining dan sering digunakan serta menghasilkan akurasi yang cukup baik adalah metode k-Nearset Neighbor (k-NN) dan Suppport Vector Machine(SVM). Tujuan penelitian ini adalah membandingkan akurasi kaslifikasi antara kedua metode tersebut. Diperoleh hasil klasifikasi IPM dengan menggunakan metode k-NN dengan nilai k sebesar 5 didapat akutasi klasifikasi sebesar 91.64%. Klasifikasi IPM menggunakan metode SVM dengan parameter gamma 1 dan C= 1, 10, dan 100 menghasilkan akurasi sebesar 95.36%. Metode yang tepat untuk pengklasikfikasian atau pengelompokan IPM adalah metode SVM dengan ketepatan klasifikasi mencapai 95.36%, dengan variabel Harapan Lama Sekolah (HLS) merupakan faktor paling besar mempengaruhi IPM.  

Human development index (HDI) is one of the measuring instruments of achieving the quality of life of one region and even the state. There are 3 basic components of IPM that is the dimensions of health, knowledge, and decent living. HDI according to BPS is divided into 4 categories: low HDI (HDI <60), moderate (60≤IPM <70), high (70≤IPM <80), and very high (≥80). One of the classification methods contained in data mining and is often used and produces a fairly good accuracy is the k-Nearset Neighbor (k-NN) and Suppport Vector Machine (SVM) methods. The purpose of this study was to compare the accuracy of casclification between the two methods. Obtained by result of classification of IPM by using k-NN method with value k equal to 5 obtained classification akutasi equal to 91.64%. IPM classification using SVM method with parameter gamma 1 and C = 1, 10, and 100 yield accuracy of 95.36%. The appropriate method for clarifying or grouping HDI is the SVM method with classification accuracy of 95.36%, with Hours Expectancy (HLS) variable being the biggest factor influencing HDI.

Keywords

Human Development Index, Data Mining, k-Nearest Neighbor, Support Vector Machine, Accuracy

Full Text:

PDF

References

BPS. 2014. Indeks Pembangunan Manusia Metode Baru. Jakarta:BPS.

-----. 2015. Jawa Tengah dalam Angka 2015. Semarang:BPS Jawa Tengah.

-----. 2014. Jawa Tengah dalam Angka 2015. Semarang:BPS Jawa Tengah.

Bramer M. 2007. Principles of Data Mining. London:Springer.

Gorunescu F. 2011. Data Mining: Concepts, Models, and Techniques. Verlag Berlin Heidelberg: Springer.

Gunn S. 1998. Support Vector Machine for Clasification and Regression. Sputhhampton: University of Southaton.

Larose DT. 2005. Discovering Knowladge in Data. New Jersey: John Willey & Sons, Inc.

Leidiyana H. 2013. Penerapan Algoritma K-Nearest Neighbor Untuk Penentuan Resiko Kredit Kepemilikan Kendaraan Bemotor. Jurnal PIKSEL (Jurnal Penelitian Ilmu Komputer, System Embedded & Logic) 1(1): 65-76. [http://www.ejournal-unisma.net/ojs/index.php/piksel/article/view/775]

Novianti FA & Purnami SW. 2012. Analisis Diagnosis Pasien Kanker Payudara Menggunakan Regresi Logistik dan Support Vector Machine (SVM) Berdasarkan Hasil Mamografi. Jurnal Sains dan Seni ITS 1(1): D147-D152 [http://www.ejurnal.its.ac.id/index.php/sains_seni/article/view/1937]

Nugroho AS, Witarto AB & Handoko D. 2003. Support Vector Machine - Teori dan Aplikasinya dalam Bioinformatika. IlmuKomputer.Com

[http://asnugroho.net/papers/ikcsvm.pdf]

Pramudiono I. 2007. Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data (Online). (http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-datamining.zip) [diakses tanggal 16 April 2017].

Prasetyo E. 2012. Data Mining Konserp dan Aplikasi Menggunakan MATLAB. Yogyakarta: Andi.

Vapnik. 1995. The Natural of Statistical Learning Thoery. New York:Springer.

Wu X & Kumar V. 2009. The Top Ten Algorithms in Data Mining. (Wu X & Kumar V, Ed.). USA: Taylor & Francis Group.

Refbacks

  • There are currently no refbacks.




Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.