KLASIFIKASI TINGKAT KESEJAHTERAAN KELUARGA PROVINSI JAWA TENGAH TAHUN 2015 MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL DAN SUPPORT VECTOR MACHINE
Abstract
Tahapan keluarga sejahtera dibagi menjadi 3 kategori, untuk menentukan kategori yang cocok dari data yang kombinasinya rumit dapat menggunakan teknik klasifikasi. Tujuan dari penelitian ini adalah untuk mengetahui metode yang memberikan ketepatan hasil klasifikasi yang lebih baik antara Regresi Logistik Ordinal dan Support Vector Machine (SVM). Data yang digunakan adalah data tingkat kesejahteraan keluarga Jawa Tengah yang diperoleh dari hasil survei Pendataan Keluarga (PK) 2015 oleh BKKBN Provinsi Jawa Tengah, sejumlah 322 data keluarga dan dibagi menjadi data training 80% sejumlah 259 dan data testing 20% sejumlah 64. Metode Regresi Logistik Ordinal dilakukan dengan estimasi data training untuk menentukan model logit awal, uji signifikansi menggunakan uji rasio Likelihood dan uji Wald, model logit yang signifikan digunakan untuk mengklasifikasi data testing. Metode SVM dilakukan dengan memodelkan data training menggunakan fungsi kernel Linear, Polynomial, dan Gaussian RBF, fungsi kernel terbaik digunakan untuk mengklasifikasi data testing. Hasil analisis metode Regresi Logistik Ordinal diperoleh nilai ketepatan klasifikasi sebesar 81,25%. Metode SVM dengan kernel Linear sebagai fungsi kernel terbaik menghasilkan nilai ketepatan klasifikasi sebesar 95,31% . Artinya metode SVM melakukan klasifikasi lebih baik jika dibandingkan dengan klasifikasi metode Regresi Logistk Ordinal. Sehingga untuk penelitian mengenai klasifikasi selanjutnya disarankan menggunakan metode SVM.
Stages of a prosperous family is divided into three categories, to determine the appropriate category of complicated combinations of data can use classification techniques. The purpose of this study was to determine the accuracy of the method provides a better classification between Ordinal Logistic Regression and Support Vector Machine (SVM). The data used is the data rate of the family welfare in Central Java were obtained from the survey of Family Data Collection (PK) in 2015 by BKKBN of Central Java province, some 322 family data and is divided into a number of training data 80% 259 20% testing data and number 64. Regression Methods Ordinal logistic done with the estimated training data to determine initial logit model, the significance test using the likelihood ratio test and Wald test, significant logit models were used to classify the data testing. SVM method is done by modeling the training data using Linear kernel function, polynomial, and Gaussian RBF, the kernel function is best used to classify the data testing. The results of the analysis method Ordinal Logistic Regression values obtained classification accuracy of 81.25%. Linear SVM method with the kernel as the kernel function best yield value of classification accuracy of 95.31%. This means SVM classification method is better than the classification Logistk Ordinal Regression method. So to study further recommended the classification using SVM method.