Klasifikasi dengan Pohon Keputusan Berbasis Algoritme C5.0 untuk Atribut Kontinu dan Diskrit

Main Article Content

Afif Zakiy Abdullah
Dewi Retno Sari Saputro
Bowo Winarno

Abstract

Data mining merupakan proses semi automatis yang menggunakan teknik statistik, matematika, keceradan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan yang potensial dan bermanfaat yang tersimpan dalam database. Klasi
kasi dengan pohon keputusan merupakan salah satu teknik data mining. Pohon keputusan adalah struktur flowchart yang menyerupai tree (pohon), dimana setiap node internal menandakan suatu tes pada atribut dan setiap cabang merepresentasikan hasil tes, dan node daun merepresentasikan kelas-kelas. Alur pada pohon keputusan ditelusuri dari node akar ke node daun yang memegang prediksi kelas. Pohon keputusan terdiri dari node yang membentuk pohon yang berakar, semua node memiliki satu masukan. Node yang keluar disebut node tes. Node yang lain disebut node keputusan atau sering disebut node daun. Setiap node internal membagi dua atau lebih sub-ruang sesuai dengan kategori atribut dan akan dipartisi sesuai dengan nilai kategori kasus. Kasus-kasus tersebut membentuk pohon keputusan, yang menghasilkan problem solving. Dalam menentukan pohon keputusan ada beberapa algoritme salah satunya adalah algoritme C5.0. Pohon keputusan berbasis algoritme C5.0 merupakan penyempurnaan dari algoritme ID3 dan C4.5. Algortime C5.0 dapat menangani atribut kontinu dan diskrit yang tidak dapat ditangani oleh algoritme ID3. Pada penelitian dilakukan kajian klasifikasi dengan pohon keputusan berbasis algoritme C5.0.

Article Details

How to Cite
Abdullah, A. Z., Saputro, D. R. S., & Winarno, B. (2020). Klasifikasi dengan Pohon Keputusan Berbasis Algoritme C5.0 untuk Atribut Kontinu dan Diskrit. PRISMA, Prosiding Seminar Nasional Matematika, 3, 72-76. Retrieved from https://journal.unnes.ac.id/sju/prisma/article/view/37651
Section
Articles

References

Bujlow, T., Riaz, T., & Pedersen, J. M. (2012). A Method for Classification of Network Traffic Based on C5.0 Machine Learning Algorithm. In Proceeding of ICNC’12: 2012 International Conference on Computing, Networking and Comminocations (ICNC): Workshop on Computing, Networking and Communications (pp. 244-248). Hawaii, USA.
Galathiya, A. S., Ganatrand, A. P., & Bhensdadia, C. K. (2012). Improved Decision Tree Induction Algorithm with Feature Selection, Cross Validation, Model Complexity and Reduced Error Pruning. International Journal of Computer Science and Information Technologies, 3(2), 3427-3431.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques Third Edition. Morgan Kaufmann. Massachusetts (US).
Hou, S., Hou, R., Shi, X., Wang, J., & Yuan, C. (2014). Research on C5.0 Algorithm Improvement and the Test in Lightning Disaster Statistics. International Journal of Control and Automation, 7(1), 181-190.
Hutabarat, C. (2018). Penerapan Data Mining untuk Memprediksi Permintaan Produk Kartu Perdana Internet Menggunakan Algoritma C5.0 (Studi Kasus: Vidha Ponsel). Jurnal Pelita Informatika, 17(2), 168-173.
Kashyap, G., & Chauhan, E. (2016). Parametric Comparisons of Classification Techniques in Data Mining Applications. International Journal of Engineering Development and Research, 4(2), 1117-1123.
Kusrini & Luthfi, E. T. (2009). Algoritma Data Mining. ANDI. Yogyakarta.
Larose, D. T. (2005). Discovery Knowledge in Data: an Introduction to Data Mining. John Willey & Sons, Inc. Hoboken, New Jersey.
Pandya, R., & Pandya, J. (2015). C5.0 Algorithm to Improved Decision Tree with Feature Selection and Reduced Error Pruning. International Journal of Computer Applications, 117(16), 18-21.
Quinlan, J. R. (1986). Induction of Decision Trees. Kluwer Academic Publishers, Boston.
Quinlan, J. R. (1993). C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers. San Mateo, California.
Rani, M. S., & Xavier, S. B. (2015). A Hybrid Intrusion Detection System Based on C5.0 Decision Tree and One-Class SVM. International Journal of Current Engineering and Technology, 5(3), 2001-2007.
Revathy, R., & Lawrance, R. (2017). Comparative Analysis of C4.5 and C5.0 Algorithms on Crop Pest Data. International Journal of Innovative Research in Computer and Communication Engineering, 5(1), 50-58.
Rulequest. (2019). Data Mining Tools See5 and C5.0. (online). (https://www.rulequest.com/see5-info.html, diakses pada 31 Mei 2019).
Septiandi, R. (2016). Analisis Data Keterlambatan Bahan Baku Berdasarkan Pendekatan Data Warehouse dan Pohon Keputusan C5.0. (Master's Thesis). Institut Pertanian Bogor, Bogor.
Sun, Z., Leinenkugel, P., Guo, H., Huang, C., & Kuenzer, C. (2017). Extracting Distribution and Expansion of Rubber Plantations from Landsat Imagery Using The C5.0 Decision Tree Method. Journal of Applied Remote Sensing, 11(2), 026011-1–026011-21.
Upadhayay, A., Shukla, S., & Kumar, S. (2013). International Journal of Computer Science and Communication Networks, 3(1), 64-68.