Klasifikasi dengan Pohon Keputusan Berbasis Algoritme C4.5
Main Article Content
Abstract
Data mining merupakan suatu proses menemukan pola dalam sejumlah data besar dengan tujuan untuk melakukan klasifikasi, estimasi, prediksi, asosiasi dan klaster. Salah satu metode klasifikasi yang popular adalah pohon keputusan (decision tree). Konsep dasar dari pohon keputusan adalah mengubah data menjadi sebuah model pohon keputusan, kemudian mengubah model pohon menjadi rule dan menyederhanakan rule. Data dalam pohon keputusan dinyatakan dalam bentuk tabel dengan atribut dan record. Terdapat beberapa cara untuk mengkonstruksikan pohon keputusan salah satunya menggunakan algoritme C4.5. Algoritme C4.5 merupakan pengembangan dari Iterative Dichotomiser (ID3). ID3 adalah algoritme pembelajaran pohon keputusan (decision tree learning) yang paling dasar. Algoritme ini melakukan pencarian secara menyeluruh (greedy) pada semua kemungkinan pohon keputusan. Algoritme ID3 membangun pohon keputusan secara top-down (dari atas ke bawah) yang diawali dengan suatu atribut. Top-down artinya pohon keputusan dibangun dari simpul akar ke daun. Algoritme ini tidak dapat mengatasi atribut dengan data kosong, oleh karena itu diperlukan algoritme C4.5 yang dapat mengatasi atribut dengan data kosong serta dapat melakukan pemangkasan cabang yang juga tidak terdapat pada algoritme ID3. Contoh dari algoritme C4.5 ditunjukkan pada Gambar 4.
Article Details
References
Dunham, M.H. (2003). Data Mining: Introductory and Advanced Topics, Pearson Education Inc.
Elisa, Erlin. (2007). Analisa dan Penerapan Algoritma C4.5 Dalam Data Mining untuk Mengidentifikasi Faktor-Faktor Penyebab Kecelakaan Kerja Kontruksi PT. Arupadhatu Adisesantani, Jurnal Sistem Informasi, Batam.
Han, J. & M. Kamber. (2006). Data Mining Concept and Techniques, Morgan Kaufmann Publishers, San Fransisco.¬
Lakshmi, T.M., A. Martin, R.M. Begum, and Dr.V.P. Venkatesan. (2013). An Analysis on Performance of Decision Tree Algorithms using Student's Qualitative Data, I.J.Modern Education and Computer Science.
Larose, Daniel T. (2005). Discovering Knowledge in Data: An Introduction to Data Mining, John Willey and Sons, Inc.
Munawaroh, Holisatul., Khusnul, Bain K., Kustiyahningsih, Yeni. (2015). Perbandingan Algoritma ID3 dan C5.0 Dalam Identifikasi Penjurusan Siswa SMA. Program Studi Teknk Informatika, Universitas Tunojoyo, Bangkalan.
Quinlan, J. R., (1993). C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers.
Ratniasih, N. L. (2016). Konversi Data Training Tentang Pemilihan Kelas Menjadi Bentuk Pohon Keputusan dengan Teknik Klasifikasi. Jurnal Eksplora Informatika, 4(2), 145-154.
Tan, Pang Ning., Michael Steinbach, Vipin Kumar (2004). Introduction to Data Mining.
Wahyudin (2009). Metode Iterative Dichotomizer 3 (ID3) Untuk Penyeleksian Penerimaan Mahasiswa Baru, Jurnal Pendidikan Teknologi Informasi dan Komunikasi (PTIK), Universitas Pendidikan Indonesia.