Klasifikasi Kanker Payudara Menggunakan Algoritma Gain Ratio

Balqis Aisyah Farahdiba(1), Yusuf Sulistyo Nugroho(2),


(1) Universitas Muhammadiyah Surakarta
(2) Universitas Muhammadiyah Surakarta

Abstract

Kanker payudara merupakan jenis kanker yang menempati urutan kedua sebagai penyakit yang paling umum ditemui. Seperlima dari wanita penderita kanker adalah mereka yang didiagnosa mengidap kanker payudara. Kanker secara umum dibagi dua yaitu jinak dan ganas, begitupun kanker payudara. Pada status ganas, kanker dapat berakibat buruk bagi penderitanya bila terlambat diketahui. Oleh sebab itu, deteksi dini pada penyakit kanker sangatlah penting agar penderitanya dapat menerima penanganan yang tepat. Penelitian ini dilakukan dalam rangka untuk melakukan klasifikasi jenis kanker berdasarkan variable-variabel yang mempengaruhi menggunakan teknik data mining. Klasifikasi kanker payudara dilakukan menggunakan metode decision tree dengan algoritma gain ratio. Atribut-atribut yang digunakan dalam  klasifikasi yaitu ketebalan rumpun, keseragaman ukuran sel, keseragaman bentuk sel, adhesi marjinal, ukuran sel epitel tunggal, ukuran asli nuclei, kromatin, keadaan nucleoli normal dan mitosis. Hasil evaluasi kinerja algoritma gain ratio diperoleh nilai recall, accuracy dan precision masing-masing sebesar 92,55%, 95,17% dan 93,76%. Nilai tersebut menunjukkan bahwa algoritma gain ratio sangat baik digunakan dalam klasifikasi ini. Berdasarkan skema decision tree, variabel keseragaman  ukuran sel merupakan variable yang paling signifikan mempengaruhi jenis kanker.

Full Text:

PDF

References

Demigha, S. (2015). Data Mining for Breast Cancer Screening. 2015 10th International Conference on Computer Science & Education (ICCSE), (Iccse), 65–69. http://doi.org/10.1109/ICCSE.2015.7250219

Kotsiantis, S. B. (2013). Decision Trees: A Recent Overview. Artificial Intelligence Review, 39(4), 261–283. http://doi.org/10.1007/s10462-011-9272-4

Ma, J., & Jemal, A. (2013). Breast Cancer Statistics. Breast Cancer Metastasis and Drug Resistance, 143–159. http://doi.org/10.1007/978-1-4614-5647-6

Nagpal, A., & Gaur, D. (2015). A New Proposed Feature Subset Selection Algorithm Based on Maximization of Gain Ratio. 4th International Conference, DBA 2015, 181–197. http://doi.org/10.1007/978-3-319-03689-2_13

Nugroho, Y. S., & Gunawan, D. (2016). Decision Tree Induction for Classifying the Cholesterol Levels. The 2nd International Conference on Science, Technology, and Humanity, 231–240.

Prasad, N., & Naidu, M. M. (2015). Gain Ratio as Attribute Selection Measure in Elegant Decision Tree to Predict Precipitation Narasimha. In Proceedings - 8th EUROSIM Congress on Modelling and Simulation, EUROSIM 2013 (pp. 141–150). http://doi.org/10.1109/EUROSIM.2013.35

Rashmi, G. D., Lekha, A., & Bawane, N. (2015). Analysis of Efficiency of Classification and Prediction Algorithms (Naïve Bayes) for Breast Cancer Dataset. In 2015 International Conference on Emerging Research in Electronics, Computer Science and Technology (ICERECT) (pp. 108–113). http://doi.org/[email protected]

Shah, C., & Jivani, A. G. (2013). Comparison of Data Mining Classification Algorithms for Breast Cancer Prediction. 2013 Fourth International Conference on Computing, Communications and Networking Technologies (ICCCNT), 1–4. http://doi.org/10.1109/ICCCNT.2013.6726477

Singh, T. T. (2007). Breast Cancer Management : Present Scenario. Department of Radiotherapy, Regional Institute of Medical Sciences, Imphal-795004, Manipur, India, 16(1), 55–60.

Refbacks

  • There are currently no refbacks.