Klasifikasi Perputaran Karyawan Perusahaan Menggunakan Algoritma Random Forest dan Random Over-sampling

Keywords: Karyawan, Klasifikasi, Machine Learning, Perputaran Random Forest, Random Over-Sampling

Abstract

Pergantian karyawan merupakan permasalahan yang berat dalam suatu perusahaan, karena pergantian karyawan dapat menyebabkan kinerja perusahaan menurun akibat kekurangan karyawan. Penelitian ini bertujuan untuk membangun model untuk mengklasifikasikan apakah karyawan akan meninggalkan perusahaan atau tidak untuk mencegah pergantian karyawan. Metode yang digunakan dalam penelitian ini adalah Machine Learning Life Cycle (MLLC). Model dibangun menggunakan algoritma Random Forest dan Random Over-sampling untuk mengatasi data yang tidak seimbang dengan rasio pembagian data untuk data pelatihan sebesar 90% dan data pengujian sebesar 10%. Selain itu untuk mengetahui kinerja model yang dibangun dilakukan evaluasi dengan menggunakan Confusion Matrix dan kurva AUC-ROC. Hasil penelitian ini menunjukkan bahwa model yang dibangun berdasarkan hasil evaluasi mempunyai kinerja yang sangat baik dan hampir sempurna, dengan nilai akurasi sebesar 99,8%, recall sebesar 100%, dan presisi sebesar 99,6%. Hanya terdapat 4 dari 2000 data pengujian yang tidak diklasifikasikan dengan benar, dengan nilai AUC yang dihasilkan sebesar 99,8%, sehingga model termasuk dalam kategori Excellent berdasarkan nilai AUC.

References

Ahmed, T. M. (2021). A Novel Classification Model for Employees Turnover Using Neural Network to Enhance Job Satisfaction in Organizations. Journal of Information and Organizational Sciences, 45(2), 361–374. https://doi.org/10.31341/jios.45.2.1

Al-suraihi, W. A., Samikon, S. A., Al-suraihi, A. A., & Ibrahim, I. (2021). Employee Turnover : Causes , Importance and Retention Strategies. European Journal of Business and Management Research, 6(June). https://doi.org/10.24018/ejbmr.2021.6.3.893

Alexandrio, B., Susanti, A. I., & Aflaha, D. S. I. (2020). Sistem Pendukung Keputusan Kepemilikan Karyawan Tetap Di PT Surya Air Menggunakan Metode SAW. Edu Komputika Journal, 7(2), 61–69. https://doi.org/10.15294/edukomputika.v7i2.42385

Ashraf, S., Saleem, S., Ahmed, T., Aslam, Z., & Muhammad, D. (2020). Conversion of Adverse Data Corpus to Shrewd Output Using Sampling Metrics. Visual Computing for Industry, Biomedicine, and Art, 3(1). https://doi.org/10.1186/s42492-020-00055-9

Brennan, D. (2020). Process technology evolution and adoption. In Process Industry Economics. https://doi.org/10.1016/b978-0-12-819466-9.00007-9

Ekhsan, M. (2019). The Influence Job Satisfaction And Organizational Commitment On Employee Turnover Intention. Journal of Business, Management, and Accounting P, 1(1), 48–55.

Habib, A., Sheikh, H., & Nabi, N. (2018). Employee Turnover & It ’ s Impact on Apparel Industry in Bangladesh : A Case Study of Mondol Group. Human Resource Management Research, 8(3), 63–68. https://doi.org/10.5923/j.hrmr.20180803.03

Ibnu Daqiqil Id. (2021). Machine Learning : Teori, Studi Kasus dan Implementasi Menggunakan Python (1st ed., Issue July). UR PRESS. https://doi.org/10.5281/zenodo.5113507

Khera, S. N., & Divya. (2019). Predictive Modelling of Employee Turnover in Indian IT Industry Using Machine Learning Techniques. Vision, 23(1), 12–21. https://doi.org/10.1177/0972262918821221

Kinoto, J., Damanik, J. L., Tri, E., Situmorang, S., Siregar, J., & Harahap, M. (2020). Prediksi Employee Churn Dengan Uplift Modeling Menggunakan Algoritma Logistic Regression. 3, 503–508. https://doi.org/https://doi.org/10.34012/jutikomp.v3i2.1645

Ma, M., Tian, X., Chen, F., Ma, X., Guo, W., & Lv, X. (2022). The Application of Feature Engineering in Establishing A Rapid and Robust Model for Identifying Patients with Glioma. Lasers in Medical Science, 37(2), 1007–1015. https://doi.org/10.1007/s10103-021-03346-6

Magnolia, C., Nurhopipah, A., & Kusuma, B. A. (2023). Penanganan Imbalanced Dataset untuk Klasifikasi Komentar Program Kampus Merdeka Pada Aplikasi Twitter. Edu Komputika Journal, 9(2), 105–113. https://doi.org/10.15294/edukomputika.v9i2.61854

Mohammed, R., Rawashdeh, J., & Abdullah, M. (2020). Machine Learning with Oversampling and Undersampling Techniques: Overview Study and Experimental Results. 2020 11th International Conference on Information and Communication Systems, ICICS 2020, 243–248. https://doi.org/10.1109/ICICS49469.2020.239556

Purohit, K. (2021). Separation of Data Cleansing Concept from EDA. International Journal of Data Science and Analysis, 7(3), 89. https://doi.org/10.11648/j.ijdsa.20210703.16

Putro, H. F., Vulandari, R. T., & Saptomo, W. L. Y. (2020). Penerapan Metode Naive Bayes Untuk Klasifikasi Pelanggan. Jurnal Teknologi Informasi Dan Komunikasi (TIKomSiN), 8(2). https://doi.org/10.30646/tikomsin.v8i2.500

Sen, P. C., Hajra, M., & Ghosh, M. (2020). Supervised Classification Algorithms in Machine Learning: A Survey and Review. Advances in Intelligent Systems and Computing, 937, 99–111. https://doi.org/10.1007/978-981-13-7403-6_11

Setianto, S. K., & Jatikusumo, D. (2020). Employee Turnover Analysis Using Comparison of Decision Tree and Naive Bayes Prediction Algorithms on K-Means Clustering Algorithms at PT. AT. Jurnal Mantik, 4, 1573–1581. https://doi.org/https://doi.org/10.35335/mantik.Vol4.2020.893.pp1573-1581

Widyastuti, R. W. (2020). Prediksi Harga Televisi Dengan Menggunakan Penerapan Metode Random Forest Dan Framework Flask. Universitas Islam Indonesia.

Zhang, H., Xu, L., Cheng, X., Chao, K., & Zhao, X. (2018). Analysis and Prediction of Employee Turnover Characteristics based on Machine Learning. ISCIT 2018 - 18th International Symposium on Communication and Information Technology, Iscit, 433–437. https://doi.org/10.1109/ISCIT.2018.8587962

Zulfiyandi, Franciscus Anton Wirawan, Tanjung, N. P. S., Yolanda, R., Zaini, M., Andrian, D., Syafitri, K., Amaldi, G., & Sidantha, I. N. B. (2021). Ketenagakerjaan Dalam Data Edisi 4 Tahun 2021.

Published
2024-07-28
How to Cite
Kurniadi, D., Nuraeni, F., Faturrohman, N., & Mulyani, A. (2024). Klasifikasi Perputaran Karyawan Perusahaan Menggunakan Algoritma Random Forest dan Random Over-sampling. Edu Komputika Journal, 10(2), 93-103. https://doi.org/10.15294/edukomputika.v10i2.73782