Pemanfaatan Metode Multiclass-SVM pada Model Klasifikasi Pesan Bencana Banjir di Twitter
Abstract
Musibah bencana alam banjir merupakan salah satu musibah alam yang sangat umum kejadian di Indonesia baik di pulau Jawa ataupun di luar Pulau Jawa. Sumber informasi dari media social Twitter dapat digunakan sebagai Social Network Sensor (SNS) untuk bencana banjir. Penelitian ini bertujuan untuk melakukan klasifikasi pesan twitter khususnya tentang bencana banjir sebagai hasil dari algoritma machine learning. Pada klasifikasi pesan bencana banjir dilakukan serangkaian proses data preprocessing dan dilanjutkan dengan ekstraksi fitur dan pembobotan kata dari data twitter. Berbagai teknik yang dilakukan pada proses data preprocessing berpengaruh terhadap tingkat akurasi hasil klasifikasi yang dihasilkan. Selanjutnya, penelitian ini menyampaikan bahwa algoritma Support Vector Machine (SVM) adalah sebuah algoritma dapat dimanfaatkan untuk klasifikasi data ke dalam tiga (3) kelas kelas saksi mata, kelas non saksi mata dan kelas tidak diketahui. Total jumlah data yang telah diolah sebanyak 3000 data untuk 3 kelas label data. Pendekatan metode One Versus One (OVO) untuk dua kelas label data dan One Versus All (OVA) untuk lebih dari dua kelas label pada algoritma SVM. Pada penelitian ini telah diterapkan algoritma Support Vector Machine untuk multiclass dengan metode OVA. Hasil eksperimen telah menunjukkan pendekatan OVA pada algoritma SVM dengan kernel RBF menghasilkan evaluasi performansi yang paling tinggi. Hasil evaluasi tersebut adalah nilai akurasi hingga 87.03%. Sedangkan hasil riset sebelumnya dengan algoritma SVM tetapi pendekatan yang berbeda hanya mencapai nilai akurasi hingga 77.87%.
References
Akbari, M., Novianty, A., & Setianingsih, C. (2017, August). Analisis Sentimen Menggunakan Metode Learning Vector Quantization Sentiment Analysis Using Learning Vector Quantization Method.
Annisa Rahmaniar Dwi Pratiwi & Erwin Budi Setiawan. (2020). Implementation of Rumor Detection on Twitter Using the SVM Classification Method. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 4(5), 782–789. https://doi.org/10.29207/resti.v4i5.2031
BNPB. (2020). Infografis Update Data Bencana Alam di Indonesia [Infografis]. Badan Nasional Penanggulangan Bencana. https://bnpb.go.id/infografis/update-bencana-indonesia-tahun-2020
Christakis, N. A., & Fowler, J. H. (2010). Social Network Sensors for Early Detection of Contagious Outbreaks. PLoS ONE, 5(9), e12948. https://doi.org/10.1371/journal.pone.0012948
Delimayanti, M. K., Sari, Risna, Laya, Mauldy, Faisal, M. Reza, Pahrul, & Naryanto, R. Fitri. (2020, October 7). The Effect of Pre-Processing on the Classification of Twitter’s Flood Disaster Messages Using Support Vector Machine Algorithm. International Conference on Applied Engineering (ICAE) 2020. International Conference on Applied Engineering (ICAE), Batam, Indonesia.
Devid Haryalesmana & Martijn Wieriks. (2016, February 1). Kamus id stopword Bahasa Indonesia [Dataset GIthub]. https://github.com/masdevid/ID-Stopwords
Dhina Nur Fitriana & Yuliant Sibaroni. (2020). Sentiment Analysis on KAI Twitter Post Using Multiclass Support Vector Machine (SVM). Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 4(5), 846–853. https://doi.org/10.29207/resti.v4i5.2231
Falahah, & Dwiki Adriadi Nur, D. (2015). PENGEMBANGAN APLIKASI SENTIMENT ANALYSIS MENGGUNAKAN METODE NAÏVE BAYES (Studi Kasus Sentiment Analysis dari media Twitter). Seminar Nasional Sistem Informasi Indonesia, November, 2–3.
Feldman, R., & Sanger, J. (2007). The text mining handbook: Advanced approaches in analyzing unstructured data. Cambridge University Press. http://www.books24x7.com/marc.asp?bookid=23164
Fitriyyah, S. N. J., Safriadi, N., & Pratama, E. E. (2019). Analisis Sentimen Calon Presiden Indonesia 2019 dari Media Sosial Twitter Menggunakan Metode Naive Bayes. Jurnal Edukasi dan Penelitian Informatika (JEPIN), 5(3), 279. https://doi.org/10.26418/jp.v5i3.34368
Fuchida, M., Pathmakumar, T., Mohan, R., Tan, N., & Nakamura, A. (2017). Vision-Based Perception and Classification of Mosquitoes Using Support Vector Machine. Applied Sciences, 7(1), 51. https://doi.org/10.3390/app7010051
Hernandez-Suarez, A., Sanchez-Perez, G., Toscano-Medina, K., Perez-Meana, H., Portillo-Portillo, J., Sanchez, V., & García Villalba, L. (2019). Using Twitter Data to Monitor Natural Disaster Social Dynamics: A Recurrent Neural Network Approach with Word Embeddings and Kernel Density Estimation. Sensors, 19(7), 1746. https://doi.org/10.3390/s19071746
Kryvasheyeu, Y., Chen, H., Moro, E., Van Hentenryck, P., & Cebrian, M. (2015). Performance of Social Network Sensors during Hurricane Sandy. PLOS ONE, 10(2), e0117288. https://doi.org/10.1371/journal.pone.0117288
Luqyana, W. A., Cholissodin, I., & Perdana, R. S. (2018). Analisis Sentimen Cyberbullying Pada Komentar Instagram dengan Metode Klasifikasi Support Vector Machine. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 2(11), 4704–4713.
Nguyen, H., Bui, X.-N., Choi, Y., Lee, C. W., & Armaghani, D. J. (2020). A Novel Combination of Whale Optimization Algorithm and Support Vector Machine with Different Kernel Functions for Prediction of Blasting-Induced Fly-Rock in Quarry Mines. Natural Resources Research. https://doi.org/10.1007/s11053-020-09710-7
Oryza Habibie Rahman, Gunawan Abdillah, & Agus Komarudin. (2021). Klasifikasi Ujaran Kebencian pada Media Sosial Twitter Menggunakan Support Vector Machine. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), 5(1), 17–23. https://doi.org/10.29207/resti.v5i1.2700
Pradana, A. W., & Hayaty, M. (2019). The Effect of Stemming and Removal of Stopwords on the Accuracy of Sentiment Analysis on Indonesian-language Texts. Kinetik: Game Technology, Information System, Computer Network, Computing, Electronics, and Control, 4(4), 375–380. https://doi.org/10.22219/kinetik.v4i4.912
Pratama, M. L., & Murfi, H. (2014). STUDI KOMPARASI METODE MULTICLASS SUPPORT VECTOR MACHINE UNTUK MASALAH ANALISIS SENTIMEN PADA TWITTER. 20.
Prayoginingsih, S., & Kusumawardani, R. P. (2018). Klasifikasi Data Twitter Pelanggan Berdasarkan Kategori myTelkomsel Menggunakan Metode Support Vector Machine (SVM). Sisfo, 07(02). https://doi.org/10.24089/j.sisfo.2018.01.002
Rachmatika, R., & Bisri, A. (2020). Perbandingan Model Klasifikasi untuk Evaluasi Kinerja Akademik Mahasiswa. Jurnal Edukasi dan Penelitian Informatika (JEPIN), 6(3), 6.
Raju, K. S., Murty, M. R., Rao, M. V., & Satapathy, S. C. (2018). Support Vector Machine with K-fold Cross Validation Model for Software Fault Prediction. International Journal of Pure and Applied Mathematics, 118(20), 321–334.
Wu, C.-H. (2016). SOCIAL SENSOR: AN ANALYSIS TOOL FOR SOCIAL MEDIA. International Journal of Electronic Commerce Studies, 7(1), 77–94. https://doi.org/10.7903/ijecs.1411
Zahra, K., Imran, M., & Ostermann, F. O. (2020). Automatic identification of eyewitness messages on twitter during disasters. Information Processing and Management, 57(1), 102107. https://doi.org/10.1016/j.ipm.2019.102107