Analisis Sentimen Pengguna Aplikasi Marketplace Tokopedia Pada Situs Google Play Menggunakan Metode Support Vector Machine (SVM), Naïve Bayes, dan Logistic Regression
Main Article Content
Abstract
Pertumbuhan e-commerce di Indonesia sangat pesat, terbukti dengan data penggunainternet yang terus meningkat dari tahun ke tahun, serta adanya pandemi virus COVID-19 yang mengharuskan masyarakat untuk melakukan social distancing.Tokopedia merupakansalahsatu penyedia e-commerce yang umum digunakan masyarakatIndonesia saat ini, khususnya generasi milenial. Data review hanya akan dilabelisebagai dua jenis sentimen, yaitu sentimen positif dan sentimen negatif kemudianmetode klasifikasi sentimen positif dan sentimen negatif dilakukan denganmenggunakan beberapa metode,yakniSupport Vector Machine, Naïve Bayes,dan Logistic Regression.Hasil pelabelan kelas sentimen pada data review Tokopedia diperoleh 3125 review dengan jumlah review positif sebanyak 2598 review dan review negatif sebanyak 527 review. Pada penelitian ini akan menggunakan dua jenis model pembagian data, yaitu dengan split data 80:20 dan k-fold cross validation.Ketidakseimbanganbanyak data padatiapkelassentimenditanganimengunakanteknik SMOTE.Penerapan SMOTE terbukti dapat meningkatkan kinerja pada data tidak seimbang, sehingga hal tersebut menunjukkan bahwa SMOTE lebih efektif dalam meningkatkan ketepatan akurasi klasifikasi daripada non-SMOTE. Metode klasifikasi yang tepat digunakan untuk klasifikasi review pengguna Tokopedia adalah k-fold cross validation Support Vector Machine-SMOTE karena karena memiliki nilai AUC paling tinggi.
Article Details
References
Castellà, Q., & Sutton, C. (2014). Word storms: Multiples of Word Clouds for Visual Comparison of Documents. WWW 2014 - Proceedings of the 23rd International Conference on World Wide Web, 665–675. https://doi.org/10.1145/2566486.2567977
Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research, 16, 321–357.
Feldman, R., & Sanger, J. (2006). The Text Mining Handbook. In The Text Mining Handbook. https://doi.org/10.1017/cbo9780511546914
Hermanto, Kuntoro, A. Y., Asra, T., Pratama, E. B., Effendi, L., & Ocanitra, R. (2020). Gojek and Grab User Sentiment Analysis on Google Play Using Naive Bayes Algorithm and Support Vector Machine Based Smote Technique. Journal of Physics: Conference Series, 1641(1). https://doi.org/10.1088/1742-6596/1641/1/012102
Jadhav, S. D., & Channe, H. P. (2016). Comparative Study of K-NN, Naive Bayes and Decision Tree Classification Techniques. International Journal of Science and Research (IJSR), 5(1), 1842–1845. https://doi.org/10.21275/v5i1.nov153131
Liu, L., & Ozsu, M. T. (2009). Encyclopedia of Database Systems. In Encyclopedia of Database Systems. Springer. https://doi.org/10.1007/978-0-387-39940-9
Mohammad, S. M., Kiritchenko, S., & Zhu, X. (2013). NRC-Canada: Building the State-of-the-Art in Sentiment Analysis of Tweets. *SEM 2013 - 2nd Joint Conference on Lexical and Computational Semantics, 2, 321–327.
Moraes, R., Valiati, J. F., & Gavião Neto, W. P. (2013). Document-level sentiment classification: An empirical comparison between SVM and ANN. Expert Systems with Applications, 40(2), 621–633. https://doi.org/10.1016/j.eswa.2012.07.059
Ramli, Yuniarti, D., & Goejantoro, R. (2013). Perbandingan metode klasifikasi Regresi Logistik dengan Jaringan Saraf Tiruan (studi kasus: pemilihan jurusan bahasa dan IPS pada SMAN 2 Samarinda tahun ajaran 2011/2012). Jurnal EKSPONENSIAL Universitas Mulawarman, 4(1), 17.
Saputri, R. P., Winahju, W. S., & Fithriasari, K. (2019). Klasifikasi Sentimen Wisatawan Candi Borobudur pada Situs TripAdvisor Menggunakan Support Vector Machine dan K-Nearest Neighbor. Jurnal Sains Dan Seni Its, 8(2), 1. http://ejurnal.its.ac.id/index.php/sains_seni/article/view/44391
Sari, E. D. N., & Irhamah. (2019). Analisis Sentimen Nasabah Pada Layanan Perbankan Menggunakan Metode Regresi Logistik Biner , Naïve Bayes Classifier ( NBC ), dan Support Vector Machine ( SVM ). Jurnal Sains Dan Seni Its, 8(2), 177.
Sumpeno, S. (2009). Klasifikasi Emosi Untuk Teks Bahasa Indonesia. Seminar, c.
Suyanto. (2019). Data Mining untuk klasifikasi dan klasterisasi data. Informatika.
Tan, P.-P., Steinbach, M., & Kumar, V. (2005). Introduction to Data Mining. Addison-Wesley Longman Publishing Co, 2005.
Turland, M. (2010). php|architect’s Guide to Web Scraping with PHP.
Wardani, N. S., Prahutama, A., & Kartikasari, P. (2020). Analisis Sentimen Pemindahan Ibu Kota Negara Dengan Klasifikasi Naïve Bayes Untuk Model Bernoulli dan Multinomial. 9, 237–246.
Wyatt, J. C., & Taylor, P. (2008). Decision Support Systems and Clinical Innovation. Getting Research Findings into Practice: Second Edition, 123–137. https://doi.org/10.1002/9780470755891.ch11