Implementasi Voice Recognition Berbasis Machine Learning
Main Article Content
Abstract
Membuat suatu dokumen yang bersumber dari rekaman suara saat ini bukanlah suatu hal yang merepotkan. Hal tersebut dapat diatasi dengan mudah dan cepat menggunakan suatu program yang disebut Voice Recognition. Program tersebut merupakan perintah yang digunakan untuk membuat dokumen tertulis dengan cara mengubah suara menjadi teks. Percobaan dilakukan dengan menggunakan library Speech recognition serta melakukan pengujian suara secara realtime dan pengujian pada file audio yang sudah tersedia. Baik suara secara realtime maupun file audio mengucapkan kalimat yang sama. Tujuan dari percobaan ini adalah untuk mengukur tingkat akurasi program speech to text menggunakan library Speech recognition diantara suara secara realtime dengan file audio. Tingkat akurasi kemudian diproses menggunakan metode cosine similarity. Hasil menunjukkan bahwa penangkapan audio secara realtime menghasilkan tingkat akurasi sebesar 0.97 dan 0.93 dan pemrosesan audio rekaman memiliki tingkat akurasi sebesar 0.97.
Article Details
References
Similarity. Jurnal Teknik Informatika, 9(1).
Bengio, Yoshua; LeCun, Yann; Hinton, Geoffrey (2015). "Deep Learning". Nature. 521 (7553): 436–444.
Ciresan, D.; Meier, U.; Schmidhuber, J. (2012). "Multi-column deep neural networks for image classification". 2012 IEEE Conference on Computer Vision and Pattern Recognition. pp. 3642–3649.
Fathurrahman, Dede N et al. (2018). Deep Neural network Untuk Pengenalan Ucapan Pada Bahasa Sunda Dialek
Tengah Timur (Majalengka). e-Proceeding of Engineering. 5(3). 6073-6080.
Goodfellow, I., Bengio, Y., Courville, A., & Bengio, Y. (2016). Deep Learning (Vol. 1). MIT Press Cambridge. Isa, Sani
M. (2019). Speech Recognition. [Online]. URL : https://mti.binus.ac.id/2019/05/08/speechrecognition/#:~:text
=Speech%20Recognition%20atau%20yan g%20biasa%20dikenal%20dengan%20automatic,yang%20diu capkan%20dengan%20cara%20digitalisasi%20kata%20dan% 20 .
Diakses tanggal 13 April 2022.
Krizhevsky, Alex; Sutskever, Ilya; Hinton, Geoffry (2012). "ImageNet Classification with Deep Convolutional Neural Networks"
Laksono, Teguh Puji. (2018). Speech To Text Untuk Bahasa Indonesia. Skripsi FTI UII, UII Yogyakarta: diterbitkan. Lecun, Y., Bengio, Y., & Hinton, G. (2015). Deep Learning. Nature, 521(7553), 436 Nurdiana, O., Jumadi., dan Nursantika, D. 2016. Perbandingan
Metode Cosine Similarity dengan Metode Jaccard Similarity pada Aplikasi Pencarian Terjemahan AlQur’an dalam Bahasa Indonesia. Jurnal Online Informatika Volume 1, Nomor 1.
Pratama, R.P., Faisal, M. and Hanani, A., 2019. Deteksi Plagiarisme pada Dokumen Jurnal Menggunakan Metode Cosine Similarity. SMARTICS Journal, 5(1), pp.22-26.
Rabiner, Lawrence, R. (1989). A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Proceedings of the IEEE, 77(2), 257–286.
Tanaka, M.; Okutomi, M. A novel inference of a restricted boltzmann machine. Pattern Recognition (ICPR), 2014 22nd International Conference on. 2014; pp 1526–1531