6285641688335, 628551515511 info@scirepid.com

 
AITI - AITI - Vol. 22 Issue. 1 (2025)

Pengembangan model akustik dengan deep neural network untuk sistem pengenalan wicara bahasa Indonesia

Gunarso Gunarso, Agus Buono, Mushthofa Mushthofa, Mohammad Teduh Uliniansyah,



Abstract

Pendekatan berbasis Deep Neural Network (DNN) menawarkan akurasi yang lebih tinggi dibandingkan dengan metode tradisional seperti Hidden Markov Model (HMM)-Gaussian Mixture Model (GMM) dalam pengembangan model akustik. Dalam penelitian ini, tiga varian DNN populer dievaluasi: Time-Delay Neural Network (TDNN), Long Short-Term Memory (LSTM), dan kombinasi hibrid TDNN-LSTM untuk pengembangan model akustik dalam pengenalan wicara bahasa Indonesia. Data wicara yang digunakan adalah KDW-BPPT-50K-ASR1 dengan durasi lebih dari 92 jam, model akustik dilatih dan eksperimen dilakukan untuk menganalisis kinerjanya. Hasil penelitian menunjukkan bahwa model hibrid TDNN-LSTM mencapai kinerja terbaik dengan Word Error Rate (WER) sebesar 9,67%, mengungguli TDNN dengan WER 12,16% dan LSTM dengan WER 10,6%. Penemuan ini menegaskan bahwa model hibrid mampu meningkatkan akurasi pengenalan wicara bahasa Indonesia dibandingkan dengan penggunaan TDNN atau LSTM secara terpisah. Hasil ini memberikan kontribusi penting bagi pengembangan sistem pengenalan wicara yang lebih akurat dan efisien.







DOI :


Sitasi :

15

PISSN :

1693-8348

EISSN :

2615-7128

Date.Create Crossref:

09-Apr-2025

Date.Issue :

22-Mar-2025

Date.Publish :

22-Mar-2025

Date.PublishOnline :

22-Mar-2025



PDF File :

Resource :

Open

License :

http://creativecommons.org/licenses/by/4.0