Pengenalan Suara Menggunakan Metode Mel-Frequency Cepstral Coefficient (MFCC)

Bahasa sebagai bagian terpenting dari kehidupan manusia, dalam bentuk tulis dapat merupakan catatan dari pengetahuan yang didapat oleh umat manusia dari satu generasi ke generasi berikutnya. Sedangkan dalam bentuk lisan merupakan sarana komunikasi antar individu dalam suatu masyarakat.

Tujuan dalam bidang Natural Language ini adalah melakukan proses pembuatan model komputasi dari bahasa, sehingga terjadi suatu interaksi antara manusia dengan komputer dengan perantara bahasa alami.Pada penelitian sebelumnya, menjelaskan bahwa model akustik yang digunakan menggunakan silabel dan hanya digunakan untuk mengidentifikasi karakter suara dari pembicara yang diambil dari NTT (Nihon Telephone and Telegraph) database.

Sedangkan metode silabel hanya bisa menghasilkan aksara Jepang berdasarkan suku kata yang dihasilkan, sehingga penekanan atau aksen yang diharapkan dapat diidentifikasi belum dapat dikenali. Selain itu riset lain yang ada adalah pengenalan suara menggunakan mora. Kelemahan yang ada jika menggunakan mora adalah kesamaan mora untuk beberapa kata yang sama namun memiliki Kanji yang berbeda, sehingga pelafal harus memilih lagi dari beberapa kemungkinan kanji yang ada.Penelitian ini bertujuan untuk mengurangi kesalahan pelafal bahasa Jepang dengan memperhatikan aksen yang digunakan oleh pelafal.

Metode yang digunakan adalah mendeteksi aksen menggunakan pola frekuensi yang kemudian dilakukan ekstraksi ciri menggunakan algoritma Fast Fourier Transform (FFT) dan Mel-Frequency Cepstral Coefficient (MFCC) untuk masing-masing kata yang mempunyai kesamaan mora dan syllable namun memiliki accent yang berbeda. Sehingga akan dihasilkan Kanji dan arti yang berbeda dengan melakukan analisis pengucapan berdasarkan aksen (accent).

Comments

Popular Posts