Speech Recognizer Tool : HTK


Sekitar tahun lalu, dalam rangka tugas kuliah, saya dan teman-teman diminta untuk melakukan eksplorasi, serta membuat eksperimen sederhana dengan tool HTK.  Untuk mengunduh tool HTK, bisa diambil dari sini . Lalu, lanjut ke, bagaimana cara menggunakannya. Dari hasil penelusuran di mesin pencari Google, ternyata tidak banyak yang membahas tentang HTK, apalagi sampai ke detail ya. Ada sih, di tutorial book yang disediakan, tetapi menurut saya tidak terlalu enak untuk diikuti.

Jadi, berpetualanglah mencari sumber lain, yang lebih sederhana, dan mudah diikuti (bagi saya). Seperti perjalanan mencari resep untuk makanan lah :D. And then, ketemu dengan satu file pdf yang telah banyak membantu saya,  HTK basic tutorial by Nicolas Moreau, bisa diunduh di sini . Silakan diikuti langkah-langkah yang tertera di situ, jika ingin melakukan eksperimen sederhana, misal,  mengenali ucapan digit 0-9.

Oya, ini ada beberapa catatan dari saya terkait petunjuk di file tutorial tadi. Karena perlu ada sedikit penyesuaian ternyata :D.

1. Untuk beberapa perintah seperti HInit, karakter ‘\’ tidak perlu diikuti.
2. Perintah HRest (setelah mendapatkan VFloors dari perintah HCompv) :
edit file hmm_yes, hmm_sil, dan hmm_0 pada folder hmm0, dengan
menambahkan baris dari file vfloors, di bagian header (sebelum
<BEGINHMM>).
3. Kalau mau menyatukan model hmm-nya saat menjalankan perintah HVite, vfloor-nya dicopy 1 kali saja.
 
Ok, semoga bermanfaat bagi yang memerlukan. Jadi kalau ada tugas tertentu, jangan sedih, googling dulu, insyaAllah ada jalan 🙂

Leave a Reply