close
在這邊我們用數字辨識來說明HTK的操作過程。透過這個範例,可以容易理解HTK的操作。
第一步為定義字典(dictionary)檔案,字典檔案中應該包含字詞 (word, syllable) 和音素 (phone, sub-syllable)。在這邊我們只需要定義數字(0~9)的字典資訊就可以了。字典資訊主要是讓HTK可以透過字典,將我們所要辨識的數字(0~9)轉換成對應的音素(phones)。例如下圖中,我們可以把 one 對應到 yi 這個音素。
音素的設定,並沒有特殊限制,主要還是使用者自訂。其中靜音預設為 "sil",而停頓音設定為 "sp"。
在此範例中,我們在HTK資料夾中新增 "Dic" 資料夾,並且產生字典檔案 "Number_phone.dic"。
字典設定好之後,我們可以在 DOS command Line 模式下,輸入下列指令,將字典排序,會輸出檔案 "Number_phone_sort.dic",提供後續使用。
sort .\Dic\Number_phone.dic > .\Dic\Number_phone_sort.dic
全站熱搜