本文共 537 字,大约阅读时间需要 1 分钟。
具体操作细节可查看一下网址:
链接
第一步就是要跑通thchs30的例子,这是清华的中文语音识别例子第二部做本地识别可查看上面网址,不过有两处不对
1、如下图所示地方要改成final.mat,上面网址的是12.mat
2、如下图所示地方也要改ac_model=${data_file}/models/$ac_model_type trans_matrix="" audio=${data_file}/audio
改后:
解释原因:
可用file 命令查看final.mat、final.mdl文件
在tri2b下的final.mat、final.mdl文件都是指向性文件,不是数据和模型,所以需要把真正的数据和模型烤过来,就是12.mat 、35.mdl文件
在tri4b下的final.mat、final.mdl文件,final.mat是真的数据文件,所以不用拷其他.mat文件,final.mdl文件还是指向性文件,所以还要拷过来它指向的文件
实际上解码只要3个文件就行了,一个模型文件(final.mdl ),words.txt,和HCLG.fst,一个是字典,一个是有限状态机。这3个文件
不过由于上面说的指向性的原因需要把指向的真正的文件拷过来。
转载自: