基于kaldi、thchs30 的离线中文识别-白红宇

基于kaldi、thchs30 的离线中文识别

阅读量：4211 次

发布时间：2019-05-26

本文共 537 字，大约阅读时间需要 1 分钟。

具体操作细节可查看一下网址：

链接

第一步就是要跑通thchs30的例子，这是清华的中文语音识别例子

第二部做本地识别可查看上面网址，不过有两处不对

1、如下图所示地方要改成final.mat，上面网址的是12.mat

2、如下图所示地方也要改

ac_model=${data_file}/models/$ac_model_type  trans_matrix=""  audio=${data_file}/audio

改后：

解释原因：

可用file 命令查看final.mat、final.mdl文件

在tri2b下的final.mat、final.mdl文件都是指向性文件，不是数据和模型，所以需要把真正的数据和模型烤过来，就是12.mat 、35.mdl文件

在tri4b下的final.mat、final.mdl文件，final.mat是真的数据文件，所以不用拷其他.mat文件，final.mdl文件还是指向性文件，所以还要拷过来它指向的文件

实际上解码只要3个文件就行了，一个模型文件（final.mdl ），words.txt,和HCLG.fst，一个是字典，一个是有限状态机。这3个文件

不过由于上面说的指向性的原因需要把指向的真正的文件拷过来。

转载自：

你可能感兴趣的文章