资料
  • 资料
  • 专题
基于RNN和WFST译码的自动语音识别研究
推荐星级:
时间:2019-06-28
大小:309.42KB
阅读数:310
上传用户:xld0932
查看他发布的资源
下载次数
0
所需E币
1
ebi
新用户注册即送 300 E币
更多E币赚取方法,请查看
close
资料介绍
文中利用Eesen 框架声学建模简化了现有的自动语音识别( ASR) ,通过训练单个递归神经网络( RNN) 来预测上下文无关的目标( 音素或字符) 。为了消除对预生成帧标签的需求,采用了连接时间分类( CTC) 目标函数来推断语音和标签序列之间的对齐。同时,采用基于加权有限状态换能器( WFST) 的广义译码方法,将词汇和语言模型有效地整合到CTC 译码中。实验结果表明,与混合HMM/DNN 模型相比,所提方法具有较低的误码率( WER) ,同时显著加快了译码速度。
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或 联系我们 删除。
PARTNER CONTENT
相关评论 (下载后评价送E币 我要评论)
没有更多评论了
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书