资料
  • 资料
  • 专题
标签同步解码算法及其在语音识别中的应用
推荐星级:
时间:2019-06-28
大小:886.71KB
阅读数:272
上传用户:xld0932
查看他发布的资源
下载次数
0
所需E币
1
ebi
新用户注册即送 300 E币
更多E币赚取方法,请查看
close
资料介绍
自动语音识别(Automatic Speech Recognition,ASR)等序列标注任务的一个显著特点是其对相邻帧的时序序列关联性建模。用于对相邻帧进行时序建模的主流序列模型包括隐马尔科夫模型(Hidden Markov Model, HMM)和连接时序模型(Connectionist Temporal Classification, CTC)。针对这些模型,当前主流的推理方法是帧层面的维特比束搜索算法,该算法复杂度很高,限制了语音识别的广泛应用。深度学习的发展使得更强的上下文和历史建模成为可能。通过引入blank单元,端到端建模系统能够直接预测标签在给定特征下的后验概率。该文系统地提出了一系列方法,通过使用高效的blank结构和后处理方法,使得搜索解码过程从逐帧同步变为标签同步。该系列通用方法在隐马尔科夫模型和连接时序模型上均得到了验证。结果表明,在Switchboad 数据集上,不损失性能的前提下,实验取得了2-4 倍的加速。该文同时研究了搜索空间,候选序列剪枝,转移模型,降帧率等对加速比的影响,并在所有情况下取得一致性加速。
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或 联系我们 删除。
相关评论 (下载后评价送E币 我要评论)
没有更多评论了
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书