资料
  • 资料
  • 专题
手机语音识别应用中DSP的选择
推荐星级:
类别: 消费电子
时间:2020-01-15
大小:52.5KB
阅读数:249
上传用户:978461154_qq
查看他发布的资源
下载次数
0
所需E币
3
ebi
新用户注册即送 300 E币
更多E币赚取方法,请查看
close
资料介绍
手机语音识别应用中DSP的选择 手机语音识别应用中DSP的选择 随着DSP技术的进步,计算能力更强、功耗更低和体积更小的DSP已经出现,使3G手机上 植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前,基本ASR应用可以分成三 大类:1. 语音-文本转换(语音输入);2. 讲者识别;3. 语音命令控制(语音控制)。   这三类功能包含了3G所需的众多ASR性能。语音- 文本转换的典型实例是语音拨号和电子邮件听写。讲者识别功能可以通过语音识别安全 地读出存储器中的个人数据,从而满足信用卡定购和银行服务等保密性高的应用需要。 语音命令控制功能包括连接语音扩展标记语言(VXML)网站内容的语音接口,它支持财经 服务与目录助理等业务。目前VXML被用于规范网站内容的语音标签。   语音识别的两种方法   3G手机的ASR应用设计可分为两类,即以终端为中心和以客户/服务器为中心的应用 。如图1所示为以终端为中心的设计方法,3G手机(终端)执行整个语音识别过程并送出识 别结果。在图2所示的客户/服务器方法中,终端只是执行预处理特征提取,然后通过一 个误码受保护的数据信道将这些参数发送给中心服务器,中心服务器最终完成语音识别 。如果采用以客户/服务器为中心的设计方法,3G手机应使用数据信道而非移动信道来将 语音发送给服务器进行识别,因为移动信道所用的低速率语音编码会严重影响语音识别 的性能。   各种ASR系统的差异主要体现在词汇量上。一个简单的网络设备可能只需要16字的词 库就能实现所要求的语音识别功能,而3G移动手机则需要更大的专业词库。这些词汇可 以跟讲者相关(训练语音识别设备使之熟悉用户的声音特征)或跟讲者无关(语音识别设备 可以识别任何人的声音),DSP的计算负荷就随着词汇量和训练数据的增加而增大。   例如,根据隐性马尔可夫模型(HMM)可以分析一个典型的跟讲者无关的100条命令识 别的应用实例。……
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或 联系我们 删除。
PARTNER CONTENT
相关评论 (下载后评价送E币 我要评论)
没有更多评论了
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书