资料
  • 资料
  • 专题
基于通用向量DSP的深度学习硬件加速技术
推荐星级:
时间:2019-06-28
大小:1.12MB
阅读数:292
上传用户:xld0932
查看他发布的资源
下载次数
0
所需E币
1
ebi
新用户注册即送 300 E币
更多E币赚取方法,请查看
close
资料介绍
随着深度学习在众多领域发挥着越来越重要的作用, 如何设计高性能、低功耗、低延迟的深度学习硬件加速器成为体系结构领域的研究热点. 本文基于深度学习算法模型的结构和优化方法,分析了深度学习硬件实现中面临的困难和挑战, 并对比当前主流的深度学习硬件加速平台的优势和不足, 提出了基于飞腾{ 迈创通用向量DSP 的深度学习硬件加速方案, 对其向量广播、矩阵转换等加速技术进行了阐述. 并围绕目前通用向量DSP 硬件加速的不足, 对兼顾通用向量计算和专用深度学习计算的可重构计算阵列等优化技术进行了深入的探讨与研究.
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或 联系我们 删除。
相关评论 (下载后评价送E币 我要评论)
没有更多评论了
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书