技术解析:随着深度学习的发展带动视频图像处理及算法的大规模应用,GPU异构运算带来的数据交互引起的瓶颈越显突出。因此我们想到在边缘计算中,让数据长期处在同一位置,减少数据搬运所带来的损耗。利用GPU硬件解码,让视频数据和图像数据的产生来源由原来的CPU内存转移到GPU的显存,并在此基础上继续进行深度学习的运算到产生结果后,仅需要将结果进行一次数据搬运即可。
GPU硬件解码是嵌入式物联网显卡独特的解码芯片进行的数据处理,其运行过程只需要占用整个显卡的显存部分,不需要占用CPU的计算资源,使用GPU解码技术,可以更高效地使用GPU的全部资源,并且可以保证由视频产生的图像存放在GPU 的显存中,可以直接进行深度学习的运算。与此同时,降低了原有使用CPU解码时对CPU的压力,可以释放更多的CPU资源来做更多的事情。
GPU的广泛使用极大地推动了人工智能的发展,GPU硬件解码技术又更好的将深度学习技术引入新的高度,随着技术的成熟,将会有更多更好更实用的产品面世,将一个个不可能变为可能。
瑞迅科技及专业算法团队结合应用趋势实现MPC-1911深度学习方向的深挖,尤其在现有深度学习应用平台上实现目标识别----即不仅可以识别出是什么物体,还可以预测物体的位置,位置一般用边框标记; 仓库优化----通过深度学习,训练机器人用最优的路径来存取货物。生物信息学---利用深度学习技术,对大量生物学数据进行收集和筛选,通过提取相关特征属性,建立合适的模型,可用于药物临床试验之前的疗效预测、疾病诊断等领域。
CPU | i.MX6D | i.MX6Q | RK3399 |
内存 | 2GB | 2GB | 2GB |
OS版本 | Android4.4.2 | Android4.4.2 | Android7.1.2 |
3D性能 | 568 | 522 | 14217 |
UX性能 | 5898 | 6401 | 25027 |
CPU性能 | 6967 | 8317 | 22757 |
RAM性能 | 2030 | 2199 | 4460 |
总分 | 15463 | 17439 | 66461 |
此外:瑞迅作为瑞芯微的战略合作伙伴,将很快启动基于3399Pro的芯片的硬件产品方案,如下一张图就能展示出此款芯片的性能。数据显示,在最重要的NPU关键运算性能方面,苹果A11惨成了渣,瑞芯微RK3399Pro 2.4TOPs的运算能力超出想象。芯微RK3399Pro则是CES2018首发亮相的新品。CPU采用big.LITTLE大小核架构,双核Cortex-A72加四核Cortex-A53。GPU采用四核Mali-T860。同样采用了专用NPU硬件的架构设计。支持8bit与16bit运算,可兼容不同的软件框架; 解决方案性价比更高,利于量产与商用。还具备高扩展性能等特点。