目的 本文 介绍广州星嵌 DSP C6657+ Xilinx Z ynq 7035 平台下 Xilinx Z ynq 7035 算力指标 。 基本概念 FLOPs / FLOPS FLOPs , Floating Point Operations ,浮点运算次数,每一个加、减、乘、除操作都算 1FLOPs 操作,常用来衡量模型计算复杂度。 注意下 FLOPS , 注意全大写,是 floating point operations per second 的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标,两者别弄混。 MACs Multiply–Accumulate Operations ,乘加累积操作数,常常被人们与 FLOPs 概念混淆。实际上 1MACs 包含一个乘法操作与一个加法操作,大约包含 2FLOPs 。通常 MACs 与 FLOPs 存在一个 2 倍的关系 。 关系 为什么使用乘加运算指标 (MACs) 呢?因为神经网络运算中内积、乘加运算无处不在: 对于一个 3*3 滤波器在特征图上的一次运算可以表示为: y = w 0 ∗ x 0 + w 1 ∗ x 1 + w 2 ∗ x 2 + w 3 ∗ x 3 + w 4 ∗ x 4 + w 5 ∗ x 5 + w 6 ∗ x 6 + w 7 ∗ x 7 + w 8 ∗ x 8 对于上式,记 w 0 ∗ x 0 +… 为一次乘加,即 1MAC s 。所以对于上式而言共有 9 次乘加,即 9MACs (实际上, 9 次相乘、 9-1 次相加,但为了方便统计,将计算量近似记为 9MACs ,就像算法复杂度通常把 O(N+b) 表示成 O(N) 一样,都只是一种近似) 。 对于上式而言,可以认为执行了 9 次乘法、 9-1 次加法,所以一共是 9+(9-1) 次 FLOPs 。所以近似来看 1FLOPs ≈ 2MAC s 。 ZYNQ PL 端算力指标 参考 Xilinx 官方文档 Zynq-7000 SoC Data Sheet: Overview (DS190) ,可找到 Zynq 7035 PL 端的 MACs 指标值为 1334 GMACs ,约为 2668 GFLOPs ,如下图所示: ZYNQ PL 端算力指标 参考 Xilinx 官方文档 Zynq-7000 SoC Data Sheet: Overview (DS190) ,可找到 Zynq 7035 PL 端的 MACs 指标值为 1334 GMACs ,约为 2668 GFLOPs ,如下图所示: Z ynq 7035 PS 端双 A RM 总运算能力: 2 . 5DMIPS/MHz Per CPU x 1000 MHz x 2 CPU = 5000 DMIPS 。