路径切换-如何使用-有什么中文资料面包板社区

标签: 路径切换

相关博文

Verilog FPGA硬件电路设计之六——脉动矩阵计算矩阵乘法

热度 36

用户442508

2013-10-18 09:55

23400 次阅读|

2 个评论

脉动阵列（ Systolic Array ）计算矩阵乘法（ Array Multiplication ）下一个目标是实现流水线输出，提升硬件资源的利用率。脉动阵列 (Systolic Array) ：数据流同步流过相邻的二维阵列单元的处理器结构，一般不同方向流过不同数据。结构：矩阵计算： C 语言描述每个输出矩阵中的值： For I = 1 to N For J = 1 to N For K = 1 to N C = C + A * B ; 运用 N x N processing units ，输入数据呈批次输入：二维不同数据在同一时钟下依次输入每个处理单元，而后完成乘法并存在其寄存器中。其中每个 PE （处理单元）结构如下：是一个乘加单元 c=c+(a*b) 例子：计算两个３×３矩阵的乘积结构：在 CLK 驱动下的每一个步骤如下 : Clk1: Clk2: Clk3: Clk4: Clk5: Clk6: Clk7: Clk8: 输出功能仿真图：在 start 上升沿到来后的第一个 CLK 上升沿开始计数 Count_start 高电平期间 Cout =1 时，准备 a11 和 b11; Cout =2 时，将数据打入寄存器，并计数出 a11*b11; Cout =3 时，计数 a11*b11+a12*b21 Cout =4 时，计数 a11*b11+a12*b21+a13*b31 Cout =5 时，用寄存器打一拍输出 Y11 。其他类似。时序仿真图：连续运算，中间忘了将乘加单元寄存器清零的情况，功能仿真：每次计算出结果后清零寄存器，修改后的功能仿真图：数据在送入运算单元之前，采用寄存器打一拍，功能仿真图：状态机便于实现控制。状态机控制：功能仿真时序仿真图：

更多...