tag 标签: 数据路径

相关博文
  • 热度 36
    2013-10-18 09:55
    20226 次阅读|
    2 个评论
    脉动阵列( Systolic Array )计算矩阵乘法( Array Multiplication ) 下一个目标是实现流水线输出,提升硬件资源的利用率。 脉动阵列 (Systolic Array) :数据流同步流过相邻的二维阵列单元的处理器结构,一般不同方向流过不同数据。 结构: 矩阵计算: C 语言描述每个输出矩阵中的值: For I = 1 to N      For J = 1 to N           For K = 1 to N                C = C + A * B ; 运用 N x N processing units ,输入数据呈批次输入: 二维不同数据在同一时钟下依次输入每个处理单元,而后完成乘法并存在其寄存器中。     其中每个 PE (处理单元)结构如下: 是一个乘加单元   c=c+(a*b)   例子:计算两个3×3矩阵的乘积 结构:     在 CLK 驱动下的每一个步骤如下 : Clk1:   Clk2: Clk3: Clk4:          Clk5:     Clk6: Clk7: Clk8: 输出 功能仿真图: 在 start 上升沿到来后的第一个 CLK 上升沿开始计数 Count_start 高电平期间 Cout =1 时,准备 a11 和 b11; Cout =2 时,将数据打入寄存器,并计数出 a11*b11; Cout =3 时,计数 a11*b11+a12*b21 Cout =4 时,计数 a11*b11+a12*b21+a13*b31 Cout =5 时,用寄存器打一拍输出 Y11 。 其他类似。 时序仿真图: 连续运算,中间忘了将乘加单元寄存器清零的情况,功能仿真: 每次计算出结果后清零寄存器,修改后的功能仿真图: 数据在送入运算单元之前,采用寄存器打一拍,功能仿真图:       状态机便于实现控制。 状态机控制:功能仿真 时序仿真图:  
相关资源
  • 所需E币: 0
    时间: 2020-9-28 18:59
    大小: 589.98KB
    上传者: LGWU1995
    Kionix三轴加速度传感器的高级数据路径功能简介
  • 所需E币: 5
    时间: 2019-12-25 12:43
    大小: 7.87MB
    上传者: quw431979_163.com
    高性能ARMCortex-A8的全自动实现DESIGNSTRATEGIESANDMETHODOLOGIES高性能ARMCortexTM-A8的全自动实现Cortex-A8可综合嵌入式应用处理器用于提高代码密度的Thumb-2指令集和作者ARMCortex-A8微处理器是ARMVFPv3浮点架构。StuartRiches的Cortex系列中首个应用处理器。TM该处ARM理器性能优、功效高,主要针对各种移动随着移动和消费类产品用户数量的和消费类应用,包括移动电话、机顶盒、增加,迅速推出新品非常关键,采用完全GaryPowellJoeWalston游戏机及汽车导航或娱乐系统。Cortex-可综合的Cortex-A8处理器就能加速这一BillSicaras……