tag 标签: systolic

相关博文
  • 热度 21
    2012-8-22 09:17
    2673 次阅读|
    5 个评论
             这节主要讲解脉动型(Systolic)FIR滤波器设计。          脉动型FIR滤波器是对直接型的升级,在每个操作后都加入流水线级,每个动作都打一拍,就跟心脏跳动一样,因此称为脉动型,这种结构非常适用于高速数据流的处理。如图1所示为脉动型FIR滤波器结构。 图1          与直接型结构不同的是,输入数据到下一个处理单元都需要打2拍,这是为了使乘法后的累加数据同步,下面推导验证:          x(n)为输入数据,yt(n)为直接型结构的输出          yt(n)=x(n)h(0)+x(n-1)h(1)+x(n-2)h(2)…x(n-10)h(10)          ys(n)为脉动型结构的输出,如图1中有P1、P2…P10共10个节点          P1=x(n-4)h(0)          P2=(P1 + x(n-5)h(1))*Z -1 =x(n-5)h(0) + x(n-6)h(1)          …          P10=(P9 + x(n-23)h(10))*Z -1          ys(n)=x(n-14)h(0) + x(n-15)h(1) + … + x(n-23)h(9)+ x(n-24)h(10)          由ys(n)和yt(n)的表达式,可以推导出 ys(n)=yt(n-14)          因此脉动型FIR 滤波器的延迟较大          如图2所示为11抽头系数脉动型FIR滤波器FPGA实现结构(实例与前几节相同),穿了一层“衣服”,采用Xilinx FPGA中的DSP48E1实现,基本处理单元中的操作都可在一个DSP48E1中完成,输入数据经过DSP48E1中寄存2拍后通过ACOUT输出,直接连接到下一个DSP48E1中的ACIN端口,累加输出PCOUT直接连接到下一个DSP48E1中的PCIN端口,这些连接都没有经过FPGA的Fabric连线逻辑,而是通过DSP Block的内部走线连接,这样实现能够缩短路径的延时。 图2          编写了相关代码,综合结果如下:          Number of Slice Registers: 4         Number of Slice LUTs: 19          Number of DSP48E1s: 11          Minimum period:   3.006ns{1}   (Maximum frequency: 332.668MHz)          线性相位实现 :          与前几节相同,由于FIR滤波器的线性相位特性,相对应有线性相位的实现结构,如图3所示,利用DSP48E1中预加器实现乘法前的加法操作。对于脉动型FIR滤波器的线性相位结构有很多注意点,其中预加器数据的配对,常规情况下,此例中应是x(n)和x(n-10)、x(n-1)和x(n-9)、x(n-2)和x(n-8)、x(n-3)和x(n-7)、x(n-4)和x(n-6),而图3中结构,加入了延时11的移位寄存器,预加器配对的数据为x(n-2)和n(n-12)、x(n-4)和x(n-12)、x(n-6)和x(n-12)、x(n-8)和x(n-12)、x(n-10)和x(n-12),可以发现预加器配对数据中有一个数据始终是x(n-12),但是每一个配对数据的相对延时与常规情况下相同:10、8、6、4和2。 图3          而各节点P1、P2、P3、P4、P5和y(n)的表达式如下          P1=x(n-5)h(0) + x(n-15)h(0)          P2=( P1 + (x(n-6)h(1) + x(n-14)h(1)) )Z -1 =x(n-6)h(0) + x(n-16)h(0) + x(n-7)h(1) + x(n-15)h(1)          P3=( P2 + (x(n-8)h(2) + x(n-14)h(2)) )Z -1 =x(n-7)h(0) + x(n-17)h(0) + x(n-8)h(1) + x(n-16)h(1) + x(n-9)h(2) + x(n-15)h(2)          P4=( P3 + (x(n-10)h(3) + x(n-14)h(3)) )Z -1 =x(n-8)h(0) + x(n-18)h(0) + x(n-9)h(1) + x(n-17)h(1) + x(n-10)h(2) + x(n-16)h(2) + x(n-11)h(3) + x(n-15)h(3)          P5=( P4 + (x(n-12)h(4) + x(n-14)h(4)) )Z -1 =x(n-9)h(0) + x(n-19)h(0) + x(n-10)h(1) + x(n-18)h(1) + x(n-11)h(2) + x(n-17)h(2) + x(n-12)h(3) + x(n-16)h(3) + x(n-13)h(4) + x(n-15)h(4)          y(n)=(P5 + x(n-14)h(5))Z -1 = x(n-10)h(0) + x(n-20)h(0) + x(n-11)h(1) + x(n-19)h(1) + x(n-12)h(2) + x(n-18)h(2) + x(n-13)h(3) + x(n-17)h(3) + x(n-14)h(4) + x(n-16)h(4) + x(n-15)h(5)          因抽头系数对称,由h(0)=h(10),h(1)=h(9),h(2)=h(8),h(3)=h(7),h(4)=h(6)可得          y(n)= x(n-10)h(0) + x(n-11)h(1) + x(n-12)h(2) + x(n-13)h(3) + x(n-14)h(4) + x(n-15)h(5) + x(n-16)h(6) + x(n-17)h(7) + x(n-18)h(8) + x(n-19)h(9) + x(n-20)h(10)          验证得到y(n)=yt(n-10) , 比普通脉动结构延时小,但是相比于其他结构的 FIR 滤波器延时还是较大的。          编写了相关代码,综合结果如下:          Number of Slice Registers: 84         Number of Slice LUTs: 99          Number of DSP48E1s: 6          Minimum period:   3.256ns{1}   (Maximum frequency: 307.125MHz)   相关代码(见附件) : 脉动结构:fir_systolic 线性相位脉动结构:fir_systolic_lin
相关资源