基于FPGA的并行FIR滤波器学习Verilog代码设计

楼主

e来e去

574 主题
583 帖子
3526 积分

身份：LV5 资深技术员

E币：1325

发消息

 705

 0

发表于 2023-11-30 17:53:20

显示全部楼层

《FPGA实验-学习并行FIR滤波器Verilog设计》

1，数字滤波器

数字滤波器从实现结构上划分，有FIR和IIR两种。FIR的特点是：线性相位、消耗资源多；IIR的特点是：非线性相位、消耗资源少。由于FIR系统的线性相位特点，设计中绝大多数情况都采用FIR滤波器。

线性相位系统的意义，这里的线性相位指的是在设计者关心的通带范围内，LTI系统满足线性相位要求：

从延时的角度看：保证了输入信号的相位响应是线性的，即保证了输入信号的延时特性。

从相位的角度看：输入的各频率成分的信号之间，相对相位是固定的。通过线性相位系统后，相对相位关系保持不变。

对于关心相位的系统，比如调制解调系统，需要使用FIR滤波器；对于只关心频率成分的系统，比如只是提取某一频率分量，为了节省资源，使用IIR滤波器即可。

2，FIR滤波器

FIR的最大特点就是其系统响应 h(n)是一个N点的有限长序列，FIR的输出y(n)本质上就是输入信号x(n)和h(n)的卷积（根据傅里叶变换性质，时域卷积等于频域相乘，因此卷积相当于筛选频谱中的各频率分量的增益倍数，某些频率分量保留，某些频率分量衰减，从而实现滤波效果）。FIR在实现上的本质是带抽头延迟的加法器和乘法器的组合，每一个乘法器对应一个系数。

由理论知识可知，只有当FIR的h(n)对称时，FIR滤波器才具有线性相位特性。使用MATLAB等工具设计FIR时，得到的h(n)也都是具有对称性的。

FIR滤波器的实现结构主要有直接型、级联型、频率取样型、格型四种。其中最适合FPGA实现的是直接型。“直接”是指直接由卷积公式得到：

实现结构

FIR滤波器的设计方法有窗函数法、频率取样法、等波纹切比雪夫逼近法（也叫最优设计法）等等。以上所有的理论知识点在任意一本数字信号处理课本中都有详细的推论，本文节省篇幅不再赘述。

3，MATLAB设计

虽然Quartus和Vivado的FIR IP核中都提供了设计FIR滤波器的功能，但远没有MATLAB设计便捷和强大。设计中通常都是在MATLAB中设计好FIR的单位脉冲响应h(n)，或者说滤波器系数，量化后应用到FPGA设计中。,

MATLAB提供了基于窗函数设计法的fir1函数、设计任意响应滤波器的fir2函数、最优设计法的firpm函数，以及两个应用程序包“Filter Builder”和“Filter Design&Analysis”，后者通常也被称作FDATOOL。现在最受欢迎的设计方式恐怕就是使用FDATOOL工具，功能强大、界面便捷，且可以直接导出xilinx公司IP核所需的coe文件。

本系列主要是讲述FPGA设计，不详细讨论上述函数及工具的使用，具体情况可以的MATLAB的help中查询。（Ps：博主目前的几个系列都处于开篇阶段，篇幅不多，暂未成体系，目前不再开新坑，等后期应该会出一个“MATLAB数字信号处理系列”）

4，FPGA设计

从MATLAB到FPGA最重要的工作便是滤波器系数的量化。现在的计算机大多都是64位的，然而为了节省资源，FPGA中进行如此高位宽的运算步进浪费资源而且也没有必要。在MATLAB中将滤波器系数量化为指定位宽，会改变滤波器的频率特性，因此需要做好仿真，确定量化后的系数也能满足FIR的设计需求。,

由上节可知FPGA最方便实现的是直接型结构FIR，实现时可以采用并行结构、串行结构、分布式结构，也可以直接使用Quartus和Vivado提供的FIR IP核。本篇先介绍并行FIR滤波器的Verilog设计。设计参考自杜勇老师的《数字滤波器的MATLAB与FPGA实现》。本设计将在Vivado环境下进行仿真。

使用MATLAB设计一个2kHz采样，500Hz截止的15阶低通滤波器（h(n)长度为16），量化位数为12bit，输入信号位宽也为12bit。Verilog设计代码如下。

//////////////////////////////////////////////////////////////////////////////////////////////////

模块接口：

module Xilinx_FIR_Guide_liuqi

(

input rst, //复位信号，高电平有效

input clk, //FPGA系统时钟，频率为2kHz

input signed [11:0] Xin, //数据输入频率为2khZ

output signed [28:0]Yout //滤波后的输出数据

);

////////////////////////////////////////////////////////////////////////////////////////////////

输出信号的29bit位宽是全分辨率输出，没有截位。“并行”FIR指的是多个乘法器并行地进行滤波器系数与输入数据之间的乘法计算，因此代码中我们需要缓存16个数据：

////////////////////////////////////////////////////////////////////////////////////////////

reg signed[11:0] Xin_Reg[15:0]; //[11:0]指单数据12bit位宽；[15:0]指共有16个数据

reg [3:0] i,j;

always @(posedge clk or posedge rst)

if (rst)

//初始化寄存器值为0

begin

for (i=0; i<15; i=i+1)

Xin_Reg=12'd0;

end

else

begin

for (j=0; j<15; j=j+1) //每个时钟移位一个数据

Xin_Reg[j+1] <= Xin_Reg[j];

Xin_Reg[0] <= Xin;

end

//////////////////////////////////////////////////////////////////////////////////////////////////

由FIR系数的对称性可知，16个系数只需要8个乘法器即可，因此应该将对称系数多对应的输入数据相加：

/////////////////////////////////////////////////////////////////////////////////////////////////////

reg signed [12:0] Add_Reg[7:0];

always @(posedge clk or posedge rst)

if (rst)

//初始化寄存器值为0

begin

for (i=0; i<8; i=i+1)

Add_Reg=13'd0;

end

else

begin

for (i=0; i<8; i=i+1) //对称系数相加

Add_Reg={Xin_Reg[11],Xin_Reg}+{Xin_Reg[15-i][11],Xin_Reg[15-i]};

end

//////////////////////////////////////////////////////////////////////////////////////////////

由于加法会增加一个bit位宽，因此相加结构扩充为13bit。由于输入数据为二进制补码带符号数，因此在相加前需要先使用Verilog中的拼接运算符{}扩展符号位到最高位。接下来例化8个乘法器IP核进行乘法运算：

//////////////////////////////////////////////////////////////////////////////////////////////

wire signed [11:0] coe[7:0] ; //滤波器为12比特量化数据

wire signed [24:0] Mout[7:0]; //乘法器输出为25比特数据

assign coe[0]=12'h000;

assign coe[1]=12'hffd;

assign coe[2]=12'h00f;

assign coe[3]=12'h02e;

assign coe[4]=12'hf8b;

assign coe[5]=12'hef9;

assign coe[6]=12'h24e;

assign coe[7]=12'h7ff;

mult_gen_0Umult0 (

.CLK (clk),

.A (coe[0]),

.B (Add_Reg[0]),

.P (Mout[0]));

mult_gen_0Umult1 (

.CLK (clk),

.A (coe[1]),

.B (Add_Reg[1]),

.P (Mout[1]));

mult_gen_0Umult2 (

.CLK (clk),

.A (coe[2]),

.B (Add_Reg[2]),

.P (Mout[2]));

mult_gen_0Umult3 (

.CLK (clk),

.A (coe[3]),

.B (Add_Reg[3]),

.P (Mout[3]));

mult_gen_0Umult4 (

.CLK (clk),

.A (coe[4]),

.B (Add_Reg[4]),

.P (Mout[4]));

mult_gen_0Umult5 (

.CLK (clk),

.A (coe[5]),

.B (Add_Reg[5]),

.P (Mout[5]));

mult_gen_0Umult6 (

.CLK (clk),

.A (coe[6]),

.B (Add_Reg[6]),

.P (Mout[6]));

mult_gen_0Umult7 (

.CLK (clk),

.A (coe[7]),

.B (Add_Reg[7]),

.P (Mout[7]));

//////////////////////////////////////////////////////////////////////////////////////////////

12bit的滤波器系数与13bit的输入信号数据相乘结果为25bit。乘法结果累加即为滤波器的输出结果：

//////////////////////////////////////////////////////////////////////////////////////////////

reg signed [28:0] sum;

reg signed [28:0] yout;

reg [3:0] k;

always @(posedge clk or posedge rst)

if (rst)

begin

sum = 29'd0;

yout <= 29'd0;

end

else

begin

yout <= sum;

sum = 29'd0;

for (k=0; k<8; k=k+1)

sum = sum+Mout[k]; //相加输出结果

end

assign Yout = yout;

//////////////////////////////////////////////////////////////////////////////////////////////

8个25bit的数相加，结果可能扩展到29bit，这也是全分辨率输出的结果。可以看到并行结构的FIR乘法、加法运算都是在一个时钟内完成，因此每个时钟都能获得一个输出。

仿真与工程下载：

使用MATLAB生成一个200Hz+800Hz的混合频率信号，写入txt文件，再生成一个噪声信号写入txt文件。

对正弦信号的滤波如下图所示：

明显看到经过500Hz低通滤波器滤波后，输入的200Hz+800Hz信号只剩下200Hz的频率分量。

对噪声信号的滤波如下图所示：

写原创有奖励！2025面包板原创奖励正在进行中

 举报



 

  0

您需要登录后才可以评论登录立即注册

热门资料

电子电路分析考试题目+学习思维导图 ...

电动车无刷控制器成熟量产方案(含原理图 ...

初级无刷电机设计学习资料

无刷电机资料大全（基本原理+接线方法+ ...

无刷电机原理图大全

热门活动

WAIC独家议程公开！Arm携阿里云/小鹏/联想揭秘AI落地密码
WAIC重磅专场|从云端到机器人，深度揭秘Arm CSS如何重塑AI基础设施
如何通过半导体技术提升光伏与储能系统的效率？
揭秘：新一代半导体器件如何提升测试电源的性能
超越单处理器嵌入式系统的演进

技术文库

BUCK电路LC低通滤波器的传递函数，如何 ...

【PCB_117】PCB布局实操

DFMA之简化设计

为什么你的高频PCB总出问题？这10个被忽 ...

运算放大器常见基本应用电路 ...

全部回复 0

暂无评论，快来抢沙发吧

开启智能 “芯” 未来：2025 MCU及嵌入式技术论坛火热来袭
ADI四大精密测量方案解析：从阻抗分析到高压SMU实战应用

可编程器件

版主: whik

交流可编程器件技术，FPGA爱好者的最佳学习平台
展开更多

帖子 899

回复 1814

置顶 2025世界人工智能大会(WAIC）| Arm携阿里云/小鹏/联想揭秘AI落地密码

置顶免费报名开启智能 “芯” 未来：2025 MCU及嵌入式技术论坛火热来袭！！…

置顶【2025面包板社区内容狂欢节】发文、回帖赢25万E币！

置顶精华1 社区内容发布、审核与管理！严厉打击刷流量发广告等行为

精华2 ESP32WIFI测试工具（WIFI杀手）

精华2 【STM32F103C8T6教程】（九）DHT11温湿度计【应用】

评测文章

【六岳微LY-F335开发板】+初识篇

《电感应用分析精粹：从磁能管理到开关电源设计》读书笔记

【凌鸥创芯LKS32MC034DOF6Q8】+调试中的困惑

【芯旺32位MCU KF32A156 开发板】介绍、环境搭建、工程测试

【富芮坤FR3068x-C】+经典蓝牙音乐A2DP 音乐播放测试

【Milk-V Duo 开发板】温湿度计，小白入门项目

【凌鸥创芯LKS32MC453RCT8】+ 移植RT-Thread + 串口日志与点灯

【凌鸥创芯LKS32MC034DOF6Q8】+ 电机运行测试

【凌鸥创芯LKS32MC034DOF6Q8】+ 电机运行测试

免费申请

热帖

【E币话题】电子工程师深圳月薪15K，够吗？
走了，华为 —— 38岁起步，不算太晚。
【变废为宝】联想电脑自带鼠标，你看这质量
【变废为宝】紫外消毒灯拆解
【变废为宝】出口小音箱拆解
【E币话题】做嵌入式，硬件方向好还是软件
【变废为宝】光控开关的拆解和原理分析
【变废为宝】将智能插座接入米家，告别多个
C语言中如何将long数据转换成char型数据输
【变废为宝】高端音箱控制器拆解

大家都在看的技术资料

基于蓝牙技术的汽车驾驶盘控制系统

滤波器有哪些分类?这些滤波器使用注意事项你都知道吗?

一看就懂！动画讲解LC振荡器的工作原理

光耦使用经验贴，大佬传授光耦实用技巧

基于ARM的智能家居控制通信控制站的设计与实现

干式变压器有何优缺点?干式变压器的应用+保护方式介绍

为何要发展电源管理芯片?如何选择电源管理芯片?

51单片机数码管显示跑马灯程序源代码讲解

芯视频

更多>

03:59

高速数字化仪：高精度信号捕获的终极利器

德思特测试测量

 118

十万块一颗的芯片值不值？ADM处理器CPU。#半导体#电子

ICMAN触摸芯片之金属触摸应用

如何使用德思特EMC自动化测试软件RadiMation执行BCI测试（06）-正式测试

如何使用德思特EMC自动化测试软件RadiMation执行BCI测试--03选择相应设备

修好视频

最新资讯