基于互连的一种FPGA最优功耗延时积设计 | |
作者:马群刚,杨银堂,李跃进 时间:2007-04-28 来源: | |
摘要:为了有效地解决困扰现场可编程门阵列发展的功耗延时积问题,采用集成电路互连的分段式结构和低压摆电路,提出了一种基于互连的最优功耗延时积现场可编程门阵列设计方法。对于产生传输线效应的现场可编程门阵列互连,通过优化互连的段数,在互连最外面的输入端和输出端分别连接低压摆电路的驱动部分和接收部分,在内部的每段互连之间插入最优尺寸的缓冲部分。理论与模拟表明,用这种方法设计的现场可编程门阵列能使功耗延时积减小近一个数量级,同时较好地保持现场可编程门阵列的面积性能。 关键词:现场可编程门阵列互连;RLC模型;分段式结构;低压摆电路;功耗延时积 对于深亚微米集成电路,设计与布图的优化目标已由芯片面积最小调整到互连延时最小和性能的优化。目前,现场可编程门阵列(FPGA)生产已进入0.13μm领域,所以FPGA设计必须尽量避免深亚微米中的二阶、三阶效应,如互连延时和串扰,因为此时的互连延时大大超过门的延时。随着系统功率预算的不断紧缩,迫切需要新型低功耗FPGA器件。尽管现在的FPGA有很好的性能,然而却以牺牲功耗为代价。延时与功耗已经越来越成为阻碍FPGA发展的两个主要因素,所以有必要提供一种低功耗延时积的设计方案。对于一个具有较强的功能实现能力的传统FPGA,90%以上的功耗与互连有关。所以,要设计出一个具有最优功耗延时积的FPGA,必须从互连入手,着重解决FPGA的互连延时和互连功耗。笔者在对基于查找表结构的FPGA(LUT-FPGA)底层电路和物理版图进行研究的基础上,建立了精确的RLC互连模型,分析了互连延时和互连功耗,并对互连引入分段式结构和低压摆电路,这种新型结构可大大降低FPGA的功耗延时积。 基本结构 高层综合的低功耗延时积设计对FPGA功耗延时积的改善程度最高,这种设计要解决的是从行为描述到RTL级描述的转换过程中如何考虑系统的结构,以减少功耗延时积。为了在FPGA结构上作进一步优化,必须在电路级设计中采用合适的结构。笔者对FPGA互连采用分段式结构和低压摆电路。 RCL互连模型 低频时,互连电感L=V/(Iω)=V/(I2πf)可忽略,互连可等效为一个RC网络进行时序和噪声预测。当时钟频率接近1GHz时,线电感的感抗与线电阻的阻抗相当。在一条均衡的有损耗长互连输入端加上单位阶跃信号进行延时分析后发现,如果满足以下条件
那么,忽略线电感将导致20%左右的误差。式(1)中,r,l,c分别表示单位长度的电阻、电感和电容,CL表示负载电容,d表示互连长度,常数n的值介于0.5~1之间。在现代FPGA设计中,判断式(1)是很容易达到的,所以片上电感不能被忽略。电感的引入不仅会增大互连延时,还会导致电压过冲、信号的上升时间减小,从而导致更大的串扰。笔者引入RLC延时模型(见图1),以确切描述互连特性。因为FPGA的互连彼此相邻,互连之间会产生互连间的耦合电容与耦合电,所以用Leff表示互连自感效应和互感效应,用Ceff表示互连自身电容和线间电容,R0表示激励电源的输出电阻。
分段式互连 这里td0是一个无量纲的比例延时。考虑到RC线极限情况下的h解和k解,可得RLC线的h解和k解为 式(3)的误差因子h′和k′用来解释电感效应。当电感接近于0时,两者的值接近于1。结合式(3)的h和k,可得变量
从式(5)可看出,h′和k′只是TL/R的函数。这样,RCL互连线的最佳段值和缓冲器的最优尺寸分别为
低压摆电路 由于SDVST的驱动部分是静态的,所以具有较强的“鲁棒性”。这时,互连的动态功耗E=(Cw+CL)VDDVS,其中Cw是互连线电容,CL是互连负载电容。根据互连功耗占FPGA总功耗的绝大部分这一事实,从互连的动态功耗表达式可得,采用低压摆信号可大大降低FPGA的功耗。几乎所有的低压摆电路技术都把数据总线和较小的互连结构作为研究和处理的对象,因为在较小的互连结构中可确切地知道它的负载电容值,同时在较小的互连结构里还有时钟脉冲来控制低压摆电路。不过。以上情况对整个FPGA互连而言是无效的。因为,对FPGA来说,电容是连线长度(所用的连线段的数目)的一个函数,并且时钟脉冲与FPGA所要实现的电路功能有关。
新型FPGA结构 根据文献,从降低功耗的角度考虑,FPGA最佳的CLB结构是4个3~4输入LUT的群集结构。这种结构可实现5输入的组合逻辑或者进行2位算术运算。图4是一个指出了关键路径(如粗线所示)的逻辑模块的组合,这个模块的端口对应着所有FPGA互连的终端。根据低压摆互连的设计思想,在这种结构的输入端A1,B1,C1,D3,A2,B2,C2,D2,A3,B3,C3,D3和A4,B4,C4,D4上分别加SDVST的接收部分,同时在这种结构的输出端1,2,3和4上加SDVST的驱动部分。
从表中可看出,SDVST-Ⅱ技术比传统技术要好得多,前者的相关参数值是后者的2倍左右。
在版图设计时,把低压摆电路和原来的逻辑块作为一个整体。但在进行功耗延时积的试验分析时,把中间包含分段式互连的低压摆电路作为一个整体。电路仿真采用的是0.25μm6铝CMOS工艺,所分析的互连是一条横跨9条连线段的长距离互连线。经过实验分析以及对不同连线段进行实验结果比较后可知:RLC互连线的最佳段值是9,复接驱动器的最优宽长比是3.5:1。对于低压摆电路,在进行仿真时,VDD的值设置为2V,即FPGA的内部工作电压,VRL的值设置为0.8V,互连的负载电容CL从0到5pF变化,同时晶体管的宽长比保持不变。 模拟分析结果表明,与传统的XC4000A相比,采用新型结构后,FPGA的互连功耗减小70%~80%,互连延时减小10%~20%,新结构的功耗延时积可以降低近一个数量级。新型FPGA的互连功耗随互连电压摆幅的减小而降低,而分段式结构对减小FPGA互连延时效果不明显。新结构不容易减小FPGA互连延时的主要原因有两个:一是低压摆互连的低电流值使得互连延时有所增加,由于分段后的互连变短,这种增加的影响不是很明显;二是传统FPGA开关矩阵中的开关多少起到了一个缓冲器的功能,这有利于减小FPGA的互连延时。 结论 用上述方法设计并实现的具有最优功耗延时积的FPGA新结构不仅可大大降低功耗延时积同时,对于庞大的FPGA电路而言,新增的结构电路对FPGA总面积的影响微乎其微,所以这种新结构对FPGA的面积性能不会产生实质性的影响。 |
标签: FPGA RLC模型 功耗延时积 |
文章评论(0条评论)
登录后参与讨论