原创 DC概论五之high fanout

 2009-3-29 19:08  8905 7 7 分类: 工程师职场

dc在综合高扇出的网络的时候，约束优先级是：
1.功能正确
2.DRC（max_transition ,max_fanout,max_capacitance )
3.Setup time （max_delay)
4.Hold time (min_delay)
5. Other...
为了符合drc要求，dc通常花费很多时间来编译和修正这些DRC violators。

路径上的cell延迟由input_transition 和output_load(包括扇出pin上的load）决定，这个由查抄表可以得到。

而net延迟是由net上的R，C决定的。在没有布局布线之前，我们不知道实际的R，C是多少，dc根据互联线模型（set_wire_load_model)来计算出R，C。然后根据得到的R，C计算出net上的延迟：

Net_delay=R*C*OC
其中系数OC是根据操作环境（set_opearting_conditions)中设置的rc树模型得到。
一般的工艺库的操作环境有三种，WORST，TYPICAL，BEST,分别是最差，典型，最坏。

在ic中出现high fanout的情况基本有三种：
1.时钟clock
2.复位reset
3.一般信号

dc中对于高扇出net的处理，基本就是加buffer（前提，如果没有对这条net设置一些约束，比如set_ideal_network,set_dont_touch，后面会讲到），以此来减少cell输出端的负载，从而减少transition time 和delay time，以及max_capacitance。而事实上我们是不希望dc这么处理的，我们希望的是可以在后端版图的时候让后端工具自己加buffer，因为我们不知道真实的high fanout net上的RC，所以不知道应该加怎么样的buffer，dc只是根据互联线模型来计算RC，接着加入buffer，不是真实的，只有布线以后我们才可以得到几乎真实的rc。

所以在dc综合过程中我们要阻止dc最high fanout net进行insert buffer处理。因此这些没被处理的高扇出net就会引起一些drc或者timing错误，在dc中，dc用价值函数（cost function）来判断这些约束对设计的影响。价值函数=DRC violator和+ timing violator 和。一般的，dc会根据所有drc和timing错误，通过使价值函数趋近等于0来修正这些违规。为了达到效果，dc会每次修正一个路径，然后重新计算价值函数，如果价值函数变小，说明设计被改进了。

在介绍如何处理 high fanout net之前，先介绍3个命令。
Set_ideal_net
（已经被set_ideal_network -no_propagate代替）忽略port，pin，net上的时序优化(timing
optimization)，以及drc修正(drc fixxing)。network具有传输型。
Set_dont_touch
（已经被set_dont_touch_network
-no_propagate代替）忽略，port，cell，design，pin上的优化(timing
optimization)，但是不会忽略DRC。network具有传输型

这样我们在综合的时候就要对high fanout net做一定的约束，让dc不对这些net做优化以及加入buffer。下面分三种情况来说明。
1.Clock，对于clock，当我们用create_clock,or creat_generated_clock创建clock的时候，这些clock已经有了ideal_network的属性。Dc已经不会在clock tree上加入buffer，同时也不会计算drc violation，但是delay timing 仍然会被计算。不计算drc不是说没有负载。
2.Reset，对于复位高扇出信号，因为没有那些属性，所以要手动设置,set_ideal_network
3.一般信号。同样需要手动set_ideal_network

下面看例子：

下面看一个高扇出实例，有时钟，有复位还有一般信号
module test(clk,clk_G, d_in ,s_r1, s_r2, rst_N1, rst_N2,dout);
parameter size =1100;
input d_in, rst_N1,rst_N2, s_r1, s_r2,clk_G,clk;

output dout;
reg dout;

reg [size-1:1] tmp;
wire G_clk, rst_N, s_r;
integer i;

assign G_clk = clk & clk_G;
assign rst_N = rst_N1 & rst_N2;
assign s_r = s_r1 & s_r2;

always@(posedge G_clk or negedge rst_N) begin
    if(!rst_N) begin
        dout <= 0;
        tmp <= 0;
    end
    else begin
        dout <= tmp[size-1] | s_r;
        for(i=size-1 ; i>1; i=i-1)
            tmp <= tmp[i-1] | s_r;
        tmp[1] <= d_in | s_r;
    end
end

endmodule
综合脚本：
set lib $env(DC_LIB)
set target_library "slow.db fast.db"
set link_library "* $target_library"
set search_path ". ../src ../scripts $lib"
set hdlin_while_loop_iterations 5000
analyze -format verilog test.v
elaborate test
uniquify
link
check_design
create_clock -period 100 [get_ports clk]
set_operating_conditions -max slow -min fast
set_wire_load_mode top
set_min_library slow.db -min_version fast.db
set input_exp_clk [remove_from_collection [all_inputs] [get_ports clk]]
set_input_delay 60 -clock [get_clocks clk] $input_exp_clk
set_output_delay 30 -clock [get_clocks clk] [all_outputs ]
compile

电路图：

下面是生成的网表的关键几个地方。
AND2X4 U1106 ( .A(clk_G), .B(clk), .Y(G_clk) );
AND2X2 U1340 ( .A(s_r2), .B(s_r1), .Y(n2) );
AND2X2 U2441 ( .A(rst_N2), .B(rst_N1), .Y(n3) );

在没有分析时序前，根据我们已经有的知识，基本上可以知道这几个net上可能存在的问题。
1.较大的延迟，因为每个net上都有1100个负载。
2.drc错误，max_transition,max_capacitance,max_fanout
3.较大的输出转换时间output_transition，尤其是U1340的output_transition作为下一级的input_transition，经过下一级的cell时候会造成更大的延迟。

时序分析

1. clock

可以看到clock tree上没有插入buffer，但是 cell的延迟却很大
2.reset

Dc自动插入了buffer。
3一般信号

Dc同样自动插入了buffer。

下面我们修改一下脚本，如下；
set lib $env(DC_LIB)
set target_library "slow.db fast.db"
set link_library "* $target_library"
set search_path ". ../src ../scripts $lib"
set hdlin_while_loop_iterations 5000
analyze -format verilog test.v
elaborate test
uniquify
link
check_design
create_clock -period 100 [get_ports clk]
set input_exp_clk [remove_from_collection [all_inputs] [get_ports clk]]
set_input_delay 60 -clock [get_clocks clk] $input_exp_clk
set_output_delay 30 -clock [get_clocks clk] [all_outputs ]
set_ideal_network   -no_propagate    [get_nets s_r]
set_ideal_network   -no_propagate    [get_nets rst_N]
compile
重新分析timing
1.       clock

基本和原来一样，cell上仍然有很大延迟。
1.       reset

原来插入的buffer现在没有了。不过令我不明白的是cell上竟然没有大延迟。等知道的朋友解答。
1.       一般信号

同样dc也没有插入延迟，和希望的一样。不过也没有出现大延迟，不是很明白

问题：
虽然设置了set_ideal_net（network），set_dont_touch(network)但是clock上仍然有大延迟。
为了解决这个问题，我们还要继续设置高扇出的选项。
1.       high_fanout_net_threshold，这个变量是用来指出，如果net的扇出个数超过指定值，那么他就是高扇出，同时drc检查，还有延迟计算都是这个数值计算，但是时间上net上的扇出是没有变的。
2.       high_fanout_net_pin_capacitance，结合high_fanout_net_threshold使用的，当net的扇出超过threshold，那么net上的负载等于这2个数值的乘积。
进一步：修改脚本：
set lib $env(DC_LIB)
set target_library "slow.db fast.db"
set link_library "* $target_library"
set search_path ". ../src ../scripts $lib"
set hdlin_while_loop_iterations 5000
analyze -format verilog test.v
elaborate test
uniquify
link
check_design
create_clock -period 100 [get_ports clk]
set input_exp_clk [remove_from_collection [all_inputs] [get_ports clk]]
set_input_delay 60 -clock [get_clocks clk] $input_exp_clk
set_output_delay 30 -clock [get_clocks clk] [all_outputs ]
set_ideal_network   -no_propagate    [get_nets s_r]
set_ideal_network   -no_propagate    [get_nets rst_N]
set high_fanout_net_threshold 60
set high_fanout_net_pin_capacitance 0.01
compile
时序分析：
1.       clock

可以发现cell的延迟已经很合理。
1.       reset

Cell上的延迟和原来一样
1.       一般信号

发现和原来一样。

Apr之后

导出网标，修改约束文件成初始状态，继续分析时序：

可以看出apr工具自动加入了buffer，同时优化了net上的fanout
总结：
为了让dc在综合高扇出的net时候不插入buffer tree和buffer chain，需要使用set_idea_network使这些搞扇出net避免时序优化（timing optimization），时序更新（timing update），drc修正（drc fixxing）。但是这样设置之后，net上的高负载并没有消除，我们需要额外的参数进行设置. high_fanout_net_threshold high_fanout_net_pin_capacitance .以减少dc综合时间，以及减少timing violators report

写原创有奖励！2025面包板原创奖励正在进行中

最新发表 推荐阅读 明星博主 原创博文 年度排行 博文排行博文评论 FPGA/CPLD MCU/ 嵌入式模拟电源/新能源测试测量通信智能手机处理器与DSP PCB 汽车电子消费电子智能硬件物联网软件与OS 采购与分销供应链管理工程师职场 EDA/ IP/ 设计与制造无人机机器人/ AI 医疗电子工业电子管理


 写博文

 点赞（7）

 收藏

分享到： 
 

上一篇： DC概论四之setup time 与 hold time 之三

下一篇： DC 概论六之multicycle_path

PARTNER CONTENT

换一换> 更多>

文章评论（0条评论）
登录后参与讨论

您需要登录后才可以评论登录 | 立即注册

用户193865

文章：94 阅读：371121 评论：7 赞：642

 好友  私信个人主页

文章 94

原创 0

阅读 371121

评论 7

赞 642

最新评论更多

curton : 这种灯质量也不能做的太好了，不然一个小夜灯你用50年，咋还能制造GDP啊寿命问题，是个神秘的问题。人的寿命有史 ...

自做自受 ... 评论博文 2025-6-21

3W小夜灯报废

这种灯质量也不能做的太好了，不然一个小夜灯你用50年，咋还能制造GDP啊

curton 评论博文 2025-6-21

3W小夜灯报废

大概是因为，增强型不驱动时是阻断的，置于恒压电源中，待机是全电路待机，电源也因管子不通而不会被加载。 ...

路青云评论博文 2025-6-20

耗尽型的MOSFET

最新博文

老挂钟，再修理，再失败

老挂钟，修理，失败

3W小夜灯报废

资料下载

本周热帖

电路第5版邱关源教材电子版 ...

C#+WPF开发全自动温湿度控制系统课程 ...

直流转交流：应用于汽车的200VA高频逆 ...

交直流电源，有电路图、PCB和源代码 ...

基于STM32正弦波逆变器设计（分享学习 ...

【资料下载-第三季】电路考试冲刺、30 ...

电子电路大全收藏

晶振起振靠的是什么呢

电子背散射衍射（EBSD）分析入门：晶 ...

三相固态继电器 pw是什么意思 ...

最新资讯

芯语最新

一个VCO全搞定？7倍频程线性音高方案 ...

SiC MOSFET 并联的关键技术

OpenAI奥特曼的权力套现：80家关联公 ...

中国厂商主导蜂窝物联网模块市场，Q1 ...

蔚来芯片业务独立实体落地合肥，李斌 ...

MCU动态加载函数库

6000字干货长文，深度解读智能家居7大 ...

如何处理嵌入式系统中的内存溢出问题 ...

2025年低空经济未来发展趋势分析报告 ...

首次提供单电机全新理想i6申报：李想 ...

EE直播间
更多

Keysight World Tech Day 线上直播-AI 驱动的超高速传输测试分论坛直播时间： 06月26日 13:30

材料介电常数的精确表征和测试直播时间： 07月03日 10:00

在线研讨会
更多

Mercury基于展频技术的医疗时钟EMI抑制方案

AI 巨型芯片，性能越强，测试越难，如何破局？

利用先进精密仪器仪表解决方案，优化研发并加快产品上市

ST 在大功率热管理系统中的电机控制系统方案（AI 数据中心/暖通空调/电池储能系统/变频制冷）

热门推荐

从ADAS到全自动驾驶演进
TI 创新雷达传感技术牛在哪？
自动驾驶的未来在何处？
震惊！这家半导体公司竟隐藏着如此多黑科技

我要评论

 0

 7



 分享到微信

 分享到微博

 分享到QQ

 点击右上角，分享到朋友圈我知道啦

请使用浏览器分享功能我知道啦

关闭站长推荐 /4

2025第1期拆解活动：赢示波器、运动相机、热像仪等！

示波器、影石运动全景相机、大疆无人机、高清红外热成像仪；树莓派5等等

【下载】电源设计工程师指南（共542页）

本书共542页，深受设计工程师欢迎，作为硅基与第三代半导体的实用工具书，本手册将成为专业技术人员实现优化功率和小信号开关、电源转换和管理的必备指南。

【2025面包板社区内容狂欢节】发帖/回帖赢25万E币！

活动时间：即日起——2025年全年（发完20万E币为止！）

社区内容发布、审核与管理！

严厉打击刷流量发广告等行为

原创 DC概论五之high fanout

文章评论（0条评论）