原创 DC概论五之high fanout （ZZ）

 2009-11-18 14:08  4699 7 7 分类: 工程师职场

http://bb2hh.blogbus.com/logs/20818986.html

在阅读本篇之前，请先阅读http://bb2hh.blogbus.com/logs/20563101.html，了解一下fanout的影响。

dc在综合高扇出的网络的时候，约束优先级是：
1.功能正确
2.DRC（max_transition ,max_fanout,max_capacitance )
3.Setup time （max_delay)
4.Hold time (min_delay)
5. Other...
为了符合drc要求，dc通常花费很多时间来编译和修正这些DRC violators。

路径上的cell延迟由input_transition 和output_load(包括扇出pin上的load）决定，这个由查抄表可以得到。

而net延迟是由net上的R，C决定的。在没有布局布线之前，我们不知道实际的R，C是多少，dc根据互联线模型（set_wire_load_model)来计算出R，C。然后根据得到的R，C计算出net上的延迟：

Net_delay=R*C*OC
其中系数OC是根据操作环境（set_opearting_conditions)中设置的rc树模型得到。
一般的工艺库的操作环境有三种，WORST，TYPICAL，BEST,分别是最差，典型，最坏。

在ic中出现high fanout的情况基本有三种：
1.时钟clock
2.复位reset
3.一般信号

dc中对于高扇出net的处理，基本就是加buffer（前提，如果没有对这条net设置一些约束，比如set_ideal_network,set_dont_touch，后面会讲到），以此来减少cell输出端的负载，从而减少transition time 和delay time，以及max_capacitance。而事实上我们是不希望dc这么处理的，我们希望的是可以在后端版图的时候让后端工具自己加buffer，因为我们不知道真实的high fanout net上的RC，所以不知道应该加怎么样的buffer，dc只是根据互联线模型来计算RC，接着加入buffer，不是真实的，只有布线以后我们才可以得到几乎真实的rc。

所以在dc综合过程中我们要阻止dc最high fanout net进行insert buffer处理。因此这些没被处理的高扇出net就会引起一些drc或者timing错误，在dc中，dc用价值函数（cost function）来判断这些约束对设计的影响。价值函数=DRC violator和+ timing violator 和。一般的，dc会根据所有drc和timing错误，通过使价值函数趋近等于0来修正这些违规。为了达到效果，dc会每次修正一个路径，然后重新计算价值函数，如果价值函数变小，说明设计被改进了。

在介绍如何处理 high fanout net之前，先介绍3个命令。
Set_ideal_net （已经被set_ideal_network -no_propagate代替）忽略port，pin，net上的时序优化(timing optimization)，以及drc修正(drc fixxing)。network具有传输型。
Set_dont_touch （已经被set_dont_touch_network -no_propagate代替）忽略，port，cell，design，pin上的优化(timing optimization)，但是不会忽略DRC。network具有传输型

这样我们在综合的时候就要对high fanout net做一定的约束，让dc不对这些net做优化以及加入buffer。下面分三种情况来说明。
1.Clock，对于clock，当我们用create_clock,or creat_generated_clock创建clock的时候，这些clock已经有了ideal_network的属性。Dc已经不会在clock tree上加入buffer，同时也不会计算drc violation，但是delay timing 仍然会被计算。不计算drc不是说没有负载。
2.Reset，对于复位高扇出信号，因为没有那些属性，所以要手动设置,set_ideal_network
3.一般信号。同样需要手动set_ideal_network

下面看例子：

下面看一个高扇出实例，有时钟，有复位还有一般信号
module test(clk,clk_G, d_in ,s_r1, s_r2, rst_N1, rst_N2,dout);
parameter size =1100;
input d_in, rst_N1,rst_N2, s_r1, s_r2,clk_G,clk;

output dout;
reg dout;

reg [size-1:1] tmp;
wire G_clk, rst_N, s_r;
integer i;

assign G_clk = clk & clk_G;
assign rst_N = rst_N1 & rst_N2;
assign s_r = s_r1 & s_r2;

always@(posedge G_clk or negedge rst_N) begin
    if(!rst_N) begin
        dout <= 0;
        tmp <= 0;
    end
    else begin
        dout <= tmp[size-1] | s_r;
        for(i=size-1 ; i>1; i="i-1")
            tmp <= tmp[i-1] | s_r;
        tmp[1] <= d_in | s_r;
    end
end

endmodule
综合脚本：
set lib $env(DC_LIB)
set target_library "slow.db fast.db"
set link_library "* $target_library"
set search_path ". ../src ../scripts $lib"
set hdlin_while_loop_iterations 5000
analyze -format verilog test.v
elaborate test
uniquify
link
check_design
create_clock -period 100 [get_ports clk]
set_operating_conditions -max slow -min fast
set_wire_load_mode top
set_min_library slow.db -min_version fast.db
set input_exp_clk [remove_from_collection [all_inputs] [get_ports clk]]
set_input_delay 60 -clock [get_clocks clk] $input_exp_clk
set_output_delay 30 -clock [get_clocks clk] [all_outputs ]
compile

电路图：

下面是生成的网表的关键几个地方。
AND2X4 U1106 ( .A(clk_G), .B(clk), .Y(G_clk) );
AND2X2 U1340 ( .A(s_r2), .B(s_r1), .Y(n2) );
AND2X2 U2441 ( .A(rst_N2), .B(rst_N1), .Y(n3) );

在没有分析时序前，根据我们已经有的知识，基本上可以知道这几个net上可能存在的问题。
1.较大的延迟，因为每个net上都有1100个负载。
2.drc错误，max_transition,max_capacitance,max_fanout
3.较大的输出转换时间output_transition，尤其是U1340的output_transition作为下一级的input_transition，经过下一级的cell时候会造成更大的延迟。

时序分析

1.       clock

可以看到clock tree上没有插入buffer，但是 cell的延迟却很大

2.reset

Dc自动插入了buffer。

3一般信号

Dc同样自动插入了buffer。

下面我们修改一下脚本，如下；

set lib $env(DC_LIB)

set target_library "slow.db fast.db"

set link_library "* $target_library"

set search_path ". ../src ../scripts $lib"

set hdlin_while_loop_iterations 5000

analyze -format verilog test.v

elaborate test

uniquify

link

check_design

create_clock -period 100 [get_ports clk]

set input_exp_clk [remove_from_collection [all_inputs] [get_ports clk]]

set_input_delay 60 -clock [get_clocks clk] $input_exp_clk

set_output_delay 30 -clock [get_clocks clk] [all_outputs ]

set_ideal_network   -no_propagate    [get_nets s_r]

set_ideal_network   -no_propagate    [get_nets rst_N]

compile

重新分析timing

1.       clock

基本和原来一样，cell上仍然有很大延迟。

1.       reset

原来插入的buffer现在没有了。不过令我不明白的是cell上竟然没有大延迟。等知道的朋友解答。

1.       一般信号

同样dc也没有插入延迟，和希望的一样。不过也没有出现大延迟，不是很明白

问题：

虽然设置了set_ideal_net（network），set_dont_touch(network)但是clock上仍然有大延迟。

为了解决这个问题，我们还要继续设置高扇出的选项。

1.       high_fanout_net_threshold，这个变量是用来指出，如果net的扇出个数超过指定值，那么他就是高扇出，同时drc检查，还有延迟计算都是这个数值计算，但是时间上net上的扇出是没有变的。

2.       high_fanout_net_pin_capacitance，结合high_fanout_net_threshold使用的，当net的扇出超过threshold，那么net上的负载等于这2个数值的乘积。

进一步：修改脚本：

set lib $env(DC_LIB)

set target_library "slow.db fast.db"

set link_library "* $target_library"

set search_path ". ../src ../scripts $lib"

set hdlin_while_loop_iterations 5000

analyze -format verilog test.v

elaborate test

uniquify

link

check_design

create_clock -period 100 [get_ports clk]

set input_exp_clk [remove_from_collection [all_inputs] [get_ports clk]]

set_input_delay 60 -clock [get_clocks clk] $input_exp_clk

set_output_delay 30 -clock [get_clocks clk] [all_outputs ]

set_ideal_network   -no_propagate    [get_nets s_r]

set_ideal_network   -no_propagate    [get_nets rst_N]

set high_fanout_net_threshold 60

set high_fanout_net_pin_capacitance 0.01

compile

时序分析：

1.       clock

可以发现cell的延迟已经很合理。

1.       reset

Cell上的延迟和原来一样

1.       一般信号

发现和原来一样。

Apr之后

导出网标，修改约束文件成初始状态，继续分析时序：

可以看出apr工具自动加入了buffer，同时优化了net上的fanout

总结：

为了让dc在综合高扇出的net时候不插入buffer tree和buffer chain，需要使用set_idea_network使这些搞扇出net避免时序优化（timing optimization），时序更新（timing update），drc修正（drc fixxing）。但是这样设置之后，net上的高负载并没有消除，我们需要额外的参数进行设置. high_fanout_net_threshold high_fanout_net_pin_capacitance .以减少dc综合时间，以及减少timing violators report

写原创有奖励！2025面包板原创奖励正在进行中

最新发表 推荐阅读 明星博主 原创博文 年度排行 博文排行博文评论 FPGA/CPLD MCU/ 嵌入式模拟电源/新能源测试测量通信智能手机处理器与DSP PCB 汽车电子消费电子智能硬件物联网软件与OS 采购与分销供应链管理工程师职场 EDA/ IP/ 设计与制造无人机机器人/ AI 医疗电子工业电子管理


 写博文

 点赞（7）

 收藏

分享到： 
 

上一篇：关于library和operating conditions

下一篇： set_drive 和 set_clock_transition 的问题

PARTNER CONTENT

换一换> 更多>

ST移动安全解决方案：构建全场景安全连接生态

赵明灿 2025-05-12

文章评论（0条评论）
登录后参与讨论

您需要登录后才可以评论登录 | 立即注册

用户1077649

文章：48 阅读：179598 评论：2 赞：309

 好友  私信个人主页

文章 48

原创 0

阅读 179598

评论 2

赞 309

最新评论更多

不错，值得学习

小白菜123 ... 评论博文 2025-6-4

高功率LED铝基板的热设计黄金法则 ...

写的好，学习和参考，很实用，写的很详细，分析全面，大师之作

开发工匠 ... 评论博文 2025-6-4

高密度LED灯条如何实现散热优化？ ...

分析很细，原理图，芯片原理图，产品设计，产品结构，大师之作

开发工匠 ... 评论博文 2025-6-3

【拆解】+Trimmer 毛球修剪拆解

最新博文

书评：《动手做AI Agent》——职业院 ...

10. ESP32开发之LED闪烁和呼吸的实现 ...

万豪“嫁”美团：老牌酒店的“中国变 ...

资料下载

本周热帖

抖胆DD3118替代创惟GL3213S国产3.0读 ...

EIO-STD安装指南

EIOLink通讯协议

CAN产品配置手册

CAN产品-TNode-N安装指南

【资料下载-第一季】开关电源、KiCad ...

【Milk-V Duo 开发板】+初用体验 ...

芯片程序

E币兑换迟迟未兑现

解读LED车灯因高温引起的光衰问题 ...

最新资讯

芯语最新

连接・集成・智护：Qorvo智能化场景破 ...

掌握拓扑选择：优化电池供电设备设计 ...

关于座舱传感发展的三个关键词：雷达 ...

合见工软宣布关键EDA免费开放试用，加 ...

美国得州市将三星工厂补贴削减至最高9 ...

一边高调喊“兄弟”，一面边骚操作逼 ...

英伟达：员工纷纷转投华为！ ...

英伟达利润率将飙升至80%！ ...

华为和小鹏官宣战略合作！ ...

三星挖走台积电前高管！

EE直播间
更多

常用电测仪表的校准展示直播时间： 06月20日 10:00

Keysight World Tech Day 线上直播-AI 驱动的超高速传输测试分论坛直播时间： 06月26日 13:30

材料介电常数的精确表征和测试直播时间： 07月03日 10:00

在线研讨会
更多

ADI人形机器人解决方案

ST 在大功率热管理系统中的电机控制系统方案（AI 数据中心/暖通空调/电池储能系统/变频制冷）

Mercury基于展频技术的医疗时钟EMI抑制方案

AI 巨型芯片，性能越强，测试越难，如何破局？

热门推荐

万亿市场风口怎么抓？5场研讨会解锁3D IC设计“通关秘籍”
协议解码慢到哭？教你1秒解析I2C故障
揭秘：新一代半导体器件如何提升测试电源的性能
八大论坛联动！与英飞凌共赴低碳化 × 数字化转型的巅峰对话