原创 静态时序分析

2008-6-17 16:04 3027 5 5 分类: FPGA/CPLD

http://techcenter.dicder.com/2006/0114/content_102_1.html


静态时序分析(Static Timing Analysis)一


前言


在制程进入深次微米世代之后,晶片(IC)设计的高复杂度及系统单晶片(SOC)设计方式兴起。此一趋势使得如何确保IC品质成为今日所有设计从业 人员不得不面临之重大课题。静态时序分析(Static Timing Analysis简称STA)经由完整的分析方式判断IC是否能够在使用者的时序环境下正常工作,对确保IC品质之课题,提供一个不错的解决方案。然而,对于许多IC设计者而言,STA是个既熟悉却又陌生的名词。本文将力求以简单叙述及图例说明的方式,对STA的基础概念及其在IC设计流程中的应用做详尽 的介绍。


什么是STA


STA的简单定义如下:套用特定的时序模型(Timing Model),针对特定电路分析其是否违反设计者给定的时序限制(Timing Constraint)。以分析的方式区分,可分为Path-BasedBlock-Based两种。  





<!--[if !vml]--><!--[endif]-->



先来看看Path-Based这种分析方式。如图一所示,讯号从A点及B点输入,经由4个逻辑闸组成的电路到达输出Y 点。套用的Timing Model标示在各逻辑闸上,对于所有输入端到输出端都可以找到相对应的延迟时间。而使用者给定的Timing Constraint为:


1.讯号A到达电路输入端的时间点为2AT=2ATArrival Time)。


2.          讯号B到达电路输入端的时间点为5AT=5)。


3.          讯号必须在时间点10之前到达输出端YRT=10RTRequired Time)。


现在我们针对P1P2两条路径(Path)来做分析。P1的起始点为A,讯号到达时间点为2。经过第1个逻辑闸之后, 由于此闸有2单位的延迟时间,所以讯号到达此闸输出的时间点为42+2)。依此类推,讯号经由P1到达输出Y的时间点为72+2+3)。在和上述第三项Timing Constraint比对之后,我们可以得知对P1这个路径而言,时序(Timing)是满足使用者要求的。


按照同样的方式可以得到讯号经由路径B到达输出Y的时间点为115+1+3+2),照样和上述第三项Timing Constraint比对,我们可以得知对P2这个路径而言,Timing是不满足使用者要求的。


对图一的设计而言,总共有6个讯号路径。对于采用Path-Based分析方式的STA软体来说,它会对这6个讯号路径 作逐一的分析,然后记录下结果。IC设计者藉由检视其分析报告的方式来判断所设计的电路是否符合给定的Timing Constraint。由于最常用来做静态时序分析验证核可(STA Signoff)的EDA软体PrimeTime?采用Path-Based的分析方式,所以本文将以Path-Based的分析方式介绍为主。


再来看看Block-Based的分析方式。此时时序资讯(Timing Information)的储存不再是以路径为单位,而是以电路节点(Node)为单位。由Timing Constraint我们仅能得知A节点的AT2B节点的AT5以及Y节点的RT10Block-Based的分析方式会找出每个节点的AT RT,然后比对这两个数值。当RT的值大于AT时表示讯号比Timing Constrain中要求的时间还早到达,如此则Timing是满足的,反之则不满足。





<!--[if !vml]--><!--[endif]-->



STA资料准备


在做STA之前,我们必须对其准备工作有充分的了解。STA所需的资料如图三所示,以下我们分项说明。其中Design Data部分,由于Block ModelSTA软体相关性太高,我们不在此加以说明,请直接参阅您STA软体的使用手册。





<!--[if !vml]--><!--[endif]-->



图 三


nLibrary Data


STA所需要的Timing Model就存放在标准元件库(Cell Library)中。这些必要的时序资讯是以Timing Arc的方式呈现在标准元件库中。Timing Arc定义逻辑闸任两个端点之间的时序关系,其种类有Combinational Timing ArcSetup Timing ArcHold Timing ArcEdge Timing ArcPreset and Clear Timing ArcRecovery Timing ArcRemoval Timing ArcThree State Enable & Disable Timing ArcWidth Timing Arc。其中第1458项定义时序延迟,其他各项则是定义时序检查。





<!--[if !vml]--><!--[endif]-->



图 四


Combinational Timing Arc是最基本的Timing ArcTiming Arc如果不特别宣告的话,就是属于此类。如图四所示,他定义了从特定输入到特定输出(AZ)的延迟时间。Combinational Timing ArcSense有三种,分别是inverting(或 negative unate),non-inverting(或 positive unate)以及non-unate。当Timing Arc相关之特定输出(图四Z)讯号变化方向和特定输入(图四A)讯号变化方向相反(如输入由01,输出由10),则此Timing Arcinverting sense。反之,输出输入讯号变化方向一致的话,则此Timing Arcnon-inverting sense。当特定输出无法由特定输入单独决定时,此Timing Arcnon-unate





<!--[if !vml]--><!--[endif]-->



图 五





<!--[if !vml]--><!--[endif]-->



图 六





<!--[if !vml]--><!--[endif]-->



图 七





<!--[if !vml]--><!--[endif]-->



图 八





<!--[if !vml]--><!--[endif]-->



图 九





<!--[if !vml]--><!--[endif]-->



图 十





<!--[if !vml]--><!--[endif]-->



图 十一





<!--[if !vml]--><!--[endif]-->



图 十二


其他的Timing Arc说明如下。



  • Setup Timing Arc:定义序向元件(Sequential Cell,如Flip-FlopLatch等)所需的Setup Time,依据Clock上升或下降分为2类(图五)。


  • Hold Timing Arc:定义序向元件所需的Hold Time,依据Clock上升或下降分为2类(图六)。


  • Edge Timing Arc:定义序向元件Clock Active Edge到资料输出的延迟时间,依据Clock上升或下降分为2类(图七)。


  • Preset and Clear Timing Arc:定义序向元件清除讯号(PresetClear)发生后,资料被清除的速度,依据清除讯号上升或下降及是PresetClear分为4类(图 八)。这个Timing Arc通常会被取消掉,因为它会造成讯号路径产生回路,这对STA而言是不允许的。


  • Recovery Timing Arc:定义序向元件Clock Active Edge之前,清除讯号不准启动的时间,依据Clock上升或下降分为2类(图九)。


  • Removal Timing Arc:定义序向元件Clock Active Edge之后,清除讯号不准启动的时间,依据Clock上升或下降分为2类(图十)。


  • Three State Enable & Disable Timing Arc:定义Tri-State元件致能讯号(Enable)到输出的延迟时间,依据EnableDisable分为2类。(图十一)


  • Width Timing Arc:定义讯号需维持稳定的最短时间,依据讯号维持在01的位准分为2类。(图十二)


上文列出了标准元件库内时序模型的项目,但对其量化的数据却没有加以说明。接下来,我们就来看看到底这些时序资讯的确实数值是如何定义在标准元件库中的。


Combinational Timing Arc为例,讯号从输入到输出的延迟时间可以描述成以输入的转换时间(Transition Time)和输出的负载为变数的函数。描述的方式可以是线性的方式,如图十三所示。也可以将这2个变数当成指标,建立时序表格(Timing Table),让STA软体可以查询出正确的延迟时间。这种以表格描述的方式会比上述线性描述的方式准确许多,因此现今市面上大部分的标准元件库皆采用产生时序表格的方式来建立Timing Model





<!--[if !vml]--><!--[endif]-->



图 十三


我们举个简单的例子来说明STA软体如何从时序表格计算出元件延迟时间。(图十四)





<!--[if !vml]--><!--[endif]-->



图十四



  •       元件延迟时间(Ddelay):输入达逻辑1位准50%到输出达逻辑1位准50%的时间。


  •       元件转换时间(Dtransition):输出达逻辑1位准20%80%)到80%20%)的时间。


当输入的转换时间为0.5,输出负载为0.2时,可由图十四的时序表格查得元件I2的延迟时间为0.432。而由于表格的大小有限,对于无法直接由表格查询到的延迟时间(如输入转换时间0.25,输出负载0.15),STA软体会利用线性内插或外插的方式计算延迟时间。


对于其他的Timing Arc,不管是时序延迟或时序检查,其相对应的时序数值计算和上例的计算方式是一样的。


接下来我们说明操作环境(Operating Condition)对时序的影响。操作环境指的是制程(Process)、电压(Voltage)、温度(Temperature)三项因子。这三项因 子通常会被简称为PVT,其对时序的影响可用下方线性方程式来描述。其中nom_processnom_voltage nom_temperature会定义在标准元件库中,代表建立时序表格时的操作环境。





<!--[if !vml]--><!--[endif]-->








静态时序分析(Static Timing Analysis


在「什么是STA」段落的例子中,为了方便说明,我们并没有把逻辑闸和逻辑闸间的连线延迟(Interconnect Delay)考虑在内。事实上,许多DSM IC设计之时序表现是由连线延迟主导的,其重要性不容我们忽视。


连线延迟依照布局与绕线(P&R)前后有不同的考量。在布局与绕线前,元件在晶片中摆放的位置尚未确定,所以连线延迟是一个预估值。而在布 局与绕线之后,连线延迟则是根据实际绕线计算出来的。对布局与绕线之前的连线延迟,通常是用Wireload Model来预估。Wireload Model根据晶片面积的预估大小及连线驱动元件数目(Fan-out)的多寡来决定连线的电阻和电容值,STA软体则利用这些电阻电容值计算出连线延迟。在布局与绕线之后,可以利用电阻电容萃取(RC Extraction)软体将绕线图形转换成实际的电阻电容电路,然后贴回(Back-annotateSTA软体计算连线延迟。


n Timing Constraints


Timing Constraint为使用者所给定,用来检验设计电路时序的准则。其中最重要的一项就是时脉(Clock)的描述。对于一个同步电路而言,暂存器和暂存 器之间的路径延迟时间必须小于一个Clock周期(Period),也就是说,当我们确认了Clock规格,所有暂存器间的路径的Timing Constraint就会自动给定了。





<!--[if !vml]--><!--[endif]-->



图十五


Clock规格包含波形、LatencyUncertainty的定义。波形定义一个Clock的周期及讯号上升缘及下降缘的时间点。 Latency定义从Clock来源到序向元件Clock输入端的延迟时间。Uncertainty则定义Clock讯号到序向元件Clock输入端可能 早到或晚到的时间。


如果上面的文字让你有不知所云的感觉,那底下看图说故事的解说也许会让你有比较清晰的概念。在图十五的电路中,左边的正反器(Flip-Flop) 在第一个Clock上升缘时会丢出资料,此资料会在第二个Clock上升缘让右边的Flip-Flop撷取。要分析右边的Flip-Flop能否正确撷取 资料就必须知道第一个Clock上升缘到达节点C1的时间点和第二个上升缘到达节点C2的时间点。假设在时间点为0的时候,Clock讯号由S点出发,经过一段时间(source latency1个时间单位,模拟晶片外的Clock延迟时间,例如板子上的绕线产生的讯号延迟时间)到达电路的Clock输入端点P,接下来再经过一 段时间(晶片内Clock绕线造成的讯号延迟时间),Clock讯号分别到达C1C2节点。如果电路已经进行布局与绕线,输入端点PC1C2的讯号 延迟时间可由连线上的寄生电阻电容计算得来。比方说,经过计算发现讯号由P传递到C1需要1个时间单位,由P传递到C22个时间单位,则Clock讯号 第一个上升缘到达C1和第二个上升缘到达C2的时间点就会如图十六下方两列所示,分别为时间点213(因为加上了1个时间单位的source latency)。





<!--[if !vml]--><!--[endif]-->



图十六


在布局与绕线之前,我们无法准确得知PC1C2的讯号延迟时间,仅能先做个预估。图十五的network latency及上文提到的Uncertainty就是用来做此种预估的。先假设我们拥有某种完美的布局与绕线软体可以让Clock输入端点P到所有 Flip-FlopClock输入端的讯号延迟时间一模一样,那么我们只要知道这个讯号延迟时间就可以得到Clock讯号到达C1C2的时间点了。这个讯号延迟时间可以藉由电路特性(如预估面积大小,Flip-Flop数目等)来做预估,而这个预估值就是所谓的network latency。如果这种完美的软体存在的话,那Clock的上升缘到达C1C2的时间点就可以由Latencysource latency + network latency)计算出来。


很不幸的,世界上没有这么完美的软体,在布局与绕线后Clock输入端点P到所有Flip-FlopClock输入端 的讯号延迟时间不会完全一样。也就是说Clock的某个上升缘不会同时到达C1C2。因此我们要对上述的预估值做些修正,加入Uncertainty的 描述来定义Clock上升缘左右移动的可能范围。在图十六中,Uncertainty1个时间单位,所以Clock第一个上升缘会在时间点3(因为 Latency3)左右1时间单位范围内(也就是时间点2到时间点4)到达C1,。第二个上升缘则会在时间点1214的范围内到达C2


除了Clock之外,对于电路其他输出输入端点及其周边的环境(Boundary Condition)也要加以描述。在说明Boundary Condition之前,我们得对路径(Path)有更进一步的了解。上文曾提及STA会将电路中所有的Path找出来加以分析,但Path的定义是什么 呢?


Path根据起点及终点可以分为4种:


1.          Flip-Flop Clock输入到Flip-Flop资料输入(图十七左上)。


2.          由主要输入(Primary Input,简称PI)到Flip-Flop资料输入(图十七右上)。


3.          Flip-Flop Clock输入到主要输出(Primary Output,简称PO)(图十七左下)。


4.          由主要输入到主要输出(图十七右下)。


Clock规格确定了之后,第1Path的时序限制(Timing Constraint)就自动的给定了。为了给定其他3Path的时序限制,我们必须定义Boundary Condition





<!--[if !vml]--><!--[endif]-->



一般来说,我们会定义下列的Boundary Condition


1.          Driving Cell:定义输入端点的推动能力(图十八)。


2.          Input Transition Time:定义输入端点的转换时间(图十八)。


3.          Output Capacitance Load:定义输出负载(图十八)。


4.          Input Delay:输入端点相对于某个Clock领域的延迟时间。(图十九,Delayclk-Q + a


5.          Output Delay:自输出端点往外看相对于某个Clock领域的延迟时间。(图十九,c


在这些Boundary Condition定义之后,上述4Path事实上都可看成是第1PathFlip-FlopFlip-Flop)。也就是说,加上 Boundary Condition后,只要Clock给定,所有PathTiming Constraint就会自动给定。。






<!--[if !vml]--><!--[endif]-->



图十八





<!--[if !vml]--><!--[endif]-->



图十九


由 于每个Path都有Timing Constraint,所以时序分析都能够进行。但在某些情况下,有些Path的分析可能没有意义,因此你会想忽略这些Path的分析。或是有些Path 分析的方式不一样,你会想指定这些Path的分析方式。此时就要设定一些Timing Exception,如False PathMulti-cycle Path等等来处理非一般性的时序分析。


STA流程及分析方式


STA的流程如图二十所示,而其分析验证的项目就是我们前文提及之时序检查相关的Timing Arc,如Setup TimeHold Time等等。以下我们针对Setup Time1实际范例来说明STA的分析方式。





<!--[if !vml]--><!--[endif]-->



图二十


n       Setup Time


设计电路如图二十一所示,时序模型(Timing Model)及时序限制(Timing Constraint)如下:





<!--[if !vml]--><!--[endif]-->



图二十一



  •          所有逻辑闸在输出讯号上升时最长的延迟时间为3ns,最短为2ns


  •          所有逻辑闸在输出讯号上升时最长的延迟时间为2ns,最短为1ns


  •          所有连线(Net)最长的延迟时间为2ns,最短为1ns


  •          所有Flip-Flop ClockQ的延迟时间为3ns


  •          所有Flip-FlopSetup Time1nsTs)。


  •          所有Flip-FlopHold Time1nsTh)。


  •          Clock周期为14nsDclkp)。


  •          Clock source latency2nsDclks)。


  •          Clock network latency3nsDclkn)。


  •          Clock uncertainty1nsDclku)。


  •          BCinput delay皆为1nsDaDbDc)。


  •          Youtput delay3nsDY)。


接下来,我们以Step-By-Step的方式说明时序分析的方式。


1.          首先找出所有Timing Path,我们只列出具代表性的3Timing Path来加以说明。





<!--[if !vml]--><!--[endif]-->



图二十二


2.          假设输入A讯号由01,计算第1Path终点讯号到达的时间(Arrival Time简称AT)。





<!--[if !vml]--><!--[endif]-->



3.          假设输入A讯号由10,计算第1Path终点AT





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图二十四


4.          计算第1Path终点的需求时间(Required Time,简称RT)。





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图二十五


5.          假设输入A讯号由01,计算第1Path终点的SlackSlack等于RTAT的差值,对于Setup Time验证来说等于RT - AT,对于Hold Time验证来说等于AT - RT。在此Setup Time范例中,Slack为正,表示讯号实际到达Path终点时间比必须到达的时间还早,因此Timing是满足的。





<!--[if !vml]--><!--[endif]-->



图二十二六


6.          假设输入A讯号由10,计算第1Path终点的SlackSlack为正,因此Timing是满足的。


  





<!--[if !vml]--><!--[endif]-->



综合56,第1PathTiming是符合规格的,其Slack4ns(取较差状况)。






<!--[if !vml]--><!--[endif]-->



图二十七


7.          假设前级Flip-Flop的讯号由01,计算第2Path终点的AT





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图二十八


8.          假设前级Flip-Flop的讯号由10,计算第2Path终点的AT





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图二十九


9.       计算第2Path终点的RT





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图三十


10.      假设前级Flip-Flop的讯号由01,计算第2Path终点的SlackSlack为负,因此Timing不满足。





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图三十一


11.      假设前级Flip-Flop的讯号由10,计算第2Path终点的SlackSlack为负,因此Timing不满足。


  





<!--[if !vml]--><!--[endif]-->



综合1011,第2PathTiming不满足,其Slack-3





<!--[if !vml]--><!--[endif]-->



图三十二


12.      假设前级Flip-Flop的讯号由01,计算第3Path终点的AT





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图三十三


13.      假设前级Flip-Flop的讯号由10,计算第3Path终点的AT





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图三十四


14.      计算第3Path终点的RT


  





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图三十五


15.      假设前级Flip-Flop的讯号由01,计算第3Path终点的SlackSlack为负,因此Timing不满足。


  





<!--[if !vml]--><!--[endif]-->







<!--[if !vml]--><!--[endif]-->



图三十六


16.      假设前级Flip-Flop的讯号由10,计算第3Path终点的SlackSlack为负,因此Timing不满足。


  





<!--[if !vml]--><!--[endif]-->



综合1516,第3Path Timing不符合规格,其Slack-4


  





<!--[if !vml]--><!--[endif]-->



图三十七


综合上述分析结果,此电路的时序不符合规格,其Critical PathPath3Slack-4


总结


本文先对STA的概念做概念性的介绍,在下集的文章中,将对STA在实际IC设计流程中的应用举一范例说明,请各位拭目以待。


静态时序分析(Static Timing Analysis


设计范例说明


设计范例为一个32bit x 32bitPipeline乘法器,其架构如图一所示。Pipeline共分3级,电路之输出输入端皆有暂存器储存运算数值。





<!--[if !vml]--><!--[endif]-->



图一


依据Cell-based设计的方式,首先以硬体描述语言设计图一之电路。接下来实作此电路,进行合成(Synthesis)及布局与绕线(P&R)。并在实作的各步骤后进行静态时序分析,确认时序规格是否满足。实作及验证所用到的软体及设计资料库如下所示:


l    合成:Synopsys? Design Compiler


l    布局与绕线:Synopsys? Astro


l    设计资料库:Artisan? 0.18um Cell Library


在接下来的文章中,各位将会看到静态时序分析在实作过程中的应用。藉由实际产生的数据了解在不同实做步骤上时序分析的差异。


  


时序限制(Timing Constraint


要作静态时序分析,首先要有时序限制。此设计范例的时序限制如下所述。(后为设定时序限制之SDC指令)


1          时脉规格(Clock Specification


1.1         周期:6ns  
  create_clock -name "MY_CLOCK" -period 6 -waveform {0 3} [get_ports {clk}]


1.2         Source Latency1ns  
  set_clock_latency -source 1 [get_clocks {MY_CLOCK}]


1.3         Network Latency1ns  
  set_clock_latency 1 [get_clocks {MY_CLOCK}]


1.4         Skew0.5ns  
  set_clock_uncertainty 0.5 [get_clocks {MY_CLOCK}]


2          周边状况(Boundary Condition


2.1         输入延迟(Input Delay):1.2ns  
  set allin_except_CLK [remove_from_collection [all_inputs] [get_ports clk] ]
  set_input_delay $I_DELAY -clock MY_CLOCK $allin_except_CLK


2.2         输出延迟(Output Delay):1.2ns  
  set_output_delay $O_DELAY -clock MY_CLOCK [all_outputs]


2.3         输出负载(Output Loading):0.5pF  
  set_load $O_LOAD 0.5 [all_outputs]


3          时序例外(Timing Exception):无



 


合成软体之时序报告


Synopsys? Design Compiler将电路合成完毕后,执行下面指令可以产生时序报告:


report_timing -path full -delay max -max_paths 10 -input_pins \
-nets -transition_time -capacitance > timing_syn.txt


时序报告会储存在timing_syn.txt此档案中。在档案的开头不远处,会列出此电路最有可能不符合时序规格的路径(Critical Path)。例如:


  Startpoint: S2/B2_reg_0_


                (rising edge-triggered flip-flop clocked by MY_CLOCK)


  Endpoint: S3/P3_reg_47_


              (rising edge-triggered flip-flop clocked by MY_CLOCK)


  Path Group: MY_CLOCK


  Path Type: max


在这个例子中,Critical Path的起点Flip-Flop是第2Pipeline Stage内的B2暂存器的第0个位元,终点Flip-Flop则是第3Pipeline Stage内的P3暂存器的第47个位元(图二)。


Critical Path报告的下方会有Wire Load Model的资讯,此范例使用的是UMC18_Conservative Model。这个Model会以较悲观的方式预估连线的延迟时间(Interconnect Delay)。


  





<!--[if !vml]--><!--[endif]-->



图二


继续往下检视档案,你会看到Critical Path的详细时序资讯。例如:


Point                                  Fanout       Cap     Trans      Incr       Path


-------------------------------------------------------------------------------


clock MY_CLOCK (rise edge)                                           0.00      0.00


clock network delay (ideal)                                           2.00      2.00


S2/B2_reg_0_/CK (DFFHQX4)                                   0.00      0.00      2.00r


S2/B2_reg_0_/Q (DFFHQX4)                                     0.16     0.30      2.30r


S2/n36 (net)                               1         0.03               0.00      2.30r


S2/U10/A (BUFX20)                                             0.16     0.00      2.30r


S2/U10/Y (BUFX20)                                             0.23     0.21      2.51r


...


...


S3/add_106/U0_5_47/A (XNOR2X2)                              0.18      0.00      7.74f


S3/add_106/U0_5_47/Y (XNOR2X2)                              0.12      0.22      7.96f


S3/add_106/SUM[47] (net)                 1         0.01                0.00      7.96f


S3/add_106/SUM[47] (stage3_DW01_add_54_0)                            0.00      7.96f


S3/N94 (net)                                         0.01                 0.00      7.96f


S3/P3_reg_47_/D (DFFTRXL)                                    0.12      0.00       7.96f


data arrival time                                                                    7.96


clock MY_CLOCK (rise edge)                                             6.00       6.00


clock network delay (ideal)                                            2.00       8.00


clock uncertainty                                                       -0.50       7.50


S3/P3_reg_47_/CK (DFFTRXL)                                             0.00       7.50r


library setup time                                                      -0.28       7.22


data required time                                                                   7.22


--------------------------------------------------------------------------------


data required time                                                                   7.22


data arrival time                                                                   -7.96


--------------------------------------------------------------------------------


slack (VIOLATED)                                                                     -0.74


先由左往右看,第一个直行Point标示出路径中的节点,节点可以是元件的输出入端点,也可以是元件间的连线(Net)。第二个直行 Fanout标示节点推动的元件个数。第三个直行Cap标示出节点推动的负载。第四个直行Trans标示出节点上信号的转换时间(Transition Time)。第五个直行Incr标示出节点造成的延迟时间。最后一个直行Path则是自路径起点到到此节点为止的总延迟时间。


再来我们由上往下检视Critical Path的时序资讯。


clock network delay (ideal)                                            2.00       2.00


此处的2nsclock network delay是由我们给定的时序限制计算而来的,因为我们给定了各1nssource latencynetwork latency,加起来共有2ns


S2/B2_reg_0_/CK (DFFHQX4)                                   0.00       0.00       2.00 r


此行表示Critical Path的起点为S2 Instance下的B2_reg_0_这个instanceCK端点。由于有2nsnetwork delay,所以时脉信号到达此节点的时间为2ns(图三)。至于0nsTransition Time则是因为我们没有在时脉规格中定义其数值,合成软体的会假设是一个0ns Transition Time的理想波形。最右边的r是因为这个Flip-Flop是正缘触发,所以以r表示。如果是f就是负缘触发。


  





<!--[if !vml]--><!--[endif]-->



图三


S2/B2_reg_0_/Q (DFFHQX4)                                    0.16       0.30       2.30 r


接着信号自起点开始向终点传递,这一行表示路径起点的Flip-FlopCK端点到Q端点的时间延迟为0.3ns,且在此节点的 Transition Time0.16ns。所以信号到达此节点的时间为2+0.3=2.3ns(图四)。最右边显示r是因为Q端点从0变化到1时的延迟时间比1变化到0时的延迟时间还长,如果状况相反的话,最右边会标示f。以上数值是由元件库(Cell Library)里的时序表(Timing Table)查出来的,其计算的方式请参照「静态时序分析(Static Timing Analysis)基础及应用(上)」。


S2/n36 (net)                               1         0.03                0.00       2.30 r


S2/U10/A (BUFX20)                                              0.16      0.00       2.30 r


这两行和上一行最右边的Path栏位都一样,这是因为其实它们是同一个节点,所以信号到达时间一样。仔细的读者这时候可能会有个疑问,Flip- FlopQ输出端和后面Buffer的输入端A信号到达时间应该有一个连线延迟(Interconnect Delay)的差距吧?想法上是没错,但因为Design Compiler这个合成器将连线延迟的时间合并到元件延迟(Cell Dealy)的时间内计算,所以从时序报告中看不到延迟时间的资讯。也就是说,如果Point栏是net的话,各位只需去检视FanoutCap栏位即可。S2/n36这个net只有推动一个Buffer,其Fanout1。负载则是Buffer的输入负载和预估连线负载的总和,其值为0.03pF


  





<!--[if !vml]--><!--[endif]-->



图四


S2/U10/Y (BUFX20)                                              0.23      0.21       2.51 r


这一行是描述Buffer从输入端到输出端的时间延迟,其值为0.21,所以信号到达Buffer输出端的时间为2.3+0.21=2.51ns(图五)。


接下来是一堆类似的元件时序资讯,我们略过它们不讨论,直接跳到最后面几个元件。


S3/add_106/U0_5_47/A (XNOR2X2)                              0.18      0.00       7.74 f


S3/add_106/U0_5_47/Y (XNOR2X2)                              0.12      0.22       7.96 f


这是到Critical Path终点前的最后一个元件,信号到达的时间是7.96ns。各位可以看到最右边的标示已经变成f了,这表示信号由10的状况元件延迟时间较长。


S3/add_106/SUM[47] (net)                 1        0.01                 0.00       7.96 f


S3/add_106/SUM[47] (stage3_DW01_add_54_0)                            0.00       7.96 f


S3/N94 (net)                                          0.01                0.00       7.96 f


S3/P3_reg_47_/D (DFFTRXL)                                    0.12      0.00       7.96 f


data arrival time                                                                     7.96


这几行都是同一个节点的时序资讯,只是逻辑阶层(Logic Hierarchy)不同。信号最后到达Critical Path终点的时间为7.96ns(图六)。以上是Arrival TimeAT)的计算,接下来我们看Required TimeRT)的计算。


  





<!--[if !vml]--><!--[endif]-->



图五


  





<!--[if !vml]--><!--[endif]-->



图六


clock MY_CLOCK (rise edge)                                             6.00       6.00


clock network delay (ideal)                                            2.00       8.00


clock uncertainty                                                       -0.50       7.50


S3/P3_reg_47_/CK (DFFTRXL)                                             0.00       7.50 r


library setup time                                                      -0.28       7.22


data required time                                                                   7.22


Critical Path终点的Flip-Flop的时脉输入一样有2nsnetwork delay,所以本来1个时脉周期后(6ns)要抓取资料就变成了6+2=8ns后抓取资料,也就是Required TimeRT)变成8ns。但因为我们的时脉规格有0.5ns的不确定性(clock uncertainty),以最坏状况考量,时脉提早了0.5ns到,则RT变为8-0.5=7.5ns。再考量元件库中定义的Setup Time 0.28nsRT就变为7.5-0.28=7.22ns(图七)。


  





<!--[if !vml]--><!--[endif]-->



图七


data required time                                                                   7.22


data arrival time                                                                   -7.96


--------------------------------------------------------------------------------


slack (VIOLATED)                                                                     -0.74


有了RTAT就可以计算slack,这个例子的slack值是负的,也就是无法达到时序规格。由于我们只是要以实例说明STA,时序规格不符合也无所谓。实际制作晶片时,这当然是不允许的。


未完:第5<<布局完成后之时序报告>>


PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
5
关闭 站长推荐上一条 /3 下一条