CN102054089B

CN102054089B - 对带有透明锁存器的数字集成电路进行优化的速度分级的方法

Info

Publication number: CN102054089B
Application number: CN 201010510296
Authority: CN
Inventors: 曾璇; 周海; 陶俊; 龚旻
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2009-10-28
Filing date: 2010-10-18
Publication date: 2013-08-21
Anticipated expiration: 2030-10-18
Also published as: CN102054089A

Abstract

本发明涉及针对工艺偏差影响下带有透明锁存器的数字集成电路进行速度分级的方法，包括：步骤1，计算带有透明锁存器的数字集成电路的最小时钟周期累计密度分布函数；步骤2，根据上述最小时钟周期累计密度分布函数采用贪婪算法来计算最优时钟周期等级分界点以最大化销售利润；步骤3，通过求解字母序二叉树带权最短路径问题确定时钟周期等级分界点的最优测试顺序以最小化测试成本，从而在同时考虑销售利润和测试成本的情况下，以低计算复杂度和高计算精度最大化集成电路的设计价值。

Description

对带有透明锁存器的数字集成电路进行优化的速度分级的方法

技术领域

本发明属于集成电路领域，具体涉及一种针对考虑工艺偏差影响下的带有透明锁存器的数字集成电路进行最优化速度分级的方法。

背景技术

随着集成电路工艺进入纳米量级，电路制造中的工艺偏差日益严重，带来了严重的电路性能不确定性和电路工作频率分散性。为了提高电路制造的收益，B.D.Cory,R.Kapur和B.Underwood于2003年提出了速度分级的概念（B.D.Cory,R.Kapur,and B.Underwood,“Speed Binning with Path DelayTest in 150-nm Technology”,IEEE Design Test Comput.,20(5),pp.41-45,2003.），即可将所有的产出电路根据各自可正常工作的最小时钟周期进行排序，并划分周期等级，然后为不同周期等级中的电路制定不同的出售价格。速度分级通常应用于以微处理器为代表的高性能流水线系统。而在这些系统中，广泛采用了具有时序借用和低功耗特性（参见C.Ebeling和B.Lockyear于1995年发表在Proceedings of the 16th Conference on Advanced Research inVLSI(ARVLSI'95)上第342页的文章“On the performance of level-clockedcircuits”）的电平敏感的透明锁存器作为时序单元。因此，如何对带有透明锁存器的电路进行速度分级优化，即找到一个最优的分级方法使得电路产品收益最大化，成为当前集成电路产业亟待解决的关键问题之一。

已有的传统速度分级策略通常将电路设计的收益定义为销售利润，即在制定的价格上卖掉所有电路产品的销售所得。销售利润完全依赖于每一个周期等级的电路产品数目和出售价格。基于这一理论，A.Davoodi和A.Srivastava于2008年在IEEE Trans.on VLSI第16(6)期683-692页的“Variability Driven Gate Sizing for Binning Yield Optimization”文章中提出了一种基于销售利润的收益模型，采用线性罚函数计算分级策略的利益损失。A.Datta等人进一步发展了该模型，在2008年IEEE Trans.on VLSI第16(7)期806-815页的“Profit Aware Circuit Design Under Process VariationsConsidering Speed Binning”一文中提出通过定义与电路正常工作周期相关的价格函数和基于该函数的价格加权模型来评价电路设计的收益。但是仅考虑销售利润的收益模型在实际生产应用中是不够完整的。在现代集成电路生产中，在电路总成本中所占比重日益显著的频率测试成本必须被纳入收益模型的考量范围。为了进行正确的速度分级，需要在各等级分界处的时钟周期点对电路进行功能或结构测试。测试成本会随着周期等级数目的增加而上升，从而降低设计收益。因此一个具有实际意义的收益模型不仅包括销售利润，还必须计入测试成本。

目前，就我们所知，仅A.Datta等人发表的“Profit Aware Circuit DesignUnder Process Variations Considering Speed Binning”一文在速度分级优化方面进行了简单的探讨，提出了一种启发式方法，通过优化周期等级分界点来最大化销售利润。即每次按指定步长移动一个周期分界点，若能够提高销售利润，则认为这一移动是可以接受的。但这一方法的最优性难以保证，且每次移动的步长也难以预测。

此外，为了顺利完成速度分级，首先需要采用统计静态时序分析（SSTA）预测电路的最小时钟周期的统计分布。目前已有的绝大多数统计静态时序分析算法都是针对边沿触发器电路的。但速度分级方法通常更多地用于处理带有透明锁存器的电路系统。由于锁存器的信号输出时间与其输入时间有关，在进行时序分析时需要同时考察所有回路上的时间约束，因此对这种电路的统计静态时序分析是一个更加复杂的问题。传统方法，如R.Chen和H.Zhou在2006年发表于IEEE Trans.on CAD第25(9)期1847-1855页的“StatisticalTiming Verification of Transparently Latched Circuits”一文中所提出的锁存器电路时序分析方法等，通常是针对时钟验证问题，通过不断迭代更新透明锁存器输入、输出端的统计到达时间和检测电路中的负环来计算某个给定时钟周期处的电路良产率。但这一类方法难以得到包含所有时钟频率点的随机时钟周期分布，除非在每一个可能的时钟周期点都采用这类SSTA方法以求得该处的良率，而这是非常耗时的。此外，由于在迭代过程中，时序随机变量需要根据前数次的迭代结果进行更新，而前数次的该变量本身和本次迭代的变量之间具有统计相关性，这将引起这类算法中的统计自相关现象，最后或多或少地导致这些算法的随机到达时间的无法收敛的问题。另外，已有方法通常假设工艺偏差具有高斯分布的特性，而这一假设在实际IC生产中并不一定满足。

因此，亟需一种改进的速度分级优化方法，用于处理带有透明锁存器的电路系统进行优化速度分级，克服现有技术的不足，提高效益，降低生产成本。

发明内容

本发明的主要目的是针对上述带有透明锁存器的数字集成电路的速度分级优化问题，在同时考虑销售利润和测试成本的前提下，寻找最优的时钟周期等级分界点和测试顺序以最大化电路设计的收益，从而提出在工艺偏差影响下的带有透明锁存器的数字集成电路的速度分级优化方法。

为实现上述发明目的，本发明所提出的带有透明锁存器的数字集成电路速度分级优化方法，主要包括以下步骤：

步骤1：采用基于通用随机配置法和稀疏网格采样技术的SSTA方法对工艺偏差影响下的带有透明锁存器的数字集成电路进行分析，通过将随机问题转化为一组在特定采样点处的固定问题来求出最小时钟周期累计密度分布函数CDF。与已有技术相比，这一方法不仅能够避免随机到达时间的收敛性问题，还能够以很低的计算复杂度和较高的求解精度得到任意分布的工艺偏差影响下的透明锁存器电路工作时钟周期的随机分布。

步骤2：根据步骤1得出的最小时钟周期累计密度分布函数CDF，采用贪婪算法确定时钟周期等级分界点的最优位置，从而最大化销售利润。在每次优化过程中，针对目标函数的单峰性，从理论上保证每次求解的最优性。而已有的启发式方法不具有理论最优性的保证。

步骤3：将测试成本的优化问题转化为基于时钟周期等级的字母序二叉树带权最短路径问题，以计算复杂度仅为O(nlogn)的优化方法确定周期等级分界点的最优测试顺序，从而最小化测试成本。传统的速度分级方法通常不考虑测试成本的最小化。

有利的是，应用本发明提出的方法，通过对时钟周期等级分界点以及测试顺序的优化，最大化销售利润的同时最小化测试成本，不仅能够通过随机配置法以很低的计算复杂度和很高的求解精度得到透明锁存器电路的工作时钟周期分布，避免随机到达时间求解中的收敛性问题；而且能够从理论上保证在采用贪婪算法确定周期等级分界点以最大化销售利润时，每次迭代计算的最优性；还能够以计算复杂度仅为O(nlogn)的优化方法确定周期等级分界点的最优测试顺序，从而最小化测试成本。

另外，这一方法同样适用于任意分布工艺偏差影响下的边沿触发器电路的速度分级优化，只需要将触发器断开，并将其输入输出作为电路的基本输入和基本输出处理即可。

附图说明

图1是本发明所提出的速度分级优化方法的步骤流程图；

图2是计算最小时钟周期累计密度分布函数CDF的步骤流程图；

图3是计算最优时钟周期等级分界点的步骤流程图；

图4是确定时钟周期等级分界点的最优测试顺序的步骤流程图；

图5是一个电路设计的速度等级划分示意图，包括该电路设计的工作周期累计密度分布函数、电路价格函数和划分为六个等级的速度分级策略；

图6的示意图是针对图2中电路设计的最优字母序二叉树；

图7是s13207电路的时钟周期统计分布CDF函数F(x)和三种价格曲线（线性曲线、二阶曲线和三阶曲线）；以及

图8是s13207电路的速度分级优化结果。

具体实施方式

本发明针对带有透明锁存器的数字集成电路的速度分级优化问题，在同时考虑销售利润和测试成本的前提下，寻找最优的时钟周期等级分界点和测试顺序以最大化电路设计的收益。

根据本发明的原理，其技术方案主要包括统计周期计算，销售利润最大化计算，以及测试成本最小化计算三个方面。下面结合图1-图4的方法流程图来描述其如下具体步骤：

步骤1：计算带有透明锁存器的数字集成电路的最小时钟周期的统计分布，可以采用基于通用随机配置法（gSCM，generalized Stochastic CollocationMethod）和稀疏网格采点技术（Sparse-Grid Sampling）的统计静态时序分析方法计算透明锁存器电路的最小时钟周期的统计分布。

设

表示通过PCA或ICA对具有相关性的工艺偏差处理后得到的一组独立的具有任意分布的随机变量，则给定锁存器电路的随机最小时钟周期

可以采用

的通用多项式展开（gPC， generalized Polynomial Chaos来逼近，如（1.1）所示，

T_{work} (\overset{r}{ξ}) \approx {\hat{T}}_{work} (\overset{r}{ξ}) Σ_{i_{1} + . . . i_{N} = 0}^{M} t_{i_{1, . . ., i_{N}}} H_{N}^{i_{1, . . ., i_{N}}} (\overset{r}{ξ}) - - - (1.1)

这里的

表示时钟周期的真实值，而

是近似值。N是随机工艺参数的个数，M是所采用的多项式的最高阶数，

表示N阶的通用多项式展开，(i₁+...+i_N)是这一多项式的阶数。未知系数

如图2所示，可通过以下三个分步骤求出：

分步骤101：采用通用稀疏网格技术生成

的一组配置点

这里P是配置点的数目。令

和

表示第j维ij阶精度高斯积分所对应的配置点（即多项式

的根）和权重，则由稀疏网格技术所产生k阶精度d维积分的配置点可由

张量积的线性组合得到，如（1.2）所示，

Θ_{d}^{k} = \underset{k + 1 \leq | \overset{r}{i} | \leq d + k}{U} (Θ_{1}^{i_{1}} \times . . . \times Θ_{1}^{i_{d}}) - - - (1.2)

这里配置点

对应的权重如式（1.3）所示，

w_{j_{i_{1}}, . . ., j_{i_{d}}}^{i_{1}, . . ., i_{d}} = {(- 1)}^{d + k - | \overset{r}{i} |} (\begin{matrix} d - 1 \\ d + k - | \overset{r}{i} | \end{matrix}) (w_{j_{i_{1}}}^{i_{1}} . . . w_{j_{i_{d}}}^{i_{d}}) - - - (1.3)

分步骤102：在每一个配置点

处，求解固定工艺参数下的静态时序分析问题，得到最小时钟周期

固定工艺参数下透明锁存器电路的静态时序分析需分别检测建立时间约束和保持时间约束是否满足，其主要步骤如下：

子步骤1021：建立SMO约束形式所对应的有向时序图G=(V,E)。顶点集合V表示电路的基本输入、输出，和所有元器件（包括门和锁存器）的输出端。边集合E表示门和锁存器端点之间的时间弧。

子步骤1022：根据SMO模型中的建立时间约束和有向时序图G=(V,E)，构造建立时间约束图GS。

时序图G=(V,E)中，令A_i(a_i)表示i顶点处的最晚（最早）到达时间，△_ji(δ_ji)表示时间弧(j,i)上的最大（最小）延迟。假设所有的锁存器由同一时钟控制，该时钟的周期为T_C，使能时间为T_P=0..5T_C。令

则SMO模型中的建立时间约束可表示如下：

若(j,i)是一个门单元，

A_{i}^{%} \leq A_{i}^{%} + (- Δ_{ji}) + 0 \cdot T_{C} - - - (1.4)

若(j,i)是一个锁存器，

A_{i}^{%} \leq A_{j}^{%} + (- Δ_{ji}) + 1 \cdot T_{C}

A_{i}^{%} \leq 0 + 0 + 0.5 . T_{C} - - - (1.5)

0 \leq A_{j}^{%} + (- S) + 1 {\cdot T}_{C}

基于以上不等式，构造新的建立时间约束图G_S=(V,E_S,w_S,r_S)。顶点集合V与图G的顶点集合是一样的。令w_S和r_S分别代表边E_S所对应的成本函数（cost function）和利润函数（gain function），边集合E_S可以由如下步骤建立：1）增加一个源顶点，令其到达时间2）对每一个不等式增加从顶点p到顶点q的边。3）对于每一条新增加的边，令其成本函数w_S(p,q)=w，利润函数r_S(p,q)=r。

子步骤1023：采用R.A.Howard在1960年出版的Dynamic Programmingand Markov Process一书中给出的Howard’s算法求解建立时间约束图G_S=(V,E_S,w_S,r_S)的最小周期率问题，得到建立时间约束所对应的最小工作周期T_work,setup。

对于图G_S中的环C，定义周期率R_O(C)为所有边的成本函数之和与利润函数之和的比例，

R_{O} (C) = \frac{w (C)}{r (C)} = \frac{Σ_{(p, q) &Element; C} w (p, q)}{Σ_{(p, q) &Element; C} r (p, q)} - - - (1.6)

采用Howard’s算法求解图G_S的最小周期率，得到建立时间约束所对应的最小工作周期T_work,setup，

T_work,setup=-min(R_O(C)) （1.7）

子步骤1024：采用与子步骤1022和子步骤1023完全类似的方法求出保持时间约束所对应的最小工作周期T_work,hold。

子步骤1025：根据步骤1023得到的T_work,setup和子步骤1024得到的T_work,hold，确定电路在配置点

处的最小工作周期

如果T_work,setup≤T_work,hold，则电路的最短周期是

如果T_work,setup≥T_work,hold，则由于同时满足建立时间约束和保持时间约束的时钟周期不存在，这个电路设计是失败的。

接下来，回到图2中所示，步骤1的分步骤103：

分步骤103：采用Galerkin算法计算式（1.1）中的未知系数

得到透明锁存器电路的随机最小时钟周期

的表达式，并根据表达式计算

的CDF。

Galerkin方法通过最小化

和

之间的误差来求得最优解，即令，

t_{i_{1}, . . ., i_{N}} = < T_{work} (\overset{r}{ξ}), H_{N}^{i_{1}, . . ., i_{N}} (\overset{r}{ξ}) > - - - (1.8)

上式是一个多维积分，可通过数值积分计算得到，

t_{i_{1}, . . ., i_{N}} = Σ_{k = 1}^{P} w_{k} T_{work} (\overset{r}{ξ}) H_{N}^{i_{1}, . . ., i_{N}} (\overset{r}{ξ}) - - - (1.9)

其中

表示第k个配置点，w_k是其对应的权重，

是子步骤102中求出的T_work在配置点处的真实值。得到未知系数

后即可根据式（1.1）求出

的CDF。

下面，仍回到图1所示根据本发明的透明锁存器数字集成电路速度分级优化方法的主流程图中。

步骤2：根据步骤1所得出的最小时钟周期累计密度分布函数来确定速度分级的最优分界点以最大化销售利润，可以采用贪婪算法进行计算。

设x为电路可正常工作的最短时钟周期，F(x)为步骤1计算出的工作周期的累计密度分布函数CDF，f(x)为相应的概率密度分布函数PDF。P(x)为电路价格函数，n为所需划分的速度等级个数。则使得销售利润

Pro (X) = Σ_{i = 1}^{n} P (x_{i}) (F (x_{i}) - F (x_{i - 1}))

最大化的最优时钟周期分界点X=[x₀,x₁,L,x_n-1,x_n]可通过以下2个分步骤确定，如图3所示：

分步骤201：确定周期分界点x₀，x₁，x_n-1和x_n。

x₀=0，x₁=T_leak，x_n-1=T_targ，x_n=+∞，其中T_targ是可被售出的所有电路的最短时钟周期的最大值，由设计者确定。T_leak是由漏电功耗约束决定的电路可正常工作的最短时钟周期，通过将功耗约束简化为最小周期约束Pr{P_work≤P_leak}≈Pr{T_work≥T_leak}即可得到。

分步骤202：运行贪婪算法确定时钟周期等级分界点x₂,x₃,L,x_n-2的位置。主要步骤是通过不断循环迭代求解两个相邻周期等级间的利润优化问题，直到优化目标不能再被改进为止。

其中，两个相邻周期等级间的利润优化问题，可以定义为：给定定义在区间[a,b]上的F(x)和P(x)，寻找最优的x∈[a,b]，从而最大化销售利润Pro(x)=P(x)(F(x)-F(a))+P(b)(F(b)-F(x))。这个问题可以通过在区间[a,b]内求解Pro'(x)=0得到最优解。

这种做法的前提是Pro(x)在区间[a,b]内是单峰的，这里给出Pro(x)单峰性证明，以保证上述方法的理论正确性：

Pro(x)=P(x)(F(x)-F(a))+P(b)(F(b)-F(x)) （2.1）

假设F(x)和P(x)都是二接可导的，F(x)、P(x)和f(x)是非负的，那么Pro(x)的单峰性可以证明如下：

引理1：Pro(x)是单峰的，当且仅当：

使Pro'(x)=0且Pro"(x)>0。证明：如果Pro(x)不是单峰的，那么至少存在一个极小值

根据极小值点的定义，可得Pro'(x)=0且Pro"(x)>0。

引理2：如果P(x)是单调递减的，且

都满足则Pro(x)在(a,b)上是单峰的。

证明：反证法。假设有Pro(x)，

满足上式条件但不是单峰的，则根据引理1有，

使Pro'(x)=0且Pro"(x)>0，那么

Pro' (x) = 0

&DoubleRightArrow; (P (x) - P (b)) f (x) + P' (x) (F (x) - F (a)) = 0 - - - (2.2)

&DoubleRightArrow; P (x) - P (b) = - \frac{P' (x) (F (x) - F (a))}{f (x)}

将P(x)-P(b)代入Pro"(x)，可得

Pro'' (x) = P'' (x) (F (x) - F (a)) + f' (x) (P (x) - P (b)) + 2 f (x) P' (x)

= P'' (F (x) - F (a)) - \frac{f' (x)}{f (x)} P' (x) (F (x) - F (a)) + 2 f (x) P' (x) > 0 - - - (2.3)

由于P'(x)<0且F(x)-F(a)>0，和题干条件相悖，由此得出引理2正确。

定理1：如果P(x)是单调递减的凸函数，f(x)在其定义域满足f'(x)F(x)-2f(x)²≤0，则Pro(x)是单峰的。

证明：因为P'(x)<0、P"(x)<0、F(x)>F(a)>0，可得

f' (x) F (x) - 2 f {(x)}^{2} \leq 0

&DoubleRightArrow; \frac{f' (x)}{f (x)} - \frac{2 f (x)}{F (x)} \leq 0 - - - (2.4)

&DoubleRightArrow; \frac{f' (x)}{f (x)} - \frac{2 f (x)}{F (x) - F (a)} \leq 0 < \frac{P'' (x)}{P' (x)}

根据引理2，可得Pro(x)是单峰的。

推论1：如果P(x)是单调递减的凸函数，f(x)是高斯、Rayleigh或者均匀分布的，则Pro(x)是单峰的

证明：高斯函数

f_{G} (x) = \frac{1}{\sqrt{2 πσ}} \exp (\frac{{(x - μ)}^{2}}{{2 σ}^{2}}),

Rayleigh函数

f_{R} (x) = \frac{x}{σ^{2}} \exp (\frac{x^{2}}{{2 σ}^{2}})

和均匀分布函数f_U(x)=a都满足f'(x)F(x)-2f(x)²≤0，由此可得此推论。

最后，再回到图1所示根据本发明的透明锁存器数字集成电路速度分级优化方法的主流程图中，步骤3的具体如下：

步骤3：基于字母序二叉树的带权最短路径求解方法确定时钟周期等级分界点的最优测试顺序，例如，采用O(nlogn)计算复杂度的算法，以最小化测试成本。

设X为步骤2计算出的最优时钟周期等级分界点，则为了完成电路的速度划分，需要进行测试的时钟周期分界点为X^-=(x₁,x₂,...,x_n-1)。设B_i,j表示处于边界x_i和x_j之间的所有时钟周期等级，N_i,j表示处于B_i,j中的电路占所有电路的百分比。这样对于第i个等级，N_i-1,i=F(x_i)-F(x_i-1)。假设单个电路在一个频率测试点处的测试成本设为1，那么测试成本

这里h_i-1,i表示在B_i-1,i中每个电路所需的测试次数。则通过以下三个子步骤可以求出使得测试成本最小化的最优阶数分配R(X^-):X^-aN⁺，进而求出最优测试顺序。步骤3的分步骤如图4所示：

分步骤301：由F(x)和X计算出每一个时钟周期等级B_i-1,i(i=1,2,L,n)内的电路数目占所有电路数目的百分比N_i-1,i，并由此确定一棵字母序二叉树的所有叶节点。

这字母序二叉树由两类节点组成，叶节点和内部节点。第i个叶节点表示第i个时钟周期B_i-1,i，其权重为N_i-1,i。所有的叶节点按字母序顺序(B_0,1,B_1,2,...,B_n-1,n)排列。内部节点B_i,j可由子步骤302得到。

分步骤302：采用基于Hu-Tucker理论的复杂度为O(nlogn)的优化算法求解上述字母序二叉树的带权最短路径问题，由此得到各时钟周期等级分界点的最优阶数分配R(X^-)。其主要子步骤如下：

子步骤3021：等级合并。给定叶节点的初始序列(B_0,1,B_1,2,...,B_n-1,n)，不断重复选取相邻的两个节点B_i,j和B_k,l，使得这两个节点的权重之和N_i,j+N_k,l是所有可能的组合中最小的。将这两个节点合并成一个超等级B_i,l，其权重为N_i,l=N_i,j+N_k,l。然后删去节点B_k,l，并用节点B_i,l替换节点B_i,j。如果在节点序列中的两个节点之间仅有内部节点，则认为这两个节点是相邻的。当所有的叶节点最后组合成一个根节点时，该步骤结束。

子步骤3022：阶数标注。根节点的阶数标注为0，然后按照与步骤3021中相反的顺序，从根节点开始标注所有内部节点的阶数。如果一个节点的阶数为r，则其两个子节点的阶数为r+1。最终可以得到所有叶节点的阶数。

子步骤3023：确定时钟周期等级分界点的最优阶数分配。首先删除步骤3021和步骤3022中所有的内部节点及其对应的阶数。然后将满足如下三个条件的B_i,j和B_j,k合并产生新的超等级B_i,k：1）B_i,j和B_j,k之间没有其他节点；2）B_i,j和B_j,k的阶数是确定的，并且是所有现有节点阶数里面最小的；3）i和j是所有满足1）和2）的可能组合中数值最小的。这里B_i,k的阶数是B_i,j的阶数减1。这样可以构造一棵新的树，并得到所有内部节点的最优阶数，即各时钟周期等级分界点的最优阶数分配R(X^-)。

分步骤303：根据子步骤302得到的最优阶数分配R(X^-)求得各时钟周期等级分界点的最优测试顺序，其主要步骤如下：

子步骤3031：将阶数等于0的分界点作为第一个测试点。

子步骤3032：阶数增加1，将所有具有该阶数的等级分界点按任意顺序列到紧接着的测试序列中。也就是说，具有同样阶数的等级分界点可以以任何顺序进行测试，总的测试成本相同。重复该步骤，直到所有的等级分界点都被赋予了相应的测试顺序。

实例一：

为使本发明的特征和优点更为明显易懂，下面结合具体的测试电路和实施方式对本发明做进一步说明。

对于65纳米工艺下ISCAS’89测试电路实例中的s13207电路，假设该电路中的边沿触发器单元全部换成电平敏感的透明锁存器，并采用50%占空比的单相时钟驱动。同时假设采用二阶延迟模型，其中包含利用PCA或者ICA得到的6个独立的随机变量（即（1.1）式中N=6，M=2），假定这6个随机变量都具有高斯分布的特性，方差设为对应均值的10%。则采用本发明方法，对该电路进行速度分级优化的具体步骤如下：

步骤1：计算s13207电路的时钟周期统计分布。

分步骤101：采用通用稀疏网格技术得到6个独立随机变量对应的2阶精度配置点共72个，对应的权重是

w_{j_{i_{1}}, . . ., j_{i_{6}}}^{i_{1}, . . ., i_{6}} = {(- 1)}^{8 - | \overset{r}{i} |} (\begin{matrix} 5 \\ 8 - | \overset{r}{i} | \end{matrix}) (w_{j_{i_{1}}}^{i_{1}} . . . w_{j_{i_{6}}}^{i_{6}}) .

分步骤102：在每一个配置点处，求得该电路的最小时钟周期T_work。

分步骤103：采用（1.9）式计算式（1.1）中的未知系数

并最终得到s13207电路的时钟周期统计分布CDF函数F(x)，如图7所示。

与采样点为10000的蒙特卡洛方法相比，本发明采用的SSTA算法得到的s13207电路时钟周期均值相对误差为0.19%，方差的相对误差为0.97%。另定义F(x)的相对误差为式（1.10）所示，则s13207的ferr为0.93%，但运行速度提高了177倍。

ferr = \frac{\sqrt{Σ_{i = 1}^{S} {(F (T_{i}) - F^{MC} (T_{i}))}^{2}}}{\sqrt{Σ_{i = 1}^{S} F^{MC} {(T_{i})}^{2}}} - - - (1.10)

这里S是用于比较的点的个数，T_i是第i个点对应的时钟周期。F(·)表示采用本方法得到的CDF函数，F^MC(·)表示采用蒙特卡罗采样方法得到的CDF。

为了进一步验证这一SSTA算法在特定工艺偏差分布下的计算精度，表格I给出了ISCAS’89的所有30个电路实例中的10个计算结果，包括最好和最差的精度，以及30个电路的平均结果。每个电路均考虑6个随机变量，包括三种分布，高斯分布，均匀分布和Rayleigh分布，方差设为对应均值的10%。从表格中可以看出本发明提出的SSTA方法在三种不同的工艺偏差随机分布情况下都具有很好的逼近精度。与蒙特卡洛方法相比能够在110倍的速度提升中达到0.07%的误差。

表格I ISCAS’89电路实例的SSTA计算结果比较

步骤2：采用贪婪算法确定s13207电路速度分级的最优分界点。

假定s13207电路需要划分的时钟周期等级数目为5，价格函数设为二阶凸函数，并且是递减的，如式（2.2）所示，

Quadratic:P(x)=a₃(x-a₄)²+a₅ （2.2）

价格函数同样可以设置为线性或三阶的递减凸函数，如式（2.3）所示，

\begin{matrix} Linear : P (x) = a_{1} x + a_{2} \\ Cubic : P (x) = a_{6} x^{3} + a_{7} \end{matrix} - - - (2.3)

价格函数中的系数a₁,...,a₇都采用A.Datta等在2008年IEEE Trans.onVLSI第16(7)期806-815页发表的”Profit Aware Circuit Design Under ProcessVariations Considering Speed Binning”一文中提出的方法来确定，即保证最短时钟周期的电路与最长时钟周期的电路价格比值为5，Ratio=P(T_leak)P(T_targ)=5。图7给出了电路s13207的工作周期T_work所对应的归一化后的三条价格函数，分别为线性、二阶和三阶函数。

分步骤201：确定周期分界点x₀=0，x₁=T_leak，x₄=T_targ，x₅=+∞，这里为简化实验，假设T_leak=u-3σ=3.69ns和T_targ=u+3σ=9.18ns，其中u和σ指的是T_work的均值和方差。实际生产中可根据具体的电路设计及功耗约束确定。

分步骤202：根据图2所示的贪婪算法确定时钟周期等级分界点x₂,x₃的位置。

令Pro+表示相对于初始设定的时钟周期等级分界点X_init而言，通过步骤2调整后得到的利润升值比率。

Pro+=(Pro(X_opt)-Pro(X_init))Pro(X_init) （2.4）

其中，通过使得每个时钟周期等级具有相同的良率设定初始的时钟周期等级分界点X_init。图8给出步骤2完成后的速度分级优化后的等级分界点结果。X_init和优化后的时钟周期等级分界点分别用虚线和实线表示。步骤2完成后，s13207的销售利润可提高Pro+=9.92%。

表格II给出了ISCAS’89测试电路采用步骤2得到的利润升值比率。每个电路同样具有6个随机变量，并假设为高斯分布。用于速度等级划分的时钟周期等级数目分别设为5，6，7，价格函数可为线性、二次型或三次型。从表格II中可以看出平均能够得到6.69%的利润提升。并且采用二阶或三阶的价格函数能够得到更高的利润提升。这是因为非线性的价格函数使得具有不同时钟周期的电路销售价格之间的差异更大，从而使得时钟周期等级分界点的位置对销售利润的影响更为重要。

表格II利润升值比率

为进一步验证本发明在最大化销售利润方面的优化特性，表格III给出了本发明方法与A.Datta等在2008年IEEE Trans.on VLSI第16(7)期806-815页发表的“Profit Aware Circuit Design Under Process Variations ConsideringSpeed Binning”一文中所提出的方法在销售利润和运行时间方面的比较结果。其中，△Pro+=Pro+₁-Pro+_AD，Pro+₁表示本发明方法的利润升值比率，Pro+_AD表示A.Datta等所提出方法的利润升值比率，SpUp表示与A.Datta的方法相比，本发明方法计算速度的提升倍数。这里的时钟周期等级数目定为n=6及n=7。A.Datta的方法中的分界点每次移动的距离设为间距(x_n-1-x₁)的110或1100。但这一距离是完全由经验确定的，距离太大（110）可能会错过最优位置，距离太小（1100）则会大大降低算法的运行速度。从表格III中可以看出，本发明所采用的算法能够在远远小于A.Datta等所提出方法的运行时间内，取得更高的利润。

表格III两种方法的销售利润和运行时间比较

步骤3：基于字母序二叉树的带权最短路径求解方法，确定时钟周期等级分界点的最优测试顺序。

分步骤301：由步骤2确定时钟周期等级分界点x₁,x₂,x₃,x₄后，可以得到一棵字母序二叉树的所有叶节点B_i-1,i和对应的权重N_i-1,i。

分步骤302：求解上述字母序二叉树的带权最短路径问题，由此得到各时钟周期等级分界点的最优阶数分配R(X^-)。

子步骤3021：等级合并。按照相邻两个节点的权重之和最小的原则，依次得到内部节点B_3,5、B_0,2、B_2,5和B_0,5（其中B_0,5是根节点）。

子步骤3022：阶数标注。令根节点B_0,5的阶数为0，则内部节点B_0,2、B_2,5的阶数为1，B_3,5的阶数为2，叶节点B_0,1、B_1,2和B_2,3的阶数为2，B_3,4、B_4,5的阶数为3。

子步骤3033：确定时钟周期等级分界点的最优阶数分配，构造最优字母序二叉树。叶节点的阶数依次为[2,2,2,3,3]，则按照该阶数合并等级，最后确定四个等级分界点的阶数依次为[1,0,1,2]。

图8给出了子步骤3033完成后得到的测试电路s13207的速度分级优化结果。分界点的最优阶数分配标在对应边界上。对于最优的分界点阶数[1,0,1,2]，各时钟周期等级中单个电路需要完成的测试次数为h=[2,2,2,3,3]，则所有电路的平均测试次数为

Ct = Σ_{i = 1}^{5} (F (X_{i}) - F (X_{i - 1})) L (i) = 2.12 .

与采用类二叉树搜索阶数R_bny=[2,1,0,1]得到的测试顺序相比，h=[3,3,2,2,2]，Ct=2.57。子步骤3022得到的阶数分配能够使得测试成本降低17.34%。这里的R_bny定义如下：

n=5:R_bny=[2,1,0,1]

n=6:R_bny=[2,1,0,1,2] （3.1）

n=7:R_bny=[2,1,2,0,2,1]

分步骤303：确定各时钟周期等级分界点的最优测试顺序。根据子步骤302得到的最优阶数分配[1,0,1,2]，最优测试顺序可以为x₂,x₁,x₃,x₄或者x₂,x₃,x₁,x₄。

表格IV给出了采用步骤3得到的ISCAS’89电路的测试成本降低比率。这里定义成本降低比率为，

Ct-=(Ct(R_bny)-Ct(R_opt))Ct(R_bny) （3.2）

从表格IV中可以看出采用最优测试顺序能够使成本平均降低14%。

表格IV测试成本降低比率

应用本发明提出的方法，不仅能够通过随机配置法以很低的计算复杂度和很高的求解精度得到透明锁存器电路的工作时钟周期分布，避免求取随机到达时间的收敛性问题；而且能够从理论上保证在采用贪婪算法确定周期等级分界点以最大化销售利润时，每次迭代计算的最优性；还能够以计算复杂度仅为O(nlogn)的优化方法确定周期等级分界点的最优测试顺序，从而最小化测试成本。

Claims

1.一种对带有透明锁存器的数字集成电路进行优化的速度分级的方法，其特征在于，其包括：

步骤1：计算带有透明锁存器的数字集成电路的最小时钟周期累计密度分布函数CDF；包括分步骤：

-通过稀疏网格技术选择工艺参数空间随机配置点；

-计算每一个配置点处的最小时钟周期；

-根据配置点处的最小时钟周期，利用随机配置法计算数字集成电路最小时钟周期累计密度分布函数CDF；

步骤2：根据上述最小时钟周期累计密度分布函数计算最优时钟周期等级分界点以最大化销售利润，包括分步骤：

-根据设计需求及漏电功耗约束确定数字集成电路正常工作时最短时钟周期的最大值和最小值边界点；

-采用贪婪算法更新时钟周期等级分界点划分；

步骤3：确定时钟周期等级分界点的最优测试顺序以最小化测试成本，包括分步骤：

-根据时钟周期等级分界点建立字母序二叉树；

-采用基于Hu-Tucker编码的复杂度为O(nlogn)的算法求解字母序二叉树的带权最短路径，以得到时钟周期等级分界点最优阶数分配；以及

-根据最优阶数分配求出能够使得测试成本最小化的最优的时钟周期等级分界点测试顺序。

2.根据权利要求1所述的方法，其特征在于，所述的步骤2中的分界点划分步骤还包括根据最小时钟周期累计密度分布函数CDF计算销售利润。

3.根据权利要求1所述的方法，其特征在于，所述步骤3中还包括根据最小时钟周期累计密度分布函数CDF以及时钟周期等级分界点的测试顺序计算测试成本。