CN103150221B - 半导体器件的寿命的动态估算 - Google Patents

半导体器件的寿命的动态估算 Download PDF

Info

Publication number
CN103150221B
CN103150221B CN201210567232.6A CN201210567232A CN103150221B CN 103150221 B CN103150221 B CN 103150221B CN 201210567232 A CN201210567232 A CN 201210567232A CN 103150221 B CN103150221 B CN 103150221B
Authority
CN
China
Prior art keywords
processor
life
dynamic
controller
residual life
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210567232.6A
Other languages
English (en)
Other versions
CN103150221A (zh
Inventor
X·韦拉
J·阿韦利亚
O·云萨尔
O·埃尔金
A·冈萨雷斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Priority to CN201210567232.6A priority Critical patent/CN103150221B/zh
Priority claimed from CN200580052138.5A external-priority patent/CN101313226B/zh
Publication of CN103150221A publication Critical patent/CN103150221A/zh
Application granted granted Critical
Publication of CN103150221B publication Critical patent/CN103150221B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

在一个实施例中,本发明包括一种方法,所述方法用于获得诸如处理器的半导体器件的动态工作参数信息,基于动态工作参数信息确定所述器件的整体或者其一个或多个部分的动态使用情况,并且基于动态使用情况动态估算所述器件的剩余寿命。可以根据估算剩余寿命按照所期望的方式控制所述器件。还描述了其他实施例,并要求对其进行保护。

Description

半导体器件的寿命的动态估算
本申请为分案申请,其原申请是2008年5月22日进入中国国家阶段、国际申请日为2005年12月30日的国际专利申请PCT/ES2005/070188,该原申请的中国国家申请号是200580052138.5,发明名称为“半导体器件的寿命的动态估算”。
技术领域
本发明的实施例涉及半导体器件,更具体而言,涉及确定这种器件的预期寿命。
背景技术
半导体器件的寿命(即,其无故障工作时间)的测量涉及当前和未来的工艺,因为晶体管和其他结构将变得更小,退化得更快。现有的预测这种器件的寿命的方法是静态方法,其在温度、电压和频率方面针对整个器件寿命假设固定条件。然而,其动态特性可能与所假设的固定条件相差悬殊。此外,集成电路(IC)内的每一资源都在不同的条件下工作,因而对于不同的资源将产生不同的寿命。
器件寿命一代一代缩短。此外,寿命取决于诸如不同的工作电压和温度的实际工作参数以及不同技术的缩放(scaling)趋势。这一逐渐缩短的寿命源自若干退化源:电迁移、应力迁移、时间相关介质击穿(TDDB)、负偏置温度不稳定性(NBTI)和热循环。假设由这些因素导致的故障率均匀地分布在五个源上。通常将这一故障率称为故障时间比(failuresintime,FIT),即,109小时内的预期故障数量。可以采用FIT值获得作为1/FIT的平均无故障时间(MTTF),这是业内通常采用的测度。对于任何技术而言,均可以通过假设在固定条件(例如,温度、电压、频率和利用率)下稳态运行而获得MTTF。
然而,温度、电压、频率和利用率都会随着电路寿命而变化,因而稳态机制无法准确预测器件的寿命。因此,有必要改进寿命测量。
附图说明
图1是根据本发明的一个实施例的处理器的方框图;
图2是根据本发明的另一实施例的处理器的方框图;
图3是根据本发明的一个实施例的方法的流程图;
图4是根据本发明的一个实施例控制资源的流程图;
图5是根据本发明的实施例的多处理器系统的方框图。
具体实施方式
在各个实施例中,可以执行对诸如处理器、存储器控制器和其他功能单元的半导体器件的剩余寿命的动态估算。可以在每个器件(例如,集成电路(IC))的基础上或者在更细粒度的基础上进行动态寿命估算。例如,在用于处理器的实施例中,可以在多内核处理器中在每个内核的基础上进行寿命估算。此外,在其他实施方式中,可以在每个块的基础上进行寿命估算,例如,在每个功能单元、高速缓存结构、寄存器堆或者其他块的基础上进行寿命估算。
寿命估算可以既考虑器件的工作时间,又考虑器件处于空闲状态的时间。通过这种方式,可以确定剩余寿命的精确估算。如以下将进一步讨论的那样,可以按照周期性间隔执行对器件的使用情况或者所谓的里程(mileage)的判断,从而使寿命估算可以准确地反映器件的动态工作条件。此外,在各个间隔处,可以将所确定的里程与器件寿命的静态估算进行比较。通过这种方式,可以有规则地判定所估算的剩余寿命。利用这一估算的剩余寿命,可以按照(例如)延长其寿命的方式,或者按照在考虑剩余器件能力的情况下通过控制器件来改善或者延续其性能的方式对器件加以控制。
现在参考图1,其示出根据本发明的实施例的处理器的方框图。如图1所示,处理器10可以是具有第一内核(即内核A)20和第二内核(即,内核B)30的双内核处理器。尽管在图1的实施例中示出了双内核,但是应当理解,本发明的范围不受这样的限制,在其他实施例中,单内核或者多内核处理器也可以利用本发明的实施例。
仍然参考图1,所示出的第一内核20包括各种块,所述块包括一个或多个执行单元22、一个或多个寄存器堆24以及一个或多个高速缓存26。当然,指定的内核架构可以包括额外的块,例如,存储器类结构(寄存器堆、高速缓存、队列等)和其他组合电路(执行单元、解码逻辑等)。在各个实施例中,执行单元22可以采取各种形式并且可以例如包括一个或多个标量处理单元,例如,整数单元和浮点单元。此外,一个或多个单指令多数据(SIMD)单元可以连同诸如地址生成单元等其他功能单元一起存在。此外,第一内核20包括例如可以为微控制器的控制器28。控制器28可以用于执行根据本发明的实施例的动态寿命估算方法。此外,在一些实施例中,控制器28还可以至少基于所确定的估算剩余寿命控制执行单元22的操作,在下文中将对其做进一步讨论。
第一内核20还包括测量内核的工作参数的多个传感器。在图1所示的实施例中,每一块包括其自己的传感器。相应地,传感器21与执行单元22相关联,传感器23与寄存器堆24相关联,传感器25与高速缓存26相关联。尽管示出了这些相关传感器,但是应当理解,在不同的实施方式中可以存在更多或者更少的传感器。此外,所述传感器可以具有相同或者不同的类型。例如,在一个实施例中,这些传感器中的每一个可以是诸如基于二极管的传感器的温度传感器。在其他实施例中,还可以存在其他工作参数传感器,例如,电流传感器、电压传感器等。
此外,如图1所示,控制器28包括存储器27,例如,其可以是用于动态存储所确定的寿命估算信息的非易失性存储器。此外,在一些实施例中,存储器27可以包括用于执行根据本发明的实施例的动态寿命测量方法的微码。在这样的实施例中,如果控制器28不包括单独的用于计算里程的逻辑,则控制器28可以控制执行单元22中的一个或多个的操作,以执行微码。
处理器10还可以包括耦合到两个内核的高速缓冲存储器40。而高速缓冲存储器40又可以耦合到存储器控制器集线器(MCH)50,所述存储器控制器集线器提供高速缓冲存储器40和诸如处理器10与其耦合的系统存储器的存储器分级体系的其他部分之间的控制和通信。尽管在图1中为了便于举例说明没有示出,但是应当理解,第二内核30可以包括与第一内核20所示的结构相类似的结构。
当然,其他实施方式也是可能的。例如,代替每一内核内的专用控制器,可以在处理器内存在单个控制器,以接收来自多个内核的工作参数信息,并且基于所述信息确定估算剩余寿命。此外,在一些实施例中,控制器28可以包括其自己的处理能力,从而根据从各个传感器接收的信息确定估算剩余寿命。然而,作为替代,在其他实施方式中,控制器28可以控制其相关内核的流水线(pipeline),从而清除未决操作,并提供用于在内核的资源上执行的代码,以实现对估算剩余寿命的动态测量。尽管在这里是在多内核环境下进行了说明,但是可以将本发明的实施例应用于任何其温度、电压和频率受到监视的器件。
现在参考图2,其示出了根据本发明的另一实施例的处理器的方框图。如图2所示,处理器100又可以是多内核处理器,更具体而言,可以使双内核处理器。然而,在该实施例中,存在专用控制器160以处理对于处理器100内的资源的估算剩余寿命的确定。
如图2所示,处理器100包括第一内核(即,内核A)120和第二内核(即,内核B)130。此外,与以上针对图1所进行的描述相似,处理器100包括耦合到内核的高速缓冲存储器140,所述高速缓冲存储器140又经由MCH150耦合到(例如)处理器100所处的系统的正面总线(FSB)。在其他实施例中,可以经由一个或多个点对点互连将处理器100耦合到诸如存储器、芯片组等的其他部件。
第一内核120包括一个或多个执行单元122、一个或多个寄存器堆124以及一个或多个高速缓存126。尽管在图2的实施例中示出了这些具体的块,但是应当理解在其他实施例中可以存在更多或者按不同方式布置的块。此外,第一内核120包括传感器128,其可以是用于测量第一内核120的工作参数的单个传感器。例如,传感器128可以是用于测量内核的温度的温度传感器。当然,在其他实施方式中,在第一内核120内可以存在其他传感器,包括位于各个功能块内或者与其紧密相关的传感器。第二内核130可以包括类似的部件。
因而,在图2的实施例中,控制器160于是可以接收来自传感器128以及位于第二内核130内或与之相关的一个或多个类似传感器的工作参数信息。基于该信息,控制器160可以为每一个内核确定估算剩余寿命。还可以将这样的独立的确定结合起来,以提供与处理器100的整体相关的信息。控制器160还可以包括存储器165,其可以是用于存储与里程和估算剩余寿命相关的最新信息的非易失性存储器。或者,可以将这样的信息存储在系统的另一位置中,例如,存储在另一非易失性存储器中。
注意,尽管图1和图2示出了控制器和相关传感器的具体配置,但是应当理解,在不同的实施例中,控制器的位置与传感器的位置无关。因此,在一些实施例中,可能存在单个的内核上传感器以及相关的内核上控制器。或者,多个内核上传感器可以与内核外控制器相关联。本发明的各种实施例考虑到了控制器和传感器的这些和其他的这种配置。
现在参考图3,其示出了根据本发明的一个实施例的方法的流程图。如图3所示,例如,可以通过诸如微控制器的控制器实现方法200,以实施剩余寿命估算。或者,可以通过由通用处理器例如对其进行寿命估算的处理器执行的指令实现方法200。
方法200可以从获得器件的工作参数开始(块210)。例如,就用于诸如处理器的半导体器件的实施例而言,可以获得一个或多个工作参数。例如,这些工作参数可以包括实际温度、电压和工作频率,尽管诸如湿度、气压、盐度、强电磁场、辐射、加速度的其他工作参数也是可能的。在一些实施例中,可以基于处理器正在处理的已知信息,而不是基于用于这些参数的传感器来获得电压和频率。相应地,在一些实施例中,仅使用温度传感器来提供相应的工作参数信息。接下来,可以基于工作参数对于指定的时间间隔计算器件的里程(块220)。也就是说,可以计算以器件的实际使用为基础的实际里程或损耗。可以执行不同方式的这种损耗的测量。此外,进行该计算的时间间隔可以变化。在一些实现中,时间间隔可以相对于机器周期较长,但是就实时参数而言较短。例如,时间间隔可以在大约1.0毫秒(ms)和1分钟之间变化,尽管本发明的范围不限于此。在这样的短实时量内,不太可能发生显著的温度、电压或频率变化。
利用所计算的里程,可以基于当前估算剩余寿命和所计算的里程确定估算剩余寿命(块230)。也就是说,可以将所存在的系统的当前估算寿命与在最后一个时间间隔上发生的里程进行比较。当前估算寿命可以对应于器件的稳态估算寿命(例如,总寿命)减去所有的计算里程确定(例如,总里程)。因此,可以从当前估算寿命中减去当前里程,以获得新的估算剩余寿命。然后,可以报告并保存这一信息(块240)。例如,可以将所述信息存储在处理器本身的非易失性存储器中,或者可以将其存储在系统的另一非易失性存储器中。
仍然参考图3,接下来可以确定时间间隔是否已经过去(菱形块250)。如果没有,那么菱形块返回其自身。若反之,时间间隔已经过去,那么控制返回至上文讨论的块210。通过这种方式,可以实施实际里程的周期性测量,并且可以连续地更新并报告剩余估算寿命以便在控制机制中使用,如下文将要进一步讨论的那样。当然,也可以采取其他的估算剩余寿命的方式。
可以基于剩余估算寿命对系统进行控制,从而相应地调整其特性、工作参数或任务管理。例如,如果确定处理器的一个或多个内核的估算寿命接近结束,则可以使这样的处理器失效,或者可以使内核改变其频率和/或电压。在其他实施例中,系统可以选择向这样的处理器发送工作,从而在其寿命终结之前彻底耗尽其资源。或者可以引导任务远离这样的处理器。因此,在不同的实施例中可能采用这种控制的不同方式。
现在参考图4,其示出了根据本发明的实施例控制资源的流程图。如图4所示,方法300可以从接收针对一个或多个处理器资源的估算寿命信息开始(块310)。例如,调度程序(例如,与操作系统(OS)或处理器调度程序相关联的)可以接收根据上文中参考图3描述的方法200的估算寿命信息。
可以基于这一估算寿命信息确定一个或多个估算寿命(例如,不同处理器资源的)是否处于预定阈值之下(菱形块320)。可以将阈值设置在不同的水平上,在各个实施例中其的范围很宽。如果寿命值不低于阈值,则控制返回至块310,在此,所述方法等待估算寿命信息的下一次接收。
若反之,如果在菱形块320处,确定寿命估算中的至少一个处于阈值以下,则控制进行至块330。这时,可以相应地控制与减少了的估算寿命相关联的资源(块330)。例如,如上所述,可以使这样的处理器资源失效,例如,整个处理器或者其内核或块,或者可以使所述处理器资源工作在减小的电压和/或频率上,此外还存在其他控制机制。尽管采用图4的实施例中的这一具体实施方式进行了说明,但是应当理解本发明的范围不限于此。
为了确定块的剩余寿命,在各个实施例中可以结合静态和动态信息。在一些实施例中,静态信息可以对应于稳态MTTF,通过确定所述稳态MTTF获得块的预期寿命。在一个实施例中,稳态模型可以用于基于静态温度(Tbase)和电压(Vbase)参数确定指定寿命(MTTFsteady),其中以摄氏度或开氏度为单位测量温度。更具体而言,在该实施例中,可以如下确定整个半导体器件的MTTFsteady
MTTF steady = 1 λ total = 1 Σ i = 1 j Σ l = 1 k λ il [方程1]
其中λtotal对应于半导体器件(例如处理器)的总故障率,λil是由第l个故障机制导致的第i个结构的故障率。相应地,可以通过将处理器的各个部件的单个故障率相加确定处理器的总故障率。因此,可以认为总故障率是结合了涉及(across)处理器的不同结构或块的不同故障机制的影响的故障率之和模型。尽管在各个实施例中,可以在每一块的基础上估算并使用这些总故障率,但是也可以测量和分析处理器或其他半导体器件内的更细粒度的结构的估算寿命。此外,应当理解,在各个实施例中,可以在确定涉及不同结构的故障率的过程中实现阐释不同故障机制的不同模型。
然后,可以采用一系列方程计算块的实际里程。这一块的实际里程或使用情况既可以以动态信息为基础又可以以用于确定稳态预期寿命的静态信息为基础,从而基于实际的块使用情况来阐释动态差异。尽管可以执行不同方式的里程计算,但是在一些实施例中,可以采用多个方程以基于针对所要分析的块观察到的不同环境参数计算里程。
首先,可以采用开启时间里程方程测量器件(例如,处理器的指定块)处于工作状态时的里程。具体而言,在一些实施例中,可以采用方程2:
MileageOn=Σ(ΔtKTon(Tnow-Tbase)·KVon(Vnow-Vbase)·KFon(Fnow- Fmax_this_V)/Fmax_this_V)[方程2]
就方程2而言,Δt是两个观察(即,前一观察和当前观察)之间的时间间隔。KTon、KVon和KFon分别是针对器件处于开启状态的周期、与温度、电压和频率相关的技术相关常数。对于各种工艺而言(例如,65nm、45nm和32nm),这些约束条件可能总是大于1,这意味着温度、电压或频率越高,里程越大。
表1示出了在根据一个实施例的里程计算中采用的常数的值。在其他实现中,可以采用其他常数值,如基于已知的工艺参数和/或实验模型所确定的那样。
表1
当前变量Tnow、Vnow和Fnow分别对应于在这一时间周期内观察到的温度、电压和频率。值Vbase和Tbase分别对应于温度和电压的稳态测量。最后,Fmax_this_V对应于在器件工作所处的指定电源电压下工作时可能的最高频率。注意,将方程2中确定的当前里程值与所有先前这样的值相加,从而获得器件的总工作时间里程。
其次,可以采用空闲时间里程方程测量器件(例如,处理器的指定块)处于空闲状态时的那些间隔的里程。在这样的间隔内,只有因应力迁移和热循环导致的退化,但是器件例如不会因电迁移、TDDB和NBTI而退化。由于退化可能均匀分布在若干个故障源,而且实际上它们当中只有一些在器件处于空闲状态时使其退化,因此可以采用比例因子。具体而言,针对方程3,以下可以采用为2/5的比例因子:
MileageOff=Σ(Δt·2/5·KToff(Tnow-Tbase))[方程3]
其中KToff(类似于KTon)是针对器件处于空闲状态的周期、与温度相关的技术相关常数。Δt、Tnow和Tbase与在方程2中相同。注意,将方程3中确定的当前里程值与所有先前这样的值相加,从而获得器件的总空闲时间里程。
可以基于方程2和方程3之和来计算器件的总里程。
Mileage=MileageOn+MileageOff[方程4]
最后,在该实施例中,可以通过将稳态值与方程4中确定的里程值进行比较确定估算剩余寿命。
MTTFremaining=MTTFsteady–Mileage[方程5]
相应地,方程4中确定的里程阐释了考虑实际温度(Tnow)和电压(Vnow)的实际退化。例如,在温度超过Tbase10度的情况下工作1小时对块造成的退化程度相当于在Tbase下工作1.5小时所造成的退化程度(1.5小时的里程)。另一方面,在较低的温度(例如,比Tbase低10度)下工作对所述块造成的退化程度相当于在Tbase下工作0.5小时所造成的退化程度。因此,估算剩余寿命可以以估算寿命的静态确定(例如,在器件制造中确定)以及基于实际动态工作参数的消耗或里程的动态估算为基础。尽管采用这一相对于方程1-5的具体实施方式进行了说明,但是应当理解本发明的范围不限于此。例如,在其他实施方式中,不是对每一间隔处的里程确定求和,而是可以进行单独的里程确定并将其从估算剩余寿命值中减掉,所述估算剩余寿命值自身以器件的初始估算寿命为基础,在每一间隔处由该间隔的实际消耗对其进行更新。当然,其他实施方式也是可能的。
为了实施根据本发明的实施例的计算,可以记录一个或多个器件的动态里程。一般而言,存储里程的数据量可以相对较小。例如,在多内核环境下,为了掌握每个内核的里程情况,可以对每个内核只使用几个字节。可以将该信息记录在非易失性存储器中,从而能够累计针对半导体器件确定的各个里程消耗。这些累计及其存储可以处于各种粒度水平上。例如,在不同的处理器资源具有独立的里程确定的实施例中,每一个这样的里程确定在存储器中都具有相应的位置。或者,在采用更粗粒度的方法的实施例中,例如,在基于每个内核的情况下,每个内核可以具有其专用存储器。此外,在一些实施例中,还可以存储估算剩余寿命,并在以后对剩余寿命的进一步估算中使用(即,在正在进行的间隔(ongoinginterval)处)。可以将该信息保存在基本输入/输出系统(BIOS)中或者保存在用户不能访问的小的非易失性存储器中。注意,在各种实施例中,可以周期性地(例如,每几分钟)将里程备份到该存储器,以节约能量。由于本发明的实施例在每个时间间隔内仅执行很少的计算,因此对里程进行更新并不昂贵。因而,可以非常频繁地读取来自一个或多个环境传感器的数据,并更新里程(例如,每1毫秒、每分钟或者类似间隔)。
在不同的实施例中,可以按照很多种不同的方式进行计算,所有的方式对面积和能量消耗的影响都很小。例如,在多内核环境下,具有下述可能的选项。在一个实施例中,可以提供在所有内核之间共享的微控制器,以计算每个内核或其部分的里程,所述微控制器例如为图2的控制器160。该微控制器可以包括一个或多个逻辑块,以进行所期望的计算。在开启包括这样的处理器的系统时,微控制器可以从非易失性存储器加载里程信息,并且每隔Δt就从每个内核的传感器获得数据,从而更新其里程并将所述里程再次存储。
不是具有全局微控制器,每个内核而是可以具有自己的微控制器,所述微控制器具有自己的用于计算里程的逻辑。或者,每个内核可以具有自己的微控制器,所述微控制器停止从内核取出指令,等待流水线变空,注入计算里程所需的指令,将结果保存在其自身的寄存器中,最后恢复执行当前运行的程序。
因此,利用本发明的实施例,可以实现器件寿命的准确预测,从而在预测器件将要毁损之前使器件本身或者其上的任何软件失效/迁移。在多内核环境下测量内核的里程可以实现针对任务的导引策略。例如,可以根据所希望的实施方式将任务导引至使用最少或最多的内核。此外,测量里程能够允许使用在器件损耗高的情况下降低器件性能的机制,以便延长器件寿命。例如,在里程确定达到预定阈值时,可以实施器件性能的降低。例如,可以通过降低工作电压和/或频率实施这样的性能降低。
采用本发明的实施例可以使其他处理器特征有效/失效。例如,在一些实现中,处理器可以包括各种控制逻辑,从而基于使用情况使某些功能或块有效/失效。此外,可以利用里程确定实现不同的定价策略。在这样的实施方式中,可以使处理器或其他半导体器件装有预定里程。例如,可以将这样的预定里程存储在所述处理器或其他半导体器件的非易失性存储器中。此外,在一些实施例中,可以将预定里程设为低于实际确定的静态寿命的值。通过这种方式,可以为以低于具有较高预定寿命值的类似器件的价格点出售的器件设置较低的预定寿命。通过这种方式,可以根据器件的预置寿命以不同的价格点出售具有相同功能的处理器。在操作过程中,可以将里程的动态测量与该预定里程进行比较,以确定何时达到寿命终止条件。在达到这样的条件时,本发明的实施例可以使处理器或其他半导体器件失效。
例如,在一些实施方式中,当所计算的里程对应于处理器的预定里程时,可以使处理器内的可编程熔丝逻辑(fuselogic)有效。相应地,所述熔丝逻辑可以通过各种方式中的任何一种使处理器失效。通过这种方式,可以根据器件的价格设定所允许的最大里程(例如,里程预算越高,价格越高)。在其他实施方式中,可以为用户提供例如通过追加付款获得额外里程的机会。
在其他实施方式中,代替熔丝逻辑,可以将控制寄存器或其他这样的控制功能部件设置为(例如)当剩余寿命满足预定里程时使处理器或其部分失效。通过利用里程来掌握器件的损耗情况,可以提供更为可靠的处理器,因为在一些实现中可以在用旧的器件发生故障之前使其失效。
可以通过很多种不同的系统类型实现实施例。现在参考图5,其示出了根据本发明的实施例的多处理器系统的方框图。如图5所示,多处理器系统是点对点互连系统,其包括经由点对点互连450耦合的第一处理器470和第二处理器480。如图5所示,处理器470和480中的每一个可以是包括第一和第二处理器内核(即,处理器内核474a和474b以及处理器内核484a和484b)的多内核处理器。处理器470和480中的每一个还可以分别包括控制器475和485,以执行根据实施例的动态估算寿命确定。在一些实施方式中,这些控制器可以包括用于预定里程以及动态里程的存储器。第一处理器470还包括存储器控制器集线器(MCH)472以及点对点(P-P)接口476和478。类似地,第二处理器480包括MCH482以及P-P接口486和488。如图5所示,MCH472和482将处理器耦合到相应存储器,即存储器432和存储器434,其可以是本地连接到相应处理器的主存储器的一部分。
在一些实施例中,多处理器系统的操作系统(OS)可以在第一处理器470和第二处理器480中的一个或多个上运行。所述OS可以包括调度不同处理器及其内核上的程序的调度程序。在一些实施方式中,控制器475和485可以向OS调度程序提供估算剩余寿命信息。然后,利用该信息,所述调度程序可以向/从第一处理器470或第二处理器480中的一个或另一个或其内核导引程序,或者导引来自其的处理。此外,调度程序可以基于估算剩余寿命信息实现其他控制功能。
可以分别经由P-P接口452和454将第一处理器470和第二处理器480耦合到芯片组490。如图5所示,芯片组490包括P-P接口494和498。此外,芯片组490包括用于使芯片组490与高性能图形引擎438耦合的接口492。在一个实施例中,可以采用高级图形端口(AGP)总线439将图形引擎438耦合到芯片组490。AGP总线439可以遵循1998年5月4日由加利福尼亚州圣克拉拉市的英特尔公司公布的2.0修订版的加速图形端口接口规范。或者,点对点互连439可以耦合这些部件。
芯片组490又可以经由接口496耦合到第一总线416。在一个实施例中,第一总线416可以是如注明日期为1995年6月的2.1修订版的PCI本地总线规范(制造版本)所定义的外设部件互连(PCI)总线,或者可以是诸如PCIExpress总线或其他第三代输入/输出(I/O)互连总线的总线,尽管本发明的范围不限于此。
如图5所示,可以将各种I/O装置414连同总线桥418耦合到第一总线416,所述总线桥418将第一总线416耦合到第二总线420。在一个实施例中,第二总线420可以是低管脚数(LPC)总线。在一个实施例中,可以将各种装置耦合到第二总线420,所述装置例如包括键盘/鼠标422、通信装置426以及可以包括代码430的数据存储单元428。可以为非易失性存储器的数据存储单元428还可以包括对应于系统的各种资源的累计里程值的寿命数据432。此外,可以将音频I/O424耦合到第二总线420。
可以通过代码实现实施例,并且可以将所述实施例存储在其上存储有指令的存储介质上,可以采用所述指令对系统编程以执行所述指令。存储介质可以包括但不限于任何类型的盘,其包括软盘、光盘、光盘只读存储器(CD-ROM)、可重写光盘(CD-RW)和磁光盘;半导体器件,例如,只读存储器(ROM)、诸如动态随机存取存储器(DRAM)和静态随机存取存储器(SRAM)的随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、闪速存储器、电可擦除可编程只读存储器(EEPROM);磁卡或光卡;或者任何其他适于存储电子指令的介质。
尽管已经相对于有限数量的实施例对本发明进行了说明,但是本领域技术人员应当认识到可以通过其做出很多修改和变化。旨在使所附的权利要求书涵盖所有这种落在本发明的实际精神和范围内的修改和变化。

Claims (17)

1.一种用于控制处理器的方法,包括:
获得处理器的动态工作参数信息;
基于所述动态工作参数信息确定所述处理器的动态使用情况,包括:
对于所述处理器工作的第一时间间隔,利用所述第一时间间隔的动态工作参数信息和用于确定所述处理器的稳态预期寿命的静态工作参数信息来执行第一计算,以获得所述处理器的动态工作使用情况;
对于所述处理器空闲的第二时间间隔,利用所述第二时间间隔的动态工作参数信息的一部分、所述静态工作参数信息的一部分以及比例因子来执行第二计算,以获得所述处理器的动态空闲使用情况;
基于所述动态使用情况动态估算所述处理器的剩余寿命;以及
基于所估算的剩余寿命控制所述处理器,包括改变所述处理器的所选内核的频率和/或电压。
2.根据权利要求1所述的方法,其中确定所述处理器的动态使用情况包括对于所述处理器的一个或多个资源确定动态使用情况。
3.根据权利要求1所述的方法,还包括基于所述动态工作使用情况和所述动态空闲使用情况确定所述处理器的总使用情况。
4.根据权利要求1所述的方法,还包括向所述处理器的使用最少的内核或者使用最多的内核导引一个或多个程序。
5.根据权利要求3所述的方法,还包括将所述总使用情况与所述处理器的估算寿命进行比较,从而动态估算所述剩余寿命。
6.一种半导体设备,包括:
处理器,该处理器包括:
至少一个执行指令的资源;
至少一个环境传感器;以及
耦合到所述至少一个环境传感器的逻辑,其用于基于来自所述至少一个环境传感器的信息,利用根据第一计算确定的工作损耗和根据第二计算确定的非工作损耗来确定所述至少一个资源的实际损耗,其中,所述第一计算将观测到的温度、电压和频率与稳态温度和稳态电压以及最大频率进行关联,所述第二计算根据比例因子将观测到的温度与所述稳态温度进行关联,所述非工作损耗对应于所述至少一个资源处于非工作状态的时间周期;以及
控制器,其用于基于利用所述实际损耗确定的估算剩余寿命控制所述至少一个资源的电压和频率中的至少一个。
7.根据权利要求6所述的半导体设备,其中所述控制器将由所述实际损耗和稳态寿命度量确定所述估算剩余寿命。
8.根据权利要求6所述的半导体设备,其中所述逻辑将周期性地更新所述实际损耗。
9.根据权利要求6所述的半导体设备,其中所述逻辑包括在所述处理器的所述至少一个资源上执行微码的微控制器。
10.根据权利要求6所述的半导体设备,其中,所述处理器包括寿命终止逻辑,其用于在所述估算剩余寿命基本对应于与所述处理器的允许寿命相对应的寿命值时使所述处理器失效,所述寿命值保存在所述处理器的非易失性存储器中。
11.一种多处理器系统,包括:
执行指令的第一处理器,所述第一处理器包括:
至少一个执行指令的内核;以及
至少一个热监视器;
耦合到所述至少一个热监视器的第一控制器,其用于利用来自所述至少一个热监视器的信息确定所述第一处理器的估算剩余寿命,其中,所述估算剩余寿命是利用所述第一处理器的实际损耗来确定的,并且其中,所述实际损耗是利用根据第一计算确定的工作损耗和根据第二计算确定的非工作损耗来确定的,其中,所述第一计算将观测到的温度、电压和频率与稳态温度和稳态电压以及最大频率进行关联,所述第二计算根据比例因子将观测到的温度与所述稳态温度进行关联,所述非工作损耗对应于所述第一处理器处于非工作状态的时间周期;
耦合到所述执行指令的第一处理器的第二处理器;
耦合到所述第一处理器和第二处理器的第二控制器,其用于接收来自所述第一控制器的所述估算剩余寿命,并且基于所述估算剩余寿命控制所述第一处理器的所述至少一个内核的频率和电压中的至少一个;以及
耦合到所述第一处理器和所述第二处理器的动态随机存取存储器(DRAM)。
12.根据权利要求11所述的多处理器系统,其中所述第一处理器包括对应于所述第一处理器的允许寿命的寿命值,所述寿命值保存在所述第一处理器的非易失性存储器中。
13.根据权利要求12所述的多处理器系统,其中在所述第一处理器的制造过程中,将所述允许寿命设置为多个不同水平中的一个,其中所述多个不同水平中的每一个对应于所述第一处理器的不同价格点。
14.根据权利要求11所述的多处理器系统,其中所述第一控制器将在所述第一处理器失效之前通知所述第二控制器所述第一处理器即将失效。
15.根据权利要求11所述的多处理器系统,其中所述第二控制器将基于所述估算剩余寿命将一个或多个任务从所述第一处理器导引出来,并导引至所述第二处理器。
16.根据权利要求11所述的多处理器系统,其中所述第二控制器将基于所述第一处理器的估算剩余寿命和由耦合到所述第二处理器的所述第一控制器或耦合到所述第二处理器的第三控制器估算的所述第二处理器的剩余寿命的比较,将一个或多个任务导引至所述第一处理器和所述第二处理器中使用最多的一个或者使用最少的一个。
17.根据权利要求11所述的多处理器系统,其中如果所述估算剩余寿命低于阈值,则所述第一处理器将调整所述第一处理器的频率和电压中的至少一个。
CN201210567232.6A 2005-12-30 2005-12-30 半导体器件的寿命的动态估算 Expired - Fee Related CN103150221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210567232.6A CN103150221B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200580052138.5A CN101313226B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算方法和设备
CN201210567232.6A CN103150221B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200580052138.5A Division CN101313226B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算方法和设备

Publications (2)

Publication Number Publication Date
CN103150221A CN103150221A (zh) 2013-06-12
CN103150221B true CN103150221B (zh) 2016-03-02

Family

ID=48548319

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201210247691.6A Expired - Fee Related CN102831019B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算
CN201210567232.6A Expired - Fee Related CN103150221B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201210247691.6A Expired - Fee Related CN102831019B (zh) 2005-12-30 2005-12-30 半导体器件的寿命的动态估算

Country Status (1)

Country Link
CN (2) CN102831019B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1613044A (zh) * 2001-03-19 2005-05-04 英特尔公司 确定有多性能状态能力的微处理器的转换点的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1011823B (zh) * 1987-07-01 1991-02-27 石家庄市自动化研究所 半导体整流器件动态寿命试验机及质量分级方法
US6424930B1 (en) * 1999-04-23 2002-07-23 Graeme G. Wood Distributed processing system for component lifetime prediction
US6775624B2 (en) * 2001-10-19 2004-08-10 International Business Machines Corporation Method and apparatus for estimating remaining life of a product
US20050144524A1 (en) * 2003-12-04 2005-06-30 International Business Machines Corporation Digital reliability monitor having autonomic repair and notification capability
US7779287B2 (en) * 2005-08-22 2010-08-17 Intel Corporation Reducing power consumption in multiprocessor systems

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1613044A (zh) * 2001-03-19 2005-05-04 英特尔公司 确定有多性能状态能力的微处理器的转换点的方法

Also Published As

Publication number Publication date
CN102831019A (zh) 2012-12-19
CN103150221A (zh) 2013-06-12
CN102831019B (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
CN101313226B (zh) 半导体器件的寿命的动态估算方法和设备
Srinivasan et al. Exploiting structural duplication for lifetime reliability enhancement
Basoglu et al. NBTI-aware DVFS: A new approach to saving energy and increasing processor lifetime
US10216557B2 (en) Method and apparatus for monitoring and enhancing on-chip microprocessor reliability
US8549363B2 (en) Reliability and performance of a system-on-a-chip by predictive wear-out based activation of functional components
CN102063323B (zh) 用于低功率程序调整的功率性能监视器的装置和方法
CN101669037B (zh) 监视数字系统的可靠性
Jacobson et al. Abstraction and microarchitecture scaling in early-stage power modeling
US20130158892A1 (en) Method for selecting a resource from a plurality of processing resources so that the probable times to failure of the resources evolve in a substantially identical manner
Swaminathan et al. Bravo: Balanced reliability-aware voltage optimization
US8571847B2 (en) Efficiency of static core turn-off in a system-on-a-chip with variation
US20180143242A1 (en) Integrated circuit reliability assessment apparatus and method
US20090254767A1 (en) Energy Management
Kwasnick et al. Determination of CPU use conditions
Chatzidimitriou et al. Assessing the effects of low voltage in branch prediction units
US20130211752A1 (en) Software power analysis
Webel et al. Proactive power management in IBM z15
CN113157043B (zh) 基于强化学习的异构多核处理器动态电压调节方法及系统
CN103150221B (zh) 半导体器件的寿命的动态估算
Glaß et al. Cross-level compositional reliability analysis for embedded systems
US11169586B2 (en) Computing device and method of operating the same
CN102221875B (zh) 微处理器、操作微处理器的方法
Zandian et al. Cross-layer resilience using wearout aware design flow
Costa et al. Effectiveness of Neural Networks for Power Modeling for Cloud and HPC: It’s Worth It!
Narang et al. Dynamic Power Management in Large Manycore Systems: A Learning-to-Search Framework

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160302

Termination date: 20181230

CF01 Termination of patent right due to non-payment of annual fee