CN107690626B - 用于电子设备的热扼制的方法和设备 - Google Patents

用于电子设备的热扼制的方法和设备 Download PDF

Info

Publication number
CN107690626B
CN107690626B CN201680030307.3A CN201680030307A CN107690626B CN 107690626 B CN107690626 B CN 107690626B CN 201680030307 A CN201680030307 A CN 201680030307A CN 107690626 B CN107690626 B CN 107690626B
Authority
CN
China
Prior art keywords
temperature
electronic component
throttling
threshold
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680030307.3A
Other languages
English (en)
Other versions
CN107690626A (zh
Inventor
T·Y·金
S·阿户加
R·阿加瓦尔
A·索达尼
J·徐
M·钦萨玛尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN107690626A publication Critical patent/CN107690626A/zh
Application granted granted Critical
Publication of CN107690626B publication Critical patent/CN107690626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • G05B11/36Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
    • G05B11/42Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • G06F1/3225Monitoring of peripheral devices of memory devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3275Power saving in memory, e.g. RAM, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3457Performance evaluation by simulation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/04Arrangements for writing information into, or reading information out from, a digital store with means for avoiding disturbances due to temperature effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2212/00Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
    • G06F2212/10Providing a specific technical effect
    • G06F2212/1028Power efficiency
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C2029/0409Online test
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Semiconductor Integrated Circuits (AREA)
  • Control Of Temperature (AREA)

Abstract

本文中所公开的是配置成实现计算设备的组件的热扼制的计算设备。该计算设备包括电子组件和热耦合到该电子组件的温度传感器。该计算设备还包括热管理控制器以从该温度传感器接收温度测量并生成该电子组件的扼制系数。若该温度测量大于指定阈值,则扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。

Description

用于电子设备的热扼制的方法和设备
相关申请的交叉引用
本申请要求2015年6月26日由Timothy Y.Yam等人提交的美国专利申请No.14/752,512的提交日权益,该专利申请通过引用纳入于此。
技术领域
本公开涉及存储器设备的热保护。更具体而言,本公开描述了用于基于检测到的结温度来扼制存储器设备的性能的技术。
背景技术
高性能计算设备趋向于在操作期间产生大量的热量。过多的热量能够破坏一些电子组件或者可以导致差错。因此,存在用于通过使用散热片、热导管、风扇以及类似组件来耗散热量的各种技术。然而,随着计算设备变得更为紧凑,这些热耗散措施变得不那么有效。在一些情况中,诸如中央处理单元(CPU)的处理器被扼制以避免过高的温度。在通常的扼制布置中,CPU的时钟频率可以被减小以减小所生成的热量。
附图简述
图1是配置成实现本文中所描述的扼制技术的计算设备的框图。
图2是配置成执行功率和热扼制的计算设备的示例。
图3是示出示例双阈值热扼制算法的模拟结果的曲线图。
图4是示出示例三阈值热扼制算法的模拟结果的曲线图。
图5是示出基于比例-积分-微分(PID)控制器的示例热扼制算法的模拟结果的曲线图。
图6是热扼制方法的过程流程图。
在整个公开和附图中使用相同的标号指示相似的组件和特征。100系列的标号涉及在图1中最初可见的特征,200系列的标号涉及在图2中最初可见的特征,以此类推。
具体实施方式
本公开提供了用于扼制计算系统中的电子设备的技术。扼制是一种在其中电子设备(诸如中央处理单元(CPU))的处理速度被减小以维持可接受热特性的技术。为了确保电子设备正确地操作并且不被过多的热量损坏,电子设备被配置成在电子设备的最大结温度Tj_max以下的温度进行操作。电子设备的最大结温度一般由制造商规定。若电子设备接近或超过最大结温度,则电子设备可以被扼制以减小所生成的热量。
在存储器设备的情况中,扼制存储器设备减小了存储器设备的带宽。然而,一些用户可以具有在特定条件下,计算设备的存储器带宽将保持在某个指定性能水平之上的期望。因此,若计算设备的存储器带宽掉到该期望性能水平之下,用户满意度可能受到影响。本公开提供了可以被用来确保电子设备的热特性保持在可接受水平,同时仍然维持用户所期望的性能水平的扼制技术。在以下描述中,动态随机存取存储器(DRAM)的扼制被作为示例实现提供。然而,本技术可以被应用于扼制若设备温度超过特定温度阈值,则其温度可以被感测且被性能控制的任何其他类型的非易失性存储器和封装上的其他类型的硅器件。
图1是配置成实现本文中所描述的扼制技术的计算设备的框图。计算设备100可以是任何类型的计算设备,诸如例如,移动电话、智能电话、膝上型计算机、平板计算机、服务器计算机、刀锋服务器、或者群集计算系统的计算节点。计算设备100包括适配成执行所存储的指令的中央处理单元(CPU)102,以及存储可由CPU 102执行的指令的存储器设备104。CPU 102可以是单核处理器、多核处理器、或者任何数目的其他配置。CPU 102还可以包括使得CPU 102能够访问存储器设备104的集成存储器控制器106。在其他实施例中,存储器控制器106可以是在CPU 102外部的单独的设备。
存储器设备104可以包括随机存取存储器(RAM),诸如动态随机存取存储器(DRAM),或任何其他合适的存储器类型。一些存储器设备104可以是存储器管芯的垂直堆叠,诸如堆叠式多通道动态随机存取存储器(MCDRAM)。每个存储器设备104可以使用多通道存储器架构,该多通道存储器架构使用在存储器设备104和存储器控制器106之间进行数据转移的多个通道。虽然示出了四个存储器设备,但是计算设备100可以包括任何合适数目的存储器设备104。
计算设备100还可以包括网络接口控制器(NIC)108,其使得CPU 102能够通过网络110与其他设备通信。网络110可以是任何合适类型的网络、存储区域网(SAN)、局域网(LAN)、互联网、以及其他网络。在一些示例中,网络110是群集计算系统的交换结构,其中计算设备100是群集中的计算节点中的一者。
计算设备100还可以包括一个或多个温度传感器112。温度传感器112可以配置成感测计算设备100的各种元件(包括CPU 102、存储器设备104、存储器控制器106、和NIC108)的温度。温度传感器112可以被设置在邻近于其倾向于要感测的具体设备。例如,温度传感器112可以被集成到设备中,或者温度传感器112可以被设置为在耦合到被感测的设备的散热片中或者毗邻于该散热片。被直接测量的温度可以被用来计算对应设备的估计结温度。本文中对于“测量结温度”或者“结温度测量”的引用包括其中温度传感器被设置在邻近于半导体器件并且结温度是从由温度传感器所实际测得的温度中计算出的技术。
在一些示例中,CPU 102、存储器设备104和NIC 108被封装在一起作为多芯片模块。多芯片模块是其中多个集成电路管芯被封装到单个基板上的电子封装。多芯片模块可以包括共用散热片,其热耦合到所有电子器件。温度传感器112可以被设置在封装内。温度传感器112可以被设置在毗邻于CPU 102的散热片中以测量CPU结温度。另一温度传感器112可以被设置成毗邻于存储器设备104之一以测量存储器设备104的结温度。在一些示例中,单个温度传感器112可以被用于所有存储器设备104。在一些示例中,每个存储器设备104与其自身的温度传感器112相关联,并且测得的结温度是分别针对每个存储器设备104的。各种其它配置是可能的。
如可以领会的,计算设备100和数据中心的其他计算设备一般在计算和执行任务中要求电功率。具有大量高性能计算(HPC)单元的数据中心可以消耗大量的电功率。为了节省功率并减小操作成本,可以在数据中心的一个或多个计算设备100上施加功率预算。计算设备100可以通过减小一些组件(诸如,CPU 102、存储器设备104、和网络接口110)的处理性能来根据功率预算限制其功率使用。功率预算可以由系统管理员或其他用户配置,并且可以取决于各种因素(诸如,当前时间、电价、电源和其他因素)而改变。
在图1中,功率预算的实现由功率管理单元114来执行。功率管理单元114可以被实现为CPU 102的逻辑硬件、在CPU 102上运行的软件、或者其他配置。例如,功率管理单元114还可以在单独的处理器中实现。功率管理单元114配置成通过减小计算设备100的组件的处理速度来根据用户给出的功率限制来减小计算设备100的功耗,这是一种有时被称作功率扼制的技术。
CPU 102还包括热管理单元116。热管理单元116被配置成确保计算设备100的组件不过热。热管理单元116可以被实现为CPU 102的逻辑硬件、在CPU 102上运行的软件、或者其他配置。例如,热管理单元116还可以在单独的处理器中实现。热管理单元116可以通过减小组件的处理速度来减小组件上的结温度。在存储器的情况中,热管理单元116可以测量一个或多个存储器设备104的结温度并基于测得的结温度与最大允许的结温度的比较来扼制存储器带宽。测得的结温度相对于最大允许的结温度越高,则越多的扼制可能被施加到电子器件。扼制的水平在本文中被称作扼制参数。在一些示例中,扼制的水平被计算为带宽百分比,其与可由电子设备的存储器消耗的最大功率相乘。带宽百分比在本文中可以被称作扼制系数。扼制可以针对每个存储器设备104使用施加到每个存储器设备104的不同扼制参数来单独地执行。扼制还可以针对所有存储器设备104使用单个扼制参数以作为整体执行。CPU 102还可以配置成使得当扼制针对封装上的任何设备被激活时,CPU 102可以拒绝来自操作系统(OS)的对通过激活turbo模式来提升性能的任何请求。
如上文所述,在一些情况中,用户可以具有关于计算设备100的性能的具体期望。计算设备的性能可以参考描述计算设备的通信或处理速度的任何可量化特性。例如,计算设备的性能可以参考处理器的速度、每单位时间的存储器访问的次数、每单位时间的计算的数目、每单位时间在通信网络上传送的位的数目、以及其他。在一些示例中,向用户给出作为性能保障的使用约束。使用约束是计算设备100所要满足的最小性能参数的表达。例如,针对存储器,计算设备100可以在存储器的全带宽容量的百分之60的带宽使用约束下。在一些系统中,存储器带宽可以随时间记录并被报告给用户。若作为热扼制的结果,存储器带宽掉到性能保障之下(即使是瞬时的),用户就可能会变得不满意。
为了减小热扼制将使得存储器带宽利用落到性能保障之下的可能性,本文中公开的热扼制技术使用性能保障作为用于计算扼制参数的参数。在一些示例中,如由图2所示的,热管理扼制和功率管理扼制被集成。然而,将会领会,这仅仅是一个可能的实现。本文中公开的技术还应用到将功率管理与热管理分开的系统,以及不使用功率管理扼制的系统。
图2是配置成执行功率和热扼制的计算设备的示例。计算设备100包括图1中所示的功率管理单元114、热管理单元116、和存储器控制器106。功率管理单元114、热管理单元116、和存储器控制器106可以任何合适形式的计算机逻辑(包括硬件、或硬件和软件的组合)来实现。一些实施例还可被实现为存储在有形、非瞬态、计算机可读介质上的指令,其可由处理器读取和执行,以执行所描述的操作。此外,计算机可读介质可包括用于以计算机可读的形式存储或传送信息的任何机制。例如,计算机可读介质可包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪存存储设备、或电、光、声或其它形式的传播信号(例如,载波、红外信号、数字信号、或传送和/或接收信号的接口)等等。功率管理单元114、热管理单元116、和存储器控制器106还可以被实现为逻辑单元,诸如例如,专用集成电路(ASIC)、现场可编程门阵列(FPGA)或实现在一个或多个集成电路中的逻辑门的布置。附加地,功率管理单元114、热管理单元116、和存储器控制器106可以被实现为单独的逻辑单元或者组合成单个逻辑单元。它们还可以用在硬件控制处理器上运行的软件来实现。
在图2中所示的示例中,监视现有功耗的功率管理单元114计算功率预算200,若一些用户给出的功率限制被违背了,则其可以引起功率扼制。热管理单元116接收一个或多个测得的结温度。基于测得的结温度,热管理单元116计算热扼制功率预算202。在该示例中基于功率管理单元的功率预算200和基于热管理单元的功率预算202可以用满足热限制和功率限制二者的方式组合成新功率预算204。
经组合的功率预算204被供应到存储器控制器106。替换地,基于带宽的扼制参数可以代替功率预算204被热和功率管理单元计算并供应到存储器控制器。若要求有扼制,则存储器控制器限制其执行的存储器操作的数目。在图2的示例中,其中扼制参数被表达为功率预算204,存储器控制器106限制所执行的存储器操作的数目以将由存储器操作所消耗的总功率保持在功率预算之下。
以下描述可以被用来将扼制参数计算为热功率预算的算法的两个示例。以下描述的算法可以使用一个或多个以下变量。
Tj,max是每个组件(包括存储器)的结温度限制。结温度限制是在其之上组件的正确运行就不能够被保障的第一温度阈值。在一些示例中,结温度限制Tj,max可以是大约95℃。
BWPERF是针对存储器规定的带宽使用约束。在一些示例中,BWPERF可以被确定为由最存储器密集型工作负载使用的存储器带宽。例如,BWPERF可以大致为百分之50到百分之75。
BWTHERM是存储器带宽,在该存储器带宽的情况下,存储器温度可以响应于存储器负载的最快速斜升而被维持在最大结温度Tj,max以下。例如,BWTHERM可以大致为百分之25到百分之50。
ΔTPERF是用来指定第三温度阈值(Tj,max-ΔTPERF)的温度差并与带宽使用约束BWPERF相对应。当测得的结温度达到Tj,max限制的ΔTPERF度内时,存储器带宽是基于BWPERF扼制的。
ΔTPERF是用于定义第二温度阈值(Tj,max–ΔTTHEM)的温度差并与BWTHERM相对应。当测得的结温度达到Tj,max限制的ΔTTHERM度内时,存储器带宽被扼制到BWTHERM
阈值值ΔTTHERM和ΔTPERF可以用实验方法确定。在一些示例中,温度阈值(Tj,max-ΔTTHERM)和(Tj,max-ΔTPERF)的值将会相对接近于最大结温度Tj,max,从而最大化工作负载性能。例如,ΔTTHERM可以大致为最大结温度的百分之98(ΔTTHERM=0.98*Tj,max),且ΔTPERF可以大致为最大结温度的百分之95(ΔTPERF=0.95*Tj,max)。其他温度阈值也是可能的。
在一些示例中,阈值ΔTTHERM和ΔTPERF可以至少部分基于用来测量结温度的温度传感器的解析度来确定。ΔTTHERM应当大于或等于最小传感器解析度,且ΔTPERF应当大于或等于ΔTTHERM加上最小传感器解析度。作为示例,若温度传感器可以用1℃增量来读取,则ΔTTHERM的最小可接受值是1℃,且ΔTTHERM的最小可接受值是2℃。
BWMAX是最大存储器带宽。值BWMAX一般将会等于100%。
BWMIN是将会仍然使得任何工作负载能够取得向前进展的最小存储器带宽。例如,百分之10的BWMIN可以足以避免使得存储器缺乏带宽。
在一些示例中,扼制参数可以根据以下三阈值热扼制算法的条件来计算:
若(TM>Tj,max)则TT_预算:=Max_Power*BWMIN
否则若(TM>Tj,max–ΔTTHERM)则TT_预算:=Max_Power*BWTHERM
否则若(TM>Tj,max–ΔTPERF)则TT_预算:=Max_Power*BWPERF
否则TT_预算:=Max_Power*BWMAX
双阈值热扼制算法将会忽视关于条件(TM>Tj,max–ΔTPERF)的第三行。
在以上算法中,TM是存储器设备104的最高测得结温度,TT_预算是热扼制参数,在该示例中其可以被计算为热功率预算,且Max_Power是存储器设备可以消耗的最大功率。用于计算热扼制功率预算的算法使用三个温度阈值Tj,max、Tj,max–ΔTTHERM、和Tj,max–ΔTPERF。热扼制功率预算可以针对每个温度采样周期来计算,其可以是数瓦特到数百瓦特。在以上算法中,存储器带宽使用被允许‘突发(burst)’到BWPERF以上直到任何存储器设备104的测得的温度TM跨越到温度阈值Tj,max–ΔTPERF之上。
当TM超过温度阈值Tj,max–ΔTPERF时,存储器带宽被限制到BWPERF。用这种方式限制存储器带宽帮助确保了存储器带宽不瞬时掉落到使用约束之下。只有当测得的结温度TM继续上升并超过下一温度阈值Tj,max–ΔTTHERM,则存储器带宽被限制到BWTHERM,其为比BWPERF低的带宽。
若测得的结温度TM超过最大结温度Tj,max,则存储器带宽被限制到BWMIN,其被选择成足够得低以使得存储器设备104能够冷却而不完全使得存储器缺乏带宽。上文所描述的算法的结果在图4中示出。
在一些示例中,热扼制功率预算被使用比例-积分-微分(PID)控制器算法计算。PID控制器可以被包括在热管理单元中并被实现为集成电路组件或编程指令。PID控制器是将误差值作为测得变量和期望设置点之间的差计算的控制回路反馈算法。在本示例中,测得的变量是最高测得结温度TM,且期望设置点为温度阈值Tj,max–ΔTPERF,该温度阈值是与带宽使用约束BWPERF相对应的温度阈值。使用PID控制器,热扼制功率预算(TT_预算)可以根据以下式子计算。
Figure GDA0002931403960000081
PID控制器可以被调谐成获得PID系数Kp、Ki、和Kd。为了调谐PID控制器,首先PID系数被调谐成最大化工作负载性能同时确保在实际工作负载和/或正常环境温度下,存储器子系统以T目标=Tj,max-ΔTPERF或者低于T目标=Tj,max-ΔTPERF来操作并以BWPERF或高于BWPERF来递送存储器性能。其次,在高带宽综合工作负载(诸如功率病毒,和/或最坏情况热条件(诸如来自其他组件的热量))下,PID控制器可以被调节成仍然以较低的存储器带宽BWTHERM,在Tj,max–ΔTTHERM之下操作。在温度目标T目标被设置在93℃的示例中,PID控制器调谐可以导致Kp=0.2、Ki=0.6、Kd=0的PID系数。
一旦计算了热扼制功率预算,其可以由存储器控制器106使用来限制存储器带宽,从而存储器设备104所使用的平均功率停留在热扼制功率预算之下。每个存储器事务消耗了特定量的可预测并可重复的电功率。在一些示例中,存储器控制器106实现了一种技术,其中控制器对在指定时间段内发生的每种类型的存储器事务的数目进行计数,并且基于不同类型的存储器事务的数目和它们的对应能量权重来计算对应的功耗。一旦达到热扼制功率预算,存储器控制器106就临时性地停止发布存储器事务。在该时段的结束,存储器事务可以开始再次被发布,并且该过程重复长达后继的时段。
图3是示出示例双阈值热扼制算法的模拟结果的曲线图。曲线图300示出了叠加在存储器带宽百分比之上的存储器设备的结温度。在图3中,用点划线302示出了实际结温度,用实线304示出了测得的结温度,并且用虚线306示出了带宽扼制参数。实际温度和测得的温度之间的差是温度传感器的解析度的结果,在该示例中是1摄氏度。
两个温度阈值是94摄氏度和95摄氏度。注意,当实际温度在94.5摄氏度以上时,由于1度的传感器解析度,被采样的温度被测量在95度或以上。因为该测得的温度在严格意义上大于95度的温度阈值,所以扼制被施加成百分之30带宽扼制系数。虽然未在图3中示出,若测得的温度在95度阈值以上(即,实际温度大于95.5度),则施加百分之10的带宽扼制系数。图3在起始斜升之后将存储器设备的变热示作时间的函数。在一开始,存储器带宽被允许突发,意味着没有限制被置于存储器带宽上。图3示出了在该时间期间在百分之80处的存储器带宽尖峰,其为可能在实际工作负载场景中所期望的大致存储器带宽。高带宽使得存储器设备的结温度增加。在大致25秒时,测得的95度的温度达到94度阈值之上,在此时施加百分之30带宽扼制系数。在百分之30带宽扼制系数处,存储器设备迅速冷却下来。当测得的温度掉落在94度阈值上或以下(对应于,实际温度跨越94.5度)时,存储器设备被允许再次突发。该循环随着时间重复,导致94度和95度之间的平均温度,以及大致百分之67的平均存储器带宽百分比。然而,即时带宽百分比规律性地掉落到百分之60,其仍然满足性能约束。
图4是示出示例三阈值热扼制算法的模拟结果的曲线图。曲线图400示出了叠加在存储器带宽百分比之上的存储器设备的结温度。在图4中,用点划线402示出了实际结温度,用实线404示出了测得的结温度,并且用虚线406示出了扼制参数。
三个温度阈值是Tj,max-ΔTPERF=93摄氏度,Tj,max-ΔTTHERM=94摄氏度,以及Tj,max=95摄氏度。若测得的温度等于94摄氏度(即,93<测得的温度<=94),则施加百分之60带宽扼制系数(BWPERF)。在测得的温度等于94度的情况下,施加百分之30带宽扼制系数(BWTHERM)。在测得的温度严格地大于95度阈值的情况下,施加百分之10带宽扼制系数(BWMIN)。
类似于图3中所示的,图4示出了存储器带宽在开始时被允许突发到百分之80,其使得存储器设备快速变热。在大致5秒时,测得的温度超过94度阈值,在此时施加百分之60带宽扼制系数。在百分之60带宽扼制系数处,存储器设备迅速冷却。当测得的温度掉落到94度阈值以下时,存储器设备被允许再次突发。该循环随着时间重复,导致93度和94度之间的平均温度,以及百分之64的平均存储器带宽百分比。相比于双阈值示例,存储器设备的平均带宽并不显著地改变,且即时带宽百分比并不落到百分之60以下。只有温度继续上升(例如,由于升高的环境温度),即时带宽将会被扼制到百分之30。
图3和4分别假设63.4摄氏度和70摄氏度的环境温度。实际结果将会取决于环境温度、存储器设备的热属性、和各种其他因素而改变。进一步,具体温度阈值和带宽百分比仅被提供为示例。在考虑特定实现的设计参数和期望的性能特性中可以使用温度阈值和热扼制系数的任何合适的组合。
图5是示出基于比例-积分-微分(PID)控制器的示例热扼制算法的模拟结果的曲线图。曲线图500示出了叠加在存储器带宽百分比之上的存储器设备的结温度。在图5中,用点划线502示出了实际结温度,用实线504示出了测得的结温度,并且用虚线506示出了扼制参数。
图5的示例PID用设置成93摄氏度的温度目标(T目标)来微调,并且被微调成具有系数Kp=0.2、Ki=0.6、Kd=0。如图5中所示,PID控制器使得存储器子系统能够以T目标=Tj,max-ΔTPERF操作或在T目标=Tj,max-ΔTPERF之下操作,并且以BWPERF或者在BWPERF之上递送存储器性能。PID控制器还提供了更为平滑的存储器带宽相对于功率的控制响应。
图6是热扼制方法的过程流程图。方法600可以由热管理单元116和存储器控制器106来执行。将理解,本文中所描述的方法可以包括更少或附加的动作。进一步,方法600不应当被理解为暗示动作应当以任何特定的次序来执行。
在框602,从温度传感器接收温度测量。温度测量与电子组件(诸如存储器设备或处理器)的结温度对应。在一些示例中,两个或更多温度测量可以从不同温度传感器接收到,并且被用来计算单独的组件的单独的扼制系数。在其他示例中,两个或更多的温度测量被热管理单元116组合以向框604供应最高测得的温度。
在框604,扼制系数被基于温度测量针对电子组件生成。扼制系数可以用各种方式计算。用来生成扼制系数的技术考虑性能保障。例如,扼制系数可以使用具有三个温度阈值,包括为电子组件指定的最大结温度的第一温度阈值、与性能保障对应的第三温度阈值、在第一温度阈值和第三温度阈值之间的第二温度阈值,的算法来计算。在一些示例中,第一温度阈值、第二温度阈值、和第三温度阈值在温度上是由温度传感器的测量解析度分开的。
若温度测量大于第三温度阈值但是低于或在第二温度阈值,则电子组件的性能被减小到大致等于电子组件的性能保障。若温度测量大于第二温度阈值但是低于或在第一温度阈值,则电子组件的性能被减小到小于电子组件的性能保障。若温度测量大于第一温度阈值,则电子组件的性能被减小到最小值。例如,在存储器设备的情况中,性能被减小到将避免缺乏的可能性的最小值,例如,最大存储器带宽的百分之10。在一些示例中,电子组件的功率预算被接收,且扼制系数被计算为功率预算的百分比。在一些示例中,生成扼制系数包括使用比例-积分-微分控制算法计算扼制系数。
在框606,扼制系数被用来减小电子组件的性能。例如,若电子组件是随机存取存储器(RAM)(诸如,堆叠式多通道动态随机存取存储器(MCDRAM)),则减小电子组件的性能可以包括在指定时间段上限制对于RAM的存储器访问的次数。存储器访问可以在数个地点被扼制:由存储器控制器在存储器设备处,或者在生成存储器事务的处理器处。减小电子组件的性能还可以包括减小电子组件的时钟频率。在一些示例中,电子组件是处理器(诸如通用处理器、数字信号处理器)、存储器控制器、存储控制器、网络接口控制器,以及其他。电子组件可以是多芯片封装的一部分。取决于测得的温度,电子组件的性能被减小到大致等于电子组件的性能保障。
该方法可以用周期性的形式重复以将电子设备维持在为电子设备指定的最大结温度以下的合适的温度。将理解图6的过程流程图并不意在指示方法600的框要以任何特定次序执行,或者在每一种情况下都要包括所有框。进一步,取决于特定实现,可在方法600中包括任何数量的附加框。
示例
示例1是执行热扼制的计算设备。该计算设备包括电子组件;热耦合到该电子组件的温度传感器;以及从该温度传感器接收温度测量并生成该电子组件的扼制系数的热管理控制器。若温度测量大于指定阈值,则扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。
示例2包括示例1的计算设备,包括或排除任选特征。在该示例中,该热管理控制器使用具有三个温度阈值的算法计算扼制系数。任选地,三个温度阈值包括:第一温度阈值,其是为该电子组件指定的最大结温度;第三温度阈值,其是与该性能保障对应的指定阈值;以及在该第一温度阈值和该第三温度阈值之间的第二温度阈值。任选地,该第一温度阈值和该第二温度阈值之间的差等于该温度传感器的测量解析度。任选地,该第二温度阈值和该第三温度阈值之间的差等于该温度传感器的测量解析度。若温度测量大于该第三温度阈值但是小于或等于该第二温度阈值,则该扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。
示例3包括示例1到2中任一项的计算设备,包括或排除任选特征。在该示例中,该扼制系数是可以在该电子组件上消耗的最大功率的百分比。
示例4包括示例1到3中任一项的计算设备,包括或排除任选特征。在该示例中,该电子组件是随机存取存储器(RAM)且扼制系数使得存储器控制器限制对于该RAM的存储器访问的次数。
示例5包括示例1到4中任一项的计算设备,包括或排除任选特征。在该示例中,热管理控制器实现比例-积分-微分控制算法。
示例6包括示例1到5中任一项的计算设备,包括或排除任选特征。在该示例中,该电子组件是位于与该计算设备的中央处理单元(CPU)相同封装内的动态随机存取存储器(DRAM)。
示例7包括示例1到6中任一项的计算设备,包括或排除任选特征。在该示例中,该电子组件是堆叠式多通道动态随机存取存储器(MCDRAM)。
示例8包括示例1到7中任一项的计算设备,包括或排除任选特征。在该示例中,若该电子组件的扼制被激活,则该计算设备的中央处理单元(CPU)将会拒绝来自该计算设备的操作系统(OS)的对通过激活turbo模式提升性能的请求。
示例9是一种扼制电子组件的方法。该方法包括从温度传感器接收温度测量,其中该温度测量与电子组件的结温度对应;基于该温度测量生成该电子组件的扼制系数;以及若该温度测量在指定阈值之上,则响应于该扼制系数,将该电子组件的性能降低到至少该电子组件的性能保障。
示例10包括示例9的方法,包括或排除任选特征。在该示例中,生成该扼制系数包括使用具有三个温度阈值的算法计算该扼制系数。任选地,三个温度阈值包括:第一温度阈值,其是为该电子组件指定的最大结温度;第三温度阈值,其是与该性能保障对应的指定阈值;以及在该第一温度阈值和该第三温度阈值之间的第二温度阈值。任选地,该第二温度阈值和该第三温度阈值之间的差等于该温度传感器的测量解析度。若该温度测量大于该第三温度阈值但是小于或等于该第二温度阈值,则将该电子组件的性能减小到至少该电子组件的性能保障。
示例11包括示例9到10中任一项的方法,包括或排除任选特征。在该示例中,该方法包括接收该电子组件的功率预算,并且将扼制系数计算为可由该组件消耗的最大功率的百分比。
示例12包括示例9到11中任一项的方法,包括或排除任选特征。在该示例中,该电子组件是随机存取存储器(RAM),并且减小该电子组件的性能包括在指定时间段上限制对于该RAM的存储器访问的次数。
示例13包括示例9到12中任一项的方法,包括或排除任选特征。在该示例中,生成该扼制系数包括使用比例-积分-微分算法计算该扼制系数。
示例14包括示例9到13中任一项的方法,包括或排除任选特征。在该示例中,该电子组件是堆叠式多芯片动态随机存取存储器(MCDRAM)。
示例15包括示例9到14中任一项的方法,包括或排除任选特征。在该示例中,该电子组件是多芯片封装的一部分。
示例16是一种非瞬态计算机可读介质。该非瞬态计算机可读介质包括指导该处理器执行以下操作的指令:从温度传感器接收温度测量,其中该温度测量与电子组件的结温度对应;以及基于该温度测量生成该电子组件的扼制系数。若该温度测量大于指定阈值,则扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。
示例17包括示例16的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,指导该处理器生成该扼制系数的指令包括使用具有三个温度阈值的算法计算该扼制系数的指令。任选地,三个温度阈值包括:第一温度阈值,其是为该电子组件指定的最大结温度;第三温度阈值,其是与该性能保障对应的指定阈值;以及在该第一温度阈值和该第三温度阈值之间的第二温度阈值。任选地,该第一温度阈值和该第二温度阈值之间的差等于该温度传感器的测量解析度。任选地,该第二温度阈值和该第三温度阈值之间的差等于该温度传感器的测量解析度。若该温度测量大于该第三阈值,则扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。
示例18包括示例16到17中任一项的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,该非瞬态计算机可读介质包括指导该处理器接收该电子组件的功率预算,并且将该扼制系数计算为该功率预算的百分比的指令。
示例19包括示例16到18中任一项的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,该电子组件是随机存取存储器(RAM),并且该指令指导存储器控制器在指定时间段上限制对于该RAM的存储器访问的次数。
示例20包括示例16到19中任一项的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,指导该处理器生成该扼制系数的指令包括使用比例-积分-微分算法计算该扼制系数的指令。
示例21包括示例16到20中任一项的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,该电子组件是位于与该处理器相同封装内的动态随机存取存储器(DRAM)。
示例22包括示例16到21中任一项的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,该电子组件是堆叠式多通道动态随机存取存储器(MCDRAM)。
示例23包括示例16到22中任一项的非瞬态计算机可读介质,包括或排除任选特征。在该示例中,该电子组件是多芯片封装的一部分。
示例24是执行热扼制的计算设备。该计算设备包括从温度传感器接收温度测量的逻辑,其中该温度测量与电子组件的结温度对应;基于该温度测量生成该电子组件的扼制系数的逻辑;以及基于该扼制系数减小该电子组件的性能的逻辑。若该温度测量大于指定阈值,则该减小该电子组件的性能的逻辑将该电子组件的性能减小到至少该电子组件的性能保障。
示例25包括示例24的计算设备,包括或排除任选特征。在该示例中,生成该扼制系数的逻辑包括使用具有三个温度阈值的算法计算该扼制系数的逻辑。任选地,三个温度阈值包括:第一温度阈值,其是为该电子组件指定的最大结温度;第三温度阈值,其是与该性能保障对应的指定阈值;以及在该第一温度阈值和该第三温度阈值之间的第二温度阈值。任选地,该第一温度阈值和该第二温度阈值之间的差等于该温度传感器的测量解析度。任选地,该第二温度阈值和该第三温度阈值之间的差等于该温度传感器的测量解析度。若该温度测量大于该第三温度阈值,则扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。
示例26包括示例24到25中任一项的计算设备,包括或排除任选特征。在该示例中,该计算设备包括接收该电子组件的功率预算,并且将该扼制系数计算为该功率预算的百分比的逻辑。
示例27包括示例24到26中任一项的计算设备,包括或排除任选特征。在该示例中,该电子组件是随机存取存储器(RAM),并且减小该电子组件的性能的逻辑在指定时间段上限制对于该RAM的存储器访问的次数。
示例28包括示例24到27中任一项的计算设备,包括或排除任选特征。在该示例中,生成该扼制系数的逻辑包括使用比例-积分-微分算法计算该扼制系数的逻辑。
示例29包括示例24到28中任一项的计算设备,包括或排除任选特征。在该示例中,该电子组件是位于与该计算设备的CPU相同封装内的动态随机存取存储器(DRAM)。
示例30包括示例24到29中任一项的计算设备,包括或排除任选特征。在该示例中,该电子组件是堆叠式多通道动态随机存取存储器(MCDRAM)。
示例31包括示例24到30中任一项的计算设备,包括或排除任选特征。在该示例中,该计算设备是多芯片封装。
示例32是一种执行热扼制的设备。该设备包括用于从温度传感器接收温度测量的装置,其中该温度测量与电子组件的结温度对应;用于基于该温度测量生成该电子组件的扼制系数的装置;以及用于基于该扼制系数减小该电子组件的性能的装置。若该温度测量大于指定阈值,则该用于减小该电子组件的性能的装置将该电子组件的性能减小到至少该电子组件的性能保障。
示例33包括示例32的设备,包括或排除任选特征。在该示例中,用于生成该扼制系数的装置包括用于使用具有三个温度阈值的算法计算该扼制系数的装置。任选地,三个温度阈值包括:第一温度阈值,其是为该电子组件指定的最大结温度;第三温度阈值,其是与该性能保障对应的指定阈值;以及在该第一温度阈值和该第三温度阈值之间的第二温度阈值。任选地,该第一温度阈值和该第二温度阈值之间的差等于该温度传感器的测量解析度。任选地,该第二温度阈值和该第三温度阈值之间的差等于该温度传感器的测量解析度。若该温度测量大于该第三温度阈值,则扼制系数将该电子组件的性能减小到至少该电子组件的性能保障。
示例34包括示例32到33中任一项的设备,包括或排除任选特征。在该示例中,该设备包括用于接收该电子组件的功率预算,并且将该扼制系数计算为该功率预算的百分比的装置。
示例35包括示例32到34中任一项的设备,包括或排除任选特征。在该示例中,该电子组件是随机存取存储器(RAM),并且用于减小该电子组件的性能的装置在指定时间段上限制对于该RAM的存储器访问的次数。
示例36包括示例32到35中任一项的设备,包括或排除任选特征。在该示例中,用于生成该扼制系数的装置包括用于使用比例-积分-微分算法计算该扼制系数的装置。
示例37包括示例32到36中任一项的设备,包括或排除任选特征。在该示例中,该电子组件是动态随机存取存储器(DRAM)。
示例38包括示例32到37中任一项的设备,包括或排除任选特征。在该示例中,该电子组件是堆叠式多通道动态随机存取存储器(MCDRAM)。
示例39包括示例32到38中任一项的设备,包括或排除任选特征。在该示例中,该设备包括mu。
在以上描述和权利要求书中,可使用术语“耦合的”和“连接的”及其衍生词。应当理解,这些术语并不旨在作为彼此的同义词。相反,在具体实施例中,“连接的”用于指示两个或更多元件彼此直接物理或电接触。“耦合”可表示两个或多个元件直接物理或电气接触。然而,“耦合的”也可意味着两个或更多个元件并未彼此直接接触,但是仍然彼此协作或彼此作用。
一些实施例可在硬件、固件和软件中的一者或组合中实现。一些实施例还可被实现为存储在机器可读介质上的指令,其可由计算平台读取和执行,以执行本文所述的操作。机器可读介质可以包括用于存储或传输机器(例如:计算机)可读形式的信息的任何机制。例如,计算机可读介质可包括只读存储器(ROM);随机存取存储器(RAM);磁盘存储介质;光存储介质;闪存设备;或电、光、声或其它形式的传播信号(例如,载波、红外信号、数字信号、或发送和/或接收信号的接口等)等等。
实施例是实现方式或示例。说明书中对“实施例”、“一个实施例”、“一些实施例”、“各种实施例”或“另一些实施例”的引用表示结合这些实施例而描述的特定特征、结构、或特性被包括在本文中所描述的至少一些实施例中,而不一定在所有的实施例中。各处出现的“实施例”、“一个实施例”或“一些实施例”不一定都指相同的实施例。
注意,并非本文中描述和示出的所有组件、特征、结构、或特性等都要被包括特定实施例或每种情况中的实施例中。如果例如说明书陈述“可以”、“可能”、“能”、或“能够”包括组件、特征、结构、或特性,则不一定在每个情况中都包括该特定组件、特征、结构、或特性。如果说明书或权利要求书提到“一”或“一个”元件,则这并不意味着仅有一个该元件。如果说明书或权利要求书引用“附加的”元件,则不排除有多于一个的该附加的元件。
要注意的是,虽然参考特定实现方式描述了一些实施例,但根据一些实施例,其他实现方式也是可能的。另外,附图中所示的和/或本文描述的电路元件或其它特征的配置和/或顺序可以不以本文中所示和所描述的特定方式安排。根据一些实施例,许多其他布置是可能的。
在附图中示出的每一个系统中,在一些情况下的每个元件可具有相同或不同的附图标记以表明所表示的元件可能不同和/或类似。但是,元件可以足够灵活以具有不同的实现方式,并与本文所示或所述的一些或所有系统一起操作。附图中示出的各种元件可以是相同或不同的。将哪个称为第一元件以及将哪个称为第二元件是任意的。
要理解的是,上述示例中的特定细节可被用在一个或多个实施例中的任何地方。例如,上述计算设备的所有任选特征也可相对于此处描述的方法或计算机可读介质而被实现。进一步,尽管已经在此处使用过程流程图和/或状态图来描述各实施例,但本发明不限于此处的那些图或相应的描述。例如,流程不必经过每个所示的框或状态或以此处所示和所述的完全相同的顺序进行。
本发明不限于此处列出的特定细节。实际上,受益于本公开的本领域的技术人员将理解,可在本发明的范围内进行来自上述描述和附图的很多其它变型。因此,由所附权利要求书(包括对其进行的任何修改)定义本发明的范围。

Claims (20)

1.一种执行热扼制的计算设备,包括:
电子组件;
温度传感器,热耦合到所述电子组件;以及
热管理控制器,用于从所述温度传感器接收所述电子组件的温度测量并生成所述电子组件的扼制系数;
其中,若所述温度测量大于指定阈值,则所述扼制系数用于将所述电子组件的性能减小到至少所述电子组件的性能保障,所述性能保障对应于所述电子组件所要满足的最小性能,
其中,所述热管理控制器用于使用具有三个温度阈值的算法计算所述扼制系数,所述三个温度阈值包括:
第一温度阈值,其是为所述电子组件指定的最大结温度;
第三温度阈值,其是与所述性能保障对应的指定阈值;以及
在所述第一温度阈值和所述第三温度阈值之间的第二温度阈值。
2.如权利要求1所述的计算设备,其特征在于,所述第一温度阈值和所述第二温度阈值之间的差等于所述温度传感器的测量解析度。
3.如权利要求1所述的计算设备,其特征在于,所述第二温度阈值和所述第三温度阈值之间的差等于所述温度传感器的测量解析度。
4.如权利要求1所述的计算设备,其特征在于,若所述温度测量大于所述第三温度阈值但是小于或等于所述第二温度阈值,则所述扼制系数将所述电子组件的性能减小到至少所述电子组件的性能保障。
5.如权利要求1-4中任一项所述的计算设备,其特征在于,所述扼制系数是可以在所述电子组件上消耗的最大功率的百分比。
6.如权利要求1-4中任一项所述的计算设备,其特征在于,所述电子组件是随机存取存储器(RAM),且所述扼制系数用于使得存储器控制器限制对于所述RAM的存储器访问的次数。
7.如权利要求1-4中任一项所述的计算设备,其特征在于,所述热管理控制器实现比例-积分-微分(PID)控制算法。
8.如权利要求1-4中任一项所述的计算设备,其特征在于,所述电子组件是位于与所述计算设备的中央处理单元(CPU)相同封装内的动态随机存取存储器(DRAM)。
9.如权利要求1-4中任一项所述的计算设备,其特征在于,所述电子组件是堆叠式多通道动态随机存取存储器(MCDRAM)。
10.如权利要求1-4中任一项所述的计算设备,其特征在于,若所述电子组件的扼制被激活,则所述计算设备的中央处理单元(CPU)将会拒绝来自该计算设备的操作系统(OS)的对通过激活turbo模式提升性能的请求。
11.一种扼制电子组件的方法,包括:
从温度传感器接收温度测量,其中所述温度测量与电子组件的结温度相对应;
基于所述温度测量生成所述电子组件的扼制系数;以及
响应于所述扼制系数,若所述温度测量大于指定阈值,则将所述电子组件的性能减小到至少所述电子组件的性能保障,所述性能保障对应于所述电子组件所要满足的最小性能,
其中生成所述扼制系数包括使用具有三个温度阈值的算法计算所述扼制系数,所述三个温度阈值包括:
第一温度阈值,其是为所述电子组件指定的最大结温度;
第三温度阈值,其是与所述性能保障对应的指定阈值;以及
在所述第一温度阈值和所述第三温度阈值之间的第二温度阈值。
12.如权利要求11所述的方法,其特征在于,所述第二温度阈值和所述第三温度阈值之间的差等于所述温度传感器的测量解析度。
13.如权利要求11所述的方法,其特征在于,包括,若所述温度测量大于所述第三温度阈值但是小于或等于所述第二温度阈值,则将所述电子组件的性能减小到至少所述电子组件的性能保障。
14.一种用于执行热扼制的设备,包括:
用于从温度传感器接收温度测量的装置,其中所述温度测量与电子组件的结温度相对应;
用于基于所述温度测量生成所述电子组件的扼制系数的装置;
用于基于所述扼制系数减小所述电子组件的性能的装置;以及
其中,若所述温度测量大于指定阈值,则所述用于减小该电子组件的性能的装置将所述电子组件的性能减小到至少所述电子组件的性能保障,所述性能保障对应于所述电子组件所要满足的最小性能,
其中,所述用于生成扼制系数的装置包括用于使用具有三个温度阈值的算法计算所述扼制系数的装置,所述三个温度阈值包括:
第一温度阈值,其是为所述电子组件指定的最大结温度;
第三温度阈值,其是与所述性能保障对应的指定阈值;以及
在所述第一温度阈值和所述第三温度阈值之间的第二温度阈值。
15.如权利要求14所述的设备,其特征在于,所述第一温度阈值和所述第二温度阈值之间的差等于所述温度传感器的测量解析度。
16.如权利要求14所述的设备,其特征在于,所述第二温度阈值和所述第三温度阈值之间的差等于所述温度传感器的测量解析度。
17.如权利要求14所述的设备,其特征在于,若所述温度测量大于所述第三温度阈值但是小于或等于所述第二温度阈值,则所述扼制系数用于将所述电子组件的性能减小到至少所述电子组件的性能保障。
18.如权利要求14-17中任一项所述的设备,其特征在于,包括用于接收所述电子组件的功率预算并将所述扼制系数计算为所述功率预算的百分比的装置。
19.如权利要求14-17中的任一项所述的设备,其特征在于,所述用于生成扼制系数的装置包括用于使用比例-积分-微分算法计算所述扼制系数的装置。
20.一种非瞬态计算机可读介质,其上存储有指令,所述指令响应于被执行而导致计算设备执行如权利要求11-13中的任一项所述的方法。
CN201680030307.3A 2015-06-26 2016-04-22 用于电子设备的热扼制的方法和设备 Active CN107690626B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/752,512 2015-06-26
US14/752,512 US10275001B2 (en) 2015-06-26 2015-06-26 Thermal throttling of electronic devices
PCT/US2016/028849 WO2016209348A1 (en) 2015-06-26 2016-04-22 Thermal throttling of electronic devices

Publications (2)

Publication Number Publication Date
CN107690626A CN107690626A (zh) 2018-02-13
CN107690626B true CN107690626B (zh) 2021-06-15

Family

ID=57586027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680030307.3A Active CN107690626B (zh) 2015-06-26 2016-04-22 用于电子设备的热扼制的方法和设备

Country Status (5)

Country Link
US (1) US10275001B2 (zh)
EP (1) EP3314359A4 (zh)
KR (1) KR102664836B1 (zh)
CN (1) CN107690626B (zh)
WO (1) WO2016209348A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10698459B2 (en) * 2015-02-17 2020-06-30 Apple Inc. Electronic devices and method of controlling an electronic device
US10255231B1 (en) * 2015-07-31 2019-04-09 Marvell International Ltd. Apparatus and methods for managing aggregate integrated circuit (IC) current demand
US20190004723A1 (en) * 2015-11-04 2019-01-03 Hewlett-Packard Development Company, L.P. Throttling components of a storage device
KR102529171B1 (ko) * 2016-02-26 2023-05-04 삼성전자주식회사 메모리 장치 진단 시스템
US10558380B2 (en) * 2016-08-09 2020-02-11 Seagate Technology Llc Active power management
US10423209B2 (en) 2017-02-13 2019-09-24 Apple Inc. Systems and methods for coherent power management
JP6640776B2 (ja) 2017-03-17 2020-02-05 キオクシア株式会社 メモリシステム
US10795836B2 (en) 2017-04-17 2020-10-06 Microsoft Technology Licensing, Llc Data processing performance enhancement for neural networks using a virtualized data iterator
JP2019114009A (ja) * 2017-12-22 2019-07-11 ルネサスエレクトロニクス株式会社 半導体装置、半導体システム、及びその方法
US10901893B2 (en) * 2018-09-28 2021-01-26 International Business Machines Corporation Memory bandwidth management for performance-sensitive IaaS
US11397460B2 (en) * 2019-06-20 2022-07-26 Western Digital Technologies, Inc. Intelligent power saving mode for solid state drive (ssd) systems
CN110569175B (zh) * 2019-09-17 2023-03-17 美特科技(苏州)有限公司 一种温度保护方法、装置、芯片、设备以及存储介质
US11543970B2 (en) * 2020-01-15 2023-01-03 Micron Technology, Inc. Managing dynamic temperature throttling thresholds in a memory subsystem
CN111651327B (zh) * 2020-06-03 2022-09-20 深圳忆联信息系统有限公司 固态硬盘的温度控制方法、装置、计算机设备和存储介质
US12019898B2 (en) * 2020-09-30 2024-06-25 Seagate Technology Llc Data storage system with workload-based dynamic power consumption
US11740953B2 (en) 2021-01-22 2023-08-29 Google Llc Solder joint damage-prevention mode for a computing device
US11934238B2 (en) * 2021-05-21 2024-03-19 Western Digital Technologies, Inc. Customized thermal throttling using environmental conditions
JP2022180826A (ja) * 2021-05-25 2022-12-07 キヤノン株式会社 制御装置、制御装置の制御方法及びプログラム
US20230152989A1 (en) * 2021-11-15 2023-05-18 Samsung Electronics Co., Ltd. Memory controller adjusting power, memory system including same, and operating method for memory system
WO2024019280A1 (ko) * 2022-07-19 2024-01-25 삼성전자주식회사 Pid 제어기에 기초하여 전자 장치의 발열을 제어하는 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1602460A (zh) * 2001-12-12 2005-03-30 英特尔公司 操作系统的协调热管理
CN1957318A (zh) * 2004-05-24 2007-05-02 英特尔公司 计算机系统中的扼制存储器
CN104487911A (zh) * 2012-07-26 2015-04-01 高通股份有限公司 用于功率管理ic的自主热控制器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7975156B2 (en) * 2008-10-21 2011-07-05 Dell Products, Lp System and method for adapting a power usage of a server during a data center cooling failure
US7774627B2 (en) * 2002-10-03 2010-08-10 Via Technologies, Inc. Microprocessor capable of dynamically increasing its performance in response to varying operating temperature
US7698578B2 (en) * 2006-06-29 2010-04-13 Nokia Corporation Temperature-dependent power adjustment of transmitter
US7830690B2 (en) * 2006-10-30 2010-11-09 Intel Corporation Memory module thermal management
US9122648B2 (en) * 2007-08-22 2015-09-01 Advanced Micro Devices, Inc. Temperature throttling mechanism for DDR3 memory
TWI578330B (zh) 2007-10-09 2017-04-11 A-Data Technology Co Ltd Solid state semiconductor storage device with temperature control function and control method thereof
JP5835465B2 (ja) 2012-03-30 2015-12-24 富士通株式会社 情報処理装置、制御方法、及びプログラム
US9355024B2 (en) 2012-10-10 2016-05-31 Apple Inc. Systems and methods for nonvolatile memory performance throttling
US9665141B2 (en) * 2013-06-05 2017-05-30 Apple Inc. Thermal management of an integrated circuit
US9557786B2 (en) * 2013-11-11 2017-01-31 Mediatek Inc. Power thermal policy using micro-throttle
US20160062421A1 (en) * 2014-09-03 2016-03-03 Lenovo (Singapore) Pte. Ltd. Device side initiated thermal throttling

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1602460A (zh) * 2001-12-12 2005-03-30 英特尔公司 操作系统的协调热管理
CN1957318A (zh) * 2004-05-24 2007-05-02 英特尔公司 计算机系统中的扼制存储器
CN104487911A (zh) * 2012-07-26 2015-04-01 高通股份有限公司 用于功率管理ic的自主热控制器

Also Published As

Publication number Publication date
KR102664836B1 (ko) 2024-05-10
EP3314359A4 (en) 2019-01-30
KR20180021831A (ko) 2018-03-05
US10275001B2 (en) 2019-04-30
CN107690626A (zh) 2018-02-13
US20160378149A1 (en) 2016-12-29
EP3314359A1 (en) 2018-05-02
WO2016209348A1 (en) 2016-12-29

Similar Documents

Publication Publication Date Title
CN107690626B (zh) 用于电子设备的热扼制的方法和设备
US9304565B2 (en) Information handling system power supply automated de-rating for power output and thermal constraints
US8412962B2 (en) Microprocessor with improved thermal monitoring and protection mechanism
US7774627B2 (en) Microprocessor capable of dynamically increasing its performance in response to varying operating temperature
US7698583B2 (en) Microprocessor capable of dynamically reducing its power consumption in response to varying operating temperature
US7464277B2 (en) Microprocessor performance mode control utilizing sensed temperature as an indication of microprocessor utilization
US11550382B2 (en) Power-subsystem-monitoring-based graphics processing system
US9223326B2 (en) Distributed thermal management system for servers
US20140240913A1 (en) Thermal regulation for solid state memory
US10209750B2 (en) SSD driven system level thermal management
US7770042B2 (en) Microprocessor with improved performance during P-state transitions
US20140277750A1 (en) Information handling system dynamic fan power management
US10788847B2 (en) Apparatus and methods for characterizing a heat pipe and for controlling an operating parameter of at least one heat generating component coupled to the heat pipe
CN113826082A (zh) 一种用于控制散热装置的方法及其设备
US20210326188A1 (en) Stabilizing performance of processing devices
US9261098B2 (en) Fan speed and memory regulator control based on memory margin
US20240007955A1 (en) Power and temperature driven bandwidth throttling using delay insertion
Gough et al. Platform power management
EP1965286B1 (en) Microprocessor with improved thermal monitoring and protection mechanism
KR20170076306A (ko) 모바일 디바이스의 발열 관리 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant