CN114217942A - 刀片外壳中的功率管理 - Google Patents

刀片外壳中的功率管理 Download PDF

Info

Publication number
CN114217942A
CN114217942A CN202110394568.6A CN202110394568A CN114217942A CN 114217942 A CN114217942 A CN 114217942A CN 202110394568 A CN202110394568 A CN 202110394568A CN 114217942 A CN114217942 A CN 114217942A
Authority
CN
China
Prior art keywords
power
cpu
msr
blade enclosure
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110394568.6A
Other languages
English (en)
Other versions
CN114217942B (zh
Inventor
J·约克
M·斯特恩斯
T·马杰尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Enterprise Development LP
Original Assignee
Hewlett Packard Enterprise Development LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Enterprise Development LP filed Critical Hewlett Packard Enterprise Development LP
Publication of CN114217942A publication Critical patent/CN114217942A/zh
Application granted granted Critical
Publication of CN114217942B publication Critical patent/CN114217942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/10Current supply arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/263Arrangements for using multiple switchable power supplies, e.g. battery and AC
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3237Power saving characterised by the action undertaken by disabling clock generation or distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Software Systems (AREA)
  • Power Sources (AREA)

Abstract

本文公开的示例涉及刀片外壳中的功率管理。通过基板管理控制器发起入侵检测模式。响应于确定所述刀片外壳中的功率不足,操作停止时钟引脚以控制所述刀片外壳中的服务器的功耗。在确定所述功率不足的预定的时间之后,重新配置与所述服务器的中央处理单元(CPU)的功率设置相关联的模型特定寄存器(MSR)。重新配置所述MSR包括,基于所述刀片外壳中的可用功率来识别功率曲线,并经由所述服务器的基板管理管理器(BMC)基于所述功率曲线来修改所述MSR中的寄存器状态。随后,停止所述停止时钟引脚的操作。

Description

刀片外壳中的功率管理
背景技术
服务提供商和制造商面临着例如通过提供计算能力访问向消费者传递质量和价值的挑战。数据中心是用于容纳计算机网络、计算机系统以及相关联的部件(如电信系统和存储系统)的设施。数据中心、办公室等可以是制造商所制造的计算设备的终端位置。刀片环境广泛用于数据中心和边缘位置,以节省空间并改善系统管理。
附图说明
以下具体实施方式参考附图,其中:
图1和图2是根据各种示例的能够进行功率管理的刀片外壳的框图;
图3图示了根据示例的在减小的功率包络内MSR值的变化对性能的影响;
图4是根据示例的用于刀片外壳中的功率管理的方法的流程图;以及
图5是根据示例的用于执行刀片外壳中的功率管理的设备的框图。
具体实施方式
刀片外壳在单一机架中容纳了多个服务器模块(也称作刀片)。刀片服务器是一种精简的服务器计算机,其模块化设计被优化用于减少物理空间和能量的使用。刀片外壳保持多个刀片服务器并向这些刀片服务器提供如供电、冷却、联网、各种互联和管理等服务。而且,刀片外壳通过在多个服务器刀片之间共享多个电源有助于实现冗余和功率节省。
通常,刀片外壳在安装在刀片外壳内的服务器刀片之间共享多个电源。在电源失效期间,一个或多个电源可能不能正常工作。因此,电源失效可能引起刀片外壳的可用功率下降,从而引起功率不足。而且,系统管理员可能将刀片外壳可用的总功率限定为以阈值为上限。这个上限可能不适合这种情况。在示例中,基于管理员配置,刀片外壳可用的总功率可以是3000W,然而,刀片外壳中的部件可能有超过3000W的功率需求。在这样的情况下,可能由于管理员的配置而发生功率不足。为了将功率不足的影响降到最低,即使处在较低功率状态下,机架基础设施和所有刀片服务器也应当保持运行。
在一些示例中,停止时钟引脚(可外部访问的专用引脚)直接连接到每个刀片服务器的中央处理单元(CPU)上的停止时钟输入或处理器过热输入。可以将停止时钟引脚驱动为高或低,以使CPU在以下两种功耗模式之一之间切换:“活跃”(全功率)或者“停止时钟”(减小的功率或者最小功率)。因此,可以操控停止时钟引脚以控制每个刀片服务器的功耗。在一个示例中,可以使用脉冲宽度调制信号以控制CPU的频率。在这个示例中,CPU能以更低的核心频率运行并实现功率节省。CPU可以在脉冲的一半时间处于活跃状态并在脉冲的另一半时间处于停止时钟状态,从而使时钟速度整体上下降大约一半并因此节省功率。
然而,使CPU在活跃功耗模式与停止时钟功耗模式之间切换可能对CPU的性能产生不利影响。而且,由于活跃模式与停止时钟模式之间的功率波动,CPU性能的对应变化也不是线性的。例如,即使将停止时钟引脚设置在90%的时间处于活动模式并在10%的时间处于停止时钟模式,由于停止时钟方法的高延迟,CPU的性能能力可能无法达到最大性能能力的90%。因此,刀片外壳中的功率管理可能引起服务器性能的突然急剧下降。进一步地,随着CPU具有更大范围的动态功率控制(如,其中,CPU的功率消耗可能会在2至3瓦特到多于100瓦特之间波动),以上解释的功率管理问题可能会恶化。
本文描述的方法使得服务器刀片能够在存在功率不足时保持在降低的可用功率之内的同时接近其最大能力来运行。在示例中,刀片外壳的电源可能遭受故障,从而引起功率不足。在示例中,当确定功率不足时,操作停止时钟引脚以在确定功率不足之后在预定义时间段内操控CPU功耗。在预定义时间段之后,机架控制器经由刀片服务器的基板管理控制器(BMC)基于预定义功率曲线重新配置与刀片服务器的CPU的功率设置相关联的一个或多个模型特定寄存器(MSR)。然后CPU基于经重新配置的MSR进行操作,并断开停止时钟引脚。因此,由CPU基于经重新配置的MSR在本地实施功率管理。这使得功耗减少而CPU性能提高。
在这个示例中,由CPU基于经重新配置的MSR在本地管理CPU功耗。因此,CPU性能随可用功率波动的变化可以几乎是线性的,从而提供更好的性能。这是因为所描述的技术使得CPU能够基于经重新配置的MSR做出内部功率管理决策,而不是基于来自外部部件(如停止时钟引脚)的指令进行操作。由于CPU具有千兆赫兹数量级的操作频率,因此可以由CPU以千兆赫兹数量级的频率基于经重新配置的MSR在本地实施或修改内部功率管理决策。相反,如果由停止时钟引脚(其以千赫兹数量级的最大频率操作)驱动CPU的功率管理决策,则在CPU中以千赫兹数量级的频率实施功率管理决策。因此,与停止时钟方法相比,所描述的方法使得功率管理决策在CPU中更快地实施。因此,可以减少在CPU中实施功率管理决策的延迟,从而增强CPU性能。
进一步地,所描述的方法使得能够在CPU内应用细粒度的功率配置,这使得对于给定的瓦数极限能够提高性能。不是使停止时钟引脚在最大阈值功率与最小阈值功率之间振荡,而是可以修改MSR以在CPU中实施细粒度的功率配置,这可以产生更好的CPU性能。
图1和图2是根据各种示例的能够进行功率管理的刀片外壳的框图。刀片外壳100包括服务器102、机架管理器104、停止时钟引脚106。刀片外壳200还包括电源单元206。服务器102包括基板管理控制器(BMC)108、模型特定寄存器(MSR)110、以及中央处理单元(CPU)112。服务器202还包括系统板208、一个或多个总线设备210、控制器中枢212、一个或多个专用集成电路(ASIC)214、以及存储器模块216。
在一些示例中,BMC 108可以用于实施服务器102、202的服务。BMC 108可以使用用于执行高级操作系统的、与(一个或多个)中央处理单元(CPU)112分离的处理器来实施。BMC可以为计算设备提供所谓的“无人值守(lights-out)”功能。即使服务器102、202上未安装操作系统或操作系统不起作用,无人值守功能也可以允许如系统管理员等用户在服务器102、202上执行管理操作。此外,在一个示例中,BMC 108可以以辅助电源运行,因此服务器102、202不需要通电到运转(on)状态,在所述运转状态下,对服务器102、202的控制在启动之后移交到操作系统。作为示例,BMC 108可以提供所谓的“带外(out-of-band)”服务,诸如远程控制台访问、远程重启和功率管理功能、监测系统的健康状况、访问系统日志等。如本文所使用的,BMC 108具有对服务器102、202的子系统的管理能力,并且与执行计算设备(例如,服务器或服务器组)的主操作系统的CPU 112分离。
如上所述,在一些实例中,BMC 108可以启用服务器102、202的无人值守管理,所述无人值守管理提供远程管理访问(例如,系统控制台访问),而不管服务器102、202是否通电、主网络子系统硬件是否正在起作用、或OS是否正在运行或甚至是否已安装。BMC 108可包括管理员可用来与BMC 108远程通信的接口,如网络接口和/或串行接口。如本文所使用的“带外”服务是由BMC 108经由专用管理通道(例如,网络接口或串行接口)提供的、并且无论服务器102、202是否处于通电运转状态都可用的服务。
在一些示例中,BMC 108可被包括作为刀片外壳100、200的部分。在其他示例中,BMC 108可被包括在所述服务器中的一个或多个中(例如,作为服务器的管理子系统的部分)或者经由接口(例如,外围接口)连接。在一些示例中,与BMC 108相关联的传感器可以测量内部物理变量,如湿度、温度、电源电压、通信参数、风扇速度、操作系统功能等。在其他示例中,BMC 108可以收集并存储日志信息,例如与服务器102、202的功率设置相关联的日志信息。BMC 108还可以重启或断电重启设备。如上所述,BMC 108允许对设备进行远程管理,因此可以使用BMC 108向集控站发出通知,或可经由BMC 108实施密码或其他用户输入。
如本文所使用的“操作系统”(OS)是管理计算机硬件与软件资源、并为计算机程序提供公共服务的系统软件。所述OS可以在CPU 112上执行并加载到存储器中(未示出)。所述OS是如LINUX、WINDOWS、UNIX、裸机管理程序、或其他类似高级软件(服务器102、202的启动固件引擎将对服务器102、202的控制转向这些高级软件)等高级OS。
如本文所使用的系统板208是用于服务器102、202的主印刷电路板,并允许服务器102、202的部件中的许多部件(例如,CPU 112、存储器模块216、外围设备、总线设备210等)之间进行通信。多个硬件设备可以耦接至系统板208。在一些示例中,控制器中枢212可以是I/O控制器中枢,例如南桥。控制器中枢可以用于管理CPU 112与系统板208的其他部件之间的数据通信。在一些示例中,控制器中枢212可以具有到北桥设备或CPU的直接媒体接口。进一步地,控制器中枢212可以为服务器202提供外围支持,比如,如通用串行总线(USB)、外围部件互连(PCI)、PCI高速、PCI扩展、串行AT附件等总线连接、音频电路、集成以太网、增强型主机控制器接口及其组合等。
服务器202的设备或部件的示例包括一个或多个总线(例如,PCIe总线)上的总线设备210、北桥设备、其他ASIC 214等。如本文所使用的存储器模块216是可以存储信息的部件。存储器模块216可以是易失性的或非易失性的。进一步地,存储器模块216可以是可由服务器102、202的中央处理单元112寻址的。存储器模块216的示例包括双列直插式存储器模块(DIMM)。
如本文所使用的,(一个或多个)模型特定寄存器(MSR)110是指改变或控制CPU112或其他数字设备的一般行为的处理器寄存器。这样的处理器寄存器执行的共同任务包括中断控制、切换寻址模式、分页控制、以及协处理器控制。MSR可以用在x86指令集中用于调试、程序执行追踪、计算机性能监测、以及切换某些CPU特征。
在示例中,MSR 110是处理器寄存器,所述处理器寄存器是CPU 112可快速访问的位置。寄存器可以包括少量快速存储。一些寄存器有特定的硬件功能,并且可以是只读或只写的。在计算机架构中,典型地通过与主存储器不同的机制来寻址寄存器,但是在某些情况下可以向其分配存储器地址。处理器寄存器通常位于存储器层级的顶端,并可以提供访问数据的最快方式。处理器寄存器通常指直接编码作为指令的一部分的寄存器组,如指令集所定义的。在一些架构中,MSR存储与CPU 112本身相关的数据和设置。由于MSR的含义与特定处理器的设计有关,因此它们在各个处理器代之间可能不会保持标准。一些MSR可以与CPU 112的特定功能相关联。基于存储在MSR中的值,CPU 112可以执行与MSR相关联的功能。
机架管理器104可以是管理刀片外壳100、200内的多个服务器、网络与存储装置的嵌入式系统管理硬件与软件解决方案。机架管理器104能实现刀片服务器的库存收集、配置、监测任务以及功率管理,从而启用服务器与刀片外壳100、200上的其他部件的事件警报。可以由机架管理器104管理和监测刀片外壳100、200的不同功能。在示例中,机架管理器104可以插入模块化刀片机架并通过刀片机架的电源来供电。参考图2,电源单元206可以向机架管理器104供应输入功率。电源单元206可以包括多个冗余输入源与备用电源,使得如果一个输入源发生失效,则可以由其他输入源/备用供应装置供电。进一步地,机架管理器104可以使用由BMC 108提供的带外(OOB)服务经由基于以太网的OOB通信通道与BMC 108通信。在示例中,OOB通信通道是专用管理通道(例如,网络接口或串行接口)。
机架管理器104包括存储器114和处理元件116。存储器114是可以存储信息的部件。存储器114可以是易失性的或非易失性的。进一步地,存储器114可以是机架管理器104的处理元件130可寻址的。存储器114的示例包括双列直插式存储器模块(DIMM)。进一步地,存储器114可以耦接至处理元件116,并且存储器114可以存储可由处理元件116执行的指令。
在示例中,功率曲线118可以存储在存储器114中。功率曲线118可以包括可用于重新配置与CPU 112的功率设置相关联的MSR 110的信息。在示例中,功率曲线118可包括可以写入MSR 110的值以及CPU 112的对应性能参数。
如本文所使用的,停止时钟引脚106是指连接到服务器102、202上的CPU 112的专用引脚。在示例中,取决于CPU的架构,停止时钟引脚106可以传送针对CPU 112的停止时钟输入或处理器过热输入的控制信号。在一个示例中,可以将来自停止时钟引脚106的控制信号驱动为高或低,以使CPU 112在以下两种功耗模式之间切换:“活跃”(全功率)或者“停止时钟”(减小的功率)。
电源单元206可以包括向服务器102、202与容纳在刀片外壳100、200内的其他服务器和/或部件供电的一个或多于一个输入源。在示例中,电源单元206还可以包括一个或多个备用电源。
考虑在刀片外壳100、200中确定功率不足。在示例中,机架管理器104可以持续监测刀片外壳100、200的可用功率与功率需求。基于可用功率与功率需求的比较,机架管理器104可以确定刀片外壳100、200中存在功率不足。当刀片外壳中的可用功率低于服务器和容纳在刀片外壳内的其他部件的标记功率需求时,可以理解为刀片外壳已经出现功率不足。在示例中,功率不足可能由于由电源单元206中的一个或多于一个的输入源中的故障引起的电源失效而发生。在另一个示例中,用户可能将刀片外壳100、200的可用功率配置为使得可用功率低于服务器和刀片外壳100、200内的其他部件的操作所需的功率,因此导致刀片外壳100、200的功率不足。因此,由于刀片外壳内一个或多个电源的失效/故障或由于用户配置可能发生功率不足。
响应于确定刀片外壳100、200中的功率不足,机架管理器104操作停止时钟引脚106以控制刀片外壳100、200中的服务器102、202的功耗。尽管本文中的描述是参考单一服务器进行详细说明的,但在示例中,该描述经必要修改后可适用于容纳在刀片外壳内的多个服务器。在示例中,操作停止时钟引脚106包括向CPU 112的停止时钟输入发送控制信号以使CPU 112在活跃(高功率)模式与停止时钟(低功率)模式之间切换。在示例中,经由停止时钟引脚106将脉冲宽度调制(PWM)信号发送到CPU 112的停止时钟输入以使CPU 112在活跃模式与停止时钟模式之间切换。在示例中,在停止时钟模式下,CPU 112可以以比如2至3瓦特运行,并且在活跃模式下,CPU 112可以以比如100至110瓦特运行。因此,停止时钟引脚106被配置用于使CPU 112的功耗在上阈值与下阈值之间振荡。由于在这两种模式之间切换,CPU 112的总功耗可以减小。
机架管理器104可以基于刀片外壳100、200的可用功率识别功率曲线。在示例中,机架管理器104可以基于刀片外壳100、200中的不同部件的可用功率与功率需求的比较识别功率曲线。功率曲线118可以包括要存储在MSR中以用于刀片外壳100、200的功率管理的一个或多个值。基于功率曲线118,机架管理器104可以修改MSR 110中的寄存器状态。在示例中,MSR 110指示CPU 112的热设计功率(TDP)。TDP是CPU被配置为在最大负荷下运行的预定义最大功率。TDP是供应商设计的CPU 112在延长的时间段内的最大功耗阈值。当CPU在消耗TDP时,CPU性能应当接近其最大水平。在示例中,修改MSR 110的寄存器状态包括调整存储在寄存器中的指示TDP的值。在示例中,指示TDP的MSR可以称作PL1寄存器。
在另一个示例中,MSR 110指示CPU 112被配置为以超频模式运行的高于TDP的最大阈值功率。在超频模式下,CPU 112可以以高于CPU 112的标记时钟频率的时钟频率运行。例如,如果CPU 112的一个核将受益于更快的处理速度,而其他核正在空闲或者更慢地运行,那么超频模式允许该核的基本频率按需以133MHz的增量增加。MSR可以指示高于TDP的最大功率水平,当处理器在超频模式下运行时,可以在短时间段内以所述最大功率水平运行。在示例中,指示高于TDP的最大阈值功率的MSR可以称作PL2寄存器。
在示例中,机架管理器104可以经由服务器102、202的BMC 108修改MSR 110中的寄存器(PL1或PL2之一或者两者)的状态。机架管理器104可以经由基于以太网的带外(OOB)通信通道将功率曲线发送到BMC 108,所述功率曲线包括要存储在MSR 100中的特定值。在示例中,机架管理器104可以使用BMC 108提供的OOB服务经由专用管理通道(例如,网络接口或串行接口)将功率曲线发送至BMC 108。在示例中,机架管理器104使用表述性状态转移(REST)应用编程接口(API)与BMC 108通信并发送功率曲线。
在示例中,机架管理器104还可以向BMC 108发送控制信号以将如功率曲线指示的特定值写入MSR 110中。BMC 108可以与MSR 110通信并将特定值写入MSR 110中。在示例中,BMC 108可以通过系统板208中的连接与MSR 110通信。图3图示了曲线图300,示出了减小的功率包络内MSR值的变化对性能的影响。在下表1中例示了随着指示CPU的TDP的MSR的变化的CPU性能变化,并且在图3中图示了其图形表示。参考下表1,指示TDP的MSR被称为“PL1”。“PL2”是指示CPU被配置为以超频模式运行的高于TDP的最大阈值功率的另一MSR。
“频率”是指当CPU在指定的PL1和PL2水平下100%繁忙运行时观察到的最大频率(兆赫兹(MHz))。“温度”是CPU在指定的PL1和PL2设置下100%繁忙运行时观察到的最高封装温度(摄氏度)。“完成的工作”表示当CPU在仅CPU模式下运行测试套件时所完成的工作,所述测试套件测试了CPU的性能与硬件能力。“工作/瓦特”是CPU每消耗一瓦特所完成的工作量。“全功率百分比”是CPU正在运行时当前TDP与最大TDP的度量。“全性能百分比”是在指定的PL1/PL2水平下相比于在最大功率(TDP)下的总体CPU性能的度量。“W/W效率百分比”是在指定的PL1和PL2水平下以最大TDP完成的工作量的增加百分比。出于该示例的目的,PL2的值保持恒定在85瓦特,并且PL1的值在25瓦特至45瓦特的范围内变化。在示例中,PL1可以由机架管理器104如功率曲线118所指示的那样重新配置。
表1
Figure BDA0003018092860000081
如从表1和图3看到的,即使在PL1的值相对较低时,比如25瓦特,每单位功耗完成的工作比率为78,并且CPU实现其最大性能能力的近67%。显然,即使处在较低的功率水平,通过修改MSR值(在这种情况下为PL1),CPU性能也得到提高。而且,参考图3,指示CPU的工作/瓦特效率的线302在PL1值的整个变化范围内几乎是线性的。这指示即使修改了PL1的值,CPU性能也保持稳定,而没有意外的波动。线304表示CPU运行测试套件所完成的工作。线304在PL1值的整个变化范围内几乎是线性的,从而指示即使修改了PL1的值,性能下降也非常小。线306表示“频率”。MSR(PL1)值的修改也对频率有影响,如线306所指示的。线308表示最大封装温度。
在示例中,功率曲线118(MSR 110的寄存器状态的值基于所述功率曲线而被重新配置)可以包括PL1的值的范围。尽管在表1和图3中,PL1的值是变化的,但在示例中,PL2的值或其组合可以是变化的以控制CPU的功率和性能。当然,与CPU的功率设置相关联的其他MSR也可以被重新配置以调整CPU的性能。
因此,如上文所解释的机架管理器104重新配置与服务器102的CPU 112的功率设置相关联的MSR 110。一旦MSR 110被重新配置,CPU 112能基于存储在MSR 110的值在本地管理其功耗。一旦CPU 112开始基于经重新配置的MSR管理自己的功耗,机架管理器104就停止停止时钟引脚106的操作。在示例中,机架管理器104可以向停止时钟引脚106发送控制信号以停止所述停止时钟引脚的操作。
进一步地,响应于刀片外壳100、200恢复到阈值功率,机架管理器104将MSR中的寄存器状态恢复到其默认值,从而使CPU 112以预定义额定功率运行。在示例中,阈值功率可以等于或大于刀片外壳100、200的总功率需求。在示例中,用户可以改变电源单元206的配置以允许更多功率被分配到刀片外壳100、200,因此恢复阈值功率。在另一个示例中,刀片外壳100、200可以从可能已经造成功率不足的电源失效中恢复,从而恢复阈值功率。在示例中,恢复MSR 110的寄存器状态包括将默认值写入MSR中。参考表1和图3,恢复MSR(PL1)的寄存器状态包括在PL1中写入值“45”,其中,45瓦特是CPU的标记TDP。
服务器102、202和机架管理器104可以包括处理元件,所述处理元件可以是一个或多个中央处理单元(CPU)或CPU与其他部件(例如,图形处理单元(GPU)或适合于取得并执行指令的微处理器和/或被配置为执行本文所描述的功能的电子电路)的组合。在一些示例中,对应于平台固件的固件引擎(如BIOS)可以被实施为一系列指令,所述指令编码在服务器102、202的机器可读存储介质上并且可由CPU 112执行。
在一些示例中,诸如服务器、机箱等设备可以使用通信网络进行通信。通信网络可以使用有线通信、无线通信、或其组合。进一步地,通信网络可以包括如数据网络、无线网络、电话网络等多个子通信网络。这样的网络可以包括例如公共数据网络(如因特网)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电缆网络、光纤网络、其组合等。在某些实施例中,无线网络可以包括蜂窝网络、卫星通信、无线LAN等。进一步地,通信网络可以呈设备之间的直接网络链路的形式。可以利用各种通信结构与基础设施以实施(一个或多个)通信网络。计算设备可以使用通信网络连接到其他设备。
通过示例的方式,设备彼此之间进行通信,并且与经由一个通信协议或多个协议访问通信网络的其他部件进行通信。协议可以是定义通信网络的节点如何与其他节点进行交互的规则集。进一步地,可以通过交换离散数据分组或发送信息来实施网络节点之间的通信。分组可以包括与协议相关联的头部信息(例如,有关要联系的(一个或多个)网络节点的位置的信息)以及有效载荷信息。
图4是根据示例的用于刀片外壳中的功率管理的方法的流程图。图5是根据示例的用于执行刀片外壳中的功率管理的设备的框图。设备500包括处理元件510与机器可读存储介质520,所述机器可读存储介质包括用于执行功率管理的指令522、524和526。设备500可以是例如刀片外壳,如刀片外壳100、200。设备500可以包括多个服务器(未示出),如服务器102、202。设备500包括与机架管理器104类似的机架管理器505。机架管理器505包括处理元件510和机器可读存储介质520。
处理元件510可以是一个或多个中央处理单元(CPU)、一个或多个基于半导体的微处理器、一个或多个图形处理单元(GPU)、适合于取得和执行存储在机器可读存储介质520中的指令的其他硬件设备、或它们的组合。处理元件510可以是物理设备。此外,在一个示例中,处理元件510可以包括一个芯片上的多个核,也可以包括多个芯片上的多个核、或它们的组合。处理元件510可以获取、解码和执行指令522和524,以实施刀片外壳中的功率管理。作为取得和执行指令的替代或补充方案,处理元件510可以包括至少一个集成电路(IC)、其他控制逻辑、其他电子电路或包括用于执行指令522、524和526的功能的多个电子部件的组合。
机器可读存储介质520可以是包含或存储可执行指令的任何电子、磁性、光学或其他物理存储设备。因此,机器可读存储介质可以是例如随机存取存储器(RAM)、电可擦除可编程只读存储器(EEPROM)、存储驱动器、光盘只读存储器(CD-ROM)等。这样,机器可读存储介质可以是非暂态的。如本文详细描述的,机器可读存储介质520可以用一系列可执行指令进行编码从而执行功率管理(例如,执行方法400)。
尽管下面参考设备500描述了方法400的执行,但是也可以利用其他适合于执行方法400的部件(例如,机架管理器104)。方法400可以以存储在如存储介质520等机器可读存储介质上的可执行指令的形式和/或以电子电路的形式来实施。
设备500可能遭受功率不足。响应于确定设备500中的功率不足,在402处,处理元件510可以执行停止时钟指令522以操作停止时钟引脚,从而控制容纳在设备500中的服务器的功耗。所述停止时钟引脚用于使服务器的CPU的功耗在上阈值与下阈值之间振荡。
在404处,执行功率曲线识别指令424以基于设备500的可用功率识别功率曲线。功率曲线可以包括要存储MSR中以用于设备500的功率管理的一个或多个值。在406处,基于功率曲线,可以通过执行MSR修改指令526来修改MSR中的寄存器状态。修改MSR也称为基于功率曲线重新配置MSR。因此,在示例中,在确定功率不足的预定义时间之后,与服务器的CPU的功率设置相关联的MSR。在示例中,MSR可以指示CPU的热设计功率(TDP),所述TDP是CPU被配置为在最大负荷下运行的预定义最大功率。在另一个示例中,MSR可以指示CPU被配置为以超频模式运行的高于TDP的最大阈值功率。
在示例中,经由服务器的BMC基于功率曲线修改MSR中的寄存器状态。可以经由基于以太网的带外(OOB)通信通道将功率曲线发送到BMC,所述BMC进而修改MSR的寄存器状态。机架管理器可以使用表述性状态转移(REST)应用编程接口(API)与BMC通信。
一旦MSR被重新配置,服务器的CPU可以基于经重新配置的MSR来管理服务器的功耗。在408处,可以执行停止时钟指令522以停止停止时钟引脚的操作。在示例中,响应于设备500恢复到阈值功率,将MSR中的寄存器状态恢复到默认值,从而使CPU以预定义额定功率运行。
尽管上面已经示出和描述了特定的实施方式,但是可以做出形式和细节上的各种改变。例如,已经关于一种实施方式和/或过程描述的一些特征可以与其他实施方式关联。换言之,关于一种实施方式描述的过程、特征、部件和/或特性可用于其他实施方式。此外,应当理解,本文描述的系统和方法可以包括所描述的不同实施方式的部件和/或特征的各种组合和/或子组合。因此,参考一种或多种实施方式描述的特征可以与本文描述的其他实施方式组合。

Claims (20)

1.一种用于刀片外壳中的功率管理的方法,包括:
响应于确定所述刀片外壳中的功率不足,通过机架管理器操作停止时钟引脚,以控制所述刀片外壳中的服务器的功耗;
在确定所述功率不足的预定时间之后,通过所述机架管理器重新配置与所述服务器的中央处理单元(CPU)的功率设置相关联的模型特定寄存器(MSR),其中,重新配置所述MSR包括:
基于所述刀片外壳中的可用的功率来识别功率曲线;以及
经由所述服务器的基板管理管理器(BMC)、基于所述功率曲线来修改所述MSR中的寄存器状态;以及
通过所述机架管理器停止所述停止时钟引脚的操作。
2.如权利要求1所述的方法,其中,所述MSR指示所述CPU的热设计功率(TDP),所述TDP是预定的最大功率,在所述预定的最大功率处,所述CPU被配置为在最大负荷下运行。
3.如权利要求1所述的方法,其中,所述MSR指示高于TDP的最大阈值功率,在所述最大阈值功率处,所述CPU被配置为以超频模式运行。
4.如权利要求1所述的方法,其中,重新配置所述MSR进一步包括:通过所述机架管理器,经由基于以太网的带外(OOB)通信通道将所述功率曲线发送到所述BMC。
5.如权利要求1所述的方法,其中,所述停止时钟引脚用于使所述CPU功耗在上阈值与下阈值之间振荡。
6.如权利要求1所述的方法,其中,所述机架管理器使用表述性状态转移(REST)应用编程接口(API)与所述BMC通信。
7.如权利要求1所述的方法,其中,响应于所述刀片外壳恢复到阈值功率,恢复所述MSR中的所述寄存器状态,以使所述CPU以预定的额定功率运行。
8.一种刀片外壳,包括:
服务器;以及
机架管理器,所述机架管理器包括:
处理元件;以及
耦接至所述处理元件的存储器,所述存储器储存能够由所述处理元件执行的指令:
响应于确定所述刀片外壳中的功率不足,操作停止时钟引脚以控制所述服务器的功耗;
在确定所述功率不足的预定的时间之后,重新配置与所述服务器的中央处理单元(CPU)的功率设置相关联的模型特定寄存器(MSR),其中,
重新配置所述MSR包括:
基于所述刀片外壳中的可用的功率来识别功率曲线;以及
经由所述服务器的基板管理管理器(BMC)、基于所述功率曲线来修改所述MSR中的寄存器状态;以及
停止所述停止时钟引脚的操作。
9.如权利要求8所述的刀片外壳,其中,所述MSR指示所述CPU的热设计功率(TDP),所述TDP是预定的最大功率,在所述预定的最大功率处,所述CPU被配置为在最大负荷下运行。
10.如权利要求8所述的刀片外壳,其中,所述MSR指示高于TDP的最大阈值功率,在所述最大阈值功率处,所述CPU被配置为以超频模式运行。
11.如权利要求8所述的刀片外壳,其中,为了重新配置所述MSR,所述机架管理器进一步经由基于以太网的带外(OOB)通信通道将所述功率曲线发送到所述BMC。
12.如权利要求8所述的刀片外壳,其中,所述停止时钟引脚用于使所述CPU的功耗在上阈值与下阈值之间振荡。
13.如权利要求8所述的刀片外壳,其中,所述机架管理器使用表述性状态转移(REST)应用编程接口(API)与所述BMC通信。
14.如权利要求8所述的刀片外壳,其中,响应于所述刀片外壳恢复到阈值功率,所述机架管理器恢复所述MSR中的所述寄存器状态,以使所述CPU以预定的额定功率运行。
15.一种非暂态计算机可读介质,包括用于刀片外壳中的功率管理的计算机可读指令,当所述计算机可读指令由处理元件执行时,所述计算机可读指令使所述处理元件执行:
响应于确定所述刀片外壳中的功率不足,操作停止时钟引脚,以控制所述刀片外壳中的服务器的功耗;
在确定所述功率不足的预定的时间之后,重新配置与所述服务器的中央处理单元(CPU)的功率设置相关联的模型特定寄存器(MSR),其中,重新配置所述MSR包括:
基于所述刀片外壳中的可用的功率来识别功率曲线;以及
经由所述服务器的基板管理管理器(BMC)、基于所述功率曲线来修改所述MSR中的寄存器状态;以及
停止所述停止时钟引脚的操作。
16.如权利要求15所述的非暂态计算机可读介质,其中,所述MSR指示所述CPU的热设计功率(TDP),所述TDP是预定的最大功率,在所述预定的最大功率处,所述CPU被配置为在最大负荷下运行。
17.如权利要求15所述的非暂态计算机可读介质,其中,所述MSR指示高于TDP的最大阈值功率,在所述最大阈值功率处,所述CPU被配置为以超频模式运行。
18.如权利要求15所述的非暂态计算机可读介质,其中,所述计算机可读指令用于重新配置所述MSR,进一步使所述处理元件经由基于以太网的带外(OOB)通信通道将所述功率曲线发送到所述BMC。
19.如权利要求15所述的非暂态计算机可读介质,其中,所述处理元件使用表述性状态转移(REST)应用编程接口(API)与所述BMC通信。
20.如权利要求15所述的非暂态计算机可读介质,其中,响应于所述刀片外壳恢复到阈值功率,所述计算机可读指令进一步使所述处理元件恢复所述MSR中的所述寄存器状态,以使所述CPU以预定的额定功率运行。
CN202110394568.6A 2020-10-13 2021-04-13 刀片外壳中的功率管理 Active CN114217942B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/069,123 US11347288B2 (en) 2020-10-13 2020-10-13 Power management in a blade enclosure
US17/069,123 2020-10-13

Publications (2)

Publication Number Publication Date
CN114217942A true CN114217942A (zh) 2022-03-22
CN114217942B CN114217942B (zh) 2022-09-23

Family

ID=80695904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110394568.6A Active CN114217942B (zh) 2020-10-13 2021-04-13 刀片外壳中的功率管理

Country Status (3)

Country Link
US (1) US11347288B2 (zh)
CN (1) CN114217942B (zh)
DE (1) DE102021108826B4 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399216B (zh) * 2019-06-27 2021-10-15 苏州浪潮智能科技有限公司 一种整机箱功耗的分配方法、系统、装置及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389525A (zh) * 2015-12-11 2016-03-09 曙光信息产业股份有限公司 刀片服务器的管理方法和系统
US20200192451A1 (en) * 2018-12-14 2020-06-18 Dell Products L.P. Fail-safe power limit (fspl) for fail-safe power management in information handling systems

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473767A (en) * 1992-11-03 1995-12-05 Intel Corporation Method and apparatus for asynchronously stopping the clock in a processor
US6308279B1 (en) * 1998-05-22 2001-10-23 Intel Corporation Method and apparatus for power mode transition in a multi-thread processor
JP3252827B2 (ja) 1999-04-21 2002-02-04 日本電気株式会社 電源電圧変動抑制回路
USRE40866E1 (en) 2000-09-27 2009-08-04 Huron Ip Llc System, method, and architecture for dynamic server power management and dynamic workload management for multiserver environment
JP2006031630A (ja) 2004-07-21 2006-02-02 Hitachi Ltd ストレージ装置及びストレージ装置の消費電力制御方法
US7895455B2 (en) 2007-06-25 2011-02-22 Hewlett-Packard Development Company, L.P. Dynamic converter control for efficient operation
US8122235B2 (en) * 2008-06-10 2012-02-21 Dell Products, Lp System and method of delaying power-up of an information handling system
US8458499B2 (en) * 2009-08-07 2013-06-04 International Business Machines Corporation Method for reducing power state in a computer system out-of-band when a request for reducing the power state is not immediately serviceable in band according to a priority of the request
EP3387735A4 (en) * 2016-01-28 2019-08-07 Hewlett Packard Enterprise Development LP HOUSING MONITORING WITH BATTERY PROTECTION
US11320884B2 (en) * 2018-07-20 2022-05-03 Intel Corporation Limiting computing rack input power due to power supply unit failure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389525A (zh) * 2015-12-11 2016-03-09 曙光信息产业股份有限公司 刀片服务器的管理方法和系统
US20200192451A1 (en) * 2018-12-14 2020-06-18 Dell Products L.P. Fail-safe power limit (fspl) for fail-safe power management in information handling systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马金伟: ""一种基于龙芯3B处理器的刀片式服务器系统"", 《电子技术》 *

Also Published As

Publication number Publication date
CN114217942B (zh) 2022-09-23
DE102021108826A1 (de) 2022-04-14
US20220113780A1 (en) 2022-04-14
US11347288B2 (en) 2022-05-31
DE102021108826B4 (de) 2022-12-08

Similar Documents

Publication Publication Date Title
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
EP2082322B1 (en) Security features in interconnect centric architectures
US8677160B2 (en) Managing power consumption of a computer
EP1763726A2 (en) A method and apparatus for managing power consumption of a server
US10373283B2 (en) System and method for normalization of GPU workloads based on real-time GPU data
US8103884B2 (en) Managing power consumption of a computer
US11340684B2 (en) System and method for predictive battery power management
US20160349812A1 (en) Managing Power in a High Performance Computing System for Resiliency and Cooling
CN116243996B (zh) 业务的运行切换方法、装置、存储介质及电子装置
CN114217942B (zh) 刀片外壳中的功率管理
US8250354B2 (en) Method and apparatus for making a processor sideband interface adhere to secure mode restrictions
CN113645047A (zh) 一种基于智能网卡的带外管理系统和服务器
US11243592B2 (en) System and method for controlling a power-on sequence and power throttling using power brake
CN107533348B (zh) 热管理高性能计算系统的方法和装置及计算机可读介质
US10996942B1 (en) System and method for graphics processing unit firmware updates
CN117289963A (zh) 在线更新服务器平台服务固件的目标区域的方法及设备
CN116501343A (zh) 一种程序升级方法、电源及计算设备
CN110096224A (zh) 存储器子系统中的功率控制
US11726537B2 (en) Dynamic load balancing across power supply units
US11663021B2 (en) System and method for providing granular processor performance control
US11249533B2 (en) Systems and methods for enabling power budgeting in an information handling system comprising a plurality of modular information handling systems
CN117608676B (zh) 服务器的网卡控制方法及装置、存储介质及电子设备
US11366673B1 (en) Managing transitioning of computing system to power-on state from standby-power state
CN115934184A (zh) Bios的重启方法及装置
CN114253375B (zh) 服务器散热模式控制方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant