CN114442787B - 服务器进入功耗封顶后实现整机功耗回调的方法、系统 - Google Patents

服务器进入功耗封顶后实现整机功耗回调的方法、系统 Download PDF

Info

Publication number
CN114442787B
CN114442787B CN202210109303.1A CN202210109303A CN114442787B CN 114442787 B CN114442787 B CN 114442787B CN 202210109303 A CN202210109303 A CN 202210109303A CN 114442787 B CN114442787 B CN 114442787B
Authority
CN
China
Prior art keywords
power consumption
node
psu
capping
cpld
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210109303.1A
Other languages
English (en)
Other versions
CN114442787A (zh
Inventor
张悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210109303.1A priority Critical patent/CN114442787B/zh
Publication of CN114442787A publication Critical patent/CN114442787A/zh
Application granted granted Critical
Publication of CN114442787B publication Critical patent/CN114442787B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明属于供电设计技术领域,具体提供一种服务器进入功耗封顶后实现整机功耗回调的方法、系统,所述方法包括如下步骤:确定节点配置最大功耗,计算出整机的最大功耗;根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求;当不满足冗余需求时,启动功耗封顶触发信号;当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作;检测到各节点功耗限制成功时,取消功耗封顶触发信号。触发服务器进入功耗封顶机制的策略,使服务器中的CPU以及内存进入硬件低功耗模式,与此同时,BMC会根据PSU所能提供的功耗来实现CPU以及内存回调的功能,从而保证了服务器上的业务能够正常运行。

Description

服务器进入功耗封顶后实现整机功耗回调的方法、系统
技术领域
本发明涉及服务器供电设计技术领域,具体涉及一种服务器进入功耗封顶后实现整机功耗回调的方法、系统。
背景技术
随着科学技术与互联网技术的快速发展,服务器的应用也越来越广泛。目前服务器一般要求电源支持冗余设计,PSU电源冗余设计一般是指2个或者多个以上同规格PSU并联。针对普通双路服务器,一般是2个同规格PSU并联来支持电源冗余设计。而互联网厂商为了降低整机的成本,一般会采用小功率的PSU来支持整机功耗,但当有一个PSU出现异常时,另一个PSU不能支持整机功耗,此时会出现系统宕机的现象,为了解决此问题,目前大部分的解决方案是采用Power Capping即功耗封顶技术,来降低整机功耗,使得一颗PSU也能支持整机功耗,不会出现系统宕机现象。而服务器Power Capping即功耗封顶技术,允许用户把功耗限定在指定的范围内,一般用于供电冗余和整机功耗节能这两种场景。高功耗服务器同样会要求电源支持冗余设计,高功耗服务器一般都需要支持4个及以上PSU电源。目前常见的冗余设计方式为3+1冗余,即当某一个PSU电源发生故障时实现系统冗余,剩余3个PSU电源仍可支持服务器工作,不会导致服务器出现宕机的现象。
目前针对PSU电源3+1冗余设计,当某个PSU电源出现故障时,系统仍然可以正常工作同时不会出现宕机现象。如果PSU电源故障前系统电流负载超过剩余PSU电源的最大负载能力,则在PSU电源出现故障后,需要将各个计算节点模块的性能下降到当前电源可支持的最大性能。
服务器支持 Power Capping电源冗余时,会将PSU电源的异常信号如12V跌落等送至CPLD,由CPLD做逻辑运算后送给各个计算模块的CPU及内存系统触发硬件低功耗模式。整个系统主要是CPLD和BMC共同实现逻辑控制,实现对不同规格电源情况进行管理,对电管告警实现快速响应,保证系统不会因为电源异常出现系统宕机现象。但是如果只对各个节点进行了功耗的限定,没有对CPU、Memory等部件的功耗进行回调,此时系统会出现性能的下降,严重时还可能会导致系统业务的中断,给客户带来经济损失。
发明内容
针对只对各个节点进行了功耗的限定,没有对CPU、内存等部件的功耗进行回调,此时系统会出现性能的下降,严重时还可能会导致系统业务的中断,给客户带来经济损失的问题,本发明提供一种服务器进入功耗封顶后实现整机功耗回调的方法、系统。
本发明的技术方案是:
一方面,本发明技术方案提供一种服务器进入功耗封顶后实现整机功耗回调的方法,包括如下步骤:
确定节点配置最大功耗,计算出整机的最大功耗;
根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求;
当不满足冗余需求时,启动功耗封顶触发信号;
当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作;
检测到各节点功耗限制成功时,取消功耗封顶触发信号。
优选地,根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求的步骤包括:
获取当前PSU状态并计算PSU功耗,其中PSU功耗=(PSU数量-1)*单PSU功耗;
将计算出的整机的最大功耗与计算的PSU功耗进行比较;
当最大功耗大于PSU功耗时,PSU不满足冗余需求;
当最大功耗小于或等于PSU功耗时,PSU满足冗余需求。
优选地,当不满足冗余需求时,启动功耗封顶信号的步骤还包括:
当不满足冗余需求时,通知启动功耗封顶触发信号;
当满足冗余需求时,通知不启动功耗封顶触发信号。
优选地,当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作的步骤包括:
检测功耗封顶触发信号;
若检测到功耗封顶触发信号时,计算当前正常工作状态的PSU的总功耗;
将整机功耗限制为计算出的当前PSU的总功耗,计算每个节点的功耗限制值,给每个节点发送功耗限制命令;
各节点根据接收到的命令执行功耗限制动作。
优选地,检测到各节点功耗限制成功时,取消功耗封顶触发信号的步骤包括:
检测各节点功耗限制是否成功;
若是,通知取消功耗封顶触发信号;
否则,执行步骤:检测功耗封顶触发信号。
第二方面,本发明技术方案提供一种服务器进入功耗封顶后实现整机功耗回调的系统,包括中背板、管理控制板、节点、PSU;
PSU设置于中背板上,PSU并联对整个系统进行供电;
管理控制板通过CMC连接器和中背板上的所有PSU连接;管理控制板还与节点连接;每个节点通过节点连接器和中背板连接;
管理控制板,用于对PSU进行在位检测和功耗侦测,用于轮询节点状态控制功耗封顶触发机制;还用于轮询检测到功耗封顶触发信号时,计算每个节点的功耗限制值并下发到各节点;
节点,用于接收下发的功耗限制值对本节点进行功耗限定。
优选地,管理控制板上设置有第一CPLD和第一BMC;
第一CPLD和第一BMC分别与每个节点连接,第一CPLD和第一BMC分别与每个PSU连接,第一CPLD与第一BMC连接。
优选地,第一BMC,用于轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;还用于根据当前正常工作状态PSU能提供的功耗总和,计算每个节点的功耗限制值发送给各节点;
第一BMC;还用于轮询PSU状态,根据当前PSU类型与整机最大功耗进行比较,判断是否满足冗余需求;还用于当检测到第一CPLD的功耗封顶触发信号时,计算当前正常工作状态PSU能提供的功耗总和;
第一BMC,还用于当PSU不满足冗余需求时通知第一CPLD启动功耗封顶触发信号,还用于检测第一CPLD触发信号是否已经启动,还用于当将计算的功耗限制值下达给各节点后,通知第一CPLD解除功耗封顶触发信号;
第一CPLD,用于触发功耗封顶信号到各节点;
节点,用于接收到下发的功耗限制值后进行功耗限制。
优选地,每个节点包括第二CPLD、第二BMC和CPU;
第一CPLD与第二CPLD连接,第一CPLD触发功耗封顶信号到第二CPLD;
第一BMC与第二BMC连接,用于轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;第一BMC计算每个节点的功耗限制值发送给各节点的第二BMC;
第二BMC与第二CPLD连接,第二BMC将接收到下发的功耗限制值发送给第二CPLD
第二CPLD与CPU连接;用于进行功耗限制。
第二BMC通过PCH与CPU连接;用于获取各节点的工作状态。
优选地,第一CPLD包括第一与非门和第二与非门;
第一与非门的输入端分别连接到PSU,第一与非门的输出端连接到第二与非门的输入端,第二与非门的输入端还与第一BMC连接,第二与非门的输出端连接到不同的节点的第二CPLD。
从以上技术方案可以看出,本发明具有以下优点:当某个PSU电源出现故障或异常时,根据BMC提前设置好的条件触发服务器进入功耗封顶机制的策略,使服务器中的CPU以及内存进入硬件低功耗模式,与此同时,BMC会根据PSU所能提供的功耗来实现CPU以及内存回调的功能,从而保证了服务器上的业务能够正常运行,为客户提供了更优的电源冗余功耗封顶方案。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明另一个实施例的方法的示意性流程图。
图3是本发明一个实施例的系统的示意性框图。
图4是本发明一个实施例的CMC板连接的示意性框图。
图5是本发明一个实施例的节点连接的示意性框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
PSU: power supply unit(电源供电装置);
CPU: Central Processing Unit(中央处理单元);
BMC: Baseboard Management Controller(基板管理控制器);
CPLD:Complex Programmable Logic Device(可编程逻辑器件);
需要说明的是,CMC,Chassis Management Controller的简称,是机箱管理控制器,存在于当前集群服务器中,CMC是一种系统管理组件,旨在管理机箱中的一个或多个服务器;本申请中的“管理控制板”同“CMC板”、“节点”同“Node”。
进一步需要说明的是,Power Capping允许用户吧功耗值限定在指定的范围内,在大多数数据中心里,当一个机器安装好后,就会给它配送一定的电力。通常来说,这是一个比较安全的点亮,会有一定的富余,也许永远不会用到额外多出来的电路。这些多出来的电力称之为边际功耗,Power Capping的主要功能就是节约这部分边际功耗。
本发明的目的在于实现Power Capping触发各个节点进行功耗限定后,实现对CPU、Memory等部件的功耗回调功能,从而解决CPU、Memory等部件性能下降的问题,避免客户系统业务的中断,降低客户的经济损失。因此,此发明可以为客户提供更优的电源冗余设计方案。如图1所示,本发明实施例提供一种服务器进入功耗封顶后实现整机功耗回调的方法,包括如下步骤:
步骤1:确定节点配置最大功耗,计算出整机的最大功耗;
步骤2:根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求;
步骤3:当不满足冗余需求时,启动功耗封顶触发信号;
步骤4:当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作;
步骤5:检测到各节点功耗限制成功时,取消功耗封顶触发信号。
如图2所示,在有些实施例中,步骤2中,根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求的步骤包括:
步骤21:获取当前PSU状态并计算PSU功耗,其中PSU功耗=(PSU数量-1)*单PSU功耗;
步骤22:将计算出的整机的最大功耗与计算的PSU功耗进行比较;
步骤23:当最大功耗大于PSU功耗时,PSU不满足冗余需求;
步骤24:当最大功耗小于或等于PSU功耗时,PSU满足冗余需求。
进一步的,步骤3中,当不满足冗余需求时,启动功耗封顶信号的步骤还包括:
当不满足冗余需求时,通知启动功耗封顶触发信号;
当满足冗余需求时,通知不启动功耗封顶触发信号。
在有些实施例中,步骤4中当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作的步骤包括:
步骤41:检测功耗封顶触发信号;
步骤42:若检测到功耗封顶触发信号时,计算当前正常工作状态的PSU的总功耗;
步骤42:将整机功耗限制为计算出的当前PSU的总功耗,计算每个节点的功耗限制值,给每个节点发送功耗限制命令;
步骤44:各节点根据接收到的命令执行功耗限制动作。
相应的步骤5中检测到各节点功耗限制成功时,取消功耗封顶触发信号的步骤包括:
步骤51:检测各节点功耗限制是否成功;若是,执行步骤52,否则执行步骤41;
步骤52:通知取消功耗封顶触发信号。
如图3所示,本发明技术方案提供一种服务器进入功耗封顶后实现整机功耗回调的系统,包括中背板、管理控制板、节点、PSU;
PSU设置于中背板上,PSU并联对整个系统进行供电;
管理控制板通过CMC连接器和中背板上的所有PSU连接;管理控制板还与节点连接;每个节点通过节点连接器和中背板连接;
管理控制板,用于对PSU进行在位检测和功耗侦测,用于轮询节点状态控制功耗封顶触发机制;还用于轮询检测到功耗封顶触发信号时,计算每个节点的功耗限制值并下发到各节点;
节点,用于接收下发的功耗限制值对本节点进行功耗限定。
具体的工作过程包括:
管理控制板确定节点配置最大功耗,计算出整机的最大功耗;根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求;当不满足冗余需求时,启动功耗封顶触发信号;当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作;检测到各节点功耗限制成功时,取消功耗封顶触发信号。
在有些实施例中,管理控制板上设置有第一CPLD和第一BMC;
第一CPLD和第一BMC分别与每个节点连接,第一CPLD和第一BMC分别与每个PSU连接,第一CPLD与第一BMC连接。
第一BMC,用于轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;还用于根据当前正常工作状态PSU能提供的功耗总和,计算每个节点的功耗限制值发送给各节点;
第一BMC;还用于轮询PSU状态,根据当前PSU类型与整机最大功耗进行比较,判断是否满足冗余需求;还用于当检测到第一CPLD的功耗封顶触发信号时,计算当前正常工作状态PSU能提供的功耗总和;
第一BMC,还用于当PSU不满足冗余需求时通知第一CPLD启动功耗封顶触发信号,还用于检测第一CPLD触发信号是否已经启动,还用于当将计算的功耗限制值下达给各节点后,通知第一CPLD解除功耗封顶触发信号;
第一CPLD,用于触发功耗封顶信号到各节点;
节点,用于接收到下发的功耗限制值后进行功耗限制。
在有些实施例中,每个节点包括第二CPLD、第二BMC和CPU;
第一CPLD与第二CPLD连接,第一CPLD触发功耗封顶信号到第二CPLD;
第一BMC与第二BMC连接,用于轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;第一BMC计算每个节点的功耗限制值发送给各节点的第二BMC;
第二BMC与第二CPLD连接,第二BMC将接收到下发的功耗限制值发送给第二CPLD ;
第二CPLD与CPU连接;用于进行功耗限制。
第二BMC通过PCH与CPU连接;用于获取各节点的工作状态。
在有些实施例中,第一CPLD包括第一与非门和第二与非门;
第一与非门的输入端分别连接到PSU,第一与非门的输出端连接到第二与非门的输入端,第二与非门的输入端还与第一BMC连接,第二与非门的输出端连接到不同的节点的第二CPLD。
第一BMC获取当前PSU状态并计算PSU功耗,其中PSU功耗=(PSU数量-1)*单PSU功耗;将计算出的整机的最大功耗与计算的PSU功耗进行比较;当最大功耗大于PSU功耗时,PSU不满足冗余需求,通知启动功耗封顶触发信号;当最大功耗小于或等于PSU功耗时,PSU满足冗余需求。
第一BMC检测功耗封顶触发信号;若检测到功耗封顶触发信号时,计算当前正常工作状态的PSU的总功耗;将整机功耗限制为计算出的当前PSU的总功耗,计算每个节点的功耗限制值,给每个节点发送功耗限制命令;功耗限制命令发送到第二CPLD。
各节点根据接收到的命令执行功耗限制动作,检测各节点功耗限制是否成功,若成功第一BMC通知第一CPLD取消功耗封顶触发信号。
以多节点服务器I48M6为例,本发明设计的核心思想是通过第一BMC芯片与第一CPLD等硬件电路,识别某个PSU异常时,多节点服务器中的计算节点能够快速进入PowerCapping触发流程,以及整机功耗的快速回调流程,从而保证服务器的正常工作。如图4、图5所示,本发明实施例还提供了一种基于实现整机功耗回调的系统的服务器进入功耗封顶后实现整机功耗回调的方法,所述的系统包括中背板、CMC板、节点、PSU;
PSU设置于中背板上,PSU并联对整个系统进行供电;
CMC板通过CMC连接器和中背板上的所有PSU连接;CMC板还与节点连接;每个节点通过节点连接器和中背板连接;
CMC板,用于对PSU进行在位检测和功耗侦测,用于轮询节点状态控制功耗封顶触发机制;还用于轮询检测到功耗封顶触发信号时,计算每个节点的功耗限制值并下发到各节点;
节点,用于接收下发的功耗限制值对本节点进行功耗限定。
CMC板上设置有第一CPLD和第一BMC;节点包括Node1-Node8;第一CPLD包括第一与非门U1和第二与非门U2; 该系统包括若干个PSU;
第一BMC通过GPIO_OVERRIDE信号与第一CPLD的第二与非门的输入端连接;每个PSU通过PSU_Alert信号与第一CPLD的第一与非门U1的输入端连接;第一与非门的输出端连接到第二与非门的输入端;每个PSU分别通过PSU_PRESENT信号以及PMBUS总线与第一BMC连接;第一CPLD的第二与非门的输出端通过CMC_CAPPING_N1- CMC_CAPPING_N8信号连接到Node1-Node8;第一BMC还通过CMC_I2C_N1- CMC_I2C_N8信号分别连接到Node1-Node8;
每个Node包括第二CPLD、第二BMC和CPU;
第一CPLD通过CMC_CAPPING_N信号与第二CPLD连接,第二CPLD分别通过PROC_HOT_Throttle信号和MEM_HOT_Throttle信号与CPU连接;第二CPLD通过BMC_GPIO_Throttle信号与第二BMC连接,第二BMC通过BMC_PCH_ME与PCH连接,PCH通过PCH_ME_N与CPU连接。所述方法包括:
第一BMC通过CMC_I2C_N1- CMC_I2C_N8信号轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;
第一BMC通过PMBUS总线轮询PSU状态,根据当前PSU类型与整机最大功耗进行比较,判断是否满足冗余需求;
当PSU不满足冗余需求时第一BMC通过GPIO_OVERRIDE信号通知第一CPLD启动功耗封顶触发信号;
第一CPLD触发功耗封顶信号到各节点;
第一BMC检测第一CPLD触发信号是否已经启动;当检测到第一CPLD的功耗封顶触发信号时,计算当前正常工作状态PSU能提供的功耗总和;
根据当前正常工作状态PSU能提供的功耗总和,计算每个节点的功耗限制值发送给各节点;
当将计算的功耗限制值下达给各节点后,通知第一CPLD解除功耗封顶触发信号。
i48M6,节点BMC检查资产配置情况,根据CPU和PCIE卡(RAID、GPU、Network)数量,查表得到节点最大功耗;第一BMC轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;第一BMC轮询PSU状态,根据当前PSU类型,判断是否满足n+1冗余,如果满足,则通知第一CPLD不启动动态power capping,否则通知第一CPLD启动PowerCapping。Power Capping功耗回调方案如下:第一BMC轮询检测第一CPLD的Power Capping触发信号,如果检测到Power Capping触发,则执行回调动作:第一BMC计算当前正常工作状态电源能提供的功耗总和,根据此功耗进行整机功耗限制,计算每个节点的功耗限制值发送给节点进行功耗限制,功耗限制下发到节点之后,再通知CPLD解除硬件Power Capping的信号。计算节点功耗限制计算方案:在i48M6上,根据各节点的最大功耗按比例分配。本发明用于服务器电源Power Capping功能,即当某个PSU电源出现故障或异常时,根据第一BMC提前设置好的条件触发服务器进入Power Capping机制的策略,使服务器中的CPU以及内存进入硬件低功耗模式,与此同时,第一BMC会根据PSU所能提供的功率来实现CPU以及内存回调的功能,从而保证了服务器上的业务能够正常运行,为客户提供了更优的电源冗余PowerCapping方案。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种服务器进入功耗封顶后实现整机功耗回调的方法,其特征在于,包括如下步骤:
确定节点配置最大功耗,计算出整机的最大功耗;
根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求;
当不满足冗余需求时,启动功耗封顶触发信号;
当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作;
检测到各节点功耗限制成功时,取消功耗封顶触发信号;
当检测到功耗封顶触发信号时,下发功耗限制值到各节点执行功耗回调动作的步骤包括:
检测功耗封顶触发信号;
若检测到功耗封顶触发信号时,计算当前正常工作状态的PSU的总功耗;
将整机功耗限制为计算出的当前PSU的总功耗,计算每个节点的功耗限制值,给每个节点发送功耗限制命令;
各节点根据接收到的命令执行功耗限制动作。
2.根据权利要求1所述的服务器进入功耗封顶后实现整机功耗回调的方法,其特征在于,根据当前PSU类型与计算出的最大功耗确定PSU是否满足冗余需求的步骤包括:
获取当前PSU状态并计算PSU功耗,其中PSU功耗=(PSU数量-1)*单PSU功耗;
将计算出的整机的最大功耗与计算的PSU功耗进行比较;
当最大功耗大于PSU功耗时,PSU不满足冗余需求;
当最大功耗小于或等于PSU功耗时,PSU满足冗余需求。
3.根据权利要求2所述的服务器进入功耗封顶后实现整机功耗回调的方法,其特征在于,当不满足冗余需求时,启动功耗封顶信号的步骤还包括:
当不满足冗余需求时,通知启动功耗封顶触发信号;
当满足冗余需求时,通知不启动功耗封顶触发信号。
4.根据权利要求3所述的服务器进入功耗封顶后实现整机功耗回调的方法,其特征在于,检测到各节点功耗限制成功时,取消功耗封顶触发信号的步骤包括:
检测各节点功耗限制是否成功;
若是,通知取消功耗封顶触发信号;
否则,执行步骤:检测功耗封顶触发信号。
5.一种服务器进入功耗封顶后实现整机功耗回调的系统,其特征在于,包括中背板、管理控制板、节点、PSU;
PSU设置于中背板上,PSU并联对整个系统进行供电;
管理控制板通过CMC连接器和中背板上的所有PSU连接;管理控制板还与节点连接;每个节点通过节点连接器和中背板连接;
管理控制板,用于对PSU进行在位检测和功耗侦测,用于轮询节点状态控制功耗封顶触发机制;还用于轮询检测到功耗封顶触发信号时,计算每个节点的功耗限制值并下发到各节点;具体用于检测功耗封顶触发信号;若检测到功耗封顶触发信号时,计算当前正常工作状态的PSU的总功耗;将整机功耗限制为计算出的当前PSU的总功耗,计算每个节点的功耗限制值,给每个节点发送功耗限制命令;
节点,用于接收下发的功耗限制值对本节点进行功耗限定; 具体根据接收到的命令执行功耗限制动作。
6.根据权利要求5所述的服务器进入功耗封顶后实现整机功耗回调的系统,其特征在于,管理控制板上设置有第一CPLD和第一BMC;
第一CPLD和第一BMC分别与每个节点连接,第一CPLD和第一BMC分别与每个PSU连接,第一CPLD与第一BMC连接。
7.根据权利要求6所述的服务器进入功耗封顶后实现整机功耗回调的系统,其特征在于,第一BMC,用于轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;还用于根据当前正常工作状态PSU能提供的功耗总和,计算每个节点的功耗限制值发送给各节点;
第一BMC;还用于轮询PSU状态,根据当前PSU类型与整机最大功耗进行比较,判断是否满足冗余需求;还用于当检测到第一CPLD的功耗封顶触发信号时,计算当前正常工作状态PSU能提供的功耗总和;
第一BMC,还用于当PSU不满足冗余需求时通知第一CPLD启动功耗封顶触发信号,还用于检测第一CPLD触发信号是否已经启动,还用于当将计算的功耗限制值下达给各节点后,通知第一CPLD解除功耗封顶触发信号;
第一CPLD,用于触发功耗封顶信号到各节点;
节点,用于接收到下发的功耗限制值后进行功耗限制。
8.根据权利要求7所述的服务器进入功耗封顶后实现整机功耗回调的系统,其特征在于,每个节点包括第二CPLD、第二BMC和CPU;
第一CPLD与第二CPLD连接,第一CPLD触发功耗封顶信号到第二CPLD;
第一BMC与第二BMC连接,用于轮询节点状态,获取各节点的最大功耗,求和取得当前系统配置的整机最大功耗;第一BMC计算每个节点的功耗限制值发送给各节点的第二BMC;
第二BMC与第二CPLD连接,第二BMC将接收到下发的功耗限制值发送给第二CPLD ;
第二CPLD与CPU连接;用于进行功耗限制;
第二BMC通过PCH与CPU连接;用于获取各节点的工作状态。
9.根据权利要求8所述的服务器进入功耗封顶后实现整机功耗回调的系统,其特征在于,第一CPLD包括第一与非门和第二与非门;
第一与非门的输入端分别连接到PSU,第一与非门的输出端连接到第二与非门的输入端,第二与非门的输入端还与第一BMC连接,第二与非门的输出端连接到不同的节点的第二CPLD。
CN202210109303.1A 2022-01-28 2022-01-28 服务器进入功耗封顶后实现整机功耗回调的方法、系统 Active CN114442787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210109303.1A CN114442787B (zh) 2022-01-28 2022-01-28 服务器进入功耗封顶后实现整机功耗回调的方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210109303.1A CN114442787B (zh) 2022-01-28 2022-01-28 服务器进入功耗封顶后实现整机功耗回调的方法、系统

Publications (2)

Publication Number Publication Date
CN114442787A CN114442787A (zh) 2022-05-06
CN114442787B true CN114442787B (zh) 2023-07-18

Family

ID=81371290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210109303.1A Active CN114442787B (zh) 2022-01-28 2022-01-28 服务器进入功耗封顶后实现整机功耗回调的方法、系统

Country Status (1)

Country Link
CN (1) CN114442787B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114880191B (zh) * 2022-05-27 2024-07-02 苏州浪潮智能科技有限公司 一种服务器的功耗处理方法、设备、装置及介质
CN115543058B (zh) * 2022-11-29 2023-03-14 苏州浪潮智能科技有限公司 降功耗的方法、系统、计算机设备及存储介质
CN116755542B (zh) * 2023-06-16 2024-06-04 北京市合芯数字科技有限公司 一种整机功耗降低方法、系统、基板管理控制器及服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783632A (zh) * 2016-08-25 2018-03-09 大连楼兰科技股份有限公司 车联网嵌入式系统中低功耗设计方法
CN113064479A (zh) * 2021-03-03 2021-07-02 山东英信计算机技术有限公司 一种gpu服务器的电源冗余控制系统、方法及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9690358B2 (en) * 2015-02-11 2017-06-27 Dell Products, Lp Method and apparatus for system control of a central processing unit (CPU) maximum power detector

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783632A (zh) * 2016-08-25 2018-03-09 大连楼兰科技股份有限公司 车联网嵌入式系统中低功耗设计方法
CN113064479A (zh) * 2021-03-03 2021-07-02 山东英信计算机技术有限公司 一种gpu服务器的电源冗余控制系统、方法及介质

Also Published As

Publication number Publication date
CN114442787A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN114442787B (zh) 服务器进入功耗封顶后实现整机功耗回调的方法、系统
US8549329B2 (en) System power management using memory throttle signal
US7840824B2 (en) Multiple computer system equipped with a management module determining number of power supply modules to be operated based upon system information
CN111367392B (zh) 一种动态电源管理系统
US11099961B2 (en) Systems and methods for prevention of data loss in a power-compromised persistent memory equipped host information handling system during a power loss event
CN110399034B (zh) 一种SoC系统的功耗优化方法及终端
CN104050061A (zh) 一种基于PCIe总线多主控板冗余备份系统
CN103853622A (zh) 一种互为备份的双余度控制方法
CN111949106B (zh) 一种x86机架式服务器及其错峰上电的控制方法
CN212541329U (zh) 基于国产龙芯平台的双冗余计算机设备
CN104199353A (zh) 一种冷备份与热备份组合的双主机指挥控制系统
US20240220385A1 (en) Power source consumption management apparatus for four-way server
JP4655718B2 (ja) コンピュータシステム及びその制御方法
CN111984471B (zh) 一种机柜电源bmc冗余管理系统及方法
CN110764829B (zh) 一种多路服务器cpu隔离方法及系统
CN117743012A (zh) 一种芯片失效的处理系统、方法、电子设备及存储介质
CN111309132B (zh) 一种服务器多档位电源冗余的方法
CN115904050A (zh) 一种防止服务器掉电关机的电源控制系统及方法
CN116540856A (zh) 一种供电模块故障恢复后更正状态的装置、方法和服务器
US11360839B1 (en) Systems and methods for storing error data from a crash dump in a computer system
CN113885689A (zh) 整机柜服务器供电控制方法、系统、终端及存储介质
JP4157807B2 (ja) 無停電電源装置
CN116204502B (zh) 一种高可用性的nas存储服务方法及系统
JP2004013723A (ja) 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法
CN111026239B (zh) 服务器和用于控制cpu的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant