CN112732058A - 多节点服务器电源失效的保护设备、方法及可读存储介质 - Google Patents

多节点服务器电源失效的保护设备、方法及可读存储介质 Download PDF

Info

Publication number
CN112732058A
CN112732058A CN202110018479.1A CN202110018479A CN112732058A CN 112732058 A CN112732058 A CN 112732058A CN 202110018479 A CN202110018479 A CN 202110018479A CN 112732058 A CN112732058 A CN 112732058A
Authority
CN
China
Prior art keywords
frequency reduction
power
node server
power supply
cpld
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110018479.1A
Other languages
English (en)
Inventor
易凌鹰
叶笑夕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110018479.1A priority Critical patent/CN112732058A/zh
Publication of CN112732058A publication Critical patent/CN112732058A/zh
Priority to PCT/CN2021/143258 priority patent/WO2022148297A1/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0016Inter-integrated circuit (I2C)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种多节点服务器电源失效的保护设备,包括:用于为多节点服务器提供电能的N个电源;与N个电源均连接的CPLD,用于通过硬线电路获取各个电源的失效告警信息,并且当基于获取的各个电源的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;其中,N为正整数。应用本申请的方案,有效地实现多节点服务器电源失效保护,保障了方案的实时性,避免出现降频不及时的情况。本申请还提供了一种一种多节点服务器电源失效的保护及可读存储介质,具有相应技术效果。

Description

多节点服务器电源失效的保护设备、方法及可读存储介质
技术领域
本发明涉及服务器技术领域,特别是涉及一种多节点服务器电源失效的保护设备、方法及可读存储介质。
背景技术
随着服务器能力的提高,功耗也不断增加,特别是在多节点服务器中,计算密度大,对功耗的要求非常高,容易出现电源功率无法满足冗余功能要求的情况,此时,如果有单个或者多个电源出现失效情况时,系统便可能超出电源负荷,进而造成机器损坏或数据丢失。目前的应对策略是利用CMC(Chassis Management Controller,机箱管理控制器)轮询检测各个工作状态的电源的失效告警状态,当发现有电源失效后,CMC便控制服务器节点进行降频,即降低部分节点的功耗需求,从而使得多节点服务器整体不会超出电源负荷。
但是,目前的这种方案中,要求从电源失效告警到节点降频的耗时比较短,但是实际应用中,CMC控制器的软件响应时间都比较长,无法较好地满足实时性的要求,即经常会发生CMC控制降频较慢,导致整机功耗无法支持已经造成电源烧毁、掉电丢失数据的后果。
综上所述,如何更有效地实现多节点服务器电源失效保护,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种多节点服务器电源失效的保护设备、方法及可读存储介质,以更有效地实现多节点服务器电源失效保护,。
为解决上述技术问题,本发明提供如下技术方案:
一种多节点服务器电源失效的保护设备,包括:
用于为多节点服务器提供电能的N个电源;
与N个电源均连接的CPLD,用于通过硬线电路获取各个电源的失效告警信息,并且当基于获取的各个电源的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;
其中,N为正整数。
优选的,还包括:
与N个电源均连接的CMC,用于按照预设周期获取各个电源的电源信息,并且每次获取了各个电源的电源信息之后,判断N个电源中当前正常工作的电源是否满足冗余功能要求,如果满足,则将所述CPLD中存储的降频启动状态设置为第一状态,否则将所述CPLD中存储的降频启动状态设置为第二状态;
相应的,所述降频条件为:
所述CPLD接收到一条新增的失效告警信息,并且所述CPLD当前的降频启动状态被设置为第二状态。
优选的,所述CPLD按照预设的降频规则进行多节点服务器的降频控制,具体包括:
获取当前在所述CPLD中存储的降频数量值k;
选取多节点服务器中的k个节点进行降频,使得k个节点降频之后的功耗均不超过W2
所述CMC还用于:
每次获取了各个电源的电源信息之后,计算出
Figure BDA0002887509340000021
的数值并利用计算结果更新所述CPLD中存储的降频数量值k;
其中,M表示多节点服务器中当前运行的节点数量;W1表示单节点正常状态下的最大功耗值;W2表示单节点降频之后的最大功耗值;
Figure BDA0002887509340000022
表示向上取整;W表示在当前正常工作的电源中,如果功率最大的一个电源失效时,剩余电源提供的功率总和。
优选的,所述CPLD还用于:
在按照预设的降频规则进行多节点服务器的降频控制之后,通过CMC输出降频提示信息。
优选的,所述CPLD通过I2C总线或者GPIO接口与所述CMC连接。
一种多节点服务器电源失效的保护方法,应用于上述任一项所述的服务器电源失效的保护设备中,包括:
N个电源为多节点服务器提供电能;
与N个电源均连接的CPLD通过硬线电路获取各个电源的失效告警信息,并且当基于获取的各个电源的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;
其中,N为正整数。
优选的,还包括:
与N个电源均连接的CMC按照预设周期获取各个电源的电源信息,并且每次获取了各个电源的电源信息之后,判断N个电源中当前正常工作的电源是否满足冗余功能要求,如果满足,则将所述CPLD中存储的降频启动状态设置为第一状态,否则将所述CPLD中存储的降频启动状态设置为第二状态;
相应的,所述降频条件为:
所述CPLD接收到一条新增的失效告警信息,并且所述CPLD当前的降频启动状态被设置为第二状态。
优选的,所述按照预设的降频规则进行多节点服务器的降频控制,包括:
获取当前在所述CPLD中存储的降频数量值k;
选取多节点服务器中的k个节点进行降频,使得k个节点降频之后的功耗均不超过W2
多节点服务器电源失效的保护方法还包括:
CMC每次获取了各个电源的电源信息之后,计算出
Figure BDA0002887509340000031
的数值并利用计算结果更新所述CPLD中存储的降频数量值k;
其中,M表示多节点服务器中当前运行的节点数量;W1表示单节点正常状态下的最大功耗值;W2表示单节点降频之后的最大功耗值;
Figure BDA0002887509340000032
表示向上取整;W表示在当前正常工作的电源中,如果功率最大的一个电源失效时,剩余电源提供的功率总和。
优选的,还包括:
所述CPLD在按照预设的降频规则进行多节点服务器的降频控制之后,通过CMC输出降频提示信息。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的多节点服务器电源失效的保护方法的步骤。
应用本发明实施例所提供的技术方案所提供的技术方案,考虑到CPLD的控制是基于硬线逻辑,响应时间非常短,因此,利用CPLD来实现多节点服务器电源失效的保护,从而保障方案的实时性,可以快速的实现降频控制。具体的,本申请将CPLD与N个电源均连接,CPLD可以通过硬线电路获取各个电源的失效告警信息,当CPLD基于获取的各个电源的失效告警信息确定出降频条件成立时,CPLD便可以预设的降频规则进行多节点服务器的降频控制。综上所述,本申请的方案有效地实现多节点服务器电源失效保护,保障了方案的实时性,避免出现降频不及时的情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中一种多节点服务器电源失效的保护设备的结构示意图;
图2为本发明中另一种多节点服务器电源失效的保护设备的结构示意图;
图3为本发明中一种多节点服务器电源失效的保护方法的实施流程图。
具体实施方式
本发明的核心是提供一种多节点服务器电源失效的保护设备,有效地实现多节点服务器电源失效保护,保障了方案的实时性,避免出现降频不及时的情况。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明中一种多节点服务器电源失效的保护设备的结构示意图,该多节点服务器电源失效的保护设备可以包括:
用于为多节点服务器提供电能的N个电源10;
与N个电源10均连接的CPLD20(Complex Programmable Logic Device,复杂可编程逻辑器件),用于通过硬线电路获取各个电源10的失效告警信息,并且当基于获取的各个电源10的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;其中,N为正整数。
具体的,本申请的方案中设置了N个电源10为多节点服务器提供电能,N的具体取值可以根据实际需要进行设定和调整,但在实际应用中,N至少为2。多节点服务器由多个服务器节点构成,节点数量也可以根据实际业务需要进行设定。
本申请将CPLD20通过硬线电路与N个电源10均连接,CPLD20可以获取每一个电源10的失效告警信息,电源10的失效告警信息由电源10发出,表示电源10当前无法功能,电源10具体的发出失效告警信息的规则通常取决于电源10厂商的设置,本申请不对此展开说明。
当CPLD20基于获取的各个电源10的失效告警信息确定出降频条件成立时,会按照预设的降频规则进行多节点服务器的降频控制。CPLD20与多节点服务器中的各个节点也是通过硬线电路连接,保障方案的实时性。
具体的降频条件以及降频规则均可以根据实际需要进行设定和调整,例如一种实施方式中,可以简单的在CPLD20中设置一个电源数量值,如果当前正常供电的电源数量低于该电源数量值,则降频条件成立,反正则不成立。降频条件成立之后,例如降频规则可以具体为控制预设的第一数量的节点进行降频,此处描述的第一数量可以预先设置在CPLD20中。这样的方案较为简单,易于实施,通常可以应用在N个电源10的型号均相同,且节点数量以及电源10数量都较为固定,不常改动的场合中。
在本发明的一种具体实施方式中,可参阅图2,还可以包括:
与N个电源10均连接的CMC30,用于按照预设周期获取各个电源10的电源10信息,并且每次获取了各个电源10的电源10信息之后,判断N个电源10中当前正常工作的电源10是否满足冗余功能要求,如果满足,则将CPLD20中存储的降频启动状态设置为第一状态,否则将CPLD20中存储的降频启动状态设置为第二状态;
相应的,降频条件为:
CPLD20接收到一条新增的失效告警信息,并且CPLD20当前的降频启动状态被设置为第二状态。
该种实施方式中,考虑到如果当前正常工作的电源10满足冗余功能要求,可以无需进行降频,从而保障多节点服务器的高性能运行。具体的,利用CPLD20结合CMC30来实现。
首先需要说明的是,满足冗余功能要求指的是:当前正常工作的各个电源10中,如果任意一个发生故障,剩余的电源10依然能够在不进行多节点服务器降频的情况下,保障各个节点的功耗需求。可以理解的是,不满足冗余功能要求便是:当前正常工作的各个电源10中,如果存在某一个电源10发生故障,剩余的电源10不能够在不进行多节点服务器降频的情况下,保障各个节点的功耗需求。
具体的,CMC30可以按照预设周期获取各个电源10的电源信息,并且每次获取了各个电源10的电源信息之后,确定出当前正常工作的电源10的功率总和,如果该功率总和减去第一功率之后,得到的差值大于多节点服务器中各个节点的功耗需求总和,则可以确定当前正常工作的电源10满足冗余功能要求。此处描述的第一功率,指的是当前正常工作的电源10中的最大功率,当然,如果实际应用中各个电源10的型号相同,则各个电源10的功率均等于该第一功率。而此处描述的多节点服务器中各个节点的功耗需求总和,通常可以按照每个节点均按照最大功耗进行计算。
例如一种具体场景中,设置了10个电源,依次编号为电源一至电源十,假设电源一发生了故障,CMC30判断出剩余9个电源依然满足冗余功能要求,因此将CPLD20中存储的降频启动状态设置为第一状态,此外需要指出的是,CPLD20中存储的降频启动状态的初始状态通常会设置为第一状态。因此,虽然CPLD20接收到了一条新增的失效告警信息,即CPLD20接收到电源一的失效告警信息,此时并不会控制多节点服务器进行降频。
之后,例如电源二又发生了故障,则虽然CPLD20接收到了一条新增的失效告警信息,即接收到了电源二的失效告警信息,此时CPLD20依然不会控制多节点服务器进行降频。
而电源二故障之后,CMC30判断出剩余8个电源不满足冗余功能要求,即剩余8个电源中,如果功率最大的电源失效的话,剩下的7个电源无法保证多节点服务器不降频情况下的功耗需求,因此,电源二故障之后,CMC30将CPLD20中存储的降频启动状态设置为第二状态。
之后,例如电源六又发生了故障,则CPLD20接收到了一条新增的失效告警信息,即接收到了电源六的失效告警信息,并且此时降频启动状态为第二状态,因此,CPLD20会立即控制多节点服务器按照预设的降频规则进行降频。
由上描述可知,本申请的该种实施方式中,如果当前正常工作的电源满足冗余功能要求,本申请并不会进行节点的降频,尽量地保障了多节点服务器能够高性能运行。
此外需要说明的是,CMC30与各个电源10之间可以通过总线连接,CMC30与CPLD20之间可以通过总线也可以是硬线连接,例如在本发明的一种具体实施方式中,CPLD20通过I2C总线或者GPIO接口与CMC30连接。本申请对CMC30与各个电源10之间,CMC30与CPLD20之间的通信实时性要求并不高,因为通常也不会出现2个电源极短时间内连续故障的情况。
在本发明的一种具体实施方式中,CPLD20按照预设的降频规则进行多节点服务器的降频控制,具体包括:
获取当前在CPLD20中存储的降频数量值k;
选取多节点服务器中的k个节点进行降频,使得k个节点降频之后的功耗均不超过W2
CMC30还用于:
每次获取了各个电源10的电源信息之后,计算出
Figure BDA0002887509340000071
的数值并利用计算结果更新CPLD20中存储的降频数量值k;
其中,M表示多节点服务器中当前运行的节点数量;W1表示单节点正常状态下的最大功耗值;W2表示单节点降频之后的最大功耗值;
Figure BDA0002887509340000081
表示向上取整;在当前正常工作的电源10中,如果功率最大的一个电源10失效时,剩余电源10提供的功率总和。
该种实施方式中,尽量地减少降频节点的数量,从而尽量地保障多节点服务器整体的性能。
具体的,在当前正常工作的电源10中,如果功率最大的一个电源10失效时,剩余电源10提供的功率总和表示为W,多节点服务器中当前运行的节点数量为M,则功率最大的一个电源10失效之后,需要满足W1(M-X)+W2×X<W;该式子中的X表示的是进行降频的节点数量,得到
Figure BDA0002887509340000082
因此,本申请取X所允许的最小值作为实际的降频数量值k,从而尽量地减少需要降频的节点的数量,但是又保障了多节点服务器总体的功耗需求不会超出当前工作的电源10所能提供的功率总和,即不会出现服务器节点失电关机的情况。
在本发明的一种具体实施方式中,CPLD20还可以用于:
在按照预设的降频规则进行多节点服务器的降频控制之后,通过CMC30输出降频提示信息,从而提醒工作人员及时处理这样的情况。并且可以理解的是,当进行了电源10的维修、更换之后,如果正常工作的电源10重新满足了冗余功能要求,CMC30可以将CPLD20中存储的降频启动状态重新设置为第一状态。
应用本发明实施例所提供的技术方案所提供的技术方案,考虑到CPLD20的控制是基于硬线逻辑,响应时间非常短,因此,利用CPLD20来实现多节点服务器电源10失效的保护,从而保障方案的实时性,可以快速的实现降频控制。具体的,本申请将CPLD20与N个电源10均连接,CPLD20可以通过硬线电路获取各个电源10的失效告警信息,当CPLD20基于获取的各个电源10的失效告警信息确定出降频条件成立时,CPLD20便可以预设的降频规则进行多节点服务器的降频控制。综上所述,本申请的方案有效地实现多节点服务器电源10失效保护,保障了方案的实时性,避免出现降频不及时的情况。
相应于上面的设备实施例,本发明实施例还提供了一种多节点服务器电源失效的保护方法,可与上文相互对应参照。
参见图3所示,为本发明中一种多节点服务器电源失效的保护方法的实施流程图,应用于上述任一实施例中的服务器电源失效的保护设备中,包括:
步骤S301:N个电源为多节点服务器提供电能;
步骤S302:与N个电源均连接的CPLD通过硬线电路获取各个电源的失效告警信息,并且当基于获取的各个电源的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;
其中,N为正整数。
在本发明的一种具体实施方式中,还包括:
与N个电源均连接的CMC按照预设周期获取各个电源的电源信息,并且每次获取了各个电源的电源信息之后,判断N个电源中当前正常工作的电源是否满足冗余功能要求,如果满足,则将CPLD中存储的降频启动状态设置为第一状态,否则将CPLD中存储的降频启动状态设置为第二状态;
相应的,降频条件为:
CPLD接收到一条新增的失效告警信息,并且CPLD当前的降频启动状态被设置为第二状态。
在本发明的一种具体实施方式中,步骤S102中描述的按照预设的降频规则进行多节点服务器的降频控制,包括:
获取当前在CPLD中存储的降频数量值k;
选取多节点服务器中的k个节点进行降频,使得k个节点降频之后的功耗均不超过W2
多节点服务器电源失效的保护方法还包括:
CMC每次获取了各个电源的电源信息之后,计算出
Figure BDA0002887509340000091
的数值并利用计算结果更新CPLD中存储的降频数量值k;
其中,M表示多节点服务器中当前运行的节点数量;W1表示单节点正常状态下的最大功耗值;W2表示单节点降频之后的最大功耗值;
Figure BDA0002887509340000092
表示向上取整;W表示在当前正常工作的电源中,如果功率最大的一个电源失效时,剩余电源提供的功率总和。
在本发明的一种具体实施方式中,还包括:
CPLD在按照预设的降频规则进行多节点服务器的降频控制之后,通过CMC输出降频提示信息。
相应于上面的设备和方法实施例,本发明实施例还提供了一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的多节点服务器电源失效的保护方法的步骤。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种多节点服务器电源失效的保护设备,其特征在于,包括:
用于为多节点服务器提供电能的N个电源;
与N个电源均连接的CPLD,用于通过硬线电路获取各个电源的失效告警信息,并且当基于获取的各个电源的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;
其中,N为正整数。
2.根据权利要求1所述的多节点服务器电源失效的保护设备,其特征在于,还包括:
与N个电源均连接的CMC,用于按照预设周期获取各个电源的电源信息,并且每次获取了各个电源的电源信息之后,判断N个电源中当前正常工作的电源是否满足冗余功能要求,如果满足,则将所述CPLD中存储的降频启动状态设置为第一状态,否则将所述CPLD中存储的降频启动状态设置为第二状态;
相应的,所述降频条件为:
所述CPLD接收到一条新增的失效告警信息,并且所述CPLD当前的降频启动状态被设置为第二状态。
3.根据权利要求1所述的多节点服务器电源失效的保护设备,其特征在于,所述CPLD按照预设的降频规则进行多节点服务器的降频控制,具体包括:
获取当前在所述CPLD中存储的降频数量值k;
选取多节点服务器中的k个节点进行降频,使得k个节点降频之后的功耗均不超过W2
所述CMC还用于:
每次获取了各个电源的电源信息之后,计算出
Figure FDA0002887509330000011
的数值并利用计算结果更新所述CPLD中存储的降频数量值k;
其中,M表示多节点服务器中当前运行的节点数量;W1表示单节点正常状态下的最大功耗值;W2表示单节点降频之后的最大功耗值;
Figure FDA0002887509330000012
表示向上取整;W表示在当前正常工作的电源中,如果功率最大的一个电源失效时,剩余电源提供的功率总和。
4.根据权利要求1所述的多节点服务器电源失效的保护设备,其特征在于,所述CPLD还用于:
在按照预设的降频规则进行多节点服务器的降频控制之后,通过CMC输出降频提示信息。
5.根据权利要求1所述的多节点服务器电源失效的保护设备,其特征在于,所述CPLD通过I2C总线或者GPIO接口与所述CMC连接。
6.一种多节点服务器电源失效的保护方法,其特征在于,应用于如权利要求1至5任一项所述的服务器电源失效的保护设备中,包括:
N个电源为多节点服务器提供电能;
与N个电源均连接的CPLD通过硬线电路获取各个电源的失效告警信息,并且当基于获取的各个电源的失效告警信息确定出降频条件成立时,按照预设的降频规则进行多节点服务器的降频控制;
其中,N为正整数。
7.根据权利要求6所述的多节点服务器电源失效的保护方法,其特征在于,还包括:
与N个电源均连接的CMC按照预设周期获取各个电源的电源信息,并且每次获取了各个电源的电源信息之后,判断N个电源中当前正常工作的电源是否满足冗余功能要求,如果满足,则将所述CPLD中存储的降频启动状态设置为第一状态,否则将所述CPLD中存储的降频启动状态设置为第二状态;
相应的,所述降频条件为:
所述CPLD接收到一条新增的失效告警信息,并且所述CPLD当前的降频启动状态被设置为第二状态。
8.根据权利要求6所述的多节点服务器电源失效的保护方法,其特征在于,所述按照预设的降频规则进行多节点服务器的降频控制,包括:
获取当前在所述CPLD中存储的降频数量值k;
选取多节点服务器中的k个节点进行降频,使得k个节点降频之后的功耗均不超过W2
多节点服务器电源失效的保护方法还包括:
CMC每次获取了各个电源的电源信息之后,计算出
Figure FDA0002887509330000031
的数值并利用计算结果更新所述CPLD中存储的降频数量值k;
其中,M表示多节点服务器中当前运行的节点数量;W1表示单节点正常状态下的最大功耗值;W2表示单节点降频之后的最大功耗值;
Figure FDA0002887509330000032
表示向上取整;W表示在当前正常工作的电源中,如果功率最大的一个电源失效时,剩余电源提供的功率总和。
9.根据权利要求6所述的多节点服务器电源失效的保护方法,其特征在于,还包括:
所述CPLD在按照预设的降频规则进行多节点服务器的降频控制之后,通过CMC输出降频提示信息。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求6至9任一项所述的多节点服务器电源失效的保护方法的步骤。
CN202110018479.1A 2021-01-07 2021-01-07 多节点服务器电源失效的保护设备、方法及可读存储介质 Withdrawn CN112732058A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110018479.1A CN112732058A (zh) 2021-01-07 2021-01-07 多节点服务器电源失效的保护设备、方法及可读存储介质
PCT/CN2021/143258 WO2022148297A1 (zh) 2021-01-07 2021-12-30 多节点服务器电源失效的保护设备、方法及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110018479.1A CN112732058A (zh) 2021-01-07 2021-01-07 多节点服务器电源失效的保护设备、方法及可读存储介质

Publications (1)

Publication Number Publication Date
CN112732058A true CN112732058A (zh) 2021-04-30

Family

ID=75591033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110018479.1A Withdrawn CN112732058A (zh) 2021-01-07 2021-01-07 多节点服务器电源失效的保护设备、方法及可读存储介质

Country Status (2)

Country Link
CN (1) CN112732058A (zh)
WO (1) WO2022148297A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113608607A (zh) * 2021-09-30 2021-11-05 阿里云计算有限公司 多节点服务器控制方法和多节点服务器
WO2022148297A1 (zh) * 2021-01-07 2022-07-14 苏州浪潮智能科技有限公司 多节点服务器电源失效的保护设备、方法及可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116879789A (zh) * 2023-06-14 2023-10-13 中科可控信息产业有限公司 电源检测方法、装置、计算机设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109683696A (zh) * 2018-12-25 2019-04-26 浪潮电子信息产业股份有限公司 服务器电源故障检测系统、方法、装置、设备及介质
CN110609760A (zh) * 2019-08-14 2019-12-24 苏州浪潮智能科技有限公司 一种防止服务器误触发降频的系统
CN111352497A (zh) * 2020-02-29 2020-06-30 苏州浪潮智能科技有限公司 一种服务器的功耗限制方法、系统、设备以及介质
CN111475011A (zh) * 2020-03-08 2020-07-31 苏州浪潮智能科技有限公司 一种服务器n+1冗余电源功率控制系统及方法
CN112732058A (zh) * 2021-01-07 2021-04-30 苏州浪潮智能科技有限公司 多节点服务器电源失效的保护设备、方法及可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022148297A1 (zh) * 2021-01-07 2022-07-14 苏州浪潮智能科技有限公司 多节点服务器电源失效的保护设备、方法及可读存储介质
CN113608607A (zh) * 2021-09-30 2021-11-05 阿里云计算有限公司 多节点服务器控制方法和多节点服务器
CN113608607B (zh) * 2021-09-30 2022-04-01 阿里云计算有限公司 多节点服务器控制方法和多节点服务器

Also Published As

Publication number Publication date
WO2022148297A1 (zh) 2022-07-14

Similar Documents

Publication Publication Date Title
CN112732058A (zh) 多节点服务器电源失效的保护设备、方法及可读存储介质
EP3253028B1 (en) Method for managing instance node and management device
US10003200B2 (en) Decentralized module-based DC data center
US5315161A (en) Power failure detection and shut down timer
WO2019128670A1 (zh) 用于在分布式系统中使管理能力自恢复的方法和装置
CN107247647B (zh) 一种存储系统中bbu工作状态检测方法及系统
JP2015082276A (ja) 情報処理方法、プログラム、情報処理装置、及びコンピュータシステム
KR101981846B1 (ko) 직류 전압 제어 방법 및 장치
US7045914B2 (en) System and method for automatically providing continuous power supply via standby uninterrupted power supplies
WO2001073531A1 (en) Apparatus and method for power integrated control
CN111309132B (zh) 一种服务器多档位电源冗余的方法
CN117453036A (zh) 调整服务器中的设备的功耗的方法、系统及装置
CN103149908B (zh) 一种供电控制方法、装置及设备
CN116823587A (zh) 一种图形处理器控制方法、装置、电子设备及存储介质
CN111416726B (zh) 一种资源管理的方法、发送端设备和接收端设备
CN114138567A (zh) 一种基板管理控制模块维护方法、装置、设备及存储介质
JP2012190101A (ja) クラスタシステム
JP7054991B2 (ja) 直流集中電源システム
CN116991591B (zh) 一种数据调度方法、装置及存储介质
CN114124590B (zh) 应用于以太网通信设备的安全电路、通信方法、设备
CN116431291B (zh) 一种虚拟化管理平台的部署方法、系统、设备及存储介质
CN218482701U (zh) 一种掉电保持电路和供电电路
CN117762233A (zh) 服务器的掉电保护方法、装置、电子设备和cpld
CN117435019A (zh) 一种服务器供电控制方法、装置、设备及存储介质
US10374453B2 (en) Uninterruptible power supply and control method there of

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210430