CN115904050A - 一种防止服务器掉电关机的电源控制系统及方法 - Google Patents

一种防止服务器掉电关机的电源控制系统及方法 Download PDF

Info

Publication number
CN115904050A
CN115904050A CN202211620451.6A CN202211620451A CN115904050A CN 115904050 A CN115904050 A CN 115904050A CN 202211620451 A CN202211620451 A CN 202211620451A CN 115904050 A CN115904050 A CN 115904050A
Authority
CN
China
Prior art keywords
power supply
power
power consumption
programmable logic
logic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211620451.6A
Other languages
English (en)
Inventor
吴俊勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211620451.6A priority Critical patent/CN115904050A/zh
Publication of CN115904050A publication Critical patent/CN115904050A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

本发明属于服务器电源控制技术领域,具体提供一种防止服务器掉电关机的电源控制系统及方法,所述系统包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;供电装置包括若干个供电单元;供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。

Description

一种防止服务器掉电关机的电源控制系统及方法
技术领域
本发明涉及服务器电源控制技术领域,具体涉及一种防止服务器掉电关机的电源控制系统及方法。
背景技术
一般服务器对于系统稳定度会有较高要求,通常都会设计电源冗余,冗余电源是用于服务器中的一种电源,是由两个以上完全一样的电源组成,由芯片控制电源进行负载均衡,当一个电源出现故障时,其他电源马上可以接管其工作,在更换电源后,所有电源再协同工作。冗余电源是为了实现服务器系统的高可用性即可靠度。
服务器为了极大提升电源效率,提供四个电源供应器供应电源,在正常时会同时供应电源,而系统通常都具有N+1或N+N个电源供应器冗余设计,来防止当其中一个电源故障,无法供电时,系统还能正常运作,不会整个系统关机。
现在处理器及系统其他周边装置电源功耗一直升高,电源供应器就必须加大电源供应,但体积必须增大,服务器内部因为设计空间限制,有时无法提供所需空间,导致无法做到电源供应器N+N冗余,当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,如何防止系统因掉电而关机是本申请要解决的技术问题。
发明内容
现在处理器及系统其他周边装置电源功耗一直升高,电源供应器就必须加大电源供应,但体积必须增大,服务器内部因为设计空间限制,有时无法提供所需空间,导致无法做到电源供应器N+N冗余,当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,针对如何防止系统因掉电而关机,本发明提供一种防止服务器掉电关机的电源控制系统及方法。
一方面,本发明技术方案提供一种防止服务器掉电关机的电源控制系统,包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;
可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;
供电装置包括若干个供电单元;
供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;
可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,在系统因电力不足关机前,通过本申请的系统即时将整机功耗降到剩余PSU的额定功耗内,进而防止系统因掉电而关机,导致后方用户严重损失。在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
作为本发明技术方案的进一步限定,BMC,用于获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件。
作为本发明技术方案的进一步限定,可编程逻辑器件,用于获取系统各部件额定功耗计算系统的额定功耗,将获取的最大功耗与系统的额定功耗进行比较,当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出开机异常告警信息。可编程逻辑器件,用于输出调低CPU的频率的控制信息,或输出固定周期内只执行一次动作,若有新事件触发,不执行的节流控制信息。
作为本发明技术方案的进一步限定,若干个供电单元中包括N个供电单元和N个冗余供电单元;
状态处理模块,具体用于获取N个供电单元状态,根据获取的状态判断是否有供电单元故障,当有供电单元故障时,控制冗余供电单元开启代替故障的供电单元工作。还用于根据获取的供电单元的状态判断供电装置供电不满足预设条件时,触发供电过流保护的同时发送告警信号低电平给可编程逻辑器件。
作为本发明技术方案的进一步限定,状态处理模块,还用于根据获取的供电单元的状态判断供电单元故障排除时,将发送给可编程逻辑器件的告警信号电平拉高;
可编程逻辑器件接收到拉高后的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
作为本发明技术方案的进一步限定,BMC,用于在可编程逻辑器件输出调整功耗的控制信息的同时记录发生限制功耗与性能的纪录。
当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,在系统因电力不足关机前,通过本申请的系统即时将整机功耗降到剩余PSU的额定功耗内,进而防止系统因掉电而关机,导致后方用户严重损失。在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
第二方面,本发明技术方案还提供一种防止服务器掉电关机的电源控制方法,包括如下步骤:
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;
当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;
系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
需要说明的是,本发明技术方案提供的方法是基于防止服务器掉电关机的电源控制系统的方法,所述系统包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;供电装置包括若干个供电单元;供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
作为本发明技术方案的进一步限定,该方法还包括:
可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
BMC用于获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件。可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将获取的最大功耗与系统的额定功耗进行比较,当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出开机异常告警信息。可编程逻辑器件,用于输出调低CPU的频率的控制信息,或输出固定周期内只执行一次动作,若有新事件触发,不执行的节流控制信息。在这里,若干个供电单元中包括N个供电单元和N个冗余供电单元;状态处理模块获取N个供电单元状态,根据获取的状态判断是否有供电单元故障,当有供电单元故障时,控制冗余供电单元开启代替故障的供电单元工作。还用于根据获取的供电单元的状态判断供电装置供电不满足预设条件时,触发供电过流保护的同时发送告警信号低电平给可编程逻辑器件。还用于根据获取的供电单元的状态判断供电单元故障排除时,将发送给可编程逻辑器件的告警信号电平拉高。客户在未来使用高功耗服务器时,若因架构和密度限制,供电装置无法做到完全N+N冗余時,通过本申请的技术方案在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
从以上技术方案可以看出,本发明具有以下优点:当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,在系统因电力不足关机前,通过本申请的系统即时将整机功耗降到剩余PSU的额定功耗内,进而防止系统因掉电而关机,导致后方用户严重损失。在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的装置的示意性框图。
具体实施方式
服务器为了极大提升电源效率,提供四个电源供应器供应电源,在正常时会同时供应电源,而系统通常都具有N+1或N+N个电源供应器冗余设计,来防止当其中一个电源故障,无法供电时,系统还能正常运作,不会整个系统关机。
现在处理器及系统其他周边装置电源功耗一直升高,电源供应器就必须加大电源供应,但体积必须增大,服务器内部因为设计空间限制,有时无法提供所需空间,导致无法做到电源供应器N+N冗余,当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,如何防止系统因掉电而关机是本申请要解决的技术问题。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1所示,本发明实施例提供一种防止服务器掉电关机的电源控制系统,包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;
可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;
供电装置包括若干个供电单元;
供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;
可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,在系统因电力不足关机前,通过本申请的系统即时将整机功耗降到剩余PSU的额定功耗内,进而防止系统因掉电而关机,导致后方用户严重损失。在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
如图1所示,本发明实施例还提供一种防止服务器掉电关机的电源控制系统,包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;
可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;
供电装置包括若干个供电单元;
供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;
可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
BMC,用于获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件。
可编程逻辑器件,用于获取系统各部件额定功耗计算系统的额定功耗,将获取的最大功耗与系统的额定功耗进行比较,当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出开机异常告警信息。可编程逻辑器件,用于输出调低CPU的频率的控制信息,或输出固定周期内只执行一次动作,若有新事件触发,不执行的节流控制信息。
需要说明的是,可编程逻辑器件通过PSU_present信号、VIN Good信号、PSU_PWOK信号与供电装置通信获取供电装置的相关状态信号,供电装置还通过PSU_present信号和PMBus与BMC连接用于上报供电装置的自身状态,只有当供电装置供电不足触发过流保护OCP时,PSU_Alert_N通过可编程逻辑器件,可编程逻辑器件才会去触发PROC_hot_Throttling、MEM_hot_Throttling、BMC_GPIO_Throttling信号将系统性能降低,达到降功耗目的。
本发明实施例还提供一种防止服务器掉电关机的电源控制系统,包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;
可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;
供电装置包括若干个供电单元;
供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;
可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
BMC,用于获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件。BMC通过I2C与可编程逻辑器件通信。
若干个供电单元中包括N个供电单元和N个冗余供电单元;在这里供电单元可以是PSU;
状态处理模块,具体用于获取N个供电单元状态,根据获取的状态判断是否有供电单元故障,当有供电单元故障时,控制冗余供电单元开启代替故障的供电单元工作。还用于根据获取的供电单元的状态判断供电装置供电不满足预设条件时,触发供电过流保护的同时发送告警信号低电平给可编程逻辑器件。还用于根据获取的供电单元的状态判断供电单元故障排除时,将发送给可编程逻辑器件的告警信号电平拉高;
当系统电源供电不足时,PSU会触发OCP保护供电装置,此时要规范PSU的Alert会拉low,而其他条件不会让PSU Alert拉low,这样是要保证只有过电流的时候,才会触发系统降功耗功能。当PSU Alert拉low后,会传给服务器的可编程逻辑器件,然后可编程逻辑器件会对系统做降性能动作,此时系统功耗也会降下来。为保证不掉电,还需限定PSU掉电保护时间,这边以1.4倍为例子,若服务器系统功耗超过PSU额定功耗,但在1.4倍的范围内,此时PSU可以保证在Alert拉low后11.1秒才掉电,也就是说如果是4颗PSU支持N+N冗余,就是2颗PSU额定功耗的1.4倍,这样只要在11.1秒内将系统功耗降下来,系统就不会掉电。限制功耗与性能机制会直到PSU问题消失后,再回到正常。也就是,可编程逻辑器件接收到拉高后的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
本发明实施例中可编程逻辑器件选择CPLD,主板BMC计算系统配置的最大功耗通知给主板CPLD设定,若系统最大功耗超过额定功耗1.4.倍,则CPLD发生告警,不让系统正常开机。PSU可用数量可由PSU_Present、VIN Good、PSU_PWOK信号判断,其中一根信号有问题,就代表此PSU不能使用,由此来判断PSU数量是否可以达成N+N冗余,但这些信号不会触发性能降低功能。只有当触发过流保护OCP时,PSU_Alert_N通过CPLD,CPLD才会去触发PROC_hot_Throttling、MEM_hot_Throttling、BMC_GPIO_Throttling将系统性能降低,达到降功耗目的。同时BMC会记录发生限制功耗与性能的纪录,直到PSU问题消失后,CPLD收到PSUAlert拉high后,再回到正常。
当系统整机功耗过大,其中一颗PSU或两颗PSU故障,剩下的PSU无法供应整系统正常工作时,在系统因电力不足关机前,通过本申请的系统即时将整机功耗降到剩余PSU的额定功耗内,进而防止系统因掉电而关机,导致后方用户严重损失。在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
利用服务器本身就有降功耗的设计,将此设计再结合PSU过电流保护设计,在限定PSU的掉电保护(OCP)时间内达到降功耗的设计,达成防止服务器掉电关机的电源控制系统,利用PSU OCP保护机制,输出Alert信号,以及利用CPLD快速整合成一根电源异常信号传递到后方的服务器,这整个电源控制设计让整系统在无法支援N+N冗余的情况下,也能在电源异常时,不会因为掉电而导致系统关机。具体实施时需限定PSU的掉电保护(OCP)时间及功耗倍率,本申请设置功耗倍率1.4倍,掉电保护(OCP)时间11.1秒。
如图2所示,本发明实施例还提供一种防止服务器掉电关机的电源控制方法,包括如下步骤:
步骤1:可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;
步骤2:当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;
步骤3:系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
步骤4:可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
需要说明的是,BMC用于获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件。可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将获取的最大功耗与系统的额定功耗进行比较,当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出开机异常告警信息。可编程逻辑器件,用于输出调低CPU的频率的控制信息,或输出固定周期内只执行一次动作,若有新事件触发,不执行的节流控制信息。
本发明实施例还提供一种防止服务器掉电关机的电源控制方法,所述方法应用于电源控制系统,所述系统包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;供电装置包括若干个供电单元;供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息;所述方法包括如下步骤:
S1:BMC获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件;
S2:可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与最大功耗进行比较;
S3:当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;
S4:系统开机运行后,状态处理模块实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;
S5:可编程逻辑器件接收到状态处理模块发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
S6:状态处理模块实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率大于设定阈值时拉高的告警信号;
S7:可编程逻辑器件接收到状态处理模块发送的拉高的告警信号(Alert信号)后,停止输出调低功耗的控制信息使系统功耗恢复正常。
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将获取的最大功耗与系统的额定功耗进行比较,当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出开机异常告警信息。可编程逻辑器件,用于输出调低CPU的频率的控制信息,或输出固定周期内只执行一次动作,若有新事件触发,不执行的节流控制信息。在这里,若干个供电单元中包括N个供电单元和N个冗余供电单元;状态处理模块获取N个供电单元状态,根据获取的状态判断是否有供电单元故障,当有供电单元故障时,控制冗余供电单元开启代替故障的供电单元工作。还用于根据获取的供电单元的状态判断供电装置供电不满足预设条件时,触发供电过流保护的同时发送告警信号低电平给可编程逻辑器件。还用于根据获取的供电单元的状态判断供电单元故障排除时,将发送给可编程逻辑器件的告警信号电平拉高。客户在未来使用高功耗服务器时,若因架构和密度限制,供电装置无法做到完全N+N冗余時,通过本申请的技术方案在电力发生超负荷情况时,达到快速降低系统功耗,进而防止系统因掉电而关机,也不会导致后方用户发生严重损失。
利用服务器本身就有降功耗的设计,将此设计再结合PSU过电流保护设计,在限定PSU的掉电保护(OCP)时间内达到降功耗的设计,达成防止服务器掉电关机的电源控制系统,利用PSU OCP保护机制,输出Alert信号,以及利用CPLD快速整合成一根电源异常信号传递到后方的服务器,这整个电源控制设计让整系统在无法支援N+N冗余的情况下,也能在电源异常时,不会因为掉电而导致系统关机。具体实施时需限定PSU的掉电保护(OCP)时间及功耗倍率,本申请设置功耗倍率1.4倍,掉电保护(OCP)时间11.1秒。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种防止服务器掉电关机的电源控制系统,其特征在于,包括供电装置,供电装置分别连接有BMC和可编程逻辑器件;
可编程逻辑器件通过依次连接的CPU和PCH与BMC连接;
供电装置包括若干个供电单元;
供电装置内部设置状态处理模块,用于实时监控各个供电单元的运行状态计算供电装置输出功率,当输出功率小于设定阈值时触发电源保护同时发送告警信号给可编程逻辑器件;
可编程逻辑器件,用于接收到告警信号后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
2.根据权利要求1所述的防止服务器掉电关机的电源控制系统,其特征在于,BMC,用于获取系统各部件状态信息计算系统配置的最大功耗发动给可编程逻辑器件。
3.根据权利要求2所述的防止服务器掉电关机的电源控制系统,其特征在于,可编程逻辑器件,用于获取系统各部件额定功耗计算系统的额定功耗,将获取的最大功耗与系统的额定功耗进行比较,当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出开机异常告警信息。
4.根据权利要求3所述的防止服务器掉电关机的电源控制系统,其特征在于,可编程逻辑器件,用于输出调低CPU的频率的控制信息,或输出固定周期内只执行一次动作,若有新事件触发,不执行的节流控制信息。
5.根据权利要求4所述的防止服务器掉电关机的电源控制系统,其特征在于,若干个供电单元中包括N个供电单元和N个冗余供电单元;
状态处理模块,具体用于获取N个供电单元状态,根据获取的状态判断是否有供电单元故障,当有供电单元故障时,控制冗余供电单元开启代替故障的供电单元工作。
6.根据权利要求5所述的防止服务器掉电关机的电源控制系统,其特征在于,状态处理模块,还用于根据获取的供电单元的状态判断供电装置供电不满足预设条件时,触发供电过流保护的同时发送告警信号低电平给可编程逻辑器件。
7.根据权利要求6所述的防止服务器掉电关机的电源控制系统,其特征在于,状态处理模块,还用于根据获取的供电单元的状态判断供电单元故障排除时,将发送给可编程逻辑器件的告警信号电平拉高;
可编程逻辑器件接收到拉高后的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
8.根据权利要求7所述的防止服务器掉电关机的电源控制系统,其特征在于,BMC,用于在可编程逻辑器件输出调整功耗的控制信息的同时记录发生限制功耗与性能的纪录。
9.一种防止服务器掉电关机的电源控制方法,其特征在于,包括如下步骤:
可编程逻辑器件获取系统各部件额定功耗计算系统的额定功耗,将系统的额定功耗与BMC传输过来的最大功耗进行比较;
当最大功耗大于系统的额定功耗的设定阈值倍数时,可编程逻辑器件输出电源异常告警信息阻止系统正常开机;
系统开机运行后,可编程逻辑器件接收到状态处理模块触发供电过流保护的同时发送的告警信号低电平后,输出将功耗调低的控制信息,同时输出供电单元故障告警信息。
10.根据权利要求9所述的防止服务器掉电关机的电源控制方法,其特征在于,该方法还包括:
可编程逻辑器件接收到状态处理模块发送的拉高的告警信号后,停止输出调低功耗的控制信息使系统功耗恢复正常。
CN202211620451.6A 2022-12-15 2022-12-15 一种防止服务器掉电关机的电源控制系统及方法 Pending CN115904050A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211620451.6A CN115904050A (zh) 2022-12-15 2022-12-15 一种防止服务器掉电关机的电源控制系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211620451.6A CN115904050A (zh) 2022-12-15 2022-12-15 一种防止服务器掉电关机的电源控制系统及方法

Publications (1)

Publication Number Publication Date
CN115904050A true CN115904050A (zh) 2023-04-04

Family

ID=86480577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211620451.6A Pending CN115904050A (zh) 2022-12-15 2022-12-15 一种防止服务器掉电关机的电源控制系统及方法

Country Status (1)

Country Link
CN (1) CN115904050A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116755542A (zh) * 2023-06-16 2023-09-15 北京市合芯数字科技有限公司 一种整机功耗降低方法、系统、基板管理控制器及服务器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116755542A (zh) * 2023-06-16 2023-09-15 北京市合芯数字科技有限公司 一种整机功耗降低方法、系统、基板管理控制器及服务器
CN116755542B (zh) * 2023-06-16 2024-06-04 北京市合芯数字科技有限公司 一种整机功耗降低方法、系统、基板管理控制器及服务器

Similar Documents

Publication Publication Date Title
KR101515849B1 (ko) Cmos 디바이스의 래치―업 자동 검출 및 cmos 디바이스로의 전력 순환
EP3226380B1 (en) Uninterruptible power supply
US9223394B2 (en) Rack and power control method thereof
CN111475288A (zh) 一种服务器及其供电保护系统
CN102882267B (zh) 供电装置、电子设备和供电方法
CN114442787B (zh) 服务器进入功耗封顶后实现整机功耗回调的方法、系统
CN111258405B (zh) 一种服务器主板防烧系统及方法
CN110609760A (zh) 一种防止服务器误触发降频的系统
WO2024082873A1 (zh) 数据备份方法、计算机设备及存储介质
CN116755542B (zh) 一种整机功耗降低方法、系统、基板管理控制器及服务器
CN115904050A (zh) 一种防止服务器掉电关机的电源控制系统及方法
US7045914B2 (en) System and method for automatically providing continuous power supply via standby uninterrupted power supplies
CN116594488A (zh) 一种计算设备
WO2023029375A1 (zh) 一种四路服务器电源功耗管理装置
CN111309132B (zh) 一种服务器多档位电源冗余的方法
CN111475293B (zh) 一种服务器及其供电保护系统
CN111984471B (zh) 一种机柜电源bmc冗余管理系统及方法
CN109917895B (zh) 一种电压调节模块vrm的控制装置及控制方法
CN112732064A (zh) 一种功耗调节系统、方法及介质
CN116540856A (zh) 一种供电模块故障恢复后更正状态的装置、方法和服务器
CN217388303U (zh) 一种基于超级电容的嵌入式系统掉电保护装置
CN113885689A (zh) 整机柜服务器供电控制方法、系统、终端及存储介质
CN102221870B (zh) 备援电源供应方法及其装置
JP6953710B2 (ja) 計算機システム
CN111381659A (zh) 计算机系统及电源管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination