CN111475293A - 一种服务器及其供电保护系统 - Google Patents

一种服务器及其供电保护系统 Download PDF

Info

Publication number
CN111475293A
CN111475293A CN202010233946.8A CN202010233946A CN111475293A CN 111475293 A CN111475293 A CN 111475293A CN 202010233946 A CN202010233946 A CN 202010233946A CN 111475293 A CN111475293 A CN 111475293A
Authority
CN
China
Prior art keywords
gate
power supply
circuit module
value
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010233946.8A
Other languages
English (en)
Other versions
CN111475293B (zh
Inventor
韩红瑞
黄柏学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010233946.8A priority Critical patent/CN111475293B/zh
Publication of CN111475293A publication Critical patent/CN111475293A/zh
Application granted granted Critical
Publication of CN111475293B publication Critical patent/CN111475293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • G06F1/305Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations in the event of power-supply fluctuations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Power Sources (AREA)

Abstract

本发明公开了一种供电保护系统,由于申请人考虑到了散热器本身占用服务器系统很大一部分功率,因此在PSU的任一状态IO接口的电平状态异常时,本申请并没有急剧拉低CPU的运行功率,而是先降低散热器的功率保证系统不宕机,然后再根据PSU的当前功率供应值对CPU的运行功率进行调整(控制CPU的运行功率不大于当前功率供应值与散热器原有运行功率的差值),最终再恢复散热器的原有运行功率,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度。本发明还公开了一种服务器,具有如上供电保护系统相同的有益效果。

Description

一种服务器及其供电保护系统
技术领域
本发明涉及服务器领域,特别是涉及一种供电保护系统,本发明还涉及一种服务器。
背景技术
目前的服务器为防止过流保护、过压保护、电源异常、电源失效或者意外拔出等异常情况出现造成服务器掉电的发生,通常会对PSU(Power Supply Unit,电源供电单元)进行冗余设计,保证其中一路PSU异常掉电之后,其他备用PSU可以提供足够电能以保证服务器工作,但是即便如此,当某个PSU出现异常无法供电的时候,若服务器的CPU功耗过大也有可能触发剩余PSU的过流等保护机制从而使得服务器宕机,现有技术中可以门电路模块监测PSU的状态IO接口,当PSU的任一状态IO接口的电平状态异常时,门电路模块便会发送第一电平来控制服务器的CPU进行低功耗模式运行,以防止服务器宕机,控制器在监测到第一电平时便会计算PSU的当前功率供应值,并将CPU的功率控制在当前功率供应值以下,可以明显地看出,该方案在PSU的某个状态IO接口异常时先将CPU的运行功率急剧拉低,然后再由控制器将CPU的功率控制在PSU的当前功率供应值一下(即提高了部分功率,减少对业务影响),然而当CPU工作在低功耗模式时,其运行功率非常低,必然会对服务器正在运行的业务造成很大的影响,降低了客户满意度。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种供电保护系统,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度;本发明的另一目的是提供一种包括上述供电保护系统的服务器,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度。
为解决上述技术问题,本发明提供了一种供电保护系统,其特征在于,包括:
与各个电源供电单元PSU的状态IO接口连接的第一门电路模块,用于在任一所述状态IO接口的电平状态异常时输出第一电平;
与所述第一门电路模块连接的散热器,用于在接收到所述第一电平时以低功耗模式运行;
与所述第一门电路模块连接的控制器,用于在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内,并恢复所述散热器的所述原有功率值。
优选地,所述获取所有所述PSU的当前功率供应值之后,所述将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内之前,所述控制器还用于:
判断所述散热器进入所述低功耗模式释放的功率值是否小于所述PSU即将损失的功率值;
若小于,则控制所述CPU进入低功耗模式运行,并执行将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内的步骤;
若不小于,则执行将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内的步骤;
则该供电保护系统还包括所述CPU。
优选地,该供电保护系统还包括第二门电路模块;
所述第二门电路模块的输入端与所述第一门电路模块的输出端连接,所述第二门电路模块的输出端分别与所述散热器以及所述CPU连接;
所述第二门电路模块,用于将所述第一电平传输至所述散热器;
则所述控制所述CPU进入低功耗模式运行具体为:
控制所述第二门电路模块接通所述第二与门与所述CPU之间的低电平的信号通路,以便所述CPU响应于所述低电平工作在低功耗模式;
所述控制器还用于在所述CPU的总功率不大于预设阈值时,通过所述第二门电路模块控制所述散热器以及所述CPU仅能接收到高电平,以便关闭供电保护功能。
优选地,该供电保护系统还包括:
与所述控制器连接的配置终端,用于通过其选择所述控制器对于所述第二门电路的预设控制策略;
所述预设控制策略包括第二预设子策略以及第三预设子策略,还包括第一预设子策略或第四预设子策略:
所述第一预设子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述CPU,在接收到所述第一电平时,将CPU的运行功率限制在所有所述PSU的当前功率供应值与所述散热器当前功率值的差值以内;
所述第二预设子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述散热器,在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,将所述CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内,并恢复所述散热器的所述原有功率值;
所述第三预设子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述散热器,在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,判断所述散热器进入所述低功耗模式释放的功率值是否小于所述PSU即将损失的功率值;若小于,则控制所述CPU进入低功耗模式,将所述CPU的运行功率限制在所述当前功率供应值与所述散热器的原有功率值的差值以内,并恢复所述散热器的所述原有功率值;若不小于,则将所述CPU的运行功率限制在所述当前功率供应值与所述散热器的原有功率值的差值以内并恢复所述散热器的所述原有功率值;
所述第四控制子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块将所述第一门电路模块输出的第一电平传输至所述散热器以及所述CPU,在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,将所述CPU的运行功率限制在所述当前功率供应值与所述散热器的原有功率值的差值以内,并恢复所述散热器的所述原有功率值;
其中,在任一预设子策略中,每当对所述CPU的运行功率进行控制之后,控制器还用于通过所述第二门电路模块控制所述散热器以及所述CPU仅能接收到高电平,在所有的所述PSU恢复正常后恢复原有的控制子策略。
优选地,所述第一门电路模块包括第二与门以及与所述PSU一一对应的第一与门;
各个所述第一与门的输入端分别与对应的所述PSU的所述状态IO接口连接,各个所述第一与门的输出端均连接至所述第二与门的输入端,所述第二与门的输出端与所述第二门电路模块的输入端连接;
则所述第一电平为低电平。
优选地,所述第二门电路模块包括第二或门以及第三或门;
所述第二或门的第一输入端与所述第二与门的输出端以及所述控制器连接,所述第二或门的第二输入端与所述控制器连接,所述第二或门的输出端与所述CPU连接,所述第三或门的第一输入端与所述第二与门的输出端连接,所述第三或门的第二输入端与所述控制器连接,所述第三或门的输出端与所述散热器连接;
所述控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述CPU具体为:
持续向所述第二或门的第二输入端发送低电平,持续向所述第三或门的第二输入端发送高电平;
所述控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述散热器具体为:
向所述第二或门的第二输入端发送高电平,向所述第三或门的第二输入端发送低电平;
所述控制所述CPU进入低功耗模式具体为:
向所述第二或门的第二输入单发送低电平;
所述控制所述第二门电路模块将所述第一门电路模块输出的第一电平传输至所述散热器以及所述CPU具体为:
向所述第二或门的第二输入端以及所述第三或门的第二输入端均发送低电平;
所述通过所述第二门电路模块控制所述散热器以及所述CPU仅能接收到高电平具体为:
向所述第二或门以及所述第三或门均发送高电平。
优选地,所述第二门电路模块还包括第一或门;
所述第二与门的输出端与所述第一或门的第一输入端连接,所述第一或门的第二输入端连接至所述控制器的控制信号输出端,所述第一或门的输出端分别与所述第二或门以及所述第三或门的输入端连接;
则所述向所述第二或门以及所述第三或门均发送高电平具体为:
通过向所述第一或门的第二输入端发送高电平以保证所述第二或门以及所述第三或门接收到高电平。
优选地,所述状态IO接口包括在位信号接口以及故障信号接口;
则所述第一门电路模块还包括与所述PSU一一对应的非门;
所述在位信号接口通过所述非门与对应的所述第一与门的输入端连接,所述故障信号接口直接与对应的所述第一与门的输入端连接。
优选地,所述第一门电路模块还包括与所述PSU一一对应的第四或门;
则每个所述非门的输出端与对应的所述第四或门的第一输入端连接,每个所述第四或门的第二输入端与所述控制器连接,每个所述或门的输出端与对应的所述第一与门的输入端连接;
则所述控制器还用于通过其向指定的PSU对应的第四或门的第二输入端发送高电平,以避免指定的所述PSU的在位信号拉低所述第一与门输出的电平。
为解决上述技术问题,本发明还提供了一种服务器,包括如上任一项所述的供电保护系统。
本发明提供了一种供电保护系统,由于申请人考虑到了散热器本身占用服务器系统很大一部分功率,因此在PSU的任一状态IO接口的电平状态异常时,本申请并没有急剧拉低CPU的运行功率,而是先降低散热器的功率保证系统不宕机,然后再根据PSU的当前功率供应值对CPU的运行功率进行调整(控制CPU的运行功率不大于当前功率供应值与散热器原有运行功率的差值),最终再恢复散热器的原有运行功率,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度。
本发明还提供了一种服务器,具有如上供电保护系统相同的有益效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种供电保护系统的结构示意图;
图2为本发明提供的另一种供电保护系统的结构示意图;
图3为本发明提供的再一种供电保护系统的结构示意图;
图4为本发明提供的又一种供电保护系统的结构示意图。
具体实施方式
本发明的核心是提供一种供电保护系统,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度;本发明的另一核心是提供一种包括上述供电保护系统的服务器,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明提供的一种供电保护系统的结构示意图,该供电保护系统包括:
与各个电源供电单元PSU的状态IO接口连接的第一门电路模块1,用于在任一状态IO接口的电平状态异常时输出第一电平;
与第一门电路模块1连接的散热器2,用于在接收到第一电平时以低功耗模式运行;
与第一门电路模块1连接的控制器3,用于在接收到第一电平时,获取所有PSU的当前功率供应值,将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内,并恢复散热器2的原有功率值。
具体的,考虑到上述背景技术中的技术问题,本发明实施例中的第一门电路模块1可以在任一状态IO接口的电平状态异常时向散热器2发送第一电平,以便散热器2响应于第一电平而工作在低功耗模式,如此一来,由于散热器2占用的一大部分功耗得到释放,因此控制器3有足够的时间去调整CPU 4的运行功率,保证了服务器不会因为功率过大而宕机,提升了用户体验。
具体的,散热器2可以为多种类型,例如可以为风扇等,本发明实施例在此不做限定。
具体的,控制器3可以为多种类型,例如可以为基板管理控制器BMC等,本发明实施例在此不做限定。
具体的,本发明实施例中只是暂时地将散热器2运行在低功耗模式,在进行进行了CPU 4的运行功率的控制之后,需要将散热器2的恢复原有功率值,以便保证服务器不会因为过热而产生故障,也正是因为如此,在对CPU 4的运行功率进行控制的时候,需要将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内,这样便能够保证在散热器2恢复原有功率值时PSU不会超负荷工作。
其中,低功耗模式可以为在散热器2中预设的总功耗较低的模式,其对应的运行功率可以进行自主设定,例如设置为100W等,本发明实施例在此不做限定。
具体的,PSU的状态IO接口可以有很多种,其共同特点为均能反映PSU是否供电异常,本发明实施例中在此不做限定。
其中,PSU的具体数量可以为多种,例如为3+1共四个PSU等,本发明实施例在此不做限定。
具体的,第一门电路模块1的具体构造可以为多种类型,本发明实施例在此不做限定。
值得一提的是,将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内具体可以为:
将根据PSU的当前功率供应值与原有功率值差值生成的功耗限值发送至CPU 4并向第一或门的第二输入端发送高电平;
其中,功耗限值不大于当前功率供应值与原有功率值差值;
则控制器3还用于,在所有的PSU恢复正常后向第一或门的第二输入端发送低电平。
具体的,控制CPU 4的总功耗不大于当前功率供应值与原有功率值差值具体可以为控制器3生成略低于或者等同于当前功率供应值与原有功率值差值的功耗限值,并通过集成南桥PCH将该功耗限值发送至CPU 4,以便CPU 4将自身以及内存还有一些其他外设的总功耗限制在功耗限值以下。
当然,除了该控制方式外,控制CPU 4的总功耗不大于当前功率供应值与原有功率值差值还可以为其他控制方式,本发明实施例在此不做限定。
本发明提供了一种供电保护系统,由于申请人考虑到了散热器2本身占用服务器系统很大一部分功率,因此在PSU的任一状态IO接口的电平状态异常时,本申请并没有急剧拉低CPU 4的运行功率,而是先降低散热器2的功率保证系统不宕机,然后再根据PSU的当前功率供应值对CPU 4的运行功率进行调整(控制CPU 4的运行功率不大于当前功率供应值与散热器2原有运行功率的差值),最终再恢复散热器2的原有运行功率,在保证系统不宕机的基础上,对服务器业务的影响降到最低,提升了客户满意度。
为了更好地对本发明实施例进行说明,请参考图2,图2为本发明提供的另一种供电保护系统的结构示意图,在上述实施例的基础上:
作为一种优选的实施例,获取所有PSU的当前功率供应值之后,将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内之前,控制器3还用于:
判断散热器2进入低功耗模式释放的功率值是否小于PSU即将损失的功率值;
若小于,则控制CPU 4进入低功耗模式运行,并执行将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内的步骤;
若不小于,则执行将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内的步骤;
则该供电保护系统还包括CPU 4。
具体的,考虑到某些情况下即使将散热器2运行在低功耗模式,散热器2释放出的功率值依然小于PSU损失的输出功率值,此种情况下服务器依然存在宕机的风险,例如当有较多的PSU供电异常时,此种情况下依靠散热器2释放功率显然是无法保证服务器不会宕机的,因此本发明实施例可以在控制散热器2运行在低功耗模式之后,在散热器2释放的功率值小于PSU即将损失的功率值时,立即控制CPU 4同样进入低功耗模式,首先保证服务器不会宕机,然后才会对CPU 4的运行功率进行控制,进一步的降低了服务器宕机的风险。
其中,CPU 4的低功耗模式可以为在服务器中预设的总功耗较低的模式,其对应的运行功率可以进行自主设定,例如设置为800W等,本发明实施例在此不做限定。
作为一种优选的实施例,该供电保护系统还包括第二门电路模块5;
第二门电路模块5的输入端与第一门电路模块1的输出端连接,第二门电路模块5的输出端分别与散热器2以及CPU 4连接;
第二门电路模块5,用于将第一电平传输至散热器2;
则控制CPU 4进入低功耗模式运行具体为:
控制第二门电路模块5接通第二与门与CPU 4之间的低电平的信号通路,以便CPU4响应于低电平工作在低功耗模式;
控制器3还用于在CPU 4的总功率不大于预设阈值时,通过第二门电路模块5控制散热器2以及CPU 4仅能接收到高电平,以便关闭供电保护功能。
具体的,第二门电路模块5的具有成本低且使用寿命长的优点,可以方便地使得控制器3通过第二门电路模块5接通第一或门与CPU 4之间的低电平的信号通路。
当然,除了本发明实施例中列举的第二门电路模块5外,还可以采用其他的方式控制CPU 4工作在低功耗模式,本发明实施例在此不做限定。
具体的,通过本发明实施例中的方法,控制器3可以对CPU 4的总功率进行自动检测并判断,以实现在CPU 4的总功率较高时通过第二门电路模块5控制供电保护功能开启(散热器2能够正常地接收到第一门电路模块1输出的第一电平)以保证服务器不宕机,而在CPU 4的总功率较低时(通过第二门电路模块5控制散热器2以及CPU 4仅能接收到高电平的方式)关闭供电保护功能以保证服务器的业务不受影响。
当然,除了本发明实施例中列举的具体形式外,除了通过预设阈值对服务器的供电保护功能进行开启以及关闭外,还可以结合其他的条件对供电保护功能的开关进行控制,例如可以划分不同的时间段,并为每个时间段设置不同的预设阈值,例如在00:00到12:00的时段内,控制器3可以按照较高的第一预设子阈值进行判断,而在12:00到00:00的时段内,控制器3可以按照较低的第二预设子阈值进行判断,可以适用于更多的服务器应用场景,本发明实施例在此不做限定。
具体的,该供电保护系统还可以包括:
与控制器3连接的人机交互界面,用于通过其修改预设阈值。
具体的,考虑到随着时间的推移,预设阈值可能需要进行修改,通过本发明实施例中的人机交互界面可以方便快捷地对预设阈值进行修改,提高了工作效率。
当然,除了人机交互界面外,还可以通过其他方式对预设阈值进行修改,本发明实施例在此不做限定。
另外,人机交互界面还用于:
通过其控制第二门电路模块5转发或截止第一电平,以便主动对供电保护功能的开关进行控制。
具体的,考虑到某些情况下工作人员可能需要主动控制供电保护功能的开关,因此本发明实施例中,工作人员还可以控制控制器3主动控制第二门电路模块5转发或截止第一电平,可以方便快捷地控制供电保护功能的开关,进一步提高了工作效率。
具体的,工作人员可以根据服务器的实际应用场景来通过控制器3以及第二门电路模块5来控制供电保护功能的开启与关闭,例如当服务器应用的场景的功耗通常较低时,此时任一PSU的供电异常可能并不会导致服务器宕机,因此为了减少对服务器运行业务的影响,可以通过控制器3控制第二门电路模块5将第一电平进行翻转后发送至CPU 4以及服务器来关闭供电保护功能。
作为一种优选的实施例,该供电保护系统还包括:
与控制器3连接的配置终端6,用于通过其选择控制器3对于第二门电路的预设控制策略;
预设控制策略包括第二预设子策略以及第三预设子策略,还包括第一预设子策略或第四预设子策略:
第一预设子策略为:在未接收到第一电平时,控制器3控制第二门电路模块5仅将第一门电路模块1输出的第一电平传输至CPU 4,在接收到第一电平时,将CPU 4的运行功率限制在所有PSU的当前功率供应值与散热器2当前功率值的差值以内;
第二预设子策略为:在未接收到第一电平时,控制器3控制第二门电路模块5仅将第一门电路模块1输出的第一电平传输至散热器2,在接收到第一电平时,获取所有PSU的当前功率供应值,将CPU 4的运行功率限制在当前功率供应值与散热器2运行在低功耗模式之前的原有功率值的差值以内,并恢复散热器2的原有功率值;
第三预设子策略为:在未接收到第一电平时,控制器3控制第二门电路模块5仅将第一门电路模块1输出的第一电平传输至散热器2,在接收到第一电平时,获取所有PSU的当前功率供应值,判断散热器2进入低功耗模式释放的功率值是否小于PSU即将损失的功率值;若小于,则控制CPU 4进入低功耗模式,将CPU 4的运行功率限制在当前功率供应值与散热器2的原有功率值的差值以内,并恢复散热器2的原有功率值;若不小于,则将CPU 4的运行功率限制在当前功率供应值与散热器2的原有功率值的差值以内并恢复散热器2的原有功率值;
第四控制子策略为:在未接收到第一电平时,控制器3控制第二门电路模块5将第一门电路模块1输出的第一电平传输至散热器2以及CPU 4,在接收到第一电平时,获取所有PSU的当前功率供应值,将CPU 4的运行功率限制在当前功率供应值与散热器2的原有功率值的差值以内,并恢复散热器2的原有功率值;
其中,在任一预设子策略中,每当对CPU 4的运行功率进行控制之后,控制器3还用于通过第二门电路模块5控制散热器2以及CPU 4仅能接收到高电平,在所有的PSU恢复正常后恢复原有的控制子策略。
具体的,考虑到用户可能需要针对不同的服务器应用场景主动地进行供电保护策略的控制,以便得到更好地体验,本发明实施例中设置了与控制器3连接的配置终端6,并配置了四种预设子策略,其中第二预设子策略以及第三预设子策略在上文中已经介绍,本发明实施例在此不再赘述,第一预设子策略与背景技术中的供电保护策略类似,本发明实施例在此不再赘述。
具体的,对于第四预设子策略,考虑到某些服务器的应用场景下业务量较少或者宕机产生的损失较小,在此种情况下可以通过第二门电路模块5直接将第一电平传输至散热器2与CPU 4,直接控制二者进入低功耗模式,大幅度地降低功耗以确保服务器不会宕机,在两者均进入低功耗模式之后再对CPU 4的功率进行调整并恢复散热器2的原有功率值。
具体的,配置终端6可以为多种类型,例如可以为HMI(Human Machine Interface,人机界面)或者手机等,本发明实施例在此不做限定。
为了更好地对本发明实施例进行说明,请参考图3以及图4,图3为本发明提供的再一种供电保护系统的结构示意图,图4为本发明提供的又一种供电保护系统的结构示意图,作为一种优选的实施例,第一门电路模块1包括第二与门以及与PSU一一对应的第一与门;
各个第一与门的输入端分别与对应的PSU的状态IO接口连接,各个第一与门的输出端均连接至第二与门的输入端,第二与门的输出端与第二门电路模块5的输入端连接;
则第一电平为低电平。
具体的,由第二与门以及第一与门构成的第一门电路模块1结构简单、成本较低且寿命较长。
当然,除了上述结构外,第一门电路模块1还可以为其他具体结构,本发明实施例在此不做限定。
作为一种优选的实施例,第二门电路模块5包括第二或门以及第三或门;
第二或门的第一输入端与第二与门的输出端以及控制器3连接,第二或门的第二输入端与控制器3连接,第二或门的输出端与CPU 4连接,第三或门的第一输入端与第二与门的输出端连接,第三或门的第二输入端与控制器3连接,第三或门的输出端与散热器2连接;
控制第二门电路模块5仅将第一门电路模块1输出的第一电平传输至CPU 4具体为:
持续向第二或门的第二输入端发送低电平,持续向第三或门的第二输入端发送高电平;
控制第二门电路模块5仅将第一门电路模块1输出的第一电平传输至散热器2具体为:
向第二或门的第二输入端发送高电平,向第三或门的第二输入端发送低电平;
控制CPU 4进入低功耗模式具体为:
向第二或门的第二输入单发送低电平;
控制第二门电路模块5将第一门电路模块1输出的第一电平传输至散热器2以及CPU 4具体为:
向第二或门的第二输入端以及第三或门的第二输入端均发送低电平;
通过第二门电路模块5控制散热器2以及CPU 4仅能接收到高电平具体为:
向第二或门以及第三或门均发送高电平。
具体的,本发明实施例中的第二门电路模块5的结构简单且成本较低,而且控制器3还可以通过向第二或门以及第三或门发送不同的高低电平来方便地实现供电保护功能的策略控制。
当然,除了上述形式外,第二门电路模块5还可以为其他具体形式,本发明实施例在此不做限定。
作为一种优选的实施例,第二门电路模块5还包括第一或门;
第二与门的输出端与第一或门的第一输入端连接,第一或门的第二输入端连接至控制器3的控制信号输出端,第一或门的输出端分别与第二或门以及第三或门的输入端连接;
则向第二或门以及第三或门均发送高电平具体为:
通过向第一或门的第二输入端发送高电平以保证第二或门以及第三或门接收到高电平。
具体的,控制器3在想要关闭供电保护功能(即使第二与门输出低电平,CPU 4以及散热器2也仅会接收到高电平)时,可以通过向第一或门发送高电平而简单快捷地关闭供电保护功能,提高了工作效率。
具体的,恢复散热器2的原有功率值具体为:
向第三或门的第二输入端发送高电平,以便散热器2恢复原有功率值。
具体的,散热器2本身具有控制机制,控制第三或门停止将低电平即可使得散热器2恢复原有功率值,当第三或门的某个输入端为高电平时,其不会输出低电平。
具体的,本发明实施例中可以简单快捷地恢复散热器2的原有功率值。
当然,除了上述方法外,还可以采用其他的方式恢复散热器2原有功率值,本发明实施例在此不做限定。
作为一种优选的实施例,状态IO接口包括在位信号接口以及故障信号接口;
则第一门电路模块1还包括与PSU一一对应的非门;
在位信号接口通过非门与对应的第一与门的输入端连接,故障信号接口直接与对应的第一与门的输入端连接。
考虑到在位信号在PSU供电正常的情况下为低电平,因此为了能够顺利地实现第一门电路模块1的功能,则应该在在位信号接口上加一个非门来翻转其电平状态,如此一来便能够顺利实现第一门电路模块1的功能。
具体的,针对PSU被意外拔出的场景,由于PSU金手指长短不同,在位信号的金手指最短,利用PSU在位信号先于主电源供电断开的情况,引入在位信号的变化到控制电路中,当其发生变化时,可以更早的通知系统处理,争取更多的调整时间,减少掉电宕机风险。
具体的,故障信号接口可以包括PSU_ALERT信号接口以及PSU_POK信号接口。
具体的,PSU_ALERT信号在正常状态下是高电平,当PSU出现如过温保护、过流保护、输入异常、电源工作异常等异常时,PSU会触发该信号,该信号电平变为低电平,PSU_POK信号在PSU正常状态下是高电平,当PSU主输出电压出现异常跌落时,PSU会触发该信号,该信号电平变为低电平。
具体的,当控制器3接收到第一电平时,控制器3首先可以判定在位信号PSU_PRESENT是否正常,如果正常则立刻通过PMbus确定出出现异常的PSU以及出现何种异常,并计算出所有PSU的当前功率供应值;如果不正常则确定出在位信号异常的PSU,并计算PSU供电即将损失的功耗以及当前功率供应值。
具体的,获取所有PSU的当前功率供应值具体可以为,控制器3通过PMBUS总线与各个PSU进行信息交互来获取PSU的运行状态、最大功耗,当前功耗等等参数(控制器3也可以通过PMBUS总线对PSU进行参数配置和状态控制等操作);或者通过监测各个PSU的状态IO接口的电平状态,并结合自身预存的各个PSU的参数计算得到所有PSU的当前功率供应值,例如结合PSU_PRESENT和PSU_POK信号,这样控制器3可以在时钟周期内直接判定出,哪个PSU的哪个信号异常,无需再通过PMBUS查询,缩短判定时间,加速后续处理争取更多宝贵时间,避免系统宕机,本发明实施例在此不做限定。
具体的,当控制器3接收到第一电平时,控制器3首先可以判定在位信号PSU_PRESENT是否正常,如果正常则立刻通过PMbus确定出出现异常的PSU以及出现何种异常,并计算出所有PSU的当前功率供应值;如果不正常则确定出在位信号异常的PSU,并计算PSU供电即将损失的功耗以及当前功率供应值。
具体的,本发明实施例中还可以设置与控制器3连接的提示器7,控制器3在接收到第一电平后可以控制提示器7进行报警,同时还可以通过与PSU连接的状态IO接口或者总线来确定出故障PSU以及故障PSU所存在的问题,并通过提示器7将故障PSU所存在的问题提示出来,以便工作人员尽快检修。
其中,提示器7可以为多种类型,例如可以为显示器,也可以为远程网络终端例如手机或者笔记本电脑等,本发明实施例在此不做限定。
当然,除了上述两个信号接口外,故障信号接口还可以为其他多种类型,本发明实施例在此不做限定。
作为一种优选的实施例,第一门电路模块1还包括与PSU一一对应的第四或门;
则每个非门的输出端与对应的第四或门的第一输入端连接,每个第四或门的第二输入端与控制器3连接,每个或门的输出端与对应的第一与门的输入端连接;
则控制器3还用于通过其向指定的PSU对应的第四或门的第二输入端发送高电平,以避免指定的PSU的在位信号拉低第一与门输出的电平。
具体的,考虑到某些PSU可能长期没有插入服务器,例如在3+2冗余的PSU结构中,某个备用PSU由于故障被拔出,并且一直没有插入服务器,此时该PSU对应的在位信号必然是异常的,但是此种情况下不能够让该异常的在位信号触发散热器2和/或CPU 4进入低功耗模式,那样会对服务器业务产生影响,因此本发明实施例中设置了第四或门,工作人员只要通过控制器3向在位信号持续异常(工作人员了解情况的持续异常)的第四或门发送高电平,那么第四或门便不会向后端发送低电平,CPU 4以及散热器2便均不会接收到由该在位信号异常的PSU触发生成的低电平,保障了此种特殊情况下的服务器的正常使用。
本发明还提供了一种服务器,包括如前述实施例中的供电保护系统。
对于本发明实施例提供的服务器的介绍请参照前述的供电保护系统的实施例,本发明实施例在此不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种供电保护系统,其特征在于,包括:
与各个电源供电单元PSU的状态IO接口连接的第一门电路模块,用于在任一所述状态IO接口的电平状态异常时输出第一电平;
与所述第一门电路模块连接的散热器,用于在接收到所述第一电平时以低功耗模式运行;
与所述第一门电路模块连接的控制器,用于在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内,并恢复所述散热器的所述原有功率值。
2.根据权利要求1所述的供电保护系统,其特征在于,所述获取所有所述PSU的当前功率供应值之后,所述将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内之前,所述控制器还用于:
判断所述散热器进入所述低功耗模式释放的功率值是否小于所述PSU即将损失的功率值;
若小于,则控制所述CPU进入低功耗模式运行,并执行将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内的步骤;
若不小于,则执行将CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内的步骤;
则该供电保护系统还包括所述CPU。
3.根据权利要求2所述的供电保护系统,其特征在于,该供电保护系统还包括第二门电路模块;
所述第二门电路模块的输入端与所述第一门电路模块的输出端连接,所述第二门电路模块的输出端分别与所述散热器以及所述CPU连接;
所述第二门电路模块,用于将所述第一电平传输至所述散热器;
则所述控制所述CPU进入低功耗模式运行具体为:
控制所述第二门电路模块接通所述第二与门与所述CPU之间的低电平的信号通路,以便所述CPU响应于所述低电平工作在低功耗模式;
所述控制器还用于在所述CPU的总功率不大于预设阈值时,通过所述第二门电路模块控制所述散热器以及所述CPU仅能接收到高电平,以便关闭供电保护功能。
4.根据权利要求3所述的供电保护系统,其特征在于,该供电保护系统还包括:
与所述控制器连接的配置终端,用于通过其选择所述控制器对于所述第二门电路的预设控制策略;
所述预设控制策略包括第二预设子策略以及第三预设子策略,还包括第一预设子策略或第四预设子策略:
所述第一预设子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述CPU,在接收到所述第一电平时,将CPU的运行功率限制在所有所述PSU的当前功率供应值与所述散热器当前功率值的差值以内;
所述第二预设子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述散热器,在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,将所述CPU的运行功率限制在所述当前功率供应值与所述散热器运行在低功耗模式之前的原有功率值的差值以内,并恢复所述散热器的所述原有功率值;
所述第三预设子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述散热器,在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,判断所述散热器进入所述低功耗模式释放的功率值是否小于所述PSU即将损失的功率值;若小于,则控制所述CPU进入低功耗模式,将所述CPU的运行功率限制在所述当前功率供应值与所述散热器的原有功率值的差值以内,并恢复所述散热器的所述原有功率值;若不小于,则将所述CPU的运行功率限制在所述当前功率供应值与所述散热器的原有功率值的差值以内并恢复所述散热器的所述原有功率值;
所述第四控制子策略为:在未接收到所述第一电平时,所述控制器控制所述第二门电路模块将所述第一门电路模块输出的第一电平传输至所述散热器以及所述CPU,在接收到所述第一电平时,获取所有所述PSU的当前功率供应值,将所述CPU的运行功率限制在所述当前功率供应值与所述散热器的原有功率值的差值以内,并恢复所述散热器的所述原有功率值;
其中,在任一预设子策略中,每当对所述CPU的运行功率进行控制之后,控制器还用于通过所述第二门电路模块控制所述散热器以及所述CPU仅能接收到高电平,在所有的所述PSU恢复正常后恢复原有的控制子策略。
5.根据权利要求4所述的供电保护系统,其特征在于,所述第一门电路模块包括第二与门以及与所述PSU一一对应的第一与门;
各个所述第一与门的输入端分别与对应的所述PSU的所述状态IO接口连接,各个所述第一与门的输出端均连接至所述第二与门的输入端,所述第二与门的输出端与所述第二门电路模块的输入端连接;
则所述第一电平为低电平。
6.根据权利要求5所述的供电保护系统,其特征在于,所述第二门电路模块包括第二或门以及第三或门;
所述第二或门的第一输入端与所述第二与门的输出端以及所述控制器连接,所述第二或门的第二输入端与所述控制器连接,所述第二或门的输出端与所述CPU连接,所述第三或门的第一输入端与所述第二与门的输出端连接,所述第三或门的第二输入端与所述控制器连接,所述第三或门的输出端与所述散热器连接;
所述控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述CPU具体为:
持续向所述第二或门的第二输入端发送低电平,持续向所述第三或门的第二输入端发送高电平;
所述控制所述第二门电路模块仅将所述第一门电路模块输出的所述第一电平传输至所述散热器具体为:
向所述第二或门的第二输入端发送高电平,向所述第三或门的第二输入端发送低电平;
所述控制所述CPU进入低功耗模式具体为:
向所述第二或门的第二输入单发送低电平;
所述控制所述第二门电路模块将所述第一门电路模块输出的第一电平传输至所述散热器以及所述CPU具体为:
向所述第二或门的第二输入端以及所述第三或门的第二输入端均发送低电平;
所述通过所述第二门电路模块控制所述散热器以及所述CPU仅能接收到高电平具体为:
向所述第二或门以及所述第三或门均发送高电平。
7.根据权利要求6所述的供电保护系统,其特征在于,所述第二门电路模块还包括第一或门;
所述第二与门的输出端与所述第一或门的第一输入端连接,所述第一或门的第二输入端连接至所述控制器的控制信号输出端,所述第一或门的输出端分别与所述第二或门以及所述第三或门的输入端连接;
则所述向所述第二或门以及所述第三或门均发送高电平具体为:
通过向所述第一或门的第二输入端发送高电平以保证所述第二或门以及所述第三或门接收到高电平。
8.根据权利要求1至7任一项所述的供电保护系统,其特征在于,所述状态IO接口包括在位信号接口以及故障信号接口;
则所述第一门电路模块还包括与所述PSU一一对应的非门;
所述在位信号接口通过所述非门与对应的所述第一与门的输入端连接,所述故障信号接口直接与对应的所述第一与门的输入端连接。
9.根据权利要求8所述的供电保护系统,其特征在于,所述第一门电路模块还包括与所述PSU一一对应的第四或门;
则每个所述非门的输出端与对应的所述第四或门的第一输入端连接,每个所述第四或门的第二输入端与所述控制器连接,每个所述或门的输出端与对应的所述第一与门的输入端连接;
则所述控制器还用于通过其向指定的PSU对应的第四或门的第二输入端发送高电平,以避免指定的所述PSU的在位信号拉低所述第一与门输出的电平。
10.一种服务器,其特征在于,包括如权利要求1至9任一项所述的供电保护系统。
CN202010233946.8A 2020-03-27 2020-03-27 一种服务器及其供电保护系统 Active CN111475293B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010233946.8A CN111475293B (zh) 2020-03-27 2020-03-27 一种服务器及其供电保护系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010233946.8A CN111475293B (zh) 2020-03-27 2020-03-27 一种服务器及其供电保护系统

Publications (2)

Publication Number Publication Date
CN111475293A true CN111475293A (zh) 2020-07-31
CN111475293B CN111475293B (zh) 2023-01-10

Family

ID=71749385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010233946.8A Active CN111475293B (zh) 2020-03-27 2020-03-27 一种服务器及其供电保护系统

Country Status (1)

Country Link
CN (1) CN111475293B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377700A (zh) * 2021-05-24 2021-09-10 珠海格力电器股份有限公司 一种通信电路的通信控制装置、方法和多联机系统
WO2022088800A1 (zh) * 2020-10-29 2022-05-05 苏州浪潮智能科技有限公司 一种服务器的电源控制方法、系统及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122035A (zh) * 2017-05-27 2017-09-01 郑州云海信息技术有限公司 一种电源管理方法、装置及系统
CN107831883A (zh) * 2017-11-24 2018-03-23 郑州云海信息技术有限公司 一种gpu服务器电源异常保护系统及方法
CN110147155A (zh) * 2019-05-21 2019-08-20 苏州浪潮智能科技有限公司 基于bmc的服务器电源冷冗余控制方法、装置及bmc

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122035A (zh) * 2017-05-27 2017-09-01 郑州云海信息技术有限公司 一种电源管理方法、装置及系统
CN107831883A (zh) * 2017-11-24 2018-03-23 郑州云海信息技术有限公司 一种gpu服务器电源异常保护系统及方法
CN110147155A (zh) * 2019-05-21 2019-08-20 苏州浪潮智能科技有限公司 基于bmc的服务器电源冷冗余控制方法、装置及bmc

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022088800A1 (zh) * 2020-10-29 2022-05-05 苏州浪潮智能科技有限公司 一种服务器的电源控制方法、系统及装置
CN113377700A (zh) * 2021-05-24 2021-09-10 珠海格力电器股份有限公司 一种通信电路的通信控制装置、方法和多联机系统

Also Published As

Publication number Publication date
CN111475293B (zh) 2023-01-10

Similar Documents

Publication Publication Date Title
CN111475288A (zh) 一种服务器及其供电保护系统
JP5901241B2 (ja) Usbハブ装置及びそれを用いたシステム
CN100419699C (zh) 一种通过网络远程自动恢复cmos数据的方法和装置
CN111475009B (zh) 一种服务器内gpu的降功耗电路及服务器
CN111475293B (zh) 一种服务器及其供电保护系统
US20110145620A1 (en) Method of using power supply to perform far-end monitoring of electronic system
CN109871692B (zh) 过温掉电保护方法、逻辑装置、业务板及网络系统
CN112389352A (zh) 一种整车静态电流管理系统及方法
CN111309132B (zh) 一种服务器多档位电源冗余的方法
CN109917895B (zh) 一种电压调节模块vrm的控制装置及控制方法
CN116823587A (zh) 一种图形处理器控制方法、装置、电子设备及存储介质
CN115904050A (zh) 一种防止服务器掉电关机的电源控制系统及方法
JP2603805Y2 (ja) 複数の機能要素を有するシステムのための監視回路
CN114415813B (zh) 一种存储阵列的供电方法、装置及服务器
CN114509981B (zh) 控制器硬件冗余控制方法及系统
CN114138567A (zh) 一种基板管理控制模块维护方法、装置、设备及存储介质
CN1323480C (zh) Ups备援系统及方法
CN114610562A (zh) 服务器功耗管控方法、系统、终端及存储介质
CN103151765A (zh) 自适应零时差过电流保护方法
CN113162015A (zh) 一种主板电源异常定位保护方法及装置
JPH06161610A (ja) コンピュータ設備
CN111834983B (zh) 一种soc芯片io控制防止误触发的电路、方法及装置
CN115277485B (zh) 一种网络数据的控制方法、装置及电子设备
CN218771407U (zh) 网通产品断电保护系统
CN115549286B (zh) 一种服务器供电方法、系统、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant