CN115237684A - 一种多节点服务器的供电系统和数据中心 - Google Patents

一种多节点服务器的供电系统和数据中心 Download PDF

Info

Publication number
CN115237684A
CN115237684A CN202210898687.XA CN202210898687A CN115237684A CN 115237684 A CN115237684 A CN 115237684A CN 202210898687 A CN202210898687 A CN 202210898687A CN 115237684 A CN115237684 A CN 115237684A
Authority
CN
China
Prior art keywords
server
power
bbu
power supply
management module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210898687.XA
Other languages
English (en)
Inventor
张维民
李志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210898687.XA priority Critical patent/CN115237684A/zh
Publication of CN115237684A publication Critical patent/CN115237684A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明提供了一种多节点服务器的供电系统和数据中心,供电系统包括:铜排;第一供电单元,第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;第二供电单元,第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;管理模块,管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。通过使用本发明的方案,能够提高系统供电的可靠性,增加系统的稳定性,避免因供电问题造成的服务器宕机。

Description

一种多节点服务器的供电系统和数据中心
技术领域
本发明涉及计算机领域,并且更具体地涉及一种多节点服务器的供电系统和数据中心。
背景技术
多节点服务器可以在固定高度内,容纳多台服务器,可以通过统一管理模块管理各节点或节点上的电源。当需求多种类型服务器的时候,可以使用多节点服务器,节点配置分别选择存储型、计算型、运算型等多种类型,适用多种应用场景。现有多节点服务器过采用电源位置集中,电源输出至系统背板,每个节点主板、风扇、其他部件再通过系统背板取电,系统背板是一张PCB板卡,对于电流较大的12V电压通常会在PCB板卡外接铜排,增加过流面积。
现有多节点服务器通常支持N+N冗余,服务器最大功率为N*电源最大输出功率,当N个电源接入线路1、另外N个电源接入线路2时,可以支持单条线路故障情况下,服务器供电正常,不会发生宕机情况。运维时,最多支持拔出N个电源模块。
发明内容
有鉴于此,本发明实施例的目的在于提出一种多节点服务器的供电系统和数据中心,通过使用本发明的技术方案,能够提高系统供电的可靠性,增加系统的稳定性,避免因供电问题造成的服务器宕机。
基于上述目的,本发明的实施例的一个方面提供了一种多节点服务器的供电系统,包括:
铜排;
第一供电单元,第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;
第二供电单元,第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;
管理模块,管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。
根据本发明的一个实施例,PSU的总数量大于等于BBU的总数量。
根据本发明的一个实施例,每个服务器上设置有BMC,当BMC检测到服务器的电源模块输出从有变无时,控制服务器从铜排取电,同时向管理模块发送电源模块不在位的告警,管理模块将告警展示给用户以提醒用户出现故障。
根据本发明的一个实施例,管理模块配置为实时监控每个PSU的在位情况,当检测到PSU不在位时,统计不在位的PSU的总数量,管理模块控制与总数量相同数量的BBU进行放电。
根据本发明的一个实施例,管理模块配置为实时监控每个BBU的电量,在需要BBU进行放电的情况下,管理模块控制电量高的BBU进行放电。
本发明的实施例的另一个方面,还提供了一种数据中心,数据中心包括多节点服务器的供电系统,多节点服务器的供电系统包括:
铜排;
第一供电单元,第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;
第二供电单元,第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;
管理模块,管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。
根据本发明的一个实施例,PSU的总数量大于等于BBU的总数量。
根据本发明的一个实施例,每个服务器上设置有BMC,当BMC检测到服务器的电源模块输出从有变无时,控制服务器从铜排取电,同时向管理模块发送电源模块不在位的告警,管理模块将告警展示给用户以提醒用户出现故障。
根据本发明的一个实施例,管理模块配置为实时监控每个PSU的在位情况,当检测到PSU不在位时,统计不在位的PSU的总数量,管理模块控制与总数量相同数量的BBU进行放电。
根据本发明的一个实施例,管理模块配置为实时监控每个BBU的电量,在需要BBU进行放电的情况下,管理模块控制电量高的BBU进行放电。
本发明具有以下有益技术效果:本发明实施例提供的多节点服务器的供电系统,通过设置铜排;第一供电单元,第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;第二供电单元,第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;管理模块,管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电的技术方案,能够提高系统供电的可靠性,增加系统的稳定性,避免因供电问题造成的服务器宕机。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为根据本发明一个实施例的多节点服务器的供电系统的示意图;
图2为根据本发明一个实施例的多节点服务器的供电系统通信的示意图。
具体实施方式
以下描述了本公开的实施例。然而,应该理解,所公开的实施例仅仅是示例,并且其他实施例可以采取各种替代形式。附图不一定按比例绘制;某些功能可能被夸大或最小化以显示特定部件的细节。因此,本文公开的具体结构和功能细节不应被解释为限制性的,而仅仅是作为用于教导本领域技术人员以各种方式使用本发明的代表性基础。如本领域普通技术人员将理解的,参考任何一个附图所示出和描述的各种特征可以与一个或多个其他附图中所示的特征组合以产生没有明确示出或描述的实施例。所示特征的组合为典型应用提供了代表性实施例。然而,与本公开的教导相一致的特征的各种组合和修改对于某些特定应用或实施方式可能是期望的。
基于上述目的,本发明的实施例的第一个方面,提出了一种多节点服务器的供电系统的一个实施例。图1示出的是该多节点服务器的供电系统的示意图。
如图1中所示,该多节点服务器的供电系统可以包括:
铜排;
第一供电单元,第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;
第二供电单元,第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;
管理模块,管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。多节点服务器中包含2N个节点(服务器),前N个节点中的每个节点有1个电源模块PSU(Power Supply Unit),其余N个节点中的每个节点有1个备用电池模块BBU(Battery Backup Unit),备用电池模块的最大输出功率与电源模块的最大输出功率相等,每个节点通过连接器与铜排Busbar相连接,每个电源模块和备用电池模块均支持热拔插功能,每个节点也支持热拔插功能。铜排电压为12V,为电源的主输出电压,也是系统内使用最多的电压等级。服务器内的其他部件,例如风扇(Fan)、管理模块(MC Management Center)也通过连接器从铜排取电,风扇和管理模块均使用12V电压。当所有节点上电源模块均上电时,电源模块的输出电能通过铜排,向风扇、管理模块及其他部件供电,同时可以通过铜排向BBU充电,直至充电结束。当某一节点上的电源模块上电源线拔出或电源拔出时,该节点可以立即从铜排取电,保证当前节点不掉电。这种情况下,其余N-1个电源模块向该节点供电。当拔出M个电源模块时,N-M个电源模块的输出功率不足以支持所有节点的功耗时,管理模块MC可以向其中X个BBU模块发出放电指令,此种情况下,节点由N-M个电源模块和X个BBU模块进行供电。X的数量由节点和风扇的总功耗决定,例如所有节点均处于最大负载工作状态、风扇也处于最大转速情况下,X=M;如果系统没有工作在最大压力上,X<M。当某一节点被拔出时,节点内BMC会控制该节点强制关机,以保证该节点的部件不因高温损坏。此种情况下,允许拔出的节点个数=(N*电源功率-风扇功率)/每个节点最大功耗。
通过本发明的技术方案,能够提高系统供电的可靠性,增加系统的稳定性,避免因供电问题造成的服务器宕机。
在本发明的一个优选实施例中,PSU的总数量大于等于BBU的总数量。
在本发明的一个优选实施例中,每个服务器上设置有BMC,当BMC检测到服务器的电源模块输出从有变无时,控制服务器从铜排取电,同时向管理模块发送电源模块不在位的告警,管理模块将告警展示给用户以提醒用户出现故障。如图2所示,管理模块MC可以通过PMbus与节点、风扇进行通讯,节点内BMC与PSU、BBU通过PMbus通讯。各模块之间进行信息传递及控制指令发布。节点BMC可以将PSU或BBU的工作状态、在位状态、BBU电量状态发送给MC,节点BMC可以将节点的工作状态、功率信息发送给MC,MC通过风扇地址位查询风扇的工作状态、在位状态、转速信息等。节点BMC可以控制节点的取电方式、控制节点开关机。当节点拔出时,可以将系统进行软关机,即保存重要数据后关机,当节点插入服务器中时,可以控制节点主板上电,可以确定从铜排取电或从电源模块取电,且处于待机状态,当开机键被按下时,节点软开机。当BMC检测到电源模块输出从有变无时,控制节点从铜排取电,同时向MC发送“电源模块不在位”的告警,MC将此告警展示给用户,提醒用户出现故障。MC通过风扇地址位查询风扇在位信息、风扇转速等。如果查询到风扇不在位时,则将告警信息展示给用户,提醒用户出现故障。MC可以通过节点BMC获取节点的功耗情况,当出现在位电源的数量减少时,可以向BBU发送指令,BBU模块开始放电,保证系统供电。
在本发明的一个优选实施例中,管理模块配置为实时监控每个PSU的在位情况,当检测到PSU不在位时,统计不在位的PSU的总数量,管理模块控制与总数量相同数量的BBU进行放电。
在本发明的一个优选实施例中,管理模块配置为实时监控每个BBU的电量,在需要BBU进行放电的情况下,管理模块控制电量高的BBU进行放电。
在本发明的一个优选实施例中,当电源模块和BBU模块总数为2N情况下,N个电源模块中,其中[N/2]([]表示向上取整)个电源模块由线路1供电,N-[N/2]个电源模块由线路2供电,N个BBU模块均保持满电状态。当线路1或线路2断电时,系统MC可以开启N个BBU模块中的Y个进行放电,可以保证服务器系统可以正常运行。当线路1和线路2同时断电时,N个BBU模块同时开始放电,可以满足系统的稳定运行。
在本发明的一个优选实施例中,系统包含2N个服务器,其中2X个电源模块,2Y个BBU,X+Y=N。X个电源模块由线路1供电,X个电源模块由线路2供电,当其中某一个线路断电时,系统可以支持的最大功率为(2Y+X)*P电源,即可以实现(2Y+X)*P电源功率的冗余,而2Y+X>N,也就是说,增加BBU的数量可以提高冗余的功率等级。这样可以将服务器的最大功耗设计为((2Y+X)*P电源-P风扇)/2N。
通过本发明的技术方案,能够提高系统供电的可靠性,增加系统的稳定性,避免因供电问题造成的服务器宕机。
基于上述目的,本发明的实施例的第二个方面,提出了一种数据中心,数据中心包括多节点服务器的供电系统,多节点服务器的供电系统包括:
铜排;
第一供电单元,第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;
第二供电单元,第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;
管理模块,管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。
在本发明的一个优选实施例中,PSU的总数量大于等于BBU的总数量。
在本发明的一个优选实施例中,每个服务器上设置有BMC,当BMC检测到服务器的电源模块输出从有变无时,控制服务器从铜排取电,同时向管理模块发送电源模块不在位的告警,管理模块将告警展示给用户以提醒用户出现故障。
在本发明的一个优选实施例中,管理模块配置为实时监控每个PSU的在位情况,当检测到PSU不在位时,统计不在位的PSU的总数量,管理模块控制与总数量相同数量的BBU进行放电。
在本发明的一个优选实施例中,管理模块配置为实时监控每个BBU的电量,在需要BBU进行放电的情况下,管理模块控制电量高的BBU进行放电。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
上述实施例,特别是任何“优选”实施例是实现的可能示例,并且仅为了清楚地理解本发明的原理而提出。可以在不脱离本文所描述的技术的精神和原理的情况下对上述实施例进行许多变化和修改。所有修改旨在被包括在本公开的范围内并且由所附权利要求保护。

Claims (10)

1.一种多节点服务器的供电系统,其特征在于,包括:
铜排;
第一供电单元,所述第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;
第二供电单元,所述第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;
管理模块,所述管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。
2.根据权利要求1所述的供电系统,其特征在于,PSU的总数量大于等于BBU的总数量。
3.根据权利要求1所述的供电系统,其特征在于,每个服务器上设置有BMC,当BMC检测到服务器的电源模块输出从有变无时,控制服务器从铜排取电,同时向管理模块发送电源模块不在位的告警,管理模块将告警展示给用户以提醒用户出现故障。
4.根据权利要求1所述的供电系统,其特征在于,管理模块配置为实时监控每个PSU的在位情况,当检测到PSU不在位时,统计不在位的PSU的总数量,管理模块控制与总数量相同数量的BBU进行放电。
5.根据权利要求1所述的供电系统,其特征在于,管理模块配置为实时监控每个BBU的电量,在需要BBU进行放电的情况下,管理模块控制电量高的BBU进行放电。
6.一种数据中心,其特征在于,所述数据中心包括多节点服务器的供电系统,多节点服务器的供电系统包括:
铜排;
第一供电单元,所述第一供电单元包括第一阈值数量的服务器,每个服务器上设置有PSU,每个PSU分别连接到铜排上以为铜排中的部件供电;
第二供电单元,所述第二供电单元包括第二阈值数量的服务器,每个服务器上设置有BBU,每个BBU分别连接到铜排上以对BBU进行充电;
管理模块,所述管理模块连接到铜排上,管理模块通过PMbus总线与各个服务器以及部件进行通信,管理模块根据服务器在位情况控制BBU进行放电。
7.根据权利要求6所述的数据中心,其特征在于,PSU的总数量大于等于BBU的总数量。
8.根据权利要求6所述的数据中心,其特征在于,每个服务器上设置有BMC,当BMC检测到服务器的电源模块输出从有变无时,控制服务器从铜排取电,同时向管理模块发送电源模块不在位的告警,管理模块将告警展示给用户以提醒用户出现故障。
9.根据权利要求6所述的数据中心,其特征在于,管理模块配置为实时监控每个PSU的在位情况,当检测到PSU不在位时,统计不在位的PSU的总数量,管理模块控制与总数量相同数量的BBU进行放电。
10.根据权利要求6所述的数据中心,其特征在于,管理模块配置为实时监控每个BBU的电量,在需要BBU进行放电的情况下,管理模块控制电量高的BBU进行放电。
CN202210898687.XA 2022-07-28 2022-07-28 一种多节点服务器的供电系统和数据中心 Pending CN115237684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210898687.XA CN115237684A (zh) 2022-07-28 2022-07-28 一种多节点服务器的供电系统和数据中心

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210898687.XA CN115237684A (zh) 2022-07-28 2022-07-28 一种多节点服务器的供电系统和数据中心

Publications (1)

Publication Number Publication Date
CN115237684A true CN115237684A (zh) 2022-10-25

Family

ID=83676446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210898687.XA Pending CN115237684A (zh) 2022-07-28 2022-07-28 一种多节点服务器的供电系统和数据中心

Country Status (1)

Country Link
CN (1) CN115237684A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115549286A (zh) * 2022-11-30 2022-12-30 苏州浪潮智能科技有限公司 一种服务器供电方法、系统、存储介质及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115549286A (zh) * 2022-11-30 2022-12-30 苏州浪潮智能科技有限公司 一种服务器供电方法、系统、存储介质及设备
CN115549286B (zh) * 2022-11-30 2024-02-27 苏州浪潮智能科技有限公司 一种服务器供电方法、系统、存储介质及设备

Similar Documents

Publication Publication Date Title
US5809311A (en) System and method for providing centralized backup power in a computer system
US8713332B2 (en) System and method of supplying an electrical system with direct current
CN103155350B (zh) 备用电源系统和方法
JP5317360B2 (ja) データ処理システムにおいてシステムの電力損失通知をしきい値処理するためのコンピュータ・プログラム、システム、および方法
CN106774771B (zh) 供电系统及其供电控制方法
CN104953694B (zh) 电源分配系统
CN102918747A (zh) 基于机架的无间断电源
CN111864885B (zh) 一种硬盘供电控制装置和方法
US11061454B2 (en) Power supply apparatus, backup power module and method for providing backup power in computing systems
US7272733B2 (en) Method of providing dynamic power redundancy based on a difference of current power units and currently needed power units
KR20150049572A (ko) 랙 마운트 서버의 전원을 공유하기 위한 시스템 및 그 운영 방법
CN105095142A (zh) 控制扩展卡的系统及方法
CN201036001Y (zh) 一种磁盘阵列装置
US20100100756A1 (en) Power Supply Wear Leveling in a Multiple-PSU Information Handling System
CN101593082A (zh) 一种管理存储设备电源电路的装置、方法和计算机
CN104808763A (zh) 一种机柜式服务器的供电方法及供电装置
US20100011229A1 (en) Methods of powering up a disk drive storage enclosure and storage enclosures
CN115237684A (zh) 一种多节点服务器的供电系统和数据中心
US10649515B2 (en) Power management of computing and communications systems during power fluctuation and sudden power failure events
CN111984471B (zh) 一种机柜电源bmc冗余管理系统及方法
US20210157387A1 (en) Method and apparatus for improving power management by controlling operations of an uninterruptible power supply in a data center
CN115291708A (zh) 一种掉电保护方法、装置及电子设备
CN201607685U (zh) 含备用电源的硬盘存储装置
CN117355812A (zh) 带有集成扩展坞的不间断电源
CN111381659B (zh) 计算机系统及电源管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination