CN109885151A - 一种服务器电源监控方法及系统 - Google Patents
一种服务器电源监控方法及系统 Download PDFInfo
- Publication number
- CN109885151A CN109885151A CN201910100662.9A CN201910100662A CN109885151A CN 109885151 A CN109885151 A CN 109885151A CN 201910100662 A CN201910100662 A CN 201910100662A CN 109885151 A CN109885151 A CN 109885151A
- Authority
- CN
- China
- Prior art keywords
- bmc
- signal
- starting
- mainboard
- cpld
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Power Sources (AREA)
Abstract
本发明公开了一种服务器电源监控方法,包括以下步骤:服务器发出主板开机信号;将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。本发明使用CPLD程序设计,利用硬件描述语言来实现开机信号的控制和处理,主板开机信号给到BMC之前先进入CPLD内部进行延时处理,延时处理之后输出给BMC芯片,在延时时间内ME得以正常工作,BMC收到开机信号后去监控主板信息时,BMC和ME之间可以正常的通信,避免BMC获取ME中的电源功耗信息时产生误报警。
Description
技术领域
本发明涉及一种服务器电源监控方法及系统。
背景技术
随着大数据、云计算、人工智能时代的到来,互联网业务量出现猛烈增长,计算量及计算频率随之增大;在服务器系统中,业务计算量的增加,使得服务器的运载压力变大,服务器的整体功耗增大,数据中心服务器的数量也随之不断增加;数据中心中每一个机架位置总的功耗是一定的,超出总的功耗限制,就会触发保护,而总的功耗也决定了一个机架位置所能放置服务器的数量,对每一台服务器而言,服务器的整体功耗信息是被实时监控的。这就对于主板上的电源管理提出了更高的要求。
服务器系统中,我们采用PSU模块(电源供应单元:Power Supply Unit)给服务器供电,通常情况下一个PSU模块就可以满足一台机架式服务器的供电需求,但当前设计都是使用两个PSU模块做冗余设计,当其中一个PSU模块出现不可预知的故障时,另外一个PSU模块能够继续保障服务器的正常运转。在PSU模块的功耗监控过程中,首先ME(ManagementEngine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过另外一路I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗,在此过程中ME起到桥接的作用。当服务器处于S5状态时(服务器主板状态之一,S5代表主板AC已经上电但是没有开机),ME是不能正常工作的,当服务器进入S0状态后(服务器主板状态之一,S0代表主板已经开机)ME才开始正常工作,当服务器从S5状态进入S0状态时,主板开机信号会同时给到BMC和南桥,BMC收到此信号之后就会去监控主板信息,南桥收到此信号之后会控制服务器开机;在此过程中,会概率性的存在BMC扫描监控主板信息时ME还没有正常工作的情形,导致BMC和ME之间无法通信,BMC侦测到无法通信之后就会产生报警记录,然而这种报警不是真正的故障,会给客户及运维人员带来很大的困扰。
发明内容
本发明要解决的技术问题是提出一种服务器电源监控方法及系统,将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,设计一个时间差,来避免BMC获取ME中的电源功耗信息时产生误报警,解决现有技术问题。
本发明一发面提供了一种服务器电源监控方法,包括以下步骤:
服务器发出主板开机信号;
将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。
南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。
进一步地,所述将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理具体包括:
将主板开机信号连接至CPLD的输入管脚;
CPLD对主板开机信号进行延时处理;
延时处理后的开机信号输入到BMC芯片。
进一步地,CPLD对主板开机信号进行延时处理具体包括:
在CPLD内部设计一个延时器;
将输入的主板开机信号嵌套在延时器中,并将延时后的信号输出至CPLD的输出管脚。
进一步地,所述延时器为一个2s的延时器。
本发明另一方面还提供了一种服务器电源监控系统,包括南桥芯片,南桥芯片的ME通过SMBUS总线读取PSU的功耗信息;
BMC,BMC通过I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗;
CPLD,主板开机信号在输入到BMC芯片之前先输入到CPLD内部,通过CPLD内部程序对信号进行延时处理,处理完成的信号输出给到BMC芯片,这样就实现了开机信号到南桥和BMC的异步处理。
进一步地,CPLD内设有延时器,将输入的主板开机信号嵌套在延时器中。
本发明使用CPLD程序设计,利用硬件描述语言来实现开机信号的控制和处理,主板开机信号给到BMC之前先进入CPLD内部进行延时处理,延时处理之后输出给BMC芯片,在延时时间内ME得以正常工作,BMC收到开机信号后去监控主板信息时,BMC和ME之间可以正常的通信,避免BMC获取ME中的电源功耗信息时产生误报警。这种设计方法可以最大程度上利用已有的芯片,节约成本;同时,使用这种设计方法,可以大大的提高产品的竞争力和客户满意度。
附图说明
图1是服务器电源监控方法的流程图;
图2是服务器电源监控系统的结构图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
如图1所示,本发明一种服务器电源监控方法,包括以下步骤:
S1、服务器发出主板开机信号;
S2、将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。
S3、南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。
优选地,所述将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理具体包括:
将主板开机信号连接至CPLD的输入管脚;
在CPLD内部对主板开机信号通过硬件描述语言进行延时处理。
处理完成的信号通过CPLD的输出管脚传递到主板硬件线路,并输入到BMC芯片。
优选地,CPLD对主板开机信号进行延时处理具体包括:
在CPLD内部设计一个延时器;
将输入的主板开机信号嵌套在延时器中,并将延时后的信号输出至CPLD的输出管脚。
优选地,所述延时器为一个2s的延时器。
如图2所示,本发明还提供了一种服务器电源监控系统,包括南桥芯片,南桥芯片的ME通过SMBUS总线读取PSU的功耗信息;
BMC,BMC通过I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗;
CPLD,主板开机信号在输入到BMC芯片之前先输入到CPLD内部,通过CPLD内部程序对信号进行延时处理,处理完成的信号输出给到BMC芯片,这样就实现了开机信号到南桥和BMC的异步处理。
优选地,CPLD内设有延时器,将输入的主板开机信号嵌套在延时器中。
本发明采用CPLD程序设计的方式来防止服务器电源误告警问题的发生。通过将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,ME处于正常工作状态,避免了通信未正常建立导致的误告警现象,提高了产品的可靠性和客户满意度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
Claims (6)
1.一种服务器电源监控方法,其特征在于,包括以下步骤:
服务器发出主板开机信号;
将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。
南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。
2.如权利要求1所述的一种服务器电源监控方法,其特征在于,所述将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理具体包括:
将主板开机信号连接至CPLD的输入管脚;
CPLD对主板开机信号进行延时处理;
延时处理后的开机信号输入到BMC芯片。
3.如权利要求2所述的一种服务器电源监控方法,其特征在于,CPLD对主板开机信号进行延时处理具体包括:
在CPLD内部设计一个延时器;
将输入的主板开机信号嵌套在延时器中,并将延时后的信号输出至CPLD的输出管脚。
4.如权利要求3所述的一种服务器电源监控方法,其特征在于:所述延时器为一个2s的延时器。
5.一种服务器电源监控系统,用于实现权力要求1所述的服务器电源监控方法,其特征在于,包括:
南桥芯片,南桥芯片的ME通过SMBUS总线读取PSU的功耗信息;
BMC,BMC通过I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗;
CPLD,主板开机信号在输入到BMC芯片之前先输入到CPLD内部,通过CPLD内部程序对信号进行延时处理,处理完成的信号输出给到BMC芯片,这样就实现了开机信号到南桥和BMC的异步处理。
6.如权利要求5所述的服务器电源监控系统,其特征在于:CPLD内设有延时器,将输入的主板开机信号嵌套在延时器中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910100662.9A CN109885151A (zh) | 2019-01-31 | 2019-01-31 | 一种服务器电源监控方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910100662.9A CN109885151A (zh) | 2019-01-31 | 2019-01-31 | 一种服务器电源监控方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109885151A true CN109885151A (zh) | 2019-06-14 |
Family
ID=66927766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910100662.9A Pending CN109885151A (zh) | 2019-01-31 | 2019-01-31 | 一种服务器电源监控方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109885151A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110618742A (zh) * | 2019-08-20 | 2019-12-27 | 苏州浪潮智能科技有限公司 | 一种pdb板及其工作方法 |
CN111475011A (zh) * | 2020-03-08 | 2020-07-31 | 苏州浪潮智能科技有限公司 | 一种服务器n+1冗余电源功率控制系统及方法 |
CN111488050A (zh) * | 2020-04-16 | 2020-08-04 | 苏州浪潮智能科技有限公司 | 一种电源监控方法、系统及服务器 |
CN111752366A (zh) * | 2020-05-29 | 2020-10-09 | 苏州浪潮智能科技有限公司 | 一种psu异常掉电处理系统、方法及装置 |
CN112269466A (zh) * | 2020-10-16 | 2021-01-26 | 苏州浪潮智能科技有限公司 | 一种功率芯片的供电方法及服务器主板 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446146A (zh) * | 2010-10-13 | 2012-05-09 | 鸿富锦精密工业(深圳)有限公司 | 服务器及其避免总线冲突的方法 |
CN104571444A (zh) * | 2015-02-03 | 2015-04-29 | 浪潮电子信息产业股份有限公司 | 一种bios控制服务器电源状态的方法 |
CN105653376A (zh) * | 2016-01-05 | 2016-06-08 | 浪潮电子信息产业股份有限公司 | Arm平台中bios与bmc同时启动时保证信息同步的优化算法 |
TW201837705A (zh) * | 2017-03-31 | 2018-10-16 | 神雲科技股份有限公司 | 管理引擎的韌體更新方法 |
US20180300273A1 (en) * | 2017-04-13 | 2018-10-18 | Dell Products, Lp | System and Method for Arbitration and Recovery of SPD Interfaces in an Information Handling System |
CN109271273A (zh) * | 2018-10-15 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种通讯异常恢复的方法、异常恢复设备及存储介质 |
-
2019
- 2019-01-31 CN CN201910100662.9A patent/CN109885151A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446146A (zh) * | 2010-10-13 | 2012-05-09 | 鸿富锦精密工业(深圳)有限公司 | 服务器及其避免总线冲突的方法 |
CN104571444A (zh) * | 2015-02-03 | 2015-04-29 | 浪潮电子信息产业股份有限公司 | 一种bios控制服务器电源状态的方法 |
CN105653376A (zh) * | 2016-01-05 | 2016-06-08 | 浪潮电子信息产业股份有限公司 | Arm平台中bios与bmc同时启动时保证信息同步的优化算法 |
TW201837705A (zh) * | 2017-03-31 | 2018-10-16 | 神雲科技股份有限公司 | 管理引擎的韌體更新方法 |
US20180300273A1 (en) * | 2017-04-13 | 2018-10-18 | Dell Products, Lp | System and Method for Arbitration and Recovery of SPD Interfaces in an Information Handling System |
CN109271273A (zh) * | 2018-10-15 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种通讯异常恢复的方法、异常恢复设备及存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110618742A (zh) * | 2019-08-20 | 2019-12-27 | 苏州浪潮智能科技有限公司 | 一种pdb板及其工作方法 |
CN111475011A (zh) * | 2020-03-08 | 2020-07-31 | 苏州浪潮智能科技有限公司 | 一种服务器n+1冗余电源功率控制系统及方法 |
CN111488050A (zh) * | 2020-04-16 | 2020-08-04 | 苏州浪潮智能科技有限公司 | 一种电源监控方法、系统及服务器 |
CN111752366A (zh) * | 2020-05-29 | 2020-10-09 | 苏州浪潮智能科技有限公司 | 一种psu异常掉电处理系统、方法及装置 |
CN111752366B (zh) * | 2020-05-29 | 2022-04-26 | 苏州浪潮智能科技有限公司 | 一种psu异常掉电处理系统、方法及装置 |
CN112269466A (zh) * | 2020-10-16 | 2021-01-26 | 苏州浪潮智能科技有限公司 | 一种功率芯片的供电方法及服务器主板 |
CN112269466B (zh) * | 2020-10-16 | 2022-07-08 | 苏州浪潮智能科技有限公司 | 一种功率芯片的供电方法及服务器主板 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885151A (zh) | 一种服务器电源监控方法及系统 | |
TWI618380B (zh) | 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體 | |
US9098257B2 (en) | Information handling system server architecture for improved management communication | |
CN110109782B (zh) | 一种故障PCIe设备的更换方法、装置及系统 | |
CN102622279A (zh) | 冗余控制系统、方法及管理控制器 | |
CN215835412U (zh) | 车载安全计算机平台通信装置 | |
CN110427283B (zh) | 一种双余度的燃油管理计算机系统 | |
CN111367392B (zh) | 一种动态电源管理系统 | |
CN210129215U (zh) | 一种双余度机电管理计算机架构 | |
CN101719089A (zh) | 分布式集群的远程管理方法及系统 | |
CN107179804A (zh) | 机柜装置 | |
CN113918383A (zh) | 核心板复位方法、装置、设备、存储介质以及程序产品 | |
CN110985426B (zh) | 一种PCIE Switch产品的风扇控制系统及方法 | |
US11308002B2 (en) | Systems and methods for detecting expected user intervention across multiple blades during a keyboard, video, and mouse (KVM) session | |
CN109684257B (zh) | 一种远程内存扩展管理系统 | |
CN103092735A (zh) | 节点状态更新方法 | |
CN105471652A (zh) | 大数据一体机及其冗余管理单元 | |
CN114116276A (zh) | Bmc挂死自恢复方法、系统、终端及存储介质 | |
CN113608970A (zh) | 核心板,服务器,故障修复方法、装置以及存储介质 | |
CN109976478B (zh) | 多cpu散热控制系统和散热控制方法 | |
CN108647124A (zh) | 一种存储跳变信号的方法及其装置 | |
CN100550771C (zh) | 实现远程加载单板固件的方法和系统 | |
US10719310B1 (en) | Systems and methods for reducing keyboard, video, and mouse (KVM) downtime during firmware update or failover events in a chassis with redundant enclosure controllers (ECs) | |
CN117111693A (zh) | 一种服务器机箱系统、服务器机箱系统设计方法及设备 | |
CN115509333A (zh) | 一种服务器协同上下电装置、方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190614 |
|
RJ01 | Rejection of invention patent application after publication |