CN109885151A - 一种服务器电源监控方法及系统 - Google Patents

一种服务器电源监控方法及系统 Download PDF

Info

Publication number
CN109885151A
CN109885151A CN201910100662.9A CN201910100662A CN109885151A CN 109885151 A CN109885151 A CN 109885151A CN 201910100662 A CN201910100662 A CN 201910100662A CN 109885151 A CN109885151 A CN 109885151A
Authority
CN
China
Prior art keywords
bmc
signal
starting
mainboard
cpld
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910100662.9A
Other languages
English (en)
Inventor
岳远斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201910100662.9A priority Critical patent/CN109885151A/zh
Publication of CN109885151A publication Critical patent/CN109885151A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Power Sources (AREA)

Abstract

本发明公开了一种服务器电源监控方法,包括以下步骤:服务器发出主板开机信号;将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。本发明使用CPLD程序设计,利用硬件描述语言来实现开机信号的控制和处理,主板开机信号给到BMC之前先进入CPLD内部进行延时处理,延时处理之后输出给BMC芯片,在延时时间内ME得以正常工作,BMC收到开机信号后去监控主板信息时,BMC和ME之间可以正常的通信,避免BMC获取ME中的电源功耗信息时产生误报警。

Description

一种服务器电源监控方法及系统
技术领域
本发明涉及一种服务器电源监控方法及系统。
背景技术
随着大数据、云计算、人工智能时代的到来,互联网业务量出现猛烈增长,计算量及计算频率随之增大;在服务器系统中,业务计算量的增加,使得服务器的运载压力变大,服务器的整体功耗增大,数据中心服务器的数量也随之不断增加;数据中心中每一个机架位置总的功耗是一定的,超出总的功耗限制,就会触发保护,而总的功耗也决定了一个机架位置所能放置服务器的数量,对每一台服务器而言,服务器的整体功耗信息是被实时监控的。这就对于主板上的电源管理提出了更高的要求。
服务器系统中,我们采用PSU模块(电源供应单元:Power Supply Unit)给服务器供电,通常情况下一个PSU模块就可以满足一台机架式服务器的供电需求,但当前设计都是使用两个PSU模块做冗余设计,当其中一个PSU模块出现不可预知的故障时,另外一个PSU模块能够继续保障服务器的正常运转。在PSU模块的功耗监控过程中,首先ME(ManagementEngine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过另外一路I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗,在此过程中ME起到桥接的作用。当服务器处于S5状态时(服务器主板状态之一,S5代表主板AC已经上电但是没有开机),ME是不能正常工作的,当服务器进入S0状态后(服务器主板状态之一,S0代表主板已经开机)ME才开始正常工作,当服务器从S5状态进入S0状态时,主板开机信号会同时给到BMC和南桥,BMC收到此信号之后就会去监控主板信息,南桥收到此信号之后会控制服务器开机;在此过程中,会概率性的存在BMC扫描监控主板信息时ME还没有正常工作的情形,导致BMC和ME之间无法通信,BMC侦测到无法通信之后就会产生报警记录,然而这种报警不是真正的故障,会给客户及运维人员带来很大的困扰。
发明内容
本发明要解决的技术问题是提出一种服务器电源监控方法及系统,将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,设计一个时间差,来避免BMC获取ME中的电源功耗信息时产生误报警,解决现有技术问题。
本发明一发面提供了一种服务器电源监控方法,包括以下步骤:
服务器发出主板开机信号;
将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。
南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。
进一步地,所述将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理具体包括:
将主板开机信号连接至CPLD的输入管脚;
CPLD对主板开机信号进行延时处理;
延时处理后的开机信号输入到BMC芯片。
进一步地,CPLD对主板开机信号进行延时处理具体包括:
在CPLD内部设计一个延时器;
将输入的主板开机信号嵌套在延时器中,并将延时后的信号输出至CPLD的输出管脚。
进一步地,所述延时器为一个2s的延时器。
本发明另一方面还提供了一种服务器电源监控系统,包括南桥芯片,南桥芯片的ME通过SMBUS总线读取PSU的功耗信息;
BMC,BMC通过I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗;
CPLD,主板开机信号在输入到BMC芯片之前先输入到CPLD内部,通过CPLD内部程序对信号进行延时处理,处理完成的信号输出给到BMC芯片,这样就实现了开机信号到南桥和BMC的异步处理。
进一步地,CPLD内设有延时器,将输入的主板开机信号嵌套在延时器中。
本发明使用CPLD程序设计,利用硬件描述语言来实现开机信号的控制和处理,主板开机信号给到BMC之前先进入CPLD内部进行延时处理,延时处理之后输出给BMC芯片,在延时时间内ME得以正常工作,BMC收到开机信号后去监控主板信息时,BMC和ME之间可以正常的通信,避免BMC获取ME中的电源功耗信息时产生误报警。这种设计方法可以最大程度上利用已有的芯片,节约成本;同时,使用这种设计方法,可以大大的提高产品的竞争力和客户满意度。
附图说明
图1是服务器电源监控方法的流程图;
图2是服务器电源监控系统的结构图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
如图1所示,本发明一种服务器电源监控方法,包括以下步骤:
S1、服务器发出主板开机信号;
S2、将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。
S3、南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。
优选地,所述将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理具体包括:
将主板开机信号连接至CPLD的输入管脚;
在CPLD内部对主板开机信号通过硬件描述语言进行延时处理。
处理完成的信号通过CPLD的输出管脚传递到主板硬件线路,并输入到BMC芯片。
优选地,CPLD对主板开机信号进行延时处理具体包括:
在CPLD内部设计一个延时器;
将输入的主板开机信号嵌套在延时器中,并将延时后的信号输出至CPLD的输出管脚。
优选地,所述延时器为一个2s的延时器。
如图2所示,本发明还提供了一种服务器电源监控系统,包括南桥芯片,南桥芯片的ME通过SMBUS总线读取PSU的功耗信息;
BMC,BMC通过I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗;
CPLD,主板开机信号在输入到BMC芯片之前先输入到CPLD内部,通过CPLD内部程序对信号进行延时处理,处理完成的信号输出给到BMC芯片,这样就实现了开机信号到南桥和BMC的异步处理。
优选地,CPLD内设有延时器,将输入的主板开机信号嵌套在延时器中。
本发明采用CPLD程序设计的方式来防止服务器电源误告警问题的发生。通过将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,ME处于正常工作状态,避免了通信未正常建立导致的误告警现象,提高了产品的可靠性和客户满意度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

Claims (6)

1.一种服务器电源监控方法,其特征在于,包括以下步骤:
服务器发出主板开机信号;
将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理,使得BMC开始监控主板信息的时候,南桥的ME处于正常工作状态,避免了通信未正常建立导致的误告警现象。
南桥芯片中的ME(Management Engine)通过SMBUS总线读取PSU的功耗信息,然后BMC通过I2C从ME内部读取PSU的功耗信息。
2.如权利要求1所述的一种服务器电源监控方法,其特征在于,所述将主板开机信号给到BMC芯片和给到南桥芯片的时间进行异步处理具体包括:
将主板开机信号连接至CPLD的输入管脚;
CPLD对主板开机信号进行延时处理;
延时处理后的开机信号输入到BMC芯片。
3.如权利要求2所述的一种服务器电源监控方法,其特征在于,CPLD对主板开机信号进行延时处理具体包括:
在CPLD内部设计一个延时器;
将输入的主板开机信号嵌套在延时器中,并将延时后的信号输出至CPLD的输出管脚。
4.如权利要求3所述的一种服务器电源监控方法,其特征在于:所述延时器为一个2s的延时器。
5.一种服务器电源监控系统,用于实现权力要求1所述的服务器电源监控方法,其特征在于,包括:
南桥芯片,南桥芯片的ME通过SMBUS总线读取PSU的功耗信息;
BMC,BMC通过I2C从ME内部读取PSU的信息,以保证实时监控服务器的供电及功耗;
CPLD,主板开机信号在输入到BMC芯片之前先输入到CPLD内部,通过CPLD内部程序对信号进行延时处理,处理完成的信号输出给到BMC芯片,这样就实现了开机信号到南桥和BMC的异步处理。
6.如权利要求5所述的服务器电源监控系统,其特征在于:CPLD内设有延时器,将输入的主板开机信号嵌套在延时器中。
CN201910100662.9A 2019-01-31 2019-01-31 一种服务器电源监控方法及系统 Pending CN109885151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910100662.9A CN109885151A (zh) 2019-01-31 2019-01-31 一种服务器电源监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910100662.9A CN109885151A (zh) 2019-01-31 2019-01-31 一种服务器电源监控方法及系统

Publications (1)

Publication Number Publication Date
CN109885151A true CN109885151A (zh) 2019-06-14

Family

ID=66927766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910100662.9A Pending CN109885151A (zh) 2019-01-31 2019-01-31 一种服务器电源监控方法及系统

Country Status (1)

Country Link
CN (1) CN109885151A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110618742A (zh) * 2019-08-20 2019-12-27 苏州浪潮智能科技有限公司 一种pdb板及其工作方法
CN111475011A (zh) * 2020-03-08 2020-07-31 苏州浪潮智能科技有限公司 一种服务器n+1冗余电源功率控制系统及方法
CN111488050A (zh) * 2020-04-16 2020-08-04 苏州浪潮智能科技有限公司 一种电源监控方法、系统及服务器
CN111752366A (zh) * 2020-05-29 2020-10-09 苏州浪潮智能科技有限公司 一种psu异常掉电处理系统、方法及装置
CN112269466A (zh) * 2020-10-16 2021-01-26 苏州浪潮智能科技有限公司 一种功率芯片的供电方法及服务器主板

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446146A (zh) * 2010-10-13 2012-05-09 鸿富锦精密工业(深圳)有限公司 服务器及其避免总线冲突的方法
CN104571444A (zh) * 2015-02-03 2015-04-29 浪潮电子信息产业股份有限公司 一种bios控制服务器电源状态的方法
CN105653376A (zh) * 2016-01-05 2016-06-08 浪潮电子信息产业股份有限公司 Arm平台中bios与bmc同时启动时保证信息同步的优化算法
TW201837705A (zh) * 2017-03-31 2018-10-16 神雲科技股份有限公司 管理引擎的韌體更新方法
US20180300273A1 (en) * 2017-04-13 2018-10-18 Dell Products, Lp System and Method for Arbitration and Recovery of SPD Interfaces in an Information Handling System
CN109271273A (zh) * 2018-10-15 2019-01-25 郑州云海信息技术有限公司 一种通讯异常恢复的方法、异常恢复设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446146A (zh) * 2010-10-13 2012-05-09 鸿富锦精密工业(深圳)有限公司 服务器及其避免总线冲突的方法
CN104571444A (zh) * 2015-02-03 2015-04-29 浪潮电子信息产业股份有限公司 一种bios控制服务器电源状态的方法
CN105653376A (zh) * 2016-01-05 2016-06-08 浪潮电子信息产业股份有限公司 Arm平台中bios与bmc同时启动时保证信息同步的优化算法
TW201837705A (zh) * 2017-03-31 2018-10-16 神雲科技股份有限公司 管理引擎的韌體更新方法
US20180300273A1 (en) * 2017-04-13 2018-10-18 Dell Products, Lp System and Method for Arbitration and Recovery of SPD Interfaces in an Information Handling System
CN109271273A (zh) * 2018-10-15 2019-01-25 郑州云海信息技术有限公司 一种通讯异常恢复的方法、异常恢复设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110618742A (zh) * 2019-08-20 2019-12-27 苏州浪潮智能科技有限公司 一种pdb板及其工作方法
CN111475011A (zh) * 2020-03-08 2020-07-31 苏州浪潮智能科技有限公司 一种服务器n+1冗余电源功率控制系统及方法
CN111488050A (zh) * 2020-04-16 2020-08-04 苏州浪潮智能科技有限公司 一种电源监控方法、系统及服务器
CN111752366A (zh) * 2020-05-29 2020-10-09 苏州浪潮智能科技有限公司 一种psu异常掉电处理系统、方法及装置
CN111752366B (zh) * 2020-05-29 2022-04-26 苏州浪潮智能科技有限公司 一种psu异常掉电处理系统、方法及装置
CN112269466A (zh) * 2020-10-16 2021-01-26 苏州浪潮智能科技有限公司 一种功率芯片的供电方法及服务器主板
CN112269466B (zh) * 2020-10-16 2022-07-08 苏州浪潮智能科技有限公司 一种功率芯片的供电方法及服务器主板

Similar Documents

Publication Publication Date Title
CN109885151A (zh) 一种服务器电源监控方法及系统
TWI618380B (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
US9098257B2 (en) Information handling system server architecture for improved management communication
CN110109782B (zh) 一种故障PCIe设备的更换方法、装置及系统
CN102622279A (zh) 冗余控制系统、方法及管理控制器
CN215835412U (zh) 车载安全计算机平台通信装置
CN110427283B (zh) 一种双余度的燃油管理计算机系统
CN111367392B (zh) 一种动态电源管理系统
CN210129215U (zh) 一种双余度机电管理计算机架构
CN101719089A (zh) 分布式集群的远程管理方法及系统
CN107179804A (zh) 机柜装置
CN113918383A (zh) 核心板复位方法、装置、设备、存储介质以及程序产品
CN110985426B (zh) 一种PCIE Switch产品的风扇控制系统及方法
US11308002B2 (en) Systems and methods for detecting expected user intervention across multiple blades during a keyboard, video, and mouse (KVM) session
CN109684257B (zh) 一种远程内存扩展管理系统
CN103092735A (zh) 节点状态更新方法
CN105471652A (zh) 大数据一体机及其冗余管理单元
CN114116276A (zh) Bmc挂死自恢复方法、系统、终端及存储介质
CN113608970A (zh) 核心板,服务器,故障修复方法、装置以及存储介质
CN109976478B (zh) 多cpu散热控制系统和散热控制方法
CN108647124A (zh) 一种存储跳变信号的方法及其装置
CN100550771C (zh) 实现远程加载单板固件的方法和系统
US10719310B1 (en) Systems and methods for reducing keyboard, video, and mouse (KVM) downtime during firmware update or failover events in a chassis with redundant enclosure controllers (ECs)
CN117111693A (zh) 一种服务器机箱系统、服务器机箱系统设计方法及设备
CN115509333A (zh) 一种服务器协同上下电装置、方法、系统及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614

RJ01 Rejection of invention patent application after publication