CN106339294A - 一种电压监控系统及方法 - Google Patents

一种电压监控系统及方法 Download PDF

Info

Publication number
CN106339294A
CN106339294A CN201610751777.0A CN201610751777A CN106339294A CN 106339294 A CN106339294 A CN 106339294A CN 201610751777 A CN201610751777 A CN 201610751777A CN 106339294 A CN106339294 A CN 106339294A
Authority
CN
China
Prior art keywords
voltage
state
node
bmc
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610751777.0A
Other languages
English (en)
Inventor
苏孝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610751777.0A priority Critical patent/CN106339294A/zh
Publication of CN106339294A publication Critical patent/CN106339294A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of Current Or Voltage (AREA)

Abstract

本发明提供了一种电压监控系统及方法。该系统包括:电源单元,用于连接到所述铜排,并向所述铜排输出供电电压;所述至少一个节点,均连接到所述铜排,从所述铜排取电;所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。本方案能够对整机柜服务器内的节点的供电电压进行监控。

Description

一种电压监控系统及方法
技术领域
本发明涉及电子信息技术领域,特别涉及一种电压监控系统及方法。
背景技术
在整机柜服务器中,采取的是集中供电的方式。在整机柜服务器中,各个部件比如电源、节点等都会连接到供电铜排。电源向供电铜排输出电压,节点等部件则从供电铜排进行取电。
由于整机柜服务器具有集中供电的特点,铜排负责给所有节点服务器供电,因此对节点供电电压的监控则比较重要,是整机柜稳定性的重要保证。
发明内容
本发明实施例提供了一种电压监控及系统方法,能够对整机柜服务器内的节点的供电电压进行监控。
电压监控系统,包括:
电源单元、铜排、至少一个节点、基板管理控制器BMC、路由器后台管理中心RMC,其中,
所述电源单元,用于连接到所述铜排,并向所述铜排输出供电电压;
所述至少一个节点,均连接到所述铜排,从所述铜排取电;
所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点;
所述RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。
进一步包括:中板,
所述中板连接在所述BMC与所述RMC之间,用于传输所述BMC与所述RMC之间的所述电压获取命令以及所述清除电压状态命令。
所述电压阈值包括:第一级别电压阈值和第二级别电压阈值;所述第二级别电压阈值大于所述第一级别电压阈值;
所述节点电压异常状态包括:警告warning状态和关键critical状态;
所述BMC,在执行所述根据当前的判断结果设置节点电压异常状态时,如果所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值,则设置为所述warning状态;如果所述当前电压值大于所述第二级别电压阈值,则设置为所述critical状态。
所述BMC中保存有状态迁移规则,其中,所述状态迁移规则中,所述正常状态可迁移到所述warning状态或者所述critical状态,所述warning状态可迁移到所述critical状态;
所述BMC在判断出所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值之后,并在所述设置为所述warning状态之前,进一步判断当前记录的节点电压状态是否为critical状态,如果是,则保留所述critical状态,否则,继续执行将所述节点电压状态设置为所述warning状态;并且,所述BMC在判断出所述当前电压值大于所述第二级别电压阈值之后,并在所述设置为所述critical状态之前,进一步判断当前的节点电压状态是否为所述正常状态或者所述warning状态,如果是继续执行所述设置为所述critical状态。
所述RMC,进一步用于判断机柜的上半部分的多个节点或者下半部分的多个节点的电压均出现异常,如果是,则确定所述铜排出现异常。
一种基于上述任意一种电源监控系统进行电压监控的方法,包括:
由BMC轮询至少一个节点,检测当前轮询到的节点的当前电压值;
由BMC根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;
由RMC通过所述电压获取命令,从所述BMC获取节点电压状态;
如果获取到的是所述节点电压异常状态,则所述RMC确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令;
所述BMC在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,返回执行所述轮询所述至少一个节点。
预先设置OEM命令格式的电压获取命令以及所述清除电压状态命令;
当所述电源监控系统中进一步包括中板时,
所述由RMC通过所述电压获取命令从所述BMC获取节点电压状态包括:由所述RMC将所述电压获取命令传输给所述中板,所述中板将所述电压获取命令发送给所述BMC,所述BMC接收到所述电压获取命令后,将所述节点电压状态通过所述中板转发给所述RMC;
所述向所述BMC返回所述清除电压状态命令包括:
所述RMC将所述清除电压状态命令发送给所述中板,由所述中板将所述清除电压状态命令发送给所述BMC。
所述电压阈值包括:第一级别电压阈值和第二级别电压阈值;所述第二级别电压阈值大于所述第一级别电压阈值;
所述节点电压异常状态包括:警告warning状态和关键critical状态;
所述根据当前的判断结果设置节点电压异常状态包括:
如果所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值,则设置为所述warning状态;
如果所述当前电压值大于所述第二级别电压阈值,则设置为所述critical状态。
该方法进一步包括:设置状态迁移规则,在所述状态迁移规则中,异常状态只能升级不能降级:当前是正常OK状态,则可以迁移到所述warning状态或者所述critical状态;当前是warning状态,只能迁移到所述critical状态,但是不能迁移至OK状态;当前是critical状态,不能迁移到OK状态或者warning状态。
在判断出所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值之后,并在所述设置为所述warning状态之前,进一步包括:判断当前记录的节点电压状态是否为critical状态,如果是,则保留所述critical状态,否则,继续执行将所述节点电压状态设置为所述warning状态;
在判断出所述当前电压值大于所述第二级别电压阈值之后,并在所述设置为所述critical状态之前,进一步包括:判断当前的节点电压状态是否为所述正常状态或者所述warning状态,如果是继续执行所述设置为所述critical状态。
本发明实施例提供了电压监控方法及系统,由于重新设计了整机柜内各个部件的布局、连接及协作处理,包括:电源单元连接到所述铜排,并向所述铜排输出供电电压;所述至少一个节点,均连接到所述铜排,从所述铜排取电;所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点;所述RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。可见,基于上述布局和协作处理,能够对整机柜服务器内的节点的供电电压进行监控。并且,由于不是简单地将节点的当前电压值传输到RMC进行电压值比较,因此,避免了电压故障时电压波动很快,异常电压持续时间较短,从而导致的异常电压很难抓取到,不能及时发现电压波动的情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例中电压监控系统的结构示意图。
图2是本发明另一个实施例中电压监控系统的结构示意图。
图3是本发明一个实施例中电压监控方法的流程图。
图4是本发明另一个实施例中电压监控方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种电压监控系统,包括:
电源单元101、铜排102、至少一个节点103、基板管理控制器(BaseboardManagement Controller,BMC)104、路由器后台管理中心(router manager center,RMC)105,其中,
所述电源单元101,用于连接到所述铜排102,并向所述铜排102输出供电电压;
所述至少一个节点103,均连接到所述铜排102,从所述铜排102取电;
所述BMC104,用于轮询所述至少一个节点103,检测当前轮询到的节点103的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC105发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点103;
所述RMC105,用于通过所述电压获取命令,从所述BMC104获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC104返回所述清除电压状态命令。
可见,在图1所示的本发明实施例的电压监控系统中,由于重新设计了整机柜内各个部件的布局、连接及协作处理,包括:电源单元连接到所述铜排,并向所述铜排输出供电电压;所述至少一个节点,均连接到所述铜排,从所述铜排取电;所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点;所述RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。可见,基于上述布局和协作处理,能够对整机柜服务器内的节点的供电电压进行监控。并且,由于不是简单地将节点的当前电压值传输到RMC进行电压值比较,因此,避免了电压故障时电压波动很快,异常电压持续时间较短,从而导致的异常电压很难抓取到,不能及时发现电压波动的情况。
在本发明一个实施例中,参见图2,为了更加有利于RMC与BMC之间的通信,在图1所示系统的基础上可以进一步包括:中板201,
所述中板201连接在所述BMC104与所述RMC105之间,用于传输所述BMC104与所述RMC105之间的所述电压获取命令以及所述清除电压状态命令。也就是说,RMC105与BMC104之间的传输的各种OEC命令都可以通过中板201来转发。
在本发明系统的一个实施例中,可以针对不同的电压异常状况,进行不同级别的异常处理,比如,异常不太严重时,进行对应的警告处理,异常非常严重时,进行异常紧急的关键处理。在此种情况下,参见图1或者图2,
所述电压阈值包括:第一级别电压阈值和第二级别电压阈值;所述第二级别电压阈值大于所述第一级别电压阈值;
所述节点电压异常状态包括:警告warning状态和关键critical状态;
所述BMC104,在执行所述根据当前的判断结果设置节点电压异常状态时,如果所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值,则设置为所述warning状态;如果所述当前电压值大于所述第二级别电压阈值,则设置为所述critical状态。
在本发明一个实施例的系统中,可以采用状态迁移规则来实现正常状态及各种不同级别的异常状态的切换迁移及相应的处理。此种情况下,参见图1或者图2,
所述BMC104中保存有状态迁移规则,其中,所述状态迁移规则中,异常状态只能升级不能降级:当前是正常(OK)状态,则可以迁移到所述warning状态或者所述critical状态;当前是warning状态,只能迁移到所述critical状态,但是不能迁移至OK状态;当前是critical状态,不能迁移到OK状态或者warning状态。基于此状态迁移规则的原理,
所述BMC104在判断出所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值之后,并在所述设置为所述warning状态之前,进一步判断当前记录的节点电压状态是否为critical状态,如果是,则保留所述critical状态,否则,继续执行将所述节点电压状态设置为所述warning状态;并且,所述BMC104在判断出所述当前电压值大于所述第二级别电压阈值之后,并在所述设置为所述critical状态之前,进一步判断当前的节点电压状态是否为所述正常状态或者所述warning状态,如果是继续执行所述设置为所述critical状态。
在本发明一个实施例中,除了能够对整机柜中的节点的电压异常状态进行监控,还可以进一步对铜排是否出现异常进行监控,此时,所述RMC105,进一步用于判断机柜的上半部分的多个节点或者下半部分的多个节点的电压是否均出现异常,如果是,则确定所述铜排102出现异常。
本发明一个实施例还提出了一种基于本发明实施例中任意一种电源监控系统进行电压监控的方法,参见图3,包括:
步骤301:由BMC轮询至少一个节点,检测当前轮询到的节点的当前电压值;
步骤302:由BMC根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则执行步骤303,否则,返回步骤301。
步骤303:由BMC根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;
步骤304:由RMC通过所述电压获取命令,从所述BMC获取节点电压状态;
步骤305:如果RMC获取到的是所述节点电压异常状态,则所述RMC确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令;
步骤306:所述BMC在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,返回步骤301。
可见,在图3所示的电压监控方法中,由于基于本发明实施例的电压监控系统,其中重新设计了整机柜内各个部件的布局、连接及协作处理,包括:电源单元连接到所述铜排,并向所述铜排输出供电电压;所述至少一个节点,均连接到所述铜排,从所述铜排取电;所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点;所述RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。可见,基于上述布局和协作处理,能够对整机柜服务器内的节点的供电电压进行监控。并且,由于不是简单地将节点的当前电压值传输到RMC进行电压值比较,因此,避免了电压故障时电压波动很快,异常电压持续时间较短,从而导致的异常电压很难抓取到,不能及时发现电压波动的情况。
为了更加清楚地说明本发明实施例中对整机柜中的电压进行监控的处理,下面结合图2所示的本发明实施例的系统以及下述图4所示的流程,对节点电压进行监控的一种较佳处理进行更为详细的说明。
步骤401:预先设置OEM命令:电压获取命令以及所述清除电压状态命令。
本步骤中,电压获取命令可以记为“Get 12V Status”命令,清除电压状态命令可以记为“Clear 12V Status”命令。
步骤402:设置状态迁移规则。
本步骤中,状态迁移规则中包括三种状态:
正常(OK)状态,表示节点电压处于正常状态;
告警(warning)状态,表示节点电压出现异常,但是异常情况不太严重;
关键(critical)状态,表示节点电压出现异常,而且异常情况非常严重。
在上述三个状态中,具有严格的迁移方向,异常状态只能升级不能降级:当前是正常OK状态,则可以迁移到所述warning状态或者所述critical状态;当前是warning状态,只能迁移到所述critical状态,但是不能迁移至OK状态;当前是critical状态,不能迁移到OK状态或者warning状态。
步骤403:预先设置电压第一级别电压阈值以及第二级别电压阈值。
这里,第一级别电压阈值对应于warning状态,具体可以包括比如LNC、UNC级别的两个阈值。
第二级别电压阈值对应于critical状态,具体可以包括比如LC、UC、LNR、UNR级别的四个阈值。
上述步骤401至步骤403是为了进行节点监控而进行的预处理过程。
步骤404:BMC轮询至少一个节点,检测当前轮询到的节点1的当前电压值。
步骤405:BMC判断当前电压值是否是大于所述第一级别电压阈值LNC、UNC,但是小于所述第二级别电压阈值LC、UC、LNR、UNR,如果是,执行步骤406,否则,执行步骤407;
步骤406:BMC判断当前的节点电压状态是否为critical状态,如果是,保持节点1的节点电压状态为critical状态,执行步骤409,否则,BMC将当前的节点电压状态更新为warning状态,执行步骤409。
步骤407:BMC判断当前电压值是否大于所述第二级别电压阈值LC、UC、LNR、UNR,如果是,执行步骤408,否则,返回步骤404。
步骤408:BMC将当前的节点电压状态更新设置为critical状态。
需要说明的是,上述步骤404至步骤408的节点轮询及设置每一个节点的节点电压状态的处理是实时进行的。通过上述状态迁移规则,保证,BMC记录的节点电压状态为最严重的异常状态。
步骤409:BMC提供Get 12V Status命令;
步骤410:RMC通过中板向BMC发送Get 12V Status命令。
步骤411:BMC根据接收到的Get 12V Status命令,将当前的节点电压状态发送给中板,由中板转发给RMC。
步骤412:RMC分析获取到的节点电压状态,如果是warning状态或者critical状态,则确定节点电压出现异常,进行相应的异常处理,比如向维护人员进行对应方式的报警等。
步骤413:RMC通过中板向BMC返回Clear 12V Status命令。
步骤414:BMC在接收到Clear 12V Status命令后,将节点电压状态更新设置为OK状态。
可见,本发明各个实施例至少具有如下的有益效果:
1、本发明实施例中,由于重新设计了整机柜内各个部件的布局、连接及协作处理,包括:电源单元连接到所述铜排,并向所述铜排输出供电电压;所述至少一个节点,均连接到所述铜排,从所述铜排取电;所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点;所述RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。可见,基于上述布局和协作处理,能够对整机柜服务器内的节点的供电电压进行监控。
2、本发明实施例采取的做法是在BMC中实时记录节点电压的正常状态和异常状态,而不是简单地将节点的当前电压值传输到RMC进行电压值比较。由于12V电压故障时电压波动很快,异常电压持续时间较短,电压值从每个节点BMC传到相应的节点中板,每个节点中板再传到RMC,时间较长,对于电压波动持续时间较短的异常,很难抓取到,不能及时发现电压波动情况,起不到及时预警的作用。因此,本发明实施例中采取记录异常状态的方式,能够有效避免不能及时发现电压波动的情况。
3、本发明实施例中,设置了状态迁移规则,BMC按照状态迁移规则的规定及轮询出的当前节点电压值来设置表示节点的电压是否正常的状态值,不同状态值存在单向迁移规则,因此,保证BMC在每次RMC获取到节点的电压状态之前,只记录节点最严重的异常状态,使得节点电压监控的结果更为准确。
4、在本发明实施例中,除了能够对整机柜中的节点的电压异常状态进行监控,还可以进一步对铜排是否出现异常进行监控,进一步增加了实用性。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个〃·····”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种电压监控系统,其特征在于,包括:
电源单元、铜排、至少一个节点、基板管理控制器BMC、路由器后台管理中心RMC,其中,
所述电源单元,用于连接到所述铜排,并向所述铜排输出供电电压;
所述至少一个节点,均连接到所述铜排,从所述铜排取电;
所述BMC,用于轮询所述至少一个节点,检测当前轮询到的节点的当前电压值,根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,继续执行所述轮询所述至少一个节点;
所述RMC,用于通过所述电压获取命令,从所述BMC获取节点电压状态,如果获取到的是所述节点电压异常状态,则确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令。
2.根据权利要求1所述的系统,其特征在于,进一步包括:中板,
所述中板连接在所述BMC与所述RMC之间,用于传输所述BMC与所述RMC之间的所述电压获取命令以及所述清除电压状态命令。
3.根据权利要求1所述的系统,其特征在于,所述电压阈值包括:第一级别电压阈值和第二级别电压阈值;所述第二级别电压阈值大于所述第一级别电压阈值;
所述节点电压异常状态包括:警告warning状态和关键critical状态;
所述BMC,在执行所述根据当前的判断结果设置节点电压异常状态时,如果所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值,则设置为所述warning状态;如果所述当前电压值大于所述第二级别电压阈值,则设置为所述critical状态。
4.根据权利要求3所述的系统,其特征在于,所述BMC中保存有状态迁移规则,在所述状态迁移规则中,异常状态只能升级不能降级:当前是正常OK状态,则可以迁移到所述warning状态或者所述critical状态;当前是warning状态,只能迁移到所述critical状态,但是不能迁移至OK状态;当前是critical状态,不能迁移到OK状态或者warning状态;
所述BMC在判断出所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值之后,并在所述设置为所述warning状态之前,进一步判断当前记录的节点电压状态是否为critical状态,如果是,则保留所述critical状态,否则,继续执行将所述节点电压状态设置为所述warning状态;并且,所述BMC在判断出所述当前电压值大于所述第二级别电压阈值之后,并在所述设置为所述critical状态之前,进一步判断当前的节点电压状态是否为所述正常状态或者所述warning状态,如果是继续执行所述设置为所述critical状态。
5.根据权利要求1所述的系统,其特征在于,所述RMC,进一步用于判断机柜的上半部分的多个节点或者下半部分的多个节点的电压均出现异常,如果是,则确定所述铜排出现异常。
6.一种基于权利要求1至5中任一所述的电源监控系统进行电压监控的方法,其特征在于,包括:
由BMC轮询至少一个节点,检测当前轮询到的节点的当前电压值;
由BMC根据预先设置的电压阈值判断所述当前电压值是否出现异常,如果是,则根据当前的判断结果设置节点电压异常状态,并提供电压获取命令;
由RMC通过所述电压获取命令,从所述BMC获取节点电压状态;
如果获取到的是所述节点电压异常状态,则所述RMC确定节点电压出现异常,并向所述BMC返回所述清除电压状态命令;
所述BMC在接收到所述RMC发来的清除电压状态命令,将节点电压设置为正常状态,返回执行所述轮询所述至少一个节点。
7.根据权利要求6所述的方法,其特征在于,预先设置OEM命令格式的电压获取命令以及所述清除电压状态命令;
当所述电源监控系统中进一步包括中板时,
所述由RMC通过所述电压获取命令从所述BMC获取节点电压状态包括:由所述RMC将所述电压获取命令传输给所述中板,所述中板将所述电压获取命令发送给所述BMC,所述BMC接收到所述电压获取命令后,将所述节点电压状态通过所述中板转发给所述RMC;
所述向所述BMC返回所述清除电压状态命令包括:
所述RMC将所述清除电压状态命令发送给所述中板,由所述中板将所述清除电压状态命令发送给所述BMC。
8.根据权利要求6所述的方法,其特征在于,所述电压阈值包括:第一级别电压阈值和第二级别电压阈值;所述第二级别电压阈值大于所述第一级别电压阈值;
所述节点电压异常状态包括:警告warning状态和关键critical状态;
所述根据当前的判断结果设置节点电压异常状态包括:
如果所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值,则设置为所述warning状态;
如果所述当前电压值大于所述第二级别电压阈值,则设置为所述critical状态。
9.根据权利要求8所述的方法,其特征在于,该方法进一步包括:设置状态迁移规则,在所述状态迁移规则中,异常状态只能升级不能降级:当前是正常OK状态,则可以迁移到所述warning状态或者所述critical状态;当前是warning状态,只能迁移到所述critical状态,但是不能迁移至OK状态;当前是critical状态,不能迁移到OK状态或者warning状态。
10.根据权利要求9所述的方法,其特征在于,
在判断出所述当前电压值大于所述第一级别电压阈值但是小于所述第二级别电压阈值之后,并在所述设置为所述warning状态之前,进一步包括:判断当前记录的节点电压状态是否为critical状态,如果是,则保留所述critical状态,否则,继续执行将所述节点电压状态设置为所述warning状态;
在判断出所述当前电压值大于所述第二级别电压阈值之后,并在所述设置为所述critical状态之前,进一步包括:判断当前的节点电压状态是否为所述正常状态或者所述warning状态,如果是继续执行所述设置为所述critical状态。
CN201610751777.0A 2016-08-29 2016-08-29 一种电压监控系统及方法 Pending CN106339294A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610751777.0A CN106339294A (zh) 2016-08-29 2016-08-29 一种电压监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610751777.0A CN106339294A (zh) 2016-08-29 2016-08-29 一种电压监控系统及方法

Publications (1)

Publication Number Publication Date
CN106339294A true CN106339294A (zh) 2017-01-18

Family

ID=57823112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610751777.0A Pending CN106339294A (zh) 2016-08-29 2016-08-29 一种电压监控系统及方法

Country Status (1)

Country Link
CN (1) CN106339294A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526664A (zh) * 2017-09-06 2017-12-29 郑州云海信息技术有限公司 一种服务器异常掉电快速定位方法和装置
CN107907762A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种检验bbu对整机柜稳定性影响的测试方法和系统
CN111198803A (zh) * 2020-01-11 2020-05-26 苏州浪潮智能科技有限公司 一种整机柜服务器的铜排供电可靠性连接检测电路与方法
CN112213980A (zh) * 2020-10-21 2021-01-12 苏州浪潮智能科技有限公司 一种单片机故障诊断板卡及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110279145A1 (en) * 2010-05-14 2011-11-17 Hon Hai Precision Industry Co., Ltd. Testing device and method thereof
CN104569731A (zh) * 2015-02-13 2015-04-29 浪潮电子信息产业股份有限公司 一种避免Busbar结构性松弛的监控方法
CN104598329A (zh) * 2015-02-12 2015-05-06 浪潮电子信息产业股份有限公司 一种基于rmc管理的自动bmc故障解决方法
CN105426287A (zh) * 2015-11-09 2016-03-23 浪潮电子信息产业股份有限公司 利用背板电压监控功能实现磁盘稳定性运行检测的方法
CN105868077A (zh) * 2016-04-12 2016-08-17 浪潮电子信息产业股份有限公司 一种获取整机柜服务器节点监控信息的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110279145A1 (en) * 2010-05-14 2011-11-17 Hon Hai Precision Industry Co., Ltd. Testing device and method thereof
CN104598329A (zh) * 2015-02-12 2015-05-06 浪潮电子信息产业股份有限公司 一种基于rmc管理的自动bmc故障解决方法
CN104569731A (zh) * 2015-02-13 2015-04-29 浪潮电子信息产业股份有限公司 一种避免Busbar结构性松弛的监控方法
CN105426287A (zh) * 2015-11-09 2016-03-23 浪潮电子信息产业股份有限公司 利用背板电压监控功能实现磁盘稳定性运行检测的方法
CN105868077A (zh) * 2016-04-12 2016-08-17 浪潮电子信息产业股份有限公司 一种获取整机柜服务器节点监控信息的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526664A (zh) * 2017-09-06 2017-12-29 郑州云海信息技术有限公司 一种服务器异常掉电快速定位方法和装置
CN107526664B (zh) * 2017-09-06 2020-07-24 苏州浪潮智能科技有限公司 一种服务器异常掉电快速定位方法和装置
CN107907762A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种检验bbu对整机柜稳定性影响的测试方法和系统
CN111198803A (zh) * 2020-01-11 2020-05-26 苏州浪潮智能科技有限公司 一种整机柜服务器的铜排供电可靠性连接检测电路与方法
CN111198803B (zh) * 2020-01-11 2022-08-02 苏州浪潮智能科技有限公司 一种整机柜服务器的铜排供电可靠性连接检测电路与方法
CN112213980A (zh) * 2020-10-21 2021-01-12 苏州浪潮智能科技有限公司 一种单片机故障诊断板卡及方法

Similar Documents

Publication Publication Date Title
EP2372861B1 (en) Data center management unit with dynamic load balancing
CN106339294A (zh) 一种电压监控系统及方法
US8185753B2 (en) Storage medium for storing power consumption monitor program, power consumption monitor apparatus and power consumption monitor method
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN107942255B (zh) 一种基于数据融合技术的变电站蓄电池组状态评估方法
CN101494564B (zh) 一种电源监控装置及单板热备份的实现方法
CN114594349B (zh) 一种储能系统中直流绝缘监测方法及终端
CN102495786B (zh) 服务器系统
WO2018154845A1 (ja) 管理装置、管理方法及びプログラム
CN104081627A (zh) 网络监视装置及网络监视方法
CN103905271B (zh) 一种告警风暴抑制方法
CN203479939U (zh) 一种变压器监控系统
CN106779443A (zh) 电力调度中的操作风险确定方法和装置
CN114676019A (zh) 一种中央处理器状态监测方法、装置、设备、存储介质
CN103457755A (zh) 一种iec 61850系统通信故障检测的方法及系统
CN115940159A (zh) 一种电网运行控制断面监视方法、系统、装置及存储介质
CN116959514A (zh) 存储管理系统的温度预测方法、装置、设备及介质
CN109882437A (zh) 一种风扇运行状态监控方法、系统、装置及可读存储介质
CN116337423A (zh) 变压器绕组的机械状态的监测方法及装置
CN104408059A (zh) 一种故障处理的方法及装置
CN115940399A (zh) 环网柜故障在线预警方法、装置、系统及预警监测设备
CN114138569A (zh) 一种整机柜服务器供电的检测方法及相关装置
CN106897195A (zh) 一种服务器机柜的监测方法及相关装置
CN110402058A (zh) 一种服务器整机柜及其管理电源板
CN114301941B (zh) 一种电力设备的管理方法、装置和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170118