CN106292986A - 一种服务器电源psu故障确定方法及装置 - Google Patents

一种服务器电源psu故障确定方法及装置 Download PDF

Info

Publication number
CN106292986A
CN106292986A CN201610645287.2A CN201610645287A CN106292986A CN 106292986 A CN106292986 A CN 106292986A CN 201610645287 A CN201610645287 A CN 201610645287A CN 106292986 A CN106292986 A CN 106292986A
Authority
CN
China
Prior art keywords
logical value
word address
address position
status word
currently monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610645287.2A
Other languages
English (en)
Inventor
张文珂
高鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610645287.2A priority Critical patent/CN106292986A/zh
Publication of CN106292986A publication Critical patent/CN106292986A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明提供了一种服务器电源PSU故障确定方法及装置,该方法包括:侦测对应PSU的当前监测参数,将所述当前监测参数与预先设置的当前监测参数的阈值比较,如果所述当前监测参数正常,则将第一逻辑值存储在查找到的第一故障状态字地址位中;如果所述当前监测参数异常,则将第二逻辑值存储在所述第一故障状态字地址位中;解析所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;判断所述逻辑值是否为第二逻辑值,如果是,则确定已经连续判断出所述逻辑值为所述第二逻辑值次数,如果达到预先设置的次数阈值,则确定为电源故障,否则为外界干扰。本发明能够确定PSU故障的类型。

Description

一种服务器电源PSU故障确定方法及装置
技术领域
本发明涉及服务器领域,特别涉及一种服务器电源PSU故障确定方法及装置。
背景技术
在互联网发展过程中,服务器的地位显著提升,服务器PSU(电源)作为服务器中的重要部件也越来越受重视,然而对于服务器PSU的故障维修也越来越频繁。
目前无论是干扰故障还是电源本身故障导致的电源供电问题,电源均会报警通知系统,从而对电源进行维修。然而大多数情况下的电源故障均是由外界干扰引起,这些故障只会短时间影响电源供电,无需取出电源进行故障维修,但现有的技术中,只要有故障,系统就会报警通知用户进行维修,因此,目前的技术并不能确定出PSU故障的类型。
发明内容
本发明实施例提供了一种服务器电源PSU故障确定方法及装置,能够确定出PSU故障的类型。
第一方面,本发明实施例提供了一种服务器电源PSU故障确定方法,包括:
侦测对应PSU的当前监测参数,将所述当前监测参数与预先设置的当前监测参数的阈值比较,如果所述当前监测参数正常,则将第一逻辑值存储在查找到的第一故障状态字地址位中;如果所述当前监测参数异常,则将第二逻辑值存储在所述第一故障状态字地址位中;
解析所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;
判断所述逻辑值是否为第二逻辑值,如果是,则确定已经连续判断出所述逻辑值为所述第二逻辑值次数,如果达到预先设置的次数阈值,则确定为电源故障,否则为外界干扰。
优选地,该方法进一步包括:
划分出地址空间7Ah-82h,将地址空间7Ah-82h中的每一个地址位分别设置为一个故障状态字地址位;
设置不同类型的监测参数与不同的故障状态字地址位的第一对应关系;
所述第一故障状态字地址位的所述查找包括:根据所述当前监测参数,在所述第一对应关系中查找与所述当前监测参数对应的第一故障状态字地址位。
优选地,进一步包括:
将所述第一故障状态字地址位中的值由所述第二逻辑值替换为所述第一逻辑值。
优选地,
该方法进一步包括:预先设置79H状态位中的每一位与相应的监测参数之间的第二对应关系;
进一步包括:
查找79H状态位中与当前监测参数对应的状态位;
将查找到的状态位置为对应于指示故障的逻辑值。
第二方面,本发明实施例提供了一种服务器电源PSU故障确定装置,包括:侦测单元、逻辑值处理单元、信息存储单元、故障确定单元,其中,
所述侦测单元,用于侦测至少一种对应PSU的当前监测参数;
所述逻辑值处理单元,用于将所述侦测单元侦测到的所述当前监测参数与预先设置的当前监测参数的阈值进行比较,在当前监测参数正常时,将第一逻辑值存储在所述信息存储单元的第一故障状态字地址位中,在当前监测参数异常时,将第二逻辑值存储在所述信息存储单元的第一故障状态字地址位中;
所述信息存储单元在所述第一故障状态字地址位中保存第一逻辑值或第二逻辑值;
所述故障确定单元,用于解析所述信息存储单元中的所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;判断所述逻辑值是否为第二逻辑值,当判断结果为是时,则确定已经连续判断出所述逻辑值为所述第二逻辑值次数,在达到预先设置的次数阈值时,确定为电源故障,否则为外界干扰。
优选地,所述信息存储单元包括8个寄存器;
所述8个寄存器的地址空间分布依次包括:7Ah-82h;每一个寄存器中均包括至少一个故障状态字地址位;不同类型的监测参数与不同寄存器中的故障状态字地址位存在第一对应关系;
所述逻辑值处理单元,用于根据所述当前监测参数,在所述第一对应关系中查找与所述当前监测参数对应的第一寄存器中的第一故障状态字地址位,将所述第一逻辑值存储在所述第一寄存器中的第一故障状态字地址位中。
优选地,所述故障确定单元进一步用于在确定为所述外界干扰之后,将所述信息存储单元中第一故障状态字地址位中的值由所述第二逻辑值替换为所述第一逻辑值。
优选地,进一步包括:79H状态位;
所述79H状态位中的每一位与相应的监测参数之间存在第二对应关系;
所述故障确定单元进一步用于在确定电源故障后,根据所述第二对应关系,将所述79H状态位中对应的状态位置为对应于指示故障的逻辑值。
本发明实施例提供了一种服务器电源PSU故障确定方法及装置,通过检测当前监测参数在故障状态字地址位中的逻辑值,从而可以确定当前监测参数是否异常,如果确定为异常,继续针对当前逻辑值进行次数检验,若未达到预先设置的阈值次数,则表明为外界干扰,通过将当前逻辑值置为指示故障的逻辑值,消除干扰,恢复供电,无需进行报警,若达到预先设置的阈值次数,则表明为电源故障,于是报警通知系统,从而完成了对电源PSU故障类型的判断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种服务器电源PSU故障确定方法流程图;
图2是本发明一个实施例提供的另一种服务器电源PSU故障确定方法流程图;
图3是本发明一个实施例提供的又一种服务器电源PSU故障确定方法流程图;
图4是本发明一个实施例提供的装置所在设备的硬件架构图;
图5是本发明一个实施例提供的一种服务器电源PSU故障确定装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种服务器电源PSU故障确定方法,该方法可以包括以下步骤:
步骤101:侦测对应PSU的当前监测参数。
步骤102:将所述当前监测参数与预先设置的当前监测参数的阈值比较,如果所述当前监测参数正常,则执行步骤103,如果所述当前监测参数异常,则执行步骤104。
步骤103:将第一逻辑值存储在查找到的第一故障状态字地址位中,执行步骤105。
步骤104:将第二逻辑值存储在所述第一故障状态字地址位中。
步骤105:解析所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;
步骤106:判断所述逻辑值是否为第二逻辑值,如果是,则步骤107,否则结束当前流程。
步骤107:判断当前已经连续确定出所述逻辑值为所述第二逻辑值的次数是否达到预先设置的次数阈值,如果是,则执行步骤108,否则执行步骤109。
步骤108:确定为电源故障,结束当前流程。
步骤109:确定为外界干扰。
本发明实施例提供了一种服务器电源PSU故障确定方法及装置,通过检测当前监测参数在故障状态字地址位中的逻辑值,从而可以确定当前监测参数是否异常,如果确定为异常,继续针对当前逻辑值进行次数检验,若未达到预先设置的阈值次数,则表明为外界干扰,通过将当前逻辑值置为指示故障的逻辑值,消除干扰,恢复供电,无需进行报警,若达到预先设置的阈值次数,则表明为电源故障,于是报警通知系统,从而完成了对电源PSU故障类型的判断。
在本发明一个实施例中,为了完成对当前监测参数的故障状态字地址位的查找,在上述步骤101之前,可以进一步包括:划分出地址空间7Ah-82h,将地址空间7Ah-82h中的每一个地址位分别设置为一个故障状态字地址位;设置不同类型的监测参数与不同的故障状态字地址位的第一对应关系;
则所述步骤103中,所述第一故障状态字地址位的所述查找包括:
根据所述当前监测参数,在所述第一对应关系中查找与所述当前监测参数对应的第一故障状态字地址位。
例如,以对应PSU的监测参数为“电压”、“电流”和“温度”为例,首先在确定这三个监测参数之前,应首先针对每一个寄存器划分出一个故障状态字地址位,而每一个故障状态字地址位用来存储相应的一种类型的监测参数的当前逻辑值。假定分别针对这三个监测参数划分的故障状态字地址位为7Ah-7Ch,也就是说,故障状态字地址位7Ah中存储电压对应的逻辑值,7Bh中存储电流对应的逻辑值,7Ch存储温度对应的逻辑值,其中,7Ah、7Bh和7Ch并且分别在不同的寄存器中,那么这三个监测参数与故障状态字地址位及寄存器的对应关系就可以包括如下表1:
表1:
监测参数 故障状态字地址位 寄存器
电压 7Ah 1号
电流 7Bh 2号
温度 7Ch 3号
…… …… ……
由表1中的对应关系可以得到,1号寄存器中存储的故障状态字地址位是7Ah,故障状态字地址位7Ah存储的是监测参数电压对应的逻辑值,其中,不同的监测参数与故障状态字地址位的对应关系可依照用户进行选择。其它监测参数的每一种对应关系与此相同,不在赘述。
通过预先设置不同类型的监测参数与不同的故障状态字地址位的对应关系,那么,在查找当前监测参数对应的逻辑值时,根据这个对应关系可以很方便的获取到相应的逻辑值,从而可以完成对不同类型监测参数的故障判断。
在本发明一个实施例中,为了减少误报警次数,完成对外界干扰的自恢复处理,在上述步骤109之后,可以进一步包括:
将所述第一故障状态字地址位中的值由所述第二逻辑值替换为所述第一逻辑值。
在本发明实施例中,以第一逻辑值“0”代表当前监测参数正常,以第二逻辑值“1”代表当前监测参数异常。因此在确定当前监测参数为外界干扰后,可通过将当前第二逻辑值1替换为第一逻辑值0,完成对当前异常监测参数的自恢复处理。
通过替换当前异常监测参数的逻辑值,可以实现对当前干扰的处理,从而减少了由于外界干扰导致的误报警次数,降低了电源故障率,同时也避免了多次无故障的人工维修。
在本发明一个实施例中,在确定为电源故障后,为方便用户查找具体是哪一种电源故障,在上述步骤101之前,可以进一步包括:预先设置79H状态位中的每一位与相应的监测参数之间的第二对应关系;
在上述步骤108之后,可以进一步包括:
查找79H状态位中与当前监测参数对应的状态位;
将查找到的状态位置为对应于指示故障的逻辑值。
在确定有电源故障后,如果用户需要了解是哪一种电源故障,就可以根据79H状态位中置高的那一位进行判断,79H状态位中共有高8位和低8位,其中,每一种监测参数对应79H状态位中的那一位可根据用户需求进行设定。例如,以电源故障为“过压”、“高阻”、“通信故障”、“逻辑故障”和“高温”、每一位代表故障的逻辑值为“1”为例,这五种电源故障分别与79H状态位中的一位相应的对应关系可以包括如下表2:
表2:
由表2中的对应关系可以得到,以“过压”为例,可以看出过压与79H状态位中高8位中的第7位相对应,也就是说,当出现过压故障时,79H状态位中相应的高位中的第7位会被置高,即逻辑值会由0变为1;以“高温”为例,与高温对应的是79H状态位中低8位中的第3位,那么,当出现高温故障时,该位上的逻辑值就会被置高,也就是说,该位上的逻辑值会变为1。其它不同类型的电源故障与79H状态位中每一位的对应关系与此相同,不在赘述。
通过置高当前电源故障对应的79H状态位中的一位,可以报警通知系统当前有电源故障,而且,在确定有电源故障之后,用户也可以根据系统中当前置高79H状态位中的那一位确定具体发生了哪种电源故障。
下面将以使用8种类型的监测参数来判断PSU是否发生电源故障为例,通过预先设置8个寄存器,为该8个寄存器依次划分出地址空间7Ah-82h,并预先将8个寄存器中的每一个地址位分别设置为一个故障状态字地址位,且设置不同类型的监测参数与不同寄存器中故障状态字地址位的第一对应关系,然后针对每一个监测参数,侦测监测参数,比如其中两种类型的监测参数为电压和温度。
下面以监测参数为电压来判断PSU是否发生电源故障为例,对本发明实施例中一种服务器电源PSU故障确定方法进行详细说明。如图2所示,该方法可以包括以下步骤:
步骤201:预先设置1个寄存器,并为该寄存器划分地址空间7Ah。
在本发明实施例中,为便于进行表示,将该寄存器记为1号寄存器。
步骤202:预先将1号寄存器中的7Ah地址位设置为一个故障状态字地址位,且设置监测参数电压与1号寄存器中故障状态字地址位的第一对应关系。
在本发明实施例中,为便于进行表示,将7Ah地址位设置的故障状态字地址位记为第一故障状态字地址位。
步骤203:预先设置监测参数电压与79H状态位中的地址位1的第二对应关系。
步骤204:侦测PSU当前输入电压。
在本发明实施例中,预先设置至少一个传感器,其中,每一个传感器的类型可根据侦测的监测参数进行选择,侦测输入电压的传感器选用电压传感器。当针对电压进行侦测时,包括如下处理:利用电压传感器侦测,应预先将传感器的一端与电源板上的输入电压端口相连,该电压传感器的另一端与电源板上的地线端口相连,这样,就可以侦测到电源板上的当前输入电压值,在本发明实施例中,以第一次侦测到的当前输入电压值为280V为例。
步骤205:将第一次侦测到的输入电压值280V与预先设置的阈值进行比较,如果当前输入电压正常,则执行步骤206,否则,则执行步骤207。
在该实施例中,PSU上的单片机与传感器相连,用于接收传感器的侦测值,而且单片机与传感器之间可以加多级放大电路用于放大信号,一级模数转换电路用于将电信号转换为数字信号。本实施例中,是以预先设置的输入电压值阈值为“260V”为例。
当PSU上的单片机获取到输入电压值280V后,首先系统会将280V与阈值260V通过if语句进行比较,由于280V>260V,因此,系统会将输入电压相应的字节位置1,于是得到第二逻辑值1,其中,输入电压相应的字节位可用不同的数字代表当前输入电压状态,在本实施例中,以1表示当前输入电压异常、0表示当前输入电压正常,因此,执行步骤207。
步骤206:将第一逻辑值0存储到查找到的第一故障状态字地址位中,执行步骤208。
步骤207:将第二逻辑值1存储到查找到的第一故障状态字地址位中。
在本发明实施例中,输入电压对应的故障状态字地址位为第一故障状态字地址位,且该第一故障状态字地址位为7Ah。当获取到280V对应的第二逻辑值1后,根据预先设置的对应关系,系统会查找地址位7Ah,然后将第二逻辑值1存储到该地址位中。
步骤208:解析所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值。
在本发明实施例中,为获取当前输入电压的逻辑值时,首先查找存放对应逻辑值的相应1号寄存器,在查找到1号寄存器后,根据换算公式“物理地址=段寄存器×16+寄存器中的16”进行地址解析,其中,在该实施例中,物理地址即为故障状态字地址位。例如,段地址是7h,偏移地址是Ah,那么解析后的物理地址=7h×16+Ah=7h×10h+Ah=7Ah,然后通过访问解析后的第一故障状态字地址位7Ah,从中获取当前输入电压的逻辑值。
步骤209:判断当前输入电压的逻辑值是否为第二逻辑值1,如果是,则执行步骤210,否则结束当前流程。
在本发明实施例中,获取当前输入电压的逻辑值后,根据if语句进行判断,如果当前输入电压的逻辑值=0,则结束当前流程,结合该实施例中的上述步骤,能够准确的判断出当前输入电压的逻辑值=1,从而也表明当前第一次检测当前输入电压的过程中电压存在异常,因此,执行步骤210。
步骤210:判断当前已经连续确定出当前输入电压的逻辑值为第二逻辑值1的次数是否达到预先设置的次数阈值3次,如果是,则执行步骤211,否则执行步骤212。
其中,每一次获取到的逻辑值均会把上一次的逻辑值覆盖掉。
在该实施例中,针对当前输入电压值和当前温度值对应的逻辑值设置的次数阈值为3次。当判断当前输入电压值对应的逻辑值为1的次数时,以判断3次为例,那么在第一次判断出逻辑值为1后,假定后两次逻辑值分别为1、0,那么可以知晓当前输入电压值对应的逻辑值为1的次数为2次,并未达到预先设置的阈值3次,因此执行步骤212。
步骤211:确定为电源故障,根据第二对应关系,将79H状态位中的地址位1置高,结束当前流程。
步骤212:确定当前输入电压为外界干扰,并对当前输入电压进行自恢复处理。
在本发明实施例中,由于上述步骤确定当前3次输入电压的逻辑值为1的次数并未到阈值3次,因此确定当前输入电压为外界干扰。在确定为外界干扰后,由于并不是电源本身出现故障,因此无需报警,通过系统的自恢复处理就可以解决外界干扰对电源的影响,也就是说,如果预先设置逻辑值为1代表当前输入电压异常,那么就在确定为干扰故障之后,通过将逻辑值1替换为0就可以,这个过程是由电源PSU上的单片机实现的,单片机发送0到上述步骤中的第一故障状态字地址位中,从而强制拉低高位信号1,实现对当前输入电压异常干扰的自恢复处理。
下面以监测参数为温度来判断PSU是否发生电源故障为例,对本发明实施例中一种服务器电源PSU故障确定方法进行详细说明。如图3所示,该方法可以包括以下步骤:
步骤301:预先设置1个寄存器,并为该寄存器划分地址空间7Ch。
在本发明实施例中,为便于进行表示,将该寄存器记为3号寄存器。
步骤302:预先将3号寄存器中的7Ch地址位设置为一个故障状态字地址位,且设置监测参数温度与3号寄存器中故障状态字地址位的第一对应关系。
在本发明实施例中,为便于进行表示,将7Ch地址位设置的故障状态字地址位记为第二故障状态字地址位。
步骤303:预先设置监测参数温度与79H状态位中的地址位3的第二对应关系。
步骤304:侦测PSU当前温度值。
在本发明实施例中,预先设置至少一个传感器,其中,每一个传感器的类型可根据侦测的监测参数进行选择,侦测温度的传感器选用温度传感器,例如,选择铂电阻PT100温度传感器。
当针对电压进行侦测时,包括如下处理:利用铂电阻PT100侦测对应PSU的当前温度时,应预先将PT100的两端连接到电源板上的桥式电路中,这样,就可以对电源板的当前温度进行侦测,只要电源的温度发生变化,PT100均可以通过桥式电路进行侦测,而且如果输出的信号过小,传感器后面可接至少一级放大电路。在本发明实施例中,以第一次侦测到的当前温度值为300℃为例。
步骤305:将第一次侦测到的温度值300℃与预先设置的阈值进行比较,如果当前温度值正常,则执行步骤306,否则,则执行步骤307。
在该实施例中,PSU上的单片机用于接收PT100温度传感器的侦测到的温度值,而且单片机与PT100温度传感器之间加至少一级放大电路,主要用于放大经过桥式电路输出的信号,还需加一级模数转换电路,主要用于将电信号转换为数字信号。本实施例中,是以电源PSU承受的最大温度阈值为“70℃”为例。
当PSU上的单片机获取到第一次侦测到的温度值300℃后,首先系统会将300℃与预先设置的阈值70℃通过if语句进行比较,由于300℃>70℃,因此,系统会将温度相应的字节位置1,于是得到第二逻辑值1,其中,温度相应的字节位可用不同的数字代表当前温度状态,在本实施例中,以1表示当前温度异常、0表示当前温度正常,因此,执行步骤步骤306。
步骤306:将第一逻辑值0存储到查找到的第二故障状态字地址位中,执行步骤308。
步骤307:将第二逻辑值1存储到查找到的第二故障状态字地址位中。
在本发明实施例中,在上述步骤中,温度对应的故障状态字地址位为第二故障状态字地址位,且第二故障状态字地址位为7Ch,当获取到300℃对应的第二逻辑值1后,系统又会查找地址位7Ch,同样将1存储到该地址位中。
步骤308:解析所述第二故障状态字地址位,并获取所述第二故障状态字地址位中的逻辑值。
在本发明实施例中,为获取当前温度的逻辑值,首先查找存放对应逻辑值的相应3号寄存器,在查找到3号寄存器后,同样根据换算公式“物理地址=段寄存器×16+寄存器中的16”进行地址解析,其中,在该实施例中,物理地址即为故障状态字地址位。例如,段地址是7h,偏移地址是Ch,那么解析后的物理地址=7h×16+Ch=7h×10h+Ch=7Ch,然后通过访问解析后的第二故障状态字地址位7Ch,从中获取当前温度值为300℃的逻辑值。
步骤309:判断当前温度的逻辑值是否为第二逻辑值1,如果是,则执行步骤310,否则结束当前流程。
在本发明实施例中,获取当前温度的逻辑值后,根据if语句进行判断,结合该实施例中的上述步骤,能够判断出当前温度的逻辑值=1,从而也表明当前第一次检测当前温度的过程中温度存在异常,因此,执行步骤310。
步骤310:判断当前已经连续确定出当前温度的逻辑值为第二逻辑值1的次数是否达到预先设置的次数阈值3次,如果否,则执行步骤311,如果是,执行步骤312。
当判断当前温度对应的逻辑值为1的次数时,同样以判断3次为例,在该实施例中第一次判断的逻辑值为1,假定如果后两次判断的逻辑值分别为1、1,那么当前温度值对应的逻辑值为1的次数就为3次,达到了阈值次数3次,因此执行312。
步骤311:确定当前输入电压为外界干扰,并对当前输入电压进行自恢复处理,结束当前流程。
步骤312:确定为电源故障,并置高温度对应的79H状态位中的相应位,进行报警通知系统。
以温度对应的是“79H状态位中低8位中的第3位”为例,由于该实施例中当前温度故障为电源故障,因此,将79H状态位中低8位中的第3位由0替换为1,从而报警通知系统有电源故障发生。其中,应预先设置好79H状态位的每一位与不同监测参数之间的对应关系,并且79H状态位是在一个大的寄存器内,该寄存器可以包括所有可能发生的故障类型。
步骤313:电源报警后,用户可通过查询79H状态位中的相应位查看电源故障的类型。
以查询是否发生高温电源故障为例,包括如下处理:首先找到79H状态位所在的寄存器,假定为6号,然后查找预先设置的对应关系,并根据该对应关系中状态位与高温的对应关系,即高温对应于79H状态位中低8位中的第3位,在6号寄存器中找到这一位,在该实施例中,由上述步骤可知,对79H状态位中低8位中的第3位查询的逻辑值为1,表明有高温电源故障。上述图2和图3以监测参数包括电压和温度为例,分别描述了针对电压和温度进行监测,从而判断电源是否发生了电压类型的电源故障和温度类型的电源故障。
当监测参数中包括其他类型的参数时,比如,上述可以设置8个寄存器,对8种类型的监测参数进行监测及判断,则对于其他六种类型的监测参数类似,其实现过程的原理与上述图2和图3过程中的相同,比如包括:分别使用对应的设备监测出监测参数的当前值,并根据相应的阈值范围进行比较,获得第一逻辑值或第二逻辑值,通过对获取到的逻辑值进行至少两次判断,从而确定出其他六种类型的监测参数是否为外界干扰或电源故障。
如图4、图5所示,本发明实施例提供了一种服务器电源PSU故障确定装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图4所示,为本发明实施例提供的一种服务器电源PSU故障确定装置所在设备的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图5所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的一种服务器电源PSU故障确定装置,包括:
一种服务器电源PSU故障确定装置,参见图5,包括:
侦测单元501、逻辑值处理单元502、信息存储单元503、故障确定单元504,其中,
所述侦测单元501,用于侦测至少一种对应PSU的当前监测参数;
所述逻辑值处理单元502,用于将所述侦测单元501侦测到的所述当前监测参数与预先设置的当前监测参数的阈值进行比较,在当前监测参数正常时,将第一逻辑值存储在所述信息存储单元503的第一故障状态字地址位中,在当前监测参数异常时,将第二逻辑值存储在所述信息存储单元503的第一故障状态字地址位中;
所述信息存储单元503在所述第一故障状态字地址位中保存第一逻辑值或第二逻辑值;
所述故障确定单元504,用于解析所述信息存储单元503中的所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;判断所述逻辑值是否为第二逻辑值,当判断结果为是时,则确定已经连续判断出所述逻辑值为所述第二逻辑值次数,在达到预先设置的次数阈值时,确定为电源故障,否则为外界干扰。
在本发明一个实施例中,所述信息存储单元503包括8个寄存器;
所述8个寄存器的地址空间分布依次包括:7Ah-82h;每一个寄存器中均包括至少一个故障状态字地址位;不同类型的监测参数与不同寄存器中的故障状态字地址位存在第一对应关系;
所述逻辑值处理单元502,用于根据所述当前监测参数,在所述第一对应关系中查找与所述当前监测参数对应的第一寄存器中的第一故障状态字地址位,将所述第一逻辑值存储在所述第一寄存器中的第一故障状态字地址位中。
在本发明一个实施例中,所述故障确定单元504进一步用于在确定为所述外界干扰之后,将所述信息存储单元中第一故障状态字地址位中的值由所述第二逻辑值替换为所述第一逻辑值。
在本发明一个实施例中,进一步包括:79H状态位;
所述79H状态位中的每一位与相应的监测参数之间存在第二对应关系;
所述故障确定单元504进一步用于在确定电源故障后,根据所述第二对应关系,将所述79H状态位中对应的状态位置为对应于指示故障的逻辑值。
综上,本发明各个实施例至少具有如下有益效果:
1、在本发明实施例中,通过检测当前监测参数在故障状态字地址位中的逻辑值,从而可以确定当前监测参数是否异常,如果确定为异常,继续针对当前逻辑值进行次数检验,若未达到预先设置的阈值次数,则表明为外界干扰,通过将当前逻辑值置为指示故障的逻辑值,消除干扰,恢复供电,无需进行报警,若达到预先设置的阈值次数,则表明为电源故障,于是报警通知系统,从而完成了对电源PSU故障类型的判断。
2、在本发明实施例中,通过预先设置不同类型的监测参数与不同的故障状态字地址位的对应关系,那么,在查找当前监测参数对应的逻辑值时,根据这个对应关系可以很方便的获取到相应的逻辑值,从而可以完成对不同类型监测参数的故障判断。
3、在本发明实施例中,通过替换当前异常监测参数的逻辑值,可以实现对当前干扰的处理,从而减少了由于外界干扰导致的误报警次数,降低了电源故障率,同时也避免了多次无故障的人工维修。
4、在本发明实施例中,通过置高当前电源故障对应的79H状态位中的一位,可以报警通知系统当前有电源故障,而且,在确定有电源故障之后,用户也可以根据系统中当前置高79H状态位中的那一位确定具体发生了哪种电源故障。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (8)

1.一种服务器电源PSU故障确定方法,其特征在于,针对PSU设置至少一种监测参数,包括:
侦测对应PSU的当前监测参数,将所述当前监测参数与预先设置的当前监测参数的阈值比较,如果所述当前监测参数正常,则将第一逻辑值存储在查找到的第一故障状态字地址位中;如果所述当前监测参数异常,则将第二逻辑值存储在所述第一故障状态字地址位中;
解析所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;
判断所述逻辑值是否为第二逻辑值,如果是,则确定已经连续判断出所述逻辑值为所述第二逻辑值的次数,如果达到预先设置的次数阈值,则确定为电源故障,否则为外界干扰。
2.根据权利要求1所述的方法,其特征在于,该方法进一步包括:
划分出地址空间7Ah-82h,将地址空间7Ah-82h中的每一个地址位分别设置为一个故障状态字地址位;
设置不同类型的监测参数与不同的故障状态字地址位的第一对应关系;
所述第一故障状态字地址位的所述查找包括:根据所述当前监测参数,在所述第一对应关系中查找与所述当前监测参数对应的第一故障状态字地址位。
3.根据权利要求1所述的方法,其特征在于,在所述判断为外界干扰之后,进一步包括:
将所述第一故障状态字地址位中的值由所述第二逻辑值替换为所述第一逻辑值。
4.根据权利要求1至4中任一所述的方法,其特征在于,该方法进一步包括:预先设置79H状态位中的每一位与相应的监测参数之间的第二对应关系;
在所述确定为电源故障之后,进一步包括:
查找79H状态位中与当前监测参数对应的状态位;
将查找到的状态位置为对应于指示故障的逻辑值。
5.一种服务器电源PSU故障确定装置,包括:
侦测单元、逻辑值处理单元、信息存储单元、故障确定单元,其中,
所述侦测单元,用于侦测至少一种对应PSU的当前监测参数;
所述逻辑值处理单元,用于将所述侦测单元侦测到的所述当前监测参数与预先设置的当前监测参数的阈值进行比较,在当前监测参数正常时,将第一逻辑值存储在所述信息存储单元的第一故障状态字地址位中,在当前监测参数异常时,将第二逻辑值存储在所述信息存储单元的第一故障状态字地址位中;
所述信息存储单元在所述第一故障状态字地址位中保存第一逻辑值或第二逻辑值;
所述故障确定单元,用于解析所述信息存储单元中的所述第一故障状态字地址位,并获取所述第一故障状态字地址位中的逻辑值;判断所述逻辑值是否为第二逻辑值,当判断结果为是时,则确定已经连续判断出所述逻辑值为所述第二逻辑值次数,在达到预先设置的次数阈值时,确定为电源故障,否则为外界干扰。
6.根据权利要求5所述的一种服务器电源PSU故障确定装置,其特征在于,所述信息存储单元包括8个寄存器;
所述8个寄存器的地址空间分布依次包括:7Ah-82h;每一个寄存器中均包括至少一个故障状态字地址位;不同类型的监测参数与不同寄存器中的故障状态字地址位存在第一对应关系;
所述逻辑值处理单元,用于根据所述当前监测参数,在所述第一对应关系中查找与所述当前监测参数对应的第一寄存器中的第一故障状态字地址位,将所述第一逻辑值存储在所述第一寄存器中的第一故障状态字地址位中。
7.根据权利要求5所述的一种服务器电源PSU故障确定装置,其特征在于,所述故障确定单元进一步用于在确定为所述外界干扰之后,将所述信息存储单元中第一故障状态字地址位中的值由所述第二逻辑值替换为所述第一逻辑值。
8.根据权利要求5至7任一所述的一种服务器电源PSU故障确定装置,其特征在于,进一步包括:79H状态位;
所述79H状态位中的每一位与相应的监测参数之间存在第二对应关系;
所述故障确定单元进一步用于在确定电源故障后,根据所述第二对应关系,将所述79H状态位中对应的状态位置为对应于指示故障的逻辑值。
CN201610645287.2A 2016-08-08 2016-08-08 一种服务器电源psu故障确定方法及装置 Pending CN106292986A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610645287.2A CN106292986A (zh) 2016-08-08 2016-08-08 一种服务器电源psu故障确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610645287.2A CN106292986A (zh) 2016-08-08 2016-08-08 一种服务器电源psu故障确定方法及装置

Publications (1)

Publication Number Publication Date
CN106292986A true CN106292986A (zh) 2017-01-04

Family

ID=57666706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610645287.2A Pending CN106292986A (zh) 2016-08-08 2016-08-08 一种服务器电源psu故障确定方法及装置

Country Status (1)

Country Link
CN (1) CN106292986A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002412A (zh) * 2018-07-03 2018-12-14 郑州云海信息技术有限公司 基于I2C总线hold time定位通信故障的系统及方法
CN110399029A (zh) * 2019-07-19 2019-11-01 广东浪潮大数据研究有限公司 一种供电故障类型的定位方法、设备、介质及装置
CN110488205A (zh) * 2018-10-24 2019-11-22 新华三技术有限公司 一种故障识别装置
CN110618909A (zh) * 2019-09-27 2019-12-27 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN111488050A (zh) * 2020-04-16 2020-08-04 苏州浪潮智能科技有限公司 一种电源监控方法、系统及服务器
CN112327795A (zh) * 2020-10-16 2021-02-05 东风汽车股份有限公司 一种自行小车运行过程中的故障诊断方法
CN112346552A (zh) * 2020-10-15 2021-02-09 宁畅信息产业(北京)有限公司 电源监测方法、装置、计算机设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033547A1 (en) * 2001-08-07 2003-02-13 Larson Thane M. System and method for power management in a server system
CN103744769A (zh) * 2014-01-18 2014-04-23 浪潮电子信息产业股份有限公司 一种基于逻辑芯片cpld的快速定位服务器电源故障的方法
CN103795459A (zh) * 2013-11-22 2014-05-14 青岛海信宽带多媒体技术有限公司 基于光模块中故障的处理方法和装置及光模块

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033547A1 (en) * 2001-08-07 2003-02-13 Larson Thane M. System and method for power management in a server system
CN103795459A (zh) * 2013-11-22 2014-05-14 青岛海信宽带多媒体技术有限公司 基于光模块中故障的处理方法和装置及光模块
CN103744769A (zh) * 2014-01-18 2014-04-23 浪潮电子信息产业股份有限公司 一种基于逻辑芯片cpld的快速定位服务器电源故障的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002412A (zh) * 2018-07-03 2018-12-14 郑州云海信息技术有限公司 基于I2C总线hold time定位通信故障的系统及方法
CN110488205A (zh) * 2018-10-24 2019-11-22 新华三技术有限公司 一种故障识别装置
US11719757B2 (en) 2018-10-24 2023-08-08 New H3C Technologies Co., Ltd. Fault recognition
CN110399029A (zh) * 2019-07-19 2019-11-01 广东浪潮大数据研究有限公司 一种供电故障类型的定位方法、设备、介质及装置
CN110618909A (zh) * 2019-09-27 2019-12-27 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN110618909B (zh) * 2019-09-27 2021-03-26 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN111488050A (zh) * 2020-04-16 2020-08-04 苏州浪潮智能科技有限公司 一种电源监控方法、系统及服务器
CN111488050B (zh) * 2020-04-16 2022-04-22 苏州浪潮智能科技有限公司 一种电源监控方法、系统及服务器
CN112346552A (zh) * 2020-10-15 2021-02-09 宁畅信息产业(北京)有限公司 电源监测方法、装置、计算机设备和存储介质
CN112346552B (zh) * 2020-10-15 2023-05-26 宁畅信息产业(北京)有限公司 电源监测方法、装置、计算机设备和存储介质
CN112327795A (zh) * 2020-10-16 2021-02-05 东风汽车股份有限公司 一种自行小车运行过程中的故障诊断方法

Similar Documents

Publication Publication Date Title
CN106292986A (zh) 一种服务器电源psu故障确定方法及装置
CN105698970B (zh) 一种电池包温度检测电路故障诊断方法
CN105137163A (zh) 金属氧化物压敏电阻型避雷器或浪涌保护器的阻性漏电流在线监测方法
CN109782111B (zh) 一种三相三线制的电能计量系统错误接线分析方法
CN105955858A (zh) 一种测试bmc日志记录功能的方法及装置
GB2476246A (en) Diagnosing an operation mode of a machine
CN109861857A (zh) 故障检测方法及装置
CN108955951A (zh) 一种温度传感器故障判断方法及装置
CN107255526A (zh) 一种温度检测方法、检测模块及检测系统
CN104574771A (zh) 一种复合式线型感温火灾探测器及其报警方法
US20100173183A1 (en) Systems and Methods of Battery Cell Anomaly Detection
CN109239489A (zh) 一种用于储能系统的健康状态在线分析方法、装置及介质
CN105182249A (zh) 一种大功率开关电源的故障诊断方法
CN215181618U (zh) 一种温度采样系统、变频器和伺服控制系统
US20210296713A1 (en) Detection method and detection device for branch states of battery system
CN110398649B (zh) 基于电压差/电流轨迹图在线检测变压器绕组变形的方法
CN109633357B (zh) 三母线中多母线接地绝缘监测方法和监测装置
CN110376463A (zh) 避雷器在线监测装置
CN205861834U (zh) 故障测试仪
Oh A simple sensor fault detection algorithm
CN104330617B (zh) 一种高精度脉冲功率检测模块
CN204288419U (zh) 一种高灵敏复合线型感温火灾探测器
JP6298202B1 (ja) 電線検査装置
CN106776169A (zh) 一种测试服务器的psu的方法及装置
CN107870298B (zh) 一种分压电路的电路参数检测电路、方法及电能表

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104

RJ01 Rejection of invention patent application after publication