CN105955864B - 电源故障处理方法、电源模块、监控管理模块及服务器 - Google Patents

电源故障处理方法、电源模块、监控管理模块及服务器 Download PDF

Info

Publication number
CN105955864B
CN105955864B CN201610266427.5A CN201610266427A CN105955864B CN 105955864 B CN105955864 B CN 105955864B CN 201610266427 A CN201610266427 A CN 201610266427A CN 105955864 B CN105955864 B CN 105955864B
Authority
CN
China
Prior art keywords
fault warning
warning information
power module
information
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610266427.5A
Other languages
English (en)
Other versions
CN105955864A (zh
Inventor
李冠广
黄家明
乔英良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610266427.5A priority Critical patent/CN105955864B/zh
Publication of CN105955864A publication Critical patent/CN105955864A/zh
Application granted granted Critical
Publication of CN105955864B publication Critical patent/CN105955864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Abstract

本发明公开了一种电源故障处理方法,用于服务器,包括:检测电源是否发生故障;若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性;本发明还公开了一种电源模块、监控管理模块及服务器。

Description

电源故障处理方法、电源模块、监控管理模块及服务器
技术领域
本发明涉及服务器技术领域,特别涉及一种电源故障处理方法、电源模块、监控管理模块及服务器。
背景技术
随着用户对计算机的计算需求的提高,用户对单台计算机的稳定性和可靠性的要求越来越高。服务器电源模块是服务器长期稳定运行最重要的模块,服务器电源模块的状态异常不能及时发现可能导致服务器因供电异常而出现宕机。服务器电源模块发生故障之后,在极短的时间之内故障恢复。该故障信息如果不能被监控管理模块监控和处理,可以会因为电源模块的异常导致服务器不能正常稳定的运行。目前在服务器的电源模块对该故障处理机制尚不明确,如果电源模块按照传统服务器的工作模式进行工作,很难满足高可靠性和高稳定性服务器管理的要求。因此,如何提高服务器的可靠性和稳定性,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种电源故障处理方法,该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性;本发明的另一目的是提供一种电源模块、监控管理模块及服务器。
为解决上述技术问题,本发明提供一种电源故障处理方法,用于服务器,包括:
检测电源是否发生故障;
若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;
当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
其中,所述设置故障告警信息,包括:
将所述故障对应的故障告警状态字设置为1。
本发明还提供一种电源模块,包括:
检测单元,用于检测电源是否发生故障;
设置单元,用于若是,则设置故障告警信息;
第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
其中,所述设置单元为将所述故障对应的故障告警状态字设置为1的单元。
本发明还提供一种电源故障处理方法,用于服务器,包括:
读取电源模块的故障告警信息;
判断所述故障告警信息对应的电源故障是否恢复;
若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
若否,则按照第二预定程序对所述故障告警信息进行处理;当对应的电源故障恢复时,向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息。
其中,所述使得所述电源模块清除所述故障告警信息之后,还包括:
确认所述故障告警信息是否清除;
若否,则进行报警。
本发明还提供一种监控管理模块,包括:
读取单元,用于读取电源模块的故障告警信息;
判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
其中,还包括:
确认单元,用于确认所述故障告警信息是否清除;
报警单元,用于若否,则进行报警。
本发明还提供一种服务器,包括:电源模块和监控管理模块;其中,
所述电源模块包括:
检测单元,用于检测电源是否发生故障;
设置单元,用于若是,则设置故障告警信息;
第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;
所述监控管理模块包括:
读取单元,用于读取电源模块的故障告警信息;
判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
其中,所述电源模块与所述监控管理模块通过I2C总线连接。
本发明所提供的电源故障处理方法,用于服务器,包括:检测电源是否发生故障;若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;
该方法通过对检测到的电源故障设置告警信息,且该故障告警信息不是在该故障解决后自行消除,而必须是在监控管理模块确认记录该故障告警信息且故障解决后通过监控管理模块发送的故障告警信息清除指令后,才可以清除该故障告警信息;防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;因此该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性;本发明还提供一种电源模块、监控管理模块及服务器。
附图说明
为了更清除地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的电源故障处理方法的流程图;
图2为本发明实施例所提供的电源模块的结构框图;
图3为本发明实施例所提供的另一电源故障处理方法的流程图;
图4为本发明实施例所提供的监控管理模块的结构框图;
图5为本发明实施例所提供的服务器的结构框图。
具体实施方式
本发明的核心是提供一种电源故障处理方法,该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
为使本发明实施例的目的、技术方案和优点更加清除,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清除、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的电源故障处理方法的流程图;该方法用于服务器可以包括:
S100、检测电源是否发生故障;
其中,这里的故障通常可以通过检测电源的在位信息、健康状态信息和输入输出电压、电流功耗信息来获取,将获取的信息与对应信息的正常状态进行对比,可以判断电源是否出现故障。
S110、若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;
S120、当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
其中,当电源模块存在故障时,设置对应的故障告警信息,使得监测管理模块能够获知电源故障,并且按照该故障对应的处理程序进行故障处理;设置的方式可以是通过状态字进行设置,也可以是通过标识进行设置;可选的,所述设置故障告警信息,包括:
将所述故障对应的故障告警状态字设置为1。
该故障告警信息可以被监控管理模块读取。
这里故障处理的结果无论是清除故障还是未清除故障都不能够清除该故障告警信息;该故障告警信息的清除只能够在接收到监控管理模块发送的故障告警信息清除指令才可以清除。这样做的目的是防止电源故障在极短的时间内被消除后,导致监测管理模块不能获取该故障信息,不能够对电源状态做出准确的分析,可能会导致电源大故障的出现。即故障告警信息被清除的条件是:电源模块故障告警信息已经恢复状态,且监控管理模块发送故障清除命令,否则,电源模块故障告警信息不能被清除。
基于上述技术方案,本发明实施例提供的电源故障处理方法,能够防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
下面对本发明实施例提供的电源模块进行介绍,下文描述的电源模块、与上文描述的电源故障处理方法可相互对应参照。
请参考图2,图2为本发明实施例所提供的电源模块的结构框图;该电源模块可以包括:
检测单元110,用于检测电源是否发生故障;
设置单元120,用于若是,则设置故障告警信息;
第一处理单元130,用于按照第一预定程序对所述故障告警信息进行处理;
清除单元140,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息。
可选的,所述设置单元120为将所述故障对应的故障告警状态字设置为1的单元。
请参考图3,图3为本发明实施例所提供的另一电源故障处理方法的流程图;该方法可以包括:
S200、读取电源模块的故障告警信息;
S210、判断所述故障告警信息对应的电源故障是否恢复;
S220、若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
S230、若否,则按照第二预定程序对所述故障告警信息进行处理;当对应的电源故障恢复时,向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息。
其中,监测管理模块读取到该故障告警信息后,首先判断该故障是否还存在,若是,则按照正常处理电源故障的流程对该故障进行处理,并在故障消除后,发送故障告警信息清除指令。若不存在,则记录该故障告警信息并发送故障告警信息清除指令。这样可以保证监测管理模块能够获取电源的全部故障信息,使得技术人员能够对电源的状态进行准确、可靠的评估,保证服务器的稳定性和可靠性。
基于上述技术方案,本发明实施例提供的电源故障处理方法,能够防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
基于上述技术方案,所述使得所述电源模块清除所述故障告警信息之后,还包括:
确认所述故障告警信息是否清除;
若否,则进行报警。
其中,该步骤可以防止出现故障信息清除错误,及时进行系统的维护,提高故障告警信息的准确性和可靠性。
下面对本发明实施例提供的监控管理模块及服务器进行介绍,下文描述的监控管理模块及服务器与上文描述的电源故障处理方法可相互对应参照。
请参考图4,图4为本发明实施例所提供的监控管理模块的结构框图;该模块可以包括:
读取单元210,用于读取电源模块的故障告警信息;
判断单元220,用于判断所述故障告警信息对应的电源故障是否恢复;
清除指令发送单元230,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
第二处理单元240,用于按照第二预定程序对所述故障告警信息进行处理。
基于上述技术方案,该监测管理模块还包括:
确认单元,用于确认所述故障告警信息是否清除;
报警单元,用于若否,则进行报警。
请参考图5,图5为本发明实施例所提供的服务器的结构框图,该服务器可以包括:电源模块100和监控管理模块200;其中,
所述电源模块100包括:
检测单元,用于检测电源是否发生故障;
设置单元,用于若是,则设置故障告警信息;
第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;
所述监控管理模块200包括:
读取单元,用于读取电源模块的故障告警信息;
判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
可选的,所述电源模块与所述监控管理模块通过I2C总线连接。
电源模块是服务器长期稳定运行最重要的模块,服务器电源模块的状态异常若不能及时发现可能导致服务器因供电异常而出现宕机。该服务器电源模块检测到发生电源故障之后,按照正常的逻辑设置电源模块的故障告警信息。电源模块故障告警信息被清除的条件是:电源模块故障告警信息已经恢复正常状态,且服务器监控管理模块发送故障告警清除命令,否则,电源模块故障告警信息不能被清除。服务器监控管理模块监测所正常检测电源的在位信息、健康状态和输入输出电压电流功耗信息,如果检测到电源模块故障信息,监控管理模块正常处理该故障信息,同时发送故障清除命令,清除电源模块故障告警信息。通过电源故障处理机制,可以确保在服务器电源模块发生故障之后,在极短的时间之内故障恢复,仍然可以被服务器监控管理模块获取故障的信息。具体故障处理需要如下步骤:
1、服务器的电源模块检测到发生故障之后,按照正常的逻辑设置电源模块的故障告警信息。该故障告警信息可以正常被监控管理模块读取到电源模块的故障信息。
2、定义电源模块的故障告警信息被清除的条件。电源模块告警信息已经恢复状态,且服务器监控管理模块发送故障告警信息清除命令,否则,电源模块告警信息不能被清除。
3、定义服务器监控管理模块处理逻辑。如果检测到电源模块故障信息,监控管理模块正常处理该故障信息,同时发送故障清除命令,清除电源模块故障告警信息。
基于上述技术方案,本发明实施例提供的服务器,能够防止出现监控管理模块不能获取短时间内的电源故障信息,进而不能准确评估电源模块健康状态,降低电源模块的稳定性;该方法能够确保监控管理模块能够获取全面、完整的电源故障信息,提高服务器电源管理的可靠性和稳定性。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清除地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的电源故障处理方法、电源模块、监控管理模块及服务器进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种电源故障处理方法,用于服务器,其特征在于,包括:
服务器的电源模块检测电源是否发生故障;
若是,则设置故障告警信息,并按照第一预定程序对所述故障告警信息进行处理;
当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;所述故障告警信息被清除的条件是:所述电源模块的所述故障告警信息已经恢复状态,且所述监控管理模块发送故障清除命令,否则,所述电源模块的所述故障告警信息不能被清除。
2.如权利要求1所述的电源故障处理方法,其特征在于,所述设置故障告警信息,包括:
将所述故障对应的故障告警状态字设置为1。
3.一种电源模块,其特征在于,包括:
检测单元,用于服务器的电源模块检测电源是否发生故障;
设置单元,用于若是,则设置故障告警信息;
第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;所述故障告警信息被清除的条件是:所述电源模块的所述故障告警信息已经恢复状态,且所述监控管理模块发送故障清除命令,否则,所述电源模块的所述故障告警信息不能被清除。
4.如权利要求3所述的电源模块,其特征在于,所述设置单元为将所述故障对应的故障告警状态字设置为1的单元。
5.一种电源故障处理方法,用于服务器,其特征在于,包括:
读取电源模块的故障告警信息;
判断所述故障告警信息对应的电源故障是否恢复;
若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
若否,则按照第二预定程序对所述故障告警信息进行处理;当对应的电源故障恢复时,向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;所述故障告警信息被清除的条件是:所述电源模块的所述故障告警信息已经恢复状态,且所述监控管理模块发送故障清除命令,否则,所述电源模块的所述故障告警信息不能被清除。
6.如权利要求5所述的电源故障处理方法,其特征在于,所述使得所述电源模块清除所述故障告警信息之后,还包括:
确认所述故障告警信息是否清除;
若否,则进行报警。
7.一种服务器,其特征在于,包括:电源模块和监控管理模块;其中,
所述电源模块包括:
检测单元,用于检测电源是否发生故障;
设置单元,用于若是,则设置故障告警信息;
第一处理单元,用于按照第一预定程序对所述故障告警信息进行处理;
清除单元,用于当接收到监控管理模块发送的所述故障告警信息清除指令时,清除所述故障告警信息;所述故障告警信息被清除的条件是:所述电源模块的所述故障告警信息已经恢复状态,且所述监控管理模块发送故障清除命令,否则,所述电源模块的所述故障告警信息不能被清除;
所述监控管理模块包括:
读取单元,用于读取电源模块的故障告警信息;
判断单元,用于判断所述故障告警信息对应的电源故障是否恢复;
清除指令发送单元,用于若是,则向所述电源模块发送所述故障告警信息清除指令,使得所述电源模块清除所述故障告警信息;
第二处理单元,用于按照第二预定程序对所述故障告警信息进行处理。
8.如权利要求7所述的服务器,其特征在于,所述电源模块与所述监控管理模块通过I2C总线连接。
CN201610266427.5A 2016-04-26 2016-04-26 电源故障处理方法、电源模块、监控管理模块及服务器 Active CN105955864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610266427.5A CN105955864B (zh) 2016-04-26 2016-04-26 电源故障处理方法、电源模块、监控管理模块及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610266427.5A CN105955864B (zh) 2016-04-26 2016-04-26 电源故障处理方法、电源模块、监控管理模块及服务器

Publications (2)

Publication Number Publication Date
CN105955864A CN105955864A (zh) 2016-09-21
CN105955864B true CN105955864B (zh) 2019-05-28

Family

ID=56916026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610266427.5A Active CN105955864B (zh) 2016-04-26 2016-04-26 电源故障处理方法、电源模块、监控管理模块及服务器

Country Status (1)

Country Link
CN (1) CN105955864B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106843441A (zh) * 2017-01-24 2017-06-13 深圳企管加企业服务有限公司 设备监控方法、服务器以及监控系统
CN108983114B (zh) * 2018-08-07 2020-07-28 山东卡尔电气股份有限公司 带故障诊断功能的身份证解码服务器及其故障诊断方法
CN114442786B (zh) * 2022-01-21 2023-07-14 苏州浪潮智能科技有限公司 一种电源故障告警及恢复方法、装置及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488881A (zh) * 2008-01-17 2009-07-22 鼎桥通信技术有限公司 一种故障处理方法
CN101840369A (zh) * 2010-04-14 2010-09-22 浪潮电子信息产业股份有限公司 一种远程控制并诊断服务器电源故障的方法
JP4819751B2 (ja) * 2007-06-08 2011-11-24 キヤノン株式会社 監視装置及び監視方法、並びにプログラム
CN103560279A (zh) * 2013-11-21 2014-02-05 上海航天电源技术有限责任公司 基于can总线的电池管理系统诊断系统及其诊断维护方法
CN104363120A (zh) * 2014-11-12 2015-02-18 北京百度网讯科技有限公司 服务器的运行环境监控、保护方法和系统
JP2015060333A (ja) * 2013-09-18 2015-03-30 日本電気株式会社 多重化電力供給システム、情報処理装置および監視機器
CN204406322U (zh) * 2015-02-04 2015-06-17 浪潮电子信息产业股份有限公司 一种服务器电源监控系统
CN105471621A (zh) * 2015-11-12 2016-04-06 浪潮通信信息系统有限公司 一种告警处理系统及方法
CN105550100A (zh) * 2015-12-11 2016-05-04 国家电网公司 一种信息系统故障自动恢复的方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4819751B2 (ja) * 2007-06-08 2011-11-24 キヤノン株式会社 監視装置及び監視方法、並びにプログラム
CN101488881A (zh) * 2008-01-17 2009-07-22 鼎桥通信技术有限公司 一种故障处理方法
CN101840369A (zh) * 2010-04-14 2010-09-22 浪潮电子信息产业股份有限公司 一种远程控制并诊断服务器电源故障的方法
JP2015060333A (ja) * 2013-09-18 2015-03-30 日本電気株式会社 多重化電力供給システム、情報処理装置および監視機器
CN103560279A (zh) * 2013-11-21 2014-02-05 上海航天电源技术有限责任公司 基于can总线的电池管理系统诊断系统及其诊断维护方法
CN104363120A (zh) * 2014-11-12 2015-02-18 北京百度网讯科技有限公司 服务器的运行环境监控、保护方法和系统
CN204406322U (zh) * 2015-02-04 2015-06-17 浪潮电子信息产业股份有限公司 一种服务器电源监控系统
CN105471621A (zh) * 2015-11-12 2016-04-06 浪潮通信信息系统有限公司 一种告警处理系统及方法
CN105550100A (zh) * 2015-12-11 2016-05-04 国家电网公司 一种信息系统故障自动恢复的方法及系统

Also Published As

Publication number Publication date
CN105955864A (zh) 2016-09-21

Similar Documents

Publication Publication Date Title
US7844866B2 (en) Mechanism to report operating system events on an intelligent platform management interface compliant server
CN107145410B (zh) 一种系统异常掉电后自动上电开机的方法、系统及设备
CN105955864B (zh) 电源故障处理方法、电源模块、监控管理模块及服务器
CN103490919A (zh) 故障管理系统和故障管理方法
CN107677899A (zh) 基于物联网的机房电磁干扰监控系统
CN111444067A (zh) 一种基于规则引擎的配置化系统监控方法、装置及设备
CN109240863A (zh) 一种cpu故障定位方法、装置、设备及存储介质
CN106909307A (zh) 一种管理双活存储阵列的方法及装置
CN108958965A (zh) 一种bmc监控可恢复ecc错误的方法、装置及设备
CN109766248A (zh) 系统故障信号获取方法、装置、服务器及可读存储介质
CN108287774A (zh) 一种服务器的故障诊断方法、装置、设备及存储介质
CN112463501A (zh) 一种异常掉电的故障快速定位方法、设备及存储介质
CN111625386A (zh) 一种针对系统设备上电超时的监控方法和装置
CN115794588A (zh) 内存故障预测方法、装置、系统及监测服务器
CN100351806C (zh) 具有专用系统管理总线的计算机系统
CN115027271A (zh) 混合动力车辆的故障提示方法和车辆
CN109150626A (zh) Ftp服务监测方法、装置、终端及计算机可读存储介质
CN103995759A (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN106897189A (zh) 一种基于数据实时推送的日志监控系统
CN116483663A (zh) 用于平台的异常告警方法和装置
CN107957719B (zh) 机器人及其异常监控方法和装置
CN108920329A (zh) 硬盘状态的监控方法、装置、系统及计算机可读存储介质
CN114915541A (zh) 系统故障排除方法及装置、电子设备及存储介质
CN113533891A (zh) 一种故障诊断系统及装置
CN112134760A (zh) 链路状态监控方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant