CN115242603B - 故障状态管理方法、装置、电子设备及存储介质 - Google Patents

故障状态管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115242603B
CN115242603B CN202210862163.5A CN202210862163A CN115242603B CN 115242603 B CN115242603 B CN 115242603B CN 202210862163 A CN202210862163 A CN 202210862163A CN 115242603 B CN115242603 B CN 115242603B
Authority
CN
China
Prior art keywords
fault
information
processing
state
personnel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210862163.5A
Other languages
English (en)
Other versions
CN115242603A (zh
Inventor
李锦勋
张鸿飞
周昊阳
董永楠
马然
潘月来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianyi Enhua Technology Co ltd
Original Assignee
Beijing Tianyi Enhua Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianyi Enhua Technology Co ltd filed Critical Beijing Tianyi Enhua Technology Co ltd
Priority to CN202210862163.5A priority Critical patent/CN115242603B/zh
Publication of CN115242603A publication Critical patent/CN115242603A/zh
Application granted granted Critical
Publication of CN115242603B publication Critical patent/CN115242603B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Abstract

本申请涉及一种故障状态管理方法、装置、电子设备及存储介质。其中,视频处理方法包括:接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态;根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则;基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态;当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态;其中,所述故障规则包括对故障进行分类的条件。

Description

故障状态管理方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其是涉及一种故障状态管理方法、装置、电子设备及存储介质。
背景技术
企业在运维的过程中,通常都会使用监控报警软件来管理和监控生产环境的业务、设备、网络等。目前,市场上常见的报警与监控系统大多重监控轻运维,即报警与监控系统只负责触发并发送报警信号,不注重报警之后的处理流程。
在这种情况下,运维人员很难确定报警是否有人去处理,以及当前各故障的处理的具体情况,从而导致运维人员不能及时对工作部署作出调整,进而导致业务中断和财产损失,降低了生产工作的效率。
发明内容
本申请提供一种故障状态管理方法、装置、电子设备及存储介质,旨在提供一种更加清晰的故障状态管理办法,提高工作效率。
第一方面,本申请提供一种故障状态管理方法,包括:
接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态;
根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则;
基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态;
当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态;
其中,所述故障规则包括对故障进行分类的条件。
本申请在接收到报警信号后,通过对故障处理进行处理并将处理过程进行阶段化标记,标注出故障处理的现阶段的状态,使运维人员能够清楚地获悉故障的处理情况,从而依据处理情况,分配工作任务,避免由于故障带来的业务中断和财产损失,提高工作效率。
可选的,所述基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人对故障进行处理,更改所述故障状态为故障处理中状态,包括:
根据所述故障信息,提取故障发生节点的故障级别和故障关键字信息;
基于所述故障级别和所述故障关键字信息,根据所述故障规则,确定所述故障类型;
针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理。
通过提取故障的故障级别和故障关键字信息,并根据故障规则,可以确定故障类型,通过确定故障的具体类型,可以将所述故障信息发送给对应的故障处理人员,提高了处理故障的效率。
可选的,所述针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理,包括:
针对不同的故障类型,确定处理时间和处理方案;
将所述故障信息发送给对应的第一故障处理人员,提示所述第一故障处理人员在所述处理时间内,按照所述处理方案对故障进行处理。
针对不同的故障类型,通过预先确定处理时间和处理方案,可以将故障的处理过程透明化,提高了处理故障的工作效率。
可选的,针对不同的故障类型,确定处理时间和处理方案,包括:
根据所述故障信息,在所述故障处理数据库中检索是否存在相同故障;
若存在相同故障,则优先确定所述故障处理数据库中的处理方案为本次故障的处理方案。
通过预先检索故障处理数据库中检索是否存在相同故障,如果存在相同故障,可以采用使用过的方案对本次故障进行处理,跳过了故障处理人员在处理故障初期的测试和摸索阶段,提高了处理故障的工作效率。
可选的,所述方法还包括:
若在所述处理时间内没有接收到所述反馈信息,更改故障状态为故障逾期状态;
根据所述故障类型,将所述故障信息发送给对应的第二故障处理人员对故障进行处理。
通过设置故障逾期状态,可以使运维人员清楚地获悉当前故障处理的情况,及时派遣第二故障处理人员协助处理故障,提高了处理故障的工作效率。
可选的,所述方法还包括:
当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查;
若故障仍然存在,则更改所述故障状态为故障未处理状态;
根据故障信息重新判断故障类型,并将所述故障信息发送给第三故障处理人员对故障进行处理。
当第一故障处理人员处理完成后,通过重新检查故障节点,排查是否还存在故障,若仍然存在故障,通过重新判断故障类型,重新对故障进行处理,提高故障处理结果的可靠性。
可选的,所述反馈信息包括故障恢复关键字信息;
所述当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查,包括:
对故障设备的工作日志进行扫描,在所述工作日志中检索所述故障恢复关键字信息;
若在所述工作日志中检索到所述故障恢复关键字信息,则说明故障消除,更改故障状态为故障处理完成状态。
通过在所述工作日志中检索到所述故障恢复关键字信息,排查故障是否还存在,若检索到故障恢复关键字信息,就可以说明故障已经消除,通过这种方法,可以提高处理故障的工作效率。
第二方面,本申请提供一种故障状态管理装置,包括:
信息获取模块,用于接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态;
故障规则选取模块,用于根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则;
故障处理模块,用于基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态;
故障处理信息记录模块,用于当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态;
其中,所述故障规则包括对故障进行分类的条件。
可选的,所述故障处理模块,具体用于:
根据所述故障信息,提取故障发生节点的故障级别和故障关键字信息;
基于所述故障级别和所述故障关键字信息,根据所述故障规则,确定所述故障类型;
针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理。
可选的,所述故障处理模块在针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理时,具体用于:
针对不同的故障类型,确定处理时间和处理方案;
将所述故障信息发送给对应的第一故障处理人员,提示所述第一故障处理人员在所述处理时间内,按照所述处理方案对故障进行处理。
可选的,所述故障处理模块针对不同的故障类型,确定处理时间和处理方案时,具体用于:
根据所述故障信息,在所述故障处理数据库中检索是否存在相同故障;
若存在相同故障,则优先确定所述故障处理数据库中的处理方案为本次故障的处理方案。
可选的,所述装置还包括:故障逾期处理模块,用于:
若在所述处理时间内没有接收到所述反馈信息,更改故障状态为故障逾期状态;
根据所述故障类型,将所述故障信息发送给对应的第二故障处理人员对故障进行处理。
可选的,所述装置还包括:处理结果检查模块,用于:
当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查;
若故障仍然存在,则更改所述故障状态为故障未处理状态;
根据故障信息重新判断故障类型,并将所述故障信息发送给第三故障处理人员对故障进行处理。
可选的,所述反馈信息包括故障恢复关键字信息;
所述处理结果检查模块在当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查时,具体用于:
对故障设备的工作日志进行扫描,在所述工作日志中检索所述故障恢复关键字信息;
若在所述工作日志中检索到所述故障恢复关键字信息,则说明故障消除,更改故障状态为故障处理完成状态。
第三方面,本申请提供一种电子设备,包括:存储器和处理器,所述存储器上存储有能够被处理器加载并执行如第一方面任一种方法的计算机程序。
第四方面,本申请提供一种计算机可读存储介质,存储有能够被处理器加载并执行如第一方面任一种方法的计算机程序。
本申请在接收到报警信号后,通过对故障处理进行处理并将处理过程进行阶段化标记,标注出故障处理的现阶段的状态,使运维人员能够清楚地获悉故障的处理情况,从而依据处理情况,分配工作任务,避免由于故障带来的业务中断和财产损失,提高工作效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的一种应用场景示意图;
图2为本申请一实施例提供的一种故障状态管理方法的流程图;
图3为本申请一实施例提供的另一种故障状态管理方法的流程图;
图4为本申请一实施例提供的一种故障状态管理装置的结构示意图;
图5为本申请一实施例提供的一种故障状态管理设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
下面结合说明书附图对本申请实施例作进一步详细描述。
图1为本申请提供的一种应用场景示意图,在本场景中需要在接收到故障发生的报警信号之后,跟踪故障的处理过程,使运维人员可以查看当前故障的处理状态。由于在设备发生故障之后,运维人员很难界定目前故障的处理情况,从而不能及时对工作部署作出调整,进而导致业务中断和财产损失,降低了生产工作的效率。为了避免上述问题,应用本申请提供的方法对故障的处理过程进行跟踪。具体的,可以将本申请的故障状态管理方法部署在服务器中。当有故障发生时,服务器执行本申请的方法,跟踪故障的处理过程,使运维人员可以查看当前故障的处理状态,提高相关人员的工作效率。
服务器处具体的处理过程的实现方式可以参考以下实施例。
图2为本申请一实施例提供的一种故障状态管理方法的流程图。本实施例的方法用于设备发生故障时,对故障的处理过程进行跟踪,从而使故障的处理过程流程化、透明化,可以应用于上述场景中的服务器,也可应用于其它具有计算能力的电子设备。如图2所示的,本实施例的方法包括:
S201、接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态。
在一些实现方式中,可以通过获取故障设备在发生故障时生成的工作日志,从而从日志中获取故障设备的设备信息和由故障设备产生的故障信息;在另一些实现方式中,可以将应用本方法的服务器和设备相连,直接获取故障设备的设备信息和故障信息。
S202、根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则。
其中,故障规则包括对故障进行分类的方法,即按照故障规则可以对故障的类型进行划分。具体的,不同类型的设备,可以对应不同的故障规则,即对应不同的对故障的分类方法,因此,可以根据故障设备的设备信息,在预先设置好的多种故障规则中,选取与故障设备对应的一条或多条故障规则,便于后续对该类型设备的故障类型进行判断。
在一些具体的实现方式中,故障规则可以根据故障设备划分为六个大类,分别为:F5类、Juniper类、HUAWEI类、H3C类、Brocade类、Cisco类。每一大类中包含与故障设备对应的故障规则,此时,可以根据所述设备信息,在预先设置好的故障规则中选取某一大类的故障规则,用于后续故障类型的判断。例如,故障设备为HUAWEI设备,即可以通过采集设备信息的方式,获取故障设备的类型,那么可以在六个大类中选择HUAWEI类的故障规则,用于后续对故障的类型的判断。
S203、基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态。
其中,故障规则可以是一些预设条件,通过故障规则可以将满足同一预设条件的故障归为同一类型的故障。具体的,根据故障信息可以判断发生了什么故障,从而根据上述获取的故障规则,对故障进行分类,判断故障的故障类型,并根据故障类型,将故障的处理任务(故障信息)发送给第一故障处理人员,一般情况下,第一故障处理人员为在处理该类型的故障方面有较为丰富的经验的相关人员。当将故障的处理任务发送给第一故障处理人员后,更改此时的故障状态为故障处理中状态。
在一些实施例中,可以对众多的故障处理人员的信息进行分析,综合选取专业契合度和熟练契合度最高的故障处理人员为第一故障处理人员,此时可以直接将故障信息发送给第一故障处理人员提示其对故障进行处理。
在另一些实施例中,可以将故障类型发布在大屏幕上或者众多故障处理人员的终端设备上,由故障处理人员综合自己的专业能力和时间分配选择认领故障处理任务,当接收到认领任务的通知后,可以将故障信息发送给对应的故障处理人员,并锁定本次故障处理任务,避免其他故障处理人员重复认领。此时认领故障处理任务的故障处理人员即为第一故障处理人员,第一故障处理人员接收到故障信息后即开始着手处理故障。
S204、当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态。
其中,反馈信息可以包括故障处理的用时情况和完成情况;故障处理信息为本次故障处理过程的全部信息,例如,故障发生时间、故障处理用时、故障处理的步骤、故障处理结果等相关信息。
具体的,第一故障处理人员完成对故障的处理后,填写并提交本次故障的反馈信息。当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,从而为故障处理人员保留故障的处理经验,提升相同故障的处理时间,降低相同故障的处理难度。标记此时的故障状态为故障处理完成状态。
本申请在接收到报警信号后,通过对故障处理进行处理并将处理过程进行阶段化标记,标注出故障处理的现阶段的状态,使运维人员能够清楚地获悉故障的处理情况,从而依据处理情况,分配工作任务,避免由于故障带来的业务中断和财产损失,提高工作效率。
在一些实施例中,对故障的处理过程包括:根据所述故障信息,提取故障发生节点的故障级别和故障关键字信息;基于所述故障级别和所述故障关键字信息,根据所述故障规则,确定所述故障类型;针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理。
具体的,通过提取故障信息中的故障发生节点的故障级别和故障关键字信息,可以判断是发生了什么故障,并根据和故障设备对应的故障规则,对故障进行分类,从而确定故障的类型,针对不同的类型的故障,可以将故障信息发送给对应的第一故障处理人员,以提示第一故障处理人员对故障进行处理。
在一些具体的实现方式中,可以针对不同的故障规则,设置对应的故障数据库。故障数据库包括故障等级、故障关键字信息、故障关键字含义等信息。当根据故障信息,获取到故障等级和故障关键字信息后,可以将故障等级和故障关键字信息与故障数据库中故障等级和故障关键字信息进行比对,从而确定故障类型,针对不同类型的故障,将故障信息发送给对应的第一故障处理人员,以提示第一故障处理人员对故障进行处理。
通过提取故障的故障级别和故障关键字信息,并根据故障规则,可以确定故障类型,通过确定故障的具体类型,可以将所述故障信息发送给对应的故障处理人员,提高了处理故障的效率。
在一些实施例中,针对不同类型的故障的处理过程包括:针对不同的故障类型,确定处理时间和处理方案;将所述故障信息发送给对应的第一故障处理人员,提示所述第一故障处理人员在所述处理时间内,按照所述处理方案对故障进行处理。
具体的,根据故障规则和故障信息可以判断故障的类型,针对不同的故障类型可以先确定处理时间和处理方案,将故障的处理过程透明化,提高处理故障的工作效率。然后再将故障信息发给对应的第一故障处理人员,提示第一故障处理人员要在处理时间内,按照规划好的处理方案及时完成对故障的处理。
针对不同的故障类型,通过预先确定处理时间和处理方案,可以将故障的处理过程透明化,提高了处理故障的工作效率。
在一些实现方式中,处理时间和处理方案的确定过程包括:根据所述故障信息,在所述故障处理数据库中检索是否存在相同故障;若存在相同故障,则优先确定所述故障处理数据库中的处理方案为本次故障的处理方案。
具体的,由于每次对故障处理完成之后,都会讲故障处理信息记录到故障处理数据库中进行存档,因此每当出现新的故障时,可以根据故障信息,在故障处理数据库中进行检索,查看是否存在相同的故障,若存在相同的故障,通过查询故障处理数据库中的历史处理方案,可以确定本次故障的处理方案和处理时间,从而提示第一故障处理人员在处理时间内,按照历史处理方案对故障进行处理,大大提高了工作效率。
在一些具体的实现方式中,根据故障信息在故障处理数据库中的检索过程,可以根据故障类型进行检索,也可以根据时间进行检索,还可以根据故障处理人员进行检索。
通过预先检索故障处理数据库中检索是否存在相同故障,如果存在相同故障,可以采用使用过的方案对本次故障进行处理,跳过了故障处理人员在处理故障初期的测试和摸索阶段,提高了处理故障的工作效率。
在一些场景中,如果第一故障处理人员没有在规划的处理时间内,完成对故障的处理,可能出现故障处理的逾期状态,对逾期状态的判断和处理过程包括:若在所述处理时间内没有接收到所述反馈信息,更改故障状态为故障逾期状态;根据所述故障类型,将所述故障信息发送给对应的第二故障处理人员对故障进行处理。
具体的,第一故障处理人员在完成对故障的处理之后,会上传反馈信息以提示故障处理完成,但是若在处理时间内,没有接收到第一故障处理人员的反馈信息,说明第一故障处理人员还没有完成对故障的处理,因此更改此时的故障状态为故障逾期状态。同时为了能更快的消除故障,可以根据故障类型,将故障信息发送给第二故障处理人员对故障进行处理。第二故障处理人员的选择,可以参考上述实施例中第一故障处理人员的选择方法。
在一些实现方式中,可以由第二故障处理人员接替第一故障处理人员对故障重新进行处理;在另一些实现方式中,可以由第二故障处理人员,协助第一故障处理人员对故障进行处理。
通过设置故障逾期状态,可以使运维人员清楚地获悉当前故障处理的情况,及时派遣第二故障处理人员协助处理故障,提高了处理故障的工作效率。
在一些实施例中,当第一故障处理人员没有在规划的处理时间内,完成对故障的处理,造成了故障的逾期状态,可以向第一工作人员发送逾期通知,并询问第一故障处理人员是否需要延长故障处理时间,若接收到第一故障处理人员的延长时间反馈,可以暂时不分配第二故障处理人员,对故障进行处理。如此,可以节省处理故障的人力成本,和第二故障处理人员熟悉情况的时间成本,提高了处理故障的工作效率。
在一些实现方式中,可以预先设置故障延长时间的阈值,若第一故障处理人员的故障处理的延长处理时间,超过了预先设置的故障延长时间的阈值,可以直接分配第二故障处理人员对故障进行处理,避免由于第一故障处理人员的沉没成本过高,造成故障的处理效率低下。
在另一些场景中,在故障处理完成之后,还可以对故障进行检查,具体过程包括:当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查;若故障仍然存在,则更改所述故障状态为故障未处理状态;根据故障信息重新判断故障类型,并将所述故障信息发送给第三故障处理人员对故障进行处理。
具体的,当接收到所述第一故障处理人员的反馈信息后,说明第一故障处理人员已经对故障处理完毕,此时可以对故障的处理结果进行检查。若经过检查故障仍然存在,则将故障状态更改为故障未处理状态。此时,根据故障信息重新判断故障类型,并将故障信息发送给第三故障处理人员对故障进行处理。
在一些实施例中,故障类型可能会发生改变,此时可以重新确定处理时间和新的处理方案,并将故障信息发送给第三故障处理人员以提示第三故障处理人员按照新的处理方案进行处理。在另一些实施例中,故障类型没有变化,此时可以继续沿用之前的处理方案对故障进行处理,也可以制定新的处理方案对故障进行处理。
在一些实施例中,当接收到第三故障处理人员的反馈信息之后,可以重新对故障处理结果进行检查,若故障仍然存在,则重复上述实施例中的步骤,直到故障消除。通过重复检查故障节点,排查是否还存在故障,提高了故障处理结果的可靠性。
在一些实施例中,反馈信息包括故障恢复关键字信息。此时,对故障的处理结果的检查过程包括:对故障设备的工作日志进行扫描,在所述工作日志中检索所述故障恢复关键字信息;若在所述工作日志中检索到所述故障恢复关键字信息,则说明故障消除,更改故障状态为故障处理完成状态。
具体的,由于反馈信息中包括恢复关键字信息,因此可以根据恢复关键字信息,对故障设备当前运行产生的工作日志进行扫描,检索工作日志中是否存在反馈信息中的恢复关键字信息。若在工作日志中检索到了故障恢复关键字信息,说明故障已经消除,故障设备已经恢复,因此可以更改此时的故障状态为故障处理完成状态。
通过在所述工作日志中检索到所述故障恢复关键字信息,排查故障是否还存在,若检索到故障恢复关键字信息,就可以说明故障已经消除,通过这种方法,可以提高处理故障的工作效率。
在另一些实施例中,对故障的处理结果的检查过程还可以是将故障信息发送给第四故障处理人员,对故障设备进行检查,若接收到第四故障处理人员的反馈信息,说明故障已经消除,并对故障处理信息进行记录,存档到故障处理数据库,更改此时的故障状态为故障处理完成状态。
图3为本申请一实施例提供的一种故障状态管理方法的流程图,如图3所示的,本实施例的故障状态管理方法主要包括以下几个步骤:
(1)发生故障:当企业业务环境发生故障时,会通过监控系统触发报警通知,并将报警通知推送到报警管理系统中。当报警管理系统收到监控系统推送的故障通知时,会将故障的状态修改为未处理状态,并在故障大屏上显示所有的当前未处理完成的故障,等待相关人员来认领故障,进行后续处理。
(2)故障处理阶段:运维人员可以通过故障监控大屏来观察当前发生示处理的故障,根据故障的具体类型联系相关人员处理故障。相关人员认领故障后根据故障的报警详情来评估当前故障的处理时间及处理方案.可通过故障监控系统来记录处理时间及方案详情.当一个故障被认领后,其它人不能再认领该故障,运维人员可清楚的看到当前故障的处理人,处理时间及处理方案.方便运维人员评估故障影响及时通知到业务相关人员。
(3)故障处理逾期:当故障处理人在处理时间内没有处理完故障时,故障状态会流转为处理逾期,运维人员可以在故障监控大屏上看到当前故障已经逾期,需要重新指派故障处理人,这时可以联系当前故障处理人,来延期故障处理时间,或者将故障分配给新的处理人来处理。
(4)故障处理完成:当故障处理人处理完故障后,可将故障状态修改为处理完成,处理完成的故障会转到故障检查模块去验证故障是否已经恢复,故障检查模块可通过自动探测,及人工确认两种方式来确认故障是否已经恢复.如果故障仍然存在,则故障会重新流转回故障发生阶段,重复上面的步骤。如果故障检查故障已经恢复,则将当前故障的详情及故障处理方案记录归档,后续发生相同类型故障时可提供故障处理方案查询功能。
(5)故障处理记录归档:故障处理的历史记录都会被整理归档,运维人员及故障处理相关人员都可以按时间,故障类型,故障处理人等条件查询故障处理记录。并且在发生故障时可以提供相同故障的历史处理方案查询,给故障处理人员提供了大量的故障处理经验,减少故障处理时间,降低故障处理难度.也降低了对运维人员的专业门槛。
本实施例可以帮助运维人员更清晰的了解到生产环境的故障的当前状态,故障的处理情况,故障处理的预期时间。更方便运维人员对当前故障范围及影响范围的评估,减少因故障没有被及时处理导致的业务影响和财产损失。并提供故障历史方案查询,降低了故障处理对专业度的依赖,使运维人员很快就可以解决故障,沉淀运维经验,最后达到全自动化运维的目的。
图4为本申请一实施例提供的一种故障状态管理装置的结构示意图,如图4所示的,本实施例的故障状态管理装置400包括:
信息获取模块401,用于接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态;
故障规则选取模块402,用于根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则;
故障处理模块403,用于基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态;
故障处理信息记录模块404,用于当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态;
其中,所述故障规则包括对故障进行分类的条件。
可选的,所述故障处理模块403,具体用于:
根据所述故障信息,提取故障发生节点的故障级别和故障关键字信息;
基于所述故障级别和所述故障关键字信息,根据所述故障规则,确定所述故障类型;
针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理。
可选的,所述故障处理模块403在针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理时,具体用于:
针对不同的故障类型,确定处理时间和处理方案;
将所述故障信息发送给对应的第一故障处理人员,提示所述第一故障处理人员在所述处理时间内,按照所述处理方案对故障进行处理。
可选的,所述故障处理模块403针对不同的故障类型,确定处理时间和处理方案时,具体用于:
根据所述故障信息,在所述故障处理数据库中检索是否存在相同故障;
若存在相同故障,则优先确定所述故障处理数据库中的处理方案为本次故障的处理方案。
可选的,所述装置还包括:故障逾期处理模块405,用于:
若在所述处理时间内没有接收到所述反馈信息,更改故障状态为故障逾期状态;
根据所述故障类型,将所述故障信息发送给对应的第二故障处理人员对故障进行处理。
可选的,所述装置还包括:处理结果检查模块406,用于:
当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查;
若故障仍然存在,则更改所述故障状态为故障未处理状态;
根据故障信息重新判断故障类型,并将所述故障信息发送给第三故障处理人员对故障进行处理。
可选的,所述反馈信息包括故障恢复关键字信息;
所述处理结果检查模块406在当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查时,具体用于:
对故障设备的工作日志进行扫描,在所述工作日志中检索所述故障恢复关键字信息;
若在所述工作日志中检索到所述故障恢复关键字信息,则说明故障消除,更改故障状态为故障处理完成状态。
本实施例的装置,可以用于执行上述任一实施例的方法,其实现原理和技术效果类似,此处不再赘述。
图5为本申请一实施例提供的一种电子设备的结构示意图,如图5所示,本实施例的电子设备500可以包括:存储器501和处理器502。
存储器501上存储有能够被处理器502加载并执行上述实施例中方法的计算机程序。
其中,处理器502和存储器501相连,如通过总线相连。
可选地,电子设备500还可以包括收发器。需要说明的是,实际应用中收发器不限于一个,该电子设备500的结构并不构成对本申请实施例的限定。
处理器502可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器602也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线可包括一通路,在上述组件之间传送信息。总线可以是PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器501可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器501用于存储执行本申请方案的应用程序代码,并由处理器502来控制执行。处理器502用于执行存储器501中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本实施例的电子设备,可以用于执行上述任一实施例的方法,其实现原理和技术效果类似,此处不再赘述。
本申请还提供一种计算机可读存储介质,存储有能够被处理器加载并执行如上实施例中的方法的计算机程序。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (9)

1.一种故障状态管理方法,其特征在于,包括:
接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态;
根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则;
基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态;
当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态;
其中,所述故障规则包括对故障进行分类的条件;
所述基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态,包括:
根据所述故障信息,提取故障发生节点的故障级别和故障关键字信息;
基于所述故障级别和所述故障关键字信息,根据所述故障规则,确定所述故障类型;
针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理;
满足同一条件的故障为同一类型的故障;
所述第一故障处理人员为在所述故障类型的故障方面具有丰富经验的相关人员;
分析若干故障处理人员的信息,确定每一故障处理人员与每一故障类型的专业契合度和熟练契合度,并将与所述故障类型的专业契合度和熟练契合度最高的故障处理人员确定为第一故障处理人员。
2.根据权利要求1所述的方法,其特征在于,所述针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理,包括:
针对不同的故障类型,确定处理时间和处理方案;
将所述故障信息发送给对应的第一故障处理人员,提示所述第一故障处理人员在所述处理时间内,按照所述处理方案对故障进行处理。
3.根据权利要求2所述的方法,其特征在于,针对不同的故障类型,确定处理时间和处理方案,包括:
根据所述故障信息,在所述故障处理数据库中检索是否存在相同故障;
若存在相同故障,则优先确定所述故障处理数据库中的处理方案为本次故障的处理方案。
4.根据权利要求2所述的方法,其特征在于,还包括:
若在所述处理时间内没有接收到所述反馈信息,更改故障状态为故障逾期状态;
根据所述故障类型,将所述故障信息发送给对应的第二故障处理人员对故障进行处理。
5.根据权利要求2-4任一项所述的方法,其特征在于,还包括:
当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查;
若故障仍然存在,则更改所述故障状态为故障未处理状态;
根据故障信息重新判断故障类型,并将所述故障信息发送给第三故障处理人员对故障进行处理。
6.根据权利要求5所述的方法,其特征在于,所述反馈信息包括故障恢复关键字信息;
所述当接收到所述第一故障处理人员的反馈信息后,对故障的处理结果进行检查,包括:
对故障设备的工作日志进行扫描,在所述工作日志中检索所述故障恢复关键字信息;
若在所述工作日志中检索到所述故障恢复关键字信息,则说明故障消除,更改故障状态为故障处理完成状态。
7.一种故障状态管理装置,其特征在于,包括:
信息获取模块,用于接收到报警信号后,获取故障设备的设备信息和由所述故障设备产生的故障信息,确定故障状态为故障未处理状态;
故障规则选取模块,用于根据所述设备信息,在预先设置好的故障规则中选取与所述故障设备对应的故障规则;
故障处理模块,用于基于所述故障规则与所述故障信息,判断故障类型并将所述故障信息发送给第一故障处理人员,提示所述第一故障处理人员对故障进行处理,更改所述故障状态为故障处理中状态;
故障处理信息记录模块,用于当接收到所述第一故障处理人员处理完成的反馈信息后,记录故障处理信息到故障处理数据库,更改所述故障状态为故障处理完成状态;
其中,所述故障规则包括对故障进行分类的条件;
所述故障处理模块具体用于:根据所述故障信息,提取故障发生节点的故障级别和故障关键字信息;基于所述故障级别和所述故障关键字信息,根据所述故障规则,确定所述故障类型;针对不同的故障类型,将所述故障信息发送给对应的第一故障处理人员以对故障进行处理;
满足同一条件的故障为同一类型的故障;
所述第一故障处理人员为在所述故障类型的故障方面具有丰富经验的相关人员;
所述故障处理模块还用于:分析若干故障处理人员的信息,确定每一故障处理人员与每一故障类型的专业契合度和熟练契合度,并将与所述故障类型的专业契合度和熟练契合度最高的故障处理人员确定为第一故障处理人员。
8.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用并执行所述存储器中的程序指令,执行如权利要求1-6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序;所述计算机程序被处理器执行时,实现如权利要求1-6任一项所述的方法。
CN202210862163.5A 2022-07-20 2022-07-20 故障状态管理方法、装置、电子设备及存储介质 Active CN115242603B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210862163.5A CN115242603B (zh) 2022-07-20 2022-07-20 故障状态管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210862163.5A CN115242603B (zh) 2022-07-20 2022-07-20 故障状态管理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115242603A CN115242603A (zh) 2022-10-25
CN115242603B true CN115242603B (zh) 2024-01-02

Family

ID=83675675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210862163.5A Active CN115242603B (zh) 2022-07-20 2022-07-20 故障状态管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115242603B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050058772A (ko) * 2003-12-12 2005-06-17 주식회사 케이티 유무선 네트워크를 이용한 인터넷 고장 처리 시스템 및 그방법
CN107612735A (zh) * 2017-09-21 2018-01-19 北京天元创新科技有限公司 一种宽带故障在线处理方法、服务器及用户终端
CN109669844A (zh) * 2018-11-27 2019-04-23 平安科技(深圳)有限公司 设备故障处理方法、装置、设备和存储介质
CN109767509A (zh) * 2018-12-07 2019-05-17 广东优世联合控股集团股份有限公司 一种设备运维管理方法、装置、可读介质及电子设备
CN111832943A (zh) * 2020-07-14 2020-10-27 北京思特奇信息技术股份有限公司 硬件设备故障管理方法、装置、电子设备及存储介质
CN111860893A (zh) * 2020-07-27 2020-10-30 中国联合网络通信集团有限公司 一种数据处理方法及装置
CN112465386A (zh) * 2020-12-09 2021-03-09 广东劲天科技有限公司 基于saas模式的智能运维系统及方法、存储介质
CN112910669A (zh) * 2019-12-03 2021-06-04 中盈优创资讯科技有限公司 故障智能化处理方法、装置及系统
CN113902408A (zh) * 2021-10-10 2022-01-07 深圳市福瑞祥电器有限公司 印刷电路板生产流程异常管理方法、装置、设备及存储介质
CN114218302A (zh) * 2021-12-28 2022-03-22 北京百度网讯科技有限公司 信息处理方法、装置、设备以及存储介质
WO2022142927A1 (zh) * 2020-12-30 2022-07-07 中兴通讯股份有限公司 一种基于规则的故障分析方法、装置、设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009099135A (ja) * 2007-09-28 2009-05-07 Fujitsu Ltd 支援管理方法、支援管理システム及び情報処理装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050058772A (ko) * 2003-12-12 2005-06-17 주식회사 케이티 유무선 네트워크를 이용한 인터넷 고장 처리 시스템 및 그방법
CN107612735A (zh) * 2017-09-21 2018-01-19 北京天元创新科技有限公司 一种宽带故障在线处理方法、服务器及用户终端
CN109669844A (zh) * 2018-11-27 2019-04-23 平安科技(深圳)有限公司 设备故障处理方法、装置、设备和存储介质
CN109767509A (zh) * 2018-12-07 2019-05-17 广东优世联合控股集团股份有限公司 一种设备运维管理方法、装置、可读介质及电子设备
CN112910669A (zh) * 2019-12-03 2021-06-04 中盈优创资讯科技有限公司 故障智能化处理方法、装置及系统
CN111832943A (zh) * 2020-07-14 2020-10-27 北京思特奇信息技术股份有限公司 硬件设备故障管理方法、装置、电子设备及存储介质
CN111860893A (zh) * 2020-07-27 2020-10-30 中国联合网络通信集团有限公司 一种数据处理方法及装置
CN112465386A (zh) * 2020-12-09 2021-03-09 广东劲天科技有限公司 基于saas模式的智能运维系统及方法、存储介质
WO2022142927A1 (zh) * 2020-12-30 2022-07-07 中兴通讯股份有限公司 一种基于规则的故障分析方法、装置、设备和存储介质
CN113902408A (zh) * 2021-10-10 2022-01-07 深圳市福瑞祥电器有限公司 印刷电路板生产流程异常管理方法、装置、设备及存储介质
CN114218302A (zh) * 2021-12-28 2022-03-22 北京百度网讯科技有限公司 信息处理方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN115242603A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN107273280A (zh) 一种日志处理方法、装置、电子设备和存储介质
EP2031800A1 (en) Method, system and apparatus of fault location for communicaion apparatus
CN107102928A (zh) 一种应用程序崩溃信息上报方法和装置
CN111866821A (zh) 一种蓝牙耳机回连控制的方法、装置及蓝牙耳机
CN108667872B (zh) 用于调度服务器的存档方法和装置
CN113301155B (zh) 数据路由方法、装置、设备和存储介质
CN115242603B (zh) 故障状态管理方法、装置、电子设备及存储介质
CN113098715B (zh) 一种信息处理方法、装置、系统、介质和计算设备
US10826764B2 (en) Dynamic server allocation for automated server builds
CN111294613A (zh) 一种视频处理方法、客户端、服务器
CN107154960B (zh) 用于确定分布式存储系统的服务可用性信息的方法与设备
CN114500178B (zh) 一种自运维的智慧物联网关
US9002788B2 (en) System for configurable reporting of network data and related method
CN114185806A (zh) 软件缺陷测试方法、装置、设备及存储介质
CN112631929A (zh) 测试用例生成方法、装置、存储介质及电子设备
CN112187527A (zh) 微服务的异常定位方法、装置、电子设备及可读存储介质
CN111225075A (zh) 物联网定向访问业务的配置方法及装置
CN111309410B (zh) 一种程序对象确定方法及装置
CN109919808B (zh) 商标智能申报方法、介质、计算机设备及系统
CN116485363A (zh) 故障处理方法、装置、电子设备及计算机存储介质
CN115454819A (zh) 区块链跨链系统的测试方法、装置、设备及存储介质
CN117453774A (zh) 跨平台的信息联合查询方法、装置、电子设备及存储介质
CN116881135A (zh) 一种基于分组连接的集成式测试参数反馈方法及系统
CN117539689A (zh) 数据库备份管理方法及系统
CN116668117A (zh) 一种多层级的指纹识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant