CN114374996A - 一种故障处理方法、装置、设备及产品 - Google Patents

一种故障处理方法、装置、设备及产品 Download PDF

Info

Publication number
CN114374996A
CN114374996A CN202111642210.7A CN202111642210A CN114374996A CN 114374996 A CN114374996 A CN 114374996A CN 202111642210 A CN202111642210 A CN 202111642210A CN 114374996 A CN114374996 A CN 114374996A
Authority
CN
China
Prior art keywords
fault
processing
preset
strategy
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111642210.7A
Other languages
English (en)
Other versions
CN114374996B (zh
Inventor
马小波
夏群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Inspur Communication Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Information System Co Ltd filed Critical Inspur Communication Information System Co Ltd
Priority to CN202111642210.7A priority Critical patent/CN114374996B/zh
Priority claimed from CN202111642210.7A external-priority patent/CN114374996B/zh
Publication of CN114374996A publication Critical patent/CN114374996A/zh
Application granted granted Critical
Publication of CN114374996B publication Critical patent/CN114374996B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种故障处理方法、装置、设备及产品,涉及故障处理技术领域,该方法包括以下步骤:获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。本发明能够在较短处理周期内进行故障处理过程定义及模拟运行验证等,大幅缩短了业务上线的时间。

Description

一种故障处理方法、装置、设备及产品
技术领域
本发明涉及故障处理技术领域,尤其涉及一种故障处理方法、装置、设备及产品。
背景技术
第五代移动通信技术(5rd Generation,5G)网络是互联网技术(InternetTechnology,IT)和通信技术(Communication Technology,CT)融合的网络结构,大量IT设备会产生海量的实时告警,如何对海量告警进行故障管理,快速定位到故障原因,为监控运维工作提供精确的故障分析和故障定位手段,是故障处理系统要解决的核心工作。
目前故障处理系统利用集中化规则配置方式,需要对每一类故障配置不同的故障处理规则,通过规则实现故障衍生、故障关联、故障预处理、故障诊断、故障派单、故障通知等功能。但是随着网络故障的种类及数量快速增长,这种集中化规则配置的方法一方面造成规则数量众多,无法从故障层面厘清相关的处理规则,可能造成新规则配置冲突及无效规则下线不便。
发明内容
本发明提供一种故障处理方法、装置、设备及产品,用以解决现有技术中集中化规则配置方式无法从故障层面厘清相关的处理规则的缺陷,实现在较短处理周期内进行故障处理过程定义及模拟运行验证等,大幅缩短了业务上线的时间。
本发明提供一种故障处理方法,包括以下步骤:
获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
根据本发明提供的故障处理方法,所述故障处理策略通过以下步骤生成的:
基于所述历史故障按照所述预设处理策略处理后产生的所述处理结果和所述关联效果,对所述历史故障对应的所述预设处理策略进行调整;其中,所述调整为对所述故障处理阶段的所述处理逻辑进行调整,所述处理逻辑为串行执行、并行执行或者有条件执行中的一种。
根据本发明提供的故障处理方法,所述基于所述历史故障按照所述预设处理策略处理后产生的所述处理结果和所述关联效果,具体包括以下步骤:
确定所述历史故障的所述故障类型;
所述预设规则库基于所述历史故障已确定的所述故障类型,为所述历史故障分配一种所述预设处理策略;
确定所述历史故障按照分配的所述预设处理策略处理后的所述处理结果和所述关联效果;其中,所述关联效果表征的是对邻接的两个故障处理阶段的影响度。
根据本发明提供的故障处理方法,所述预设规则库基于所述历史故障已确定的所述故障类型,为所述历史故障分配一种所述预设处理策略,具体包括:
提取所述故障类型的关键字,从所述预设规则库获取与所述关键字相匹配的一种所述预设处理策略,并将所述预设处理策略分配给所述历史故障;其中,不同的所述预设处理策略和所述故障处理策略均按照所述关键字进行区分。
根据本发明提供的故障处理方法,所述获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略步骤中,每一种所述故障处理策略和预设处理策略均具有至少一个所述故障处理阶段。
根据本发明提供的故障处理方法,所述获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略步骤中,所述故障处理阶段包括:
故障发现阶段、故障预处理阶段、故障定界阶段、故障处置阶段和故障清除阶段;
其中,所述故障发现阶段包括对故障进行故障范围定义、衍生配置和故障通知;
故障预处理阶段包括对故障进行故障关联和故障交互处理;
故障定界阶段包括对故障进行故障诊断和故障研判;
故障处置阶段包括对故障进行故障派单、业务抢通和故障修复。
故障恢复阶段包括对故障进行故障清除。
本发明还提供一种故障处理装置,包括以下步骤:
策略确定模块,用于获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
故障处理模块,用于基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述故障处理方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述故障处理方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述故障处理方法的步骤。
本发明提供的故障处理方法、装置、设备及产品,通过对待处理故障的故障处理过程按照用户设置好的预设处理策略或者后期更新生成的故障处理策略直线,有效解决了传统方法规则配置分散,无法进行故障全流程自定义及模拟运行验证等问题,大幅提高了应对不断增加的新的网络故障处理定义的灵活性,并且可以不断沉淀并复用故障处理能力;可以将零散的故障相关规则整合在预设规则库中,避免对于复杂度一般的新的故障,使用传统方法需要反复进行规则配置、等待运行、效果验证、规则调整等步骤,本发明能够实现在较短处理周期内进行故障处理过程定义及模拟运行验证等,大幅缩短了业务上线的时间。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的故障处理方法的流程示意图;
图2是本发明提供的故障处理装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1描述本发明的本发明提供故障处理方法,该方法包括以下步骤:
S100、获取待处理故障,预设规则库基于待处理故障的故障类型确定故障处理策略或者预设处理策略。
在该方法中,预设规则库中包括多种能够正确处理故障的故障处理策略和预设处理策略,且,不同的故障处理策略或者预设处理策略在至少一个故障处理阶段有不同的处理逻辑。在本实施例中,每一种故障处理策略和预设处理策略均具有至少一个故障处理阶段。
在该方法中,根据故障处理业务流程,可以将故障处理划分为故障发现阶段、故障预处理阶段、故障定界阶段、故障处置阶段和故障清除阶段这几个故障处理阶段。
其中,故障发现阶段包括对故障进行故障范围定义、衍生配置和故障通知;
故障预处理阶段包括对故障进行故障关联和故障交互处理;
故障定界阶段包括对故障进行故障诊断和故障研判;
故障处置阶段包括对故障进行故障派单、业务抢通和故障修复。
故障恢复阶段包括对故障进行故障清除。
每个故障处理阶段均具有若干功能,相关能力包括规则配置页面、接口等多种灵活的方式,为下一步的编排配置打下基础。上述功能即为故障处理阶段对应的子处理阶段,邻接的故障处理阶段,以及故障处理阶段内部的邻接的字处理阶段均存在相应的处理逻辑,在本实施例中,处理逻辑为串行执行、并行执行或者有条件执行中的一种。
故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的。关联效果表征的是对邻接的两个故障处理阶段的影响度。
在该方法中,预设处理策略是用户预先设置好的。可选的,预设处理策略是用户基于故障分阶段处理能力,利用可视化运维编排工具对具体故障进行处理阶段设计及每个阶段的处理能力设计。
用户设置预设处理策略时,首先对具体故障进行处理阶段设计。处理阶段可以选择故障发现、故障预处理、故障定界、故障处置、故障恢复标准阶段,也可以自行定义其他阶段。部分故障不需要预处理直接派单,那可以只选择故障发现、故障处置、故障恢复三个阶段。
然后基于故障处理阶段设计,在每个故障处理阶段内进行处理能力设计,即设计字处理阶段,处理能力支持标准能力选择以及自定义处理能力,处理逻辑包括串行执行、并行执行和有条件执行等。
对于具体故障的处理阶段设计以及每个阶段内的处理能力设计,可以生成yaml文件格式的文件进行存储,形成各种预设处理策略。
S200、基于故障处理策略或者预设处理策略,处理待处理故障。
预设规则库首先读取用户设置好的预设处理策略以及后期更新生成的故障处理策略,例如可以将预设处理策略和故障处理策略缓存在内存中。然后基于实时检测到的故障数据,生成待处理故障,符合预设处理策略中故障发现阶段定义的待处理故障会自动触发相应的预设处理策略或者故障处理策略执行,并基于预设处理策略或者故障处理策略中指示的各个故障处理阶段以及故障处理阶段内的子处理阶段,实现按照已存储的策略的故障全流程自动化调度处理。
本发明的本发明提供故障处理方法,通过对待处理故障的故障处理过程按照用户设置好的预设处理策略或者后期更新生成的故障处理策略直线,有效解决了传统方法规则配置分散,无法进行故障全流程自定义及模拟运行验证等问题,大幅提高了应对不断增加的新的网络故障处理定义的灵活性,并且可以不断沉淀并复用故障处理能力;可以将零散的故障相关规则整合在预设规则库中,避免对于复杂度一般的新的故障,使用传统方法需要反复进行规则配置、等待运行、效果验证、规则调整等步骤,本发明能够实现在较短处理周期内进行故障处理过程定义及模拟运行验证等,大幅缩短了业务上线的时间。
在本实施例中,故障处理策略通过以下步骤生成的:
基于历史故障按照预设处理策略处理后产生的处理结果和关联效果,对历史故障对应的预设处理策略进行调整。在该方法中,调整为对故障处理阶段的处理逻辑进行调整。
具体的,基于历史故障按照预设处理策略处理后产生的处理结果和关联效果,包括以下步骤:
确定历史故障的故障类型。
预设规则库基于历史故障已确定的故障类型,为历史故障分配一种预设处理策略。在一些可能的实施例中,会提取故障类型的关键字,并从预设规则库获取与关键字相匹配的一种预设处理策略,再将预设处理策略分配给历史故障,不同的预设处理策略和故障处理策略均按照关键字进行区分。
确定历史故障按照分配的预设处理策略处理后的处理结果和关联效果。
通过使用历史故障的相关数据,预设规则库会自动生成新的故障处理策略,具体的,是先通过历史故障的故障类型,为其分配一个预设处理策略,之后进行故障全流程处理模拟运行,并输出处理结果和关联效果等模拟运行指标。基于模拟运行机制,可以通过不断调整预设处理策略中的故障处理阶段、故障处理阶段的子处理阶段及相关处理逻辑,结合历史故障实现故障处理全流程模拟运行、验证、调整、再运行的闭环机制,实现故障处理自定义设计优化。
需要说明的是,为历史故障分配的还可以是已经存储即已经存在的故障处理策略,因此,新的故障处理策略可以是基于已经存储的故障处理策略进行更新生成的。
下面对本发明提供的故障处理装置进行描述,下文描述的故障处理装置与上文描述的故障处理方法可相互对应参照。
下面结合图2描述本发明的本发明提供故障处理装置,该装置包括:
策略确定模块100,用于获取待处理故障,预设规则库基于待处理故障的故障类型确定故障处理策略或者预设处理策略。
在该装置中,预设规则库中包括多种能够正确处理故障的故障处理策略和预设处理策略,且,不同的故障处理策略或者预设处理策略在至少一个故障处理阶段有不同的处理逻辑。在本实施例中,每一种故障处理策略和预设处理策略均具有至少一个故障处理阶段。
在该装置中,根据故障处理业务流程,可以将故障处理划分为故障发现阶段、故障预处理阶段、故障定界阶段、故障处置阶段和故障清除阶段这几个故障处理阶段。
其中,故障发现阶段包括对故障进行故障范围定义、衍生配置和故障通知;
故障预处理阶段包括对故障进行故障关联和故障交互处理;
故障定界阶段包括对故障进行故障诊断和故障研判;
故障处置阶段包括对故障进行故障派单、业务抢通和故障修复。
故障恢复阶段包括对故障进行故障清除。
每个故障处理阶段均具有若干功能,相关能力包括规则配置页面、接口等多种灵活的方式,为下一步的编排配置打下基础。上述功能即为故障处理阶段对应的子处理阶段,邻接的故障处理阶段,以及故障处理阶段内部的邻接的字处理阶段均存在相应的处理逻辑,在本实施例中,处理逻辑为串行执行、并行执行或者有条件执行中的一种。
故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的。关联效果表征的是对邻接的两个故障处理阶段的影响度。
在该装置中,预设处理策略是用户预先设置好的。可选的,预设处理策略是用户基于故障分阶段处理能力,利用可视化运维编排工具对具体故障进行处理阶段设计及每个阶段的处理能力设计。
用户设置预设处理策略时,首先对具体故障进行处理阶段设计。处理阶段可以选择故障发现、故障预处理、故障定界、故障处置、故障恢复标准阶段,也可以自行定义其他阶段。部分故障不需要预处理直接派单,那可以只选择故障发现、故障处置、故障恢复三个阶段。
然后基于故障处理阶段设计,在每个故障处理阶段内进行处理能力设计,即设计字处理阶段,处理能力支持标准能力选择以及自定义处理能力,处理逻辑包括串行执行、并行执行和有条件执行等。
对于具体故障的处理阶段设计以及每个阶段内的处理能力设计,可以生成yaml文件格式的文件进行存储,形成各种预设处理策略。
故障处理模块200,用于基于故障处理策略或者预设处理策略,处理待处理故障。
预设规则库首先读取用户设置好的预设处理策略以及后期更新生成的故障处理策略,例如可以将预设处理策略和故障处理策略缓存在内存中。然后基于实时检测到的故障数据,生成待处理故障,符合预设处理策略中故障发现阶段定义的待处理故障会自动触发相应的预设处理策略或者故障处理策略执行,并基于预设处理策略或者故障处理策略中指示的各个故障处理阶段以及故障处理阶段内的子处理阶段,实现按照已存储的策略的故障全流程自动化调度处理。
本发明的本发明提供故障处理装置,通过对待处理故障的故障处理过程按照用户设置好的预设处理策略或者后期更新生成的故障处理策略直线,有效解决了传统装置规则配置分散,无法进行故障全流程自定义及模拟运行验证等问题,大幅提高了应对不断增加的新的网络故障处理定义的灵活性,并且可以不断沉淀并复用故障处理能力;可以将零散的故障相关规则整合在预设规则库中,避免对于复杂度一般的新的故障,使用传统装置需要反复进行规则配置、等待运行、效果验证、规则调整等步骤,本发明能够实现在较短处理周期内进行故障处理过程定义及模拟运行验证等,大幅缩短了业务上线的时间。
在本实施例中,故障处理策略通过以下模块生成的:
生成模块,用于基于历史故障按照预设处理策略处理后产生的处理结果和关联效果,对历史故障对应的预设处理策略进行调整。在该装置中,调整为对故障处理阶段的处理逻辑进行调整。
具体的,基于历史故障按照预设处理策略处理后产生的处理结果和关联效果,包括以下模块:
确定单元,用于确定历史故障的故障类型。
分配单元,用于预设规则库基于历史故障已确定的故障类型,为历史故障分配一种预设处理策略。在一些可能的实施例中,会提取故障类型的关键字,并从预设规则库获取与关键字相匹配的一种预设处理策略,再将预设处理策略分配给历史故障,不同的预设处理策略和故障处理策略均按照关键字进行区分。
反馈单元,用于确定历史故障按照分配的预设处理策略处理后的处理结果和关联效果。
通过使用历史故障的相关数据,预设规则库会自动生成新的故障处理策略,具体的,是先通过历史故障的故障类型,为其分配一个预设处理策略,之后进行故障全流程处理模拟运行,并输出处理结果和关联效果等模拟运行指标。基于模拟运行机制,可以通过不断调整预设处理策略中的故障处理阶段、故障处理阶段的子处理阶段及相关处理逻辑,结合历史故障实现故障处理全流程模拟运行、验证、调整、再运行的闭环机制,实现故障处理自定义设计优化。
需要说明的是,为历史故障分配的还可以是已经存储即已经存在的故障处理策略,因此,新的故障处理策略可以是基于已经存储的故障处理策略进行更新生成的。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行故障处理方法,该方法包括以下步骤:
S100、获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
S200、基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的故障处理方法,该方法包括以下步骤:
S100、获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
S200、基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的故障处理方法,该方法包括以下步骤:
S100、获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
S200、基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种故障处理方法,其特征在于,包括以下步骤:
获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
2.根据权利要求1所述的故障处理方法,其特征在于,所述故障处理策略通过以下步骤生成的:
基于所述历史故障按照所述预设处理策略处理后产生的所述处理结果和所述关联效果,对所述历史故障对应的所述预设处理策略进行调整;其中,所述调整为对所述故障处理阶段的所述处理逻辑进行调整,所述处理逻辑为串行执行、并行执行或者有条件执行中的一种。
3.根据权利要求2所述的故障处理方法,其特征在于,所述基于所述历史故障按照所述预设处理策略处理后产生的所述处理结果和所述关联效果,具体包括以下步骤:
确定所述历史故障的所述故障类型;
所述预设规则库基于所述历史故障已确定的所述故障类型,为所述历史故障分配一种所述预设处理策略;
确定所述历史故障按照分配的所述预设处理策略处理后的所述处理结果和所述关联效果;其中,所述关联效果表征的是对邻接的两个故障处理阶段的影响度。
4.根据权利要求3所述的故障处理方法,其特征在于,所述预设规则库基于所述历史故障已确定的所述故障类型,为所述历史故障分配一种所述预设处理策略,具体包括:
提取所述故障类型的关键字,从所述预设规则库获取与所述关键字相匹配的一种所述预设处理策略,并将所述预设处理策略分配给所述历史故障;其中,不同的所述预设处理策略和所述故障处理策略均按照所述关键字进行区分。
5.根据权利要求1所述的故障处理方法,其特征在于,所述获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略步骤中,每一种所述故障处理策略和预设处理策略均具有至少一个所述故障处理阶段。
6.根据权利要求1所述的故障处理方法,所述获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略步骤中,所述故障处理阶段包括:
故障发现阶段、故障预处理阶段、故障定界阶段、故障处置阶段和故障清除阶段;
其中,所述故障发现阶段包括对故障进行故障范围定义、衍生配置和故障通知;
故障预处理阶段包括对故障进行故障关联和故障交互处理;
故障定界阶段包括对故障进行故障诊断和故障研判;
故障处置阶段包括对故障进行故障派单、业务抢通和故障修复。
故障恢复阶段包括对故障进行故障清除。
7.一种故障处理装置,其特征在于,包括:
策略确定模块,用于获取待处理故障,预设规则库基于所述待处理故障的故障类型确定故障处理策略或者预设处理策略;其中,所述预设规则库中包括多种能够正确处理故障的所述故障处理策略和预设处理策略,且,不同的所述故障处理策略或者所述预设处理策略在至少一个故障处理阶段有不同的处理逻辑;所述故障处理策略基于历史故障的故障类型、故障处理阶段的处理结果和关联效果生成的;
故障处理模块,用于基于所述故障处理策略或者所述预设处理策略,处理所述待处理故障。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述故障处理方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述故障处理方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述故障处理方法的步骤。
CN202111642210.7A 2021-12-29 一种故障处理方法、装置、设备及产品 Active CN114374996B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111642210.7A CN114374996B (zh) 2021-12-29 一种故障处理方法、装置、设备及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111642210.7A CN114374996B (zh) 2021-12-29 一种故障处理方法、装置、设备及产品

Publications (2)

Publication Number Publication Date
CN114374996A true CN114374996A (zh) 2022-04-19
CN114374996B CN114374996B (zh) 2024-07-05

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115695142A (zh) * 2022-10-25 2023-02-03 浪潮通信信息系统有限公司 一种面向网络运维的事件监控方法及装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083029A1 (en) * 2008-09-29 2010-04-01 International Business Machines Corporation Self-Optimizing Algorithm for Real-Time Problem Resolution Using Historical Data
CN102521613A (zh) * 2011-12-17 2012-06-27 山东省科学院自动化研究所 一种汽车电子系统的故障诊断方法
CN108429629A (zh) * 2017-02-14 2018-08-21 腾讯科技(深圳)有限公司 设备故障恢复方法和装置
CN109062723A (zh) * 2018-08-22 2018-12-21 郑州云海信息技术有限公司 服务器故障的处理方法和装置
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN109218114A (zh) * 2018-11-12 2019-01-15 西安微电子技术研究所 一种基于决策树的服务器故障自动检测系统及检测方法
CN110175204A (zh) * 2019-05-17 2019-08-27 国网河北省电力有限公司沧州供电分公司 智能变电站数据管理与决策系统、方法及终端设备
CN110928799A (zh) * 2019-12-05 2020-03-27 锐捷网络股份有限公司 一种软件故障定位方法及装置
CN111639921A (zh) * 2020-06-11 2020-09-08 广东电网有限责任公司 一种基于专家系统的设备故障智判与辅助处置方法
CN111722976A (zh) * 2020-05-19 2020-09-29 珠海高凌信息科技股份有限公司 基于智能运维的故障流程分析方法、装置及介质
CN112446511A (zh) * 2020-11-20 2021-03-05 中国建设银行股份有限公司 一种故障处置方法、装置、介质及设备
CN113285358A (zh) * 2021-06-25 2021-08-20 苏州道和电力设计安装有限公司 一种配电柜事故监控报警方法及系统
CN113553210A (zh) * 2021-07-30 2021-10-26 平安普惠企业管理有限公司 告警数据的处理方法、装置、设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100083029A1 (en) * 2008-09-29 2010-04-01 International Business Machines Corporation Self-Optimizing Algorithm for Real-Time Problem Resolution Using Historical Data
CN102521613A (zh) * 2011-12-17 2012-06-27 山东省科学院自动化研究所 一种汽车电子系统的故障诊断方法
CN108429629A (zh) * 2017-02-14 2018-08-21 腾讯科技(深圳)有限公司 设备故障恢复方法和装置
CN109062723A (zh) * 2018-08-22 2018-12-21 郑州云海信息技术有限公司 服务器故障的处理方法和装置
CN109117298A (zh) * 2018-09-03 2019-01-01 郑州云海信息技术有限公司 一种硬件故障修复方法、装置及设备
CN109218114A (zh) * 2018-11-12 2019-01-15 西安微电子技术研究所 一种基于决策树的服务器故障自动检测系统及检测方法
CN110175204A (zh) * 2019-05-17 2019-08-27 国网河北省电力有限公司沧州供电分公司 智能变电站数据管理与决策系统、方法及终端设备
CN110928799A (zh) * 2019-12-05 2020-03-27 锐捷网络股份有限公司 一种软件故障定位方法及装置
CN111722976A (zh) * 2020-05-19 2020-09-29 珠海高凌信息科技股份有限公司 基于智能运维的故障流程分析方法、装置及介质
CN111639921A (zh) * 2020-06-11 2020-09-08 广东电网有限责任公司 一种基于专家系统的设备故障智判与辅助处置方法
CN112446511A (zh) * 2020-11-20 2021-03-05 中国建设银行股份有限公司 一种故障处置方法、装置、介质及设备
CN113285358A (zh) * 2021-06-25 2021-08-20 苏州道和电力设计安装有限公司 一种配电柜事故监控报警方法及系统
CN113553210A (zh) * 2021-07-30 2021-10-26 平安普惠企业管理有限公司 告警数据的处理方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴英;: "基于证据理论的民机电源系统故障诊断方法", 国外电子测量技术, no. 08, 15 August 2017 (2017-08-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115695142A (zh) * 2022-10-25 2023-02-03 浪潮通信信息系统有限公司 一种面向网络运维的事件监控方法及装置

Similar Documents

Publication Publication Date Title
CN101833714A (zh) 一种审批权限控制方法、装置及系统
CN111553576A (zh) 适应电力现货市场的数据校验方法、装置及系统
CN112508249A (zh) 突发事件推演图结构的构建及突发事件推演的方法和装置
CN110988563B (zh) 一种ups故障检测方法、装置、设备和存储介质
CN105989133A (zh) 事务处理方法及装置
CN108255703A (zh) 一种sql脚本的故障修复方法及其终端
CN117909864A (zh) 一种电力故障预测系统及方法
CN107229977A (zh) 一种主机安全基线自动加固方法及系统
CN114374996A (zh) 一种故障处理方法、装置、设备及产品
CN114374996B (zh) 一种故障处理方法、装置、设备及产品
CN107612755A (zh) 一种云资源的管理方法及其装置
CN116062009A (zh) 故障分析方法、装置、电子设备及存储介质
CN111651652B (zh) 基于人工智能的情感倾向识别方法、装置、设备及介质
CN113127459B (zh) 一种数据治理的实现方法、装置、可读介质及电子设备
CN110941624A (zh) 用于人事变动的数据处理方法及装置
CN107844397A (zh) 用于嵌入式系统的分析方法、计算机程序产品和分析设备
CN113157740B (zh) 一种业务物料的投放方法、装置和电子设备
US9535414B2 (en) System and method for distributing and exchanging elements for planning and/or for operating automation operating equipment
CN115001771B (zh) 基于自动更新的验证码防御方法、系统、设备及存储介质
CN117668677B (zh) 一种数据检测方法
CN113051747B (zh) 一种飞机可靠性数据资产模型构建方法及装置
CN110874258B (zh) 物理机变更方法、装置
CN108614871B (zh) 数据查询与结果生成方法、装置、设备及存储介质
CN113553237A (zh) 异常场景应急处理方法及装置
CN104699528B (zh) 基于NetWeaver的排程方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant