CN111814999B - 一种故障工单生成方法、装置、设备 - Google Patents
一种故障工单生成方法、装置、设备 Download PDFInfo
- Publication number
- CN111814999B CN111814999B CN202010652493.2A CN202010652493A CN111814999B CN 111814999 B CN111814999 B CN 111814999B CN 202010652493 A CN202010652493 A CN 202010652493A CN 111814999 B CN111814999 B CN 111814999B
- Authority
- CN
- China
- Prior art keywords
- alarm information
- target
- fault alarm
- association
- service system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000011084 recovery Methods 0.000 claims description 45
- 238000012544 monitoring process Methods 0.000 claims description 38
- 238000011835 investigation Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008439 repair process Effects 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 abstract 1
- 230000001960 triggered effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 6
- 238000013024 troubleshooting Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Alarm Systems (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请实施例公开一种故障工单生成方法、装置、设备,方法包括:对同一时间段内接收到的至少两条目标故障告警信息进行判断;若目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足第一关联条件的所有目标故障告警信息进行归集;基于归集后的目标故障告警信息生成业务系统的故障工单。本申请将告警进行归集或关联,从而减少派单量,提高了故障工单的处理效率。
Description
技术领域
本发明属于设备故障检测技术领域,尤其涉及一种故障工单生成方法、装置、设备。
背景技术
业务系统出现故障时,通常都会触发告警,信息系统根据业务系统触发的一条告警信息,生成对应的一张故障工单并进行排查处理。告警数量越多时,生成相同的故障工单的数量也越多,在此种情况下,若多条告警信息内容相同,或者多条告警信息有关联,其根因源自同一故障点时,若还是生成相同数量的故障工单的话,便会增加维护人员的工作量,降低故障工单的处理效率。
发明内容
为了解决现有技术的问题,本发明提出一种故障工单生成方法、装置、设备。本发明将告警进行归集或关联,从而减少派单量,提高了故障工单的处理效率。
本发明实施例提供的具体技术方案如下:
一方面公开了一种故障工单生成方法,所述方法包括:
对同一时间段内接收到的至少两条目标故障告警信息进行判断;
若所述目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足所述第一关联条件的所有目标故障告警信息进行归集;
基于归集后的目标故障告警信息生成所述业务系统的故障工单。
优选的,在判断所述目标故障告警信息源自同一业务系统后,所述方法还包括:
获取触发所述目标故障告警信息的业务系统的监控维度;
当所述目标故障告警信息源自同一监控维度时,获取所述目标故障告警信息的生成时间,根据生成时间计算相邻两个目标故障告警信息的时间间隔;
当所述目标故障告警信息源自不同监控维度时,提取所述目标故障告警信息的关键字;
所述确定满足预设的第一关联条件的所有目标故障告警信息具体包括:
将时间间隔相同时所对应的源自同一监控维度的目标故障告警信息确定为满足所述第一关联条件的所有目标故障告警信息;和/或,
将关键字相同时所对应的源自不同监控维度的目标故障告警信息确定为满足所述第一关联条件的所有目标故障告警信息。
优选的,所述方法还包括:
若所述目标故障告警信息源自不同业务系统,则确定满足预设的第二关联条件的所有目标故障告警信息,并对满足所述第二关联条件的所有目标故障告警信息进行关联;
确定关联后的目标故障告警信息所对应的业务系统,并基于关联后的目标故障告警信息生成对应的业务系统的故障工单。
优选的,在判断所述目标故障告警信息源自不同业务系统后,所述方法还包括:
获取第一关联关系表、第二关联关系表、第三关联关系表,所述第一关联关系表为故障告警信息与触发故障告警信息的业务系统的模块之间的关联关系,所述第二关联关系表为不同业务系统的模块之间的主次关联关系,所述第三关联关系表为故障告警信息与触发故障告警信息的基础业务系统之间的关联关系;
根据所述第一关联关系表,获取与所述目标故障告警信息相匹配的目标模块,并根据所述第二关联关系表判断所述目标模块之间是否存在主次关联关系;
根据所述第三关联关系表,判断在所述目标故障告警信息中是否存在与同一目标基础业务系统相关联的目标故障告警信息;
所述确定满足预设的第二关联条件的所有目标故障告警信息具体包括:
将目标模块存在主次关联关系时所对应的目标故障告警信息确定为满足所述第二关联条件的所有目标故障告警信息;和/或,
将与同一目标基础业务系统相关联的目标故障告警信息确定为满足所述第二关联条件的所有目标故障告警信息。
优选的,所述确定关联后的目标故障告警信息所对应的业务系统具体包括:
若关联后的目标故障告警信息中包括由目标模块存在主次关联关系时所对应的目标故障告警信息关联生成的目标故障告警信息时,根据所述第二关联关系表,将目标模块为主模块时所对应的业务系统确定为关联后的目标故障告警信息所对应的业务系统;
若关联后的目标故障告警信息中包括由与同一目标基础业务系统相关联的目标故障告警信息关联生成的目标故障告警信息时,根据所述第三关联关系表,将对应的一目标基础业务系统确定为关联后的目标故障告警信息所对应的业务系统。
优选的,所述方法还包括:
将所述故障工单与预存的对应的业务系统中的每一维度的排查模型相匹配,得到与所述业务系统的每一维度相对应的匹配结果;
根据与所述业务系统的所有维度相对应的匹配结果确定所述业务系统的目标故障点以及与所述目标故障点相对应的应急恢复预案;
对所述应急恢复预案进行显示,接收并执行故障处理人员选择的目标应急预案以对所述业务系统的故障进行修复。
优选的,当与所述目标故障点相对应的应急恢复预案大于一个时,在对所述应急恢复预案进行显示前包括:
获取所述应急恢复预案的优先级;
所述对所述应急恢复预案进行显示具体包括:
按照与所述应急恢复预案的优先级相对应的排列顺序对所述应急恢复预案进行显示。
优选的,所述方法还包括:
实时监测所述故障处理人员选择的目标应急预案;
当监测到的目标应急预案与所述目标故障点相对应的任一应急恢复预案都不相同时,将监测到的目标应急预案确定为新应急预案;
基于所述新应急预案对所述业务系统的目标故障点所对应维度的排查模型进行更新。
另一方面还公开了一种故障工单生成装置,所述装置包括:
识别模块,用于对同一时间段内接收到的至少两条目标故障告警信息进行判断;
第一处理模块,用于若所述目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足所述第一关联条件的所有目标故障告警信息进行归集;
第一生成模块,用于基于归集后的目标故障告警信息生成所述业务系统的故障工单。本申请再一方面还公开了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的故障工单生成方法。
再一方面还公开了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的故障工单生成方法。
本发明实施例具有如下有益效果:
1、本发明通过对源自同一业务系统且满足一预设条件的告警信息进行归集处理,减少派单量,提高了故障工单的处理效率;
2、本发明通过对源自不同业务系统且满足一预设条件的告警信息进行关联,同样也能降低派单量,提高故障工单的处理效率;
3、本发明通过不同系统的所有维度的排查模型进行并行排查,从而快速定位到故障点;
4、当故障排查结果与实际结果不符时,本发明还可以通过维护变化维度的排查模型来实现对系统的更新或者对新的故障场景的更新,不会影响其他维度的排查模型,进而提高了故障的识别速度和准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例1提供的一种故障工单生成方法的流程图;
图2是本申请实施例1提供的同一业务系统中各不同监控维度的目标故障告警信息归集示意图;
图3是本申请实施例1提供的不同业务系统中的目标故障告警信息关联示意图;
图4是本申请实施例2提供的一种故障工单生成装置的结构示意图;
图5是本申请实施例3提供的一种计算机设备架构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术中所述,现有技术中,当业务系统触发一条故障时,信息系统根据业务系统触发的一条告警信息生成对应的一张故障工单,因此当多条告警信息内容相同,或者多条告警信息有关联,其根因源自同一故障点时,若还是生成相同数量的故障工单的话,便会增加维护人员的工作量,降低故障工单的处理效率。
基于此,本申请提供一种故障工单生成方法、装置、设备,可以有效减少派单量,提高故障工单处理效率。本申请的实施例如下:
实施例1
如图1所示,一种故障工单生成方法,包括:
S11、对同一时间段内接收到的至少两条目标故障告警信息进行判断;
其中,目标故障告警信息由业务系统触发生成,并发送至信息系统,信息系统对目标故障告警信息进行识别。
S12、若目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足第一关联条件的所有目标故障告警信息进行归集;
具体的,在判断目标故障告警信息源自同一业务系统后,还包括如下处理步骤:
S121、获取触发目标故障告警信息的业务系统的监控维度;
S122、当目标故障告警信息源自同一监控维度时,获取目标故障告警信息的生成时间,根据生成时间计算相邻两个目标故障告警信息的时间间隔;
S123、当目标故障告警信息源自不同监控维度时,提取目标故障告警信息的关键字。
基于上述处理过程,确定满足预设的第一关联条件的所有目标故障告警信息具体包括如下步骤:
将时间间隔相同时所对应的源自同一监控维度的目标故障告警信息确定为满足第一关联条件的所有目标故障告警信息;和/或,
将关键字相同时所对应的源自不同监控维度的目标故障告警信息确定为满足第一关联条件的所有目标故障告警信息。
S13、基于归集后的目标故障告警信息生成业务系统的故障工单;
参考图2,若一业务系统中三个监控维度(STP业务监控维度、TRO链路监控维度、AOPS基础监控维度)都触发告警,STP业务监控维度触发的三条目标故障告警信息的时间间隔相同,对STP业务监控维度触发的三条目标故障告警进行归集,得到一条目标故障告警信息,且在对STP业务监控维度触发的三条目标故障告警进行归集的基础上,再对已归集的STP业务监控维度的目标故障告警信息、TRO链路监控维度触发的一条目标故障告警信息、AOPS运维监控维度触发的两条目标故障告警信息进行关键字提取,从而合并成一条目标故障告警信息,并生成与WMC相对应的故障工单。
如此,本方案不仅能够对同一监控维度触发的多条目标故障告警信息进行合并,还能够对不同监控维度触发的多条目标故障告警信息进行合并。
S14、若目标故障告警信息源自不同业务系统,则确定满足预设的第二关联条件的所有目标故障告警信息,并对满足第二关联条件的所有目标故障告警信息进行关联;
具体的,在判断目标故障告警信息源自不同业务系统后,还包括如下处理步骤:
S141、获取第一关联关系表、第二关联关系表、第三关联关系表,第一关联关系表为故障告警信息与触发故障告警信息的业务系统的模块之间的关联关系,第二关联关系表为不同业务系统的模块之间的主次关联关系,第三关联关系表为故障告警信息与触发故障告警信息的基础业务系统之间的关联关系;
S142、根据第一关联关系表,获取与目标故障告警信息相匹配的目标模块,并根据第二关联关系表判断目标模块之间是否存在主次关联关系;
S143、根据第三关联关系表,判断在目标故障告警信息中是否存在与同一目标基础业务系统相关联的目标故障告警信息;
基于上述处理过程,确定预设的第二关联条件的所有目标故障告警信息具体包括如下步骤:
将目标模块存在主次关联关系时所对应的目标故障告警信息确定为满足第二关联条件的所有目标故障告警信息;和/或,
将与同一目标基础业务系统相关联的目标故障告警信息确定为满足第二关联条件的所有目标故障告警信息。
S15、确定关联后的目标故障告警信息所对应的业务系统,并基于关联的目标故障告警信息生成对应的业务系统的故障工单。
其中,确定关联后的目标故障告警信息所对应的业务系统具体包括如下步骤:
S151、若关联后的目标故障告警信息中包括由目标模块存在主次关联关系时所对应的目标故障告警信息关联生成的目标故障告警信息时,根据第二关联关系表,将目标模块为主模块时所对应的业务系统确定为关联后的目标故障告警信息所对应的业务系统;
S152、若关联后的目标故障告警信息中包括由与同一目标基础业务系统相关联的目标故障告警信息关联生成的目标故障告警信息时,根据第三关联关系表,将对应的一目标基础业务系统确定为关联后的目标故障告警信息所对应的业务系统。
参考图3,图3中显示了不同的六条目标故障告警信息,该六条目标故障告警信息与同一基础业务系统(UUMS)有关联,因此,将六条目标故障告警信息关联至UUMS系统,生成与UUMS对应的故障工单。
如此,若多个系统都触发告警,且多个系统触发告警的模块之间有主次关联关系,便能对此情况下的告警进行合并后关联到主系统;并且,当多个系统触发的告警由一基础业务系统引起(例如,同为网络/存储等基础层故障,或中台服务故障(包括:数据中台服务异常、微服务网关异常、多个业务系统的用户菜单权限异常)等),也能对此情况下的告警进行合并后关联到基础业务系统,实现了不同情况下告警的处理。
在创建故障工单后,还需根据故障工单进行故障排查,从而定位故障点,因此本方案还包括如下步骤:
S21、将故障工单与预存的对应的业务系统中的每一维度的排查模型相匹配,得到与业务系统的每一维度相对应的匹配结果;
上述排查模型的生成过程包括:
S211、根据样本数据构建故障点与应急恢复预案的关联关系表;
S212、根据关联关系表,按照业务系统的维度划分信息,确定与业务系统中每一维度相对应的故障点和应急恢复预案;
S213、根据每一维度相对应的故障点和应急恢复预案生成每一维度的故障排查模型。
S22、根据与业务系统的所有维度相对应的匹配结果确定业务系统的目标故障点以及与目标故障点相对应的应急恢复预案;
S23、对应急恢复预案进行显示,接收并执行故障处理人员选择的目标应急预案以对业务系统的故障进行修复。
其中,当与目标故障点相对应的应急恢复预案大于一个时,在对应急恢复预案进行显示前包括:
获取应急恢复预案的优先级,如此,便能按照与应急恢复预案的优先级相对应的排列顺序对应急恢复预案进行显示。
其中,应急恢复预案可以包括:重启、回滚上一版本等。
在排查过程中,有可能会出现故障排查人员所选择的应急恢复预案与推荐的都不相同的情况,此时,说明系统推荐的应急恢复预案并不正确,需要对排查模型进行更新,具体包括如下步骤:
S31、实时监测故障处理人员选择的目标应急预案;
S32、当监测到的目标应急预案与目标故障点相对应的任一应急恢复预案都不相同时,将监测到的目标应急预案确定为新应急预案;
S33、基于新应急预案对业务系统的目标故障点所对应维度的排查模型进行更新。
具体更新过程为:
S331、将监测到的目标应急恢复预案与对应业务系统的目标故障点进行关联,同时解除原应急恢复预案与对应业务系统的目标故障点的关联关系;
S332、根据监测到的目标应急恢复预案、对应业务系统的目标故障点生成对应维度的新故障排查模型。
此外,当故障工单与预存的业务系统的任一维度的排查模型都不匹配时,本方案还包括如下处理步骤:
S41、基于预设的通用排查模型输出通用应急恢复预案;
S42、对通用应急恢复预案进行显示,接收并执行故障处理人员选择的目标通用应急预案以对业务系统的故障进行修复。
实施例2
对应上述方法,本申请实施例2提供一种故障工单生成装置,如图4所示,装置包括:
识别模块21,用于对同一时间段内生成的至少两条目标故障告警信息进行识别;
第一处理模块22,用于若目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足第一关联条件的所有目标故障告警信息进行归集;
第一生成模块23,用于基于归集后的目标故障告警信息生成业务系统的故障工单。
优选的,第一处理模块22还用于:
在判断目标故障告警信息源自同一业务系统后,获取触发目标故障告警信息的业务系统的监控维度;
当目标故障告警信息源自同一监控维度时,获取目标故障告警信息的生成时间,根据生成时间计算相邻两个目标故障告警信息的时间间隔;
当目标故障告警信息源自不同监控维度时,提取目标故障告警信息的关键字;
将时间间隔相同时所对应的源自同一监控维度的目标故障告警信息确定为满足第一关联条件的所有目标故障告警信息;和/或,
将关键字相同时所对应的源自不同监控维度的目标故障告警信息确定为满足第一关联条件的所有目标故障告警信息。
优选的,上述装置还包括:
第二处理模块24,用于若目标故障告警信息源自不同业务系统,则确定满足预设的第二关联条件的所有目标故障告警信息,并对满足第二关联条件的所有目标故障告警信息进行关联;
第二生成模块25,用于确定关联后的目标故障告警信息所对应的业务系统,并基于关联后的目标故障告警信息生成对应的业务系统的故障工单。
优选的,第二处理模块24具体用于:
在判断目标故障告警信息源自不同业务系统后,获取第一关联关系表、第二关联关系表、第三关联关系表,第一关联关系表为故障告警信息与触发故障告警信息的业务系统的模块之间的关联关系,第二关联关系表为不同业务系统的模块之间的主次关联关系,第三关联关系表为故障告警信息与触发故障告警信息的基础业务系统之间的关联关系;
根据第一关联关系表,获取与目标故障告警信息相匹配的目标模块,并根据第二关联关系表判断目标模块之间是否存在主次关联关系;
根据第三关联关系表,判断在目标故障告警信息中是否存在与同一目标基础业务系统相关联的目标故障告警信息;
将目标模块存在主次关联关系时所对应的目标故障告警信息确定为满足第二关联条件的所有目标故障告警信息;和/或,
将与同一目标基础业务系统相关联的目标故障告警信息确定为满足第二关联条件的所有目标故障告警信息。
优选的,第二生成模块25具体用于:
若关联后的目标故障告警信息中包括由目标模块存在主次关联关系时所对应的目标故障告警信息关联生成的目标故障告警信息时,根据第二关联关系表,将目标模块为主模块时所对应的业务系统确定为关联后的目标故障告警信息所对应的业务系统;
若关联后的目标故障告警信息中包括由与同一目标基础业务系统相关联的目标故障告警信息关联生成的目标故障告警信息时,根据第三关联关系表,将对应的一目标基础业务系统确定为关联后的目标故障告警信息所对应的业务系统。
优选的,上述装置还包括:
匹配模块26,用于将故障工单与预存的对应的业务系统中的每一维度的排查模型相匹配,得到与业务系统的每一维度相对应的匹配结果;
定位模块27,用于根据与业务系统的所有维度相对应的匹配结果确定业务系统的目标故障点以及与目标故障点相对应的应急恢复预案;
显示模块28,用于对应急恢复预案进行显示;
执行模块29,接收并执行故障处理人员选择的目标应急预案以对业务系统的故障进行修复。
优选的,上述装置还包括:
获取模块210,用于当与目标故障点相对应的应急恢复预案大于一个时,在对应急恢复预案进行显示前,获取应急恢复预案的优先级;
显示模块28还用于按照与应急恢复预案的优先级相对应的排列顺序对应急恢复预案进行显示。
优选的,上述装置还包括:
监测模块211,用于实时监测故障处理人员选择的目标应急预案;
更新模块212,用于当监测到的目标应急预案与目标故障点相对应的任一应急恢复预案都不相同时,将监测到的目标应急预案确定为新应急预案;
基于新应急预案对业务系统的目标故障点所对应维度的排查模型进行更新。
实施例3
在一个实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现实施例1所述的所有方法。
图5为本发明实施例提供的计算机设备的内部结构图。该计算机设备可以是模块器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种故障工单生成方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种故障工单生成方法,其特征在于,所述方法包括:
对同一时间段内接收到的至少两条目标故障告警信息进行判断;
若所述目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足所述第一关联条件的所有目标故障告警信息进行归集;所述第一关联条件包括时间间隔相同或关键词相同;
基于归集后的目标故障告警信息生成所述业务系统的故障工单;
若所述目标故障告警信息源自不同业务系统,则获取第一关联关系表、第二关联关系表、第三关联关系表,所述第一关联关系表为故障告警信息与触发故障告警信息的业务系统的模块之间的关联关系,所述第二关联关系表为不同业务系统的模块之间的主次关联关系,所述第三关联关系表为故障告警信息与触发故障告警信息的基础业务系统之间的关联关系;
根据所述第一关联关系表、第二关联关系表、第三关联关系表确定满足预设的第二关联条件的所有目标故障告警信息,并对满足所述第二关联条件的所有目标故障告警信息进行关联;具体包括,根据所述第一关联关系表,获取与所述目标故障告警信息相匹配的目标模块,并根据所述第二关联关系表判断所述目标模块之间是否存在主次关联关系;根据所述第三关联关系表,判断在所述目标故障告警信息中是否存在与同一目标基础业务系统相关联的目标故障告警信息;所述第二关联条件包括目标模块存在主次关联关系或与同一目标基础业务系统相关联;
确定关联后的目标故障告警信息所对应的业务系统,并基于关联后的目标故障告警信息生成对应的业务系统的故障工单。
2.根据权利要求1所述的方法,其特征在于,在判断所述目标故障告警信息源自同一业务系统后,所述方法还包括:
获取触发所述目标故障告警信息的业务系统的监控维度;
当所述目标故障告警信息源自同一监控维度时,获取所述目标故障告警信息的生成时间,根据生成时间计算相邻两个目标故障告警信息的时间间隔;
当所述目标故障告警信息源自不同监控维度时,提取所述目标故障告警信息的关键字;
所述确定满足预设的第一关联条件的所有目标故障告警信息具体包括:
将时间间隔相同时所对应的源自同一监控维度的目标故障告警信息确定为满足所述第一关联条件的所有目标故障告警信息;和/或,
将关键字相同时所对应的源自不同监控维度的目标故障告警信息确定为满足所述第一关联条件的所有目标故障告警信息。
3.根据权利要求1所述的方法,其特征在于,所述确定满足预设的第二关联条件的所有目标故障告警信息具体包括:
将目标模块存在主次关联关系时所对应的目标故障告警信息确定为满足所述第二关联条件的所有目标故障告警信息;和/或,
将与同一目标基础业务系统相关联的目标故障告警信息确定为满足所述第二关联条件的所有目标故障告警信息。
4.根据权利要求3所述的方法,其特征在于,所述确定关联后的目标故障告警信息所对应的业务系统具体包括:
若关联后的目标故障告警信息中包括由目标模块存在主次关联关系时所对应的目标故障告警信息关联生成的目标故障告警信息时,根据所述第二关联关系表,将目标模块为主模块时所对应的业务系统确定为关联后的目标故障告警信息所对应的业务系统;
若关联后的目标故障告警信息中包括由与同一目标基础业务系统相关联的目标故障告警信息关联生成的目标故障告警信息时,根据所述第三关联关系表,将对应的一目标基础业务系统确定为关联后的目标故障告警信息所对应的业务系统。
5.根据权利要求1~4任意一项所述的方法,其特征在于,所述方法还包括:
将所述故障工单与预存的对应的业务系统中的每一维度的排查模型相匹配,得到与所述业务系统的每一维度相对应的匹配结果;
根据与所述业务系统的所有维度相对应的匹配结果确定所述业务系统的目标故障点以及与所述目标故障点相对应的应急恢复预案;
对所述应急恢复预案进行显示,接收并执行故障处理人员选择的目标应急预案以对所述业务系统的故障进行修复。
6.根据权利要求5所述的方法,其特征在于,当与所述目标故障点相对应的应急恢复预案大于一个时,在对所述应急恢复预案进行显示前包括:
获取所述应急恢复预案的优先级;
所述对所述应急恢复预案进行显示具体包括:
按照与所述应急恢复预案的优先级相对应的排列顺序对所述应急恢复预案进行显示。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
实时监测所述故障处理人员选择的目标应急预案;
当监测到的目标应急预案与所述目标故障点相对应的任一应急恢复预案都不相同时,将监测到的目标应急预案确定为新应急预案;
基于所述新应急预案对所述业务系统的目标故障点所对应维度的排查模型进行更新。
8.一种故障工单生成装置,其特征在于,所述装置包括:
识别模块,用于对同一时间段内接收到的至少两条目标故障告警信息进行判断;
第一处理模块,用于若所述目标故障告警信息源自同一业务系统,则确定满足预设的第一关联条件的所有目标故障告警信息,并对满足所述第一关联条件的所有目标故障告警信息进行归集;所述第一关联条件包括时间间隔相同或关键词相同;
第一生成模块,用于基于归集后的目标故障告警信息生成所述业务系统的故障工单;
第二处理模块,用于若所述目标故障告警信息源自不同业务系统,则获取第一关联关系表、第二关联关系表、第三关联关系表,所述第一关联关系表为故障告警信息与触发故障告警信息的业务系统的模块之间的关联关系,所述第二关联关系表为不同业务系统的模块之间的主次关联关系,所述第三关联关系表为故障告警信息与触发故障告警信息的基础业务系统之间的关联关系;根据所述第一关联关系表、第二关联关系表、第三关联关系表确定满足预设的第二关联条件的所有目标故障告警信息,并对满足所述第二关联条件的所有目标故障告警信息进行关联;具体包括,根据所述第一关联关系表,获取与所述目标故障告警信息相匹配的目标模块,并根据所述第二关联关系表判断所述目标模块之间是否存在主次关联关系;根据所述第三关联关系表,判断在所述目标故障告警信息中是否存在与同一目标基础业务系统相关联的目标故障告警信息;所述第二关联条件包括目标模块存在主次关联关系或与同一目标基础业务系统相关联;
第二生成模块,用于确定关联后的目标故障告警信息所对应的业务系统,并基于关联后的目标故障告警信息生成对应的业务系统的故障工单。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:
所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的故障工单生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010652493.2A CN111814999B (zh) | 2020-07-08 | 2020-07-08 | 一种故障工单生成方法、装置、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010652493.2A CN111814999B (zh) | 2020-07-08 | 2020-07-08 | 一种故障工单生成方法、装置、设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814999A CN111814999A (zh) | 2020-10-23 |
CN111814999B true CN111814999B (zh) | 2024-01-16 |
Family
ID=72842968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010652493.2A Active CN111814999B (zh) | 2020-07-08 | 2020-07-08 | 一种故障工单生成方法、装置、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814999B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610560B (zh) * | 2020-12-07 | 2024-04-02 | 腾讯科技(深圳)有限公司 | 系统异常监控方法、装置和存储介质 |
CN112668733A (zh) * | 2020-12-17 | 2021-04-16 | 国网冀北电力有限公司信息通信分公司 | 基于无监督学习的通信管理系统缺陷故障派单方法及装置 |
CN113256244A (zh) * | 2021-04-30 | 2021-08-13 | 新奇点智能科技集团有限公司 | 智能交通云管理平台生成告警工单的方法、装置、设备及存储介质 |
CN113312200A (zh) * | 2021-06-01 | 2021-08-27 | 中国民航信息网络股份有限公司 | 一种事件处理方法、装置、计算机设备及存储介质 |
CN113608839A (zh) * | 2021-08-10 | 2021-11-05 | 曙光信息产业(北京)有限公司 | 集群告警方法、装置、计算机设备及存储介质 |
CN113722184A (zh) * | 2021-09-01 | 2021-11-30 | 中国建设银行股份有限公司 | 系统告警方法及装置、电子设备、存储介质 |
CN113568991B (zh) * | 2021-09-22 | 2022-02-08 | 北京必示科技有限公司 | 一种基于动态风险的告警处理方法及系统 |
CN113868008A (zh) * | 2021-10-14 | 2021-12-31 | 中国建设银行股份有限公司 | 一种异常处理方法及装置 |
CN115174350B (zh) * | 2022-06-30 | 2024-07-02 | 济南浪潮数据技术有限公司 | 一种运维告警方法、装置、设备及介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101212367A (zh) * | 2007-12-25 | 2008-07-02 | 北京亿阳信通软件研究院有限公司 | 一种告警信息的处理方法及装置 |
CN102638100A (zh) * | 2012-04-05 | 2012-08-15 | 华北电力大学 | 地区电网设备异常告警信号关联分析与诊断方法 |
CN103001324A (zh) * | 2012-09-19 | 2013-03-27 | 上海市电力公司 | 一种电网事故调度处理的优化方法 |
CN104038375A (zh) * | 2014-06-30 | 2014-09-10 | 成都广达电子股份有限公司 | 一种广电接入网络告警处理分析系统及其分析方法 |
CN104125087A (zh) * | 2013-04-28 | 2014-10-29 | 中国移动通信集团设计院有限公司 | 一种告警信息处理方法及装置 |
CN107196804A (zh) * | 2017-06-01 | 2017-09-22 | 国网山东省电力公司信息通信公司 | 电力系统终端通信接入网告警集中监控系统及方法 |
CN107770797A (zh) * | 2016-08-17 | 2018-03-06 | 中国移动通信集团内蒙古有限公司 | 一种无线网络告警管理的关联分析方法及系统 |
CN107885634A (zh) * | 2016-09-29 | 2018-04-06 | 腾讯科技(深圳)有限公司 | 监控中异常信息的处理方法和装置 |
CN108156037A (zh) * | 2017-12-29 | 2018-06-12 | 中国移动通信集团江苏有限公司 | 告警关联分析方法、装置、设备及介质 |
CN108989132A (zh) * | 2018-08-24 | 2018-12-11 | 深圳前海微众银行股份有限公司 | 故障告警处理方法、系统及计算机可读存储介质 |
CN110930538A (zh) * | 2019-12-18 | 2020-03-27 | 三一重机有限公司 | 车辆可视化故障信息的方法和系统 |
-
2020
- 2020-07-08 CN CN202010652493.2A patent/CN111814999B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101212367A (zh) * | 2007-12-25 | 2008-07-02 | 北京亿阳信通软件研究院有限公司 | 一种告警信息的处理方法及装置 |
CN102638100A (zh) * | 2012-04-05 | 2012-08-15 | 华北电力大学 | 地区电网设备异常告警信号关联分析与诊断方法 |
CN103001324A (zh) * | 2012-09-19 | 2013-03-27 | 上海市电力公司 | 一种电网事故调度处理的优化方法 |
CN104125087A (zh) * | 2013-04-28 | 2014-10-29 | 中国移动通信集团设计院有限公司 | 一种告警信息处理方法及装置 |
CN104038375A (zh) * | 2014-06-30 | 2014-09-10 | 成都广达电子股份有限公司 | 一种广电接入网络告警处理分析系统及其分析方法 |
CN107770797A (zh) * | 2016-08-17 | 2018-03-06 | 中国移动通信集团内蒙古有限公司 | 一种无线网络告警管理的关联分析方法及系统 |
CN107885634A (zh) * | 2016-09-29 | 2018-04-06 | 腾讯科技(深圳)有限公司 | 监控中异常信息的处理方法和装置 |
CN107196804A (zh) * | 2017-06-01 | 2017-09-22 | 国网山东省电力公司信息通信公司 | 电力系统终端通信接入网告警集中监控系统及方法 |
CN108156037A (zh) * | 2017-12-29 | 2018-06-12 | 中国移动通信集团江苏有限公司 | 告警关联分析方法、装置、设备及介质 |
CN108989132A (zh) * | 2018-08-24 | 2018-12-11 | 深圳前海微众银行股份有限公司 | 故障告警处理方法、系统及计算机可读存储介质 |
CN110930538A (zh) * | 2019-12-18 | 2020-03-27 | 三一重机有限公司 | 车辆可视化故障信息的方法和系统 |
Non-Patent Citations (3)
Title |
---|
2008 International Conference on Cyberworlds;T. Zhihong, Q. Baoshan, Y. Jianwei and Z. Hongli;Alertclu: A Realtime Alert Aggregation and Correlation System;778-781 * |
IOP Conference Series: Materials Science and Engineering;Xianguang Lu et al;An Alert Aggregation Algorithm Based on K-means and Genetic Algorithm;1-10 * |
电网主站监控系统告警信息优化;赵银菊;李海燕;马艳霞;凤雨;;电工文摘(第01期);58-60 * |
Also Published As
Publication number | Publication date |
---|---|
CN111814999A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814999B (zh) | 一种故障工单生成方法、装置、设备 | |
US20190361759A1 (en) | System and method to identify failed points of network impacts in real time | |
US11153144B2 (en) | System and method of automated fault correction in a network environment | |
CN112631913A (zh) | 应用程序的运行故障监控方法、装置、设备和存储介质 | |
CN104796273A (zh) | 一种网络故障根源诊断的方法和装置 | |
CN109669844A (zh) | 设备故障处理方法、装置、设备和存储介质 | |
CN112966056B (zh) | 一种信息处理方法、装置、设备、系统及可读存储介质 | |
CN111352759A (zh) | 一种告警根因的判定方法及装置 | |
JP6079243B2 (ja) | 障害分析支援装置、障害分析支援方法、及びプログラム | |
CN111949480B (zh) | 一种基于组件感知的日志异常检测方法 | |
CN113391943A (zh) | 一种基于因果推断的微服务故障根因定位方法及装置 | |
CN113672456A (zh) | 应用平台的模块化自监听方法、系统、终端及存储介质 | |
CN111210029A (zh) | 辅助分析业务的装置、方法及相关设备 | |
JP2019049802A (ja) | 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム | |
CN108880838B (zh) | 业务故障的监控方法及装置、计算机设备及可读介质 | |
WO2024148857A1 (zh) | 服务器故障根因的过滤方法和装置、非易失性可读存储介质及电子装置 | |
CN111813872B (zh) | 一种故障排查模型的生成方法、装置、设备 | |
CN112769615B (zh) | 一种异常分析方法及装置 | |
CN116089231A (zh) | 一种故障告警方法、装置、电子设备及存储介质 | |
CN111913824A (zh) | 确定数据链路故障原因的方法及相关设备 | |
CN113656252B (zh) | 故障定位方法、装置、电子设备以及存储介质 | |
CN117155772B (zh) | 一种告警信息丰富方法、装置、设备及存储介质 | |
CN117389779A (zh) | 一种微服务故障根因定位方法 | |
US12056033B2 (en) | Anomaly location estimating apparatus, method, and program | |
CN114327988A (zh) | 一种可视化网络故障关系确定方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |