CN115296979B - 一种故障处理方法、装置、设备及存储介质 - Google Patents

一种故障处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115296979B
CN115296979B CN202210914441.7A CN202210914441A CN115296979B CN 115296979 B CN115296979 B CN 115296979B CN 202210914441 A CN202210914441 A CN 202210914441A CN 115296979 B CN115296979 B CN 115296979B
Authority
CN
China
Prior art keywords
alarm
target
verification
type
processing operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210914441.7A
Other languages
English (en)
Other versions
CN115296979A (zh
Inventor
周恒俊
赵怡茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202210914441.7A priority Critical patent/CN115296979B/zh
Publication of CN115296979A publication Critical patent/CN115296979A/zh
Application granted granted Critical
Publication of CN115296979B publication Critical patent/CN115296979B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Abstract

本发明实施例公开了一种故障处理方法、装置、设备及存储介质。该方法包括:接收到告警信息,并识别目标告警类型;根据告警信息,对目标告警类型进行验证;根据验证结果,选择并执行验证结果对应的告警处理操作。本发明实施例通过对告警信息的进行多维度验证,实现了对目标告警类型的精准定位,降低了对人工的依赖性,提高了故障处理的执行效率和故障处理的准确性。

Description

一种故障处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种故障处理方法、装置、设备及存储介质。
背景技术
随着信息化资源的应用越来越广泛,为信息化资源建立监控和运维管理系统越来越重要。
目前,针对信息资源中软件和硬件出现的问题,通过设立阈值的方式,产生告警信息。运维人员接收到告警信息后对系统的各项信息进行排查,再依据运维人员的经验进行故障处理。
但是,依赖运维人员的经验进行故障处理,对人工的依赖性高、处置的效率低且准确性难以保障,亟待解决。
发明内容
本发明提供了一种故障处理方法、装置、设备及存储介质,降低了对人工的依赖性,提高了故障处理的效率和准确性。
根据本发明的一方面,提供了一种故障处理方法,包括:
接收到告警信息,并识别目标告警类型;
根据告警信息,对目标告警类型进行验证;
根据验证结果,选择并执行验证结果对应的告警处理操作。
根据本发明的另一方面,提供了一种故障处理装置,包括:
告警类型识别模块,用于接收到告警信息,并识别目标告警类型;
告警类型验证模块,用于根据告警信息,对目标告警类型进行验证;
告警处理模块,用于根据验证结果,选择并执行验证结果对应的告警处理操作。
根据本发明的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的故障处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的故障处理方法。
本发明实施例的技术方案基于接收到的告警信息,对进行目标告警类型的识别和验证,基于验证结果,执行相应的告警处理操作,通过对告警信息的进行多维度验证,实现了对目标告警类型的精准定位,降低了对人工的依赖性,提高了故障处理的执行效率和故障处理的准确性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种故障处理方法的流程图;
图2是本发明实施例二提供的一种故障处理方法的流程图;
图3是本发明实施例三提供的一种故障处理方法的流程图;
图4a是本发明实施例四提供的一种故障处理方法的流程图;
图4b是本发明实施例四提供的一种故障处理装置的系统架构图;
图5是本发明实施例五提供的一种故障处理装置的结构示意图;
图6是本发明实施例六提供的一种实现故障处理方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”、“包含”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是本发明实施例一提供了一种故障处理方法的流程图。本实施例可适用于从多维度对故障进行处理的情况,该方法可以由故障处理装置来执行,该故障处理装置可以采用硬件和/或软件的形式实现,该故障处理装置可集成于电子设备中。如图1所示,该方法包括:
S110、接收到告警信息,并识别目标告警类型。
其中,告警信息可以是包含异常状态的信息。告警信息可以由发生故障的业务系统发送,可以用于定位发生故障的业务系统。告警信息可以作为业务系统故障处理的参考信息。业务系统可以是进行业务处理的各个系统。
目标告警类型可以是告警信息对应的业务系统的故障的类型。目标告警类型可以进一步细化为目标告警类型对应的具体的故障点。确定了目标告警类型,可以确定告警信息中包含的异常状态对应的故障点的位置。示例性的,告警类型可以包括基础资源告警、日志资源告警、链路资源告警、性能告警和其他告警等。
其中,基础资源告警可以是业务系统中基础资源出现故障的告警。基础资源可以包括系统资源、网络资源和中间件等。系统资源可以是在程序执行过程中需要访问的硬件。例如,中央处理器(CPU)、缓存、内存、硬盘、总线、输入输出接口(I/O)、网际协议地址(Internet Protocol Address)、子网掩码、网关和域名系统(DNS)等。网络资源可以是借助于网络环境可以利用的信息资源。例如,超级文本语言(Hyper Text Markup Language,HTML)文档、图像、视频、音频和程序等。中间件是独立的系统软件或服务程序。分布式应用软件借助中间件在不同的系统之间共享资源。中间件位于服务器的操作系统之上,管理计算资源和网络通信。
日志资源告警可以是日志数据中出现异常字段、异常词汇或异常词频的告警。日志资源告警用于提示和定位业务系统的故障。若日志数据中出现异常字段、异常词汇或异常词频,则认为业务系统存在故障,需要对故障进行定位和处理。
链路资源告警可以是业务系统中上下游之间无法进行通信的告警。示例性的,链路资源告警可以为交易告警。交易告警可以是上下游之间无法进行交易的告警。产生链路资源告警的原因可以包括:网络配置不当、因特网控制消息协议(Internet ControlMessage Protocol,ICMP)限速、环路和链路中断等。
性能告警可以是业务系统的性能指标出现异常的告警。性能指标可以包括:吞吐量、响应时间和成功率等。吞吐量是每秒钟系统能够处理的任务数量;响应时间是处理单个任务的时间;成功率是一批任务中处理成功且处理结果正确的任务在一批任务中所占比例。性能指标出现异常是指吞吐量低于吞吐量阈值、响应时间高于响应时间阈值或成功率低于成功率阈值。其中,吞吐量阈值、响应时间阈值和成功率阈值可以根据技术人员的经验进行设定和调整。
其他告警可以是除上述告警类型以外的可以处理的其他类型的告警。
具体的,当故障处理装置接收到业务系统发送的告警信息时,故障处理装置的分析层根据告警信息的内容对告警信息进行分析和识别,确定告警信息对应的业务系统的故障的类型为基础资源告警、日志资源告警、链路资源告警、性能告警或其他告警中的哪一种类型。
S120、根据告警信息,对目标告警类型进行验证。
具体的,故障处理装置可以根据告警信息中包含的异常状态和已确定的目标告警类型定位的故障点,对故障点进行调用,并进行异常状态的验证测试,根据验证结果验证目标告警类型的正确性。若验证结果显示依然为异常状态,则故障点定位正确,即确定的目标告警类型正确;若验证结果为正常状态,则故障点定位错误,即确定的目标告警类型错误,将目标告警类型更新为其它告警类型并返回对目标告警类型进行验证的步骤,直至确认目标告警类型或对所有目标告警类型确认完成为止。其中,验证结果可以是对目标告警类型进行验证后得到的结果。验证结果可以包括某一确定的目标告警类型或没有确定的目标告警类型。
示例性的,若告警信息为上游设备A向下游设备B发送数据失败,故障处理装置识别出的目标告警类型为链路资源告警,具体为上游设备A与下游设备B之间的链路存在异常。故障处理装置对上游设备A与下游设备B之间的链路进行调用,通过该链路在故障处理装置中的上游设备C向下游设备D发送数据,验证是否会发送失败。若故障处理装置中的下游设备D没有接收到数据并反馈给故障处理装置,则说明该链路确实存在异常,验证目标告警类型正确;若故障处理装置中的下游设备D接收到数据并反馈给故障处理装置,则说明该链路没有异常,验证目标告警类型错误,将目标告警类型更新为其它告警类型(例如基础资源告警等)并返回对基础资源告警进行验证,验证上游设备A或下游设备B是否存在基础资源告警,直至确认目标告警类型或对所有目标告警类型均已确认完成为止。
S130、根据验证结果,选择并执行验证结果对应的告警处理操作。
其中,告警处理操作可以是对告警信息进行处理的操作。可选的,针对不同的验证结果,所执行的告警处理操作不同。
具体的,若验证结果为没有确定的目标告警类型,则将告警信息和验证结果发送给运维用户,运维用户接收到告警信息和验证结果,根据告警信息和验证结果执行告警处理操作。其中,运维用户可以是对告警信息进行分析和处理的运维人员。若验证结果为某一确定的目标告警类型,则故障处理装置查询该目标告警类型进一步细化的具体的故障点是否存在对应的告警处理操作,若是,则选择该告警处理操作,并对该故障点执行该告警处理操作;若否,则发送给运维用户进行处理。
针对不同的目标告警类型进一步细化的具体的故障点,所执行的告警处理操作不同。
示例性的,设定目标告警类型为基础资源告警,将基础资源告警进一步细化为具体的故障点,若具体的故障点为内存或缓存溢出,则告警处理操作可以是对内存或缓存进行删除;若具体的故障点为某一硬盘故障,则告警处理操作可以是更换其他硬盘位置执行请求,并提示维修或更换故障硬盘;若具体的故障点为网关故障,则告警处理操作可以是重启相应的路由器。
设定目标告警类型为日志资源告警,将日志资源告警进一步细化为具体的故障点,若对应的故障点为日志溢出,则告警处理操作位删除日志数据。
设定目标告警类型为链路资源告警,将链路资源告警进一步细化为具体的故障点,若具体的故障点为网络配置不当,则告警处理操作可以是等待网络恢复或重启相应的网关;若具体的故障点为因特网控制消息协议限速,则告警处理操作可以是请求解除限速;若具体的故障点为环路,则告警处理操作可以是请求断开部分环路;若具体的故障点为链路中断,则告警处理操作可以是提示进行链路中断恢复。
设定目标告警类型为性能告警,将性能告警进一步细化为具体的故障点,若具体的故障点为响应时间超过响应时间阈值,则告警处理操作为请求任务分配系统调节业务系统的任务数量;若具体的故障点为吞吐量低于吞吐量阈值或成功率低于成功率阈值,则告警处理操作可以是将任务转移至其他业务系统处理,并提示对该业务系统进行维护。
在本发明的一个可选实施例中,在执行验证结果对应的告警处理操作之后,还包括:
在预设时长内未接收到告警信息,确定告警处理完成。
其中,预设时长可以为验证是否出现告警信息的预先设定的时长。预设时长大于相邻两次告警信息提醒的时间间隔的时长。预设时长可以由告警信息提醒的时间间隔决定。若不同业务系统的告警信息的时间间隔不同,则不同业务系统的预设时长不同。预设时长可以根据技术人员的经验值进行设定和调整。
具体的,若告警处理操作的执行过程均已执行之后,直至达到预设时长,故障处理装置仍没有收到发生故障的业务系统发送告警信息,则认为告警处理操作执行成功,告警处理完成。
示例性的,若相邻告警信息的时间间隔为3s,则可以设定预设时长为10s。若故障处理装置执行完告警处理操作之后,经过10s,仍未收到对应的业务系统发送的告警信息,则认为告警处理完成。
在预设时长内接收到告警信息,将告警信息转发给运维用户,以使运维用户对告警信息进行处理。
具体的,若告警处理操作的执行过程均已执行之后,在预设时间内,故障处理装置仍会接收到发生故障的业务系统发送的告警信息,则认为告警处理操作无效,业务系统的故障依然存在,将告警信息发送给运维用户,运维用户收到告警信息后,根据告警信息的内容对业务系统执行告警处理操作。
示例性的,如上述示例,若故障处理装置执行完告警处理操作之后,在10s内仍可以收到对应的业务系统发送的告警信息,则认为告警处理操作无效,业务系统的故障依然存在。此时,将告警信息发送给运维用户,运维用户收到告警信息后,根据告警信息的内容对业务系统执行告警处理操作。
本方案通过对告警处理操作进行验证,一方面保证了故障处理的完成度,另一方面保障了告警处理操作的准确性,进而保证了故障处理的准确性。
在本发明的一个可选实施例中,在执行验证结果对应的告警处理操作的同时,还包括:
展示验证结果对应的告警处理操作的执行过程。
具体的,在故障处理装置执行基于验证结果确定的告警处理操作的同时,故障处理装置的展示层对执行该告警处理操作的每一步的具体处理流程进行展示。若为运维用户执行的告警处理操作,则在展示告警处理操作的执行过程之后生成新的告警处理操作。
示例性的,若目标告警类型为性能告警,具体的故障点为响应时间超过响应时间阈值,告警处理操作为调节业务系统的任务数量。在执行验证结果对应的告警处理操作的同时,故障处理装置的展示层可以展示该告警处理操作的每一步的具体处理流程。例如,若故障处理装置正在执行向任务分配系统发送请求,以减少任务数量的步骤,则故障处理装置的展示层可以显示“正在向任务分配系统发送请求”;若故障处理装置正在执行接收任务分配系统发送任务的步骤,则故障处理装置的展示层可以显示“正在接收任务分配系统发送的任务”;若故障处理装置正在执行确定告警处理是否完成的步骤,则故障处理装置的展示层可以显示“正在确认告警是否处理完成”;若故障处理装置正在执行已确定告警处理完成的步骤,则故障处理装置的展示层可以显示“告警已处理”。若该告警处理操作不是故障处理装置中已经配置的,而是运维用户进行操作处理的,则在运维用户执行结束之后,将该告警处理操作存入故障处理装置中。
可选的,该故障处理方法还可以展示发生故障的各业务系统的健康度。
其中,健康度可以是评价业务系统的系统指标的参数。可选的,系统指标可以包括:异常告警频率、CPU占用率、内存占用率、请求处理的成功率和响应时间等。
具体的,可以在故障处理装置的展示层显示业务系统的各项系统指标的数值和综合业务系统的各项系统指标后得出的健康度的数值。
本方案通过对告警处理操作的执行过程进行展示,展示了运维用户的告警处理操作,并生成了新的告警处理操作,实现了告警处理操作的更新迭代,进一步降低了故障处理过程中对人工的依赖性,提高了后续故障处理的效率。
本发明实施例的技术方案基于接收到的告警信息,对进行目标告警类型的识别和验证,基于验证结果,执行相应的告警处理操作,通过对告警信息的进行多维度验证,实现了对目标告警类型的精准定位,降低了对人工的依赖性,提高了故障处理的执行效率和故障处理的准确性。
实施例二
图2是本发明实施例二提供的一种故障处理方法的流程图,本实施例在上述各实施例的基础上,将根据告警信息,对目标告警类型进行验证进一步优化。如图2所示,该方法包括:
S210、接收到告警信息,并识别目标告警类型。
S220、获取告警信息对应的目标验证操作。
其中,目标验证操作可以是验证目标告警类型是否识别正确的操作。
具体的,故障处理装置可以获取告警信息中包含的异常状态,将故障处理装置对该故障点重复执行告警信息中的异常状态的操作,作为告警信息对应的目标验证操作。
示例性的,若告警信息为上游设备A向下游设备B发送数据失败,故障处理装置识别出的目标告警类型为基础资源告警,具体为下游设备B发生故障,则将故障处理装置向下游设备B发送数据的操作作为该告警信息对应的目标验证操作。
S230、执行告警信息对应的目标验证操作,获取目标验证操作的异常检测结果。
其中,异常检测结果可以是目标验证操作的检测结果。
具体的,故障处理装置对故障点进行调用,故障处理装置对该故障点执行告警信息中的异常状态对应的目标验证操作,在目标验证操作执行结束后,故障处理装置获取目标验证操作的执行结果,并将该执行结果作为异常检测结果。
示例性的,若告警信息为上游设备A向下游设备B发送数据失败,故障处理装置识别出的目标告警类型为基础资源告警,具体为下游设备B发生故障,则故障处理装置调用下游设备B,并执行故障处理装置向下游设备B发送数据的目标验证操作,在目标验证操作执行结束之后,故障处理装置获取目标验证操作的执行结果,并将该执行结果作为异常检测结果。
S240、在目标验证操作的异常检测结果为异常的情况下,确定目标告警类型的验证结果为正确。
具体的,若故障处理装置对该故障点重复执行告警信息中的异常状态的目标验证操作之后,得到的异常检测结果依然为异常,即依然存在告警信息中包含的异常状态,则说明该故障点定位正确,验证了该故障点对应的目标告警类型的正确,即目标告警类型的验证结果为正确。
示例性的,参见上述S230中的具体示例,在目标验证操作执行结束之后,故障处理装置获取目标验证操作的异常检测结果。若异常检测结果仍然为异常的情况下,则说明故障点确为下游设备B发生故障,目标告警类型的验证结果为正确。
S250、在目标验证操作的异常检测结果为正常的情况下,确定目标告警类型的验证结果为错误。
具体的,若故障处理装置对该故障点重复执行告警信息中的异常状态的目标验证操作之后,得到的异常检测结果为正常,即不存在告警信息中包含的异常状态,则说明该故障点定位错误,验证了该故障点对应的目标告警类型的错误,即目标告警类型的验证结果为错误。
示例性的,参见上述S230中的具体示例,在目标验证操作执行结束之后,故障处理装置获取目标验证操作的异常检测结果。若异常检测结果为正常,则说明下游设备B并没有发生故障,故障点定位错误,目标告警类型的验证结果为错误。
S260、获取除告警信息对应的验证操作之外的其他验证操作。
其中,其他验证操作可以是除目标验证操作之外的告警信息对应的验证操作。
具体的,获取告警信息中包含的异常状态,根据该异常状态,重新定位其他故障点,并将利用故障处理装置对各个其他故障点重复执行异常状态的验证操作作为各个其他验证操作。
示例性的,参见上述S250中的具体示例,若目标告警类型的验证结果为错误,故障点并非下游设备B,则将对应的故障点确定为上游设备A或上游设备A与下游设备B之间的链路。
若验证目标告警类型是否为基础资源告警,具体为上游设备A发生故障,则故障处理装置调用上游设备A,并执行上游设备A向故障处理装置发送数据的验证操作。
若验证目标告警类型是否为链路资源告警,具体为上游设备A与下游设备B之间的链路故障,则故障处理装置调用上游设备A与下游设备B之间的链路,并执行通过该链路由故障处理装置中的上游设备C向下游设备D发送数据的验证操作。
S270、获取各其他验证操作的异常检测结果。
具体的,在执行完其他验证操作之后,故障处理装置获取该其他验证操作对应的执行结果,作为该其他验证操作的异常检测结果。直至全部其他验证操作均已执行完毕为止。
S280、在其他验证操作的异常检测结果为异常的情况下,根据其他验证操作对应的告警类型,并更新目标告警类型。
具体的,若其他验证操作的异常检测结果为异常的情况下,说明通过该其他验证操作对应的故障点验证正确,即该其他验证操作对应的目标告警类型正确,将目标告警类型更新为其他验证操作对应的目标告警类型。
示例性的,参见上述S260中的具体示例,若执行通过该链路由故障处理装置中的上游设备C向下游设备D发送数据的其他验证操作之后,获取的异常检测结果为异常的情况下,则说明故障点确定正确,即上游设备A与下游设备B之间的链路发生故障。根据该其他验证操作对应的告警类型(即链路资源告警),将目标告警类型更新为链路资源告警。
S290、根据验证结果,选择并执行验证结果对应的告警处理操作。
本发明实施例的技术方案通过接收到告警信息,并识别目标告警类型;获取告警信息对应的目标验证操作;执行告警信息对应的目标验证操作,获取目标验证操作的异常检测结果;在目标验证操作的异常检测结果为异常的情况下,确定目标告警类型的验证结果为正确;在目标验证操作的异常检测结果为正常的情况下,确定目标告警类型的验证结果为错误;获取除告警信息对应的验证操作之外的其他验证操作;获取各其他验证操作的异常检测结果;在其他验证操作的异常结果为异常的情况下,根据其他验证操作对应的告警类型,并更新目标告警类型;根据验证结果,选择并执行验证结果对应的告警处理操作;通过目标验证操作对目标告警类型的正确性进行验证,保障了目标告警类型对应的告警处理操作的准确性,通过引入其他验证操作,对告警信息进行多维度验证,保障了告警处理操作验证的全面性,保障了故障处理方法的全面性和准确性。
需要说明的是,在本发明实施例中未详述部分,可参见前述实施例的表述。
实施例三
图3是本发明实施例三提供的一种故障处理方法的流程图,本实施例在上述各实施例的基础上,将根据验证结果,选择并执行所述验证结果对应的告警处理操作进一步优化。如图3所示,该方法包括:
S310、接收到告警信息,并识别目标告警类型。
S320、根据告警信息,对目标告警类型进行验证。
S330、在目标告警类型的验证结果为正确的情况下,选择并执行目标告警类型对应的告警处理操作。
具体的,若目标告警类型的验证结果为正确的情况下,故障处理装置根据目标告警类型,查询该目标告警类型针对相应的故障点是否存在对应的告警处理操作,若是,则选择该告警处理操作,并对该故障点执行该告警处理操作。若否,则将告警信息和验证结果发送给运维用户,运维用户接收到告警信息和验证结果,根据警信息和验证结果执行告警处理操作。
在本发明的一个可选实施例中,选择并执行所述目标告警类型对应的告警处理操作,包括如下子步骤:
S3301、在目标告警类型对应的告警处理操作为空的情况下,获取所述目标告警类型对应的通用处理操作。
其中,通用处理操作可以是针对某一目标告警类型而配置的通用的处理操作。通用处理操作根据目标告警类型进行配置,并不针对目标告警类型的具体的故障点。
具体的,若针对目标告警类型的具体故障点,并没有配置相应的告警处理操作时,故障处理装置获取目标告警类型所对应的通用处理操作。
示例性的,若目标告警类型为基础资源告警,具体的故障点为中间件发生故障,但是针对中间件故障并没有配置相应的告警处理操作,则故障处理装置获取基础资源告警对应的通用处理操作(例如,重启业务系统)。
S3302、执行目标告警类型对应的通用处理操作。
具体的,在故障执行装置获取目标告警类型对应的通用处理操作之后,故障处理装置执行目标告警类型对应的通用处理操作。
示例性的,参见上述S3301的具体示例,故障处理装置获取基础资源告警对应的通用处理操作(例如,重启业务系统的)之后,向业务系统发送重新启动的请求,业务系统收到请求后进行重启。
本方案通过引入了通用处理操作,在目标告警类型的具体故障点没有对应的告警处理操作时,可以采用通用处理操作进行告警处理,进一步减少了对人工的利用率,降低了对人工的依赖性。
在本发明的一个可选实施例中,执行所述目标告警类型对应的通用处理操作,可以包括如下子步骤:
步骤A、获取所述通用处理操作的权限信息。
其中,权限信息可以是评价通用处理操作的参考信息。可选的,权限信息可以是通用处理操作所配置的风险度。风险度可以是采用通用处理操作进行故障处理的风险程度。风险度可以由技术人员根据经验值直接配置在通用处理操作中。
具体的,故障处理装置可以获取通用处理操作本身配置的权限信息(例如风险度)。
步骤B、在权限信息满足权限条件的情况下,执行所述目标告警类型对应的通用处理操作。
其中,权限条件可以是判断是否可以直接执行通用处理操作的判断条件。
具体的,若权限信息满足权限条件,则直接执行目标告警类型对应的通用处理操作;若权限信息不满足权限条件,则不直接执行目标告警类型对应的通用处理操作,需要向运维用户进行确认是否执行该通用处理操作。可选的,若风险度低于风险度阈值,认为风险度满足权限条件,则直接执行目标告警类型对应的通用处理操作;若风险度高于或等于风险度阈值,认为风险度不满足权限条件,则不直接执行目标告警类型对应的通用处理操作,需要向运维用户进行确认是否执行该通用处理操作。
示例性的,设定风险度阈值为50%,若基础资源的通用处置策略的风险度为30%,低于风险度阈值,认为风险度满足权限条件,则直接执行目标告警类型对应的通用处理操作;若基础资源的通用处置策略的风险度为80%,高于风险度阈值,认为风险度不满足权限条件,则不直接执行目标告警类型对应的通用处理操作,需要向运维用户发送告警信息和确认信息(例如“请求执行高风险的通用处理操作,请确认是否执行”),若运维用户点击确认,则执行该通用处理操作;若运维用点击取消,则不执行该通用处理操作。
若目标告警类型没有对应的通用处理操作,则将告警信息和目标告警类型的验证结果转发给运维用户,由运维用户进行处理。
本方案通过引入了权限信息和权限条件,对通用处理操作的执行过程进行了限定,保障了通用处理操作执行的安全性,进而保障了故障处理执行的安全性和稳定性。
S340、在目标告警类型的验证结果为错误的情况下,选择并执行更新后的目标告警类型对应的告警处理操作。
具体的,若目标告警类型的验证结果为错误的情况下,根据其他验证操作重新确定了目标告警类型,并进行了更新。故障处理装置选择更新确定后的目标告警类型对应的告警处理操作,并针对目标告警类型对应的故障点执行该告警处理操作。
本发明实施例的技术方案通过接收到告警信息,并识别目标告警类型;根据告警信息,对目标告警类型进行验证;在目标告警类型的验证结果为正确的情况下,选择并执行目标告警类型对应的告警处理操作;在目标告警类型的验证结果为错误的情况下,选择并执行更新后的目标告警类型对应的告警处理操作;根据目标告警类型的验证结果,执行相应的告警处理操作,提高了故障处理的灵活性,保障了故障处理的准确性。
需要说明的是,在本发明实施例中未详述部分,可参见前述实施例的表述。
实施例四
图4a是本发明实施例四提供的一种故障处理方法的流程图。本实施例在上述各实施例的基础上,给出了一种故障处理方法的优选实施例。如图4a所示,该方法包括:
当业务系统发生故障时,产生告警信息,并发送告警信息至故障处理装置。
故障处理装置接收到告警信息后,对告警信息进行分析,确定目标告警类型为基础资源告警、链路资源告警或性能告警等。
故障处理装置根据目标告警类型,匹配相应维度的目标验证操作。
故障处理装置自动执行目标验证操作,并判断验证结果是否异常。
若验证结果为异常,认为验证正确,则执行目标告警类型对应的告警处理操作。
若验证结果为正常,认为验证错误,则匹配其他维度的其他验证操作进行验证,并判断其他验证操作是否验证正确。若验证正确,则将其他验证操作对应的告警类型,更新为目标告警类型,并执行目标告警类型对应的告警处理操作。若其他验证操作均验证错误,则转人工处置。
业务系统恢复正常(即告警处理完成)后结束。
可选的,选择验证结果对应的告警处理操作可以包括:
步骤a:根据告警信息对应的目标告警类型,查询是否配置告警处理操作,若是则执行步骤b;若否,则执行步骤c。
步骤b:执行该告警处理操作;
步骤c:判断是否可以查询到目标告警类型对应的通用处理操作,若是,则执行步骤e;若否,则执行步骤d。
步骤d:由运维用户人工处置,处置后在故障处理装置里配置该通用处理操作;
步骤e:判断通用处理操作的风险度是否高于或等于风险度阈值,若是,则执行步骤f;若否,则执行步骤g。
步骤f:由运维用户确认后执行;
步骤g:直接执行。
步骤h:告警处理后,检查告警是否恢复,若是,则执行步骤j;若否,则执行步骤i。
步骤i:转人工处置;
步骤j:处置结束。
图4b是本发明实施例四提供的一种故障处理装置的系统架构图。如图4b所示,该故障处理装置包括:输入层、分析层、处置层和展示层。
其中,输入层包括:故障系统(即发生故障的业务系统)和告警信息。
分析层(即告警类型识别模块)将分析业务系统的基础资源、日志资源、链路资源以及其他个性化分析。基础资源包括:系统资源、网络资源和中间件等。日志资源包括:异常词频和异常词汇等。链路资源包括:应用层、模块层、方法层和IP层等。
处置层(即告警处理模块)包括:通用处置策略(即通用处理操作)、个性化策略(即告警处理操作)和人工处置等。通用处置策略可以处理某一个告警;个性化处置策略可以针对每个特定告警的指定个性化策略;人工处置可以用于若未查询到对应的处置策略,则转交由人工处置。
展示层包括:处置流程展示(即执行过程展示模块)和系统健康度展示。处置流程展示可以展示处置的每一步过程。系统健康度展示可以展示系统各系统指标的数据和综合的健康度评值。
本发明实施例的技术方案通过确认目标告警类型,并根据告警信息对目标告警类型进行多维度的验证,保证了目标告警类型的准确性;并根据目标告警类型的验证结果,选择对应的告警处理操作,保障了故障处理的灵活性;若系统没有配置告警处理操作,则执行通用处理操作,降低了故障处理对人工的依赖性;通过对通用处理操作的风险度进行判断,保障了业务系统的安全性。
需要说明的是,在本发明实施例中未详述部分,可参见前述实施例的表述。
实施例五
图5是本发明实施例五提供的一种故障处理装置的结构示意图。本实施例可适用于对从多维度对故障进行处理的情况,该装置可以实现本发明上述实施例所提供的故障处理方法。该装置可以由软件和/或硬件的方式来实现,并可集成于电子设备中。如图5所示,该装置包括:
告警类型识别模块510,用于接收到告警信息,并识别目标告警类型。
告警类型验证模块520,用于根据告警信息,对目标告警类型进行验证。
告警处理模块530,用于根据验证结果,选择并执行验证结果对应的告警处理操作。
本发明实施例的技术方案基于接收到的告警信息,对进行目标告警类型的识别和验证,基于验证结果,执行相应的告警处理操作,通过对告警信息的进行多维度验证,实现了对目标告警类型的精准定位,减少了对人工的依赖性,提高了故障处理的执行效率和故障处理的准确性。
可选的,告警类型验证模块520,可以用于:
获取告警信息对应的目标验证操作。
执行告警信息对应的目标验证操作,获取目标验证操作的异常检测结果。
在目标验证操作的异常检测结果为异常的情况下,确定目标告警类型的验证结果为正确。
在目标验证操作的异常检测结果为正常的情况下,确定目标告警类型的验证结果为错误。
获取除告警信息对应的验证操作之外的其他验证操作。
获取各其他验证操作的异常检测结果。
在其他验证操作的异常结果为异常的情况下,根据其他验证操作对应的告警类型,并更新目标告警类型。
可选的,告警处理模块530包括:
第一告警处理单元,用于在目标告警类型的验证结果为正确的情况下,选择并执行目标告警类型对应的告警处理操作。
第二告警处理单元,用于在目标告警类型的验证结果为错误的情况下,选择并执行更新后的目标告警类型对应的告警处理操作。
其中,第一告警处理单元和第二告警处理单元为告警处理模块530中的两个并列的告警处理单元。
可选的,第一告警处理单元包括:
通用操作获取子单元,用于在目标告警类型对应的告警处理操作为空的情况下,获取目标告警类型对应的通用处理操作。
通用操作执行子单元,用于执行目标告警类型对应的通用处理操作。
可选的,通用操作执行子单元,可以用于:
获取通用处理操作的权限信息。
在权限信息满足权限条件的情况下,执行目标告警类型对应的通用处理操作。
相应的,在告警处理模块530执行验证结果对应的告警处理操作之后,该装置还包括:
告警处理确定模块,用于在预设时长内未接收到告警信息,确定告警处理完成。
告警信息处理模块,用于在预设时长内接收到告警信息,将告警信息转发给运维用户,以使运维用户对告警信息进行处理。
相应的,在告警处理模块530执行验证结果对应的告警处理操作的同时,该装置还包括:
执行过程展示模块,用于展示验证结果对应的告警处理操作的执行过程。
本发明实施例所提供的故障处理装置可执行本发明任意实施例所提供的故障处理方法,具备执行各故障处理方法相应的功能模块和有益效果。
实施例六
图6提供了可以用来实施本发明的实施例的电子设备600的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图6所示,电子设备600包括至少一个处理器601,以及与至少一个处理器601通信连接的存储器,如只读存储器(ROM)602、随机访问存储器(RAM)603等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器601可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储电子设备600操作所需的各种程序和数据。处理器601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
电子设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器601可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器601执行上文所描述的各个方法和处理,例如故障处理方法。
在一些实施例中,故障处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM 603并由处理器601执行时,可以执行上文描述的故障处理方法的一个或多个步骤。备选地,在其他实施例中,处理器601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行故障处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
本发明的技术方案中,所涉及的告警信息等的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (9)

1.一种故障处理方法,其特征在于,所述方法包括:
接收到告警信息,并识别目标告警类型;
根据所述告警信息,对所述目标告警类型进行验证;
根据验证结果,选择并执行所述验证结果对应的告警处理操作;
其中,所述根据所述告警信息,对所述目标告警类型进行验证,包括:
获取所述告警信息对应的目标验证操作;
执行所述告警信息对应的目标验证操作,获取所述目标验证操作的异常检测结果;
在所述目标验证操作的异常检测结果为异常的情况下,确定所述目标告警类型的验证结果为正确;
在所述目标验证操作的异常检测结果为正常的情况下,确定所述目标告警类型的验证结果为错误;
获取其他验证操作;其中,所述其他验证操作是除目标验证操作之外的告警信息对应的验证操作;
获取各所述其他验证操作的异常检测结果;
在所述其他验证操作的异常检测结果为异常的情况下,根据所述其他验证操作对应的告警类型,更新所述目标告警类型。
2.根据权利要求1所述的方法,其特征在于,所述根据验证结果,选择并执行所述验证结果对应的告警处理操作,包括:
在所述目标告警类型的验证结果为正确的情况下,选择并执行所述目标告警类型对应的告警处理操作;
在所述目标告警类型的验证结果为错误的情况下,选择并执行更新后的目标告警类型对应的告警处理操作。
3.根据权利要求2中所述的方法,其特征在于,所述选择并执行所述目标告警类型对应的告警处理操作,包括:
在所述目标告警类型对应的告警处理操作为空的情况下,获取所述目标告警类型对应的通用处理操作;
执行所述目标告警类型对应的通用处理操作。
4.根据权利要求3所述的方法,其特征在于,所述执行所述目标告警类型对应的通用处理操作,包括:
获取所述通用处理操作的权限信息;
在权限信息满足权限条件的情况下,执行所述目标告警类型对应的通用处理操作。
5.根据权利要求1所述的方法,其特征在于,在执行所述验证结果对应的告警处理操作之后,还包括:
在预设时长内未接收到所述告警信息,确定告警处理完成;
在预设时长内接收到所述告警信息,将所述告警信息转发给运维用户,以使所述运维用户对所述告警信息进行处理。
6.根据权利要求1所述的方法,其特征在于,在执行所述验证结果对应的告警处理操作的同时,还包括:
展示所述验证结果对应的告警处理操作的执行过程。
7.一种故障处理装置,其特征在于,包括:
告警类型识别模块,用于接收到告警信息,并识别目标告警类型;
告警类型验证模块,用于根据所述告警信息,对所述目标告警类型进行验证;
告警处理模块,用于根据验证结果,选择并执行所述验证结果对应的告警处理操作;
其中,所述告警类型验证模块,具体用于:
获取所述告警信息对应的目标验证操作;
执行所述告警信息对应的目标验证操作,获取所述目标验证操作的异常检测结果;
在所述目标验证操作的异常检测结果为异常的情况下,确定所述目标告警类型的验证结果为正确;
在所述目标验证操作的异常检测结果为正常的情况下,确定所述目标告警类型的验证结果为错误;
获取其他验证操作;其中,所述其他验证操作是除目标验证操作之外的告警信息对应的验证操作;
获取各所述其他验证操作的异常检测结果;
在所述其他验证操作的异常检测结果为异常的情况下,根据所述其他验证操作对应的告警类型,并更新所述目标告警类型。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的故障处理方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的故障处理方法。
CN202210914441.7A 2022-08-01 2022-08-01 一种故障处理方法、装置、设备及存储介质 Active CN115296979B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210914441.7A CN115296979B (zh) 2022-08-01 2022-08-01 一种故障处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210914441.7A CN115296979B (zh) 2022-08-01 2022-08-01 一种故障处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115296979A CN115296979A (zh) 2022-11-04
CN115296979B true CN115296979B (zh) 2024-03-08

Family

ID=83826114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210914441.7A Active CN115296979B (zh) 2022-08-01 2022-08-01 一种故障处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115296979B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010220A (zh) * 2023-02-09 2023-04-25 北京优特捷信息技术有限公司 一种告警诊断方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110544362A (zh) * 2019-09-04 2019-12-06 中国联合网络通信集团有限公司 基于区块链的施工现场异常识别方法及装置
CN112015618A (zh) * 2020-08-17 2020-12-01 杭州指令集智能科技有限公司 异常告警方法及装置
WO2021082697A1 (zh) * 2019-11-01 2021-05-06 平安科技(深圳)有限公司 基于批量告警事件的定位方法、装置、电子设备及介质
CN113495825A (zh) * 2021-06-17 2021-10-12 中国工商银行股份有限公司 线路告警的处理方法、装置、电子设备及可读存储介质
CN113553210A (zh) * 2021-07-30 2021-10-26 平安普惠企业管理有限公司 告警数据的处理方法、装置、设备及存储介质
CN114006719A (zh) * 2021-09-14 2022-02-01 国科信创科技有限公司 基于态势感知的ai验证方法、装置及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110544362A (zh) * 2019-09-04 2019-12-06 中国联合网络通信集团有限公司 基于区块链的施工现场异常识别方法及装置
WO2021082697A1 (zh) * 2019-11-01 2021-05-06 平安科技(深圳)有限公司 基于批量告警事件的定位方法、装置、电子设备及介质
CN112015618A (zh) * 2020-08-17 2020-12-01 杭州指令集智能科技有限公司 异常告警方法及装置
CN113495825A (zh) * 2021-06-17 2021-10-12 中国工商银行股份有限公司 线路告警的处理方法、装置、电子设备及可读存储介质
CN113553210A (zh) * 2021-07-30 2021-10-26 平安普惠企业管理有限公司 告警数据的处理方法、装置、设备及存储介质
CN114006719A (zh) * 2021-09-14 2022-02-01 国科信创科技有限公司 基于态势感知的ai验证方法、装置及系统

Also Published As

Publication number Publication date
CN115296979A (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN108804215B (zh) 一种任务处理方法、装置以及电子设备
CN115296979B (zh) 一种故障处理方法、装置、设备及存储介质
WO2019034095A1 (zh) 软件处理方法、装置、电子设备及计算机可读存储介质
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN110430070B (zh) 一种服务状态分析方法、装置、服务器、数据分析设备及介质
CN114328132A (zh) 外部数据源的状态监控方法、装置、设备和介质
CN111782502A (zh) 一种自动化测试的方法及装置
CN114301800A (zh) 一种网络设备质差分析方法及装置
CN109150587B (zh) 一种维护方法和装置
CN111506641A (zh) 数据管理方法、数据采集平台、数据管理系统及存储介质
CN116450176A (zh) 版本更新方法、装置、电子设备及存储介质
CN115509714A (zh) 一种任务处理方法、装置、电子设备及存储介质
CN111950232B (zh) 一种自动切换号段的方法和装置
CN111552566B (zh) 一种数据处理系统、方法、电子设备及存储介质
CN114528350A (zh) 集群脑裂的处理方法、装置、设备及可读存储介质
CN114928540B (zh) 一种抢注方法、装置、电子设备及存储介质
CN115277652B (zh) 基于推理服务的流媒体处理方法、装置、电子设备
CN111371900B (zh) 一种监测同步链路健康状态的方法及系统
CN116094908A (zh) 日志文件存储方法、装置、设备和存储介质
CN117493000A (zh) 一种任务处理方法、装置、设备及介质
CN116302796A (zh) 一种进程监控方法、装置、电子设备及存储介质
CN117331841A (zh) 一种接口测试方法、装置、电子设备及存储介质
CN117591374A (zh) 金融类业务异常场景监控方法、装置、设备和存储介质
CN114238069A (zh) 一种Web应用防火墙测试方法、装置、电子设备、介质及产品
CN115603806A (zh) 纤缆告警管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant