CN116401163A - 服务系统故障处理方法、装置、设备及存储介质 - Google Patents

服务系统故障处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116401163A
CN116401163A CN202310347741.6A CN202310347741A CN116401163A CN 116401163 A CN116401163 A CN 116401163A CN 202310347741 A CN202310347741 A CN 202310347741A CN 116401163 A CN116401163 A CN 116401163A
Authority
CN
China
Prior art keywords
fault
fault data
abnormal code
service system
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310347741.6A
Other languages
English (en)
Inventor
刘通
郑朋
程志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu com Times Technology Beijing Co Ltd
Original Assignee
Baidu com Times Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu com Times Technology Beijing Co Ltd filed Critical Baidu com Times Technology Beijing Co Ltd
Priority to CN202310347741.6A priority Critical patent/CN116401163A/zh
Publication of CN116401163A publication Critical patent/CN116401163A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本公开提供一种服务系统故障处理方法、装置、设备及存储介质,涉及计算机技术领域,具体涉及软件程序、操作系统等技术领域,可应用于对服务系统的故障位置进行定位、故障处理等场景下。具体实现方案包括:获取服务系统的故障数据;根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件,目标异常代码仅包含异常代码位置对应的异常代码中的变量信息;根据目标磁盘文件,对服务系统的故障进行处理。本公开可以快速定位服务系统中的程序故障位置,程序故障后可以快速恢复,提高了解决故障的效率,减少了服务系统无法对用户请求进行响应的时间,提升了用户体验感。

Description

服务系统故障处理方法、装置、设备及存储介质
技术领域
本公开涉及计算机技术领域,具体涉及软件程序、操作系统等技术领域,可应用于对服务系统的故障位置进行定位、故障处理等场景下,尤其涉及服务系统故障处理方法、装置、设备及存储介质。
背景技术
服务系统中包括很多程序,当服务系统中的某个程序发生异常,而该异常在程序内部没有被捕获时,服务系统可以把程序发生异常时的内存信息、寄存器状态、运行堆栈信息等信息转存在一个磁盘文件中。该磁盘文件可以用于调试前述发生异常的程序,以解除异常或发现异常原因。在转存磁盘文件的这段时间里,服务系统无法处理用户请求,导致无法为用户提供服务。
相关技术中,可以在服务系统内核捕获程序异常时,将磁盘文件转存自定义的脚本中进行处理。自定义的脚本可以和远端进行交互,控制转存磁盘文件的频率以及按照比例选择保存磁盘文件的机器,提高了解决故障的效率,减少了无法对用户请求进行响应的时间。
但是,目前服务系统无法对用户请求进行响应的时间仍然较长,用户服务体验不佳。
发明内容
本公开提供了一种服务系统故障处理方法、装置、设备及存储介质,可以快速定位服务系统中的程序故障位置,程序故障后可以快速恢复,提高了解决故障的效率,减少了服务系统无法对用户请求进行响应的时间,提升了用户体验感。
根据本公开的第一方面,提供了一种服务系统故障处理方法,所述方法包括:
获取服务系统的故障数据;根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件,目标异常代码仅包含异常代码位置对应的异常代码中的变量信息;根据目标磁盘文件,对服务系统的故障进行处理。
根据本公开的第二方面,提供了一种服务系统故障处理方法,所述方法包括:
接收来自服务系统的故障数据;确定故障数据与历史故障记录是否具有相似性;向服务系统发送指示信息,指示信息用于指示故障数据是否与历史故障记录具有相似性。
根据本公开的第三方面,提供了一种服务系统故障处理装置,所述装置包括:获取单元、确定单元、处理单元。
获取单元,用于获取服务系统的故障数据;确定单元,用于根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件,目标异常代码仅包含异常代码位置对应的异常代码中的变量信息;处理单元,用于根据目标磁盘文件,对服务系统的故障进行处理。
根据本公开的第四方面,提供了一种服务系统故障处理装置,所述装置包括:接收单元、确定单元、发送单元。
接收单元,用于接收来自服务系统的故障数据;确定单元,用于确定故障数据与历史故障记录是否具有相似性;发送单元,用于向服务系统发送指示信息,指示信息用于指示故障数据是否与历史故障记录具有相似性。
根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或者第二方面所述的方法。
根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据第一方面或者第二方面所述的方法。
根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据如第一方面或者第二方面所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开实施例提供的服务系统故障处理方法的流程示意图;
图2为本公开实施例提供的S102的一种实现流程示意图;
图3为本公开实施例提供的获取服务系统的故障数据方法的一种实现流程示意图;
图4为本公开实施例提供的服务系统故障处理方法的又一流程示意图;
图5为本公开实施例提供的服务系统故障处理方法的又一流程示意图;
图6为本公开实施例提供的服务系统故障处理方法的又一流程示意图;
图7为本公开实施例提供的服务系统故障处理的原理示意图;
图8为本公开实施例提供的服务系统故障处理装置的组成示意图;
图9为本公开实施例提供的服务系统故障处理装置的另一组成示意图;
图10为本公开实施例提供的服务系统故障处理装置的又一组成示意图;
图11为本公开实施例提供的服务系统故障处理装置的又一组成示意图;
图12为本公开实施例提供的可以用来实施本公开的实施例的示例电子设备1200的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
应当理解,在本公开各实施例中,字符“/”一般表示前后关联对象是一种“或”的关系。术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
服务系统中包括很多程序,当服务系统中的某个程序发生异常,而该异常在程序内部没有被捕获时,服务系统可以把程序发生异常时的内存信息、寄存器状态、运行堆栈信息等信息转存在一个磁盘文件中。该磁盘文件可以用于调试前述发生异常的程序,以解除异常或发现异常原因。在转存磁盘文件的这段时间里,服务系统无法处理用户请求,导致无法为用户提供服务。
例如,以Linux服务系统为例,当服务系统中的某个程序发生了异常,但还无法确定发生异常的具体位置时,服务系统可以把程序发生异常时服务系统的进程id、异常的程序的变更历史文件(比如最近变更人、最近变更时间、最近代码变更记录等)、基本的故障函数调用关系等信息转存在一个磁盘文件中。在这个磁盘文件中对发生异常的程序进行调试和修改,以解除异常或发现异常原因。在磁盘文件转存完成之前无法查看异常的代码位置,在转存磁盘文件的这段时间里,服务系统无法处理用户请求,如果异常的程序占用的内存很大,那么转存磁盘文件的时间会需要很久,用户在这段时间获取不到对应的服务,会逐渐丧失对该产品的依赖度,转向竞品。
相关技术中,可以在服务系统内核捕获程序异常时,将磁盘文件转存到自定义的脚本中进行处理。自定义的脚本可以和远端进行交互,控制转存磁盘文件的频率以及按照比例选择保存磁盘文件的机器,提高了解决故障的效率,减少了无法对用户请求进行响应的时间。
但是,目前服务系统无法对用户请求进行响应的时间仍然较长,用户服务体验不佳。
例如,目前有core pattern类似的技术,这种技术是在服务系统内核捕获程序异常时,将磁盘文件转存到自定义的脚本中进行处理。自定义的脚本可以和远端进行交互,控制转存磁盘文件的频率以及按照比例选择保存磁盘文件的机器,比如,如果一分钟内发生10个异常,选择2个进行转存,剩下8个直接丢弃,然后重启服务系统,这样可以保证服务系统在大部分时间都能正常工作,为用户提供服务。然而这种技术并不能加快故障的定位效率,在服务系统发生故障时,服务系统无法对用户请求进行响应的时间仍然较长,并没有从根本上解决问题,用户服务体验不佳。
在此背景技术下,本公开提供了一种服务系统故障处理方法,可以快速定位服务系统中的程序故障位置,程序故障后可以快速恢复,提高了解决故障的效率,减少了服务系统无法对用户请求进行响应的时间,提升了用户体验感。
示例性地,该服务系统故障处理方法的执行主体可以是服务系统,具体可以是部署有服务系统的计算机或服务器,或者还可以是其他具有数据处理能力的设备。在此对该方法的执行主体不作限制。
一些实施例中,服务器可以是单独的一个服务器,或者,也可以是由多个服务器构成的服务器集群。部分实施方式中,服务器集群还可以是分布式集群。本公开对服务器的具体实现方式也不作限制。
图1为本公开实施例提供的服务系统故障处理方法的流程示意图。如图1所示,该方法可以包括:
S101、获取服务系统的故障数据。
示例性地,当服务系统发生故障时,可以先获取服务系统的故障数据。故障数据可以是由发生故障的服务名称、发生故障的机器名称、故障发生的时间、部署路径、基本的故障函数调用关系、发生故障的程序的变更历史文件(比如最近变更人、最近变更时间、最近代码变更记录等)等信息汇总生成的数据。
例如,某个服务系统发生了一个故障,可以收集这个故障发生的服务名称(比如XX进程)、机器名称(比如XX计算机)、故障发生的时间(比如XX年XX月XX日XX时XX分XX秒)、部署路径、基本的故障函数调用关系(参数、变量信息)、发生故障的程序的变更历史文件(比如最近变更人、最近变更时间、最近代码变更记录等)等信息,然后汇总生成这个故障的故障数据。
S102、根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件,目标异常代码仅包含异常代码位置对应的异常代码中的变量信息。
示例性地,可以对获取到的故障数据进行解析、分析,然后确定出异常代码的位置,根据异常代码的位置对原代码进行裁剪可以得到目标异常代码,将目标异常代码转存生成目标磁盘文件。裁剪后得到的目标异常代码可以仅包含异常代码位置对应的异常代码中的变量信息,去除了其他无用的信息,其他无用的信息是指非变量信息。
例如,假设对获取到的故障数据进行解析、分析后确定异常代码在原代码的第10至30行,共20行,在原代码第10至30行进行特定的裁剪,去除大量无用的信息,仅保留异常代码位置对应的异常代码中的变量信息,可能得到最终的目标异常代码有9行,将这9行代码转存生成目标磁盘文件。
S103、根据目标磁盘文件,对服务系统的故障进行处理。
示例性地,在将目标异常代码转存生成目标磁盘文件后,可以重启服务系统,以保证服务系统正常运行,也可以在目标磁盘文件中对目标异常代码进行调试和修改,解决故障,使服务系统恢复正常运行。
本公开通过对获取到的故障数据进行解析、分析,确定出异常代码的位置,然后根据异常代码的位置对原代码进行特定的裁剪得到目标异常代码,并将目标异常代码转存生成目标磁盘文件,再根据目标磁盘文件,对服务系统的故障进行处理,可以快速定位服务系统的程序故障的位置,程序故障后可以快速恢复,提高了解决故障的效率,减少服务系统无法对用户请求进行响应的时间,提升了用户体验感。
图2为本公开实施例提供的S102的一种实现流程示意图;如图2所示,S102可以包括:
S201、向数据处理系统发送故障数据。
示例性地,当服务系统发生故障时,服务系统可以向数据处理系统发送故障数据。与服务系统类似,数据处理系统也可以部署在计算机、服务器等设备上,S201中具体可以向部署有数据处理系统的计算机或服务器发送故障数据。
可选地,数据处理系统和服务系统可以部署在同一个设备或不同设备上,在此不限制。
例如,某个服务系统发生了一个故障,服务系统可以向数据处理系统发送故障发生的服务名称(比如XX进程)、机器名称(比如XX计算机)、故障发生的时间(比如XX年XX月XX日XX时XX分XX秒)、部署路径、基本的故障函数调用关系(参数、变量信息)、发生故障的程序的变更历史文件(比如最近变更人、最近变更时间、最近代码变更记录等)等信息。
S202、接收来自数据处理系统的指示信息,指示信息用于指示故障数据是否与历史故障记录具有相似性。
示例性地,数据处理系统在接收到服务系统发送的故障数据后,数据处理系统可以对收到的故障数据和历史记录的故障数据做文本比对,判断服务系统发送的故障数据与历史记录的故障数据有没有相似性,然后将具有相似性或者不具有相似性的判断结果作为指示信息发送给服务系统。
例如,服务系统向数据处理系统发送了某个故障数据,数据处理系统收到了这个故障数据,然后对收到的这个故障数据和历史记录的故障数据做文本比对,若通过文本比对判断这个故障数据和历史记录的故障数据具有相似性,那么数据处理系统对服务系统发送的指示信息为具有相似性;若通过文本比对判断这个故障数据和历史记录的故障数据不具有相似性,那么数据处理系统对服务系统发送的指示信息为不具有相似性。
S203、当指示信息指示故障数据与历史故障记录不具有相似性时,根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件。
示例性地,当数据处理系统对服务系统发送的指示信息为不具有相似性时,服务系统对上述故障数据进行解析、分析,然后确定出异常代码的位置,根据异常代码的位置对原代码进行特定的裁剪得到目标异常代码,再将目标异常代码转存生成目标磁盘文件。
例如,数据处理系统收到了服务系统发送的某个故障数据,然后对收到的这个故障数据和历史记录的故障数据做了文本比对,通过文本比对结果判断这个故障数据和历史记录的故障数据不具有相似性,向服务系统发送不具有相似性的指示信息,服务系统对这个故障数据进行解析、分析,假设确定异常代码在原代码的第10至30行,那么在原代码第10至30行进行特定的裁剪,仅保留异常代码位置对应的异常代码中的变量信息,如果得到最终的目标异常代码有9行,就将这9行代码转存生成目标磁盘文件。
S204、当指示信息指示故障数据与历史故障记录具有相似性时,丢弃故障数据。
示例性地,当数据处理系统对服务系统发送的指示信息为具有相似性时,就表示这个故障以前发生过,有过相应的处理策略,此时服务系统就丢弃这个故障数据,不再对这个故障数据做其他处理。
例如,数据处理系统收到了服务系统发送的某个故障数据,然后对收到的这个故障数据和历史记录的故障数据做了文本比对,通过文本比对结果判断这个故障数据和历史记录的故障数据不具有相似性,向服务系统发送具有相似性的指示信息,服务系统就丢弃这个故障数据,不再对这个故障数据做其他处理。
本实施例通过服务系统向数据处理系统发送故障数据,数据处理系统对收到的故障数据和历史记录的故障数据做文本比对,通过文本比对结果判断这个故障数据和历史记录的故障数据是否具有相似性,并向服务系统发送是否具有相似性的指示信息,当数据处理系统对服务系统发送的指示信息为不具有相似性时,服务系统对上述故障数据进行解析、分析,然后确定出异常代码的位置,根据异常代码的位置对原代码进行特定的裁剪得到目标异常代码,将目标异常代码转存生成目标磁盘文件,做进一步的处理;当数据处理系统对服务系统发送的指示信息为具有相似性时,服务系统就丢弃这个故障数据;可以进一步提高解决服务系统故障的效率。
一些实施例中,上述根据故障数据确定异常代码位置的步骤,可以包括:
当指示信息指示故障数据与历史故障记录不具有相似性、且故障数据对应的源设备在第一时长内没有再发生故障时,根据故障数据解析异常地址,得到异常代码位置。
示例性地,当数据处理系统给服务系统发送的指示信息为故障数据与历史故障记录不具有相似性、并且这个故障数据对应的源设备在第一时长内没有再发生故障时,服务系统根据故障数据解析异常地址,得到异常代码位置。其中,第一时长为预设的一个时间段,源设备可以是运行异常代码所在原代码的计算机。
例如,假设第一时长为30分钟,当数据处理系统给服务系统发送的指示信息为故障数据与历史故障记录不具有相似性、并且这个故障数据对应的源设备在30分钟内没有再发生故障时,服务系统根据故障数据解析异常地址,得到异常代码位置。
本实施例通过预先设置一个第一时长,规定当指示信息指示故障数据与历史故障记录不具有相似性、且故障数据对应的源设备在第一时长内没有再发生故障时,服务系统再根据故障数据解析异常地址,得到异常代码位置,从而可以减少在同一个设备上的操作,减少对CPU资源的消耗。
一些实施例中,上述根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件的步骤,可以包括:
当指示信息指示故障数据与历史故障记录不具有相似性、且故障数据对应的源设备在第二时长内没有再发生故障时,根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件;
其中,第二时长大于第一时长。
示例性地,当数据处理系统给服务系统发送的指示信息为故障数据与历史故障记录不具有相似性、并且这个故障数据对应的源设备在第一时长内没有再发生故障时,服务系统根据异常代码位置对应的异常代码生成目标异常代码,并将目标异常代码转存生成目标磁盘文件;其中,第二时长为预设的一个大于第一时长的时间段。
例如,假设第二时长为60分钟,当数据处理系统给服务系统发送的指示信息为故障数据与历史故障记录不具有相似性、并且这个故障数据对应的源设备在60分钟内没有再发生故障时,服务系统根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件。
本实施例通过预先设置一个第二时长,规定当指示信息指示故障数据与历史故障记录不具有相似性、且故障数据对应的源设备在第二时长内没有再发生故障时,服务系统根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件。可以减少对磁盘和数据在内部存储器和外部存储器或其他周边设备之间的输入和输出的影响,避免因为查询定位故障而引入新的故障。
一些实施例中,上述向数据处理系统发送故障数据这一步骤之后,可以包括:
重启服务系统。
示例性地,当服务系统发生故障时,服务系统向数据处理系统发送故障数据,数据处理系统可以对故障数据进行解析、分析等处理,服务系统进行重启。
本实施例通过在服务系统向数据处理系统发送故障数据之后,重启服务系统,可以保证服务系统在大部分时间都能响应用户的请求,减少无法对用户请求进行响应的时间,提升用户体验感。
图3为本公开实施例提供的S101的一种实现流程示意图;如图3所示,S101可以包括:
S301、响应于服务系统发生异常,通过主模块收集异常对应的调用关系信息,并向子模块发送调用关系信息和异常的基本信息。
示例性地,服务系统包括主模块和子模块。服务系统发生异常时,主模块收集异常对应的调用关系信息,并向子模块发送调用关系信息和异常的基本信息。其中,调用关系信息包含当前程序的栈信息(比如参数、变量信息),基本信息包含故障发生的服务名称(比如XX进程)、机器名称(比如XX计算机)、故障发生的时间(比如XX年XX月XX日XX时XX分XX秒)、部署路径。
例如,可以利用signal系统函数,在系统抛出异常信号后,自动调用signal函数,在signal函数中会对当前程序的栈信息依次进行收集,形成一条完成的调用链,然后发送给对应的子模块。
S302、通过子模块收集异常的辅助信息,并根据调用关系信息、基本信息、以及辅助信息生成故障数据。
示例性地,辅助信息可以是发生故障的程序的变更历史文件,比如最近变更人、最近变更时间、最近代码变更记录等。子模块可以收集异常的辅助信息,并根据主模块发送的调用关系信息、基本信息,以及收集到的辅助信息生成故障数据。
本实施例通过配置一个子模块,子模块收集异常的辅助信息并根据主模块发送的故障的基本信息和调用关系信息汇总生成故障数据,发送到数据处理系统,可以尽可能的简化主模块,减少对主模块的侵入性。通过减少对主模块的侵入性,可以减少在对服务系统故障进行定位的过程中,引入新故障的可能性。
本公开还提供一种服务系统故障处理方法,可以应用于前述实施例中所述的数据处理系统,能够帮助服务系统快速定位程序故障,提高解决故障的效率,减少服务系统无法对用户请求进行响应的时间。
示例性地,该服务系统故障处理方法的执行主体可以是部署有数据处理系统的计算机或服务器,或者还可以是其他具有数据处理能力的设备。在此对该方法的执行主体也不作限制。
图4为本公开实施例提供的服务系统故障处理方法的又一流程示意图;如图4所示,该方法可以包括:
S401、接收来自服务系统的故障数据。
示例性地,数据处理系统在服务系统发生故障后可以接收服务系统发送的故障数据。
其中,故障数据可以参考前述实施例中所述,此处不再赘述。
S402、确定故障数据与历史故障记录是否具有相似性。
示例性地,数据处理系统可以通过文本对比的方式,确定故障数据与历史故障记录是否具有相似性,以便发现历史上是否出现过类似的故障。例如,数据处理系统可以先通过tf-idf方式对故障数据与历史故障记录进行向量化,得到故障数据的向量和历史故障记录的向量,然后可以使用余弦相似度方法计算故障数据的向量和历史故障记录的向量之间的余弦相似度,得到故障数据与历史故障记录之间的相似度。
以故障数据的向量为向量A,历史故障记录的向量为向量B为例,余弦相似度的计算方式可以如下:
将A的n个分量和B的n个分量分别一一进行相乘,得到n个第一乘积结果,n为大于1的整数;对n个第一乘积结果进行求和,得到第一求和结果;将A的n个分量分别进行平方后,对平方结果进行求和,得到第二求和结果;计算出第二求和结果的平方根作为第一平方根结果;将B的n个分量分别进行平方后,对平方结果进行求和,得到第三求和结果;计算出第三求和结果的平方根作为第二平方根结果;计算出第一平方根结果和第二平方根结果的乘积作为第二乘积结果;计算第一求和结果和第二乘积结果的比值,得到余弦相似度。
余弦相似度规定:0度角的余弦值是1,其他任何角度的余弦值都不大于1,并且最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。
示例性地,上述余弦相似度的计算过程可以参考下述公式(1)。
Figure BDA0004160409920000121
公式(1)中,similarity表示余弦相似度;cosθ表示向量A和B的余弦值;θ向量A和B的夹角;Ai代表向量A的第i个分量;Bi代表向量B的第i个分量,i为大于0且小于或等于n的整数。
按照上述方式计算出来的余弦相似度是-1到1的值,余弦相似度越接近1说明故障数据与历史故障记录越相似。
本实施例中,可以预设设置一个相似度阈值,当故障数据与历史故障记录的余弦相似度大于或等于相似度阈值时,可以确定故障数据与历史故障记录具有相似性。当故障数据与历史故障记录的余弦相似度小于相似度阈值时,可以确定故障数据与历史故障记录不具有相似性。
可选地,相似度阈值可以设置为0.88至0.90范围内的值,具体可以设置为0.8895,通过将相似度阈值设置在0.88至0.90范围内,可以大大提高相似性判断的正确率。
其他一些示例中,也可以采用欧氏距离、马氏距离等其他方式计算故障数据与历史故障记录之间的相似度,本公开对此不作限制。
S403、向服务系统发送指示信息,指示信息用于指示故障数据是否与历史故障记录具有相似性。
示例性地,数据处理系统将计算出的相似性与设置的阈值进行对比,若计算出的相似性达到阈值,就认为当前的故障与历史故障记录具有相似性,数据处理系统向服务系统发送当前的故障与历史故障记录具有相似性,若计算出的相似性未达到阈值,就认为当前的故障与历史故障记录不具有相似性,数据处理系统向服务系统发送当前的故障与历史故障记录不具有相似性。
例如,若计算出的相似为0.9,达到阈值0.8895,当前的故障与历史故障记录具有相似性,数据处理系统向服务系统发送当前的故障与历史故障记录具有相似性的指示信息,若计算出的相似为0.8,未达到阈值0.8895,当前的故障与历史故障记录不具有相似性,数据处理系统向服务系统发送当前的故障与历史故障记录不具有相似性的指示信息。
示例性地,指示信息中可以包括一个字段,该字段可以用于指示当前的故障与历史故障记录是否具有相似性。或者,指示信息中也可以采用其他方式来指示相似性,在此同样不作限制。
本实施例通过对当前的故障数据与历史故障记录进行相似度分析,可以在当前的故障数据与历史故障记录具有相似性时,根据历史故障记录的故障处理方法对当前的故障直接进行处理,在当前的故障数据与历史故障记录不具有相似性时再对当前的故障进行进一步定位和处理,能够提高故障定位效率。
图5为本公开实施例提供的服务系统故障处理方法的又一实现流程示意图。如图5所示,该方法还可以包括:
S501、解析故障数据是否存在异常。
示例性地,数据处理系统可以对接收到的故障数据进行解析,判断故障数据是否存在异常。
例如,数据处理系统对接收到的故障数据进行解析,如果故障数据有缺失、乱码等问题,就认为故障数据存在异常。
当数据处理系统解析到故障数据存在异常时,执行步骤S502;当数据处理系统解析到故障数据无异常时,执行前述步骤S402,确定故障数据与历史故障记录是否具有相似性。
S502、丢弃存在异常的故障数据。
示例性地,数据处理系统可以对接收到的故障数据进行解析,判断故障数据存在异常,就将这个故障数据丢弃,不再做进一步处理。
例如,假设数据处理系统解析出某个故障数据有部分缺失,那么认为这个故障数据存在异常,对这个故障数据进行相似度比对等进一步处理时,结果会不太准确,参考意义不大,所以会将这个故障数据丢弃。
本实施例通过数据处理系统对接收到的故障数据进行解析,判断故障数据是否存在异常,如果故障数据存在异常,就将这个故障数据丢弃,不再做进一步处理,可以减少处理异常数据浪费的资源,提高服务器的工作效率。
图6为本公开实施例提供的服务系统故障处理方法的又一实现流程示意图。如图6所示,该方法还可以包括:
S601、对故障数据进行文本格式化,得到故障数据的链接。
示例性地,可以对不同格式的故障数据进行文本格式化,得到故障数据的链接,其中,故障数据的链接可以是纯文本链接、网址链接等不同形式。
例如,假设预设的标准链接形式为网址链接,对某个故障数据进行文本格式化后,可以得到的故障数据的链接会以网址的形式存在,直接点击这个链接就可以查看这个故障数据详细的分析结果。
S602、向客户端发送故障数据的链接。
示例性地,可以将进行文本格式化后得到的故障数据的链接发送至客户端,以通知相应的负责人来处理故障。
例如,当某个服务器发生故障时服务器会进行故障报警,同时生成故障数据并格式化成链接发送至客户端,这里可以对故障报警进行分级:最近30分钟出现10次以上为特高频、最近30分钟出现3-10次为高频、最近30小时出现1-3次为中频,其余为低频。如果故障报警较为频繁,我们可以认为负责人正在处理,但是还没有发现具体的时间,可以进行故障报警窗口的合并,在2分钟内的故障报警会合并成一条链接发送,持续十分钟后,5分钟内的故障报警会合并成一条链接发送,持续半个小时后,10分钟的故障报警会合并成一条链接发送。
其中,客户端可以是手机、电脑或其他固定设备。
本实施例通过对故障数据进行文本格式化,得到故障数据的链接,并将得到的故障数据的链接发送至客户端,可以让相关负责人点击链接看到详细的分析结果,便于及时定位故障,了解故障发生的原因。
为使本公开实施例的方案更加清楚,效果更加清晰,以下结合图7,通过一个具体的示例,对本公开实施例的方案进行进一步的说明。
图7为本公开实施例提供的服务系统故障处理的原理示意图。如图7所示,在一个具体的示例中,服务系统可以包括主模块和子模块。数据处理系统可以包括后置反馈模块、数据解析模块、相似度分析模块、报警通知模块。前述各模块可以是软件模块或硬件模块,又或者软硬件结合的模块。
当服务系统发生故障时,服务系统的主模块可以捕获到故障信号,进行故障调用函数链的收集,并向子模块发送故障调用函数关系信息和故障的基本信息。子模块可以收集其他基本信息和辅助信息并生成故障数据发送给数据处理系统。数据处理系统可以通过数据解析模块进行数据解析故障数据,以确定是否存在异常,通过相似度分析模块确定故障数据与历史故障记录是否具有相似性,以及,通过报警通知模块发送报警通知(如向客户端发送故障数据的链接)。数据处理系统可以根据数据解析结果和相似性分析结果,向子模块发送反馈命令。子模块可以根据不同的反馈命令进行不同的处理。
其中,当故障数据异常,或者故障数据正常、但故障数据与历史故障记录具有相似性时,数据处理系统可以通过后置反馈模块向子模块发送反馈命令1,反馈命令1用于指示重启服务系统;子模块接收到反馈命令1后,可以通知主模块重启服务系统。
当故障数据正常、故障数据与历史故障记录不具有相似性、且故障数据对应的设备在30分钟内没有再发生故障时,数据处理系统可以通过后置反馈模块向子模块发送反馈命令2,反馈命令2用于指示重启服务系统、以及获取详细信息;子模块接收到反馈命令2后,可以通知主模块重启服务系统,并获取异常代码的详细信息,即根据故障数据确定异常代码位置。
当故障数据正常、故障数据与历史故障记录不具有相似性、且故障数据对应的设备在1小时内没有再发生故障时,数据处理系统可以通过后置反馈模块向子模块发送反馈命令3,反馈命令3用于指示重启服务系统、以及进行mini-core写入;子模块接收到反馈命令3后,可以通知主模块重启服务系统,并获取异常代码的详细信息,即根据故障数据确定异常代码位置,然后进行mini-core写入,即根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件。
可选地,当数据解析模块解析到故障数据异常时,或者,相似度分析模块分析出故障数据与历史故障记录具有相似性时,数据处理系统可以丢弃故障数据。期间,故障数据可以存在与数据处理系统连接的数据存储模块(如数据库)中,通过服务器(如server)供前端进行查询和展示。
示例性实施例中,本公开实施例还提供一种服务系统故障处理装置,可以用于实现如前述实施例中服务系统实现的服务系统故障处理方法。图8为本公开实施例提供的服务系统故障处理装置的组成示意图。如图8所示,该装置可以包括:
获取单元801、确定单元802、处理单元803。
获取单元801,用于获取服务系统的故障数据。
确定单元802,用于用于根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件,目标异常代码仅包含异常代码位置对应的异常代码中的变量信息。
处理单元803,用于根据目标磁盘文件,对服务系统的故障进行处理。
可选地,获取单元801,还用于向数据处理系统发送故障数据;接收来自数据处理系统的指示信息,指示信息用于指示故障数据是否与历史故障记录具有相似性;确定单元802,还用于当指示信息指示故障数据与历史故障记录不具有相似性时,根据故障数据确定异常代码位置,并根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件;确定单元802,还用于当指示信息指示故障数据与历史故障记录具有相似性时,丢弃故障数据。
可选地,确定单元802,还用于当指示信息指示故障数据与历史故障记录不具有相似性、且故障数据对应的源设备在第一时长内没有再发生故障时,根据故障数据解析异常地址,得到异常代码位置。
可选地,确定单元802,还用于当指示信息指示故障数据与历史故障记录不具有相似性、且故障数据对应的源设备在第二时长内没有再发生故障时,根据异常代码位置对应的异常代码生成目标异常代码,将目标异常代码转存生成目标磁盘文件;其中,第二时长大于第一时长。
可选地,处理单元803,还用于重启服务系统。
示例性实施例中,本公开实施例还提供一种服务系统故障处理装置,可以用于实现如前述实施例中数据处理系统实现的服务系统故障处理方法。图9为本公开实施例提供的服务系统故障处理装置的另一组成示意图。如图9所示,该装置可以包括:接收单元901、确定单元902、发送单元903。
其中,接收单元901,用于接收来自服务系统的故障数据;确定单元902,用于确定故障数据与历史故障记录是否具有相似性;发送单元903,用于向服务系统发送指示信息,指示信息用于指示故障数据是否与历史故障记录具有相似性。
图10为本公开实施例提供的服务系统故障处理装置的又一组成示意图。可选地,如图10所示,在图9的基础上,该装置还可以包括:解析单元904。
解析单元904用于解析故障数据是否存在异常,并丢弃存在异常的故障数据。
图11为本公开实施例提供的服务系统故障处理装置的又一组成示意图。可选地,如图11所示,在图9或图10(以图10为例)的基础上,该装置还可以包括:报警单元905。
报警单元905用于对故障数据进行文本格式化,得到故障数据的链接。发送单元903还用于向客户端发送故障数据的链接。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质、一种计算机程序产品。
示例性实施例中,电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上实施例所述的方法。
示例性实施例中,可读存储介质可以是存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行根据以上实施例所述的方法。
示例性实施例中,计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现根据以上实施例所述的方法。
图12示出了可以用来实施本公开的实施例的示例电子设备1200的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图12所示,电子设备1200包括计算单元1201,其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序,来执行各种适当的动作和处理。在RAM 1203中,还可存储电子设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
电子设备1200中的多个部件连接至I/O接口1205,包括:输入单元1206,例如键盘、鼠标等;输出单元1207,例如各种类型的显示器、扬声器等;存储单元1208,例如磁盘、光盘等;以及通信单元1209,例如网卡、调制解调器、无线通信收发机等。通信单元1209允许电子设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理,例如服务系统故障处理方法。例如,在一些实施例中,服务系统故障处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到电子设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时,可以执行上文描述的服务系统故障处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元1201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行服务系统故障处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (21)

1.一种服务系统故障处理方法,所述方法包括:
获取服务系统的故障数据;
根据所述故障数据确定异常代码位置,并根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件,所述目标异常代码仅包含所述异常代码位置对应的异常代码中的变量信息;
根据所述目标磁盘文件,对所述服务系统的故障进行处理。
2.根据权利要求1所述的方法,所述根据所述故障数据确定异常代码位置,并根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件之前,所述方法还包括:
向数据处理系统发送所述故障数据;
接收来自所述数据处理系统的指示信息,所述指示信息用于指示所述故障数据是否与历史故障记录具有相似性;
所述根据所述故障数据确定异常代码位置,并根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件,包括:
当所述指示信息指示所述故障数据与历史故障记录不具有相似性时,根据所述故障数据确定异常代码位置,并根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件;
所述方法还包括:
当所述指示信息指示所述故障数据与历史故障记录具有相似性时,丢弃所述故障数据。
3.根据权利要求2所述的方法,所述根据所述故障数据确定异常代码位置,包括:
当所述指示信息指示所述故障数据与历史故障记录不具有相似性、且所述故障数据对应的源设备在第一时长内没有再发生故障时,根据所述故障数据解析异常地址,得到所述异常代码位置。
4.根据权利要求3所述的方法,所述根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件,包括:
当所述指示信息指示所述故障数据与历史故障记录不具有相似性、且所述故障数据对应的源设备在第二时长内没有再发生故障时,根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件;
其中,所述第二时长大于所述第一时长。
5.根据权利要求2-4任一项所述的方法,所述向数据处理系统发送所述故障数据之后,所述方法还包括:
重启所述服务系统。
6.根据权利要求1-5任一项所述的方法,所述获取服务系统的故障数据,包括:
响应于所述服务系统发生异常,通过主模块收集所述异常对应的调用关系信息,并向所述子模块发送所述调用关系信息和所述异常的基本信息;
通过所述子模块收集所述异常的辅助信息,并根据所述调用关系信息、所述基本信息、以及所述辅助信息生成所述故障数据。
7.一种服务系统故障处理方法,所述方法包括:
接收来自服务系统的故障数据;
确定所述故障数据与历史故障记录是否具有相似性;
向所述服务系统发送指示信息,所述指示信息用于指示所述故障数据是否与历史故障记录具有相似性。
8.根据权利要求7所述的方法,所述确定所述故障数据与历史故障记录是否具有相似性之前,所述方法还包括:
解析所述故障数据是否存在异常;
丢弃存在异常的故障数据。
9.根据权利要求7或8所述的方法,所述方法还包括:
对所述故障数据进行文本格式化,得到所述故障数据的链接;
向客户端发送所述故障数据的链接。
10.一种服务系统故障处理装置,所述装置包括:
获取单元,用于获取服务系统的故障数据;
确定单元,用于根据所述故障数据确定异常代码位置,并根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件,所述目标异常代码仅包含所述异常代码位置对应的异常代码中的变量信息;
处理单元,用于根据所述目标磁盘文件,对所述服务系统的故障进行处理。
11.根据权利要求10所述的装置,所述获取单元,还用于:
向数据处理系统发送所述故障数据;
接收来自所述数据处理系统的指示信息,所述指示信息用于指示所述故障数据是否与历史故障记录具有相似性;
所述确定单元,还用于:
当所述指示信息指示所述故障数据与历史故障记录不具有相似性时,根据所述故障数据确定异常代码位置,并根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件;
所述确定单元,还用于:
当所述指示信息指示所述故障数据与历史故障记录具有相似性时,丢弃所述故障数据。
12.根据权利要求11所述的装置,所述确定单元,还用于:
当所述指示信息指示所述故障数据与历史故障记录不具有相似性、且所述故障数据对应的源设备在第一时长内没有再发生故障时,根据所述故障数据解析异常地址,得到所述异常代码位置。
13.根据权利要求12所述的装置,所述确定单元,还用于:
当所述指示信息指示所述故障数据与历史故障记录不具有相似性、且所述故障数据对应的源设备在第二时长内没有再发生故障时,根据所述异常代码位置对应的异常代码生成目标异常代码,将所述目标异常代码转存生成目标磁盘文件;
其中,所述第二时长大于所述第一时长。
14.根据权利要求11-13任一项所述的装置,所述向数据处理系统发送所述故障数据之后,所述处理单元,还用于:
重启所述服务系统。
15.根据权利要求10-14任一项所述的装置,所述获取单元,还包括:
响应于所述服务系统发生异常,通过主模块收集所述异常对应的调用关系信息,并向所述子模块发送所述调用关系信息和所述异常的基本信息;
通过所述子模块收集所述异常的辅助信息,并根据所述调用关系信息、所述基本信息、以及所述辅助信息生成所述故障数据。
16.一种服务系统故障处理装置,所述装置包括:
接收单元,用于接收来自服务系统的故障数据;
确定单元,用于确定所述故障数据与历史故障记录是否具有相似性;
发送单元,用于向所述服务系统发送指示信息,所述指示信息用于指示所述故障数据是否与历史故障记录具有相似性。
17.根据权利要求16所述的装置,所述装置还包括:
解析单元,用于解析所述故障数据是否存在异常;
所述解析单元,还用于:
丢弃存在异常的故障数据。
18.根据权利要求16或17所述的装置,所述装置还包括:
报警单元,用于对所述故障数据进行文本格式化,得到所述故障数据的链接;
所述发送单元,还用于:
向客户端发送所述故障数据的链接。
19.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行根据权利要求1-6任一项所述的方法或者权利要求7-9任一项所述的方法。
21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6任一项所述的方法或者权利要求7-9任一项所述的方法。
CN202310347741.6A 2023-04-03 2023-04-03 服务系统故障处理方法、装置、设备及存储介质 Pending CN116401163A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310347741.6A CN116401163A (zh) 2023-04-03 2023-04-03 服务系统故障处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310347741.6A CN116401163A (zh) 2023-04-03 2023-04-03 服务系统故障处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116401163A true CN116401163A (zh) 2023-07-07

Family

ID=87017324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310347741.6A Pending CN116401163A (zh) 2023-04-03 2023-04-03 服务系统故障处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116401163A (zh)

Similar Documents

Publication Publication Date Title
CN112087334B (zh) 告警根因分析方法、电子设备和存储介质
US8332690B1 (en) Method and apparatus for managing failures in a datacenter
CN116010220A (zh) 一种告警诊断方法、装置、设备及存储介质
CN114844768A (zh) 信息分析方法、装置及电子设备
CN114416685A (zh) 日志处理方法、系统和存储介质
CN110515758B (zh) 一种故障定位方法、装置、计算机设备及存储介质
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN111737055A (zh) 业务处理方法、装置、设备及计算机可读存储介质
CN116401163A (zh) 服务系统故障处理方法、装置、设备及存储介质
CN115296979B (zh) 一种故障处理方法、装置、设备及存储介质
CN110838940A (zh) 地下电缆巡检任务配置方法和装置
CN114697247B (zh) 流媒体系统的故障检测方法、装置、设备和存储介质
CN111694686B (zh) 一种异常服务的处理方法、装置、电子设备及存储介质
CN113672453A (zh) 一种展示页面的监控方法、装置、电子设备及存储介质
CN113420713A (zh) 异常监控方法、装置、电子设备及计算机可读介质
CN113656239A (zh) 针对中间件的监控方法、装置及计算机程序产品
CN111061613A (zh) 前端异常监控方法、装置及计算机设备
CN117251769B (zh) 基于监控组件的异常数据识别方法、装置、设备及介质
CN117395071B (zh) 一种异常检测方法、装置、设备及存储介质
CN114791996B (zh) 信息处理方法、装置、系统、电子设备及存储介质
CN117544487A (zh) 异常设备确定方法、装置、电子设备以及存储介质
CN114327967A (zh) 设备修复方法及装置、存储介质、电子装置
CN113986697A (zh) 通信日志丢失风险诊断方法、系统及存储介质
CN117389594A (zh) 固件升级方法、装置、电子设备及存储介质
CN117729005A (zh) 一种网络资产测绘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination