CN109766204A - 智能故障处理方法、装置、设备及可读存储介质 - Google Patents

智能故障处理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN109766204A
CN109766204A CN201811530487.9A CN201811530487A CN109766204A CN 109766204 A CN109766204 A CN 109766204A CN 201811530487 A CN201811530487 A CN 201811530487A CN 109766204 A CN109766204 A CN 109766204A
Authority
CN
China
Prior art keywords
tool
emergency
api
emergency tool
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811530487.9A
Other languages
English (en)
Inventor
方振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN201811530487.9A priority Critical patent/CN109766204A/zh
Publication of CN109766204A publication Critical patent/CN109766204A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种智能故障处理方法、装置、设备及可读存储介质,所述方法包括:当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;判断各个单独的所述api应急工具能否排除所述故障因子;若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集,应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。本发明解决解决异常故障场景的一一修复过程,系统故障运维效率低的技术问题。

Description

智能故障处理方法、装置、设备及可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种智能故障处理方法、装置、设备及可读存储介质。
背景技术
目前,自动化工具平台或者智能故障处理平台中针对单个的异常故障场景或者故障流程,均设计有自动化恢复工具,这些自动化恢复工具对应具有API调用接口,以API的形式对外提供服务。
然而,在现有技术中,对于系统故障点而言,常常具有多个连续故障流程即是多个异常故障场景需要修复,对于具有多个故障流程即多个异常故障场景的系统故障点的修复,需要运维人员多次在自动化工具平台中手动输入各种参数信息,才能调用多个上述API调用接口并实现多个异常故障场景的一一修复,由于需要运维人员多次在自动化工具平台中手动输入各种参数信息,才能调用多个上述API调用接口并实现多个异常故障场景的一一修复,因而,降低了系统故障运维的效率。
发明内容
本发明的主要目的在于提供一种智能故障处理方法、装置、设备及可读存储介质,旨在解决异常故障场景的一一修复过程,系统故障运维效率低的技术问题。
为实现上述目的,本发明提供一种智能故障处理方法,所述智能故障处理方法包括:
当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断各个单独的所述api应急工具能否排除所述故障因子;
若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
可选地,所述若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集步骤包括:
若各个单独的所述api应急工具都未能排除所述故障因子,则获取各api应急工具的输出参数和输入参数,判断是否存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数;
若存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,将输出参数为另一个api应急工具的输入参数的api应急工具作为第一应急工具,将输入参数为另一个api应急工具的输出参数的api应急工具作为第二应急工具,则将所述第一应急工具和所述第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集。
可选地,所述将第一应急工具和第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集步骤包括:
获取所述第一应急工具的第一调用接口,并获取所述第二应急工具的第二调用接口;
将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中;
将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,生成目标应急工具。
可选地,所述应用所述目标应急工具集步骤之后包括:
获取预存的所述故障因子的故障探测工具;
基于所述故障探测工具验证所述系统故障点是否修复正常,若所述系统故障点修复正常,则保存所述目标应急工具集。
可选地,所述基于所述故障探测工具验证所述系统故障点是否修复正常步骤包括:
基于所述故障探测工具,对所述系统故障点进行健康探测,并获得探测返回值;
判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常。
可选地,所述当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具步骤包括:
当接收到系统故障点的文件系统调用异常因子时,从预存的应急数据库中获取所述文件系统调用异常因子对应的文件系统探测工具、文件调用工具、以及系统扩容工具。
可选地,所述判断各个单独的所述api应急工具能否排除所述故障因子步骤之后包括:
若存在单独的所述api应急工具能够排除所述故障因子,则将所述能够排除所述故障因子的api应急工具排序在所述系统故障点对应所有api应急工具的首位。
本发明还提供一种智能故障处理装置,所述智能故障处理装置包括:
第一获取模块,用于当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断模块,用于判断各个单独的所述api应急工具能否排除所述故障因子;
生成模块,用于若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用模块,用于应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
可选地,所述生成模块包括:
第一获取单元,用于若各个单独的所述api应急工具都未能排除所述故障因子,则获取各api应急工具的输出参数和输入参数,判断是否存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数;
组合编排单元,用于若存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,将输出参数为另一个api应急工具的输入参数的api应急工具作为第一应急工具,将输入参数为另一个api应急工具的输出参数的api应急工具作为第二应急工具,则将所述第一应急工具和所述第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集。
可选地,所述组合编排单元包括:
获取子单元,用于获取所述第一应急工具的第一调用接口,并获取所述第二应急工具的第二调用接口;
代入子单元,用于将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中;
生成子单元,用于将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,生成目标应急工具。
可选地,所述智能故障处理装置还包括:
第二获取模块,用于获取预存的所述故障因子的故障探测工具;
验证模块,用于基于所述故障探测工具验证所述系统故障点是否修复正常,若所述系统故障点修复正常,则保存所述目标应急工具集。
可选地,所述验证模块包括:
健康探测单元,用于基于所述故障探测工具,对所述系统故障点进行健康探测,并获得探测返回值;
判断单元,用于判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常。
可选地,所述第一获取模块包括:
第二获取单元,用于当接收到系统故障点的文件系统调用异常因子时,从预存的应急数据库中获取所述文件系统调用异常因子对应的文件系统探测工具、文件调用工具、以及系统扩容工具。
可选地,所述智能故障处理装置还包括:
排序模块,用于若存在单独的所述api应急工具能够排除所述故障因子,则将所述能够排除所述故障因子的api应急工具排序在所述系统故障点对应所有api应急工具的首位。
此外,为实现上述目的,本发明还提供一种智能故障处理设备,所述智能故障处理设备包括:存储器、处理器,通信总线以及存储在所述存储器上的智能故障处理程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述智能故障处理程序,以实现以下步骤:
当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断各个单独的所述api应急工具能否排除所述故障因子;
若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断各个单独的所述api应急工具能否排除所述故障因子;
若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
本发明通过当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;判断各个单独的所述api应急工具能否排除所述故障因子;若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。在本申请中,在检测到系统故障点的故障因子后,系统能够自动采集对应所有api应急工具,若是判断各个单独的api应急工具不能够排除所述故障因子,则对所述各api应急工具进行组合编排,得到目标应急工具集,并基于该目标应急工具集进行系统故障点多个异常故障场景的一一修复,而不需要多次在自动化工具平台中手动输入各种参数信息,才能调用多个上述API调用接口并实现多个异常故障场景的一一修复,因而提升了系统故障运维的效率,解决了异常故障场景的一一修复过程,系统故障运维效率低的技术问题。
附图说明
图1为本发明智能故障处理方法第一实施例的流程示意图;
图2为本发明智能故障处理方法中若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集步骤的细化流程示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种智能故障处理方法,在本发明智能故障处理方法的第一实施例中,参照图1,所述智能故障处理方法包括:
步骤S10当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
步骤S20,判断各个单独的所述api应急工具能否排除所述故障因子;步骤S30,若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
步骤S40,应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
具体步骤如下:
步骤S10,当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
在本实施例中,智能故障处理方法应用于智能故障处理平台,该智能故障处理平台与系统进行实时通信,若检测到系统存在故障点时(系统存在故障点时可以上报给智能故障处理平台),能够调用本智能故障处理平台中的api应急工具进行该故障点的处理。需要说明的是,对于智能故障处理平台而言,在得到故障点后,能够分析具体的故障点类型以及故障场景(也可以是系统分析后发送给能故障处理平台),具体的故障点类型以及故障场景分析过程可以是:根据故障点的名称以及在系统中的节点位置确定故障点的类型,进一步地,根据检测到的或者是系统上报后接收到的被影响业务量确定故障场景,在分析具体的故障点类型以及故障场景后,智能故障处理平台能够得到分析结果,该分析结果中包括系统故障点的故障因或者是故障原因。
即在得到分析结果后,智能故障处理平台能够得到系统故障点的故障因子,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具,所述api应急工具指的是系统针对预设的系统故障因子而配置的系统应急方案。
具体地,所述当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具步骤包括:
步骤S11,当接收到系统故障点的文件系统调用异常因子时,从预存的应急数据库中获取所述文件系统调用异常因子对应的文件系统探测工具、文件调用工具、以及系统扩容工具。
即是智能故障处理平台中,系统设置了文件系统调用异常的故障因子,而针对文件系统调用异常的故障因子的api应急工具可以包括工具1:文件系统探测工具、工具2:文件调用工具、工具3:系统扩容工具等等。
步骤S20,判断各个单独的所述api应急工具能否排除所述故障因子;
在本实施例中,智能故障处理平台将调用应用系统故障因子对应的所有api应急工具,并判断各个单独的所述api应急工具能否排除所述故障因子,例如,应用上述工具1探测文件系统是否存在调用衔接问题,若工具1无法排除故障因子,则应用工具2,若工具2无法排除故障因子,则应用工具3,判断各个单独的所述api应急工具能否排除所述故障因子过程中,若是单独的所述api应急工具能够排除所述故障因子,则不执行后续步骤。需要说明的是,api工具各自有输入参数和输出参数,均为各api工具执行其功能步骤时的参数,在上述判断各个单独的所述api应急工具能否排除所述故障因子过程中,可以初始化所述api应急工具的配置参数,例如,智能故障处理平台需要利用api应急工具对系统进行扩容,则可以将系统中现有的容量,ip信息作为相应api应急工具的初始化配置参数,以便该相应api应急工具在执行扩容功能时,计算应扩容多少容量,配置什么ip等等数据。
所述判断各个单独的所述api应急工具能否排除所述故障因子步骤之后包括:
步骤S21,若存在单独的所述api应急工具能够排除所述故障因子,则将所述能够排除所述故障因子的api应急工具排序在所述系统故障点对应所有api应急工具的首位。
对于系统而言,故障因子可能是多次反复出现的,若存在单独的所述api应急工具能够排除所述故障因子,则在排除所述故障因子后,将所述能够排除所述故障因子的api应急工具排序在所述系统故障点对应所有api应急工具的首位,以便下次在发生故障时,首先选取该排除所述故障因子的api应急工具,以尽可能节约故障因子的排除流程。
步骤S30,若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
在本实施例中,若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,组合编排各api应急工具后,得到目标应急工具集,其中目标应急工具集中各api应急工具是可以有序集合的。
参照图2,具体地,所述若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集步骤包括:
步骤S31,若各个单独的所述api应急工具都未能排除所述故障因子,则获取各api应急工具的输出参数和输入参数,判断是否存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数;
在本实施例中,在目标应急工具集的生成过程中,获取各api应急工具的输出参数和输入参数,判断是否存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,并根据各api应急工具的输入参数和输出参数进行工具组合编排。
步骤S32,若存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,将输出参数为另一个api应急工具的输入参数的api应急工具作为第一应急工具,将输入参数为另一个api应急工具的输出参数的api应急工具作为第二应急工具,则将所述第一应急工具和所述第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集;
若存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,将输出参数为另一个api应急工具的输入参数的api应急工具作为第一应急工具,将输入参数为另一个api应急工具的输出参数的api应急工具作为第二应急工具,具体地,各个api工具执行着不同的功能步骤,例如,工具A,工具B和工具C三者都是用于解决问题a,但是工具A和工具B在解决问题a上的技术方向是一致的,属于同一技术维度的解决方案,而工具C在解决问题a上的技术方向与A、B并不相同,也就是说,工具A和工具B相互兼容,工具C与工具A、工具B并不兼容,故,工具A和工具B所引用的参数很大程度上是相承的,假设工具A的输出参数刚好为工具B的输入参数,例如工具A的输出参数为系统名d、系统编号123456、系统容量的缺失量为1G。而工具B的输入参数为系统编号、系统容量的缺失量。那么将确定根据工具A的输出参数和工具B的输入参数定位到工具A和工具B,并对工具A和工具B进行编排组合。由于工具A的输出参数为参数B的输入参数,因此工具A的功能步骤需要先执行,故按照工具A、工具B的顺序进行组合编排。而对于工具C,则,本实施例的步骤的意义在于,确定第一应急工具和第二应急工具进行组合编排的合格性,避免第一应急工具和第二应急工具通过组合编排出来的新工具是无效工具,而出现无法执行或执行异常的现象。需要说明的是,本实施例中的第一应急工具和第二应急工具为泛称,指代的是某一类工具而不是具体的工具对象,即第一应急工具可以为若干个同属性工具,第二应急工具同理。
步骤S40,应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
在得到目标应急工具集后,将直接调用所述工具,排除所述故障因子对应的系统故障点。例如,调用测试网络连接、DNS解析测试、数据解析测试组成的网络连接故障工具集,进行网络连接故障的排除。
本发明通过当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;判断各个单独的所述api应急工具能否排除所述故障因子;若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。在本实施例中,在检测到系统故障点的故障因子后,系统能够自动采集对应所有api应急工具,若是判断各个单独的api应急工具不能够排除所述故障因子,则对所述各api应急工具进行组合编排,得到目标应急工具集,并基于该目标应急工具集进行系统故障点多个异常故障场景的一一修复,而不需要多次在自动化工具平台中手动输入各种参数信息,才能调用多个上述API调用接口并实现多个异常故障场景的一一修复,因而提升了系统故障运维的效率,解决了异常故障场景的一一修复过程,系统故障运维效率低的技术问题。
进一步地,本发明提供智能故障处理方法的另一实施例,在该实施例中,所述将第一应急工具和第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集步骤包括:
步骤A1,获取所述第一应急工具的第一调用接口,并获取所述第二应急工具的第二调用接口;
组合编排的具体步骤是将第一应急工具和第二应急工具进行有序组合,由于原先的应急工具有各自的调用接口,相互独立不影响,因此组合编排过程是将二者进行接口兼容,因而首先获取第一应急工具的第一调用接口和第二应急工具的第二调用接口。
步骤A2,将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中;
将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中,由于第一应急工具的输出参数是第二应急工具的输入参数,因此该输出参数可作为第二应急工具的初始化配置项。而第二调用接口是第二应急工具的触发配置项,因此可直接将输出参数和第二调用接口作为第一应急工具的后续执行接口,第一应急工具执行完毕之后,系统执行第二应急工具,系统设置了自动化衔接子工具,用于作为第二应急工具的触发接口。当第一应急工具执行完毕,系统从自动化衔接子工具中得到输出参数和第二调用接口,便可以直接调用第二应急工具。
步骤A3,将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,生成目标应急工具。
将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,从而形成一套完整的标准应急流程,最后得到目标应急工具。
在本实施例中,由于先获取所述第一应急工具的第一调用接口,并获取所述第二应急工具的第二调用接口;再将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中;最后将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,生成目标应急工具。因而,能够准确融合不同接口,因而,能够生成目标应急工具。
进一步地,本发明提供智能故障处理方法的另一实施例,在该实施例中,所述应用所述目标应急工具集步骤之后包括:
步骤S50,获取预存的所述故障因子的故障探测工具;
执行目标应急工具的功能后,将针对当前的系统故障因子,检测系统是否恢复正常,此时,获取系统故障因子对应的故障探测工具。
步骤S60,基于所述故障探测工具验证所述系统故障点是否修复正常,若所述系统故障点修复正常,则保存所述目标应急工具集。
可以理解的是故障探测工具是预设在系统数据库中的再验证工具,基于所述故障探测工具验证所述系统故障点是否修复正常,例如系统发生运行卡顿的故障,那么在通过相应目标应急工具的故障排除之后,获得预存的系统运行卡顿对应的故障探测工具,通过卡顿对应故障探测工具确定卡顿是否修复完成,若系统应用目标应急工具集可以直接排除系统故障,因此保存所述目标应急工具集,以供下次使用。
所述基于所述故障探测工具验证所述系统故障点是否修复正常步骤包括:
步骤S61,基于所述故障探测工具,对所述系统故障点进行健康探测,并获得探测返回值;
在本实施例中,在得到故障探测工具后,对所述系统故障点进行健康探测,并获得探测返回值,通过该探测返回值确定系统故障点是否修复正常。
步骤S62,判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常。
在本实施例中,判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常,若所述探测返回值与预存的确定返回值不一致,则所述系统故障点未修复正常。
在本实施例中,先基于所述故障探测工具,对所述系统故障点进行健康探测,并获得探测返回值;再判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常。在本实施例中,实现准确判断系统故障点修复正常。
参照图3,图3是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例智能故障处理设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面3)播放器、便携计算机等终端设备。
如图3所示,该智能故障处理设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该智能故障处理设备还可以包括目标用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。目标用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选目标用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的智能故障处理设备结构并不构成对智能故障处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及智能故障处理程序。操作系统是管理和控制智能故障处理设备硬件和软件资源的程序,支持智能故障处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与智能故障处理设备中其它硬件和软件之间通信。
在图3所示的智能故障处理设备中,处理器1001用于执行存储器1005中存储的智能故障处理程序,实现上述任一项所述的智能故障处理方法的步骤。
本发明智能故障处理设备具体实施方式与上述智能故障处理方法各实施例基本相同,在此不再赘述。
本发明还提供一种智能故障处理装置,所述智能故障处理装置包括:
第一获取模块,用于当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断模块,用于判断各个单独的所述api应急工具能否排除所述故障因子;
生成模块,用于若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用模块,用于应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
可选地,所述生成模块包括:
第一获取单元,用于若各个单独的所述api应急工具都未能排除所述故障因子,则获取各api应急工具的输出参数和输入参数,判断是否存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数;
组合编排单元,用于若存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,将输出参数为另一个api应急工具的输入参数的api应急工具作为第一应急工具,将输入参数为另一个api应急工具的输出参数的api应急工具作为第二应急工具,则将所述第一应急工具和所述第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集。
可选地,所述组合编排单元包括:
获取子单元,用于获取所述第一应急工具的第一调用接口,并获取所述第二应急工具的第二调用接口;
代入子单元,用于将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中;
生成子单元,用于将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,生成目标应急工具。
可选地,所述智能故障处理装置还包括:
第二获取模块,用于获取预存的所述故障因子的故障探测工具;
验证模块,用于基于所述故障探测工具验证所述系统故障点是否修复正常,若所述系统故障点修复正常,则保存所述目标应急工具集。
可选地,所述验证模块包括:
健康探测单元,用于基于所述故障探测工具,对所述系统故障点进行健康探测,并获得探测返回值;
判断单元,用于判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常。
可选地,所述第一获取模块包括:
第二获取单元,用于当接收到系统故障点的文件系统调用异常因子时,从预存的应急数据库中获取所述文件系统调用异常因子对应的文件系统探测工具、文件调用工具、以及系统扩容工具。
可选地,所述智能故障处理装置还包括:
排序模块,用于若存在单独的所述api应急工具能够排除所述故障因子,则将所述能够排除所述故障因子的api应急工具排序在所述系统故障点对应所有api应急工具的首位。
本发明智能故障处理装置具体实施方式与上述智能故障处理方法各实施例基本相同,在此不再赘述。
本发明提供了一种可读存储介质,所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的智能故障处理方法的步骤。
本发明可读存储介质具体实施方式与上述智能故障处理方法各实施例基本相同,在此不再赘述。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利处理范围内。

Claims (10)

1.一种智能故障处理方法,其特征在于,所述方法包括:
当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断各个单独的所述api应急工具能否排除所述故障因子;
若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
2.如权利要求1所述的智能故障处理方法,其特征在于,所述若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集步骤包括:
若各个单独的所述api应急工具都未能排除所述故障因子,则获取各api应急工具的输出参数和输入参数,判断是否存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数;
若存在其中一个api应急工具中的输出参数为另一个api应急工具的输入参数,将输出参数为另一个api应急工具的输入参数的api应急工具作为第一应急工具,将输入参数为另一个api应急工具的输出参数的api应急工具作为第二应急工具,则将所述第一应急工具和所述第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集。
3.如权利要求2所述的智能故障处理方法,其特征在于,所述将第一应急工具和第二应急工具按先后顺序进行组合编排,以生成所述故障因子的目标应急工具集步骤包括:
获取所述第一应急工具的第一调用接口,并获取所述第二应急工具的第二调用接口;
将所述第一应急工具的输出参数和所述第二应急工具的第二调用接口代入至预设的自动化衔接子工具中;
将所述第一调用接口、所述第一应急工具、所述自动化衔接子工具和所述第二应急工具按先后顺序结合,生成目标应急工具。
4.如权利要求1所述的智能故障处理方法,其特征在于,所述应用所述目标应急工具集步骤之后包括:
获取预存的所述故障因子的故障探测工具;
基于所述故障探测工具验证所述系统故障点是否修复正常,若所述系统故障点修复正常,则保存所述目标应急工具集。
5.如权利要求4所述的智能故障处理方法,其特征在于,所述基于所述故障探测工具验证所述系统故障点是否修复正常步骤包括:
基于所述故障探测工具,对所述系统故障点进行健康探测,并获得探测返回值;
判断所述探测返回值是否与预存的确定返回值是否一致,若所述探测返回值与预设的确定返回值一致,则所述系统故障点修复正常。
6.如权利要求1所述的智能故障处理方法,其特征在于,所述当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具步骤包括:
当接收到系统故障点的文件系统调用异常因子时,从预存的应急数据库中获取所述文件系统调用异常因子对应的文件系统探测工具、文件调用工具、以及系统扩容工具。
7.如权利要求1-6任一项所述的智能故障处理方法,其特征在于,所述判断各个单独的所述api应急工具能否排除所述故障因子步骤之后包括:
若存在单独的所述api应急工具能够排除所述故障因子,则将所述能够排除所述故障因子的api应急工具排序在所述系统故障点对应所有api应急工具的首位。
8.一种智能故障处理装置,其特征在于,所述智能故障处理装置包括:
第一获取模块,用于当接收到系统故障点的故障因子时,从预存的应急数据库中获取所述系统故障因子对应的所有api应急工具;
判断模块,用于判断各个单独的所述api应急工具能否排除所述故障因子;
生成模块,用于若各个单独的所述api应急工具都未能排除所述故障因子,则组合编排所述各api应急工具,以生成所述故障因子的目标应急工具集;
应用模块,用于应用所述目标应急工具集,以排除所述故障因子对应的系统故障点。
9.一种智能故障处理设备,其特征在于,所述智能故障处理设备包括:存储器、处理器,通信总线以及存储在所述存储器上的智能故障处理程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述智能故障处理程序,以实现如权利要求1至7中任一项所述的智能故障处理方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有智能故障处理程序,所述智能故障处理程序被处理器执行时实现如权利要求1-7中任一项所述的智能故障处理方法的步骤。
CN201811530487.9A 2018-12-13 2018-12-13 智能故障处理方法、装置、设备及可读存储介质 Pending CN109766204A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811530487.9A CN109766204A (zh) 2018-12-13 2018-12-13 智能故障处理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811530487.9A CN109766204A (zh) 2018-12-13 2018-12-13 智能故障处理方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN109766204A true CN109766204A (zh) 2019-05-17

Family

ID=66450646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811530487.9A Pending CN109766204A (zh) 2018-12-13 2018-12-13 智能故障处理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN109766204A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835921A (zh) * 2021-09-29 2021-12-24 平安普惠企业管理有限公司 接口服务异常的处理方法、装置、设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106327A1 (en) * 2007-10-19 2009-04-23 Oracle International Corporation Data Recovery Advisor
CN104067216A (zh) * 2011-06-27 2014-09-24 亚马逊科技公司 用于实施可扩展数据存储服务的系统和方法
US20140298091A1 (en) * 2013-04-01 2014-10-02 Nebula, Inc. Fault Tolerance for a Distributed Computing System
US20160019102A1 (en) * 2014-07-15 2016-01-21 International Business Machines Corporation Application pattern discovery
CN105373440A (zh) * 2015-11-02 2016-03-02 努比亚技术有限公司 故障检测修复装置及方法
CN105959130A (zh) * 2016-04-13 2016-09-21 乐视控股(北京)有限公司 一种基于大数据运维的监控方法和装置
CN106992884A (zh) * 2017-03-28 2017-07-28 武汉虹信技术服务有限责任公司 一种智能建筑业务系统的多子系统联动方法
US20170371567A1 (en) * 2016-06-22 2017-12-28 Vmware, Inc. Supporting replication and recovery of virtual volumes
CN108197016A (zh) * 2018-01-11 2018-06-22 上海有云信息技术有限公司 一种云平台故障原因分析方法、装置、设备及存储介质
CN108628738A (zh) * 2018-01-11 2018-10-09 百富计算机技术(深圳)有限公司 应用程序编程接口测试用例的生成方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106327A1 (en) * 2007-10-19 2009-04-23 Oracle International Corporation Data Recovery Advisor
CN104067216A (zh) * 2011-06-27 2014-09-24 亚马逊科技公司 用于实施可扩展数据存储服务的系统和方法
US20140298091A1 (en) * 2013-04-01 2014-10-02 Nebula, Inc. Fault Tolerance for a Distributed Computing System
US20160019102A1 (en) * 2014-07-15 2016-01-21 International Business Machines Corporation Application pattern discovery
CN105373440A (zh) * 2015-11-02 2016-03-02 努比亚技术有限公司 故障检测修复装置及方法
CN105959130A (zh) * 2016-04-13 2016-09-21 乐视控股(北京)有限公司 一种基于大数据运维的监控方法和装置
US20170371567A1 (en) * 2016-06-22 2017-12-28 Vmware, Inc. Supporting replication and recovery of virtual volumes
CN106992884A (zh) * 2017-03-28 2017-07-28 武汉虹信技术服务有限责任公司 一种智能建筑业务系统的多子系统联动方法
CN108197016A (zh) * 2018-01-11 2018-06-22 上海有云信息技术有限公司 一种云平台故障原因分析方法、装置、设备及存储介质
CN108628738A (zh) * 2018-01-11 2018-10-09 百富计算机技术(深圳)有限公司 应用程序编程接口测试用例的生成方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WEIXIN_33713707: "Netflix Conductor:一个微服务编排工具", pages 1, Retrieved from the Internet <URL:《https://blog.csdn.net/weixin_33713707/article/details/90326925》> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113835921A (zh) * 2021-09-29 2021-12-24 平安普惠企业管理有限公司 接口服务异常的处理方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN102141962B (zh) 一种安全性分布式测试框架系统及其测试方法
CN105094783B (zh) 安卓应用稳定性测试的方法及装置
CN100544292C (zh) 一种宽带接入服务器自动化测试的方法
CN103365770A (zh) 移动终端软件测试系统及软件测试方法
CN110309051A (zh) 管理测试用例的方法、系统、设备及存储介质
CN109582563A (zh) 测试案例的测试方法、装置、计算机设备及存储介质
CN111124919A (zh) 一种用户界面的测试方法、装置、设备及存储介质
CN109633351A (zh) 智能it运维故障定位方法、装置、设备及可读存储介质
CN103279416A (zh) 一种存储软件自动化测试系统和方法
CN111224845A (zh) 一种基于物联网云的设备自动化测试系统及方法
CN107861864A (zh) 自动化测试方法、系统及计算机可读存储介质
CN109783260A (zh) 智能it全流程运维方法、装置、设备及可读存储介质
CN107302476A (zh) 一种测试异步交互系统的自动化测试方法与系统
CN103455413A (zh) 一种通讯终端交互场景测试数据处理方法、装置和系统
CN106209515A (zh) 接入网设备自动化测试系统
CN110134612A (zh) Ui测试数据生成方法、装置、设备及可读存储介质
CN106294172A (zh) 基于终端设备的app自测方法和装置
CN107122307B (zh) 一种物联网执行系统
CN105760300B (zh) 一种stk/utk业务的自动化测试方法及测试系统
CN107679423A (zh) 分区完整性检查方法及装置
CN106294097B (zh) 一种应用程序测试方法及设备
CN104182348A (zh) 软件测试方法及装置
CN109962823B (zh) 一种网络应用场景的自动化测试系统及方法
CN109766204A (zh) 智能故障处理方法、装置、设备及可读存储介质
CN113747150B (zh) 一种基于容器云实现的视频服务系统的测试方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination