CN113342560A - 一种故障处理方法、系统、电子设备及存储介质 - Google Patents

一种故障处理方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN113342560A
CN113342560A CN202110628502.9A CN202110628502A CN113342560A CN 113342560 A CN113342560 A CN 113342560A CN 202110628502 A CN202110628502 A CN 202110628502A CN 113342560 A CN113342560 A CN 113342560A
Authority
CN
China
Prior art keywords
fault
self
script
information
healing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110628502.9A
Other languages
English (en)
Inventor
潘子垚
耿英
熊志标
田伟鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110628502.9A priority Critical patent/CN113342560A/zh
Publication of CN113342560A publication Critical patent/CN113342560A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种故障处理方法,用于处理在软件交付流水线中的故障,其中,该软件包括至少一个子应用,可用于金融领域或其他领域,包括:根据软件交付流水线的故障日志,获得故障信息;根据故障信息,判断该故障的来源;其中,若该故障来源于至少一个子应用,则将故障信息发送至对应的研发人员;若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当所述自愈脚本执行成功后,重启软件交付流水线。本公开还提供了一种故障处理系统、电子设备及计算机可读存储介质。

Description

一种故障处理方法、系统、电子设备及存储介质
技术领域
本公开涉及故障检测技术领域,具体涉及一种故障处理方法、系统、电子设备及存储介质。
背景技术
持续交付流水线是持续交付的载体,它承载着开发团队从代码提交到产品交付的整个生命周期,主要包括代码扫描模块、编译模块、部署模块、测试模块等四大模块。研发人员提交代码后,代码扫描模块将对代码进行扫描,发现代码其中存在的逻辑问题,计算出代码的圈复杂度等;扫描通过的代码会进入编译模块,根据不同的编译策略进行编译,编译成功后将得到一个可部署的版本;该版本被推送到部署模块,部署模块根据部署策略将版本部署到测试环境;部署成功后,测试模块会对测试环境上的应用进行冒烟测试、接口测试和自动化测试等,来确保新上线的系统无问题。交付流水线是串行处理的,其中任何一个模块报错都会导致流水线卡住无法继续。
随着应用数量增加,持续交付流水线也会越来越多,目前的流水线模式存在以下问题:
1)、由于流水线的增多,构建频次增多,配置管理员成为处理流水线故障的瓶颈,降低了项目团队的效率;
2)、流水线故障信息缺乏分类梳理,故障处理效率低;
3)、缺乏流水线故障自愈机制,自动化程度低。
发明内容
为解决现有技术中存在的问题,本公开实施例提供的一种故障处理方法、系统、电子设备及存储介质,通过对流水线故障日志的分析处理,将故障分发至对应的负责人员,并对由于环境引起的故障进行自动化自愈,提升故障处理效率。
本公开的第一个方面提供了一种故障处理方法,用于处理在软件交付流水线中的故障,其中,该软件包括至少一个子应用,包括:根据软件交付流水线的故障日志,获得故障信息;根据故障信息,判断该故障的来源;其中,若该故障来源于该至少一个子应用,则将该故障信息发送至对应的研发人员;若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当自愈脚本执行成功后,重启该软件交付流水线。
进一步地,根据该软件交付流水线的故障日志,获得故障信息,包括:对该故障日志进行故障关键词分析,获得该故障信息,其中,该故障信息包括故障来源、故障归属及故障类型中的一种或多种。
进一步地,若该故障来源于该至少一个子应用,则将该故障信息发送至对应的研发人员,包括:根据该软件交付流水线的配置文件,该配置文件至少包括通知配置表及脚本配置表;根据通知配置表获得该软件的研发人员信息;根据研发人员信息,并将该故障信息发送至对应的研发人员。
进一步地,若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当该自愈脚本执行成功后,重启软件交付流水线,包括:根据脚本配置表获得该故障的自愈脚本的存储位置;根据存储位置自动登录该自愈脚本所在的服务器,并执行该自愈脚本;若该自愈脚本执行成功,则重启该软件交付流水线。
进一步地,将故障信息发送至对应的研发人员,包括:通过邮件或短信的通知方式将该故障信息发送至对应的研发人员。
进一步地,软件交付流水线包括代码扫描模块、编译模块、部署模块及测试模块,故障日志来源于代码扫描模块或编译模块或部署模块或测试模块。
进一步地,通知配置表包括该至少一个子应用的编号及研发人员信息,该脚本配置表包括该至少一个子应用的编号、IP地址、存储路径、脚本类型及自愈类型。
进一步地,研发人员信息包括:角色名称、邮箱地址及手机号。
本公开的第二个方面提供了一种故障处理系统,用于处理在软件交付流水线中的故障,其中,该软件包括至少一个子应用,包括:日志分析模块,用于根据该软件交付流水线的故障日志,获得故障信息;故障判断模块,用于根据该故障信息,判断该故障的来源;故障处理模块,用于该故障来源于该至少一个子应用时,则将该故障信息发送至对应的研发人员;若该故障来源于软件部署环境时,则调用对应的自愈脚本进行该故障自愈处理,当该自愈脚本执行成功后,重启该软件交付流水线。
进一步地,该系统还包括:配置模块,用于定制通知配置表及脚本配置表,其中,该通知配置表用于获取各研发人员信息,该脚本配置表用于获取各故障对应的自愈脚本的信息。
进一步地,日志分析模块用于根据该软件交付流水线的故障日志,获得故障信息,包括:对故障日志进行故障关键词分析,获得该故障信息,其中,该故障信息包括故障来源、故障归属及故障类型中的一种或多种。
进一步地,若该故障来源于该至少一个子应用,则将该故障信息发送至对应的研发人员,包括:根据该软件交付流水线的配置文件,该配置文件至少包括通知配置表及脚本配置表;根据该通知配置表获得该软件的研发人员信息;根据该研发人员信息,并将该故障信息发送至对应的研发人员。
进一步地,若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当自愈脚本执行成功后,重启该软件交付流水线,包括:根据脚本配置表获得该故障的自愈脚本的存储位置;根据该存储位置自动登录该自愈脚本所在的服务器,并执行该自愈脚本;若自愈脚本执行成功,则重启该软件交付流水线。
本公开的第三个方面提供了一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现本公开的第一个方面提供的故障处理方法。
本公开的第四个方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本公开的第一个方面提供的异常交易的故障处理方法。
本公开提供的一种故障处理方法、系统、电子设备及存储介质,通过对流水线故障日志的分析处理,判断故障的归属人及将故障分发至对应的负责人员,并对由于环境引起的故障进行自动化自愈,提升故障处理效率。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开一实施例的故障处理方法的应用场景图;
图2示意性示出了根据本公开一实施例的故障处理方法的流程图;
图3示意性示出了根据本公开一实施例的持续交付流水线的方框图;
图4示意性示出了根据本公开一实施例的故障通知的流程图;
图5示意性示出了根据本公开一实施例的故障自愈处理的流程图;
图6示意性示出了根据本公开另一实施例的故障分析处理的流程图;
图7示意性示出了根据本公开一实施例的故障处理系统的方框图;
图8示意性示出了根据本公开另一实施例的故障处理系统的方框图;
图9示意性示出了根据本公开一实施例的适于实现上文描述的方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
本公开实施例提供一种故障处理方法和系统,用于处理在软件交付流水线中的故障,其中,该软件包括至少一个子应用,该故障处理方法包括:根据软件交付流水线的故障日志,获得故障信息;根据故障信息,判断该故障的来源;其中,若该故障来源于该至少一个子应用,则将该故障信息发送至对应的研发人员;若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当自愈脚本执行成功后,重启该软件交付流水线。
根据本公开的实施例,通过对软件交付流水线中的故障信息进行分析,判断故障的归属人及将故障分发至对应的负责人员,并对由于环境引起的故障进行自动化自愈,提升软件交付流水线的故障自动化处理效率。
图1示意性示出了根据本公开实施例的可以应用于故障处理方法的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户(如研发人员)可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如各语言软件编程系统、测试系统、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器103可以是提供各种服务的服务器,例如对用户利用终端设备101所按照的应用程序提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等进行分析处理,并将处理结果(例如信息或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的故障处理方法一般可以由服务器103执行。相应地,本公开实施例所提供的故障处理系统一般可以部署于服务器103中。本公开实施例所提供的故障处理方法也可以由不同于服务器103且能够与终端设备101和/或服务器103通信的服务器或服务器集群执行。相应地,本公开实施例所提供的用于故障处理系统也可以设置于不同于服务器103且能够与终端设备101和/或服务器103通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的故障处理方法的流程图。如图2所示,该方法用于处理在软件交付流水线中的故障,包括:步骤S201~S203。
在操作S201,根据软件交付流水线的故障日志,获得故障信息。
本公开的实施例中,该故障处理方法可以应用于电子设备中,该电子设备可以包括但不仅限于服务器、服务器集群等。电子设备中可以部署各软件交付流水线,如:手机银行的交付流水线等。以软件为手机银为例,该手机银行包括但不仅限于登录子应用、转账子应用、缴费子应用、投资理财子应用等等。需说明的是,该软件及该软件包括的子应用仅为示例性的说明,其并不构成对本公开实施例的限定。
如图3所示,软件交付流水线为持续交付流水线,其具体包括:代码扫描模块、编译模块、部署模块及测试模块,本公开的方法获取的故障日志来源于代码扫描模块或编译模块或部署模块或测试模块。具体地,当持续交付流水线的代码扫描模块、编译模块、部署模块及测试模块中的任一模块发生故障使得持续交付流水线挂起时,持续交付流水线会根据当前故障生成相应的故障日志,并将该故障日志发送至本公开提供的故障处理系统进行分析处理。需说明的是,在实际应用过程中,根据实际需求该持续交付流水线可以包括除了代码扫描模块、编译模块、部署模块及测试模块之外的其他模块,以保证软件持续交付过程中自动检测的全面性。
根据本公开的实施例,在操作S201步骤时,具体包括:对故障日志进行故障关键词分析,获得该故障信息,其中,该故障信息包括故障来源、故障归属及故障类型中的一种或多种。本公开的实施例中,可以根据故障日志的命名规则得到该故障日志来自于代码扫描模块、编译模块、部署模块及测试模块中的哪个模块,再根据故障日志的内容进行关键词判断该故障来源及该故障属于哪种类型的故障,故障来源主要包括来源于上述实施例中的至少一个子应用或来源于软件部署环境,故障类型包括但不仅限于数据库故障、中间件故障、前端代码报错、后端代码报错、部署环境报错等等。
在操作S202,根据该故障信息,判断该故障的来源。
本公开的实施例中,沿用上述实施例,根据故障日志分析得到的故障信息包括故障来源、故障归属及故障类型中的一种或多种,根据该故障来源可以得到当前故障是来自于软件的子应用还是软件部署环境故障,然后根据故障的来源不同分别采取不同的处理方式。
在操作S203,若该故障来源于至少一个子应用,则将该故障信息发送至对应的研发人员;若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当该自愈脚本执行成功后,重启该软件交付流水线。
本公开的实施例中,沿用上述实施例,若该故障日志来自于代码扫描模块或编译模块或测试模块时,则该故障是来源于软件的至少一个子应用的故障,若该故障日志来自于部署模块,则该故障来源于软件的至少一个子应用或软件部署环境,其中,来源于软件的至少一个子应用的故障可以为前端代码报错、后端代码报错、缺少jar包导致编译报错、接口实现依赖问题的报错等等,来源于软件部署环境的故障可以为数据库的监听故障、数据库代码报错、数据库变量报错、中间件没有运行等等。
具体地,如图4所示,若该故障来源于至少一个子应用,则将该故障信息发送至对应的研发人员具体包括:
在操作S401,根据该软件交付流水线的配置文件,该配置文件至少包括通知配置表及脚本配置表;
在操作S402,根据该通知配置表获得该软件的研发人员信息;
在操作S403,根据该研发人员信息,并将该故障信息发送至对应的研发人员。
本公开的实施例中,通知配置表包括但不仅限于每个子应用的编号及研发人员信息,其中,研发人员信息包括但不仅限于:研发人员姓名、职能名称、邮箱地址及手机号等等,如下表1为通知配置表的示例说明:
表1 通知配置表
Figure BDA0003101959090000091
如表1所示,每个子应用分别至少对应的有配置管理员(SCM)、数据库管理员(DBA)、测试工程师(TESTER)及开发工程师(CODER),不同职能的研发人员对应着不同的研发内容,即负责与其职能匹配的故障处理。本公开的实施例中,不管属于哪种类型的故障,原则上该故障信息均发送至出现故障的应用所对应的配置管理员。
根据本公开的实施例,将该故障信息发送至对应的研发人员,包括:通过邮件或短信的通知方式将该故障信息发送至对应的研发人员。其中,根据通知配置表获得的故障负责人员的邮箱地址或是手机号,将该故障信息通过邮件或是短信的通知方式发送至对应的研发人员,邮件正文内容及短信内容至少包括该故障信息,并提示该研发人员在一定时间内进行故障处理。
需说明的是,上述通知配置表中子应用ID、姓名、职能(role Id)、邮箱地址及手机号等都是示例性的说明,其并不构成本公开实施例的通知配置表的限定。另外,故障通知方式并不仅限于上述实施例所示的邮件或短信的通知方式,在其他一些实施例中,其也可以为以系统消息提示或是链接以二维码的方式提示该故障信息,本公开对故障通知的方式不做限定。
具体地,如图5所示,若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当该自愈脚本执行成功后,重启该软件交付流水线具体包括:
在操作S501,根据该脚本配置表获得该故障的自愈脚本的存储位置;
在操作S502,根据该存储位置自动登录该自愈脚本所在的服务器,并执行该自愈脚本;
在操作S503,若该自愈脚本执行成功,则重启该软件交付流水线。
本公开的实施例中,该脚本配置表包括但不仅限于每个子应用的编号、IP地址、存储路径、脚本类型及自愈类型等,其中,IP地址为自愈脚本存储的服务器IP地址,存储路径是指自愈脚本存储在服务器上的具体文件夹的路径。如下表2为脚本配置表的示例说明:
子应用ID IP地址 存储路径 脚本名称 自愈类型
应用A 1.1.1.2 /data/shell WasshellA.sh was
应用A 1.1.1.3 /oracle/shell OracleshellA.sh db
应用B 147.1.1.2 /data/shell WasshellB.sh was
应用B 147.1.1.3 /oracle/shell OracleshellB.sh db
如表2所示,自愈类型包括但不仅限于软件运行的中间件自愈(was)、软件的运行的数据库(db)等等,根据故障的来源调取相应的自愈脚本先根据脚本配置本获取该自愈脚本存储的信息,登录该自愈脚本存储的服务器,根据存储路径找到该自愈脚本,然后自动调用执行该自愈脚本对该故障进行自愈处理,有效提升了故障处理效率。
需说明的是,上述脚本配置表中子应用ID、IP地址、存储路径、脚本名称及自愈类型等都是示例性的说明,其并不构成本公开实施例的脚本配置表的限定。
本公开的实施例中,负责持续交付流水线的配置管理员可以对通知配置表及脚本配置表定期进行更新,保证故障通知能够发给最准确的处理人以及增加可自愈的脚本类型,以使可以进行自愈修复的故障更加全面,节省研发人员的处理时间,提高工作效率。
图6示意性示出了根据本公开另一实施例的故障分析处理的流程图。
如图6所示,logA为来源于代码扫描模块的故障日志,logB为来源于编译模块的故障日志,logC为来源于部署模块的故障日志,logD为来源于测试模块的故障日志。当持续交付流水线出现故障挂起时,其将当前出现故障模块的日志发送至故障处理系统,该故障处理系统首先判断该故障日志来源于流水线的哪个模块。
若该故障日志为logA,其来源于代码扫描模块,则根据该故障日志的内容获得出现故障的子应用ID号,然后根据通知配置表中该子应用ID找到与其对应的开发人员信息,并将根据故障日志生成的故障信息发送至对应的开发人员邮箱地址,以通知其进行故障处理。
若该故障日志为logD,其来源于测试模块,则根据该故障日志的内容获得出现故障的子应用ID号,然后根据通知配置表中该子应用ID找到与其对应的测试工程师信息,并将根据故障日志生成的故障信息发送至对应的测试工程师邮箱地址,以通知其进行故障处理。
若该故障日志为logB,其来源于编译模块,则根据该故障日志的内容进行关键词检索分析,遍历日志中失败的信息,判断具体是哪个编译模块报错,获取该编译模块所对应的子应用,然后根据通知配置表中该子应用ID找到与其对应研发工程师信息,并将根据故障日志生成的故障信息发送至对应的研发工程师邮箱地址,以通知其进行故障处理。来源于编译模块的故障主要分为数据库报错或代码报错,则其相应的故障信息发送至数据库管理员DBA或开发工程师CODER。
若该故障日志为logC,其来源于部署模块,则根据该故障日志的内容进行关键词检索分析,遍历日志中失败的信息,获取该故障来源于子应用报错还是软件部署环境,若是子应用报错,则根据通知配置表中该子应用ID找到与其对应研发工程师信息,并将根据故障日志生成的故障信息发送至对应的研发工程师邮箱地址;若是软件部署环境报错,则根据脚本配置表判断该故障是否属于可自愈的故障,若是,则调用对应的自愈脚本进行该故障自愈处理,使流水线服务自动恢复;否则,根据通知配置表中该子应用ID找到与其对应配置管理员信息,以通知其进行故障处理。
需说明的是,上述实施例中的实施流程、故障日志名称、各成员命名参数等仅为示例性说明,其不构成对本公开提供的方法适用其他故障处理的限定。
图7示意性示出了根据本公开实施例的故障处理系统的方框图。
如图7所示,该故障处理系统700包括:日志分析模块710、故障判断模块720及故障处理模块730。该系统700可以用于实现参考图2所描述的故障处理方法。
日志分析模块710,用于根据该软件交付流水线的故障日志,获得故障信息。根据本公开的实施例,该日志分析模块710例如可以用于执行上文参考图2所描述的S201步骤,在此不再赘述。
故障判断模块720,用于根据该故障信息,判断该故障的来源。根据本公开的实施例,该故障判断模块720例如可以用于执行上文参考图2所描述的S202步骤,在此不再赘述。
故障处理模块730,用于该故障来源于至少一个子应用时,则将该故障信息发送至对应的研发人员;若该故障来源于软件部署环境时,则调用对应的自愈脚本进行该故障自愈处理,当该自愈脚本执行成功后,重启该软件交付流水线。根据本公开的实施例,该故障处理模块730例如可以用于执行上文参考图2所描述的S203步骤,在此不再赘述。
本公开的实施例中,该日志分析模块用于根据该软件交付流水线的故障日志,获得故障信息,包括:对该故障日志进行故障关键词分析,获得所述故障信息,其中,所述故障信息包括故障来源、故障归属及故障类型中的一种或多种。
具体地,若该故障来源于所述至少一个子应用,则将该故障信息发送至对应的研发人员,包括:根据该软件交付流水线的配置文件,该配置文件至少包括通知配置表及脚本配置表;根据该通知配置表获得该软件的研发人员信息;根据该研发人员信息,并将该故障信息发送至对应的研发人员。
具体地,若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当该自愈脚本执行成功后,重启该软件交付流水线,包括:根据该脚本配置表获得该故障的自愈脚本的存储位置;根据存储位置自动登录该自愈脚本所在的服务器,并执行该自愈脚本;若该自愈脚本执行成功,则重启该软件交付流水线
如图8所示,该系统700还包括:配置模块740,用于定制通知配置表及脚本配置表,其中,该通知配置表用于获取各研发人员信息,该脚本配置表用于获取各故障对应的自愈脚本的信息。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,日志分析模块710、故障判断模块720、故障处理模块730、配置模块740中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,日志分析模块710、故障判断模块720、故障处理模块730、配置模块740中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,日志分析模块710、故障判断模块720、故障处理模块730、配置模块740中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
本公开提供的一种故障处理方法及系统,可用于金融领域或其他领域,需说明的是,本公开提供的一种故障处理方法及系统可用于金融领域,例如金融领域中各业务系统的流水线的故障处理,也可用于除金融领域之外其他领域,本公开提供的一种故障处理方法及系统的应用领域不作限定。
本公开提供的一种故障处理方法及系统,该方法通过对故障日志分析,能够替代原有配置管理员角色的部分工作,使得流水线故障被实时通知到处理人,提升了处理效率;通过配置文件的定期更新,可以由各子应用根据应用的编译模块等信息实时进行更新,保证通知信息是最新的,提升了故障处理效率。另外,通过自愈脚本的设置,使得故障可以进行自动修复,提升了重新交付流水线的自动化。
图9示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的方框图。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,本实施例中所描述的电子设备900,包括:处理器901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 903中,存储有系统900操作所需的各种程序和数据。处理器901、ROM 902以及RAM 903通过总线904彼此相连。处理器901通过执行ROM 902和/或RAM 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 902和RAM 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备900还可以包括输入/输出(I/O)接口905,输入/输出(I/O)接口905也连接至总线904。系统900还可以包括连接至I/O接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的故障处理方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 902和/或RAM 903和/或ROM 902和RAM 903以外的一个或多个存储器。
需要说明的是,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (15)

1.一种故障处理方法,用于处理在软件交付流水线中的故障,其中,所述软件包括至少一个子应用,其特征在于,包括:
根据所述软件交付流水线的故障日志,获得故障信息;
根据所述故障信息,判断该故障的来源;其中,
若该故障来源于所述至少一个子应用,则将所述故障信息发送至对应的研发人员;若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当所述自愈脚本执行成功后,重启所述软件交付流水线。
2.根据权利要求1所述的故障处理方法,其特征在于,所述根据所述软件交付流水线的故障日志,获得故障信息,包括:
对所述故障日志进行故障关键词分析,获得所述故障信息,其中,所述故障信息包括故障来源、故障归属及故障类型中的一种或多种。
3.根据权利要求1所述的故障处理方法,其特征在于,所述若该故障来源于所述至少一个子应用,则将所述故障信息发送至对应的研发人员,包括:
根据所述软件交付流水线的配置文件,该配置文件至少包括通知配置表及脚本配置表;
根据所述通知配置表获得该软件的研发人员信息;
根据所述研发人员信息,并将所述故障信息发送至对应的研发人员。
4.根据权利要求3所述的故障处理方法,其特征在于,所述若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当所述自愈脚本执行成功后,重启所述软件交付流水线,包括:
根据所述脚本配置表获得该故障的自愈脚本的存储位置;
根据所述存储位置自动登录该自愈脚本所在的服务器,并执行该自愈脚本;
若所述自愈脚本执行成功,则重启所述软件交付流水线。
5.根据权利要求1所述的故障处理方法,其特征在于,所述将所述故障信息发送至对应的研发人员,包括:
通过邮件或短信的通知方式将所述故障信息发送至对应的研发人员。
6.根据权利要求2所述的故障处理方法,其特征在于,所述软件交付流水线包括代码扫描模块、编译模块、部署模块及测试模块,所述故障日志来源于所述代码扫描模块或所述编译模块或所述部署模块或所述测试模块。
7.根据权利要求3所述的故障处理方法,其特征在于,所述通知配置表包括所述至少一个子应用的编号及研发人员信息,所述脚本配置表包括所述至少一个子应用的编号、IP地址、存储路径、脚本类型及自愈类型。
8.根据权利要求7所述的故障处理方法,其特征在于,所述研发人员信息包括:角色名称、邮箱地址及手机号。
9.一种故障处理系统,用于处理在软件交付流水线中的故障,其中,所述软件包括至少一个子应用,其特征在于,包括:
日志分析模块,用于根据所述软件交付流水线的故障日志,获得故障信息;
故障判断模块,用于根据所述故障信息,判断该故障的来源;
故障处理模块,用于该故障来源于所述至少一个子应用时,则将所述故障信息发送至对应的研发人员;若该故障来源于软件部署环境时,则调用对应的自愈脚本进行该故障自愈处理,当所述自愈脚本执行成功后,重启所述软件交付流水线。
10.根据权利要求9所述的故障处理系统,其特征在于,该系统还包括:
配置模块,用于定制通知配置表及脚本配置表,其中,所述通知配置表用于获取各研发人员信息,所述脚本配置表用于获取各故障对应的自愈脚本的信息。
11.根据权利要求9所述的故障处理系统,其特征在于,所述日志分析模块用于根据所述软件交付流水线的故障日志,获得故障信息,包括:
对所述故障日志进行故障关键词分析,获得所述故障信息,其中,所述故障信息包括故障来源、故障归属及故障类型中的一种或多种。
12.根据权利要求9所述的故障处理系统,其特征在于,所述若该故障来源于所述至少一个子应用,则将所述故障信息发送至对应的研发人员,包括:
根据所述软件交付流水线的配置文件,该配置文件至少包括通知配置表及脚本配置表;
根据所述通知配置表获得该软件的研发人员信息;
根据所述研发人员信息,并将所述故障信息发送至对应的研发人员。
13.根据权利要求9所述的故障处理系统,其特征在于,所述若该故障来源于软件部署环境,则调用对应的自愈脚本进行该故障自愈处理,当所述自愈脚本执行成功后,重启所述软件交付流水线,包括:
根据所述脚本配置表获得该故障的自愈脚本的存储位置;
根据所述存储位置自动登录该自愈脚本所在的服务器,并执行该自愈脚本;
若所述自愈脚本执行成功,则重启所述软件交付流水线。
14.一种电子设备,包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至8中任一项所述的故障处理方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至8中任一项所述的故障处理方法。
CN202110628502.9A 2021-06-04 2021-06-04 一种故障处理方法、系统、电子设备及存储介质 Pending CN113342560A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110628502.9A CN113342560A (zh) 2021-06-04 2021-06-04 一种故障处理方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110628502.9A CN113342560A (zh) 2021-06-04 2021-06-04 一种故障处理方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113342560A true CN113342560A (zh) 2021-09-03

Family

ID=77474202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110628502.9A Pending CN113342560A (zh) 2021-06-04 2021-06-04 一种故障处理方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113342560A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114884796A (zh) * 2022-06-16 2022-08-09 中国工商银行股份有限公司 故障处理方法、装置、电子设备及存储介质
CN115190008A (zh) * 2022-07-08 2022-10-14 中国建设银行股份有限公司 故障处理方法、故障处理装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727629A (zh) * 2008-10-10 2010-06-09 北京资和信担保有限公司 自组织分布式金融业务系统
CN110704231A (zh) * 2019-09-30 2020-01-17 深圳前海微众银行股份有限公司 一种故障处理方法及装置
CN111181767A (zh) * 2019-12-10 2020-05-19 中国航空工业集团公司成都飞机设计研究所 一种面向复杂系统的监控和故障自愈系统及其方法
CN111563002A (zh) * 2020-05-15 2020-08-21 中国工商银行股份有限公司 交易故障的处理方法和装置、以及电子设备和存储介质
US20200401397A1 (en) * 2019-06-24 2020-12-24 Hartford Fire Insurance Company Intelligent software agent to facilitate software development and operations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727629A (zh) * 2008-10-10 2010-06-09 北京资和信担保有限公司 自组织分布式金融业务系统
US20200401397A1 (en) * 2019-06-24 2020-12-24 Hartford Fire Insurance Company Intelligent software agent to facilitate software development and operations
CN110704231A (zh) * 2019-09-30 2020-01-17 深圳前海微众银行股份有限公司 一种故障处理方法及装置
CN111181767A (zh) * 2019-12-10 2020-05-19 中国航空工业集团公司成都飞机设计研究所 一种面向复杂系统的监控和故障自愈系统及其方法
CN111563002A (zh) * 2020-05-15 2020-08-21 中国工商银行股份有限公司 交易故障的处理方法和装置、以及电子设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114884796A (zh) * 2022-06-16 2022-08-09 中国工商银行股份有限公司 故障处理方法、装置、电子设备及存储介质
CN114884796B (zh) * 2022-06-16 2024-01-30 中国工商银行股份有限公司 故障处理方法、装置、电子设备及存储介质
CN115190008A (zh) * 2022-07-08 2022-10-14 中国建设银行股份有限公司 故障处理方法、故障处理装置、电子设备及存储介质
CN115190008B (zh) * 2022-07-08 2024-05-03 中国建设银行股份有限公司 故障处理方法、故障处理装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US10872034B2 (en) Method, device and computer program product for executing test cases
US8793660B2 (en) Automated testing of programming code for a web service
US20060117091A1 (en) Data logging to a database
US9934135B2 (en) Generic test automation for application programming interface applications
US20110289356A1 (en) Methods and systems for testing methods in a multi-tenant database environment
US11061669B2 (en) Software development tool integration and monitoring
US10310964B2 (en) System and method for determining relevance of application software maintenance
CN113342560A (zh) 一种故障处理方法、系统、电子设备及存储介质
US20230161614A1 (en) Detecting vulnerabilities in configuration code of a cloud environment utilizing infrastructure as code
US20210286614A1 (en) Causality determination of upgrade regressions via comparisons of telemetry data
US20200371902A1 (en) Systems and methods for software regression detection
US9823999B2 (en) Program lifecycle testing
US9032253B2 (en) Integrated testing system utilizing a test script and a test environment created based on the script
CN113238965B (zh) 一种接口测试脚本生成方法、系统及存储介质
CN113191889A (zh) 风控配置方法、配置系统、电子设备及可读存储介质
CN113094081A (zh) 软件发布方法、装置、计算机系统和计算机可读存储介质
CN114253599A (zh) 版本部署方法、版本部署装置、电子设备和存储介质
CN113434382A (zh) 数据库性能监控方法、装置、电子设备及计算机可读介质
CN111290870A (zh) 一种检测异常的方法和装置
US20230221983A1 (en) Techniques for providing third party trust to a cloud computing environment
US20230164174A1 (en) Techniques for lateral movement detecton in a cloud computing environment
CN113157558B (zh) 系统测试方法和装置
US20230161871A1 (en) System and method for detecting excessive permissions in identity and access management
CN117130945B (zh) 一种测试方法和装置
Bachwani et al. Recommending software upgrades with Mojave

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination