CN110287052A - 一种异常任务的根因任务确定方法及装置 - Google Patents

一种异常任务的根因任务确定方法及装置 Download PDF

Info

Publication number
CN110287052A
CN110287052A CN201910554278.6A CN201910554278A CN110287052A CN 110287052 A CN110287052 A CN 110287052A CN 201910554278 A CN201910554278 A CN 201910554278A CN 110287052 A CN110287052 A CN 110287052A
Authority
CN
China
Prior art keywords
task
upstream
relied
abnormal
current goal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910554278.6A
Other languages
English (en)
Other versions
CN110287052B (zh
Inventor
汪洋
王怡然
陈永青
常峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201910554278.6A priority Critical patent/CN110287052B/zh
Publication of CN110287052A publication Critical patent/CN110287052A/zh
Priority to PCT/CN2020/096906 priority patent/WO2020259392A1/zh
Application granted granted Critical
Publication of CN110287052B publication Critical patent/CN110287052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Abstract

本发明公开了一种异常任务的根因任务确定方法及装置,其中方法为:根据预设依赖规则,确定异常任务是否存在所依赖的上游任务;若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务;确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务;若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。上述方法应用于金融科技(Fintech)时,提升了根因任务确定的效率。

Description

一种异常任务的根因任务确定方法及装置
技术领域
本发明涉及金融科技(Fintech)领域和任务执行领域,尤其涉及一种异常任务的根因任务确定方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链(Blockchain)、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变。目前,金融科技领域的任务在执行过程中,在一些场景下,需要执行对数据进行统计、清洗、分析的计算任务,举例来说,大数据平台上,经常需要批量执行大量的计算任务,完成对数据的处理。在执行计算任务的过程中,可能会遇到异常任务,举例来说,一个计算任务出现未在预期时刻正常执行的情况,称为异常任务。由于计算任务之间会存在依赖关系,即一个任务执行会受到另外任务执行结果的约束,因此需要分析排查导致异常任务异常的根因任务。
然而,目前排查根因任务的方式为通过人工分析判断。这种方式需要运维人员有丰富的运维经验,而且当计算任务较多时,各个计算任务的关系错综复杂,人工分析的方式效率较低,且很容易出错。因此,亟需一种高效率、准确的确定根因任务的方法。
发明内容
本申请实施例提供一种异常任务的根因任务确定方法及装置,解决了现有技术中确定根因任务的效率较低,且很容易出错的问题。
第一方面,本申请实施例提供一种异常任务的根因任务确定方法:根据预设依赖规则,确定异常任务是否存在所依赖的上游任务;若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务;确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务;若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。
上述方法中,由于异常任务的所依赖的上游任务是根据预设依赖规则确定的,不易出错,而且确定出的所依赖的上游任务是有选择性的,不需要对所依赖的上游任务之外的任务进行排查,效率更高,另外,如果所述所依赖的上游任务中不存在正在执行或运行错误的任务,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤,从而有选择性的继续根据目标任务排查异常任务的根因任务,通过上述方法极大降低了无效排查工作,提升了根因任务确定的效率。
一种可选实施方式中,所述根据预设依赖规则,确定异常任务是否存在所依赖的上游任务之前,还包括:解析任务调度平台的编排文件,获取所述编排文件中存储的任务编排信息;所述任务编排信息为指示任务依赖关系的信息;根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;所述至少一条数据记录中每条数据记录对应一个任务以及该任务的所依赖的上游任务;根据所述至少一条数据记录,生成所述预设依赖规则。
上述方法下,通过解析任务调度平台的编排文件获取任务编排信息,并根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;从而根据所述至少一条数据记录,生成所述预设依赖规则,通过上述方法可在数据记录生成预设依赖规则,避免了人工编排分析工作。
一种可选实施方式中,所述根据预设依赖规则,确定异常任务是否存在所依赖的上游任务,包括:若所述异常任务的任务类型为事件等待类型,则将与所述事件等待类型的唯一匹配的事件完成类型对应的任务,确定为所述异常任务所依赖的上游任务;若所述异常任务为预定义任务连接中的结束任务,则将所述预定义任务连接中的开始任务,确定为所述异常任务所依赖的上游任务;若所述异常任务为子组任务中的首任务,且所述子组任务存在预定义的子组上游任务,则将所述子组上游任务作为所述异常任务所依赖的上游任务;或者,若所述子组任务不存在预定义的子组上游任务,且所述子组任务所属父组任务存在预定义的父组上游任务,作为所述异常任务所依赖的上游任务。
上述方法下,通过异常任务的任务类型、是否为预定义任务连接中的结束任务、是否为子组任务中的首任务等预设依赖规则,确定出了异常任务的上游任务,从而更细化地确定处理异常任务的上游任务,缩小了确定根因任务的排查范围。
一种可选实施方式中,若所述当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕,则将所述异常任务作为导致所述异常任务未开始执行的根因任务。
上述方法为当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕时,异常任务的根因任务的一种确定方法,也给出了确定异常任务为异常任务本身的一种情况,从而不需要额外排查其它任务。
一种可选实施方式中,所述确定当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务之后,还包括:若存在,则将所述正在执行或运行错误的任务确定为根因任务。
可通过上述方法直接确定根因任务。
一种可选实施方式中,所述确定当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务,包括:按照预设周期,获取所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,根据所述预设周期内该上游任务的日志信息中的关键字信息与预设任务状态规则的匹配结果,确定该上游任务的任务状态。
上述方式为确定至少一个上游任务的任务状态的确定方式,通过对预设周期内,所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,确定该上游任务的状态,由于日志为记录上游任务执行状态的信息,因此上述方法可及时准确的更新上游任务的状态。
第二方面,本申请提供一种异常任务的根因任务确定装置,包括:确定模块,用于根据预设依赖规则,确定异常任务是否存在所依赖的上游任务;处理模块,用于若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务;确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务;若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。
一种可选实施方式中,所述处理模块还用于:解析任务调度平台的编排文件,获取所述编排文件中存储的任务编排信息;所述任务编排信息为指示任务依赖关系的信息;根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;所述至少一条数据记录中每条数据记录对应一个任务以及该任务的所依赖的上游任务;根据所述至少一条数据记录,生成所述预设依赖规则。
一种可选实施方式中,所述确定模块具体用于:若所述异常任务的任务类型为事件等待类型,则将与所述事件等待类型的唯一匹配的事件完成类型对应的任务,确定为所述异常任务所依赖的上游任务;若所述异常任务为预定义任务连接中的结束任务,则将所述预定义任务连接中的开始任务,确定为所述异常任务所依赖的上游任务;若所述异常任务为子组任务中的首任务,且所述子组任务存在预定义的子组上游任务,则将所述子组上游任务作为所述异常任务所依赖的上游任务;或者,若所述子组任务不存在预定义的子组上游任务,且所述子组任务所属父组任务存在预定义的父组上游任务,作为所述异常任务所依赖的上游任务。
一种可选实施方式中,所述处理模块还用于:若存在,则将所述正在执行或运行错误的任务确定为根因任务。
一种可选实施方式中,所述处理模块还用于:按照预设周期,获取所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,根据所述预设周期内该上游任务的日志信息中的关键字信息与预设任务状态规则的匹配结果,确定该上游任务的任务状态。
一种可选实施方式中,所述处理模块还用于:若所述当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕,则将所述异常任务作为导致所述异常任务未开始执行的根因任务。
上述第二方面及第二方面各个实施例的有益效果,可以参考上述第一方面及第一方面各个实施例的有益效果,这里不再赘述。
第三方面,本申请实施例提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施例的方法。
第四方面,本申请实施例提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施例的方法。
附图说明
图1为本申请实施例提供的一种异常任务的根因任务确定方法的步骤流程示意图;
图2为本申请实施例提供的一种异常任务的根因任务确定方法中确定上游任务的步骤流程示意图;
图3为本申请实施例中提供的一种异常任务的根因任务确定方法中任务之间依赖关系的示意图;
图4为本申请实施例中提供的一种异常任务的根因任务确定装置的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互结合。
金融科技(Fintech)领域中,需要调度大量的计算任务,以完成金融交易的过程。金融科技的任务可以在多个平台上调度执行,举例来说,大数据平台(bigdata platform,BDP)。大数据平台中,计算任务有多种,如批量任务:指在大数据平台上执行的、对数据进行统计、清洗、分析的计算作业。大数据平台中还有调度平台,调度平台指用来编排、调度大数据平台上批量任务的执行、重新执行、跳过的一个客户端工具。编排文件:用来定义每个批量任务的所属分组、作业类型、具体执行的指令,以及在调度平台上所处的位置,调度平台会根据编排文件内容,在客户端界面里进行展示和控制。服务等级协议(SLA),是在一定开销下为保障服务的性能和可靠性,服务提供商与用户间定义的一种双方认可的协定,包含了对服务有效性的保障,譬如对故障解决时间、服务超时等的保证。由于计算任务之间会存在依赖关系,即一个任务执行会受到另外任务执行结果的约束,因此需要分析排查导致异常任务异常的根因任务。
然而,目前排查根因任务的方式为通过人工分析判断。这种方式需要运维人员有丰富的运维经验,而且当计算任务较多时,各个计算任务的关系错综复杂,人工分析的方式效率较低,且很容易出错。
为此,本申请提出一种高效率、准确的确定根因任务的方法。如图1所示,为本申请实施例提供的一种异常任务的根因任务确定方法的步骤流程示意图。
步骤101:根据预设依赖规则,确定异常任务是否存在所依赖的上游任务。
步骤102:若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务。
步骤103:确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务。
步骤104:若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。
步骤101中,所依赖的上游任务的定义如下:
若N个第一任务和第二任务同时满足以下条件(1)和(2),N为正整数,则称N个第一任务为第二任务所依赖的上游任务:(1)N个第一任务中任一第一任务执行成功完毕之前,均不能执行第二任务;(2)N个第一任务全部执行成功完毕后,触发第二任务的执行。需要说明的是,本申请中所依赖的上游任务的定义不具有传递性,第一任务所依赖的上游任务并不是第二上游任务所依赖的上游任务。相应地,第二任务也可以称为N个第一任务中任一第一任务的下游任务。此时,也称第二任务与N个第一任务中存在上下游关系。
另外,未开始执行指在预设时刻未处于正在执行状态。
以大数据平台为例,可通过如图2所示的流程,确定异常任务的所依赖的上游任务,如图2所示,为本申请实施例提供的一种异常任务的根因任务确定方法中确定上游任务的步骤流程示意图。
步骤201:解析任务调度平台的编排文件,获取所述编排文件中存储的任务编排信息。
步骤201可通过shell语言来解析。所述任务编排信息为指示任务依赖关系的信息。
步骤202:根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录。
所述至少一条数据记录中每条数据记录对应一个任务以及该任务的所依赖的上游任务。举例来说,步骤202中,将所述任务编排信息转化为至少一条数据记录时,可将可扩展标记语言(xml)格式中存储的预定义任务关系,和任务定义信息拼接成结构化查询语言(structured query language,SQL)的插入(insert)语句,导入到mysql数据库中。
步骤203:根据所述至少一条数据记录,生成所述预设依赖规则。
将分解出的预定义任务关系,任务定义信息,存入到数据库中,在数据库的存储过程中,根据预设依赖规则,确定异常任务所依赖的上游任务。
上述方法下,通过解析任务调度平台的编排文件获取任务编排信息,并根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;从而根据所述至少一条数据记录,生成所述预设依赖规则,通过上述方法可在数据记录生成预设依赖规则,避免了人工编排分析工作。
步骤101中,根据预设依赖规则,确定异常任务是否存在所依赖的上游任务的一种可选实施方式可以如下,包括:
(1)若所述异常任务的任务类型为事件等待类型,则将与所述事件等待类型的唯一匹配的事件完成类型对应的任务,确定为所述异常任务所依赖的上游任务。
举例来说,事件等待类型的任务A和事件完成类型的任务B为预先定义的一对匹配的任务,任务B成功执行完毕后,就会触发任务A执行。触发方式不限,举例来说可以通过等待信号来触发。
(2)若所述异常任务为预定义任务连接中的结束任务,则将所述预定义任务连接中的开始任务,确定为所述异常任务所依赖的上游任务。
预定义任务连接中定义了开始任务和结束任务,开始任务为结束任务的上游任务。举例来说,连接L定义了开始任务L1以及结束任务L2,当异常任务为结束任务L2时,那么L1就是异常任务的一个上游任务。
(3)若所述异常任务为子组任务中的首任务,且所述子组任务存在预定义的子组上游任务,则将所述子组上游任务作为所述异常任务所依赖的上游任务;或者,若所述子组任务不存在预定义的子组上游任务,且所述子组任务所属父组任务存在预定义的父组上游任务,作为所述异常任务所依赖的上游任务。
需要说明的是,子组任务为多个存在上游任务关系的任务组,子组任务可以为父组任务的一个任务单位,一个父组任务中,子组任务之间也存在上下游关系。举例来说,任务C1的上游任务为任务C2和任务C3,任务C2的上游任务为C4,那么C1、C2、C3、C4的组合就是一个子组任务。子组任务的首任务为,满足以下条件的任务:(1)该任务是子组任务中一个任务的上游任务。(2)该任务无上游任务。(3)该任务的下游任务的上游任务有且仅有一个,且为该任务。
上述方法下,通过异常任务的任务类型、是否为预定义任务连接中的结束任务、是否为子组任务中的首任务等预设依赖规则,确定出了异常任务的上游任务,从而更细化地确定处理异常任务的上游任务,缩小了确定根因任务的排查范围。
一种可选实施方式中,若所述当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕,则将所述异常任务作为导致所述异常任务未开始执行的根因任务。
上述方法为当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕时,异常任务的根因任务的一种确定方法,也给出了确定异常任务为异常任务本身的一种情况,从而不需要额外排查其它任务。
步骤102~步骤104中,需要获取当前的目标任务所依赖的上游任务的状态,可以按照以下方式获取当前的目标任务所依赖的任务状态:
按照预设周期,获取所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,根据所述预设周期内该上游任务的日志信息中的关键字信息与预设任务状态规则的匹配结果,确定该上游任务的任务状态。
上述方式为确定至少一个上游任务的任务状态的确定方式,通过对预设周期内,所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,确定该上游任务的状态,由于日志为记录上游任务执行状态的信息,因此上述方法可及时准确的更新上游任务的状态。
具体来说,按照五分钟的预设周期,在批量服务器上抓取各任务日志的更新时间,结合日志信息中的关键词,判断任务当前的各种状态:包括批量日、运行状态(成功执行完毕,运行错误,未开始执行等)、任务启动/结束时间、运行时长等。再以各任务为最小基准单元,向上回溯任务所在子组任务,子组所在父组任务,根据内建逻辑计算其相应状态;整个分析过程相对独立,支持任务在正常运行,单个重新运行。
步骤102~步骤104中,确定异常任务的根因任务的方式还有以下两种:
第一种:若当前的目标任务所依赖的上游任务中存在正在执行或运行错误的上游任务,则将正在执行或运行错误的上游任务作为异常任务的根因任务。
上述方法下,指示出了导致所述异常任务未开始执行的根因任务的一种情况。
第二种,若当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕,则将所述异常任务作为导致所述异常任务未开始执行的根因任务。
上述方法为当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕时,异常任务的根因任务的一种确定方法,也给出了确定异常任务为异常任务本身的一种情况,从而不需要额外排查其它任务。
下面结合图3具体说明,本申请实施例提供的一种异常任务的根因任务确定方法。如图3所示,为本申请实施例中提供的一种异常任务的根因任务确定方法中任务之间依赖关系的示意图。
假定任务K1有2个上游任务:任务K2、任务K3,而任务K3又有2个上游任务:任务K4、任务K5。任务K1能正常开始执行的前提条件是其所有上游任务包括任务K2、任务K3都已正常完成。当K1到预设时刻未开始执行,说明可能受上游任务的影响,则:
第一步、代入任务K1的信息,查出其最近一层的上游任务,包括任务K2和任务K3,其中任务K2成功执行完毕,任务K3未正常开始,说明是任务K3的上游任务或任务K3上存在问题。
第二步、查询任务K3的上游任务情况。而任务K3的上游任务中任务K4成功执行完毕,任务K5显示运行错误,显然任务K5是导致任务K1未开始执行的根因任务。
第三步、显示查询结果为任务K5,运维人员即可直接排查任务K5的异常原因,进而解决问题。
此时获取到的任务K5,即为影响了下游任务未正常执行的根因任务,只需针对任务K5进行直接处理即可。如任务K5正处于正在运行状态,可查看执行时长、日志来分析是否因代码更新导致任务效率变化,或因上游推送数据偶发增量导致;如执行出错,可根据日志记录定位到出错原因;如异常为外部的信号等待超时,可根据任务名称或描述直接判断出负责方,联系其确认信号延迟原因即可。结合此技术,配合微信、邮件等监控提示,便可清晰地直击问题根因,省下逐层分析判断的时间。
本申请通过技术手段,自动解析编排文件,将界面看到的上下游,转化成代码可识别的依赖关系,并按层级回溯、遍历其上游所有任务的状态,直到找到其最上游未正常结束的任务,即可定位为影响异常任务的根因任务。通过人工梳理的依赖任务清单,可以模糊定位到当前异常任务可能受哪几个上游任务影响,再通过客户端页面,进行人工查询,找到影响因素。
上述方法中,由于异常任务的至少一个上游任务是根据预设依赖规则确定的,不易出错,而且确定出的至少一个上游任务是有选择性的,不需要对至少一个上游任务之外的任务进行排查,效率更高,另外,如果所述至少一个上游任务中存在第一上游任务,则将导致所述第一上游任务未开始执行的根因任务,确定为导致所述异常任务未开始执行的根因任务,从而有选择性的继续根据上游任务排查异常任务的根因任务,通过上述方法极大降低了无效排查工作,提升了根因任务确定的效率。
如图4所示,为本申请实施例中提供的一种异常任务的根因任务确定装置的结构示意图。
本申请提供一种异常任务的根因任务确定装置,包括:确定模块401,用于根据预设依赖规则,确定异常任务是否存在所依赖的上游任务;处理模块402,用于若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务;确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务;若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。
一种可选实施方式中,所述处理模块402还用于:解析任务调度平台的编排文件,获取所述编排文件中存储的任务编排信息;所述任务编排信息为指示任务依赖关系的信息;根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;所述至少一条数据记录中每条数据记录对应一个任务以及该任务的所依赖的上游任务;根据所述至少一条数据记录,生成所述预设依赖规则。
一种可选实施方式中,所述确定模块401具体用于:若所述异常任务的任务类型为事件等待类型,则将与所述事件等待类型的唯一匹配的事件完成类型对应的任务,确定为所述异常任务所依赖的上游任务;若所述异常任务为预定义任务连接中的结束任务,则将所述预定义任务连接中的开始任务,确定为所述异常任务所依赖的上游任务;若所述异常任务为子组任务中的首任务,且所述子组任务存在预定义的子组上游任务,则将所述子组上游任务作为所述异常任务所依赖的上游任务;或者,若所述子组任务不存在预定义的子组上游任务,且所述子组任务所属父组任务存在预定义的父组上游任务,作为所述异常任务所依赖的上游任务。
一种可选实施方式中,所述处理模块402还用于:若存在,则将所述正在执行或运行错误的任务确定为根因任务。
一种可选实施方式中,所述处理模块402还用于:按照预设周期,获取所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,根据所述预设周期内该上游任务的日志信息中的关键字信息与预设任务状态规则的匹配结果,确定该上游任务的任务状态。
一种可选实施方式中,所述处理模块402还用于:若所述当前的目标任务所依赖的上游任务的任务状态均为成功执行完毕,则将所述异常任务作为导致所述异常任务未开始执行的根因任务。
本申请实施例提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的异常任务的根因任务确定的方法及可选方法。
本申请实施例提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的异常任务的根因任务确定的方法及可选方法。
最后应说明的是:本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (12)

1.一种异常任务的根因任务确定方法,其特征在于,包括:
根据预设依赖规则,确定异常任务是否存在所依赖的上游任务;
若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务;
确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务;
若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。
2.如权利要求1所述的方法,其特征在于,所述根据预设依赖规则,确定异常任务是否存在所依赖的上游任务之前,还包括:
解析任务调度平台的编排文件,获取所述编排文件中存储的任务编排信息;所述任务编排信息为指示任务依赖关系的信息;
根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;所述至少一条数据记录中每条数据记录对应一个任务以及该任务的所依赖的上游任务;
根据所述至少一条数据记录,生成所述预设依赖规则。
3.如权利要求1所述的方法,其特征在于,所述根据预设依赖规则,确定异常任务是否存在所依赖的上游任务,包括:
若所述异常任务的任务类型为事件等待类型,则将与所述事件等待类型的唯一匹配的事件完成类型对应的任务,确定为所述异常任务所依赖的上游任务;
若所述异常任务为预定义任务连接中的结束任务,则将所述预定义任务连接中的开始任务,确定为所述异常任务所依赖的上游任务;
若所述异常任务为子组任务中的首任务,且所述子组任务存在预定义的子组上游任务,则将所述子组上游任务作为所述异常任务所依赖的上游任务;或者,若所述子组任务不存在预定义的子组上游任务,且所述子组任务所属父组任务存在预定义的父组上游任务,作为所述异常任务所依赖的上游任务。
4.如权利要求1-3任一所述的方法,其特征在于,所述确定当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务之后,还包括:
若存在,则将所述正在执行或运行错误的任务确定为根因任务。
5.如权利要求1-3任一所述的方法,其特征在于,所述确定当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务,包括:
按照预设周期,获取所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,根据所述预设周期内该上游任务的日志信息中的关键字信息与预设任务状态规则的匹配结果,确定该上游任务的任务状态。
6.一种异常任务的根因任务确定装置,其特征在于,包括:
确定模块,用于根据预设依赖规则,确定异常任务是否存在所依赖的上游任务;
处理模块,用于若所述异常任务存在所依赖的上游任务,则将所述异常任务作为当前的目标任务;确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务;若不存在,则将所述当前的目标任务所依赖的上游任务中未开始执行的任务重新作为所述当前的目标任务,以对所述当前的目标任务进行更新,并返回执行所述确定所述当前的目标任务所依赖的上游任务中是否存在正在执行或运行错误的任务的步骤。
7.如权利要求6所述的装置,其特征在于,所述处理模块还用于:
解析任务调度平台的编排文件,获取所述编排文件中存储的任务编排信息;所述任务编排信息为指示任务依赖关系的信息;根据所述任务编排信息中指示的任务依赖关系,将所述任务编排信息转化为至少一条数据记录;所述至少一条数据记录中每条数据记录对应一个任务以及该任务的所依赖的上游任务;根据所述至少一条数据记录,生成所述预设依赖规则。
8.如权利要求6所述的装置,其特征在于,所述确定模块具体用于:
若所述异常任务的任务类型为事件等待类型,则将与所述事件等待类型的唯一匹配的事件完成类型对应的任务,确定为所述异常任务所依赖的上游任务;
若所述异常任务为预定义任务连接中的结束任务,则将所述预定义任务连接中的开始任务,确定为所述异常任务所依赖的上游任务;
若所述异常任务为子组任务中的首任务,且所述子组任务存在预定义的子组上游任务,则将所述子组上游任务作为所述异常任务所依赖的上游任务;或者,若所述子组任务不存在预定义的子组上游任务,且所述子组任务所属父组任务存在预定义的父组上游任务,作为所述异常任务所依赖的上游任务。
9.如权利要求6-8任一所述的装置,其特征在于,所述处理模块还用于:
若存在,则将所述正在执行或运行错误的任务确定为根因任务。
10.如权利要求6-8任一所述的装置,其特征在于,所述处理模块还用于:
按照预设周期,获取所述当前的目标任务所依赖的上游任务中每个上游任务的日志信息中的关键字信息,根据所述预设周期内该上游任务的日志信息中的关键字信息与预设任务状态规则的匹配结果,确定该上游任务的任务状态。
11.一种计算机设备,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至5中任意一项所述的方法被执行。
12.一种存储介质,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至5中任意一项所述的方法被执行。
CN201910554278.6A 2019-06-25 2019-06-25 一种异常任务的根因任务确定方法及装置 Active CN110287052B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910554278.6A CN110287052B (zh) 2019-06-25 2019-06-25 一种异常任务的根因任务确定方法及装置
PCT/CN2020/096906 WO2020259392A1 (zh) 2019-06-25 2020-06-18 一种异常任务的根因任务确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910554278.6A CN110287052B (zh) 2019-06-25 2019-06-25 一种异常任务的根因任务确定方法及装置

Publications (2)

Publication Number Publication Date
CN110287052A true CN110287052A (zh) 2019-09-27
CN110287052B CN110287052B (zh) 2022-01-28

Family

ID=68005564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910554278.6A Active CN110287052B (zh) 2019-06-25 2019-06-25 一种异常任务的根因任务确定方法及装置

Country Status (2)

Country Link
CN (1) CN110287052B (zh)
WO (1) WO2020259392A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111290911A (zh) * 2020-01-21 2020-06-16 上海悦易网络信息技术有限公司 一种用于检测移动终端任务的方法及设备
CN111859403A (zh) * 2020-07-30 2020-10-30 中国工商银行股份有限公司 依赖关系漏洞的确定方法、装置、电子设备及存储介质
WO2020259392A1 (zh) * 2019-06-25 2020-12-30 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN112749034A (zh) * 2019-10-31 2021-05-04 北京沃东天骏信息技术有限公司 一种数据异常处理方法、装置、存储介质及电子设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667383B (zh) * 2020-12-31 2024-02-09 北京高途云集教育科技有限公司 一种任务执行及调度方法、系统、装置、计算设备及介质
CN112990766B (zh) * 2021-04-16 2023-10-20 成都数之联科技股份有限公司 一种产品搬送路径中不良根因设备的确定方法、系统、装置及介质
CN113238838B (zh) * 2021-04-22 2023-01-24 中国银联股份有限公司 一种任务调度方法、装置及计算机可读存储介质
CN115378792A (zh) * 2021-05-18 2022-11-22 腾讯云计算(北京)有限责任公司 告警处理方法、装置及存储介质
CN113347033B (zh) * 2021-05-31 2022-05-27 中国工商银行股份有限公司 基于区块链的根因定位方法、系统及验证节点
CN113590579A (zh) * 2021-06-22 2021-11-02 微梦创科网络科技(中国)有限公司 一种基于数据仓库的根因分析方法、装置及系统
CN113918937B (zh) * 2021-09-10 2023-07-18 广州博依特智能信息科技有限公司 一种基于大数据的非法事件识别方法及系统
CN113886122B (zh) * 2021-09-30 2024-03-01 济南浪潮数据技术有限公司 一种系统运行异常处理方法、装置、设备及存储介质
CN114168275B (zh) * 2021-10-28 2022-10-18 厦门国际银行股份有限公司 任务调度方法、系统、终端设备及存储介质
CN116224400B (zh) * 2023-03-03 2024-01-02 博泰车联网(南京)有限公司 一种定位分析方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034554A (zh) * 2012-12-30 2013-04-10 焦点科技股份有限公司 一种纠错重启以及自动判断启动的etl调度系统及方法
CN104272266A (zh) * 2012-09-03 2015-01-07 株式会社日立制作所 对具有多个监视对象器件的计算机系统进行管理的管理系统
CN104965754A (zh) * 2015-03-31 2015-10-07 腾讯科技(深圳)有限公司 任务调度方法及任务调度装置
US20160026542A1 (en) * 2014-07-22 2016-01-28 Cisco Technology Inc. Pre-Computation of Backup Topologies in Computer Networks
CN105653419A (zh) * 2014-11-11 2016-06-08 阿里巴巴集团控股有限公司 基于监控点的溯源实现方法及系统
CN107608774A (zh) * 2017-09-08 2018-01-19 新智云数据服务有限公司 一种任务调度方法、装置、设备及存储介质
CN107870948A (zh) * 2016-09-28 2018-04-03 平安科技(深圳)有限公司 任务调度方法和装置
CN109558292A (zh) * 2017-09-26 2019-04-02 阿里巴巴集团控股有限公司 一种监控方法及装置
CN109614400A (zh) * 2018-11-30 2019-04-12 深圳前海微众银行股份有限公司 失败任务的影响及溯源分析方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108958920B (zh) * 2018-07-13 2021-04-06 众安在线财产保险股份有限公司 一种分布式任务调度方法及系统
CN110287052B (zh) * 2019-06-25 2022-01-28 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104272266A (zh) * 2012-09-03 2015-01-07 株式会社日立制作所 对具有多个监视对象器件的计算机系统进行管理的管理系统
CN103034554A (zh) * 2012-12-30 2013-04-10 焦点科技股份有限公司 一种纠错重启以及自动判断启动的etl调度系统及方法
US20160026542A1 (en) * 2014-07-22 2016-01-28 Cisco Technology Inc. Pre-Computation of Backup Topologies in Computer Networks
CN105653419A (zh) * 2014-11-11 2016-06-08 阿里巴巴集团控股有限公司 基于监控点的溯源实现方法及系统
CN104965754A (zh) * 2015-03-31 2015-10-07 腾讯科技(深圳)有限公司 任务调度方法及任务调度装置
CN107870948A (zh) * 2016-09-28 2018-04-03 平安科技(深圳)有限公司 任务调度方法和装置
CN107608774A (zh) * 2017-09-08 2018-01-19 新智云数据服务有限公司 一种任务调度方法、装置、设备及存储介质
CN109558292A (zh) * 2017-09-26 2019-04-02 阿里巴巴集团控股有限公司 一种监控方法及装置
CN109614400A (zh) * 2018-11-30 2019-04-12 深圳前海微众银行股份有限公司 失败任务的影响及溯源分析方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020259392A1 (zh) * 2019-06-25 2020-12-30 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN112749034A (zh) * 2019-10-31 2021-05-04 北京沃东天骏信息技术有限公司 一种数据异常处理方法、装置、存储介质及电子设备
CN111290911A (zh) * 2020-01-21 2020-06-16 上海悦易网络信息技术有限公司 一种用于检测移动终端任务的方法及设备
CN111859403A (zh) * 2020-07-30 2020-10-30 中国工商银行股份有限公司 依赖关系漏洞的确定方法、装置、电子设备及存储介质
CN111859403B (zh) * 2020-07-30 2023-09-05 中国工商银行股份有限公司 依赖关系漏洞的确定方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2020259392A1 (zh) 2020-12-30
CN110287052B (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN110287052A (zh) 一种异常任务的根因任务确定方法及装置
CN106156186B (zh) 一种数据模型管理装置、服务器及数据处理方法
CN103150249B (zh) 一种自动化测试的方法和系统
US20090271351A1 (en) Rules engine test harness
CN107506451A (zh) 用于数据交互的异常信息监控方法及装置
CN100461130C (zh) 测试软件应用的方法
WO2019006654A1 (zh) 金融自助设备维修派单生成方法、手持终端及电子设备
WO2013140608A1 (ja) イベントの根本原因の解析を支援する方法及びシステム
CN112394922A (zh) 决策配置方法、业务决策方法和决策引擎系统
CN111400011B (zh) 一种实时任务调度方法、系统、设备及可读存储介质
US20130227528A1 (en) Paradigm for concurrency testcase generation
CN104021080A (zh) 基于自定义脚本的自动化测试系统
CN108491254A (zh) 一种数据仓库的调度方法及装置
CN109634843A (zh) 一种面向ai芯片平台的分布式自动化软件测试方法及平台
CN105677465B (zh) 应用于银行跑批处理的数据处理方法及装置
CN110221905A (zh) 定时任务监测方法、装置、系统、设备和存储介质
CN101286212A (zh) 业务流程执行方法、业务流程引擎及其部署方法
CN109344189A (zh) 一种基于NiFi的大数据计算方法及装置
CN116719622A (zh) 业务流程的编排方法及业务流程编排系统
CN113641739B (zh) 一种基于Spark的智能数据转换方法
CN115658246A (zh) 调度引擎中间件数据处理方法
CN115525406A (zh) 一种分布式异步任务调度系统
CN109284331A (zh) 基于业务数据资源的制证信息获取方法、终端设备及介质
CN101256491B (zh) 基于工作流的可信软件过程的定义方法
CN114116900A (zh) 一种基于mdd模型的高效交易系统及开发方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant