CN106547613B - 任务处理流程的调度及故障恢复方法 - Google Patents

任务处理流程的调度及故障恢复方法 Download PDF

Info

Publication number
CN106547613B
CN106547613B CN201610915259.8A CN201610915259A CN106547613B CN 106547613 B CN106547613 B CN 106547613B CN 201610915259 A CN201610915259 A CN 201610915259A CN 106547613 B CN106547613 B CN 106547613B
Authority
CN
China
Prior art keywords
task
state
job
tasks
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610915259.8A
Other languages
English (en)
Other versions
CN106547613A (zh
Inventor
谷建华
周兴社
王云岚
侯正雄
兰学渊
郝莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201610915259.8A priority Critical patent/CN106547613B/zh
Publication of CN106547613A publication Critical patent/CN106547613A/zh
Application granted granted Critical
Publication of CN106547613B publication Critical patent/CN106547613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/481Exception handling

Abstract

本发明公开了一种任务处理流程的调度及故障恢复方法,用于解决现有流程控制方法在执行批量任务时效率低的技术问题。技术方案是由用户建立流程描述文件,描述作业流程中每一个任务的次序关系和运行需要的资源等信息,将作业描述文件提交由流程控制软件处理和调度执行。流程调度软件通过描述文件为任务程序准备好程序执行所需要的资源,对任务程序的执行状态进行监控,将任务状态的变化实时更新到分布式数据库中。这样,在流程恢复时,只需要查询数据库就能够将流程恢复到异常前的正常状态,避免了文件检索等复杂耗时的操作,提高了执行批量任务时的效率。

Description

任务处理流程的调度及故障恢复方法
技术领域
本发明属于计算机自动化流程控制和处理领域,具体涉及一种任务处理流程的调度及故障恢复方法。
背景技术
作业流程执行的自动化是计算机流程调度领域的一个重要目标,准确的对作业中的不同任务步骤进行调度,在流程执行出错后对执行错误的任务做出快速响应,在物理机或软件发生故障迫使流程执行暂停后可以保存任务执行状态的信息,故障排除后可以迅速的恢复作业和任务的执行状态,这些都具有非常重要的现实意义。
传统的流程调度方法同样依托于流程调度软件来执行。对于传统流程调度方法的一大缺陷是,如果在流程执行过程中,流程某一个任务执行出错,或是流程执行软件奔溃死锁,运行此软件的物理机断电或者死机,就会使流程阻塞在当前状态下无法继续向下执行。
文献“申请公开号是CN101159605A的中国发明专利”公开了一种可实现状态记忆和恢复的流程控制方法,该方法是针对传统的流程调度的改进方法,将任务执行的时序状态实时的写入文件中,流程控制软件在从计算机断电或软件异常退出的情况下恢复后查找之前保存的任务文件,对文件进行搜索,恢复到异常之前的状态。
但是这种依托于文件的方法在批量任务执行时的效率会变得很差,尤其是当任务量较大时,需要频繁的向文件写入任务的状态更新,在异常恢复时,由于检索文件只能使用顺序检索的方式,当文件中记录的状态变化过多时,对文件内容的查找也会影响异常恢复的时效性,在执行大规模任务时过多的文件读写严重影响着这种方法的吞吐量。
发明内容
为了克服现有流程控制方法在执行批量任务时效率低的不足,本发明提供一种任务处理流程的调度及故障恢复方法。该方法由用户建立流程描述文件,描述作业流程中每一个任务的次序关系和运行需要的资源等信息,将作业描述文件提交由流程控制软件处理和调度执行。流程调度软件通过描述文件为任务程序准备好程序执行所需要的资源,对任务程序的执行状态进行监控,将任务状态的变化实时更新到分布式数据库中。这样,在流程恢复时,只需要查询数据库就能够将流程恢复到异常前的正常状态,避免了文件检索等复杂耗时的操作,提高了执行批量任务时的效率。
本发明解决其技术问题所采用的技术方案:一种任务处理流程的调度及故障恢复方法,其特点是包括以下步骤:
步骤一、执行调度任务时,对于由多个任务构成的一个流程定义为一个作业,作业进一步抽象为一个DAG图。流程调度模块加载作业信息对所述作业进行调度,并使用数据库保存一个作业中各任务的关键信息,在系统发生意外宕机的情况时依据保存的信息快速定位作业中尚未完成的任务,并根据其执行状态恢复调度现场,完成作业的快速恢复,重新调度,继续执行中断的任务。
在流程调度模块接收到一个新的作业之后对此作业进行分析,将作业的信息由DAG图转化为表结构存储在数据库中。
对于任一作业,将作业中的任务唯一的转化为表项保存在数据库中,同时保证其结构不变。同样的,根据数据库中保存的记录还原作业DAG图。将作业保存到数据库中。
步骤二、流程调度模块获取作业的信息,针对一个作业中的不同任务,在不同的物理节点进行执行,流程调度模块将对此进行判定,将任务发往相应物理节点的任务执行模块进行处理执行。
对于初次提交的作业,流程调度模块通过数据库获取作业的信息,取出作业中应最先执行的任务,将其加入预备执行队列中。
针对预备执行队列中的任务,流程调度模块将其依次从队列中取出,根据其中保存的信息将任务依次发往对应的任务执行模块执行。。
步骤三、任务到达执行节点后,任务执行模块为其分配节点的计算资源和数据。完成预定的任务后任务执行模块将计算结果和任务运行的状态信息一并返回给流程调度模块。
流程调度模块接收任务执行模块发出的消息,消息包含任务状态的更新,流程调度模块根据获得的状态更新决定接下来要执行的任务。
若收到一条任务状态更新的消息,首先更新数据库中此任务的状态表项,将其状态更新为收到的新状态,并根据此次的状态变化判断其后继节点是否满足参与调度的条件。若存在一个后继节点,其前驱节点均成功执行完成,那么此后继任务满足参与调度的条件,将其状态更新为准备执行,加入预备执行队列中。
步骤四、故障恢复时,一个作业由若干个任务组成,一个作业对应一个DAG图,DAG图由节点和节点之间的有向边构成。作业DAG图中的每个节点解释为一个任务,作业DAG图中每条有向边解释为任务的前驱节点和后继节点关系。作业信息中作业标识信息唯一,用于区分不同的作业;状态信息描述作业的运行状态,是任务调度的结果。作业要经历的状态有已提交、调度中、已完成,作业出错或发生异常时,进入错误状态。
任务信息中作业标识信息和任务标识信息组合用于区分不同作业中的不同任务;状态信息描述任务的运行状态,调度模块根据任务的状态以及任务间先后关系进行调度。一般任务会经历已提交、调度中、运行中和完成状态,任务出错或发生意外时,进入错误状态。前驱节点和后继节点记录了作业DAG图中该任务节点相关两条边指向的节点。任务的前驱节点指任务必须在前驱结点任务结束后才能开始,任务的后继节点指当前任务结束后,其后继节点任务才能开始。
在调度程序启动时,恢复工作被首先执行,通过检索数据库,判断每个任务的运行状态,重新构建作业运行时DAG图,完成故障恢复操作。
本发明的有益效果是:该方法由用户建立流程描述文件,描述作业流程中每一个任务的次序关系和运行需要的资源等信息,将作业描述文件提交由流程控制软件处理和调度执行。流程调度软件通过描述文件为任务程序准备好程序执行所需要的资源,对任务程序的执行状态进行监控,将任务状态的变化实时更新到分布式数据库中。这样,在流程恢复时,只需要查询数据库就能够将流程恢复到异常前的正常状态,避免了文件检索等复杂耗时的操作,提高了执行批量任务时的效率。本发明基于消息模式对流程进行调度,同时将作业流程中任务执行的每一步都保存在高可靠的分布式数据库中,依据数据库中任务的状态来驱动作业的调度,执行高效。在系统发生宕机等意外情况时依据数据库中保存的信息可以快速定位尚未完成的作业流程,并根据执行状态恢复调度现场,执行重新调度,相比使用扁平的文件保存信息在时效性、可靠性和吞吐量上有显著的提升,可实现在几百毫秒的级别快速定位和恢复异常流程。
下面结合附图和具体实施方式对本发明作详细说明。
附图说明
图1是本发明任务处理流程的调度及故障恢复方法中任务处理流程的调度流程图。
图2是本发明任务处理流程的调度及故障恢复方法中任务处理流程的故障恢复流程图。
具体实施方式
参照图1-2。本发明任务处理流程的调度及故障恢复方法具体步骤如下:
1.调度方法技术方案
1)对于由多个任务构成的一个流程将其定义为一个作业,作业必须可以进一步抽象为一个DAG图(Direct Acyclic Graph,有向无环图)。流程调度模块加载作业信息对此作业进行调度,并使用数据库保存一个作业中各任务的关键信息,在系统发生意外宕机等情况时依据保存的信息可以快速定位作业中尚未完成的任务,并根据其执行状态恢复调度现场,完成作业的快速恢复,重新调度,继续执行中断的任务,以此来保证任务执行的可靠性。
2)流程调度模块获取作业的信息,针对一个作业中的不同任务,可能在不同的物理节点进行执行,流程调度模块将对此进行判定,将任务发往相应物理节点的任务执行模块进行处理执行。
3)任务到达执行节点后,任务执行模块为其分配节点的计算资源和数据。完成预定的任务后任务执行模块将计算结果和任务运行的状态信息一并返回给流程调度模块。
根据权利要求1所述的任务流程调度及故障恢复方法,其特征在于,所述步骤1)包含以下进一步的处理:
11)在流程调度模块接收到一个新的作业之后对此作业进行分析,将作业的信息由DAG图转化为表结构存储在数据库中。
12)对于任一作业可以将作业中的任务唯一的转化为表项保存在数据库中,同时保证其结构不变。同样的,可以根据数据库中保存的记录还原作业DAG图。将作业保存到数据库中后进入步骤2)。
对于所述步骤2)包含以下进一步的处理:
21)对于初次提交的作业,流程调度模块通过数据库获取作业的信息,取出作业中应最先执行的任务,将其加入预备执行队列中。
22)针对预备执行队列中的任务,流程调度模块将其依次从队列中取出,根据其中保存的信息将任务依次发往对应的任务执行模块执行。进入步骤3)。
对于所述步骤3)包含以下进一步的处理:
31)流程调度模块接收任务执行模块发出的消息,消息包含任务状态的更新,流程调度模块根据获得的状态更新决定接下来要执行的任务。
32)若收到一条任务状态更新的消息,首先更新数据库中此任务的状态表项,将其状态更新为收到的新状态,并根据此次的状态变化判断其后继节点是否满足参与调度的条件。若存在一个后继节点,其前驱节点均成功执行完成,那么此后继任务满足参与调度的条件,将其状态更新为准备执行,加入预备执行队列中。
2.恢复方法技术方案。
通常一个作业由若干个任务组成,一个作业对应一个DAG图,DAG图由节点和节点之间的有向边构成。作业DAG图中的每个节点解释为一个任务,作业DAG图中每条有向边解释为任务的前驱节点、后继节点关系。作业信息中作业标识信息唯一,用于区分不同的作业;状态信息描述作业的运行状态,是任务调度的结果。一般来说,作业要经历的状态有已提交、调度中、已完成,作业出错或发生异常时,进入错误状态。
任务信息中作业标识信息和任务标识信息组合用于区分不同作业中的不同任务;状态信息描述任务的运行状态,调度模块根据任务的状态以及任务间先后关系进行调度。一般任务会经历的状态有已提交、调度中、运行中、完成等,任务出错或发生意外时,进入错误状态。前驱节点和后继节点记录了作业DAG图中该任务节点相关两条边指向的节点。任务的前驱节点指任务必须在前驱结点任务结束后才能开始,任务的后继节点指当前任务结束后,其后继节点任务才能开始。
在调度程序启动时,恢复工作被首先执行,通过检索数据库,判断每个任务的运行状态,重新构建作业运行时DAG图,即可完成恢复操作。
具体的,将流程调度模块接收到的状态变化同步到数据库中,当系统发送故障如物理机宕机,作业调度意外中断等情况时流程调度模块可从数据库中对作业进行恢复,保证作业流程的正常调度执行。
参照图1,为本发明流程调度的具体实施方式,包含以下步骤:
步骤101:用户向流程调度模块提交作业流程描述。
步骤102:流程调度模块在接收到用户提交的作业流程描述之后首先会分析用户提交的作业,完成诸如可用性和正确性等校验。
步骤103:流程调度模块提取作业描述中的信息,并将其转换为任务和作业表项保存到数据库中。
步骤104:流程调度模块查询数据库,根据任务的状态判断是否存在一个未完成的任务,并取出可以执行的任务编号转105,若作业中所有任务都执行结束转113。
步骤105:从数据库中获取此任务执行所需要的所有信息。
步骤106:流程调度模块对此任务进行分析,构造消息,消息中包含此任务执行所需的所有信息,将此信息发往其对应的其他物理节点(或本节点)的任务执行模块。
步骤107:任务执行模块接收从流程调度模块发出的任务执行消息。
步骤108:在收到一个新的任务之后,任务执行模块首先根据收到的消息初始化任务,准备任务所需的执行环境等。
步骤109:任务执行模块等待任务执行完成。
步骤110:任务执行模块将任务状态和执行结果等返回给流程调度模块。
步骤111:流程调度模块接收来自任务执行模块的状态更新消息以及任务执行结果。
步骤112:流程调度模块将收到的任务状态更新保存在数据库中。
步骤113:作业执行结束,本次调度完成。
参照图2,表示程序启动时恢复操作的执行步骤,具体如下:
步骤201:程序启动,完成一系列初始化的工作。
步骤202:从数据库中获取未完成的作业信息,重构内存中保存的作业数据状态。
步骤203:准备接收消息更新,即步骤111。

Claims (1)

1.一种任务处理流程的调度及故障恢复方法,其特征在于包括以下步骤:
步骤一、执行调度任务时,对于由多个任务构成的一个流程定义为一个作业,作业进一步抽象为一个DAG图;流程调度模块加载作业信息对所述作业进行调度,并使用数据库保存一个作业中各任务的关键信息,在系统发生意外宕机的情况时依据保存的信息快速定位作业中尚未完成的任务,并根据其执行状态恢复调度现场,完成作业的快速恢复,重新调度,继续执行中断的任务;
在流程调度模块接收到一个新的作业之后对此作业进行分析,将作业的信息由DAG图转化为表结构存储在数据库中;
对于任一作业,将作业中的任务唯一的转化为表项保存在数据库中,同时保证其结构不变;同样的,根据数据库中保存的记录还原作业DAG图;将作业保存到数据库中;
步骤二、流程调度模块获取作业的信息,针对一个作业中的不同任务,在不同的物理节点进行执行,流程调度模块将对此进行判定,将任务发往相应物理节点的任务执行模块进行处理执行;
对于初次提交的作业,流程调度模块通过数据库获取作业的信息,取出作业中应最先执行的任务,将其加入预备执行队列中;
针对预备执行队列中的任务,流程调度模块将其依次从队列中取出,根据其中保存的信息将任务依次发往对应的任务执行模块执行;
步骤三、任务到达执行节点后,任务执行模块为其分配节点的计算资源和数据;完成预定的任务后任务执行模块将计算结果和任务运行的状态信息一并返回给流程调度模块;
流程调度模块接收任务执行模块发出的消息,消息包含任务状态的更新,流程调度模块根据获得的状态更新决定接下来要执行的任务;
若收到一条任务状态更新的消息,首先更新数据库中此任务的状态表项,将其状态更新为收到的新状态,并根据此次的状态变化判断其后继节点是否满足参与调度的条件;若存在一个后继节点,其前驱节点均成功执行完成,那么此后继任务满足参与调度的条件,将其状态更新为准备执行,加入预备执行队列中;
步骤四、故障恢复时,一个作业由若干个任务组成,一个作业对应一个DAG图,DAG图由节点和节点之间的有向边构成;作业DAG图中的每个节点解释为一个任务,作业DAG图中每条有向边解释为任务的前驱节点和后继节点关系;作业信息中作业标识信息唯一,用于区分不同的作业;状态信息描述作业的运行状态,是任务调度的结果;作业要经历的状态有已提交、调度中、已完成,作业出错或发生异常时,进入错误状态;
任务信息中作业标识信息和任务标识信息组合用于区分不同作业中的不同任务;状态信息描述任务的运行状态,调度模块根据任务的状态以及任务间先后关系进行调度;一般任务会经历已提交、调度中、运行中和完成状态,任务出错或发生意外时,进入错误状态;任务节点的前驱节点和后继节点记录了作业DAG图中该任务节点相关两条边指向的节点;任务的前驱节点指任务必须在前驱结点任务结束后才能开始,任务的后继节点指当前任务结束后,其后继节点任务才能开始;
在调度程序启动时,恢复工作被首先执行,通过检索数据库,判断每个任务的运行状态,重新构建作业运行时DAG图,完成故障恢复操作。
CN201610915259.8A 2016-10-20 2016-10-20 任务处理流程的调度及故障恢复方法 Active CN106547613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610915259.8A CN106547613B (zh) 2016-10-20 2016-10-20 任务处理流程的调度及故障恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610915259.8A CN106547613B (zh) 2016-10-20 2016-10-20 任务处理流程的调度及故障恢复方法

Publications (2)

Publication Number Publication Date
CN106547613A CN106547613A (zh) 2017-03-29
CN106547613B true CN106547613B (zh) 2020-04-03

Family

ID=58391973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610915259.8A Active CN106547613B (zh) 2016-10-20 2016-10-20 任务处理流程的调度及故障恢复方法

Country Status (1)

Country Link
CN (1) CN106547613B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832130A (zh) * 2017-10-31 2018-03-23 中国银行股份有限公司 一种银行系统的作业流调度执行方法、装置及电子设备
CN108415761B (zh) * 2018-01-31 2021-11-05 西北工业大学 一种基于网络流量优化的Storm任务调度方法
CN108388474A (zh) * 2018-02-06 2018-08-10 北京易沃特科技有限公司 基于dag的智能分布式计算管理系统及方法
CN108846020A (zh) * 2018-05-22 2018-11-20 北京易知创新数据科技有限公司 基于多源异构数据进行知识图谱自动化构建方法、系统
CN109885460A (zh) * 2019-01-29 2019-06-14 北京明略软件系统有限公司 一种信息获取方法、装置及计算机可读存储介质
CN110532108B (zh) * 2019-08-15 2022-10-11 北京拉勾网络技术有限公司 简历投递任务的处理方法、装置、服务器和系统
CN110673936B (zh) * 2019-09-18 2022-05-17 平安科技(深圳)有限公司 编排业务的断点续作方法、装置、存储介质及电子设备
CN110633914A (zh) * 2019-09-20 2019-12-31 中国银行股份有限公司 批量作业调度处理方法及装置
CN110825391B (zh) * 2019-10-31 2023-10-13 北京金山云网络技术有限公司 服务管理方法、装置、电子设备及存储介质
CN110851283A (zh) * 2019-11-14 2020-02-28 百度在线网络技术(北京)有限公司 资源处理方法、装置以及电子设备
CN111488234B (zh) * 2020-04-09 2021-01-26 深圳米筐科技有限公司 一种量化交易状态恢复方法
CN113850045A (zh) * 2020-06-28 2021-12-28 上海望友信息科技有限公司 一种协同编程方法、装置、系统及电子设备、存储介质
CN113342511A (zh) * 2021-08-06 2021-09-03 南京鹏云网络科技有限公司 一种分布式任务管理系统及方法
CN113641556A (zh) * 2021-08-24 2021-11-12 东风电子科技股份有限公司 用于保障汽车仪表稳定运行的系统、方法、装置、处理器及其计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928832A (zh) * 2005-09-09 2007-03-14 国际商业机器公司 多处理计算系统中的状态跟踪和恢复方法和系统
CN101159605A (zh) * 2007-10-25 2008-04-09 中兴通讯股份有限公司 一种可实现状态记忆和恢复的流程控制方法
CN102364447A (zh) * 2011-10-28 2012-02-29 北京航空航天大学 一种优化多任务间通信能耗的作业调度方法
CN104407919A (zh) * 2014-12-15 2015-03-11 浪潮软件股份有限公司 一种数据处理任务调度系统及方法
CN104965754A (zh) * 2015-03-31 2015-10-07 腾讯科技(深圳)有限公司 任务调度方法及任务调度装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9477511B2 (en) * 2013-08-14 2016-10-25 International Business Machines Corporation Task-based modeling for parallel data integration

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928832A (zh) * 2005-09-09 2007-03-14 国际商业机器公司 多处理计算系统中的状态跟踪和恢复方法和系统
CN101159605A (zh) * 2007-10-25 2008-04-09 中兴通讯股份有限公司 一种可实现状态记忆和恢复的流程控制方法
CN102364447A (zh) * 2011-10-28 2012-02-29 北京航空航天大学 一种优化多任务间通信能耗的作业调度方法
CN104407919A (zh) * 2014-12-15 2015-03-11 浪潮软件股份有限公司 一种数据处理任务调度系统及方法
CN104965754A (zh) * 2015-03-31 2015-10-07 腾讯科技(深圳)有限公司 任务调度方法及任务调度装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
分布式流处理技术综述;崔星灿;《计算机研究与发展》;20150215;第52卷(第2期);全文 *

Also Published As

Publication number Publication date
CN106547613A (zh) 2017-03-29

Similar Documents

Publication Publication Date Title
CN106547613B (zh) 任务处理流程的调度及故障恢复方法
CN111736969B (zh) 分布式作业调度方法及装置
US11210185B2 (en) Method and system for data recovery in a data system
CN101236515B (zh) 多核系统单核异常的恢复方法
EP1246063A2 (en) Restartable database loads using parallel data streams
CN102609296A (zh) 虚拟机分支和并行执行
CN111125444A (zh) 大数据任务调度管理方法、装置、设备及存储介质
US7475073B2 (en) Technique for improving staff queries in a workflow management system
Lu et al. Performing large science experiments on azure: Pitfalls and solutions
CN111984390A (zh) 任务调度方法、装置、设备及存储介质
US20080244592A1 (en) Multitask processing device and method
CN105912387A (zh) 数据处理作业调度方法及装置
CN112579267A (zh) 一种去中心化大数据作业流调度方法及装置
CN103425093A (zh) 生产工厂中故障状态自动恢复的方法和系统
CN102681894A (zh) 一种多任务并发调度方法及系统
CN114238077A (zh) 一种自动化测试任务编排系统及方法
CN108958915A (zh) 定时任务执行方法及装置
CN110569113A (zh) 分布式任务的调度方法及系统、计算机可读存储介质
US20180188713A1 (en) Method and Apparatus for Automatically Maintaining Very Large Scale of Machines
CN113312147B (zh) 一种对象存储跨集群海量数据迁移方法及系统
Thomas et al. Survey on MapReduce scheduling algorithms
CN111158890A (zh) 控制任务集中的任务并行的系统及其方法
Tikotekar et al. Evaluation of fault-tolerant policies using simulation
CN113467908A (zh) 任务执行方法、装置、计算机可读存储介质及终端设备
Wang et al. A resilient framework for fault handling in web service oriented systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant