CN103034554A - 一种纠错重启以及自动判断启动的etl调度系统及方法 - Google Patents

一种纠错重启以及自动判断启动的etl调度系统及方法 Download PDF

Info

Publication number
CN103034554A
CN103034554A CN2012105851449A CN201210585144A CN103034554A CN 103034554 A CN103034554 A CN 103034554A CN 2012105851449 A CN2012105851449 A CN 2012105851449A CN 201210585144 A CN201210585144 A CN 201210585144A CN 103034554 A CN103034554 A CN 103034554A
Authority
CN
China
Prior art keywords
subtask
task
processor
information
etl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105851449A
Other languages
English (en)
Other versions
CN103034554B (zh
Inventor
何昌桃
黄建鹏
徐晓冬
陈静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Focus Technology Co Ltd
Original Assignee
Focus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Focus Technology Co Ltd filed Critical Focus Technology Co Ltd
Priority to CN201210585144.9A priority Critical patent/CN103034554B/zh
Publication of CN103034554A publication Critical patent/CN103034554A/zh
Application granted granted Critical
Publication of CN103034554B publication Critical patent/CN103034554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种纠错重启以及自动判断启动的ETL调度方法及系统,本发明的系统结构包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器,本发明的方法是将数据仓库ETL任务分为若干主题任务,每个主题任务包含若干子任务,按预设执行顺序配置信息以及前置关联子任务成功执行完成时间自动判断,执行后续子任务,当子任务执行发生异常后,根据子任务关联关系停止后续关联子任务的执行,并记录异常子任务,以多次自动重启的方式,只对异常子任务及相关联后续子任务进行处理;本发明解决ETL任务调度中由于前置子任务出错时而后续子任务依然执行的问题,提高任务执行效率,减少人工干预,减少运行损耗。

Description

一种纠错重启以及自动判断启动的ETL调度系统及方法
技术领域
本发明属于数据仓库技术领域,特别是一种纠错重启以及自动判断启动的ETL调度系统及方法。
背景技术
随着数据仓库技术的普及和深化,构建数据仓库的核心技术ETL工具也逐步地完善且多样化,ETL在数据仓库构建中主要承担着数据抽取、加载、转换的角色,并负责系统程序调度控制和资源分配,直接关系着数据仓库构建实施的成败。
目前信息价值日益体现,尤其是具有大量数据记录的行业。成功的数据仓库对企业的发展十分重要,银行、移动电信、保险、电子商务运营商的大数据特性决定了这些行业极为注重数据仓库的构建及技术实施策略。目前的实施策略大体可以概括如下:
1、根据任务依赖关系设定调度顺序,依次完成系统调度任务;在调度过程中有管理人员人工监控,出现异常进行人工操作重启任务。
2、在依赖关系设定调度顺序的基础上,根据各独立任务的关系设定独立线程定时定点调度,并进行任务监控、人工排错及重启调度。
以上情况,都存在完全依赖人工处理的问题,而且还存在由于异常发生不能被及时处理而使系统继续运行产生错误结果的情况,并导致系统资源的浪费。
专利“一种ETL调度的实现方法及装置”(专利申请号 200910203276.9),在执行ETL调度包含的若干任务流程时,针对任意一个任务流程,根据预设的配置文件确定任务流程内包含的各子任务流程的触发方式、执行顺序和相互之间的依赖关系,按照设定的触发方式触发子任务流程,并按设定的顺序执行已触发的子任务流程,并根据子任务流程之间的依赖关系,执行依赖已完成子任务并已触发的后续子任务流程。专利“一种实现ETL调度的方法及系统”(专利申请号 200910137527.8),根据预设的任务配置文件确定当前需要执行的任务,所述任务配置文件包括需要执行的任务及各任务之间的依赖关系,并通过获取应用服务器的资源信息,选定合适的应用服务器来执行任务。
这2种专利所提供的方法都使各任务之间的业务逻辑清晰、业务功能明确,但对于任务或子任务在执行过程中异常终止后如何处理,仍是采用常用的人工重新启动的方法,这没有良好的解决ETL的运行效率和运行损耗的问题。
发明内容
本发明的目的在于提供一种能够解决ETL任务调度中由于前置子任务出错时而后续子任务依然执行的问题,提高任务执行效率,有利于减少人工干预,减少运行损耗的纠错重启以及自动判断启动的ETL调度系统及方法。
实现本发明目的的技术解决方案为:
一种纠错重启以及自动判断启动的ETL调度系统,包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器;数据仓库服务器包括任务配置存储器、数据仓库数据存储器、ETL任务处理器、执行记录存储器,ETL任务处理器与数据仓库数据存储器和执行记录存储器相连;ETL调度监控服务器包括任务执行监控处理器、任务异常信息存储器、异常信息发送器,任务异常信息存储器与任务执行监控处理器和异常信息发送器相连;ETL调度平台服务器包括启动判断处理器、任务启动处理器,启动判断处理器与任务启动处理器相连;其中,数据仓库服务器的ETL任务处理器与业务系统数据库服务器和ETL调度平台服务器的任务启动处理器相连,ETL调度平台服务器的启动判断处理器分别与数据仓库服务器的任务配置存储器、执行记录存储器、以及ETL调度监控服务器的异常信息发送器相连,数据仓库服务器的执行记录存储器与ETL调度监控服务器的任务执行监控处理器相连。
一种纠错重启以及自动判断启动的ETL调度方法,包括以下步骤:
步骤一:安排任务、子任务的执行顺序,配置子任务之间的关联关系,把任务执行的先后顺序,任务包含的子任务,子任务执行的先后顺序,子任务之间的关系保存在数据仓库服务器的任务配置存储器中,且每个子任务对应数据仓库中的一张表,根据业务需要来安排任务在执行时间上的先后顺序,安排任务所包含的子任务的执行顺序时,子任务采用以下原则进行排序:
(1)当一个子任务与其它子任务之间具有关联关系时,必须在一个或者若干个前置子任务成功执行之后才能执行该子任务;
(2)在此基础上,按照子任务的重要程度进行排序,对业务影响较大的子任务优先执行;
(3)最后根据子任务执行的时间长度进行排序,执行时间较短的子任务优先执行;
步骤二:由启动判断处理器从任务配置存储器读取待执行子任务及其前置子任务信息;由启动判断处理器从执行记录存储器中读取待执行子任务及其前置子任务最近一次成功执行的结束时间;根据这些信息,通过启动判断处理器的计算,得出待执行子任务的执行标志,待执行子任务执行标志生成流程如下:
(1)通过任务配置信息抽取单元,从任务配置存储器获取任务配置信息,通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,将这些信息发送到任务执行标志计算单元;
(2)任务执行信息抽取单元通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,再从执行记录存储器获取当前待执行的子任务及其前置子任务最近一次成功执行的结束时间;
若最近一次成功执行的结束时间不存在,则表明当前子任务是第一次执行,直接得出“可执行”标志;
(3)任务执行标志计算单元计算出待执行子任务所对应的所有前置子任务中最近一次成功执行的结束时间中的最早值,将这个最早值与待执行子任务的最后一次成功执行结束时间进行对比,对比方法如下:
这个最早值若晚于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务可以执行,返回“可执行”标志;
这个最早值若早于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务的前置子任务中存在着执行异常的情况,返回“不可执行”标志;
步骤三:将启动判断处理器中任务标志发送单元的执行标志结果发送到任务启动处理器;任务启动处理器分以下两种情况:
若任务启动处理器获取“可执行”标志后,将启动指令发送至数据仓库服务器的ETL任务处理器中,继续执行步骤四;
若任务启动处理器获取“不可执行”标志后,不进行动作,跳至步骤二;
步骤四:ETL任务处理器获取启动指令开始执行相应的子任务;若ETL任务处理器执行相应的子任务未发生异常,继续执行步骤五;若ETL任务处理器执行相应的子任务发生异常而被终止,直接跳到步骤八;
步骤五:执行记录存储器在子任务开始执行时,记录该子任务的名称,开始时间、把子任务设置为“fail”状态,表示此任务还未成功完成,执行记录存储器在子任务成功执行结束时,记录子任务结束时间,以及更新数据量等信息,把此任务设置为“success”状态,表示此任务还成功完成;
步骤六:任务执行监控处理器读取执行记录存储器中的子任务执行情况信息,以便于系统管理员监控;
步骤七:如果任务配置存储器中所有任务还未全部执行,则跳至步骤二;如果任务配置存储器中所有任务都已执行,则跳至步骤十三;
步骤八:执行记录存储器记录该子任务的状态信息,包括开始执行时间、异常终止时间、运行状态等;
步骤九:任务执行监控处理器从执行记录存储器中获取任务执行情况信息,并把该异常子任务的信息放置到任务异常信息存储器中保存,同时对这个异常子任务信息的保存次数增加一次;
步骤十二:由于前置任务发生异常,将不会执行与其具有关联关系的后续子任务,跳至步骤七;
步骤十三:异常信息发送器依照执行的先后顺序从任务异常信息存储器中读取发生异常问题的子任务信息,并把它发送给启动判断处理器;
步骤十四:启动判断处理器从任务配置存储器中读取这个异常子任务的前置子任务,如果这个异常子任务不存在前置子任务,那么发送“可执行”指令给任务启动处理器;如果这个异常子任务存在前置子任务,则需要从执行记录存储器读取这个前置子任务的执行状态,如果判断这个前置子任务的执行状态是成功的,那么启动判断处理器发送“可执行”指令给任务启动处理器;否则,启动判断处理器发送“不可执行”指令给任务启动处理器;
步骤十五:任务启动处理器接收到“可执行”执行标志结果,将启动指令发送至数据仓库服务器的ETL任务处理器中;
步骤十六:ETL任务处理器开始重新执行相应的异常子任务;
步骤十七:执行记录存储器在异常子任务开始执行时,记录此异常子任务的名称,开始时间、把此任务设置为“fail”状态,表示此子任务还未成功完成;执行记录存储器在此子任务成功执行结束时,记录此子任务结束时间、把此任务设置为“success”状态,表示此此任务还成功完成,以及更新数据量等信息;如果这个异常子任务在这次执行过程中还是发生了异常,则把这个异常子任务信息通过任务执行监控处理器仍然保存到任务异常信息存储器中,同时对这个异常子任务信息的保存次数加1;
步骤十八:这个异常子任务成功执行后,启动判断处理器从任务配置存储器中读取与这个子任务有关联关系的后续子任务,由于这个子任务已经被成功执行,那么计算后续子任务得到“可执行”的执行标志结果,把“可执行”的执行标志结果传递给任务启动处理器,进而通过ETL任务处理器执行这些后续子任务;如果这些后续子任务在执行过程中发生异常,则把异常子任务信息通过任务执行监控处理器仍然保存到任务异常信息存储器中,同时对此异常子任务信息的保存次数增加1;
步骤十九:当这个异常子任务所关联的所有后续任务都执行后,启动判断处理器接收异常信息发送器发送的异常子任务,开始处理新的异常子任务;
步骤二十:当所有的异常子任务都处理后,异常信息发送器又开始把仍存在的子任务信息发送给启动判断处理器,开始新一轮处理过程; 
步骤二十一:如果某个异常子任务经过3轮处理后还是发生异常,那么对这个异常子任务不再执行,把这个异常子任务的信息发送给系统管理员来进行紧急处理。
本发明与现有技术相比,其显著优点:
(1)本发明从将数据仓库所有ETL任务分为若干主题任务,每个主题任务包含若干子任务,在任务执行发生异常后,只需要对对应的异常子任务进行处理,错误排查方便,减少重新调度任务时间,提高了调度效率。
(2)本发明采用子任务关联关系及子任务成功执行完成时间自动判断是否执行后续关联子任务,可以避免由于前置子任务出错时而后续子任务依然执行,带来的系统消耗及产生错误的结果问题。
(3)本发明对记录的异常子任务,以多次自动重启的方式提高任务执行的成功率,减少人工干预,降低维护成本。
(4)本发明在任务执行顺序的安排上,优先执行重要程度高,执行时间短的子任务,保证了整个ETL调度过程效率高、故障低。
(5)每个任务对应若干个子任务,每个子任务对应数据仓库中的一张表,子任务与表一对一的关系可以避免需要处理某个表的数据时对其他的表的数据进行重复处理,节省了系统资源和时间的消耗。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明纠错重启以及自动判断启动的ETL调度系统的系统结构示意图。
图2为本发明的子任务关系图。
图3为本发明的子任务成功执行的过程示意图。
图4为本发明的子任务发生异常时的处理过程示意图。
图5为本发明的子任务执行异常时的关联关系子任务结果示意图。
图6为本发明的纠错重启的处理过程示意图。
图7为本发明的启动判断处理器的结构示意图。
图8为本发明的实施例的ETL任务流程图。
具体实施方式
如图1所述:
本发明一种纠错重启以及自动判断启动的ETL调度系统,包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器;数据仓库服务器包括任务配置存储器、数据仓库数据存储器、ETL任务处理器、执行记录存储器,ETL任务处理器与数据仓库数据存储器和执行记录存储器相连;ETL调度监控服务器包括任务执行监控处理器、任务异常信息存储器、异常信息发送器,任务异常信息存储器与任务执行监控处理器和异常信息发送器相连;ETL调度平台服务器包括启动判断处理器、任务启动处理器,启动判断处理器与任务启动处理器相连;其中,数据仓库服务器的ETL任务处理器与业务系统数据库服务器和ETL调度平台服务器的任务启动处理器相连,ETL调度平台服务器的启动判断处理器分别与数据仓库服务器的任务配置存储器、执行记录存储器、以及ETL调度监控服务器的异常信息发送器相连,数据仓库服务器的执行记录存储器与ETL调度监控服务器的任务执行监控处理器相连。
如图7所述:
所述的启动判断处理器包括任务配置信息抽取单元、配置信息处理单元、任务执行信息抽取单元、任务执行标志计算单元、任务标志发送单元,其中任务配置信息抽取单元与配置信息处理单元和任务执行信息抽取单元相连,任务执行标志计算单元分别与配置信息处理单元、任务执行信息抽取单元相连、任务标志发送单元相连。
如图3和4以及如图6所述:
一种纠错重启以及自动判断启动的ETL调度方法,其特征在于,包括以下步骤:
步骤一:安排任务、子任务的执行顺序,配置子任务之间的关联关系,把任务执行的先后顺序,任务包含的子任务,子任务执行的先后顺序,子任务之间的关系保存在数据仓库服务器的任务配置存储器中,根据业务需要来安排任务在执行时间上的先后顺序,安排任务所包含的子任务的执行顺序时,子任务采用以下原则进行排序:
(1)当一个子任务与其它子任务之间具有关联关系时,必须在一个或者若干个前置子任务成功执行之后才能执行该子任务;
(2)在此基础上,按照子任务的重要程度进行排序,对业务影响较大的子任务优先执行;
(3)最后根据子任务执行的时间长度进行排序,执行时间较短的子任务优先执行;
步骤二:由启动判断处理器从任务配置存储器读取待执行子任务及其前置子任务信息;由启动判断处理器从执行记录存储器中读取待执行子任务及其前置子任务最近一次成功执行的结束时间;根据这些信息,通过启动判断处理器的计算,得出待执行子任务的执行标志,待执行子任务执行标志生成流程如下:
(1)通过任务配置信息抽取单元,从任务配置存储器获取任务配置信息,通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,将这些信息发送到任务执行标志计算单元;
(2)任务执行信息抽取单元通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,再从执行记录存储器获取当前待执行的子任务及其前置子任务最近一次成功执行的结束时间;
若最近一次成功执行的结束时间不存在,则表明当前子任务是第一次执行,直接得出“可执行”标志;
(3)任务执行标志计算单元计算出待执行子任务所对应的所有前置子任务中最近一次成功执行的结束时间中的最早值,将这个最早值与待执行子任务的最后一次成功执行结束时间进行对比,对比方法如下:
这个最早值若晚于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务可以执行,返回“可执行”标志;
这个最早值若早于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务的前置子任务中存在着执行异常的情况,返回“不可执行”标志;
步骤三:将启动判断处理器中任务标志发送单元的执行标志结果发送到任务启动处理器;任务启动处理器分以下两种情况:
若任务启动处理器获取“可执行”标志后,将启动指令发送至数据仓库服务器的ETL任务处理器中,继续执行步骤四;
若任务启动处理器获取“不可执行”标志后,不进行动作,跳至步骤二;
步骤四:ETL任务处理器获取启动指令开始执行相应的子任务;若ETL任务处理器执行相应的子任务未发生异常,继续执行步骤五;若ETL任务处理器执行相应的子任务发生异常而被终止,直接跳到步骤八;
步骤五:执行记录存储器在子任务开始执行时,记录该子任务的名称,开始时间、把子任务设置为“fail”状态,表示此任务还未成功完成,执行记录存储器在子任务成功执行结束时,记录子任务结束时间,以及更新数据量等信息,把此任务设置为“success”状态,表示此任务还成功完成;
步骤六:任务执行监控处理器读取执行记录存储器中的子任务执行情况信息,以便于系统管理员监控;
步骤七:如果任务配置存储器中所有子任务未全部执行,则跳至步骤二;如果任务配置存储器中所有子任务都已执行,则跳至步骤十三;
步骤八:执行记录存储器记录该子任务的状态信息,包括开始执行时间、异常终止时间、运行状态等;
步骤九:任务执行监控处理器从执行记录存储器中获取任务执行情况信息,并把该异常子任务的信息放置到任务异常信息存储器中保存,同时对这个异常子任务信息的保存次数增加一次;
步骤十二:由于前置子任务发生异常,将不会执行与其具有关联关系的后续子任务,跳至步骤七;
步骤十三:异常信息发送器依照执行的先后顺序从任务异常信息存储器中读取发生异常问题的子任务信息,并把它发送给启动判断处理器;
步骤十四:启动判断处理器从任务配置存储器中读取这个异常子任务的前置子任务,如果这个异常子任务不存在前置子任务,那么发送“可执行”指令给任务启动处理器;如果这个异常子任务存在前置子任务,则需要从执行记录存储器读取这个前置子任务的执行状态,如果判断这个前置子任务的执行状态是成功的,那么启动判断处理器发送“可执行”指令给任务启动处理器;否则,启动判断处理器发送“不可执行”指令给任务启动处理器;
步骤十五:任务启动处理器接收到“可执行”执行标志结果,将启动指令发送至数据仓库服务器的ETL任务处理器中;
步骤十六:ETL任务处理器开始重新执行相应的异常子任务;
步骤十七:执行记录存储器在异常子任务开始执行时,记录异常子任务的名称,开始时间、把此子任务设置为“fail”状态,表示此子任务还未成功完成;执行记录存储器在子任务成功执行结束时,记录子任务结束时间、把此任务设置为“success”状态,表示此子任务还成功完成,以及更新数据量等信息;如果这个异常子任务在这次执行过程中还是发生了异常,则把这个异常子任务信息通过任务执行监控处理器仍然保存到任务异常信息存储器中,同时对这个异常子任务信息的保存次数加1;
步骤十八:这个异常子任务成功执行后,启动判断处理器从任务配置存储器中读取与这个子任务有关联关系的后续子任务,由于这个子任务已经被成功执行,那么计算后续子任务得到“可执行”的执行标志结果,把“可执行”传递给任务启动处理器,进而通过ETL任务处理器执行这些后续子任务;如果这些后续子任务在执行过程中发生异常,则把异常子任务信息通过任务执行监控处理器仍然保存到任务异常信息存储器中,同时对异常子任务信息的保存次数增加1;
步骤十九:当这个异常子任务所关联的所有后续任务都成功执行后,启动判断处理器接收异常信息发送器发送的异常子任务,又开始处理新的异常子任务;
步骤二十:当所有的异常子任务都处理后,异常信息发送器又开始把仍存在异常的子任务信息发送给启动判断处理器,开始新一轮处理过程;
步骤二十一:如果某个异常子任务经过3轮处理后还是发生异常,那么对这个异常子任务不再执行,把这个异常子任务的信息发送给系统管理员来进行紧急处理。
如图1所示,本发明的系统结构包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器。
业务系统数据库服务器,用于存储业务系统用户使用业务系统操作生成的数据,业务系统数据库服务器是数据仓库数据的主要来源,是ETL任务数据的源头。
数据仓库服务器,用于执行ETL任务,存储数据仓库的数据,存储ETL任务的相关配置信息,存储ETL任务执行的相关记录信息。
数据仓库服务器包括任务配置存储器、数据仓库数据存储器、ETL任务处理器、执行记录存储器。
任务配置存储器,用于存储ETL任务的执行顺序,每个任务所包含的子任务,以及子任务与子任务的关联关系等配置信息,以供ETL调度平台服务器使用。
数据仓库数据存储器,用于存储数据仓库表的数据,存储每个ETL任务完成后生成的结果数据。
ETL任务处理器,根据任务配置存储器中的配置信息执行预设的ETL任务,处理来自业务系统数据库的数据,生成数据仓库数据。
执行记录存储器,记录每个ETL任务执行的初始状态和结束状态,包括子任务名称、子任务开始时间、子任务结束时间、子任务执行状态、更新的数据量等信息。
ETL调度监控服务器,用于对ETL任务所包含的子任务执行进行监控,捕获子任务的异常信息,向维护人员发送异常信息提示,用于维护人员查看任务执行状况。ETL调度监控服务器包括任务执行监控处理器、任务异常信息存储器、异常信息发送器。
任务执行监控处理器,监控数据仓库服务器中的ETL任务执行情况,获取任务及各个子任务执行信息,并将子任务异常信息发送到任务异常信息存储器。
任务异常信息存储器,从任务执行监控处理器获取子任务异常信息,将异常信息进行存储。
异常信息发送器,从任务异常信息存储器获取子任务异常信息,将子任务异常信息发送到维护人员和ETL调度平台服务器。
ETL调度平台服务器,用于判断各个子任务的顺序,判断子任务是否可以执行,在子任务到可执行状态时启动;从ETL调度监控服务器获取异常子任务信息,当子任务由于执行异常而失败后,准备重新执行该子任务。ETL调度平台服务器包括启动判断处理器、任务启动处理器。
启动判断处理器,从数据仓库服务器获取ETL任务以及子任务配置信息,通过计算处理,判断子任务是否符合执行的条件,并将执行标志结果发送到任务启动处理器。
任务启动处理器,获取任务判断处理器处理结果后,将启动任务指令发送至数据仓库服务器,启动对应ETL任务。
本专利提供的方法具体实现,包括:
1、安排任务、子任务的执行顺序,配置子任务之间的关联关系
按照业务工作的范围,将业务工作需求分成若干个不同的主题,每个主题对应一个任务。每个任务被划分为若干个子任务,子任务为最小的执行单元,不能再进行划分,每个子任务对应数据仓库中的一张数据表。
在任务内的子任务之间,存在着2种关系:
(1)独立关系。子任务之间不存在必要的因果关系。
(2)关联关系。子任务之间存在着必要的因果关系,一个子任务必须在一个或者若干个前置子任务成功执行之后才能开始执行。
如图2所示,子任务1和子任务之间是独立关系。子任务1和子任务3、子任务4之间是关联关系。子任务2和子任务3、子任务4之间是关联关系。
子任务1和子任务2是子任务3的前置任务,子任务3必须在子任务1和子任务2全部成功执行结束后才能执行。子任务3是子任务4的前置任务,子任务4必须在子任务3成功执行结束后才能执行。
子任务5与子任务1、子任务2、子任务3、子任务4是独立关系。子任务6与子任务1、子任务2、子任务3、子任务4是独立关系。子任务5和子任务6是关联关系,子任务5是子任务6的前置任务,子任务6必须在子任务5成功执行结束后才能执行。
子任务7与其他所有的子任务之间是独立关系。
根据业务需要来安排任务在执行时间上的先后顺序。安排任务所包含的子任务的执行顺序时,子任务采用以下原则进行排序:
(1)当一个子任务与其它子任务之间具有关联关系时,必须在一个或者若干个前置子任务成功执行之后才能执行该子任务。
(2)在此基础上,按照子任务的重要程度进行排序,对业务影响较大的子任务优先执行。
(3)最后根据子任务执行的时间长度进行排序,执行时间较短的子任务优先执行。
把任务执行的先后顺序,任务包含的子任务,子任务执行的先后顺序,子任务之间的关系保存在任务配置存储器中。
2、子任务执行异常时,记录异常子任务信息,并且当异常子任务与其它子任务有关联关系时,将不执行此异常子任务的后续子任务。
如图3所示,子任务正常执行过程:
(1)由启动判断处理器从任务配置存储器读取待执行子任务及其前置子任务信息。
(2)由启动判断处理器从执行记录存储器中读取待执行子任务及其前置子任务最近一次成功执行的结束时间。
(3)根据这些信息,通过启动判断处理器的计算,得出子任务的执行标志,相关各前置子任务成功执行时得到的执行标志结果是“可执行”。
(4)将执行标志结果发送到任务启动处理器。
(5)任务启动处理器获取“可执行”标志后,将启动指令发送至数据仓库服务器的ETL任务处理器中。
(6)ETL任务处理器开始执行相应的子任务。
(7)执行记录存储器在子任务开始执行时,记录该子任务的名称,开始时间、把子任务设置为“fail”状态,表示此子任务还未成功完成。执行记录存储器在子任务成功执行结束时,记录子任务结束时间、以及更新数据量等信息,把此任务设置为“success”状态,表示此任务还成功完成。
(8)任务执行监控处理器读取执行记录存储器中的子任务执行情况信息,以便于系统管理员监控。
如图4所示。子任务执行发生异常时,与该子任务有关联关系的后续子任务将不会被执行,其处理过程如下:
(1)ETL任务处理器开始执行子任务,该子任务执行时发生异常而被终止。
(2)执行记录存储器记录该子任务的状态信息,包括开始执行时间、异常终止时间、运行状态等。
(3)任务执行监控处理器获取任务执行情况信息。
(4)把该异常子任务的信息放置到任务异常信息存储器中保存,同时对这个异常子任务信息的保存次数增加一次。
(5)由启动判断处理器从任务配置存储器读取待执行子任务及其前置子任务信息。此处所述前置子任务为上述执行时发生异常的子任务。
(6)由启动判断处理器从执行记录存储器中读取待执行子任务及其前置子任务最近一次成功执行的结束时间。
(7)启动判断处理器通过计算,由于前置任务发生异常,得出待执行子任务的执行标志是“不可执行”。
(8)将执行标志即结果发送到任务启动处理器。任务启动处理器接到这个执行标志,不进行动作。
如图5所示,其中执行顺序为子任务1、子任务2、子任务3、子任务4。其中,子任务1与子任务3关联,子任务2与子任务3关联,子任务3与子任务4关联,子任务1与子任务2是独立关系。
如果子任务1发生异常错误,子任务3与子任务4将不会被执行,而子任务2不受影响,将按顺序执行。
3、当任务配置存储器中的所有任务都已执行后,进入到纠错重启阶段。依次执行被记录的异常子任务,当异常子任务与其它子任务有关联关系时,成功执行异常子任务后,需要依次执行与其有关联关系的后续子任务。在此过程中有子任务在执行时发生异常,仍被记录,用于新一轮的处理,如图6所示。
(1)异常信息发送器依照执行的先后顺序从任务异常信息存储器中读取发生异常问题的子任务信息,并把它发送给启动判断处理器。
(2)启动判断处理器从任务配置存储器中读取这个异常子任务的前置子任务,如果这个异常子任务不存在前置子任务,那么发送“可执行”指令给任务启动处理器。如果这个异常子任务存在前置子任务,则需要从执行记录存储器读取这个前置子任务的执行状态,如果判断这个前置子任务的执行状态是成功的,那么启动判断处理器发送“可执行”指令给任务启动处理器;否则,启动判断处理器发送“不可执行”指令给任务启动处理器。
(3)任务启动处理器接收到“可执行”执行标志结果,将启动指令发送至数据仓库服务器的ETL任务处理器中。
(4)ETL任务处理器开始重新执行相应的异常子任务。
(5)执行记录存储器在异常子任务开始执行时,记录异常子任务的名称,开始时间、把此子任务设置为“fail”状态,表示此子任务还未成功完成。执行记录存储器在子任务成功执行结束时,记录子任务结束时间、把此子任务设置为“success”状态,表示此子任务还成功完成,以及更新数据量等信息。如果这个异常子任务在这次执行过程中还是发生了异常,则把这个异常子任务信息通过任务监控处理器仍然保存到任务异常信息存储器中,同时对这个异常子任务信息的保存次数加1。
(6)这个异常子任务成功执行后,启动判断处理器从任务配置存储器中读取与这个子任务有关联关系的后续子任务,由于这个子任务已经被成功执行,那么计算后续子任务的是否可执行,得到“可执行”的执行标志结果,把“可执行”传递给任务启动处理器,进而通过ETL任务处理器执行这些后续子任务。如果这些后续子任务在执行过程中发生异常,则把异常子任务信息通过任务监控处理器仍然保存到任务异常信息存储器中,同时对此异常子任务信息的保存次数增加1。
(7)当这个异常子任务所关联的所有后续任务都成功执行后,启动判断处理器接收异常信息发送器发送的下一个异常子任务,开始处理。
(8)当所有的异常子任务都处理后,异常信息发送器又开始把仍存在的子任务信息发送给启动判断处理器,开始新一轮处理过程。
(9)如果某个异常子任务经过连续3轮处理后还是发生异常,那么对这个异常子任务不再执行,把这个异常子任务的信息发送给系统管理员来进行紧急处理。
如图7所示:
本发明中的启动判断处理器用于计算和判断待执行子任务是否满足执行条件,并向任务启动处理器发出是否执行的标志,保证任务流程中的子任务按序自动启动执行。其结构包括任务配置信息抽取单元、配置信息处理单元、任务执行信息抽取单元、任务执行标志计算单元、任务标志发送单元。
任务配置信息抽取单元,用于抽取任务配置信息存储器中预先设置好的子任务执行顺序、子任务与子任务的关联关系等信息。
配置信息处理单元,处理任务配置信息抽取单元的信息,计算出待执行的子任务,并将结果信息发送到任务执行标志计算单元。
任务执行信息抽取单元,从配置信息处理单元获得待执行子任务及其前置子任务,从执行记录存储器获取待执行子任务最近一次成功执行的结束时间,以及其前置子任务最近一次成功执行的结束时间等信息,将信息发送到任务执行标志计算单元。
任务执行标志计算单元,从配置信息处理单元获取待执行的子任务及其前置子任务,再从任务执行信息抽取单元获取待执行子任务其前置子任务相关成功执行的信息,计算出待执行子任务执行的标志。
任务标志发送单元,从任务执行标志计算单元获取任务可执行标志后,将是否可执行的指令发送到任务启动处理器,以启动待执行子任务。
待执行子任务执行标志生成流程如下:
(1)通过任务配置信息抽取单元,获取任务配置信息,通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,将这些信息发送到任务执行标志计算单元。
(2)任务执行信息抽取单元通过配置信息处理单元获取待执行的子任务及其前置子任务的信息,并从执行记录存储器获取当前待执行的子任务及其前置子任务最近一次成功执行的结束时间。
若最近一次成功执行的结束时间不存在,则表明当前子任务是第一次执行,直接得出“可执行”标志。
(3)任务执行标志计算单元计算出待执行子任务所对应的所有前置子任务中最近一次成功执行的结束时间中的最早值,将这个最早值与待执行子任务的最后一次成功执行结束时间进行对比。
这个最早值若晚于待执行任务的最后一次成功执行结束时间,则表明待执行子任务可以执行,返回“可执行”标志。
这个最早值若早于待执行任务的最后一次成功执行结束时间,则表明待执行任务的前置任务中存在着执行异常的情况,返回“不可执行”标志。
实施例:
对于一个ETL任务流程,如图8所示。
本ETL任务流程分成4个任务,依次执行顺序是任务1、任务2、任务3、任务4。
其中任务1包括5个子任务,依次执行顺序是1、2、3、4、5。
任务2包括6个子任务,依次执行顺序是6、7、8、9、10、11。
任务3包括5个子任务,依次执行顺序是12、13、14、15、16。
任务4包括6个子任务,依次执行顺序是17、18、19、20、21、22。
并且,在图中有连线直接连接的子任务具有关联关系,无连线直接连接的子任务无关联关系,是独立关系。
如果子任务2发生异常,则子任务3、4、5将不会被执行。
子任务7发生异常,则子任务9、11将不会被执行。
子任务13发生异常,则子任务14、16将不会被执行。
子任务19发生异常,则子任务20、21、22将不会被执行。
ETL任务流程结束后,子任务2、7、13、19的异常信息将会被保存在任务异常信息存储器中。当进入到纠错重启阶段时,将依次重新启动子任务2、7、13、19。
当成功执行子任务2后,将会依次执行与其具有关联关系的后续子任务3、4、5。当成功执行子任务7后,将会依次执行与其具有关联关系的后续子任务9、11。当成功执行子任务13后,将会依次执行与其具有关联关系的后续子任务14、16。当成功执行子任务19后,将会依次执行与其具有关联关系的后续子任务20、21、22。
如果某个子任务连续3次执行时都发生异常,将通知系统管理员进行处理。
这种方式可以最大程度的减少人工操作,提高运行效率,并且由于只对发生异常的子任务进行重新执行,减少了正常子任务的重复运行,减少系统运行损耗。

Claims (3)

1.一种纠错重启以及自动判断启动的ETL调度系统,其特征在于,包括业务系统数据库服务器、数据仓库服务器、ETL调度监控服务器、ETL调度平台服务器;数据仓库服务器包括任务配置存储器、数据仓库数据存储器、ETL任务处理器、执行记录存储器,ETL任务处理器与数据仓库数据存储器和执行记录存储器相连;ETL调度监控服务器包括任务执行监控处理器、任务异常信息存储器、异常信息发送器,任务异常信息存储器与任务执行监控处理器和异常信息发送器相连;ETL调度平台服务器包括启动判断处理器、任务启动处理器,启动判断处理器与任务启动处理器相连;其中,数据仓库服务器的ETL任务处理器与业务系统数据库服务器和ETL调度平台服务器的任务启动处理器相连,ETL调度平台服务器的启动判断处理器分别与数据仓库服务器的任务配置存储器、执行记录存储器、以及ETL调度监控服务器的异常信息发送器相连,数据仓库服务器的执行记录存储器与ETL调度监控服务器的任务执行监控处理器相连。
2.根据权利要求1所述的一种纠错重启以及自动判断启动的ETL调度系统,其特征在于,所述的启动判断处理器包括任务配置信息抽取单元、配置信息处理单元、任务执行信息抽取单元、任务执行标志计算单元、任务标志发送单元,其中配置信息处理单元与任务配置信息抽取单元、任务执行信息抽取单元、任务执行标志计算单元相连,任务执行标志计算单元分别与配置信息处理单元、任务执行信息抽取单元、任务标志发送单元相连。
3.一种纠错重启以及自动判断启动的ETL调度方法,其特征在于,包括以下步骤:
步骤一:安排任务、子任务的执行顺序,配置子任务之间的关联关系,把任务执行的先后顺序,任务包含的子任务,子任务执行的先后顺序,子任务之间的关系保存在数据仓库服务器的任务配置存储器中,且每个子任务对应数据仓库中的一张表,根据业务需要来安排任务在执行时间上的先后顺序,安排任务所包含的子任务的执行顺序时,子任务采用以下原则进行排序:
(1)当一个子任务与其它子任务之间具有关联关系时,必须在一个或者若干个前置子任务成功执行之后才能执行该子任务;
(2)在此基础上,按照子任务的重要程度进行排序,对业务影响较大的子任务优先执行;
(3)最后根据子任务执行的时间长度进行排序,执行时间较短的子任务优先执行;
步骤二:由启动判断处理器从任务配置存储器读取待执行子任务及其前置子任务信息;由启动判断处理器从执行记录存储器中读取待执行子任务及其前置子任务最近一次成功执行的结束时间;根据这些信息,通过启动判断处理器的计算,得出待执行子任务的执行标志,待执行子任务执行标志生成流程如下:
(1)通过任务配置信息抽取单元,从任务配置存储器获取任务配置信息,通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,将这些信息发送到任务执行标志计算单元;
(2)任务执行信息抽取单元通过配置信息处理单元获取当前待执行的子任务及其前置子任务的信息,再从执行记录存储器获取当前待执行的子任务及其前置子任务最近一次成功执行的结束时间;
若最近一次成功执行的结束时间不存在,则表明当前子任务是第一次执行,直接得出“可执行”标志;
(3)任务执行标志计算单元计算出待执行子任务所对应的所有前置子任务中最近一次成功执行的结束时间中的最早值,将这个最早值与待执行子任务的最后一次成功执行结束时间进行对比,对比方法如下:
这个最早值若晚于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务可以执行,返回“可执行”标志;
这个最早值若早于待执行子任务的最后一次成功执行结束时间,则表明待执行子任务的前置子任务中存在着执行异常的情况,返回“不可执行”标志;
步骤三:将启动判断处理器中任务标志发送单元的执行标志结果发送到任务启动处理器;任务启动处理器分以下两种情况:
若任务启动处理器获取“可执行”标志后,将启动指令发送至数据仓库服务器的ETL任务处理器中,继续执行步骤四;
若任务启动处理器获取“不可执行”标志后,不进行动作,跳至步骤二;
步骤四:ETL任务处理器获取启动指令开始执行相应的子任务;若ETL任务处理器执行相应的子任务未发生异常,继续执行步骤五;若ETL任务处理器执行相应的子任务发生异常而被终止,直接跳到步骤八;
步骤五:执行记录存储器在子任务开始执行时,记录该子任务的名称,开始时间、把子任务设置为“fail”状态,表示此任务还未成功完成,执行记录存储器在子任务成功执行结束时,记录子任务结束时间,以及更新数据量等信息,把此任务设置为“success”状态,表示此任务还成功完成;
步骤六:任务执行监控处理器读取执行记录存储器中的子任务执行情况信息,以便于系统管理员监控;
步骤七:如果任务配置存储器中所有任务还未全部执行,则跳至步骤二;如果任务配置存储器中所有任务都已执行,则跳至步骤十三;
步骤八:执行记录存储器记录该子任务的状态信息,包括开始执行时间、异常终止时间、运行状态等;
步骤九:任务执行监控处理器从执行记录存储器中获取任务执行情况信息,并把该异常子任务的信息放置到任务异常信息存储器中保存,同时对这个异常子任务信息的保存次数增加一次;
步骤十二:由于前置任务发生异常,将不执行与其具有关联关系的后续子任务,跳至步骤七;
步骤十三:异常信息发送器依照执行的先后顺序从任务异常信息存储器中读取发生异常问题的子任务信息,并把它发送给启动判断处理器;
步骤十四:启动判断处理器从任务配置存储器中读取这个异常子任务的前置子任务,如果这个异常子任务不存在前置子任务,那么发送“可执行”指令给任务启动处理器;如果这个异常子任务存在前置子任务,则需要从执行记录存储器读取这个前置子任务的执行状态,如果判断这个前置子任务的执行状态是成功的,那么启动判断处理器发送“可执行”指令给任务启动处理器;否则,启动判断处理器发送“不可执行”指令给任务启动处理器;
步骤十五:任务启动处理器接收到“可执行”执行标志结果,将启动指令发送至数据仓库服务器的ETL任务处理器中;
步骤十六:ETL任务处理器开始重新执行相应的异常子任务;
步骤十七:执行记录存储器在此异常子任务开始执行时,记录此异常子任务的名称,开始时间、把此任务设置为“fail”状态,表示此子任务还未成功完成;执行记录存储器在此子任务成功执行结束时,记录此子任务结束时间、把此子任务设置为“success”状态,表示此子任务成功完成,以及更新数据量等信息;如果这个异常子任务在这次执行过程中还是发生了异常,则把这个异常子任务信息通过任务执行监控处理器仍然保存到任务异常信息存储器中,同时对这个异常子任务信息的保存次数加1;
步骤十八:这个异常子任务成功执行后,启动判断处理器从任务配置存储器中读取与这个子任务有关联关系的后续子任务,由于这个子任务已经被成功执行,那么计算后续子任务得到“可执行”的执行标志结果,把“可执行”的执行标志结果传递给任务启动处理器,进而通过ETL任务处理器执行这些后续子任务;如果这些后续子任务在执行过程中发生异常,则把异常子任务信息通过任务执行监控处理器仍然保存到任务异常信息存储器中,同时对此异常子任务信息的保存次数增加1;
步骤十九:当这个异常子任务所关联的所有后续任务都执行后,启动判断处理器接收异常信息发送器发送的异常子任务,开始处理新的异常子任务;
步骤二十:当所有的异常子任务都处理后,异常信息发送器开始把仍存在的异常子任务信息发送给启动判断处理器,开始新一轮处理过程;
步骤二十一:如果某个异常子任务经过3轮处理后还是发生异常,那么对这个异常子任务不再执行,把这个异常子任务的信息发送给系统管理员来进行紧急处理。
CN201210585144.9A 2012-12-30 2012-12-30 一种纠错重启以及自动判断启动的etl调度系统及方法 Active CN103034554B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210585144.9A CN103034554B (zh) 2012-12-30 2012-12-30 一种纠错重启以及自动判断启动的etl调度系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210585144.9A CN103034554B (zh) 2012-12-30 2012-12-30 一种纠错重启以及自动判断启动的etl调度系统及方法

Publications (2)

Publication Number Publication Date
CN103034554A true CN103034554A (zh) 2013-04-10
CN103034554B CN103034554B (zh) 2015-11-18

Family

ID=48021477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210585144.9A Active CN103034554B (zh) 2012-12-30 2012-12-30 一种纠错重启以及自动判断启动的etl调度系统及方法

Country Status (1)

Country Link
CN (1) CN103034554B (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559082A (zh) * 2013-11-04 2014-02-05 北京华胜天成科技股份有限公司 一种基于队列的分布式任务调度方法、装置及系统
CN104462243A (zh) * 2014-11-19 2015-03-25 上海烟草集团有限责任公司 一种结合数据校验的etl调度系统及方法
CN104484167A (zh) * 2014-12-05 2015-04-01 广州华多网络科技有限公司 任务处理方法及装置
CN105190556A (zh) * 2013-04-19 2015-12-23 克罗诺安全公司 允许确定性的实时错误恢复的任务时间分配方法
CN105868190A (zh) * 2015-01-19 2016-08-17 中国移动通信集团河北有限公司 一种在etl中优化任务处理的方法及系统
CN106155786A (zh) * 2016-06-23 2016-11-23 浪潮(北京)电子信息产业有限公司 一种云平台任务管理方法及系统
CN106293920A (zh) * 2016-08-15 2017-01-04 北京票之家科技有限公司 任务调度方法及装置
CN106951315A (zh) * 2017-03-17 2017-07-14 北京搜狐新媒体信息技术有限公司 一种基于etl的数据任务调度方法及系统
CN107241205A (zh) * 2016-03-28 2017-10-10 阿里巴巴集团控股有限公司 异常监控方法及装置
CN107479962A (zh) * 2016-06-08 2017-12-15 阿里巴巴集团控股有限公司 一种用于任务下发的方法与设备
CN107547238A (zh) * 2016-06-29 2018-01-05 阿里巴巴集团控股有限公司 事件监控系统、方法及装置
CN107924357A (zh) * 2015-09-18 2018-04-17 三菱电机株式会社 作业管理装置、作业管理方法和作业管理程序
CN108304413A (zh) * 2017-01-13 2018-07-20 北京京东尚科信息技术有限公司 分布式数据仓库监控方法、装置、电子设备和存储介质
CN108319499A (zh) * 2018-02-07 2018-07-24 麒麟合盛网络技术股份有限公司 任务调度方法及装置
CN108804215A (zh) * 2018-06-12 2018-11-13 北京奇艺世纪科技有限公司 一种任务处理方法、装置以及电子设备
CN109034668A (zh) * 2018-09-05 2018-12-18 平安科技(深圳)有限公司 Etl任务调度方法、装置、计算机设备及存储介质
CN109271435A (zh) * 2018-09-14 2019-01-25 南威软件股份有限公司 一种支持断点续传的数据抽取方法及系统
CN109582396A (zh) * 2017-09-25 2019-04-05 北京国双科技有限公司 一种任务状态处理方法、装置、系统及存储介质
CN109842665A (zh) * 2017-11-29 2019-06-04 北京京东尚科信息技术有限公司 用于任务分配服务器的任务处理方法和装置
CN110008291A (zh) * 2019-04-10 2019-07-12 北京字节跳动网络技术有限公司 数据预警方法、装置、存储介质及电子设备
CN110046041A (zh) * 2019-04-15 2019-07-23 北京中安智达科技有限公司 一种基于celery调度框架的数据采集方法
CN110083441A (zh) * 2018-01-26 2019-08-02 中兴飞流信息科技有限公司 一种分布式计算系统及分布式计算方法
CN110287052A (zh) * 2019-06-25 2019-09-27 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN110399241A (zh) * 2019-07-10 2019-11-01 金蝶软件(中国)有限公司 任务异常处理方法、装置、计算机设备和可读存储介质
CN110597611A (zh) * 2019-09-19 2019-12-20 中国银行股份有限公司 任务调度方法及装置
CN110750371A (zh) * 2019-10-17 2020-02-04 北京创鑫旅程网络技术有限公司 流程执行方法、装置、设备及存储介质
CN110968486A (zh) * 2018-09-29 2020-04-07 北京国双科技有限公司 一种脚本运行方法及装置
CN111026516A (zh) * 2018-10-10 2020-04-17 上海寒武纪信息科技有限公司 异常处理方法、任务分派装置、任务处理系统及存储介质
CN112084014A (zh) * 2020-08-10 2020-12-15 珠海格力电器股份有限公司 一种数据处理方法、装置、设备及介质
CN112732424A (zh) * 2020-12-30 2021-04-30 北京明朝万达科技股份有限公司 一种多任务处理方法方法、系统和介质
CN113485820A (zh) * 2021-08-03 2021-10-08 北京百度网讯科技有限公司 任务调度系统及其实现方法、设备和介质
CN113821326A (zh) * 2021-09-24 2021-12-21 北京天融信网络安全技术有限公司 一种作业调度方法、装置、电子设备和存储介质
US11487776B2 (en) 2020-02-26 2022-11-01 International Business Machines Corporation Managing extract-transform-load operations

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030014463A1 (en) * 2001-07-04 2003-01-16 Atsushi Togawa Task management system
CN101533417A (zh) * 2009-04-28 2009-09-16 阿里巴巴集团控股有限公司 一种实现etl调度的方法及系统
CN101567013A (zh) * 2009-06-02 2009-10-28 阿里巴巴集团控股有限公司 一种etl调度的实现方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030014463A1 (en) * 2001-07-04 2003-01-16 Atsushi Togawa Task management system
CN101533417A (zh) * 2009-04-28 2009-09-16 阿里巴巴集团控股有限公司 一种实现etl调度的方法及系统
CN101567013A (zh) * 2009-06-02 2009-10-28 阿里巴巴集团控股有限公司 一种etl调度的实现方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
尤玉林等: "一种可靠的数据仓库中ETL策略与架构设计", 《计算机工程与应用》 *

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105190556A (zh) * 2013-04-19 2015-12-23 克罗诺安全公司 允许确定性的实时错误恢复的任务时间分配方法
CN105190556B (zh) * 2013-04-19 2019-06-21 克罗诺安全公司 实时多任务系统及其执行方法
CN103559082A (zh) * 2013-11-04 2014-02-05 北京华胜天成科技股份有限公司 一种基于队列的分布式任务调度方法、装置及系统
CN104462243A (zh) * 2014-11-19 2015-03-25 上海烟草集团有限责任公司 一种结合数据校验的etl调度系统及方法
CN104462243B (zh) * 2014-11-19 2018-09-07 上海烟草集团有限责任公司 一种结合数据校验的etl调度系统及方法
CN104484167B (zh) * 2014-12-05 2018-03-09 广州华多网络科技有限公司 任务处理方法及装置
CN104484167A (zh) * 2014-12-05 2015-04-01 广州华多网络科技有限公司 任务处理方法及装置
CN105868190A (zh) * 2015-01-19 2016-08-17 中国移动通信集团河北有限公司 一种在etl中优化任务处理的方法及系统
CN105868190B (zh) * 2015-01-19 2019-08-13 中国移动通信集团河北有限公司 一种在etl中优化任务处理的方法及系统
CN107924357A (zh) * 2015-09-18 2018-04-17 三菱电机株式会社 作业管理装置、作业管理方法和作业管理程序
CN107924357B (zh) * 2015-09-18 2019-07-05 三菱电机株式会社 作业管理装置和作业管理方法
CN107241205A (zh) * 2016-03-28 2017-10-10 阿里巴巴集团控股有限公司 异常监控方法及装置
CN107479962A (zh) * 2016-06-08 2017-12-15 阿里巴巴集团控股有限公司 一种用于任务下发的方法与设备
CN106155786A (zh) * 2016-06-23 2016-11-23 浪潮(北京)电子信息产业有限公司 一种云平台任务管理方法及系统
CN107547238A (zh) * 2016-06-29 2018-01-05 阿里巴巴集团控股有限公司 事件监控系统、方法及装置
CN107547238B (zh) * 2016-06-29 2020-11-24 阿里巴巴集团控股有限公司 事件监控系统、方法及装置
CN106293920A (zh) * 2016-08-15 2017-01-04 北京票之家科技有限公司 任务调度方法及装置
CN108304413A (zh) * 2017-01-13 2018-07-20 北京京东尚科信息技术有限公司 分布式数据仓库监控方法、装置、电子设备和存储介质
CN106951315A (zh) * 2017-03-17 2017-07-14 北京搜狐新媒体信息技术有限公司 一种基于etl的数据任务调度方法及系统
CN106951315B (zh) * 2017-03-17 2020-05-22 北京搜狐新媒体信息技术有限公司 一种基于etl的数据任务调度方法及系统
CN109582396A (zh) * 2017-09-25 2019-04-05 北京国双科技有限公司 一种任务状态处理方法、装置、系统及存储介质
CN109582396B (zh) * 2017-09-25 2022-02-18 北京国双科技有限公司 一种任务状态处理方法、装置、系统及存储介质
CN109842665A (zh) * 2017-11-29 2019-06-04 北京京东尚科信息技术有限公司 用于任务分配服务器的任务处理方法和装置
CN110083441B (zh) * 2018-01-26 2021-06-04 中兴飞流信息科技有限公司 一种分布式计算系统及分布式计算方法
CN110083441A (zh) * 2018-01-26 2019-08-02 中兴飞流信息科技有限公司 一种分布式计算系统及分布式计算方法
CN108319499A (zh) * 2018-02-07 2018-07-24 麒麟合盛网络技术股份有限公司 任务调度方法及装置
CN108319499B (zh) * 2018-02-07 2021-06-04 麒麟合盛网络技术股份有限公司 任务调度方法及装置
CN108804215A (zh) * 2018-06-12 2018-11-13 北京奇艺世纪科技有限公司 一种任务处理方法、装置以及电子设备
CN108804215B (zh) * 2018-06-12 2021-06-22 北京奇艺世纪科技有限公司 一种任务处理方法、装置以及电子设备
CN109034668A (zh) * 2018-09-05 2018-12-18 平安科技(深圳)有限公司 Etl任务调度方法、装置、计算机设备及存储介质
CN109034668B (zh) * 2018-09-05 2024-01-16 平安科技(深圳)有限公司 Etl任务调度方法、装置、计算机设备及存储介质
CN109271435A (zh) * 2018-09-14 2019-01-25 南威软件股份有限公司 一种支持断点续传的数据抽取方法及系统
CN109271435B (zh) * 2018-09-14 2022-03-04 南威软件股份有限公司 一种支持断点续传的数据抽取方法及系统
CN110968486A (zh) * 2018-09-29 2020-04-07 北京国双科技有限公司 一种脚本运行方法及装置
CN111026516A (zh) * 2018-10-10 2020-04-17 上海寒武纪信息科技有限公司 异常处理方法、任务分派装置、任务处理系统及存储介质
CN111026516B (zh) * 2018-10-10 2022-12-02 上海寒武纪信息科技有限公司 异常处理方法、任务分派装置、任务处理系统及存储介质
CN110008291A (zh) * 2019-04-10 2019-07-12 北京字节跳动网络技术有限公司 数据预警方法、装置、存储介质及电子设备
CN110008291B (zh) * 2019-04-10 2022-03-11 北京字节跳动网络技术有限公司 数据预警方法、装置、存储介质及电子设备
CN110046041B (zh) * 2019-04-15 2021-04-09 北京中安智达科技有限公司 一种基于celery调度框架的数据采集方法
CN110046041A (zh) * 2019-04-15 2019-07-23 北京中安智达科技有限公司 一种基于celery调度框架的数据采集方法
CN110287052B (zh) * 2019-06-25 2022-01-28 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN110287052A (zh) * 2019-06-25 2019-09-27 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN110399241A (zh) * 2019-07-10 2019-11-01 金蝶软件(中国)有限公司 任务异常处理方法、装置、计算机设备和可读存储介质
CN110399241B (zh) * 2019-07-10 2023-12-12 金蝶软件(中国)有限公司 任务异常处理方法、装置、计算机设备和可读存储介质
CN110597611A (zh) * 2019-09-19 2019-12-20 中国银行股份有限公司 任务调度方法及装置
CN110750371A (zh) * 2019-10-17 2020-02-04 北京创鑫旅程网络技术有限公司 流程执行方法、装置、设备及存储介质
US11487776B2 (en) 2020-02-26 2022-11-01 International Business Machines Corporation Managing extract-transform-load operations
CN112084014A (zh) * 2020-08-10 2020-12-15 珠海格力电器股份有限公司 一种数据处理方法、装置、设备及介质
CN112732424A (zh) * 2020-12-30 2021-04-30 北京明朝万达科技股份有限公司 一种多任务处理方法方法、系统和介质
CN113485820A (zh) * 2021-08-03 2021-10-08 北京百度网讯科技有限公司 任务调度系统及其实现方法、设备和介质
CN113821326A (zh) * 2021-09-24 2021-12-21 北京天融信网络安全技术有限公司 一种作业调度方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN103034554B (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
CN103034554A (zh) 一种纠错重启以及自动判断启动的etl调度系统及方法
CN101477543B (zh) 用于自动化etl应用的系统和方法
CN101017546A (zh) 一种用于可分类数据批处理的方法及装置
CN111400011B (zh) 一种实时任务调度方法、系统、设备及可读存储介质
CN112035233A (zh) 大数据批量作业任务调度方法及装置
CN105630588A (zh) 一种分布式作业调度方法和系统
CN110611707A (zh) 一种任务调度的方法及装置
CN105573840A (zh) 工作流运行期的事件处理方法和装置
CN101639803A (zh) 多线程应用系统的异常处理方法和异常处理装置
CN109426550A (zh) 资源的调度方法及设备
CN109947532A (zh) 一种教育云平台中的大数据任务调度方法
CN113268334A (zh) Rpa机器人的调度方法、装置、设备以及存储介质
CN110019144A (zh) 一种大数据平台数据运维的方法和系统
CN116089040A (zh) 业务流程的调度方法及其装置、电子设备及存储介质
CN111177232B (zh) 一种数据处理方法、装置、系统和存储介质
CN104731900A (zh) 一种Hive调度方法及装置
CN115185825A (zh) 接口测试的调度方法及装置
CN111159188B (zh) 基于DataWorks实现准实时大数据量的处理方法
CN112965798A (zh) 一种基于分布式多线程的大数据处理方法及系统
CN110795224A (zh) 一种基于Ansible的自动化运维系统和方法
CN117251267A (zh) 一种作业调度方法、装置、设备及存储介质
CN108268494A (zh) 一种数据处理与控制逻辑分离的etl调度方法和装置
WO2012142962A1 (zh) 一种用于文件装载的方法和装置
CN105447680A (zh) 基于工作流的订单处理方法及系统
CN117112152A (zh) 分布式调度方法、装置、电子设备和计算机程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant