CN105138666B - 一种数据处理的方法及终端 - Google Patents

一种数据处理的方法及终端 Download PDF

Info

Publication number
CN105138666B
CN105138666B CN201510560108.0A CN201510560108A CN105138666B CN 105138666 B CN105138666 B CN 105138666B CN 201510560108 A CN201510560108 A CN 201510560108A CN 105138666 B CN105138666 B CN 105138666B
Authority
CN
China
Prior art keywords
task
work flow
goal
dependence
race
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510560108.0A
Other languages
English (en)
Other versions
CN105138666A (zh
Inventor
刘远荣
周群辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD
Original Assignee
SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD filed Critical SHENZHEN CHUANGMENG TIANDI TECHNOLOGY CO LTD
Priority to CN201510560108.0A priority Critical patent/CN105138666B/zh
Publication of CN105138666A publication Critical patent/CN105138666A/zh
Application granted granted Critical
Publication of CN105138666B publication Critical patent/CN105138666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种数据处理的方法及终端。一种数据处理的方法包括:确定第一作业流程中的目标任务和第二作业流程中的连接任务;将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。采用本发明实施例可降低业务开发工作量,同时,可实现两个作业流程之间的重跑操作。

Description

一种数据处理的方法及终端
技术领域
本发明实施例涉及数据库技术领域,尤其涉及到一种数据处理的方法及终端。
背景技术
在数据库的使用中,抽取、转换和加载(英文:Extract Transform Load,缩写:ETL)的整个过程可以描述为:将数据从源端经抽取、转换、加载至目的端的过程。现有技术中,开源或商业的ETL调度工具,都具有ETL作业流程的功能,每个作业流程内部各个任务之间存在依赖关系,且在实现ETL调度的过程中,作业流程间的任务可能存在依赖。在实现不同作业流程之间的重跑操作的过程中,需要说明的是,不同的作业流程之间的重跑操作实现的前提是建立在该不同的作业流程之间具有任务依赖关系。而现有ETL调度工具,对于作业流程之间的任务依赖通常有两种情况:一种是ETL调度工具本身不支持作业流程间的依赖,需要通过业务开发来解决,以两个作业流程为例进行说明,该两个作业流程分别为第一作业流程和第二作业流程,由于ETL不支持作业流程之间的依赖关系,需要开发一个连接任务,用于置于第一作业流程与第二作业流程之间,基于该连接任务建立第一作业流程与第二作业流程之间的任务依赖关系,因此,会增加业务开发的工作量;另一种是对整个作业流程的依赖,这种情况由于依赖关系由业务逻辑实现,以两个作业流程为例进行说明,该两个作业流程分别为第一作业流程和第二作业流程,第一作业流程和第二作业流程之间的任务依赖关系由业务逻辑实现,该业务逻辑仅实现了该两个作业流程之间的整体任务依赖关系,而尚未建立该第一作业流程中的各任务和第二作业流程中的各任务之间的任务依赖关系,因而,ETL调度工具不能较好对该情况下的作业流程进行控制,即:ETL调度工具实现重跑操作只能在单个作业流程中进行,而不能较好实现两个作业流程间的重跑操作,进一步地,倘若不能执行作业间的重跑操作,那么在多个作业流程中存在故障任务的情况下,便无法快速搜索到该故障任务。
发明内容
本发明实施例提供了一种数据处理的方法及终端,以期降低业务开发的工作量,同时,可实现多个作业流程之间的重跑操作,并在该多个作业流程中存在故障任务的情况下,通过该重跑操作快速查找到故障任务。
本发明实施例第一方面提供了一种数据处理的方法,包括:
确定第一作业流程中的目标任务和第二作业流程中的连接任务;
将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;
基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;
在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
相应地,本发明实施例第二方面提供了一种终端,包括:
第一确定单元,用于确定第一作业流程中的目标任务和第二作业流程中的连接任务;
建立单元,用于将所述第一确定单元确定的目标任务引用添加到第二作业流程中,并建立所述目标任务与所述第一确定单元确定的连接任务之间的第一任务依赖关系;
第二确定单元,用于基于所述建立单元建立的所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;
执行单元,用于在接收到用户输入的预设重跑指令的情况下,根据所述第二确定单元确定的第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
本发明实施例确定第一作业流程中的目标任务和第二作业流程中的连接任务;将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。采用本发明实施例可在确定了第一作业流程中的目标任务和第二作业流程中的连接任务的基础上,建立该目标任务和连接任务之间的任务依赖关系,因而,不必在该第一作业流程和第二作业流程之间开发新的任务作为连接任务,可降低业务开发的工作量。另外,由于第一流程作业的各任务之间具有任务依赖关系和第二作业流程的各任务之间具有任务依赖关系,因而,可根据目标任务和连接任务建立了任务依赖关系推断出第一作业流程和第二作业流程之间的任务依赖关系,从而,当目标任务执行重跑操作之后,第二作业流程中的各任务之间便可实现重跑操作,由于该重跑操作的实现基于ETL调度工具,因此,可解决通过业务逻辑实现第一作业流程和第二作业流程之间的任务依赖关系而导致无法实现作业流程之间的重跑操作的问题。以此类推,本实施例可实现多个作业流程的重跑操作,进一步地,在该多个作业流程出现故障的情况下,利用该重跑操作可快速查找到该多个作业流程中的故障任务。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例、描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据处理的方法的第一实施例的流程示意图;
图1a为本发明实施例提供的一种数据处理的方法的具体实例图;
图2为本发明实施例提供的一种数据处理的方法的第二实施例的流程示意图;
图3为本发明实施例提供的一种数据处理的方法的第三实施例的流程示意图;
图4a为本发明实施例提供的一种终端的第一实施例的结构示意图;
图4b为本发明实施例提供的一种终端的第一实施例的又一结构示意图;
图4c为本发明实施例提供的一种终端的第一实施例的又一结构示意图;
图4d为本发明实施例提供的一种终端的第一实施例的又一结构示意图;
图4e为本发明实施例提供的一种终端的第一实施例的又一结构示意图;
图5为本发明实施例提供的一种终端的第二实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明实施例保护的范围。
实现中,本发明实施例中,终端可以包括但不限于:笔记本电脑、手机、平板电脑、智能可穿戴设备等等。终端的系统指设备的操作系统,可以包括但不限于:Android系统、塞班系统、Windows系统、IOS(苹果公司开发的移动操作系统)等等。需要说明的是,Android终端指Android系统的终端,塞班终端指塞班系统的终端,等等。上述终端仅是举例,而非穷举,包含但不限于上述终端。
本发明实施例结合图1至图5对本发明实施例提供的一种数据处理的方法及终端进行描述。
请参阅图1,图1是本发明实施例提供的一种数据处理的方法的第一实施例流程示意图。本实施例中所描述的数据处理的方法,包括以下步骤:
S101、确定第一作业流程中的目标任务和第二作业流程中的连接任务。
具体实现中,终端可确定第一作业流程中的目标任务和第二作业流程中的连接任务。其中,第一作业流程至少包含一个任务,第二作业流程也至少包含一个任务,在第一作业流程中包含多个任务的情况下,可选择第一作业流程中的一个任务作为目标任务,在第二作业流程中包含多个任务的情况下,可将第二作业流程中的一个任务作为连接任务,将该目标任务标记为虚拟任务,建立目标任务和连接任务之间的任务依赖关系,特别地,在第一作业流程只有1个任务的情况下,可将该任务作为目标任务,确定第二作业流程中的连接任务,并将该目标任务标记为虚拟任务,以建立目标任务与连接任务之间的任务依赖关系。通常情况下,第一作业流程的所有任务之间都存在着任务依赖关系,第二作业流程中的所有任务之间也都存在着任务依赖关系。
S102、将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系。
具体实现中,终端可将目标任务引用添加到第二作业流程中,建立该目标任务与该连接任务之间的第一任务依赖关系,以通过该第一任务依赖关系将第一作业流程和第二作业流程之间建立任务依赖关系。
可选地,终端可将目标任务标记为第二作业流程中的虚拟任务,然后建立虚拟任务和第二作业流程中的连接任务之间的任务依赖关系。
S103、基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系。
具体实现中,终端可基于目标任务与连接任务之间的第一任务依赖关系确定目标任务和所述第二作业流程各任务之间的第二任务依赖关系。其中,由于第二作业流程的所有任务之间存在着任务依赖关系,只要将目标任务和连接任务之间建立任务依赖关系,便可将目标任务和第二作业流程的各任务之间建立任务依赖关系,由于第一作业流程的各任务之间也存在着任务依赖关系,同时,也建立了第一作业流程和第二作业流程之间的任务依赖关系。
S104、在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
具体实现中,终端可在接收到用户输入的预设重跑指令的情况下,根据第二任务依赖关系控制引用添加目标任务之后的第二作业流程执行重跑操作,其中,预设重跑指令用于控制目标任务执行重跑操作。即在目标任务执行完重跑操作之后,目标任务之后的连接任务也开始进行重跑操作,连接任务执行完重跑操作之后,根据第二任务依赖关系确定连接任务的子任务,从而,连接任务的子任务也执行重跑操作,直到,第二任务依赖关系中的最后一个子任务执行完重跑操作,则预设重跑执行完毕。
可选地,终端可第一作业流程中的任务依赖关系确定目标任务的父任务,该父任务为目标任务的前一个任务,在预设重跑指令为控制该父任务执行重跑操作的情况下,在该父任务执行完重跑操作的情况下,目标任务开始执行重跑操作,在该目标任务执行完重跑操作的情况下,第二作业流程中的各任务开始执行重跑操作。进一步地,终端可第一作业流程中的任务依赖关系确定目标任务的前面的任务,在目标任务的前面任一任务执行完重跑操作之后,均可按照重跑顺序,让目标任务进行重跑操作,在目标任务执行完之后,第二作业流程中的连接任务开始重跑操作,在该连接任务执行完之后,第二作业流程中的其他任务开始重跑操作。
作为一种可能的实施方式,终端在接收到用户输入的预设重跑指令的情况下,根据第二任务依赖关系控制引用添加所述目标任务之后的第二作业流程实现重跑操作,所述预设重跑指令用于控制所述目标任务进行重跑操作之后,可在接收到展示指令的情况下,在终端的显示器上展示所述第二作业流程的任务关系图,所述任务关系图用于展示所述第二作业流程的任务依赖关系。
例如,如图1a所示,图1a为本发明实施例提供的一种数据处理的方法的具体实例图,可以看出,第一作业流程中包括:任务A、任务B、任务C、任务D和任务E,第二作业流程中包括:任务1、任务2和任务3,终端确定第一作业流程中的任务D为目标任务和第二作业流程中的任务1为连接任务,将任务D引用添加到第二作业流程中,即将任务D标记为虚拟任务,而将任务D和任务1建立第一任务依赖关系,而第二作业任务自身存在任务依赖关系,从而,可建立任务D和第二作业流程的各任务之间的任务依赖关系,又由于第一作业流程中的各任务之间存在任务依赖关系,这样就建立了第一作业流程和第二作业流程之间的任务依赖关系,基于该任务依赖关系,可在任务D在执行重跑完操作的时候,任务1开始执行重跑操作,接着,根据第二作业流程的各任务之间的任务依赖关系确定第二作业流程中的各任务的重跑操作执行顺序,根据该执行顺序第二作业流程中的各任务依次执行重跑操作。同时,假设图1a中的任务E出错,在任务D执行重跑操作之后,并不会影响第二作业流程中的各任务的重跑操作的执行。
需要说明的是,本实施例可应用于两个作业流程之间的协同工作,还可以用于多个作业流程之间的协同工作,倘若多个作业流程之间的协同工作,协同工作的方式主要通过重跑操作加以实现,例如,以三个作业流程为例,三个作业流程依次为:第一作业流程、第二作业流程和第三作业流程,则重跑操作可为:第一作业流程开始重跑操作,第一作业流程完成了重跑操作,第二作业流程开始重跑操作,在第二作业流程完成了重跑操作,第三作业流程开始重跑操作。
由上所述,采用本发明实施例可在确定了第一作业流程中的目标任务和第二作业流程中的连接任务的基础上,建立该目标任务和连接任务之间的任务依赖关系,因而,不必在该第一作业流程和第二作业流程之间开发新的任务作为连接任务,可降低业务开发的工作量。另外,由于第一流程作业的各任务之间具有任务依赖关系和第二作业流程的各任务之间具有任务依赖关系,因而,可根据目标任务和连接任务建立了任务依赖关系推断出第一作业流程和第二作业流程之间的任务依赖关系,从而,当目标任务执行重跑操作之后,第二作业流程中的各任务之间便可实现重跑操作,由于该重跑操作的实现基于ETL调度工具,因此,可解决通过业务逻辑实现第一作业流程和第二作业流程之间的任务依赖关系而导致无法实现作业流程之间的重跑操作的问题。
请参阅图2,图2是本发明实施例提供的一种数据处理的方法的第二实施例流程示意图。本实施例中所描述的数据处理的方法,包括以下步骤:
S201、确定所述第一作业流程中的所述M个任务与所述第二作业流程的所述N个任务之间的任务依赖紧密值,以得到M×N个任务依赖紧密值。
具体实现中,终端可确定第一作业流程中的M个任务与第二作业流程的N个任务之间的任务依赖紧密值,以得到M×N个任务依赖紧密值。其中,终端可先确定第一作业流程中的任一任务与第二作业流程中的各任务之间的任务依赖紧密值,从而,可得到N个任务依赖依赖紧密值。然后,再确认第一作业流程中的下一个任务与第二作业流程中的各任务之间的任务依赖紧密值。
S202、选取所述M×N个任务依赖紧密值中的最大值,并将所述最大值对应的所述第一作业流程中的任务作为目标任务和所述第二作业流程中的任务作为连接任务。
具体实现中,终端可选取M×N个任务依赖紧密值中的最大值,并将该最大值对应的第一作业流程中的任务作为目标任务和第二作业流程中的任务作为连接任务。
S203、将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系。
具体实现中,终端可将目标任务引用添加到第二作业流程中,建立该目标任务与该连接任务之间的第一任务依赖关系,以通过该第一任务依赖关系将第一作业流程和第二作业流程之间建立任务依赖关系。
可选地,终端可将目标任务标记为第二作业流程中的虚拟任务,然后建立虚拟任务和第二作业流程中的连接任务之间的任务依赖关系。
S204、基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系。
具体实现中,终端可基于目标任务与连接任务之间的第一任务依赖关系确定目标任务和所述第二作业流程各任务之间的第二任务依赖关系。其中,由于第二作业流程的所有任务之间存在着任务依赖关系,只要将目标任务和连接任务之间建立任务依赖关系,便可将目标任务和第二作业流程的各任务之间建立任务依赖关系,由于第一作业流程的各任务之间也存在着任务依赖关系,同时,也建立了第一作业流程和第二作业流程之间的任务依赖关系。
S205、在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
具体实现中,终端可在接收到用户输入的预设重跑指令的情况下,根据第二任务依赖关系控制引用添加目标任务之后的第二作业流程执行重跑操作,其中,预设重跑指令用于控制目标任务执行重跑操作。即在目标任务执行完重跑操作之后,目标任务之后的连接任务也开始进行重跑,连接任务执行完重跑操作之后,根据第二任务依赖关系确定连接任务的子任务,从而,连接任务的子任务也执行重跑操作,直到,第二任务依赖关系中的最后一个子任务执行完重跑操作,则预设重跑指令执行完毕。
可选地,终端可第一作业流程中的任务依赖关系确定目标任务的父任务,在预设重跑指令为控制该父任务执行重跑操作的情况下,在该父任务执行完重跑操作的情况下,目标任务开始执行重跑操作,在该目标任务执行完重跑操作的情况下,第二作业流程中的各任务开始执行重跑操作。
由上所述,本实施例提供了一种可在两个作业流程之间确定目标任务和连接任务的方式,可快速确定目标任务和连接任务,并可在确定了第一作业流程中的目标任务和第二作业流程中的连接任务的基础上,建立该目标任务和连接任务之间的任务依赖关系,因而,不必在该第一作业流程和第二作业流程之间开发新的任务作为连接任务,可降低业务开发的工作量。另外,由于第一流程作业的各任务之间具有任务依赖关系和第二作业流程的各任务之间具有任务依赖关系,因而,可根据目标任务和连接任务建立了任务依赖关系推断出第一作业流程和第二作业流程之间的任务依赖关系,从而,当目标任务执行重跑操作之后,第二作业流程中的各任务之间便可实现重跑操作,由于该重跑操作的实现基于ETL调度工具,因此,可解决通过业务逻辑实现第一作业流程和第二作业流程之间的任务依赖关系而导致无法实现作业流程之间的重跑操作的问题。
请参阅图3,图3是本发明实施例提供的一种数据处理的方法的第三实施例流程示意图。本实施例中所描述的数据处理的方法,包括以下步骤:
S301、确定第一作业流程中的目标任务和第二作业流程中的连接任务。
具体实现中,终端可确定第一作业流程中的目标任务和第二作业流程中的连接任务。其中,第一作业流程至少包含一个任务,第二作业流程也至少包含一个任务,在第一作业流程中包含多个任务的情况下,可选择第一作业流程中的一个任务作为目标任务,在第二作业流程中包含多个任务的情况下,可将第二作业流程中的一个任务作为连接任务,将该目标任务标记为虚拟任务,建立目标任务和连接任务之间的任务依赖关系,特别地,在第一作业流程只有1个任务的情况下,可将该任务作为目标任务,确定第二作业流程中的连接任务,并将该目标任务标记为虚拟任务,以建立目标任务与连接任务之间的任务依赖关系。通常情况下,第一作业流程的所有任务之间都存在着任务依赖关系,第二作业流程中的所有任务之间也都存在着任务依赖关系。
S302、将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系。
具体实现中,终端可将目标任务引用添加到第二作业流程中,建立该目标任务与该连接任务之间的第一任务依赖关系,以通过该第一任务依赖关系将第一作业流程和第二作业流程之间建立任务依赖关系。
可选地,终端可将目标任务标记为第二作业流程中的虚拟任务,然后建立虚拟任务和第二作业流程中的连接任务之间的任务依赖关系。
S303、基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系。
具体实现中,终端可基于目标任务与连接任务之间的第一任务依赖关系确定目标任务和所述第二作业流程各任务之间的第二任务依赖关系。其中,由于第二作业流程的所有任务之间存在着任务依赖关系,只要将目标任务和连接任务之间建立任务依赖关系,便可将目标任务和第二作业流程的各任务之间建立任务依赖关系,由于第一作业流程的各任务之间也存在着任务依赖关系,同时,也建立了第一作业流程和第二作业流程之间的任务依赖关系。
S304、在接收到用户输入的预设重跑指令的情况下,控制所述目标任务执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
具体实现中,终端在接收到用户输入的预设重跑指令的情况下,控制目标任务执行重跑操作,该预设重跑指令用于控制该目标任务执行重跑操作。
S305、根据所述第二任务依赖关系确定所述目标任务的N个子任务的重跑顺序。
S306、根据所述重跑顺序控制所述N个子任务执行重跑操作,并在子任务i出现故障的情况下,终止所述重跑操作,其中,所述子任务i为所述N个子任务中在所述重跑操作的过程中最先出现的故障子任务。
具体实现中,终端可根据第二任务依赖关系确定目标任务的N个子任务的重跑顺序,并根据重跑顺序控制N个子任务执行重跑操作。由于第二任务依赖关系是目标任务和第二作业流程之间的任务依赖关系,也就是目标任务和第二作业流程中的各任务之间的任务依赖关系,终端可根据该第二任务依赖关系确定目标任务的N个子任务的重跑顺序,从而,根据该重跑顺序控制该N个子任务执行重跑操作。在执行重跑操作过程中,子任务i出现故障的情况下,终止该重跑操作,其中,子任务i为N个子任务中在重跑操作的过程中最先出现的故障子任务。例如,两个作业流程中的重跑操作顺序为目标任务、连接任务、子任务A、子任务B和子任务C,倘若子任务A出现故障,那么在目标任务开始执行重跑操作之后,连接任务开始执行重跑操作,执行完毕之后,由于子任务A终止重跑操作,在子任务A修复之后,倘若子任务C出现故障,那么在目标任务开始执行重跑操作之后,连接任务、子任务A和子任务B依次进行重跑操作,在子任务B执行完毕之后,由于子任务C出现故障,则终止重跑操作。倘若所有任务均没有故障,则在目标任务执行完重跑操作之后,连接任务、子任务A、子任务B和子任务C进行重跑操作,则在子任务C执行完重跑操作之后,可提示用户重跑操作结束。
本实施例可应用于多个作业流程之间的故障诊断。而传统方式中多个作业流程倘若未建立任务依赖关系,或者多个作业流程之间的任务依赖关系采用业务逻辑实现,则在进行故障诊断时,均需要分别对单个作业流程采用重跑操作进行故障诊断,因而,相对于该传统方式可提高诊断效率。例如,假设有100个作业流程,其中某个作业流程中的某个子任务出现故障,那么本实施可对第一作业流程进行重跑操作,倘若,第一作业流程中未发现故障子任务,则在第一作业流程中确定目标任务,在其他99个作业流程中确定连接任务,在此基础上,建立该100个作业流程之间的任务依赖关系,然后,进行重跑操作,则可通过一次重跑操作快速找到该100个作业中的故障子任务,因而,只需要至多2次重跑操作,可从100个作业流程中找到故障子任务,而现有技术中,若100个作业流程中的每个作业流程均进行重跑操作,那么,需要较多次数尝试才能找到故障子任务,因而,本实施例中提供的故障诊断方式可提高查找故障子任务的效率。进一步地,采用业务开发建立多个作业流程之间的任务依赖关系的方式应用在故障诊断同样可达到本实施例的诊断效率,但是,该故障诊断方式增加了业务开发量,因而,增加了实现的复杂度。而且,实现过程中,倘若业务开发的连接任务出现故障,会增加了新的故障任务。
作为一种可能的实施方式,倘若第二作业流程中的各任务都正常的情况下,终端在接收到用户输入的预设重跑指令的情况下,该预设重跑指令用于控制目标任务执行重跑操作控制该目标任务执行重跑操作,并根据该第二任务依赖关系确定目标任务的N个子任务的重跑顺序,根据重跑顺序控制N个子任务执行重跑操作。
总之,本实施例可在多个作业流程的情况下,通过重跑操作对故障任务进行快速搜索。即在重跑操作过程中,倘若遇到故障任务,则终端重跑操作,从而,及时告知用户故障任务的位置。
由上所述,采用本发明实施例可在确定了第一作业流程中的目标任务和第二作业流程中的连接任务的基础上,建立该目标任务和连接任务之间的任务依赖关系,因而,不必在该第一作业流程和第二作业流程之间开发新的任务作为连接任务,可降低业务开发的工作量。另外,由于第一流程作业的各任务之间具有任务依赖关系和第二作业流程的各任务之间具有任务依赖关系,因而,可根据目标任务和连接任务建立了任务依赖关系推断出第一作业流程和第二作业流程之间的任务依赖关系,即可确定目标任务和第二作业流程中的各任务的重跑操作顺序,从而,当目标任务执行重跑操作之后,第二作业流程中的各任务之间便可实现重跑操作,由于该重跑操作的实现基于ETL调度工具,因此,可解决通过业务逻辑实现第一作业流程和第二作业流程之间的任务依赖关系而导致无法实现作业流程之间的重跑操作的问题。以此类推,本实施例可实现多个作业流程的重跑操作,进一步地,在该多个作业流程出现故障的情况下,利用该重跑操作可快速查找到该多个作业流程中的故障任务。
请参阅图4a,图4a是本发明实施例提供的一种终端的第一实施例的结构示意图。图4a中本实施例中所描述的终端可包括:第一确定单元401、建立单元402、第二确定单元403和执行单元404,具体如下:
第一确定单元401,用于确定第一作业流程中的目标任务和第二作业流程中的连接任务。
具体实现中,第一确定单元401可确定第一作业流程中的目标任务和第二作业流程中的连接任务。其中,第一作业流程至少包含一个任务,第二作业流程也至少包含一个任务,在第一作业流程中包含多个任务的情况下,可选择第一作业流程中的一个任务作为目标任务,在第二作业流程中包含多个任务的情况下,可将第二作业流程中的一个任务作为连接任务,将该目标任务标记为虚拟任务,建立目标任务和连接任务之间的任务依赖关系,特别地,在第一作业流程只有1个任务的情况下,可将该任务作为目标任务,确定第二作业流程中的连接任务,并将该目标任务标记为虚拟任务,以建立目标任务与连接任务之间的任务依赖关系。通常情况下,第一作业流程的所有任务之间都存在着任务依赖关系,第二作业流程中的所有任务之间也都存在着任务依赖关系。
建立单元402,用于将所述第一确定单元401确定的目标任务引用添加到第二作业流程中,并建立所述目标任务与所述第一确定单元401确定的连接任务之间的第一任务依赖关系。
具体实现中,建立单元402可将目标任务引用添加到第二作业流程中,建立该目标任务与该连接任务之间的第一任务依赖关系,以通过该第一任务依赖关系将第一作业流程和第二作业流程之间建立任务依赖关系。
第二确定单元403,用于基于所述建立单元402建立的所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系。
具体实现中,第二确定单元403可基于目标任务与连接任务之间的第一任务依赖关系确定目标任务和所述第二作业流程各任务之间的第二任务依赖关系。其中,由于第二作业流程的所有任务之间存在着任务依赖关系,只要将目标任务和连接任务之间建立任务依赖关系,便可将目标任务和第二作业流程的各任务之间建立任务依赖关系,由于第一作业流程的各任务之间也存在着任务依赖关系,同时,也建立了第一作业流程和第二作业流程之间的任务依赖关系。
执行单元404,用于在接收到用户输入的预设重跑指令的情况下,根据所述第二确定单元403确定的第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
具体实现中,执行单元404可在接收到用户输入的预设重跑指令的情况下,根据第二任务依赖关系控制引用添加目标任务之后的第二作业流程执行重跑操作,其中,预设重跑指令用于控制所述目标任务执行重跑操作。即在目标任务执行完重跑操作之后,目标任务之后的连接任务也开始进行重跑,连接任务执行完重跑操作之后,根据第二任务依赖关系确定连接任务的子任务,从而,连接任务的子任务也执行重跑操作,直到,第二任务依赖关系中的最后一个子任务执行完重跑操作,则预设重跑指令执行完毕。
可选地,第三确定单元(图中未标出)可第一作业流程中的任务依赖关系确定目标任务的父任务,在预设重跑指令为控制该父任务执行重跑操作的情况下,执行单元404可在该父任务执行完重跑操作的情况下,目标任务开始执行重跑操作,在该目标任务执行完重跑操作的情况下,第二作业流程中的各任务开始执行重跑操作。
例如,如图1a所示,图1a为本发明实施例提供的一种数据处理的方法的具体实例图,可以看出,第一作业流程中包括:任务A、任务B、任务C、任务D和任务E,第二作业流程中包括:任务1、任务2和任务3,终端确定第一作业流程中的任务D为目标任务和第二作业流程中的任务1为连接任务,将任务D引用添加到第二作业流程中,即将任务D标记为虚拟任务,而将任务D和任务1建立第一任务依赖关系,而第二作业任务自身存在任务依赖关系,从而,可建立任务D和第二作业流程的各任务之间的任务依赖关系,又由于第一作业流程中的各任务之间存在任务依赖关系,这样就建立了第一作业流程和第二作业流程之间的任务依赖关系,基于该任务依赖关系,可在任务D在执行重跑完操作的时候,任务1开始执行重跑操作,接着,根据第二作业流程的各任务之间的任务依赖关系确定第二作业流程中的各任务的重跑操作执行顺序,根据该执行顺序第二作业流程中的各任务依次执行重跑操作。同时,假设图1a中的任务E出错,在任务D执行重跑操作之后,并不会影响第二作业流程中的各任务的重跑操作的执行。
作为一种可能的实施方式,如图4b所示,图4a中本发明实施例所描述的终端的第一确定单元401可包括:确定子单元4011和选取单元4012,具体如下:
确定子单元4011,用于确定所述第一作业流程中的所述M个任务与所述第二作业流程的所述N个任务之间的任务依赖紧密值,以得到M×N个任务依赖紧密值。
具体实现中,确定子单元4011可确定第一作业流程中的M个任务与第二作业流程的N个任务之间的任务依赖紧密值,以得到M×N个任务依赖紧密值。其中,终端可先确定第一作业流程中的任一任务与第二作业流程中的各任务之间的任务依赖紧密值,从而,可得到N个任务依赖依赖紧密值。然后,再确认第一作业流程中的下一个任务与第二作业流程中的各任务之间的任务依赖紧密值。
选取单元4012,用于选取所述确定子单元确定的M×N个任务依赖紧密值中的最大值,并将所述最大值对应的所述第一作业流程中的任务作为目标任务和所述第二作业流程中的任务作为连接任务。
具体实现中,选取单元4012可选取M×N个任务依赖紧密值中的最大值,并将该最大值对应的第一作业流程中的任务作为目标任务和第二作业流程中的任务作为连接任务。
作为一种可能的实施方式,如图4c所示,图4a中本发明实施例所描述的终端的建立单元402可包括:标记单元4021和建立子单元4022,具体如下:
标记单元4021,用于将所述目标任务标记为所述第二作业流程中的虚拟任务。
建立子单元4022,用于建立所述虚拟任务和所述第二作业流程中的连接任务之间的任务依赖关系。
作为一种可能的实施方式,如图4d所示,图4a中本发明实施例所描述的终端的执行单元404可包括:标记单元4041和建立子单元4042,具体如下:
控制单元4041,用于在接收到用户输入的预设重跑指令的情况下,控制所述目标任务执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
第三确定单元4042,用于根据所述第二任务依赖关系确定所述目标任务的N个子任务的重跑顺序。
执行子单元4043,用于根据所述第三确定单元4042确定的重跑顺序控制所述N个子任务执行重跑操作。
作为一种可能的实施方式,在子任务i出现故障的情况下,其中,所述子任务i为所述N个子任务中在所述重跑操作的过程中最先出现的故障子任务,执行子单元4043还具体用于:
在执行完所述子任务j之后,终止所述重跑操作,所述子任务j为所述子任务i的前一个任务。
作为一种可能的实施方式,如图4e所示,图4a中本发明实施例所描述的终端还可包括:展示单元405,具体如下:
展示单405,用于在接收到展示指令的情况下,所述第二作业流程的任务关系图,并在终端的显示器上进行展示所述任务关系图。
本发明实施例所描述的终端可确定第一作业流程中的目标任务和第二作业流程中的连接任务;将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。采用本发明实施例可在确定了第一作业流程中的目标任务和第二作业流程中的连接任务的基础上,建立该目标任务和连接任务之间的任务依赖关系,因而,不必在该第一作业流程和第二作业流程之间开发新的任务作为连接任务,可降低业务开发的工作量。另外,由于第一流程作业的各任务之间具有任务依赖关系和第二作业流程的各任务之间具有任务依赖关系,因而,可根据目标任务和连接任务建立了任务依赖关系推断出第一作业流程和第二作业流程之间的任务依赖关系,从而,当目标任务执行重跑操作之后,第二作业流程中的各任务之间便可实现重跑操作,由于该重跑操作的实现基于ETL调度工具,因此,可解决通过业务逻辑实现第一作业流程和第二作业流程之间的任务依赖关系而导致无法实现作业流程之间的重跑操作的问题。以此类推,本实施例可实现多个作业流程的重跑操作,进一步地,在该多个作业流程出现故障的情况下,利用该重跑操作可快速查找到该多个作业流程中的故障任务。
请参阅图5,图5为本发明实施例提供的一种终端的第二实施例的结构示意图。本实施例中所描述的终端包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000可为触控面板、普通PC、液晶屏、触控屏、触控按钮等。
上述存储器4000可以是高速RAM存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码,执行如下操作:
上述处理器3000,用于:
确定第一作业流程中的目标任务和第二作业流程中的连接任务;
将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;
基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;
在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
作为一种可能的实施方式,第一作业流程包含M个任务,所述M为大于或等于1的整数,第二作业流程包含N个任务,所述N为大于或等于1的整数,上述处理器3000确定第一作业流程中的目标任务和第二作业流程中的连接任务,具体为:
确定所述第一作业流程中的所述M个任务与所述第二作业流程中的根任务依赖紧密值,以得到M个任务依赖紧密值;
选取所述M个任务依赖紧密值中的最大值对应的任务作为目标任务。
作为一种可能的实施方式,上述处理器3000在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作,具体为:
在接收到用户输入的预设重跑指令的情况下,控制所述目标任务执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作;
根据所述第二任务依赖关系确定所述目标任务的N个子任务的重跑顺序;
根据所述重跑顺序控制所述N个子任务执行重跑操作。
作为一种可能的实施方式,在子任务i出现故障的情况下,终止所述重跑操作,其中,所述子任务i为所述N个子任务中在所述重跑操作的过程中最先出现的故障子任务,上述处理器3000根据所述重跑顺序控制所述N个子任务执行重跑操作,具体为:
在执行完所述子任务j之后,终止所述重跑操作,所述子任务j为所述子任务i的前一个任务。
作为一种可能的实施方式,上述处理器3000在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程实现重跑操作,所述预设重跑指令用于控制所述目标任务进行重跑操作,还具体用于:
在接收到展示指令的情况下,在终端的显示器上展示所述第二作业流程的任务关系图,所述任务关系图用于展示所述第二作业流程的任务依赖关系。
作为一种可能的实施方式,上述处理器3000将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系,具体为:
将所述目标任务标记为所述第二作业流程中的虚拟任务;
建立所述虚拟任务和所述第二作业流程中的连接任务之间的任务依赖关系。
本发明实施例所描述的终端通过确定第一作业流程中的目标任务和第二作业流程中的连接任务;将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。采用本发明实施例可在确定了第一作业流程中的目标任务和第二作业流程中的连接任务的基础上,建立该目标任务和连接任务之间的任务依赖关系,因而,不必在该第一作业流程和第二作业流程之间开发新的任务作为连接任务,可降低业务开发的工作量。另外,由于第一流程作业的各任务之间具有任务依赖关系和第二作业流程的各任务之间具有任务依赖关系,因而,可根据目标任务和连接任务建立了任务依赖关系推断出第一作业流程和第二作业流程之间的任务依赖关系,从而,当目标任务执行重跑操作之后,第二作业流程中的各任务之间便可实现重跑操作,由于该重跑操作的实现基于ETL调度工具,因此,可解决通过业务逻辑实现第一作业流程和第二作业流程之间的任务依赖关系而导致无法实现作业流程之间的重跑操作的问题。以此类推,本实施例可实现多个作业流程的重跑操作,进一步地,在该多个作业流程出现故障的情况下,利用该重跑操作可快速查找到该多个作业流程中的故障任务。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种信号处理方法的部分或全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(英文:Read-Only Memory,缩写:ROM)或者随机存取存储器(英文:Random Access Memory,缩写:RAM)等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种数据处理的方法,其特征在于,包括:
确定第一作业流程中的目标任务和第二作业流程中的连接任务,在所述第二作业流程中至少包含一个任务情况下,将所述第二作业流程中的一个任务作为所述连接任务;
将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系;
基于所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;
在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
2.如权利要求1所述的方法,其特征在于,所述第一作业流程包含M个任务,所述M为大于或等于1的整数,所述第二作业流程包含N个任务,所述N为大于或等于1的整数,所述确定第一作业流程中的目标任务和第二作业流程中的连接任务,包括:
确定所述第一作业流程中的所述M个任务与所述第二作业流程的所述N个任务之间的任务依赖紧密值,以得到M×N个任务依赖紧密值;
选取所述M×N个任务依赖紧密值中的最大值,并将所述最大值对应的所述第一作业流程中的任务作为目标任务和所述第二作业流程中的任务作为连接任务。
3.如权利要求1所述的方法,其特征在于,所述在接收到用户输入的预设重跑指令的情况下,根据所述第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作,包括:
在接收到用户输入的预设重跑指令的情况下,控制所述目标任务执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作;
根据所述第二任务依赖关系确定所述目标任务的N个子任务的重跑顺序;
根据所述重跑顺序控制所述N个子任务执行重跑操作。
4.如权利要求3所述的方法,其特征在于,在子任务i出现故障的情况下,其中,所述子任务i为所述N个子任务中在所述重跑操作的过程中最先出现的故障子任务,所述根据所述重跑顺序控制所述N个子任务执行重跑操作,包括:
在执行完所述子任务j之后,终止所述重跑操作,所述子任务j为所述子任务i的前一个任务。
5.如权利要求1至4任一项所述的方法,其特征在于,所述将所述目标任务引用添加到第二作业流程中,并建立所述目标任务与所述连接任务之间的第一任务依赖关系,包括:
将所述目标任务标记为所述第二作业流程中的虚拟任务;
建立所述虚拟任务和所述第二作业流程中的连接任务之间的任务依赖关系。
6.一种终端,其特征在于,包括:
第一确定单元,用于确定第一作业流程中的目标任务和第二作业流程中的连接任务,在所述第二作业流程中至少包含一个任务情况下,将所述第二作业流程中的一个任务作为所述连接任务;
建立单元,用于将所述第一确定单元确定的目标任务引用添加到第二作业流程中,并建立所述目标任务与所述第一确定单元确定的连接任务之间的第一任务依赖关系;
第二确定单元,用于基于所述建立单元建立的所述目标任务与所述连接任务之间的第一任务依赖关系确定所述目标任务和所述第二作业流程各任务之间的第二任务依赖关系;
执行单元,用于在接收到用户输入的预设重跑指令的情况下,根据所述第二确定单元确定的第二任务依赖关系控制引用添加所述目标任务之后的所述第二作业流程执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作。
7.如权利要求6所述的终端,其特征在于,所述第一作业流程包含M个任务,所述M为大于或等于1的整数,所述第二作业流程包含N个任务,所述第一确定单元包括:
确定子单元,用于确定所述第一作业流程中的所述M个任务与所述第二作业流程的所述N个任务之间的任务依赖紧密值,以得到M×N个任务依赖紧密值;
选取单元,用于选取所述确定子单元确定的M×N个任务依赖紧密值中的最大值,并将所述最大值对应的所述第一作业流程中的任务作为目标任务和所述第二作业流程中的任务作为连接任务。
8.如权利要求6所述的终端,其特征在于,所述执行单元包括:
控制单元,用于在接收到用户输入的预设重跑指令的情况下,控制所述目标任务执行重跑操作,所述预设重跑指令用于控制所述目标任务执行重跑操作;
第三确定单元,用于根据所述第二任务依赖关系确定所述目标任务的N个子任务的重跑顺序;
执行子单元,用于根据所述第三确定单元确定的重跑顺序控制所述N个子任务执行重跑操作。
9.如权利要求8所述的终端,其特征在于,在子任务i出现故障的情况下,其中,所述子任务i为所述N个子任务中在所述重跑操作的过程中最先出现的故障子任务,所述执行子单元还具体用于:
在执行完所述子任务j之后,终止所述重跑操作,所述子任务j为所述子任务i的前一个任务。
10.如权利要求6至9任一项所述的终端,其特征在于,所述建立单元包括:
标记单元,用于将所述目标任务标记为所述第二作业流程中的虚拟任务;
建立子单元,用于建立所述虚拟任务和所述第二作业流程中的连接任务之间的任务依赖关系。
CN201510560108.0A 2015-09-06 2015-09-06 一种数据处理的方法及终端 Active CN105138666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510560108.0A CN105138666B (zh) 2015-09-06 2015-09-06 一种数据处理的方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510560108.0A CN105138666B (zh) 2015-09-06 2015-09-06 一种数据处理的方法及终端

Publications (2)

Publication Number Publication Date
CN105138666A CN105138666A (zh) 2015-12-09
CN105138666B true CN105138666B (zh) 2019-04-26

Family

ID=54724013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510560108.0A Active CN105138666B (zh) 2015-09-06 2015-09-06 一种数据处理的方法及终端

Country Status (1)

Country Link
CN (1) CN105138666B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108073521B (zh) * 2016-11-11 2021-10-08 深圳市创梦天地科技有限公司 一种数据去重的方法和系统
CN111459629A (zh) * 2020-03-24 2020-07-28 深圳市云智融科技有限公司 基于Azkaban的项目运行方法、装置及终端设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533417A (zh) * 2009-04-28 2009-09-16 阿里巴巴集团控股有限公司 一种实现etl调度的方法及系统
CN102981904A (zh) * 2011-09-02 2013-03-20 阿里巴巴集团控股有限公司 一种任务调度方法及系统
CN103019691A (zh) * 2012-11-20 2013-04-03 北京思特奇信息技术股份有限公司 一种etl作业关系图的转化方法及其实现系统
US8688625B1 (en) * 2010-12-31 2014-04-01 United Services Automobile Association (Usaa) Extract, transform, and load application complexity management framework
CN104252381A (zh) * 2013-06-30 2014-12-31 北京百度网讯科技有限公司 一种用于调度etl任务的方法与设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9336504B2 (en) * 2013-11-25 2016-05-10 International Business Machines Corporation Eliminating execution of jobs-based operational costs of related reports

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533417A (zh) * 2009-04-28 2009-09-16 阿里巴巴集团控股有限公司 一种实现etl调度的方法及系统
US8688625B1 (en) * 2010-12-31 2014-04-01 United Services Automobile Association (Usaa) Extract, transform, and load application complexity management framework
CN102981904A (zh) * 2011-09-02 2013-03-20 阿里巴巴集团控股有限公司 一种任务调度方法及系统
CN103019691A (zh) * 2012-11-20 2013-04-03 北京思特奇信息技术股份有限公司 一种etl作业关系图的转化方法及其实现系统
CN104252381A (zh) * 2013-06-30 2014-12-31 北京百度网讯科技有限公司 一种用于调度etl任务的方法与设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于多Agent与工作流的分布式ETL引擎的研究;丁进;《计算机应用》;20090313;第29卷(第1期);第319-322页
基于数据仓库的工作流系统的研究与实现;龙立熹;《信息技术与信息化》;20150210(第2014年第12期);第117-121页

Also Published As

Publication number Publication date
CN105138666A (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
US10764207B2 (en) Software defined visibility fabric
CN113377520A (zh) 资源调度方法、装置、设备以及存储介质
CN110308969A (zh) 故障演练方法、装置、设备及计算机存储介质
CN109783472A (zh) 表数据的迁移方法、装置、计算机设备和存储介质
CN107526645A (zh) 一种通信优化方法及系统
CN110413390A (zh) 线程任务处理方法、装置、服务器及存储介质
CN110502217B (zh) 一种基于ros的机器人云平台设计方法
CN107038032A (zh) 移动终端应用运行状态的切换方法、装置和系统
CN112416323A (zh) 控制代码的生成方法、运行方法、装置、设备及存储介质
CN107451062A (zh) 一种用户界面遍历测试方法、装置、服务器、存储介质
CN109731334A (zh) 状态的切换方法和装置、存储介质、电子装置
CN105138666B (zh) 一种数据处理的方法及终端
TW201432470A (zh) 與電子裝置之遠端互動
CN102929619A (zh) 一种跨硬件平台的过程自动化软件开发系统
CN104951346A (zh) 一种用于嵌入式系统的进程管理方法及系统
CN104572275B (zh) 一种进程加载方法、装置及系统
CN102387137B (zh) 多个网络设备智能操作逻辑的实现方法和系统
CN103294532B (zh) 快速实现矩阵开关图形化控制系统的方法
KR102255334B1 (ko) 전자 장치에서 네트워크 온 칩을 생성하는 장치 및 방법
CN114116487B (zh) 压力测试方法、装置、电子设备及存储介质
CN105759702B (zh) 一种直流电网实证系统的监控方法及系统
CN113010285B (zh) 用于处理数据的方法、装置、设备、介质和产品
CN107741887A (zh) 一种组件间的通信交互方法和装置
US20220253193A1 (en) Accidental touch prevention method and apparatus, and storage medium
CN108874504A (zh) 一种多虚拟化平台的管理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant