CN105320562A - 一种基于作业特征指纹的分布式作业加速运行方法与系统 - Google Patents

一种基于作业特征指纹的分布式作业加速运行方法与系统 Download PDF

Info

Publication number
CN105320562A
CN105320562A CN201510844049.XA CN201510844049A CN105320562A CN 105320562 A CN105320562 A CN 105320562A CN 201510844049 A CN201510844049 A CN 201510844049A CN 105320562 A CN105320562 A CN 105320562A
Authority
CN
China
Prior art keywords
job
fingerprint
module
operational feature
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510844049.XA
Other languages
English (en)
Other versions
CN105320562B (zh
Inventor
王海洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Genedock Technology Co Ltd
Original Assignee
Beijing Genedock Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Genedock Technology Co Ltd filed Critical Beijing Genedock Technology Co Ltd
Priority to CN201510844049.XA priority Critical patent/CN105320562B/zh
Publication of CN105320562A publication Critical patent/CN105320562A/zh
Application granted granted Critical
Publication of CN105320562B publication Critical patent/CN105320562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

本发明公开了基于作业特征指纹的分布式作业加速运行方法与系统,方法步骤包括:1)计算作业的特征指纹;2)将所述作业的特征指纹写入历史日志;3)根据所述作业的特征指纹,在所述历史日志里搜索具有相同特征指纹的历史作业;4)若没有,则继续完成作业;5)若存在相同特指纹的历史作业,则将历史作业输出赋予新提交的作业。本发明首次提出了作业特征指纹的概念,通过获取所述作业的依赖程序,获取所述作业运行程序参数,并将所述获取的作业依赖程序和作业运行程序参数,按预设进行合并,得到作业特征指纹。本发明还提供了的分布式作业加速运系统通过将所述作业特征指纹应用于分布式任务运行,并简化分布式任务的调度及提高分布式任务运行效率。

Description

一种基于作业特征指纹的分布式作业加速运行方法与系统
技术领域
本发明涉及分布式作业方法及系统,特别涉及基于作业特征指纹的分布式作业加速运行方法与系统,用于简化计算机分布式系统作业的调度。
背景技术
现有的分布式作业运行方法中,在用户提交作业后,后端系统会直接根据用户的需求将作业调度到相应的机器上进行运行,分布式作业运行主要步骤有:1.用户指定运行的流程,提交输入参数;2.系统根据输入参数,生成分布式作业的执行计划;3.系统根据执行计划,调度每一步作业实际运行;4.所有作业执行完毕后,输出必要结果。以上的技术方案主要存在以下问题:
1)对完全相同的作业会进行重复的调度,从而导致重复运行,不仅浪费运算资源,降低运行效率;
2)不支持断点重跑,也就是说,当某个流程跑到中间某步时因某种原因失败,系统重新提交时,不得不重新调度运行此前已经完成的所有计算,从而增加计算复杂度。
发明内容
有鉴于此,本发明的目的在于提供一种简化计算机分布式系统作业的调度方法,对完全相同的作业不会进行重复的调度,以及提高重复作业的运行效率的加速运行方法。
基于上述目的一种基于作业特征指纹的分布式作业加速运行方法,输入等待运行的作业后,包括如下步骤:
1)计算作业的特征指纹;
1.1)获取所述作业的依赖程序标识串,
1.2)获取所述作业运行程序参数,
1.3)将上述获取的作业依赖程序标识串和作业运行程序参数,按照预设进行合并,产生作业的特征指纹,
2)将所述作业的特征指纹写入历史日志;
3)根据所述作业的特征指纹,在所述历史日志里搜索具有相同特征指纹的历史作业;
4)若没有,则继续完成作业。
更进一步,所述步骤3)中,若搜索到具有相同特征指纹的历史作业,则将所述历史作业的输出结果直接拷贝到所述作业,执行完成。
更进一步,获取所述作业的程序的标识串的方法为:
将所述程序标识串和该作业对应的输入表内的所有字符串按照顺序和格式排列,然后合并得到一长字符串;
或者,通过字符串加密算法对所述长字符串进行映射变形获得作业的程序标识串。
更进一步,所述程序的标识串包括:程序列表中全局唯一的数字编号、程序名、或者版本号按照次序和格式合并而成的字符串。
更进一步,所述运行程序参数包括:输入的程序指令、输入的参数、输入的文件名以及运行环境。
更进一步,在所述步骤3)中,需要等待述历史作业运行完毕,将所述历史作业的输出结果拷贝给所述的作业,同时跳过该作业的调度和执行,直接结束。
通过本发明的作业加速运行方法,主要通过计算单个分布式作业的唯一特征标识(在这我们称之为作业特征指纹),并在历史作业候选集合中匹配具有相同特征指纹的作业,最后(即如所述步骤3)中,若搜索到具有相同特征指纹的历史作业,则将所述历史作业的输出结果直接拷贝到所述作业,执行完成)将匹配的作业的运行状态、运行日志、结果数据复制并赋予当前新作业。相比其他的分布式作业运行方式,基于作业特征指纹的分布式作业运行方式节省了重复作业运行的时间,从而提高了作业运行的效率。
本发明还提出了一种基于作业特征指纹的分布式作业加速运行系统,包括:作业、作业特征指纹计算模块、作业检索模块、数据库、调度执行作业模块、历史结果拷贝模块、计算控制模块,
所述作业特征指纹计算模块,接收等待运行的作业,用以获取所述作业的依赖程序标识串,获取所述作业运行程序参数,并将所述获取的作业依赖程序标识串和作业运行程序参数,按预设进行合并,产生作业特征指纹后上输入到所述作业检索模块;
所述作业检索模块,用以根据所述作业特征指纹在所述数据库中的历史日志里搜索具有相同特征指纹的历史作业;
所述调度执行作业模块,用以在所述作业检索模块中没有相同特征指纹的历史作业时,调度执行所述作业并通过所述计算控制模块完成;
所述历史结果拷贝模块,用以在搜索到具有相同特征指纹的历史作业时,将所述历史作业的输出结果直接拷贝到所述作业,通过所述计算控制模块执行完成。
更进一步,还包括:数据储存单元,用以储存所述历史结果拷贝模块中的拷贝结果。
更进一步,所述作业特征指纹计算模块包括:作业的依赖程序采集模块、作业运行程序参数采集模块、作业特征指纹合并模块,所述作业的依赖程序采集模块,用以获取所述作业的依赖程序,所述作业运行程序参数采集模块,用以获取所述作业运行程序参数,所述作业特征指纹合并模块,用以将上述获取的作业依赖程序标识串和作业运行程序参数,按预设进行合并,产生作业特征指纹。
更进一步,所述在分布式系统上运行时,包括:程序指令、程序版本、运行环境、输入参数和文件多个作业。本发明的有益效果:
1)本发明首次提出了作业特征指纹的概念,通过获取所述作业的依赖程序,获取所述作业运行程序参数,并将所述获取的作业依赖程序和作业运行程序参数,按预设进行合并,得到作业特征指纹。
2)本发明通过将所述作业特征指纹应用于分布式任务运行,并简化分布式任务的调度及提高分布式任务运行效率。
3)本发明通过搜索到具有相同特征指纹的历史作业,则将所述历史作业的输出结果直接拷贝到所述作业,执行完成,大大简化了计算机分布式系统作业的调度。
附图说明
图1(a)-图1(b)为本发明一实施例中基于作业特征指纹的分布式作业加速运行方法的流程示意图。
图2为本发明一实施例中基于作业特征指纹的分布式作业加速运行方法运行示例图。
图3为本发明一实施例中基于作业特征指纹的分布式作业加速运行系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如图1(a)-图1(b)所示,是本实施例中基于作业特征指纹的分布式作业加速运行方法,输入等待运行的作业后,包括如下步骤:
1)计算作业的特征指纹;
1.1)获取所述作业的依赖程序标识串,
1.2)获取所述作业运行程序参数,
1.3)将上述获取的作业依赖程序标识串和作业运行程序参数,按照预设进行合并,产生作业的特征指纹,
2)将所述作业的特征指纹写入历史日志;
3)根据所述作业的特征指纹,在所述历史日志里搜索具有相同特征指纹的历史作业;
4)若没有,则继续完成作业。
上述1)中,首先根据作业中的使用的程序包、算法指令、软件版本、运行容器、输入参数以及输入数据,计算出作业的特征指纹;
上述2)中,根据计算得到的作业特征指纹,在历史作业中查找出具有相同特征指纹的作业,否则正常调度执行作业;
更进一步,所述步骤3)中,若搜索到具有相同特征指纹的历史作业,则将所述历史作业的输出结果直接拷贝到所述作业,执行完成。即如果发现,则把2)发现的历史作业的输出结果拷贝给当前作业作为输出,跳过调度运行阶段。更进一步,在所述步骤3)中,需要等待述历史作业运行完毕,将所述历史作业的输出结果拷贝给所述的作业,同时跳过该作业的调度和执行,直接结束。
在本发明的实施例中,所述的特征指纹是指,一个字符串,能用于区分作业的运行结果,如果两个作业的特征指纹相同,则运行的结果必然一样。作业特征指纹可以是,一个由作业程序的标识串A,作业程序运行参数B,作业程序运行输入数据标识串C,通过将A,B,C进行排列组合,并使用MD5等字符串哈希加密算法,对A,B,C排列组合得到的字符串进行映射变形,最后得到能够唯一标识作业,同时能用于区分作业的运行结果的标示符。例如:假设作业J1使用的程序jar包为job.jar,输入参数为p1,p2,输入数据d1,作业程序的标识串为job.jar的MD5校验值:j_md5,作业运行参数p1,p2,输入数据d1的标识串为d1的MD5校验值d_md5,则将j_md5,p1,p2,d_md5进行排列组合拼接成长字符串,如:j_md5:p1:p2:d_md5,其中,排列组合方式可以又用户自己定义,但所有提交的作业在计算作业特征指纹时,都必须使用同一排列组合方式。最后使用MD5等字符串哈希加密算法将长字符串j_md5:p1:p2:d_md5映射到固定长度的字符串。
本领域技术人员能够明了,流程是指,用户希望在分布式系统上运行的一整套运算,可以由多个作业组成。作业是指,组成所述流程的每一步计算。作业一般包括:程序指令、程序版本、运行环境(容器)、输入的参数和文件。作业之间有可能有依赖关系,例如必须先完成作业A再完成作业B。作业输入是指,作业程序运行必须输入的参数和数据,只有获得明确的输入,作业才能开始正常运行。不同的输入,会导致运算结果不同。
更进一步,获取所述作业的程序标识串的方法为:将所述程序标识串和该作业对应的输入表内的所有字符串按照顺序和格式排列,然后合并得到一长字符串,所述的长字符串为程序标识串;或者,通过字符串加密算法对所述长字符串进行映射变形获得作业的程序标识串。优选地,所述程序标识串包括:程序列表中全局唯一的数字编号、程序名、或者版本号。优选地,所述作业运行程序参数包括:输入的程序指令、输入的参数、输入的文件名以及运行环境。
如图3所示,本发明的实施例中的处理步骤流程如下,以作业J1表示输入等待运行的作业,J2表示历史作业,
步骤1,输入等待运行的作业J1;
步骤2,计算作业J1的作业特征指纹;
步骤2-1获取作业的程序的标识串,能够和所有程序一一对应的表达方式都可以作为程序标识串,例如程序列表中全局唯一的数字编号,再例如程序名和版本号按照约定次序和格式合并而成的字符串;
步骤2-2获取作业输入表,一般包括但不限于输入的程序指令、参数、输入文件名以及运行环境(容器);
步骤2-3将前面获得的运行程序标识串和作业输入表,按约定方法合并产生作业特征指纹。任何能与程序标识再加作业输入表一一对应的表达方式,都可以作为特征指纹。例如:把程序标识串和作业输入表内的所有字符串按约定次序和格式合并形成的长字符串,再例如:进一步使用MD5等字符串哈希加密算法,对以上字符串进行映射变形;
步骤3,将J1的特征指纹写入历史日志;
步骤4,根据J1的作业特征指纹,在历史日志里搜索具有相同特征指纹的作业。如果没有找到则正常调度执行J1并结束,如果发现有相同特征指纹的作业J2则进入步骤5;
步骤5,等待J2运行完毕,将J2作业的输出拷贝给J1,跳过J1的调度和执行,直接结束。
在本发明的实施例中,通过对分布式作业进行分析并且提取作业的特征指纹即唯一标识DNA,不仅简化了分布式作业的调度,同时提高了作业运行时间。本发明中举个简单的例子:
以bwamapping作业为例,采用传统的分布式作业运行方式,bwamapping作业运行需要的时间包括:下载数据的时间为T1,作业实际运行时间为T2,上传数据的时间为T3。所以运行一个bwamapping所需要的总时间是T=T1+T2+T3。
在本发明的实施例中,因为在实际运行作业前我们先对要运行的作业做了必要的分析,并提取了作业的DNA,所以运行bwamapping作业实际需要的时间主要由提取作业DNA的时间t1,历史作业检索时间t2,将历史作业输出数据拷贝给新作业的时间t3组成。所以,实际运行时间为t=t1+t2+t3。而计算作业DNA及检索历史作业的时间在被发明中可以忽略不计。所以实际真正的运行时间t≈t3。而经过测试,t3也是小于传统分布式作业运行的总时间T的。
所述步骤1中计算作业特征指纹的方法,特征指纹计算方法可以通过构建分布式作业运行程序唯一标识,将作业运行程序参数,依赖程序标识串的组合计算出能够唯一标识作业的标示即作业的特征指纹。本领域技术人员能够明了,该作业特征指纹计算方法只是其中一种方法,任何足以计算并获取作业唯一标识符的算法得到的唯一标示符都能作为作业的特征指纹。
所述步骤2,根据作业DNA检索出历史中具有相同的特征指纹作业的方法可以采用通用的检索方法,例如二叉树。
如图3所示,在本实施例中的一种基于作业特征指纹的分布式作业加速运行系统,包括:作业、作业特征指纹计算模块、作业检索模块、数据库、调度执行作业模块、历史结果拷贝模块、计算控制模块,
所述作业特征指纹计算模块,接收等待运行的作业,用以获取所述作业的依赖程序标识串,获取所述作业运行程序参数,并将所述获取的作业依赖程序标识串和作业运行程序参数,按预设进行合并,产生作业特征指纹后上输入到所述作业检索模块;所述作业检索模块,用以根据所述作业特征指纹在所述数据库中的历史日志里搜索具有相同特征指纹的历史作业;所述调度执行作业模块,用以在所述作业检索模块中没有相同特征指纹的历史作业时,调度执行所述作业并通过所述计算控制模块完成;所述历史结果拷贝模块,用以在搜索到具有相同特征指纹的历史作业时,将所述历史作业的输出结果直接拷贝到所述作业,通过所述计算控制模块执行完成。
更进一步,所述的基于作业特征指纹的分布式作业加速运行系统,还包括:数据储存单元,用以储存所述历史结果拷贝模块中的拷贝结果。作为本实施例中的优选,所述作业特征指纹计算模块包括:作业的依赖程序采集模块、作业运行程序参数采集模块、作业特征指纹合并模块,所述作业的依赖程序采集模块,用以获取所述作业的依赖程序,所述作业运行程序参数采集模块,用以获取所述作业运行程序参数,所述作业特征指纹合并模块,用以将上述获取的作业依赖程序标识串和作业运行程序参数,按预设进行合并,产生作业特征指纹。
作为本实施例中的优选,所述在分布式系统上运行时,包括:程序指令、程序版本、运行环境、输入参数和文件多个作业。
所属领域的普通技术人员应当理解:以上,所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于作业特征指纹的分布式作业加速运行方法,输入等待运行的作业后,其特征在于,包括如下步骤:
1)计算作业的特征指纹;
1.1)获取所述作业的依赖程序标识串,
1.2)获取所述作业运行程序参数,
1.3)将上述获取的作业依赖程序标识串和作业运行程序参数,按照预设进行合并,产生作业的特征指纹,
2)将所述作业的特征指纹写入历史日志;
3)根据所述作业的特征指纹,在所述历史日志里搜索具有相同特征指纹的历史作业;
4)若没有,则继续完成作业。
2.根据权利要求1所述的基于作业特征指纹的分布式作业加速运行方法,其特征在于,所述步骤3)中,若搜索到具有相同特征指纹的历史作业,则将所述历史作业的输出结果直接拷贝到所述作业,执行完成。
3.根据权利要求1或2所述的基于作业特征指纹的分布式作业加速运行方法,其特征在于,获取所述作业的程序标识串的方法为:
将所述程序标识串和该作业对应的输入表内的所有字符串按照顺序和格式排列,然后合并得到一长字符串,所述的长字符串为程序标识串;
或者,通过字符串加密算法对所述长字符串进行映射变形获得作业的程序标识串。
4.根据权利要求3所述的基于作业特征指纹的分布式作业加速运行方法,其特征在于,所述程序标识串包括:程序列表中全局唯一的数字编号、程序名、或者版本号。
5.根据权利要求1或2所述的基于作业特征指纹的分布式作业加速运行方法,其特征在于,所述作业运行程序参数包括:输入的程序指令、输入的参数、输入的文件名以及运行环境。
6.根据权利要求2所述的基于作业特征指纹的分布式作业加速运行方法,其特征在于,在所述步骤3)中,需要等待述历史作业运行完毕,将所述历史作业的输出结果拷贝给所述的作业,同时跳过该作业的调度和执行,直接结束。
7.一种基于作业特征指纹的分布式作业加速运行系统,其特征在于,包括:作业、作业特征指纹计算模块、作业检索模块、数据库、调度执行作业模块、历史结果拷贝模块、计算控制模块,
所述作业特征指纹计算模块,接收等待运行的作业,用以获取所述作业的依赖程序标识串,获取所述作业运行程序参数,并将所述获取的作业依赖程序标识串和作业运行程序参数,按预设进行合并,产生作业特征指纹后上输入到所述作业检索模块;
所述作业检索模块,用以根据所述作业特征指纹在所述数据库中的历史日志里搜索具有相同特征指纹的历史作业;
所述调度执行作业模块,用以在所述作业检索模块中没有相同特征指纹的历史作业时,调度执行所述作业并通过所述计算控制模块完成;
所述历史结果拷贝模块,用以在搜索到具有相同特征指纹的历史作业时,将所述历史作业的输出结果直接拷贝到所述作业,通过所述计算控制模块执行完成。
8.根据权利要求7所述的基于作业特征指纹的分布式作业加速运行系统,其特征在于,还包括:数据储存单元,用以储存所述历史结果拷贝模块中的拷贝结果。
9.根据权利要求7所述的基于作业特征指纹的分布式作业加速运行系统,其特征在于,所述作业特征指纹计算模块包括:作业的依赖程序采集模块、作业运行程序参数采集模块、作业特征指纹合并模块,所述作业的依赖程序采集模块,用以获取所述作业的依赖程序,所述作业运行程序参数采集模块,用以获取所述作业运行程序参数,所述作业特征指纹合并模块,用以将上述获取的作业依赖程序标识串和作业运行程序参数,按预设进行合并,产生作业特征指纹。
10.根据权利要求7所述的基于作业特征指纹的分布式作业加速运行系统,其特征在于,所述在分布式系统上运行时,包括:程序指令、程序版本、运行环境、输入参数和文件多个作业。
CN201510844049.XA 2015-11-26 2015-11-26 一种基于作业特征指纹的分布式作业加速运行方法与系统 Active CN105320562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510844049.XA CN105320562B (zh) 2015-11-26 2015-11-26 一种基于作业特征指纹的分布式作业加速运行方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510844049.XA CN105320562B (zh) 2015-11-26 2015-11-26 一种基于作业特征指纹的分布式作业加速运行方法与系统

Publications (2)

Publication Number Publication Date
CN105320562A true CN105320562A (zh) 2016-02-10
CN105320562B CN105320562B (zh) 2018-11-16

Family

ID=55247986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510844049.XA Active CN105320562B (zh) 2015-11-26 2015-11-26 一种基于作业特征指纹的分布式作业加速运行方法与系统

Country Status (1)

Country Link
CN (1) CN105320562B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846636A (zh) * 2018-06-01 2018-11-20 北京字节跳动网络技术有限公司 数据调度方法、装置、计算机可读存储介质
CN107220121B (zh) * 2017-05-25 2020-11-13 深信服科技股份有限公司 一种numa架构下沙箱环境测试方法及其系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882161A (zh) * 2010-06-23 2010-11-10 中国工商银行股份有限公司 应用级异步任务调度系统和方法
CN102929698A (zh) * 2012-09-29 2013-02-13 北京百度网讯科技有限公司 一种任务判重方法及系统
US20150006735A1 (en) * 2013-06-28 2015-01-01 International Business Machines Corporation Framework to improve parallel job workflow
US20150199216A1 (en) * 2014-01-10 2015-07-16 International Business Machines Corporation Scheduling and execution of tasks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882161A (zh) * 2010-06-23 2010-11-10 中国工商银行股份有限公司 应用级异步任务调度系统和方法
CN102929698A (zh) * 2012-09-29 2013-02-13 北京百度网讯科技有限公司 一种任务判重方法及系统
US20150006735A1 (en) * 2013-06-28 2015-01-01 International Business Machines Corporation Framework to improve parallel job workflow
US20150199216A1 (en) * 2014-01-10 2015-07-16 International Business Machines Corporation Scheduling and execution of tasks

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220121B (zh) * 2017-05-25 2020-11-13 深信服科技股份有限公司 一种numa架构下沙箱环境测试方法及其系统
CN108846636A (zh) * 2018-06-01 2018-11-20 北京字节跳动网络技术有限公司 数据调度方法、装置、计算机可读存储介质

Also Published As

Publication number Publication date
CN105320562B (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN109861844B (zh) 一种基于日志的云服务问题细粒度智能溯源方法
US10776170B2 (en) Software service execution apparatus, system, and method
CN107784026B (zh) 一种etl数据处理方法及装置
Markovtsev et al. Public git archive: a big code dataset for all
CN105719126B (zh) 一种基于生命周期模型的互联网大数据任务调度的系统及方法
CN105094851A (zh) 一种基于Git随时发布代码的实现方法
CN105243528A (zh) 大数据环境下金融it系统中图形化集中对账系统与方法
CN105550268A (zh) 大数据流程建模分析引擎
CN105893509B (zh) 一种大数据分析模型的标记与解释系统及方法
CN103942099B (zh) 基于Hive的并行执行任务方法及装置
CN108037919A (zh) 一种基于web的可视化大数据工作流配置方法及系统
CN114416855A (zh) 一种基于电力大数据的可视化平台及方法
EP1217515A1 (en) Workflow system
CN107479866A (zh) 基于重构技术实现开放终端应用数据与功能的方法
CN105320562A (zh) 一种基于作业特征指纹的分布式作业加速运行方法与系统
KR101450239B1 (ko) 대용량 xml 데이터에 대한 다수의 가지 패턴 질의의 동시 병렬처리시스템 및 그 방법
CN111061733A (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
CN117235325B (zh) 一种企业研发数据的可视化管理方法及相关装置
CN108874395A (zh) 一种组件化流处理过程中的硬编译方法及装置
US11567957B2 (en) Incremental addition of data to partitions in database tables
CN111460021A (zh) 数据导出方法及装置
CN104484226B (zh) MapReduce作业处理系统、服务器及处理方法
CN110532311A (zh) 一种基于队列的分布式数据导出方法及系统
CN115857918A (zh) 数据处理方法、装置、电子设备及存储介质
KR102473776B1 (ko) 빅데이터 크로스 모델 데이터 통합 처리 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant