CN107766132B - 多任务调度方法、应用服务器及计算机可读存储介质 - Google Patents
多任务调度方法、应用服务器及计算机可读存储介质 Download PDFInfo
- Publication number
- CN107766132B CN107766132B CN201710490454.5A CN201710490454A CN107766132B CN 107766132 B CN107766132 B CN 107766132B CN 201710490454 A CN201710490454 A CN 201710490454A CN 107766132 B CN107766132 B CN 107766132B
- Authority
- CN
- China
- Prior art keywords
- data
- task
- source
- synchronous
- script
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/273—Asynchronous replication or reconciliation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Stored Programmes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种多任务调度方法,该方法包括步骤:建立一数据平台与至少一个数据源的第一连接,并建立该数据平台与该应用服务器的第二连接;接收用户选择的需要同步的源表和数据源类型,生成各数据源对应的建表任务和数据同步任务,并将其发布至预设的工作流调度引擎;当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎调用预先设置的任务调度接口模板,并将同步参数传递至所述任务调度接口模板;根据所述同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。本发明可以将API接口调用参数化,数据同步时只需传递同步参数即可完成同步任务。
Description
技术领域
本发明涉及计算机信息技术领域,尤其涉及一种多任务调度方法、应用服务器及计算机可读存储介质。
背景技术
现有的任务调度接口(如oozie web service API)设计中,需要将依次将不同的指定文件(如执行脚本、调度脚本等)部署到Hadoop分布式文件系统(Hadoop DistributedFile System,HDFS)中,此种设计方式必然需要经过部署流程,不够便捷。故,现有技术中的任务调度接口设计不够合理,亟需改进。
发明内容
有鉴于此,本发明提出一种多任务调度方法、应用服务器及计算机可读存储介质,将API接口调用参数化,数据同步时只需传递同步参数即可完成同步任务,无需部署流程。
首先,为实现上述目的,本发明提出一种应用服务器,所述应用服务器包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多任务调度系统,所述多任务调度系统被所述处理器执行时实现如下步骤:
建立一数据平台与至少一个数据源的第一连接,并建立该数据平台与该应用服务器的第二连接;
接收用户选择的需要同步的源表和数据源类型,根据预先解析获得的各数据源的源表结构,生成各数据源对应的建表任务和数据同步任务,并将所述生成的各数据源对应的建表任务和数据同步任务发布至预设的工作流调度引擎;
当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎从指定的文件系统中调用预先设置的任务调度接口模板,并通过该预设的工作流调度引擎将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板;及
根据各数据源对应的数据同步任务的同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。
优选地,所述任务调度接口模板包括参数配置脚本、任务执行脚本、及任务调度脚本,所述参数配置脚本用于接收所述工作流调度引擎传递的同步参数,所述任务执行脚本用于根据各数据源对应的数据同步任务的同步参数,执行各数据源对应的建表任务和数据同步任务,所述任务调度脚本用于管理各数据源对应的数据同步任务的执行顺序。
优选地,所述任务执行脚本包括用于从第一类型维度表抽取数据的第一执行脚本,用于从第二类型任务表抽取数据的第二执行脚本,及用于从第三类型流水表抽取数据的第三执行脚本。
优选地,所述数据同步任务的执行包括:
调用所述任务调度接口模板中各数据源相应的任务执行脚本,获取数据同步各个任务所需的资源配置,从各源表中分别抽取相应字段对应的数据,并将抽取的数据分别存入各目标表的相应字段。
优选地,所述数据同步任务的执行包括:
若用户选择的需要同步的源表类型为第一类型维度表,则调用所述任务调度接口模板中的第一执行脚本,从各第一类型维度表中分别抽取相应字段对应的第一数据,并将抽取的第一数据分别存入各第一类型目标表的相应字段;
若用户选择的需要同步的源表类型为第二类型任务表,则调用所述任务调度接口模板中的第二执行脚本,从各第二类型任务表中分别抽取相应字段对应的第二数据,并将抽取的第二数据分别存入各第二类型目标表的相应字段;及
若用户选择的需要同步的源表类型为第三类型流水表,则调用所述任务调度接口模板中的第三执行脚本,从各第三类型流水表中分别抽取相应字段对应的第三数据,并将抽取的第三数据分别存入各第三类型目标表的相应字段。
此外,为实现上述目的,本发明还提供一种多任务调度方法,该方法应用于应用服务器,所述方法包括:
建立一数据平台与至少一个数据源的第一连接,并建立该数据平台与该应用服务器的第二连接;
接收用户选择的需要同步的源表和数据源类型,根据预先解析获得的各数据源的源表结构,生成各数据源对应的建表任务和数据同步任务,并将所述生成的各数据源对应的建表任务和数据同步任务发布至预设的工作流调度引擎;
当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎从指定的文件系统中调用预先设置的任务调度接口模板,并通过该预设的工作流调度引擎将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板;及
根据各数据源对应的数据同步任务的同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。
优选地,所述任务调度接口模板包括参数配置脚本、任务执行脚本、及任务调度脚本,所述参数配置脚本用于接收所述工作流调度引擎传递的同步参数,所述任务执行脚本用于根据各数据源对应的数据同步任务的同步参数,执行各数据源对应的建表任务和数据同步任务,所述任务调度脚本用于管理各数据源对应的数据同步任务的执行顺序。
优选地,所述任务执行脚本包括用于从第一类型维度表抽取数据的第一执行脚本,用于从第二类型任务表抽取数据的第二执行脚本,及用于从第三类型流水表抽取数据的第三执行脚本。
优选地,所述数据同步任务的执行包括:
若用户选择的需要同步的源表类型为第一类型维度表,则调用所述任务调度接口模板中的第一执行脚本,从各第一类型维度表中分别抽取相应字段对应的第一数据,并将抽取的第一数据分别存入各第一类型目标表的相应字段;
若用户选择的需要同步的源表类型为第二类型任务表,则调用所述任务调度接口模板中的第二执行脚本,从各第二类型任务表中分别抽取相应字段对应的第二数据,并将抽取的第二数据分别存入各第二类型目标表的相应字段;及
若用户选择的需要同步的源表类型为第三类型流水表,则调用所述任务调度接口模板中的第三执行脚本,从各第三类型流水表中分别抽取相应字段对应的第三数据,并将抽取的第三数据分别存入各第三类型目标表的相应字段。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多任务调度系统,所述多任务调度系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的多任务调度方法的步骤。
相较于现有技术,本发明所提出的应用服务器、多任务调度方法及计算机可读存储介质,根据用户选择的需要同步的源表和数据源类型,自动生成各数据源对应的建表任务和数据同步任务;同时,通过一次性将不同的指定文件(如参数配置脚本、任务执行脚本、及任务调度脚本)部署到一任务调度接口模板,当进行数据同步操作时,直接调用该任务调度接口模板,并将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板,自动执行各数据源对应的建表任务和数据同步任务,实现了多数据源数据同步的全程自动化,不用部署流程,将API接口调用参数化,数据同步时只需传递同步参数即可完成同步任务。
附图说明
图1是本发明各个实施例一可选的应用环境示意图;
图2是图1中应用服务器一可选的硬件架构的示意图;
图3是应用服务器中多任务调度系统一实施例的功能模块示意图;
图4为本发明多任务调度方法一实施例的实施流程示意图。
附图标记:
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
进一步需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
参阅图1所示,是本发明各个实施例一可选的应用环境示意图。
在本实施例中,本发明可应用于包括,但不限于,应用服务器2、网络3、数据平台4、及数据源5的应用环境中。其中,所述应用服务器2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该应用服务器2可以是独立的服务器,也可以是多个服务器所组成的服务器集群。所述网络3可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
其中,所述应用服务器2中通过所述网络3与数据平台4通信连接,所述数据平台4通过所述网络3分别与各数据源5通信连接。所述数据平台4与各数据源5之间建立有第一连接(或称其为第一类连接),以使所述数据平台4能够通过所述第一连接与各数据源5进行数据传输和交互。所述数据平台4与应用服务器2之间建立有第二连接(或称其为第二类连接),以使所述数据平台4能够通过所述第二连接与应用服务器2进行数据传输和交互。
参阅图2所示,是图1中应用服务器2一可选的硬件架构的示意图。本实施例中,所述应用服务器2可包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23。需要指出的是,图2仅示出了具有组件21-23的应用服务器2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,所述存储器21至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器21可以是所述应用服务器2的内部存储单元,例如该应用服务器2的硬盘或内存。在另一些实施例中,所述存储器21也可以是所述应用服务器2的外部存储设备,例如该应用服务器2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括所述应用服务器2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器21通常用于存储安装于所述应用服务器2的操作系统和各类应用软件,例如所述多任务调度系统20的程序代码等。此外,所述存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制所述应用服务器2的总体操作,例如执行与所述应用服务器2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器22用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的多任务调度系统20等。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述应用服务器2与其他电子设备之间建立通信连接。本实施例中,所述网络接口23主要用于通过所述网络3将所述应用服务器2与所述数据平台4相连,在所述应用服务器2与所述数据平台4之间的建立数据传输通道和通信连接。
至此,己经详细介绍了本发明各个实施例的应用环境和相关设备的硬件结构和功能。下面,将基于上述应用环境和相关设备,提出本发明的各个实施例。
首先,本发明提出一种多任务调度系统20。
参阅图3所示,是应用服务器2中多任务调度系统20一实施例的功能模块图。本实施例中,所述的多任务调度系统20可以被分割成一个或多个模块,所述一个或者多个模块被存储于所述存储器21中,并由一个或多个处理器(本实施例中为所述处理器22)所执行,以完成本发明。例如,在图3中,所述的多任务调度系统20可以被分割成连接模块201、任务发布模块202、调度模块203、以及执行模块204。本发明所称的功能模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述多任务调度系统20在所述应用服务器2中的执行过程。以下将就各功能模块201-204的功能进行详细描述。
所述连接模块201,用于建立一数据平台4与至少一个数据源5的第一连接(或称其为第一类连接),并建立该数据平台4与一应用服务器2(如解析服务器)的第二连接(或称其为第二类连接)。
优选地,在本实施例中,所述数据平台4采用Hadoop数据平台,并通过该数据平台4中的数据传输工具建立该数据平台4与各数据源5的第一连接。例如,所述数据传输工具为Hadoop中设置的Sqoop工具。本领域技术人员应当可以理解,在其它实施例中,所述数据平台和数据传输工具也可以采用其它类型。
所述任务发布模块202,用于接收用户选择的需要同步的源表(部分或全部)和数据源类型,根据预先解析获得的各数据源的源表结构,生成各数据源对应的建表任务和数据同步任务(或称其为数据抽取任务),并将所述生成的各数据源对应的建表任务和数据同步任务发布至预设的工作流调度引擎(如oozie调度引擎)。
优选地,在本实施例中,所述数据源类型包括,但不限于,第一类型数据源(如MSSQL Server数据源),第二类型数据源(如Oracle数据源),第三类型数据源(如MySQL数据源)等。本领域技术人员应当可以理解,在其它实施例中,所述数据源类型的数量,也可以根据不同数据平台的需求增加或减少。例如,用户可以选择同步第一类型数据源中的部分源表。
优选地,在本实施例中,所述数据源的源表结构包括,但不限于,各数据源的数据类型和包含的字段信息等。
优选地,在本实施例中,所述应用服务器2中设置有各数据源5相应的解析脚本文件,通过并行调度机制,控制所述数据平台4中的数据传输工具并行执行各解析脚本文件中的源表结构解析任务,解析获得各数据源的源表结构,并通过所述第二连接将解析获得的各数据源的源表结构返回至所述应用服务器2。
优选地,在本实施例中,所述生成各数据源对应的建表任务包括:根据用户选择的需要同步的源表(部分或全部)和各源表的类型,生成与该选择的源表类型对应的目标表。优选地,在本实施例中,所述源表类型包括,但不限于,第一类型维度表(即数据量小,关联配置使用的源表)、第二类型任务表(即表中数据不断有更新和新增,且当天会更新当天除外的历史数据)、第三类型流水表(即表中数据不断有新增,且当天不会更新当天除外的历史数据)。
具体而言,若用户选择的需要同步的源表类型为第一类型维度表(即数据量小,关联配置使用的源表),则生成与所述第一类型维度表的源表结构对应的第一类型目标表,其中,所述第一类型目标表的数量根据所述用户选择的需要同步的第一类型源表数量确定。
若用户选择的需要同步的源表类型为第二类型任务表(即表中数据不断有更新和新增,且当天会更新当天除外的历史数据),则生成与所述第二类型任务表的源表结构对应的第二类型目标表,其中,所述第二类型目标表的数量根据所述用户选择的需要同步的第二类型源表数量确定。
若用户选择的需要同步的源表类型为第三类型流水表(即表中数据不断有新增,且当天不会更新当天除外的历史数据),则生成与所述第三类型流水表的源表结构对应的第三类型目标表,其中,所述第三类型目标表的数量根据所述用户选择的需要同步的第三类型源表数量确定。
优选地,在本实施例中,所述生成各数据源对应的数据同步任务包括:
根据用户选择的需要同步的开始时间和结束时间确定从各源表开始抽取数据的时间和停止抽取数据的时间;
根据用户选择的需要同步的源表数量及同步的目标端用户确定数据同步各个任务所需的资源配置(如CPU、内存和磁盘等)和资源管理节点,其中,所述资源配置可以通过列表方式实现,所述资源管理节点可以采用Hadoop资源表示模型和资源分配模型实现;
建立所述需要同步的源表的相应字段与所述生成的各目标表的相应字段的对应关系,并根据源表与目标表相应字段的对应关系生成各源表对应的数据抽取任务。
具体而言,若用户选择的需要同步的源表类型为第一类型维度表,则建立所述需要同步的第一类型维度表的相应字段与所述生成的各第一类型目标表的相应字段的对应关系,并根据第一类型维度表与第一类型目标表相应字段的对应关系生成各第一类型维度表对应的数据抽取任务;
若用户选择的需要同步的源表类型为第二类型任务表,则建立所述需要同步的第二类型任务表的相应字段与所述生成的各第二类型目标表的相应字段的对应关系,并根据第二类型任务表与第二类型目标表相应字段的对应关系生成各第二类型任务表对应的数据抽取任务;
若用户选择的需要同步的源表类型为第三类型流水表,则建立所述需要同步的第三类型流水表的相应字段与所述生成的各第三类型目标表的相应字段的对应关系,并根据第三类型流水表与第三类型目标表相应字段的对应关系生成各第三类型流水表对应的数据抽取任务。
所述调度模块203,用于当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎从指定的文件系统中调用预先设置的任务调度接口模板,并通过该预设的工作流调度引擎将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板。在本实施方式中,所述指定的文件系统为分布式文件系统,如Hadoop分布式文件系统(HadoopDistributed File System,HDFS),所述任务调度接口模板为oozie web service API(Application Programming Interface,应用程序编程接口)模板。其中,所述任务调度接口模版预先部署至所述指定的文件系统中。
优选地,在本实施例中,所述同步参数包括,但不限于,各个任务所需的资源配置和资源管理节点、数据同步的开始时间和结束时间、选择该同步参数的用户名等信息。
优选地,在本实施例中,所述任务调度接口模板包括,但不限于,参数配置脚本、任务执行脚本、及任务调度脚本。其中,所述参数配置脚本为shell脚本,用于接收所述工作流调度引擎传递的同步参数。所述任务执行脚本为XML(Extensible Markup Language,可扩展标记语言)脚本,用于根据各数据源对应的数据同步任务的同步参数,执行各数据源对应的建表任务和数据同步任务。所述任务调度脚本为XML脚本,用于管理各数据源对应的数据同步任务的执行顺序。
优选地,在本实施例中,所述任务执行脚本包括,但不限于,用于从第一类型维度表抽取数据的第一执行脚本,用于从第二类型任务表抽取数据的第二执行脚本,用于从第三类型流水表抽取数据的第三执行脚本。
所述执行模块204,用于根据各数据源对应的数据同步任务的同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。
优选地,在本实施例中,所述数据同步任务的执行包括:
调用所述任务调度接口模板中各数据源相应的任务执行脚本,获取数据同步各个任务所需的资源配置,从各源表中分别抽取相应字段对应的数据(元数据信息),并将抽取的数据分别存入各目标表的相应字段。
具体而言,若用户选择的需要同步的源表类型为第一类型维度表,则调用所述任务调度接口模板中的第一执行脚本,从各第一类型维度表中分别抽取相应字段对应的第一数据,并将抽取的第一数据分别存入各第一类型目标表的相应字段;
若用户选择的需要同步的源表类型为第二类型任务表,则调用所述任务调度接口模板中的第二执行脚本,从各第二类型任务表中分别抽取相应字段对应的第二数据,并将抽取的第二数据分别存入各第二类型目标表的相应字段;
若用户选择的需要同步的源表类型为第三类型流水表,则调用所述任务调度接口模板中的第三执行脚本,从各第三类型流水表中分别抽取相应字段对应的第三数据,并将抽取的第三数据分别存入各第三类型目标表的相应字段。
优选地,在其它实施例中,所述多任务调度系统20被所述处理器22执行时,还实现如下步骤:
通过并行调度机制,调用所述任务调度接口模板中相应的任务执行脚本,并行执行各数据源对应的建表任务和数据同步任务,从各源表中分别抽取相应字段对应的数据,并将抽取的数据分别存入各目标表的相应字段。
通过上述功能模块201-204,本发明所提出的多任务调度系统20,根据用户选择的需要同步的源表和数据源类型,自动生成各数据源对应的建表任务和数据同步任务;同时,通过一次性将不同的指定文件(如参数配置脚本、任务执行脚本、及任务调度脚本)部署到一任务调度接口模板,当进行数据同步操作时,直接调用该任务调度接口模板,并将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板,自动执行各数据源对应的建表任务和数据同步任务,实现了多数据源数据同步的全程自动化,不用部署流程,将API接口调用参数化,数据同步时只需传递同步参数即可完成同步任务。
此外,本发明还提出一种多任务调度方法。
参阅图4所示,是本发明多任务调度方法一实施例的实施流程示意图。在本实施例中,根据不同的需求,图4所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
步骤S41,建立一数据平台4与至少一个数据源5的第一连接(或称其为第一类连接),并建立该数据平台4与一应用服务器2(如解析服务器)的第二连接(或称其为第二类连接)。
优选地,在本实施例中,所述数据平台4采用Hadoop数据平台,并通过该数据平台4中的数据传输工具建立该数据平台4与各数据源5的第一连接。例如,所述数据传输工具为Hadoop中设置的Sqoop工具。本领域技术人员应当可以理解,在其它实施例中,所述数据平台和数据传输工具也可以采用其它类型。
步骤S42,接收用户选择的需要同步的源表(部分或全部)和数据源类型,根据预先解析获得的各数据源的源表结构,生成各数据源对应的建表任务和数据同步任务(或称其为数据抽取任务),并将所述生成的各数据源对应的建表任务和数据同步任务发布至预设的工作流调度引擎(如oozie调度引擎)。
优选地,在本实施例中,所述数据源类型包括,但不限于,第一类型数据源(如MSSQL Server数据源),第二类型数据源(如Oracle数据源),第三类型数据源(如MySQL数据源)等。本领域技术人员应当可以理解,在其它实施例中,所述数据源类型的数量,也可以根据不同数据平台的需求增加或减少。例如,用户可以选择同步第一类型数据源中的部分源表。
优选地,在本实施例中,所述数据源的源表结构包括,但不限于,各数据源的数据类型和包含的字段信息等。
优选地,在本实施例中,所述应用服务器2中设置有各数据源5相应的解析脚本文件,通过并行调度机制,控制所述数据平台4中的数据传输工具并行执行各解析脚本文件中的源表结构解析任务,解析获得各数据源的源表结构,并通过所述第二连接将解析获得的各数据源的源表结构返回至所述应用服务器2。
优选地,在本实施例中,所述生成各数据源对应的建表任务包括:根据用户选择的需要同步的源表(部分或全部)和各源表的类型,生成与该选择的源表类型对应的目标表。优选地,在本实施例中,所述源表类型包括,但不限于,第一类型维度表(即数据量小,关联配置使用的源表)、第二类型任务表(即表中数据不断有更新和新增,且当天会更新当天除外的历史数据)、第三类型流水表(即表中数据不断有新增,且当天不会更新当天除外的历史数据)。
具体而言,若用户选择的需要同步的源表类型为第一类型维度表(即数据量小,关联配置使用的源表),则生成与所述第一类型维度表的源表结构对应的第一类型目标表,其中,所述第一类型目标表的数量根据所述用户选择的需要同步的第一类型源表数量确定。
若用户选择的需要同步的源表类型为第二类型任务表(即表中数据不断有更新和新增,且当天会更新当天除外的历史数据),则生成与所述第二类型任务表的源表结构对应的第二类型目标表,其中,所述第二类型目标表的数量根据所述用户选择的需要同步的第二类型源表数量确定。
若用户选择的需要同步的源表类型为第三类型流水表(即表中数据不断有新增,且当天不会更新当天除外的历史数据),则生成与所述第三类型流水表的源表结构对应的第三类型目标表,其中,所述第三类型目标表的数量根据所述用户选择的需要同步的第三类型源表数量确定。
优选地,在本实施例中,所述生成各数据源对应的数据同步任务包括:
根据用户选择的需要同步的开始时间和结束时间确定从各源表开始抽取数据的时间和停止抽取数据的时间;
根据用户选择的需要同步的源表数量及同步的目标端用户确定数据同步各个任务所需的资源配置(如CPU、内存和磁盘等)和资源管理节点,其中,所述资源配置可以通过列表方式实现,所述资源管理节点可以采用Hadoop资源表示模型和资源分配模型实现;
建立所述需要同步的源表的相应字段与所述生成的各目标表的相应字段的对应关系,并根据源表与目标表相应字段的对应关系生成各源表对应的数据抽取任务。
具体而言,若用户选择的需要同步的源表类型为第一类型维度表,则建立所述需要同步的第一类型维度表的相应字段与所述生成的各第一类型目标表的相应字段的对应关系,并根据第一类型维度表与第一类型目标表相应字段的对应关系生成各第一类型维度表对应的数据抽取任务;
若用户选择的需要同步的源表类型为第二类型任务表,则建立所述需要同步的第二类型任务表的相应字段与所述生成的各第二类型目标表的相应字段的对应关系,并根据第二类型任务表与第二类型目标表相应字段的对应关系生成各第二类型任务表对应的数据抽取任务;
若用户选择的需要同步的源表类型为第三类型流水表,则建立所述需要同步的第三类型流水表的相应字段与所述生成的各第三类型目标表的相应字段的对应关系,并根据第三类型流水表与第三类型目标表相应字段的对应关系生成各第三类型流水表对应的数据抽取任务。
步骤S43,当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎从指定的文件系统中调用预先设置的任务调度接口模板,并通过该预设的工作流调度引擎将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板。在本实施方式中,所述指定的文件系统为分布式文件系统,如Hadoop分布式文件系统(Hadoop DistributedFile System,HDFS),所述任务调度接口模板为oozie web service API(ApplicationProgramming Interface,应用程序编程接口)模板。其中,所述任务调度接口模版预先部署至所述指定的文件系统中。
优选地,在本实施例中,所述同步参数包括,但不限于,各个任务所需的资源配置和资源管理节点、数据同步的开始时间和结束时间、选择该同步参数的用户名等信息。
优选地,在本实施例中,所述任务调度接口模板包括,但不限于,参数配置脚本、任务执行脚本、及任务调度脚本。其中,所述参数配置脚本为shell脚本,用于接收所述工作流调度引擎传递的同步参数。所述任务执行脚本为XML(Extensible Markup Language,可扩展标记语言)脚本,用于根据各数据源对应的数据同步任务的同步参数,执行各数据源对应的建表任务和数据同步任务。所述任务调度脚本为XML脚本,用于管理各数据源对应的数据同步任务的执行顺序。
优选地,在本实施例中,所述任务执行脚本包括,但不限于,用于从第一类型维度表抽取数据的第一执行脚本,用于从第二类型任务表抽取数据的第二执行脚本,用于从第三类型流水表抽取数据的第三执行脚本。
步骤S44,根据各数据源对应的数据同步任务的同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。
优选地,在本实施例中,所述数据同步任务的执行包括:
调用所述任务调度接口模板中各数据源相应的任务执行脚本,获取数据同步各个任务所需的资源配置,从各源表中分别抽取相应字段对应的数据(元数据信息),并将抽取的数据分别存入各目标表的相应字段。
具体而言,若用户选择的需要同步的源表类型为第一类型维度表,则调用所述任务调度接口模板中的第一执行脚本,从各第一类型维度表中分别抽取相应字段对应的第一数据,并将抽取的第一数据分别存入各第一类型目标表的相应字段;
若用户选择的需要同步的源表类型为第二类型任务表,则调用所述任务调度接口模板中的第二执行脚本,从各第二类型任务表中分别抽取相应字段对应的第二数据,并将抽取的第二数据分别存入各第二类型目标表的相应字段;
若用户选择的需要同步的源表类型为第三类型流水表,则调用所述任务调度接口模板中的第三执行脚本,从各第三类型流水表中分别抽取相应字段对应的第三数据,并将抽取的第三数据分别存入各第三类型目标表的相应字段。
优选地,在其它实施例中,该方法还包括步骤:
通过并行调度机制,调用所述任务调度接口模板中相应的任务执行脚本,并行执行各数据源对应的建表任务和数据同步任务,从各源表中分别抽取相应字段对应的数据,并将抽取的数据分别存入各目标表的相应字段。
通过上述步骤S41-S44,本发明所提出的多任务调度方法,根据用户选择的需要同步的源表和数据源类型,自动生成各数据源对应的建表任务和数据同步任务;同时,通过一次性将不同的指定文件(如参数配置脚本、任务执行脚本、及任务调度脚本)部署到一任务调度接口模板,当进行数据同步操作时,直接调用该任务调度接口模板,并将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板,自动执行各数据源对应的建表任务和数据同步任务,实现了多数据源数据同步的全程自动化,不用部署流程,将API接口调用参数化,数据同步时只需传递同步参数即可完成同步任务。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质(如ROM/RAM、磁碟、光盘),所述计算机可读存储介质存储有多任务调度系统20,所述多任务调度系统20可被至少一个处理器22执行,以使所述至少一个处理器22执行如上所述的多任务调度方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明,比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种应用服务器,其特征在于,所述应用服务器包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多任务调度系统,所述多任务调度系统被所述处理器执行时实现如下步骤:
建立一数据平台与至少一个数据源的第一连接,并建立该数据平台与该应用服务器的第二连接;
接收用户选择的需要同步的源表和数据源类型,根据预先解析获得的各数据源的源表结构,生成各数据源对应的建表任务和数据同步任务,并将所述生成的各数据源对应的建表任务和数据同步任务发布至预设的工作流调度引擎;
当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎从指定的文件系统中调用预先设置的任务调度接口模板,并通过该预设的工作流调度引擎将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板,所述任务调度接口模板包括参数配置脚本、任务执行脚本、及任务调度脚本,所述参数配置脚本用于接收所述工作流调度引擎传递的同步参数,所述任务执行脚本用于根据各数据源对应的数据同步任务的同步参数,执行各数据源对应的建表任务和数据同步任务,所述任务调度脚本用于管理各数据源对应的数据同步任务的执行顺序;及
根据各数据源对应的数据同步任务的同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。
2.如权利要求1所述的应用服务器,其特征在于,所述源表包括第一类型维度表、第二类型任务表及第三类型流水表,所述第一类型维度表指的是数据量小、关联配置使用的源表,所述第二类型任务表指的是表中数据不断有更新和新增、且当天更新当天除外的历史数据的源表,所述第三类型流水表指的是表中数据不断有新增、且只更新当天数据的源表,所述任务执行脚本包括用于从所述第一类型维度表抽取数据的第一执行脚本,用于从所述第二类型任务表抽取数据的第二执行脚本,及用于从所述第三类型流水表抽取数据的第三执行脚本。
3.如权利要求2所述的应用服务器,其特征在于,所述数据同步任务的执行包括:
若用户选择的需要同步的源表为第一类型维度表,则调用所述任务调度接口模板中的第一执行脚本,从各第一类型维度表中分别抽取相应字段对应的第一数据,并将抽取的第一数据分别存入各第一类型目标表的相应字段;
若用户选择的需要同步的源表为第二类型任务表,则调用所述任务调度接口模板中的第二执行脚本,从各第二类型任务表中分别抽取相应字段对应的第二数据,并将抽取的第二数据分别存入各第二类型目标表的相应字段;及
若用户选择的需要同步的源表为第三类型流水表,则调用所述任务调度接口模板中的第三执行脚本,从各第三类型流水表中分别抽取相应字段对应的第三数据,并将抽取的第三数据分别存入各第三类型目标表的相应字段。
4.一种多任务调度方法,应用于应用服务器,其特征在于,所述方法包括:
建立一数据平台与至少一个数据源的第一连接,并建立该数据平台与该应用服务器的第二连接;
接收用户选择的需要同步的源表和数据源类型,根据预先解析获得的各数据源的源表结构,生成各数据源对应的建表任务和数据同步任务,并将所述生成的各数据源对应的建表任务和数据同步任务发布至预设的工作流调度引擎;
当用户选择的同步开始时间到达时,通过该预设的工作流调度引擎从指定的文件系统中调用预先设置的任务调度接口模板,并通过该预设的工作流调度引擎将各数据源对应的数据同步任务的同步参数传递至所述任务调度接口模板,所述任务调度接口模板包括参数配置脚本、任务执行脚本、及任务调度脚本,所述参数配置脚本用于接收所述工作流调度引擎传递的同步参数,所述任务执行脚本用于根据各数据源对应的数据同步任务的同步参数,执行各数据源对应的建表任务和数据同步任务,所述任务调度脚本用于管理各数据源对应的数据同步任务的执行顺序;及
根据各数据源对应的数据同步任务的同步参数,调用所述任务调度接口模板中相应的任务执行脚本,执行各数据源对应的建表任务和数据同步任务。
5.如权利要求4所述的多任务调度方法,其特征在于,所述源表包括第一类型维度表、第二类型任务表及第三类型流水表,所述第一类型维度表指的是数据量小、关联配置使用的源表,所述第二类型任务表指的是表中数据不断有更新和新增、且当天更新当天除外的历史数据的源表,所述第三类型流水表指的是表中数据不断有新增、且只更新当天数据的源表,所述任务执行脚本包括用于从所述第一类型维度表抽取数据的第一执行脚本,用于从所述第二类型任务表抽取数据的第二执行脚本,及用于从所述第三类型流水表抽取数据的第三执行脚本。
6.如权利要求4或5所述的多任务调度方法,其特征在于,所述数据同步任务的执行包括:
调用所述任务调度接口模板中各数据源相应的任务执行脚本,获取数据同步各个任务所需的资源配置,从各源表中分别抽取相应字段对应的数据,并将抽取的数据分别存入各目标表的相应字段。
7.如权利要求6所述的多任务调度方法,其特征在于,所述数据同步任务的执行包括:
若用户选择的需要同步的源表为第一类型维度表,则调用所述任务调度接口模板中的第一执行脚本,从各第一类型维度表中分别抽取相应字段对应的第一数据,并将抽取的第一数据分别存入各第一类型目标表的相应字段;
若用户选择的需要同步的源表为第二类型任务表,则调用所述任务调度接口模板中的第二执行脚本,从各第二类型任务表中分别抽取相应字段对应的第二数据,并将抽取的第二数据分别存入各第二类型目标表的相应字段;及
若用户选择的需要同步的源表为第三类型流水表,则调用所述任务调度接口模板中的第三执行脚本,从各第三类型流水表中分别抽取相应字段对应的第三数据,并将抽取的第三数据分别存入各第三类型目标表的相应字段。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有多任务调度系统,所述多任务调度系统可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求4-7中任一项所述的多任务调度方法的步骤。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710490454.5A CN107766132B (zh) | 2017-06-25 | 2017-06-25 | 多任务调度方法、应用服务器及计算机可读存储介质 |
KR1020187024858A KR102162872B1 (ko) | 2017-06-25 | 2017-08-31 | 멀티 타스크 스케줄링 방법, 시스템, 애플리케이션 서버 및 컴퓨터 판독 가능한 저장매체 |
JP2018537644A JP6695984B2 (ja) | 2017-06-25 | 2017-08-31 | マルチタスクスケジューリング方法、システム、アプリケーションサーバ及びコンピュータの読み取り可能な記憶媒体 |
PCT/CN2017/100052 WO2019000630A1 (zh) | 2017-06-25 | 2017-08-31 | 多任务调度方法、系统、应用服务器及计算机可读存储介质 |
US16/084,980 US11061925B2 (en) | 2017-06-25 | 2017-08-31 | Multi-task scheduling method and system, application server and computer-readable storage medium |
AU2017409830A AU2017409830B2 (en) | 2017-06-25 | 2017-08-31 | Multi-task scheduling method and system, application server and computer-readable storage medium |
EP17904352.6A EP3454209A4 (en) | 2017-06-25 | 2017-08-31 | METHOD AND SYSTEM FOR PLANNING MULTIPLE TASKS, APPLICATION SERVER AND COMPUTER READABLE STORAGE MEDIUM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710490454.5A CN107766132B (zh) | 2017-06-25 | 2017-06-25 | 多任务调度方法、应用服务器及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107766132A CN107766132A (zh) | 2018-03-06 |
CN107766132B true CN107766132B (zh) | 2019-03-15 |
Family
ID=61264944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710490454.5A Active CN107766132B (zh) | 2017-06-25 | 2017-06-25 | 多任务调度方法、应用服务器及计算机可读存储介质 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11061925B2 (zh) |
EP (1) | EP3454209A4 (zh) |
JP (1) | JP6695984B2 (zh) |
KR (1) | KR102162872B1 (zh) |
CN (1) | CN107766132B (zh) |
AU (1) | AU2017409830B2 (zh) |
WO (1) | WO2019000630A1 (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763341B (zh) * | 2018-05-14 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 电子装置、自动化建表方法及存储介质 |
CN110866062B (zh) * | 2018-08-09 | 2023-11-24 | 菜鸟智能物流控股有限公司 | 基于分布式集群的数据同步方法以及装置 |
CN109684053B (zh) * | 2018-11-05 | 2023-08-01 | 广东岭南通股份有限公司 | 大数据的任务调度方法和系统 |
CN109542920B (zh) * | 2018-11-23 | 2021-11-19 | 泰康保险集团股份有限公司 | 一种数据传输方法、装置、介质和电子设备 |
CN109614446A (zh) * | 2018-11-23 | 2019-04-12 | 金色熊猫有限公司 | 数据同步方法、装置、电子设备及存储介质 |
CN110209652B (zh) * | 2019-05-20 | 2024-02-02 | 平安科技(深圳)有限公司 | 数据表迁移方法、装置、计算机设备和存储介质 |
CN110780937B (zh) * | 2019-09-16 | 2023-12-08 | 腾讯大地通途(北京)科技有限公司 | 任务发布方法、装置、计算机可读存储介质及设备 |
CN110716987B (zh) * | 2019-10-18 | 2023-06-20 | 浪潮软件股份有限公司 | 一种同步任务异步执行的方法和调度系统 |
CN111708750A (zh) * | 2019-12-27 | 2020-09-25 | 山东鲁能软件技术有限公司 | 一种基于大数据平台存储适配方法,系统,设备及可读存储介质 |
CN111177247B (zh) * | 2019-12-30 | 2023-10-20 | 腾讯科技(深圳)有限公司 | 一种数据转换的方法、装置及存储介质 |
CN111324434B (zh) * | 2020-02-04 | 2023-03-21 | 支付宝(杭州)信息技术有限公司 | 计算任务的配置方法、装置及执行系统 |
CN111258742B (zh) * | 2020-02-17 | 2023-08-04 | 杭州依图医疗技术有限公司 | 一种数据同步的方法、系统、计算设备及存储介质 |
KR102298342B1 (ko) * | 2020-05-11 | 2021-09-06 | 주식회사제이앤케이씨 | 정보 연동 시스템 및 정보 연동 방법 |
CN111625331B (zh) * | 2020-05-20 | 2023-06-16 | 拉扎斯网络科技(上海)有限公司 | 任务调度方法、装置、平台、服务器及存储介质 |
US11113105B1 (en) * | 2020-06-09 | 2021-09-07 | Infosys Limited | Computer implemented system and method for generating platform agnostic digital worker |
CN111913791B (zh) * | 2020-07-02 | 2023-10-13 | 北京和瑞精湛医学检验实验室有限公司 | 任务调度方法、装置、设备和计算机可读存储介质 |
CN113760240B (zh) * | 2020-09-02 | 2024-06-14 | 北京沃东天骏信息技术有限公司 | 一种生成数据模型的方法和装置 |
CN112487090A (zh) * | 2020-11-30 | 2021-03-12 | 乐刷科技有限公司 | 数据同步方法、数据展示平台及计算机可读存储介质 |
CN112597242B (zh) * | 2020-12-16 | 2023-06-06 | 四川新网银行股份有限公司 | 一种基于涉及批量任务的应用系统数据切片的抽取方法 |
CN112905339B (zh) * | 2021-02-08 | 2024-02-13 | 中国工商银行股份有限公司 | 任务调度执行方法、装置及系统 |
CN112925622A (zh) * | 2021-02-26 | 2021-06-08 | 北信源系统集成有限公司 | 系统定时任务处理方法、装置、电子设备及存储介质 |
CN113238846A (zh) * | 2021-05-20 | 2021-08-10 | 浙江网商银行股份有限公司 | 任务调度的方法以及装置 |
KR102566983B1 (ko) * | 2021-06-01 | 2023-08-14 | 성균관대학교산학협력단 | 스케줄러 기반의 워크플로우 프로세스 자동화 모델 장치 |
CN113220694A (zh) * | 2021-06-02 | 2021-08-06 | 中国农业银行股份有限公司 | 数据表的处理方法、装置、服务器及存储介质 |
CN113296915B (zh) * | 2021-06-18 | 2023-07-18 | 瀚云科技有限公司 | 一种基于工业互联网平台的任务生成方法及系统 |
CN113449035B (zh) * | 2021-06-29 | 2024-06-04 | 平安健康保险股份有限公司 | 数据同步方法、装置、计算机设备及可读存储介质 |
CN113918636B (zh) * | 2021-10-21 | 2024-04-19 | 中通服公众信息产业股份有限公司 | 一种基于etl的数据处理量分析方法 |
WO2023101610A2 (en) * | 2021-12-01 | 2023-06-08 | Shopee IP Singapore Private Limited | Device and method for synchronizing data between data sources |
CN114254039A (zh) * | 2021-12-02 | 2022-03-29 | 东方财富信息股份有限公司 | 分布式同步系统 |
CN114371808B (zh) * | 2022-01-10 | 2024-09-10 | 百融至信(北京)科技有限公司 | 一种基于调度系统流程节点参数传递方法及系统 |
CN115834605B (zh) * | 2023-02-20 | 2023-05-12 | 塔比星信息技术(深圳)有限公司 | 数据采集方法、装置、设备及存储介质 |
CN116860227B (zh) * | 2023-07-12 | 2024-02-09 | 北京东方金信科技股份有限公司 | 一种基于大数据etl脚本编排的数据开发系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339323A (zh) * | 2011-11-11 | 2012-02-01 | 江苏鸿信系统集成有限公司 | 一种针对db2数据仓库进行数据抽取、调度及展现的方法 |
CN104410875A (zh) * | 2014-11-25 | 2015-03-11 | 上海美琦浦悦通讯科技有限公司 | 实现iptv盒端业务零配置自动开通的系统及方法 |
CN105095327A (zh) * | 2014-05-23 | 2015-11-25 | 深圳市珍爱网信息技术有限公司 | 一种分布式etl系统及调度方法 |
CN106528070A (zh) * | 2015-09-15 | 2017-03-22 | 阿里巴巴集团控股有限公司 | 一种数据表生成方法及设备 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6151608A (en) * | 1998-04-07 | 2000-11-21 | Crystallize, Inc. | Method and system for migrating data |
US7107589B1 (en) * | 2001-09-28 | 2006-09-12 | Siebel Systems, Inc. | Infrastructure for the automation of the assembly of schema maintenance scripts |
KR100491541B1 (ko) * | 2003-08-01 | 2005-05-25 | 니트젠테크놀러지스 주식회사 | 네트웍 환경에서의 컨텐츠 동기화 시스템 및 동기화 방법 |
US7865574B1 (en) * | 2003-10-09 | 2011-01-04 | Sprint Communications Company L.P. | System for processing data retrieved from an information service layer |
US9558042B2 (en) * | 2004-03-13 | 2017-01-31 | Iii Holdings 12, Llc | System and method providing object messages in a compute environment |
EP2438537A4 (en) * | 2009-06-05 | 2013-05-01 | Hewlett Packard Development Co | SYSTEM AND METHOD FOR REPRESENTING USER INTERACTION WITH A WEB SERVICE |
JP4959774B2 (ja) * | 2009-11-30 | 2012-06-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | アプリケーション生成システム、方法及びプログラム |
US9430505B2 (en) * | 2011-04-18 | 2016-08-30 | Infosys Limited | Automated data warehouse migration |
WO2014043416A1 (en) * | 2012-09-12 | 2014-03-20 | Genesys Telecommunications Laboratories, Inc. | System and method for dynamic configuration of contact centers via templates |
JP2014106907A (ja) * | 2012-11-29 | 2014-06-09 | Ricoh Co Ltd | 情報処理装置およびプログラム |
US9805070B2 (en) * | 2013-07-09 | 2017-10-31 | Oracle International Corporation | Dynamic migration script management |
US9607020B1 (en) * | 2013-09-17 | 2017-03-28 | Amazon Technologies, Inc. | Data migration system |
CN104317843B (zh) * | 2014-10-11 | 2017-08-25 | 上海瀚之友信息技术服务有限公司 | 一种数据同步etl系统 |
CN106156165A (zh) * | 2015-04-16 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 异构数据源之间的数据同步方法和装置 |
CN105045602B (zh) * | 2015-08-24 | 2019-07-23 | 北京金山安全软件有限公司 | 一种构建Hadoop应用开发框架的方法、装置及电子装置 |
US20170098180A1 (en) * | 2015-10-05 | 2017-04-06 | Yahoo! Inc. | Method and system for automatically generating and completing a task |
US10620974B2 (en) * | 2017-02-13 | 2020-04-14 | Microsoft Technology Licensing, Llc | Gallery control with dynamically determined control template replica sizes |
-
2017
- 2017-06-25 CN CN201710490454.5A patent/CN107766132B/zh active Active
- 2017-08-31 US US16/084,980 patent/US11061925B2/en active Active
- 2017-08-31 WO PCT/CN2017/100052 patent/WO2019000630A1/zh active Application Filing
- 2017-08-31 JP JP2018537644A patent/JP6695984B2/ja active Active
- 2017-08-31 AU AU2017409830A patent/AU2017409830B2/en active Active
- 2017-08-31 EP EP17904352.6A patent/EP3454209A4/en not_active Ceased
- 2017-08-31 KR KR1020187024858A patent/KR102162872B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339323A (zh) * | 2011-11-11 | 2012-02-01 | 江苏鸿信系统集成有限公司 | 一种针对db2数据仓库进行数据抽取、调度及展现的方法 |
CN105095327A (zh) * | 2014-05-23 | 2015-11-25 | 深圳市珍爱网信息技术有限公司 | 一种分布式etl系统及调度方法 |
CN104410875A (zh) * | 2014-11-25 | 2015-03-11 | 上海美琦浦悦通讯科技有限公司 | 实现iptv盒端业务零配置自动开通的系统及方法 |
CN106528070A (zh) * | 2015-09-15 | 2017-03-22 | 阿里巴巴集团控股有限公司 | 一种数据表生成方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6695984B2 (ja) | 2020-05-20 |
EP3454209A4 (en) | 2020-01-01 |
CN107766132A (zh) | 2018-03-06 |
AU2017409830B2 (en) | 2019-10-03 |
US11061925B2 (en) | 2021-07-13 |
EP3454209A1 (en) | 2019-03-13 |
US20210124757A1 (en) | 2021-04-29 |
JP2019523462A (ja) | 2019-08-22 |
KR20190038750A (ko) | 2019-04-09 |
AU2017409830A1 (en) | 2019-01-17 |
KR102162872B1 (ko) | 2020-10-08 |
WO2019000630A1 (zh) | 2019-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766132B (zh) | 多任务调度方法、应用服务器及计算机可读存储介质 | |
CN107689982A (zh) | 多数据源数据同步方法、应用服务器及计算机可读存储介质 | |
CN107172187B (zh) | 一种负载均衡系统和方法 | |
CN108574702A (zh) | 一种云应用部署方法和系统 | |
CN108428104A (zh) | 薪资计算方法、应用服务器及计算机可读存储介质 | |
CN105159718B (zh) | 固件升级方法及装置 | |
CN108319463A (zh) | 一种应用升级方法、装置 | |
CN111245634B (zh) | 一种虚拟化管理方法及装置 | |
CN106953746A (zh) | 集群节点升级系统及方法 | |
CN110347747A (zh) | 数据库间数据同步方法、系统、计算机设备及存储介质 | |
CN104793998B (zh) | 终端系统资源管理方法及装置 | |
CN111356182A (zh) | 一种资源的调度、处理方法及装置 | |
CN110233874A (zh) | 用于物联网设备的信息传输方法及装置 | |
CN109327321B (zh) | 网络模型业务执行方法、装置、sdn控制器及可读存储介质 | |
CN108255735A (zh) | 关联环境测试方法、电子装置及计算机可读存储介质 | |
CN112835700B (zh) | 基于智能合约的数据处理方法、装置、设备及存储介质 | |
CN112311741A (zh) | 一种防火墙规则管理方法、装置、介质及设备 | |
CN109150694A (zh) | 动态场景信息的发送方法、显示方法及服务器和移动终端 | |
CN107563871A (zh) | Ota网站的酒店任务单的管理方法及系统 | |
CN107733715A (zh) | 一种分布式系统中配置信息的管理系统及方法 | |
CN114675940A (zh) | 应用实例构建方法、装置和设备 | |
KR20150137766A (ko) | 가상머신 스택 생성 시스템 및 방법 | |
CN116170822B (zh) | 一种5g网络资源管理方法及系统 | |
CN103996091A (zh) | 运维管理系统的通用设备快速导入方法 | |
CN105743944B (zh) | 业务流程部署方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |