CN104461747B - 一种分布式任务调度系统 - Google Patents

一种分布式任务调度系统 Download PDF

Info

Publication number
CN104461747B
CN104461747B CN201410845199.8A CN201410845199A CN104461747B CN 104461747 B CN104461747 B CN 104461747B CN 201410845199 A CN201410845199 A CN 201410845199A CN 104461747 B CN104461747 B CN 104461747B
Authority
CN
China
Prior art keywords
task
layer module
tasks
execution
intermediate layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410845199.8A
Other languages
English (en)
Other versions
CN104461747A (zh
Inventor
贺群斐
舒志龙
陈学文
李晓
彭锦臻
姚键
潘柏宇
卢述奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Youku Network Technology Beijing Co Ltd
Original Assignee
1Verge Internet Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Verge Internet Technology Beijing Co Ltd filed Critical 1Verge Internet Technology Beijing Co Ltd
Priority to CN201410845199.8A priority Critical patent/CN104461747B/zh
Publication of CN104461747A publication Critical patent/CN104461747A/zh
Application granted granted Critical
Publication of CN104461747B publication Critical patent/CN104461747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本申请公开分布式任务调度系统,任务中间层模块用于通过接口接收输入的任务配置信息配置到调度服务器中,同时存储具有任务编号的任务为至少2个任务工作节点提供;调度服务器用于根据存储的任务配置的执行时程表,当执行时程表中的配置时间到达时,从至少2个任务工作节点选择其中之一,并创建分布式队列的任务和任务编号发送给选择后的任务工作节点;任务工作节点用于接收到调度服务器发送的任务编号后从任务中间层模块查找与其内存储有相同的任务编号,并根据该任务编号从任务中间层模块中查找出对应的任务进行执行。本发明解决了对服务器中计划任务的管理,可以实时监控计划任务的执行状态,当任务失败后如何合理的处理相应的计划任务问题。

Description

一种分布式任务调度系统
技术领域
本申请涉及分布式的数据采集端领域,更具体地,涉及一种分布式任务调度系统。
背景技术
现有技术中,类Unix服务器上通常需要执行一些计划任务,现有方案基本都是使用crontab命令进行周期性的执行任务。
现在的crontab配置都是单独的写在对应的服务器上,随着线上服务被拆分得越来越细,服务计划任务的数量以及需要管理的服务器数量成倍增长,对计划任务的管理变的越来越复杂;对正在运行的计划任务没有合理的监控机制;当服务器宕机或者停电无法将原有任务转移到其他服务器完成。
所以,如何解决对服务器中计划任务的管理,同时可以实时监控计划任务的执行状态,当任务失败后如何合理的处理相应的计划任务,成为亟待解决的技术问题。
发明内容
有鉴于此,本申请提供一种分布式任务调度系统,以解决如何对服务器中计划任务的管理,同时可以实时监控计划任务的执行状态,当任务失败后如何合理的处理相应的计划任务问题。
本申请公开了一种分布式任务调度系统,其特征在于,包括:任务中间层模块、至少一调度服务器和至少2个任务工作节点;其中,
所述任务中间层模块,分别与所述调度服务器和至少2个任务工作节点相耦接,用于通过接口接收输入的任务配置信息配置到所述调度服务器中,同时存储具有任务编号的任务为所述至少2个任务工作节点提供;
所述调度服务器,分别与所述任务中间层模块和至少2个任务工作节点相耦接,用于根据存储的任务配置的执行时程表,当执行时程表中的配置时间到达时,从所述至少2个任务工作节点选择其中之一,并创建分布式队列的任务和任务编号发送给选择后的所述任务工作节点;
所述任务工作节点,分别与所述任务中间层模块和调度服务器相耦接,用于接收到所述调度服务器发送的任务编号后从所述任务中间层模块查找与其内存储有相同的任务编号,并根据该任务编号从所述任务中间层模块中查找出对应的任务进行执行。
优选地,其中,所述调度服务器,进一步还用于:在创建分布式队列的任务和任务编号发送给选择后的所述任务工作节点时,启动对该任务的超时检查,当超时时间到,且所述任务工作节点并没有将该任务执行完成或任务失败后,会根据配置的失败策略选择重新执行或不执行操作。
优选地,其中,所述失败策略,包括:当超时时间到,且所述任务工作节点对该任务失败后,选择不执行操作;
或者,当超时时间到,且所述任务工作节点并没有将该任务执行完成后,选择重新执行操作。
优选地,其中,所述接口,进一步为采用rest接口。
与现有技术相比,本申请所述的分布式任务调度系统,达到了如下效果:
1)本发明解决了对服务器中计划任务的管理,同时可以实时监控计划任务的执行状态,当任务失败后如何合理的处理相应的计划任务。
2)本发明还实现了计划任务的集中管理,计划任务的安全机制(worknode的选取、任务监控和任务失败的重试)。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为依据本发明实施例一所述的分布式任务调度系统结构图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
如图1所示,为依据本发明实施例一所述的分布式任务调度系统,该系统包括:任务中间层模块101、至少一调度服务器102和至少2个任务工作节点103;其中,
所述任务中间层模块101,分别与所述调度服务器102和至少2个任务工作节点103相耦接,用于通过接口(本实施例采用rest接口,这里不作具体限定)接收输入的任务配置信息配置到所述调度服务器102中,同时存储具有任务编号的任务为所述至少2个任务工作节点103提供;
所述调度服务器102,分别与所述任务中间层模块101和至少2个任务工作节点103相耦接,用于根据存储的任务配置的执行时程表,当执行时程表中的配置时间到达时,从所述至少2个任务工作节点103选择其中之一,并创建分布式队列的任务和任务编号(ID)发送给选择后的所述任务工作节点103;
所述任务工作节点103(worknode),分别与所述任务中间层模块101和调度服务器102相耦接,用于接收到所述调度服务器102发送的任务编号(ID)后从所述任务中间层模块101查找与其内存储有相同的任务编号,并根据该任务编号从所述任务中间层模块101中查找出对应的任务进行执行。
所述调度服务器102,进一步还用于在创建分布式队列的任务和任务编号发送给选择后的所述任务工作节点103时,启动对该任务的超时检查,当超时时间到,且所述任务工作节点103并没有将该任务执行完成或任务失败后,会根据配置的失败策略选择重新执行或不执行操作。
所述失败策略,主要包括:当超时时间到,且所述任务工作节点103对该任务失败后,选择不执行操作;
或者,当超时时间到,且所述任务工作节点103并没有将该任务执行完成后,选择重新执行操作。
当然这里失败策略还可以根据具体内容进行设定,在本发明中,这里不作具体限定。
所述执行时程表,具体为:让使用者在固定时间或固定间隔执行相应任务之用。
与现有技术相比,本申请所述的分布式任务调度系统,达到了如下效果:
1)本发明解决了对服务器中计划任务的管理,同时可以实时监控计划任务的执行状态,当任务失败后如何合理的处理相应的计划任务。
2)本发明还实现了计划任务的集中管理,计划任务的安全机制(worknode的选取、任务监控和任务失败的重试)。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者系统中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (3)

1.一种分布式任务调度系统,其特征在于,包括:任务中间层模块、至少一调度服务器和至少2个任务工作节点;其中,
所述任务中间层模块,分别与所述调度服务器和至少2个任务工作节点相耦接,用于通过接口接收输入的任务配置信息配置到所述调度服务器中,同时存储具有任务编号的任务为所述至少2个任务工作节点提供;
所述调度服务器,分别与所述任务中间层模块和至少2个任务工作节点相耦接,用于根据存储的任务配置的执行时程表,当执行时程表中的配置时间到达时,从所述至少2个任务工作节点选择其中之一,并创建分布式队列的任务和任务编号发送给选择后的所述任务工作节点;
所述任务工作节点,分别与所述任务中间层模块和调度服务器相耦接,用于接收到所述调度服务器发送的任务编号后从所述任务中间层模块查找与其内存储有相同的任务编号,并根据该任务编号从所述任务中间层模块中查找出对应的任务进行执行;
所述调度服务器,进一步还用于:在创建分布式队列的任务和任务编号发送给选择后的所述任务工作节点时,启动对该任务的超时检查,当超时时间到,且所述任务工作节点并没有将该任务执行完成或任务失败后,会根据配置的失败策略选择重新执行或不执行操作;
所述执行时程表包括任务节点执行相应任务的固定时间或固定间隔。
2.如权利要求1所述的分布式任务调度系统,其特征在于,所述失败策略,包括:当超时时间到,且所述任务工作节点对该任务失败后,选择不执行操作;
或者,当超时时间到,且所述任务工作节点并没有将该任务执行完成后,选择重新执行操作。
3.如权利要求1所述的分布式任务调度系统,其特征在于,所述接口,进一步为采用rest接口。
CN201410845199.8A 2014-12-31 2014-12-31 一种分布式任务调度系统 Active CN104461747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410845199.8A CN104461747B (zh) 2014-12-31 2014-12-31 一种分布式任务调度系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410845199.8A CN104461747B (zh) 2014-12-31 2014-12-31 一种分布式任务调度系统

Publications (2)

Publication Number Publication Date
CN104461747A CN104461747A (zh) 2015-03-25
CN104461747B true CN104461747B (zh) 2019-03-08

Family

ID=52907845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410845199.8A Active CN104461747B (zh) 2014-12-31 2014-12-31 一种分布式任务调度系统

Country Status (1)

Country Link
CN (1) CN104461747B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105119992A (zh) * 2015-08-24 2015-12-02 用友网络科技股份有限公司 分布式任务执行装置和方法
FR3052890B1 (fr) * 2016-06-21 2018-07-13 Thales Sa Procede de reception garantie de signaux communs dans un systeme avionique comportant une pluralite de calculateurs electroniques
CN106293911A (zh) * 2016-07-29 2017-01-04 乐视控股(北京)有限公司 分布式调度系统、方法
CN107783843B (zh) * 2016-08-31 2021-08-06 中国移动通信有限公司研究院 一种云数据的处理方法及装置
CN106936911B (zh) * 2017-03-13 2020-06-23 广州五舟科技股份有限公司 轻量级分布式计算平台及其计算资源管控方法
CN108287764A (zh) * 2018-01-31 2018-07-17 上海携程商务有限公司 分布式任务调度方法及其系统、存储介质、电子设备
CN108897854B (zh) * 2018-06-29 2020-06-05 京东数字科技控股有限公司 一种超时任务的监控方法和装置
CN109614209B (zh) * 2018-10-26 2023-09-05 创新先进技术有限公司 一种任务处理方法、应用服务器及系统
CN109542641A (zh) * 2018-11-14 2019-03-29 中国联合网络通信集团有限公司 服务调用方法、装置及系统
CN109831520A (zh) * 2019-03-07 2019-05-31 网宿科技股份有限公司 一种定时任务调度方法及相关装置
CN109918187B (zh) * 2019-03-12 2021-10-08 北京同城必应科技有限公司 任务调度方法、装置、设备和存储介质
CN111754085B (zh) * 2020-06-03 2022-02-18 深圳前海禾盈科技有限公司 一种调度生产计划的方法
CN115378839B (zh) * 2022-08-26 2023-12-12 北京百度网讯科技有限公司 采集任务的部署方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1480863A (zh) * 2002-09-06 2004-03-10 劲智数位科技股份有限公司 具有分布式负载平衡系统的集群计算机
CN101202761A (zh) * 2007-12-04 2008-06-18 赵晓宇 一种分布式资源调度系统及其方法
CN101986272A (zh) * 2010-11-05 2011-03-16 北京大学 一种云计算环境下的任务调度方法
CN103197969A (zh) * 2013-03-27 2013-07-10 百度在线网络技术(北京)有限公司 一种分布式定时任务控制装置及方法
CN103336709A (zh) * 2013-06-01 2013-10-02 北京华胜天成科技股份有限公司 一种在集群中实现虚拟化分布式统一管理的方法及系统
CN103677973A (zh) * 2013-09-01 2014-03-26 西安重装渭南光电科技有限公司 一种分布式多任务调度管理系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1480863A (zh) * 2002-09-06 2004-03-10 劲智数位科技股份有限公司 具有分布式负载平衡系统的集群计算机
CN101202761A (zh) * 2007-12-04 2008-06-18 赵晓宇 一种分布式资源调度系统及其方法
CN101986272A (zh) * 2010-11-05 2011-03-16 北京大学 一种云计算环境下的任务调度方法
CN103197969A (zh) * 2013-03-27 2013-07-10 百度在线网络技术(北京)有限公司 一种分布式定时任务控制装置及方法
CN103336709A (zh) * 2013-06-01 2013-10-02 北京华胜天成科技股份有限公司 一种在集群中实现虚拟化分布式统一管理的方法及系统
CN103677973A (zh) * 2013-09-01 2014-03-26 西安重装渭南光电科技有限公司 一种分布式多任务调度管理系统

Also Published As

Publication number Publication date
CN104461747A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
CN104461747B (zh) 一种分布式任务调度系统
US8880591B2 (en) Workflow management in distributed systems
CN104407847B (zh) 一种批处理的方法及装置
US20170031623A1 (en) Method and apparatus for configuring redundancy data center in cloud computing architecture
US9477460B2 (en) Non-transitory computer-readable storage medium for selective application of update programs dependent upon a load of a virtual machine and related apparatus and method
CN103458086B (zh) 一种智能手机及其故障检测方法
CN108431836A (zh) 用于硬件故障修复的基础设施管理系统
US20170134526A1 (en) Seamless cluster servicing
CN105677462A (zh) 基于物联网的分布式任务系统及业务处理方法
CN101542445A (zh) 零单点故障负载平衡器的设备及方法
CN108961033A (zh) 多业务系统交互方法及装置、存储介质、电子终端
US20150143380A1 (en) Scheduling workloads and making provision decisions of computer resources in a computing environment
JP2014241020A (ja) 運用計画立案支援システム及び方法
CN102681865A (zh) 分布式系统中的协调升级
Hinchey et al. Evolving critical systems: A research agenda for computer-based systems
CN104601668B (zh) 基于状态管理的数据推送方法、装置和系统
CN104468174A (zh) 一种集群服务器执行任务的方法和装置
CN104615486B (zh) 用于搜索推广平台的多任务调度和执行方法、装置和系统
CN103139245A (zh) 网元升级方法及装置
US20160034315A1 (en) Information processing system, deployment method, processing device, and deployment device
CN104461562A (zh) 一种任务创建的方法及系统
CN103516735A (zh) 一种网络节点升级的方法及装置
CN114153580A (zh) 一种跨多集群的工作调度方法及装置
CN103823719A (zh) 针对可执行程序的分布式云计算系统及针对可执行程序的分布式云计算方法
CN105787300B (zh) 一种控制软件使用的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee after: Youku network technology (Beijing) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee before: 1VERGE INTERNET TECHNOLOGY (BEIJING) Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20200318

Address after: 310018 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Patentee before: Youku network technology (Beijing) Co.,Ltd.

TR01 Transfer of patent right