CN109933422A - 处理任务的方法、装置、介质及电子设备 - Google Patents

处理任务的方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN109933422A
CN109933422A CN201711375227.4A CN201711375227A CN109933422A CN 109933422 A CN109933422 A CN 109933422A CN 201711375227 A CN201711375227 A CN 201711375227A CN 109933422 A CN109933422 A CN 109933422A
Authority
CN
China
Prior art keywords
task
processing
execution unit
information
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711375227.4A
Other languages
English (en)
Inventor
胡蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201711375227.4A priority Critical patent/CN109933422A/zh
Publication of CN109933422A publication Critical patent/CN109933422A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

本发明实施例提供了一种处理任务的方法、装置、介质及电子设备,该处理任务的方法包括:将待处理任务划分为多个执行单元;将所述多个执行单元发送至其它处理节点;确定向各个处理节点分配的需要处理的执行单元的信息;将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。本发明实施例的技术方案可以自动实现对待处理任务的划分,同时能够提高分布式计算的效率及处理性能。

Description

处理任务的方法、装置、介质及电子设备
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种处理任务的方法、装置、介质及电子设备。
背景技术
分布式调度在互联网企业中占据着十分重要的作用,尤其是电子商务领域,由于存在数据量大、高并发的特点,对数据的处理既要保证高效性,也要保证准确性和安全性,因此相对比较耗时的业务逻辑往往会从中剥离开来进行异步处理。
相关技术中提出的分布式系统框架或多或少都存在问题,比如TBSchedule(一种支持分布式调度的框架)和ElasticJob(一种分布式调度框架)需要用户自行对数据进行取模等分片动作,由于机器性能各有差异,执行速度也各有差异,因此可能会出现某单条数据执行慢造成整个分片执行慢,进而导致整个节点执行慢的问题。同时,对于用户来说,TBSchedule和ElasticJob在使用上并不方便,需要用户设计良好的分片策略才能有效执行。此外,由于分片全部在内存中进行,因此在作业任务过大或者并行作业过多的情况下容易引起分片节点的内存溢出,影响系统的处理性能。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种处理任务的方法、装置、介质及电子设备,进而至少在一定程度上解决分布式计算效率低、性能不高的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种处理任务的方法,包括:将待处理任务划分为多个执行单元;将所述多个执行单元发送至其它处理节点;确定向各个处理节点分配的需要处理的执行单元的信息;将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
在本发明的一些实施例中,基于前述方案,在将待处理任务划分为多个执行单元之前,还包括:向所述注册中心发送选举主处理节点的请求;其中,若接收到所述注册中心发送的作为主处理节点的反馈信息,则执行将所述待处理任务划分为多个执行单元的步骤。
在本发明的一些实施例中,基于前述方案,所述的处理任务的方法还包括:若接收到所述注册中心发送的作为从处理节点的反馈信息,则接收主处理节点发送的所述多个执行单元,并从所述注册中心获取需要处理的执行单元的信息。
在本发明的一些实施例中,基于前述方案,从所述注册中心获取需要处理的执行单元的信息,包括:对所述注册中心进行监听,以获取到需要处理的执行单元的信息。
在本发明的一些实施例中,基于前述方案,将待处理任务划分为多个执行单元,包括:按照每个执行单元包含的数据量,将所述待处理任务划分为多个执行单元。
在本发明的一些实施例中,基于前述方案,确定向各个处理节点分配的需要处理的执行单元的信息,包括:根据所述各个处理节点的处理能力,确定向所述各个处理节点分配的需要处理的执行单元的信息。
在本发明的一些实施例中,基于前述方案,根据需要处理的执行单元的信息对相应的执行单元进行处理,包括:根据需要处理的执行单元的信息,从所述多个执行单元中加载需要处理的执行单元进行处理。
在本发明的一些实施例中,基于前述方案,所述的处理任务的方法还包括:将对需要处理的执行单元的处理结果发送至所述注册中心。
在本发明的一些实施例中,基于前述方案,所述的处理任务的方法还包括:在需要处理任一任务时,确定所述任一任务是否存在具有依赖关系的父任务;若所述任一任务不存在所述父任务,则在接收到触发指令时开始处理所述任一任务;若所述任一任务存在所述父任务,则在所述父任务处理完成之后再开始处理所述任一任务。
在本发明的一些实施例中,基于前述方案,若所述任一任务存在所述父任务,则所述方法还包括:若所述父任务的处理时长超过预定时长后还未处理完成,则结束所述父任务的处理,并确定所述父任务处理完成。
根据本发明实施例的第二方面,提供了一种处理任务的装置,包括:划分单元,用于将待处理任务划分为多个执行单元;第一发送单元,用于将所述多个执行单元发送至其它处理节点;确定单元,用于确定向各个处理节点分配的需要处理的执行单元的信息;第二发送单元,用于将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
根据本发明实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的处理任务的方法。
根据本发明实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的处理任务的方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,(主处理节点)通过将待处理任务划分为多个执行单元,使得能够自动以预定的处理粒度来对待处理任务进行划分,无需用户进行分片操作;通过将多个执行单元发送至其它处理节点,使得各个处理节点都能够获取到该多个执行单元,进而在获取到需要处理的执行单元的信息时能够直接加载相应的执行单元进行处理;通过确定向各个处理节点分配的执行单元的信息,并将各个处理节点需要处理的执行单元的信息发送至注册中心,使得各个处理节点能够从注册中心获取到各自需要处理的执行单元的信息,以根据需要处理的执行单元的信息对相应的执行单元进行处理。可见,本发明实施例中提出的处理任务的方法可以自动实现对待处理任务的划分,同时使得各个处理节点能够根据各自需要处理的执行单元的信息仅加载需要处理的执行单元进行处理,无需将所有执行单元都加载至内存中,尽可能避免了在任务过大或并行作业过多而导致内存溢出的问题,进而能够提高分布式计算的效率及处理性能。
在本发明的一些实施例所提供的技术方案中,通过根据各个处理节点的处理能力确定向各个处理节点分配的需要处理的执行单元的信息,使得向各个处理节点分配的执行单元能够与各个处理节点的处理能力相匹配,有利于提高待处理任务的处理效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本发明的一个实施例的处理任务的方法的流程图;
图2示意性示出了根据本发明的另一个实施例的处理任务的方法的流程图;
图3示意性示出了根据本发明的一个实施例的分布式计算系统的结构图;
图4示出了根据本发明的一个实施例的任务树的结构示意图;
图5示意性示出了根据本发明的一个实施例的帧异构的流程图;
图6示出了根据本发明的一个实施例的对一个任务进行帧异构处理之后得到的各个帧的示意图;
图7示意性示出了根据本发明的一个实施例的帧文件的结构图;
图8示出了根据本发明的实施例的FrameJob的存储结构示意图;
图9示意性示出了根据本发明的一个实施例的处理任务的装置的框图;
图10示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示意性示出了根据本发明的一个实施例的处理任务的方法的流程图,该方法的执行主体可以是分布式系统中的一个处理节点。
参照图1所示,根据本发明的实施例的处理任务的方法,包括步骤S110、步骤S120、步骤S130和步骤S140。以下对各个步骤的实现细节进行阐述。
在步骤S110中,将待处理任务划分为多个执行单元。
在本发明的一个实施例中,可以按照每个执行单元包含的数据量,将所述待处理任务划分为多个执行单元。需要说明的是,在将待处理任务划分为多个执行单元之后,可以存储在本地磁盘中,避免存储在内存中而引发内存溢出的问题。
在步骤S120中,将所述多个执行单元发送至其它处理节点。
在本发明的一个实施例中,可以通过分布式系统中各个处理节点之间的网络连接来将上述多个执行单元发送至其它处理节点,以保证各个处理节点中都存储有上述多个执行单元。其中,各个处理节点可以将上述多个执行单元都存储在本地磁盘中。
在步骤S130中,确定向各个处理节点分配的需要处理的执行单元的信息。
在本发明的一个实施例中,可以根据所述各个处理节点的处理能力,确定向所述各个处理节点分配的需要处理的执行单元的信息,进而确保向各个处理节点分配的执行单元能够与各个处理节点的处理能力相匹配,提高待处理任务的处理效率。
在步骤S140中,将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
在本发明的一个实施例中,各个处理节点可以对注册中心进行监听,以获取到需要处理的执行单元的信息。
在本发明的一个实施例中,各个处理节点可以根据需要处理的执行单元的信息,从所述多个执行单元中加载需要处理的执行单元进行处理,这样能够仅将需要处理的执行单元加载至内存中,避免了在任务过大或并行作业过多而导致内存溢出的问题。
在本发明的一个实施例中,当对需要处理的执行单元处理之后,可以将处理结果发送至所述注册中心。
需要说明的是,上述步骤S120和步骤S130之间并没有绝对的执行先后顺序,既可以先执行步骤S120,再执行步骤S130;也可以先执行步骤S130,再执行步骤S120;或者同时执行步骤S120和步骤S130。
在本发明的一个实施例中,在步骤S110之前,还可以包括:向所述注册中心发送选举主处理节点的请求,若接收到所述注册中心发送的作为主处理节点的反馈信息,则执行步骤S110。在该实施例中,主处理节点会执行图1所示的方法。
可选地,在本发明的一个实施例中,若接收到所述注册中心发送的作为从处理节点的反馈信息,则接收主处理节点发送的所述多个执行单元,并从所述注册中心获取需要处理的执行单元的信息。在该实施例中,如果处理节点被选为从处理节点,则从处理节点无需对待处理任务进行划分,只需接收主处理节点发送的多个执行单元并监听注册中心,以获取需要处理的执行单元的信息即可。
图2示意性示出了根据本发明的另一个实施例的处理任务的方法的流程图。
参照图2所示,根据本发明的另一个实施例的处理任务的方法,包括:
步骤S210,在需要处理任一任务时,确定所述任一任务是否存在具有依赖关系的父任务。
步骤S220,若所述任一任务不存在所述父任务,则在接收到触发指令时开始处理所述任一任务。
在本发明的一个实施例中,触发指令可以是定时触发指令。
步骤S230,若所述任一任务存在所述父任务,则在所述父任务处理完成之后再开始处理所述任一任务。
在本发明的一个实施例中,若所述任一任务存在所述父任务,则所述方法还包括:若所述父任务的处理时长超过预定时长后还未处理完成,则结束所述父任务的处理,并确定所述父任务处理完成。该实施例的技术方案可以避免父任务的处理出现问题而影响后续子任务的执行,提高了系统的鲁棒性。
图2所示实施例的技术方案能够有效支撑复杂任务依赖关系的处理,保证了具有依赖关系的任务之间能够顺利执行。
参照图3所示,在本发明的一个实施例中,分布式计算系统包括:任务调度模块302、API、核心模块304、基本模块306、持久化存储模块308和运行环境310。
其中,任务调度模块302由任务调度程序(Job-Scheduler)或者开源作业调度框架Quartz来调度任务执行。
API中主要包含了如下三种任务类型:
(1)SimpleJob:简单实现Process()方法,执行业务逻辑。
(2)FlowJob:面向一些流式作业,比如订单数据,需要一直处理的任务,一直运行直到loadData的数据为空。
(3)FrameJob:该方式即为帧作业方式,对于数据量较大、执行时间较长的作业用该方式进行帧结构的数据异构,由主节点对帧数据进行调配。需要说明的是,帧作业的方式即为将待处理任务/作业进行帧异构,得到一个个执行单元(也可以称之为帧)。
核心模块304包含了Zookeeper单元、日志、系统配置、核心报表、系统日志等。
基本模块306包含了注册中心、监控中心、监听器、持久化功能和统计报表的功能。
持久化存储模块308包含各种数据库,比如MySQL数据库、Redis数据库、HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)等。
运行环境310包含了物理机、Docker(开源的应用容器引擎)、第三方虚拟机等。
在本发明的实施例中,在处理任务时,任务默认由Spring Quartz配置Cron表达式定时触发。当配置了任务之间的依赖关系时,Cron表达式触发失效,任务触发规则演变成由父任务都完成后自动触发。
比如对于图4所示的任务树,单个任务可以没有父任务,此时可以由Cron表达式定时触发,比如图4中所示的父任务1、父任务2和父任务3。单个任务也可以有n个父任务作业和n个子任务,比如图4中所示的任务1具有父任务1、父任务2和父任务3,且具有子任务1-1和子任务1-2,子任务1-2又具有子任务1-2-1、子任务1-2-2和子任务1-2-3。
对于具有父任务的目标任务,只有当所有的父任务均执行完毕后才能执行。比如对于任务1而言,只有父任务1、父任务2和父任务3执行完毕后才能执行任务1。
需要说明的是,在本发明的实施例中,父任务应设计为健壮的超时机制,比如若有异常情况发生导致执行超时,则结束该任务的执行,以便于避免影响后续子任务执行而引发任务雪崩效应。
子任务在初始化的时候,在注册中心写入一个父任务的计数器;同时子任务会监听父任务的完成状态,当有父任务执行完成,子任务计数器数量-1(比如可以由Zookeeper实现的分布式锁保证操作原子性)。当子任务计数器数量为0的时候,代表所有父任务已经全部执行完毕,子任务可以开始执行。
子任务写入状态znode,当全部父任务执行完成,进入Ready状态;帧开始计算,进入Running状态,主节点所有帧分发完毕,并且均已反馈结束状态,任务Complete。
需要说明的是,注册中心的选型不仅限于Zookeeper。当子任务执行之后,依赖于其的其它任务重复执行上述过程。
在本发明的一个实施例中,当任一任务被触发之后,可以进行本发明实施例中的帧异构流程,即上述的FrameJob方式。具体如图5所示。为便于说明,在图5中以分布式系统具有两个节点(即节点1和节点2)为例,在本发明的其它实施例中,分布式系统可以有更多个节点。
参照图5所示,帧异构流程主要包括以下步骤:
步骤S501,节点1向注册中心发起主节点选举请求。
步骤S502,注册中心进行选举判定,并选举节点1作为主节点。
步骤S503,节点1根据loadData数据按每帧数据量进行异构。
步骤S504,节点1将数据分帧存储进本地文件,成为一个个执行单元。
步骤S505,节点1与节点2同步帧文件,即节点1将帧文件发送至节点2。
步骤S506,节点1按照帧文件,异步多节点分帧,即向各个节点分配需要处理的帧的信息,然后将各节点需要处理的帧的信息发送至注册中心。此时注册中心获取到各个节点的帧元数据信息。
类似地,节点2也会向注册中心发起主节点选举请求,此时由于节点1已经成为主节点,所以节点2被选举为从节点。
当注册中心获取到各个节点的帧元数据信息之后,各个节点对注册中心进行监听,以确定各个节点需要处理的帧的信息,然后在本地存储的帧文件中找到自己需要处理的帧进行解析执行,最后向注册中心回写执行状态。
在本发明的一个实施例中,如图6所示为对一个任务进行帧异构处理之后得到的各个帧的示意图,其中的每个帧可以包含50个units(数值在此处仅为示例)。需要说明的是,单个帧包含的unit数量可以根据实际任务粒度进行调整。
在本发明的一个实施例中,单个帧的结构如表1所示:
Frame Meta Frame Content Frame Type Frame Spacing
表1
参照表1所示,单个帧主要包括如下字段:
Frame Meta:表示帧元数据信息,主要包括时间戳、帧索引值、帧描述、分隔符、单行帧数据的类信息等。
Frame Content:表示帧内容信息,主要包括帧文件地址、帧文件名称等。
Frame Type:表示帧数据类型,如Json/序列化二进制/xml等。
Frame Spacing:表示帧间隔长度,默认与帧大小一致。
在本发明的一个实施例中,上述的帧文件的结构如图7所示,当某一节点获取到其需要处理的帧的数据信息时,可以根据帧的数据信息中的文件地址寻址帧文件,然后根据帧类型转换成内存中数据,调用用户实现的processData()方法,处理业务逻辑。
在本发明的上述实施例中,FrameJob默认会消费单个帧,单个节点同样消费单个帧,当单个帧执行较快时,说明属于瞬时的任务,因此可以调整单帧大小,或者设置单个节点消费帧的数量进行配置调整。
在本发明的一个实施例中,一个FrameJob的存储结构如图8所示,包括:
ParentsCountr:表示父任务计数器;
Ready/Running/Complete:表示任务执行状态:
Configuration:表示任务配置文件,包括作业名称、描述、执行类、是否启用、每次帧分发数量(FrameJob)、是否开启流式处理(FlowJob)等作业配置信息。
Servers:表示注册在注册中心的有效的执行节点,各个节点都记录了IP地址,以及向其分配的帧的信息。
本发明上述实施例中由于各个节点是按帧进行计算存取的,因此能够有效减少计算中的TCP连接次数,进而能够有效减少RTT(Round-Trip Time,往返时延,表示从发送端发送数据开始,到发送端收到来自接收端的确认总共经历的时延),提升系统性能。
同时,本发明上述实施例中的帧异构方式能够保证所有节点以帧粒度的结构进行数据分布式计算,无需用户再进行类似的分片操作。
并且数据是按照帧结构及特定格式存储在本地磁盘中的,当从注册中心拉取到相应的帧元数据信息时,可以从本次磁盘中加载帧文件,解析数据,然后进行复杂运算。由于每个节点只需加载需要执行的帧,因此能够保证节点并行执行多个任务时不会轻易出现内存溢出的问题。
此外,本发明实施例的技术方案支持自定义线程池对帧数据进行异步并行消费,充分利用服务器性能进行并行计算,加快计算速度。并且支持自定义异常对异常情况的处理,多种策略保证任务有效不重复的执行。
本发明上述实施例具有如下效果:
1、通过任务树结构构建任务之间的依赖关系,有效支撑实际生产环境中复杂任务依赖关系的处理。
2、在应用本发明实施例的技术方案时,应用系统仅需要引入相关的安装包(如Jar包)即可使用。用户操作无需自行分片,系统会自动进行待处理数据的帧异构。对于执行时间长,并且存在多个任务并行情况,本发明实施例的帧异构方式避免了因为并行任务过多而容易导致内存溢出的问题,有效提升了节点并行异步处理任务的能力,有效减少了运维成本。
3、分帧计算可以将大任务按照特定的帧结构异构在本地磁盘与注册中心上,节省内存空间,提高整体运算效率。
4、分帧由于会根据实际节点的运算能力进行先消费完的先分,相比于预分片的设计,本发明实施例的技术方案能够有效平均任务分配,一定程度上避免数据倾斜。
以下介绍本发明的装置实施例,可以用于执行本发明上述的处理任务的方法。
图9示意性示出了根据本发明的一个实施例的处理任务的装置的框图。
参照图9所示,根据本发明的一个实施例的处理任务的装置900,包括:划分单元902、第一发送单元904、第一确定单元906和第二发送单元908。
其中,划分单元902用于将待处理任务划分为多个执行单元;第一发送单元904用于将所述多个执行单元发送至其它处理节点;第一确定单元906用于确定向各个处理节点分配的需要处理的执行单元的信息;第二发送单元908用于将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
在本发明的一些实施例中,基于前述方案,处理任务的装置900还包括:第三发送单元,用于在划分单元902将待处理任务划分为多个执行单元之前,向所述注册中心发送选举主处理节点的请求;其中,划分单元902配置为:若接收到所述注册中心发送的作为主处理节点的反馈信息,则执行将所述待处理任务划分为多个执行单元的步骤。
在本发明的一些实施例中,基于前述方案,所述处理任务的装置900还包括:获取单元,用于在接收到所述注册中心发送的作为从处理节点的反馈信息时,接收主处理节点发送的所述多个执行单元,并从所述注册中心获取需要处理的执行单元的信息。
在本发明的一些实施例中,基于前述方案,所述获取单元配置为:对所述注册中心进行监听,以获取到需要处理的执行单元的信息。
在本发明的一些实施例中,基于前述方案,所述划分单元902配置为:按照每个执行单元包含的数据量,将所述待处理任务划分为多个执行单元。
在本发明的一些实施例中,基于前述方案,所述第一确定单元906配置为:根据所述各个处理节点的处理能力,确定向所述各个处理节点分配的需要处理的执行单元的信息。
在本发明的一些实施例中,基于前述方案,所述处理任务的装置900还包括:第一处理单元,用于根据需要处理的执行单元的信息,从所述多个执行单元中加载需要处理的执行单元进行处理。
在本发明的一些实施例中,基于前述方案,所述第一处理单元还用于:将对需要处理的执行单元的处理结果发送至所述注册中心。
在本发明的一些实施例中,基于前述方案,所述的处理任务的装置900还包括:第二确定单元,用于在需要处理任一任务时,确定所述任一任务是否存在具有依赖关系的父任务;第二处理单元,用于在所述任一任务不存在所述父任务时,在接收到触发指令时开始处理所述任一任务,以及在所述任一任务存在所述父任务时,在所述父任务处理完成之后再开始处理所述任一任务。
在本发明的一些实施例中,基于前述方案,所述第二处理单元还用于:在所述父任务的处理时长超过预定时长后还未处理完成时,结束所述父任务的处理,并确定所述父任务处理完成。
由于本发明的示例实施例的处理任务的装置的各个功能模块与上述处理任务的方法的示例实施例的步骤对应,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的处理任务的方法的实施例。
下面参考图10,其示出了适于用来实现本发明实施例的电子设备的计算机系统1000的结构示意图。图10示出的电子设备的计算机系统1000仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的处理任务的方法。
例如,所述的电子设备可以实现如图1中所示的:步骤S110,将待处理任务划分为多个执行单元;步骤S120,将所述多个执行单元发送至其它处理节点;步骤S130,确定向各个处理节点分配的需要处理的执行单元的信息;步骤S140,将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (13)

1.一种处理任务的方法,其特征在于,包括:
将待处理任务划分为多个执行单元;
将所述多个执行单元发送至其它处理节点;
确定向各个处理节点分配的需要处理的执行单元的信息;
将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
2.根据权利要求1所述的处理任务的方法,其特征在于,在将待处理任务划分为多个执行单元之前,还包括:向所述注册中心发送选举主处理节点的请求;
其中,若接收到所述注册中心发送的作为主处理节点的反馈信息,则执行将所述待处理任务划分为多个执行单元的步骤。
3.根据权利要求2所述的处理任务的方法,其特征在于,还包括:
若接收到所述注册中心发送的作为从处理节点的反馈信息,则接收主处理节点发送的所述多个执行单元,并从所述注册中心获取需要处理的执行单元的信息。
4.根据权利要求3所述的处理任务的方法,其特征在于,从所述注册中心获取需要处理的执行单元的信息,包括:
对所述注册中心进行监听,以获取到需要处理的执行单元的信息。
5.根据权利要求1所述的处理任务的方法,其特征在于,将待处理任务划分为多个执行单元,包括:
按照每个执行单元包含的数据量,将所述待处理任务划分为多个执行单元。
6.根据权利要求1所述的处理任务的方法,其特征在于,确定向各个处理节点分配的需要处理的执行单元的信息,包括:
根据所述各个处理节点的处理能力,确定向所述各个处理节点分配的需要处理的执行单元的信息。
7.根据权利要求1所述的处理任务的方法,其特征在于,根据需要处理的执行单元的信息对相应的执行单元进行处理,包括:
根据需要处理的执行单元的信息,从所述多个执行单元中加载需要处理的执行单元进行处理。
8.根据权利要求7所述的处理任务的方法,其特征在于,还包括:将对需要处理的执行单元的处理结果发送至所述注册中心。
9.根据权利要求1至8中任一项所述的处理任务的方法,其特征在于,还包括:
在需要处理任一任务时,确定所述任一任务是否存在具有依赖关系的父任务;
若所述任一任务不存在所述父任务,则在接收到触发指令时开始处理所述任一任务;
若所述任一任务存在所述父任务,则在所述父任务处理完成之后再开始处理所述任一任务。
10.根据权利要求9所述的处理任务的方法,其特征在于,若所述任一任务存在所述父任务,则所述方法还包括:
若所述父任务的处理时长超过预定时长后还未处理完成,则结束所述父任务的处理,并确定所述父任务处理完成。
11.一种处理任务的装置,其特征在于,包括:
划分单元,用于将待处理任务划分为多个执行单元;
第一发送单元,用于将所述多个执行单元发送至其它处理节点;
确定单元,用于确定向各个处理节点分配的需要处理的执行单元的信息;
第二发送单元,用于将所述各个处理节点需要处理的执行单元的信息发送至注册中心,以便所述各个处理节点从所述注册中心获取各自需要处理的执行单元的信息,并根据需要处理的执行单元的信息对相应的执行单元进行处理。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至10中任一项所述的处理任务的方法。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至10中任一项所述的处理任务的方法。
CN201711375227.4A 2017-12-19 2017-12-19 处理任务的方法、装置、介质及电子设备 Pending CN109933422A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711375227.4A CN109933422A (zh) 2017-12-19 2017-12-19 处理任务的方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711375227.4A CN109933422A (zh) 2017-12-19 2017-12-19 处理任务的方法、装置、介质及电子设备

Publications (1)

Publication Number Publication Date
CN109933422A true CN109933422A (zh) 2019-06-25

Family

ID=66983748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711375227.4A Pending CN109933422A (zh) 2017-12-19 2017-12-19 处理任务的方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN109933422A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489086A (zh) * 2019-07-25 2019-11-22 广东高云半导体科技股份有限公司 流程执行控制方法、装置、计算机设备及存储介质
CN110661844A (zh) * 2019-08-16 2020-01-07 北京旷视科技有限公司 自动发布调度系统、方法和存储介质
CN111552547A (zh) * 2020-04-21 2020-08-18 北京金山云网络技术有限公司 作业处理方法、装置以及计算机设备
CN112445598A (zh) * 2020-12-07 2021-03-05 建信金融科技有限责任公司 一种基于quartz的任务调度方法、装置、电子设备以及介质
CN113703929A (zh) * 2020-05-20 2021-11-26 中国移动通信集团浙江有限公司 一种任务调度方法、系统、计算设备和存储介质
WO2023202006A1 (en) * 2022-04-20 2023-10-26 Zhejiang Dahua Technology Co., Ltd. Systems and methods for task execution

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130263142A1 (en) * 2012-03-27 2013-10-03 Fujitsu Limited Control device, control method, computer readable recording medium in which program is recorded, and distributed processing system
CN105338028A (zh) * 2014-07-30 2016-02-17 浙江宇视科技有限公司 一种分布式服务器集群中主从节点选举方法及装置
CN106993019A (zh) * 2016-11-29 2017-07-28 上海壹账通金融科技有限公司 分布式任务调度方法和系统
CN106991002A (zh) * 2017-02-08 2017-07-28 网易无尾熊(杭州)科技有限公司 用于实现任务调度管理的方法及设备
CN107315629A (zh) * 2017-06-14 2017-11-03 北京小米移动软件有限公司 任务处理方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130263142A1 (en) * 2012-03-27 2013-10-03 Fujitsu Limited Control device, control method, computer readable recording medium in which program is recorded, and distributed processing system
CN105338028A (zh) * 2014-07-30 2016-02-17 浙江宇视科技有限公司 一种分布式服务器集群中主从节点选举方法及装置
CN106993019A (zh) * 2016-11-29 2017-07-28 上海壹账通金融科技有限公司 分布式任务调度方法和系统
CN106991002A (zh) * 2017-02-08 2017-07-28 网易无尾熊(杭州)科技有限公司 用于实现任务调度管理的方法及设备
CN107315629A (zh) * 2017-06-14 2017-11-03 北京小米移动软件有限公司 任务处理方法、装置及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489086A (zh) * 2019-07-25 2019-11-22 广东高云半导体科技股份有限公司 流程执行控制方法、装置、计算机设备及存储介质
CN110489086B (zh) * 2019-07-25 2021-01-19 广东高云半导体科技股份有限公司 流程执行控制方法、装置、计算机设备及存储介质
CN110661844A (zh) * 2019-08-16 2020-01-07 北京旷视科技有限公司 自动发布调度系统、方法和存储介质
CN111552547A (zh) * 2020-04-21 2020-08-18 北京金山云网络技术有限公司 作业处理方法、装置以及计算机设备
CN113703929A (zh) * 2020-05-20 2021-11-26 中国移动通信集团浙江有限公司 一种任务调度方法、系统、计算设备和存储介质
CN113703929B (zh) * 2020-05-20 2023-08-01 中国移动通信集团浙江有限公司 一种任务调度方法、系统、计算设备和存储介质
CN112445598A (zh) * 2020-12-07 2021-03-05 建信金融科技有限责任公司 一种基于quartz的任务调度方法、装置、电子设备以及介质
WO2023202006A1 (en) * 2022-04-20 2023-10-26 Zhejiang Dahua Technology Co., Ltd. Systems and methods for task execution

Similar Documents

Publication Publication Date Title
CN109933422A (zh) 处理任务的方法、装置、介质及电子设备
US10733019B2 (en) Apparatus and method for data processing
CN108304250A (zh) 用于确定运行机器学习任务的节点的方法和装置
US9396028B2 (en) Scheduling workloads and making provision decisions of computer resources in a computing environment
CN109408205B (zh) 基于hadoop集群的任务调度方法和装置
US9973512B2 (en) Determining variable wait time in an asynchronous call-back system based on calculated average sub-queue wait time
US9417913B2 (en) Tunable computerized job scheduling
US8572614B2 (en) Processing workloads using a processor hierarchy system
US10884801B2 (en) Server resource orchestration based on application priority
US10884800B2 (en) Server resource balancing using a suspend-resume strategy
CN108769162B (zh) 分布式消息均衡处理方法、装置、电子设备、存储介质
CN107832143B (zh) 一种物理机资源的处理方法和装置
CN110166507B (zh) 多资源调度方法和装置
US11126466B2 (en) Server resource balancing using a fixed-sharing strategy
CN109299088A (zh) 海量数据存储方法、装置、存储介质及电子设备
EP3702917B1 (en) Intelligent server task balancing based on server capacity
US11307898B2 (en) Server resource balancing using a dynamic-sharing strategy
CN109117252A (zh) 基于容器的任务处理的方法、系统及容器集群管理系统
CN109597810A (zh) 一种任务切分方法、装置、介质及电子设备
CN114968567A (zh) 用于分配计算节点的计算资源的方法、装置和介质
CN114490048A (zh) 任务执行方法、装置、电子设备及计算机存储介质
CN115525400A (zh) 基于批次来管理多个计算任务的方法、设备和程序产品
US9577869B2 (en) Collaborative method and system to balance workload distribution
CN113760638A (zh) 一种基于kubernetes集群的日志服务方法和装置
CN109684059A (zh) 用于监控数据的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190625