CN105893497A - 一种任务处理方法和装置 - Google Patents

一种任务处理方法和装置 Download PDF

Info

Publication number
CN105893497A
CN105893497A CN201610189405.3A CN201610189405A CN105893497A CN 105893497 A CN105893497 A CN 105893497A CN 201610189405 A CN201610189405 A CN 201610189405A CN 105893497 A CN105893497 A CN 105893497A
Authority
CN
China
Prior art keywords
node
service node
service
data
working
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610189405.3A
Other languages
English (en)
Inventor
张友先
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dt Dream Technology Co Ltd
Original Assignee
Hangzhou Dt Dream Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dt Dream Technology Co Ltd filed Critical Hangzhou Dt Dream Technology Co Ltd
Priority to CN201610189405.3A priority Critical patent/CN105893497A/zh
Publication of CN105893497A publication Critical patent/CN105893497A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Abstract

本发明提供一种任务处理方法和装置,应用于包括客户端节点、多个服务节点、多个工作节点的系统中,所述方法应用在客户端节点,所述方法包括:针对每个服务节点,获得服务节点对应的总数据处理能力;将待处理任务划分成多个子任务,并利用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务;将为每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。通过本发明的技术方案,使得每个工作节点处理的子任务与总数据处理能力相适应,在服务节点与工作节点之间的网络连接断开的情况下,能够适应性的调整该服务节点分配到的子任务,从而保证子任务的合理分配。

Description

一种任务处理方法和装置
技术领域
本发明涉及通信技术领域,尤其涉及一种任务处理方法和装置。
背景技术
随着大数据时代的到来,不同数据库之间的数据交换需求越来越多,而ETL(Extract Transform Load,抽取转换加载)用于从源数据库中抽取数据,并将抽取的数据加载到目标数据库中。例如,从RDBMS(Relational DatabaseManagement System,关系数据库管理系统)数据库(例如,Oracle、MySQL等)中抽取数据,并将抽取的数据加载到Hadoop(分布式)数据库中。或者,从Hadoop数据库中抽取数据,并将抽取的数据加载到RDBMS数据库中。
在大数据时代,面对大量的数据抽取和数据加载工作,单个工作节点已经无法满足用户需求,通常需要多个工作节点共同完成大量的数据抽取和数据加载工作,即将数据抽取和数据加载工作分配到多个工作节点进行处理。
发明内容
本发明提供一种任务处理方法,应用于包括客户端节点、多个服务节点、多个工作节点的系统中,所述方法应用在客户端节点,所述方法包括:
针对每个服务节点,获得所述服务节点对应的总数据处理能力;
将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
将为所述每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和;工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量。
所述获得所述服务节点对应的总数据处理能力的过程,具体包括:
接收所述服务节点上报的总数据处理能力;所述总数据处理能力是所述服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算的;或者,接收所述服务节点上报的与所述服务节点连接的每个工作节点的数据处理能力,并利用所述每个工作节点的数据处理能力计算所述总数据处理能力;其中,每个工作节点统计本工作节点的数据处理能力,并将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。
利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务,包括:计算所述每个服务节点对应的总数据处理能力之间的比值;按照所述比值为所述每个服务节点分配对应数量的子任务。
本发明提供一种任务处理方法,该方法应用于包括客户端节点、多个服务节点、多个工作节点的系统中,所述方法包括以下步骤:
工作节点将自身的数据处理能力发送给自身连接的所有服务节点;
服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算总数据处理能力,并将所述总数据处理能力发送给客户端节点;或者,将与所述服务节点连接的每个工作节点的数据处理能力发送给客户端节点;
针对每个服务节点,客户端节点获得该服务节点对应的总数据处理能力;
所述客户端节点将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
所述客户端节点将为所述每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
所述工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量;所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和。
所述客户端节点利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务的过程,具体包括:
所述客户端节点计算每个服务节点对应的总数据处理能力之间的比值;
所述客户端节点按照所述比值为每个服务节点分配对应数量的子任务。
本发明提供一种任务处理装置,应用于包括客户端节点、多个服务节点、多个工作节点的系统中,所述装置应用在客户端节点,所述装置包括:
获得模块,用于获得每个服务节点对应的总数据处理能力;
分配模块,用于将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
发送模块,用于将为所述每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和;工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量;
所述获得模块,具体用于在获得服务节点对应的总数据处理能力的过程中,接收所述服务节点上报的总数据处理能力;所述总数据处理能力是所述服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算的;或者,接收所述服务节点上报的与所述服务节点连接的每个工作节点的数据处理能力,利用所述每个工作节点的数据处理能力计算所述总数据处理能力;
其中,每个工作节点统计本工作节点的数据处理能力,并将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。
所述分配模块,具体用于在利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务中,计算所述每个服务节点对应的总数据处理能力之间的比值;按照所述比值为所述每个服务节点分配对应数量的子任务。
基于上述技术方案,本发明实施例中,客户端节点可以基于每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务,并将为每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。基于上述方式,客户端节点可以基于各服务节点对应的总数据处理能力来为每个服务节点分配对应数量的子任务,使得每个工作节点处理的子任务与本服务节点对应的总数据处理能力相适应,在服务节点与工作节点之间的网络连接断开的情况下,能够适应性的调整该服务节点分配到的子任务,从而保证子任务的合理分配。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明一种实施方式中的系统结构示意图;
图2是本发明一种实施方式中的任务处理方法的流程图;
图3是本发明另一种实施方式中的任务处理方法的流程图;
图4是本发明一种实施方式中的客户端节点的硬件结构图;
图5是本发明一种实施方式中的任务处理装置的结构图。
具体实施方式
在本申请使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在大数据时代,为了完成大量数据抽取和数据加载工作,可以采用图1所示的网络架构,其中包含客户端节点(client)、多个服务节点(server)、多个工作节点(worker)。客户端节点是请求的发起者,用于获得待处理任务,并将待处理任务提供给服务节点,该待处理任务会包含需要完成数据抽取和数据加载的数据信息,例如,当需要将源数据库中的数据1-数据3000加载到目标数据库时,则数据信息可以是数据1-数据3000的信息。服务节点是请求的调度者,用于将来自客户端节点的任务分配给工作节点。工作节点是请求的处理者,用于完成大量的数据抽取和数据加载工作,如从源数据库中抽取数据,将抽取的数据加载到目标数据库中,源数据库是RDBMS或者Hadoop数据库数据库,目标数据库是Hadoop数据库或者RDBMS数据库。
基于上述应用场景,在一种可行的实施方式中,客户端节点获取待处理任务,如该待处理任务用于将源数据库A中的数据1-数据3000加载到目标数据库B中,客户端节点获取待处理任务的方式可以根据实际情况决定,例如,用户在客户端节点上下发命令,客户端节点基于该命令获取待处理任务。
客户端节点将待处理任务划分成多个子任务,并为每个服务节点分配相同数量的子任务。例如,客户端节点将待处理任务划分成子任务1、子任务2、子任务3、子任务4、子任务5、子任务6,并将子任务1、子任务2、子任务3分配给服务节点1,将子任务4、子任务5、子任务6分配给服务节点2。
服务节点1将子任务1分配给自身连接的工作节点1,并将子任务2分配给自身连接的工作节点2,并将子任务3分配给自身连接的工作节点3。而且,服务节点2将子任务4分配给自身连接的工作节点1,并将子任务5分配给自身连接的工作节点2,并将子任务6分配给自身连接的工作节点3。
工作节点1处理子任务1和子任务4,如将数据1-数据500、数据1501-数据2000从源数据库加载到目标数据库。工作节点2处理子任务2和子任务5,如将数据501-数据1000、数据2001-数据2500从源数据库加载到目标数据库。工作节点3处理子任务3和子任务6,如将数据1001-数据1500、数据2501-数据3000从源数据库加载到目标数据库。进一步的,各工作节点向服务节点返回数据处理结果,服务节点将该数据处理结果返回给客户端节点,由客户端节点接收该数据处理结果,并将该数据处理结果显示给用户。
在一个例子中,假设服务节点1与工作节点1之间的网络连接断开(如发生故障),则服务节点1将子任务1和子任务2分配给自身连接的工作节点2,并将子任务3分配给自身连接的工作节点3。服务节点2将子任务4分配给自身连接的工作节点1,并将子任务5分配给自身连接的工作节点2,并将子任务6分配给自身连接的工作节点3。基于此,工作节点1处理子任务4,工作节点2处理子任务1、子任务2和子任务5,工作节点3处理子任务3和子任务6。显然,在这样的处理方式下,会导致不同工作节点处理的子任务数量并不相同,服务节点1连接的工作节点的处理能力会比服务节点2连接的工作节点的处理能力低,导致服务节点1上的子任务完成较慢。
针对上述发现,本发明实施例中提出一种任务处理方法,可以应用于包括客户端节点、多个服务节点、多个工作节点的系统中,以图1为本发明实施例的应用场景示意图,该系统中可以包括工作节点1、工作节点2、工作节点3、服务节点1、服务节点2、客户端节点。图1中的源数据库可以为RDBMS数据库(如Oracle、MySQL等),目标数据库可以为Hadoop数据库,或者,源数据库可以为Hadoop数据库,目标数据库可以为RDBMS数据库。
本发明实施例中,针对客户端节点获得的第一个待处理任务,将该待处理任务划分成多个子任务,并为每个服务节点分配相同数量的子任务。针对客户端节点获得的第二个以及后续的待处理任务,将该待处理任务划分成多个子任务,并采用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务,而不是直接为每个服务节点分配相同数量的子任务。
针对采用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务的过程,如图2所示,该任务处理方法可以包括以下步骤:
步骤201,工作节点将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。其中,本工作节点的数据处理能力具体可以包括:本工作节点在单位时间内的数据处理量除以本工作节点连接的服务节点数量。
工作节点在接收到来自服务节点的子任务之后,对该子任务进行处理,并在完成子任务的处理后,统计本工作节点在单位时间内的数据处理量,并将该数据处理量除以本工作节点连接的服务节点数量,得到本工作节点的数据处理能力,并将该数据处理能力发送给本工作节点连接的所有服务节点。
步骤202,服务节点利用与本服务节点连接的每个工作节点的数据处理能力计算总数据处理能力,并将总数据处理能力发送给客户端节点;或者,将与本服务节点连接的每个工作节点的数据处理能力发送给客户端节点。
本发明实施例中,服务节点对应的总数据处理能力具体可以包括:本服务节点连接的所有工作节点的数据处理能力之和。
服务节点在接收到与本服务节点连接的每个工作节点的数据处理能力之后,可以将每个工作节点的数据处理能力进行求和处理,得到总数据处理能力,并将总数据处理能力发送给客户端节点;或者,可以直接将与本服务节点连接的每个工作节点的数据处理能力发送给客户端节点。
步骤203,客户端节点获得每个服务节点对应的总数据处理能力。
本发明实施例中,针对每个服务节点,如果服务节点直接将总数据处理能力发送给客户端节点,则客户端节点接收服务节点上报的总数据处理能力,并获得该服务节点对应的总数据处理能力。或者,如果服务节点将与本服务节点连接的每个工作节点的数据处理能力发送给客户端节点,则客户端节点接收服务节点上报的与该服务节点连接的每个工作节点的数据处理能力,并利用每个工作节点的数据处理能力计算该服务节点对应的总数据处理能力,即将每个工作节点的数据处理能力进行求和处理,得到总数据处理能力。
步骤204,客户端节点将待处理任务划分成多个子任务,并利用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务。
本发明实施例中,客户端节点利用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务的过程,具体可以包括但不限于如下方式:客户端节点计算每个服务节点对应的总数据处理能力之间的比值。客户端节点按照该比值为每个服务节点分配对应数量的子任务。例如,服务节点1的总数据处理能力与服务节点2的总数据处理能力之间的比值为2:1时,则服务节点1分配到的子任务的数量与服务节点2分配到的子任务的数量之间的比值为2:1。假设客户端节点将待处理任务划分成6个子任务,则将4个子任务分配给服务节点1,并将2个子任务分配给服务节点2。
当然,在实际应用中,并不局限于采用上述方式来为每个服务节点分配对应数量的子任务,基于每个服务节点对应的总数据处理能力,只要保证总数据处理能力大的服务节点分配到的子任务的数量,大于总数据处理能力小的服务节点分配到的子任务的数量即可,对于其它方式不再详加赘述。
步骤205,客户端节点将为每个服务节点分配的子任务发送给对应的服务节点,各服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
工作节点在接收到来自服务节点的子任务后,对该子任务进行处理,统计本工作节点在单位时间内的数据处理量,并将该数据处理量除以本工作节点连接的服务节点数量,得到本工作节点的数据处理能力,返回步骤201。
基于上述技术方案,本发明实施例中,客户端节点可以基于每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务,并将为每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。基于上述方式,客户端节点可以基于各服务节点对应的总数据处理能力来为每个服务节点分配对应数量的子任务,使得每个工作节点处理的子任务与本服务节点对应的总数据处理能力相适应,在服务节点与工作节点之间的网络连接断开的情况下,能够适应性的调整该服务节点分配到的子任务,从而保证子任务的合理分配。
针对客户端节点的处理过程,本发明实施例中还提出一种应用在客户端节点上的任务处理方法,该方法可以应用于包括客户端节点、多个服务节点、多个工作节点的系统中,且以图1为本发明实施例的应用场景示意图。
本发明实施例中,针对客户端节点获得的第一个待处理任务,将该待处理任务划分成多个子任务,并为每个服务节点分配相同数量的子任务。针对客户端节点获得的第二个以及后续的待处理任务,将该待处理任务划分成多个子任务,并采用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务,而不是直接为每个服务节点分配相同数量的子任务。
针对采用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务的过程,如图3所示,该任务处理方法可以包括以下步骤:
步骤301,针对每个服务节点,获得该服务节点对应的总数据处理能力。
其中,服务节点对应的总数据处理能力具体可以包括:服务节点连接的所有工作节点的数据处理能力之和。工作节点的数据处理能力具体可以包括:工作节点在单位时间内的数据处理量除以工作节点连接的服务节点数量。
本发明实施例中,获得服务节点对应的总数据处理能力的过程,具体可以包括但不限于如下方式:方式一、接收该服务节点上报的总数据处理能力,该总数据处理能力是服务节点利用与服务节点连接的每个工作节点的数据处理能力计算的。方式二、接收该服务节点上报的与服务节点连接的每个工作节点的数据处理能力,并利用每个工作节点的数据处理能力计算总数据处理能力。针对方式一和方式二,每个工作节点统计本工作节点的数据处理能力,并将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。
针对方式一和方式二,工作节点在接收到来自服务节点的子任务之后,对该子任务进行处理,并统计本工作节点在单位时间内的数据处理量,并将该数据处理量除以本工作节点连接的服务节点数量,得到本工作节点的数据处理能力,并将该数据处理能力发送给本工作节点连接的所有服务节点。
针对方式一,服务节点在接收到与本服务节点连接的每个工作节点的数据处理能力之后,可以将每个工作节点的数据处理能力进行求和处理,得到总数据处理能力,并将总数据处理能力发送给客户端节点。客户端节点接收服务节点上报的总数据处理能力,并获得该服务节点对应的总数据处理能力。
针对方式二,服务节点在接收到与本服务节点连接的每个工作节点的数据处理能力后,将每个工作节点的数据处理能力发送给客户端节点。客户端节点接收服务节点上报的与该服务节点连接的每个工作节点的数据处理能力,利用每个工作节点的数据处理能力计算该服务节点对应的总数据处理能力,即将每个工作节点的数据处理能力进行求和处理,得到总数据处理能力。
步骤302,将待处理任务划分成多个子任务,并利用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务。
本发明实施例中,利用每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务的过程,具体可以包括但不限于如下方式:计算每个服务节点对应的总数据处理能力之间的比值,并按照该比值为每个服务节点分配对应数量的子任务。例如,当服务节点1的总数据处理能力与服务节点2的总数据处理能力之间的比值为2:1时,则服务节点1分配到的子任务的数量与服务节点2分配到的子任务的数量之间的比值可以为2:1。
当然,在实际应用中,并不局限于采用上述方式来为每个服务节点分配对应数量的子任务,基于每个服务节点对应的总数据处理能力,只要保证总数据处理能力大的服务节点分配到的子任务的数量,大于总数据处理能力小的服务节点分配到的子任务的数量即可,对于其它方式不再详加赘述。
步骤303,将为每个服务节点分配的子任务发送给对应的服务节点,以使各服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
基于上述技术方案,本发明实施例中,客户端节点可以基于每个服务节点对应的总数据处理能力,为每个服务节点分配对应数量的子任务,并将为每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。基于上述方式,客户端节点可以基于各服务节点对应的总数据处理能力来为每个服务节点分配对应数量的子任务,使得每个工作节点处理的子任务与本服务节点对应的总数据处理能力相适应,在服务节点与工作节点之间的网络连接断开的情况下,能够适应性的调整该服务节点分配到的子任务,从而保证子任务的合理分配。
针对图2所示的流程和图3所示的流程,针对每个待处理任务,客户端节点还可以为该待处理任务设置一个唯一的任务标识(TaskID),且每个待处理任务对应的任务标识均不同。针对该待处理任务对应的每个子任务,均有对应的唯一的子任务标识(TaskID-SubTaskNum),即该任务标识+其它序号,且每个子任务对应的子任务标识均不同。例如,为待处理任务设置的任务标识可以为TaskID1,其对应的6个子任务的子任务标识分别为TaskID1-1,TaskID1-2,TaskID1-3,TaskID1-4,TaskID1-5,TaskID1-6。
基于此,工作节点在将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点时,还包含该数据处理能力对应的任务标识,即工作节点统计的是针对同一待处理任务对应的一个或者多个子任务的数据处理能力。进一步的,服务节点或者客户端节点在将每个工作节点的数据处理能力进行求和处理时,是将具有同一任务标识的每个工作节点的数据处理能力进行求和处理,即总数据处理能力是同一任务标识的数据处理能力的求和结果。
以下结合图1所示的应用场景,对上述流程进行进一步的说明。在图1中,假设服务节点1与工作节点1之间的网络连接断开(如发生故障)。
针对客户端节点获得的第一个待处理任务,假设该待处理任务用于将6万条数据从源数据库加载到目标数据库。客户端节点为该待处理任务设置任务标识TaskID1,并将该待处理任务划分成6个子任务,这6个子任务的子任务标识分别为TaskID1-1,TaskID1-2,TaskID1-3,TaskID1-4,TaskID1-5,TaskID1-6,每个子任务用于将1万条数据从源数据库加载到目标数据库。
客户端节点为各服务节点分配相同数量的子任务,将子任务TaskID1-1,TaskID1-2,TaskID1-3分配给服务节点1,并将子任务TaskID1-4,TaskID1-5,TaskID1-6分配给服务节点2。由于服务节点1与工作节点1之间的网络连接断开,因此,服务节点1不会将子任务分配给工作节点1,假设服务节点1将子任务TaskID1-1,TaskID1-2,TaskID1-3均分配给工作节点2进行处理,而且,服务节点2将子任务TaskID1-4,TaskID1-5分配给工作节点1进行处理,服务节点2子任务TaskID1-6分配给工作节点3进行处理。
假设工作节点1、工作节点2和工作节点3在单位时间内的数据处理量均为1万条/秒,因此,在第一秒,工作节点2处理TaskID1-1对应的1万条数据,即工作节点2将1万条数据从源数据库加载到目标数据库,工作节点1处理TaskID1-4对应的1万条数据,工作节点3处理TaskID1-6对应的1万条数据。在第二秒,工作节点2处理TaskID1-2对应的1万条数据,工作节点1处理TaskID1-5对应的1万条数据,工作节点3空闲。在第三秒,工作节点2处理TaskID1-3对应的1万条数据,工作节点1和工作节点3空闲。
在上述过程中,工作节点1统计本待处理任务TaskID1在单位时间内的数据处理量为1万条/秒,并确定工作节点1的数据处理能力为1万/1(工作节点1只连接服务节点2),并将该数据处理能力发送给服务节点2。工作节点2统计本待处理任务TaskID1在单位时间内的数据处理量为1万条/秒,并确定工作节点2的数据处理能力为1万/2(工作节点2连接服务节点1和服务节点2),并将该数据处理能力发送给服务节点1和服务节点2。工作节点3统计本待处理任务TaskID1在单位时间内的数据处理量为1万条/秒,并确定工作节点3的数据处理能力为1万/2(工作节点3连接服务节点1和服务节点2),并将该数据处理能力发送给服务节点1和服务节点2。
服务节点1对应的总数据处理能力为:工作节点2对应的数据处理能力(1万/2)+工作节点3对应的数据处理能力(1万/2)。服务节点2对应的总数据处理能力为:工作节点1对应的数据处理能力(1万/1)+工作节点2对应的数据处理能力(1万/2)+工作节点3对应的数据处理能力(1万/2)。
针对客户端节点获得的第二个待处理任务,假设该待处理任务用于将6万条数据从源数据库加载到目标数据库。客户端节点为该待处理任务设置任务标识TaskID2,并将该待处理任务划分成6个子任务,这6个子任务的子任务标识分别为TaskID2-1,TaskID2-2,TaskID2-3,TaskID2-4,TaskID2-5,TaskID2-6,每个子任务用于将1万条数据从源数据库加载到目标数据库。
客户端节点计算出服务节点1对应的总数据处理能力与服务节点2对应的总数据处理能力之间的比值为1:2,基于此,服务节点1分配到的子任务的数量与服务节点2分配到的子任务的数量之间的比值可以为1:2。假设该客户端节点将子任务TaskID2-1,TaskID2-2分配给服务节点1,并将子任务TaskID2-3,TaskID2-4,TaskID2-5,TaskID2-6分配给服务节点2。
由于服务节点1与工作节点1之间的网络连接断开,因此,服务节点1不会将子任务分配给该工作节点1。在此基础上,假设服务节点1将子任务TaskID2-1,TaskID2-2均分配给工作节点2进行处理,而且,服务节点2将子任务TaskID2-3,TaskID2-4均分配给工作节点1进行处理,并且,服务节点2子任务TaskID2-5,TaskID2-6均分配给工作节点3进行处理。
假设工作节点1、工作节点2和工作节点3在单位时间内的数据处理量均为1万条/秒,在第一秒,工作节点2处理TaskID2-1对应的1万条数据,工作节点1处理TaskID2-3对应的1万条数据,工作节点3处理TaskID2-5对应的1万条数据。在第二秒,工作节点2处理TaskID2-2对应的1万条数据,工作节点1处理TaskID2-4对应的1万条数据,工作节点3处理TaskID2-6对应的1万条数据。因此,所有子任务只需要2秒钟即可同时完成。
在上述过程中,工作节点1统计本待处理任务TaskID1在单位时间内的数据处理量为1万条/秒,并确定工作节点1的数据处理能力为1万/1(工作节点1只连接服务节点2),并将该数据处理能力发送给服务节点2。工作节点2统计本待处理任务TaskID1在单位时间内的数据处理量为1万条/秒,并确定工作节点2的数据处理能力为1万/2(工作节点2连接服务节点1和服务节点2),并将该数据处理能力发送给服务节点1和服务节点2。工作节点3统计本待处理任务TaskID1在单位时间内的数据处理量为1万条/秒,并确定工作节点3的数据处理能力为1万/2(工作节点3连接服务节点1和服务节点2),并将该数据处理能力发送给服务节点1和服务节点2。
服务节点1对应的总数据处理能力为:工作节点2对应的数据处理能力(1万/2)+工作节点3对应的数据处理能力(1万/2)。服务节点2对应的总数据处理能力为:工作节点1对应的数据处理能力(1万/1)+工作节点2对应的数据处理能力(1万/2)+工作节点3对应的数据处理能力(1万/2)。
针对客户端节点获得的第三个待处理任务以及后续的待处理任务,其处理过程与第二个待处理任务的处理过程相同,本发明实施例中不再赘述。
基于与上述方法同样的发明构思,本发明实施例还提供一种任务处理装置,应用于包括客户端节点、多个服务节点、多个工作节点的系统中,该任务处理装置应用在客户端节点上。该任务处理装置可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在的客户端节点的处理器,读取非易失性存储器中对应的计算机程序指令形成的。从硬件层面而言,如图4所示,为本发明提出的任务处理装置所在的客户端节点的一种硬件结构图,除了图4所示的处理器、非易失性存储器外,客户端节点还可以包括其他硬件,如负责处理报文的转发芯片、网络接口、内存等;从硬件结构上来讲,客户端节点还可能是分布式设备,可能包括多个接口卡,以便在硬件层面进行报文处理的扩展。
如图5所示,为本发明提出的任务处理装置的结构图,所述装置包括:
获得模块11,用于获得每个服务节点对应的总数据处理能力;
分配模块12,用于将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
发送模块13,用于将为每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和;工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量;
所述获得模块11,具体用于在获得服务节点对应的总数据处理能力的过程中,接收所述服务节点上报的总数据处理能力;所述总数据处理能力是所述服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算的;或者,接收所述服务节点上报的与所述服务节点连接的每个工作节点的数据处理能力,利用所述每个工作节点的数据处理能力计算所述总数据处理能力;其中,每个工作节点统计本工作节点的数据处理能力,并将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。
所述分配模块12,具体用于在利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务中,计算所述每个服务节点对应的总数据处理能力之间的比值;按照所述比值为所述每个服务节点分配对应数量的子任务。
其中,本发明装置的各个模块可以集成于一体,也可以分离部署。上述模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可进一步拆分成多个子模块。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (10)

1.一种任务处理方法,应用于包括客户端节点、多个服务节点、多个工作节点的系统中,其特征在于,所述方法应用在客户端节点,所述方法包括:
针对每个服务节点,获得所述服务节点对应的总数据处理能力;
将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
将为所述每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
2.根据权利要求1所述的方法,其特征在于,
所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和;工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量。
3.根据权利要求2所述的方法,其特征在于,
所述获得所述服务节点对应的总数据处理能力的过程,具体包括:
接收所述服务节点上报的总数据处理能力;所述总数据处理能力是所述服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算的;
或者,
接收所述服务节点上报的与所述服务节点连接的每个工作节点的数据处理能力,并利用所述每个工作节点的数据处理能力计算所述总数据处理能力;
其中,每个工作节点统计本工作节点的数据处理能力,并将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。
4.根据权利要求1所述的方法,其特征在于,利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务,包括:
计算所述每个服务节点对应的总数据处理能力之间的比值;
按照所述比值为所述每个服务节点分配对应数量的子任务。
5.一种任务处理方法,该方法应用于包括客户端节点、多个服务节点、多个工作节点的系统中,其特征在于,所述方法包括以下步骤:
工作节点将自身的数据处理能力发送给自身连接的所有服务节点;
服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算总数据处理能力,并将所述总数据处理能力发送给客户端节点;或者,将与所述服务节点连接的每个工作节点的数据处理能力发送给客户端节点;
针对每个服务节点,客户端节点获得该服务节点对应的总数据处理能力;
所述客户端节点将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
所述客户端节点将为所述每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
6.根据权利要求5所述的方法,其特征在于,
所述工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量;所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和。
7.根据权利要求5所述的方法,其特征在于,
所述客户端节点利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务的过程,具体包括:
所述客户端节点计算每个服务节点对应的总数据处理能力之间的比值;
所述客户端节点按照所述比值为每个服务节点分配对应数量的子任务。
8.一种任务处理装置,应用于包括客户端节点、多个服务节点、多个工作节点的系统中,其特征在于,所述装置应用在客户端节点,所述装置包括:
获得模块,用于获得每个服务节点对应的总数据处理能力;
分配模块,用于将待处理任务划分成多个子任务,并利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务;
发送模块,用于将为所述每个服务节点分配的子任务发送给对应的服务节点,以使服务节点将接收到的子任务分配给自身连接的工作节点进行处理。
9.根据权利要求8所述的装置,其特征在于,
所述服务节点对应的总数据处理能力包括:所述服务节点连接的所有工作节点的数据处理能力之和;工作节点的数据处理能力包括:所述工作节点在单位时间内的数据处理量除以所述工作节点连接的服务节点数量;
所述获得模块,具体用于在获得服务节点对应的总数据处理能力的过程中,接收所述服务节点上报的总数据处理能力;所述总数据处理能力是所述服务节点利用与所述服务节点连接的每个工作节点的数据处理能力计算的;或者,接收所述服务节点上报的与所述服务节点连接的每个工作节点的数据处理能力,利用所述每个工作节点的数据处理能力计算所述总数据处理能力;
其中,每个工作节点统计本工作节点的数据处理能力,并将本工作节点的数据处理能力发送给本工作节点连接的所有服务节点。
10.根据权利要求8所述的装置,其特征在于,
所述分配模块,具体用于在利用所述每个服务节点对应的总数据处理能力,为所述每个服务节点分配对应数量的子任务中,计算所述每个服务节点对应的总数据处理能力之间的比值;按照所述比值为所述每个服务节点分配对应数量的子任务。
CN201610189405.3A 2016-03-29 2016-03-29 一种任务处理方法和装置 Pending CN105893497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610189405.3A CN105893497A (zh) 2016-03-29 2016-03-29 一种任务处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610189405.3A CN105893497A (zh) 2016-03-29 2016-03-29 一种任务处理方法和装置

Publications (1)

Publication Number Publication Date
CN105893497A true CN105893497A (zh) 2016-08-24

Family

ID=57014896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610189405.3A Pending CN105893497A (zh) 2016-03-29 2016-03-29 一种任务处理方法和装置

Country Status (1)

Country Link
CN (1) CN105893497A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107493199A (zh) * 2017-08-31 2017-12-19 郑州云海信息技术有限公司 一种分布式集群管理方法及系统
CN107707592A (zh) * 2017-01-24 2018-02-16 贵州白山云科技有限公司 任务处理方法、节点及内容分发网络
WO2018099067A1 (zh) * 2016-11-29 2018-06-07 上海壹账通金融科技有限公司 分布式任务调度方法和系统
CN110708576A (zh) * 2019-09-25 2020-01-17 李多 收视数据处理方法、装置以及存储介质
CN110928692A (zh) * 2020-01-23 2020-03-27 飞诺门阵(北京)科技有限公司 一种任务处理方法、装置及电子设备
CN112604977A (zh) * 2020-11-07 2021-04-06 泰州芯源半导体科技有限公司 利用大数据服务的目标分类平台及方法
US11528232B1 (en) 2021-08-27 2022-12-13 Hong Kong Applied Science and Technology Research Institute Company Limited Apparatus and method for handling real-time tasks with diverse size based on message queue
RU2794969C1 (ru) * 2020-01-23 2023-04-26 Новнет Компютинг Систем Тек Ко., Лтд. Способ, устройство и электронное устройство для обработки задач
US11706097B2 (en) 2020-01-23 2023-07-18 Novnet Computing System Tech Co., Ltd. Task processing method applied to network topology, electronic device and storage medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467570A (zh) * 2010-11-17 2012-05-23 日电(中国)有限公司 用于分布式数据仓库的连接查询系统和方法
CN102801812A (zh) * 2012-08-24 2012-11-28 上海和辰信息技术有限公司 松散网络环境下新型云服务组件管理的系统与方法
CN103595651A (zh) * 2013-10-15 2014-02-19 北京航空航天大学 基于分布式的数据流处理方法和系统
CN104243531A (zh) * 2013-06-21 2014-12-24 华为技术有限公司 一种数据处理的方法、装置及系统
CN104731647A (zh) * 2015-03-31 2015-06-24 北京奇艺世纪科技有限公司 任务处理方法及系统
US20150347541A1 (en) * 2014-05-30 2015-12-03 International Business Machines Corporation System and method of consuming and integrating with rest-based cloud and enterprise services

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467570A (zh) * 2010-11-17 2012-05-23 日电(中国)有限公司 用于分布式数据仓库的连接查询系统和方法
CN102801812A (zh) * 2012-08-24 2012-11-28 上海和辰信息技术有限公司 松散网络环境下新型云服务组件管理的系统与方法
CN104243531A (zh) * 2013-06-21 2014-12-24 华为技术有限公司 一种数据处理的方法、装置及系统
CN103595651A (zh) * 2013-10-15 2014-02-19 北京航空航天大学 基于分布式的数据流处理方法和系统
US20150347541A1 (en) * 2014-05-30 2015-12-03 International Business Machines Corporation System and method of consuming and integrating with rest-based cloud and enterprise services
CN104731647A (zh) * 2015-03-31 2015-06-24 北京奇艺世纪科技有限公司 任务处理方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018099067A1 (zh) * 2016-11-29 2018-06-07 上海壹账通金融科技有限公司 分布式任务调度方法和系统
CN107707592A (zh) * 2017-01-24 2018-02-16 贵州白山云科技有限公司 任务处理方法、节点及内容分发网络
CN107493199A (zh) * 2017-08-31 2017-12-19 郑州云海信息技术有限公司 一种分布式集群管理方法及系统
CN110708576A (zh) * 2019-09-25 2020-01-17 李多 收视数据处理方法、装置以及存储介质
CN110928692A (zh) * 2020-01-23 2020-03-27 飞诺门阵(北京)科技有限公司 一种任务处理方法、装置及电子设备
CN110928692B (zh) * 2020-01-23 2020-08-07 飞诺门阵(北京)科技有限公司 一种任务处理方法、装置及电子设备
RU2794969C1 (ru) * 2020-01-23 2023-04-26 Новнет Компютинг Систем Тек Ко., Лтд. Способ, устройство и электронное устройство для обработки задач
US11706097B2 (en) 2020-01-23 2023-07-18 Novnet Computing System Tech Co., Ltd. Task processing method applied to network topology, electronic device and storage medium
CN112604977A (zh) * 2020-11-07 2021-04-06 泰州芯源半导体科技有限公司 利用大数据服务的目标分类平台及方法
CN112604977B (zh) * 2020-11-07 2021-12-28 北京创想开盈科贸有限公司 利用大数据服务的目标分类平台及方法
US11528232B1 (en) 2021-08-27 2022-12-13 Hong Kong Applied Science and Technology Research Institute Company Limited Apparatus and method for handling real-time tasks with diverse size based on message queue

Similar Documents

Publication Publication Date Title
CN105893497A (zh) 一种任务处理方法和装置
CN105677462A (zh) 基于物联网的分布式任务系统及业务处理方法
CN104156843A (zh) 一种物流配送管理系统及其方法
CN110083651B (zh) 一种数据加载的方法和装置
CN106097092A (zh) 用于对账的数据处理方法和装置
CN104462243B (zh) 一种结合数据校验的etl调度系统及方法
CN106844397A (zh) 基于分库分表的任务传输方法、装置及系统
CN110941674A (zh) 基于区块链的合规审计方法、装置、系统及存储介质
CN103338152A (zh) 一种组播报文转发方法和主控板
CN110557416A (zh) 一种多节点协同打块的方法及系统
CN106991070A (zh) 实时计算方法及装置
CN105450584A (zh) 一种业务触发方法以及用于业务触发的超时处理模块
CN107864187A (zh) 终端设备联机任务执行方法及服务器
WO2020008433A3 (en) Availability ranking system and method
CN114024960A (zh) 多方安全计算方法、装置、系统、存储介质及设备
CN109359034A (zh) 一种业务系统测试方法、计算机可读存储介质及终端设备
CN112035579B (zh) 图管理、数据存储、数据查询方法、装置及存储介质
CN108228355A (zh) 任务处理方法及装置、任务调度方法及装置
US20190129763A1 (en) Processing system and processing method
CN107229635B (zh) 一种数据处理的方法、存储节点及协调节点
CN106169979B (zh) 一种业务处理方法和设备
CN105183871B (zh) 数据查询方法及装置
CN103428273B (zh) 在异步式交互中进行响应询问的方法与装置
Balhara et al. Leader election algorithms in distributed systems
CN115952003A (zh) 一种集群服务器负载均衡的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160824

RJ01 Rejection of invention patent application after publication