CN102760073A - 一种任务调度方法、系统及装置 - Google Patents
一种任务调度方法、系统及装置 Download PDFInfo
- Publication number
- CN102760073A CN102760073A CN2011101109402A CN201110110940A CN102760073A CN 102760073 A CN102760073 A CN 102760073A CN 2011101109402 A CN2011101109402 A CN 2011101109402A CN 201110110940 A CN201110110940 A CN 201110110940A CN 102760073 A CN102760073 A CN 102760073A
- Authority
- CN
- China
- Prior art keywords
- job
- processing node
- map task
- task
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
本发明公开了一种任务调度方法、系统及装置,应用于Hadoop架构中,包括:处理节点向主节点提交申请映射(Map)任务的请求;主节点接收到申请Map任务的请求后,在为处理节点分配Map任务的过程中,将一个作业(Job)中处理节点的本地Map任务分配给处理节点后,在未达到处理节点的最多Map任务分配数的情况下,选定下一个Job,为处理节点继续分配本地Map任务。本发明在将一个Job中处理节点的本地Map任务分配给处理节点后,在未达到处理节点的最大Map任务分配数的情况下,选定下一个Job为处理节点分配本地Map任务,提高了多Job运行时的Map任务本地化执行率,降低了网络开销。
Description
技术领域
本发明涉及分布式计算领域,尤其涉及一种任务调度方法、系统及装置。
背景技术
MapReduce(映射和汇总)是一种编程模型,用于处理海量数据的并行运算。在MapReduce编程模型中,一个数据处理过程称为一个Job(作业);Job提交后,会将该Job的待处理数据分为N份,每份待处理数据由一个Map(映射)任务进行处理,Map任务运行在分布式环境中的一个结点上,一个结点可以运行一个到多个Map任务;所有Map任务的输出结果由Reduce(汇总)任务进行汇总、计算并最终输出。
因为Map任务是直接对源数据进行处理,所以如果Map任务的待处理数据在Map任务的运行结点上或与Map任务处于同一机架中,将会大大提升整个Job的处理效率。
Hadoop是MapReduce编程模型的一个具体实现,Hadoop这个名称不是一个缩写,是一个虚构的名字。Hadoop是一个能够对大量数据进行分布式处理的软件框架。如图1所示,Hadoop中有一个主节点和多个处理结点,主节点负责Job中Map任务和Reduce任务的调度,处理结点定期向主节点报告任务的处理情况并申请新的Map任务或Reduce任务到本地执行。
在Hadoop中,可以通过分布式文件系统确定待处理数据所处的网络结点位置,通过机架感知功能确定处理结点和待处理数据所在结点的网络层次,同时Hadoop对所有的网络结点的拓扑结构建立了层次关系。当处理结点向主节点申请Map任务时,主节点就可以根据处理结点在网络拓扑结构中的位置,分配距离该处理结点最近的Map任务给该处理结点。Hadoop在分配Map任务时,将Map任务分为两种:本地Map任务和非本地Map任务,其中,本地Map任务一般指本地结点任务和同一机架下的任务。
Hadoop可以为多种应用提供服务。例如,为搜索引擎提供服务。搜索引擎需要对海量数据进行处理,以对外提供检索服务。搜索引擎的处理过程一般分为采集和索引,由于是对海量数据进行处理,因此可以采用MapReduce编程模型进行海量数据的采集和索引,目前一般采用Hadoop框架。再次参考图1,当采集和索引同时运行时,搜索引擎的采集子系统和索引子系统,会向主节点提交Job,可以看成搜索引擎向Hadoop提交了一个采集Job和一个索引Job。Hadoop对这两个Job的Map任务进行的调度,将会直接影响整个系统的处理效率和检索数据的实时性。
目前,Hadoop对Job的Map任务的调度一般分为两种方式,说明如下:
(一)队列式,队列式的处理流程如图2所示,包括:
步骤201:处理结点向主节点申请Map任务;
步骤202:主结点接收到申请后,计算对申请Map任务的处理结点的最多Map任务分配数;
步骤203:主节点按照先进先出的原则搜索Job队列,从Job队列中选定一个Job;
先进先出的原则是指,先将Job队列中最早提交到主节点的Job的Map任务分配给处理结点,当最早提交的Job中的Map任务分配完成后,再分配下一个Job中的Map任务。
步骤204:主节点判断选定的Job中是否含有申请Map任务的处理结点的本地未处理Map任务,如果含有,则执行步骤205;否则,执行步骤207;
步骤205:主节点添加一个本地Map任务到任务列表中;
步骤206:主节点判断为申请Map任务的处理结点分配的本地Map任务的数量是否达到最多Map任务分配数,如果达到,则执行步骤210;否则,执行步骤204;
步骤207:主节点判断选定的Job中是否含有申请Map任务的处理结点的非本地未处理Map任务,如果含有,则执行步骤208;否则,执行步骤209;
步骤208:主节点添加非本地Map任务到任务列表中,执行步骤210;
步骤209:主节点按照先进先出的原则从Job队列中选定下一个Job,执行步骤204,如果Job队列循环结束,则执行步骤210;
步骤210:主节点向申请Map任务的处理节点返回任务列表。
(二)对Job限制Map任务数量的方式,处理流程如图3所示,包括:
步骤301:处理结点向主节点申请Map任务;
步骤302:主结点接收到申请后,计算对申请Map任务的处理结点的最多Map任务分配数;
步骤303:主节点按照先进先出的原则搜索Job队列,从Job队列中选定一个Job;
步骤304:主节点判断选定的Job中正在运行的Map任务的数量是否达到设置值,如果未达到,则执行步骤305;否则,执行步骤308;
步骤305:主节点判断Job中是否含有未处理的Map任务,如果有,则执行步骤306;否则,执行步骤308;
步骤306:主节点添加一个本地Map任务到任务列表中;
步骤307:主节点判断为申请Map任务的处理结点分配的本地Map任务的数量是否达到最多Map任务分配数,如果达到,则执行步骤309;否则,执行步骤304;
步骤308:主节点按照先进先出的原则从Job队列中选定下一个Job,执行步骤304,如果Job队列循环结束,则执行步骤309;
步骤309:主节点向申请Map任务的处理节点返回任务列表。
发明内容
本发明要解决的技术问题是提供一种任务调度方法、系统及装置,可以充分地为处理节点分配本地Map任务,提高任务的执行效率。
为解决上述技术问题,本发明的一种任务调度方法,应用于Hadoop架构中,包括:
处理节点向主节点提交申请映射(Map)任务的请求;
主节点接收到申请Map任务的请求后,在为处理节点分配Map任务的过程中,将一个作业(Job)中处理节点的本地Map任务分配给处理节点后,在未达到处理节点的最多Map任务分配数的情况下,选定下一个Job,为处理节点继续分配本地Map任务。
进一步地,还包括:
主节点在为处理节点分配完本地Map任务后,若仍未达到处理节点的最多Map任务分配数,则在已选定的Job中为处理节点分配一个非本地Map任务。
进一步地,还包括:
主节点读取预先配置的一次最多调度的Job数,在执行选定下一个Job前,判断已选定的Job的数量是否达到一次最多调度的Job数,如果未达到,则执行选定下一个Job;如果达到,则执行在已选定的Job中为处理节点分配一个非本地Map任务。
进一步地,还包括:
主节点读取预先配置的一次最多调度的Job数,在为处理节点分配本地Map任务前,建立长度为一次最多调度的Job数的待调度Job队列,从主Job队列中选取Job,加入到待调度Job队列中;
主节点在为处理节点分配本地Map任务时,是从待调度Job队列中选定Job。
进一步地,主节点在为处理节点分配完本地Map任务后,若仍未达到处理节点的最多Map任务分配数,是从待调度Job队列中选定Job,为处理节点分配一个非本地Map任务。
进一步地,一种任务调度装置,应用于Hadoop架构中,包括:分配控制实体和本地任务分配实体,其中:
分配控制实体,用于在接收到处理节点提交的申请映射(Map)任务的请求后,调用本地任务分配实体为处理节点分配本地Map任务;
本地Map任务分配实体,用于将一个作业(Job)中处理节点的本地Map任务分配给处理节点后,在未达到处理节点的最多Map任务分配数的情况下,选定下一个Job,为处理节点继续分配本地Map任务。
进一步地,还包括:非本地任务分配实体,其中:
分配控制实体,还用于在本地Map任务分配实体为处理节点分配完本地Map任务后,若仍未达到处理节点的最多Map任务分配数,则调用非本地任务分配实体为处理节点分配非本地Map任务;
非本地任务分配实体,用于在本地Map任务分配实体已选定的Job中为处理节点分配一个非本地Map任务。
进一步地,本地任务分配实体,还用于读取预先配置的一次最多调度的Job数,在为处理节点分配本地Map任务前,建立长度为一次最多调度的Job数的待调度Job队列,从主Job队列中选取Job,加入到待调度Job队列中;
本地任务分配实体在为处理节点分配本地Map任务时,是从待调度Job队列中选定Job。
进一步地,一种任务调度系统,应用于Hadoop架构中,包括:主节点和多个分布式部署的处理节点,其中:
处理节点,用于向主节点提交申请映射(Map)任务的请求;
主节点,用于接收到申请Map任务的请求后,在为处理节点分配Map任务的过程中,将一个作业(Job)中处理节点的本地Map任务分配给处理节点后,在未达到处理节点的最多Map任务分配数的情况下,选定下一个Job,为处理节点继续分配本地Map任务。
进一步地,主节点,还用于在为处理节点分配本地Map任务后,若仍未达到处理节点的最多Map任务分配数,则在已选定的Job中为处理节点分配一个非本地Map任务。
综上所述,本发明在将一个Job中处理节点的本地Map任务分配给处理节点后,在未达到处理节点的最大Map任务分配数的情况下,选定下一个Job为处理节点分配本地Map任务,可以实现对多个Job进行Map任务的分配,且Job个数可以配置;提高了多Job运行时的Map任务本地化执行率,降低了网络开销,提高了整个系统的处理效率。
附图说明
图1为现有技术中Hadoop的架构图;
图2为现有技术中队列式任务调度方法的流程图;
图3为现有技术中对Job限制Map任务数量方式的任务调度方法的流程图;
图4为本发明实施方式的任务调度系统的架构图;
图5为本发明实施方式的任务调度方法的流程图。
具体实施方式
在Hadoop中,对Job的Map任务的调度方式中,队列式和对Job限制其运行的Map任务数量的方式虽然已有使用,但却存在一定的局限性,分析如下:
对于队列式,假设处理结点最多可以申请N个Map任务(N>1),在给处理节点分配Map任务的过程中,主节点给处理节点分配一个非本地Map任务后,此时即使分配的总Map任务数小于N,也会结束此次Map任务的分配,这就会导致如下问题:
如果上一个Job中没有足够的本地Map任务但有非本地Map任务,而下一个Job中有本地Map任务,在分配完上一个Job的本地Map任务后,会分配1个非本地Map任务并返回任务列表,而并不会分配下一个Job中的本地Map任务,导致对处理节点的本地Map任务分配不充分、本地Map任务执行率不高的问题。
对于限制Job中Map任务的执行数量的方式,主节点是对每个Job最多同时执行的Map任务的数量进行限制,如果当前正在调度的Job中,其正在执行的Map任务的数量达到了限定值,则会为下一个Job进行Map任务的分配,而不管当前Job的Map任务是否已分配完,虽然可以同时对多个Job进行调度,但并没有考虑本地Map任务优先的原则,导致Map任务的本地化执行率很低。
本实施方式针对以上两种方式的局限性,通过设定一次最多调度的Job数,在设定的个数内,按先进先出的原则依次为Job进行调度。
在调度时,遵循本地Map任务优先的原则,先分配本地Map任务;在设定个数的Job中,本地Map任务分配完后,再依次调度这些Job,从中找出一个非本地Map任务进行分配,然后返回;如果没有找到非本地Map任务,也可直接返回。
本实施方式的调度方法在Hadoop框架中的处理流程包括:
步骤一:主节点收到处理结点申请Map任务的请求时,计算处理结点的最多Map任务分配数;
步骤二:主节点按先进先出的原则搜索Job队列,选定Job;
步骤三:主节点分配选定的Job的Map任务,将查找到的处理结点的本地Map任务添加到任务列表中;如果选定的Job已经查找完成,但还未达到处理节点的最多Map任务分配数,且已经调度的Job数也未达到一次最多调度的Job数,则选定下一个Job继续查找本地Map任务。
在为处理节点分配的Map任务达到最多Map任务分配数时,向处理节点返回任务列表。
在调度的Job的个数达到一次最多调度的Job数,为处理节点分配的Map任务未达到最多Map任务分配数时,在已调度的Job队列中,按照先进先出的顺序查找一个非本地Map任务添加到任务列表中,并向处理节点返回任务列表;如果未查找到非本地Map任务,则直接返回任务列表。
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图4为本发明实施方式的任务调度系统,包括:主节点和多个分布式部署的处理节点,其中,主节点包括:Job列表及状态维护实体、本地任务分配实体、非本地任务分配实体和分配控制实体;
Job列表及状态维护实体,用于接收应用提交的Job,将Job加入到Job队列中,初始化Job的状态,并对Job队列和Job的状态进行实时维护。
分配控制实体,用于接收处理结点申请Map任务的请求,调用本地任务分配实体对Job的本地Map任务进行分配,在完成本地Map任务的分配后,如果未达到处理节点的最多Map任务分配数,则调用非本地任务分配实体进行非本地Map任务的分配;还用于在完成对处理节点的Map任务分配时,向处理节点返回任务列表。
本地任务分配实体,用于分配选定的Job的Map任务,将查找到的处理结点的本地Map任务添加到任务列表中;如果选定的Job已经查找完成,但还未达到处理节点的最多Map任务分配数,且已经调度的Job数也未达到一次最多调度的Job数,则选定下一个Job继续查找本地Map任务。
非本地任务分配实体,用于在已调度的Job队列中,按照先进先出的顺序查找一个非本地Map任务添加到任务列表中。
图5为本发明实施方式的任务调度方法,包括:
步骤S501:处理结点向主节点的分配控制实体提交申请Map任务的请求;
步骤S502,主结点的分配控制实体计算处理结点的最多Map任务分配数;
步骤S503,主节点的分配控制实体调用本地任务分配实体,本地任务分配实体按先进先出的顺序搜索Job队列,选定待调度Job,对待调度Job的本地Map任务进行分配;
步骤S504,主节点的本地任务分配实体记录待调度Job的标识(ID);
步骤S505,主节点的本地任务分配实体根据待调度Job的ID查询待调度Job的相关信息,判断待调度Job中是否含有处理节点的本地Map任务,如果含有,则执行步骤S506,否则,执行步骤S508;
步骤S506,本地任务分配实体将待调度Job中的一个本地Map任务添加到任务列表中;
步骤S507,本地任务分配实体判断为处理节点分配的本地Map任务的数量是否达到最多Map任务分配数,如果未达到,则执行步骤S505;否则,执行步骤S511;
步骤S508,本地任务分配实体读取预先配置的一次最多调度的Job数,判断已调度的Job数是否达到一次最多调度的Job数,如果达到,则执行步骤S510;否则,执行步骤S509;
分配控制实体可以根据已记录的待调度Job的ID的个数,获知已调度的Job数。
步骤S509,完成本Job的Map任务调度,选定下一个待调度Job,执行步骤S504,开始对下一个Job的调度;
步骤S510,分配控制实体调用非本地任务分配实体从已调度的Job中,按先进先出的顺序查找处理结点的非本地Map任务,添加一个非本地Map任务到任务列表中;
分配一个非本地Map任务是最优的方式,例如,对处理节点A而言,Map任务y为非本地Map任务,但对处理节点B可能就是本地Map任务,因为处理节点A和处理节点B是分布式部署的,如果处理节点B已经执行完了自己的Map任务,此时Map任务y由处理节点B执行效果更好,所以一次性分配给处理节点A多个非本地Map任务,可能造成处理节点B空闲,或者处理节点B不得不执行非本地Map任务。
步骤S511,分配控制实体将任务列表返回给处理结点。
在本实施方式的另一实施例中,本地任务分配实体也可以建立待调度Job队列,按照先进先出的原则,从主Job队列中选定一次最多调度的Job数个Job,加入到待调度Job队列中。本地任务分配实体在进行本地Map任务的分配时,依次对待调度Job队列中的Job进行调度;非本地任务分配实体也是按照先进先出的原则从待调度Job队列中查找Job,为处理节点选择一个非本地Map任务。采用这种方式时,分配控制实体无需在本地任务分配实体完成一个Job的本地Map任务调度后,就判断一次已调度的Job数是否达到一次最多调度的Job数,本地任务分配实体和非本地任务分配实体均对待调度Job队列中的Job进行调度即可。
显然,本领域的技术人员应该明白,上述的本发明的各模块、各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们的多个模块或者步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种任务调度方法,应用于Hadoop架构中,包括:
处理节点向主节点提交申请映射(Map)任务的请求;
所述主节点接收到所述申请Map任务的请求后,在为所述处理节点分配Map任务的过程中,将一个作业(Job)中所述处理节点的本地Map任务分配给所述处理节点后,在未达到所述处理节点的最多Map任务分配数的情况下,选定下一个Job,为所述处理节点继续分配本地Map任务。
2.如权利要求1所述的方法,其特征在于,还包括:
所述主节点在为所述处理节点分配完本地Map任务后,若仍未达到所述处理节点的最多Map任务分配数,则在已选定的Job中为所述处理节点分配一个非本地Map任务。
3.如权利要求2所述的方法,其特征在于,还包括:
所述主节点读取预先配置的一次最多调度的Job数,在执行所述选定下一个Job前,判断已选定的Job的数量是否达到所述一次最多调度的Job数,如果未达到,则执行所述选定下一个Job;如果达到,则执行所述在已选定的Job中为所述处理节点分配一个非本地Map任务。
4.如权利要求2所述的方法,其特征在于,还包括:
所述主节点读取预先配置的一次最多调度的Job数,在为所述处理节点分配本地Map任务前,建立长度为所述一次最多调度的Job数的待调度Job队列,从主Job队列中选取Job,加入到所述待调度Job队列中;
所述主节点在为所述处理节点分配本地Map任务时,是从所述待调度Job队列中选定Job。
5.如权利要求4所述的方法,其特征在于:
所述主节点在为所述处理节点分配完本地Map任务后,若仍未达到所述处理节点的最多Map任务分配数,是从所述待调度Job队列中选定Job,为所述处理节点分配一个非本地Map任务。
6.一种任务调度装置,应用于Hadoop架构中,包括:分配控制实体和本地任务分配实体,其中:
所述分配控制实体,用于在接收到处理节点提交的申请映射(Map)任务的请求后,调用所述本地任务分配实体为所述处理节点分配本地Map任务;
所述本地Map任务分配实体,用于将一个作业(Job)中所述处理节点的本地Map任务分配给所述处理节点后,在未达到所述处理节点的最多Map任务分配数的情况下,选定下一个Job,为所述处理节点继续分配本地Map任务。
7.如权利要求6所述的装置,其特征在于,还包括:非本地任务分配实体,其中:
所述分配控制实体,还用于在所述本地Map任务分配实体为所述处理节点分配完本地Map任务后,若仍未达到所述处理节点的最多Map任务分配数,则调用所述非本地任务分配实体为所述处理节点分配非本地Map任务;
所述非本地任务分配实体,用于在所述本地Map任务分配实体已选定的Job中为所述处理节点分配一个非本地Map任务。
8.如权利要求7所述的装置,其特征在于:
所述本地任务分配实体,还用于读取预先配置的一次最多调度的Job数,在为所述处理节点分配本地Map任务前,建立长度为所述一次最多调度的Job数的待调度Job队列,从主Job队列中选取Job,加入到所述待调度Job队列中;
所述本地任务分配实体在为所述处理节点分配本地Map任务时,是从所述待调度Job队列中选定Job。
9.一种任务调度系统,应用于Hadoop架构中,包括:主节点和多个分布式部署的处理节点,其中:
所述处理节点,用于向所述主节点提交申请映射(Map)任务的请求;
所述主节点,用于接收到所述申请Map任务的请求后,在为所述处理节点分配Map任务的过程中,将一个作业(Job)中所述处理节点的本地Map任务分配给所述处理节点后,在未达到所述处理节点的最多Map任务分配数的情况下,选定下一个Job,为所述处理节点继续分配本地Map任务。
10.如权利要求9所述的系统,其特征在于:
所述主节点,还用于在为所述处理节点分配本地Map任务后,若仍未达到所述处理节点的最多Map任务分配数,则在已选定的Job中为所述处理节点分配一个非本地Map任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110110940.2A CN102760073B (zh) | 2011-04-29 | 2011-04-29 | 一种任务调度方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110110940.2A CN102760073B (zh) | 2011-04-29 | 2011-04-29 | 一种任务调度方法、系统及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102760073A true CN102760073A (zh) | 2012-10-31 |
CN102760073B CN102760073B (zh) | 2014-10-22 |
Family
ID=47054539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110110940.2A Active CN102760073B (zh) | 2011-04-29 | 2011-04-29 | 一种任务调度方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102760073B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631922A (zh) * | 2013-12-03 | 2014-03-12 | 南通大学 | 基于Hadoop集群的大规模Web信息提取方法及系统 |
CN105183871A (zh) * | 2015-09-17 | 2015-12-23 | 北京京东尚科信息技术有限公司 | 数据查询方法及装置 |
CN105335218A (zh) * | 2014-07-03 | 2016-02-17 | 北京金山安全软件有限公司 | 一种基于本地的流式计算方法及流式计算系统 |
CN107357649A (zh) * | 2017-05-27 | 2017-11-17 | 北京奇艺世纪科技有限公司 | 系统资源部署策略的确定方法、装置及电子设备 |
CN108268316A (zh) * | 2016-12-30 | 2018-07-10 | 北京国双科技有限公司 | 作业调度的方法及装置 |
CN108491255A (zh) * | 2018-02-08 | 2018-09-04 | 昆仑智汇数据科技(北京)有限公司 | 自助式MapReduce数据优化分配方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101403978A (zh) * | 2007-10-01 | 2009-04-08 | 埃森哲环球服务有限公司 | 用于机器集群的并行编程的基础构造 |
CN101770402A (zh) * | 2008-12-29 | 2010-07-07 | 中国移动通信集团公司 | MapReduce系统中的Map任务调度方法、设备及系统 |
-
2011
- 2011-04-29 CN CN201110110940.2A patent/CN102760073B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101403978A (zh) * | 2007-10-01 | 2009-04-08 | 埃森哲环球服务有限公司 | 用于机器集群的并行编程的基础构造 |
CN101770402A (zh) * | 2008-12-29 | 2010-07-07 | 中国移动通信集团公司 | MapReduce系统中的Map任务调度方法、设备及系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631922A (zh) * | 2013-12-03 | 2014-03-12 | 南通大学 | 基于Hadoop集群的大规模Web信息提取方法及系统 |
CN103631922B (zh) * | 2013-12-03 | 2017-04-05 | 南通大学 | 基于Hadoop集群的大规模Web信息提取方法及系统 |
CN105335218A (zh) * | 2014-07-03 | 2016-02-17 | 北京金山安全软件有限公司 | 一种基于本地的流式计算方法及流式计算系统 |
CN105183871A (zh) * | 2015-09-17 | 2015-12-23 | 北京京东尚科信息技术有限公司 | 数据查询方法及装置 |
CN105183871B (zh) * | 2015-09-17 | 2018-09-25 | 北京京东尚科信息技术有限公司 | 数据查询方法及装置 |
CN108268316A (zh) * | 2016-12-30 | 2018-07-10 | 北京国双科技有限公司 | 作业调度的方法及装置 |
CN107357649A (zh) * | 2017-05-27 | 2017-11-17 | 北京奇艺世纪科技有限公司 | 系统资源部署策略的确定方法、装置及电子设备 |
CN107357649B (zh) * | 2017-05-27 | 2020-07-03 | 北京奇艺世纪科技有限公司 | 系统资源部署策略的确定方法、装置及电子设备 |
CN108491255A (zh) * | 2018-02-08 | 2018-09-04 | 昆仑智汇数据科技(北京)有限公司 | 自助式MapReduce数据优化分配方法及系统 |
CN108491255B (zh) * | 2018-02-08 | 2020-11-03 | 昆仑智汇数据科技(北京)有限公司 | 自助式MapReduce数据优化分配方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102760073B (zh) | 2014-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Viswanathan et al. | {CLARINET}:{WAN-Aware} Optimization for Analytics Queries | |
Dong et al. | Greedy scheduling of tasks with time constraints for energy-efficient cloud-computing data centers | |
CN102254246B (zh) | 一种工作流管理方法及其系统 | |
Tan et al. | Coupling task progress for mapreduce resource-aware scheduling | |
CN102831120B (zh) | 一种数据处理方法及系统 | |
CN102063336B (zh) | 一种分布式计算多应用功能异步并发调度方法 | |
US10089142B2 (en) | Dynamic task prioritization for in-memory databases | |
CN102760073B (zh) | 一种任务调度方法、系统及装置 | |
CN103365726B (zh) | 一种面向gpu集群的资源管理方法和系统 | |
CN105487930A (zh) | 一种基于Hadoop的任务优化调度方法 | |
CN103927225A (zh) | 一种多核心架构的互联网信息处理优化方法 | |
CN107864211B (zh) | 集群资源调度方法及系统 | |
CN103530182A (zh) | 一种作业调度方法和装置 | |
CN106569887B (zh) | 一种云环境下细粒度任务调度方法 | |
CN110383764A (zh) | 无服务器系统中使用历史数据处理事件的系统和方法 | |
Gandomi et al. | HybSMRP: a hybrid scheduling algorithm in Hadoop MapReduce framework | |
CN103297499A (zh) | 一种基于云平台的调度方法及系统 | |
CN102609303A (zh) | MapReduce系统的慢任务调度方法和装置 | |
CN103914556A (zh) | 大规模图数据处理方法 | |
Wang et al. | Dependency-aware network adaptive scheduling of data-intensive parallel jobs | |
CN103685492A (zh) | Hadoop集群系统的调度方法、调度装置及其应用 | |
CN103440113A (zh) | 一种磁盘io资源分配方法和装置 | |
WO2011078162A1 (ja) | スケジューリング装置、スケジューリング方法及びプログラム | |
CN111158875B (zh) | 基于多模块的多任务处理方法、装置及系统 | |
EP2840513B1 (en) | Dynamic task prioritization for in-memory databases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |