CN102841822A - 对jobTracker主机进行宕机保护的方法和系统 - Google Patents

对jobTracker主机进行宕机保护的方法和系统 Download PDF

Info

Publication number
CN102841822A
CN102841822A CN2011101703284A CN201110170328A CN102841822A CN 102841822 A CN102841822 A CN 102841822A CN 2011101703284 A CN2011101703284 A CN 2011101703284A CN 201110170328 A CN201110170328 A CN 201110170328A CN 102841822 A CN102841822 A CN 102841822A
Authority
CN
China
Prior art keywords
jobtracker
main frame
task
formation
tasktracker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101703284A
Other languages
English (en)
Other versions
CN102841822B (zh
Inventor
史晓峰
蔡斌
崔小丰
宫振飞
张文郁
韩欣
肖桂菊
邱翔虎
崔晓春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201110170328.4A priority Critical patent/CN102841822B/zh
Publication of CN102841822A publication Critical patent/CN102841822A/zh
Application granted granted Critical
Publication of CN102841822B publication Critical patent/CN102841822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明实施例公开了一种对任务调度jobTracker主机进行宕机保护的方法和系统,其中所述方法包括:jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,所述任务包括map任务和reduce任务;任务执行单元TaskTracker根据各jobTracker主机与任务间的录属关系,将任务执行过程中的任务状态信息上报给对应的jobTracker主机;jobTracker主机队列中的两两jobTracker主机之间对管理的任务进行备份并对任务状态信息进行同步。实施本发明,可避免单个jobTracker主机任务调度的压力过大,以及避免jobTracker主机单点故障给整个系统造成的重大影响。

Description

对jobTracker主机进行宕机保护的方法和系统
技术领域
本发明涉及分布式计算机领域,尤其涉及一种对任务调度jobTracker主机进行宕机保护的方法和系统。
背景技术
分布式计算平台使用分布式的计算方法,利用多台主机协同运算以处理大规模数据,该平台可以简单,有效,快速地接入各种业务需求。分布式计算平台使用开源项目Hadoop作为其软件支撑,Hadoop是Apache开源组织的一个分布式计算开源框架,包括计算框架(MapReduce实现)和分布式存储(HDFS文件系统)两部分。其中:MapReduce是“任务的分解与结果的汇总”,HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。简言之,Hadoop被设计为存储与计算分离的结构,即MapReduce计算框架与HDFS存储框架是松散耦合的。
在Hadoop中,计算框架MapReduce包括Map和Reduce两个阶段。
在Map阶段,输入任务(文件)被组织成便于分发传递的块,这一过程即split;对这些块文件进行一个用户自定义的Map操作,按照业务的需求将输入数据以<KEY, VALUE>对的形式重新组织并分发出去。
在Reduce阶段,系统收集Map阶段分发的<KEY, VALUE>对,自动将相同KEY的<KEY, VALUE>对传递到同一台Reduce机器上,这一过程即shuffle;对这些<KEY, VALUE>对做归并(merge)、排序(sort)操作之后,对其施加一个用户自定义的Reduce操作。这样就完成了一次MapReduce。
具体的,MapReduce框架是主从结构的。MapReduce运行时,主机(master)启动一个JobTracker(任务调度)进程,用于任务调度。从机(slave)启动数个TaskTracker(任务执行单元)进程,作为运算实体。JobTracker的主要职责就是启动、跟踪和调度各个Slave的任务执行,JobTracker中存储着任务状态信息。每一台Slave通常具有TaskTracker的工作。TaskTracker根据应用要求来结合本地数据执行Map任务以及Reduce任务。
由前面的描述可知,jobTracker在整个系统中承担举足轻重的作用,因此,如何保护jobTracker中的数据尤为重要,当前,如何对jobTracker进行宕机保护函待解决。
发明内容
本发明实施例所要解决的技术问题在于,提供对任务调度jobTracker主机进行宕机保护的方法及系统,以避免单个jobTracker主机任务调度的压力过大,以及避免jobTracker主机单点故障给整个系统造成的重大影响。
具体的,本发明实施例提供的一种对任务调度jobTracker主机进行宕机保护的方法包括:
jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,所述任务包括map任务和reduce任务;
任务执行单元TaskTracker根据各jobTracker主机与任务间的录属关系,将任务执行过程中的任务状态信息上报给对应的jobTracker主机;
jobTracker主机队列中的两两jobTracker主机之间jobTracker主机队列中的两两jobTracker主机之间对管理的任务进行备份并对任务状态信息进行同步。
较佳的,本发明的方法还包括:
当jobTracker主机队列中的一jobTracker主机发生宕机时,通过分布系统协调单元通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker主机的备份的jobTracker主机上进行任务获取或上报任务状态信息。
较佳的,本发明的方法还包括:
为各jobTracker主机管理的任务加入任务属性信息,所述任务属性信息用于标识所述任务与jobTracker主机之间的录属关系。
较佳的,本发明的方法还包括:
TaskTracker以循环方式依次从各jobTracker主机中获取任务进行执行。
较佳的,本发明的方法还包括,
根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,执行时间越长的任务放置到优先级越低的jobTracker主机上进行管理;
所述TaskTracker以循环方式依次从各jobTracker主机中获取任务进行执行具体包括:
TaskTracker按照jobTracker主机的高低优先级的次序,以由高至低的顺序循环访问jobTracker主机,并从所述jobTracker主机中获取任务进行执行。
相应的,本发明实施例提供的一种对任务调度jobTracker主机进行宕机保护的系统,包括:
用户任务提交接口机,用于提交任务,所述任务包括map和reduce任务;
多个任务执行单元TaskTracker,用于根据jobTracker主机与任务间的录属关系,将任务执行过程中的任务状态上报给对应的jobTracker主机;
多个jobTracker主机,其组成一jobTracker主机队列,所述jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,并且两两jobTracker主机之间jobTracker主机队列中的两两jobTracker主机之间对管理的任务进行备份并对任务状态信息进行同步。
较佳的,所述系统还包括:
分布系统协调单元,用于保存所述jobTracker主机队列中的各jobTracker主机的配置信息,所述配置信息包括jobTracker主机队列中各jobTracker主机之间的备份关系,以及各jobTracker主机与任务的录属关系;当jobTracker主机队列中的一jobTracker主机发生宕机时,基于所述配置信息通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker主机的备份的jobTracker主机上进行任务获取或上报任务状态信息。
较佳的,所述jobTracker主机队列中的各jobTracker主机为其管理的任务加入任务属性信息,所述任务属性信息用于标识所述任务与jobTracker主机之间的录属关系。
较佳的,所述TaskTracker还用于以循环方式依次从各jobTracker主机中获取任务进行执行。
较佳的,本发明的系统还包括:
优先等级划分单元,用于根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,执行时间越长的任务放置到优先级越低的jobTracker主机上进行管理;
所述TaskTracker具体按照jobTracker主机的高低优先级的次序,以由高至低的顺序循环访问jobTracker主机,并从所述jobTracker主机中获取任务进行执行。
实施本发明实施例有如下有益效果:
本发明实施例一方面不再由单个jobTracker主机来接收任务以对任务进行调度,而是提供一个jobTracker主机队列,由jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,通过该方式,降低了单个jobTracker主机来进行任务调度的工作压力;另一方面,本发明实施例将jobTracker主机队列中的两两jobTracker主机之间进行任务的备份以及任务状态信息的同步,避免了jobTracker主机单点故障给整个系统造成的重大影响;除此之外,本发明实施例根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,管理的任务的执行时间越长的jobTracker主机的优先级越低,这样可优先处理执行时间短的小任务,提高整个系统的处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的对任务调度jobTracker主机进行宕机保护的方法的一个实施例流程示意图。
图2是本发明的对任务调度jobTracker主机进行宕机保护的方法的另一个实施例流程示意图。
图3是图2中步骤115-步骤116的操作原理示意图。
图4是本发明的对任务调度jobTracker主机进行宕机保护的系统的一个实施例结构组成示意图。
图5是本发明的对任务调度jobTracker主机进行宕机保护的系统的另一个实施例结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例提供了对任务调度jobTracker主机进行宕机保护的方法,该方法应用于hadoop的MapReduce框架下,用于解决现有的MapReduce框架下jobTracker主机单点承担的工作压力大,单点故障导致系统故障的缺陷。
具体的,图1是本发明的对任务调度jobTracker主机进行宕机保护的方法的一个实施例流程示意图。如图1所示,本实施例的方法包括:
步骤S110,jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机(jobclient)所提交的任务,所述任务包括map任务和reduce任务。在步骤S110,用户任务提交接口机并不是每次都将任务提报给同一个jobTracker主机,而是以循环的方式将不同的任务提交到不同的jobTracker主机上。比如:假设jobTracker主机队列中包括三个jobTracker主机,分别是:jobTracker1、jobTracker2和jobTracker3,该三个jobTracker主机的循环顺序为jobTracker1-jobTracker3-jobTracker2-jobTracker1,假设当前有四个任务jobD1、jobD2、jobD3和jobD4,因此,当用户任务提交接口机接收到jobD1时,将其提交给jobTracker1;当用户任务提交接口机接收到jobD2时,将其提交给jobTracker3;当用户任务提交接口机接收到jobD3时,将其提交给jobTracker2;当用户任务提交接口机接收到jobD4时,将其提交给jobTracker1。
步骤S111,为各jobTracker主机管理的任务加入任务属性信息,所述任务属性信息用于标识所述任务与jobTracker主机之间的录属关系。具体实现中,所述任务属性信息可为任务配置信息表,该表中建立jobTracker主机名与任务名之间的对应关系。表1即为任务配置信息表的一种表达方式。具体实现中,任务属性信息可存储于jobTracker主机中,也可存储于系统的分布系统协调单元中。
表1:
jobID1->jobtracker1
jobID4->jobtracker1
jobID2->jobtracker3
jobID3->jobtracker2
步骤S112,任务执行单元(TaskTracker)根据jobTracker主机与任务间的录属关系,将任务执行过程中的任务状态信息上报给对应的jobTracker主机。比如,TaskTracker将根据“jobD3-> jobtracker2”的录属关系,将jobD3的任务状态信息上报给jobTracker2。
步骤S113,jobTracker主机队列中的两两jobTracker主机之间对管理的任务状态信息进行备份和同步。仍借用前面的例子,假设jobTracker主机队列中包括三个jobTracker主机,分别是:jobTracker1、jobTracker2和jobTracker3,在步骤S113,建立jobTracker1、jobTracker2和jobTracker3两两之间的管理的任务进行备份,并根据备份关系将任务状态信息进行同步(主要包括map和reduce任务的执行进度的同步),比如,该三个jobTracker主机中Jobtracker2备份jobtracker1, jobtracker3备份jobtracker2,jobtracker1备份jobtracker3。
步骤S114,当jobTracker主机队列中的一jobTracker主机发生宕机时,通过分布系统协调单元(zookeeper)通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker主机的备份的jobTracker主机上进行任务获取或上报任务状态信息。仍借用前面的例子,假设jobTracker主机队列中包括三个jobTracker主机,分别是:jobTracker1、jobTracker2和jobTracker3,假设jobTracker1宕机,此时通过zookeeper将宕机的所述jobTracker1上的任务jobD1和jobD4指定到jobTracker主机队列中对宕机的所述jobTracker1主机备份的jobTracker2主机上,也即,上述的表1将变为下表2:
表2:
jobID1->jobtracker2
jobID4->jobtracker2
jobID2->jobtracker3
jobID3->jobtracker2
在步骤S114,并通过分布系统协调单元(zookeeper)通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker1主机的备份的jobTracker2主机上进行任务获取或上报任务状态信息。
本实施例一方面不再由单个jobTracker主机来接收任务以对任务进行调度,而是提供一个jobTracker主机队列,由jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,通过该方式,降低了单个jobTracker主机来进行任务调度的工作压力;另一方面,本发明实施例将jobTracker主机队列中的两两jobTracker主机之间进行备份及任务状态信息同步,避免了jobTracker主机单点故障给整个系统造成的重大影响。
图2是本发明的对任务调度jobTracker主机进行宕机保护的方法的另一个实施例流程示意图。如图2所示,本实施例的方法在图1的基础上还包括步骤S115和步骤S116,具体的,本实施例的方法包括:
步骤S110-步骤S114。具体实现中,步骤S110-步骤S114与图1相同,在此不进行赘述。
步骤S115,根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,执行时间越长的任务放置到优先级越低的jobTracker主机上进行管理。比如参考图3,将jobTracker主机队列中的jobTracker主机按照管理的任务的执行时间长短划分为一级队列、二级队列和三级队列。
步骤S116,TaskTracker按照jobTracker主机的高低优先级的次序,以由高至低的顺序循环访问jobTracker主机,并从所述jobTracker主机中获取任务进行执行。比如,仍采用图3的例子,在步骤S116中,TaskTracker可首先从一级队列中获取20个任务执行,然后再从二级队列中获取10个任务执行,最后从三级队列中获取5个任务执行,依此循环。这样当系统中有执行时间较长的任务时,可将其放到第二级或三级队列中,以达到优先处理系统中的小任务,提高整个系统的处理效率。
具体实现中,当然也可以不对jobTracker主机队列中的jobTracker主机进行优先级划分,此时,TaskTracker直接按照jobTracker主机在队列中的循环顺序,循环从各jobTracker主机中获取任务进行执行。
本实施例一方面不再由单个jobTracker主机来接收任务以对任务进行调度,而是提供一个jobTracker主机队列,由jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,通过该方式,降低了单个jobTracker主机来进行任务调度的工作压力;另一方面,本发明实施例将jobTracker主机队列中的两两jobTracker主机之间进行备份及任务状态信息同步,避免了jobTracker主机单点故障给整个系统造成的重大影响;除此之外,本实施例根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,管理的任务的执行时间越长的jobTracker主机的优先级越低,这样可优先处理执行时间短的小任务,提高整个系统的处理效率。
相应的,本发明实施例还提供了对任务调度jobTracker主机进行宕机保护的系统,该系统可用于实现图1和图2所示的方法。
具体的,图4是本发明的对任务调度jobTracker主机进行宕机保护的系统的一个实施例结构组成示意图。该实施例可用于实施图1所示的方法。具体的,本实施例的系统包括:用户任务提交接口机40、任务执行单元(TaskTracker)41、jobTracker主机42以及分布系统协调单元43,其中:
所述用户任务提交接口机40,用于提交任务,所述任务包括map和reduce任务。用户任务提交接口机并不是每次都将任务提报给同一个jobTracker主机,而是以循环的方式将不同的任务提交到不同的jobTracker主机上。比如:假设jobTracker主机队列中包括三个jobTracker主机,分别是:jobTracker1、jobTracker2和jobTracker3,该三个jobTracker主机的循环顺序为jobTracker1-jobTracker3-jobTracker2-jobTracker1,假设当前有四个任务jobD1、jobD2、jobD3和jobD4,因此,当用户任务提交接口机接收到jobD1时,将其提交给jobTracker1;当用户任务提交接口机接收到jobD2时,将其提交给jobTracker3;当用户任务提交接口机接收到jobD3时,将其提交给jobTracker2;当用户任务提交接口机接收到jobD4时,将其提交给jobTracker1。
所述多个任务执行单元(TaskTracker)41,用于根据jobTracker主机42与任务间的录属关系,将任务执行过程中的任务状态上报给对应的jobTracker主机42。具体的,为各jobTracker主机中的管理的任务加入任务属性信息,所述任务属性信息用于标识所述任务与jobTracker主机之间的录属关系。具体实现中,所述任务属性信息可为任务配置信息表,该表中建立jobTracker主机名与任务名之间的对应关系。表1即为任务配置信息表的一种表达方式。具体实现中,任务属性信息可存储于jobTracker主机42中,也可存储于系统的分布系统协调单元43中。比如,基于表1,任务执行单元(TaskTracker)41将根据“jobD3-> jobtracker2”的录属关系,将jobD3的任务状态信息上报给jobTracker2。
多个jobTracker主机42,其组成一jobTracker主机队列,所述jobTracker主机队列中的各jobTracker主机42以循环方式接收用户任务提交接口机40所提交的任务,并且两两jobTracker主机42之间对管理的任务进行备份并对任务状态信息进行同步。
所述分布系统协调单元43(zookeeper),用于保存所述jobTracker主机队列中的各jobTracker主机的配置信息,所述配置信息包括jobTracker主机队列中各jobTracker主机之间的备份关系,以及各jobTracker主机与任务的录属关系;当jobTracker主机队列中的一jobTracker主机发生宕机时,基于所述配置信息通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker主机的备份的jobTracker主机上进行任务获取或上报任务状态信息。仍借用前面的例子,假设jobTracker主机队列中包括三个jobTracker主机,分别是:jobTracker1、jobTracker2和jobTracker3,所述分别系统协调单元43建立jobTracker1、jobTracker2和jobTracker3两两之间的备份关系,并根据备份关系将任务状态信息同步,比如,该三个jobTracker主机中Jobtracker2备份jobtracker1, jobtracker3备份jobtracker2,jobtracker1备份jobtracker3。另外,假设jobTracker1宕机,此时通过zookeeper将宕机的所述jobTracker1上的任务jobD1和jobD4指定到jobTracker主机队列中对宕机的所述jobTracker1主机备份的jobTracker2主机上。也即,表1将变为表2。并且,zookeeper通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker1主机的备份的jobTracker2主机上进行任务获取或上报任务状态信息
图5是本发明的对任务调度jobTracker主机进行宕机保护的系统的另一个实施例结构组成示意图。该实施例可用于实施图2所示的方法。如图5所示,本实施例的系统在图4所示的系统的基础上,还包括优先等级划分单元45,用于根据jobTracker主机42所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机42进行优先级等级划分,执行时间越长的任务放置到优先级越低的jobTracker主机上进行管理。比如参考图3,将jobTracker主机队列中的jobTracker主机按照管理的任务的执行时间长短划分为一级队列、二级队列和三级队列。
在此基础上,所述TaskTracker41具体按照jobTracker主机的高低优先级的次序,以由高至低的顺序循环访问jobTracker主机42,并从所述jobTracker主机42中获取任务进行执行。比如,仍采用图3的例子,TaskTracker41可首先从一级队列中获取20个任务执行,然后再从二级队列中获取10个任务执行,最后从三级队列中获取5个任务执行,依此循环。这样当系统中有执行时间较长的任务时,可将其放到第二级或三级队列中,以达到优先处理系统中的小任务,提高整个系统的处理效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种对任务调度jobTracker主机进行宕机保护的方法,其特征在于,包括:
jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,所述任务包括map任务和reduce任务;
任务执行单元TaskTracker根据各jobTracker主机与任务间的录属关系,将任务执行过程中的任务状态信息上报给对应的jobTracker主机;
jobTracker主机队列中的两两jobTracker主机之间对管理的任务进行备份并对任务状态信息进行同步。
2.如权利要求1所述的对任务调度jobTracker主机进行宕机保护的方法,其特征在于,还包括:
当jobTracker主机队列中的一jobTracker主机发生宕机时,通过分布系统协调单元通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker主机的备份的jobTracker主机上进行任务获取或上报任务状态信息。
3.如权利要求1或2所述的对任务调度jobTracker主机进行宕机保护的方法,其特征在于,还包括:
为各jobTracker主机管理的任务加入任务属性信息,所述任务属性信息用于标识所述任务与jobTracker主机之间的录属关系。
4.如权利要求1或2所述的对任务调度jobTracker主机进行宕机保护的方法,其特征在于,还包括:
TaskTracker以循环方式依次从各jobTracker主机中获取任务进行执行。
5.如权利要求4所述的对任务调度jobTracker主机进行宕机保护的方法,其特征在于,
根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,执行时间越长的任务放置到优先级越低的jobTracker主机上进行管理;
所述TaskTracker以循环方式依次从各jobTracker主机中获取任务进行执行具体包括:
TaskTracker按照jobTracker主机的高低优先级的次序,以由高至低的顺序循环访问jobTracker主机,并从所述jobTracker主机中获取任务进行执行。
6.一种对任务调度jobTracker主机进行宕机保护的系统,其特征在于,包括:
用户任务提交接口机,用于提交任务,所述任务包括map和reduce任务;
多个任务执行单元TaskTracker,用于根据jobTracker主机与任务间的录属关系,将任务执行过程中的任务状态上报给对应的jobTracker主机;
多个jobTracker主机,其组成一jobTracker主机队列,所述jobTracker主机队列中的各jobTracker主机以循环方式接收用户任务提交接口机所提交的任务,并且两两jobTracker主机之间对管理的任务进行备份并对任务状态信息进行同步。
7.如权利要求6所述的对任务调度jobTracker主机进行宕机保护的系统,其特征在于,还包括:
分布系统协调单元,用于保存所述jobTracker主机队列中的各jobTracker主机的配置信息,所述配置信息包括jobTracker主机队列中各jobTracker主机之间的备份关系,以及各jobTracker主机与任务的录属关系;当jobTracker主机队列中的一jobTracker主机发生宕机时,基于所述配置信息通知TaskTracker,以使所述TaskTracker到宕机的所述jobTracker主机的备份的jobTracker主机上进行任务获取或上报任务状态信息。
8.如权利要求6或7所述的对任务调度jobTracker进行宕机保护的系统,其特征在于,所述jobTracker主机队列中的各jobTracker主机为其管理的任务加入任务属性信息,所述任务属性信息用于标识所述任务与jobTracker主机之间的录属关系。
9.如权利要求6或7所述的对任务调度jobTracker进行宕机保护的系统,其特征在于, 
所述TaskTracker还用于以循环方式依次从各jobTracker主机中获取任务进行执行。
10.如权利要求9所述的对任务调度jobTracker进行宕机保护的系统,其特征在于,还包括:
优先等级划分单元,用于根据jobTracker主机所管理的任务的执行时间长短,对jobTracker主机队列中的各jobTracker主机进行优先级等级划分,执行时间越长的任务放置到优先级越低的jobTracker主机上进行管理;
所述TaskTracker具体按照按照jobTracker主机的高低优先级的次序,以由高至低的顺序循环访问jobTracker主机,并从所述jobTracker主机中获取任务进行执行。
CN201110170328.4A 2011-06-23 2011-06-23 对jobTracker主机进行宕机保护的方法和系统 Active CN102841822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110170328.4A CN102841822B (zh) 2011-06-23 2011-06-23 对jobTracker主机进行宕机保护的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110170328.4A CN102841822B (zh) 2011-06-23 2011-06-23 对jobTracker主机进行宕机保护的方法和系统

Publications (2)

Publication Number Publication Date
CN102841822A true CN102841822A (zh) 2012-12-26
CN102841822B CN102841822B (zh) 2016-10-05

Family

ID=47369217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110170328.4A Active CN102841822B (zh) 2011-06-23 2011-06-23 对jobTracker主机进行宕机保护的方法和系统

Country Status (1)

Country Link
CN (1) CN102841822B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544081A (zh) * 2013-10-23 2014-01-29 曙光信息产业(北京)有限公司 双元数据服务器的管理方法和装置
CN103645952A (zh) * 2013-08-08 2014-03-19 中国人民解放军国防科学技术大学 一种基于MapReduce的非精确任务并行处理方法
CN106452899A (zh) * 2016-10-27 2017-02-22 中国工商银行股份有限公司 一种分布式数据挖掘系统及方法
CN108845867A (zh) * 2018-07-16 2018-11-20 郑州云海信息技术有限公司 一种分布式事务管理方法、装置、系统及存储介质
CN111597056A (zh) * 2020-05-18 2020-08-28 北京思特奇信息技术股份有限公司 一种分布式调度方法、系统、存储介质和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308468A (zh) * 2008-06-13 2008-11-19 南京邮电大学 网格计算环境下的作业跨域控制方法
CN102096599A (zh) * 2009-12-14 2011-06-15 中国移动通信集团公司 一种多队列任务调度方法及相关系统和设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308468A (zh) * 2008-06-13 2008-11-19 南京邮电大学 网格计算环境下的作业跨域控制方法
CN102096599A (zh) * 2009-12-14 2011-06-15 中国移动通信集团公司 一种多队列任务调度方法及相关系统和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张密密: "MapReduce模型在Hadoop实现中的性能分析及改进优化", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 4, 15 April 2011 (2011-04-15), pages 137 - 55 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103645952A (zh) * 2013-08-08 2014-03-19 中国人民解放军国防科学技术大学 一种基于MapReduce的非精确任务并行处理方法
CN103645952B (zh) * 2013-08-08 2017-06-06 中国人民解放军国防科学技术大学 一种基于MapReduce的非精确任务并行处理方法
CN103544081A (zh) * 2013-10-23 2014-01-29 曙光信息产业(北京)有限公司 双元数据服务器的管理方法和装置
CN103544081B (zh) * 2013-10-23 2015-08-12 曙光信息产业(北京)有限公司 双元数据服务器的管理方法和装置
CN106452899A (zh) * 2016-10-27 2017-02-22 中国工商银行股份有限公司 一种分布式数据挖掘系统及方法
CN106452899B (zh) * 2016-10-27 2019-09-06 中国工商银行股份有限公司 一种分布式数据挖掘系统及方法
CN108845867A (zh) * 2018-07-16 2018-11-20 郑州云海信息技术有限公司 一种分布式事务管理方法、装置、系统及存储介质
CN111597056A (zh) * 2020-05-18 2020-08-28 北京思特奇信息技术股份有限公司 一种分布式调度方法、系统、存储介质和设备
CN111597056B (zh) * 2020-05-18 2023-06-30 北京思特奇信息技术股份有限公司 一种分布式调度方法、系统、存储介质和设备

Also Published As

Publication number Publication date
CN102841822B (zh) 2016-10-05

Similar Documents

Publication Publication Date Title
EP2535810B1 (en) System and method for performing distributed parallel processing tasks in a spot market
US8112659B2 (en) Reducing recovery time for business organizations in case of disasters
CN102831120B (zh) 一种数据处理方法及系统
CN102841822A (zh) 对jobTracker主机进行宕机保护的方法和系统
Shen et al. Fast failure recovery in distributed graph processing systems
CN108469988A (zh) 一种基于异构Hadoop集群的任务调度方法
WO2016022492A1 (en) Account processing method and apparatus
CN102387179B (zh) 分布式文件系统及其结点、存储方法和存储控制方法
EP2962226A1 (en) System and method for distributed sql join processing in shared-nothing relational database clusters using stationary tables
CN110716802B (zh) 一种跨集群的任务调度系统及方法
CN102541858A (zh) 基于映射和规约的数据均衡性处理方法、装置及系统
CN103064728A (zh) 一种MapReduce任务的容错调度方法
US20220027173A1 (en) Processing an operation with a plurality of processing steps
CN113987064A (zh) 数据处理方法、系统及设备
EP2904518A2 (en) Efficient pushdown of joins in a heterogeneous database system involving a large-scale low-power cluster
CN110990372A (zh) 一种维度数据的处理方法及装置、数据查询方法及装置
US20150149437A1 (en) Method and System for Optimizing Reduce-Side Join Operation in a Map-Reduce Framework
CN104391748A (zh) 一种mapreduce计算过程优化方法
CN103763740A (zh) 一种单板间负载均衡的方法及装置
CN109325200B (zh) 获取数据的方法、装置及计算机可读存储介质
CN106775948A (zh) 一种基于优先级的云任务调度方法及装置
CN107562803B (zh) 数据供应系统及方法、终端
CN105893156B (zh) 存储计算系统中的请求处理方法及存储计算系统
Dai et al. Research and implementation of big data preprocessing system based on Hadoop
CN103678360A (zh) 一种分布式文件系统的数据存储方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180930

Address after: 101000 Beijing Haidian District Zhichun Road 49 No. 3 West 309

Patentee after: Tencent cloud computing (Beijing) limited liability company

Address before: 518057 East 403 room, Sai Ge science and Technology Park, Futian District Zhenxing Road, Shenzhen, Guangdong, China, 2

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.