CN101958808A - 一种服务于多网格接入的集群任务调度管理器 - Google Patents

一种服务于多网格接入的集群任务调度管理器 Download PDF

Info

Publication number
CN101958808A
CN101958808A CN2010105104140A CN201010510414A CN101958808A CN 101958808 A CN101958808 A CN 101958808A CN 2010105104140 A CN2010105104140 A CN 2010105104140A CN 201010510414 A CN201010510414 A CN 201010510414A CN 101958808 A CN101958808 A CN 101958808A
Authority
CN
China
Prior art keywords
task
resource
cluster
reservation
changeed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105104140A
Other languages
English (en)
Other versions
CN101958808B (zh
Inventor
柴亚辉
刘觉夫
涂春萍
赵海霞
刘美香
谢昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Jiaotong University
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN2010105104140A priority Critical patent/CN101958808B/zh
Publication of CN101958808A publication Critical patent/CN101958808A/zh
Application granted granted Critical
Publication of CN101958808B publication Critical patent/CN101958808B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种服务于多网格接入的集群任务调度管理器。将集群系统上的任务分为本地任务与网格任务,并将网格任务细分为是哪个网格上的任务。对任务进行优先级分类,以确保在同时提交任务时,根据任务优先级确定先为哪个任务分配集群资源。同时,采用本地任务预约占用资源策略来保证本地任务对资源有很大需求时,在预约占用时间有效期内,来自网格方面的任务不能与本地任务争用集群资源。在此基础上提出任务调度与资源分配策略算法,保证及时有效地为任务分配所需的资源。此发明使得集群的任务调度与管理能够适应集群同时接入多个网格系统,充分提高了集群资源的使用效率,使集群系统的任务调度与管理更加灵活与方便。

Description

一种服务于多网格接入的集群任务调度管理器
技术领域
本发明涉及一种服务于多网格接入的集群任务调度管理器,属接入网格后的计算机集群调度管理技术领域。
背景技术
高性能计算机的发展趋势正从传统的专用超级计算机平台转变到低成本且通用、松耦合、由单一或者多个处理器的计算机或者工作站构成的集群系统。这种集群系统有很多的优势,包括可以按照给定的任务建造平台,以适应较大型的应用程序和工作负荷等。很多单位因为科研与工作的需要而购买或者研制了高性能计算集群系统,而且购买了相关的在集群上使用的系统软件与应用软件。但这些单位在集群的管理与维护上都面对着一个的问题,就是集群的资源利用率的问题。作为一个单位而言,它不可能每天都有大量的运算任务让集群去计算。而且好多购买集群的单位也不是计算机专业研究单位,只是用集群来为其做科研计算或者工程计算等。因此,在集群系统的使用上,集群的利用率非常低,但每天用在集群上的开销是一种很大的浪费,集群系统每天是开机运行状态,但CPU、内存、硬盘、网格等的利用率却很低。
而另一方面,一个单位上的集群的计算能力在某些时候,不能保证任务的性能需求,但这种情况又不是很多,如果就因为这种个别情况,而再去花大量的经费去购买新的集群系统,也会增大科研的成本,造成科研经费的紧张,同时,对集群的效率而言也很低。而通过网格技术,可以把分布在不同地点的、不同单位的、不同计算节点的各种计算和信息服务资源,例如计算能力、存储能力和信息服务能力,整合为一个单一的(虚拟的)系统。大规模高性能计算需求以及计算机和网络技术的发展促进了计算网格的诞生,充分利用已有资源更好地为用户服务,甚至求解人类不曾或者很难解决的问题。在单位的集群系统,比较空闲时,可以将这部分空闲资源共享到网格中去,当自己的资源紧张时,可以通过网格获取更多的可用资源,实现资源的动态高效利用。
因为很多网格是服务于某一项科研工作的需要的专用网格,因此,一台集群系统可能要接入到多个网格系统中,即多网格接入。多网格接入一方面,使集群系统的性能得到了更好的发挥,同时,也会使得本单位从不同的网格中获取了现多的有用资源。但多网格接入也会给集群系统的任务与资源管理带来了很多的问题。集群上现有的任务与资源管理系统与方法已经不能满足多网格接入以后的任务调度与管理需求,因此,需要有新的能够满足在多网格接入的条件下的任务调度与管理系统。
发明内容
本发明的目的是,为了使集群在多网格接入时,能够及时而高效地为每个网格上的任务分配集群资源,同时有效地管理好集群上的每个任务,本发明公开了一个服务于多网格接入的集群任务调度管理器,使网格用户与集群用户对集群系统上的资源的利用与任务的管理更加灵活与方便。
本发明的技术方案是,所述服务于多网格接入的集群任务调度管理器包括任务分类与任务优先级划分策略、本地任务的资源预约占用策略和任务的调度与资源分配策略。
任务分类与任务优先级划分策略:
任务首先分为本地提交任务LT与网格提交任务GT。其中GT又根据集群接入的网格的不同分为某网格的GT(G1)、GT(G2)、……、GT(GN)。任务的优先级P为PLT>PGT(G1)>PGT(G2)>……>PGT(GN)。当集群系统内的本地用户通过集群本地任务管理系统向集群提交任务时,则该任务为本地提交任务LT,如果该用户通过网格来提交该任务时,则如果该任务向集群申请资源时,被认为是该网格的任务GT。
本地任务的资源预约占用策略:
本地任务LT为了能确保在任务提交时能够及时获得集群上的资源,可以对集群资源进行预约占用,预约占用的有效期为时间TP。预约占用的作用范围只针对于网格任务,即:当用户为本地任务LT预约占用资源RP以后,该资源RP在预约占用时间有效期内,网格任务无法使用该资源,但其它本地任务LT’可以使用该资源RP。用户提交预约占用请求时,提交的信息包括:任务所需要的资源信息集合(一般包括:集群节点数量、计算核数、所需软件工具、存储空间大小等)、预约有效期(该时间≤TP)、预约用户信息(用ID、预约提交时间等)。预约占用请求提交成功以后,如果当前的集群中的空闲资源能够满足用户的资源预约占用需求,则预约占用管理器给用户立即返回预约成功消息,并为用户保留好预约的资源。如果当前没有满足预约条件的资源,则预约占用管理器将暂存该预约请求,每当集群上资源有变化时,就进行预约占用请求,直到在预约请求时间有效期内,如果预约成功,向用户返回预约成功消息,否则,在预约占用有效时间截止时返回预约失败的信息。
任务的调度与资源分配策略:
假设初始时,没有任务提交,当有新的任务提交时,转第0步。
第0步:任务调度管理器的任务接收端口接收所有提交请求任务,并将其交给任务接收器,任务接收器将任务进行接收,如果在某一时刻,同时有来自不同的网格的任务同时提交,则需要根据每个任务优先级将这些任务按优先级高低进行排队,首先对优先级最高的任务进行调度与资源分配。
第一步:从提交任务队列出取出一个任务TR,查看其所需要的资源,从集群的空闲资源管理器中寻找满足其需求的资源,如果满足其资源需求,则转第二步,否则转第三步。
第二步:如果该任务是本地任务LT,则为其分配资源,并更新当前集群空闲资源库,转第XX步;否则,该任务为网格提交任务GT,先为其预约好其所需要的资源,并更新当前集群空闲资源库,并确认该任务是否要提交到该集群,如果确认提交,转第四步,否则转第五步。
第三步:确认该任务是否需要加入该集群的等待再次提交任务队列QW?如果确认加入QW,转第六步;否则,取消该任务的提交,转第七步。
第四步:将该任务交由任务状态管理器来监控任务的提交状态,并由任务提交管理器负责对该任务在集群上进行提交,转第七步。
第五步:回收为该任务预留的资源,并更新当前集群空闲资源库,转第七步。
第六步:根据该任务的优先级确定任务要插入到QW中的位置。QW的排队策略如下:对于相同优先级的任务,提交时间在先的排在队列的前面;对于不同优先级的任务,则高优先级的任务排在低优先级的任务的前面。转第七步。
第七步:查看当前提交任务队列是否为空,如果该队列为空,则转第八步,否则,指向队列的下一个任务,转第一步。
第八步:查看当前有无空闲资源变化,如果空闲资源发生变化,则查看是QW否为空,如果QW为空,则等待新任务到来,在新的任务到来之后,转第一步;如果QW不为空,则转第九步。
第九步:从QW中取出当前指针指向的任务,为其匹配空闲资源,如果匹配成功,则提交该任务,转第十步。如果资源匹配不成功,则指针指向QW中下一个任务,并转第九步。
第十步:确认QW是否为空,如果QW为空,则等待新任务提交或者空闲资源发生变化,转第十一步。如果QW不为空,则指针指向QW中下一个任务,并转第九步。
第十一步:如果是有新的任务提交,则转第0步,如果是空闲资源发生变化,则转第八步。
通过对本地提交的任务LT设立高的优先级,保证了本地任务对集群的资源的优先使用权,在本地任务不多,集群资源空闲时,向网格任务开放。同时,如果本地的用户想使用网格上的其它的网格资源节点的资源,则可以通过向该网格的portal提交任务,并由该网格的任务调度器将此任务调到对应的网格资源节点上。
本发明与现有技术比较的有益效果是,本发明提出的服务于多网格接入的集群任务调度管理器,不仅可以充分保证本地任务对集群资源的充分利用,而且能够灵活的控制整个集群上的资源对网格任务的动态开放与退出,充分提高了集群资源的使用效率,使集群系统的任务调度与管理更加灵活与方便。
附图说明
图1是实现该任务调度管理器的系统功能结构图;
图2是任务队列管理模块功能结构图;
图3是任务状态监控管理功能结构图;
图4是集群资源管理功能结构图;
图中图号:1为用户管理系统模块;2为网络任务接口管理模块;3为任务队列管理器;4为本地任务接口管理模块;5为任务状态监控器;6为调度器;7为预约占用管理器;8为任务提交控制管理器;9为资源回收器;10为资源管理器;21为任务排队决策策略;22为任务排队决策策略;31为任务状态信息服务;32为任务状态切换管理;33为分类任务状态管理;41为资源分类信息管理;42为空闲资源管理;43为预约占用资源管理;44为占用资源管理;45为异常资源管理;46为资源信息服务管理。
具体实施方式
本发明具体实施方式如图1、图2、图3和图4所示。
本发明方法的实现对硬件环境为集群系统,软件环境为多核处理器集群管理平台,实现本发明所用的语言工具没有特别要求,C语言、C++语言、Java语言等都能实现。对操作系统平台也没有特别要求,Microsoft Windows系统、各种Linux系统、UNIX系统等都可以做为操作系统运行平台,该发明可以开发成图形界面形式,也可以开发成非图形界面形式。
图1是实现该任务资源分配方法的功能结构图,主要包括以下功能模块:
(1)用户管理系统模块,如图1中的1所示。该功能模块主要是对集群系统上的提交任务的用户的认证与管理,通过该用户管理系统来注册与审核用户,用户被集群系统认证以后,可以直接通过集群本地任务管理系统向集群提交任务,用户被某接入网格认证以后可以通过该网格任务管理系统向网格提交任务。
(2)网格任务接口管理模块,如图1中的2所示。该功能模块负责与网格任务管理系统的任务进行信息交互,将网格提交的网格任务接收后,对网格任务格式进行转换,转换为集群任务管理系统所要求的任务格式,并将任务传送给任务队列管理器(如图1中的3所示)。集群系统每接入一个网格,便对应生成一个网格任务接口。
(3)本地任务接口管理模块,如图1中的4所示。该功能模块负责与本地任务管理系统的任务进行信息交互,将本地提交的集群任务接收后,将任务传送给任务队列管理器(如图1中的3所示)。集群系统中只需要一个本地任务接口。
(4)任务队列管理模块,如图1中的3所示。该功能模块负责对提交的各种任务进行调度前的排序队列管理,主要包括待处理任务队列QS与等待再次提交任务队列QW
图2为任务队列管理模块功能结构图,队列QS主要保存的是从本地任务接口与网格任务接口所提交过来的任务,如果同是时刻(例如:在同一秒内)有多个任务从不同的接口提交过来,将根据排队决策策略,对任务进行排队。图2中的22所示的排队决策策略为:则根据其所在的接口的任务的优先级,对这些任务按优先级高低进行排序;对于不是同时提交的,则按提交时间先后排序。如果QS为空,表明当前没有正在提交的任务,且以前提交的任务都已经被调度器(图1中的6所示)进行了调度处理。
队列QW主要保存的是当前集群资源不能满足需求而需要在岳面的适当时刻(如:有新的空闲资源出现时)再次向集群系统提交的任务序列。在图2中21所示的排队决策策略为:(1)本地任务LT优先于网格任务GT;(2)任务同优先级时,以提交时间先后为序;(3)网格任务以优先级为主序,提交时间为次序。当队列QW为空时,表明没有等待再次提交的任务。
(5)任务状态监控管理模块,如图1中的5所示。该功能模块负责监控提交到集群上的各个任务的生命周期状态,并负责任务切换管理以及任务状态信息服务。图3为任务状态监控管理功能结构图,任务管理主要管理如下任务状态队列:正在提交任务队列、正在运行任务队列、故障任务队列、运行结束任务队列等。任务状态切换管理(图3中32)主要是根据任务的不同的状态之间切换过程,通知相应的功能模块。如:由正在提交状态变为正在运行状态时,生成任务提交成功的消息,并传送给调度器(如图1中的6所示)。当任务由正在运行状态变为运行结束状态时,生成任务运行完成的消息,传送给调度器,并通知资源回收器收回该任务所占用资源。任务状态信息服务(图3中31)主要是负责处理任务信息状态的查询请求,根据其查询请求,为其提供相对应的任务当前状态信息。分类任务状态管理(图3中的33)主要是负责对所接入的某个网格的任务状态信息服务管理,如:当前网格A的运行任务等。
(6)预约占用管理模块,如图1中的7所示。该功能模块负责处理由本地用户提交的资源预占用请求,根据用户所请求的资源,查看当前的资源情况,如果当前空闲资源能满足该资源需求,则进行资源预约占用标记处理,对网格任务而言,整个集群系统的可用资源将是全部资源减去预约占用资源,但对其它本地任务,预约占用资源无效。如果当前没有满足预约占用要求的资源,则预约占用管理模块会保存预约请求,在资源发生变化时,继续进行预约占用,当有效期结束时,还没有预约成功,则表示此次预约占用失败。
(7)任务提交控制管理模块,如图1中的8所示。当调度器为提交任务找到满足其需求的资源,并且确认提交时,交由该模块进行提交,该模块为每个要提交的任务开辟一个线程来处理任务提交。如果任务提交成功,则通知任务状态监控管理模块任务提交成功,并生成该任务的详细信息。如果任务在提交中出现了问题,任务提交没有成功,则通知调度器任务提交不成功,并通知资源回收器收回该任务占用的资源。
(8)资源回收器管理模块,如图1中的9所示。该功能模块主要是负责对资源的回收与管理。在以下情况发生时,回收相应的任务资源:①任务运行结束;②任务提交未成功;③任务取消,包括正在运行的任务被取消与预约占用资源被用户取消;④任务自身异常中断而退出;⑤故障资源的恢复正常。资源回收器将这些回收的资源设置为空闲资源,并加入空闲资源集合中。
(9)资源管理器模块,如图1中的10所示。该功能模块主要负责对整个集群统的各种有效的资源管理与资源信息服务。图4为集群资源管理功能结构图,主要包括:①资源分类信息管理;②空闲资源管理;③预约占用资源管理;④占用资源管理;⑤异常资源管理;⑥资源信息服务管理等。
①资源分类信息管理(图4中41)。对集群上的各种资源进行资源分类,进行资源分类的主要依据是网格的硬件系统、操作系统、软件系统等。在集群系统中,资源一般主要包括:计算节点、CPU、计算核、内存资源、存储资源、通信资源、应用软件资源、编程资源等。
②空闲资源管理(图4中42)。对集群上的各种空闲资源的统计与管理,将空闲资源信息提供给调度器。同时,将资源回收器回收的资源加入到对应的空闲资源种类集合中,当有资源被占用与预约占用时,将相应的空闲资源数目减少。
③预约占用资源管理(图4中43)。对由本地用户的预约占用成功的资源数目进行管理,这些资源数目对网格任务是不可用资源,当在预约占用有效期内,用户从本地提交任务成功,则将该预约占用资源转为占用资源,如果在预约占用有效期内没有提交任务成功,则在预约占用到期时,将该预约占用资源由资源回收器收回。
④占用资源管理(图4中44)。对已经在运行的任务所占用的管理,将该资源信息提供给调度器,并管理这些被占用资源上的具体资源信息与分类,当有新任务提交时,将其所占用的资源加入到占用资源集合中,当有任务运行完成、任务取消或者运行异常而退出时,将其所占用的资源从占用资源集合中去除。
⑤异常资源管理(图4中45)。当有资源出现异常或者集群某节点关机时,将这些资源信息加入到异常资源集合中,并提供异常情况类型信息。
⑥资源信息服务管理(图4中46)。为管理员与用户提供当前的集群上的信息资源情况,包括:当前空闲资源种类与数量、集群可提供的资源信息、当前资源占用信息、当前关机资源信息、当前故障或者异常资源信息、当前预约占用资源信息等。
(11)任务调度器模块,如图1中的6所示。该功能模块是实现本发明方法的核心功能模块,它与其它各功能模块进行交互。当任务提交队列不为空时,从中取出任务,按本发明所提出的调度方法将该任务调度到对应的资源节点上。当调度器确认一个任务将要提交时,启动任务提交功能模块开始任务的正式提交,如果任务提交成功,则由调度器向用户返回任务提交成功信息,如果提交失败,向用户返回提交失败信息,并通知资源回收器收回该任务占用资源。只要QW或QS不为空,调度器持续在资源信息变化或者有新的任务提交时为任务在集群中匹配合适资源。
通过对本地提交的任务LT设立高的优先级,保证了本地任务对集群的资源的优先使用权,通过预约占用策略,保证在本地任务对资源有很大需求时,在预约占用时间有效期内,网格方面的任务不能与本地任务争用集群资源。本发明的实施方案中的各个功能模块易于用各种编程语言实现,也易于在各种操作系统平台上去实现与运行。本发明提出的服务于多网格接入的集群任务调度管理器,不仅可以充分保证本地任务对集群资源的充分利用,而且能够灵活的控制整个集群上的资源对网格任务的动态开放与退出,充分提高了集群资源的使用效率,使集群系统的任务调度与管理更加灵活与方便。

Claims (4)

1.一种服务于多网格接入的集群任务调度管理器,其特征在于:所述服务于多网格接入的集群任务调度管理器包括任务分类与任务优先级划分策略、本地任务的资源预约占用策略和任务的调度与资源分配策略。
2.根据权利要求1所述的一种服务于多网格接入的集群任务调度管理器,其特征在于,所述任务分类与任务优先级划分策略为:
任务首先为分本地提交任务LT与网格提交任务GT;其中GT又根据集群接入的网格的不同分为某网格的GT(G1)、GT(G2)、……、GT(GN);
任务的优先级P为PLT>PGT(G1)>PGT(G2)>……>PGT(GN)
当集群系统内的本地用户通过集群本地任务管理系统向集群提交任务时,则该任务为本地提交任务LT,如果该用户通过网格来提交该任务时,则如果该任务向集群申请资源时,被认为是该网格的任务GT。
3.根据权利要求1所述的一种服务于多网格接入的集群任务调度管理器,其特征在于,所述本地任务的资源预约占用策略为:
本地任务LT为了能确保在任务提交时能够及时获得集群上的资源,可以对集群资源进行预约占用,预约占用的有效期为时间TP
预约占用的作用范围只针对于网格任务,即:当用户为本地任务LT预约占用资源RP以后,该资源RP在预约占用时间有效期内,网格任务无法使用该资源,但其它本地任务LT’可以使用该资源RP
用户提交预约占用请求时,提交的信息包括:任务所需要的资源信息集合、预约有效期、预约用户信息;
预约占用请求提交成功以后,如果当前的集群中的空闲资源能够满足用户的资源预约占用需求,则预约占用管理器给用户立即返回预约成功消息,并为用户保留好预约的资源;
如果当前没有满足预约条件的资源,则预约占用管理器将暂存该预约请求,每当集群上资源有变化时,就进行预约占用请求,直到在预约请求时间有效期内,如果预约成功,向用户返回预约成功消息,否则,在预约占用有效时间截止时返回预约失败的信息。
4.根据权利要求1所述的一种服务于多网格接入的集群任务调度管理器,其特征在于,所述任务的调度与资源分配策略为:
假设初始时,没有任务提交,当有新的任务提交时,转第0步;
第0步:任务调度管理器的任务接收端口接收所有提交请求任务,并将其交给任务接收器,任务接收器将任务进行接收,如果在某一时刻,同时有来自不同的网格的任务同时提交,则需要根据每个任务优先级将这些任务按优先级高低进行排队,首先对优先级最高的任务进行调度与资源分配;
第1步:从提交任务队列出取出一个任务TR,查看其所需要的资源,从集群的空闲资源管理器中寻找满足其需求的资源,如果满足其资源需求,则转第2步,否则转第3步;
第2步:如果该任务是本地任务LT,则为其分配资源,并更新当前集群空闲资源库,转第4步;否则,该任务为网格提交任务GT,先为其预约好其所需要的资源,并更新当前集群空闲资源库,并确认该任务是否要提交到该集群,如果确认提交,转第4步,否则转第5步;
第3步:确认该任务是否需要加入该集群的等待再次提交任务队列QW,如果确认加入QW,转第6步;否则,取消该任务的提交,转第7步;
第4步:将该任务交由任务状态管理器来监控任务的提交状态,并由任务提交管理器负责对该任务在集群上进行提交,转第7步;
第5步:回收为该任务预留的资源,并更新当前集群空闲资源库,转第7步;
第6步:根据该任务的优先级确定任务要插入到QW中的位置;QW的排队策略如下:
对于相同优先级的任务,提交时间在先的排在队列的前面;
对于不同优先级的任务,则高优先级的任务排在低优先级的任务的前面,转第7步;
第7步:查看当前提交任务队列是否为空,如果该队列为空,则转第8步;否则,指向队列的下一个任务,转第1步;
第8步:查看当前有无空闲资源变化,如果空闲资源发生变化,则查看是QW否为空,
如果QW为空,则等待新任务到来,在新的任务到来之后,转第1步;如果QW不为空,则转第9步;
第9步:从QW中取出当前指针指向的任务,为其匹配空闲资源,
如果匹配成功,则提交该任务,转第10步;如果资源匹配不成功,则指针指向QW中下一个任务,并转第9步;
第10步:确认QW是否为空,
如果QW为空,则等待新任务提交或者空闲资源发生变化,转第11步;
如果QW不为空,则指针指向QW中下一个任务,并转第9步;
第11步:如果是有新的任务提交,则转第0步,如果是空闲资源发生变化,则转第8步。
CN2010105104140A 2010-10-18 2010-10-18 一种服务于多网格接入的集群任务调度管理器 Expired - Fee Related CN101958808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105104140A CN101958808B (zh) 2010-10-18 2010-10-18 一种服务于多网格接入的集群任务调度管理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105104140A CN101958808B (zh) 2010-10-18 2010-10-18 一种服务于多网格接入的集群任务调度管理器

Publications (2)

Publication Number Publication Date
CN101958808A true CN101958808A (zh) 2011-01-26
CN101958808B CN101958808B (zh) 2012-05-23

Family

ID=43485930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105104140A Expired - Fee Related CN101958808B (zh) 2010-10-18 2010-10-18 一种服务于多网格接入的集群任务调度管理器

Country Status (1)

Country Link
CN (1) CN101958808B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207814A (zh) * 2012-12-27 2013-07-17 北京仿真中心 一种去中心化的跨集群资源管理与任务调度系统与调度方法
CN103425536A (zh) * 2013-08-26 2013-12-04 中国科学院软件研究所 一种面向分布式系统性能测试的测试资源管理方法
CN103473140A (zh) * 2013-10-09 2013-12-25 浪潮(北京)电子信息产业有限公司 一种生命科学应用的集群分配方法、软件安装方法及装置
CN103810046A (zh) * 2012-11-15 2014-05-21 百度在线网络技术(北京)有限公司 一种单机资源管理方法及系统
CN103942102A (zh) * 2014-04-14 2014-07-23 桂林电子科技大学 基于双优先级的实时任务调度方法
CN104239493A (zh) * 2014-09-09 2014-12-24 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN105045957A (zh) * 2015-06-18 2015-11-11 上海幻维数码创意科技有限公司 为多边形引擎提供几何实体数据服务的系统
WO2015180116A1 (zh) * 2014-05-30 2015-12-03 华为技术有限公司 一种分配承载资源的方法和装置
CN105208530A (zh) * 2015-09-02 2015-12-30 哈尔滨海能达科技有限公司 一种组呼业务处理方法、终端及核心网网元
CN106293950A (zh) * 2016-08-23 2017-01-04 成都卡莱博尔信息技术股份有限公司 一种面向集群系统的资源优化管理方法
CN106897128A (zh) * 2017-01-19 2017-06-27 网宿科技股份有限公司 一种分布式应用退出方法、系统以及服务器
CN106899521A (zh) * 2016-08-30 2017-06-27 阿里巴巴集团控股有限公司 互联网资源调度方法及装置、担保方法及装置
CN107066332A (zh) * 2017-01-25 2017-08-18 广东神马搜索科技有限公司 分布式系统及其调度方法和调度装置
CN107707638A (zh) * 2017-06-01 2018-02-16 云智慧(北京)科技有限公司 一种分布式云压测机资源管理系统及方法
CN108874518A (zh) * 2018-05-21 2018-11-23 福建省数字福建云计算运营有限公司 一种任务调度方法及终端
CN109828833A (zh) * 2018-11-02 2019-05-31 上海帆一尚行科技有限公司 一种神经网络训练任务的排队系统及其方法
CN109858655A (zh) * 2019-02-14 2019-06-07 重庆西部汽车试验场管理有限公司 预约测试的方法及系统
CN110022337A (zh) * 2018-01-09 2019-07-16 阿里巴巴集团控股有限公司 资源调度方法、装置、设备和系统
US11010193B2 (en) 2017-04-17 2021-05-18 Microsoft Technology Licensing, Llc Efficient queue management for cluster scheduling

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080168451A1 (en) * 2002-12-23 2008-07-10 International Business Machines Corporation Topology aware grid services scheduler architecture
CN101308468A (zh) * 2008-06-13 2008-11-19 南京邮电大学 网格计算环境下的作业跨域控制方法
CN101751298A (zh) * 2009-12-18 2010-06-23 武汉理工大学 一种基于能量和时间约束的移动网格任务调度方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080168451A1 (en) * 2002-12-23 2008-07-10 International Business Machines Corporation Topology aware grid services scheduler architecture
CN101308468A (zh) * 2008-06-13 2008-11-19 南京邮电大学 网格计算环境下的作业跨域控制方法
CN101751298A (zh) * 2009-12-18 2010-06-23 武汉理工大学 一种基于能量和时间约束的移动网格任务调度方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810046A (zh) * 2012-11-15 2014-05-21 百度在线网络技术(北京)有限公司 一种单机资源管理方法及系统
CN103207814B (zh) * 2012-12-27 2016-10-19 北京仿真中心 一种去中心化的跨集群资源管理与任务调度系统与调度方法
CN103207814A (zh) * 2012-12-27 2013-07-17 北京仿真中心 一种去中心化的跨集群资源管理与任务调度系统与调度方法
CN103425536A (zh) * 2013-08-26 2013-12-04 中国科学院软件研究所 一种面向分布式系统性能测试的测试资源管理方法
CN103425536B (zh) * 2013-08-26 2017-03-15 中国科学院软件研究所 一种面向分布式系统性能测试的测试资源管理方法
CN103473140A (zh) * 2013-10-09 2013-12-25 浪潮(北京)电子信息产业有限公司 一种生命科学应用的集群分配方法、软件安装方法及装置
CN103942102A (zh) * 2014-04-14 2014-07-23 桂林电子科技大学 基于双优先级的实时任务调度方法
WO2015180116A1 (zh) * 2014-05-30 2015-12-03 华为技术有限公司 一种分配承载资源的方法和装置
CN104239493A (zh) * 2014-09-09 2014-12-24 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN104239493B (zh) * 2014-09-09 2017-05-10 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN105045957A (zh) * 2015-06-18 2015-11-11 上海幻维数码创意科技有限公司 为多边形引擎提供几何实体数据服务的系统
CN105208530A (zh) * 2015-09-02 2015-12-30 哈尔滨海能达科技有限公司 一种组呼业务处理方法、终端及核心网网元
WO2017036373A1 (zh) * 2015-09-02 2017-03-09 哈尔滨海能达科技有限公司 一种组呼业务处理方法、终端及核心网网元
CN105208530B (zh) * 2015-09-02 2018-12-04 哈尔滨海能达科技有限公司 一种组呼业务处理方法、终端及核心网网元
CN106293950A (zh) * 2016-08-23 2017-01-04 成都卡莱博尔信息技术股份有限公司 一种面向集群系统的资源优化管理方法
CN106293950B (zh) * 2016-08-23 2019-08-13 成都卡莱博尔信息技术股份有限公司 一种面向集群系统的资源优化管理方法
CN106899521A (zh) * 2016-08-30 2017-06-27 阿里巴巴集团控股有限公司 互联网资源调度方法及装置、担保方法及装置
CN106899521B (zh) * 2016-08-30 2020-07-03 阿里巴巴集团控股有限公司 互联网资源调度方法及装置
CN106897128A (zh) * 2017-01-19 2017-06-27 网宿科技股份有限公司 一种分布式应用退出方法、系统以及服务器
CN106897128B (zh) * 2017-01-19 2021-06-22 网宿科技股份有限公司 一种分布式应用退出方法、系统以及服务器
CN107066332B (zh) * 2017-01-25 2020-03-13 广东神马搜索科技有限公司 分布式系统及其调度方法和调度装置
CN107066332A (zh) * 2017-01-25 2017-08-18 广东神马搜索科技有限公司 分布式系统及其调度方法和调度装置
US11010193B2 (en) 2017-04-17 2021-05-18 Microsoft Technology Licensing, Llc Efficient queue management for cluster scheduling
CN107707638A (zh) * 2017-06-01 2018-02-16 云智慧(北京)科技有限公司 一种分布式云压测机资源管理系统及方法
CN110022337A (zh) * 2018-01-09 2019-07-16 阿里巴巴集团控股有限公司 资源调度方法、装置、设备和系统
CN108874518A (zh) * 2018-05-21 2018-11-23 福建省数字福建云计算运营有限公司 一种任务调度方法及终端
CN109828833A (zh) * 2018-11-02 2019-05-31 上海帆一尚行科技有限公司 一种神经网络训练任务的排队系统及其方法
CN109828833B (zh) * 2018-11-02 2020-09-29 上海帆一尚行科技有限公司 一种神经网络训练任务的排队系统及其方法
CN109858655A (zh) * 2019-02-14 2019-06-07 重庆西部汽车试验场管理有限公司 预约测试的方法及系统
CN109858655B (zh) * 2019-02-14 2021-08-06 重庆西部汽车试验场管理有限公司 预约测试的方法及系统

Also Published As

Publication number Publication date
CN101958808B (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
CN101958808B (zh) 一种服务于多网格接入的集群任务调度管理器
CN102033777B (zh) 基于ice的分布式作业调度引擎
CN100517219C (zh) 多芯架构中的资源管理装置和方法以及多芯处理器
CN101458634B (zh) 负载均衡调度方法和装置
CN101290668B (zh) 一种分时作业动态调度方法和装置
CN110362390B (zh) 一种分布式数据集成作业调度方法及装置
CN104598426B (zh) 用于异构多核处理器系统的任务调度方法
US20150121391A1 (en) Method and device for scheduling multiprocessor of system on chip (soc)
CN101566977B (zh) 处理器访问共享数据的方法、装置及系统
CN104102548B (zh) 任务资源调度处理方法和系统
CN102063336A (zh) 一种分布式计算多应用功能异步并发调度方法
CN101324851A (zh) 线程调度方法及其装置
EP3114589B1 (en) System and method for massively parallel processing database
CN112698943A (zh) 资源分配方法、装置、计算机设备以及存储介质
CN103716397A (zh) 一种面向服务仿真时钟推进方法
CN111459622B (zh) 调度虚拟cpu的方法、装置、计算机设备和存储介质
CN114389955B (zh) 嵌入式平台异构资源池化管理方法
CN110471777B (zh) 一种Python-Web环境中多用户共享使用Spark集群的实现方法和系统
CN113515361B (zh) 一种面向服务的轻量级异构计算集群系统
Molesky et al. Implementing a predictable real-time multiprocessor kernel-the Spring kernel
CN111125070A (zh) 一种数据交换方法及平台
CN102184139A (zh) 一种硬件动态内存池管理方法和系统
CN110647393A (zh) 一种弹性进程管理系统及方法
WO2007110987A1 (ja) マルチプロセッサコンピュータおよびネットワークコンピューティングシステム
CN106844021B (zh) 计算环境资源管理系统及其管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20131018