CN1617126A - 一种计算机机群系统及其作业管理方法 - Google Patents
一种计算机机群系统及其作业管理方法 Download PDFInfo
- Publication number
- CN1617126A CN1617126A CN 200310103587 CN200310103587A CN1617126A CN 1617126 A CN1617126 A CN 1617126A CN 200310103587 CN200310103587 CN 200310103587 CN 200310103587 A CN200310103587 A CN 200310103587A CN 1617126 A CN1617126 A CN 1617126A
- Authority
- CN
- China
- Prior art keywords
- node
- pond
- group
- node pond
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
本发明公开了一种计算机机群系统,包括:一个以上的机群结点池和作业调度器;所述的机群结点池是计算机机群中的一部分计算机结点的集合,用来完成加载到结点池上的并行任务;所述的作业调度器用来处理用户提交的并行任务,根据并行任务的要求和作业强度将并行任务加载到不同的结点池。本发明不仅能够管理单一机群,而且能够很容易地扩展到多机群系统,实现统一管理各个机群系统的系统资源和作业,实现多机群系统中的资源和作业的统一调度;并且本发明利于实现多机群系统的单一系统映像,使多机群系统使用难度降低。
Description
技术领域
本发明涉及一种计算机机群系统及其作业管理方法,尤其是一种采用结点池方式的计算机机群系统及其作业管理方法;属于计算机机群技术领域。
背景技术
机群系统是一组相互独立的、通过高速网络互联的计算机,并以单一系统的模式加以管理,即充分利用机群中的每一台计算机的资源,实现复杂运算的并行处理。随着科学和网络的发展,人们对计算机运算速度和处理能力的要求的提高,机群中的结点规模越来越大,同时,越来越多的机构拥有多个计算机机群。如何利用以前的计算机机群,保护原有的投资,发挥旧有设备的计算能力,实现多个机群之间的作业管理和资源共享,形成一个统一管理,处理能力更加强大的计算环境,是一个非常现实的问题,同时也为机群系统以后如何支持网格系统有一定的借鉴意义。
机群系统除了能够提供强大的处理能力之外,它的另外一个重要的好处就是单一系统映像。也就是说,用户可以登录到机群中的登录结点,通过使用机群系统软件,如同使用一台机器那样方便。对于一个多机群系统来说,用户同样希望是一个具有单一系统映像的系统。另外,为了实现对批处理作业的支持,使系统具有自动调度批处理作业的功能,支持多机群的系统成为必要。
现有技术中有很多单一机群作业系统,但是这些机群作业系统并不能支持多机群,如果能有一种支持多机群的作业系统,实现机群系统具有的单一系统映像、作业的统一管理、资源的统一调度,对于提高多机群系统的利用率具有重要意义。
发明内容
本发明所要解决的技术问题在于:提出的一种可以适用于多机群的系统,不但能够支持一个大规模的机群,并且能够很好的对多个异构机群实现多机群系统的统一作业管理、资源共享和统一调度。
本发明所要解决的另一个技术问题在于:提出一种应用于上述机群系统的作业处理方法。
一种计算机机群系统,包括:一个以上的机群结点池和作业调度器;
所述的机群结点池是一部分计算机结点的集合,用来完成加载到结点池上的并行任务;
所述的作业调度器用来处理用户提交的并行任务,根据并行任务的要求将并行任务加载到不同的结点池。
如上所述的结点池既可以是一个机群的计算结点,也可以是不同的机群的结点。
一种计算机机群系统作业管理方法,包括如下步骤:
步骤一、根据各个结点池的资源信息,判断是否存在满足作业资源请求的结点池,如果存在满足资源需求的结点池,则执行步骤二;否则执行步骤三;
步骤二、如果满足资源需求的结点池只有一个,则选择该结点池运行并行任务,执行步骤四;
如果满足资源需求的结点池为一个以上,则根据各个机群的负载情况,选择负载较轻的结点池作为运行该作业的结点池,执行步骤四;
步骤三、如果单个结点池无法满足作业的资源需求,则根据各个机群中结点的负载情况依次选择作业需要的结点池资源,直到资源满足需求或者已经调度了全部的结点池资源运行该并行任务;或者直接加载该任务到全局结点池;
步骤四、将作业在选择的结点池中调度并加载运行。
如上所述的计算机机群系统作业管理方法,所述的步骤一之前,还包括:当一个作业提交时,如果指定了结点池,则将作业调度到该结点池对应的机群中运行;如果没有指定结点池,则执行步骤一。
本发明具有以下优点:
1、可以实现多机群系统的统一资源管理、统一作业管理和统一作业调度。本发明提出的这种机群作业管理系统实现方法,不仅能够管理单一机群,实现单个机群系统的资源管理、权限控制和作业调度,而且,能够很容易地扩展到多机群系统,统一管理各个机群系统的系统资源和作业,实现多机群系统中的资源和作业的统一调度。
2、可以实现多机群系统的单一系统映像。多个机群通过部署我们提出的机群作业管理系统,为用户提供了一个多机群系统的单一系统映像,极大地方便了系统的使用。
3、降低多机群系统使用的难度。采用我们提出的机群作业管理系统,不但解决了统一管理多个机群的问题,而且使用多机群如同使用单个机群一样,简化了用户的使用。熟悉了机群使用环境的用户可以方便地使用多机群系统。
附图说明
图1是本发明单一机群结点池系统的示意图;
图2是本发明多机群结点池系统的示意图;
图3是本发明作业管理的流程图。
具体实施方式
机群结构是一种松耦合结构,机群中的每个节点是一个独立的单元,节点的配置和操作系统可以按照用户的需求灵活配置,节点可以是PC机或者工作站,操作系统可以是任何一种商用的操作系统,各个节点之间彼此独立,同时又可以在机群软件的管理和配置下协同工作,对外界提供一个单一系统映像。
多机群系统是指有一个以上的机群组成的系统。通常,各个机群系统是异构的,有着不同的系统配置。
本发明的计算机机群系统,包括:一个以上的机群结点池和作业调度器;
所述的机群结点池是一部分计算机结点的集合,用来完成加载到结点池上的并行任务;
所述的作业调度器用来处理用户提交的并行任务,根据并行任务的要求将并行任务加载到不同的结点池。
在本发明的机群系统中,采用了分区的概念设置多个结点池,一个结点池,对应一个结点集(结点的集合),同时对应一个提交到这个结点池的作业集。通过作业调度器统一管理用户请求的并行任务(即作业),将并行任务按需求加载到不同的结点池上,实现对并行任务的处理。
用户可以在计算结点上直接提交作业或者通过网络(如internat的web页面)提交任务,或者机群系统包括专门用来与用户进行交互,提交作业,返回作业结果的登录结点,作业在登录结点上提交。这与现有的机群相同。
由于本发明所述的结点池既可以包括一个机群的部分计算结点,也可以包括不同的机群的计算结点,这种逻辑上的划分可以实现多机群组成的机群系统的统一资源管理、统一作业管理和统一作业调度。因此,本发明的机群系统,不仅能够实现单个机群系统的资源管理和作业调度,而且,能够很容易地扩展到多机群组成的机群系统,统一管理各个机群系统的系统资源和作业,实现多机群系统中的资源和作业的统一调度。
对于多个机群组成的机群系统,由于采用了统一的作业调度器进行并行任务的加载,所以可以方便的为用户提供了一个多机群系统的单一系统映像,极大地方便了系统的使用。
由于一个结点池中的作业只能在该结点池的结点集中运行。对于某些计算能力强的结点,可以使其在逻辑上处于两个或两个以上不同的结点池,即两个结点池上加载的并行任务都可以在该结点上运行;或者说,各个结点池的结点集之间可以有交集。这样可以充分的利用每个结点的计算能力,提高机群系统整体的计算能力。
对于机群系统来说,根据需要完成多个结点池划分,划分的原则可以是机群设计的任务量和针对的用户群来设定。对于多机群组成的机群系统,一般至少包括由每个机群的结点集组成的结点池。
机群系统中的每个结点池可以设置访问控制权限,达到控制机群系统资源的目的。一个结点池具有自身的权限控制,只允许特定的用户在特定的结点上提交作业到该结点池。这样做的目的在于保证某些特殊的用户的资源的可用性,使机群可以提供差别服务,所具有的可管理性更强。
对于机群系统来说,结点池还可以包括由一个以上的结点池组成的多池结点池,用来完成工作量较大的并行任务。多池结点池可以由作业调度器在并行任务分配时动态生成,也可以预先设定。多池结点池有自己的作业集和权限控制,
对于本发明的机群系统可以建立一个全局的结点池,全局结点池是包括全部结点池的特殊多池结点池,其结点集包括机群系统中的所有结点资源。
特别的,对于多机群组成的机群系统,当用户需要所有机群的资源联合计算时,可以将作业提交到这个全局结点池,作业调度器将从各个机群的结点资源中为作业选取结点进行计算;而当用户的作业并行度较小,可以在单个机群中完成时,就将作业提交到相应的机群系统的结点池,这样,作业调度器在该结点池的结点集中为该作业选取结点资源进行计算。通过以上实现,对于小作业,尽量安排在单个机群中计算,极可能的提高作业运行的效率。对于大作业,又可以利用多个机群的结点资源进行计算,满足大作业的需要。
如图1所示是单一机群组成的机群系统的一个示例,在一个具有y*n的机群中,将其划分为三个结点池,其中包括一个全局结点池p0,两个互不相交的结点池p1和p2。同时,为每个机群结点池设置访问控制列表,例如p1只允许A组用户使用,p2只允许B组用户使用,p0允许C组用户使用。这样,对于A组用户来说,他们的作业只能被调度运行在结点池p1管理的结点集中,对于B组用户,他们的作业只能被调度运行在结点池p2管理的结点集中。而对于C组用户,他们的作业可能被调度运行在所有结点。这样通过类似的结点池划分方法以及相应的访问权限设置,可以达到灵活控制计算资源的目的。
如图2所示是多机群组成的机群系统的一个示例,该机群系统中共有N个机群,各个机群的结点数目分别为x*n,y*j,...,z*v;将各个机群的结点集划分为各个结点池,从P1到PN。同时创建一个全局的结点池,P0。通过设置结点池的访问权限,可以从中控制允许访问各个机群的用户集。
本发明所述的机群系统作业管理方法,如图3所示,包括如下步骤:
步骤一、根据各个结点池的资源信息,判断是否存在满足作业资源请求的结点池,如果存在满足资源需求的结点池,则执行步骤二;否则执行步骤三;
步骤二、如果满足资源需求的结点池只有一个,则选择该结点池运行并行任务,执行步骤四;
如果满足资源需求的结点池为一个以上,则根据各个机群的负载情况,选择负载较轻的结点池作为运行该作业的结点池,执行步骤四;
步骤三、如果单个结点池无法满足作业的资源需求,则根据各个机群中结点的负载情况依次选择作业需要的结点池资源,直到资源满足需求或者已经调度了全部的结点池资源运行该并行任务;或者直接加载该任务到全局结点池;
步骤四、将作业在选择的结点池中调度并加载运行。
所述的步骤一之前还包括:当一个作业提交时,如果指定了结点池,则将作业调度到该结点池对应的结点集中运行(在结点池的权限设置允许该用户访问的前提下)。如果没有指定结点池,则执行步骤一。
作业调度器首先要判断作业指定的结点池是否允许提交作业的用户使用,一般还要判断用户进行提交的结点是否符合设定的要求,如果满足了该结点池的权限设置,则作业调度器将作业调度到该结点池对应的结点集中运行。
所述的步骤一中,作业调度器采用如下步骤来判断结点池或结点池的组合的资源是否满足并行任务的需求:
首先,对每一个结点池,得到其中的结点等资源信息;
其次,对作业所请求的每一项资源,判断结点池拥有的该项资源的数目是否大于或等于作业请求的该资源数;如果是,则该结点池可以满足此项资源请求;否则,该结点池无法满足此项作业的资源需求;如果存在结点池,对所有作业请求的资源都能满足,则该结点池为满足此项作业资源需求的结点池。
作业调度器管理整个的并行任务加载,可以根据任务的加载情况来对每个结点池的负载作出判断,所以步骤二中,作业调度器可以选择结点池从负载较轻的结点池完成加载的并行任务,这样有利于负载均衡,可以提高机群的整体效率;之所以选择负载较轻而不是一定选择负载最轻的结点池来运行作业,是因为一方面要考虑结点池的负载,另一方面要考虑负载均衡算法的简单,比如可以采用阈值的方法,如果一个结点池的负载达到或超过阈值,就不在向其加载新的并行任务。
如果单个结点池无法满足作业的资源需求,根据各个机群中结点的负载情况依次选择不同的结点池的组合来满足作业所需的资源,也就是动态生成多池结点池的方式来满足作业的资源需求;或者,也可以直接就调用全局结点来处理该并行任务,如图3所示,这样的方法更为简单。结点池负载的判断方式与步骤一中相同;资源是否满足作业的需求的判断也与步骤一中的判断方式相同。
所述的步骤四中,结点池的并行任务的加载,与现有的单一机群作业系统加载并行任务的方式相同,都是在确定的结点集合中,按结点选择策略选取作业运行结点(即作业调度),然后加载作业到选择的结点运行,这里不在赘述,可以参考[1]Rajkumar Buyya,郑纬民等译,高性能机群计算:结构与系统(第一卷)(电子工业出版社,2001年6月);[2]黄铠,徐志伟,可扩展并行计算技术、结构与编程(机械工业出版社,2000年5月)等有关的文献。
最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1、一种计算机机群系统,其特征在于:包括:一个以上的机群结点池和作业调度器;
所述的机群结点池是一部分计算结点的集合,用来完成加载到结点池上的并行任务;
所述的作业调度器用来处理用户提交的并行任务,根据并行任务的要求将并行任务加载到不同的结点池。
2、根据权利要求1所述的计算机机群系统,其特征在于:用户的并行任务可以在计算结点提交或通过网络提交;或者还包括登录结点,用户的并行任务通过登录结点提交。
3、根据权利要求1所述的计算机机群系统,其特征在于:所述的结点池既可以只包括一个机群的计算结点,也可以包括不同的机群的计算结点。
4、根据权利要求1或2或3所述的计算机机群系统,其特征在于:所述的任何一个计算结点可以属于两个或两个以上不同的结点池。
5、根据权利要求1或2或3所述的计算机机群系统,其特征在于:所述的结点池具有自身的权限控制。
6、根据权利要求1或2或3所述的计算机机群系统,其特征在于:所述的结点池还可以包括由一个以上的结点池组成的多池结点池。
7、根据权利要求6所述的计算机机群系统,其特征在于:所述的结点池包括一个全局的结点池,其结点集可以包括多个机群系统中的所有结点资源。
8、一种计算机机群系统作业管理方法,其特征在于:包括如下步骤:
步骤一、根据各个结点池的资源信息,判断是否存在满足作业资源请求的结点池,如果存在满足资源需求的结点池,则执行步骤二;否则执行步骤三;
步骤二、如果满足资源需求的结点池只有一个,则选择该结点池运行并行任务,执行步骤四;
如果满足资源需求的结点池为一个以上,则根据各个机群的负载情况,选择负载较轻的结点池作为运行该作业的结点池,执行步骤四;
步骤三、如果单个结点池无法满足作业的资源需求,则根据各个机群中结点的负载情况依次选择作业需要的结点池资源,直到资源满足需求或者已经调度了全部的结点池资源运行该并行任务;或者直接加载该任务到全局结点池;
步骤四、将作业在选择的结点池中调度并加载运行。
9、根据权利要求7所述的计算机机群系统作业管理方法,其特征在于:所述的步骤一之前,还包括:当一个作业提交时,如果指定了结点池,则将作业调度到该结点池对应的机群中运行;如果没有指定结点池,则执行步骤一。
10、根据权利要求7或8所述的计算机机群系统作业管理方法,其特征在于:所述的步骤一中,作业调度器采用如下的步骤来判断结点池资源是否满足并行任务的需求:
步骤21、对每一个结点池,得到其中的结点资源信息;
步骤22、对作业所请求的每一项资源,判断结点池拥有的该项资源的数目是否大于或等于作业请求的该资源数;如果是,则该结点池可以满足此项资源请求;否则,该结点池无法满足此项作业的资源需求;
步骤23、如果存在结点池,对所有作业请求的资源都能满足,则该结点池为满足此项作业资源需求的结点池。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2003101035870A CN1302412C (zh) | 2003-11-11 | 2003-11-11 | 一种计算机机群系统及其作业管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2003101035870A CN1302412C (zh) | 2003-11-11 | 2003-11-11 | 一种计算机机群系统及其作业管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1617126A true CN1617126A (zh) | 2005-05-18 |
CN1302412C CN1302412C (zh) | 2007-02-28 |
Family
ID=34756736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003101035870A Expired - Fee Related CN1302412C (zh) | 2003-11-11 | 2003-11-11 | 一种计算机机群系统及其作业管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1302412C (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100458705C (zh) * | 2005-12-15 | 2009-02-04 | 国际商业机器公司 | 使用动态确定的前端作业群调度计算机作业的方法和系统 |
CN102118297A (zh) * | 2009-12-31 | 2011-07-06 | 联想(北京)有限公司 | 一种计算机机群作业调度方法和系统 |
CN102591921A (zh) * | 2010-12-20 | 2012-07-18 | 微软公司 | 个人数据中心内的调度和管理 |
CN101604264B (zh) * | 2009-07-08 | 2012-07-25 | 深圳先进技术研究院 | 超级计算机的任务调度方法及系统 |
CN103067296A (zh) * | 2013-01-18 | 2013-04-24 | 浪潮电子信息产业股份有限公司 | 一种实现hpc集群登录节点负载均衡的方法 |
CN102118297B (zh) * | 2009-12-31 | 2016-12-14 | 联想(北京)有限公司 | 一种计算机机群作业调度方法和系统 |
CN111866188A (zh) * | 2020-04-30 | 2020-10-30 | 中科院计算所西部高等技术研究院 | 具有ooda分形机制的计算机群构建方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020198996A1 (en) * | 2000-03-16 | 2002-12-26 | Padmanabhan Sreenivasan | Flexible failover policies in high availability computing systems |
US20020049859A1 (en) * | 2000-08-25 | 2002-04-25 | William Bruckert | Clustered computer system and a method of forming and controlling the clustered computer system |
NZ518575A (en) * | 2002-04-24 | 2004-08-27 | Open Cloud Ltd | Distributed application server using a peer configuration |
-
2003
- 2003-11-11 CN CNB2003101035870A patent/CN1302412C/zh not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100458705C (zh) * | 2005-12-15 | 2009-02-04 | 国际商业机器公司 | 使用动态确定的前端作业群调度计算机作业的方法和系统 |
CN101604264B (zh) * | 2009-07-08 | 2012-07-25 | 深圳先进技术研究院 | 超级计算机的任务调度方法及系统 |
CN102118297A (zh) * | 2009-12-31 | 2011-07-06 | 联想(北京)有限公司 | 一种计算机机群作业调度方法和系统 |
CN102118297B (zh) * | 2009-12-31 | 2016-12-14 | 联想(北京)有限公司 | 一种计算机机群作业调度方法和系统 |
CN102591921A (zh) * | 2010-12-20 | 2012-07-18 | 微软公司 | 个人数据中心内的调度和管理 |
US9268613B2 (en) | 2010-12-20 | 2016-02-23 | Microsoft Technology Licensing, Llc | Scheduling and management in a personal datacenter |
CN103067296A (zh) * | 2013-01-18 | 2013-04-24 | 浪潮电子信息产业股份有限公司 | 一种实现hpc集群登录节点负载均衡的方法 |
CN103067296B (zh) * | 2013-01-18 | 2017-05-10 | 浪潮电子信息产业股份有限公司 | 一种实现高性能计算集群登录节点负载均衡的方法 |
CN111866188A (zh) * | 2020-04-30 | 2020-10-30 | 中科院计算所西部高等技术研究院 | 具有ooda分形机制的计算机群构建方法 |
CN111866188B (zh) * | 2020-04-30 | 2022-05-17 | 中科院计算所西部高等技术研究院 | 具有ooda分形机制的计算机群构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1302412C (zh) | 2007-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1306754C (zh) | 平衡网格计算环境中的工作负荷的方法和系统 | |
CN100511151C (zh) | 多路多核服务器及其cpu的虚拟化处理方法 | |
US6732139B1 (en) | Method to distribute programs using remote java objects | |
CN104331321B (zh) | 基于禁忌搜索和负载均衡的云计算任务调度方法 | |
CN100347675C (zh) | 应用服务器的性能优化方法 | |
Wang et al. | A three-phases scheduling in a hierarchical cloud computing network | |
CN106095569B (zh) | 一种基于sla的云工作流引擎资源调度与控制方法 | |
CN1604042A (zh) | 用于调度作业的方法、调度器以及网络计算机系统 | |
CN1866217A (zh) | 确定源服务器在目标服务器中的最佳分布的系统和方法 | |
CN1636191A (zh) | 响应分区工作负荷动态再分区计算机系统的装置和方法 | |
CN101986274A (zh) | 一种私有云环境下资源调配系统及资源调配方法 | |
CN1818875A (zh) | 嵌入式操作系统分组硬实时任务调度的实现方法 | |
CN1845075A (zh) | 面向服务的网格高性能计算作业调度方法 | |
WO2014139470A1 (zh) | 一种内存超分配管理系统及方法 | |
CN101034362A (zh) | 运用移动代理实现网格作业调度的方法 | |
CN100351792C (zh) | 一种实时任务管理与调度方法 | |
CN1302412C (zh) | 一种计算机机群系统及其作业管理方法 | |
CN1946225A (zh) | 一种全分布式资源管理方法和系统 | |
CN1315046C (zh) | 一种机群作业管理系统中分配计算结点的方法 | |
CN103268261A (zh) | 一种适用于大规模高效能计算机的层次式计算资源管理方法 | |
CN116755888A (zh) | 一种面向高性能计算云平台的作业调度装置及方法 | |
CN1790275A (zh) | 服务网格调度器及调度作业的方法 | |
CN111506407A (zh) | Pull模式与Push模式相结合的资源管理与作业调度方法、系统及介质 | |
CN1671135A (zh) | 一种面向网格的机群作业管理系统及其实现方法 | |
CN1791025A (zh) | 服务网格系统及处理作业的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070228 Termination date: 20201111 |
|
CF01 | Termination of patent right due to non-payment of annual fee |