CN1547128A - 一种机群系统资源管理的分区租借方法 - Google Patents

一种机群系统资源管理的分区租借方法 Download PDF

Info

Publication number
CN1547128A
CN1547128A CNA2003101194097A CN200310119409A CN1547128A CN 1547128 A CN1547128 A CN 1547128A CN A2003101194097 A CNA2003101194097 A CN A2003101194097A CN 200310119409 A CN200310119409 A CN 200310119409A CN 1547128 A CN1547128 A CN 1547128A
Authority
CN
China
Prior art keywords
resource
subregion
partition
lease
leasing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003101194097A
Other languages
English (en)
Other versions
CN1296850C (zh
Inventor
涂碧波
邹铭
孟丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xinrui Medical Technology Co ltd
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB2003101194097A priority Critical patent/CN1296850C/zh
Publication of CN1547128A publication Critical patent/CN1547128A/zh
Application granted granted Critical
Publication of CN1296850C publication Critical patent/CN1296850C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

本发明涉及计算机系统技术领域,管理机群系统节点资源的有效方法就是分区租借。将机群节点分属于若干个不同的分区,采用各自的策略独自管理。当一个分区资源不够用时,可在一定规则下实现分区合作,即租借其它分区节点资源。这就是一种机群系统资源管理的分区租借方法。实施此方法的具体步骤为:a)建立名为pools的分区信息文件;b)依据pools文件启动和初始化分区资源管理器;c)依据pools文件启动和初始化租借公告牌。

Description

一种机群系统资源管理的分区租借方法
技术领域
本发明涉及计算机系统技术领域,特别是一种机群系统资源管理的分区租借方法。
技术背景
机群是由众多pc机或workstation(工作站)通过高速网络连接起来构成的计算机系统。构成机群的pc机或workstation被称为节点。机群中每个节点都是一台可独立使用的计算机,拥有着各自的硬、软件资源。如何充分合理地利用机群的各种资源,是机群系统应用和管理的重要问题之一。要充分合理地利用机群资源,就需要有效地管理机群中的节点资源。然而,由于机群中节点的分散性、独立性、节点资源的多样性以及节点资源在使用过程中的动态性,给机群资源管理带来了很大的困难。另外,随着机群规模的不断增大,集中管理机群系统资源极大地影响了机群系统的可扩展性;再者,用户对机群资源需求的多样化,也需要灵活地管理机群节点资源。
一般的节点资源管理方法如附图1所示,所有的节点都周期性地向机群资源管理器汇报资源,由机群资源管理器集中管理。这种方法简单、易实现,但不能很好地适应上述机群资源管理的要求。
发明内容
本发明目的在于提供一种机群系统资源管理的分区租借方法。
采用分区管理,将机群节点分属于若干个不同的分区,采用各自的资源管理策略独自管理,并在租借公告牌的帮助下,实现分区间资源的租借使用(如附图2所示)。
机群节点的分区信息由一个系统配置文件决定。
系统管理员可通过修改配置文件来动态管理分区信息。
每个分区只有一个分区资源管理器,相互独立管理,分区中节点不重叠。
系统中只有一个租借公告牌,租借信息、租借公告牌的初始化信息由配置文件提供。
租借公告牌记录着租借节点的动态资源信息,租借节点时需先查询租借公告牌,根据查询结果向相应的分区资源管理器申请租借。
附图说明
图1是机群资源管理的一般方法结构图。
图2是本发明使用分区租借方法实现的机群系统资源管理的结构图。
图3是本发明的分区资源管理器的工作流程图。
这三个附图可以更好地说明本发明的思想、实现和优点:
图1中,显示了一种集中式的机群资源管理方法,即所有的节点由一个机群资源管理器集中管理。其中,1是机群资源管理器,2是节点。
图2是机群资源管理的分区租借方法结构图;图2中,所有的机群节点分成若干个分区,分区间在公告牌的帮助下相互协商请求租借节点资源。其中,3是租借公告牌,4表示一个分区,包括分区资源管理器和节点。5表示另一个分区,包括分区资源管理器和节点。此图可以很明确地说明本发明的意图。通过与图1的比较,可以体会本发明的优点。
图3是分区资源管理器的流程图。它直观地表达了资源请求和租借处理的主要流程。其步骤如下:
a)分区资源管理器等待接受资源请求。如请求到来,判断其是本分区请求,还是租借请求?如为租借请求,转步骤g,
b)判断请求是否满足权限要求?如不满足,转步骤j,
c)判断分区是否满足请求的资源要求?如不满足,转步骤e,
d)给请求分配资源,转步骤a,
e)询问租借公告牌是否有可行的租借资源?如果没有,转步骤j,
f)向其它由租借公告牌指定的分区请求资源租借,转步骤a,
g)判断租借请求是否满足本分区用户权限?如不满足,转步骤j,
h)判断本分区可租借资源是否满足租借请求的资源要求?如不满足,转步骤j,
i)给租借请求分配资源,转步骤a,
j)拒绝请求,转步骤a。
具体实施方法
A)分区管理
分区管理是组织、管理机群的一种有效方式。采用分区,使分区相互独立,可以有效组织资源,是增强机群系统规模可扩展性的基础(见附图2),也为灵活管理机群、使用机群提供了便利。
在机群系统中有一个关于节点分区的配置文件,名为pools(将每个分区称为一个节点池pool)。根据这个文件,机群系统组织分区、部署各个分区里的分区资源管理器和租借公告牌,并依据pools文件内容初始化它们的信息。通过手工修改这个文件或通过命令方式修改机群分区信息,可以灵活的组织分区,达到机群资源管理的灵活性;可以为分区增加各种属性以及权限,实现机群应用和管理的多样化。pools文件格式如下,关键字与内容以冒号隔离。
●Name:pool的名字,它必须是仅由大写字母(A-Z)、小写字母(a-z)、数字(0-9)以及下划线(_)构成的字符串,其最大长度不超过常量MAXPOOlNAMELEN(最大分区名长度)。
●Size:pool的大小,即pool所含的节点数。注意:size大小必须与nodelist中节点个数相符。
●Nodelist:pool的节点集,给出所有属于该pool的节点的节点名,以“,”分隔。注意:同一个节点只能出现在一个分区中。
●Leaselist:可出借资源的节点列表。注意:出借节点集必须是nodelist的子集。
●RMD_name:本pool内资源管理器所在节点的主机名
●RMD_port:分区管理器监听的端口号
●Property:pool的属性,用户自己定义,为任意字符串
●Users:给出有权限使用该pool的用户/组,或者没有权限使用该pool的用户/组。
有权限的用户/组以如下形式描述:
+|username|@groupname|{,username|,@groupname}
没有权限的用户/组以如下形式描述:
-|-username|-@groupname|{,-username|,-@groupname}
其中:
|:表示“或者”
{...}:表示括号内的内容“重复0次或多次”
+:(一个加号)表示所有的用户都有权限
-:(一个减号)表示所有的用户都没有权限
username:表示某个用户的登录名
groupname:表示某个组的组名。
根据pools文件中分区资源管理器所在的节点名和监听的端口号远程部署分区;根据每个分区所管理的节点列表收集管理每个分区内所有节点的资源信息;根据每个分区的属性和使用权限对每个分区进行管理。根据pools文件启动和初始化租借公告牌,租借公告牌从leaselist域中获取租借节点信息。由此,一种机群系统资源管理的分区租借方法,其具体实施步骤如下:
a)建立名为pools的分区信息文件;
b)依据pools文件启动和初始化分区资源管理器;
c)依据pools文件启动和初始化租借公告牌。
在本方法中,将负责分区中资源管理、权限管理以及可租界资源管理的程序称为分区资源管理器,它以后台服务进程的形态存在于系统中。它启动时依赖于pools文件,启动后,它的工作流程详见附图3以及附图3的说明。
B)租借
节点分区独立后,可能有些应用需要跨区使用资源,这时需要租借其它分区资源。一个节点分区就是一个节点池(pool)。闲置池可以出借资源,资源短缺池可以租借资源。在本方法中,管理各个分区租借信息的程序是租借公告牌,它以一个后台服务进程的形态存在于系统中,它管理这各个分区可以出借资源的节点信息,初始化时从pools配置文件中获取最初信息,并在运行过程中动态动态刷新租借资源信息。
资源之间的租借在租借公告牌的帮助下由各自的分区资源管理器协商决定。当某个分区需要租借资源时,先向租借公告牌查询可出借资源的节点,然后向相应的分区资源管理器申请租借资源。当申请者满足资源租借权限(用户权限、足够的可出借资源)时,分区资源管理器出借资源(见附图3)。
当租借资源的应用完成时,自动释放资源。当出借资源的分区负载过重时,系统管理员可以查看本分区资源出借情况,通过停止应用运行或应用迁移的方法来回收资源。
本发明的一个优点是分区的方法能有效地管理资源,适应异构机群资源的多样性。可以使同构节点划在一个分区里进行管理,使机群资源管理条理化、清晰化。
本发明的另一个优点是每个分区可以实现各自不同的管理策略,适应用户使用的多样性和灵活性。还要,每个分区有不同的权限控制,更方便于用户的使用和管理。
本发明的又一个优点是分区租借资源的方法巧妙地解决了跨区使用资源的问题,使得节点分区后也有办法使节点资源联合成一个整体来使用。

Claims (8)

1、一种机群系统资源管理的分区租借方法,其特征在于,采用分区管理,将机群节点分属于若干个不同的分区,采用各自的资源管理策略独自管理,并在租借公告牌的帮助下,实现分区间资源的租借使用。
2、如权利要求1所述的一种机群系统资源管理的分区租借方法,其特征在于,机群节点的分区信息由一个系统配置文件决定。
3、如权利要求1或2所述的一种机群系统资源管理的分区租借方法,其特征在于,系统管理员可通过修改配置文件来动态管理分区信息。
4、如权利要求1所述的一种机群系统资源管理的分区租借方法,其特征在于,每个分区只有一个分区资源管理器,相互独立管理,分区中节点不重叠。
5、如权利要求1所述的一种机群系统资源管理的分区租借方法,其特征在于,系统中只有一个租借公告牌,租借信息、租借公告牌的初始化信息由配置文件提供。
6、如权利要求1所述的一种机群系统资源管理的分区租借方法,其特征在于,租借公告牌记录着租借节点的动态资源信息,租借节点时需先查询租借公告牌,根据查询结果向相应的分区资源管理器申请租借。
7、如权利要求1所述的一种机群系统资源管理的分区租借方法,其具体实施步骤如下:
a)建立名为pools的分区信息文件;
b)依据pools文件启动和初始化分区资源管理器;
c)依据pools文件启动和初始化租借公告牌。
8、如权利要求1所述的一种机群系统资源管理的分区租借方法,其特征在于,系统中存在一个租借公告牌和多个分区资源管理器,其工作步骤如下:
a)分区资源管理器等待接受资源请求。如请求到来,判断其是本分区请求,还是租借请求?如为租借请求,转步骤g,
b)判断请求是否满足权限要求?如不满足,转步骤j,
c)判断分区是否满足请求的资源要求?如不满足,转步骤e,
d)给请求分配资源,转步骤a,
e)询问租借公告牌是否有可行的租借资源?如果没有,转步骤j,
f)向其它由租借公告牌指定的分区请求资源租借,转步骤a,
g)判断租借请求是否满足本分区用户权限?如不满足,转步骤j,
h)判断本分区可租借资源是否满足租借请求的资源要求?如不满足,转步骤j,
i)给租借请求分配资源,转步骤a,
j)拒绝请求,转步骤a。
CNB2003101194097A 2003-12-10 2003-12-10 一种机群系统资源管理的分区租借方法 Expired - Fee Related CN1296850C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2003101194097A CN1296850C (zh) 2003-12-10 2003-12-10 一种机群系统资源管理的分区租借方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2003101194097A CN1296850C (zh) 2003-12-10 2003-12-10 一种机群系统资源管理的分区租借方法

Publications (2)

Publication Number Publication Date
CN1547128A true CN1547128A (zh) 2004-11-17
CN1296850C CN1296850C (zh) 2007-01-24

Family

ID=34338240

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003101194097A Expired - Fee Related CN1296850C (zh) 2003-12-10 2003-12-10 一种机群系统资源管理的分区租借方法

Country Status (1)

Country Link
CN (1) CN1296850C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100451970C (zh) * 2005-09-27 2009-01-14 浪潮电子信息产业股份有限公司 一种实现基于机群结构的高性能服务器动态部署方法
CN103516763A (zh) * 2012-06-30 2014-01-15 华为技术有限公司 资源处理方法和系统以及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151688A (en) * 1997-02-21 2000-11-21 Novell, Inc. Resource management in a clustered computer system
GB2379769B (en) * 2000-03-09 2003-09-10 Dell Products Lp System and method for managing storage resources in a clustered computing environment
US6622163B1 (en) * 2000-03-09 2003-09-16 Dell Products L.P. System and method for managing storage resources in a clustered computing environment

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100451970C (zh) * 2005-09-27 2009-01-14 浪潮电子信息产业股份有限公司 一种实现基于机群结构的高性能服务器动态部署方法
CN103516763A (zh) * 2012-06-30 2014-01-15 华为技术有限公司 资源处理方法和系统以及装置
CN103516763B (zh) * 2012-06-30 2016-09-28 华为技术有限公司 资源处理方法和系统以及装置

Also Published As

Publication number Publication date
CN1296850C (zh) 2007-01-24

Similar Documents

Publication Publication Date Title
CN1108569C (zh) 具有无数据端点机的可伸缩和可扩充系统管理结构
CN1138207C (zh) 使用远程java对象分配程序的方法和装置
CN1294492C (zh) 动态调整活动资源的工作负荷的方法和系统
CN100489789C (zh) 响应分区工作负荷动态再分区计算机系统的装置和方法
CN1276340C (zh) 多窗口显示设备以及多窗口管理方法
CN1213567C (zh) 一种网络设备的集群管理方法
CN1787000A (zh) 批量作业集中管理和调度的系统及方法
CN1906585A (zh) 供应数据处理系统中识别、保留和逻辑供应资源的方法、系统和产品
CN1503942A (zh) 包含准备操作的群集计算机系统中的资源动作
CN1111800C (zh) 管理共享资源的装置和方法
CN1901568A (zh) 一种网管系统中实现历史性能采集的方法
CN1851696A (zh) 一种关联查询的系统及其方法
CN1510575A (zh) 一种数据库连接的高效管理方法
CN1629810A (zh) 管理分布式资源的管理系统和方法
CN1293493C (zh) 机群文件服务系统及其输入输出处理方法
CN1946225A (zh) 一种全分布式资源管理方法和系统
CN1296850C (zh) 一种机群系统资源管理的分区租借方法
CN1226028A (zh) 用于无线通信的基于组件的控制结构
CN1725707A (zh) 管理分布式网络设备的方法
CN101079903A (zh) 基于用户终端远程登录的方法及系统
CN1561072A (zh) 实现用户ip地址池共享的方法
CN101065732A (zh) 计算机系统和信息处理方法
CN101043529A (zh) 一种通用网关接口及利用通用网关接口获得数据的方法
CN1553332A (zh) 基于插件技术的设备集中管理方法
CN1859153A (zh) 通信系统中用户权限设置方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170630

Address after: 100190 room 10, floor 6, scientific research complex, No. 1044 South Road, Haidian District Academy of Sciences, Beijing

Patentee after: Beijing Kejiyin Technology Co.,Ltd.

Address before: 100080 No. 6 South Road, Zhongguancun Academy of Sciences, Beijing

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191224

Address after: 510663 room 208, block a, Kecheng building, 121 science Avenue, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou Xinrui Medical Technology Co.,Ltd.

Address before: 100190 1044, room 10, research complex, 6 South Road, Haidian District Science Academy, Beijing.

Patentee before: Beijing Kejiyin Technology Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070124