CN101271444A - 多部件自组织软连接集群计算机智能资源管理方法 - Google Patents

多部件自组织软连接集群计算机智能资源管理方法 Download PDF

Info

Publication number
CN101271444A
CN101271444A CNA2008100277589A CN200810027758A CN101271444A CN 101271444 A CN101271444 A CN 101271444A CN A2008100277589 A CNA2008100277589 A CN A2008100277589A CN 200810027758 A CN200810027758 A CN 200810027758A CN 101271444 A CN101271444 A CN 101271444A
Authority
CN
China
Prior art keywords
parts
resource
user
storage space
cluster computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100277589A
Other languages
English (en)
Other versions
CN101271444B (zh
Inventor
刘桂开
韦岗
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN2008100277589A priority Critical patent/CN101271444B/zh
Publication of CN101271444A publication Critical patent/CN101271444A/zh
Application granted granted Critical
Publication of CN101271444B publication Critical patent/CN101271444B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种多部件自组织软连接集群计算机智能资源管理方法,该方法根据用户对资源的需求动态提供部件资源,即随着用户数量的增加逐步增加部件资源,而随着用户数量的减少逐步减少部件资源,实现部件的自动开启和自动关闭;通过监控部件资源的使用情况,实现部件群中部件资源的动态调度,同时实施部件的故障管理和安全管理,监测和维护部件资源的可靠运行。本发明还对系统存储资源进行划分处理,满足不同用户数据的临时与永久存储要求。本发明能提高集群计算机的部件资源利用率、优化资源配置,从而进一步降低投资成本和运行维护管理成本,并提高系统的可靠性。

Description

多部件自组织软连接集群计算机智能资源管理方法
技术领域
本发明属于网络系统资源管理领域,特别涉及一种多部件自组织软连接集群计算机的智能资源管理方法。
背景技术
随着社会和科学技术的发展,计算机已日益成为人们工作、学习、生活、交流、娱乐等方面不可缺少的工具,尤其是在办公室、实验室、电化教学教室、图书馆等场所得到了广泛的应用。但是现阶段计算机都是一个相对独立的设备,是由主机、显示器、键盘、鼠标等硬件设备构成的一个整体,用户的使用也是独占一台主机资源及其外设。在这种情况下,如果某一关键的硬件设备出现故障,则即使其它硬件设备仍可使用,整台计算机也将无法正常工作,会造成用户因无法使用计算机而给工作、生活带来影响。为了解决单机的运算及I/O能力的不足,提高系统的可靠性,获得规模可扩展能力,降低整体方案的运维成本(运行、升级、维护成本),自七十年代开始计算机厂商和研究机构就开始了对集群计算机系统的研究和开发。集群计算机系统在处理能力、可靠性、I/O能力等方面都得到了大幅的提升,但由于传统集群计算机系统的基本单元(节点)仍然是单独的计算机,每个节点计算机中的各种硬件设备又是固定连接的(看作是一种“硬连接”)。所以存在资源浪费、效率不高的问题。
针对计算机目前的使用状况,专利文献(申请号:200810026062.4,发明名称:多部件自组织软连接集群计算机及其自组织方法)分析了造成计算机资源浪费、效率不高的主要原因,并充分利用目前的超宽带(UWB)无线传输技术能在3.1GHz到10.6GHz频率之间提供最高达到480Mbps数据传输速率,提出了一种多部件自组织软连接集群计算机及其自组织方法,该集群计算机不像传统的集群计算机那样以单台计算机为基本单元,而是以计算机的部件(由计算机硬件中的一种或多种构成)为基本单元,相同类型的计算机部件构成部件群。部件群中的部件按照计算机的构成方式,通过一个或多个连接器(包括有线数据交换器或无线收发器)自组织地与对应部件群中的部件建立连接并进行数据传输,该集群计算机结构如图1所示。用户使用时,各个部件群中的部件根据需求自组织地组合(看作是一种“软连接”)成一个计算机系统为用户服务,具有资源高度共享、可靠性高、便于维护等突出的优点,可以广泛适用于生产、服务、教学、娱乐等多种场合。一个典型的实施例是集群计算机系统由终端部件群、主机部件群和外存部件群三个部分组成。其中,终端部件群由多套计算机终端构成,为系统提供用户使用的界面和接口,每套终端可以看作系统的一个终端部件;主机部件群由多台计算机主机构成,为系统的运算和处理中心,每个计算机主机可以看作是系统的一个运算处理部件;外存部件群由多个外部存储器构成,为系统提供海量存储空间,每个外部存储器可以看作系统的一个外存部件。这样,一套终端部件、主机部件和外存部件顺次连接,即可以构成一台功能完整的计算机。
利用上述专利文献所提供的多部件自组织软连接集群计算机,可以降低成本、提高可靠性和简化运行维护,在资源管理方面,上述文献中所提供的自组织“组合”方法中采用了用户分级管理和权重分配。但从集群计算机整体运行效率来看,对多部件自组织软连接集群计算机的资源管理还存在如下不足:(1)部件群中的每个部件不能总处于开启状态,这样会造成部件资源的闲置和浪费,需要对部件群中的部件资源进行调度,根据用户对资源的需求动态提供部件资源,即随着用户数量的增加逐步增加部件资源,而随着用户数量的减少逐步减少部件资源,实现部件的自动开启和自动关闭;(2)对用户分级、按权重分配资源仍然是静态的分配方式,即分配给用户的资源是固定不变的,为了达到部件资源的高度共享,需要根据用户实际使用资源的多少来平衡用户之间的资源占用,实现对用户之间资源的动态调度;(3)用户数据的存储只是临时性的,用户退出系统后,由于下次登陆系统时不一定是同一个存储部件提供服务,况且临时分配的存储空间也将被释放,所以用户所存储的数据不能长期保存。但有的用户有长期保存数据的需求,因此存储资源的使用既要实现临时存储,也要解决永久存储的问题;(4)必须实施部件的故障管理和安全管理,保证部件资源的可靠性,从而保障系统的安全可靠运行。上述不足不仅会造成资源的闲置和降低资源的利用率,也会影响用户数据的保存和服务的可靠性,因此,为多部件自组织软连接集群计算机提供一种全面智能的资源管理方法,将会优化集群计算机的资源配置,进一步降低成本和提供高可靠性的服务,使多部件自组织软连接集群计算机更具实际应用价值和市场竞争力。
发明内容
本发明的目的在于克服上述现有技术的不足,为多部件自组织软连接集群计算机提供一种智能资源管理方法,提高集群计算机的部件资源利用率、优化资源配置,从而进一步降低投资成本和运行维护管理成本,并提高系统的可靠性。
本发明所提供的一种多部件自组织软连接集群计算机的智能资源管理方法,实现部件群中部件资源的动态调度,根据用户对资源的需求动态提供部件资源,即随着用户数量的增加逐步增加部件资源,而随着用户数量的减少逐步减少部件资源,实现部件的自动开启和自动关闭。
本发明的多部件自组织软连接集群计算机智能资源管理方法通过如下技术方案实现:
要实现部件的自动开启,需要在部件群中设置一个“监控器”,没有部件开启时,“监控器”处于激活状态,用于监控“组合”命令中对部件资源的需求情况,当对本部件群有需求时,选择一个部件开启。部件开启成功后,“监控器”进入非激活状态,以后的部件开启由集群计算机控制。“监控器”可以是一个独立的设备,也可以集成到某一个部件中,它实现的功能是接收到“组合”命令后触发一个部件开启。
部件的自动开启可以采用如下具体步骤实现:
(1)“监控器”处于激活状态;
(2)“监控器”监测到“组合”命令中对本部件群有资源需求;
(3)“监控器”触发一个部件开启。
(4)如果被选择的部件在时间T(T>0)内无法开启,则重复步骤(3),选择触发另一个部件开启;
(5)开启的部件为集群计算机系统提供服务;
(6)有部件成功开启后,“监控器”进入非激活状态;
(7)集群计算机系统监控部件资源使用情况;
(8)如果部件群提供的资源已不能满足系统的需求时,将增加一个部件开启;
(9)直到部件群的资源能够满足集群计算机系统的需求。
部件的自动关闭是由部件群监控系统的资源使用情况,当系统资源需求减少到一定程度时,关闭一些部件以节约资源。
部件的自动关闭可以采用如下具体步骤实现:
(1)集群计算机监控部件资源使用情况;
(2)当集群计算机检测到由m(1<m≤M,M为部件的总个数)个部件所提供给系统的资源可以由m-1个部件来保证,转入下一步;
(3)集群计算机从m个部件中选择一个;
(4)将由该个部件提供服务的其它部件群的部件切换到由其余m-1个部件提供;
(5)所选择的部件空闲后自动关闭;
(6)重复步骤(1)-(5);
(7)直至最后一个部件关闭;
(8)将“监控器”置为激活状态。
所述的智能资源管理方法,对用户进行分级,为用户分配登录帐号、运算服务等级和存储服务等级,当用户登录到系统后,对分配给用户的资源进行动态调度,根据用户实际使用资源的多少来平衡用户之间的资源占用,将用户空闲资源调度出一部分作为预留资源,然后将预留资源分配给迫切需要资源的用户,实现部件资源的高度共享。
用户分级过程是用户向集群计算机系统管理者申请登录帐号、运算服务等级和存储服务等级;用户获得帐号、相应的服务等级和存储服务等级以后,即可登录系统;系统收到登录信息后,根据用户的等级为用户分配相应的部件资源,并开始为用户提供服务。
对用户资源进行动态调度是由系统监测每个用户使用部件资源的情况,然后予以动态调整。动态资源调度过程,采用如下具体步骤实现:
(1)系统监测用户使用部件资源的情况;
(2)如果在时间T(T>0)内某个用户使用部件资源的比例低于某个阀值L1(L1>0),系统将分配给该用户的资源调整出一部分作为预留资源;
(3)如果在时间T(T>0)内某个用户使用部件资源的比例高于某个阀值L2(L2>0),这时若有预留资源,则系统将部分预留资源分配给该用户,以满足该用户对资源需求;
(4)如果被调整出资源的用户资源需求增加,且增加后该用户使用的总资源不超出其被允许使用的最大资源的范围,即在其规定级别范围内,则系统首先从预留资源中调配资源给该用户,如果预留资源不够,系统将回收分配出去的部分预留资源以满足该用户的需求;
(5)系统保存着一个“动态资源调度列表”,内容包括各用户使用部件资源的比例、调整资源的情况、剩余预留资源情况和预留资源分配情况等。
所述的智能资源管理方法,解决用户使用存储类部件资源时的临时存储和永久存储问题。暂时存储是指用户只在使用集群计算机的过程中占用的存储类部件资源,当用户退出系统后即被释放,所存放的数据将丢失。永久存储是指用户需要长期保存数据时需要占用的存储类资源,用户退出系统后保存的数据仍然有效,存储类资源仍然被占用,用户可以进行重复访问。所述的方法将从存储类部件群中划分出一部分作为永久存储区,实现用户数据在系统中的长期保存。
要实现临时存储和永久存储,首先从存储类部件群中划分一个区域作为用户数据的永久存储区,永久存储区不能再作为临时存储空间;用户登录到系统后,系统根据用户等级在存储类部件群中为用户分配临时存储空间,并提示临时存储空间的访问位置;然后,系统判断用户是否申请了永久存储空间,如果用户申请了永久存储空间,则判断用户是否是第一次登录进入系统,如果是第一次,则系统在永久存储区为用户分配用户所申请大小的永久存储空间,并提示永久存储空间的访问位置,系统保存有“永久存储空间分配表”记录永久存储空间与用户的映射关系;如果用户曾经成功登录过系统,则系统根据“永久存储空间分配表”建立用户与其永久存储空间的映射关系,并提示永久存储空间的访问位置。当用户准备退出系统时,系统将提示用户把需要长期保存的数据存储到永久存储空间中,临时存储空间将被释放。
所述的智能资源管理方法,通过读取运行部件的关键参数实施部件的故障管理和安全管理,监测和维护部件资源的可靠运行。故障管理是监测部件是否处于正常的运行状态,安全管理是监测部件是否受到攻击或篡改。
对某个部件群中的部件实施故障管理和安全管理,首先针对故障管理和安全管理分别设置一个关键参数表,即故障管理参数表和安全管理参数表,选择参数的要求是这些参数能够全面反映部件的运行状态和安全状态。然后对每个参数设置多个级别的阀值如L1、L2、......Ln(n为自然数),当系统监测到某个参数达到(高于或低于或等于)某个阀值时,将产生对应级别的告警信息,如达到阀值Li即产生i级告警(i=1,2,......n),并通过多种方式将告警信息通知系统管理者,由系统管理者根据告警级别采取相应的措施以确保部件的正常运行和安全。通知系统管理者的方式可以是(1)将告警信息显示到系统管理者的电脑屏幕上;(2)如果系统已与Internet相连,则可以给系统管理者发送E-mail;(3)如果与电信运营商达成协议,可以通过短消息的方式将告警信息发送到管理者的手机上。
当某一个部件无法开启时,将以最高级别的故障告警信息通知系统管理者。
将所有故障告警和安全告警分别记录到故障日志文件和安全日志文件中,以备查询。
上述功能的实现,使多部件自组织软连接集群计算机更具竞争优势:
(1)通过实现部件群中部件资源的动态调度,不仅可以优化多部件自组织软连接集群计算机的资源配置,而且可以避免部件的闲置、最大限度地节省损耗成本和维护成本,同时也提高了对多部件自组织软连接集群计算机进行维护的自动化程度。
(2)对用户进行分级和对分配给用户的资源进行动态调度,克服了现有多用户系统对所有用户平均分配资源的不足,实现了资源的高度共享,不仅可以提供差异化服务,而且也提高了多部件自组织软连接集群计算机资源的利用率。
(3)临时存储和永久存储问题的解决,实现了用户数据的长期保存,满足了不同用户的存储要求,扩展了多部件自组织软连接集群计算机的服务功能和服务范围。
(4)通过对部件实施故障管理和安全管理,可以让系统管理者及时发现部件的异常状态,及时采取相应的措施,保障系统的安全和可靠运行。
附图说明
图1多部件自组织软连接集群计算机典型结构示意图
图2本发明实施例中集群计算机的示意图
图3本发明实施例主机部件自动开启流程图
图4本发明实施例主机部件自动关闭流程图
图5本发明实施例用户分级过程流程图
图6本发明实施例用户资源动态调度过程流程图
图7本发明实施例临时存储和永久存储实现流程图
图8本发明部件的故障管理和安全管理实现流程图
具体实施方式
本发明所提供的一种多部件自组织软连接集群计算机的智能资源管理方法,是基于计算机部件群以及部件群之间的自组织连接而组成的集群计算机。下面将结合附图对本发明的具体实施方式作进一步说明。
本发明的一个典型实施例中的集群计算机如图2所示,集群计算机系统分为终端部件群201、主机部件群202和外存部件群203三个部分。其中,终端部件群201由N套的计算机终端204构成,为系统提供用户使用的界面和接口,每套终端可以看作系统的一个终端部件;主机部件群202由M台计算机主机部件207构成,为系统的运算和处理中心,每个计算机主机可以看作是系统的一个运算处理部件;外存部件群203由K个的外部存储器209构成,为系统提供海量存储空间,每个外部存储器可以看作系统的一个外存部件。于是,一套终端部件、主机部件和外存部件连接成功后,即可构成一台功能完整的计算机。
一、部件的自动开启和自动关闭
实施例中,集群计算机系统分成了终端部件群201、主机部件群202和外存部件群203三个部分,亦即有终端部件204、主机部件207和外存部件209三类部件。其中终端部件204是用户使用系统的界面和接口,是由用户来开启和关闭的,不需要实现自动开启和关闭;外存部件209的自动开启和关闭与主机部件群类似。所以,在本实施例中,只说明实现主机部件207的自动开启和关闭过程。
在本实施例中,实现主机部件的自动开启,“监控器”只要在接收到“组合”命令后(指其他部件群发出的组合命令,如手动开启的终端部件发出的“组合”命令),触发接通一台(或个,具体实施例中对于主机部件而言,用量词“台”来替代“个”)主机部件的电源即可开启一台主机。
主机部件207的自动开启可以采用如下具体步骤实现:
(1)在主机部件群202中的“监控器”处于激活状态;
(2)“监控器”监测到“组合”命令中对主机部件群有资源需求;
(3)“监控器”选择触发一台主机部件开启(触发的依据可以是已设定好的优先等级),如主机1;
(4)如果被选择的主机1在时间T(T>0)内无法开启,则选择触发另一台部件开启,如主机2;
(5)开启的主机部件为集群计算机系统提供服务;
(6)有主机部件成功开启后,“监控器”进入非激活状态;
(7)集群计算机监控主机部件资源使用情况;
(8)如果主机部件群提供的资源已不能满足系统的需求时,将增加一台主机部件开启;
(9)直到主机部件群的资源能够满足系统的需求。
主机部件自动开启流程如图3所示。
主机部件207的自动关闭可以采用如下具体步骤实现:
(1)集群计算机监控终端部件群201的资源使用情况;
(2)当集群计算机检测到由m(1<m≤M)台主机部件所提供给终端部件群201的资源可以由m-1台主机部件来保证;
(3)集群计算机从m台主机部件中选择一台;
(4)将由该台主机部件提供服务的终端部件切换到由其余m-1台主机部件提供;
(5)所选择的主机部件空闲后自动关闭;
(6)重复步骤(1)-(5);
(7)直至最后一台主机部件关闭;
(8)将主机部件群中的“监控器”置为激活状态。
主机部件自动关闭流程如图4所示。
二、用户分级和用户资源的动态调度
用户分级是指用户在向集群计算机管理者申请用户帐号和用户密码时,同时还要申请运算服务等级和存储服务等级,例如,可以将终端部件要求的运算服务划分为3个等级:等级0为普通运算服务等级,主要用于上网、文字处理等需要运算量不大的普通任务;等级1为需要一定运算量的任务,如从事一些一台主机部件207可以完成的运算量中等的计算;等级2为需要大量运算量的任务,如需要大量数学运算的实时任务等,此时需要启动多台主机部件207的并行计算功能来加快运算速度;存储服务等级可以按需要的存储空间来划分,例如:等级0需要100M存储空间,等级1需要200M存储空间等等,另外,存储服务还有临时存储和永久存储之分。
用户分级过程实现的具体步骤包括:
(1)用户向集群计算机系统管理者申请登录帐号、运算服务等级和存储服务等级;
(2)系统管理者为用户分配登录帐号、运算服务等级和存储服务等级;
(3)用户通过终端部件204输入登录信息;
(4)系统收到登录信息后,根据用户的运算服务等级为用户分配相应的主机部件资源,根据用户的存储服务等级为用户分配临时存储空间和永久存储空间;
(5)系统为用户提供服务。
用户分级过程的流程如图5所示。
用户资源动态调度是指根据用户实际使用所分配资源的情况,在不影响用户服务质量的条件下,对用户资源进行动态调整,将一定时期内空闲的资源临时分配给需要资源的用户,使系统部件资源得到充分利用。本实施例中,终端部件204由用户独占,无法进行调整,而主机部件207资源和外存部件209资源可以进行调整。
用户资源动态调度的具体实现步骤包括:
(1)系统监测终端部件群201中每个终端部件204(用户)使用资源(主机部件资源和外存部件资源)的情况;
(2)如果在时间T(T>0)内某台终端部件204使用资源的比例低于某个阀值L1(L1>0),主机部件群202将分配给该终端部件的资源调整出一部分作为预留资源;
(3)如果在时间T(T>0)内某台终端部件204使用资源的比例高于某个阀值L2(L2>0),这时若有预留资源,则主机部件群202将部分预留资源分配给该终端部件,以满足该终端部件对资源的需求;
(4)如果被调整出资源的终端部件资源需求增加,且在其规定级别范围内,则系统首先从预留资源中调出资源给该终端部件,如果预留资源不够,系统将回收分配出去的部分预留资源来满足该终端部件的需求;
(5)系统保存有一个“动态资源调度表”,内容包括各终端部件204使用部件资源(本实施例中为主机部件资源和外存部件资源)的比例、调整资源的情况、剩余预留资源情况和预留资源分配情况等。
用户资源动态调度流程如图6所示。
三、临时存储和永久存储
用户在向系统管理者申请帐号的同时,需要申请存储服务等级,存储服务包括分配临时存储空间和永久存储空间,所以用户在申请需要指明是否需要永久存储空间。临时存储空间将根据用户的等级分配,如等级0为100M、等级1为200M、等级2为400M等等,为用户在使用系统的过程存储数据,如仿真过程中产生的数据,但用户退出系统后,临时存储空间将被释放,存储的数据将被删除,如果用户需要长期保存数据则自己通过U盘保存。如果用户需要在系统中保存数据,则需要申请永久存储空间,存储空间的大小由用户根据需求指定。
显然,临时存储空间的分配容易实现,在用户从终端部件群201登录后,由主机部件群202根据用户的存储服务等级随机从外存部件群203中分配即可。但永久存储空间不能随机分配,需要为用户分配固定的存储空间,以便用户登录后即可访问到所保存的数据。
临时存储和永久存储实现的具体步骤包括:
(1)从外存部件群203中划分一个区域作为用户数据的永久存储区,本实施例指定外存储器1为永久存储区,外存储器1不能再作为临时存储空间;
(2)用户从终端部件群201登录进入系统;
(3)系统根据用户等级在外存部件群203中为用户分配临时存储空间,并提示临时存储空间的访问位置;
(4)系统判断用户是否申请了永久存储空间,如果用户申请了永久存储空间,则判断用户是否是第一次登录进入系统,如果是第一次,则系统在永久存储区为用户分配用户所申请大小的永久存储空间,并提示永久存储空间的访问位置。同时,系统保存有“永久存储空间分配表”记录永久存储空间与用户的映射关系;
(5)如果用户曾经成功登录过系统,则系统根据“永久存储空间分配表”建立用户与其永久存储空间的映射关系,并提示永久存储空间的访问位置;
(6)当用户准备退出系统时,系统提示用户把需要长期保存的数据存储到永久存储空间中,临时存储空间将被释放。
临时存储和永久存储实现的流程如图7所示。
四、部件的故障管理和安全管理(实现的流程如图8所示)
本实施例中,对主机部件群202中的主机部件207实施故障管理和安全管理,具体步骤包括:
(1)设置主机部件207的故障管理参数表和安全管理参数表,其中故障管理参数表包括CPU利用率、内存利用率等参数,安全管理参数表包括系统文件、注册表等参数。
(2)对每个参数设置多个级别的阀值,对故障管理参数CPU利用率设置的阀值为L1=50%,L2=70%,L3=90%;内存利用率设置的阀值为L1=60%,L2=80%,L3=95%。对安全管理参数系统文件和注册表设置的阀值均为L1=0(将被修改),L2=1(已被修改)。
(3)当系统监测到故障管理参数CPU利用率和内存利用率的阀值等于或高于L1时产生初级告警;当阀值等于或高于L2时产生中级告警;当阀值等于或高于L3时产生高级告警,总共三级告警。当系统监测到安全管理参数系统文件和注册表的阀值=L1时,将发出安全参数将被修改的告警信息;当阀值=L2时,将发出安全参数已被修改的告警信息。
(4)告警信息通过显示到系统管理者电脑屏幕上,或发送E-mail,或发送短消息到管理者手机上等方式通知系统管理者;
(5)系统管理者根据告警级别采取相应的措施解决部件故障和安全问题,以确保系统的正常可靠运行。
(6)当某一个主机部件207无法开启时,将以最高级别的故障告警信息通知系统管理者。主机部件无法开启的信息由主机部件群的“监控器”发送给第一台成功开启的主机部件。
(7)将所有故障告警和安全告警分别记录到主机部件群202的故障日志文件和安全日志文件中,以备查询。

Claims (6)

1、多部件自组织软连接集群计算机智能资源管理方法,其特征在于所述集群计算机的每个部件群设有一个“监控器”,“监控器”实现在接收到“组合”命令后触发一个部件开启,部件的自动开启通过如下步骤实现:
(1)“监控器”处于激活状态;
(2)“监控器”监测到“组合”命令中对本部件群有资源需求;
(3)“监控器”触发一个部件开启;
(4)如果被选择的部件在时间T内无法开启,则重复步骤(3),选择触发另一个部件开启,所述T>0;
(5)开启的部件为集群计算机系统提供服务;
(6)有部件成功开启后,“监控器”进入非激活状态;
(7)集群计算机监控部件资源使用情况;
(8)如果部件群提供的资源已不能满足集群计算机系统的需求时,将增加一个部件开启,直到部件群的资源满足集群计算机系统的需求。
2、根据权利要求1所述的多部件自组织软连接集群计算机智能资源管理方法,其特征在于还通过如下步骤实现部件的自动关闭:
(2.1)集群计算机监控部件资源的使用情况;
(2.2)当集群计算机检测到由m个部件所提供给系统的资源可由m-1个部件来提供时,转入步骤(2.3),所述1<m≤M,M为部件的总个数;
(2.3)集群计算机从所述m个部件中选择一个;将由该个部件提供的服务切换到由其余m-1个部件提供;
(2.4)步骤(2.3)所选择的部件空闲后自动关闭;
(2.5)重复步骤(2.1)-(2.4);
(2.6)直至最后一个部件关闭;
(2.7)将“监控器”置为激活状态。
3、根据权利要求2所述的多部件自组织软连接集群计算机智能资源管理方法,其特征在于还包括对用户进行分级,为用户分配登录帐号、运算服务等级和存储服务等级,并通过所述步骤(2.1)监控部件资源的使用情况,同时对分配给用户的资源进行动态调度,监控和调度过程如下:
(3.1)如果在时间T内某个用户使用部件资源的比例低于某个阀值L1,集群计算机系统将分配给该用户的资源调整出一部分作为预留资源,所述T>0,L1>0;
(3.2)如果在时间T内某个用户使用部件资源的比例高于某个阀值L2,这时若有预留资源,则系统将部分预留资源分配给该用户,以满足该用户对资源需求,所述T>0,L2>0;
(3.3)如果被调整出资源的用户资源需求增加,且增加后该用户使用的总资源不超出其被允许使用的最大资源的范围,则集群计算机系统首先从预留资源中调配资源给该用户,如果预留资源不够,集群计算机系统将回收分配出去的部分预留资源以满足该用户的需求;
(3.4)集群计算机系统保存着一个“动态资源调度列表”,内容包括各用户使用部件资源的比例、调整资源的情况、剩余预留资源情况和预留资源分配情况等。
4、根据权利要求3所述的多部件自组织软连接集群计算机智能资源管理方法,其特征在于还包括对存储资源的管理,系统从存储类部件群中分出一部分存储资源作为永久存储区,另一部分作为临时存储区,所述对存储资源的管理包括如下步骤:
(4.1)用户登录到系统后,系统根据用户的存储服务等级在存储类部件群中为用户分配临时存储空间,并提示临时存储空间的访问位置;
(4.2)系统判断用户是否申请了永久存储空间,如果用户申请了永久存储空间,则判断用户是否是第一次登录进入系统,如果是第一次,则系统在永久存储区为用户分配用户所申请大小的永久存储空间,并提示永久存储空间的访问位置;
(4.3)系统保存用于记录永久存储空间与用户的映射关系的“永久存储空间分配表”;
(4.4)如果用户曾经成功登录过系统,则系统根据“永久存储空间分配表”建立用户与其永久存储空间的映射关系,并提示永久存储空间的访问位置;
(4.5)当用户准备退出系统时,系统将提示用户把需要长期保存的数据存储到永久存储空间中,临时存储空间将被释放。
5、根据权利要求4所述的多部件自组织软连接集群计算机智能资源管理方法,其特征在于还包括对系统中部件群中部件的故障管理和安全管理:
首先针对故障管理和安全管理分别设置一个关键参数表,参数表中的参数反映部件的运行状态和安全状态,每个参数都有对应的多个阈值,每个阈值对应不同的安全级别;
系统监测某个部件当前的参数,判断该参数所处的阈值范围,产生对应级别的告警信息,并将告警信息通知系统管理者,由系统管理者根据告警级别采取相应的措施以确保部件的正常运行和安全;
当系统监测到某一个部件无法开启时,将以最高级别的故障告警信息通知系统管理者;
将所有故障告警和安全告警分别记录到故障日志文件和安全日志文件中,以备查询。
6、根据权利要求5所述的多部件自组织软连接集群计算机智能资源管理方法,其特征在于集群计算机系统将告警信息显示到系统管理者的电脑屏幕上或通过Internet发送E-mail给系统管理者或通过短消息的方式将告警信息发送到管理者的手机上。
CN2008100277589A 2008-04-29 2008-04-29 多部件自组织软连接集群计算机智能资源管理方法 Expired - Fee Related CN101271444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100277589A CN101271444B (zh) 2008-04-29 2008-04-29 多部件自组织软连接集群计算机智能资源管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100277589A CN101271444B (zh) 2008-04-29 2008-04-29 多部件自组织软连接集群计算机智能资源管理方法

Publications (2)

Publication Number Publication Date
CN101271444A true CN101271444A (zh) 2008-09-24
CN101271444B CN101271444B (zh) 2010-11-03

Family

ID=40005424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100277589A Expired - Fee Related CN101271444B (zh) 2008-04-29 2008-04-29 多部件自组织软连接集群计算机智能资源管理方法

Country Status (1)

Country Link
CN (1) CN101271444B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567115A (zh) * 2010-12-23 2012-07-11 伊姆西公司 基于云的系统中的信息技术资源分配和利用跟踪
CN103856909A (zh) * 2012-11-30 2014-06-11 北京信威通信技术股份有限公司 一种集群通信中组资源分配方法
CN104424106A (zh) * 2013-08-30 2015-03-18 国际商业机器公司 为存储优化操作分配存储设备的资源的方法和系统
WO2015037011A1 (en) * 2013-09-13 2015-03-19 Hewlett-Packard Development Company, L.P. Intelligent auto-scaling
CN104506553A (zh) * 2015-01-05 2015-04-08 四川中时代科技有限公司 一种分布式信息安全管理系统
CN104506552A (zh) * 2015-01-05 2015-04-08 四川中时代科技有限公司 一种信息系统安全监控及访问控制方法
US9356903B2 (en) 2013-03-14 2016-05-31 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Dynamically managing social networking groups
CN106886458A (zh) * 2016-12-27 2017-06-23 北京奇艺世纪科技有限公司 一种集群资源分配方法和装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247627A (zh) * 2017-06-22 2017-10-13 上海优刻得信息科技有限公司 存储设备io分配方法、存储设备io分配装置及服务器系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567115A (zh) * 2010-12-23 2012-07-11 伊姆西公司 基于云的系统中的信息技术资源分配和利用跟踪
CN102567115B (zh) * 2010-12-23 2016-04-06 伊姆西公司 云系统中用于信息技术资源分配和利用跟踪的装置和方法
CN103856909A (zh) * 2012-11-30 2014-06-11 北京信威通信技术股份有限公司 一种集群通信中组资源分配方法
US9356903B2 (en) 2013-03-14 2016-05-31 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Dynamically managing social networking groups
CN104424106A (zh) * 2013-08-30 2015-03-18 国际商业机器公司 为存储优化操作分配存储设备的资源的方法和系统
WO2015037011A1 (en) * 2013-09-13 2015-03-19 Hewlett-Packard Development Company, L.P. Intelligent auto-scaling
US9921877B2 (en) 2013-09-13 2018-03-20 EntIT Software, LLC Intelligent auto-scaling
CN104506553A (zh) * 2015-01-05 2015-04-08 四川中时代科技有限公司 一种分布式信息安全管理系统
CN104506552A (zh) * 2015-01-05 2015-04-08 四川中时代科技有限公司 一种信息系统安全监控及访问控制方法
CN104506552B (zh) * 2015-01-05 2017-09-12 山东金佳园科技股份有限公司 一种信息系统安全监控及访问控制方法
CN106886458A (zh) * 2016-12-27 2017-06-23 北京奇艺世纪科技有限公司 一种集群资源分配方法和装置

Also Published As

Publication number Publication date
CN101271444B (zh) 2010-11-03

Similar Documents

Publication Publication Date Title
CN101271444B (zh) 多部件自组织软连接集群计算机智能资源管理方法
CN103229125B (zh) 机箱内的刀片服务器之间的动态功率平衡
CN104468407B (zh) 实现业务平台资源弹性分配的方法与装置
TWI269963B (en) Method, system and computer readable media of controlling the power state of multiple processing elements in a network processor
CN104683388B (zh) 云资源管理系统及其管理方法
CN106357414B (zh) 用于基站发电管理的信息交互方法和系统
CN106452842B (zh) 基于网络功能虚拟化中介系统架构的网络系统
CN101860024A (zh) 电力系统省地调一体化pas系统的实现方法
CN102571413A (zh) 一种集群环境下资源管理的方法
CN109800261A (zh) 双数据库连接池的动态控制方法、装置及相关设备
CN111756760A (zh) 基于集成分类器的用户异常行为检测方法及相关设备
Wang et al. Air conditioner fast dispatching model based on load aggregator and direct load control
CN102724100B (zh) 一种针对组合服务的板卡资源分配系统及方法
CN107992951A (zh) 云管理平台的容量告警方法、系统、存储器及电子设备
CN115495231B (zh) 一种高并发任务复杂场景下的动态资源调度方法及系统
CN101458631B (zh) 一种自适应虚拟机调度的方法及装置
CN110471769A (zh) 一种虚拟机的资源管理方法及装置
CN110135756A (zh) 一种电力调度工作分配的计算机装置、方法以及设备
CN101188526B (zh) 无线超宽带动态联接集群计算机的智能资源管理方法
CN114518798A (zh) 设备集群的低功耗控制方法及装置
CN112783637B (zh) 一种资源调控方法和装置
CN112654077B (zh) 节能方法及装置、计算机可存储介质
CN112734359A (zh) 科技项目进度跟踪系统
CN107678903B (zh) 一种应用系统效能评估方法
CN112698714A (zh) 一种ups启用时虚拟资源智能管理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101103

Termination date: 20130429