CN103067229A - 自动管理计算资源的方法、控制中心、计算节点及系统 - Google Patents

自动管理计算资源的方法、控制中心、计算节点及系统 Download PDF

Info

Publication number
CN103067229A
CN103067229A CN2013100228672A CN201310022867A CN103067229A CN 103067229 A CN103067229 A CN 103067229A CN 2013100228672 A CN2013100228672 A CN 2013100228672A CN 201310022867 A CN201310022867 A CN 201310022867A CN 103067229 A CN103067229 A CN 103067229A
Authority
CN
China
Prior art keywords
computing node
described computing
control centre
fault
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013100228672A
Other languages
English (en)
Inventor
胡玉鹏
朱波
陈光新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN2013100228672A priority Critical patent/CN103067229A/zh
Publication of CN103067229A publication Critical patent/CN103067229A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明涉及一种自动管理计算资源的方法、控制中心、计算节点及系统,该方法包括:控制中心检测计算节点的当前状态;所述控制中心根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池。本发明自动管理计算资源的方法、控制中心、计算节点及系统通过对计算节点的状态进行检测,实现了对可用计算节点与故障计算节点的集中管理,提高了虚拟机开启效率。

Description

自动管理计算资源的方法、控制中心、计算节点及系统
技术领域
本发明涉及虚拟化,云计算等领域,具体涉及一种自动管理计算资源的方法、控制中心、计算节点及系统。
背景技术
在大型的云计算数据中心中,对物理机资源的有效管理,是实现虚拟机生命周期管理的前提。但往往由于不能及时发现发生故障的物理机资源,很可能导致开启虚拟机的时候调度到故障的物理机上而失败。
现有技术中,在发现故障的物理机资源时,需要把其上的虚拟机资源进行HA(HA操作只针对故障物理机资源上的虚拟机,该操作使得故障物理机上的虚拟机在其他正常的物理机上运行)操作,并把该物理机资源迁出可用资源池,移入故障资源池。可见现有技术方案并没有对物理机资源进行有效管理,导致虚拟机开启的效率降下。
发明内容
本发明要解决的技术问题是提供一种自动管理计算资源的方法、控制中心、计算节点及系统,以解决虚拟机开启效率低下的问题。
为解决上述技术问题,本发明提供了一种自动管理计算资源的方法,该方法包括:
控制中心检测计算节点的当前状态;
所述控制中心根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池。
为解决上述技术问题,本发明提供了一种自动管理计算资源的控制中心,该控制中心包括:
状态检测单元,用于检测计算节点的当前状态;
资源池管理单元,用于根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池;
故障资源池,用于存储故障的计算节点信息;
可用资源池,用于存储可用的计算节点信息。
为解决上述技术问题,本发明提供了一种计算节点,所述计算节点包括:
检测指令接收模块,用于接收控制中心发送的检测指令;
检测指令响应模块,用于向所述控制中心发送检测响应。
为解决上述技术问题,本发明提供了一种自动管理计算资源的系统,该系统包括如上所述的计算节点和控制中心。
为解决上述技术问题,本发明提供了一种自动管理计算资源的系统,其该系统包括计算节点,控制中心,其中:
所述计算节点,用于定时向所述控制中心发送用于表明状态正常的报文;
所述控制中心包括:
状态检测单元,用于根据是否定时收到所述报文判断所述计算节点的状态,若定时收到则确认所述计算节点可用,否则确认所述计算节点故障;
资源池管理单元,用于根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点转入故障资源池;
故障资源池,用于存储故障的计算节点信息;
可用资源池,用于存储可用的计算节点信息。
相较于现有技术,本发明自动管理计算资源的方法、控制中心、计算节点及系统通过对计算节点的状态进行检测,实现了对可用计算节点与故障计算节点的集中管理,能够及时发现故障资源,方便管理员排查故障,提高了虚拟机开启效率。
附图说明
图1为本发明自动管理计算资源的方法实施例的示意图;
图2为本发明方法的应用实例示意图;
图3为本发明控制中心的模块结构示意图;
图4为本发明计算节点的模块结构示意图;
图5为本发明自动管理计算资源的模块结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明自动管理计算资源的方法实施例,如图1所示,该方法包括:
步骤101:控制中心检测计算节点的当前状态;
具体地,所述控制中心可以采用主动或被动的方式对计算节点的状态进行检测。
步骤101中控制中心采用主动方式检测计算节点的当前状态的步骤包括:
a1.所述控制中心向所述计算节点发送检测指令;
所述控制中心定时向所述计算节点发送检测指令,或采用轮询的方式向所有计算节点发送检测指令。
b1.所述控制中心判断是否收到检测响应,若收到检测响应,则确定所述计算节点可用,否则确定所述计算节点发生故障。
步骤101控制中心采用被动方式检测计算节点的状态变化的步骤包括:
a2.所述计算节点定时向所述控制中心发送用于表明状态正常的报文;
b2.所述控制中心根据是否定时收到所述报文判断所述计算节点的状态,若定时收到则确认所述计算节点可用,否则确认所述计算节点故障。
步骤102:所述控制中心根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池。
控制中心的可用资源池与故障资源池是当前的操作对象,具体地,可用资源池与故障资源池其可通过对计算节点的状态进行置位实现,如计算节点的状态置为第一标志,可认为对应可用资源池,计算节点的状态置为第二标志,可认为对应故障资源池。
待管理员排查该计算节点的故障完成后,可自动或者管理员手动再移入可用资源池。优选地,所述计算节点在故障恢复后向所述控制中心发送故障恢复指令;所述控制中心根据该故障恢复指令确定所述计算节点故障恢复,将所述计算节点信息从故障资源池移入可用资源池。
如图2所示,控制中心向计算节点1、2发送检测指令,计算节点1反馈检测响应,计算节点2不反馈检测响应,则计算节点1为正常,计算节点2为故障,则计算节点1的信息迁入可用资源池,计算节点2的信息从可用资源池迁入故障资源池;计算节点3故障恢复,向控制中心发送故障恢复指令,控制中心将计算节点3的信息从故障资源池迁入可用资源池。
为实现上述方法,本发明还提供了一种自动管理计算资源的控制中心,如图3所示,该控制中心包括:
状态检测单元,用于检测计算节点的当前状态;
资源池管理单元,用于根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池;
故障资源池,用于存储故障的计算节点信息;
可用资源池,用于存储可用的计算节点信息。
可选地,所述状态检测单元包括:
检测指令发送模块,用于向所述计算节点发送检测指令;
状态判断模块,用于判断是否收到检测响应,若收到检测响应,则确定所述计算节点可用,否则确定所述计算节点发生故障。
所述检测指令发送模块定时向所述计算节点发送检测指令,或采用轮询的方式向所有计算节点发送检测指令。
优选地,所述状态检测单元,还用于接收计算节点在故障恢复后发送的故障恢复指令;所述资源池管理单元,还用于根据该故障恢复指令确定所述计算节点故障恢复,将所述计算节点信息从故障资源池移入可用资源池。
为实现上述方法,本发明还提供了一种计算节点,如图4所示,所述计算节点包括:
检测指令接收模块,用于接收控制中心发送的检测指令;
检测指令响应模块,用于向所述控制中心发送检测响应。
优选地,所述检测指令响应模块还用于在故障恢复后,发送故障恢复指令。
另外,本发明还提供了一种自动管理计算资源的系统,该系统包括如图3所示的计算节点和如图4所示的控制中心。
本发明还提供了一种自动管理计算资源的系统,如图5所示,该系统包括计算节点和控制中心,其中:
所述计算节点,用于定时向所述控制中心发送用于表明状态正常的报文;
所述控制中心包括:
状态检测单元,用于根据是否定时收到所述报文判断所述计算节点的状态,若定时收到则确认所述计算节点可用,否则确认所述计算节点故障;
资源池管理单元,用于根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池;
故障资源池,用于存储故障的计算节点信息;
可用资源池,用于存储可用的计算节点信息。
本发明自动管理计算资源的方法、控制中心、计算节点及系统通过对计算节点的状态进行检测,实现了对可用计算节点与故障计算节点的集中管理,能够及时发现故障资源,方便管理员排查故障,提高了虚拟机开启效率。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
本发明实施例中所描述的单元、模块仅是根据其功能进行划分的一种示例,可理解地,在实现相同功能的情况下,本领域技术人员可给出一种或多种其他功能划分方式,在具体应用时可将其中任意一个或多个功能模块采用一个功能实体装置或单元实现,不可否认地,以上变换方式均在本申请保护范围之内。
显然,所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

Claims (13)

1.一种自动管理计算资源的方法,其特征在于,该方法包括:
控制中心检测计算节点的当前状态;
所述控制中心根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池。
2.如权利要求1所述的方法,其特征在于:控制中心检测计算节点的当前状态的步骤包括:
所述控制中心向所述计算节点发送检测指令;
所述控制中心判断是否收到检测响应,若收到检测响应,则确定所述计算节点可用,否则确定所述计算节点发生故障。
3.如权利要求2所述的方法,其特征在于:所述控制中心定时向所述计算节点发送检测指令,或采用轮询的方式向所有计算节点发送检测指令。
4.如权利要求1所述的方法,其特征在于:所述计算节点在故障恢复后向所述控制中心发送故障恢复指令;所述控制中心根据该故障恢复指令确定所述计算节点故障恢复,将所述计算节点信息从故障资源池移入可用资源池。
5.如权利要求1所述的方法,其特征在于:检测计算节点的状态变化的步骤包括:
所述计算节点定时向所述控制中心发送用于表明状态正常的报文;
所述控制中心根据是否定时收到所述报文判断所述计算节点的状态,若定时收到则确认所述计算节点可用,否则确认所述计算节点故障。
6.一种自动管理计算资源的控制中心,其特征在于,该控制中心包括:
状态检测单元,用于检测计算节点的当前状态;
资源池管理单元,用于根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点信息转入故障资源池;
故障资源池,用于存储故障的计算节点信息;
可用资源池,用于存储可用的计算节点信息。
7.如权利要求6所述的控制中心,其特征在于:所述状态检测单元包括:
检测指令发送模块,用于向所述计算节点发送检测指令;
状态判断模块,用于判断是否收到检测响应,若收到检测响应,则确定所述计算节点可用,否则确定所述计算节点发生故障。
8.如权利要求7所述的控制中心,其特征在于:所述检测指令发送模块定时向所述计算节点发送检测指令或采用轮询的方式向所有计算节点发送检测指令。
9.如权利要求6所述的控制中心,其特征在于:所述状态检测单元,还用于接收计算节点在故障恢复后发送的故障恢复指令;资源池管理单元,还用于根据该故障恢复指令确定所述计算节点故障恢复,将所述计算节点信息从故障资源池移入可用资源池。
10.一种计算节点,其特征在于,所述计算节点包括:
检测指令接收模块,用于接收控制中心发送的检测指令;
检测指令响应模块,用于向所述控制中心发送检测响应。
11.如权利要求10所述的计算节点,其特征在于:所述检测指令响应模块还用于在故障恢复后,发送故障恢复指令。
12.一种自动管理计算资源的系统,其特征在于,该系统包括如权利要求6至9中任一项所述的计算节点和如权利要求10或11所述的控制中心。
13.一种自动管理计算资源的系统,其特征在于,该系统包括计算节点和控制中心,其中:
所述计算节点,用于定时向所述控制中心发送用于表明状态正常的报文;
所述控制中心包括:
状态检测单元,用于根据是否定时收到所述报文判断所述计算节点的状态,若定时收到则确认所述计算节点可用,否则确认所述计算节点故障;
资源池管理单元,用于根据所述计算节点的当前状态,调整所述计算节点对应的资源池,其中,若所述计算节点发生故障,则将所述计算节点转入故障资源池;
故障资源池,用于存储故障的计算节点信息;
可用资源池,用于存储可用的计算节点信息。
CN2013100228672A 2013-01-22 2013-01-22 自动管理计算资源的方法、控制中心、计算节点及系统 Pending CN103067229A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013100228672A CN103067229A (zh) 2013-01-22 2013-01-22 自动管理计算资源的方法、控制中心、计算节点及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013100228672A CN103067229A (zh) 2013-01-22 2013-01-22 自动管理计算资源的方法、控制中心、计算节点及系统

Publications (1)

Publication Number Publication Date
CN103067229A true CN103067229A (zh) 2013-04-24

Family

ID=48109698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013100228672A Pending CN103067229A (zh) 2013-01-22 2013-01-22 自动管理计算资源的方法、控制中心、计算节点及系统

Country Status (1)

Country Link
CN (1) CN103067229A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103312694A (zh) * 2013-05-20 2013-09-18 深圳市京华科讯科技有限公司 后端计算控制方法
CN103390054A (zh) * 2013-07-26 2013-11-13 浪潮(北京)电子信息产业有限公司 云数据中心中管理流程节点的方法和系统
CN105068763A (zh) * 2015-08-13 2015-11-18 武汉噢易云计算有限公司 一种针对存储故障的虚拟机容错系统和方法
WO2017041671A1 (zh) * 2015-09-10 2017-03-16 华为技术有限公司 故障恢复的方法和装置
CN106844083A (zh) * 2017-02-20 2017-06-13 重庆邮电大学 一种面向流计算系统异常感知的容错方法及系统
WO2024109916A1 (zh) * 2022-11-24 2024-05-30 大唐移动通信设备有限公司 算力节点管理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986272A (zh) * 2010-11-05 2011-03-16 北京大学 一种云计算环境下的任务调度方法
CN102033777A (zh) * 2010-09-17 2011-04-27 中国资源卫星应用中心 基于ice的分布式作业调度引擎

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033777A (zh) * 2010-09-17 2011-04-27 中国资源卫星应用中心 基于ice的分布式作业调度引擎
CN101986272A (zh) * 2010-11-05 2011-03-16 北京大学 一种云计算环境下的任务调度方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103312694A (zh) * 2013-05-20 2013-09-18 深圳市京华科讯科技有限公司 后端计算控制方法
CN103390054A (zh) * 2013-07-26 2013-11-13 浪潮(北京)电子信息产业有限公司 云数据中心中管理流程节点的方法和系统
CN103390054B (zh) * 2013-07-26 2016-09-07 浪潮(北京)电子信息产业有限公司 云数据中心中管理流程节点的方法和系统
CN105068763A (zh) * 2015-08-13 2015-11-18 武汉噢易云计算有限公司 一种针对存储故障的虚拟机容错系统和方法
CN105068763B (zh) * 2015-08-13 2018-11-23 武汉噢易云计算股份有限公司 一种针对存储故障的虚拟机容错系统和方法
WO2017041671A1 (zh) * 2015-09-10 2017-03-16 华为技术有限公司 故障恢复的方法和装置
CN106844083A (zh) * 2017-02-20 2017-06-13 重庆邮电大学 一种面向流计算系统异常感知的容错方法及系统
CN106844083B (zh) * 2017-02-20 2020-05-12 重庆邮电大学 一种面向流计算系统异常感知的容错方法及系统
WO2024109916A1 (zh) * 2022-11-24 2024-05-30 大唐移动通信设备有限公司 算力节点管理方法及装置

Similar Documents

Publication Publication Date Title
CN103067229A (zh) 自动管理计算资源的方法、控制中心、计算节点及系统
CN102355369B (zh) 虚拟化集群系统及其处理方法和设备
US10649512B2 (en) High efficient battery backup system
CN105429776B (zh) 一种虚拟化网络功能管理的方法和系统
CN107977254B (zh) 云数据系统中请求的响应方法和计算机可读存储介质
CN106059791B (zh) 一种存储系统中业务的链路切换方法和存储设备
WO2016206456A1 (zh) 物理机升级方法、业务迁移方法及装置
CN105337780B (zh) 一种服务器节点配置方法及物理节点
CN103067277A (zh) 建立控制通道的方法、转发设备和控制设备
WO2013165369A1 (en) Automated event management
CN106576260B (zh) Nfv系统中的策略协调方法和装置
CN103414626A (zh) 基于网络虚拟化的报文处理方法及装置
CN104239548A (zh) 数据库容灾系统和数据库容灾方法
US11641405B2 (en) GPU box server cascade communication method, device, and system
KR20150016820A (ko) 가상 노드 배치 관리 시스템 및 방법
CN106874142B (zh) 一种实时数据容错处理方法及系统
CN105095103A (zh) 用于云环境下的存储设备管理方法和装置
CN106230622B (zh) 一种集群实现方法及装置
CN103634128A (zh) 虚拟机放置策略的配置方法及装置
CN105591778A (zh) 一种分布式系统更新配置文件的方法及系统
CN108322326A (zh) 一种接口状态控制方法、报文传输方法及装置
CN109254876A (zh) 云计算系统中数据库的管理方法和装置
CN103559124A (zh) 故障快速检测方法及装置
CN105335256A (zh) 在整机柜服务器中切换备份磁盘的方法、装置和系统
CN103780467A (zh) 通信连接方法、通信装置及通信系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130424