CN102882970B - 基于云计算平台保持主机资源稳定的方法 - Google Patents

基于云计算平台保持主机资源稳定的方法 Download PDF

Info

Publication number
CN102882970B
CN102882970B CN201210371657.XA CN201210371657A CN102882970B CN 102882970 B CN102882970 B CN 102882970B CN 201210371657 A CN201210371657 A CN 201210371657A CN 102882970 B CN102882970 B CN 102882970B
Authority
CN
China
Prior art keywords
cluster
cloud computing
computing platform
main frame
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210371657.XA
Other languages
English (en)
Other versions
CN102882970A (zh
Inventor
邓书芬
吴海玲
吴文青
陈浩
庹海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GCI Science and Technology Co Ltd
Original Assignee
GCI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GCI Science and Technology Co Ltd filed Critical GCI Science and Technology Co Ltd
Priority to CN201210371657.XA priority Critical patent/CN102882970B/zh
Publication of CN102882970A publication Critical patent/CN102882970A/zh
Application granted granted Critical
Publication of CN102882970B publication Critical patent/CN102882970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于云计算平台保持主机资源稳定的方法,包括步骤:A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;B、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群。

Description

基于云计算平台保持主机资源稳定的方法
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种基于云计算平台保持主机资源稳定的方法。
背景技术
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(UtilityComputing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统。云计算的一个核心理念就是通过不断提高“云”的处理能力,进而减少用户终端的处理负担,最终使用户终端简化成一个单纯的输入输出设备,并能按需享受“云”的强大计算处理能力。云计算的重要特点之一就是对用户端的设备要求最低,使用起来也最方便。
主机是云平台的一个节点,是组成云平台的最小的实体单位,主机上主要用来开启虚拟机。同类型主机可组成一个集群。集群是指将一组计算机关联起来,使它们在外界从很多方面看起来如同一台计算机。集群内的计算机之间通常通过局域网连接,通常用来改善性能和可用性。
虚拟化指对计算资源进行抽象的一个广义概念。虚拟化对上层应用或用户隐藏了计算资源的底层属性。它既包括使单个的资源(比如一个服务器,一个操作系统,一个应用程序,一个存储设备)划分成多个虚拟资源,也包括将多个资源(比如存储设备或服务器)整合成一个虚拟资源。虚拟化技术是指实现虚拟化的具体的技术性手段和方法的集合性概念。
主机是云计算平台中的基础部分,主要向云计算平台提供资源。当集群出现错误时,主机与云控制器的连接被中断,对云计算平台来说,有部分资源无法被利用,现有的解决方法是在云平台中清除错误集群下的主机记录,将主机重新注册到另外一个集群。
但是,现有的解决方法存在以下的不足:在现有云计算平台的基础上,主机不能重复注册,如果已经注册的主机因为集群丢失而无法使用时,需要将主机重新注册到另外一个集群上,必须先修改云计算平台的数据,即需要清空掉云计算平台关于主机的记录,主机才能重新注册到另外一个集群上。这样,由于需要人为修改云计算平台的数据,可能会导致数据修改错误;另外,由于修改过程繁琐,导致主机资源在一段时间无法使用。
发明内容
本发明实施例提出一种基于云计算平台保持主机资源稳定的方法,能够减少因集群出错而造成的资源丢失和数据丢失,减少处理的步骤和时间,降低因此给用户带来的影响。
本发明实施例提供一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤:
A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;
B、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;
C、所述云计算平台通知管理员对所述异常集群进行修复;
D、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群。
优选的,还包括步骤E:当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群。
实施本发明实施例,具有如下有益效果:本发明基于云计算平台保持主机资源稳定的方法,通过将主机注册到主要集群的时候还同时注册到一个备要集群,使备要集群在主要集群发生异常时候能够变为所述主机的当前主要集群以代替所述主要集群以接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的一段时间集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用备要集群相比使用特定集群(云平台中因集群所在主机不能正常通信导致云控制器无法管理该集群下的正常主机,而特定集群用于找回这些主机;当损坏主机修复后,特定集群会自动归还集群的这部分主机)来接管损坏集群下的主机资源,不需要配备一台专门的机器,适合规模小一点的云计算平台;特定集群在相对大一点的平台中应单独一台设备来接受丢失主机,相对反应速度较快,但是需要额外配备一台专门的机器(作为特定集群)。另外,使用备要集群接管损坏集群下的主机资源同时通知管理员修复异常集群,若异常集群能修复,将所述异常集群变为所述主机的当前备要集群;若不能修复,则通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群,防止因集群出错而造成的资源丢失和数据丢失,降低因此给用户带来影响。
附图说明
图1是本发明所提供的基于云计算平台保持主机资源稳定的方法的流程图。
图2是图1所示基于云计算平台保持主机资源稳定的方法的具体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,本发明提供了一种基于云计算平台保持主机资源稳定的方法,所述方法包括:
步骤S101、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;
步骤S102、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;
步骤S103、所述云计算平台通知管理员对所述异常集群进行修复;
步骤S104、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群;
步骤S105、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群。
下面,结合图2,对本发明的基于云计算平台保持主机资源稳定的方法进行详细描述,包括:
步骤S11:主机向集群a提出正式注册请求;
步骤S12:注册成功后,集群a向主机返回注册成功消息;
步骤S13:将主机注册记录发送给云计算平台;
以上步骤为现有技术中主机注册到集群上的通用技术,在此不详细描述。
步骤S14:主机向集群a提出正式注册请求的同时向集群b提出注册备要集群请求;
具体的,在主机正式注册的同时,同时在云计算平台利用数据库做个链接,使主机与备要集群b保持一个联系;主要集群a平时正常使用,备要集群b其他时间可作为另一个主机的主要集群,只有在该主机的主要集群a发生故障时代替主要集群a发挥作用。
步骤S15:注册成功后,集群b向主机返回注册成功消息;
步骤S16:将主机注册记录发送给云计算平台;
步骤S17:当主要集群a发生异常情况时,云计算平台监控到与集群a的通讯中断;
步骤S18:等待一段时间后云计算平台再次向集群a发送命令,若仍无回答,则判断集群a以及集群a下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;
步骤S19:接着,所述云计算平台从数据库中查找所述主机的备要集群b时,若发现所述备要集群b的状态为正在运行,则发送命令至所述备要集群b,以使备要集群b和丢失的主机通信;
步骤S20:集群b与状态丢失的主机连接成功后变为所述主机的当前主要集群以接管所述主机,所述云计算平台通过所述集群b重新获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行;
步骤S21:同时,所述云计算平台通知管理员对所述异常集群a进行修复(图中没显示);
步骤S22:当集群a修复成功,将修复成功结果通知云计算平台;
步骤S23:所述云计算平台将所述集群a变为所述主机的当前备要集群;
步骤S24:但是,若所述集群a修复失败,将修复失败结果通知云计算平台;
步骤S25:所述云计算平台选择一新集群c,并与所述新集群c通信,若能
正常获取所述新集群c的信息则判定所述新集群c是正常的;
步骤S26:所述云计算平台将所述集群a的状态丢失主机与所述新集群c建立链接,以使所述新集群c替换所述集群a且变为所述状态丢失主机的当前备要集群,并对应修改云计算平台的数据库中的数据。
综上所述,本发明基于云计算平台保持主机资源稳定的方法,通过将主机注册到主要集群的时候还同时注册到一个备要集群,使备要集群在主要集群发生异常时候能够变为所述主机的当前主要集群以代替所述主要集群以接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用备要集群相比使用特定集群(云平台中因集群所在主机不能正常通信导致云控制器无法管理该集群下的正常主机,而特定集群用于找回这些主机;当损坏主机修复后,特定集群会自动归还集群的这部分主机)来接管损坏集群下的主机资源,不需要配备一台专门的机器,适合规模小一点的云计算平台;特定集群在相对大一点的平台中应单独一台设备来接受丢失主机,相对反应速度较快,但是需要额外配备一台专门的机器(作为特定集群)。另外,使用备要集群接管损坏集群下的主机资源同时通知管理员修复异常集群,若异常集群能修复,将所述异常集群变为所述主机的当前备要集群;若不能修复,则通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群,防止因集群出错而造成的资源丢失和数据丢失,降低因此给用户带来影响。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (5)

1.一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤:
A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;
B、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;
C、所述云计算平台通知管理员对所述异常集群进行修复;
D、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群;
其中,还包括步骤:
E、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群;
其中,所述云计算平台通知一新集群替换所述异常集群具体包括步骤:
E1、所述云计算平台选择一新集群,并与所述新集群通信,若能正常获取所述新集群的信息则判定所述新集群是正常的;
E2、所述云计算平台将所述异常集群的状态丢失主机与所述新集群重新建立链接,以使所述新集群替换所述异常集群且变为所述状态丢失主机的当前备要集群,并对应修改云计算平台的数据库中的数据。
2.如权利要求1所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤A中,当云计算平台发现与异常集群通讯中断时,再次向所述异常集群发送命令,如无应答才判断所述异常集群及注册到所述异常集群下的主机状态丢失。
3.如权利要求1所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤B中,所述云计算平台从数据库中查找所述主机的备要集群时,若发现所述备要集群的状态为正在运行,则发送命令至所述备要集群,以 使备要集群和丢失的主机通信,通信成功后则变为所述主机的当前主要集群以接管所述主机,并将主机状态变为正在运行。
4.如权利要求1所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述主机同时注册到主要集群和备要集群,是所述主机正式注册到主要集群的同时,在云计算平台利用数据库做链接,使所述主机与备要集群保持联系。
5.如权利要求4所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述备要集群在所述主要集群发生故障而变为所述主机的当前主要集群以代替所述主要集群发挥作用前,所述备要集群可作为另一个主机的主要集群。
CN201210371657.XA 2012-09-28 2012-09-28 基于云计算平台保持主机资源稳定的方法 Active CN102882970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210371657.XA CN102882970B (zh) 2012-09-28 2012-09-28 基于云计算平台保持主机资源稳定的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210371657.XA CN102882970B (zh) 2012-09-28 2012-09-28 基于云计算平台保持主机资源稳定的方法

Publications (2)

Publication Number Publication Date
CN102882970A CN102882970A (zh) 2013-01-16
CN102882970B true CN102882970B (zh) 2015-07-29

Family

ID=47484112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210371657.XA Active CN102882970B (zh) 2012-09-28 2012-09-28 基于云计算平台保持主机资源稳定的方法

Country Status (1)

Country Link
CN (1) CN102882970B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103475696A (zh) * 2013-08-23 2013-12-25 汉柏科技有限公司 云计算集群服务器状态监控系统和方法
CN103995731B (zh) * 2014-05-09 2018-01-02 华为技术有限公司 一种管理中心部署方法和虚拟装置
CN114401160B (zh) * 2022-01-19 2022-12-02 腾讯科技(深圳)有限公司 数据处理方法、装置、服务器、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873225A (zh) * 2010-06-09 2010-10-27 神州数码网络(北京)有限公司 一种具有高可靠性和灵活性的集群网管系统及方法
CN102124697A (zh) * 2008-08-18 2011-07-13 F5网络公司 更新网络流量管理设备同时维持有效性
CN102130759A (zh) * 2010-01-13 2011-07-20 中国移动通信集团公司 一种数据采集方法、数据采集机集群及数据采集机
CN102164184A (zh) * 2011-04-22 2011-08-24 广州杰赛科技股份有限公司 云计算网络中计算机实体的接入和管理方法及云计算网络

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9886309B2 (en) * 2002-06-28 2018-02-06 Microsoft Technology Licensing, Llc Identity-based distributed computing for device resources

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102124697A (zh) * 2008-08-18 2011-07-13 F5网络公司 更新网络流量管理设备同时维持有效性
CN102130759A (zh) * 2010-01-13 2011-07-20 中国移动通信集团公司 一种数据采集方法、数据采集机集群及数据采集机
CN101873225A (zh) * 2010-06-09 2010-10-27 神州数码网络(北京)有限公司 一种具有高可靠性和灵活性的集群网管系统及方法
CN102164184A (zh) * 2011-04-22 2011-08-24 广州杰赛科技股份有限公司 云计算网络中计算机实体的接入和管理方法及云计算网络

Also Published As

Publication number Publication date
CN102882970A (zh) 2013-01-16

Similar Documents

Publication Publication Date Title
CN104115447B (zh) 一种云计算架构下的容灾方案配置方法及装置
CN105183554A (zh) 高性能计算与云计算混合计算系统及其资源管理方法
CN102917064B (zh) 基于私有云计算平台的双机热备方法
CN202565304U (zh) 分布式计算任务调度及执行系统
CN104333568A (zh) 基于cdn和负载均衡技术的家居电商云系统及实现方法
WO2015139374A1 (zh) 一种云计算平台下的虚拟机分布式任务调度方法
CN102594861A (zh) 一种多服务器负载均衡的云存储系统
CN102917025A (zh) 一种云计算平台的业务迁移方法
CN103620520A (zh) 基于发电机容量的功率封顶
CN106293934B (zh) 一种集群系统管理优化方法及平台
CN104102543A (zh) 一种云计算环境中负载调整的方法和装置
CN102769670A (zh) 虚拟机迁移方法、装置及系统
CN104539716A (zh) 云桌面管理系统桌面虚拟机调度控制系统及方法
CN110471766A (zh) 一种基于cuda的gpu资源调度系统和方法
CN108881512A (zh) Ctdb的虚拟ip均衡分配方法、装置、设备及介质
CN103891086B (zh) 用于提供电能的方法和设备
CN105516292A (zh) 一种智能变电站云平台的热备方法
CN102882970B (zh) 基于云计算平台保持主机资源稳定的方法
CN106385330B (zh) 一种网络功能虚拟化编排器的实现方法及装置
CN104850394A (zh) 分布式应用程序的管理方法和分布式系统
CN106210052A (zh) 一种广域电力服务管理方法
CN104518995B (zh) 基于分布式架构的交换机虚拟化系统
CN106059940A (zh) 一种流量控制方法及装置
CN104484228A (zh) 基于Intelli-DSC的分布式并行任务处理系统
CN110519354A (zh) 一种分布式对象存储系统及其业务处理方法和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant