CN102769675B - 基于云计算平台保持主机资源稳定的方法 - Google Patents

基于云计算平台保持主机资源稳定的方法 Download PDF

Info

Publication number
CN102769675B
CN102769675B CN201210287500.9A CN201210287500A CN102769675B CN 102769675 B CN102769675 B CN 102769675B CN 201210287500 A CN201210287500 A CN 201210287500A CN 102769675 B CN102769675 B CN 102769675B
Authority
CN
China
Prior art keywords
cluster
cloud computing
computing platform
main frame
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210287500.9A
Other languages
English (en)
Other versions
CN102769675A (zh
Inventor
邓书芬
吴海玲
吴文青
陈浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GCI Science and Technology Co Ltd
Original Assignee
GCI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GCI Science and Technology Co Ltd filed Critical GCI Science and Technology Co Ltd
Priority to CN201210287500.9A priority Critical patent/CN102769675B/zh
Publication of CN102769675A publication Critical patent/CN102769675A/zh
Application granted granted Critical
Publication of CN102769675B publication Critical patent/CN102769675B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤:A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;B、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接。

Description

基于云计算平台保持主机资源稳定的方法
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种基于云计算平台保持主机资源稳定的方法。
背景技术
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(UtilityComputing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统。云计算的一个核心理念就是通过不断提高“云”的处理能力,进而减少用户终端的处理负担,最终使用户终端简化成一个单纯的输入输出设备,并能按需享受“云”的强大计算处理能力。云计算的重要特点之一就是对用户端的设备要求最低,使用起来也最方便。
主机是云平台的一个节点,是组成云平台的最小的实体单位,主机上主要用来开启虚拟机。同类型主机可组成一个集群。集群是指将一组计算机关联起来,使它们在外界从很多方面看起来如同一台计算机。集群内的计算机之间通常通过局域网连接,通常用来改善性能和可用性。
虚拟化指对计算资源进行抽象的一个广义概念。虚拟化对上层应用或用户隐藏了计算资源的底层属性。它既包括使单个的资源(比如一个服务器,一个操作系统,一个应用程序,一个存储设备)划分成多个虚拟资源,也包括将多个资源(比如存储设备或服务器)整合成一个虚拟资源。虚拟化技术是指实现虚拟化的具体的技术性手段和方法的集合性概念。
主机是云计算平台中的基础部分,主要向云计算平台提供资源。当集群出现错误时,主机与云控制器的连接被中段,对云计算平台来说,有部分资源无法被利用,现有的解决方法是在云平台中清除错误集群下的主机记录,将主机重新注册到另外一个集群。
但是,现有的解决方法存在以下的不足:在现有云计算平台的基础上,主机不能重复注册,如果已经注册的主机因为集群丢失而无法使用时,需要将主机重新注册到另外一个集群上,必须先修改云计算平台的数据,即需要清空掉云计算平台关于主机的记录,主机才能重新注册到另外一个集群上。这样,由于需要人为修改云计算平台的数据,可能会导致数据修改错误;另外,由于修改过程繁琐,导致主机资源在一段时间无法使用。
发明内容
本发明实施例提出一种基于云计算平台保持主机资源稳定的方法,能够减少因集群出错而造成的资源丢失和数据丢失,减少处理的步骤和时间,降低因此给用户带来的影响。
本发明实施例提供一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤:A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;B、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接。
优选的,还包括步骤:E、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。
实施本发明实施例,具有如下有益效果:本发明基于云计算平台保持主机资源稳定的方法,通过使用特定集群自动接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的一段时间集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用特定集群能自动接管损坏集群下的主机资源同时通知管理员修复损坏集群,若损坏的集群能修复,直接开机自动接入平台,收回那些主机资源,重新管理;若不能修复,则提供新集群替换损坏集群的方法来管理丢失的主机,尽量保证资源的稳定性,灵活管理主机资源。
附图说明
图1是本发明所提供的基于云计算平台保持主机资源稳定的方法的流程图。
图2是图1所示基于云计算平台保持主机资源稳定的方法的具体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,本发明提供了一种基于云计算平台保持主机资源稳定的方法,所述方法包括:
步骤S101、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;
步骤S102、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;
步骤S103、所述云计算平台通知管理员对所述异常集群进行修复;
步骤S104、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接;
步骤S105、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。
下面,结合图2,对本发明的基于云计算平台保持主机资源稳定的方法进行详细描述,包括:
步骤S11:主机向集群b提出注册请求;
步骤S12:注册成功后,集群b向主机返回注册成功消息;并执行
步骤S13:将主机注册记录发送给云计算平台;
以上步骤为现有技术中主机注册到集群上的通用技术,在此不详细描述。
步骤S14:当集群b发生异常情况时,云计算平台监控到与集群b的通讯中断;
步骤S15:等待一段时间后云计算平台再次向集群b发送命令,若等待一段时间后仍无回答,则判断集群b以及集群b下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;
步骤S16:接着,云计算平台通知一特定集群a与所述状态丢失的主机进行连接通信;
在该步骤中,所述特定集群a可以理解为:云平台中因集群所在主机不能正常通信导致云控制器无法管理该集群下的正常主机,而特定集群用于找回这些主机;当损坏主机修复后,特定集群会自动归还集群的这部分主机。因此,特定集群在正常情况下其实和其他集群一样的,执行集群的程序,但这些程序都是平台来控制的。当云计算平台知道丢失主机的IP,特定集群会通过IP联系上丢失主机。
步骤S17:特定集群a与状态丢失的主机连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;
在该步骤中,所述特定集群从所述云计算平台获取所述主机的IP地址和端口号以与所述主机实现连接;当连接成功后,所述特定集群将集群编号发送给所送主机进行验证,验证符合规则后便可获取所送主机的资源。
步骤S18:同时,所述云计算平台通知管理员对所述异常集群b进行修复(图中没显示),若集群b修复成功,所述云计算平台与修复后的集群b重新连接;
步骤S19:修复后的集群b回收所述主机资源,所述云计算平台通过所述修复后的异常集群获取主机资源,并将所述主机的状态更改为正在进行;
步骤S20:所述云计算平台通知特定集群不再管理所述主机,使特定集群与主机断开连接;
步骤S21:但是,若所述集群b修复失败,将修复失败结果通知云计算平台;
步骤S22:所述云计算平台通知新集群c替换所述异常集群b;
在该步骤中,我们了解,每一个集群具有一个唯一与硬件绑定的集群编号,由IP地址、MAC地址以及特定标示加密生成,该集群编号记录在集群数据库中。一台主机值属于一个集群,所以主机更换需要平台、集群的数据更换。在替换集群时,在新集群c上部署好环境并开启服务,该新集群c通过向云计算平台的接口输入新集群的IP地址和MAC地址后生成新的集群编号,以替换所述异常集群的集群编号。
步骤S23:替换成功后,所送云计算平台通过所述新的集群编号将所述异常集群下的主机信息发送到所述新集群;所送新集群通过所送主机信息与对应的主机实现连接,并将集群编号发送给所送主机进行验证,验证符合规则后便可获取所述对应的主机的资源,从而,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。
综上所述,本发明基于云计算平台保持主机资源稳定的方法,通过使用特定集群自动接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的一段时间集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用特定集群能自动接管损坏集群下的主机资源同时通知管理员修复损坏集群,若损坏的集群能修复,直接开机自动接入平台,收回那些主机资源,重新管理;若不能修复,则提供新集群替换损坏集群的方法来管理丢失的主机,尽量保证资源的稳定性,灵活管理主机资源。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (4)

1.一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤:
A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;
B、所述云计算平台通知一特定集群与所述状态丢失的主机进行通信,连接成功后,所述云计算平台通过所述特定集群重新获取状态丢失的主机的资源,并将所述主机的状态更改为找回;
C、所述云计算平台通知管理员对所述异常集群进行修复;
D、当所述异常集群修复成功,所述云计算平台与修复后的异常集群重新连接,并通过所述修复后的异常集群获取主机资源,将所述主机的状态更改为正在进行,同时中断所述特定集群与所述主机的连接;
E、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述云计算平台通过所述新集群获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行。
2.如权利要求1所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤A中,当云计算平台发现与异常集群通讯中断时,等待一段时间后再次向所述异常集群发送命令,如无应答才判断所述异常集群及注册到所述异常集群下的主机状态丢失。
3.如权利要求1所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤B中,所述特定集群从所述云计算平台获取所述主机的IP地址和端口号以与所述主机实现连接;当连接成功后,所述特定集群将集群编号发送给所述主机进行验证,验证符合规则后便可获取所述主机的资源。
4.如权利要求1所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述云计算平台通知一新集群替换所述异常集群具体包括步骤:
E1、所述云计算平台选择一新集群,所述新集群通过向云计算平台的接口 输入新集群的IP地址和MAC地址后生成新的集群编号,以替换所述异常集群的集群编号;
E2、所述云计算平台通过所述新的集群编号将所述异常集群下的主机信息发送到所述新集群;
E3、所述新集群通过所述主机信息与对应的主机实现连接,并将集群编号发送给所述主机进行验证,验证符合规则后便可获取所述对应的主机的资源。
CN201210287500.9A 2012-08-13 2012-08-13 基于云计算平台保持主机资源稳定的方法 Expired - Fee Related CN102769675B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210287500.9A CN102769675B (zh) 2012-08-13 2012-08-13 基于云计算平台保持主机资源稳定的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210287500.9A CN102769675B (zh) 2012-08-13 2012-08-13 基于云计算平台保持主机资源稳定的方法

Publications (2)

Publication Number Publication Date
CN102769675A CN102769675A (zh) 2012-11-07
CN102769675B true CN102769675B (zh) 2015-04-22

Family

ID=47096923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210287500.9A Expired - Fee Related CN102769675B (zh) 2012-08-13 2012-08-13 基于云计算平台保持主机资源稳定的方法

Country Status (1)

Country Link
CN (1) CN102769675B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105871631B (zh) * 2016-05-31 2019-04-09 武汉光迅科技股份有限公司 一种基于snmp协议找回丢失ip的方法
CN110061983B (zh) * 2019-04-09 2020-11-06 苏宁云计算有限公司 一种数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873237A (zh) * 2010-06-13 2010-10-27 用友软件股份有限公司 动态维护集群中的成员服务器的方法和系统
CN102164184A (zh) * 2011-04-22 2011-08-24 广州杰赛科技股份有限公司 云计算网络中计算机实体的接入和管理方法及云计算网络
CN102325192A (zh) * 2011-09-30 2012-01-18 上海宝信软件股份有限公司 云计算实现方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873237A (zh) * 2010-06-13 2010-10-27 用友软件股份有限公司 动态维护集群中的成员服务器的方法和系统
CN102164184A (zh) * 2011-04-22 2011-08-24 广州杰赛科技股份有限公司 云计算网络中计算机实体的接入和管理方法及云计算网络
CN102325192A (zh) * 2011-09-30 2012-01-18 上海宝信软件股份有限公司 云计算实现方法和系统

Also Published As

Publication number Publication date
CN102769675A (zh) 2012-11-07

Similar Documents

Publication Publication Date Title
CN103368768B (zh) 混合云环境中自动缩放网络覆盖的方法、装置及设备
CN106301876B (zh) 物理机升级方法、业务迁移方法及装置
US11561817B2 (en) High availability for virtual network functions
CN104899095A (zh) 虚拟机器的资源调整方法及系统
CN105681077A (zh) 故障处理方法、装置及系统
CN103516759B (zh) 云系统资源管理方法、云呼叫中心坐席管理方法和云系统
CN102594861A (zh) 一种多服务器负载均衡的云存储系统
CN105183554A (zh) 高性能计算与云计算混合计算系统及其资源管理方法
CN108881512A (zh) Ctdb的虚拟ip均衡分配方法、装置、设备及介质
CN104539716A (zh) 云桌面管理系统桌面虚拟机调度控制系统及方法
CN106385330B (zh) 一种网络功能虚拟化编排器的实现方法及装置
CN112948063A (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
CN109274537A (zh) 一种连续性网络虚拟化平台系统
CN102819470A (zh) 基于私有云计算平台的虚拟机修复方法
CN104850394A (zh) 分布式应用程序的管理方法和分布式系统
CN107291821A (zh) 一种同城双活架构快速切换的方法
CN110661865A (zh) 一种网络通信方法及网络通信架构
CN109002354A (zh) 一种基于OpenStack的计算资源容量弹性伸缩方法及系统
CN102769675B (zh) 基于云计算平台保持主机资源稳定的方法
CN102882970B (zh) 基于云计算平台保持主机资源稳定的方法
CN107579850B (zh) 一种云数据中心基于sdn控制的有线无线混合组网方法
EP4232933A1 (en) Techniques for generating a configuration for electrically isolating fault domains in a data center
CN109144666A (zh) 一种跨云平台的资源处理方法及系统
CN113504968A (zh) 一种电厂数据中心的搭建方法
CN102868594B (zh) 一种消息处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150422