CN103581177A - 虚拟机管理方法及装置 - Google Patents

虚拟机管理方法及装置 Download PDF

Info

Publication number
CN103581177A
CN103581177A CN201310507851.0A CN201310507851A CN103581177A CN 103581177 A CN103581177 A CN 103581177A CN 201310507851 A CN201310507851 A CN 201310507851A CN 103581177 A CN103581177 A CN 103581177A
Authority
CN
China
Prior art keywords
virtual machine
data center
tolerant
fault
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310507851.0A
Other languages
English (en)
Inventor
王春风
张永森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310507851.0A priority Critical patent/CN103581177A/zh
Publication of CN103581177A publication Critical patent/CN103581177A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种虚拟机管理方法,包括:第一管理节点在第一数据中心的第一计算节点创建主虚拟机,在第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,所述容错虚拟机与所述主虚拟机规格相同;指示所述第一计算节点将所述主虚拟机的内存数据同步到所述第二计算节点。本发明实施例还提供相应的装置。本发明技术方案由于将主虚拟机和容错虚拟机分别创建在不同的数据中心内,使得,当主虚拟机或者主虚拟机所在的数据中心发生故障时,可以将业务即时切换到另一数据中心的容错虚拟机,从而使业务在整个数据中心故障时也能够持续可用。

Description

虚拟机管理方法及装置
技术领域
本发明涉及通信技术领域,具体涉及一种虚拟机管理方法及装置。
背景技术
现有的虚拟机(Virtual Machine,VM)容错(Fault Tolerance)技术可以创建与主虚拟机保持实时同步的虚拟机影子实例,当发生硬件故障时,能够在两个虚拟机实例之间进行即时故障切换,从而消除数据丢失或业务中断的风险,使应用在服务器发生故障的情况下也能够持续可用。
请参考图1,现有的虚拟机容错方法包括:在一个计算节点中开通称为生产主机的虚拟机,并对已经开通的生产主机开通容错特性,同时,在另外一个计算节点上自动会生成称为容错主机的虚拟机。正常运行情况下,生产主机对外提供业务且与容错主机同步,但容错主机处于暂停状态,不对外提供服务;生产主机和容错主机采用共享存储器,使用同一块存储单元保存内存数据,保证两者的内存数据一致。当生产主机或者生产主机所在的物理节点发生不可恢复故障后,虚拟资源管理节点会检测到生产主机故障,则虚拟资源管理节点将容错主机置于工作状态,接替生产主机提供业务,因为内存数据是完全一致的,所以业务宕机时间为零。
现有的虚拟机容错技术只适用于在同一个数据中心内部进行故障虚拟机切换,如果整个数据中心出现大规模故障,例如,火灾、水灾或供电故障灯,则现有的虚拟机容错技术难以实现故障虚拟机切换,不能保证业务持续可用,可靠性不够高。
发明内容
本发明实施例提供一种虚拟机管理方法及装置,以解决现有的虚拟机容错技术在整个数据中心出现大规模故障时不能保证业务持续可用的技术问题。
本发明第一方面提供一种虚拟机管理方法,包括:
用于虚拟机容错系统,所述虚拟机容错系统包括第一数据中心和第二数据中心,所述第一数据中心和所述第二数据中心分别包括管理节点和计算节点以及存储设备,所述计算节点与所述存储设备连接;所述第一数据中心的存储设备和所述第二数据中心的存储设备通信,且所述第一数据中心的第一管理节点和所述第二数据中心的第二管理节点通信;所述方法包括:所述第一管理节点在所述第一数据中心的第一计算节点创建主虚拟机,在所述第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,所述容错虚拟机与所述主虚拟机规格相同;指示所述第一计算节点将所述主虚拟机的内存数据同步到所述第二计算节点。
在第一种可能的实现方式中,所述虚拟机管理方法还包括:若所述第一管理节点检测到所述主虚拟机发生故障,则将所述容错虚拟机转为运行态;或者,若所述第二管理节点检测到所述第一数据中心发生故障,则将述容错虚拟机转为运行态。
结合第一方面或者第一种可能的实现方式,在第二种可能的实现方式中,所述第一管理节点在所述第一数据中心的第一计算节点创建主虚拟机之前还包括:所述第一管理节点接收来自客户端的虚拟机创建申请,所述虚拟机创建申请包含需要创建的虚拟机的规格;根据所述虚拟机创建申请,生成并下发创建虚拟机指令给所述第一计算节点和所述第二计算节点。
结合第一方面或者第一种可能的实现方式,在第三种可能的实现方式中,所述虚拟机容错系统还包括域名系统;所述虚拟机管理方法还包括:所述域名系统建立所述主虚拟机运行的业务的域名与所述主虚拟机的地址的映射关系;若所述业务从所述主虚拟机迁移至所述容错虚拟机,则将所述映射关系中的地址更新为所述所述容错虚拟机的地址。
结合第一方面或者第一种可能的实现方式,在第四种可能的实现方式中,所述虚拟机管理方法还包括:所述第一管理节点指示所述第一数据中心的路由设备发布所述主虚拟机运行的业务的精细路由,指示所述第二数据中心的路由设备发布所述业务的粗略路由;若检测到所述业务从所述主虚拟机迁移至所述容错虚拟机,则切换路由发布策略,指示所述第二数据中心的路由设备发布所述业务的精细路由,指示所述第一数据中心的路由设备发布所述业务的粗略路由;其中,所述精细路由包括所述主虚拟机或容错虚拟机的地址,所述粗略路由包括所述主虚拟机或容错虚拟机所属的虚拟局域网的地址。
本发明第二方面提供一种虚拟机管理装置,包括:
用于虚拟机容错系统,所述虚拟机容错系统包括第一数据中心和第二数据中心,所述第一数据中心和所述第二数据中心分别包括管理节点和计算节点以及存储设备,所述计算节点与所述存储设备连接;所述第一数据中心的存储设备和所述第二数据中心的存储设备通信,且所述第一数据中心的第一管理节点和所述第二数据中心的第二管理节点通信;所述虚拟机管理装置部署在所述第一管理节点和第二管理节点中,所述虚拟机管理装置包括:创建单元,用于在所述第一数据中心的第一计算节点创建主虚拟机,在所述第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,所述容错虚拟机与所述主虚拟机规格相同;同步单元,用于指示所述第一计算节点将所述主虚拟机的内存数据同步到所述第二计算节点。
在第一种可能的实现方式中,所述虚拟机管理装置还包括:检测单元,用于检测所述主虚拟机和所述第一数据中心是否发生故障;切换单元,用于若所述检测单元检测到所述主虚拟机或者所述第一数据中心发生故障,则将所述容错虚拟机转为运行态。
结合第二方面或者第一种可能的实现方式,在第二种可能的实现方式中,所述虚拟机管理装置还包括:接收单元,用于接收来自客户端的虚拟机创建申请,所述虚拟机创建申请包含需要创建的虚拟机的规格;所述创建单元,具体用于根据所述虚拟机创建申请,生成并下发创建虚拟机指令给所述第一计算节点和所述第二计算节点。
结合第二方面或者第一种可能的实现方式,在第三种可能的实现方式中,所述虚拟机容错系统还包括域名系统;所述域名系统用于建立所述主虚拟机运行的业务的域名与所述主虚拟机的地址的映射关系;所述虚拟机管理装置还包括:域名发布控制单元,用于若所述业务从所述主虚拟机迁移至所述容错虚拟机,则指示所述域名系统将所述映射关系中的地址更新为所述所述容错虚拟机的地址。
结合第二方面或者第一种可能的实现方式,在第四种可能的实现方式中,所述虚拟机管理装置还包括:路由发布控制单元,用于指示所述第一数据中心的路由设备发布所述主虚拟机运行的业务的精细路由,指示所述第二数据中心的路由发布设备发布所述业务的粗略路由;还用于若所述业务从所述主虚拟机迁移至所述容错虚拟机,则切换路由发布策略,指示所述第二数据中心的路由设备发布所述业务的精细路由,指示所述第一数据中心的路由设备发布所述业务的粗略路由;其中,所述精细路由包括所述主虚拟机或容错虚拟机的地址,所述粗略路由包括所述主虚拟机或容错虚拟机所属的虚拟局域网的地址。
本发明实施例采用将主虚拟机和容错虚拟机分别创建在不同的数据中心内的技术方案,使得,当主虚拟机或者主虚拟机所在的数据中心发生故障时,可以将业务即时切换到另一数据中心的容错虚拟机,从而使业务在整个数据中心故障时也能够持续可用,解决了现有的虚拟机容错技术的缺陷。
附图说明
图1是现有的虚拟机容错技术的示意图;
图2是本发明实施例提供的虚拟机容错系统的示意图;
图3是本发明实施例提供的虚拟机管理方法的流程图;
图4是本实施例跨数据中心的虚拟机容错流程图;
图5是本实施例中用户开通带有跨站容错特性的虚拟机的流程图;
图6是本发明一个实施例的网络架构的示意图;
图7本发明另一实施例的网络架构的示意图;
图8是本发明实施例提供的虚拟机管理装置的示意图。
具体实施方式
本发明实施例提供一种虚拟机管理方法及装置,可以解决现有的虚拟机容错技术在整个数据中心出现大规模故障时不能保证业务持续可用的技术问题。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例一、
本发明实施例提供一种虚拟机管理方法,用于虚拟机容错系统。
请参考图2,虚拟机容错系统包括两个数据中心,即第一数据中心和第二数据中心,每个数据中心包括管理节点和计算节点以及存储设备,每个数据中心内的计算节点与存储设备连接;第一数据中心的存储设备和所述第二数据中心的存储设备通信,且第一数据中心的管理节点和第二数据中心的管理节点通信。
其中,管理节点具体可以是虚拟资源管理节点。计算节点具体可以采用光纤通道(Fibre Channel,FC)与存储设备连接。多个计算节点可以构成物理集群,多个存储设备则可以构成存储局域网络(Storage Area Network,SAN)。每个数据中心还可以部署有云计算管理平台,以便对整个数据中心进行统一管理,虚拟资源管理节点和其它网络设备例如防火墙(firewall,FW)等接入云计算管理平台,云计算管理平台则通过核心交换机(Core Switch,CSW)接入互联网。第一数据中心和第二数据中心的存储设备通过光纤链路通信,管理节点通过二层(L2)链路通信。所述二层链路具体可以是物理链路例如光纤链路或者双绞线电缆等,也可以是虚拟专用网络(Virtual Private Network,VPN)链路。
具体的,第一数据中心和第二数据中心可以采用华为存储设备6600T远程同步功能实现相互同步,优选两个数据中心是同城的数据中心,相互距离最好不超过100Km,以保证同步效果。存储设备之间的光纤链路采用物理光纤,优选延迟小于1ms,物理带宽大于等于1GB。出于同步性能和兼容性等方面的考虑,与计算节点通过光纤通道连接的多个存储设备构成的SAN采用光纤通道SAN。
需要注意的是,分别承担生产站点和容灾站点功能的两个数据中心的业务都要通过主网关出口,因此网络规划时生产站点和容灾站点间的业务网络带宽需要考虑这一部分的冗余;同时需要支持跨站点的虚拟机热迁移,也要考虑这一部分流量冗余。
下面具体介绍本发明实施例方法,为方便描述,下文中将第一数据中心的管理节点称为第一管理节点,将第二数据中心的管理节点称为第二管理节点。
请参考图3,本发明实施例提供的虚拟机管理方法包括:
301、第一管理节点在第一数据中心的第一计算节点创建主虚拟机,在第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,容错虚拟机与主虚拟机的规格相同。
本发明实施例的虚拟机容错系统,其两个数据中心的两个管理节点只有一个处于正常运行状态,称为主管理节点,另一个管理节点处于暂停状态,称为备管理节点;当主管理节点所在的数据中心发生故障时,原来的备管理节点自动升主,成为新的主管理节点。
为保证虚拟机能够在异地容错,本实施例中由主管理节点将主虚拟机和容错虚拟机分别创建在两个数据中心内。假定当前的主管理节点是第一管理节点,则由第一管理节点在第一数据中心的的第一计算节点创建主虚拟机,在第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,且容错虚拟机与主虚拟机的规格相同。所述规格相同是指主虚拟机占用的CPU和内存等资源与容错虚拟机占用的CPU和内存等资源相同。
一种实施方式中,需要创建虚拟机时,客户端发送虚拟机创建申请,所述虚拟机创建申请包含需要创建的虚拟机的规格,并且包含开通容错特性的指示;当第一管理节点接收到来自客户端的虚拟机创建申请后,下发创建虚拟机指令给第一数据中心中的第一计算节点,以便在所述第一计算节点创建所需要的规格的虚拟机。同时,下发创建虚拟机指令给第二数据中心中的第二计算节点,以便在第二数据中心的第二计算节点创建与主虚拟机规格相同的容错虚拟机,作为主虚拟机的影子实例。当主虚拟机正常运行提供业务时,容错虚拟机处于暂停状态。
302、指示第一计算节点将主虚拟机的内存数据同步到第二计算节点。
作为主管理节点的第一计算节点可以实时检测主虚拟机的运行状态。若检测到主虚拟机运行正常,则实时进行主虚拟机和容错虚拟机的数据同步,包括:指示第一计算节点采用远程同步功能将主虚拟机的内存数据实时同步到第二计算节点。同步过程中,内存数据通过管理层面的L2链路传递,底层SAN数据通过存储层面的光纤链路传递。
可选的,302之后还可以包括:若主虚拟机发生故障,则将容错虚拟机转为运行态。具体包括:若第一管理节点检测到所述主虚拟机发生故障,则将所述容错虚拟机转为运行态,以接替所述主虚拟机继续提供业务。或者,若整个第一数据中心发生故障,导致主虚拟机以及第一管理节点均停止工作时,第二管理节点自动切换为主管理节点,由第二管理节点将容错虚拟机转为运行态,以接替主虚拟机继续提供业务。
为了对上述方法做进一步的说明,下面从不同的角度分别进行详细描述:
图4本实施例跨数据中心的容错流程,包括:
1、主虚拟机(又称为生产虚拟主机或生产主机)正常运行时,作为管理节点的虚拟资源管理节点检测主虚拟机的运行状态。
2、若主虚拟机正常运行,虚拟资源管理节点控制生产主机和容错虚拟机(又称为容错主机)之间同步内存数据。具体为:控制生产主机所在计算节点通过管理层面网络将主虚拟机的内存数据同步到容错主机所在计算节点。
3、生产主机发生不可恢复故障后,虚拟资源管理节点检测到生产主机故障。
4、虚拟资源管理节点控制容错主机转为运行状态,接替生产主机继续提供业务。
图5是本实施例中用户开通带有跨站容错特性的虚拟机的流程,包括:
1、用户登录自助服务门户(Portal),计划开通带跨站容错属性的VM。
2、用户申请创建VM,选择VM带有跨数据中心的容错特性。
3、运营系统提交管理员审批VM申请。
4、管理员审批创建VM申请。
5、运营系统提交VM创建申请,传递VM规格。
6、云计算管理平台传递创建虚拟机指令,包含虚拟机规格。
7、云计算管理平台下的管理节点下发包含虚拟机规格的创建虚拟机指令给计算节点。
8、计算节点根据指令创建虚拟机,分配虚拟机所需资源,包含容错属性。
同时,管理节点还下发创建虚拟机指令给另一数据中心的另一计算节点,在另一计算节点创建相同规格的容错虚拟机。
9、返回创建虚拟机结果给客户端。
综上,本发明实施例提供了一种虚拟机管理方法,该方法采用将主虚拟机和容错虚拟机分别创建在不同的数据中心内的技术方案,使得,当主虚拟机或者主虚拟机所在的数据中心发生故障时,可以将主虚拟机运行的业务即时切换到另一数据中心的容错虚拟机,从而使业务在整个数据中心故障时也能够持续可用,解决了现有的虚拟机容错技术的缺陷。
本技术方案可以用在公有云,提供对外租赁的多租户场景,用户可以选择自己的业务是否有跨数据中心容错的属性。同时本技术方案也可以用在私有云,私有云所在企业需要拥有至少2个数据中心。
一种实施方式中,本发明虚拟机容错系统的网络架构图如图6所示,其中的资源池具体为图2中示出的数据中心。为了解决跨数据中心的虚拟机容错之后,业务的地址跨数据中心变化,而带来的虚拟机业务切换所遇到的问题;本发明实施例的虚拟机容错系统还包括域名系统;本发明实施例提供的虚拟机管理方法还可以包括:
A1、域名系统建立所述主虚拟机运行的业务的域名与所述主虚拟机的地址的映射关系;
A2、若所述业务从所述主虚拟机迁移至所述容错虚拟机,则将所述映射关系中的地址更新为所述所述容错虚拟机的地址。
其中,域名系统用于接收来自客户端的业务访问请求,所述业务访问请求中携带业务的域名;根据业务的域名解析主虚拟机的地址,并将主虚拟机的地址返回给客户端。
可选的,所述域名系统具体可以包括全局域名系统和分属于两个数据中心的两个下级域名系统。所述域名系统具体可以采用全球流量管理系统和域名系统(Domain Name System,DNS)。客户端访问主虚拟机提供的业务之前,首先要经过全局域名系统解析域名;全局域名系统对所述业务的域名进行初次解析后,根据解析结果判断该业务的域名所属的数据中心,将所述业务的域名授权给该数据中心对应的下级域名系统进一步解析,由所述对应的下级域名系统解析出运行所述业务的的主虚拟机的地址。当业务从主虚拟机迁移到容错虚拟机后,业务的公网地址就发生了变化,具体为从原主虚拟机的地址变化为原容错虚拟机的地址,则域名系统更新所述映射关系。
以上,本发明实施例采用由域名系统根据业务是否迁移实时更新业务的域名对应的主虚拟机的地址,解决了跨数据中心的虚拟机容错之后,业务的地址跨数据中心变化,而带来的虚拟机业务切换所遇到的问题。
另一种实施方式中,本发明虚拟机容错系统的网络架构图如图7所示,其中的资源池具体为图2中示出的数据中心。为了解决跨数据中心的虚拟机容错之后,业务的地址跨数据中心变化,而带来的虚拟机业务切换所遇到的问题;本发明实施例提供的虚拟机管理方法还可以包括:
B1、第一管理节点指示第一数据中心的路由设备发布主虚拟机运行的业务的精细路由,指示第二数据中心的路由设备发布所述业务的粗略路由;
B2、第一管理节点若检测到所述业务从所述主虚拟机迁移至所述容错虚拟机,则切换路由发布策略,指示所述第二数据中心的路由设备发布所述业务的精细路由,指示第一数据中心的路由设备发布所述业务的粗略路由;
其中,所述精细路由包括所述主虚拟机或容错虚拟机的地址,所述粗略路由包括所述主虚拟机或容错虚拟机所属的虚拟局域网的地址。
本实施方式适用于两个数据中心在同城,并且运营商可以为一个业务提供同城同网段的IP地址,即一个公网IP地址可以在一个数据中心,也可以切换到另外一个数据中心的应用场景。所述第一或第二数据中心的路由设备具体可以是防火墙或者核心交换机或者网关所在的汇聚交换机。
所述的切换路由发布策略具体可以包括:
1、如果使用了防火墙进行网络地址转换(Network Address Translation,NAT),则在防火墙上发布对外路由,否则在核心交换机上发布路由,如果没有核心交换机则在网关所在的汇聚交换机发布路由;
2、虚拟机业务所运行侧的站点,也就是主虚拟机所在数据中心的路由设备对外发布该网段的精细路由,对端站点也就是容错虚拟机所在的数据中心的路由设备发布该网段的粗略路由。如果规划两侧站点对外分别提供不同业务,也是按照同样策略进行发布。
3、举例说明:某个数据中心直接通过汇聚交换机对外三层接入。按照规划,业务A的虚拟机运行在站点1,业务A的虚拟局域网VLAN子网是10.1.1.0/24,则在站点1发布业务A的精细路由10.1.1.0/25;10.1.1.128/25,在站点2发布业务A的粗略路由10.1.1.0/24;业务B的虚拟机运行在站点2,业务B的VLAN子网是10.1.2.0/24,则在站点1发布业务B的粗略路由10.1.2.0/24,在站点2发布业务B的精细路由10.1.2.0/25;10.1.2.128/25。所述的站点可以理解为数据中心。
4、当发生容错切换后,由主管理节点切换明细路由和粗略路由的发布,按照规划,某个虚拟机业务所运行侧的站点主机发生故障,主机发生容错切换,在容灾站点容错生效并被拉起。此时该主虚拟机的公网IP地址,变为在故障站点发布粗略路由,在对端站点发布明细路由,这样,互联网上的流量访问可以通过互联网的公网路由表访问到正确的业务所在站点。
以上,本发明实施例采用由主管理节点根据业务是否迁移指示路由设备发布精细路由或粗略路由,解决了跨数据中心的虚拟机容错之后,业务的地址跨数据中心变化,而带来的虚拟机业务切换所遇到的问题。
实施例二、
请参考图8,本发明实施例提供一种虚拟机管理装置800,用于虚拟机容错系统,所述系统包括第一数据中心和第二数据中心,所述第一数据中心和所述第二数据中心分别包括管理节点和计算节点以及存储设备,所述计算节点与所述存储设备连接;所述第一数据中心和所述第二数据中心的存储设备通信,且所述第一数据中心的第一管理节点和所述第二数据中心的第二管理节点通信;
所述虚拟机管理装置800部署在第一管理节点和第二管理节点中,具体包括:
创建单元801,用于在所述第一数据中心的第一计算节点创建主虚拟机,在所述第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,所述容错虚拟机与所述主虚拟机规格相同;
同步单元802,用于指示所述第一计算节点将所述主虚拟机的内存数据同步到所述第二计算节点。
一种实施方式中,所述虚拟机管理装置800还可以包括:
检测单元,用于检测所述主虚拟机和所述第一数据中心是否发生故障;
切换单元,用于若所述检测单元检测到所述主虚拟机或者所述第一数据中心发生故障,则控制所述容错虚拟机转为运行态。
可选的,另一种实施方式中,所述虚拟机管理装置800还可以包括:
接收单元,用于接收来自客户端的虚拟机创建申请,所述虚拟机创建申请包含需要创建的虚拟机的规格;
相应的,所述创建单元801,具体用于根据所述虚拟机创建申请,生成并下发创建虚拟机指令给所述第一计算节点和所述第二计算节点。
可选的,又一种实施方式中,所述虚拟机容错系统还包括域名系统,所述域名系统用于建立所述主虚拟机运行的业务的域名与所述主虚拟机的地址的映射关系;所述虚拟机管理装置800还可以包括:域名发布控制单元,用于若所述业务从所述主虚拟机迁移至所述容错虚拟机,则指示所述域名系统将所述映射关系中的地址更新为所述所述容错虚拟机的地址。
可选的,再一种实施方式中,所述虚拟机管理装置800还可以包括:
路由发布控制单元,用于指示所述第一数据中心的路由设备发布所述主虚拟机运行的业务的精细路由,指示所述第二数据中心的路由发布设备发布所述业务的粗略路由;还用于若所述业务从所述主虚拟机迁移至所述容错虚拟机,则切换路由发布策略,指示所述第二数据中心的路由设备发布所述业务的精细路由,指示所述第一数据中心的路由设备发布所述业务的粗略路由;其中,所述精细路由包括所述主虚拟机或容错虚拟机的地址,所述粗略路由包括所述主虚拟机或容错虚拟机所属的虚拟局域网的地址。
以上,对本发明实施例装置进行了说明,更详细的描述请参考实施例一。
本发明实施例提供的虚拟机管理装置部署在管理节点,可以将主虚拟机和容错虚拟机分别创建在不同的数据中心内,当主虚拟机所在的数据中心发生不可恢复故障时,将业务即时切换到另一数据中心的容错虚拟机的技术方案,从而使业务在整个数据中心故障时也能够持续可用,解决了现有的虚拟机容错技术的缺陷。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤可以通过硬件来完成,也可以通过程序指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机读取存储器、磁盘或光盘等。
以上对本发明实施例所提供的虚拟机管理方法及相应的装置进行了详细介绍,但以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,不应理解为对本发明的限制。本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种虚拟机管理方法,其特征在于,用于虚拟机容错系统,所述虚拟机容错系统包括第一数据中心和第二数据中心,所述第一数据中心和所述第二数据中心分别包括管理节点和计算节点以及存储设备,所述计算节点与所述存储设备连接;所述第一数据中心的存储设备和所述第二数据中心的存储设备通信,且所述第一数据中心的第一管理节点和所述第二数据中心的第二管理节点通信;所述方法包括:
所述第一管理节点在所述第一数据中心的第一计算节点创建主虚拟机,在所述第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,所述容错虚拟机与所述主虚拟机规格相同;
指示所述第一计算节点将所述主虚拟机的内存数据同步到所述第二计算节点。
2.根据权利要求1所述的方法,其特征在于,还包括:
若所述第一管理节点检测到所述主虚拟机发生故障,则将所述容错虚拟机转为运行态;或者,若所述第二管理节点检测到所述第一数据中心发生故障,则将述容错虚拟机转为运行态。
3.根据权利要求1或2所述的方法,其特征在于,所述第一管理节点在所述第一数据中心的第一计算节点创建主虚拟机之前还包括:
所述第一管理节点接收来自客户端的虚拟机创建申请,所述虚拟机创建申请包含需要创建的虚拟机的规格;
根据所述虚拟机创建申请,生成并下发创建虚拟机指令给所述第一计算节点和所述第二计算节点。
4.根据权利要求1或2所述的方法,其特征在于,所述虚拟机容错系统还包括域名系统;所述方法还包括:
所述域名系统建立所述主虚拟机运行的业务的域名与所述主虚拟机的地址的映射关系;
若所述业务从所述主虚拟机迁移至所述容错虚拟机,则将所述映射关系中的地址更新为所述所述容错虚拟机的地址。
5.根据权利要求1或2所述的方法,其特征在于,还包括:
所述第一管理节点指示所述第一数据中心的路由设备发布所述主虚拟机运行的业务的精细路由,指示所述第二数据中心的路由设备发布所述业务的粗略路由;
若检测到所述业务从所述主虚拟机迁移至所述容错虚拟机,则切换路由发布策略,指示所述第二数据中心的路由设备发布所述业务的精细路由,指示所述第一数据中心的路由设备发布所述业务的粗略路由;
其中,所述精细路由包括所述主虚拟机或容错虚拟机的地址,所述粗略路由包括所述主虚拟机或容错虚拟机所属的虚拟局域网的地址。
6.一种虚拟机管理装置,其特征在于,用于虚拟机容错系统,所述虚拟机容错系统包括第一数据中心和第二数据中心,所述第一数据中心和所述第二数据中心分别包括管理节点和计算节点以及存储设备,所述计算节点与所述存储设备连接;所述第一数据中心的存储设备和所述第二数据中心的存储设备通信,且所述第一数据中心的第一管理节点和所述第二数据中心的第二管理节点通信;所述虚拟机管理装置部署在所述第一管理节点和第二管理节点中,所述虚拟机管理装置包括:
创建单元,用于在所述第一数据中心的第一计算节点创建主虚拟机,在所述第二数据中心的第二计算节点创建所述主虚拟机的容错虚拟机,所述容错虚拟机与所述主虚拟机规格相同;
同步单元,用于指示所述第一计算节点将所述主虚拟机的内存数据同步到所述第二计算节点。
7.根据权利要求6所述的虚拟机管理装置,其特征在于,还包括:
检测单元,用于检测所述主虚拟机和所述第一数据中心是否发生故障;
切换单元,用于若所述检测单元检测到所述主虚拟机或者所述第一数据中心发生故障,则将所述容错虚拟机转为运行态。
8.根据权利要求6或7所述的虚拟机管理装置,其特征在于,还包括:
接收单元,用于接收来自客户端的虚拟机创建申请,所述虚拟机创建申请包含需要创建的虚拟机的规格;
所述创建单元,具体用于根据所述虚拟机创建申请,生成并下发创建虚拟机指令给所述第一计算节点和所述第二计算节点。
9.根据权利要求6或7所述的虚拟机管理装置,其特征在于,所述虚拟机容错系统还包括域名系统;所述域名系统用于建立所述主虚拟机运行的业务的域名与所述主虚拟机的地址的映射关系;所述虚拟机管理装置还包括:
域名发布控制单元,用于若所述业务从所述主虚拟机迁移至所述容错虚拟机,则指示所述域名系统将所述映射关系中的地址更新为所述所述容错虚拟机的地址。
10.根据权利要求6或7所述的虚拟机管理装置,其特征在于,还包括:
路由发布控制单元,用于指示所述第一数据中心的路由设备发布所述主虚拟机运行的业务的精细路由,指示所述第二数据中心的路由发布设备发布所述业务的粗略路由;还用于若所述业务从所述主虚拟机迁移至所述容错虚拟机,则切换路由发布策略,指示所述第二数据中心的路由设备发布所述业务的精细路由,指示所述第一数据中心的路由设备发布所述业务的粗略路由;
其中,所述精细路由包括所述主虚拟机或容错虚拟机的地址,所述粗略路由包括所述主虚拟机或容错虚拟机所属的虚拟局域网的地址。
CN201310507851.0A 2013-10-24 2013-10-24 虚拟机管理方法及装置 Pending CN103581177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310507851.0A CN103581177A (zh) 2013-10-24 2013-10-24 虚拟机管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310507851.0A CN103581177A (zh) 2013-10-24 2013-10-24 虚拟机管理方法及装置

Publications (1)

Publication Number Publication Date
CN103581177A true CN103581177A (zh) 2014-02-12

Family

ID=50052107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310507851.0A Pending CN103581177A (zh) 2013-10-24 2013-10-24 虚拟机管理方法及装置

Country Status (1)

Country Link
CN (1) CN103581177A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885857A (zh) * 2014-03-10 2014-06-25 中标软件有限公司 虚拟机容错方法以及设备
CN104484231A (zh) * 2014-12-31 2015-04-01 武汉邮电科学研究院 虚拟机切换系统及切换方法
CN104536842A (zh) * 2014-12-17 2015-04-22 中电科华云信息技术有限公司 基于kvm虚拟化的虚拟机容错方法
CN104618155A (zh) * 2015-01-23 2015-05-13 华为技术有限公司 一种虚拟机容错的方法、装置及系统
CN105446792A (zh) * 2014-08-27 2016-03-30 联想(北京)有限公司 一种虚拟机的部署方法、部署装置和管理节点
CN105591801A (zh) * 2015-08-11 2016-05-18 杭州华三通信技术有限公司 一种虚拟网络功能vnf故障处理方法及vnf管理设备
CN105721550A (zh) * 2016-01-21 2016-06-29 北京乐动卓越科技有限公司 一种客户端容错监控方法及系统
CN106101280A (zh) * 2016-08-18 2016-11-09 无锡华云数据技术服务有限公司 一种数据中心间的网络信息同步更新方法
CN106301876A (zh) * 2015-06-26 2017-01-04 中兴通讯股份有限公司 物理机升级方法、业务迁移方法及装置
WO2017045436A1 (zh) * 2015-09-18 2017-03-23 中兴通讯股份有限公司 虚拟机故障处理方法和装置
CN106972970A (zh) * 2017-03-31 2017-07-21 山东超越数控电子有限公司 一种避免oVirt云平台管理节点单点故障的方法
CN107566139A (zh) * 2016-06-30 2018-01-09 中兴通讯股份有限公司 虚拟机容灾方法、装置及系统
CN107562519A (zh) * 2017-09-05 2018-01-09 联想(北京)有限公司 虚拟机的迁移方法、系统及服务器
CN107995319A (zh) * 2018-01-08 2018-05-04 迈普通信技术股份有限公司 虚拟设备配置方法及网络设备
CN109995554A (zh) * 2017-12-29 2019-07-09 中国移动通信集团吉林有限公司 多级数据中心主备切换的控制方法及云调度指挥器
CN111258867A (zh) * 2015-12-30 2020-06-09 华为技术有限公司 一种公有云的拨测方法和装置
WO2020134678A1 (zh) * 2018-12-29 2020-07-02 中兴通讯股份有限公司 容灾方法、装置及系统
CN111435320A (zh) * 2019-01-14 2020-07-21 阿里巴巴集团控股有限公司 一种数据处理方法及其装置
CN112256477A (zh) * 2020-10-09 2021-01-22 上海云轴信息科技有限公司 一种虚拟化容错方法及设备
CN113157393A (zh) * 2021-04-09 2021-07-23 上海云轴信息科技有限公司 管理节点高可用方法及设备
CN113225375A (zh) * 2021-03-29 2021-08-06 北京城建智控科技有限公司 一种基于分布式的中心车站一体城轨云架构系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5488716A (en) * 1991-10-28 1996-01-30 Digital Equipment Corporation Fault tolerant computer system with shadow virtual processor
CN1312922A (zh) * 1998-08-11 2001-09-12 艾利森电话股份有限公司 容错计算机系统
CN101593136A (zh) * 2008-05-30 2009-12-02 国际商业机器公司 使得计算机具有高可用性的方法和计算机系统
CN102523257A (zh) * 2011-11-30 2012-06-27 广东电子工业研究院有限公司 一种基于iaas云平台的虚拟机容错方法
CN102761566A (zh) * 2011-04-26 2012-10-31 国际商业机器公司 迁移虚拟机的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5488716A (en) * 1991-10-28 1996-01-30 Digital Equipment Corporation Fault tolerant computer system with shadow virtual processor
CN1312922A (zh) * 1998-08-11 2001-09-12 艾利森电话股份有限公司 容错计算机系统
CN101593136A (zh) * 2008-05-30 2009-12-02 国际商业机器公司 使得计算机具有高可用性的方法和计算机系统
CN102761566A (zh) * 2011-04-26 2012-10-31 国际商业机器公司 迁移虚拟机的方法和装置
CN102523257A (zh) * 2011-11-30 2012-06-27 广东电子工业研究院有限公司 一种基于iaas云平台的虚拟机容错方法

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885857B (zh) * 2014-03-10 2017-05-17 中标软件有限公司 虚拟机容错方法以及设备
CN103885857A (zh) * 2014-03-10 2014-06-25 中标软件有限公司 虚拟机容错方法以及设备
CN105446792A (zh) * 2014-08-27 2016-03-30 联想(北京)有限公司 一种虚拟机的部署方法、部署装置和管理节点
CN105446792B (zh) * 2014-08-27 2019-09-24 联想(北京)有限公司 一种虚拟机的部署方法、部署装置和管理节点
CN104536842A (zh) * 2014-12-17 2015-04-22 中电科华云信息技术有限公司 基于kvm虚拟化的虚拟机容错方法
CN104484231A (zh) * 2014-12-31 2015-04-01 武汉邮电科学研究院 虚拟机切换系统及切换方法
CN104618155A (zh) * 2015-01-23 2015-05-13 华为技术有限公司 一种虚拟机容错的方法、装置及系统
CN104618155B (zh) * 2015-01-23 2018-06-05 华为技术有限公司 一种虚拟机容错的方法、装置及系统
US10411953B2 (en) 2015-01-23 2019-09-10 Huawei Technologies Co., Ltd. Virtual machine fault tolerance method, apparatus, and system
CN106301876A (zh) * 2015-06-26 2017-01-04 中兴通讯股份有限公司 物理机升级方法、业务迁移方法及装置
CN106301876B (zh) * 2015-06-26 2019-11-29 南京中兴新软件有限责任公司 物理机升级方法、业务迁移方法及装置
CN105591801A (zh) * 2015-08-11 2016-05-18 杭州华三通信技术有限公司 一种虚拟网络功能vnf故障处理方法及vnf管理设备
CN105591801B (zh) * 2015-08-11 2019-01-22 新华三技术有限公司 一种虚拟网络功能vnf故障处理方法及vnf管理设备
WO2017045436A1 (zh) * 2015-09-18 2017-03-23 中兴通讯股份有限公司 虚拟机故障处理方法和装置
CN111258867A (zh) * 2015-12-30 2020-06-09 华为技术有限公司 一种公有云的拨测方法和装置
CN111258867B (zh) * 2015-12-30 2022-04-22 华为技术有限公司 一种公有云的拨测方法和装置
CN105721550A (zh) * 2016-01-21 2016-06-29 北京乐动卓越科技有限公司 一种客户端容错监控方法及系统
CN105721550B (zh) * 2016-01-21 2019-04-19 北京乐动卓越科技有限公司 一种客户端容错监控方法及系统
CN107566139A (zh) * 2016-06-30 2018-01-09 中兴通讯股份有限公司 虚拟机容灾方法、装置及系统
CN106101280B (zh) * 2016-08-18 2019-01-22 无锡华云数据技术服务有限公司 一种数据中心间的网络信息同步更新方法
CN106101280A (zh) * 2016-08-18 2016-11-09 无锡华云数据技术服务有限公司 一种数据中心间的网络信息同步更新方法
CN106972970A (zh) * 2017-03-31 2017-07-21 山东超越数控电子有限公司 一种避免oVirt云平台管理节点单点故障的方法
CN107562519A (zh) * 2017-09-05 2018-01-09 联想(北京)有限公司 虚拟机的迁移方法、系统及服务器
CN109995554A (zh) * 2017-12-29 2019-07-09 中国移动通信集团吉林有限公司 多级数据中心主备切换的控制方法及云调度指挥器
CN107995319A (zh) * 2018-01-08 2018-05-04 迈普通信技术股份有限公司 虚拟设备配置方法及网络设备
CN107995319B (zh) * 2018-01-08 2021-05-18 迈普通信技术股份有限公司 虚拟设备配置方法及网络设备
WO2020134678A1 (zh) * 2018-12-29 2020-07-02 中兴通讯股份有限公司 容灾方法、装置及系统
CN111435320A (zh) * 2019-01-14 2020-07-21 阿里巴巴集团控股有限公司 一种数据处理方法及其装置
CN111435320B (zh) * 2019-01-14 2023-04-11 阿里巴巴集团控股有限公司 一种数据处理方法及其装置
CN112256477A (zh) * 2020-10-09 2021-01-22 上海云轴信息科技有限公司 一种虚拟化容错方法及设备
CN113225375B (zh) * 2021-03-29 2022-01-21 北京城建智控科技股份有限公司 一种基于分布式的中心车站一体城轨云架构系统
CN113225375A (zh) * 2021-03-29 2021-08-06 北京城建智控科技有限公司 一种基于分布式的中心车站一体城轨云架构系统
CN113157393A (zh) * 2021-04-09 2021-07-23 上海云轴信息科技有限公司 管理节点高可用方法及设备

Similar Documents

Publication Publication Date Title
CN103581177A (zh) 虚拟机管理方法及装置
Wood et al. CloudNet: dynamic pooling of cloud resources by live WAN migration of virtual machines
US20190140890A1 (en) Method and system of a dynamic high-availability mode based on current wide area network connectivity
CN101390336B (zh) 灾难恢复体系结构
CN103999412B (zh) 软件部署拓扑结构
US20120224588A1 (en) Dynamic networking of virtual machines
CN106506588A (zh) 多地多中心的数据中心双活方法和系统
CN104794028B (zh) 一种容灾处理方法、装置、主用数据中心和备用数据中心
CN107078951A (zh) 从虚拟端口信道对等体故障恢复
CN105827623A (zh) 数据中心系统
CN204859222U (zh) 同城数据中心双活高可用系统
CN105262820A (zh) 一种基于Linux操作系统的集群多机互备的方法
US9042270B2 (en) Method and apparatus of network configuration for storage federation
CN104767676A (zh) Sdn网络中的数据报文转发方法和系统
US20140258771A1 (en) High-availability cluster architecture and protocol
JP2013539877A5 (zh)
CN112039682A (zh) 软件定义数据中心在运营商网络中的运用及实践的方法
Oechsner et al. Flexible support of VNF placement functions in OpenStack
CN107391294A (zh) 一种ipsan容灾系统的建立方法及装置
CN103856357B (zh) 一种堆叠系统故障处理方法及堆叠系统
Kokkinos et al. Survey: Live migration and disaster recovery over long-distance networks
CN109587286A (zh) 一种设备接入控制方法及装置
CN103095569A (zh) 一种高冗余低成本的热容灾广域网架构及其实现方法
CN104468791A (zh) 私有云IaaS平台的构建方法
CN108833153A (zh) 实现异地数据中心云资源统一管理的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140212