CN105302661A - 一种实现虚拟化管理平台高可用的系统和方法 - Google Patents

一种实现虚拟化管理平台高可用的系统和方法 Download PDF

Info

Publication number
CN105302661A
CN105302661A CN201410242890.7A CN201410242890A CN105302661A CN 105302661 A CN105302661 A CN 105302661A CN 201410242890 A CN201410242890 A CN 201410242890A CN 105302661 A CN105302661 A CN 105302661A
Authority
CN
China
Prior art keywords
main frame
service
network interface
management platform
standby host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410242890.7A
Other languages
English (en)
Inventor
王力
张征宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING CLOUD TIMES TECHNOLOGY Co Ltd
Original Assignee
BEIJING CLOUD TIMES TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING CLOUD TIMES TECHNOLOGY Co Ltd filed Critical BEIJING CLOUD TIMES TECHNOLOGY Co Ltd
Priority to CN201410242890.7A priority Critical patent/CN105302661A/zh
Publication of CN105302661A publication Critical patent/CN105302661A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种实现虚拟化管理平台高可用的系统和方法。该系统由配备双网卡、本地存储的虚拟化管理平台主机和备机以及网络交换设备构成。虚拟化管理平台主机和备机均安装相同的操作系统、本地数据库,并启动多个与高可用相关的服务。本发明提出的高可用解决方案无需额外的共享存储设备,而是采用普通的本地磁盘并利用分布式块设备技术实现数据库中数据的实时备份。同时,由于把此管理平台用到的所有的服务资源看作一个整体,故从根本上保证了虚拟化管理平台主机上的所有实例异常都能被检测到,并能够在最短的时间内切换到虚拟化管理平台备机上并启动所有依赖的服务。本发明以最少的成本和技术实现了一个保护范围广以及恢复效率高的完整高可用方案。

Description

一种实现虚拟化管理平台高可用的系统和方法
技术领域
本发明涉及虚拟化技术领域,具体涉及实现虚拟化管理平台高可用的技术领域。
背景技术
如说明书附图1所示,在虚拟化基础架构中,虚拟化管理平台101主要负责通过虚拟化管理代理102来集中管理多台被虚拟化的物理服务器104及其上托管的虚拟机103(VM,VirtualMachine),以实现对多台物理服务器之上的资源进行整合及弹性调度,同时还可以提供虚拟机迁移、虚拟机备份或虚拟机高可用(一种减少系统停工时间,保持服务连续性和可用性的技术方案)等附加功能。其中虚拟化架构中各组成部分的信息(静态信息或者动态信息)就保存在虚拟化管理数据库106中。在现有的虚拟化方案中,虚拟化管理平台101多采用单点服务模式,并没有提供数据和服务的高可用支持,这样,当虚拟化管理平台出现异常的时候通常会因为无法迅速恢复正常服务而影响整个虚拟化基础架构的正常运行。
针对虚拟化管理平台自身的高可用问题,常见的解决方案有两个:一是可以采用支持集群的数据库进而针对数据库采用高可用的方案;二是在运行虚拟化管理平台实例的服务器上通过部署一个驻留内存的监控程序来检测虚拟化管理平台的实例是否在正常运行,若该实例出现异常就重新启动一个新的虚拟化管理平台的实例服务。
从实际应用情况来看,这两个解决方案都还存在一些问题:第一个方案虽然可以较好的解决数据备份的问题,但是一般情况下数据会保存在共享存储上,因为成本问题这个方案对一些中小企业来说,是不可接受的。第二个方案虽然可以实现因虚拟化管理平台自己的原因导致的实例异常的快速恢复,但是不能解决因操作系统,网络等其它因素引起的管理平台不可用性。
故一个完整的虚拟化管理平台的高可用方案需要考虑实现的成本最低、保护的范围最广、恢复的效率最高以及技术复杂度最低等因素。
发明内容
本发明公开了一种实现虚拟化管理平台高可用的系统和方法。利用分布式块设备复制技术把数据库中的文件进行实时备份,解除高可用系统对共享存储的依赖。在此基础上把虚拟化管理平台所依赖的所有服务(虚拟化管理服务、文件同步服务、网络服务、数据库服务等)与虚拟化管理平台看作一个整体来进行高可用处理,从而实现虚拟化管理平台真正的高可用。
一种实现虚拟化管理平台高可用的系统,包括:虚拟化管理平台主机205和虚拟化管理平台备机225以及将二者连接起来的网络交换设备208。其中的虚拟化管理平台主机207和备机225的硬件配置和软件环境完全相同,都至少包括一个安装在本地硬盘上的数据库(201、221)以及多个本地服务(202、222)。其中本地服务(202、222)至少包括:虚拟化管理服务(203、215)、高可用管理服务(211、223)、文件同步服务(204、216)、心跳监控服务(212、224)等,这些服务的功能包括:
1)高可用管理服务(211、223)根据心跳监控服务发送的主机和备机的运行状态消息协调主机和备机的资源来保证高可用系统对外服务的连续性和可用性;
2、虚拟化管理服务(203、215)用于对虚拟化基础架构中的物理设备、虚拟设备以及对外服务进行综合管理,该服务是高可用系统中的核心服务,需要保证其可用性和连续性。
3)文件同步服务(204、216)采取分布式块设备复制技术把分布在不同物理机上的两块普通的磁盘在系统内核空间进行实时同步,因其直接复制的是二进制数据,故可以达到与共享存储相当的存取速度。
4)心跳监控服务(212、224)用于周期性的检测位于主机和备机上的与虚拟化管理平台高可用相关的服务(如虚拟化管理服务、数据库服务、文件同步服务、网络服务等)是否处于正常状态,若相关服务没有处于正常工作状态,则心跳监控服务将向高可用管理服务发送特定格式的消息,高可用管理服务将根据运行状态消息内容进行相应的处理。
一种实现虚拟化管理平台高可用的方法,包括以下步骤:
1)虚拟化管理平台主机上的高可用管理服务按照一定时间间隔向主机和备机上的心跳监控服务发送系统运行状态查询消息,心跳监控消息收集相关服务的状态信息并反馈给主机上的高可用管理服务;
2)当虚拟化管理平台主机上的数据库文件或进程文件发生变化的时候,文件同步服务实时的将相关文件的更新同步到虚拟化管理平台的备机上;
3)当虚拟化管理平台主机的服务实例出现异常时,高可用管理模块重新启动出现异常的服务实例;
4)当虚拟化管理平台主机出现故障时,心跳监控服务发送主机故障消息给备机的高可用管理服务,备机的高可用管理服务修改IP地址和MAC地址映射配置表,建立虚拟化管理平台对外服务的IP地址与备机MAC地址的映射关系,则来自虚拟化管理平台高可用系统外部的服务请求将被转发到虚拟化管理平台备机处理;
5)当虚拟化管理平台主机的故障修复后,执行主机加入高可用系统的流程,虚拟化管理平台备机上的文件同步服务首先将备机上的服务和数据文件同步到虚拟化管理平台主机,然后备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系,则来自虚拟化管理平台外部的服务请求将被转发到虚拟化管理平台主机处理。
本发明提出的高可用解决方案无需共享存储设备,而是采用普通磁盘并利用分布式块设备技术实现了数据库中数据的实时备份,使得中小企业的成本大幅节省。同时,由于把此管理平台用到的所有的服务资源看作一个整体,故从根本上保证了虚拟化管理平台主机上的所有的实例异常都能被检测到,并能够在最短的时间内切换到虚拟化管理平台备机上并启动所有依赖的服务。
附图说明
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为虚拟化基础架构示意图。
图2为虚拟化管理平台高可用系统架构示意图。
图3为虚拟化管理平台主、备机切换流程图。
具体实施方式
下面将结合本发明附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的其他实施例,都属于本发明保护的范围。
本发明所述的一种实现虚拟化管理平台高可用的系统和方法,包括如下实施内容。
1、虚拟化管理平台高可用系统的搭建,包括以下内容:
1)准备两台具有相同硬件配置的工业标准服务器作为虚拟化管理平台高可用系统的主机和备机;在主机和备机上各安装两块双网口网卡,通过已实现冗余的网络交换设备实现互连互通;主机和备机均配备支持RAID功能的硬盘阵列;
2)在主机和备机的本地硬盘上安装操作系统、用于保存虚拟化基础架构中各组成对象信息的数据库、虚拟化管理平台以及高可用管理软件。
2、虚拟化管理平台高可用系统主机和备机初始化,包括以下内容:
1)分别启动虚拟化管理平台的主机和备机,并在各自的系统配置文件(该文件提供了主、备机的硬件描述、网络信息以及相关服务、任务的定义等参数)中对虚拟化管理平台高可用系统初始化信息进行配置,包括以下内容:
①将当前服务器角色分别配置为主机和备机;
②配置高可用管理服务发送主、备机状态查询消息的时间间隔参数;
③配置触发备机切换步骤的因失效导致的主机未响应查询次数参数;
④配置主机和备机的第一网卡的第一网口作为状态查询消息和反馈消息的传输通道;
⑤配置主机和备机的第二网卡的第一网口作为各种操作和控制指令的传输通道;
⑥配置IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系;
⑦配置开机自动启动的服务以及心跳监控服务需要监控的服务名称和进程名称,如数据库服务、虚拟化管理服务、高可用管理服务、心跳监控服务、文件同步服务等;
2)分别重新启动虚拟化管理平台的主机和备机,使配置生效,高可用系统进入正常工作状态。
3、虚拟化管理平台高可用系统网络异常处理流程,包括以下内容:
1)网络监控服务按照预先设定的时间间隔查询虚拟机管理平台高可用系统中的主机和备机的网卡、网口的运行状态,缺省情况下启用的网络设备包括:主机的第一网卡206的第一网口207、备机的第一网卡226的第一网口220、主机的第二网卡213的第一网口210、备机的第二网卡217的第一网口218;
2)若主机的第一网卡206的第一网口207出现故障则:
①启用主机第一网卡206的第二网口209;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信号的通道设为主机第一网卡206的第二网口209;
3)若主机的第二网卡213的第一网口210出现故障则:
①启用主机第一网卡206的第二网口209;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第二网卡206的第二网口209;
4)若主机的第一网卡206出现故障则:
①启用第二网卡213的第二网口214;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信息的通道设为主机第二网卡213的第二网口214;
5)若主机的第二网卡213出现故障则:
①启用第一网卡206的第二网口209;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第一网卡206的第二网口209;
6)若主机的第一网卡和第二网卡均出现故障,则启动备机切换流程,由备机接管虚拟化管理平台服务;
7)若备机的第一网卡226的第一网口220出现故障则:
①启用备机第一网卡226的第二网口227;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信号的通道设为主机第一网卡226的第二网口227;
8)若备机的第二网卡217的第一网口218出现故障则:
①启用备机第一网卡217的第二网口219;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第二网卡217的第二网口219;
9)若备机的第一网卡226出现故障则:
①启用备机第二网卡217的第二网口219;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信息的通道设为主机第二网卡217的第二网口219;
10)若备机的第二网卡217出现故障则:
①启用备机第一网卡226的第二网口227;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第一网卡226的第二网口227;
11)若备机的第一网卡和第二网卡均出现故障,则启动备机恢复流程,待备机网络故障解决后再重新将备机加入虚拟化管理平台高可用系统。
4、通过高可用管理服务和心跳监控服务在主机和备机之间建立一个故障检测机制,包括以下内容:
1)高可用管理服务按照预设的时间间隔向虚拟化管理平台主机和备机上的心跳监控服务发送运行状态查询消息;
2)主机和备机的心跳监控服务实时获取相关服务的状态信息(包括服务的状态和系统的状态)并反馈给高可用管理服务;
3)如果主、备机的运行状态均正常,则高可用管理服务在预设的时间间隔后再次执行步骤1);
4)如果主机正常,备机异常,则高可用管理服务启动备机恢复流程;
5)如果主机异常,备机正常,则高可用管理服务启动备机切换流程,备机切换流程结束后高可用管理服务将启动主机恢复流程。
5、虚拟化管理平台主机出现故障后备机切换的过程,包括以下内容:
1)当虚拟化管理平台主机出现故障后,备机的高可用管理服务接管高可用系统的控制权,并启动备机上所有必要的服务;
2)备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与备机MAC地址的映射关系,则来自虚拟化管理平台高可用系统的外部服务请求将被转发到虚拟化管理平台备机处理;
3)启动虚拟化管理平台主机的恢复流程。
6、虚拟化管理平台备机的恢复流程,包括以下内容:
1)高可用管理服务根据备机上的心跳监控服务反馈回来的消息内容进行相应的处置;
2)若故障为虚拟化管理等相关服务的失败,则高可用管理服务重启相应的服务;
3)若故障为主机部件的物理问题,则可更换好的部件后再启动相应的服务;
4)虚拟化管理平台备机向主机的高可用管理服务发送故障修复消息,高可用管理服务将备机加入高可用系统,并同步相关的数据和服务到备机,使高可用系统重新进入正常运行状态。
7、虚拟化管理平台主机恢复流程,包括以下内容:
1)高可用管理服务根据主机心跳监控服务反馈回来的消息内容进行相应的处置;
2)若故障为虚拟化管理等相关服务的失败,则高可用管理服务重启相应的服务;
3)若故障为主机部件的物理问题,则可更换好的部件后再启动相应的服务;
4)虚拟化管理平台主机向备机的高可用管理服务发送故障修复消息;
5)虚拟化管理平台备机将主机加入高可用系统,并同步相关的数据和服务到主机;
6)备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系,则来自虚拟化管理平台高可用系统的外部服务请求将被转发到虚拟化管理平台主机处理;
7)备机的高可用管理服务将控制权移交到主机的高可用管理服务,高可用系统重新进入正常运行状态。
本发明实施例可以较低的成本搭建一个虚拟化管理平台的高可用系统,同时,该实施例能够确保虚拟化管理平台主机发生故障的时候快速切换到备机从而继续提供所需的服务。故本发明实施例能够有效提高虚拟化基础架构的整体高可用性,有利于虚拟化基础架构的部署、实施和推广。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnlyMemory)、随机存取记忆体(RAM,RandomAccessMemory)、磁盘或光盘。
以上对本发明实施例所提供的一种实现虚拟化管理平台高可用的系统和方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时对于本领域的一般技术人员,一举本发明的思想,在具体实施方式及应用范围上均会有所改变,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种实现虚拟化管理平台高可用的系统,其特征在于,由虚拟化管理平台主机、虚拟化管理平台备机以及将二者连接起来的网络交换设备构成;其中,虚拟化管理平台主机和备机的硬件配置和软件环境完全相同,都至少包括一个安装在本地硬盘上的数据库以及多个本地服务;其中本地服务至少包括:虚拟化管理服务、高可用管理服务、文件同步服务及心跳监控服务等,这些服务的功能在于:
1)高可用管理服务根据心跳监控服务发送的主机和备机的系统运行状态消息协调主机和备机的资源来保证高可用系统对外服务的连续性和可用性;
2)虚拟化管理服务用于对虚拟化基础架构中的物理设备、虚拟设备以及对外服务进行综合管理,该服务是高可用系统中的核心服务,需要保证其可用性和连续性;
3)文件同步服务采取分布式块设备复制技术把分布在不同物理机上的两块普通的磁盘在系统内核空间进行实时同步,因其直接复制的是二进制数据,故可以达到与共享存储相当的存取速度;
4)心跳监控服务用于周期性的检测位于主机和备机上的与虚拟化管理平台高可用相关的服务(如虚拟化管理服务、数据库服务、文件同步服务、网络服务等)是否处于正常状态,若相关服务没有处于正常工作状态,则心跳监控服务将向高可用管理服务发送特定格式的消息,而高可用管理服务将根据运行状态消息的内容进行相应的处理。
2.一种实现虚拟化管理平台高可用的方法,其特征在于,包括以下步骤:
1)虚拟化管理平台主机上的高可用管理服务按照一定时间间隔向主机和备机上的心跳监控服务发送系统运行状态查询消息,心跳监控消息收集相关服务的状态信息并反馈给主机上的高可用管理服务;
2)当虚拟化管理平台主机上的数据库文件或进程文件发生变化的时候,文件同步服务实时的将相关文件的更新同步到虚拟化管理平台的备机上;
3)当虚拟化管理平台主机的服务实例出现异常时,高可用管理模块重新启动出现异常的服务实例;
4)当虚拟化管理平台主机出现故障时,心跳监控服务发送主机故障消息给备机的高可用管理服务,备机的高可用管理服务修改IP地址和MAC地址映射配置表,建立虚拟化管理平台对外服务的IP地址与备机MAC地址的映射关系,则来自虚拟化管理平台高可用系统外部的服务请求将被转发到虚拟化管理平台备机处理;
5)当虚拟化管理平台主机的故障修复后,执行主机加入高可用系统的流程,虚拟化管理平台备机上的文件同步服务首先将备机上的服务和数据文件同步到虚拟化管理平台主机,然后备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系,则来自虚拟化管理平台外部的服务请求将被转发到虚拟化管理平台主机处理。
3.如权利要求1所述的虚拟化管理平台高可用系统的搭建方法,其特征在于,包括以下内容:
1)准备两台具有相同硬件配置的工业标准服务器作为虚拟化管理平台高可用系统的主机和备机;在主机和备机上各安装两块双网口网卡,通过已实现冗余的网络交换设备实现互连互通;主机和备机均配备支持RAID功能的硬盘阵列;
2)在主机和备机的本地硬盘上安装操作系统、用于保存虚拟化基础架构中各组成对象信息的数据库、虚拟化管理平台以及高可用管理软件。
4.如权利要求1所述的虚拟化管理平台高可用系统的初始化过程,其特征在于,包括以下内容:
1)分别启动虚拟化管理平台的主机和备机,并在各自的系统配置文件(该文件提供了主、备机的硬件描述、网络信息以及相关服务、任务的定义等参数)中对虚拟化管理平台高可用系统初始化信息进行配置,包括以下内容:
①将当前服务器在高可用系统中的角色分别配置为主机和备机;
②配置高可用管理服务发送主、备机状态查询消息的时间间隔参数;
③配置触发备机切换步骤的因失败导致的主机未响应查询次数参数;
④配置主机和备机的第一网卡的第一网口作为状态查询消息和反馈消息的传输通道;
⑤配置主机和备机的第二网卡的第一网口作为各种操作和控制指令的传输通道;
⑥配置IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系;
⑦配置开机自动启动的服务以及心跳监控服务需要监控的服务名称和进程名称,如数据库服务、虚拟化管理服务、高可用管理服务、心跳监控服务、文件同步服务等;
2)分别重新启动虚拟化管理平台的主机和备机,使配置生效,高可用系统进入正常工作状态。
5.如权利要求1所述的由心跳监控服务反馈给高可用管理服务的主机和备机运行状态的消息格式,其特征在于:
1)在一条消息内包含了多项系统状态信息,如文件同步服务、虚拟化管理服务、网络服务、数据库服务等的状态信息;
2)对于每一个监控项的状态信息存在多个预定义的不同状态以及对应的数字编码;
3)多个监控项的状态编码按照预定义的顺序排列并封装后通过网络反馈给高可用管理服务。
6.如权利要求1所述的虚拟化管理平台高可用系统,其特征在于,在主机和备机之间存在一个故障检测机制,包括以下内容:
1)高可用管理服务按照预设的时间间隔向虚拟化管理平台主机和备机上的心跳监控服务发送系统运行状态查询消息;
2)主机和备机的心跳监控服务实时获取系统中相关服务的状态信息并反馈给高可用管理服务;
3)如果主机和备机的运行状态均正常,则高可用管理服务在预设的时间间隔后再次执行步骤1);
4)如果主机正常,备机异常,则高可用管理服务启动备机恢复流程;
5)如果主机异常,备机正常,则高可用管理服务启动备机切换流程,备机切换流程结束后高可用管理服务将启动主机恢复流程。
7.如权利要求6所述的在主机或备机的故障恢复阶段的网络故障处理流程,其特征在于,包括以下内容:
1)心跳监控服务接收到高可用管理服务的系统状态查询消息后将虚拟化管理平台高可用系统中的主机和备机的网卡、网口的运行状态消息反馈给高可用管理服务进行后续处理,缺省情况下主机和备机上启用的网络设备包括:主机的第一网卡的第一网口、备机的第一网卡的第一网口、主机的第二网卡的第一网口、备机的第二网卡的第一网口;
2)若主机的第一网卡的第一网口出现故障,则:
①启用主机第一网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信号的通道设为主机第一网卡的第二网口;
3)若主机的第二网卡的第一网口出现故障,则:
①启用主机第一网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第二网卡的第二网口;
4)若主机的第一网卡出现故障,则:
①启用第二网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信息的通道设为主机第二网卡的第二网口;
5)若主机的第二网卡出现故障,则:
①启用第一网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第一网卡的第二网口;
6)若主机的第一网卡和第二网卡均出现故障,则启动备机切换流程,由备机接管虚拟化管理平台服务;
7)若备机的第一网卡的第一网口出现故障,则:
①启用备机第一网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信号的通道设为主机第一网卡的第二网口;
8)若备机的第二网卡的第一网口出现故障,则:
①启用备机第一网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第二网卡的第二网口;
9)若备机的第一网卡出现故障,则:
①启用备机第二网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信息的通道设为主机第二网卡的第二网口;
10)若备机的第二网卡出现故障,则:
①启用备机第一网卡的第二网口;
②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第一网卡的第二网口;
11)若备机的第一网卡和第二网卡均出现故障,则启动备机恢复流程,待备机网络故障解决后再重新将备机加入虚拟化管理平台高可用系统。
8.如权利要求6所述的虚拟化管理平台主机出现故障后备机切换的流程,其特征在于,包括以下内容:
1)当虚拟化管理平台主机出现故障后,备机的高可用管理服务接管高可用系统的控制权,检查并启动备机上所有必要的服务;
2)备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与备机MAC地址的映射关系,则来自虚拟化管理平台高可用系统的外部服务请求将被转发到虚拟化管理平台备机处理。
9.如权利要求6所述的虚拟化管理平台备机的恢复流程,其特征在于,包括以下内容:
1)主机上的高可用管理服务根据备机上的心跳监控服务反馈回来的运行状态消息进行相应的处置;
2)若故障为虚拟化管理等相关服务的失败,则主机上的高可用管理服务协调备机上的高可用管理服务重启备机上的相应服务;
3)若故障为备机部件的物理问题,则可在更换新的部件后重启虚拟化管理平台备机;
4)虚拟化管理平台备机向虚拟化管理平台主机发送故障修复消息;
5)主机的高可用管理服务将主机上的相关数据和服务同步到备机,使高可用系统重新进入正常运行状态。
10.如权利要求6所述的虚拟化管理平台主机的恢复流程,其特征在于,包括以下内容:
1)主机的高可用管理服务根据主机心跳监控服务反馈回来的消息内容进行相应的处置;
2)若故障为虚拟化管理等相关服务的失败,则主机的高可用管理服务重启相应的服务;
3)若故障为主机部件的物理问题,则可在更换新的部件后启动虚拟化管理平台主机;
4)虚拟化管理平台主机向虚拟化管理平台备机发送故障修复消息;
5)虚拟化管理平台备机将备机上的相关数据和服务同步到主机;
6)备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系,则来自虚拟化管理平台高可用系统的外部服务请求将被转发到虚拟化管理平台主机处理;
7)主机的高可用管理服务得到控制权,高可用系统重新进入正常运行状态。
CN201410242890.7A 2014-06-04 2014-06-04 一种实现虚拟化管理平台高可用的系统和方法 Pending CN105302661A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410242890.7A CN105302661A (zh) 2014-06-04 2014-06-04 一种实现虚拟化管理平台高可用的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410242890.7A CN105302661A (zh) 2014-06-04 2014-06-04 一种实现虚拟化管理平台高可用的系统和方法

Publications (1)

Publication Number Publication Date
CN105302661A true CN105302661A (zh) 2016-02-03

Family

ID=55199953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410242890.7A Pending CN105302661A (zh) 2014-06-04 2014-06-04 一种实现虚拟化管理平台高可用的系统和方法

Country Status (1)

Country Link
CN (1) CN105302661A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106411589A (zh) * 2016-09-29 2017-02-15 北京神州绿盟信息安全科技股份有限公司 一种实现高可用的方法和装置
CN107368537A (zh) * 2017-06-23 2017-11-21 芜湖恒天易开软件科技股份有限公司 违章数据查询告警系统
CN107423113A (zh) * 2017-06-30 2017-12-01 华为技术有限公司 一种管理虚拟设备的方法、带外管理设备及备用虚拟设备
WO2018001262A1 (zh) * 2016-06-30 2018-01-04 中兴通讯股份有限公司 虚拟机容灾方法、装置及系统
CN108268302A (zh) * 2016-12-30 2018-07-10 华为技术有限公司 实现设备启动的方法和装置
CN108345510A (zh) * 2018-01-11 2018-07-31 中国人民解放军国防科技大学 一种自动巡检检测大规模离线归档系统可靠性的方法
CN108365970A (zh) * 2018-01-09 2018-08-03 长沙曙通信息科技有限公司 一种虚拟桌面网卡故障自动调试实现方法
CN109408302A (zh) * 2017-08-16 2019-03-01 阿里巴巴集团控股有限公司 一种故障检测方法、装置及电子设备
CN109857034A (zh) * 2019-03-01 2019-06-07 中国航空无线电电子研究所 实时热备份综合数据处理系统
CN109871298A (zh) * 2019-03-14 2019-06-11 大连海大船舶导航国家工程研究中心有限责任公司 一种linux系统船舶交通管理数据实时双机内存热备方法
CN110177048A (zh) * 2019-05-28 2019-08-27 银联商务股份有限公司 一种虚拟私有云系统的高可用实现方法及装置
CN110908723A (zh) * 2019-11-29 2020-03-24 新华三大数据技术有限公司 操作系统的主备切换方法、装置及相关设备
CN110933142A (zh) * 2019-11-07 2020-03-27 浪潮电子信息产业股份有限公司 一种icfs集群网卡监控方法、装置和设备及介质
CN111385107A (zh) * 2018-12-27 2020-07-07 大唐移动通信设备有限公司 一种服务器的主备切换处理方法及装置
CN112202934A (zh) * 2020-08-20 2021-01-08 国网浙江省电力有限公司培训中心 应用于电力监控系统的调试设备网络快速切换方法及系统
CN112199048A (zh) * 2020-10-20 2021-01-08 重庆紫光华山智安科技有限公司 数据读取方法、系统、设备及介质
CN112313908A (zh) * 2018-04-18 2021-02-02 西门子股份公司 用于控制和/或监控装置的方法和控制系统
CN112637336A (zh) * 2020-12-22 2021-04-09 新华三大数据技术有限公司 一种虚拟机高可用实现方法、装置及存储介质
CN115114083A (zh) * 2022-03-14 2022-09-27 重庆紫光华山智安科技有限公司 基于视频监控平台的存储容灾方法、装置、设备和介质

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018001262A1 (zh) * 2016-06-30 2018-01-04 中兴通讯股份有限公司 虚拟机容灾方法、装置及系统
CN107566139A (zh) * 2016-06-30 2018-01-09 中兴通讯股份有限公司 虚拟机容灾方法、装置及系统
CN106411589A (zh) * 2016-09-29 2017-02-15 北京神州绿盟信息安全科技股份有限公司 一种实现高可用的方法和装置
CN108268302A (zh) * 2016-12-30 2018-07-10 华为技术有限公司 实现设备启动的方法和装置
CN108268302B (zh) * 2016-12-30 2020-12-04 华为技术有限公司 实现设备启动的方法和装置
CN107368537A (zh) * 2017-06-23 2017-11-21 芜湖恒天易开软件科技股份有限公司 违章数据查询告警系统
CN107423113B (zh) * 2017-06-30 2020-07-07 华为技术有限公司 一种管理虚拟设备的方法、带外管理设备及备用虚拟设备
CN107423113A (zh) * 2017-06-30 2017-12-01 华为技术有限公司 一种管理虚拟设备的方法、带外管理设备及备用虚拟设备
CN109408302A (zh) * 2017-08-16 2019-03-01 阿里巴巴集团控股有限公司 一种故障检测方法、装置及电子设备
CN108365970A (zh) * 2018-01-09 2018-08-03 长沙曙通信息科技有限公司 一种虚拟桌面网卡故障自动调试实现方法
CN108345510A (zh) * 2018-01-11 2018-07-31 中国人民解放军国防科技大学 一种自动巡检检测大规模离线归档系统可靠性的方法
CN112313908A (zh) * 2018-04-18 2021-02-02 西门子股份公司 用于控制和/或监控装置的方法和控制系统
US11412047B2 (en) 2018-04-18 2022-08-09 Siemens Aktiengesellschaft Method and control system for controlling and/or monitoring devices
CN112313908B (zh) * 2018-04-18 2022-06-14 西门子股份公司 用于控制和/或监控装置的方法和控制系统
CN111385107A (zh) * 2018-12-27 2020-07-07 大唐移动通信设备有限公司 一种服务器的主备切换处理方法及装置
CN111385107B (zh) * 2018-12-27 2021-07-06 大唐移动通信设备有限公司 一种服务器的主备切换处理方法及装置
CN109857034B (zh) * 2019-03-01 2022-04-29 中国航空无线电电子研究所 实时热备份综合数据处理系统
CN109857034A (zh) * 2019-03-01 2019-06-07 中国航空无线电电子研究所 实时热备份综合数据处理系统
CN109871298A (zh) * 2019-03-14 2019-06-11 大连海大船舶导航国家工程研究中心有限责任公司 一种linux系统船舶交通管理数据实时双机内存热备方法
CN110177048B (zh) * 2019-05-28 2022-03-25 银联商务股份有限公司 一种虚拟私有云系统的高可用实现方法及装置
CN110177048A (zh) * 2019-05-28 2019-08-27 银联商务股份有限公司 一种虚拟私有云系统的高可用实现方法及装置
CN110933142A (zh) * 2019-11-07 2020-03-27 浪潮电子信息产业股份有限公司 一种icfs集群网卡监控方法、装置和设备及介质
CN110908723A (zh) * 2019-11-29 2020-03-24 新华三大数据技术有限公司 操作系统的主备切换方法、装置及相关设备
CN112202934A (zh) * 2020-08-20 2021-01-08 国网浙江省电力有限公司培训中心 应用于电力监控系统的调试设备网络快速切换方法及系统
CN112199048A (zh) * 2020-10-20 2021-01-08 重庆紫光华山智安科技有限公司 数据读取方法、系统、设备及介质
CN112637336A (zh) * 2020-12-22 2021-04-09 新华三大数据技术有限公司 一种虚拟机高可用实现方法、装置及存储介质
CN112637336B (zh) * 2020-12-22 2022-05-27 新华三大数据技术有限公司 一种虚拟机高可用实现方法、装置及存储介质
CN115114083A (zh) * 2022-03-14 2022-09-27 重庆紫光华山智安科技有限公司 基于视频监控平台的存储容灾方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN105302661A (zh) 一种实现虚拟化管理平台高可用的系统和方法
US8615676B2 (en) Providing first field data capture in a virtual input/output server (VIOS) cluster environment with cluster-aware vioses
CN202798798U (zh) 基于云计算技术的高可用系统
EP2800303B1 (en) Switch method, device and system for virtual application dual machine in cloud environment
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
EP3210367B1 (en) System and method for disaster recovery of cloud applications
EP3217627B1 (en) Arbitration method, apparatus and system for active-active data centers
US20080307254A1 (en) Information-processing equipment and system therefor
CN112181660A (zh) 一种基于服务器集群的高可用方法
CN103019889A (zh) 分布式文件系统及其故障处理方法
CN102394914A (zh) 集群脑裂处理方法和装置
CN101237315A (zh) 一种用于双控高可用系统的同步检测和故障隔离方法
CN104639367A (zh) 一种实现主备服务器切换的方法及系统
CN101873223A (zh) 基于ip切换的n+m服务备份机制
CN104506372A (zh) 一种实现主备服务器切换的方法及系统
CN114090184B (zh) 一种虚拟化集群高可用性的实现方法和设备
CN105589756A (zh) 批处理集群系统以及方法
JP4592511B2 (ja) Ipネットワークサーバのバックアップシステム
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
CN105490847A (zh) 一种私有云存储系统中节点故障实时检测及处理方法
JP5285044B2 (ja) クラスタシステム復旧方法及びサーバ及びプログラム
CN101567804B (zh) 一种实现系统异常保护的方法、设备和系统
KR102327520B1 (ko) 무중단 네트워크 미러링 솔루션 시스템 및 그 방법
CN102833096A (zh) 一种低成本的高可用系统实现方法及装置
KR20140140719A (ko) 가상 머신 동기화 장치 및 시스템과 이를 이용한 장애 처리 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160203

WD01 Invention patent application deemed withdrawn after publication