CN102819465B - 一种虚拟化环境中故障恢复的方法 - Google Patents

一种虚拟化环境中故障恢复的方法 Download PDF

Info

Publication number
CN102819465B
CN102819465B CN201210219947.2A CN201210219947A CN102819465B CN 102819465 B CN102819465 B CN 102819465B CN 201210219947 A CN201210219947 A CN 201210219947A CN 102819465 B CN102819465 B CN 102819465B
Authority
CN
China
Prior art keywords
server
virtual machine
physical
physical server
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210219947.2A
Other languages
English (en)
Other versions
CN102819465A (zh
Inventor
金海�
廖小飞
陆枫
潘浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201210219947.2A priority Critical patent/CN102819465B/zh
Publication of CN102819465A publication Critical patent/CN102819465A/zh
Application granted granted Critical
Publication of CN102819465B publication Critical patent/CN102819465B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种虚拟化环境中故障恢复的方法,包括步骤:调度服务器监控物理服务器的性能数据,以判断虚拟机是否发生故障,若发生故障,则调度服务器在故障物理服务器上选取待恢复虚拟机,并根据物理服务器的状态选取合适的物理接管服务器恢复虚拟机,调度服务器探测故障物理服务器的网络状况,若网络可用,则调度服务器向故障物理服务器和物理接管服务器发送做好迁移准备的指令,故障物理服务器将待恢复虚拟机实时迁移至物理接管服务器。本发明使虚拟化环境中的上层服务具有容错与容灾能力,提升了服务质量和基础架构利用率,降低物理基础架构成本,提升IT员工工作效率,并具有更好的安全和隔离性,以及良好的容灾和容错特性。

Description

一种虚拟化环境中故障恢复的方法
技术领域
本发明属于计算机技术领域,更具体地,涉及一种虚拟化环境中故障恢复的方法。
背景技术
传统灾难恢复计划需要许多手动、复杂的步骤来分配恢复资源、执行裸机恢复、执行数据恢复,并验证系统是否为使用做好了准备。搭建一套容灾备份系统无论是在金钱、还是在人力、技术投入上,都是一个耗资巨大、效果十分不明显的工程。容灾备份系统一旦建成,需要专人定期维护、检查、演练,以保证紧急时刻,系统可以正常启用。同时,容灾备份系统软硬件的选用,也要足以支撑起系统投入使用时的业务容量。对企业来说,搭建这样一个系统无疑是一笔巨大的支出。
随着x86服务器及台式机部署数量的日益增长,新的运行风险和IT基础架构的挑战也开始出现,现有的故障恢复的方法存在如下问题:1、基础架构的低利用率;2、会导致物理基础架构成本不断增加;3、会导致IT管理成本不断增加;4、缺乏故障恢复及灾难保护,导致台式机管理的安全性差。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种虚拟化环境中故障恢复的方法,其使虚拟化环境中的上层服务具有容错与容灾能力,提升了服务质量和基础架构利用率,降低物理基础架构成本,提升IT员工工作效率,并具有更好的安全和隔离性,以及良好的容灾和容错特性。
为实现上述目的,本发明提供了一种虚拟化环境中故障恢复的方法,包括以下步骤:
(1)调度服务器监控物理服务器的性能数据,以判断虚拟机是否发生故障;若发生故障,则进入步骤(2),否则过程结束;
(2)调度服务器在故障物理服务器上选取待恢复虚拟机,并根据物理服务器的状态选取合适的物理接管服务器恢复虚拟机;
(3)调度服务器探测故障物理服务器的网络状况,若网络可用则进入步骤(4),否则进入步骤(6);
(4)调度服务器向故障物理服务器和物理接管服务器发送做好迁移准备的指令;
(5)故障物理服务器将待恢复虚拟机实时迁移至物理接管服务器,过程结束;
(6)调度服务器在网络文件系统的检查点库中获取待恢复虚拟机的检查点索引文件,读取并解析文件,获得虚拟机运行时的虚拟CPU个数、内存占用量和检查点文件的路径,并发送给物理接管服务器;
(7)物理接管服务器从网络文件系统中读取检查点文件,并恢复虚拟机。
步骤(1)具体为:调度服务器广播收集物理服务器信息,根据收集的信息构建物理服务器状态表,为每个物理服务器设置定时器。物理服务器定期提取运行时的性能参数以及运行的虚拟机列表,编码写入心跳包中,将心跳包传输至调度服务器。调度服务器接收心跳包,解析心跳包内容,更新物理服务器状态表。
性能参数包括CPU总利用率、内存利用率、网络带宽占用率,虚拟机列表包括虚拟机名称,UUID,IP地址,虚拟CPU个数,内存占用量,网络上行速率,网络下行速率。
步骤(2)具体为:调度服务器获取待恢复虚拟机的虚拟CPU个数,内存占用量,网络带宽的资源需求,查找物理服务器状态表,筛选符合虚拟机资源需求的候选物理服务器,预匹配虚拟机与候选物理服务器,计算恢复后物理服务器CPU、内存和带宽的资源占用率,选取占用率最接近的物理服务器为最终的接管物理服务器。保证虚拟机恢复后物理服务器不出现某一资源短缺的情况,同时保证整体负载均衡。
步骤(2)包括以下子步骤:
(2-1)调度服务器判断故障类型;
(2-2)调度服务器根据故障类型选取待恢复虚拟机;
(2-3)调度服务器判断是否可筛选物理服务器作为候选物理接管服务器,若可筛选则进入子步骤(2-4),否则过程结束;
(2-4)调度服务器根据运行的虚拟机数量判断是否可以从候选物理接管服务器中选取一台物理接管服务器,若可以,则步骤(2)结束,否则进入子步骤(2-5);
(2-5)调度服务器根据故障类型,从候选物理接管服务器选取一台物理接管服务器。
故障类型包括CPU故障和内存故障。且CPU故障的优先级高于内存故障。
在步骤(2-2)中,当CPU故障时,选取CPU绝对占用率最高的虚拟机,其中CPU绝对占用率=虚拟机CPU占用率×虚拟CPU个数/物理服务器CPU核数,当内存故障时,选取内存占用量最高的虚拟机。
步骤(2-3)具体为:调度服务器遍历物理服务器状态表,筛选非故障且非锁定的空闲物理服务器作为候选物理接管服务器,非故障指物理服务器当前没有被监控到发生故障,非锁定指物理服务器当前并没有在进行迁移,空闲物理服务器指虚拟机恢复后的CPU和内存占用率均低于70%。
步骤(2-4)具体为:调度服务器首先从候选物理接管节点中选取运行虚拟机最少的物理服务器,若该节点运行的虚拟机少于等于3个,则确定该物理服务器为物理接管服务器。
步骤(2-5)具体为:当CPU故障时,选取CPU利用率最低的候选物理服务器,当内存故障时,选取内存占用率最低的候选物理服务器。
通过本发明所构思的以上技术方案,与现有技术相比,本发明具有以下的有益效果:
1、容错性与容灾性良好:本发明使用虚拟化环境中的步骤(5)实时迁移技术,在故障/灾难发生时及时的将承载上层服务的虚拟机迁移至安全稳定的物理服务器上,该过程对上层服务透明;使用虚拟化环境中的步骤(7)检查点技术,定时对虚拟机进行备份,防止故障/灾难发生后造成不可恢复的后果。提高了虚拟化环境中上层服务的容错和容灾的能力。
2、快速备份与恢复:本发明针对虚拟化环境中的检查点制作过程进行了优化。步骤(7)通过对虚拟机的内存进行压缩和动态调整,大大提升了检查点文件备份和恢复的时间,同时减少了检查点文件占用的磁盘空间。提高了检查点恢复的性能。
3、高可用性:本发明针对不同的灾难种类采取不同的恢复策略。步骤(3)针对网络通畅的故障,采用实时迁移技术快速将故障影响的虚拟机迁移至安全可靠的物理服务器上,进行故障转移,保证故障发生时服务不中断;针对网络中断的故障,第一时间选择安全可靠的物理服务器,从检查点文件中恢复虚拟机至稳定的运行状态,保证故障发生后的服务快速恢复。
4、低成本:本发明采用虚拟化技术,对硬件设备没有特殊的要求,不需要额外添加价格昂贵的容灾恢复硬件。只要是支持虚拟化的硬件设备,即可使用本方法进行故障恢复,降低了设备成本。
附图说明
图1是本发明虚拟化环境中故障恢复的方法的流程图。
图2是本发明方法中步骤(2)的细化流程图。
图3是检查点索引文件结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明虚拟化环境中故障恢复的方法包括以下步骤:
(1)调度服务器(Dispatch Server,简称DS)监控物理服务器(PhysicalMachine,简称PM)的性能数据,以判断虚拟机(Virtual Machine,简称VM)是否发生故障;若发生故障,则进入步骤(2),否则过程结束;具体而言,调度服务器广播收集物理服务器信息,根据收集的信息构建物理服务器状态表,为每个物理服务器设置定时器。物理服务器定期提取运行时的性能参数(CPU总利用率、内存利用率、网络带宽占用率)以及运行的虚拟机列表(虚拟机名称,UUID,IP地址,虚拟CPU个数,内存占用量,网络上行速率,网络下行速率),编码写入心跳包中,将心跳包传输至调度服务器。调度服务器接收心跳包,解析心跳包内容,更新物理服务器状态表。
(2)调度服务器在故障物理服务器上选取待恢复虚拟机,并根据物理服务器的状态选取合适的物理接管服务器恢复虚拟机;具体而言,调度服务器获取待恢复虚拟机的虚拟CPU个数,内存占用量,网络带宽的资源需求,查找物理服务器状态表,筛选符合虚拟机资源需求的候选物理服务器,预匹配虚拟机与候选物理服务器,计算恢复后物理服务器CPU、内存和带宽的资源占用率,选取占用率最接近的物理服务器为最终的接管物理服务器。保证虚拟机恢复后物理服务器不出现某一资源短缺的情况,同时保证整体负载均衡。
(3)调度服务器探测故障物理服务器的网络状况,若网络可用则进入步骤(4),否则进入步骤(6);具体而言,调度服务器向故障物理服务器发送ping包探测故障物理服务器的网络状况,根据ping包响应时间确定故障物理服务器的网络状况。ping回复的延迟超过1s或超时,认为故障服务器网络不可用;ping的延迟低于1s,认为故障服务器网络可用。
(4)调度服务器向故障物理服务器和物理接管服务器发送做好迁移准备的指令;具体而言,故障物理服务器和物理接管节点进入锁定状态,不再被作为候选物理接管服务器,同时暂停虚拟机检查点备份过程,保证有足够的CPU、内存和网络带宽进行迁移。
(5)故障物理服务器将待恢复虚拟机实时迁移至物理接管服务器,过程结束;具体而言,故障物理服务器在实时迁移前,动态调整虚拟机分配的内存至最小值,以避免传输不必要的未使用的内存块。迁移完成后,动态调整虚拟机的内存至迁移前的大小。
(6)调度服务器在网络文件系统(Network File System,简称NFS)的检查点库中获取待恢复虚拟机的检查点索引文件,读取并解析文件,获得虚拟机运行时的虚拟CPU个数、内存占用量和检查点文件的路径,并发送给物理接管服务器。如图3所示,检查点索引文件包含以下内容:虚拟机IP、虚拟机UUID、检查点文件创建时间、检查点文件使用次数、虚拟CPU个数、内存大小、挂载镜像路径、检查点文件大小和检查点文件路径。
(7)物理接管服务器从网络文件系统中读取检查点文件,并恢复虚拟机,过程结束;具体而言,物理接管节点完成检查点文件的恢复后,动态调整虚拟至运行时状态。
如图2所示,步骤(2)具体包括以下子步骤:
(2-1)判断故障类型;具体而言,故障类型包括CPU故障、内存故障。其中CPU故障优先级高于内存故障,当CPU故障和内存故障同时出现时,视为CPU故障。
(2-2)根据故障类型选取待恢复虚拟机;具体而言,当CPU故障时,选取CPU绝对占用率最高的虚拟机,CPU绝对占用率的计算公式为:CPU绝对占用率=虚拟机CPU占用率×虚拟CPU个数/物理服务器CPU核数;当内存故障时,选取内存占用量最高的虚拟机。
(2-3)判断是否可筛选物理服务器作为候选物理接管服务器,若可筛选则进入子步骤(2-4),否则过程结束;具体而言,调度服务器遍历物理服务器状态表,筛选非故障且非锁定的空闲物理服务器作为候选物理接管服务器。非故障指物理服务器当前没有被监控到发生故障,非锁定指物理服务器当前并没有在进行迁移,空闲物理服务器指虚拟机恢复后的CPU和内存占用率均低于70%。
(2-4)根据运行的虚拟机数量判断是否可以从候选物理接管服务器中选取一台物理接管服务器,若可以,则步骤(2)结束,否则进入子步骤(2-5);具体而言,调度服务器首先从候选物理接管节点中选取运行虚拟机最少的物理服务器,若该节点运行的虚拟机少于等于3个,则确定该物理服务器为物理接管服务器。
(2-5)根据故障类型,从候选物理接管服务器选取一台物理接管服务器。具体而言,CPU故障时,选取CPU利用率最低的候选物理服务器,内存故障时,选取内存占用率最低的候选物理服务器。
应用实例
为了验证本发明方法的可行性和有效性,在真实环境下搭建了本发明系统验证本发明方法。系统环境如下表所示:
该系统包含1台调度服务器,9台物理服务器,每台物理服务器上开启最多8个虚拟机,1台网络文件系统服务器。物理服务器采用Cent OS5.5操作系统,虚拟机管理器采用Xen4.1.1,虚拟机使用半虚拟化方式,虚拟机镜像文件存储在网络文件系统NFS上,通过网络的方式加载虚拟机镜像,虚拟机每10分钟制作一次检查点备份。调度服务器、物理服务器和网络文件系统在一个局域网内。
调度服务器广播收集物理服务器信息,根据收集的信息构建物理服务器状态表,为每个物理服务器设置定时器。物理服务器定期提取运行时的性能参数以及运行的虚拟机列表,编码写入心跳包中,通过UDP传输协议将心跳包传输至调度服务器。调度服务器接收心跳包,解析心跳包内容,更新物理服务器状态表。调度服务器监控服务状态表,确定故障。调度服务器向故障物理服务器发送ping包探测故障物理服务器的网络状况。根据ping包响应时间确定故障物理服务器的网络状况。ping的延迟超过1s或超时,认为故障服务器网络不可用;ping的延迟低于1s,认为故障服务器网络可用。网络可用时,确定采用实时迁移的方法进行故障处理;网络不可用时,采用检查点恢复的方法进行故障处理。
经过测试,如下表,在虚拟机分配1GB内存的情况下,本发明的实时迁移时间为4s,服务中断时间为60-300ms,未进行优化的Xen原生的实时迁移时间为12s;本发明的检查点文件大小在400MB-1GB之间,检查点制作时间为5-10s,恢复时间为4-10s;未进行优化的Xen原生的检查点文件大小为1.1GB,制作时间为14s,恢复时间为10s。在故障发生时,能够根据故障物理服务器的网络状况选择相应的故障处理方式解决故障,降低故障对服务的影响,提高服务的容灾与容错能力。
本发明 Xen4.1.1
实时迁移时间 4s 12s
实时迁移服务中断时间 60-300ms 60-300ms
检查点文件大小(1GB内存) 400MB–1GB 1.1GB
检查点文件制作时间(1GB内存) 5–10s 14s
检查点文件恢复时间(1GB内存) 4–10s 10s
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种虚拟化环境中故障恢复的方法,其特征在于,包括以下步骤:
(1)调度服务器监控物理服务器的性能数据,以判断虚拟机是否发生故障;若发生故障,则进入步骤(2),否则过程结束;
(2)调度服务器在故障物理服务器上选取待恢复虚拟机,并根据物理服务器的状态选取合适的物理接管服务器恢复虚拟机;本步骤具体包括以下子步骤:
(2-1)调度服务器判断故障类型;
(2-2)调度服务器根据故障类型选取待恢复虚拟机;
(2-3)调度服务器判断是否可筛选物理服务器作为候选物理接管服务器,若可筛选则进入子步骤(2-4),否则过程结束;
(2-4)调度服务器根据运行的虚拟机数量判断是否可以从候选物理接管服务器中选取一台物理接管服务器,若可以,则步骤(2)结束,否则进入子步骤(2-5);
(2-5)调度服务器根据故障类型,从候选物理接管服务器选取一台物理接管服务器;
(3)调度服务器探测故障物理服务器的网络状况,若网络可用则进入步骤(4),否则进入步骤(6);
(4)调度服务器向故障物理服务器和物理接管服务器发送做好迁移准备的指令;
(5)故障物理服务器将待恢复虚拟机实时迁移至物理接管服务器,过程结束;
(6)调度服务器在网络文件系统的检查点库中获取待恢复虚拟机的检查点索引文件,读取并解析文件,获得虚拟机运行时的虚拟CPU个数、内存占用量和检查点文件的路径,并发送给物理接管服务器;
(7)物理接管服务器从网络文件系统中读取检查点文件,并恢复虚拟机。
2.根据权利要求1的方法,其特征在于,步骤(1)具体为:调度服务器广播收集物理服务器信息,根据收集的信息构建物理服务器状态表,为每个物理服务器设置定时器,物理服务器定期提取运行时的性能参数以及运行的虚拟机列表,编码写入心跳包中,将心跳包传输至调度服务器,调度服务器接收心跳包,解析心跳包内容,更新物理服务器状态表。
3.根据权利要求2的方法,其特征在于,性能参数包括CPU总利用率、内存利用率、网络带宽占用率,虚拟机列表包括虚拟机名称,UUID,IP地址,虚拟CPU个数,内存占用量,网络上行速率,网络下行速率。
4.根据权利要求1的方法,其特征在于,步骤(2)具体为:调度服务器获取待恢复虚拟机的虚拟CPU个数,内存占用量,网络带宽的资源需求,查找物理服务器状态表,筛选符合虚拟机资源需求的候选物理服务器,预匹配虚拟机与候选物理服务器,计算恢复后物理服务器CPU、内存和带宽的资源占用率,选取占用率最接近的物理服务器为最终的接管物理服务器,保证虚拟机恢复后物理服务器不出现某一资源短缺的情况,同时保证整体负载均衡。
5.根据权利要求1的方法,其特征在于,故障类型包括CPU故障和内存故障,且CPU故障的优先级高于内存故障。
6.根据权利要求1的方法,其特征在于,在步骤(2-2)中,当CPU故障时,选取CPU绝对占用率最高的虚拟机,其中CPU绝对占用率=虚拟机CPU占用率×虚拟CPU个数/物理服务器CPU核数,当内存故障时,选取内存占用量最高的虚拟机。
7.根据权利要求1的方法,其特征在于,步骤(2-3)具体为:调度服务器遍历物理服务器状态表,筛选非故障且非锁定的空闲物理服务器作为候选物理接管服务器,非故障指物理服务器当前没有被监控到发生故障,非锁定指物理服务器当前并没有在进行迁移,空闲物理服务器指虚拟机恢复后的CPU和内存占用率均低于70%。
8.根据权利要求1的方法,其特征在于,步骤(2-4)具体为:调度服务器首先从候选物理接管节点中选取运行虚拟机最少的物理服务器,若该节点运行的虚拟机少于等于3个,则确定该物理服务器为物理接管服务器。
9.根据权利要求1的方法,其特征在于,步骤(2-5)具体为:当CPU故障时,选取CPU利用率最低的候选物理服务器,当内存故障时,选取内存占用率最低的候选物理服务器。
CN201210219947.2A 2012-06-29 2012-06-29 一种虚拟化环境中故障恢复的方法 Expired - Fee Related CN102819465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210219947.2A CN102819465B (zh) 2012-06-29 2012-06-29 一种虚拟化环境中故障恢复的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210219947.2A CN102819465B (zh) 2012-06-29 2012-06-29 一种虚拟化环境中故障恢复的方法

Publications (2)

Publication Number Publication Date
CN102819465A CN102819465A (zh) 2012-12-12
CN102819465B true CN102819465B (zh) 2014-09-24

Family

ID=47303589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210219947.2A Expired - Fee Related CN102819465B (zh) 2012-06-29 2012-06-29 一种虚拟化环境中故障恢复的方法

Country Status (1)

Country Link
CN (1) CN102819465B (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873516B (zh) * 2012-12-14 2018-02-16 中兴通讯股份有限公司 提高云计算资源池中物理服务器使用率的ha方法和系统
CN103294546B (zh) * 2013-04-03 2016-04-20 华中科技大学 多维度资源性能干扰感知的虚拟机在线迁移方法及系统
WO2015042859A1 (zh) * 2013-09-27 2015-04-02 华为技术有限公司 一种异步通信的方法及设备
CN103607296B (zh) * 2013-11-01 2017-08-22 新华三技术有限公司 一种虚拟机故障处理方法和设备
CN103605574A (zh) * 2013-11-18 2014-02-26 浪潮(北京)电子信息产业有限公司 一种服务器集群中的虚拟机资源调度方法及系统
CN104683131A (zh) * 2013-11-27 2015-06-03 杭州迪普科技有限公司 一种应用级虚拟化高可靠性方法及装置
CN104735704B (zh) * 2013-12-20 2018-12-07 中国移动通信集团公司 一种载波迁移方法及装置
CN103729280A (zh) * 2013-12-23 2014-04-16 国云科技股份有限公司 一种虚拟机高可用机制
CN103729263B (zh) * 2013-12-23 2017-07-07 国云科技股份有限公司 一种高成功率的xen虚拟机容错机制
CN104753992A (zh) * 2013-12-29 2015-07-01 中国移动通信集团公司 一种数据存储、虚拟平台故障恢复的方法、设备和系统
WO2015103764A1 (en) * 2014-01-10 2015-07-16 Hewlett-Packard Development Company, L.P. Monitoring an object to prevent an occurrence of an issue
CN105095001B (zh) * 2014-05-08 2018-01-30 中国银联股份有限公司 分布式环境下虚拟机异常恢复方法
CN105224426A (zh) * 2014-06-09 2016-01-06 中兴通讯股份有限公司 物理主机故障检测方法、装置及虚机管理方法、系统
CN104063262A (zh) * 2014-06-16 2014-09-24 南京信息工程大学 一种基于虚拟机的异地容灾系统及其容灾方法
CN105577408A (zh) * 2014-09-25 2016-05-11 中兴通讯股份有限公司 一种vnfm容灾保护的方法、装置和nfvo
CN105607973B (zh) * 2014-11-19 2020-03-17 中国移动通信集团公司 一种虚拟机系统中设备故障处理的方法、装置及系统
CN104618191B (zh) * 2015-02-11 2018-05-11 新华三技术有限公司 一种主机与裸存储块之间的通信故障检测方法和装置
CN105335214A (zh) * 2015-11-12 2016-02-17 国云科技股份有限公司 一种虚拟机故障检测和恢复的方法
CN105487946B (zh) * 2015-11-30 2019-03-12 北京四达时代软件技术股份有限公司 一种故障计算机自动切换方法及装置
TWI595760B (zh) * 2015-12-01 2017-08-11 廣達電腦股份有限公司 伺服器資源之管理系統及其管理方法
CN105959145B (zh) * 2016-06-04 2019-05-17 广东中兴新支点技术有限公司 一种适用高可用性集群的并行管理服务器的方法及系统
CN107544839B (zh) * 2016-06-27 2021-05-25 腾讯科技(深圳)有限公司 虚拟机迁移系统、方法及装置
CN108241544B (zh) * 2016-12-23 2023-06-06 中科星图股份有限公司 一种基于集群的故障处理方法
CN107122229A (zh) * 2017-04-21 2017-09-01 紫光华山信息技术有限公司 一种虚拟机恢复方法及装置
CN107577561A (zh) * 2017-09-14 2018-01-12 郑州云海信息技术有限公司 一种数据恢复方法、装置、设备及计算机可读存储介质
CN110046064B (zh) * 2018-01-15 2020-08-04 厦门靠谱云股份有限公司 一种基于故障漂移的云服务器容灾实现方法
CN109688368B (zh) * 2019-01-04 2021-12-28 尚阳科技股份有限公司 视频会议的智能调度方法、电子设备及存储介质
CN110300024A (zh) * 2019-06-28 2019-10-01 中天宽带技术有限公司 一种服务器任务处理方法、装置及其相关设备
JP7010272B2 (ja) * 2019-10-08 2022-01-26 横河電機株式会社 リアルタイム通信処理システム、およびリアルタイム通信処理方法
CN110740066B (zh) * 2019-10-30 2022-07-08 北京计算机技术及应用研究所 一种席位不变的跨机故障迁移方法和系统
CN113472571B (zh) * 2021-06-28 2023-11-03 北京汇钧科技有限公司 一种智能网卡设备和智能网卡设备的旁路探测方法
CN114780272B (zh) * 2022-04-18 2023-03-17 北京亚康万玮信息技术股份有限公司 基于共享存储和虚拟化的智能故障自愈调度方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053873A (zh) * 2011-01-13 2011-05-11 浙江大学 一种缓存感知的多核处理器虚拟机故障隔离保证方法
CN102455951A (zh) * 2011-07-21 2012-05-16 中标软件有限公司 一种虚拟机容错方法和系统
CN102521128A (zh) * 2011-12-08 2012-06-27 华中科技大学 面向云平台的软件故障容忍方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI537828B (zh) * 2010-12-21 2016-06-11 萬國商業機器公司 虛擬機管理的方法及其電腦系統之裝置和電腦程式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053873A (zh) * 2011-01-13 2011-05-11 浙江大学 一种缓存感知的多核处理器虚拟机故障隔离保证方法
CN102455951A (zh) * 2011-07-21 2012-05-16 中标软件有限公司 一种虚拟机容错方法和系统
CN102521128A (zh) * 2011-12-08 2012-06-27 华中科技大学 面向云平台的软件故障容忍方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
图2.

Also Published As

Publication number Publication date
CN102819465A (zh) 2012-12-12

Similar Documents

Publication Publication Date Title
CN102819465B (zh) 一种虚拟化环境中故障恢复的方法
CN103778031B (zh) 一种云环境下的分布式系统多级故障容错方法
EP2710461B1 (en) Cross-cloud computing for capacity management and disaster recovery
TWI755417B (zh) 計算任務分配方法、流計算任務的執行方法、控制伺服器、流計算中心伺服器集群、流計算系統及異地多活系統
CN111381928B (zh) 一种虚拟机迁移方法、云计算管理平台和存储介质
CN104125286A (zh) 一种基于云计算的企业基础设施智能云化管理系统
CN107040406B (zh) 一种端云协同计算系统及其容错方法
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
CN102394774A (zh) 云计算操作系统的控制器服务状态监控和故障恢复方法
CN109873714B (zh) 云计算节点配置更新方法及终端设备
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
WO2021077746A1 (zh) 一种数据恢复方法、装置、设备及可读存储介质
CN102929769A (zh) 一种基于代理服务的虚拟机内部数据采集方法
CN105516292A (zh) 一种智能变电站云平台的热备方法
CN112235142B (zh) 一种可实现关键业务容灾的用电信息采集系统及其运行方法
CN108469996A (zh) 一种基于自动快照的系统高可用方法
CN104753992A (zh) 一种数据存储、虚拟平台故障恢复的方法、设备和系统
WO2023109062A1 (zh) 云灾备系统、方法、电子设备及存储介质
CN106612314A (zh) 基于虚拟机实现软件定义存储的系统
WO2024169653A1 (zh) 一种基于集群的负载分担和备份的方法及装置
CN114338670A (zh) 一种边缘云平台和具有其的网联交通三级云控平台
CN110046064B (zh) 一种基于故障漂移的云服务器容灾实现方法
CN106959885A (zh) 一种虚拟机高可用实现系统及其实现方法
CN106484495A (zh) 一种虚拟机磁盘数据块同步方法
CN115250227A (zh) 一种边缘计算场景下实现故障迁移的调度系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140924

Termination date: 20210629