CN103559108A - 一种基于虚拟化实现主备故障自动恢复的方法及系统 - Google Patents

一种基于虚拟化实现主备故障自动恢复的方法及系统 Download PDF

Info

Publication number
CN103559108A
CN103559108A CN201310558217.XA CN201310558217A CN103559108A CN 103559108 A CN103559108 A CN 103559108A CN 201310558217 A CN201310558217 A CN 201310558217A CN 103559108 A CN103559108 A CN 103559108A
Authority
CN
China
Prior art keywords
virtual machine
machine
virtual
physical machine
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310558217.XA
Other languages
English (en)
Other versions
CN103559108B (zh
Inventor
周薇
戴娇
张章
韩冀中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201310558217.XA priority Critical patent/CN103559108B/zh
Publication of CN103559108A publication Critical patent/CN103559108A/zh
Application granted granted Critical
Publication of CN103559108B publication Critical patent/CN103559108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明涉及一种基于虚拟化实现主备故障自动恢复的方法及系统,部署包括控制中心和若干台物理机的集群系统,每台物理机上运行若干个虚拟机;所述控制中心实时监控所有物理机的运行状态,每台物理机实时监控其内部若干个虚拟机的运行状态;当出现故障时,判断是虚拟机故障还是物理机故障,然后进行针对性的故障自动恢复处理;本发明将虚拟化技术引入到主从系统的故障恢复中,可自动实现故障感知和故障恢复,不需要人工参与,相比传统的手动恢复方式,可以做到快速故障恢复,将恢复时间控制在分钟级,从而缩短了只有一台机器提供服务的不稳定时间;且本发明既可实现虚拟机故障的快速恢复,还可实现物理机故障的快速恢复,扩大了可靠性的保障范围。

Description

一种基于虚拟化实现主备故障自动恢复的方法及系统
技术领域
本发明涉及虚拟化技术领域,尤其涉及一种基于虚拟化技术实现的主备节点故障自动恢复方法及系统。
背景技术
随着互联网的发展以及生产系统对服务的高质量要求,服务提供7×24小时不间断运行已经成为服务提供商努力的目标。目前为了保证高质量服务,通常使用主备方式提供服务。在正常的服务提供过程中,是主节点响应客户端的请求服务。当主节点出现故障后,从节点实时感应到,然后接管服务,成为主节点。主节点出现故障后,由技术人员解决该故障,然后让该节点重新开始提供服务,成为备节点。所以,在经过技术人员恢复之后,服务又由主备节点构成,提供高可靠的服务。同样的道理,当从节点发生故障时,由自动感知机制通知技术人员,由技术人员解决该故障后,重新让该从节点提供服务,形成主备局势,保证服务的高可靠性。
但是,在这个过程中,面临着两个问题:1.当节点出现故障后,需要技术人员的介入才能完成故障节点的恢复,无法做到自动故障恢复机制;2.故障恢复引入了人员因素,故障恢复的时间就变得不可控。故障恢复时间既与故障问题的复杂程度相关,也与技术人员的能力水平相关。但是,故障恢复时间的长短直接影响了服务的高可用性,如果在故障修复的时间段内,另外一台正在提供服务的机器出现故障,那么就无法提供服务了。
发明内容
本发明所要解决的技术问题是提供,提供一种基于虚拟化技术实现主备节点故障自动恢复的方法及系统,实现主备节点故障的自动快速恢复,从而实现高质量服务。
本发明解决上述技术问题的技术方案如下:一种基于虚拟化实现主备故障自动恢复的方法,包括如下步骤:
步骤1:部署包括一个控制中心和若干台物理机的集群系统,每台物理机上运行若干个虚拟机;
步骤2:所述控制中心实时监控所有物理机的运行状态,每台物理机实时监控其内部若干个虚拟机的运行状态;
步骤3:出现故障时判断是某台物理机内的虚拟机故障还是某台物理机故障,如果是虚拟机故障,则执行步骤4;如果是物理机故障则执行步骤5;
步骤4:判断该故障虚拟机的类型,如果是主虚拟机,则进行主从切换,并执故障虚拟机自动恢复处理;如果是从虚拟机,则直接执行故障虚拟机自动恢复处理,结束;
步骤5:控制中心获取该故障物理机上运行的虚拟机的个数,并依次判断每个虚拟机的类型,如果是主虚拟机,则进行主从切换,执行虚拟机自动恢复处理;如果是从虚拟机,直接执行虚拟机自动恢复处理;
步骤6:判断所述物理机内是否还有未处理的虚拟机,如果有,则返回步骤5;否则,结束。
本发明的有益效果是:
1、本发明将虚拟化技术引入到主从系统的故障恢复中,可自动实现故障感知和故障恢复,不需要人工参与;
2、本发明相比传统的技术人员恢复方式,可以做到快速故障恢复,将恢复时间控制在分钟级,从而缩短了只有一台机器提供服务的不稳定时间;
3、本发明方法除了可以做到虚拟机故障的快速故障恢复外,还可以实现物理机的快速恢复(多台虚拟机),从而扩大了可靠性的保障范围。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,一个主虚拟机和一个从虚拟机组成一个主从系统,同一主从系统中的主虚拟机和从虚拟机部署在不同的物理机上,并将同一主从系统中的主虚拟机和从虚拟机的对应关系存储在控制中心。
采用上述进一步方案的有益效果是;如果主从系统的主虚拟机和从虚拟机部署在同一台物理机上的话,当所述物理机出现故障时,主从虚拟机都将失效,无法提供服务,因此同一台物理机上部署属于不同主从系统的虚拟机,防止上述情况的出现造成服务中断。
进一步,所述主从切换,就是将同属于一个主从系统中的主虚拟机变为从虚拟机,从虚拟机变为主虚拟机。
进一步,所述每个虚拟机的实体文件都存储在共享磁盘上一个分区上,该共享磁盘可挂载在每台物理机上。
采用上述进一步方案的有益效果是:当虚拟机出现故障时,将其所在的物理机上共享磁盘相应分区卸载掉,将其欲转移到的物理机(故障恢复物理机)上的共享磁盘挂载所述虚拟机相应分区,并重新启动作为从虚拟机备用。
进一步,步骤4和步骤5中所述的虚拟机的自动恢复处理过程为:
步骤A:自动关闭所述待恢复虚拟机,将该待恢复虚拟机所在的物理机上的共享磁盘上的相应的磁盘分区卸载掉;
步骤B:控制中心根据故障信息查询所述待恢复虚拟机所在主从系统中另一虚拟机所在的物理机记为第一排除物理机,将待恢复虚拟机自身所在的物理机记为第二排除物理机;
步骤C:根据负载均衡策略选择一台物理机作为故障恢复物理机,且第一排除物理机和第二排除物理机不在选择范围之内;
步骤D:在控制中心的控制下,所述故障恢复物理机挂载所述待恢复虚拟机所对应的磁盘分区;
步骤E:重启故障恢复物理机上新挂载的虚拟机,并作为从虚拟机备用。
采用上述进一步方案的有益效果是:自动进行虚拟机故障恢复处理,无需人工参与,故障恢复效率大大提供,缩短了故障恢复时间,保证了服务的稳定性。
本发明解决上述技术问题的技术方案另一技术方案如下:一种基于虚拟化实现主备节点故障自动恢复的系统,包括控制中心、若干台物理机和共享磁盘;
所述控制中心,其用于实时监控各个物理机的运行状态,并在故障发生时进行协调处理;
所述每台物理机上包括若干个虚拟机,每台物理机实时监控各个虚拟机的运行状态,并在故障发生时,及时向控制中心报告故障情况;
所述共享磁盘用于存储所有虚拟机的实体文件,每个虚拟机占用一个磁盘分区。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述每台物理机上还包括监控程序,所述监控程序负责监控运行在所述物理机上的所有虚拟机的运行状态和健康状态。
进一步,一个主虚拟机和一个从虚拟机组成一个主从系统,同一主从系统中的主虚拟机和从虚拟机部署在不同的物理机上,并将同一主从系统中的主虚拟机和从虚拟机的对应关系存储在控制中心。
附图说明
图1为本发明所述一种基于虚拟化技术的主备节点自动故障恢复方法流程图;
图2为本发明所述步骤4和5中虚拟机的自动恢复处理过程的流程图;
图3为本发明所述一种基于虚拟化技术的主备节点自动故障恢复系统框图。
附图中,各标号所代表的部件列表如下:
101、控制中心,102、物理机,103、虚拟机,104、共享磁盘。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
在主备节点快速自动故障恢复的系统中,包括三个层次,第一个层次是物理机集群,第二个层次是单台物理机中的虚拟机集群,第三个层次是虚拟机本身。实现快速故障恢复的有两方面,即单个虚拟机故障恢复和物理机(包括若干个虚拟机)故障恢复。
本申请采用虚拟化技术管理物理机,在一台物理机上运行多台虚拟机,每台虚拟机对应着以前的一台主节点或者一台备节点。在虚拟机中运行着应用服务,虚拟机对外提供服务。但是虚拟化技术对用户来说是透明的,使用虚拟机提供的服务和之前使用主从节点提供的服务是一样的。
为了分散安全隐患,属于同一个主从系统的主虚拟机和从虚拟机运行在不同的物理机上,虚拟机的实体文件都存储在共享磁盘上,该共享磁盘可挂载在每台物理机上。
如图1所示,一种基于虚拟化技术的主备故障自动恢复方法,包括如下步骤:
步骤1:部署包括一个控制中心和若干台物理机的集群系统,每台物理机上运行若干个虚拟机;
步骤2:所述控制中心实时监控所有物理机的运行状态,每台物理机实时监控其内部若干个虚拟机的运行状态;
步骤3:出现故障时判断是某台物理机内的虚拟机故障还是某台物理机故障,如果是虚拟机故障,则执行步骤4;如果是物理机故障则执行步骤5;
步骤4:判断该故障虚拟机的类型,如果是主虚拟机,则进行主从切换,并执故障虚拟机自动恢复处理;如果是从虚拟机,则直接执行故障虚拟机自动恢复处理,结束;
步骤5:控制中心获取该故障物理机上运行的虚拟机的个数,并依次判断每个虚拟机的类型,如果是主虚拟机,则进行主从切换,执行虚拟机自动恢复处理;如果是从虚拟机,直接执行虚拟机自动恢复处理;
步骤6:判断所述物理机内是否还有未处理的虚拟机,如果有,则返回步骤5;否则,结束。
其中,一个主虚拟机和一个从虚拟机组成一个主从系统,同一主从系统中的主虚拟机和从虚拟机部署在不同的物理机上,并将同一主从系统中的主虚拟机和从虚拟机的对应关系存储在控制中心。即所述每台物理机上运行的虚拟机为分别属于不同主从系统的主虚拟机或从虚拟机。
其中,所述主从切换,就是将同属于一个主从系统中的主虚拟机变为从虚拟机,从虚拟机变为主虚拟机。
其中,所述每个虚拟机的实体文件都存储在共享磁盘上一个分区上,该共享磁盘可挂载在每台物理机上。
如图2所示,步骤4和步骤5中所述的虚拟机的自动恢复处理过程为:
步骤A:自动关闭所述待恢复虚拟机,将该待恢复虚拟机所在的物理机上的共享磁盘上的相应的磁盘分区卸载掉;
步骤B:控制中心根据故障信息查询所述待恢复虚拟机所在主从系统中另一虚拟机所在的物理机记为第一排除物理机,将待恢复虚拟机自身所在的物理机记为第二排除物理机;
步骤C:根据负载均衡策略选择一台物理机作为故障恢复物理机,且第一排除物理机和第二排除物理机不在选择范围之内;
步骤D:在控制中心的控制下,所述故障恢复物理机挂载所述待恢复虚拟机所对应的磁盘分区;
步骤E:重启故障恢复物理机上新挂载的虚拟机,并作为从虚拟机备用。
如图3所示,为本发明实时例中一种基于虚拟化实现主备故障自动恢复的系统,包括控制中心101、若干台物理机102和共享磁盘104;
所述控制中心101,其用于实时监控各个物理机102的运行状态,并在故障发生时进行协调处理;
所述每台物理机102上包括若干个虚拟机103,每台物理机102实时监控各个虚拟机103的运行状态,并在故障发生时,及时向控制中心101报告故障情况;
所述共享磁盘104用于存储所有虚拟机的实体文件,每个虚拟机占用一个磁盘分区。
其中,所述每台物理机102上还包括监控程序,所述监控程序负责监控运行在所述物理机上的所有虚拟机103的运行状态和健康状态,其中包括CPU、内存和网络资源。
其中,所述每台物理机102上运行的虚拟机103为分别属于不同主从系统的主虚拟机或从虚拟机,如第一物理机上运行主虚拟机1和从虚拟机2,第二物理机上运行从虚拟机1、主虚拟机2和主虚拟机4,第三物理机上主虚拟机103、从虚拟机2和从虚拟机5,主虚拟机5和从虚拟机4;当主虚拟机1出现故障时,则进行主虚拟机1和从虚拟机1的主从切换,并将第一物理机中已变为从虚拟机1的故障虚拟机所对应的磁盘分区在第一物理机上卸载掉,并根据负载均衡策略选择另一台物理机(除第一物理机和第二物理机1外)作为故障恢复物理机,比如选择了第N物理机,则在第N物理机上挂载故障虚拟机对于的磁盘分区,并启动该虚拟机,作为从虚拟机备用;假如是第一物理机出现故障,则其内运行的主虚拟机1的处理如上述操作,从虚拟机3的操作不必进行主从切换,只需根据负载均衡策略选择一台物理机(除第一物理机和第三物理机外)作为故障恢复物理机,比如选择了第二物理机,在第二物理机上挂载故障虚拟机对于的磁盘分区,并启动该虚拟机,作为从虚拟机备用。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于虚拟化实现主备故障自动恢复的方法,其特征在于,包括如下步骤:
步骤1:部署包括一个控制中心和若干台物理机的集群系统,每台物理机上运行若干个虚拟机;
步骤2:所述控制中心实时监控所有物理机的运行状态,每台物理机实时监控其内部若干个虚拟机的运行状态;
步骤3:出现故障时判断是某台物理机内的虚拟机故障还是某台物理机故障,如果是虚拟机故障,则执行步骤4;如果是物理机故障则执行步骤5;
步骤4:判断该故障虚拟机的类型,如果是主虚拟机,则进行主从切换,并执行故障虚拟机自动恢复处理;如果是从虚拟机,则直接执行故障虚拟机自动恢复处理,结束;
步骤5:控制中心获取该故障物理机上运行的虚拟机的个数,并依次判断每个虚拟机的类型,如果是主虚拟机,则进行主从切换,执行虚拟机自动恢复处理;如果是从虚拟机,直接执行虚拟机自动恢复处理;
步骤6:判断所述物理机内是否还有未处理的虚拟机,如果有,则返回步骤5;否则,结束。
2.根据权利要求1所述一种基于虚拟化实现主备故障自动恢复的方法,其特征在于,一个主虚拟机和一个从虚拟机组成一个主从系统,同一主从系统中的主虚拟机和从虚拟机部署在不同的物理机上,并将同一主从系统中的主虚拟机和从虚拟机的对应关系存储在控制中心。
3.根据权利要求1所述一种基于虚拟化实现主备故障自动恢复的方法,其特征在于,所述主从切换,就是将同属于一个主从系统中的主虚拟机变为从虚拟机,从虚拟机变为主虚拟机。
4.根据权利要求1所述一种基于虚拟化实现主备故障自动恢复的方法,其特征在于,所述每个虚拟机的实体文件都存储在共享磁盘上一个分区上,该共享磁盘可挂载在每台物理机上。
5.根据权利要求1所述一种基于虚拟化实现主备故障自动恢复的方法,其特征在于,步骤4和步骤5中所述的虚拟机的自动恢复处理过程为:
步骤A:自动关闭所述待恢复虚拟机,将该待恢复虚拟机所在的物理机上的共享磁盘上的相应的磁盘分区卸载掉;
步骤B:控制中心根据故障信息查询所述待恢复虚拟机所在主从系统中另一虚拟机所在的物理机记为第一排除物理机,将待恢复虚拟机自身所在的物理机记为第二排除物理机;
步骤C:根据负载均衡策略选择一台物理机作为故障恢复物理机,且第一排除物理机和第二排除物理机不在选择范围之内;
步骤D:在控制中心的控制下,所述故障恢复物理机挂载所述待恢复虚拟机所对应的磁盘分区;
步骤E:重启故障恢复物理机上新挂载的虚拟机,并作为从虚拟机备用。
6.一种基于虚拟化实现主备故障自动恢复的系统,其特征在于,包括控制中心、若干台物理机和共享磁盘;
所述控制中心,其用于实时监控各个物理机的运行状态,并在故障发生时进行协调处理;
所述每台物理机上包括若干个虚拟机,每台物理机实时监控各个虚拟机的运行状态,并在故障发生时,及时向控制中心报告故障情况;
所述共享磁盘用于存储所有虚拟机的实体文件,每个虚拟机占用一个磁盘分区。
7.根据权利要求6所述一种基于虚拟化实现主备故障自动恢复的系统,其特征在于,所述每台物理机上还包括监控程序,所述监控程序负责监控运行在所述物理机上的所有虚拟机的运行状态和健康状态。
8.根据权利要求6所述一种基于虚拟化实现主备故障自动恢复的系统,其特征在于,一个主虚拟机和一个从虚拟机组成一个主从系统,同一主从系统中的主虚拟机和从虚拟机部署在不同的物理机上,并将同一主从系统中的主虚拟机和从虚拟机的对应关系存储在控制中心。
CN201310558217.XA 2013-11-11 2013-11-11 一种基于虚拟化实现主备故障自动恢复的方法及系统 Active CN103559108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310558217.XA CN103559108B (zh) 2013-11-11 2013-11-11 一种基于虚拟化实现主备故障自动恢复的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310558217.XA CN103559108B (zh) 2013-11-11 2013-11-11 一种基于虚拟化实现主备故障自动恢复的方法及系统

Publications (2)

Publication Number Publication Date
CN103559108A true CN103559108A (zh) 2014-02-05
CN103559108B CN103559108B (zh) 2017-05-17

Family

ID=50013359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310558217.XA Active CN103559108B (zh) 2013-11-11 2013-11-11 一种基于虚拟化实现主备故障自动恢复的方法及系统

Country Status (1)

Country Link
CN (1) CN103559108B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090832A (zh) * 2014-07-07 2014-10-08 用友软件股份有限公司 云计算平台的高可用性支撑装置及方法
CN104484231A (zh) * 2014-12-31 2015-04-01 武汉邮电科学研究院 虚拟机切换系统及切换方法
CN104484243A (zh) * 2014-12-05 2015-04-01 广东新支点技术服务有限公司 一种虚拟机容错技术和高可用集群技术结合的高可靠系统装置和方法
CN104793899A (zh) * 2015-02-04 2015-07-22 北京神州云科数据技术有限公司 一种基于虚拟磁盘层的检测Raid磁盘拔出的方法及装置
CN105095001A (zh) * 2014-05-08 2015-11-25 中国银联股份有限公司 分布式环境下虚拟机异常恢复方法
CN105119754A (zh) * 2015-09-08 2015-12-02 烽火通信科技股份有限公司 虚拟化主备倒换保持tcp连接的系统及方法
CN105162632A (zh) * 2015-09-15 2015-12-16 浪潮集团有限公司 一种服务器集群故障自动处理系统
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
CN105471994A (zh) * 2015-12-01 2016-04-06 华为技术有限公司 一种控制方法及装置
CN105577408A (zh) * 2014-09-25 2016-05-11 中兴通讯股份有限公司 一种vnfm容灾保护的方法、装置和nfvo
CN105959145A (zh) * 2016-06-04 2016-09-21 广东中兴新支点技术有限公司 一种适用高可用性集群的并行管理服务器的方法及系统
CN106293874A (zh) * 2016-07-29 2017-01-04 浪潮(北京)电子信息产业有限公司 一种对高可用集群进行监控的方法及装置
CN106708603A (zh) * 2016-12-28 2017-05-24 平安科技(深圳)有限公司 虚拟机快速恢复方法及装置
WO2018014567A1 (zh) * 2016-07-22 2018-01-25 平安科技(深圳)有限公司 一种提高虚拟机性能的方法、终端、设备及计算机可读存储介质
CN108459923A (zh) * 2018-03-19 2018-08-28 北京工业大学 一种基于Actor模型的多设备运行管理方法
CN112148485A (zh) * 2020-09-16 2020-12-29 杭州安恒信息技术股份有限公司 超融合平台故障恢复方法、装置、电子装置和存储介质
CN113221937A (zh) * 2021-02-24 2021-08-06 山东万博科技股份有限公司 基于人工智能判断的应急处理系统及方法
CN113741248A (zh) * 2021-08-13 2021-12-03 北京和利时系统工程有限公司 一种边缘计算控制器和控制系统
CN115994044A (zh) * 2023-01-09 2023-04-21 苏州浪潮智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801587A (zh) * 2012-08-29 2012-11-28 北京邮电大学 面向大规模网络的虚拟化监测系统与动态监测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801587A (zh) * 2012-08-29 2012-11-28 北京邮电大学 面向大规模网络的虚拟化监测系统与动态监测方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095001A (zh) * 2014-05-08 2015-11-25 中国银联股份有限公司 分布式环境下虚拟机异常恢复方法
CN105095001B (zh) * 2014-05-08 2018-01-30 中国银联股份有限公司 分布式环境下虚拟机异常恢复方法
EP3142011A4 (en) * 2014-05-08 2018-01-10 China Unionpay Co., Ltd Anomaly recovery method for virtual machine in distributed environment
CN104090832A (zh) * 2014-07-07 2014-10-08 用友软件股份有限公司 云计算平台的高可用性支撑装置及方法
CN105577408A (zh) * 2014-09-25 2016-05-11 中兴通讯股份有限公司 一种vnfm容灾保护的方法、装置和nfvo
CN104484243A (zh) * 2014-12-05 2015-04-01 广东新支点技术服务有限公司 一种虚拟机容错技术和高可用集群技术结合的高可靠系统装置和方法
CN104484243B (zh) * 2014-12-05 2019-08-06 广东中兴新支点技术有限公司 一种虚拟机容错技术和高可用集群技术结合的高可靠系统装置和方法
CN104484231A (zh) * 2014-12-31 2015-04-01 武汉邮电科学研究院 虚拟机切换系统及切换方法
CN104793899B (zh) * 2015-02-04 2017-10-03 深圳神州数码云科数据技术有限公司 一种基于虚拟磁盘层的检测Raid磁盘拔出的方法及装置
CN104793899A (zh) * 2015-02-04 2015-07-22 北京神州云科数据技术有限公司 一种基于虚拟磁盘层的检测Raid磁盘拔出的方法及装置
CN105119754A (zh) * 2015-09-08 2015-12-02 烽火通信科技股份有限公司 虚拟化主备倒换保持tcp连接的系统及方法
CN105162632A (zh) * 2015-09-15 2015-12-16 浪潮集团有限公司 一种服务器集群故障自动处理系统
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
CN105471994A (zh) * 2015-12-01 2016-04-06 华为技术有限公司 一种控制方法及装置
CN105471994B (zh) * 2015-12-01 2019-01-15 华为技术有限公司 一种控制方法及装置
CN105959145B (zh) * 2016-06-04 2019-05-17 广东中兴新支点技术有限公司 一种适用高可用性集群的并行管理服务器的方法及系统
CN105959145A (zh) * 2016-06-04 2016-09-21 广东中兴新支点技术有限公司 一种适用高可用性集群的并行管理服务器的方法及系统
WO2018014567A1 (zh) * 2016-07-22 2018-01-25 平安科技(深圳)有限公司 一种提高虚拟机性能的方法、终端、设备及计算机可读存储介质
US10509710B2 (en) 2016-07-22 2019-12-17 Ping An Technology (Shenzhen) Co., Ltd. Method, terminal, device and computer readable storage medium for improving the performance of virtual machine
CN106293874A (zh) * 2016-07-29 2017-01-04 浪潮(北京)电子信息产业有限公司 一种对高可用集群进行监控的方法及装置
WO2018120491A1 (zh) * 2016-12-28 2018-07-05 平安科技(深圳)有限公司 虚拟机快速恢复方法、装置和系统
CN106708603B (zh) * 2016-12-28 2019-04-26 平安科技(深圳)有限公司 虚拟机快速恢复方法及装置
AU2017341159B2 (en) * 2016-12-28 2019-07-25 Ping An Technology(Shenzhen)Co.,Ltd. Quick recovery method, device and system of a virtual machine
CN106708603A (zh) * 2016-12-28 2017-05-24 平安科技(深圳)有限公司 虚拟机快速恢复方法及装置
US10740197B2 (en) 2016-12-28 2020-08-11 Ping An Technology (Shenzhen) Co., Ltd. Quick recovery method, device and system of a virtual machine
CN108459923A (zh) * 2018-03-19 2018-08-28 北京工业大学 一种基于Actor模型的多设备运行管理方法
CN112148485A (zh) * 2020-09-16 2020-12-29 杭州安恒信息技术股份有限公司 超融合平台故障恢复方法、装置、电子装置和存储介质
CN113221937A (zh) * 2021-02-24 2021-08-06 山东万博科技股份有限公司 基于人工智能判断的应急处理系统及方法
CN113741248A (zh) * 2021-08-13 2021-12-03 北京和利时系统工程有限公司 一种边缘计算控制器和控制系统
CN113741248B (zh) * 2021-08-13 2023-07-14 北京和利时系统工程有限公司 一种边缘计算控制器和控制系统
CN115994044A (zh) * 2023-01-09 2023-04-21 苏州浪潮智能科技有限公司 基于监控服务的数据库故障处理方法、装置及分布式集群

Also Published As

Publication number Publication date
CN103559108B (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN103559108A (zh) 一种基于虚拟化实现主备故障自动恢复的方法及系统
Botelho et al. On the design of practical fault-tolerant SDN controllers
CN101996106B (zh) 一种对软件运行状态进行监控的方法
CN105095001B (zh) 分布式环境下虚拟机异常恢复方法
CN108270726B (zh) 应用实例部署方法及装置
CN105659562B (zh) 一种用于容障的方法和数据处理系统和包括用于容障的计算机可用代码的存储设备
CN102394774B (zh) 一种云计算操作系统的控制器服务状态监控和故障恢复方法
CN107147540A (zh) 高可用性系统中的故障处理方法和故障处理集群
CN105159798A (zh) 一种虚拟机的双机热备方法、双机热备管理服务器和系统
CN111901422B (zh) 一种集群中节点的管理方法、系统及装置
CN104133734A (zh) 分布式综合模块化航空电子系统混合式动态重构系统与方法
CN103312809A (zh) 云平台中服务的分布式管理方法
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
CN104427002A (zh) 集群系统及用于在集群系统中提供服务可用性的方法
CN106603696B (zh) 一种基于超融合基础框架的高可用系统
CN105335214A (zh) 一种虚拟机故障检测和恢复的方法
CN103440160A (zh) 虚拟机恢复方法和虚拟机迁移方法以及装置与系统
CN103595572B (zh) 一种云计算集群中节点自修复的方法
CN104917827A (zh) 一种实现oracle负载均衡集群的方法
CN106487486A (zh) 业务处理方法和数据中心系统
CN109361542A (zh) 客户端的故障处理方法、装置、系统、终端和服务器
CN105915391B (zh) 基于单阶段提交并具备自恢复功能的分布式键值存储方法
CN105786462A (zh) 开机方法
CN111181780A (zh) 基于ha集群的主机池切换方法、系统、终端及存储介质
CN105607973A (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant