CN105068763A - 一种针对存储故障的虚拟机容错系统和方法 - Google Patents

一种针对存储故障的虚拟机容错系统和方法 Download PDF

Info

Publication number
CN105068763A
CN105068763A CN201510496008.6A CN201510496008A CN105068763A CN 105068763 A CN105068763 A CN 105068763A CN 201510496008 A CN201510496008 A CN 201510496008A CN 105068763 A CN105068763 A CN 105068763A
Authority
CN
China
Prior art keywords
virtual machine
node
communications status
computing node
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510496008.6A
Other languages
English (en)
Other versions
CN105068763B (zh
Inventor
李文文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUHAN OS-EASY CLOUD COMPUTING Co Ltd
Original Assignee
WUHAN OS-EASY CLOUD COMPUTING Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN OS-EASY CLOUD COMPUTING Co Ltd filed Critical WUHAN OS-EASY CLOUD COMPUTING Co Ltd
Priority to CN201510496008.6A priority Critical patent/CN105068763B/zh
Publication of CN105068763A publication Critical patent/CN105068763A/zh
Application granted granted Critical
Publication of CN105068763B publication Critical patent/CN105068763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种针对存储故障的虚拟机容错系统和方法,涉及云计算领域,系统包括分析管理模块和至少一个检测上报模块;分析管理模块与控制节点相对应,每个检测上报模块均与一计算节点相对应;检测上报模块用于实时检测相应的计算节点与相对应的存储节点的通信状态并在通信状态为断开时上报断开状态至分析管理模块;分析管理模块用于接收检测上报模块上报的计算节点与相对应的存储节点的通信状态,并在通信状态为断开时,使计算节点中与存储节点相应且处于运行状态的虚拟机暂停。本发明不仅能够缩短业务的恢复时间,而且能够避免虚拟机的数据丢失。

Description

一种针对存储故障的虚拟机容错系统和方法
技术领域
本发明涉及云计算领域,具体涉及一种针对存储故障的虚拟机容错系统和方法。
背景技术
目前虚拟化的技术发展已日渐成熟,基于开关机的虚拟机高可用技术在目前的生产环境中也已经部署较多,但是虚拟机高在使用过程中,当虚拟机的存储系统出现故障时,高可用技术难以感知,需要等待虚拟机系统IO(输入输出)完成读写,IO读写超时时才会将超时信息反馈给虚拟机系统,使得windows虚拟机系统蓝屏或Linux虚拟机内核Panic(报错),此时,管理平台感仍然难以知晓虚拟机已出现异常,造成虚拟机内核崩溃,虚拟机内核崩溃后管理平台上显示的该虚拟机状态仍为正常通信状态,排错难度较大,延长了了业务恢复的时间。
当主备存储切换的过程中,计算节点与存储节点断开,虚拟机的数据无法正常写入和读出,虚拟机非正常写入和读出的时间超过10s后(不同操作系统发生异常的时间不一样)),会发生异常,当主备切换操作完成以后,虚拟机也不能恢复正常,需要在管理平台上对虚拟机进行重置,重置不仅会延长虚拟机业务的恢复时间,而且会导致虚拟机在重置过程中由于电源关闭引起的数据丢失。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种针对存储故障的虚拟机容错系统和方法,不仅能够缩短业务的恢复时间,而且能够避免虚拟机的数据丢失。
为达到以上目的,本发明采取的技术方案是:一种针对存储故障的虚拟机容错系统,其特征在于:该系统包括控制节点、至少一个计算节点和至少一个存储节点;
每个计算节点与至少一台虚拟机相对应,每个计算节点至少与一存储节点对应,虚拟机将数据发送至与对应计算节点相应的存储节点;
所述系统还包括分析控制平台,该平台包括分析管理模块和至少一个检测上报模块;
所述分析管理模块与控制节点相对应,每个检测上报模块均与一计算节点相对应;
所述检测上报模块用于实时检测相应的计算节点与相对应的存储节点的通信状态并在通信状态为断开时上报断开状态至分析管理模块;
所述分析管理模块用于接收检测上报模块上报的计算节点与相对应的存储节点的通信状态,并在通信状态为断开时,使所述计算节点中与所述存储节点相应且处于运行状态的虚拟机暂停。
在上述技术方案的基础上,所述分析管理模块还用于在计算节点与相对应的存储节点由断开状态恢复到连通状态时,使所述计算节点中与所述存储节点相应且在断开状态下被暂停的虚拟机恢复运行。
在上述技术方案的基础上,所述分析管理模块包括虚拟机分析单元、状态信息接收单元和虚拟机管理单元,所述状态信息接收单元用于接收所述检测上报模块上报的通信状态,并将通信状态发送至虚拟机分析单元,所述虚拟机分析单元用于在状态上报单元上报的通信状态为断开时,标记所述计算节点中与所述存储节点相应且处于运行状态的虚拟机,并将被标记虚拟机的信息发送至虚拟机分析单元;
所述虚拟机分析单元用于接收虚拟机分析上报的被标记虚拟机的信息,并向检测上报模块发送暂停指令和被标记的虚拟机信息,所述检测上报模块控制被标记的虚拟机暂停。
在上述技术方案的基础上,所述虚拟机分析单元还用于在状态上报单元上报的通信状态由断开恢复为连通时,并将在断开时被标记虚拟机的信息发送至虚拟机分析单元;
所述虚拟机分析单元用于接收虚拟机分析上报的被标记虚拟机的信息,并向检测上报模块发送恢复运行指令和被标记的虚拟机信息,所述检测上报模块控制被标记的虚拟机恢复运行。
在上述技术方案的基础上,所述检测上报模块包括存储状态监测单元、状态上报单元和KVM虚拟机管理单元;
所述存储状态监测单元用于实时监测相应计算节点与对应存储节点的通信状态,并将通信状态发送至状态上报单元;
状态上报单元用于接收存储状态监测单元上报的通信状态,并将通信状态发送至信息接收单元;
KVM虚拟机管理单元用于接收并执行虚拟机管理单元发送的指令,根据指令控制相应虚拟机的暂停或恢复运行。
一种针对存储故障的虚拟机容错的方法,该方法用于对与存储节点对应的计算节点相应的虚拟机容错,该方法包括以下步骤:
a、检测计算节点与存储节点之间的通信状态,并在通信状态为断开时上报断开状态;
b、在通信状态为断开时控制当前计算节点中与所述存储节点相应的处于运行的虚拟机暂停。
在上述技术方案的基础上,在所述步骤b具体包括以下步骤:
通信状态为断开时,对所述计算节点中与所述存储节点相应的处于运行状态的虚拟机进行标记,控制所有被标记的虚拟机暂停。
在上述技术方案的基础上,在步骤b之后还包括以下步骤:
检测计算节点与相对应的存储节点的断开状态是否恢复到连通,并在恢复连通时控制所有被标记的虚拟机恢复运行。
在上述技术方案的基础上,,
与现有技术相比,本发明的优点在于:
(1)本发明中针对存储故障的虚拟机容错系统,包括分析管理模块和若干检测上报模块,能够实时检测计算节点与存储节点的通信状态,并根据通信状态控制虚拟机的运行,与现有技术中计算节点与存储节点断开时,虚拟机仍然向存储节点发送数据,容易造成虚拟机内核崩溃、数据丢失相比,本发明的系统能够在计算节点与存储节点断开时,及时使得虚拟机暂停,并在计算节点与存储节点连通后,恢复虚拟机的运行,避免了数据的丢失和虚拟机内核的崩溃。
(2)本发明中针对存储故障的虚拟机容错系统,能够实时获取虚拟机的通信状态,与现有技术中虚拟机内核崩溃后管理平台上显示的该虚拟机状态仍为正常通信状态,排错难度较大,延长了业务恢复的时间相比,本发明的虚拟机发生故障时,能够在较短的时间内确定发生故障的虚拟机,能够有效缩短业务恢复的时间。
(3)本发明中针对存储故障的虚拟机容错的方法,检测计算节点与存储节点是否为断开状态,并在断开时确定当前计算节点中共享所述存储节点的所有虚拟机,分析所有虚拟机的通信状态,标记所有处于运行的虚拟机,使所有处于运行的虚拟机暂停,暂停需要的时间在3s以内,远远小于现有技术中启动和关闭虚拟机所需要的时间,大大缩减了业务的中断时间。
(4)本发明中针对存储故障的虚拟机容错的方法,在虚拟机暂停之后,检测计算节点与存储节点是否为连通,并在连通时确定当前计算节点中共享所述存储节点的所有虚拟机,将所有虚拟机中被标记的虚拟机通信状态修改为运行,本发明通过发送指令使得虚拟机暂停和运行,不需要进行人工干预,提升了系统的稳定性,且虚拟机暂停和运行前后,虚拟机内存数据前后一致,在整个存储故障发生到最后恢复,虚拟机能够接着上一条运行的指令继续往下运行,能够避免内存数据的丢失。
附图说明
图1为本发明实施例中针对存储故障的虚拟机容错系统的结构示意图。
图2为本发明中的分析平台的结构框图;
图3为本发明实施例中计算节点与存储节点断开时针对存储故障的虚拟机容错的方法的流程图。
具体实施方式
以下结合附图及实施例对本发明作进一步详细说明。
参见图1所示,本发明实施例提供一种针对存储故障的虚拟机容错系统,该系统包括控制节点、至少一个计算节点和至少一个存储节点,所有计算节点均与控制节点通信,所有存储节点均与控制节点通信,所有计算节点与相应的存储节点通信。
每个计算节点与至少一台虚拟机相对应,每个计算节点均与至少一存储节点对应,计算节点的虚拟机能够将数据发送至相应的存储节点,同一计算节点中的不同虚拟机可对应不同的存储节点,且所有存储节点均与所述同一计算节点相应。
本实施例中,所有计算节点均通过网络与控制节点通信,所有存储节点均通过存储交换机与控制节点和计算节点进行通信。
参见图2所示,本发明的系统还包括分析控制平台,该平台包括分析管理模块和至少一检测上报模块,分析管理模块与控制节点对应,每个检测上报模块均与一计算节点对应。
检测上报模块用于检测对应计算节点与相应存储节点的通信状态:断开或连通,将通信状态上报至分析管理模块,接收并执行分析管理模块的指令。
分析管理模块用于接收检测上报模块的通信状态,并在计算节点与存储节点断开时,分析计算节点中与存储节点相应的所有虚拟机的通信状态:运行或暂停,并对所有处于运行的虚拟机进行标记,使被标记的虚拟机暂停。
分析管理模块还用于通信状态由断开恢复连通时,使所述计算节点中与所述存储节点相应,且由于断开被暂停的虚拟机恢复运行。
分析管理模块包括虚拟机分析单元、状态信息接收单元和虚拟机管理单元,状态信息接收单元用于接收检测上报模块上报的通信状态,并将通信状态发送至虚拟机分析单元,虚拟机分析单元用于在状态上报单元上报的通信状态为断开时,标记计算节点中与存储节点相应且处于运行状态的虚拟机,并将被标记虚拟机的信息发送至虚拟机分析单元。
虚拟机分析单元用于接收虚拟机分析上报的被标记虚拟机的信息,并向检测上报模块发送暂停指令和被标记的虚拟机信息,检测上报模块控制被标记的虚拟机暂停。
虚拟机分析单元还用于在状态上报单元上报的通信状态由断开恢复为连通时,并将在断开时被标记虚拟机的信息发送至虚拟机分析单元。虚拟机分析单元用于接收虚拟机分析上报的被标记虚拟机的信息,并向检测上报模块发送恢复运行指令和被标记的虚拟机信息,检测上报模块控制被标记的虚拟机恢复运行。
检测上报模块包括存储状态监测单元、状态上报单元和KVM虚拟机管理单元。
存储状态监测单元用于实时监测所有计算节点与存储节点的通信状态,并将通信状态发送至状态上报单元。
状态上报单元用于接收存储状态监测单元的通信状态,并将通信状态发送至信息接收单元。
KVM虚拟机管理单元用于接收并执行虚拟机管理单元发送的指令,根据指令控制相应虚拟机的暂停或恢复运行。
一种针对存储故障的虚拟机容错系统的方法,该方法用于对与存储节点对应的计算节点相应的虚拟机容错,包括以下步骤:
1、检测计算节点与存储节点之间的通信状态,并在通信状态为断开时上报断开状态;
2、对所述计算节点中与所述存储节点相应的处于运行状态的虚拟机进行标记,在通信状态为断开时控制当前计算节点中与所述存储节点相应的处于运行的虚拟机暂停。
3、检测计算节点与相对应的存储节点的断开状态是否恢复到连通,并在恢复连通时控制所有被标记的虚拟机恢复运行。
参见图3所示,当前通信状态为断开时,针对存储故障的虚拟机容错系统的方法包括以下步骤。
步骤一、存储状态监测单元监测所有计算节点与相应存储节点的通信状态,得到断开状态信息,并将断开状态信息发送至状态上报单元,转入步骤二。
步骤二、状态上报单元接收存储状态监测单元发送的断开状态信息并发送至信息接收单元,转入步骤三。
步骤三、信息接收单元接收状态上报单元的断开状态信息并发送至虚拟机分析单元,转入步骤四。
步骤四、虚拟机分析单元接收断开状态信息,分析当前状态为断开状态下的计算节点中共享所述存储节点的所有虚拟机,确定所有虚拟机中处于通信状态虚拟机的信息、计算节点与相应存储节点的通信状态发送至虚拟机管理单元,转入步骤五。
步骤五、虚拟机管理单元将相应处于通信状态虚拟机的信息和暂停指令发送至KVM虚拟机管理单元,转入步骤六。
步骤六、KVM虚拟机管理单元控制相应处于通信状态的虚拟机暂停。
计算节点与相应存储节点的通信状态由断开恢复连通时,针对存储故障的虚拟机容错系统的方法包括以下步骤。
S1:存储状态监测单元监测所有计算节点与相应存储节点的通信状态,得到连通状态信息,并将连通状态信息发送至状态上报单元,转入S2。
S2:状态上报单元接收存储状态监测单元发送的连通状态信息并发送至信息接收单元,转入S3。
S3:信息接收单元接收状态上报单元的连通状态信息并发送至虚拟机分析单元,转入S4。
S4:虚拟机分析单元接收连通状态信息,分析当前状态为连通状态下的计算节点中共享所述存储节点的所有虚拟机,确定在断开状态下被暂停的所有虚拟机,将连通状态信息、所有被暂停的虚拟机信息发送至至虚拟机管理单元,转入S5。
S5:虚拟机管理单元将所有被暂停的虚拟机信息和运行指令发送至KVM虚拟机管理单元,转入S6。
S6:KVM虚拟机管理单元控制所有被暂停的虚拟机重新运行。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (8)

1.一种针对存储故障的虚拟机容错系统,其特征在于:该系统包括控制节点、至少一个计算节点和至少一个存储节点;
每个计算节点与至少一台虚拟机相对应,每个计算节点至少与一存储节点对应,虚拟机将数据发送至与对应计算节点相应的存储节点;
所述系统还包括分析控制平台,该平台包括分析管理模块和至少一个检测上报模块;
所述分析管理模块与控制节点相对应,每个检测上报模块均与一计算节点相对应;
所述检测上报模块用于实时检测相应的计算节点与相对应的存储节点的通信状态并在通信状态为断开时上报断开状态至分析管理模块;
所述分析管理模块用于接收检测上报模块上报的计算节点与相对应的存储节点的通信状态,并在通信状态为断开时,使所述计算节点中与所述存储节点相应且处于运行状态的虚拟机暂停。
2.如权利要求1所述的针对存储故障的虚拟机容错系统,其特征在于:所述分析管理模块还用于在计算节点与相对应的存储节点由断开状态恢复到连通状态时,使所述计算节点中与所述存储节点相应且在断开状态下被暂停的虚拟机恢复运行。
3.如权利要求2所述的针对存储故障的虚拟机容错系统,其特征在于:所述分析管理模块包括虚拟机分析单元、状态信息接收单元和虚拟机管理单元,所述状态信息接收单元用于接收所述检测上报模块上报的通信状态,并将通信状态发送至虚拟机分析单元,所述虚拟机分析单元用于在状态上报单元上报的通信状态为断开时,标记所述计算节点中与所述存储节点相应且处于运行状态的虚拟机,并将被标记虚拟机的信息发送至虚拟机分析单元;
所述虚拟机分析单元用于接收虚拟机分析上报的被标记虚拟机的信息,并向检测上报模块发送暂停指令和被标记的虚拟机信息,所述检测上报模块控制被标记的虚拟机暂停。
4.如权利要求3所述的用于针对存储故障的虚拟机容错系统,其特征在于:所述虚拟机分析单元还用于在状态上报单元上报的通信状态由断开恢复为连通时,并将在断开时被标记虚拟机的信息发送至虚拟机分析单元;
所述虚拟机分析单元用于接收虚拟机分析上报的被标记虚拟机的信息,并向检测上报模块发送恢复运行指令和被标记的虚拟机信息,所述检测上报模块控制被标记的虚拟机恢复运行。
5.如权利要求4所述的针对存储故障的虚拟机容错系统,其特征在于:所述检测上报模块包括存储状态监测单元、状态上报单元和KVM虚拟机管理单元;
所述存储状态监测单元用于实时监测相应计算节点与对应存储节点的通信状态,并将通信状态发送至状态上报单元;
状态上报单元用于接收存储状态监测单元上报的通信状态,并将通信状态发送至信息接收单元;
KVM虚拟机管理单元用于接收并执行虚拟机管理单元发送的指令,根据指令控制相应虚拟机的暂停或恢复运行。
6.一种针对存储故障的虚拟机容错的方法,该方法用于对与存储节点对应的计算节点相应的虚拟机容错,其特征在于:该方法包括以下步骤:
a、检测计算节点与存储节点之间的通信状态,并在通信状态为断开时上报断开状态;
b、在通信状态为断开时控制当前计算节点中与所述存储节点相应的处于运行的虚拟机暂停。
7.如权利要求6所述的针对存储故障的虚拟机容错的方法,其特征在于:在所述步骤b具体包括以下步骤:
通信状态为断开时,对所述计算节点中与所述存储节点相应的处于运行状态的虚拟机进行标记,控制所有被标记的虚拟机暂停。
8.如权利要求7所述的针对存储故障的虚拟机容错的方法,其特征在于:在步骤b之后还包括以下步骤:
检测计算节点与相对应的存储节点的断开状态是否恢复到连通,并在恢复连通时控制所有被标记的虚拟机恢复运行。
CN201510496008.6A 2015-08-13 2015-08-13 一种针对存储故障的虚拟机容错系统和方法 Active CN105068763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510496008.6A CN105068763B (zh) 2015-08-13 2015-08-13 一种针对存储故障的虚拟机容错系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510496008.6A CN105068763B (zh) 2015-08-13 2015-08-13 一种针对存储故障的虚拟机容错系统和方法

Publications (2)

Publication Number Publication Date
CN105068763A true CN105068763A (zh) 2015-11-18
CN105068763B CN105068763B (zh) 2018-11-23

Family

ID=54498144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510496008.6A Active CN105068763B (zh) 2015-08-13 2015-08-13 一种针对存储故障的虚拟机容错系统和方法

Country Status (1)

Country Link
CN (1) CN105068763B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919346A (zh) * 2017-02-21 2017-07-04 无锡华云数据技术服务有限公司 一种基于clvm的共享存储虚拟化实现方法
CN109951331A (zh) * 2019-03-15 2019-06-28 北京百度网讯科技有限公司 用于发送信息的方法、装置和计算集群
CN110795261A (zh) * 2019-09-26 2020-02-14 北京浪潮数据技术有限公司 虚拟磁盘故障的检测方法和装置
CN111240899A (zh) * 2020-01-10 2020-06-05 北京百度网讯科技有限公司 状态机复制方法、装置、系统及存储介质
CN113849251A (zh) * 2020-06-28 2021-12-28 中兴通讯股份有限公司 虚拟云桌面监测方法、客户端、服务端和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067229A (zh) * 2013-01-22 2013-04-24 浪潮(北京)电子信息产业有限公司 自动管理计算资源的方法、控制中心、计算节点及系统
CN103186423A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 虚拟机迁移方法与云端伺服系统
US20140201564A1 (en) * 2013-01-15 2014-07-17 Microsoft Corporation Healing cloud services during upgrades
CN104239120A (zh) * 2014-08-28 2014-12-24 华为技术有限公司 一种虚拟机的状态信息同步的方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186423A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 虚拟机迁移方法与云端伺服系统
US20140201564A1 (en) * 2013-01-15 2014-07-17 Microsoft Corporation Healing cloud services during upgrades
CN103067229A (zh) * 2013-01-22 2013-04-24 浪潮(北京)电子信息产业有限公司 自动管理计算资源的方法、控制中心、计算节点及系统
CN104239120A (zh) * 2014-08-28 2014-12-24 华为技术有限公司 一种虚拟机的状态信息同步的方法、装置及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919346A (zh) * 2017-02-21 2017-07-04 无锡华云数据技术服务有限公司 一种基于clvm的共享存储虚拟化实现方法
CN106919346B (zh) * 2017-02-21 2019-01-22 无锡华云数据技术服务有限公司 一种基于clvm的共享存储虚拟化实现方法
CN109951331A (zh) * 2019-03-15 2019-06-28 北京百度网讯科技有限公司 用于发送信息的方法、装置和计算集群
CN109951331B (zh) * 2019-03-15 2021-08-20 北京百度网讯科技有限公司 用于发送信息的方法、装置和计算集群
CN110795261A (zh) * 2019-09-26 2020-02-14 北京浪潮数据技术有限公司 虚拟磁盘故障的检测方法和装置
CN110795261B (zh) * 2019-09-26 2022-06-17 北京浪潮数据技术有限公司 虚拟磁盘故障的检测方法和装置
CN111240899A (zh) * 2020-01-10 2020-06-05 北京百度网讯科技有限公司 状态机复制方法、装置、系统及存储介质
CN111240899B (zh) * 2020-01-10 2023-07-25 北京百度网讯科技有限公司 状态机复制方法、装置、系统及存储介质
CN113849251A (zh) * 2020-06-28 2021-12-28 中兴通讯股份有限公司 虚拟云桌面监测方法、客户端、服务端和存储介质

Also Published As

Publication number Publication date
CN105068763B (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
CN102231681B (zh) 一种高可用集群计算机系统及其故障处理方法
CN102394774B (zh) 一种云计算操作系统的控制器服务状态监控和故障恢复方法
CN105068763A (zh) 一种针对存储故障的虚拟机容错系统和方法
CN103440160A (zh) 虚拟机恢复方法和虚拟机迁移方法以及装置与系统
JP2008269194A (ja) 仮想計算機システム
CN100492305C (zh) 一种计算机系统的快速恢复方法及设备
CN102708027B (zh) 一种避免通信设备运行中断的方法及系统
CN105095001A (zh) 分布式环境下虚拟机异常恢复方法
CN105243004A (zh) 一种故障资源检测方法及装置
CN103532753A (zh) 一种基于内存换页同步的双机热备方法
CN104484243A (zh) 一种虚拟机容错技术和高可用集群技术结合的高可靠系统装置和方法
CN113918383A (zh) 核心板复位方法、装置、设备、存储介质以及程序产品
WO2023065601A1 (zh) 服务器组件自检异常恢复方法、装置、系统及介质
CN101488105B (zh) 实现存储双控制器高可用性的方法及存储双控制器系统
CN104734904A (zh) 旁路设备的自动测试方法及系统
WO2015135100A1 (zh) 一种实现处理器切换的方法、计算机和切换装置
CN107026759A (zh) 一种基于bmc的远程管理bbu模块的固件及其开发方法
US10817400B2 (en) Management apparatus and management method
CN201047943Y (zh) 一种计算机系统的快速恢复设备
CN109117317A (zh) 一种集群故障恢复方法和相关装置
CN104346233A (zh) 一种用于计算机系统的故障恢复方法及装置
TW201328247A (zh) 系統錯誤處理方法與使用其之伺服器系統
KR101282891B1 (ko) 리셋 이력 관리 기능을 갖는 광전송로 종단장치 및 그 방법
CN105306256B (zh) 一种基于VxWorks设备的双机热备实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 430000 Hubei city of Wuhan Province, East Lake New Technology Development Zone, Optics Valley Road No. 465 building 17 room 1701 creative

Applicant after: WUHAN OS-EASY CLOUD COMPUTING CO., LTD.

Address before: 430074 Hubei city of Wuhan Province, East Lake New Technology Development Zone, Optics Valley Road No. 465 building 17 room 1701 creative

Applicant before: WUHAN OS-EASY CLOUD COMPUTING CO., LTD.

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant