CN105718325A - 基于虚拟机集群的回滚方法及系统和服务器 - Google Patents

基于虚拟机集群的回滚方法及系统和服务器 Download PDF

Info

Publication number
CN105718325A
CN105718325A CN201610044580.3A CN201610044580A CN105718325A CN 105718325 A CN105718325 A CN 105718325A CN 201610044580 A CN201610044580 A CN 201610044580A CN 105718325 A CN105718325 A CN 105718325A
Authority
CN
China
Prior art keywords
virtual machine
duplicate pages
failed
cluster
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610044580.3A
Other languages
English (en)
Other versions
CN105718325B (zh
Inventor
胡春明
陈德勍
师斌
崔磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIGITAL CHINA HOLDINGS Ltd.
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201610044580.3A priority Critical patent/CN105718325B/zh
Publication of CN105718325A publication Critical patent/CN105718325A/zh
Application granted granted Critical
Publication of CN105718325B publication Critical patent/CN105718325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种基于虚拟机集群的回滚方法及系统和服务器,该方法包括:在检测到虚拟机集群中的至少一个虚拟机异常时,从内存中获取虚拟机集群中的所有重复页面和除重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与各虚拟机之间的映射关系;根据各重复页面与各虚拟机之间的映射关系,将各重复页面通过组播的传输方式发送给对应的虚拟机;并根据各剩余页面与各虚拟机之间的映射关系,将各剩余页面通过单播的传输方式发送给对应的虚拟机;以使虚拟机集群中的各虚拟机恢复异常前的正常状态。本发明提供的基于虚拟机集群的回滚方法及系统和服务器,缩短了虚拟机集群恢复的时间,降低了恢复时的网络占用量。

Description

基于虚拟机集群的回滚方法及系统和服务器
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于虚拟机集群的回滚方法及系统和服务器。
背景技术
随着虚拟化技术的兴起,越来越多的应用依赖于虚拟机集群来实现,云计算的规模和运算量也呈急剧增加的趋势,随之而来的,系统出现异常的情况越来越严重。当出现异常时,虚拟机可能会崩溃,集群之间的网络也可能中断,更严重的将有可能导致应用在虚拟环境里终止计算。此外,如果进行长时间计算,如科学计算和大型图象处理,这些工作可能因为频繁中断带来的中间结果丢失而永远无法完成。因而,现有技术对虚拟化技术的可行性提出了较高的要求。
在现有的众多提高虚拟化技术的可行性的方法中,回滚方法是被采用的最为广泛的方法之一。目前,回滚方法主要是通过将虚拟机集群恢复所需的数据,分别发送到各对应的虚拟机中使得虚拟机集群从崩溃状态中恢复。但是,这种回滚方法在恢复虚拟机集群时,需要的恢复时间较长,网络占用量较高。
发明内容
本发明提供一种基于虚拟机集群的回滚方法及系统和服务器,用以解决现有回滚方法在恢复虚拟机集群时,需要的恢复时间较长,网络占用量较高的问题。
本发明提供的基于虚拟机集群的回滚方法,包括:
在检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
本发明提供的服务器,包括:
检测模块,用于对虚拟机集群中的虚拟机的工作状态进行检测;
获取模块,用于在所述检测模块检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面;
确定模块,用于确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
发送模块,用于根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
本发明提供的基于虚拟机集群的回滚系统,包括所述虚拟机集群和上述服务器。
本实施例提供的基于虚拟机集群的回滚方法及系统和服务器,通过组播的传输方式将内存中存储的各重复页面发送给与各重复页面对应的虚拟机,并通过单播的传输方式将内存中存储的除重复页面以外的各剩余页面,发送给与各剩余页面对应的虚拟机,缩短了虚拟机集群从异常状态中恢复所需的时间,降低了虚拟机集群恢复时的网络占用量。
附图说明
图1为本发明一实施例提供的基于虚拟机集群的回滚方法的流程示意图;
图2为图1所示方法的补充方法的流程示意图;
图3为本发明一实施例提供的服务器的结构示意图;
图4为本发明一实施例提供的基于虚拟机集群的回滚系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的基于虚拟机集群的回滚方法的流程示意图,如图1所示,本实施例提供的基于虚拟机集群的回滚方法包括如下步骤:
步骤101、在检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
具体的,服务器按照预先设定的检测周期对虚拟机集群中的所有虚拟机的工作状态进行检测,其中,该检测周期可以根据具体实施需要进行具体设定,在这里不做具体限定。当服务器检测到虚拟机集群中存在至少一个虚拟机工作状态异常时,服务器从内存中存储的所有虚拟机的页面中获取所有重复的页面,以及除重复页面以外剩余的所有页面,并且,服务器在获取重复页面和剩余页面的同时,确定各重复页面与虚拟机集群中各虚拟机之间的映射关系,以及各剩余页面与虚拟机集群中各虚拟机的映射关系。
其中,服务器内存中存储的所有虚拟机的页面,是通过现有的虚拟机快照机制获得的,在这里不再赘述。
步骤102、根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
具体的,服务器获取到内存中存储的所有重复页面后,根据各重复页面与虚拟机集群中各虚拟机之间的映射关系,采用组播的传输方法将各重复页面分别发送给对应的虚拟机,其中,用来传输各重复页面的组播组的切换方法可以采用现有的组播组切换方法,在这里不再赘述。
在这里需要说明的是,鉴于循环码的特性,本实施例优选采用循环码的切换方式对用来发送各重复页面的组播组进行切换,使得各个重复页面发送给对应的虚拟机。
进一步的,服务器根据确定的各剩余页面与各虚拟机之间的映射关系,将获取到的各剩余页面通过单播的传输方式发送给对应的虚拟机。从而使得各虚拟机根据服务器通过组播或单播的传输方式发送的页面从异常的工作状态中恢复过来。
值得说明的是,本实施例对组播传输与单播传输的先后顺序不做具体限定,即可以先通过组播的传输方式对重复页面进行传输,再通过单播的方式对剩余页面进行传输,也可以先通过单播的方式对剩余页面进行传输,再通过组播的传输方式对重复页面进行传输。
本实施例提供的基于虚拟机集群的回滚方法,通过组播的传输方式将内存中存储的各重复页面发送给与各重复页面对应的虚拟机,并通过单播的传输方式将内存中存储的除重复页面以外的各剩余页面,发送给与各剩余页面对应的虚拟机,缩短了虚拟机集群从异常状态中恢复所需的时间,降低了虚拟机集群恢复时的网络占用量。
进一步的,图2为图1所示方法的补充方法的流程示意图,如图2所示,在图1所示方法的基础上,本实施例提供的方法还包括:
步骤S1、接收虚拟机返回的接收响应,确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面;
具体的,服务器通过组播的传输方式将重复页面发送给对应的虚拟机,并通过单播的传输方式将除重复页面以外的剩余页面发送给对应的虚拟机后,服务器接收各虚拟机返回的接收响应,并根据各虚拟机返回的接收响应,判断各重复页面和各剩余页面是否发送成功。
步骤S2、若存在一发送失败的重复页面,则确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量,若所述数量为多个,则将所述一发送失败的重复页面以组播的传输方式发送给所述目标虚拟机;和/或,若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
具体的,若服务器判断存在一发送失败的重复页面,则确定该重复页面对应的待重新发送的目标虚拟机的数量,即该重复页面对应的虚拟机中返回接收失败响应的虚拟机的数量,若返回接收失败响应的虚拟机的数量为多个,则将重复页面以组播的传输方式发送给所述目标虚拟机。
进一步的若确定该重复页面对应的待重新发送的目标虚拟机的数量为一个,则采用单播的传输方式将该重复页面发送给该目标虚拟机。
和/或,
若服务器判断存在一发送失败的剩余页面,则将该剩余页面,以单播的传输方式重新发送给对应的虚拟机。
通过确定发送失败的重复页面,并将对应多个待重新发送的目标虚拟机的重复页面,通过组播的传输方式进行重新发送,进一步的减少了虚拟机集群恢复时所需的时间和网络占用量。
图3为本发明一实施例提供的服务器的结构示意图,如图3所示,本实施例提供的服务器,包括:
检测模块10,用于对虚拟机集群中的虚拟机的工作状态进行检测;
获取模块11,用于在所述检测模块10检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面;
确定模块12,用于确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
发送模块13,用于根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
所述服务器还包括:接收模块14,用于接收虚拟机返回的接收响应;
所述确定模块12,还用于确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面,若存在一发送失败的重复页面,则所述确定模块确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量;
所述发送模块13,还用于若所述数量为多个,则将所述一发送失败的重复页面,以组播的传输方式发送给所述目标虚拟机;和/或,若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
所述发送模块13,具体用于根据各重复页面与各虚拟机之间的映射关系,采用循环码的方式进行切换,以使得各个重复页面发送给对应的虚拟机。
本实施例提供的服务器能够用于执行如图1或图2所示的技术方案,其具体执行方式和有益效果与图1或图2所示的技术方案类似,在这里不再赘述。
图4为本发明一实施例提供的基于虚拟机集群的回滚系统的结构示意图,如图4所示,本实施例提供的基于虚拟机集群的回滚系统包括:上述实施例所述的虚拟机集群20和如图3所示的服务器21。
本实施例提供的基于虚拟机集群的回滚系统,通过组播的传输方式将内存中存储的各重复页面发送给与各重复页面对应的虚拟机,并通过单播的传输方式将内存中存储的除重复页面以外的各剩余页面,发送给与各剩余页面对应的虚拟机,缩短了虚拟机集群从异常状态中恢复所需的时间,降低了虚拟机集群恢复时的网络占用量。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (7)

1.一种基于虚拟机集群的回滚方法,其特征在于,包括
在检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
2.根据权利要求1所述的方法,其特征在于,还包括:
接收虚拟机返回的接收响应,确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面;
若存在一发送失败的重复页面,则确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量,若所述数量为多个,则将所述一发送失败的重复页面以组播的传输方式发送给所述目标虚拟机;和/或,
若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
3.根据权利要求1所述的方法,其特征在于,所述根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机,包括:
根据各重复页面与各虚拟机之间的映射关系,采用循环码的方式进行切换,以使得各个重复页面发送给对应的虚拟机。
4.一种服务器,其特征在于,包括:
检测模块,用于对虚拟机集群中的虚拟机的工作状态进行检测;
获取模块,用于在所述检测模块检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面;
确定模块,用于确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
发送模块,用于根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
5.根据权利要求4所述的服务器,其特征在于,还包括:
接收模块,用于接收虚拟机返回的接收响应;
所述确定模块,还用于确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面,若存在一发送失败的重复页面,则所述确定模块确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量;
所述发送模块,还用于若所述数量为多个,则将所述一发送失败的重复页面,以组播的传输方式发送给所述目标虚拟机;和/或,若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
6.根据权利要求4所述的服务器,其特征在于,所述发送模块,具体用于根据各重复页面与各虚拟机之间的映射关系,采用循环码的方式进行切换,以使得各个重复页面发送给对应的虚拟机。
7.一种基于虚拟机集群的回滚系统,其特征在于,包括所述虚拟机集群和如权利要求4-6任一项所述的服务器。
CN201610044580.3A 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器 Active CN105718325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610044580.3A CN105718325B (zh) 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610044580.3A CN105718325B (zh) 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器

Publications (2)

Publication Number Publication Date
CN105718325A true CN105718325A (zh) 2016-06-29
CN105718325B CN105718325B (zh) 2019-05-03

Family

ID=56153775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610044580.3A Active CN105718325B (zh) 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器

Country Status (1)

Country Link
CN (1) CN105718325B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194247A (zh) * 2017-04-27 2017-09-22 华中科技大学 一种针对虚拟机回滚的软件补偿方法及系统
CN110673925A (zh) * 2019-09-06 2020-01-10 苏州浪潮智能科技有限公司 一种基于循环码的虚拟机迁移数据的方法、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089377B1 (en) * 2002-09-06 2006-08-08 Vmware, Inc. Virtualization system for computers with a region-based memory architecture
CN102262557A (zh) * 2010-05-25 2011-11-30 运软网络科技(上海)有限公司 通过总线架构构建虚拟机监控器的方法及性能服务框架
CN103257929A (zh) * 2013-04-18 2013-08-21 中国科学院计算技术研究所 一种虚拟机内存映射方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089377B1 (en) * 2002-09-06 2006-08-08 Vmware, Inc. Virtualization system for computers with a region-based memory architecture
CN102262557A (zh) * 2010-05-25 2011-11-30 运软网络科技(上海)有限公司 通过总线架构构建虚拟机监控器的方法及性能服务框架
CN103257929A (zh) * 2013-04-18 2013-08-21 中国科学院计算技术研究所 一种虚拟机内存映射方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BIN SHI 等: "Mercurial: A Traffic-saving Roll Back System for Virtual Machine Cluster", 《2014 IEEE/ACM 7TH INTERNATIONAL CONFERENCE ON UTILITY AND CLOUD COMPUTING》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194247A (zh) * 2017-04-27 2017-09-22 华中科技大学 一种针对虚拟机回滚的软件补偿方法及系统
CN107194247B (zh) * 2017-04-27 2020-02-21 华中科技大学 一种针对虚拟机回滚的软件补偿方法及系统
CN110673925A (zh) * 2019-09-06 2020-01-10 苏州浪潮智能科技有限公司 一种基于循环码的虚拟机迁移数据的方法、设备及介质

Also Published As

Publication number Publication date
CN105718325B (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
KR101908465B1 (ko) 결함 관리 방법, 엔티티 및 시스템
US9112887B2 (en) Mirroring solution in cloud storage environment
US7865782B2 (en) I/O device fault processing method for use in virtual computer system
CN102546135B (zh) 主备服务器切换系统及方法
US20170060671A1 (en) Anomaly recovery method for virtual machine in distributed environment
US9330049B2 (en) Method and apparatuses for monitoring system bus
CN107517110B (zh) 一种分布式系统中单板配置自恢复方法及装置
CN108847879B (zh) 基于总线控制器的双机故障检测及恢复方法
CN106469069B (zh) 一种版本升级方法及系统
CN109308242B (zh) 一种动态监控方法、装置、设备和存储介质
CN1794198A (zh) 容错双工计算机系统及其控制方法
US7886181B2 (en) Failure recovery method in cluster system
CN105718325A (zh) 基于虚拟机集群的回滚方法及系统和服务器
CN107688547B (zh) 一种控制器主备切换的方法及系统
KR20080050276A (ko) 객체 기반 분산 공유 시스템 및 그의 방법
CN110264452B (zh) 一种工件检测方法、装置、设备及存储介质
CN114615310A (zh) 一种维护tcp连接的方法、装置及电子设备
CN107491344B (zh) 一种实现虚拟机高可用性的方法及装置
WO2017041671A1 (zh) 故障恢复的方法和装置
CN102624537B (zh) 一种数据恢复系统及方法
CN111371582B (zh) 一种pcie链路故障的处理方法及装置
CN109219105B (zh) 路由切换方法以及路由切换系统
JP5166006B2 (ja) 画像形成装置
JP6269199B2 (ja) 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム
US10606702B2 (en) System, information processing apparatus, and method for rebooting a part corresponding to a cause identified

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210201

Address after: 100085 Digital Technology Plaza, 9 shangdijiu street, Haidian District, Beijing

Patentee after: DIGITAL CHINA HOLDINGS Ltd.

Address before: 100191 box 7-28, Beijing University of Aeronautics and Astronautics, Haidian District, Beijing

Patentee before: BEIHANG University