CN105718325B - 基于虚拟机集群的回滚方法及系统和服务器 - Google Patents

基于虚拟机集群的回滚方法及系统和服务器 Download PDF

Info

Publication number
CN105718325B
CN105718325B CN201610044580.3A CN201610044580A CN105718325B CN 105718325 B CN105718325 B CN 105718325B CN 201610044580 A CN201610044580 A CN 201610044580A CN 105718325 B CN105718325 B CN 105718325B
Authority
CN
China
Prior art keywords
virtual machine
duplicate pages
cluster
remaining page
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610044580.3A
Other languages
English (en)
Other versions
CN105718325A (zh
Inventor
胡春明
陈德勍
师斌
崔磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIGITAL CHINA HOLDINGS Ltd.
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201610044580.3A priority Critical patent/CN105718325B/zh
Publication of CN105718325A publication Critical patent/CN105718325A/zh
Application granted granted Critical
Publication of CN105718325B publication Critical patent/CN105718325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种基于虚拟机集群的回滚方法及系统和服务器,该方法包括:在检测到虚拟机集群中的至少一个虚拟机异常时,从内存中获取虚拟机集群中的所有重复页面和除重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与各虚拟机之间的映射关系;根据各重复页面与各虚拟机之间的映射关系,将各重复页面通过组播的传输方式发送给对应的虚拟机;并根据各剩余页面与各虚拟机之间的映射关系,将各剩余页面通过单播的传输方式发送给对应的虚拟机;以使虚拟机集群中的各虚拟机恢复异常前的正常状态。本发明提供的基于虚拟机集群的回滚方法及系统和服务器,缩短了虚拟机集群恢复的时间,降低了恢复时的网络占用量。

Description

基于虚拟机集群的回滚方法及系统和服务器
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于虚拟机集群的回滚方法及系统和服务器。
背景技术
随着虚拟化技术的兴起,越来越多的应用依赖于虚拟机集群来实现,云计算的规模和运算量也呈急剧增加的趋势,随之而来的,系统出现异常的情况越来越严重。当出现异常时,虚拟机可能会崩溃,集群之间的网络也可能中断,更严重的将有可能导致应用在虚拟环境里终止计算。此外,如果进行长时间计算,如科学计算和大型图象处理,这些工作可能因为频繁中断带来的中间结果丢失而永远无法完成。因而,现有技术对虚拟化技术的可行性提出了较高的要求。
在现有的众多提高虚拟化技术的可行性的方法中,回滚方法是被采用的最为广泛的方法之一。目前,回滚方法主要是通过将虚拟机集群恢复所需的数据,分别发送到各对应的虚拟机中使得虚拟机集群从崩溃状态中恢复。但是,这种回滚方法在恢复虚拟机集群时,需要的恢复时间较长,网络占用量较高。
发明内容
本发明提供一种基于虚拟机集群的回滚方法及系统和服务器,用以解决现有回滚方法在恢复虚拟机集群时,需要的恢复时间较长,网络占用量较高的问题。
本发明提供的基于虚拟机集群的回滚方法,包括:
在检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
本发明提供的服务器,包括:
检测模块,用于对虚拟机集群中的虚拟机的工作状态进行检测;
获取模块,用于在所述检测模块检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面;
确定模块,用于确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
发送模块,用于根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
本发明提供的基于虚拟机集群的回滚系统,包括所述虚拟机集群和上述服务器。
本实施例提供的基于虚拟机集群的回滚方法及系统和服务器,通过组播的传输方式将内存中存储的各重复页面发送给与各重复页面对应的虚拟机,并通过单播的传输方式将内存中存储的除重复页面以外的各剩余页面,发送给与各剩余页面对应的虚拟机,缩短了虚拟机集群从异常状态中恢复所需的时间,降低了虚拟机集群恢复时的网络占用量。
附图说明
图1为本发明一实施例提供的基于虚拟机集群的回滚方法的流程示意图;
图2为图1所示方法的补充方法的流程示意图;
图3为本发明一实施例提供的服务器的结构示意图;
图4为本发明一实施例提供的基于虚拟机集群的回滚系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的基于虚拟机集群的回滚方法的流程示意图,如图1所示,本实施例提供的基于虚拟机集群的回滚方法包括如下步骤:
步骤101、在检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
具体的,服务器按照预先设定的检测周期对虚拟机集群中的所有虚拟机的工作状态进行检测,其中,该检测周期可以根据具体实施需要进行具体设定,在这里不做具体限定。当服务器检测到虚拟机集群中存在至少一个虚拟机工作状态异常时,服务器从内存中存储的所有虚拟机的页面中获取所有重复的页面,以及除重复页面以外剩余的所有页面,并且,服务器在获取重复页面和剩余页面的同时,确定各重复页面与虚拟机集群中各虚拟机之间的映射关系,以及各剩余页面与虚拟机集群中各虚拟机的映射关系。
其中,服务器内存中存储的所有虚拟机的页面,是通过现有的虚拟机快照机制获得的,在这里不再赘述。
步骤102、根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
具体的,服务器获取到内存中存储的所有重复页面后,根据各重复页面与虚拟机集群中各虚拟机之间的映射关系,采用组播的传输方法将各重复页面分别发送给对应的虚拟机,其中,用来传输各重复页面的组播组的切换方法可以采用现有的组播组切换方法,在这里不再赘述。
在这里需要说明的是,鉴于循环码的特性,本实施例优选采用循环码的切换方式对用来发送各重复页面的组播组进行切换,使得各个重复页面发送给对应的虚拟机。
进一步的,服务器根据确定的各剩余页面与各虚拟机之间的映射关系,将获取到的各剩余页面通过单播的传输方式发送给对应的虚拟机。从而使得各虚拟机根据服务器通过组播或单播的传输方式发送的页面从异常的工作状态中恢复过来。
值得说明的是,本实施例对组播传输与单播传输的先后顺序不做具体限定,即可以先通过组播的传输方式对重复页面进行传输,再通过单播的方式对剩余页面进行传输,也可以先通过单播的方式对剩余页面进行传输,再通过组播的传输方式对重复页面进行传输。
本实施例提供的基于虚拟机集群的回滚方法,通过组播的传输方式将内存中存储的各重复页面发送给与各重复页面对应的虚拟机,并通过单播的传输方式将内存中存储的除重复页面以外的各剩余页面,发送给与各剩余页面对应的虚拟机,缩短了虚拟机集群从异常状态中恢复所需的时间,降低了虚拟机集群恢复时的网络占用量。
进一步的,图2为图1所示方法的补充方法的流程示意图,如图2所示,在图1所示方法的基础上,本实施例提供的方法还包括:
步骤S1、接收虚拟机返回的接收响应,确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面;
具体的,服务器通过组播的传输方式将重复页面发送给对应的虚拟机,并通过单播的传输方式将除重复页面以外的剩余页面发送给对应的虚拟机后,服务器接收各虚拟机返回的接收响应,并根据各虚拟机返回的接收响应,判断各重复页面和各剩余页面是否发送成功。
步骤S2、若存在一发送失败的重复页面,则确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量,若所述数量为多个,则将所述一发送失败的重复页面以组播的传输方式发送给所述目标虚拟机;和/或,若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
具体的,若服务器判断存在一发送失败的重复页面,则确定该重复页面对应的待重新发送的目标虚拟机的数量,即该重复页面对应的虚拟机中返回接收失败响应的虚拟机的数量,若返回接收失败响应的虚拟机的数量为多个,则将重复页面以组播的传输方式发送给所述目标虚拟机。
进一步的若确定该重复页面对应的待重新发送的目标虚拟机的数量为一个,则采用单播的传输方式将该重复页面发送给该目标虚拟机。
和/或,
若服务器判断存在一发送失败的剩余页面,则将该剩余页面,以单播的传输方式重新发送给对应的虚拟机。
通过确定发送失败的重复页面,并将对应多个待重新发送的目标虚拟机的重复页面,通过组播的传输方式进行重新发送,进一步的减少了虚拟机集群恢复时所需的时间和网络占用量。
图3为本发明一实施例提供的服务器的结构示意图,如图3所示,本实施例提供的服务器,包括:
检测模块10,用于对虚拟机集群中的虚拟机的工作状态进行检测;
获取模块11,用于在所述检测模块10检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面;
确定模块12,用于确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
发送模块13,用于根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态。
所述服务器还包括:接收模块14,用于接收虚拟机返回的接收响应;
所述确定模块12,还用于确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面,若存在一发送失败的重复页面,则所述确定模块确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量;
所述发送模块13,还用于若所述数量为多个,则将所述一发送失败的重复页面,以组播的传输方式发送给所述目标虚拟机;和/或,若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
所述发送模块13,具体用于根据各重复页面与各虚拟机之间的映射关系,采用循环码的方式进行切换,以使得各个重复页面发送给对应的虚拟机。
本实施例提供的服务器能够用于执行如图1或图2所示的技术方案,其具体执行方式和有益效果与图1或图2所示的技术方案类似,在这里不再赘述。
图4为本发明一实施例提供的基于虚拟机集群的回滚系统的结构示意图,如图4所示,本实施例提供的基于虚拟机集群的回滚系统包括:上述实施例所述的虚拟机集群20和如图3所示的服务器21。
本实施例提供的基于虚拟机集群的回滚系统,通过组播的传输方式将内存中存储的各重复页面发送给与各重复页面对应的虚拟机,并通过单播的传输方式将内存中存储的除重复页面以外的各剩余页面,发送给与各剩余页面对应的虚拟机,缩短了虚拟机集群从异常状态中恢复所需的时间,降低了虚拟机集群恢复时的网络占用量。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (3)

1.一种基于虚拟机集群的回滚方法,其特征在于,包括
在检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面,并确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态;
所述根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机,包括:
根据各重复页面与各虚拟机之间的映射关系,采用循环码的方式进行切换,以使得各个重复页面发送给对应的虚拟机;
接收虚拟机返回的接收响应,确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面;
若存在一发送失败的重复页面,则确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量,若所述数量为多个,则将所述一发送失败的重复页面以组播的传输方式发送给所述目标虚拟机;和/或,
若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机。
2.一种服务器,其特征在于,包括:
检测模块,用于对虚拟机集群中的虚拟机的工作状态进行检测;
获取模块,用于在所述检测模块检测到所述虚拟机集群中的至少一个虚拟机异常时,从内存中获取所述虚拟机集群中的所有重复页面和除所述重复页面以外的剩余页面;
确定模块,用于确定各重复页面与各虚拟机之间的映射关系,以及各剩余页面与所述各虚拟机之间的映射关系;
发送模块,用于根据各重复页面与各虚拟机之间的映射关系,将所述各重复页面通过组播的传输方式发送给对应的虚拟机;并根据所述各剩余页面与所述各虚拟机之间的映射关系,将所述各剩余页面通过单播的传输方式发送给对应的虚拟机;以使所述虚拟机集群中的各虚拟机恢复异常前的正常状态;
接收模块,用于接收虚拟机返回的接收响应;
所述确定模块,还用于确定所述接收响应中是否存在一发送失败的重复页面和/或一发送失败的剩余页面,若存在一发送失败的重复页面,则所述确定模块确定所述一发送失败的重复页面对应的待重新发送的目标虚拟机的数量;
所述发送模块,还用于若所述数量为多个,则将所述一发送失败的重复页面,以组播的传输方式发送给所述目标虚拟机;和/或,若存在所述一发送失败的剩余页面,则将所述一发送失败的剩余页面,以单播的传输方式重新发送给对应的虚拟机;
所述发送模块,具体用于根据各重复页面与各虚拟机之间的映射关系,采用循环码的方式进行切换,以使得各个重复页面发送给对应的虚拟机。
3.一种基于虚拟机集群的回滚系统,其特征在于,包括所述虚拟机集群和如权利要求2所述的服务器。
CN201610044580.3A 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器 Active CN105718325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610044580.3A CN105718325B (zh) 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610044580.3A CN105718325B (zh) 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器

Publications (2)

Publication Number Publication Date
CN105718325A CN105718325A (zh) 2016-06-29
CN105718325B true CN105718325B (zh) 2019-05-03

Family

ID=56153775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610044580.3A Active CN105718325B (zh) 2016-01-22 2016-01-22 基于虚拟机集群的回滚方法及系统和服务器

Country Status (1)

Country Link
CN (1) CN105718325B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194247B (zh) * 2017-04-27 2020-02-21 华中科技大学 一种针对虚拟机回滚的软件补偿方法及系统
CN110673925A (zh) * 2019-09-06 2020-01-10 苏州浪潮智能科技有限公司 一种基于循环码的虚拟机迁移数据的方法、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089377B1 (en) * 2002-09-06 2006-08-08 Vmware, Inc. Virtualization system for computers with a region-based memory architecture
CN102262557A (zh) * 2010-05-25 2011-11-30 运软网络科技(上海)有限公司 通过总线架构构建虚拟机监控器的方法及性能服务框架
CN103257929A (zh) * 2013-04-18 2013-08-21 中国科学院计算技术研究所 一种虚拟机内存映射方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089377B1 (en) * 2002-09-06 2006-08-08 Vmware, Inc. Virtualization system for computers with a region-based memory architecture
CN102262557A (zh) * 2010-05-25 2011-11-30 运软网络科技(上海)有限公司 通过总线架构构建虚拟机监控器的方法及性能服务框架
CN103257929A (zh) * 2013-04-18 2013-08-21 中国科学院计算技术研究所 一种虚拟机内存映射方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Mercurial: A Traffic-saving Roll Back System for Virtual Machine Cluster;Bin Shi 等;《2014 IEEE/ACM 7th International Conference on Utility and Cloud Computing》;20141211;第877-882页

Also Published As

Publication number Publication date
CN105718325A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
CN103634150B (zh) 一种冗余的高安全性can总线通信方法
US9251002B2 (en) System and method for writing checkpointing data
CN103262044B (zh) 虚拟机失效转移管理的方法及其支持系统
KR20170048141A (ko) 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
EP3142011A1 (en) Anomaly recovery method for virtual machine in distributed environment
CN101145946B (zh) 一种基于消息日志的容错集群系统和方法
CN102364448A (zh) 一种计算机故障管理系统的容错方法
CN101980171B (zh) 一种软件系统故障自恢复方法及其使用的软件看门狗系统
CN103019889A (zh) 分布式文件系统及其故障处理方法
US7886181B2 (en) Failure recovery method in cluster system
WO2015102875A1 (en) Checkpointing systems and methods of using data forwarding
CN102047643A (zh) 用于在服务器故障的事件中能使客户端应用更快恢复的方法
CN102404139B (zh) 一种提高容错服务器应用层级容错性能的方法
CN101873223A (zh) 基于ip切换的n+m服务备份机制
CN105554074A (zh) 一种基于rpc通信的nas资源监控系统及监控方法
CN105718325B (zh) 基于虚拟机集群的回滚方法及系统和服务器
CN108958880A (zh) 数据处理方法、数据处理系统与计算机程序产品
US9830263B1 (en) Cache consistency
US20100085871A1 (en) Resource leak recovery in a multi-node computer system
WO2017041671A1 (zh) 故障恢复的方法和装置
CN109117317A (zh) 一种集群故障恢复方法和相关装置
JP6291711B2 (ja) フォールトトレラントシステム
CN104038364B (zh) 分布式流处理系统的容错方法、节点及系统
US20120246509A1 (en) Global detection of resource leaks in a multi-node computer system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210201

Address after: 100085 Digital Technology Plaza, 9 shangdijiu street, Haidian District, Beijing

Patentee after: DIGITAL CHINA HOLDINGS Ltd.

Address before: 100191 box 7-28, Beijing University of Aeronautics and Astronautics, Haidian District, Beijing

Patentee before: BEIHANG University