CN107171849A - 一种虚拟机集群的故障监控方法及装置 - Google Patents

一种虚拟机集群的故障监控方法及装置 Download PDF

Info

Publication number
CN107171849A
CN107171849A CN201710401102.8A CN201710401102A CN107171849A CN 107171849 A CN107171849 A CN 107171849A CN 201710401102 A CN201710401102 A CN 201710401102A CN 107171849 A CN107171849 A CN 107171849A
Authority
CN
China
Prior art keywords
virtual machine
host
nodes
normal
another host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710401102.8A
Other languages
English (en)
Other versions
CN107171849B (zh
Inventor
耿东
张月辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710401102.8A priority Critical patent/CN107171849B/zh
Publication of CN107171849A publication Critical patent/CN107171849A/zh
Application granted granted Critical
Publication of CN107171849B publication Critical patent/CN107171849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种虚拟机集群的故障监控方法及装置,通过宿主机接收虚拟机集群心跳发生异常的通知指令;宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;当虚拟机为DC节点时,判断虚拟机运行是否正常;当虚拟机运行正常时,宿主机将虚拟机作为DC节点,并向另一宿主机发送消息;当虚拟机运行异常时,宿主机获取另一宿主机虚拟机的运行状态,判断另一宿主机虚拟机运行是否正常;当另一宿主机虚拟机运行正常时,将另一宿主机虚拟机作为DC节点。本申请通过宿主机监控虚拟机集群状态,即利用宿主机自身资源对集群进行故障监控,不用借助外置工具,降低了成本,且不借助外部因素,使得监控自主可控。

Description

一种虚拟机集群的故障监控方法及装置
技术领域
本发明涉及虚拟机领域,特别是涉及一种虚拟机集群的故障监控方法及装置。
背景技术
对于虚拟机集群,当一个控制器节点故障时,该节点上的相关资源服务会切换到另一个节点,然后在对需要对故障节点进行恢复,故集群故障监控显得尤为重要。
在建立集群的每个控制器中都可以存在一个虚拟机,这些虚拟机要建立集群,并监控集群。在两个控制节点的情况下,如果虚拟机集群的心跳中断,两个节点孤立存在,法定节点数(quorum)就不起作用了,会造成这两个节点争抢资源,无法实现故障监控。
针对两个控制节点的虚拟机集群,目前主要使用IP Quorum来实现监控,即通过外置IP连接集群的两个节点,当集群心跳中断时,哪个节点先与外置IP通信,拿到quorum,则将该节点作为DC节点继续工作,另一个节点释放资源。但是,这样需要提供外置IP的服务器,来提供IP Quorum,增加成本,同时增加一条外部通信链路就多一分风险,使得监控不可控。
发明内容
本发明的目的是提供一种虚拟机集群的故障监控方法及装置,目的在于解决现有技术中虚拟机集群监控方法的成本较高且不可控风险较高。
为解决上述技术问题,本发明提供一种虚拟机集群的故障监控方法,该方法包括:
宿主机接收虚拟机集群心跳发生异常的通知指令;
所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;
当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常;
当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息;
当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;
当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。
可选地,在所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点之后还包括:
当所述虚拟机为非DC节点时,所述宿主机获取所述另一宿主机虚拟机的所述运行状态,判断所述另一宿主机虚拟机运行是否正常;
若正常,将所述另一宿主机虚拟机作为所述DC节点;
若异常,结束进程。
可选地,在所述宿主机接收虚拟机集群心跳发生异常的通知指令之前还包括:
在所述虚拟机转为所述DC节点后,记录所述虚拟机的信息,得出所述节点信息。
此外,本发明还提供了一种虚拟机集群的故障监控装置,该装置包括:
接收模块,用于宿主机接收虚拟机集群心跳发生异常的通知指令;
第一判断模块,用于所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;
第二判断模块,用于当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常;
第一作为模块,用于当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息;
第三判断模块,用于当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;
第二作为模块,用于当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。
可选地,还包括:
第四判断模块,用于当所述虚拟机为非DC节点时,所述宿主机获取所述另一宿主机虚拟机的所述运行状态,判断所述另一宿主机虚拟机运行是否正常;
第三作为模块,用于若正常,将所述另一宿主机虚拟机作为所述DC节点;
结束模块,用于若异常,结束进程。
可选地,还包括:
节点信息记录模块,用于在所述虚拟机转为所述DC节点后,记录所述虚拟机的信息,得出所述节点信息。
本发明所提供的一种虚拟机集群的故障监控方法及装置,通过宿主机接收虚拟机集群心跳发生异常的通知指令;宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;当虚拟机为DC节点时,判断虚拟机运行是否正常;当虚拟机运行正常时,宿主机将虚拟机作为DC节点,并向另一宿主机发送消息;当虚拟机运行异常时,宿主机获取另一宿主机虚拟机的运行状态,判断另一宿主机虚拟机运行是否正常;当另一宿主机虚拟机运行正常时,将另一宿主机虚拟机作为DC节点。本申请通过宿主机监控虚拟机集群状态,即利用宿主机自身资源对集群进行故障监控,不用借助外置工具,降低了成本,且不借助外部因素,使得监控自主可控。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的虚拟机集群故障监控方法的一种具体实施方式的流程示意图;
图2为本发明实施例所提供的虚拟机集群故障监控方式的逻辑关系流程图;
图3为本发明实施例提供的虚拟机集群故障监控装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,图1为本发明实施例所提供的虚拟机集群故障监控方法的一种具体实施方式的流程示意图,该方法包括以下步骤:
步骤101:宿主机接收虚拟机集群心跳发生异常的通知指令。
具体地,当虚拟机集群发送心跳中断时,即当前虚拟机集群的通信异常,虚拟机向各自的宿主机发送通知指令,以告知宿主机此刻虚拟机集群的心跳异常。而各个宿主机可以接收到相应通知指令。
需要说明的是,上述虚拟机集群可以是指包括两个虚拟机的集群,每个虚拟机各自设置在各自的宿主机上,即一个虚拟机对应一个宿主机。此时,两个宿主机都可以接收到心跳异常通知指令。
步骤102:所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点。
需要说明的是,上述宿主机可以是指集群中的任意一个宿主机。该宿主机在接收到通知指令之后,首先判断本地节点是否为DC节点。
上述DC节点可以是指当集群发生故障时继续处理相应资源的节点。
而上述节点信息可以是指表明宿主机节点是否为DC节点的信息,该信息可以是在虚拟机节点转换为DC节点之后,虚拟机主动通知宿主机记录的。
作为一种具体实施方式,在上述宿主机接收虚拟机集群心跳发生异常的通知指令之前还可以包括:在所述虚拟机转为所述DC节点后,记录所述虚拟机的信息,得出所述节点信息。
具体地,每个宿主机上的虚拟机转换为DC节点之后,都会通知自身宿主机,记录对应当前虚拟机为DC节点。而当宿主机上的虚拟机转换为普通节点时,也会向自身宿主机发送通知,自身宿主机可以将之前所记录的DC节点信息清除。
此时,宿主机可以根据是否存储有相应的节点信息,来判断自身虚拟机是否为DC节点。
步骤103:当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常。
具体地,当宿主机存储有节点信息,则可以判断自身虚拟机为DC节点,然后再根据自身虚拟机的状态,来判断虚拟机是否正常运行。
而当宿主机上没有存储相应节点信息时,则其自身虚拟机不是DC节点,此时,需要判断是否可以将另一个宿主机作为DC节点。
作为一种具体实施方式,在上述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点之后还可以包括:当所述虚拟机为非DC节点时,所述宿主机获取所述另一宿主机虚拟机的所述运行状态,判断所述另一宿主机虚拟机运行是否正常;若正常,将所述另一宿主机虚拟机作为所述DC节点;若异常,结束进程。
可以理解的是,可以判断另一宿主机是否正常运行,来确定是否可以将其作为DC节点。故可以去获取另一宿主机上的虚拟机的运行状态,根据该运行状态来判断其是否运行正常。
当然,若另一宿主机运行异常,也可以继续判断自身虚拟机是否运行正常,继而确定是否可以将自身虚拟机转换为DC节点,以保证虚拟机集群的稳定运行。
步骤104:当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息。
具体地,宿主机上存储有自身虚拟机的节点信息,且自身虚拟机正常运行时,则可以利用自身虚拟机来接管集群的资源,以保证虚拟机集群的稳定运行。并且向另一宿主机发送消息,告知其DC节点为自身虚拟机。
步骤105:当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;
需要说明的是,当本地虚拟机运行异常时,此时,不能将本地虚拟机作为DC节点。可以通过判断另一宿主机上的虚拟机运行正常与否,来确定是否可以将另一宿主机虚拟机作为DC节点,以保证虚拟机集群的稳定运行。
步骤106:当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。
为了更好地说明各个步骤之间的逻辑关系,可以参见图2,图2为本发明实施例所提供的虚拟机集群故障监控方式的逻辑关系流程图。
本发明实施例所提供的虚拟机集群故障监控方法,通过宿主机接收虚拟机集群心跳发生异常的通知指令;宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;当虚拟机为DC节点时,判断虚拟机运行是否正常;当虚拟机运行正常时,宿主机将虚拟机作为DC节点,并向另一宿主机发送消息;当虚拟机运行异常时,宿主机获取另一宿主机虚拟机的运行状态,判断另一宿主机虚拟机运行是否正常;当另一宿主机虚拟机运行正常时,将另一宿主机虚拟机作为DC节点。该方法通过宿主机监控虚拟机集群状态,即利用宿主机自身资源对集群进行故障监控,不用借助外置工具,降低了成本,且不借助外部因素,使得监控自主可控。
下面对本发明实施例提供的虚拟机集群故障监控装置进行介绍,下文描述的虚拟机集群故障监控装置与上文描述的虚拟机集群故障监控方法可相互对应参照。
图3为本发明实施例提供的虚拟机集群故障监控装置的结构框图,参照图3虚拟机集群故障监控所装置可以包括:
接收模块31,用于宿主机接收虚拟机集群心跳发生异常的通知指令;
第一判断模块32,用于宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;
第二判断模块33,用于当虚拟机为所述DC节点时,判断虚拟机运行是否正常;
第一作为模块34,用于当虚拟机运行正常时,宿主机将虚拟机作为DC节点,并向另一宿主机发送消息;
第三判断模块35,用于当虚拟机运行异常时,宿主机获取另一宿主机虚拟机的运行状态,判断另一宿主机虚拟机运行是否正常;
第二作为模块36,用于当另一宿主机虚拟机运行正常时,将另一宿主机虚拟机作为DC节点。
可选地,还包括:
第四判断模块,用于当虚拟机为非DC节点时,宿主机获取另一宿主机虚拟机的运行状态,判断另一宿主机虚拟机运行是否正常;
第三作为模块,用于若正常,将另一宿主机虚拟机作为DC节点;
结束模块,用于若异常,结束进程。
可选地,还包括:
节点信息记录模块,用于在虚拟机转为DC节点后,记录虚拟机的信息,得出节点信息。
本发明实施例所提供的虚拟机集群故障监控装置,该装置通过宿主机监控虚拟机集群状态,即利用宿主机自身资源对集群进行故障监控,不用借助外置工具,降低了成本,且不借助外部因素,使得监控自主可控。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的虚拟机集群的故障监控方法及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (6)

1.一种虚拟机集群的故障监控方法,其特征在于,包括:
宿主机接收虚拟机集群心跳发生异常的通知指令;
所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;
当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常;
当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息;
当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;
当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。
2.如权利要求1所述的故障监控方法,其特征在于,在所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点之后还包括:
当所述虚拟机为非DC节点时,所述宿主机获取所述另一宿主机虚拟机的所述运行状态,判断所述另一宿主机虚拟机运行是否正常;
若正常,将所述另一宿主机虚拟机作为所述DC节点;
若异常,结束进程。
3.如权利要求1或2所述的故障监控方法,其特征在于,在所述宿主机接收虚拟机集群心跳发生异常的通知指令之前还包括:
在所述虚拟机转为所述DC节点后,记录所述虚拟机的信息,得出所述节点信息。
4.一种虚拟机集群的故障监控装置,其特征在于,包括:
接收模块,用于宿主机接收虚拟机集群心跳发生异常的通知指令;
第一判断模块,用于所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;
第二判断模块,用于当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常;
第一作为模块,用于当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息;
第三判断模块,用于当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;
第二作为模块,用于当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。
5.如权利要求4所述的故障监控装置,其特征在于,还包括:
第四判断模块,用于当所述虚拟机为非DC节点时,所述宿主机获取所述另一宿主机虚拟机的所述运行状态,判断所述另一宿主机虚拟机运行是否正常;
第三作为模块,用于若正常,将所述另一宿主机虚拟机作为所述DC节点;
结束模块,用于若异常,结束进程。
6.如权利要求4或5所述的故障监控装置,其特征在于,还包括:
节点信息记录模块,用于在所述虚拟机转为所述DC节点后,记录所述虚拟机的信息,得出所述节点信息。
CN201710401102.8A 2017-05-31 2017-05-31 一种虚拟机集群的故障监控方法及装置 Active CN107171849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710401102.8A CN107171849B (zh) 2017-05-31 2017-05-31 一种虚拟机集群的故障监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710401102.8A CN107171849B (zh) 2017-05-31 2017-05-31 一种虚拟机集群的故障监控方法及装置

Publications (2)

Publication Number Publication Date
CN107171849A true CN107171849A (zh) 2017-09-15
CN107171849B CN107171849B (zh) 2020-03-31

Family

ID=59821253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710401102.8A Active CN107171849B (zh) 2017-05-31 2017-05-31 一种虚拟机集群的故障监控方法及装置

Country Status (1)

Country Link
CN (1) CN107171849B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662751A (zh) * 2012-03-30 2012-09-12 浪潮电子信息产业股份有限公司 一种提高基于热迁移虚拟机系统可用性的方法
CN103067242A (zh) * 2012-12-04 2013-04-24 中国电信股份有限公司云计算分公司 一种用于提供网络服务的虚拟机系统
CN104503861A (zh) * 2012-04-20 2015-04-08 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN104702693A (zh) * 2015-03-19 2015-06-10 华为技术有限公司 两节点系统分区的处理方法和节点
CN105159798A (zh) * 2015-08-28 2015-12-16 浪潮集团有限公司 一种虚拟机的双机热备方法、双机热备管理服务器和系统
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统
US20160277271A1 (en) * 2015-03-19 2016-09-22 National Central University Fault tolerant method and system for multiple servers

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662751A (zh) * 2012-03-30 2012-09-12 浪潮电子信息产业股份有限公司 一种提高基于热迁移虚拟机系统可用性的方法
CN104503861A (zh) * 2012-04-20 2015-04-08 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN103067242A (zh) * 2012-12-04 2013-04-24 中国电信股份有限公司云计算分公司 一种用于提供网络服务的虚拟机系统
CN104702693A (zh) * 2015-03-19 2015-06-10 华为技术有限公司 两节点系统分区的处理方法和节点
US20160277271A1 (en) * 2015-03-19 2016-09-22 National Central University Fault tolerant method and system for multiple servers
CN105159798A (zh) * 2015-08-28 2015-12-16 浪潮集团有限公司 一种虚拟机的双机热备方法、双机热备管理服务器和系统
CN105357038A (zh) * 2015-10-26 2016-02-24 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋涛: "一种面向客户端的双机热备机制的研究与实现", 《万方学位论文数据库》 *

Also Published As

Publication number Publication date
CN107171849B (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN105681077B (zh) 故障处理方法、装置及系统
CN109240765A (zh) 服务资源的熔断方法、装置、设备及计算机可读存储介质
CN107239383A (zh) 一种OpenStack虚拟机的故障监控方法及装置
CN110321265A (zh) 一种服务器监控管理装置、方法及系统
CN108768758A (zh) 分布式存储系统在线升级方法、装置、设备及存储介质
JP2005209201A (ja) 高可用性クラスタにおけるノード管理
CN107967195A (zh) 一种基于双控存储的故障修复方法及系统
CN109213637A (zh) 分布式文件系统集群节点的数据恢复方法、装置及介质
CN109274544A (zh) 一种分布式存储系统的故障检测方法及装置
CN111176888B (zh) 云存储的容灾方法、装置及系统
CN109960634A (zh) 一种应用程序监控方法、装置及系统
CN107360045A (zh) 一种存储集群系统的监控方法及装置
CN107122229A (zh) 一种虚拟机恢复方法及装置
CN107229507A (zh) 一种容器镜像构建方法及装置
CN110535940A (zh) 一种bmc的连接管理方法、系统、设备及存储介质
CN108924202A (zh) 一种分布式集群的数据容灾方法以及相关装置
CN114675791A (zh) 一种磁盘处理方法、系统及电子设备
CN106528324A (zh) 故障恢复的方法和装置
CN109842526A (zh) 一种容灾方法和装置
CN107171849A (zh) 一种虚拟机集群的故障监控方法及装置
CN108519940A (zh) 一种存储设备告警方法、系统及计算机可读存储介质
CN105955864B (zh) 电源故障处理方法、电源模块、监控管理模块及服务器
CN110224872B (zh) 一种通信方法、装置及存储介质
CN106897201A (zh) 一种数据中心运维中设备硬件信息更新确定方法及装置
CN109491867A (zh) 一种通讯自动恢复方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant