CN102402395A - 基于仲裁磁盘的高可用系统不间断运行方法 - Google Patents

基于仲裁磁盘的高可用系统不间断运行方法 Download PDF

Info

Publication number
CN102402395A
CN102402395A CN2010102832288A CN201010283228A CN102402395A CN 102402395 A CN102402395 A CN 102402395A CN 2010102832288 A CN2010102832288 A CN 2010102832288A CN 201010283228 A CN201010283228 A CN 201010283228A CN 102402395 A CN102402395 A CN 102402395A
Authority
CN
China
Prior art keywords
node
disk
cluster
quorum disk
quorum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102832288A
Other languages
English (en)
Other versions
CN102402395B (zh
Inventor
兰雨晴
王阳利
梁昕
刘涛
张永军
刘明
姚超
夏颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Standard Software Co Ltd
Original Assignee
SHANGHAI ZHONGBIAO SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHONGBIAO SOFTWARE CO Ltd filed Critical SHANGHAI ZHONGBIAO SOFTWARE CO Ltd
Priority to CN201010283228.8A priority Critical patent/CN102402395B/zh
Publication of CN102402395A publication Critical patent/CN102402395A/zh
Application granted granted Critical
Publication of CN102402395B publication Critical patent/CN102402395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明揭示了一种通过磁盘进行信息交互的技术使高可用系统可以不间断运行的方法。本发明针对具有共享存储设备的多节点高可用集群系统,在共享存储上划定一小块空间作为仲裁磁盘使用。高可用的各节点可以同时读写仲裁磁盘。各节点的仲裁磁盘守护进程将节点的状态信息写入仲裁磁盘,并对所有节点在仲裁磁盘中保存的信息进行检测,在节点故障和出现网络分区时,从正常工作节点中智能选举整个集群的主控节点,使集群系统恢复到正常工作状态,从而避免高可用系统脑裂发生,保证高可用系统不间断正常运行。

Description

基于仲裁磁盘的高可用系统不间断运行方法
技术领域
本发明涉及计算机高可用集群系统,具体涉及通过磁盘进行信息交互的技术,使高可用系统可以不间断运行的方法。
背景技术
作为提高在计算机系统中执行的处理的可用性的方式,存在被称为“集群”的思想。集群,英文名称为Cluster,通俗地说,集群是这样一种技术:它将多个系统连接到一起,使多台服务器能够像一台机器那样工作或者看起来好像一台机器。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。目前,有两种常用的服务器集群方法,一种是将备份服务器连接在主服务器上,当主服务器发生故障时,备份服务器才投入运行,把主服务器上所有任务接管过来。另一种方法是将多台服务器连接,这些服务器一起分担同样的应用和数据库计算任务,改善关键大型应用的响应时间。
在集群系统中,集群内任一系统上运行的服务可被所有的网络客户所使用。集群必须可以协调管理各分离组件的错误和失败,并可透明的向集群中加入组件。用户的公共数据被放置到了共享的磁盘柜中。当集群系统在正常运转时,应用只在一台服务器上运行,并且只有这台服务器才能操纵该应用在共享磁盘柜上的数据区,其它的服务器监控这台服务器,只要这台服务器上的应用停止运行(无论是硬件损坏、操作系统死机、应用软件故障,还是人为误操作造成的应用停止运行),其它的服务器就会接管这台服务器所运行的应用,并将共享磁盘柜上的相应数据区接管过来。也就是说在集群系统中,在多个计算机中安装同一程序,将其中的几个计算机作为执行实际处理的计算机,剩下的计算机被控制成在检测到执行处理的计算机发生故障时取代该计算机来执行处理。这些服务器或计算机可被称为节点,节点的含义是指网络任何支路的终端或网络中两个或更多支路的互连公共点。为了使各节点能顺利接管某台服务器所运行的应用,并将共享磁盘柜上的相应数据区接管过来,而配置有集群内各节点都可以访问的外部共享存储装置。
在多节点的高可用集群中,使用仲裁策略来决定集群的工作状态。通常使用的仲裁策略是计算集群中活跃的节点个数是否超过整个集群节点总数的一半。节点是否活跃是通过节点的心跳网络连接状况决定的。在节点个数不多的多节点集群中,连通的活跃节点不到半数的可能性较大,这种情况下,集群就处于瘫痪状态。
为了避免由于节点或网故障导致整个集群挂起,不再服务的问题,可以在共享存储装置上,划出一块小于10M的共享存储来记录各节点的状态信息,由守护进程参与对各节点的投票,这个小于10M的共享存储就是仲裁磁盘。仲裁磁盘是防止多个服务器争夺对服务、程序、资源的控制权的一个机制。
仲裁磁盘的一种工作方式是启动仲裁磁盘守护进程,且运行在集群的所有节点上,当前节点的守护进程定期评估当前节点的健康情况,然后把当前节点的状态信息放入到指定的共享磁盘区域。仲裁磁盘守护进程接着查看其他节点的状态,记录各节点的状态信息。集群的仲裁计数就是每个节点计数再加上仲裁磁盘分区的计数之和。例如,一个四节点集群,总共仲裁投票数是7,每个节点投票数为1,仲裁磁盘投票数为3。这样,在一个节点A上的仲裁磁盘守护进程经过几次尝试都不能访问共享磁盘分区,那么运行在另一节点B上的仲裁磁盘守护进程会请求节点A被隔离,集群中的控制节点会重启节点A并重新使节点A加入集群中。
上述仲裁磁盘的工作方式保证了集群的连续性,但是在集群心跳被分割为多个网络分区的情况下,运行的网络分区是id最小的节点所在的网络分区。极端情况下,可能只有这一个节点运行,而其它所有节点都被隔离。这样整个集群的负载都在一个节点上,会导致集群的响应能力下降。
本发明针对上述方法的弊端,采用在节点连接个数最多的网络分区中选举整个集群的主控节点重新获得仲裁权的方法,保证高可用集群在心跳网络发生故障的情况下能智能地选举连接节点个数较多的网络分区代表集群对外提供服务,既保证了集群的连续性,又提高了集群故障情况下的负载能力。
发明内容
针对目前仲裁磁盘在心跳网络故障时选举节点算法的缺陷,本发明提供新的节点选举方法,仲裁磁盘不再增加仲裁计数,在网络心跳工作正常(即集群活跃节点数超半数)情况下,仲裁磁盘的守护进程仅把节点信息写入仲裁磁盘。当集群中一些节点无效的时候,守护进程选举节点连接个数最多的网络分区中的控制节点作为集群的主控节点,并使主控节点重新拥有仲裁权,使集群能正常工作。从而保证集群的连续性,提高集群故障情况下的负载能力。
本发明提供了一种基于仲裁磁盘的高可用系统不间断运行方法,运用于有共享存储设备的多节点集群中,其包括一个仲裁磁盘,集群中每个节点能够同时读写该仲裁磁盘,且在每个节点上运行的仲裁磁盘守护进程把各节点的信息写入该仲裁磁盘上与各节点对应的节点信息区域,并对所有节点在仲裁磁盘中保存的信息进行检测,在节点故障和出现网络分区时,该仲裁磁盘守护进程选举节点连接个数最多的网络分区的控制节点作为整个集群的主控节点,使其获得仲裁权,从而实现以节点连接个数最多的网络分区代表集群对外提供服务。
承上,基于仲裁磁盘的高可用系统不间断运行方法还包含以下步骤:
1)配置仲裁磁盘信息到集群:将仲裁磁盘的配置内容写入集群配置文件,集群节点仅需要在一个节点上进行初始化仲裁磁盘及配置工作;
2)初始化仲裁磁盘头及节点信息:仲裁磁盘内容包括仲裁磁盘头、节点id与节点的仲裁磁盘分区id之间的对应关系表、集群每个节点的状态信息,节点的状态信息包括节点是否为控制节点、仲裁状态、工作节点队列长度和与当前节点连接的节点个数等;
3)在仲裁磁盘守护进程中选举拥有磁盘仲裁权的节点:仲裁磁盘选举有磁盘仲裁权的节点时,是寻找节点个数最多的网络分区中的控制节点,使其重新获得仲裁权。当集群恢复到有半数以上节点心跳连通时,磁盘仲裁失效;
4)交互仲裁磁盘守护进程与集群其它进程的信息:集群在选举控制节点时,集群其它进程会向仲裁磁盘守护进程发送自己是控制节点的消息。集群无超半数节点连接时,仲裁磁盘进程选举出拥有磁盘仲裁状态的网络分区后,向集群发送获得磁盘仲裁权的消息;否则,发送没有磁盘仲裁权的消息。
本发明的技术效果是利用仲裁磁盘达到集群不间断运行的目的,主要表现在:
第一,仲裁磁盘监控各节点运行状况,在集群有半数以上节点可连通并且正常工作的情况下,仲裁磁盘守护进程仅获取各节点状态,而不对集群状态进行任何改变。
第二,当集群发生心跳断开时,在任何一个网络分区中的活跃节点个数都不能使集群对外提供正常服务工作的情况下,根据各节点写入磁盘的信息选举一个控制节点让其拥有仲裁权,从而使集群恢复工作。并且拥有仲裁权的节点是各网络分区中连接节点个数最多的分区中的节点,使集群中可以工作的节点保持最多,保证集群服务效率更高。
这里的仲裁状态是指,高可用集群可以正常工作的状态,通常要求集群活跃节点大于整个集群节点总数的半数。如果集群中有网络分区,那么拥有大于整个集群节点总数的半数的网络分区可以达到仲裁状态,即集群节点个数有效,或者说其它网络分区的节点没有仲裁状态,即节点个数无效。
附图说明
图1为仲裁磁盘结构图;
图2为本发明高可用系统不间断运行方法实现的流程图;
图3为本发明仲裁磁盘选举的流程图。
具体实施方式
为了使本发明所采用的技术、手段及其优点,现举优选实施例并配合附图详述如后,此仅供说明之用,在专利申请上并不受具体实施方式的限制。
本发明基于仲裁磁盘的高可用系统不间断运行方法,主要是借助仲裁磁盘监控各节点运行状况,在集群有半数以上节点可连通并且正常工作的情况下,仲裁磁盘守护进程仅获取各节点状态,而不对集群状态进行任何改变;当集群发生心跳断开时,在任何一个网络分区中的活跃节点个数都不能使集群对外提供正常服务工作的情况下,根据各节点写入磁盘的信息选举一个控制节点让其拥有仲裁权,从而使集群恢复工作。并且拥有仲裁权的节点是各网络分区中连接节点个数最多的分区中的控制节点,从而使集群中可以工作的节点数量保持最多,保证集群服务效率更高。
运用本发明的不间断运行方法一般包括以下步骤:
(1)搭建多节点计算机集群环境(图1的步骤11)
在天文、军事、物理等需要很精密的、大量的运算的工作中,通常需用搭建多节点计算机集群环境,以使用到多个CPU的运算能力,所以可以加快运算的速度。
(2)准备小于10M的共享存储
在集群的共享储存设备中分出一个小于10M的共享存储(图1的步骤12),其中,步骤11和步骤12为软硬件环境的准备,硬件环境包括多台作为PC或者服务器和存储设备,服务器上具备双网卡,并且可以连接到存储设备。服务器上安装同样的操作系统和高可用产品,每组网卡互相连通,一组网络地址供心跳网络连接使用,一组网络地址提供对外服务使用,各服务器连接同一个共享存储设备。
(3)配置仲裁磁盘信息到集群(图1的步骤13)
各节点上安装高可用软件,并启动集群服务。在配置节点上将上述步骤指定的共享存储初始化为仲裁磁盘,配置仲裁磁盘标签到集群配置文件,使用的标签为配置文件中指定的标签。
(4)初始化仲裁磁盘及节点信息(步骤14)
仲裁磁盘的结构如附图1所示,当集群配置了仲裁磁盘信息,仲裁磁盘守护进程被启动。仲裁磁盘守护进程判断当前节点的工作状态,将当前节点的信息写入到仲裁磁盘上与当前节点对应的节点信息区域。然后将其它节点写入到仲裁磁盘对应区域的信息保存到节点信息数组中。
节点信息中包含节点是否为控制节点、仲裁状态、工作节点队列长度和与本节点连接的节点个数等,这些信息用于仲裁磁盘选举时作参照。
(5)由仲裁磁盘守护进程选举拥有磁盘仲裁权的节点(步骤15)
仲裁磁盘选举的目的是当集群发生心跳断开时,在任何一个网络分区中节点个数都不能使集群有正常对外提供服务的情况下,根据各节点写入磁盘的信息选举一个控制节点让其获得仲裁状态(即该节点获得仲裁权),从而使集群恢复工作。
(6)交互仲裁磁盘进程与集群其它进程的信息(步骤16)
仲裁磁盘进程与集群其它进程的信息交互方法与集群的实现方式有关。一般来说,都采用进程间通讯方法完成,具体方法有本地socket方式、g_source的事件轮询、corosync的ipc等。仲裁磁盘守护进程与集群其它进程的信息交互内容包括:节点是否为控制节点、仲裁状态、节点队列长度和节点连接个数,这些信息是集群的其它进程发送给仲裁磁盘守护进程的。仲裁磁盘守护进程发送给集群其它进程的有:节点获得磁盘仲裁权或节点没有获得磁盘仲裁权。
仲裁磁盘选举过程如附图3所示,具体包括以下步骤:
(1)仲裁磁盘的选举是在仲裁磁盘守护进程中进行循环处理,在选举之前,需要由仲裁磁盘守护进程从仲裁磁盘中读取各节点信息,各节点信息经处理后放入节点信息结构数组中(步骤S0);
(2)由仲裁磁盘守护进程检查节点信息结构中的内容,判断每个节点所在网络分区的连接个数是否达到节点总数的半数以上,即该节点是否处于仲裁状态(步骤S1),如果节点是处于仲裁状态,表明有超半数节点心跳连接,此时磁盘仲裁不起作用,为保证集群不受之前磁盘仲裁影响,仲裁磁盘守护进程向集群发送qdisk_quorate为0的消息(步骤S2’);
(3)如果节点没有处于仲裁状态,表明没有任何一个节点所在网络分区的节点连接个数是达到节点总数的半数以上,表明集群中没有超半数节点有心跳连接,此时由仲裁磁盘守护进程开始需要选举有磁盘仲裁状态的网络分区(步骤S2);
(4)选举有仲裁磁盘的网络分区过程(步骤S2)中,首先,比较每个节点的节点连接个数,选择其中最大值并记录为plugin_votes,设置master_id为0(步骤S21)。网络分区要有磁盘仲裁状态,必须该网络分区中节点连接个数大于等于plugin_votes;
(5)依照上述方式,检查集群的每一个节点(步骤S22):
判断该节点是否为控制节点,且节点连接个数是否大于等于plugin_votes(步骤S23),如果是,则将节点连接数大于等于plugin_votes的节点的id设置为master_id(步骤S24);否则,对集群里的其他节点继续进行检查(步骤S25);
(6)对集群里所有节点检查完后,判断当前节点id是否为master_id(步骤S26):
如果本节点id为master_id,则发送qdisk_quorate为1的消息(步骤S27’);否则,再判断该节点是否为控制节点(步骤S271),如果是控制节点,则发送qdisk_quorate为0的消息(步骤S272)。
其中,
plugin_votes:表示当前仲裁磁盘正常工作的节点中,最大的网络分区节点连接个数;
master_id:在节点信息比较时,记录可以获得磁盘仲裁权的节点id;
qdisk_quorate:仲裁磁盘给集群其它进程发送的消息,其值可以为1或0,1表示当前节点获得磁盘仲裁权,0表示取消当前节点的磁盘仲裁权。

Claims (10)

1.一种基于仲裁磁盘的高可用系统不间断运行方法,运用于有共享存储设备的多节点集群中,其特征在于:包括一个仲裁磁盘,集群中每个节点能够同时读写该仲裁磁盘,且在每个节点上运行的仲裁磁盘守护进程把各节点的信息写入该仲裁磁盘上与各节点对应的节点信息区域,并对所有节点在仲裁磁盘中保存的信息进行检测,在节点故障和出现网络分区时,该仲裁磁盘守护进程选举节点连接个数最多的网络分区的控制节点作为整个集群的主控节点,使其获得仲裁权,从而实现以节点连接个数最多的网络分区代表集群对外提供服务。
2.如权利要求1所述的方法,其特征在于:所述仲裁磁盘是在集群的共享存储设备上的分出的一部分,该仲裁磁盘小于10M。
3.如权利要求1所述的方法,其特征在于:还包括将仲裁磁盘的配置信息写入集群配置文件的步骤。
4.如权利要求1所述的方法,其特征在于:还包括初始化仲裁磁盘及节点信息的步骤。
5.如权利要求3所述的方法,其特征在于:所述仲裁磁盘的配置信息写入到集群配置文件的方式是配置仲裁磁盘标签到集群配置文件。
6.如权利要求4所述的方法,其特征在于:所述初始化仲裁磁盘及节点信息的步骤包括:启动仲裁磁盘守护进程,由仲裁磁盘守护进程判断当前节点的工作状态,并将当前节点的信息写入到仲裁磁盘上与当前节点对应的节点信息区域,经初始化后的仲裁磁盘的内容包括仲裁磁盘头、节点id与节点磁盘id对应关系表、集群每个节点的状态信息,节点的状态信息包括节点是否为控制节点、仲裁状态、工作节点队列长度和与当前节点连接的节点个数。
7.如权利要求6所述的方法,其特征在于:所述选举节点连接个数最多的网络分区的控制节点作为主控节点的步骤包括:在选举之前,运行于各节点上的仲裁磁盘守护进程从仲裁磁盘中读取各节点信息,各节点信息经处理后放入节点信息结构数组中,由仲裁磁盘守护进程检查各节点信息结构数组中的内容,判断每个节点所在网络分区的节点连接个数是否达到节点总数的半数以上,若是,表明有超半数节点心跳连接,则由仲裁磁盘守护进程给集群发送取消磁盘仲裁权的消息。
8.如权利要求7所述的方法,其特征在于:如果判断每个节点所在网络分区的节点连接个数没有达到节点总数的半数以上,表明集群中没有超半数节点有心跳连接,此时由仲裁磁盘守护进程选举有磁盘仲裁状态的网络分区,有磁盘仲裁状态的网络分区是该网络分区中节点连接个数最多。
9.如权利要求8所述的方法,其特征在于:所述选举有磁盘仲裁状态的网络分区的过程包括:比较所有节点的节点连接个数,选择其中最大值并记录为plugin_votes,同时将该节点的id设置为master_id。
10.如权利要求9所述的方法,其特征在于:所述选举有磁盘仲裁状态的网络分区的过程还包括:由仲裁磁盘守护进程继续对集群中的下一个节点进行检查,判断该节点是否为控制节点,且节点连接个数是否大于等于plugin_votes,如果是,则设置master_id为该节点的id;依上述方式对集群里所有节点检查完后,判断当前节点id是否为master_id,如果是,则由仲裁磁盘守护进程向集群发送当前节点获得磁盘仲裁权的消息;否则,如果当前节点是控制节点,则发送取消当前节点磁盘仲裁权的消息。
CN201010283228.8A 2010-09-16 2010-09-16 基于仲裁磁盘的高可用系统不间断运行方法 Active CN102402395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010283228.8A CN102402395B (zh) 2010-09-16 2010-09-16 基于仲裁磁盘的高可用系统不间断运行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010283228.8A CN102402395B (zh) 2010-09-16 2010-09-16 基于仲裁磁盘的高可用系统不间断运行方法

Publications (2)

Publication Number Publication Date
CN102402395A true CN102402395A (zh) 2012-04-04
CN102402395B CN102402395B (zh) 2014-07-16

Family

ID=45884642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010283228.8A Active CN102402395B (zh) 2010-09-16 2010-09-16 基于仲裁磁盘的高可用系统不间断运行方法

Country Status (1)

Country Link
CN (1) CN102402395B (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103051470A (zh) * 2012-11-29 2013-04-17 中标软件有限公司 一种集群及其磁盘心跳的控制方法
CN103647820A (zh) * 2013-12-09 2014-03-19 华为数字技术(苏州)有限公司 用于分布式集群系统的仲裁方法及仲裁装置
CN103684941A (zh) * 2013-11-23 2014-03-26 广东新支点技术服务有限公司 基于仲裁服务器的集群裂脑预防方法和装置
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN104077199A (zh) * 2014-06-06 2014-10-01 中标软件有限公司 基于共享磁盘的高可用集群的隔离方法和系统
CN105337780A (zh) * 2015-12-01 2016-02-17 迈普通信技术股份有限公司 一种服务器节点配置方法及物理节点
CN105450717A (zh) * 2014-09-29 2016-03-30 中兴通讯股份有限公司 集群脑裂处理方法和装置
WO2016106682A1 (zh) * 2014-12-31 2016-07-07 华为技术有限公司 一种集群脑裂后仲裁处理方法、仲裁存储装置以及系统
CN106354560A (zh) * 2015-07-16 2017-01-25 中兴通讯股份有限公司 一种系统的维护进程运行方法及装置
CN106407397A (zh) * 2016-09-20 2017-02-15 郑州云海信息技术有限公司 一种基于oracle asm Rebalance的数据迁移方法和装置
CN106790163A (zh) * 2016-12-29 2017-05-31 郑州云海信息技术有限公司 一种面向存储设备的授权码管理方法及系统
CN106789291A (zh) * 2016-12-29 2017-05-31 郑州云海信息技术有限公司 一种集群成员控制方法和装置
CN107147528A (zh) * 2017-05-23 2017-09-08 郑州云海信息技术有限公司 一种存储网关智能防脑裂系统及方法
WO2017215430A1 (zh) * 2016-06-14 2017-12-21 中兴通讯股份有限公司 一种集群内的节点管理方法及节点设备
CN107547252A (zh) * 2017-06-29 2018-01-05 新华三技术有限公司 一种网络故障处理方法和装置
CN107888393A (zh) * 2016-09-30 2018-04-06 郑州云海信息技术有限公司 一种非对称冗余通信链路中生成全连接集合的方法
CN107918570A (zh) * 2017-10-20 2018-04-17 杭州沃趣科技股份有限公司 一种双活系统共享仲裁盘的方法
CN109495312A (zh) * 2018-12-05 2019-03-19 广州鼎甲计算机科技有限公司 基于仲裁盘和双链路的高可用集群的实现方法和系统
CN111586110A (zh) * 2020-04-22 2020-08-25 广州锦行网络科技有限公司 一种raft在出现点对点故障时的优化处理方法
CN112181305A (zh) * 2020-09-30 2021-01-05 北京人大金仓信息技术股份有限公司 数据库集群网络分区选择方法和装置
CN112468596A (zh) * 2020-12-02 2021-03-09 苏州浪潮智能科技有限公司 一种集群仲裁方法、装置、电子设备及可读存储介质
CN114461141A (zh) * 2021-12-30 2022-05-10 苏州浪潮智能科技有限公司 一种etcd系统、节点仲裁方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060041595A1 (en) * 2004-08-19 2006-02-23 Hitachi, Ltd. Storage network migration method, management device, management program and storage network system
CN101482829A (zh) * 2009-01-22 2009-07-15 华为技术有限公司 集群系统、处理装置及集群系统冗余方法
CN101778002A (zh) * 2010-02-02 2010-07-14 浪潮(北京)电子信息产业有限公司 一种大规模集群系统及其构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060041595A1 (en) * 2004-08-19 2006-02-23 Hitachi, Ltd. Storage network migration method, management device, management program and storage network system
CN101482829A (zh) * 2009-01-22 2009-07-15 华为技术有限公司 集群系统、处理装置及集群系统冗余方法
CN101778002A (zh) * 2010-02-02 2010-07-14 浪潮(北京)电子信息产业有限公司 一种大规模集群系统及其构建方法

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103051470A (zh) * 2012-11-29 2013-04-17 中标软件有限公司 一种集群及其磁盘心跳的控制方法
CN103051470B (zh) * 2012-11-29 2015-10-07 中标软件有限公司 一种集群及其磁盘心跳的控制方法
CN103684941A (zh) * 2013-11-23 2014-03-26 广东新支点技术服务有限公司 基于仲裁服务器的集群裂脑预防方法和装置
CN103684941B (zh) * 2013-11-23 2018-01-16 广东中兴新支点技术有限公司 基于仲裁服务器的集群裂脑预防方法和装置
CN103647820A (zh) * 2013-12-09 2014-03-19 华为数字技术(苏州)有限公司 用于分布式集群系统的仲裁方法及仲裁装置
CN103647820B (zh) * 2013-12-09 2016-11-23 华为数字技术(苏州)有限公司 用于分布式集群系统的仲裁方法及仲裁装置
CN103716182B (zh) * 2013-12-12 2016-08-31 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN104077199A (zh) * 2014-06-06 2014-10-01 中标软件有限公司 基于共享磁盘的高可用集群的隔离方法和系统
CN105450717A (zh) * 2014-09-29 2016-03-30 中兴通讯股份有限公司 集群脑裂处理方法和装置
WO2016106682A1 (zh) * 2014-12-31 2016-07-07 华为技术有限公司 一种集群脑裂后仲裁处理方法、仲裁存储装置以及系统
US10020980B2 (en) 2014-12-31 2018-07-10 Huawei Technologies Co., Ltd. Arbitration processing method after cluster brain split, quorum storage apparatus, and system
US10298436B2 (en) 2014-12-31 2019-05-21 Huawei Technologies Co., Ltd. Arbitration processing method after cluster brain split, quorum storage apparatus, and system
CN106354560A (zh) * 2015-07-16 2017-01-25 中兴通讯股份有限公司 一种系统的维护进程运行方法及装置
CN106354560B (zh) * 2015-07-16 2021-04-20 中兴通讯股份有限公司 一种系统的维护进程运行方法及装置
CN105337780A (zh) * 2015-12-01 2016-02-17 迈普通信技术股份有限公司 一种服务器节点配置方法及物理节点
CN105337780B (zh) * 2015-12-01 2018-09-18 迈普通信技术股份有限公司 一种服务器节点配置方法及物理节点
WO2017215430A1 (zh) * 2016-06-14 2017-12-21 中兴通讯股份有限公司 一种集群内的节点管理方法及节点设备
CN106407397A (zh) * 2016-09-20 2017-02-15 郑州云海信息技术有限公司 一种基于oracle asm Rebalance的数据迁移方法和装置
CN107888393B (zh) * 2016-09-30 2021-04-27 郑州云海信息技术有限公司 一种非对称冗余通信链路中生成全连接集合的方法
CN107888393A (zh) * 2016-09-30 2018-04-06 郑州云海信息技术有限公司 一种非对称冗余通信链路中生成全连接集合的方法
CN106789291A (zh) * 2016-12-29 2017-05-31 郑州云海信息技术有限公司 一种集群成员控制方法和装置
CN106790163A (zh) * 2016-12-29 2017-05-31 郑州云海信息技术有限公司 一种面向存储设备的授权码管理方法及系统
CN106790163B (zh) * 2016-12-29 2020-05-29 郑州云海信息技术有限公司 一种面向存储设备的授权码管理方法及系统
CN107147528A (zh) * 2017-05-23 2017-09-08 郑州云海信息技术有限公司 一种存储网关智能防脑裂系统及方法
CN107547252B (zh) * 2017-06-29 2020-12-04 新华三技术有限公司 一种网络故障处理方法和装置
CN107547252A (zh) * 2017-06-29 2018-01-05 新华三技术有限公司 一种网络故障处理方法和装置
CN107918570A (zh) * 2017-10-20 2018-04-17 杭州沃趣科技股份有限公司 一种双活系统共享仲裁盘的方法
CN107918570B (zh) * 2017-10-20 2021-07-23 杭州沃趣科技股份有限公司 一种双活系统共享仲裁逻辑盘的方法
CN109495312B (zh) * 2018-12-05 2020-01-17 广州鼎甲计算机科技有限公司 基于仲裁盘和双链路的高可用集群的实现方法和系统
CN109495312A (zh) * 2018-12-05 2019-03-19 广州鼎甲计算机科技有限公司 基于仲裁盘和双链路的高可用集群的实现方法和系统
CN111586110A (zh) * 2020-04-22 2020-08-25 广州锦行网络科技有限公司 一种raft在出现点对点故障时的优化处理方法
CN112181305A (zh) * 2020-09-30 2021-01-05 北京人大金仓信息技术股份有限公司 数据库集群网络分区选择方法和装置
CN112181305B (zh) * 2020-09-30 2024-06-07 北京人大金仓信息技术股份有限公司 数据库集群网络分区选择方法和装置
CN112468596A (zh) * 2020-12-02 2021-03-09 苏州浪潮智能科技有限公司 一种集群仲裁方法、装置、电子设备及可读存储介质
CN112468596B (zh) * 2020-12-02 2022-07-05 苏州浪潮智能科技有限公司 一种集群仲裁方法、装置、电子设备及可读存储介质
US11902095B2 (en) 2020-12-02 2024-02-13 Inspur Suzhou Intelligent Technology Co., Ltd. Cluster quorum method and apparatus, electronic device, and readable storage medium
CN114461141A (zh) * 2021-12-30 2022-05-10 苏州浪潮智能科技有限公司 一种etcd系统、节点仲裁方法及系统
CN114461141B (zh) * 2021-12-30 2023-08-18 苏州浪潮智能科技有限公司 一种etcd系统、节点仲裁方法及系统

Also Published As

Publication number Publication date
CN102402395B (zh) 2014-07-16

Similar Documents

Publication Publication Date Title
CN102402395B (zh) 基于仲裁磁盘的高可用系统不间断运行方法
CN103201724B (zh) 在高可用性虚拟机环境中提供高可用性应用程序
CN105095001B (zh) 分布式环境下虚拟机异常恢复方法
CN100547558C (zh) 并行计算系统中的冗余保护的方法和系统
CN108270726B (zh) 应用实例部署方法及装置
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
CN101689114B (zh) 用于集群软件实体的动态cli映射
US10826812B2 (en) Multiple quorum witness
CN103546313A (zh) 基于云计算的it运维管理系统
CN102035862A (zh) Svc集群中配置节点的故障移交方法和系统
CN111694789A (zh) 嵌入式可重构异构测定方法、系统、存储介质、处理器
CN107918570B (zh) 一种双活系统共享仲裁逻辑盘的方法
US9218140B2 (en) System and method for selectively utilizing memory available in a redundant host in a cluster for virtual machines
CN105359109A (zh) 基于次计算机中的存储器错误移动主计算机中的对象
CN103106126A (zh) 一种基于虚拟化的高可用计算机系统
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
CN104798046A (zh) 对称多处理器布置、安全关键系统及其方法
US9195528B1 (en) Systems and methods for managing failover clusters
CN107291821A (zh) 一种同城双活架构快速切换的方法
CN103902401A (zh) 基于监控的虚拟机容错方法及装置
US8621260B1 (en) Site-level sub-cluster dependencies
JP2009069963A (ja) マルチプロセッサシステム
US20080250421A1 (en) Data Processing System And Method
CN110620684A (zh) 一种存储双控防脑裂方法、系统、终端及存储介质
CN102904946A (zh) 集群内节点管理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: CHINA STANDARD SOFTWARE CO., LTD.

Free format text: FORMER OWNER: SHANGHAI ZHONGBIAO SOFTWARE CO. LTD.

Effective date: 20120305

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20120305

Address after: 200030 room 1006-1010, Panyu Road, Shanghai, 1028

Applicant after: China Standard Software Co., Ltd.

Address before: 200030 Panyu Road, Shanghai, No. 10, building 1028, building

Applicant before: Shanghai Zhongbiao Software Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant