WO2014000430A1

WO2014000430A1 - 一种实现高可用集群的心跳服务的方法及装置

Info

Publication number: WO2014000430A1
Application number: PCT/CN2013/070155
Authority: WO
Inventors: 高军利
Original assignee: 华为技术有限公司
Priority date: 2012-06-29
Filing date: 2013-01-07
Publication date: 2014-01-03
Also published as: US9658912B2; CN102799394B; CN102799394A; US20150113340A1

Abstract

本发明实施例提供一种实现高可用集群的心跳服务的方法，包括：服务器将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；读取所述对应的一台或多台服务器写入至所述磁盘阵列中的所述对应的一台或多台服务器的心跳计数信息，重复所述写入和读取操作。相应地，本发明实施例还提供一种服务器，解决了脑裂的问题，提高了数据保护的安全性。

Description

一种实现高可用集群的心跳服务的方法及装置技术领域

本发明实施例涉及通信技术领域，尤其涉及一种实现高可用集群的心跳服务的方法及装置。背景技术

随着电信及 IT大容量关系式数据库应用，海量数据要求系统提供大容量、高速访问及双机可靠性机制，这种系统要求高可用（ High Available , HA ) 集群能够可靠性有效切换数据库业务到备用服务器，一般而言，磁阵双机模式下主备双机会通过心跳服务来传递心跳、倒换执行等控制信息，而平常心跳服务都是承载于 IP、时分复用器、光线、串口等磁阵之外硬件之上。

在 HA集群中，当心跳服务故障时，本来为一整体、动作协调的 HA集群，就分裂成为 2个及以上独立的个体。由于相互失去了联系，都以为是其他个体出了故障，后果是每个独立的个体都会争抢共享资源，同时读写共享存储，即同时对磁盘阵列进行读写操作，导致数据损坏，称之为脑裂。数据损坏修复困难并且费时费力，很可能彻底损坏，造成经济损失无法估量。

现有技术中，防止脑裂可以是釆用冗余心跳链路的方式，即釆用传输控制协议（ Transmission Control Protocol , TCP ) 、用户数据包协议（ User Datagram Protocol , UDP ) 、串口等通讯方式来传递心跳，减少主备出现脑裂，保证临界资源数据库的安全。以上几种通讯方式可以同时使用，也可以只使用一种，其余当备选的通讯方式。但是，当冗余心跳链路出故障时，不可避免地会出现脑裂。发明内容

本发明实施例提供一种实现高可用集群的心跳服务的方法及装置，解决了脑裂的问题，提高了数据保护的安全性。

本发明实施例提供一种实现高可用集群的心跳服务的方法，包括：服务器将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；

读取所述对应的一台或多台服务器写入至所述磁盘阵列中的所述对应的一台或多台服务器的心跳计数信息，重复所述写入和读取操作。

本发明实施例还提供一种实现高可用集群的心跳服务的服务器，包括：

写入单元，用于将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；读取单元，用于读取所述对应的一台或多台服务器写入至所述磁盘阵列中的所述对应的一台或多台服务器的心跳计数信息，所述写入单元和所述读取单元，还分别用于重复所述写入和读取操作。

本实施例提供的对实现高可用集群的心跳服务的方法，主机和备机对用于存储心跳计数信息的磁盘进行读写操作，解决了脑裂的问题，提高了数据保护的安全性。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例一的方法流程图；

图 2为本发明实施例二的方法流程图；

图 3为本发明实施例三的服务器的装置图；具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例一：图 1为本发明对实现高可用集群的心跳服务的一个方法实施例的流程图，如图 1所示，该方法可以包括：

S101、服务器将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；对于一个基于磁盘阵列的方式的高可用集群来说，磁盘阵列方式主要通过磁盘阵列提供切换后，对数据完整性和连续性的保障。用户数据一般会放在磁盘阵列上，当主机宕机后，备机继续从磁盘阵列上取得原有数据。

以双机热备（基于高可用的两台服务器的热备份）为例，将磁盘阵列规划为 3个逻辑盘，这里分别命名为 VI , V2及 DB , 其中， VI , V2都用于写入和读取心跳数据，也可以写入和读取服务器的主备用状态， DB 则用于记录用户数据。 VI、 V2及 DB的大小可以自定义，可以根据具体需要来进行规划。例如， VI、 V2 的占用空间不大，可以为其分配较小的逻辑空间， DB包含剩下的逻辑空间。 VI、 V2的内容组织是一样的，如表 1 所示。

表 1

0x5A000000为正在激活

0x00005A5A为备用

0x0000005A为预备激活

2 本端写消无符号每写入一条消息后该计数器累加一次，釆用物理 I /O 或基于操息序列号整形， 32 作系统的文件 I /O 方式写入到本 WSeq 端投票磁盘分区中

位

3 本端读取无符号每读取对端一条消息计数累加一次，釆用物理 I /O 方式或基于对端消息整形， 32 操作系统的文件 I /O 写入到本端投票磁盘分区中

序列号位 RSeq

4 心跳消息无符号消息区长度，最大不超过 64KB 长度整形， 32 位

5 心跳消息 BYTES 主、备机的心跳消息需要说明的是，主用状态为双机中使用磁阵提供业务的主机；备用态为双机中未使用磁阵提供业务的主机；预备激活态表示的是：备机检测到主机故障时准备激活，保持一段时间，防止对端争抢，对端检测到准备激活就不会争抢资源升主；正在激活态表示的是：预备激活态结束，开始激活资源，挂载磁阵的状态。服务器可通过物理的输入 /输出方式写入磁盘阵列中 ,也可通过基于操作系统的文件输入 /输出方式写入磁盘阵列中。在服务器写入至磁盘阵列后，对应的一台或多台服务器读取该磁盘阵列中服务器的心跳计数信息。由表 1可知，当服务器写入成功时，该服务器的写心跳序列号需要累加一次，可定义一个默认的正整数，每写入一次，写心跳序列号加上该正整数，作为新的写心跳消息序列号。而服务器每一次读取磁盘阵列的对应的一台或多台服务器的心跳计数信息后，服务器的读取对端心跳消息序列号也要加上该正整数作为新的读取对端心跳消息序列号。同理，若对应的一台或多台服务器每进行一次写入操作后，对应的一台或多台服务器的写心跳序列号加上该正整数，作为新的写心跳消息序列号，每进行一次读取操作后，对应的一台或多台服务器的读取对端心跳消息序列号也要加上该正整数作为新的读取对端心跳消息序列号。

S102、读取所述对应的一台或多台服务器写入至所述磁盘阵列中的所述对应的一台或多台服务器的心跳计数信息，重复所述写入和读取操作。

以双机热备为例，若该服务器是主机，则对应的服务器是备机，若该服务器是备机，则对应的服务器是主机。以该服务器是主机，对应服务器是备机为例，当备机写入心跳计数信息至磁盘阵列后，主机读取备机写入的心跳计数信息。读取的心跳计数信息与主机写入的心跳计数信息类型一致。为了方便说明，将主机的写心跳消息序列号定义为 WSeql , 主机的读取对端心跳消息序列号定义为 RSeql , 备机,的写心跳消息序列号定义为 WSeq2 , 备机的读取对端心跳消息序列号定义为 RSeq2。整个流程可用 tl— 14时刻为例 , 具体如下：

初始化时，定义 WSeql=RSeq2=0X0001 , WSeq2=RSeql=0X0001； tl 时刻，主机写入心跳计数信息至 VI , 其中的心跳计数信息包括主机的写心跳消息序列号 WSeql、主机读取对端心跳消息序列号 RSeql、主备状态信息、心跳消息和心跳消息长度，具体地，其中的 WSeql=0X0001 , RSeql=0X0001 , tl过程结束， WSeql 累加 1 得到 WSeql=0X0002。进入 t2 时刻（t2>tl ) , 备机读取 VI 中的心跳计数信息，读取到的心跳计数信息具体为 RSeql = WSeql =0X0001 , t2过程结束 RSeq2 累加 1 得到 RSeq2 =0X0002。进入 t3时刻（ t3>t2 ) , 备机写入心跳计数信息至 V2 , 备机写入的心跳计数信息包括备机的写心跳消息序列号 WSeq2、备机读取对端心跳消息序列号 RSeq2、主备状态信息、心跳消息和心跳消息长度，具体地，其中的 WSeq2=0X0001 , RSeq2=0X0002, t3 过程结束， WSeq2 累加 1 得到 WSeq2=0X0002。进入 t4时刻（t4>t3), 主机读取 V2中的心跳计数信息，读取到的 RSeq2= 0X0002 , WSeq2=0X0001 , t4过程结束， RSeql 累加 1得到 0X0002。

需要说明的是，在主机每次读取磁盘阵列上的备机的心跳计数信息之后，主机需要判断自身存储的 WSeql与从磁盘阵列中读取到的 RSeq2是否相等，如果相等，则进行下一次的写入操作，如果不相等，则判断判断磁盘阵列异常。其原因可能是第三方对磁盘阵列进行误操作，或者是磁盘阵列本身的故障导致。对于此种情况，主机将 WSeql赋值为 RSeq2 , 重新写入至 VI , 其流程不变。同理，对于备机来说，在备机每次读取磁盘阵列上的心跳计数信息之后，备机需要判断自身存储的 WSeq2 与从磁盘阵列中读取到的 RSeql是否相等，相等则进行下一次的写入操作，不相等则将 WSeq2赋值为 RSeql , 重新写入至 V2。这种方式可提供一种基于磁盘阵列的心跳保护机制，对于磁盘阵列异常处理有很强的自愈能力。对于心跳链路故障时，其主机或者备机与磁盘阵列的链路是故障的 , 即使脑裂情况出现，故障主机或者备机也无法访问磁阵，因此，也就不会同时对磁盘阵列进行读写，有效保护数据安全。

本实施例提供的对实现高可用集群的心跳服务的方法，主机和备机对用于存储心跳计数信息的磁盘进行读写操作，解决了脑裂的问题，提高了数据保护的安全性。本发明实施例二：

如图 2所示，在本实施例中，对实现高可用集群的心跳服务的方法流程如下：

S201、将磁盘阵列规划为 N个逻辑盘；

对于一个基于磁盘阵列的方式的高可用集群来说，磁盘阵列方式主要通过磁盘阵列提供切换后，对数据完整性和连续性的保障。用户数据一般会放在磁盘阵列上，当主机宕机后，备机继续从磁盘阵列上取得原有数据。

对于双机热备（基于高可用的两台服务器的热备份）来说，某一项业务需要两台服务器来执行，一台处于激活状态，即主服务器，简称主机，另外一台处理待命状态，及备服务器，简称备机。

以双机热备为例，将磁盘阵列规划为 3 个逻辑盘，这里分别命名为 VI , V2及 DB , 其中， VI , V2都用于写入和读取心跳数据，也可以写入和读取服务器的主备用状态， DB则用于记录用户数据。 VI、 V2及 DB的大小可以自定义，可以根据具体需要来进行规划。例如， VI、 V2 的占用空间不大，可以为其分配较小的逻辑空间， DB包含剩下的逻辑空间。 VI、 V2的内容组织是一样的，如实施例 1的表 1所示。

需要说明的是，对于主机个数大于 2的高可用多集群来说，磁盘阵列规划的逻辑盘个数为 N, N为大于 3的正整数。

S202、主机写入心跳计数信息至 VI；

主机通过物理的输入 /输出读写方式将心跳计数信息写入至 VI , 也可以通过基于操作系统的文件输入 /输出方式将心跳计数信息写入至 VI。其中，心跳计数信息包括写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，写心跳消息序列号每写入成功一次之后累加 N, N为默认的正整数，为了方便理解，本实施例中，写心跳消息序列号每写入成功一次之后累加 1。读取对端心跳消息序列号是主机读取 V2上的备机写入的写心跳消息序列号，主备状态信息即自身是主用还是备用，对于某一业务来说，主备用的状态可以相互转化，若主用服务器宕机，则备用服务器可升为主用服务器，原来的主用服务器则降为备用服务器。

S203、备机读取 VI的心跳计数信息；

备机读取 VI的心跳计数信息，将备机的读取对端心跳消息序列号赋值为读取到的主机的写心跳消息序列号之后，每读取成功一次，备机的读取对端心跳消息序列号加 1。

为了方便说明，将主机的写心跳消息序列号定义为 WSeql , 主机的读取对端心跳消息序列号定义为 RSeql , 备机,的写心跳消息序列号定义为 WSeq2 , 备机的读取对端心跳消息序列号定义为 RSeq2。则主机写入心跳计数信息至 VI之后，下一次待写入 VI的 WSeql为本次写入的 WSeql+1 ; 备机读取 VI的心跳计数信息之后，下一次待读取的 RSeq2为本次读取的 RSeq2+l 。例如，初始化时，定义 WSeql=RSeq2=0X0001 , WSeq2=RSeql=0X0001 ; tl 时刻，主机写入心跳计数信息至 VI , 其中的心跳计数信息包括主机的写心跳消息序列号 WSeql、主机读取对端心跳消息序列号 RSeql、主备状态信息、心跳消息和心跳消息长度，具体地，其中的 WSeql=0X0001 , RSeql=0X0001 , tl过程结束， WSeql 累加 1 得到 WSeql=0X0002。进入 t2时刻（ t2>tl ) , 备机读取 VI中的心跳计数信息，读取到的心跳计数信息具体为 RSeql = WSeql =0X0001 , t2 过程结束 RSeq2累加 1 得到 RSeq2 =0X0002。

S204、备机写入心跳计数信息至 V2;

备机写入心跳计数信息至 V2, 具体处理同 S202。接上例，进入 t3时刻（t3>t2 ) , 备机写入心跳计数信息至 V2, 备机写入的心跳计数信息包括备机的写心跳消息序列号 WSeq2、备机读取对端心跳消息序列号 RSeq2、主备状态信息、心跳消息和心跳消息长度，具体地，其中的 WSeq2=0X0001 , RSeq2=0X0002 , t3过程结束， WSeq2累加 1 得到 WSeq2=0X0002。

S205、主机读取 V2的心跳计数信息；

V2的心跳计数消息与 VI的心跳计数消息类型一致。接上例，进入 t4 时刻（t4>t3), 主机读取 V2中的心跳计数信息，读取到的 RSeq2= 0X0002, WSeq2=0X0001 , t4过程结束， RSeql 累加 1得到 0X0002。

若 VI , V2的原有的緩冲区已写满，则可另申请新的緩冲区，或者，从第一次写入緩冲区的位置开始到 VI , V2的緩冲区的末尾依次覆盖原来写入的信息。

S206、判断主机的写心跳消息序列号与备机的读取对端心跳消息序列号的关系；

主机和备机都会在写入和读取之前对自身保存的写心跳消息序列号和从磁盘阵列中读取的读取对端心跳消息序列号进行判断。由 tl一 t4时刻， RSeql、 RSeq2、 WSeql和 WSeq2的关系不难得出，对于主机来说 WSeql 等于 RSeq2, 或者等于 RSeq2+l时，属于正常状态，同理，对于备机来说， WSeq2等于 RSeql , 或者等于 RSeql+1时，属于正常状态。具体地，主机在写入之前判断 WSeql是否等于 RSeq2 , 在读取之前判断 WSeql是否等于 RSeq2+l ; 备机在写入之前判断 WSeq2是否等于 RSeql ,在读取之前判断 WSeq2是否等于 RSeql+l。故在主机判断出 WSeql等于 RSeq2, 或者等于 RSeq2+l时，服务器重复写入与读取操作。同理，在备机判断出 WSeq2 等于 RSeql ,或者等于 RSeql+1时，服务器重复写入与读取操作。接上例， t5 时刻，主机第二次将心跳计数信息写入至 VI , 此时 RSeql=WSeql=0X0002 , t5时刻结束， WSeql 累加 1 得到 WSeql=0X0003。 t6 时刻，备机第二次读取 VI 的心跳计数信息，此时读取的 WSeql=RSeql=0X0002。

那么，当主机判断出 WSeql 不等于 RSeq2+l , 且不等于 RSeq2, 则判断磁盘阵列异常。其原因可能是第三方对磁盘阵列进行误操作，或者是磁盘阵列本身的故障导致。对于此种情况，主机将 WSeql赋值为 RSeq2 , 重新写入至 VI ,其流程不变。同理，当备机判断出 WSeq2不等于 RSeql+1 , 且不等于 RSeql , 则判断磁盘阵列异常。备机将 WSeq2赋值为 RSeql , 重新写入至 V2 , 其流程不变。这种方式可提供一种基于磁盘阵列的心跳保护机制，对于磁盘阵列异常处理有很强的自愈能力。

对于心跳链路故障时，其主机或者备机与磁盘阵列的链路是故障的，即使脑裂情况出现，故障主机或者备机也无法访问磁阵，因此，也就不会同时对磁盘阵列进行读写，有效保护数据安全。

对于多集群的情况，可将磁盘阵列分为多个阵列（如分配为 VI , V2, V3 , …及用于存储用户数据的 DB ) , 其流程同双机热备的流程。

本实施例提供的对实现高可用集群的心跳服务的方法，主机和备机对用于存储心跳计数信息的磁盘进行读写操作，解决了脑裂的问题，提高了数据保护的安全性。本发明实施例三：

本发明实施例提供一种实现高可用集群的心跳服务的服务器，如图 3 所示，包括：

写入单元 301 , 用于将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；

以双机热备（基于高可用的两台服务器的热备份）为例，将磁盘阵列规划为 3个逻辑盘，这里分别命名为 VI , V2及 DB , 其中， VI , V2都用于写入和读取心跳数据，也可以写入和读取服务器的主备用状态， DB 则用于记录用户数据。 VI、 V2及 DB的大小可以自定义，可以根据具体需要来进行规划。例如， VI、 V2 的占用空间不大，可以为其分配较小的逻辑空间， DB包含剩下的逻辑空间。 VI、 V2的内容组织是一样的，如实施例的表 1所示。

写入单元 301可通过物理的输入 /输出方式写入磁盘阵列中 ,也可通过基于操作系统的文件输入 /输出方式写入磁盘阵列中。

当写入单元 301写入成功时，累加单元将写心跳序列号累加一次，可定义一个默认的正整数，每写入一次，写心跳序列号加上该正整数，作为新的写心跳消息序列号。而服务器的读取单元每一次读取磁盘阵列的对应的一台或多台服务器的心跳计数信息后，服务器的累加单元也要将服务器的读取对端心跳消息序列号加上该正整数作为新的读取对端心跳消息序列号。同理，若对应的一台或多台服务器每进行一次写入操作后，对应的一台或多台服务器的写心跳序列号加上该正整数，作为新的写心跳消息序列号，每进行一次读取操作后，对应的一台或多台服务器的读取对端心跳消息序列号也要加上该正整数作为新的读取对端心跳消息序列号。

读取单元 302, 用于读取所述对应的一台或多台服务器写入至所述磁盘阵列中的所述对应的一台或多台服务器的心跳计数信息；

所述写入单元 301和所述读取单元 302, 还分别用于重复所述写入和读取操作。

以双机热备为例，若该服务器是主机，则对应的服务器是备机，若该服务器是备机，则对应的服务器是主机。

以该服务器是主机，对应服务器是备机为例，当备机写入心跳计数信息至磁盘阵列后，主机的读取单元 302读取备机写入的心跳计数信息。读取的心跳计数信息与主机写入的心跳计数信息类型一致。

为了方便说明，将主机的写心跳消息序列号定义为 WSeql , 主机的读取对端心跳消息序列号定义为 RSeql , 备机的写心跳消息序列号定义为 WSeq2 , 备机的读取对端心跳消息序列号定义为 RSeq2。整个流程可用 tl— 14时刻为例 , 具体如下：

初始化时，定义 WSeql=RSeq2=0X0001 , WSeq2=RSeql=0X0001； tl 时刻，主机的写入单元 301写入心跳计数信息至 VI , 其中的心跳计数信息包括主机的写心跳消息序列号 WSeql、主机读取对端心跳消息序列号 RSeql , 主备状态信息、心跳消息和心跳消息长度，具体地，其中的 WSeql=0X0001 , RSeql=0X0001 , tl过程结束，主机的累加单元将 WSeql 累加 1 得到 WSeql=0X0002。进入 t2时刻（ t2>tl ) , 备机的读取单元读取 VI中的心跳计数信息，读取到的心跳计数信息具体为 RSeql = WSeql =0X0001 , t2 过程结束备机的累加单元将 RSeq2 累加 1 得到 RSeq2 =0X0002。进入 t3 时刻（t3>t2 ) , 备机的写入单元写入心跳计数信息至 V2 , 备机的写入单元写入的心跳计数信息包括备机的写心跳消息序列号 WSeq2、备机读取对端心跳消息序列号 RSeq2、主备状态信息、心跳消息和心跳消息长度，具体地，其中的 WSeq2=0X0001 , RSeq2=0X0002 , t3 过程结束，备机的累加单元将 WSeq2累加 1 得到 WSeq2=0X0002。进入 t4时刻（t4>t3), 主机的读取单元 302读取 V2中的心跳计数信息，读取到的 RSeq2= 0X0002 , WSeq2=0X0001 , t4过程结束，主机的累加单元将 RSeql 累加 1得到 0X0002。

需要说明的是，在主机的读取单元 302每次读取磁盘阵列上的备机的心跳计数信息之后，主机的判断单元需要判断自身存储的 WSeql 与从磁盘阵列中读取到的 RSeq2是否相等，如果相等，则写入单元 301进行下一次的写入操作，如果不相等，则判断单元判断磁盘阵列异常。其原因可能是第三方对磁盘阵列进行误操作，或者是磁盘阵列本身的故障导致。对于此种情况，主机的写入单元将 WSeql赋值为 RSeq2 , 重新写入至 VI , 其流程不变。同理，对于备机来说，在备机的读取单元每次读取磁盘阵列上的心跳计数信息之后，备机的判断单元需要判断自身存储的 WSeq2 与从磁盘阵列中读取到的 RSeql是否相等，相等则进行下一次的写入操作，不相等则备机的写入单元将 WSeq2赋值为 RSeql , 重新写入至 V2。这种方式可提供一种基于磁盘阵列的心跳保护机制，对于磁盘阵列异常处理有很强的自愈能力。

主机和备机判断单元进行判断的另外一种方式可以是：主机和备机的判断单元都会在写入单元写入和读取单元读取之前对自身保存的写心跳消息序列号和从磁盘阵列中读取的读取对端心跳消息序列号进行判断。由 tl一 t4时刻， RSeql、 RSeq2、 WSeql和 WSeq2的关系不难得出，对于主机来说 WSeql等于 RSeq2 , 或者等于 RSeq2+l时，属于正常状态，同理，对于备机来说， WSeq2等于 RSeql , 或者等于 RSeql+1时，属于正常状态。具体地，主机在写入单元写入之前通过判断单元判断 WSeql是否等于 RSeq2 , 在读取单元读取之前通过判断单元判断 WSeql 是否等于 RSeq2+l ; 备机在写入单元写入之前通过判断单元判断 WSeq2是否等于 RSeql , 在读取单元读取之前通过判断单元判断 WSeq2 是否等于 RSeql+l。故在主机的判断单元判断出 WSeql 等于 RSeq2 , 或者等于 RSeq2+l 时，主机的写入单元进行下一次写入操作，读取单元进行下一次读取操作。同理，在备机的判断单元判断出 WSeq2等于 RSeql , 或者等于 RSeql+1 时，备机的写入单元进行下一次写入操作，读取单元进行下一次读取操作。那么，当主机判断单元判断出 WSeql不等于 RSeq2+l , 且不等于 RSeq2 , 则判断磁盘阵列异常。其原因可能是第三方对磁盘阵列进行误操作，或者是磁盘阵列本身的故障导致。对于此种情况，主机将写入单元将 WSeql赋值为 RSeq2 ,重新写入至 VI ,其流程不变。同理，当备机判断单元判断出 WSeq2不等于 RSeql+1 , 且不等于 RSeql , 则判断磁盘阵列异常。备机写入单元将 WSeq2赋值为 RSeql ,重新写入至 V2 , 其流程不变。

本实施例提供的对实现高可用集群的心跳服务的服务器，服务器的写入单元对用于存储心跳计数信息的磁盘进行写操作，服务器的读取单元对用于存储心跳计数信息的磁盘进行读操作，解决了脑裂的问题，提高了数据保护的安全性。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，设备和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的单元或流程并不一定是实施本发明所必须的。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以釆用硬件的形式实现，也可以釆用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括： U盘、移动硬盘、只读存储器（Read-Only Memory, 简称 ROM ) 、随机存取存储器（Random Access Memory, 简称 RAM ) 、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求

1、一种实现高可用集群的心跳服务的方法，其特征在于，包括：服务器将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；

2、根据权利要求 1所述的方法，其特征在于，

所述服务器每进行一次写入操作之后，将所述服务器的写心跳消息序列号加上一个默认的正整数作为所述服务器的新的写心跳消息序列号；所述服务器每进行一次读取操作之后，将所述服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述服务器的新的读取对端心跳消息序列号，并在判断出自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号相等之后，进行下一次写入操作。

3、根据权利要求 2所述的方法，其特征在于，

所述对应的一台或多台服务器每进行一次写入操作之后，将所述对应的一台或多台服务器的写心跳消息序列号加上所述默认的正整数作为对应的一台或多台服务器的新的写心跳消息序列号；

所述对应的一台或多台服务器每进行一次读取操作之后，将所述对应的一台或多台服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述对应的一台或多台服务器的新的读取对端心跳消息序列号，并在判断出自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号相等之后，进行下一次写入操作。

4、根据权利要求 1所述的方法，其特征在于，

所述对应的一台或多台服务器每进行一次写入操作之后，将所述对应的一台或多台服务器的写心跳消息序列号加上一个默认的正整数作为对应的一台或多台服务器的新的写心跳消息序列号；

5、根据权利要求 2或 3所述的方法，其特征在于，当所述服务器判断出所述服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号后，所述方法进一步包括：

所述服务器判断所述磁盘阵列状态异常，将所述服务器自身存储的写心跳消息序列号赋值为在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号；

将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

6、根据权利要求 3— 5任一项所述的方法，其特征在于，当所述对应的一台或多台服务器判断出所述对应的一台或多台服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号后，所述方法进一步包括：

所述对应的一台或多台服务器判断所述磁盘阵列状态异常，将所述对应的一台或多台服务器自身存储的写心跳消息序列号赋值为在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号；

将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

7、根据权利要求 1所述的方法，其特征在于，

所述服务器每进行一次写入操作之前，判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号相等；

所述服务器每进行一次写入操作之后，将所述服务器的写心跳消息序列号加上一个默认的正整数作为所述服务器的新的写心跳消息序列号；所述服务器每进行一次读取操作之前，判断自身储存的写心跳消息序列号等于在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号与所述默认的正整数之和；

所述服务器每进行一次读取操作之后，将所述服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述服务器的新的读取对端心跳消息序列号。

8、根据权利要求 7所述的方法，其特征在于，

所述对应的一台或多台服务器每进行一次写入操作之前，判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号相等；

所述对应的一台或多台服务器每进行一次读取操作之前，判断自身储存的写心跳消息序列号等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号与所述默认的正整数之和；

所述对应的一台或多台服务器每进行一次读取操作之后，将所述对应的一台或多台服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述对应的一台或多台服务器的新的读取对端心跳消息序列号。

9、根据权利要求 1所述的方法，其特征在于，

10、根据权利要求 7或 8所述的方法，其特征在于，当所述服务器判断出所述服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号，且所述服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号与所述默认的正整数的和之后，所述方法进一步包括：

将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

11、根据权利要求 8— 10任一项所述的方法，其特征在于，当所述对应的一台或多台服务器判断出所述对应的一台或多台服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号，且所述对应的一台或多台服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号与所述默认的正整数的和之后，所述方法进一步包括：

将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

12、根据权利要求 1 11任一项所述的方法，其特征在于，所述写入和读取操作，包括：

所述服务器通过物理的输入 /输出方式对所述磁盘阵列进行所述写入和读取操作。

13、根据权利要求 1 1 1任一项所述的方法，其特征在于，所述写入和读取操作，包括：

所述服务器通过基于操作系统的文件输入 /输出方式对所述磁盘阵列进行所述写入和读取操作。

14、一种实现高可用集群的心跳服务的服务器，其特征在于，包括：写入单元，用于将心跳计数信息写入磁盘阵列中，所述心跳计数信息包括所述服务器的写心跳消息序列号、读取对端心跳消息序列号、主备状态信息、心跳消息和心跳消息长度，以便对应的一台或多台服务器读取所述磁盘阵列中的所述服务器的心跳计数信息；读取单元，用于读取所述对应的一台或多台服务器写入至所述磁盘阵列中的所述对应的一台或多台服务器的心跳计数信息，

所述写入单元和所述读取单元，还分别用于重复所述写入和读取操作。

15、根据权利要求 14 所述的服务器，其特征在于，所述服务器还包括：

累加单元，用于所述服务器每进行一次写入操作之后，将所述服务器的写心跳消息序列号加上一个默认的正整数作为所述服务器的新的写心跳消息序列号；

所述累加单元还用于所述服务器每进行一次读取操作之后，将所述服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述服务器的新的读取对端心跳消息序列号；

判断单元，用于判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号相等；所述写入单元还用于在所述判断单元判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号相等后，进行下一次写入操作。

16、根据权利要求 15 所述的服务器，其特征在于，所述对应的一台或多台服务器还包括：

累加单元，用于所述对应的一台或多台服务器每进行一次写入操作之后，将所述对应的一台或多台服务器的写心跳消息序列号加上所述默认的正整数作为对应的一台或多台服务器的新的写心跳消息序列号；

所述累加单元还用于所述对应的一台或多台服务器每进行一次读取操作之后，将所述对应的一台或多台服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述对应的一台或多台服务器的新的读取对端心跳消息序列号；

判断单元，用于判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号相等；

所述写入单元还用于在所述判断单元判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号相等后，进行下一次写入操作。

17、根据权利要求 15或 16所述的服务器，其特征在于，当所述服务器判断出所述服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号后，所述服务器的写入单元进行写入操作，进一步包括：

所述判断单元判断所述磁盘阵列状态异常，将所述服务器自身存储的写心跳消息序列号赋值为在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号，将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

18、根据权利要求 15— 17 任一项所述的服务器，其特征在于，当所述对应的一台或多台服务器判断出所述对应的一台或多台服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号后，所述对应的一台或多台服务器的写入单元进行写入操作，进一步包括：

将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

19、根据权利要求 14 所述的服务器，其特征在于，所述服务器还包括：

判断单元，用于在所述写入单元每进行一次写入操作之前，判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号相等；

累加单元，用于在所述写入单元每进行一次写入操作之后，将所述服务器的写心跳消息序列号加上一个默认的正整数作为所述服务器的新的写心跳消息序列号；

所述判断单元还用于在所述读取单元每进行一次读取操作之前，判断自身储存的写心跳消息序列号等于在所述磁盘阵列中读取的所述对应一台或多台服务器的读取对端心跳消息序列号与所述默认的正整数之和；所述累加单元还用于在所述读取单元每进行一次读取操作之后，将所述服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述服务器的新的读取对端心跳消息序列号。

20、根据权利要求 19 所述的服务器，其特征在于，所述对应的一台或多台服务器还包括：

判断单元，用于在所述写入单元每进行一次写入操作之前，判断自身储存的写心跳消息序列号与在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号相等；

累加单元，用于在所述写入单元每进行一次写入操作之后，将所述对应的一台或多台服务器的写心跳消息序列号加上所述默认的正整数作为对应的一台或多台服务器的新的写心跳消息序列号；

所述判断单元还用于在所述读取单元每进行一次读取操作之前，判断自身储存的写心跳消息序列号等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号与所述默认的正整数之和；

所述累加单元还用于在所述读取单元每进行一次读取操作之后，将所述对应的一台或多台服务器的读取对端心跳消息序列号加上所述默认的正整数作为所述对应的一台或多台服务器的新的读取对端心跳消息序列号。

21、根据权利要求 19或 20所述的服务器，其特征在于，当所述服务器的判断单元判断出所述服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号，且所述服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号与所述默认的正整数的和之后，所述服务器还包括：

所述判断单元判断所述磁盘阵列状态异常，所述写入单元将所述服务器自身存储的写心跳消息序列号赋值为在所述磁盘阵列中读取的所述对应的一台或多台服务器的读取对端心跳消息序列号，将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

22、根据权利要求 20或 21所述的服务器，其特征在于，当所述对应的一台或多台服务器的判断单元判断出所述对应的一台或多台服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号，且所述对应的一台或多台服务器自身存储的写心跳消息序列号不等于在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号与所述默认的正整数的和之后，所述服务器还包括：所述对应的一台或多台服务器的判断单元判断所述磁盘阵列状态异常，所述对应的一台或多台服务器的写入单元将所述对应的一台或多台服务器自身存储的写心跳消息序列号赋值为在所述磁盘阵列中读取的所述服务器的读取对端心跳消息序列号，将所述赋值之后的写心跳消息序列号写入所述磁盘阵列中。

23、根据权利要求 14 22任一项所述的服务器，其特征在于，所述写入单元和所述读取单元通过物理的输入 /输出方式对所述磁盘阵列进行所述写入和读取操作。

24、根据权利要求 14 22任一项所述的服务器，其特征在于，所述写入单元和所述读取单元通过基于操作系统的文件输入 /输出方式对所述磁盘阵列进行所述写入和读取操作。