WO2012097588A1

WO2012097588A1 - 数据存储方法、设备和系统

Info

Publication number: WO2012097588A1
Application number: PCT/CN2011/078476
Authority: WO
Inventors: 周文明; 钟炎培; 吴清
Original assignee: 华为技术有限公司
Priority date: 2011-01-19
Filing date: 2011-08-16
Publication date: 2012-07-26
Also published as: CN102088490B; CN102088490A

Description

数据存储方法、设备和系统

本申请要求于 2011 年 1 月 19 日提交中国专利局、申请号为 201110021715.1、发明名称为 "数据存储方法、设备和系统" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种数据存储方法、设备和系统。

背景技术

网络块设备（Network Block Device; 以下简称： NBD ) ，是通过传输控制协议 ( Transmission Control Protocol; 以下简称： TCP ) /因特网协议 ( Internet

Protocol; 以下简称： IP ) 网络把服务器上的文件或块设备抽象出来供客户端使用的技术。与之对应的软件是一种基于 Linux的网络存储软件，利用这一软件可以构建基于 Linux的网络存储系统。作为一套存储系统，尤其是用于商业解决方案，存储系统非常复杂，对性能和可靠性的要求都很高。但是，现有的 NBD只是完成普通的网络传输，缺少对网络异常和存储节点异常的考虑。

举例来说，在本地服务器 A上布署 NBD客户端（NBD Client )，并虚拟一个 NBD设备 nbdl，在远程服务器 B上布署 NBD服务器（NBD Server ) 。创建于 nbdl上的虚拟机处于运行状态，但是由于网络异常或者存储节点发生异常，无法从 NBD服务器读取数据，造成虚拟机停机。

为解决上述可靠性问题，现有技术提出独立磁盘冗余阵列 1 ( Redundant

Array of Independent Disks 1；以下简称： RAID 1 ) 方案，即由底层的单个存储节点上的多个硬盘组成 RAID1 , 供 NBD服务器使用。

但是，发明人发现上述 RAID1方案至少存在以下缺点：

( l ) RAIDl方案不能跨节点存储，只能降低单节点发生故障的概率，如果 RAID卡出现故障，则上层业务程序不可用；

( 2 )无法解决网络异常引起的业务不可用问题；

( 3 )对于存储节点来说，经过 RAID卡之后数据量增倍，大大增加了存储节点的负荷。

为解决上述可靠性问题，现有技术还提供另外一种方案，即主卷和备份卷方案，具体地，上层业务程序写输入（Input; 以下简称： 1 ) /输出（Output; 以下简称： 0 ) 时，先向主卷写数据，然后由主卷将数据传到备份卷，备份卷写完后再向主卷报告写 I/O结果，最后由主卷向上层业务程序报告写 I/O结果。

主卷和备份卷方案在物理上将主备分开了，与 RAID1方案相比，单节点故障时数据不会损坏，进一步提高了可靠性。但发明人发现主卷和备份卷方案仍然存在以下缺点：

( 1 )备份卷只是用来备份数据，在系统运行过程中，所有的负荷都在主卷，也就是说主卷所在的节点会成为 I/O瓶颈；

( 2 )—次 I/O要交互 4条消息，消息流量较大。发明内容

本发明实施例提供一种数据存储方法、设备和系统，以提高存储可靠性，降低消息流量。

本发明实施例提供一种数据存储方法，包括：

通过主卷与虚拟块存储客户端之间的套接字连接接收待写入数据；将所述待写入数据写入所述主卷的卷文件，并将所述待写入数据通过所述主卷与备份卷之间的套接字连接发送给所述备份卷，以便所述备份卷在将所述待写入数据写入所述备份卷的卷文件之后，向所述虚拟块存储客户端的内核上报写入操作的结果。

本发明实施例还提供一种主卷节点设备，包括：

接收模块，用于通过所述主卷节点设备与虚拟块存储客户端之间的套接字连接接收待写入数据；

写入模块，用于将所述接收模块接收的待写入数据写入所述主卷节点设备的卷文件，并将所述待写入数据通过所述主卷节点设备与备份卷节点设备之间的套接字连接发送给所述备份卷节点设备，以便所述备份卷节点设备在将所述待写入数据写入所述备份卷节点设备的卷文件之后，向所述虚拟块存储客户端的内核上报写入操作的结果。

本发明实施例还提供一种虚拟块存储客户端设备，包括：

连接建立模块，用于根据预先指定的备份卷的监听端口与所述预先指定的备份卷建立套接字连接，以及根据预先指定的主卷的监听端口与所述预先指定的主卷建立套接字连接；

获得模块，用于获得所述预先指定的备份卷的卷大小、检测点和单节点位图，以及获得所述预先指定的主卷的卷大小、检测点和单节点位图；

比较模块，用于比较所述预先指定的主卷和所述预先指定的备份卷的检测点；

确定模块，用于根据所述比较模块的比较结果确定最新检测点对应的卷为真正的主卷，次新检测点对应的卷为真正的备份卷；

注册模块，用于向所述虚拟块存储客户端设备的内核注册所述真正的主卷和所述真正的备份卷的角色，以及当所述真正的主卷与所述真正的备份卷之间的链路正常时，将所述连接建立模块与所述预先指定的备份卷建立的套接字连接的描述符，以及所述连接建立模块与所述预先指定的主卷建立的套接字连接的描述符注册到所述虚拟块存储客户端设备的内核；

调用模块，用于调用系统函数进入内核态线程，在所述内核态线程中处理上层业务程序发送的写操作请求。

本发明实施例还提供一种备份卷节点设备，包括：

数据接收模块，用于接收主卷节点设备通过所述主卷节点设备与备份卷节点设备之间的套接字连接发送的待写入数据；

数据写入模块，用于将所述数据接收模块接收的待写入数据写入所述备份卷节点设备的卷文件；

结果上报模块，用于向虚拟块存储客户端设备的内核上报写入操作的结果。

本发明实施例还提供一种存储系统，包括：上述主卷节点设备、上述虚拟块存储客户端设备和上述备份卷节点设备。

通过本发明实施例，主卷通过该主卷与虚拟块存储客户端之间的套接字连接接收到待写入数据之后，将上述待写入数据写入主卷的卷文件，并将上述待写入数据通过主卷与备份卷之间的套接字连接发送给备份卷，以便备份卷将待写入数据写入该备份卷的卷文件，从而可以提高存储可靠性；在备份卷将待写入数据写入该备份卷的卷文件之后，由备份卷向虚拟块存储客户端的内核上报写入操作的结果；从而可以降低消息流量，并且可以分担主卷的部分负荷，达到动态负载均衡的目的。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明数据存储方法一个实施例的流程图；

图 2为本发明网络架构一个实施例的示意图；

图 3为本发明建立三角模型一个实施例的流程图；

图 4为本发明数据存储方法另一个实施例的流程图；

图 5为本发明网络架构另一个实施例的示意图；

图 6为本发明数据存储方法又一个实施例的流程图；

图 7为本发明网络架构又一个实施例的示意图；

图 8为本发明数据存储方法再一个实施例的流程图；

图 9为本发明网络架构再一个实施例的示意图；

图 10为本发明主卷节点设备一个实施例的结构示意图；图 11为本发明主卷节点设备另一个实施例的结构示意图；图 12为本发明虚拟块存储客户端设备一个实施例的结构示意图；图 13为本发明虚拟块存储客户端设备另一个实施例的结构示意图；；图 14为本发明备份卷节点设备一个实施例的结构示意图；

图 15为本发明备份卷节点设备另一个实施例的结构示意图；

图 16为本发明存储系统一个实施例的结构示意图；

图 17为本发明云存储系统一个实施例的示意图。具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明数据存储方法一个实施例的流程图，如图 1所示，该数据存储方法可以包括：

步骤 101，通过主卷与虚拟块存储客户端之间的套接字连接接收待写入数据。

步骤 102，将上述待写入数据写入该主卷的卷文件，并将上述待写入数据通过主卷与备份卷之间的套接字连接发送给备份卷，以便备份卷在将待写入数据写入该备份卷的卷文件之后，向虚拟块存储客户端的内核上报写入操作的结果。

本实施例中，在通过主卷与虚拟块存储客户端之间的套接字连接接收待写入数据之前，主卷还可以接收虚拟块存储客户端的内核发送的写操作请求，并将该写操作请求转发给备份卷，该写操作请求用于通知主卷和 /或备份卷准备接收待写入数据；上述写操作请求是虚拟块存储客户端的内核从该内核注册的请求队列中获取的；该内核注册的请求队列中的写操作请求是虚拟块存储客户端接收到上层业务程序发送的写操作请求之后，放入该内核注册的请求队列中的。

本实施例中，在备份卷向虚拟块存储客户端的内核上报写入操作的结果之后，主卷可以向备份卷发送检测点记录请求，以使主卷和备份卷更新各自的检测点。

另外，在备份卷向虚拟块存储客户端的内核上报写入操作的结果之后，主卷还可以检查脏数据块列表中是否有脏数据；当该脏数据块列表中有脏数据，且满足预定条件之后，将上述脏数据写到磁盘中。其中，脏数据为暂时存放在内存緩沖区中，还未写入卷文件的数据；脏数据块列表用于记录哪些数据是脏数据。

进一步地，本实施例中，主卷接收虚拟块存储客户端的内核发送的写操作请求之前，虚拟块存储客户端可以根据预先指定的备份卷的监听端口与预先指定的备份卷建立套接字连接，并获得预先指定的备份卷的卷大小、检测点和单节点位图；虚拟块存储客户端可以根据预先指定的主卷的监听端口与预先指定的主卷建立套接字连接，并获得预先指定的主卷的卷大小、检测点和单节点位图；然后，虚拟块存储客户端可以比较预先指定的主卷和预先指定的备份卷的检测点，确定最新检测点对应的卷为真正的主卷，次新检测点对应的卷为真正的备份卷；之后，虚拟块存储客户端可以向该虚拟块存储客户端的内核注册真正的主卷和真正的备份卷的角色；当上述真正的主卷与真正的备份卷之间的链路正常时，虚拟块存储客户端将与预先指定的备份卷建立的套接字连接的描述符，以及与预先指定的主卷建立的套接字连接的描述符注册到虚拟块存储客户端的内核；接下来，虚拟块存储客户端可以调用系统函数，例如： ioctrl进入内核态线程，在该内核态线程中处理上层业务程序发送的写操作请求。

其中，在虚拟块存储客户端将与预先指定的备份卷建立的套接字连接的描述符，以及与预先指定的主卷建立的套接字连接的描述符注册到虚拟块存果真正的主卷与真正的备份卷之间的数据不同步，则虚拟块存储客户端可以向真正的主卷发送数据同步请求，以使真正的主卷与真正的备份卷进行数据同步。

另外，本实施例的一种实现方式中，当主卷发生异常时，在虚拟块存储客户端的内核进行主备倒换，将备份卷注册为新的主卷之后，该新的主卷可以通过新的主卷与虚拟块存储客户端之间的套接字连接接收待写入数据，在将该待写入数据写入新的主卷的卷文件之后，更新新的主卷的检测点和单节点位图；然后，该新的主卷向虚拟块存储客户端的内核上报写入操作的结果。

本实施例的另一种实现方式中，当虚拟块存储客户端与备份卷之间的网络发生异常时，主卷可以接收虚拟块存储客户端发送的链路异常消息，并将该链路异常消息转发给备份卷，以使备份卷将写入操作的结果发送给主卷，再由主卷将该写入操作的结果发送给虚拟块存储客户端的内核；其中，上述链路异常消息由虚拟块存储客户端的心跳进程发送给虚拟块存储客户端。

本实施例的再一种实现方式中，当主卷和备份卷之间的网络发生异常时，主卷可以在将待写入数据写入该主卷的卷文件之后，更新主卷的检测点和单节点位图；然后，再由主卷向虚拟块存储客户端的内核上报写入操作的结果。

本实施例中，接收到写入操作的结果之后，虚拟块存储客户端的内核可以先确定写入操作的结果是否与已发送的写操作请求对应；如果对应，则虚拟块存储客户端的内核可以将上述写入操作的结果发送给上层业务程序；如果写入操作的结果与已发送的写操作请求不对应，则虚拟块存储客户端的内核可以丟弃该写入操作的结果，或者緩存但不处理该写入操作的结果，本发明实施例对此不作限定，但本发明实施例以写入操作的结果与已发送的写操作请求不对应时，虚拟块存储客户端的内核丟弃该写入操作的结果为例进行说明。上述实施例中，主卷通过该主卷与虚拟块存储客户端之间的套接字连接接收到待写入数据之后，将上述待写入数据写入主卷的卷文件，并将上述待写入数据通过主卷与备份卷之间的套接字连接发送给备份卷，以便备份卷将待写入数据写入该备份卷的卷文件，从而可以提高存储可靠性；在备份卷将待写入数据写入该备份卷的卷文件之后，由备份卷向虚拟块存储客户端的内核上报写入操作的结果；从而可以降低消息流量，并且可以分担主卷的部分负荷，达到动态负载均衡的目的。

本发明实施例提供的数据存储方法可以提高存储可靠性，并在保证存储可靠性的前提下，可以进一步降低消息流量，提高性能。

本发明实施例中，可以将主卷和备份卷部署在不同的存储节点上，既可以解决单存储节点故障引起的业务不可用问题，也可以解决业务与主卷所在存储节点或备份卷所在存储节点间的网络异常引起的业务不可用问题；另夕卜，在保证单节点故障业务不中断的前提下，本发明实施例可以将消息流量减少

25%, 性能上有很大的提高。另外，备份卷在实现数据备份的同时，参与了业务流程（回应写入操作的结果），可以分担主卷的部分负荷，达到一个动态负载均衡的目的。

本发明实施例采用图 2所示的网络架构，图 2为本发明网络架构一个实施例的示意图，如图 2所示，该网络架构是一个稳定的三角模型，在该三角模型中，实线代表套接字（SOCKET )连接，箭头指向服务器侧，虚线为控制消息的流向。

本发明实施例中，在处理读操作请求时，备份卷（ Backup Volume; 以下简称： BV ) 不感知，读数据操作和回应都由主卷（Primary Volume; 以下简称： PV ) 负责；在处理写操作请求时，由 PV接收待写入数据， BV回应写入操作的结果。这样，可以将消息量减少 25%，从而达到提高性能的目的。

另外，图 2所示的网络架构可以有效防止存储节点异常和网络异常，只要不是虚拟块存储客户端（virtual block storage client; 以下简称： vbs-client ) 、 PV和 BV中的任意两个同时发生异常，或者 vbs-client与 PV之间的链路，以及 vbs-client与 BV之间的链路同时发生异常，上层业务程序可以不中断的运行。

图 3为本发明建立三角模型一个实施例的流程图，如图 3所示，图 2所示三角模型的建立流程可以包括：

步骤 301， vbs-client根据预先指定的 BV的监听端口与该预先指定的 BV建立 SOCKET连接。

本实施例中，预先指定的 BV的监听端口是由预先指定的 BV预先对外提供的。

步骤 302， vbs-client与预先指定的 BV进行协商，协商的内容包括： ( 1 )通知预先指定的 BV当前连接的是 vbs-client;

( 2 )通知预先指定的 BV预先指定的 PV的信息，包括预先指定的 PV的名称和监听端口；其中，预先指定的 PV的监听端口也是由预先指定的 PV预先提供的；

( 3 ) 向预先指定的 BV发送获取卷大小，检测（check )点和单节点位图 ( solo bitmap ) 的请求；其中， check点记录的是写入数据的时间点。

步骤 303，预先指定的 BV向 vbs-client返回卷大小、 check点和 solo bitmap。步骤 304， vbs-client根据预先指定的 PV的监听端口与该预先指定的 PV建立 SOCKET连接。

步骤 305， vbs-client与预先指定的 PV进行协商，协商的内容包括： ( 1 )通知预先指定的 PV当前连接的是 vbs-client;

( 2 )通知预先指定的 PV当前预先指定的 BV的信息，包括预先指定的 BV 的名称和监听端口；

( 3 ) 向预先指定的 PV发送获取卷大小、 check点和 solo bitmap的请求。步骤 306，预先指定的 PV向 vbs-client返回卷大小、 check点和 solo bitmap。步骤 307， vbs-client比较预先指定的 PV和预先指定的 BV的 check点，确定最新检测点对应的卷为真正的 PV，次新检测点对应的卷为真正的 B V。具体地，如果比较 check点之后， vbs-client发现预先指定的 BV的 check点是最新的，也就是说预先指定的 BV—侧的数据是最新的，这说明在这之前预先指定的 PV发生过异常，然后由 vbs-client的内核进行主备倒换，将预先指定的 B V作为真正的 P V，之后存储系统在预先指定的 B V写过数据。

本实施例以预先指定的 PV为真正的 PV，预先指定的 BV为真正的 BV为例进行说明。

步骤 308， vbs-client向 vbs-client的内核注册真正的 BV的角色，并通知预先指定的 BV，其为真正的 BV。

步骤 309， vbs-client向 vbs-client的内核注册真正的 PV的角色，并通知预先指定的 PV，其为真正的 PV。果正常，则执行步骤 311〜步骤 313; 如果真正的 PV与真正的 BV之间的链路发生异常，则退出本流程，进入重建流程。

步骤 311，如果真正的 PV与真正的 BV之间的数据不同步，则 vbs-client向真正的 PV发送数据同步请求，以使该真正的 PV与真正的 BV进行数据同步。

步骤 312， vbs-client将步骤 301与步骤 304建立的 SOCKET连接的描述符注册到 vbs-client的内核。这样， vbs-client的内核在向真正的 PV发送读操作请求、接；而在接收数据或控制消息时， vbs-client的内核会选择一个合适的 SOCKET 连接。因为，在三角模型下， vbs-client是从 vbs-client的内核与真正的 BV之间的 SOCKET连接开始接收数据的，而在 L模型或 SOLO模型下， vbs-client是从 vbs-client的内核与真正的 PV之间的 SOCKET连接开始接收数据的。

步骤 313， vbs-client调用系统函数，例如： ioctrl进入内核态线程，在内核态线程由注册到系统的回调函数处理上层业务程序发送的 I/O请求，例如：写操作请求和读操作请求。

上述实施例可以实现建立三角模型，通过该三角模型处理写操作请求，可以实现提高存储可靠性，降低消息流量，提高存储性能。

图 4为本发明数据存储方法另一个实施例的流程图，由于本发明实施例中，读操作请求的处理过程仅是 vbs-client与 PV之间的交互，与现有技术一样，因此，本实施例仅对写操作请求的处理过程进行介绍。

如图 4所示，该数据存储方法可以包括：

步骤 401，三角模型建立，存储系统处于稳定状态。

步骤 402，三角模型建立后， vbs-client会启动一个内核态线程专门用来处理写操作请求。

步骤 403，上层业务程序发送的写操作请求被 vbs-client的操作系统 ( Operating System; 以下简称： OS )放入内核注册的一个请求队列中。

步骤 404， vbs-client的内核线程从上述请求队列中获取一个写操作请求。本实施例中， vbs-client的内核线程可以按照预定的规则从上述请求队列中获取一个写操作请求，该预定的规则可以为先入先出规则或其他规则，本实施例对此不作限定，只要 vbs-client的内核线程可以按照该预定的规则从上述请求队列中获取一个写操作请求即可；但本实施例以该预定的规则为先入先出规则为例进行说明。

步骤 405， vbs-client的内核向 PV发送写操作请求，该写操作请求用于通知 PV准备接收待写入数据。

步骤 406， PV子进程收到写操作请求之后，将接收到的写操作请求转发给 BV子进程；该写操作请求用于通知 BV准备接收待写入数据。

步骤 407， PV通过该 PV与 vbs-client之间的 SOCKET连接接收待写入数据，将该待写入数据写入 PV的卷文件（volume file ) ，并将该待写入数据通过 PV 与 BV之间的 SOCKET连接发送给 BV，以便 BV在将待写入数据写入该 BV的卷文件。

步骤 408， BV在将待写入数据写入该 BV的卷文件之后，向 vbs-client的内核上报写入操作的结果。步骤 409， PV向 BV发送 check点记录请求。

步骤 410， PV和 BV更新各自的 check点。

本实施例中， check点是判断当前侧数据是最新数据的唯一标准。

步骤 411， PV检查脏数据块列表（Dirty Block List; 以下简称： DBL ) 中是否有脏数据，如果有，且满足预定条件，则 PV将 DBL中的脏数据强行写到磁盘中。其中，脏数据为暂时存放在内存緩沖区中，还未写入卷文件的数据； DBL用于记录哪些数据是脏数据。

本实施例中，上述预定条件可以为以下之一或组合：

( 1 )如果在轮询时发现 DBL没有变化，说明存储系统不忙，可以直接将 DBL中的脏数据写到磁盘中；

( 2 )如果 DBL不为空，且在轮询时发现该 DBL有变化，则可以在达到预定的时间间隔后将 DBL中的脏数据写到磁盘中。

步骤 412， vbs-client的内核接收到 BV发送的写入操作的结果之后，判断接收到的写入操作的结果是否与已发送的写操作请求对应；如果对应，则执行步骤 413 ; 如果上述写入操作的结果与已发送的写操作请求不对应，则 vbs-client的内核可以丟弃该写入操作的结果，或者緩存但不处理该写入操作的结果，本实施例对此不作限定，但本实施例以写入操作的结果与已发送的写操作请求不对应时， vbs-client的内核丟弃该写入操作的结果为例进行说明。

步骤 413， vbs-client的内核将写入操作的结果发送给上层业务程序。

上述实施例中， PV通过该 PV与 vbs-client之间的 SOCKET连接接收到待写入数据之后，将上述待写入数据写入 PV的卷文件，并将上述待写入数据通过 PV与 BV之间的 SOCKET连接发送给 BV，以便 BV将待写入数据写入该 BV的卷文件，从而可以提高存储可靠性；在 BV将待写入数据写入该 BV的卷文件之后，由 BV向 vbs-client的内核上报写入操作的结果；从而可以降低消息流量，并且可以分担 PV的部分负荷，达到动态负载均衡的目的。

以下介绍在各种异常发生时，存储系统是如何从稳定的三角模型切换到其他模型，从而保证上层业务程序不受影响的。

当 PV发生异常时，原来的 BV变成真正的 PV，既负责接收请求，也负责回应结果，这时网络结构可以如图 5所示，图 5为本发明网络架构另一个实施例的示意图。图 5所示的网络架构为单节点（SOLO )模型

图 6为本发明数据存储方法又一个实施例的流程图，本实施例对图 5所示网络架构下的数据存储过程进行介绍。

如图 6所示，该数据存储方法可以包括：

步骤 601， vbs-client内核态线程接收 PV发生异常之前的写操作请求。

步骤 602， PV发生异常导致 vbs-client与 PV之间的 SOCKET连接发生异常， vbs-client的内核进行主备倒换，将原来的 BV注册为新的 PV。

步骤 603， vbs-client内核态线程启动检测发生异常的 P V是否恢复的进程。步骤 604， vbs-client内核态线程将上述写操作请求发送给新的 PV (即原来的 BV ) 。

步骤 605，新的 PV将待写入数据写入该新的 PV的卷文件。

步骤 606，新的 PV更新 check点。

步聚 607，新的 PV更新 solo bitmap。

步骤 608，新的 PV向 vbs-client的内核上报写入操作的结果。

步骤 609， vbs-client的内核确定该写入操作的结果与之前发送的写操作请求对应之后，将该写入操作的结果发送给上层业务程序。

步骤 610，检测发生异常的 PV是否恢复的进程发送检测消息给 vbs-client 的内核，以便 vbs-client的内核根据该检测消息确定发生异常的 PV是否恢复正常。之后，要更新 solo bitmap和 check点，该 solo bitmap用于记录哪一块数据发生了变化，该 check点用于记录写入待写入数据的时间点。记录 solo bitmap和 check点的作用是，在下次三角模型建立时，存储系统会根据 check点判断哪一侧的数据是最新的，只有具有最新数据的卷才可以做 PV。另外，如果 PV的数据比 BV的新，则可以根据 solo bitmap中记录的信息，将 PV上相应的数据同步到 BV，保证 PV和 BV上数据的一致性；反之亦然。

当 vbs-client与 BV之间的链路发生异常时，网络架构可以如图 7所示，图 7 为本发明网络架构又一个实施例的示意图，图 7所示的网络架构为 L模型。在图 7所示的网络架构下， BV无法向上层业务程序发送写入操作的结果，这时， BV转向 PV上报写入操作的结果，最后由 PV向上层业务程序上报写入操作的结果。

图 8为本发明数据存储方法再一个实施例的流程图，本实施例对图 7所示网络架构下的数据存储过程进行介绍。

如图 8所示，该数据存储方法可以包括：

步骤 801，在稳定状态下， vbs-client与 BV之间的链路突然发生异常。步骤 802，本来需要 BV上报的写入操作的结果，因为 vbs-client与 BV之间的链路发生异常， BV无法将写入操作的结果发送给 vbs-client的内核，一直阻塞。

步骤 803，当 vbs-client的心跳机制检测到链路异常时，向 vbs-client发送链路异常消息。

步骤 804， vbs-client将链路异常消息发送给 PV。

步骤 805， PV将链路异常消息转发给 BV。

步骤 806， BV接收到链路异常消息之后，将未发出的写入操作的结果发送给 PV。

步骤 807， PV将写入操作的结果发送给 vbs-client的内核。

步骤 808， vbs-client的内核将写入操作的结果上报给上层业务程序。

步骤 809，之后有写操作请求时， BV在将待写入数据写入 BV的卷文件之后，直接将写入操作的结果上报给 PV而不再进行尝试发送给 vbs-client的内核。当 PV与 BV之间的链路发生异常时，网络架构可以如图 9所示，图 9为本发明网络架构再一个实施例的示意图，图 9所示的网络结构为倒 V模型。在倒 V 模型下，存储系统可以忽略 BV，以处理写操作请求为例， PV将待写入数据写入 PV的卷文件之后，更新 PV的 check点和 solo bitmap; 然后， PV向 vbs-client 的内核上报写入操作的结果，即 vbs-client不从 BV接收写入操作的结果，转而从 PV接收，整体的处理流程与 SOLO模型类似，在此不再赘述。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括： ROM, RAM, 磁碟或者光盘等各种可以存储程序代码的介质。

图 10为本发明主卷节点设备一个实施例的结构示意图，该主卷节点设备可以实现本发明图 1所示实施例的流程，如图 10所示，该主卷节点设备可以包括：接收模块 1001和写入模块 1002;

其中，接收模块 1001，用于通过该主卷节点设备与虚拟块存储客户端之间的套接字连接接收待写入数据；

写入模块 1002，用于将接收模块 1001接收的待写入数据写入主卷节点设备的卷文件，并将待写入数据通过主卷节点设备与备份卷节点设备之间的套接字连接发送给备份卷节点设备，以便备份卷节点设备在将该待写入数据写入备份卷节点设备的卷文件之后，向虚拟块存储客户端的内核上报写入操作的结果。

上述实施例中，接收模块 1001通过该主卷节点设备与虚拟块存储客户端之间的套接字连接接收到待写入数据之后，写入模块 1002将上述待写入数据写入主卷节点设备的卷文件，并将上述待写入数据通过主卷节点设备与备份卷节点设备之间的套接字连接发送给备份卷节点设备，以便备份卷节点设备将待写入数据写入该备份卷节点设备的卷文件，从而可以提高存储可靠性；在备份卷节点设备将待写入数据写入该备份卷的卷文件之后，由备份卷节点设备向虚拟块存储客户端的内核上报写入操作的结果；从而可以降低消息流量，并且可以分担主卷节点设备的部分负荷，达到动态负载均衡的目的。

图 11为本发明主卷节点设备另一个实施例的结构示意图，与图 10所示的主卷节点设备相比，不同之处在于，图 11所示的主卷节点设备还可以包括：发送模块 1003;

本实施例中，接收模块 1001还可以在接收待写入数据之前，接收虚拟块存储客户端的内核发送的写操作请求；则发送模块 1003用于将接收模块 1001 接收的写操作请求转发给备份卷节点设备，该写操作请求用于通知主卷节点设备和 /或备份卷节点设备准备接收待写入数据；写操作请求是虚拟块存储客户端的内核从该内核注册的请求队列中获取的；该内核注册的请求队列中的写操作请求是虚拟块存储客户端接收到上层业务程序发送的写操作请求之后，放入该内核注册的请求队列中的。

进一步地，本实施例中，发送模块 1003还可以向备份卷节点设备发送检测点记录请求，以使主卷节点设备和备份卷节点设备更新各自的检测点。

进一步地，本实施例中的主卷节点设备还可以包括：

检查模块 1004，用于检查脏数据块列表中是否有脏数据；

则写入模块 1002还可以当脏数据块列表中有脏数据，且满足预定条件之后，将上述脏数据写到磁盘中。

进一步地，本实施例中，接收模块 1001还可以当虚拟块存储客户端与备份卷节点设备之间的链路发生异常时，接收虚拟块存储客户端发送的链路异常消息；发送模块 1003还可以将接收模块 1001接收的链路异常消息转发给备份卷节点设备，以使备份卷节点设备将写入操作的结果发送给主卷节点设备，再由发送模块 1003将上述写入操作的结果发送给虚拟块存储客户端的内核；该链路异常消息由虚拟块存储客户端的心跳进程发送给虚拟块存储客户端。

进一步地，本实施例中的主卷节点设备还可以包括：更新模块 1005，用于当主卷节点设备和备份卷节点设备之间的链路发生异常时，在写入模块 1002将待写入数据写入主卷节点设备的卷文件之后，更新主卷节点设备的检测点和单节点位图；这时，发送模块 1003可以向虚拟块存储客户端的内核上报写入操作的结果。

采用上述主卷节点设备构建存储系统，可以提高存储可靠性，降低消息流量，提高存储性能。

图 12为本发明虚拟块存储客户端设备一个实施例的结构示意图，如图 12 所示，该虚拟块存储客户端设备可以包括：连接建立模块 1201、获得模块 1202、比较模块 1203、确定模块 1204、注册模块 1205和调用模块 1206;

其中，连接建立模块 1201，用于根据预先指定的备份卷的监听端口与预先指定的备份卷建立套接字连接，以及根据预先指定的主卷的监听端口与预先指定的主卷建立套接字连接；

获得模块 1202，用于获得预先指定的备份卷的卷大小、检测点和单节点位图，以及获得预先指定的主卷的卷大小、检测点和单节点位图；

比较模块 1203，用于比较预先指定的主卷和预先指定的备份卷的检测点；确定模块 1204，用于根据比较模块 1203的比较结果确定最新检测点对应的卷为真正的主卷，次新检测点对应的卷为真正的备份卷；

注册模块 1205，用于向虚拟块存储客户端设备的内核注册真正的主卷和将连接建立模块 1201与预先指定的备份卷建立的套接字连接的描述符，以及连接建立模块 1201与预先指定的主卷建立的套接字连接的描述符注册到虚拟块存储客户端设备的内核；

调用模块 1206，用于调用系统函数进入内核态线程，在内核态线程中处理上层业务程序发送的写操作请求。

采用上述虚拟块存储客户端设备构建存储系统，可以提高存储可靠性，降低消息流量，提高存储性能。图 13为本发明虚拟块存储客户端设备另一个实施例的结构示意图，与图 12所示的虚拟块存储客户端设备相比，不同之处在于，图 13所示的虚拟块存储客户端设备 12还可以包括：时，如果真正的主卷与真正的备份卷之间的数据不同步，则向真正的主卷发送数据同步请求，以使真正的主卷与真正的备份卷进行数据同步；

主备倒换模块 1208，用于当主卷发生异常时，在虚拟块存储客户端设备的内核进行主备倒换，将备份卷注册为新的主卷，以使新的主卷通过新的主卷与虚拟块存储客户端之间的套接字连接接收待写入数据，并在将待写入数据写入新的主卷的卷文件之后，更新新的主卷的检测点和单节点位图，以及向虚拟块存储客户端设备的内核上报写入操作的结果。

进一步地，本实施例中的虚拟块存储客户端设备 12还可以包括：结果接收模块 1209和结果发送模块 1210;

其中，结果接收模块 1209，用于接收写入操作的结果；

这时确定模块 1204还可以确定结果接收模块 1209接收的写入操作的结果是否与已发送的写操作请求对应；

结果发送模块 1210，用于在确定模块 1204确定结果接收模块 1209接收的写入操作的结果与已发送的写操作请求对应之后，将上述写入操作的结果发送给上层业务程序。

采用上述虚拟块存储客户端设备构建存储系统，可以提高存储可靠性，降低消息流量，提高存储性能。

图 14为本发明备份卷节点设备一个实施例的结构示意图，如图 14所示，该备份卷节点设备可以包括：数据接收模块 1401、数据写入模块 1402和结果上报模块 1403;

其中，数据接收模块 1401，用于接收主卷节点设备通过该主卷节点设备与备份卷节点设备之间的套接字连接发送的待写入数据；数据写入模块 1402，用于将数据接收模块 1401接收的待写入数据写入备份卷节点设备的卷文件；

结果上报模块 1403，用于向虚拟块存储客户端设备的内核上报写入操作的结果。

采用上述备份卷节点设备构建存储系统，可以提高存储可靠性，降低消息流量，提高存储性能。

图 15为本发明备份卷节点设备另一个实施例的结构示意图，与图 13所示的备份卷节点设备相比，不同之处在于，图 14所示的备份卷节点设备还可以包括：

请求接收模块 1404，用于在数据接收模块 1401接收待写入数据之前，接收主卷节点设备发送的写操作请求，该写操作请求用于通知所述备份卷节点设备准备接收所述待写入数据；还可以在结果上报模块 1403上报写入操作的结果之后，接收主卷节点设备发送的检测点记录请求，以更新该备份卷节点设备的检测点。

图 16为本发明存储系统一个实施例的结构示意图，如图 16所示，该存储系统可以包括： vbs客户端 1601、 PV 1602和 BV 1603;

其中， PV 1602用于通过 PV 1602与 vbs客户端 1601之间的套接字连接接收待写入数据，将该待写入数据写入 PV 1602的卷文件，并将待写入数据通过 PV 1602与 BV 1603之间的套接字连接发送给 BV 1603，以便 BV 1603在将待写入数据写入 B V 1603的卷文件之后，向 vbs客户端 1601的内核上报写入操作的结果。

具体地， vbs客户端 1601可以通过本发明图 12或图 13所示的虚拟块存储客户端设备实现， PV 1602可以通过本发明图 10或图 11所示的主卷节点设备实现。本实施例中， vbs客户端 1601可以包括三角模型建立模块 16011、控制消息处理模块 16012、 I/O请求发送模块 16013、链路选择模块 16014和 I/O结果接收模块 16015;

其中，三角模型建立模块 16011，用于初次启动、节点异常或网络异常时，重新建立三角模型或进行模型切换；具体地，三角模型建立模块 16011可以参照本发明图 3所示实施例提供的方法建立三角模型，实现图 12所示实施例提供的虚拟块存储客户端设备中连接建立模块 1201、获得模块 1202、比较模块 1203、确定模块 1204、注册模块 1205、调用模块 1206和请求发送模块 1207的功能。

控制消息处理模块 16012: 为用户态与内核态之间的接口；

I/O请求发送模块 16013 : 来自上层业务程序的 I/O请求，例如：写操作请求或读操作请求通过 I/O请求发送模块 16013发送到 PV 1602；

链路选择模块 16014: 当异常发生时，数据的收发不同于三角模型，所以在 SOLO模型或 L模型时， vbs-client的内核在发送 I/O请求时要选择合适的链路；本实施例中，链路选择模块 16014可以实现图 12所示实施例提供的虚拟块存储客户端设备中主备倒换模块 1208的功能；

I/O结果接收模块 16015 : 来自 BV的写入操作的结果由 I/O结果接收模块 16015处理；本实施例中， I/O结果接收模块 16015可以实现图 12所示实施例提供的虚拟块存储客户端设备中结果接收模块 1209和结果发送模块 1210的功能。

本实施例中， PV 1602可以包括读操作请求处理模块 16021、写操作请求处理模块 16022、主备数据同步模块 16023、 PV状态检测模块 16024、单节点位图（solo bitmap ) 16025、 DBL 16026和卷文件 16027。

其中，读操作请求处理模块 16021，用于处理来自 vbs客户端 1601的读操作请求，在三角模型下读操作请求只到 PV 1602， BV 1603不感知；

写操作请求处理模块 16022，用于处理来自 vbs客户端 1601的写操作请求，在三角模型下写操作请求会转到 BV 1603 , 最后由 BV 1603向 vbs客户端 1601 报告写入操作的结果；本实施例中，写操作请求处理模块 16022可以实现本发明图 10所示实施例提供的主卷节点设备中接收模块 1001、写入模块 1002和发送模块 1003的部分功能；

主备数据同步模块 16023: 当 PV 1602或 BV 1603发生异常时，该存储系统进入 SOLO模型，以后有写操作请求时， solo bitmap 16025会记录发生变化的数据，当重建三角模型时，主备数据同步模块 16023将数据同步到另一侧，保持数据一致；

PV状态检测模块 16024: 当 PV 1602发生异常时，存储系统进入 SOLO模型，原来的 BV 1603会成为真正的 PV， PV状态检测模块 16024轮询检测发生异常的 PV 1602是否恢复正常，恢复后重建三角模型；

solo bitmap 16025: 记录存储系统在 SOLO模型下运行期间， PV 1602上发生变化的数据块；本实施例中， solo bitmap 16025可以实现本发明图 10所示实施例提供的主卷节点设备中更新模块 1005的部分功能；

DBL 16026: 写操作请求发生时，存储系统首先将待写入数据写入緩沖区，这些待写入数据在真正写到磁盘之前都被认为是脏数据， DBL 16026用于记录这些脏数据。当 DBL 16026中有脏数据，且满足预定条件时， PV 1602 可以将 DBL 16026中的脏数据强行写到磁盘中。本实施例中，上述预定条件可以为以下之一或组合：

( 1 )如果在轮询时发现 DBL 16026没有变化，说明存储系统不忙， PV

1602可以直接将 DBL 16026中的脏数据写到磁盘中；

( 2 )如果 DBL 16026不为空，且在轮询时发现该 DBL 16026有变化，则 PV 1602可以在达到预定的时间间隔后将 DBL 16026中的脏数据写到磁盘中；卷文件 16027：基于高级日志文件系统（ XFS )文件系统的稀疏文件，用于存放所有的数据。写入待写入数据之前，卷文件 16027并不占用磁盘空间，是一种瘦分配，为用户提供了很大的灵活性。本实施例中， BV 1603中各模块的功能与 P V 1602中相同模块的功能相同，在此不再赘述。

上述存储系统中， PV 1602通过该 PV 1602与 vbs客户端 1601之间的套接字连接接收到待写入数据之后，将上述待写入数据写入 PV 1602的卷文件，并将上述待写入数据通过 PV 1602与 BV 1603之间的套接字连接发送给 BV 1603 , 以便 BV 1603将待写入数据写入该 BV 1603的卷文件，从而可以提高存储可靠客户端 1601的内核上报写入操作的结果；从而可以降低消息流量，并且可以分担 PV 1602的部分负荷，达到动态负载均衡的目的。云存储是在云计算概念上延伸和发展出来的一个新的概念，是指通过集群应用、网格技术或分布式文件系统等功能，将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作，共同对外提供数据存储和业务访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时，云计算系统中就需要配置大量的存储设备，那么云计算系统就转变成为一个云存储系统，所以云存储系统是一个以数据存储和管理为核心的云计算系统。

图 17为本发明云存储系统一个实施例的示意图，如图 17所示，本实施例中的云存储系统可以包括以下设备：

( 1 )三台块存储提供者（Block Storage Provider; 以下简称： BSP )，分别记为 BSP1、 BSP2和 BSP3， BSP1、 BSP2和 BSP3为上层的块存储代理（ Block Storage Agent; 以下简称： BSA )提供存储空间。同时，每个 BSP上分别有本发明实施例提供的三角模型中的 PV和 BV。在这种部署下，可以有效地将每个 BSP的 I/O负荷平均分配。

( 2 )—台 BSA，作为存储管理中间件和底层 BSP之间的接口，负责向上层提供虚拟的 NBD设备。 ( 3 )另一台服务器，该服务器上部署监控系统、计费系统和存储资源管理系统等；其中，存储资源管理系统，主要负责 BSP1、 BSP2和 BSP3上 PV和 BV的选择，从而达到 BSP1、 BSP2和 BSP3之间负载的均衡；监控系统用于实时监控各节点是否异常，另外，也负责监控 BSP1、 BSP2和 BSP3的性能，如有异常及时通知存储资源管理系统。

本发明实施例提供的数据存储方法、设备和系统，可以方便地构建大型可靠的存储系统。同时，本发明实施例在提高存储可靠性的同时，也有效降低了整个存储系统的消息流量。在 I/O负荷很高的场合，优势更加明显。

本领域技术人员可以理解附图只是一个优选实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求

1、一种数据存储方法，其特征在于，包括：

2、根据权利要求 1所述的方法，其特征在于，所述通过主卷与虚拟块存储客户端之间的套接字连接接收待写入数据之前，还包括：

接收虚拟块存储客户端的内核发送的写操作请求，并将所述写操作请求转发给备份卷，所述写操作请求用于通知所述主卷和 /或所述备份卷准备接收所述待写入数据；所述写操作请求是所述虚拟块存储客户端的内核从所述内核注册的请求队列中获取的；所述内核注册的请求队列中的写操作请求是所述虚拟块存储客户端接收到上层业务程序发送的写操作请求之后，放入所述内核注册的请求队列中的。

3、根据权利要求 1所述的方法，其特征在于，所述向所述虚拟块存储客户端的内核上报写入操作的结果之后，还包括：

向所述备份卷发送检测点记录请求，以使所述主卷和所述备份卷更新各自的检测点。

4、根据权利要求 1或 3所述的方法，其特征在于，所述向所述虚拟块存储客户端的内核上报写入操作的结果之后，还包括：

检查脏数据块列表中是否有脏数据；当所述脏数据块列表中有脏数据，且满足预定条件之后，将所述脏数据写到磁盘中。

5、根据权利要求 2所述的方法，其特征在于，所述接收虚拟块存储客户端的内核发送的写操作请求之前，还包括：

所述虚拟块存储客户端根据预先指定的备份卷的监听端口与所述预先指定的备份卷建立套接字连接，并获得所述预先指定的备份卷的卷大小、检测点和单节点位图；

所述虚拟块存储客户端根据预先指定的主卷的监听端口与所述预先指定的主卷建立套接字连接，并获得所述预先指定的主卷的卷大小、检测点和单节点位图；

所述虚拟块存储客户端比较所述预先指定的主卷和所述预先指定的备份卷的检测点，确定最新检测点对应的卷为真正的主卷，次新检测点对应的卷为真正的备份卷；

所述虚拟块存储客户端向所述虚拟块存储客户端的内核注册所述真正的主卷和所述真正的备份卷的角色；

当所述真正的主卷与所述真正的备份卷之间的链路正常时，所述虚拟块存储客户端将与所述预先指定的备份卷建立的套接字连接的描述符，以及与所述预先指定的主卷建立的套接字连接的描述符注册到所述虚拟块存储客户端的内核；

所述虚拟块存储客户端调用系统函数进入内核态线程，在所述内核态线程中处理上层业务程序发送的写操作请求。

6、根据权利要求 5所述的方法，其特征在于，所述虚拟块存储客户端将与所述预先指定的备份卷建立的套接字连接的描述符，以及与所述预先指定的主卷建立的套接字连接的描述符注册到所述虚拟块存储客户端的内核之前，还包括：

当所述真正的主卷与所述真正的备份卷之间的链路正常时，如果所述真正的主卷与所述真正的备份卷之间的数据不同步，则所述虚拟块存储客户端向所述真正的主卷发送数据同步请求，以使所述真正的主卷与所述真正的备份卷进行数据同步。

7、根据权利要求 2所述的方法，其特征在于，还包括：

当所述主卷发生异常时，在所述虚拟块存储客户端的内核进行主备倒换，将所述备份卷注册为新的主卷之后，所述新的主卷通过所述新的主卷与所述虚拟块存储客户端之间的套接字连接接收待写入数据；

所述新的主卷将所述待写入数据写入所述新的主卷的卷文件之后，更新所述新的主卷的检测点和单节点位图；

所述新的主卷向所述虚拟块存储客户端的内核上报写入操作的结果。

8、根据权利要求 2所述的方法，其特征在于，还包括：

当所述虚拟块存储客户端与所述备份卷之间的链路发生异常时，所述主卷接收所述虚拟块存储客户端发送的链路异常消息，并将所述链路异常消息转发给所述备份卷，以使所述备份卷将所述写入操作的结果发送给所述主卷，由所述主卷将所述写入操作的结果发送给所述虚拟块存储客户端的内核；所述链路异常消息由所述虚拟块存储客户端的心跳进程发送给所述虚拟块存储客户端。

9、根据权利要求 2所述的方法，其特征在于，还包括：

当所述主卷和所述备份卷之间的链路发生异常时，所述主卷将所述待写入数据写入所述主卷的卷文件之后，更新所述主卷的检测点和单节点位图；所述主卷向所述虚拟块存储客户端的内核上报写入操作的结果。

10、根据权利要求 2、 7、 8或 9所述的方法，其特征在于，还包括：接收到所述写入操作的结果之后，所述虚拟块存储客户端的内核确定所述写入操作的结果是否与已发送的写操作请求对应；

如果对应，则所述虚拟块存储客户端的内核将所述写入操作的结果发送给所述上层业务程序。

11、一种主卷节点设备，其特征在于，包括：

12、根据权利要求 11所述的设备，其特征在于，还包括发送模块；所述接收模块，还用于在接收所述待写入数据之前，接收虚拟块存储客户端的内核发送的写操作请求；

所述发送模块，用于将所述接收模块接收的写操作请求转发给所述备份卷节点设备，所述写操作请求用于通知所述主卷节点设备和 /或所述备份卷节点设备准备接收所述待写入数据；所述写操作请求是所述虚拟块存储客户端的内核从所述内核注册的请求队列中获取的；所述内核注册的请求队列中的写操作请求是所述虚拟块存储客户端接收到上层业务程序发送的写操作请求之后，放入所述内核注册的请求队列中的。

13、根据权利要求 12所述的设备，其特征在于，

所述发送模块，还用于向所述备份卷节点设备发送检测点记录请求，以使所述主卷节点设备和所述备份卷节点设备更新各自的检测点。

14、根据权利要求 11或 13所述的设备，其特征在于，还包括检查模块；所述检查模块，用于检查脏数据块列表中是否有脏数据；

所述写入模块，还用于当所述脏数据块列表中有脏数据，且满足预定条件之后，将所述脏数据写到磁盘中。

15、根据权利要求 12所述的设备，其特征在于，

所述接收模块，还用于当所述虚拟块存储客户端与所述备份卷节点设备之间的链路发生异常时，接收所述虚拟块存储客户端发送的链路异常消息；所述发送模块，还用于将所述接收模块接收的链路异常消息转发给所述备份卷节点设备，以使所述备份卷节点设备将所述写入操作的结果发送给所述主卷节点设备，再由所述发送模块将所述写入操作的结果发送给所述虚拟块存储客户端的内核；所述链路异常消息由所述虚拟块存储客户端的心跳进程发送给所述虚拟块存储客户端。

16、根据权利要求 12所述的设备，其特征在于，还包括更新模块；更新模块，用于当所述主卷节点设备和所述备份卷节点设备之间的链路发生异常时，在所述写入模块将所述待写入数据写入所述主卷节点设备的卷文件之后，更新所述主卷节点设备的检测点和单节点位图；

所述发送模块，还用于向所述虚拟块存储客户端的内核上报写入操作的结果。

17、一种虚拟块存储客户端设备，其特征在于，包括：

18、根据权利要求 17所述的设备，其特征在于，还包括：

请求发送模块，用于当所述真正的主卷与所述真正的备份卷之间的链路正常时，如果所述真正的主卷与所述真正的备份卷之间的数据不同步，则向所述真正的主卷发送数据同步请求，以使所述真正的主卷与所述真正的备份卷进行数据同步。

19、根据权利要求 17所述的设备，其特征在于，还包括：

主备倒换模块，用于当所述主卷发生异常时，在所述虚拟块存储客户端设备的内核进行主备倒换，将所述备份卷注册为新的主卷，以使所述新的主卷通过所述新的主卷与所述虚拟块存储客户端之间的套接字连接接收待写入数据，并在将所述待写入数据写入所述新的主卷的卷文件之后，更新所述新的主卷的检测点和单节点位图，以及向所述虚拟块存储客户端设备的内核上报写入操作的结果。

20、根据权利要求 19所述的设备，其特征在于，还包括结果接收模块和结果发送模块；

所述结果接收模块，用于接收写入操作的结果；

所述确定模块，还用于确定所述结果接收模块接收的写入操作的结果是否与已发送的写操作请求对应；

所述结果发送模块，用于在所述确定模块确定所述结果接收模块接收的写入操作的结果与已发送的写操作请求对应之后，将所述写入操作的结果发送给所述上层业务程序。

21、一种备份卷节点设备，其特征在于，包括：

22、根据权利要求 21所述的设备，其特征在于，还包括：

请求接收模块，用于在所述数据接收模块接收待写入数据之前，接收所述主卷节点设备发送的写操作请求，所述写操作请求用于通知所述备份卷节点设备准备接收所述待写入数据。

23、根据权利要求 22所述的设备，其特征在于，

所述请求接收模块，还用于在所述结果上报模块上报写入操作的结果之后，接收所述主卷节点设备发送的检测点记录请求，以更新所述备份卷节点设备的检测点。

24、一种存储系统，其特征在于，包括：如权利要求 11-16任意一项所述的主卷节点设备、如权利要求 17-20任意一项所述的虚拟块存储客户端设备和如权利要求 21-23任意一项所述的备份卷节点设备。