WO2011015134A1

WO2011015134A1 - 多磁盘容错系统及生成校验块、恢复数据块的方法

Info

Publication number: WO2011015134A1
Application number: PCT/CN2010/075678
Authority: WO
Inventors: 王玉林; 姚建业
Original assignee: 成都市华为赛门铁克科技有限公司; 电子科技大学
Priority date: 2009-08-04
Filing date: 2010-08-03
Publication date: 2011-02-10
Also published as: US20120260125A1; US8489916B2; CN101625652A; CN101625652B

Description

多磁盘容错系统及生成校验块、恢复数据块的方法本申请要求于 2009年 8月 4日提交中国专利局、申请号为 200910090420.2、发明名称为"多磁盘容错系统及生成校验块、恢复数据块的方法"的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域本发明实施例涉及数据存储技术领域，特别涉及一种多磁盘容错系统及生成校验块、恢复数据块的方法。

背景技术随着网络的发展和计算机技术的普及应用，人们对存储系统的性能要求越来越高。廉价冗余磁盘阵歹¹ J ( Redundant Array of Independent Di sks , 以下简称： RAID )采用分条和冗余的方法提高了存储系统的容量、速度和可靠性，已成为高性能数据存储的首选结构，磁盘阵列技术的基本思想有两个方面：利用数据条纹化提高性能以及利用数据冗余提高可靠性。迄今为止，大多数系统被设计成容忍单磁盘故障，对单磁盘故障的设计原理是，磁盘发送故障较少，在一个磁盘故障发生后，另一个故障发生前有足够的时间从故障中恢复。随着磁盘技术的发展和用户对更高性能的存储系统的需求使得单磁盘故障容错越来越不足，首先是磁盘阵列规模的不断增大，越来越多的磁盘被分组到一个阵列，相应的一个阵列中发生多个磁盘故障的可能性增加了；第二是磁盘容量的增加比数据存取速度的增加快，重建一个磁盘的所需的时间增加，因此加长了重建一个磁盘过程中阵列产生随后的磁盘故障的时间窗口；第三是介质存储密度的增加导致磁盘可靠性减小；第四是由于实际应用中磁盘故障的相关性，由于外部环境和磁盘内部因素的影响，导致磁盘故障是相关的，这也会导致短时间内发生多个磁盘故障的概率大大增加。

一个磁盘阵列中从多磁盘故障恢复的常规技术大致可以分为双校验、双镜像及 RAID51型及其改进机型模式。在双镜像模式中，数据被镜像两次，使得有该数据的三个拷贝，每次写请求需要产生三个磁盘写操作来更新每个拷贝，同时也需要使用未保护阵列的三倍存储空间。

RAID51型模式防止单磁盘故障破坏数据，并且镜像 RAID 5阵列来保护多达三个任意磁盘故障，对于一个写请求，产生两个磁盘读操作和四个磁盘写操作。双校验模式将 RAID5型模式扩展为双校验，该模式下每个写请求产生至少三个磁盘读操作和三个磁盘写操作。

RAID6是双校验型模式的双磁盘容错方法，与其他级别的 RAID相比，增加了两个独立的错误校验区块，即校验块 P和校验块 Q,对于每个分条（ stripe ) 包括两个校验单元： P校验单元和 Q校验单元，其中 P采用奇偶校验码， Q采用 Reed-Solomon等其它校验码。当出现单磁盘故障时， P+Q RAID转变为 N+1 奇偶校验的 RAID5。当出现双磁盘故障时， P+Q RAID 转变为无容错能力的 RAID0。

发明人在实现本发明的过程中发现，现有技术中 RAID6在进行数据处理时需要进行伽罗瓦域（Galois Fie ld ) 变换，该变换过程需要进行复杂的乘加运算，使得计算复杂度高。发明内容

本发明实施例的目的是提供一种多磁盘容错系统及生成校验块、恢复数据块的方法，能够降低多磁盘容错系统中校验块生成的计算复杂度，提高数据处理速度。

为实现上述目的，本发明实施例提供了一种多磁盘容错系统，包括通过系统总线连接的磁盘阵列和计算模块；

所述磁盘阵列由 p个磁盘组成，其中 p为大于或等于 3的自然数，所述磁盘阵列的容错磁盘数为 q, 其中 q为小于 /2且不小于 2的自然数；

所述磁盘阵列中的数据按照 (m + ^x p的矩阵 M形式进行排列，其中 m为小于或等于 p-d的素数；所述矩阵 M中第 0行为虚拟的值为 0的虚拟数据块，第 1行至第 m-1行为数据块，第 m行至第 m+q-1行为校验区域；其中校验区域中的校验块 C_m— 所在校验分组中的各个数据块的行号为 w - /，列号为 M + k 的取值范围为 /到 -l+/，其中 /为校验块在校验区域中的行号， l≤/≤g，n为校验块对应的列号， 0≤«≤ρ-1 ; 所述校验块中的数据为校验块所属校验分组的所有数据块中数据的异或值；

所述计算模块用于根据校验分组中的数据块进行异或计算以生成所述校验分组中的校验块，并在磁盘损毁时根据所述校验块恢复所述数据块。

本发明实施例还提供了一种在上述多磁盘容错系统中生成校验块的方法，包括：

获取需要生成的校验块所属校验分组中所有数据块的数据；

根据所述校验分组中所有数据块的数据获得所述需要生成的校验块中的校验数据；

将上述获得的所述校验数据写入到所述磁盘阵列中的相应校验块中。本发明实施例还提供了一种在上述多磁盘容错系统中恢复数据块的方法，包括:

获取待恢复数据块所属校验分组中其他数据块的数据;

获取待恢复数据块所属校验分组中校验块的数据；

数据进行进行异或计算以获得所述待恢复数据块的数据；

将所述计算获得的数据块的值写入到所述待恢复数据块中。

本发明实施例提供了一种多磁盘容错系统、在多磁盘容错系统中生成校验块的方法以及在多磁盘容错系统中恢复数据块的方法，在多磁盘容错系统中生成校验块以及恢复数据块的过程中，不需要进行复杂的乘加运算，能够有效降低多磁盘容错系统在数据处理过程中的计算复杂度，提高数据处理速度。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例提供的多磁盘容错系统实施例的结构示意图；图 2为本发明实施例中计算模块的结构示意图一；

图 3为本发明实施例中计算模块的结构示意图二；

图 4为本发明实施例提供的多磁盘容错系统具体结构示意图

图 5为本发明实施例提供的多磁盘容错系统的数据布局示意图；图 6 为本发明实施例提供的多磁盘容错系统中数据块与校验块关系示意图；

图 Ί 为本发明实施例提供的多磁盘容错系统中生成校验块的方法流程示意图；

图 8为图 7所示实施例中一个具体实施例的流程示意图；

图 9 为本发明实施例中多磁盘容错系统中恢复数据块的方法的流程示意图；

图 10为图 9所示实施例中一个具体实施例的流程示意图；

图 11为本发明实施例中双磁盘容错系统在重建单个故障磁盘的流程示意图；

图 12为本发明实施例中多磁盘容错系统中恢复多个磁盘的方法流程示意图；

图 1 3为图 12所示实施例中数据恢复路径的示意图。

具体实施方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。图 1为本发明实施例提供的多磁盘容错系统实施例的结构示意图，如图 1 所示，多磁盘容错系统包括通过系统总线 11连接的磁盘阵列 12和计算模块 1 3 , 其中：

磁盘阵列 12由 ρ个磁盘组成，其中 ρ为大于或等于 3的自然数，所述磁盘阵列的容错磁盘数为 q, 其中 q为小于 p/2且不小于 2的自然数；所述磁盘阵列中的数据按照 (m + ^xp的矩阵 M形式进行排列，其中 m为小于或等于 p-q 的素数；所述矩阵 M中第 0行为虚拟的值为 0的虚拟数据块，第 1行至第 m-1 行为数据块，第 m行至第 m+q-1行为校验块；其中校验块 ^所在校验分组中的各个数据块的行号为 - /，列号为《 + 的取值范围为 /到 m-l+/，其中 I为校验块在校验区域中的行号， 1≤ /≤ g， n为校验块对应的列号， 0≤η≤_Ρ-1 ; 所述校验块的数据为校验块所属校验分组中所有数据块的数据的异或值；

计算模块 1 3 , 用于根据校验分组中的数据块计算生成所述校验分组中的校验块，并在磁盘损毁时根据所述校验块恢复所述数据块。

本实施例中提供的多磁盘容错系统，在任意整数 P ( P > 3 ) 个磁盘中，能够实现 q ( 2≤q≤Lp / 2」）个磁盘的容错，并且其中每个磁盘 + ( m 为小于 p-q的素数）行物理单元为一个数据集，第 0行为全为 0的虚拟物理单元，第 1行到 m-1行存储数据块，之后的 q行存储校验块，其中的校验块的数据为校验块所属校验分组中所有数据块中数据的异或值。本实施例提供的多磁盘容错系统能够使得在生成校验块以及恢复数据块时不需要进行复杂的乘加运算，而仅仅进行异或计算即可，能够有效降低多磁盘容错系统在数据处理过程中的计算复杂度。

图 2为本发明实施例中计算模块的结构示意图一，如图 2所示，计算模块 1 3包括：

第一获取单元 1 31 , 用于获取校验块所属校验分组中所有数据块的数据；第一计算单元 1 32 , 用于根据所述第一获取单元获取的校验块所属校验分组中所有数据块的数据进行异或计算以获取所述校验块的数据；第一输出单元 133, 用于将第一计算单元 132计算生成的校验块的数据写入到磁盘阵列中相应的校验块中。

本实施例中是针对生成数据块的情况，将计算模块按早功能进行划分，校验块的值为校验块所属校验分组中所有数据块中数据的异或值。

图 3为本发明实施例中计算模块的结构示意图二，如图 3所示，计算模块

13包括第二获取单元 134、第二计算单元 135和第二输出单元 136, 其中：第二获取单元 134, 用于获取待恢复数据块所属校验分组中除待恢复数据块之外其他数据块的数据以及校验块的数据；

第二计算单元 135, 用于根据第二获取单元 134获取的所述数据块的数据以及所述校验块的数据进行异或计算以获取所述待恢复数据块的数据；

第二输出单元 136, 用于将所述第二计算单元 135计算生成的待恢复数据块的待恢复写入到所述待恢复数据块中。

图 4为本发明实施例提供的多磁盘容错系统具体结构示意图，如图 4所示，多磁盘容错系统包括磁盘阵列 21、主处理器 22、 X0R协处理器 23、緩存模块 24和系统总线 25, 上述的磁盘阵列 21、主处理器 22、 X0R协处理器 23和緩存模块 24由系统总线 25连接，本具体实施例中磁盘阵列由个（ p>2> )磁盘组成，磁盘阵列的容错磁盘数为 q ( 2≤q≤Lp/2」），磁盘阵列中数据的具体存储格式可参见图 1所述实施例。上述实施例中的主处理器 22用于完成磁盘阵列系统的地址转换、系统管理、緩存管理等操作， X0R协处理器 23主要完成数据块的异或计算， X0R协处理器可相当于上述实施例中的计算模块；緩存模块 24用于緩存数据。

图 5 为本发明实施例提供的多磁盘容错系统的数据布局示意图，如图 5 所示，以 7 (p=7 )个磁盘为例，每一列代表一个磁盘，共有 7个磁盘，分别是 D0、 Dl、 D2、 D3、 D4、 D5、 D6, 实现 2 ( q=2 ) 个磁盘的容错，本实施例中 m值取 5, 在一个数据集中共有 7行数据块，其中第 0行为虚拟的全为 0的数据块，不占用磁盘的实际存储空间，第 1行至第 4行为数据块，存放的是有效数据，第 5、 6行为校验块，为相应数据块的异或校验值，对数据块提供冗余保护，可以看出本发明实施例中校验块不是使用单独的磁盘存放，而是均匀分布在所有磁盘上。

图 6 为本发明实施例提供的多磁盘容错系统中数据块与校验块关系示意图，如图 6所示，仍以 7个磁盘为例，其中 1-5行的每个数据块都被两个不同的校验分组所包含，如磁盘 DO上的第 1行数据块 D ( 1, 0)被标示为 f4, 表示该数据块既属于第一行校验的 4分组，也属于第二行校验的 f 分组， 4分组的校验块 4位于磁盘 D3上， f 分组的校验块 f位于磁盘 D5上，除虚拟行（即校验分组的第 0行）外其他所有数据块所属的分组校验块都位于不同的磁盘、不同的校验行上，即除第 0行虚拟数据块外，不存在一个数据块属于同一个磁盘上的两个校验分组，也不存在同一个数据块属于同一校验行上的两个校验分组。

在一个校验分组 f 中，校验块 f 的值等于所有标示有 f 的数据块的异或值，即 f = f4®fl®f7®f6®fi。若 C, 为第 i行第 j列的物理数据块，本实施例中对于第一行校验块 C ( 5, 0), 其中 m=5, 1=1, k的取值范围为 1到 5, 其所属校验分组的数据块的行号为 - /，列号为《 + 经计算可得数据块 C (4， 1)、 C(3， 2)、 C(2， 3)、 C (1,4)和 C (0, 5)为该校验分组的数据块，同理可计算第一行其他校验块所属校验分组数据块的情况 ,各检验块的值为其所属校验分组中各个数据块的异或值，具体可见如下的公式:

A、对于第一行校验块

C(5, 0) =C(4, 1) ©C(3, 2) ©C(2, 3) ©C(l, 4) ©C(0, 5)

C(5, 1) =C(4, 2) ©C(3, 3) ©C(2, 4) ©C(l, 5) ©C(0, 6)

C(5, 2) =C(4, 3) ©C(3, 4) ©C(2, 5) ©C(l, 6) ©C(0, 0)

C(5, 3) =C(4, 4) ©C(3, 5) ©C(2, 6) ©C(l, 0) ©C(0, 1)

C(5, 4) =C(4, 5) ©C(3, 6) ©C(2, 0) ©C(l, 1) ©C(0, 2)

C(5, 5) =C(4, 6) ©C(3, 0) ©C(2, 1) ©C(l, 2) ©C(0, 3)

C(5, 6) =C(4, 0) ©C(3, 1) ©C(2, 2) ©C(l, 3) ©C(0, 4)

对于第二行校验块 C ( 6, 0 ), 其中 m=5, 1=2, k的取值范围为 2到 6, 其所属校验分组的数据块的行号为 - /，列号为《 + 经计算可得数据块 C (l，2)、 C (4，3)、 C (2，4)、 C (0， 5)和 C (3， 6)为该校验分组的数据块，同理可计算第二行其他校验块所属校验分组数据块的情况，各检验块的值为其所属校验分组中各个数据块的异或值，具体可见如下的公式：

B、对于第二行校验块

C(6, 0) =C(1, 2) ©C(4, 3) ©C(2, 4) ©C(0, 5) ©C(3, 6)

C(6, 1) =C(1, 3) ©C(4, 4) ©C(2, 5) ©C(0, 6) ©C(3, 0)

C(6, 2) =C(1,4) ©C(4, 5) ©C(2, 6) ©C(0, 0) ©C(3, 1)

C(6, 3) =C(1, 5) ©C(4, 6) ©C(2, 0) ©C(0, 1) ©C(3, 2)

C(6, 4) =C(1,6) ©C(4, 0) ©C(2, 1) ©C(0, 2) ©C(3, 3)

C(6, 5) =C(1,0) ©C(4, 1) ©C(2, 2) ©C(0, 3) ©C(3, 4)

C(6, 6) =C(1, 1) ©C(4, 2) ©C(2, 3) ©C(0, 4) ©C(3, 5)

图 Ί 为本发明实施例提供的多磁盘容错系统中生成校验块的方法流程示意图，如图 7所示，包括如下步骤：

步骤 101、获取需要生成的校验块所属校验分组中各个数据块的数据，本实施例中的生成校验块的方法于图 1所述的多磁盘容错系统，在该多磁盘系统中，校验块 ^所在校验分组中的各个数据块的行号和列号满足如下的条件，数据块的行号为 - /，列号为 A的取值范围为 /到 m-l+/，其中 / 为校验块在校验区域中的行号， 1≤ /≤ g， n为校验块对应的列号， 0≤η≤_Ρ-1 ; 具体的在获取到属于上述校验块所在校验分组的所有数据块的数据后，将其进行异或计算即可得到校验块的值，具体可以按照如下的公式进行计算： c = ㊉ Γ

在获得校验分组中各个数据块的数据后根据上述公式进行异或计算即可得到校验块的数据；

步骤 1 02、根据所述校验分组中所有数据块的数据获得所述需要生成的校验块中的校验数据；

步骤 1 03、将计算获得的上述校验块的数据写入到所述磁盘阵列中的相应校验块中。

本实施例中提供的多磁盘容错系统中生成校验块的方法，通过获取校验分组中各个数据块的数据，根据所述各个数据块的数据获取校验块的数据，其中的数据块和校验块由于采用了如图 1所示实施例的设置方式，能够使得在生成校验块时不需要进行复杂的乘加运算，能够有效降低多磁盘容错系统在数据处理过程中的计算复杂度。

上述实施例中的具体计算过程可以按照图 8所示的步骤执行，包括：步骤 201 , 令变量 k为校验块在校验区域中的行号 / ;

步骤 202 , 确定属于该校验分组的下一个数据块的行号和列号；

具体可以通过计算 (m - k X /)%m确定行号 i , m为预定的小于 p-q的素数，通过计算 (_n + k)%p确定列号 j；步骤 203 , 读取步骤 202中确定的数据块 C (i， j)中的数据；

步骤 204 , 令 k的值增加 1 ;

步骤 205 , 判断 k是否小于 m-l + /，如果是则执行步骤 202 , 如果不是则执行步骤 206 ;

步骤 206 , 将校验分组中各个数据块的数据进行异或计算并将计算结果写入到校验块中；另外在上述步骤 203 中若已经读取了一个以上的数据块的数据，则可在从数据块中读取数据后即将已经读取的数据进行异或计算，并可以在此后的流程中，利用上次计算的异或值与本次读取的数据进行异或计算，在本步骤中仅将最后的异或计算结果写入校验块即可

本实施例中提供的多磁盘容错系统中生成校验块的方法，可以使用较少的异或计算获取磁盘数据校验块，能够有效降低多磁盘容错系统中的计算复杂度。

图 9 为本发明实施例中多磁盘容错系统中恢复数据块的方法的流程示意图，本实施例中恢复数据块的方法是基于图 1所示的多磁盘容错系统，如图 9 所示，包括如下步骤：

步骤 301、获取待恢复数据块所属校验分组中其他数据块的数据以及校验块的数据；据进行计算获得所述待恢复数据块的数据；

步骤 303、将所述计算获得的数据块的值写入到所述待恢复数据块中。本实施例中提供的多磁盘容错系统中恢复数据块的方法，通过获取待恢复数据块所属校验分组中其他数据块的数据以及校验块的数据，根据上述数据获取待恢复的数据，其中的数据块和校验块由于采用了如图 1所示实施例的设置方式，能够使得在获取数据块时不需要进行复杂的乘加运算，能够有效降低多磁盘容错系统在数据处理过程中的计算复杂度。得所述待恢复数据块的数据包括：根据所述校验块的数据以及其他数据块的数据进行异或处理以获取待恢复数据块的数据。

上述实施例中的数据块恢复方法用在双磁盘容错系统中时，可使用校验区域的第一行的校验块或者第二行的校验块进行校验，例如当待恢复的数据块为 D (i, j) , 可包括如图 10所示的步骤：

步骤 401、计算待恢复数据块 D (i， j)的校验块的位置信息并获取校验块的数据；

在存在两行校验块时，可利用第一行或者第二行上的校验块进行数据恢复，利用该数据块在校验区域第一行（即第 m行）上的校验块 P (m，w)时，其中的列号 w可由如下的计算式获得： w = (j-(m-i))%p , 其中 p为容错磁盘数，利用该数据块在校验区域第二行（即第 m+1行）上的校验块 P (m+l，y)时，其中的列号 y可由如下公式获得： y = (j- (a x m-i)/2)%p ,其中 a的取值情况如下：在 m-i为奇数或小于 4时 a为 2 , 否则 a为 1。在获取上述校验块的位置信息后，即可获取其中的数据；本步骤中给出在双磁盘容错系统中根据数据块的位置信息计算其在校验区域的第一行和第二行的校验块的列号的方法同样适用于由三个以上的磁盘组成的多磁盘容错系统。

步骤 402、读取校验分组中其他数据块的数据；

校验分组中其他数据块的行号和列号也可通过计算获得，对于步骤 401 中在第一行上的校验块 P (m, w)所属的校验分组，其数据块的行号为（m-k) %m, 列号为（n+k) %p, 其中 k从 1到 m取值；对于步骤 401 中第二行上的校验块 P (m+l，y)所属的校验分组，其数据块的行号为（m-2k) %m, 列号为（n+k) %p; 步骤 403、根据上述数据块所属的校验分组的其他数据块的数据和校验块的数据得到待恢复的数据块的数据，并将该数据写入待恢复的数据块中。

所述得到待恢复的数据块的数据可以根据将与所述数据块所属的校验分组的其他数据块的数据和校验块的数据进行异或计算得到。

上述实施例中提供了在多磁盘容错系统中对待恢复数据块进行恢复的方法，能够获得较优的数据块更新代价，在实现 q个磁盘的容错系统中，更新一个数据块只需要 q+1次磁盘写操作即可，能够提高多磁盘容错系统的写性能。

图 11为本发明实施例中双磁盘容错系统在重建单个故障磁盘的流程示意图，本实施例是以双磁盘容错系统中发生单个磁盘故障为例，介绍恢复单个磁盘的方法，如图 11所示，包括如下步骤：

步骤 501 , 初始时设定变量 i为 0;

步骤 502 , 变量 i 自加 1 , 并利用上述实施例中提到的单个损毁数据块的恢复方法恢复损毁磁盘上的数据块 D(i， j), 即通过获取损毁数据块的所属校验分组的校验块的数据以及校验分组中其他数据块的数据，并将获取的数据进行异或计算获得损毁数据块的数据；

步骤 503 , 将步骤 502中恢复的数据写入到数据块 D(i， j);

步骤 504 , 判断 i的值是否小于 m, m为设定的小于 p-q的素数，其中 p 为磁盘阵列中的磁盘个数， q为容错磁盘数目，在 i的值小于 m时执行步骤 502 , 在 i值大于或等于 m时执行步骤 505 ; 步骤 505, 恢复损毁磁盘上的校验块，在双磁盘容错系统中每个磁盘包括两个校验块，因此本步骤中首先获取校验块 P (m, j )所属的校验分组的各个数据块的数据并进行异或计算，将异或计算的结果写入到校验块 P (m, j )中；获取校验块 P ( m+1 , j )所属的校验分组的各个数据块的数据并进行异或计算，将异或计算的结果写入到校验块 P (m+1, j ) 中。

图 12为本发明实施例中多磁盘容错系统中恢复多个磁盘的方法流程示意图，如图 12所示，包括如下步骤：

步骤 601、确定一条恢复路径的起始点；

例如以双磁盘容错系统为例，令两个故障磁盘的序号为 a和 b, 即两个故障磁盘在磁盘阵列中的列号为 a和 b, 且 a〉 b, 则确定一条恢复路径有两种情况，第一种情况：当两个故障磁盘相邻时，即 a=(b+l)%p, 此时存在两条恢复路径，一条是以校验块 P(m，（a+l)%p)恢复的 b磁盘上的数据块为起始点的，另一条是以校验块 P(m+1，（b-l)%p)恢复 a磁盘上的数据块为起始点的。第二种情况：当两个故障磁盘不相邻时，即 a≠ (b + 1)%ρ , 此时存在 4条恢复路径：第一条是以校验块 P (m, (b+1) %p)恢复的 a磁盘上的数据块为起始点，第二条是以校验块 P(m，（a+l)%p)恢复的 b 磁盘上的数据块为起始点，第三条是以校验块 P(m+1，（b-l)%p)恢复的 a 磁盘上的数据块为起始点，第四条是以校验块 P(m+1, (a-l)%p)恢复的 b磁盘上的数据块为起始点。

步骤 602、恢复上述恢复路径上的数据块或者校验块；

具体可以为：在确定一条恢复路径的开始点后，交替使用不同校验行上的校验块来恢复数据块。例如在双磁盘容错系统中某个故障磁盘 b 上的数据块 D(i, b)是利用第一校验行上的校验块恢复的，则该恢复路径上的下一个恢复的数据块为另一个故障磁盘 a上的数据块 D (j， a) , 其中 D (j，a)与 D (i，b)所属的校验分组的校验块在第二校验行上。类似地，如果某个故障磁盘 b上的数据块 D (i, b)是利用第二校验行上的校验块恢复的，则该恢复路径上的下一个恢复的数据块为另一个故障磁盘 a上的数据块 D (j， a) , 其中 D (j，a)与 D (i，b) 所属的校验分组的校验块在第一校验行上。其中在 a>b 的情况下， j 的值可由 j = (i - (a - b))%m确定，此时 D(j, a)与 D(i, b)所属的校验分组的校验块在第一校验行上；或者由 j = (i - 2 X (a - b))%m确定，此时 D(j, a)与 D(i, b) )所属的校验分组的校验块在第二校验行上，其中 m为预设的小于磁盘阵列中磁盘数目 p和容错磁盘数 q的差的任一素数。具体的单个数据块的恢复过程可以见图 9所示的多磁盘容错系统中数据块恢复的方法的实施例，校验块的恢复可参见图 7所示的实施例。

步骤 603、判断上述步骤中恢复的是损毁磁盘上的数据块还是校验块，如果是校验块则终止恢复路径，并执行步骤 604 ,如果是数据块则执行步骤 602; 步骤 604、判断损毁磁盘上的所有数据块是否都恢复，如果是则执行步骤 605 , 如果不是则执行步骤 601 , 重新确定一条恢复路径；

步骤 605、判断损毁磁盘上的校验块是否都恢复，如果都恢复则结束本流程，否则，执行步骤 606;

步骤 606、恢复损毁磁盘上未恢复的校验块。

以下以一个具体实施例说明上述的步骤 601、步骤 602中确定恢复路径并恢复该路径上的数据块和校验快的过程，以由 7个磁盘组成的磁盘阵列中两个相邻磁盘 D3和 D4 (即磁盘阵列中列号为 3和 4的磁盘 )发生故障为例，如图 13 所示，故障磁盘的数据块恢复存在两条并行路径。其中一条恢复路径的起始点是利用从故障磁盘右侧的磁盘 D5上的第一校验行的校验块 C(5，5) (6)恢复 D3上的数据块 C (0， 3) (f 6) ,然后根据数据块 C (0， 3) (f 6)利用第二校验行的校验块 C (6， 5) ( f )恢复 D4故障磁盘的 C (3， 4) ( f 3 ),根据数据块 C (3， 4) ( f 3 ) 利用第一校验行的校验块 C (5， 2) ( 3 )恢复故障磁盘 D3的 C (4， 3) (a3 ), 根据数据块 C (4， 3) ( a3 )利用第二校验行的校验块 C (5， 2) ( a )恢复故障磁盘 D4 的 C (2， 4) ( a2 ), 根据数据块 C (2， 4) (a2 )利用第一校验行的校验块 C (5, 1) ( 2 )恢复故障磁盘 D3的 C (2, 3) ( e2 ), 根据数据块 C (2, 3) ( e2 )所属的校验分组生成故障磁盘 D4的第二校验行上的校验块 C (6， 4) (e), 该路径终止。上述恢复路径中可以简单表示为：

C(0, 3)f6→ C(3, 4)β→ C(4, 3)α3→ C(2, 4)α2→ C(3, 3)e2→ C(6, 4)e

另一条恢复路径的开始点是利用磁盘 D2 的第二校验行的校验块 C(6，2) (c)恢复的故障磁盘 D4的数据块 C (1, 4) (cl) , 然后根据数据块 C (1, 4) (cl) 利用第一校验行的校验块 C (5， 0) ( 1 )恢复故障磁盘 D3的 C (2, 3) ( gl ), 根据数据块 C (2, 3) ( gl )利用第一校验行的校验块 C (6， 6) ( g )恢复故障磁盘 D⁴ 的 C (0， 4) ( g7 ), 根据数据块 C (0， 4) ( g7 )利用第一校验行的校验块 C (5, 6) ( 7 )恢复故障磁盘 D3的 C (1， 3) ( b7 ), 根据数据块 C (1， 3) ( b7 )利用第二校验行的校验块 C (6, 1) ( b )恢复故障磁盘 D4的 C (4， 4) ( b4 ),根据数据块 C (4， 4) ( b4 )所属的校验分组生成故障磁盘 D3的第一校验行上的校验块 C (5, 3) ( 4 ), 该路径终止。上述恢复路径中可以简单表示为：

C(7, 4)cl→ C(2, 3)gl→ C(0, 4)g7→ C(l, 3)b7→ C(4, 4)b4→ C(5, 3)4

另外，对于剩下的 C(6， 3)d和 C(5，4) 5属于校验块，由于所有的数据块都已恢复，对这两个校验块可直接使用校验块的生成方式直接计算可得，至此，磁盘 D3和 D4的数据块和校验块全部恢复。

从上述两条恢复路径可以看出，路经的开始点是利用故障磁盘的向右的第一校验行的校验块或向左的第二校验行的校验块开始的，然后交替使用第一校验行和第二校验行的校验块来恢复故障磁盘数据块，直到恢复的是校验块为止，上述的两条路径可同时进行，从而能够提高恢复速度。对于不相邻的双磁盘故障数据恢复的方法同相邻的双磁盘故障一样，不同的是存在四条并行的恢复路径而已。

本发明上述实施例中多是以双磁盘容错为例进行说明，同时对于 3个或者 3个以上的多磁盘容错系统也可以使用本发明实施例提供的数据块恢复方法，其中在确定恢复路径时，各恢复路径上的交叉恢复数据块的顺序和方法有所差别。

本发明实施例中的一个磁盘可以看作是存储区域网络（S torage Area Network , 以下简称： SAN )中的一个存储节点，即将本发明实施例中的多磁盘容错的系统和方法应用到 SAN技术中，数据的编码和解码的方法与上述实施例相同。另外对于分布式存储系统容错，将本发明实施例中的单个磁盘作为分布式存储系统中的一个网络节点，则可将本发明上述实施例中应用到分布式存储系统中，其数据的编码和解码方法与上述实施例相同。

本发明上述实施例提供的多磁盘容错系统、多磁盘容错系统中生成校验块的方法、多磁盘容错系统中数据块恢复的方法和多磁盘容错系统中多个磁盘恢复的方法，能够使用少量的异或计算来产生磁盘数据校验块，有效降低多磁盘容错系统的计算复杂度，并获取的最优的数据块更新代价，在实现 q个磁盘的容错系统中，更新一个数据块只需要 q+1次磁盘写操作，提高了多磁盘容错系统的写性能。另外本发明实施例还可以获得各个磁盘负载均衡的特性，无论计算校验块还是恢复数据块，各个磁盘的负载都是均衡的，从而能够提高多磁盘容错系统的整体性能。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求

1、一种多磁盘容错系统，包括通过系统总线连接的磁盘阵列和计算模块，其特征在于：

所述磁盘阵列由 p个磁盘组成，其中 p为大于或等于 3的自然数，所述磁盘阵列的容错磁盘数为 q , 其中 q为小于 / 2且不小于 2的自然数；

所述磁盘阵列中的数据按照 (rn + ^ x p的矩阵 M形式进行排列，其中 m为小于或等于 p-q的素数；所述矩阵 M中第 0行为虚拟的值为 0的虚拟数据块，第 1行至第 m-1行为数据块，第 m行至第 m+q-1行为校验区域；其中所述校验区域中的校验块 C_m；所在校验分组中的各个数据块的行号为 m _ k - l , 列号为 n + k , k的取值范围为 /到 m-l+/ ,其中 /为所述校验块在所述校验区域中的行号， l≤/≤g，n为所述校验块对应的列号， 0≤n≤_P-l 所述校验块中的数据为校验块所属校验分组中所有数据块的数据的异或值；

2、根据权利要求 1所述的多磁盘容错系统，其特征在于，所述计算模块包括：

第一获取单元，用于获取校验块所属校验分组中所有数据块的数据；第一计算单元，用于根据所述第一获取单元获取的校验块所属校验分组中所有数据块的数据进行异或计算以获取所述校验块的数据；

第一输出单元，用于将第一计算单元计算生成的校验块的数据写入到磁盘阵列中相应的校验块中。

3、根据权利要求 1所述的多磁盘容错系统，其特征在于，所述计算模块包括：

第二获取单元，用于获取待恢复数据块所属校验分组中除待恢复数据块之外的其他数据块的数据以及校验块的数据；

第二计算单元，用于根据第二获取单元获取的所述数据块的数据以及所述校验块的数据进行异或计算以获取所述待恢复数据块的数据；

第二输出单元，用于将所述第二计算单元计算生成的待恢复数据块的数据写入到所述待恢复数据块中。

4、一种在如权利要求 1所述的多磁盘容错系统中生成校验块的方法，其特征在于，包括：

获取需要生成的校验块所属校验分组中所有数据块的数据；

将上述获得的所述校验数据写入到所述磁盘阵列中的相应校验块中。

5、根据权利要求 4所述的多磁盘容错系统中生成校验块的方法，其特征在于，所述根据校验分组中所有数据块的数据获得所述需要生成的校验块中的校验数据包括：

根据校验分组中所有数据块的数据根据公式 c_m—w,„ = ^m® c_(m__k,_{) n+k)p}获得所述需要生成的校验块中的校验数据 C_m__l+hn。

6、一种在如权利要求 1所述的多磁盘容错系统中恢复数据块的方法，其特征在于，包括：获取待恢复数据块所属校验分组中其他数据块的数据；

获取所述待恢复数据块所属校验分组中校验块的数据；行异或计算以获得所述待恢复数据块的数据；

将所述计算获得的数据块的值写入到所述待恢复数据块中。

7、根据权利要求 6所述的多磁盘容错系统中恢复数据块的方法，其特征在于，所述获取待恢复数据块所属校验分组中校验块的数据包括：

根据如下公式确定待恢复数据块在第 m行的校验块的列号 w以获取校验块的数据： w = (j'_( _ ))%p, 其中 i为所述待恢复的数据块所在行的行号， j为所述待恢复的数据块所在列的列号。

8、根据权利要求 6所述的多磁盘容错系统中恢复数据块的方法，其特征在于，所述获取待恢复数据块所属校验分组中校验块的数据包括：

根据如下公式确定待恢复数据块在第 m+1行的校验块的列号 y以获取校验块的数据： y = (j- (axm- i)/2)%p, 其中 i为所述待恢复的数据块所在行的行号， j为所述待恢复的数据块所在列的列号，在 m-i为奇数或小于 4时， a为 2, 否则为 1。