CN111124738B

CN111124738B - 用于独立冗余磁盘阵列的数据管理方法、设备和计算机程序产品

Info

Publication number: CN111124738B
Application number: CN201811289419.8A
Authority: CN
Inventors: 康剑斌; 董继炳; 高宏坡
Original assignee: EMC IP Holding Co LLC
Current assignee: EMC Corp
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2023-08-18
Anticipated expiration: 2038-10-31
Also published as: US11513896B2; US20200133774A1; CN111124738A

Abstract

本公开涉及一种用于独立冗余磁盘阵列(RAID)的数据管理方法、设备和计算机程序产品。该方法包括：获取第一校验和校验值对，第一校验和校验值对是基于RAID中的数据盘的用户数据为预定值时的第一校验和而确定的；基于RAID中的数据盘的当前校验和，确定RAID的第二校验和校验值对，第一校验和校验值对和第二校验和校验值对分别包括行奇偶校验和校验值和对角奇偶校验和校验值；以及基于第一校验和校验值对以及第二校验和校验值对，确定第三校验和校验值对，以用于更新RAID的校验盘的校验数据。

Description

用于独立冗余磁盘阵列的数据管理方法、设备和计算机程序产品

技术领域

本公开涉及存储设备的数据管理方法和设备。更具体地，本公开涉及用于独立冗余磁盘阵列的数据管理方法、设备及计算机程序产品。

背景技术

当前，为了增强存储设备的磁盘的容错能力，会在独立冗余磁盘阵列(RAID)中配置两个独立的、基于不同校验机制的校验盘，例如RAID 6中配置有两个基于不同校验机制的校验盘，即P盘和Q盘。与RAID 5相比，RAID 6由于存在两个独立的、具有不同算法的校验机制，因此增强了RAID中磁盘的容错能力，提高了所存储数据的可靠性。

在传统的用于独立冗余磁盘阵列的数据管理方案中，由于存在两种不同的校验算法，使得在一些特殊情况下，即使数据盘上的数据相同，也会得到两个不一致的校验和校验值(POC)。例如，当RAID 6的数据盘的所有用户数据为0时，RAID 6中的P盘和Q盘上的两个校验和校验值(POC)既可能是初始校验和校验值(ZeroPOC)，也可能是基于校验算法而确定的计算校验和校验值(SetPOC)，因此不能唯一确定POC。这种关于POC的不确定性使得当RAID中的校磁盘发生降级和/或缺失时，在数据恢复或重建过程中的POC不能唯一被确定，进而导致重建过程中的数据丢失。

发明内容

本公开提供一种用于独立冗余磁盘阵列的数据管理方法、系统，能够有效地降低在数据恢复过程中丢失数据的风险。

根据本公开的第一方面，提供了一种用于独立冗余磁盘阵列(RAID)的数据管理方法。该方法包括：获取第一校验和校验值对，第一校验和校验值对是基于RAID中的数据盘的用户数据为预定值时的第一校验和而确定的；基于RAID中的数据盘的当前校验和，确定RAID的第二校验和校验值对，第一校验和校验值对和第二校验和校验值对分别包括行奇偶校验和校验值和对角奇偶校验和校验值；以及基于第一校验和校验值对以及第二校验和校验值对，确定第三校验和校验值对，以用于更新RAID的校验盘的校验数据。

根据本发明的第二方面，还提供一种用于独立冗余磁盘阵列(RAID)的数据管理设备。该设备包括：存储器，被配置为存储一个或多个程序；处理单元，耦合至存储器并且被配置为执行一个或多个程序使管理设备执行多个动作，动作包括：获取第一校验和校验值对，第一校验和校验值对是基于RAID中的数据盘的用户数据为预定值时的第一校验和而确定的；基于RAID中的数据盘的当前校验和，确定RAID的第二校验和校验值对，第一校验和校验值对和第二校验和校验值对分别包括行奇偶校验和校验值和对角奇偶校验和校验值；以及基于第一校验和校验值对以及第二校验和校验值对，确定第三校验和校验值对，以用于更新RAID的校验盘的校验数据。

根据本公开的第三方面，还提供了一种计算机程序产品。该计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令，所述机器可执行指令在被执行时使机器执行根据第一方面的方法的步骤。

提供发明内容部分是为了简化的形式来介绍对概念的选择，它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征，也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施例中，相同的参考标号通常代表相同部件。

图1示出了传统的独立冗余磁盘阵列100的示意图；

图2示出了根据本公开的实施例的用于RAID的数据管理方法200的流程图；

图3示出了根据本公开的实施例的数据管理方法中POC数据变化的示意图300；

图4示出了根据本公开的实施例的用于RAID中失效数据盘的恢复方法400的流程图；

图5示出了根据本公开的实施例的用于RAID中失效校验盘的恢复方法500的流程图；

图6示出了根据本公开的实施例的用于RAID的整条带数据写入方法600的流程图；

图7示出了根据本公开的实施例的用于RAID的部分条带数据写入方法700的流程图；以及

图8示意性示出了适于用来实现本公开实施例的电子设备800的框图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括，即“包括但不限于”。除非特别申明，术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

以下具体分析传统的用于独立冗余磁盘阵列的数据管理方案中的不足及其原因。图1示出了传统的独立冗余磁盘阵列100的示意图。如图1所示，独立冗余磁盘阵列100中包括多个磁盘，例如是包括6个磁盘的RAID 6。其中包括4个数据盘和2个校验盘。4个数据盘例如分别是磁盘D0、磁盘D1、磁盘D2、磁盘D3。2个校验盘例如分别是磁盘P和磁盘Q，其中磁盘P也被称为“行校验盘”，磁盘Q也被称为“对角校验盘”。每个磁盘的扇区大小例如为520字节，其中包括512字节的用户数据110和8字节的元数据120。上述8字节的元数据120通常分为4个部分，具体包括：2个字节的校验和(Checksum)122、2个字节的逻辑块地址标志(LBAstamp)124、2个字节的写标志(Write stamp)126和2个字节的时间标志(Timestamp)128。其中，LBA标志是磁盘扇区的逻辑块地址的异或，其用于检查RAID组是否读取了正确的扇区。同一条带的数据盘的逻辑块地址标识是相同的。写标志和时间标志组合在一起以用于检测不完整的数据写入。磁盘P和磁盘Q中的元数据中的2个字节的LBA标志被用作存储校验和校验值(简称为POC)130和132。磁盘P中的POC和磁盘Q中的POC是基于不同的校验算法计算的。

在传统的用于RAID的数据管理方案中，当绑定RAID时，系统将RAID中所有磁盘上的数据格式化为启动模式。下表1示出了启动模式下的数据盘的校验和以及校验盘的POC。在上述启动模式中，各数据盘的校验和122都为0x5EED，P盘的POC为0，Q盘的POC也为0。此时的POC，称为初始校验和校验值(ZeroPOC)。在启动模式下，ZeroPOC的取值是不因RAID的宽度(即RAID中磁盘数量)的不同而发生变化。

表1

以下表2示出了RAID的条带被写入数据“0”时的数据盘校验和以及校验盘POC。在表2中，当用户数据被写入数据“0”时，数据磁盘上的校验和仍为0x5EED，P盘的POC和POC和Q盘的POC是分别基于RAID6的不同校验算法而计算的。此时的POC，称为计算校验和校验值(SetPOC)。由于校验算法与RAID的宽度有关。因此，SetPOC因RAID的宽度的不同而不同，并且与启动模式下的ZeroPOC不同。

表2

RAID的宽度	4	5	6	7	8
						数据盘校验和	0x5EED	0x5EED	0x5EED	0x5EED	0x5EED
P盘的POC0	0x0000	0x5EED	0x0000	0x5EED	0x0000
						Q盘的POC	0x8E64	0x19DF	0xADFD	0xF7EC	0x251B

通过对比上述表1和表2可知，即便数据磁盘上的数据都为数据“0”，当为零的条带分别是“启动条带”或者是“数据0填充条带”时，其对应的POC是不同的。这意味着，存在两对不同的、有效的POC用于零模式。因此在传统的RAID的数据管理方案中，需要在所有的数据读、写、重建路径中设置需要设置额外的步骤来处理零条带，以便检查所有磁盘上的数据是否与零模式匹配，以及检查P和Q磁盘上的数据是否与零模式匹配，这会显著提高代码的复杂性。更有甚者，在一些特殊情况下，当P盘或/和Q盘降级时，需在降级条带上重建降级的POC时，如果其中一个校验盘正在重建，而另一个校验盘缺失，则无法从两个校验盘读取数据。只能依赖于数据磁盘的校验和来恢复校验盘的POC。此时，如果所有数据盘数据为0，则正在重建的校验盘将被设置为ZeroPOC，而另一个缺失的校验盘存在被确定SetPOC或ZeroPOC的两种可能性。传统的方案中，可能基于选择的一种可能的POC进行数据恢复，会造成两个校验盘中数据不一致。进而导致数据丢失。

综上，传统的用于RAID的数据管理方案中存在诸多不足。例如，传统方案在数据读、写、重建路径中需要设置额外的步骤来处理零条带，较为复杂。又例如，传统方案在数据恢复过程中会导致数据丢失。

为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个，本公开的示例实施例提出了一种用于RAID的数据管理方案。首先获取第一校验和校验值对，第一校验和校验值对是基于RAID中的数据盘的用户数据为预定值时的第一校验和而确定的；然后，基于RAID中的数据盘的当前校验和，确定RAID的第二校验和校验值对，第一校验和校验值对和第二校验和校验值对分别包括行奇偶校验和校验值和对角奇偶校验和校验值；以及基于第一校验和校验值对以及第二校验和校验值对，确定第三校验和校验值对，以用于更新RAID的校验盘的校验数据。在上述方案中，通过利用基于各数据盘的用户数据为预定值时的第一校验和而确定的第一校验和校验值对以及基于RAID中数据盘的当前校验和而确定第二校验和校验值对，来确定用于更新RAID的校验盘的校验数据的第三校验和校验值对，实现了RAID在零数据的情况下，其校验盘的第三校验和校验值(CookPOC)与ZeroPOC相同。由于在RAID各数据盘包括零数据的情况下，校验盘被更新的POC的取值唯一并且等于ZeroPOC，因此，一方面在数据读、写、重建路径中不需要设置额外的步骤来处理零条带，使得软件设计非常简单；而且在数据恢复过程中不会因为POC取值不唯一而导致的数据丢失。

图2示出了根据本公开的实施例的一种用于RAID的数据管理方法200的流程图。在图2所示的实施例中，各个动作例如由图8所示的处理器执行。方法200还可以包括未示出的附加动作和/或可以省略所示出的动作，本公开的范围在此方面不受限制。另外，图3示出了根据本公开的实施例的数据管理方法中的POC数据变化示意图。为了说明方法200各动作对RAID的校验盘的POC的影响，以下将结合图3所示的数据变化来描述方法200的各动作。

在框202，获取第一校验和校验值对，第一校验和校验值对是基于RAID中的数据盘的用户数据为预定值时的第一校验和而确定的。第一校验和校验值对也可以被称为预置POC(Preset POC)，第一校验和校验值对例如包括两个Preset POC，分别是P盘的PresetPOC和Q盘的Preset POC。在一些实施例中，上述预定值例如为0。在一些实施例中，第一校验和校验值对对于不同宽度的RAID是不同的。以下表3示出了不同RAID宽度下的第一校验和以及第一校验和校验值对。根据表3数据可知，当RAID的宽度为4时，第一校验和校验值对为(0x0000，0x8E64)；当RAID的宽度为5时，第一校验和校验值对为(0x5EED，0x19DF)；当RAID的宽度为8时，第一校验和校验值对为(0x0000，0x251B)。可见，对于不同宽度的RAID，第一校验和校验值对的取值是不同的，P盘的Preset POC和Q盘的PresetPOC的取值是与RAID宽度相匹配的。在一些实施例中，在RAID启动时计算第一校验和校验值，并将其保存在存储器中。

表3

RAID的宽度	4	5	6	7	8
						第一校验和	0x5EED	0x5EED	0x5EED	0x5EED	0x5EED
P盘的Preset POC	0x0000	0x5EED	0x0000	0x5EED	0x0000
						Q盘的Preset POC	0x8E64	0x19DF	0xADFD	0xF7EC	0x251B

关于获取第一校验和校验值对，在一些实施例中，其包括：对第一校验和执行异或运算，以得到第一行奇偶校验和校验值；以及对第一校验和执行偶数奇数运算，以得到第一对角校验和校验值。在一些实施例中，对各数据盘的用户数据为0时的第一校验和(例如0x5EED)执行行异或运算，以得到P盘的Preset POC；以及对各第一校验和执行偶数奇数(even-odd)运算，以得到Q盘的Preset POC。偶数奇数(even-odd)运算也称为对角奇偶运算，是由调节因子与相应对角线的数据块进行异或运算而得到的。由于本公开并不涉及对偶数奇数(even-odd)运算自身的改进，因此关于偶数奇数运算的具体算法不进行赘述。在一些实施例中，例如，当RAID宽度为5时，当RAID中的各数据盘D0至D4的用户数据为0x0000时，各数据盘的各第一校验和为0x5EED，如图3所示。在框332，基于数据盘用户数据为0时的第一校验和5EED而确定第一校验和校验值对。具体而言，为了得到P盘的Preset POC，即行奇偶校验和校验值302，对各数据盘的第一校验和0x5EED执行异或运算。则得到行奇偶校验和校验值302为0x0000。为了得到Q盘的Preset POC，即对角校验和校验值304，对各数据盘第一校验和(即0x5EED)执行偶数奇数运算，则得到对角校验和校验值304为0x19DF。此时，第一校验和校验值对为(0x0000，0x19DF)。

在框204，基于RAID中的数据盘的当前校验和，确定RAID的第二校验和校验值对，第一校验和校验值对和第二校验和校验值对分别包括行奇偶校验和校验值和对角奇偶校验和校验值。在一些实施例中，基于数据盘的当前校验和，利用RAID 6的行异或运算校验算法和偶数奇数(even-odd)运算，分别计算RAID的第二校验和校验值对。如图3所示。在框334，基于数据盘当前校验和，确定第二校验和校验值对。具体而言，当RAID宽度为5时，数据盘的当前校验和例如分别为C0、C1、C2、C3、C4，基于各数据盘的当前校验C0至C4，利用RAID6的校验算法，计算RAID的第二校验和校验值对中的行奇偶校验和校验值312(即P盘的SetPOC)和对角奇偶校验和校验值314(即Q盘的Set POC)。在图3中，P盘的Set POC例如是SP0，Q盘的Set POC例如是SP1。

在框206，基于第一校验和校验值对以及第二校验和校验值对，确定第三校验和校验值对，以用于更新RAID的校验盘的校验数据。在一些实施例中，确定第三校验和校验值对包括：对第一校验和校验值对以及第二校验和校验值对执行异或运算，以得到第三校验和校验值对。在一些实施例中，将得到的第三校验和校验值对所包括的行奇偶校验和校验值(即P盘的Set POC)和对角奇偶校验和校验值(即Q盘的Set POC)分别存储在RAID的行奇偶校验盘(即P盘)和对角校验盘(即Q盘)。如图3所示，在336，基于第一校验和校验值对以及第二校验和校验值对，确定第三校验和校验值对。具体而言，对P盘的Preset POC和P盘的SetPOC执行异或运算，以得第三校验和校验值对中的行奇偶校验和校验值322，即P盘的CookPOC；对Q盘的Preset POC和Q盘的Set POC执行异或运算，以得第三校验和校验值对中的对角奇偶校验和校验值324，即Q盘的Cook POC。如图3所示，第三校验和校验值对为(CP0，CP1)。

以下表4示出了本公开实施例的方法200在不同RAID宽度下的校验和校验值对。根据表4的数据可知，第二校验和校验值对，即SetPOC，对于RAID的不同宽度是不同的。而基于第一校验和校验值对以及第二校验和校验值对所确定的第三校验和校验值对，即CookPOC，在数据盘的用户数据为0时，CookPOC与启动模式下的初始校验和校验值，即ZeroPOC相同。而且第三校验和校验值对与RAID的宽度无关。这使得P盘或Q盘与ZeroPOC相关联的“启动零模式”成为有效的RAID奇偶校验模式。

表4

RAID的宽度	4	5	6	7	8
						P盘的ZeroPOC	0000	0000	0000	0000	0000
Q盘的ZeroPOC	0000	0000	0000	0000	0000
						P盘的SetPOC	0000	5EED	0000	5EED	0000
Q盘的SetPOC	0x8E64	0x19DF	0xADFD	0xF7EC	0x251B
						P盘的CookPOC	0000	0000	0000	0000	0000
Q盘的CookPOC	0000	0000	0000	0000	0000

在上述方案中，通过利用第一校验和校验值对以及第二校验和校验值对，来确定用于更新RAID的校验盘的校验数据的第三校验和校验值对，实现了RAID在零数据的情况下，其校验盘的POC，即CookPOC与ZeroPOC相同，取值唯一确定，并且与RAID的宽度无关。因此，一方面，在数据读、写、恢复路径中不需要设置额外的步骤来处理“启动零条带”和“写入零条带”的差异所带来的特殊情况，因此显著地简化了软件设计；避免了因校验和校验值对的取值不确定而导致的恢复数据过程中的数据丢失的问题。。

在一些实施例中，在用于RAID的数据管理方法200中还包括用于RAID中失效数据盘的恢复方法。图4示出了根据本公开的实施例的用于RAID中失效数据盘的恢复方法400的流程图。方法400还可以包括未示出的附加动作和/或可以省略所示出的动作，本公开的范围在此方面不受限制。

在框402，响应于检测到RAID中存在失效数据盘，获取RAID中未失效数据盘的校验和。以图1所示的4+2的宽度为6的RAID 6为例，例如，响应于检测到RAID中图1所示的数据盘D0失效，假设此时其余数据盘D1至D3、P盘、Q盘未失效，则读取剩下3个数据盘D1、D2和D3上的校验和C1、C2和C3。

在框404，获取失效前的第三校验和校验值对。在一些实施例中，通过读取保存在P盘和Q盘上的第三校验和校验值对(P盘的CookPOC，Q盘的CookPOC)，来获取失效前的第三校验和校验值对。由于失效数据盘的校验和需要藉由失效前的第二校验和校验值对(SetPOC)进行恢复，而SetPOC因为失效数据盘的校验和无法获知，因此无法直接基于各数据盘的校验和计算失效前的SetPOC，因此需要藉由失效前的CookPOC来恢复失效前的SetPOC。

在框406，基于第三校验和校验值对以及第一校验和校验值对，确定失效前的第二校验和校验值对，第一校验和校验值对与RAID的宽度相匹配。在一些实施例中，对所获取的第三校验和校验值对和第二校验和校验值对执行异或运算，以得到失效前的第二校验和校验值对(P盘的SetPOC，Q盘的SetPOC)。

在框408，基于未失效数据盘的校验和以及失效前的第二校验和校验值对，恢复失效的数据盘的校验和。例如，基于数据盘D1、D2和D3上的校验和C1、C2和C3，以及P盘的SetPOC、Q盘的SetPOC，经由异或运算，已获得失效数据盘D0的校验和C0。

在一些实施例中，在用于RAID的数据管理方法200中还包括用于RAID中失效校验盘的恢复方法。图5示出了根据本公开的实施例的用于RAID中失效校验盘的恢复方法500的流程图。方法500还可以包括未示出的附加动作和/或可以省略所示出的动作，本公开的范围在此方面不受限制。

在框502，响应于检测到RAID中的校验盘失效，基于RAID中各数据盘的当前校验和，确定失效前的第二校验和校验值对。以图1所示的4+2的宽度为6的RAID6为例，例如，响应于检测到RAID中P盘和/或Q盘失效，假设此时数据盘D1至D4未失效，则读取4个数据盘D1、D2、D3和D4上的校验和C1、C2、C3和C4。

在框504，基于失效前第二校验和校验值对以及第一校验和校验值对，确定失效前的第三校验和校验值对，第一校验和校验值对与RAID的宽度相匹配。在一些实施例中，首先，基于数据盘的当前各校验和，经由RAID 6的校验算法，计算第二校验和校验值对(P盘的SetPOC，Q盘的SetPOC)。其次，获取与RAID的宽度相匹配的第一校验和校验值对，例如藉由查表获取与宽度为6的RAID相匹配的P盘的Preset POC为0x0000，Q盘的Preset POC为0xADFD。然后，基于第一校验和校验值对以及所计算的第二校验和校验值对，确定失效前的第三校验和校验值对(P盘的CookPOC，Q盘的CookPOC)。例如，通过对P盘的PresetPOC0x0000和P盘的SetPOC执行异或运算，以得到P盘的CookPOC；通过对Q盘的PresetPOC0xADFD和Q盘的SetPOC执行异或运算，以得到Q盘的CookPOC。

在框506，存储所述失效前的第三校验和校验值对，以用于重构后的校验盘的校验和校验值对。例如上述经计算得到的第三校验和校验值对(P盘的CookPOC，Q盘的CookPOC)即为重构后的P盘和Q盘的POC数据。

在上述方案中，通过利用第一校验和校验值对以及第二校验和校验值对，来确定用于更新RAID的校验盘的校验数据的第三校验和校验值对，使得RAID在零数据的情况下，校验盘POC的取值唯一并且等于ZeroPOC，因此，在数据恢复路径中不需要设置额外的步骤来处理“零数据条带”。

而在传统的用于RAID数据管理方法中的数据恢复过程中，当P盘和/或Q盘发生降级，在降级条带上进行重建时，需要执行以下动作以便处理“零数据条带”：首先，确认所有磁盘上的数据是否匹配零模式，如果不匹配，则使用RAID 6的常规检验算法，将POC更新为SetPOC；然后，如果确认存在未降级的P盘或Q盘，检测未降级的P盘或Q盘上的数据，如果所检测数据不匹配“启动零模式”，则使用RAID 6常规校验算法，将POC更新为SetPOC；再者，设置正重建校验盘(可以是P或Q或两者)的POC为“启动零模式”，即ZeroPOC。在上述传统的数据恢复方法中，如果在一个校验盘正在重建，另一个校验盘不存在，则只能基于所有数据盘的校验和来重建POC。如果此时所有的数据盘包括零模式，正在被重建的校验盘将被设定ZeroPOC，而另一个缺失的校验盘存在是SetPOC或ZeroPOC的两种可能。此时，校验盘的校验数据不一致。容易导致重建过程中的数据丢失。

以下表5示出了传统的数据管理方法和本公开实施例的数据管理方法在POC重建值和一致性方面的效果对比情况。根据表5可以得出：根据传统的数据管理方法，当在一个校验盘正在重建，另一个校验盘不存在，并且所有的数据盘的包括零模式的情况下，正在被重建的校验盘的POC可能被重建为两种不一致的取值。而根据本公开实施例的数据管理方法，当所有的数据盘的包括零模式，POC仅可能被重建为唯一确定的值，而不存在不一致的情况。因此，本公开实施例的数据管理方法能够有效避免因POC重建值不唯一而导致的数据重建过程中的数据丢失。

表5

另外，相对于传统的数据管理方法，本公开实施例的数据管理方法因为在数据恢复路径中不需要设置额外的步骤来处理零条带，因此使得软件设计非常简单。

在一些实施例中，在用于RAID的数据管理方法200中还包括用于进一步向RAID写入数据的方法。图6示出了根据本公开的实施例的用于RAID的整条带数据写入方法600的流程图。方法600还可以包括未示出的附加动作和/或可以省略所示出的动作，本公开的范围在此方面不受限制。

RAID是由多块磁盘组成，其通过数据条带技术将数据以块的方式分布存储在多个磁盘中，从而可以对数据进行并发处理。以便写入和读取数据就在多个磁盘上同时进行，有利于有效提高了整体I/O性能。以下结合图6说明用于向RAID针对整条带写入数据的方法600。

在框602，响应于检测到向RAID的写入，确定写入是针对整个条带进行写入还是针对部分条带进行写入。RAID的写入类型可以包括：整条带写入(Full-Stripe Write)和部分条带写入。当RAID的写入类型为整条带写入时，每次IO几乎占用所有盘，因此每个条带上的每个单元都被写更新。当RAID的写入类型为部分条带写入时，例如读改写(Read-ModifyWrite)，其需要修改部分单元的数据。通过首先判断RAID的写入类型，可以使得计算校验数据的方式与RAID的写入类型相匹配。在一些实施例中，基于RAID元数据中写标志和时间标志，来确定写入是针对整个条带进行写入还是针对部分条带进行写入。例如，当写入IO是针对整条带写入时，图1所示RAID的元数据中的写标志128为0，当写入IO是针对部分条带写入时，被写入的磁盘的对应写标志被翻转为1，当其再次写入时对应写标志再变为0。另外，当写入IO是针对整条带写入时，所有磁盘的时间标志为一致的，如果是非整条带写入时，被写入的相应磁盘的时间标志是特殊值，例如是全1的值。

在框604，响应于确定写入是针对整个条带进行写入，获取写入后的第二校验和校验值对。在整条带写入过程中，由于每个条带上的每个单元都被写更新，因此可以直接利用更新的数据盘校验和计算出写入后的第二校验和校验值对。在一些实施例中，基于更新的用户数据获得更新的校验和，再基于更新的校验和，利用RAID 6的校验算法，分别确定写入后的第二校验和校验值对中的P盘的SetPOC和Q盘的SetPOC。

在框606，基于写入后的第二校验和校验值对以及第一校验和校验值对，更新第三校验和校验值对，以用于存储到行奇偶校验盘和对角校验盘，第一校验和校验值对与RAID的宽度相匹配。在一些实施例中，在计算出第三校验和校验值对之后，在用户数据被写入RAID的数据盘的同时，将计算好的第三校验和校验值对写入RAID的校验盘。

在一些实施例中，在用于RAID的数据管理方法200中还包括用于进一步向RAID的部分条带写入数据的方法。图7示出了根据本公开的实施例的用于RAID的部分条带数据写入方法700的流程图。方法700还可以包括未示出的附加动作和/或可以省略所示出的动作，本公开的范围在此方面不受限制。

在框702，响应于确定向RAID的写入是针对部分条带进行写入，获取写入前的第三校验和校验值对。在一些实施例中，当RAID的写入类型为是针对部分条带写入时，并非所有数据盘都被会被涉及。因此需要从P盘和Q盘读取所存储的写入前的第三校验和校验值对，并根据更新数据来更新第三校验和校验值对。

在框704，基于写入前的第三校验和校验值对以及第一校验和校验值对，确定写入前的第二校验和校验值对，第一校验和校验值对与所述RAID的宽度相匹配。在一些实施例中，对所获取的第三校验和校验值对以及第一校验和校验值对执行异或运算，以获得写入前的第二校验和校验值。

在框706，基于新的数据盘的校验和以及写入前的第二校验和校验值对，确定更新的第二校验和校验值对。在一些实施例中，基于写入前的校验和、写入前的第二校验和校验值对和新的数据盘的校验和，确定更新的第二校验和校验值对。

在框708，基于更新的第二校验和校验值对以及第一校验和校验值对，更新所述第三校验和校验值对，以用于存储到所述行奇偶校验盘和所述对角校验盘。在一些实施例中，对第一校验和校验值对和经更新的第二校验和校验值对执行异或运算，以得到更新后的第三校验和校验值对，然后将更新后的第三校验和校验值对存储到RAID的P盘和Q盘。

图8示意性示出了适于用来实现本公开实施例的电子设备800的框图。设备800可以用于实现执行图2、4-6所示的方法200、400、500、600、700的系统。如图8所示，设备800包括中央处理单元(CPU)801，其可以根据存储在只读存储器(ROM)802中的计算机程序指令或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序指令，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。CPU 801、ROM802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理单元801执行上文所描述的各个方法和处理，例如执行用于独立冗余磁盘阵列的数据管理方法200、用于RAID中失效数据盘的恢复方法400、用于RAID中失效校验盘的恢复方法500、用于向RAID整条带写入数据的方法600、用于向RAID部分条带写入数据的方法700。例如，在一些实施例中，方法200、400、500、600、700可被实现为计算机软件程序，其被存储于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由CPU 801执行时，可以执行上文描述的方法200、400、500、600、700的一个或多个操作。备选地，在其他实施例中，CPU 801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行方法200、400、500、600、700的一个或多个动作。

需要进一步说明的是，本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，该编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，该模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

以上该仅为本公开的可选实施例，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等效替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种用于独立冗余磁盘阵列RAID的数据管理方法，包括：

获取第一校验值对，所述第一校验值对是基于所述RAID中的数据盘的用户数据为预定值时的第一校验和而被确定的，其中获取所述第一校验值对包括：

对所述第一校验和执行异或运算，以得到所述第一校验值对的行奇偶校验值；以及

对所述RAID中的所述数据盘的所述用户数据中的所述预定值的对角数据块执行包括异或运算的对角奇偶校验运算，以得到所述第一校验值对的对角奇偶校验值；

基于所述RAID中的所述数据盘的当前校验和，确定所述RAID的第二校验值对，其中确定所述RAID的所述第二校验值对包括：

对所述RAID中的所述数据盘的所述当前校验和执行异或运算，以得到所述第二校验值对的行奇偶校验值；以及

对所述RAID中的所述数据盘的当前用户数据中的对角数据块执行包括异或运算的对角奇偶校验运算，以得到所述第二校验值对的对角奇偶校验值；以及

基于所述第一校验值对以及所述第二校验值对，至少部分地通过以下方式确定第三校验值对以用于更新所述RAID的校验盘的校验数据：对所述第一校验值对和所述第二校验值对执行异或运算以获得所述第三校验值对。

2.根据权利要求1所述的方法，还包括：

将所述第三校验值对的行奇偶校验值和对角奇偶校验值分别存储在所述RAID的行奇偶校验盘和对角奇偶校验盘。

3.根据权利要求1所述的方法，其中所述第一校验值对的所述对角奇偶校验值对于不同宽度的RAID是不同的。

4.根据权利要求1所述的方法，还包括：

响应于检测到所述RAID中存在失效数据盘，获取所述RAID中未失效数据盘的校验和；

获取失效前的第三校验值对；

基于失效前获取的所述第三校验值对以及所述第一校验值对，确定失效前的第二校验值对；以及

基于响应于检测到所述RAID中存在失效数据盘而获取的所述RAID中的所述未失效数据盘的所述校验和以及所述失效前确定的所述第二校验值对，恢复失效的所述数据盘的校验和。

5.根据权利要求1所述的方法，还包括：

响应于检测到所述RAID中的校验盘失效，基于所述RAID中各数据盘的当前校验和，确定失效前的第二校验值对；

基于失效前确定的所述第二校验值对以及所述第一校验值对，确定失效前的第三校验值对，所述第一校验值对与所述RAID的宽度相匹配；以及

存储所确定的所述失效前的第三校验值对，以用于重构后的校验盘的校验值对。

6.根据权利要求2所述的方法，还包括：

响应于检测到向所述RAID的写入，确定所述写入是针对整个条带进行写入还是针对部分条带进行写入；

响应于确定所述写入是针对所述整个条带进行写入，获取写入后的第二校验值对；以及

基于所述写入后的第二校验值对以及所述第一校验值对，更新所述第三校验值对，以用于存储到所述行奇偶校验盘和所述对角奇偶校验盘，所述第一校验值对与所述RAID的宽度相匹配。

7.根据权利要求2所述的方法，还包括：

响应于确定向所述RAID的写入是针对部分条带进行写入，获取写入前的第三校验值对；

基于响应于确定向所述RAID的写入是针对部分条带进行写入而获取的所述写入前的所述第三校验值对以及所述第一校验值对，确定写入前的第二校验值对，所述第一校验值对与所述RAID的宽度相匹配；

基于新的数据盘的校验和以及写入前确定的第二校验值对，确定更新的第二校验值对；以及

基于所述更新的第二校验值对以及所述第一校验值对，更新所述第三校验值对，以用于存储到所述行奇偶校验盘和所述对角奇偶校验盘。

8.一种用于独立冗余磁盘阵列RAID的数据管理设备，包括：

存储器，被配置为存储一个或多个程序；

处理单元，耦合至所述存储器并且被配置为执行所述一个或多个程序使所述管理设备执行多个动作，所述动作包括：

获取第一校验值对，所述第一校验值对是基于所述RAID中的数据盘的用户数据为预定值时的第一校验和而被确定的，其中

获取所述第一校验值对包括：

9.根据权利要求8所述的设备，所述动作还包括：

10.根据权利要求8所述的设备，其中所述第一校验值对的所述对角奇偶校验值对于不同宽度的RAID是不同的。

11.根据权利要求8所述的设备，所述动作还包括：

获取失效前的第三校验值对；

12.根据权利要求8所述的设备，所述动作还包括：

13.根据权利要求9所述的设备，所述动作还包括：

14.根据权利要求9所述的设备，所述动作还包括：

15.一种非瞬态计算机可读介质，其存储机器可执行指令，所述机器可执行指令在被执行时使机器执行根据权利要求1-7中任一项所述的方法的步骤。