CN108228086B

CN108228086B - Raid重建的方法和设备

Info

Publication number: CN108228086B
Application number: CN201611194062.6A
Authority: CN
Inventors: 高健; 韩耕; 董继炳; 杨利锋; 徐鑫磊
Original assignee: EMC IP Holding Co LLC
Current assignee: EMC Corp
Priority date: 2016-12-21
Filing date: 2016-12-21
Publication date: 2021-07-16
Anticipated expiration: 2036-12-21
Also published as: CN113407122A; US10592366B2; US20200210298A1; US20180210799A1; US11099955B2; CN108228086A; CN113407122B

Abstract

本公开的实施例提供了RAID重建的方法和设备。在一些实施例中，提供了一种由计算机实现的方法。该方法包括：从存储池的至少一个独立盘冗余阵列(RAID)组包含的多个盘中，确定具有预备容量的预备RAID组；从所述预备RAID组建立预备逻辑单元；以及响应于所述存储池中的所述至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘。

Description

RAID重建的方法和设备

技术领域

本公开的实施例总体涉及数据存储，更具体地，涉及独立盘冗余阵列(RAID)的重建方法。

背景技术

独立盘冗余阵列(RAID)是一种数据存储虚拟化技术，其出于数据冗余备份和/或性能改进的目的将多个物理盘驱动器组合成单个逻辑单元。以RAID5为例，其可以由具有分布式校验信息的块级别条带构成。当单个盘发生故障时，后续的读取能够通过分布式校验信息来计算，使得没有数据被丢失。同时，预备盘将被选择以替代故障盘，并且故障盘上的所有数据将被重建并被写入到预备盘上。在传统RAID中，RAID组(RG)将消耗掉该组内的所有盘空间，这将对故障重建的效果和代价带来不利影响。

发明内容

本公开的实施例旨在提供一种改进RAID重建性能的方案。

在本公开的一个方面，提供了一种由计算机执行的方法。该方法包括从存储池的至少一个RAID组包含的多个盘中，确定具有预备容量的预备RAID组；从所述预备RAID组建立预备逻辑单元；以及响应于所述存储池中的所述至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘。

在一些实施例中，确定具有预备容量的预备RAID组包括：基于在所述存储池中的所述盘的数量与预备盘的数量的对应关系，确定所述多个盘中的预备容量的分配。

在一些实施例中，从所述预备RAID组建立预备逻辑单元包括：根据所述预备容量的大小，确定从所述预备RAID组所建立的预备逻辑单元的个数。

在一些实施例中，利用所述预备逻辑单元重建所述降级的RAID组中故障的盘包括：检测所述预备逻辑单元是否可用；响应于所述预备逻辑单元是可用的，将所述预备逻辑单元指派给在所述降级的RAID组；以及响应于所述降级的RAID组启动重建动作，将所述故障盘中的数据写入所述预备逻辑单元中。

在一些实施例中，该方法还包括：在所述故障盘被更换之后，释放所述预备逻辑单元。

在一些实施例中，释放所述预备逻辑单元包括：响应于所述故障盘的更换，将写入到所述预备逻辑单元中的所述故障的盘的数据写回更换后的盘中；将所述预备逻辑单元从所述降级的RAID组中移除；以及将所述更换后的盘添加到所述降级的RAID组中。

在本公开的第二方面，提供了一种由计算机实现的设备。该设备包括至少一个处理单元；以及至少一个存储器。至少一个存储器耦合至至少一个处理单元并且在其上存储指令，指令在由所述至少一个处理单元执行时执行包括以下各项的动作：从存储池的至少一个独立盘冗余阵列(RAID)组包含的多个盘中，确定具有预备容量的预备RAID组；从所述预备RAID组建立预备逻辑单元；以及响应于所述存储池中的所述至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘。

在本公开的第三方面，提供了一种计算机程序产品，其被有形地存储在非瞬态计算机可读介质上并且包括计算机可读程序指令，当所述计算机可读程序指令在设备上被执行时使得所述设备执行根据以上第一方面所描述的方法的步骤。

与现有技术相比，本公开的实施例能够显著改进传统RAID的重建性能。此外，由于取消了存储池中的专用预备盘，使得在存储池中的所有盘都能够用于用户IO，这进一步提高了盘的有效率。使用RAID-X0类型的RAID组管理分布式的预备盘空间，这能够在重建期间将写入IO分布给在存储池中的所有盘。本公开的实施例的重建方法能够基于传统的RAID技术来实施。

提供发明内容部分是为了简化的形式来介绍对概念的选择，它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开内容的关键特征或主要特征，也无意限制本公开内容的范围。

附图说明

通过参考附图阅读下文的详细描述，本公开的实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例而非限制性的方式示出了本公开的若干实施例，其中：

图1示出了传统RAID的重建的示意图；

图2示出了传统RAID的用于重建的内部行为的示意图；

图3示出了根据本发明的实施例的具有多个RAID组和专用预备盘的存储池的示意图；

图4示出了根据本公开的实施例的用于RAID的重建方法400的流程图；

图5示出了根据本发明的实施例的具有多个RAID组和分布式预备盘的存储池的示意图；

图6示出了根据本发明的实施例的采用分布式预备盘对RAID的进行重建的示意图；

图7示出了根据本公开的实施例的利用IO生成器对传统RAID的重建过程的模拟的示意图；

图8示出了根据本公开的实施例的利用IO生成器进行分布式重建过程的模拟的示意图；以及

图9示出了可以用来实施本公开的实施例的设备900的示意性框图。

图10示出了根据本公开的实施例的用于RAID重建的设备1000的示例性结构图。

在各个附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

在下文中，将参考附图详细描述本公开的各个示例性实施例。应当注意，这些附图和描述涉及的仅仅是作为示例性的实施例。应该指出的是，根据随后描述，很容易设想出此处公开的结构和方法的替换实施例，并且可以在不脱离本公开要求保护的原理的情况下使用这些替代实施例。

应当理解，给出这些示例性实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。

在此使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语，即“包括/包含但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。

在下文中，将参考附图来详细描述根据本公开的实施例的用于评估RAID的重建性能的方案。出于便于描述的目的，以下以具有4个数据块和1个校验块(4D+1P)的RAID5为例来详细地说明本公开的实施例。然而，应当理解的是，本公开的实施例的原理和方法可以应用于任何级别或布局的RAID而不仅限于以下所列举的示例，并且本公开的保护范围在此方面不受限制。

如上所述，在传统RAID中，RAID组(RG)将消耗掉该组内的所有盘空间。通过发明人的研究发现，传统方案将导致以下问题：首先，如果单个盘发生故障，则用于重建的写输入输出(IO)将针对唯一的预备盘，因此该预备盘的带宽将成为重建性能的瓶颈。主轴盘(spindle)具有不同的读/写IO性能，用于读IO或写IO的带宽也不同。其次，针对相同RG的用户IO将受到严重影响，这些用户IO的响应时间将显著增加，因为RG的IO性能受限于该RG中最慢的盘；并且在重建情况下，处于重建中的盘将限制用户IO性能。再次，RAID组在重建过程中需要特定的用户IO进程，如在该重建过程中出现其他盘的故障就会造成数据丢失。而特定的用户IO进程也会使用户IO性能明显降级。而且，由于盘容量逐年增加，使得上述几个问题被放大，从而对用户造成了更大的数据丢失风险。

图1示出了传统RAID的重建的示意图。传统RAID由具有分布式校验信息的块级别条带构成，校验信息可以被分布在多个盘中。图1示出了RG 110，其是具有4个数据块和1个校验块(4D+1P)的RAID5。如图1中的(1A)所示，RG 110使用了5个盘，分别为盘120₀、盘120₁、盘120₂、盘120₃和盘120₄。此外，RG 110利用盘120₅作为其预备盘。RG 110的每个条带可以包括5个块，该5个块由4个数据块(即，存储D00、D01……DN3的块)和1个校验块(即，存储P0、P1……PN的块)构成。图1中的(1B)示出了RG 110中的一个盘(例如，盘120₂)发生故障。此时，如图1中的(1C)所示，预备盘(例如，盘120₅)将会替代故障盘(即，盘120₂)；并且如图1中的(1D)所示，故障盘(即，盘120₂)上的所有数据将被重建并被写入到预备盘(即，盘120₅)上。

进一步地，图2示出了如图1所示的RG 110的用于重建的内部行为的示意图。用于重建的内部行为可以包括在盘中备份、预读取、异或(XOR)和写回三个步骤。如已经参考图1所描述的，RG 110中的盘120₂发生故障，并且盘120₂上的所有数据将被重建并被写入到盘120₅(即，预备盘)上。例如，如图2中的(2A)所示，此时RG 110将要重建P4之后的块。首先进行的步骤是预读取，如图2中的(2B)所示，RG 110从4个未发生故障的盘中(即，盘120₀、盘120₁、盘120₃和盘120₄)分别读取相同条带中的数据D50、D51、D52和D53；然后进行的步骤是异或，如图2中的(2C)所示，RG 110对读取的数据执行异或操作以得到发生故障的盘中的相应块中存储的数据(例如，D50XOR D51XOR D52XOR D53＝P5)；最后进行的步骤是写回，如图2中的(2D)所示，RG 110将异或操作的结果(例如，P5)写入预备盘的相应块中，以完成对该块的重建。

在一个存储池中，通常串接具有相同的RAID类型和宽度(在RAID组中的盘的数量)，并且具有用于保持在精简型逻辑单元(Thin LUN)地址空间以及非精简型逻辑单元(Thick LUN)地址空间的映射的组成部分，之后在必要时能够启动/分配从Thick LUN切分出Thin LUN。因此，一般地，在同一个存储池中，具有相同的盘技术的RAID组需要具有相同的类型和宽度，而用户需要为每个存储池配置预备盘，或者预备盘能够在存储池中被共享，不管怎样，存储池都需要呈阵列形式的预备盘。图3示出了根据本发明的实施例的具有多个RAID组和专用预备盘的存储池的示意图。如图3所示，在存储池中包括多个RAID组(即，RG310₁，RG310₂，…RG310_N)以及专用的预备盘。该预备盘用于在这个存储池中的RAID组中的一个处于降级的状态时，对该降级的RAID组中的RAID进行重建。然而，如果在存储池中没有出现故障盘的情况下，这样的专用预备盘的配置是浪费客户资源的。

因此，需要实现一种能够行之有效的改进传统RAID的重建性能的方案。图4示出了根据本公开的实施例的用于RAID的重建方法400的流程图。

在401处，从存储池的至少一个RAID组包含的多个盘中，确定具有预备容量的预备RAID组。在某些实施例中，可以基于在所述存储池中的所述盘的数量与预备盘的数量的对应关系，确定所述多个盘中的预备容量的分配。以下将参考图5对方法400进行详细描述，其示出了根据本发明的实施例的具有多个RAID组和分布式预备盘的存储池的示意图。图5示出了存储池，在该存储池中包括多个RAID组，即RG 510₁、RG 510₂…RG 510_N。以RG 510₁为例，其为4D+1P的传统RAID 5，包括盘520₀、盘520₁、盘520₂、盘520₃和盘520₄。可以看出，相较于在图3中示出的实施例，在图5示出的实施例中取消了专用预备盘的配置。相反地，将预备盘分布在存储池的RAID组中的每个盘中。在每个盘中所划分出预备容量的大小，可以取决于盘的数量与预备盘的数量的对应关系，也就是预定的预备盘率。例如，30个盘对应1个预备盘。如果存储池包括少于30的盘，则从包含在存储池中的所有盘中划分出1个盘容量的预备盘。如果存储池包含多于30但少于60的盘，则划分出2个盘容量的预备盘。被划分出的预备盘形成了预备RAID组，即在图5中的预备RG。

需要说明的是，在存储池中的RAID组可以以RAID-X的形式来提供，例如RAID 5(宽度Y)或RAID 6(宽度Z)，这通常是在存储池的初始化阶段由用户预定的。而由从这些RAID组(RAID-X)中划分出的预备盘区段(piece)建立的预备RAID组可以是RAID-X0形式的RAID组(宽度Y/Z)，也就是说，该预备RAID组能够支持所有传统类型的RAID。并且，预备RG(RAID-X0)能跨所有盘地均匀分配IO，其通常能够将IO分配到所有盘并且分配成几千比特的粒度。

另外，尽管在图5所示的实施例中，在存储池的每个RAID组中的每个盘中均划分出了一些容量作为预备盘。然而，也可以仅仅在存储池的一部分RAID组中划分出作为预备盘的容量。例如，可以仅仅使用在存储池中的一个RAID组。图5中的实施例仅仅旨在示例性地示出分布式预备盘的布局，而非作为预备盘的布局的限定。

在420处，从所述预备RAID组建立预备逻辑单元。为此，在某些实施例中，可以根据预备容量的大小，确定从预备RAID组所建立的预备逻辑单元的个数。例如，如果划分出的预备盘容量等于1个盘的容量，则从预备RG中建立一个预备逻辑单元，例如LUN 0，如果划分出的预备盘容量等于2个盘的容量，则从预备RG中建立预备逻辑单元，例如LUN 0和LUN 1，以此类推。例如在图5中示出的，从预备RG中建立预备逻辑单元LUN 0、LUN 1…LUN n。这些预备逻辑单元提供块设备访问接口，其实际上非常类似于物理盘，所需要做的仅仅是在这些预备逻辑单元上添加非常薄的垫片(shim)以将该预备逻辑单元模拟为盘。

在430处，响应于所述存储池中的所述至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘。下面参考图6来描述430处操作的示例实现，其示出了根据本发明的实施例的采用分布式预备盘对RAID的进行重建的示意图。

根据本发明的实施例，可以检测所述预备逻辑单元是否可用。一旦该预备逻辑单元是可用的，将所述预备逻辑单元指派给在所述降级的RAID组。如果降级的RAID组启动重建动作，将故障盘中的数据写入所述预备逻辑单元中。例如，在图6中，RG 510₂中的盘520₆出现故障，使得RG 510₂处于降级状态。在这种情况下，例如可以检测预备逻辑单元LUN 0是否可用。一旦确定预备逻辑单元LUN 0是可用的，可以将其指派给RG 510₂来用于盘520₆的重建。当RG 510₂启动重建时，将盘520₆中的数据写入到LUN 0中。该重建动作仍然包括读动作、异或动作以及写入动作，其与在图2中的过程类似，故在此不再赘述。在图6中，由于预备逻辑单元从预盘RAID(RAID-X0)组建立，因此写入IO可以被分给在存储池中的所有盘。通过这一改变，RAID的重建性能能够被显著的提高。

当在RAID组中的盘出现故障时，客户将接收到用新盘代替旧盘的警报。然而，在实际中，不管配置了多少预备盘的容量，预备逻辑单元的数量也是有限的，因此，在将故障盘中的所有数据重建到预备逻辑单元之后，将对故障盘进行更换。根据本发明的实施例，方法400还可以包括在所述故障盘被更换之后，释放所述预备逻辑单元。

根据本公开的实施例，如果要将故障盘更换掉，则将写入到预备逻辑单元中的故障盘的数据写回更换后的盘中。在写回之后，将该预备逻辑单元从降级的RAID组中移除并且将更换后的盘纳入到降级的RAID组中。例如在图6中，如果插入新的盘来代替故障盘520₆，则需要启动复制过程，即将预备逻辑单元LUN 0上的数据复制到新盘上，以便释放预备逻辑单元LUN 0以用于下次重建。即便这个过程需要较长时间，也不会影响如果在RG510₂中出现第二个盘的损坏，因为这时该预备逻辑单元LUN 0已经具有全部的原始数据。一旦完成了将预备逻辑单元LUN 0复制到新盘，基于预备逻辑单元LUN 0的模拟盘将从RG510₂中被移除，并且新盘将被纳入RG 510₂。

图7根据本公开的实施例的利用IO生成器对传统RAID的重建过程的模拟的示意图，其中示出了RG 110和IO生成器710。如图6所示，RG 110中的盘120₂故障，使得RG 110处于降级状态。IO生成器710向RG 110中的盘120₂发起读请求。由于RG 110处于降级模式，针对RG 110中故障的盘120₂的读请求将会触发RG 110从4个其他盘(即，盘120₀、盘120₁、盘120₃和盘120₄)中分别读取相应的数据，将来自该4个盘的数据进行异或以得到故障的盘中的数据，以及向IO生成器710返回所得到的数据。IO生成器710将所得到的数据写入盘120₅中。

下表中列出了模拟的重建结果与实际的传统RAID重建结果：

表1：模拟的重建结果与实际的传统RAID重建结果

图8示出了根据本公开的实施例的利用IO生成器进行分布式重建过程的模拟的示意图。这里的重建模型属于分布式重建，其中降级的盘能够被重建到多个盘中而不是在传统的RAID重建中的一个专用预备盘。在重建过程中，预读取IO将指向盘的特定子集或一个指派的RAID组，例如在图6示出的那样，所有的预读取IO指向RG 510₂。

在此，模拟过程满足以下条件：

●仅仅存在一个源RAID组，所有的预读取IO都被指向该RAID；多于一个重建目标盘；

●通过增加的IO生成器线程测量并行比例(scaling)；以及

●通过增加的目标盘测量重建率比例。

图8示出了RG 810，其为4D+1P的传统RAID 5，包括盘830₁、830₂……830₄。RG 810作为源RG被用于模拟对如图7所示的RG 710的重建过程，并且所有读请求将针对RG 810。此外，图8还示出了4个预备盘830₅、830₆、830₇和830₈以及4个IO生成器820₀、820₁、820₂和820₃。

首先，RG 810中的盘(例如，盘830₂)故障，因此RG 810处于降级状态。然后，可以经由IO生成器向故障的盘830₂发起读请求。无需将整个RAID组作为每个重建线程的重建目标，因为到目标盘中的每个盘的所有写IO负载彼此相同。例如，可以利用4个IO生成器820₀、820₁、820₂和820₃并行地向盘830₂的25％的数据区域并行地发起读请求，以使得读IO负载与所模拟的映射RG。

接下来，响应于接收到所请求的数据，经由IO生成器向预备盘写入所请求的数据。例如，可以利用4个IO生成器820₀、820₁、820₂和820₃向4个预备盘830₅、830₆、830₇和830₈并行地写入所请求的数据，以使得写IO负载与所模拟的映射RG大致相同。

通过上述模型，例如将目标盘数量增加到8个，和/或将IO生成器线程增加到8个。在该模拟过程中，CPU使用率和内存占用并没有明显的增长。下表中示出了经由上述模型测量的结果：

表2：模拟分布重建结果

由此可见，与传统的RAID重建方法相比，模拟的分布式重建的重建速率被显著地提高了五至六倍。

图9示出了可以用来实施本公开的实施例的设备900的示意性框图。如图所示，设备900包括中央处理单元(CPU)901，其可以根据存储在只读存储器(ROM)902中的计算机程序指令或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序指令，来执行各种适当的动作和处理。在RAM 903中，还可存储设备900操作所需的各种程序和数据。CPU901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

设备900中的多个部件连接至I/O接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的各个过程和处理，例如方法400，可由处理单元901执行。例如，在一些实施例中，方法400可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序被加载到RAM 903并由CPU 901执行时，可以执行上文描述的方法400的一个或多个步骤。

图10示出了根据本公开的实施例的用于RAID重建的设备1000的示例性结构图。装置1000可操作用于执行参照图4所描述的方法400和结合图5和图6所描述的处理和方法以及任何其他的处理和方法。

为此，装置1000包括：确定单元1002，被配置为从存储池的至少一个RAID组包含的多个盘中，确定具有预备容量的预备RAID组；建立单元1004，被配置为从预备RAID组建立预备逻辑单元；以及重建单元1006，被配置为响应于所述存储池中的至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘。

在某些实施例中，确定单元1002还被配置为基于在所述存储池中的所述盘的数量与预备盘的数量的对应关系，确定所述多个盘中的预备容量的分配。在某些实施例中，建立单元1004还被配置为根据所述预备容量的大小，确定从所述预备RAID组所建立的预备逻辑单元的个数。在某些实施例中，重建单元1006还被配置为检测预备逻辑单元是否可用。在预备逻辑单元是可用的情况下，将该预备逻辑单元指派给在降级的RAID组。一旦该降级的RAID组启动重建动作，将故障盘中的数据写入所述预备逻辑单元中。

在某些实施例中，装置1000还包括释放单元，被配置为在故障盘被更换之后，释放预备逻辑单元。该释放单元还被配置为在要将故障盘的更换掉的情况下，则将写入到所述预备逻辑单元中的故障盘的数据写回更换后的盘中。在写回之后，将该预备逻辑单元从降级的RAID组中移除并且将所述更换后的盘添加到所述纳入到降级的RAID组中。

装置1000中所包括的单元可以利用各种方式来实现，包括软件、硬件、固件或其任意组合。在一个实施例中，一个或多个单元可以使用软件和/或固件来实现，例如存储在存储介质上的机器可执行指令。除了机器可执行指令之外或者作为替代，装置1000中的部分或者全部单元可以至少部分地由一个或多个硬件逻辑组件来实现。作为示例而非限制，可以使用的示范类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准品(ASSP)、片上系统(SOC)、复杂可编程逻辑器件(CPLD)，等等。

综上所述，本公开的实施例提供了一种用于改善独立盘冗余阵列的重建性能的方案。与现有技术相比，本公开的实施例能够显著改进传统RAID的重建性能。此外，由于取消了存储池中的专用预备盘，使得在存储池中的所有盘都能够用于用户IO，这进一步提高了盘的有效率。使用RAID-X0类型的RAID组管理分布式的预备盘空间，这能够在重建期间将写入IO分布给在存储池中的所有盘。本公开的实施例的重建方法能够基于传统的RAID技术来实施。

本公开内容可以是方法、设备和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开内容的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开内容操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开内容的各个方面。

这里参照根据本公开内容实施例的方法、装置(设备)和计算机程序产品的流程图和/或框图描述了本公开内容的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开内容的多个实施例的方法、设备和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开内容的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所公开的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进，或者使本技术领域的其它普通技术人员能理解本文公开的各实施例。

Claims

1.一种由计算机执行的方法，包括：

从存储池的至少一个独立盘冗余阵列(RAID)组包含的多个盘中，确定具有预备容量的预备RAID组；

从所述预备RAID组建立预备逻辑单元；

响应于所述存储池中的所述至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘；

其中所述预备逻辑单元跨所述存储池中的多个目标盘分布，并且其中重建所述故障盘包括：

向所述多个目标盘分配相应的I/O生成器；

由每个I/O生成器从处于所述降级状态的所述RAID组中读取所述故障盘的相应的数据；以及

由每个I/O生成器将所述相应的数据写入到所述相应的I/O生成器被分配到的所述目标盘，

其中每个I/O生成器在相应的线程中运行，其中由每个I/O生成器写入所述数据包括并行地运行所述I/O生成器线程以并行地向所述相应的目标盘有效写入，所述多个目标盘包括N个目标盘，所述故障盘具有数据区域，并且其中由每个I/O生成器从所述故障盘读取所述相应的数据包括每个I/O生成器读取大致1/N的数据。

2.根据权利要求1所述方法，其中确定具有预备容量的预备RAID组包括：

基于在所述存储池中的所述盘的数量与预备盘的数量的对应关系，确定所述多个盘中的预备容量的分配。

3.根据权利要求1所述方法，其中从所述预备RAID组建立预备逻辑单元包括：

根据所述预备容量的大小，确定从所述预备RAID组所建立的预备逻辑单元的个数。

4.根据权利要求1所述的方法，其中利用所述预备逻辑单元重建所述降级的RAID组中故障的盘包括：

检测所述预备逻辑单元是否可用；

响应于所述预备逻辑单元是可用的，将所述预备逻辑单元指派给在所述降级的RAID组；

响应于所述降级的RAID组启动重建动作，将所述故障盘中的数据写入所述预备逻辑单元中。

5.根据权利要求1所述的方法，还包括：

在所述故障盘被更换之后，释放所述预备逻辑单元。

6.根据权利要求5所述的方法，其中释放所述预备逻辑单元包括：

响应于所述故障盘的更换，将写入到所述预备逻辑单元中的所述故障的盘的数据写回更换后的盘中；

将所述预备逻辑单元从所述降级的RAID组中移除；以及

将所述更换后的盘添加到所述降级的RAID组中。

7.一种由计算机实现的设备，包括：

至少一个处理单元；以及

至少一个存储器，所述至少一个存储器耦合至所述至少一个处理单元并且在其上存储指令，所述指令在由所述至少一个处理单元执行时执行包括以下各项的动作：

从所述预备RAID组建立预备逻辑单元；

响应于所述存储池中的所述至少一个RAID组中的一个处于降级状态，利用所述预备逻辑单元重建降级的RAID组中的故障盘；其中所述预备逻辑单元跨所述存储池中的多个目标盘分布，并且其中重建所述故障盘包括：

向所述多个目标盘分配相应的I/O生成器；

8.根据权利要求7所述的设备，其中确定具有预备容量的预备RAID组包括：

9.根据权利要求7所述的设备，其中从所述预备RAID组建立预备逻辑单元包括：

10.根据权利要求7所述的设备，其中利用所述预备逻辑单元重建降级的RAID组中的故障的盘包括：

检测所述预备逻辑单元是否可用；

11.根据权利要求7所述的设备，其中所述动作还包括：

在所述故障盘被更换之后，释放所述预备逻辑单元。

12.根据权利要求11所述的设备，其中释放所述预备逻辑单元包括：

将所述预备逻辑单元从所述降级的RAID组中移除；以及

将所述更换后的盘添加到所述降级的RAID组中。

13.一种计算机可读介质，存储有计算机可读程序指令，当所述计算机可读程序指令在设备上被执行时使得所述设备执行根据权利要求1-6中任一项所述的方法。