WO2014094572A1

WO2014094572A1 - 一种Raid5阵列读IO失败的修复方法和装置

Info

Publication number: WO2014094572A1
Application number: PCT/CN2013/089373
Authority: WO
Inventors: 成浩; 丁强
Original assignee: 浙江宇视科技有限公司
Priority date: 2012-12-17
Filing date: 2013-12-13
Publication date: 2014-06-26
Also published as: CN102981921A

Abstract

一种RAID5阵列读IO失败的修复方法，该方法应用于降级的RAID5阵列，包括：将失败的读IO置于失败修复线程队列；针对失败修复线程队列中失败读IO，构造内容为无效数据的写IO并执行写IO操作，写IO的起始位置、大小与失败读IO相同；写IO成功后在失败读IO数据缓存中写入无效数据，返回读IO成功。本方法实现了对降级模式RAID5阵列的录像数据区的读错误的即时修复。

Description

一种 Raid5阵列读 IO失败的修复方法和装置技术领域本发明涉及存储阵列技术，尤其涉及 Raid 5阵列读 10失败的修复方法和装置。背景技术

传统的 RAID5阵列在降级模式（阵列的单个磁盘损坏）下，由于条带不再具有数据冗余保护的能力，磁盘读错误的容错机制较弱，因而会出现如下问题：如果在阵列重建过程中，重建流程对某个磁盘发生读错误、或者外部获取存储数据的业务对磁盘发生读错误，会造成磁盘从阵列中踢出、重建中止、阵列不可用等问题；如果处于降级状态的阵列因为系统缺乏热备盘等客观原因而尚未进入重建状态，此时外部业务对某个磁盘发生读错误，也将造成该磁盘从阵列中踢出、阵列不可用的问题。

RAID5 阵列在监控存储的实际应用中，如果出现上述问题，大量的数据存储业务将会终端，对用户来说是难以接受的。发明内容

有鉴于此，本发明的目的是提供一种 Raid5阵列读 10失败的修复方法和装置。

为实现上述目的，本发明提供技术方案如下：

一种 Raid5阵列读 10失败的爹复方法，该方法应用于降级的 Raid5阵列，该方法包括： A、将失败的读 10置于失败修复线程队列； B、针对失败修复线程队列中所述失败的读 10, 构造内容为无效数据的写 10并执行该写 10操作，该写 10的起始位置、大小与所述失败的读 10相同； C、该写 10 成功后在所述失败的读 10的数据緩存中写入所述无效数据，返回该读 10成功。

优选地，在步骤 B之前进一步包括：步骤 D1、判断失败的读 10读取的是否为索引区，如果是，则返回读 10失败，如果否，则执行步骤 B。

优选地，步骤 C进一步包括：如果所述写 10失败，则返回所述读 10失败。

优选地，在步骤 D1之前进一步包括：步骤 D2、给所述失败的读 10设置标志，用以表示该读 10经过失败修复处理；在步骤 A之前进一步包括：步骤 D3、判断所述失败的读 10是否设置有经过失败修复处理的标志，如果没有，执行步骤 A; 如果有，则进入 Raid 5阵列正常处理流程。

优选地，该步骤 D3进一步包括在所述失败的读 10没有设置经过失败修复处理标志的情况下判断所述读 10 失败是否由扇区损坏导致，如果是，执行步骤 A; 如果否，进入 Raid 5阵列正常处理流程。

基于相同的构思，本发明还提供了一种 Raid5 阵列读 10失败的修复装置，该装置应用于降级的 Raid5阵列，该装置包括：修复准备模块和修复执行模块。

修复准备模块，用于将失败的读 10置于失败修复线程队列；

修复执行模块，用于针对失败修复线程队列中所述失败的读 10, 构造内容为无效数据的写 10并执行该写 10操作，该写 10的起始位置、大小与所述失败的读 10相同；该写 10成功后在所述失败的读 10的数据緩存中写入所述无效数据，返回该读 10成功。

该修复准备模块进一步用于对失败修复线程队列中的失败的读 10进行判断，判断其读取的是否为索引区，如果是，不执行修复处理，如果否，由修复执行模块执行修复处理。

该修复执行模块在所述写 10失败时返回所述读 10失败。

该修复准备模块还用于对失败修复线程队列中的失败的读 10 设置标志，用以表示该读 10经过失败爹复处理；

该修复准备模块在将失败的读 10 置于失败修复线程队列前，判断所述失败的读 10是否设置有经过失败修复处理的标志，如果没有，将该失败的读 10置于失败修复线程队列；如果有，则进入 Raid 5阵列正常处理流程。

该修复准备模块进一步用于在所述失败的读 10 没有设置经过失败修复处理标志的情况下判断所述读 10 失败是否由扇区损坏导致，如果是，将该失败的读 10置于失败修复线程队列；如果否，进入 Raid 5阵列正常处理流程。与现有技术相比，本发明实现了对降级模式 RAID5 阵列的录像数据区读错误的即时修复机制。附图说明图 1是本发明实施例的流程图。

图 2是本发明实施例的另一流程图。

图 3是本发明实施例的第三流程图。

图 4是本发明装置的逻辑结构图。具体实施方式仔细研究监控业务的特点可以发现对于监控的存储业务来说，磁盘出现少量坏扇区的情况下，丢失一部分老的视频录像数据是可以接受的，因为视频监控数据虽然是海量的，但有很多视频信息其实是重复无用的，比如某个摄像头采集到的画面可能数个小时没有变化，或者变化很少。磁盘出现少量坏扇区但是在磁盘仍旧可以正常使用的情况下，需要采用即时有效的错误处理机制，避免这种情况下的磁盘从阵列中踢出、重建中止、阵列不可用等问题，保证新的录像数据可以正常存储到阵列中。为此，本发明提出了一种用于降级 Raid5阵列的读 10失败爹复方法，该方法包括以下步骤：步骤 A、将失败的读 10置于错误修复线程队列；

步骤 B、针对错误修复线程队列中所述失败的读 10, 构造内容为无效数据的写 10并执行该写 10, 该写 10的起始逻辑地址、长度与所述失败的读 10 相同；

步骤 C、在所述失败的读 10 的数据緩存中写入所述无效数据，返回该读 10成功的信息。

处于降级状态的 Raid阵列，当发生读 10失败时，将不立即反馈读失败信息，而是针对读 10所指向的逻辑地址构造新的写 10命令，该新的写 10 命令利用磁盘配备的坏扇区重分配机制 /磁盘坏块重映射机制，将无效数据写入到逻辑地址和上述读 10对应的逻辑地址一致，但物理空间和上述读 10 对应的物理空间不一致的扇区上。并且构造的该无效数据作为实际读到的数据写入读緩存中。这样从处理流程上来看，本次读 10操作是成功的，虽然读到的数据本身和真实的数据不一致的（扇区的损坏导致真实数据丢失了）。但是读 10操作的成功解决使得坏扇区所在磁盘不会被从阵列中踢出、阵列不会不可用，如果在重建的话，重建也不会中止。

以下进一步结合附图详细描述实施例。

参图 1 , 降级模式的 RAID5阵列出现读失败 10, 将该读失败 10挂入错误修复线程的 10队列。

511、判断该读 10失败是否是扇区损坏导致；且该读失败 10没有经过失败修复处理。

512、如果是，则将该失败的读 10挂入错误修复线程的 10队列，以进行失败爹复。

513、如果否，按照 RAID5现有的处理流程进行后续处理。

参见图 2, 错误修复线程对读失败 10的修复流程。

521、取出所述错误修复线程 10队列中的读失败 10。

522、给该读失败 10置上失败修复处理的标志位。 523、判断该读失败 10读取的条带是否为索引区。

524、如果是索引区，返回读失败 10 , 结束对该读失败 10 的失败爹复。

525、如果不是索引区，构造写 10, 该写 10 的起始地址、长度与该读失败 10相同，该写 10的内容为全 0。

参见图 3 , 图 3为修复写 10的响应流程。

531、判断修复写 10是否写成功。

532、如果写成功，将上述读失败 10的数据緩存进行清 0, 返回读成功信息。

533、如果没有写成功，以读失败的方式进行返回。

图 1〜图 3的处理流程展示了对一个读失败 10的修复流程。针对一个降级的 RAID5阵列，当出现读 10失败的时候，不立即反馈读 10失败使得磁盘被踢出、重建被中止，而是针对该失败的读 10进行修复处理。读 10失败有多种原因，其中磁盘的扇区损坏是一种读 10 失败的原因。本发明主要是针对该原因导致的读 10 失败进行修复处理。当由于坏扇区导致读 10 失败时，会反馈扇区损坏的错误码，据此就可以判断是由于扇区损坏导致读 10 失败的。在这种情况下，就可以对该读失败 10 进行修复了。先将该读失败 10挂入失败修复线程队列中，唤醒对该读 10的修复处理。由于在修复处理的过程中会存在修复不成功的情况，在修复不成功时仍然返回读 10 失败，但是该失败的读 10 已经经过修复处理了，所以无需再一次进行修复处理，否则就进入死循环了。所以在将读失败 10 挂入失败修复线程队列中之前还需判断该读 10 失败是否已经经过失败修复处理，如果没有再将其置入失败修复线程队列中，如果已经经过失败修复了，那么就只能按照现有 Raid 阵列的处理流程进行处理了，如进行踢盘、中止重建等。

对于失败修复线程队列中的读失败 10 , 在对其执行进一步修复处理前，给它置上经过失败修复处理的标志位，因为后续的进一步修复处理可能会发生修复失败的状况。设置上述标志位后，对该失败读 10读取的存储区域进行判断：是数据区还是索引区，如果是索引区将不再执行进一步的修复处理，认为修复失败，直接返回上述读 10 为失败的响应。如果是数据区的话，继续执行修复流程：构造写 10 (可以称为修复写 10 ) , 起始地址、长度与该读失败 10相同，数据内容为全 0。之所以判断读取的是索引区还是数据区，主要原因在于：索引区损坏将导致单个或者多个磁盘的所有监控录像无法使用。如果采用将写入无效数据到索引区的修复方案，还是会导致上述问题。由于磁盘具有坏扇区重分配机制，有的存储设备还支持自身的磁盘坏块重映射机制，所以在执行对某一逻辑地址的写 10 时，在该逻辑地址当前对应的扇区损坏时会自动分配新的扇区与该逻辑地址对应，该写 10 实际将对新分配的扇区执行写操作。写入的内容属于无效数据，可以是全 0 的数据，也可以是其它数据。上述构造的写 10 在执行的时候，一般情况下都会成功，但是不排除一些其它导致失败的情况。如果没有写成功，说明针对上述读 10的修复就失败了，返回读 10失败。如果写成功了，表明针对上述读 10 的修复成功了，返回读 10 成功。坏的扇区就自动被从存储业务中隔离了，并且是即时的隔离（后续针对原先坏扇区的读 10或者写 10就变成了对上述新分配扇区的读写操作）。修复成功后，还需要在该读 10 的数据緩存中写入构造的无效数据，比如全 0。执行上述写 10的目的并不是要真正写入数据，只是为了隔离坏扇区，使得原本失败的读 10 能成功而不至于产生踢盘等后果，达到所谓的修复目的。虽然损坏扇区中的数据确实已经丢失了，但是少量存储数据的丢失有的时候并不会对实际的业务产生影响，比如视频存储业务。

执行了无效数据写 10 的条带，需要通过后续机制更新条带校验和与数据的一致性：如果该读 10是外部业务所引发的，并且该读 10所针对的条带已经完成了重建，则需要重新计算条带校验和，并将新校验和写入磁盘。如果读 10是外部业务引发的，并且该读 10所针对的条带还没有开始重建，则在后续的重建过程中自然会恢复条带校验和与数据的一致性。如果该读 10 是重建所引发的，则直接利用该无效数据和其它条带的数据计算校验和写入磁盘，保证检验和与数据的一致性。

基于相同的构思，本发明还提供了一种 Raid5 阵列读 10失败的修复装置。该装置应用于降级的 Raid5阵列，该装置包括：修复准备模块和修复执行模块。通常该 Raid5阵列读 10失败修复装置由计算机程序实现，其修复准备模块和修复执行模块存储于内存中，指令 CPU执行处理。

修复准备模块，用于将失败的读 10置于失败修复线程队列；

该修复执行模块在所述写 10失败时返回所述读 10失败。

该修复准备模块在将失败的读 10 置于失败修复线程队列前，判断所述失败的读 10是否设置有经过失败修复处理的标志，如果没有，将该失败的读 10置于失败修复线程队列；如果有，则进入 Raid 5阵列正常处理流程。该修复准备模块进一步用于在所述失败的读 10 没有设置经过失败修复处理标志的情况下判断所述读 10 失败是否由扇区损坏导致，如果是，将该失败的读 10置于失败修复线程队列；如果否，进入 Raid 5阵列正常处理流程。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

权利要求书

1、一种 Raid5阵列读 10失败的修复方法，该方法应用于降级的 Raid5 阵列，其特征在于，该方法包括：

A、将失败的读 10置于失败修复线程队列；

B、针对失败修复线程队列中所述失败的读 10, 构造内容为无效数据的写 10并执行该写 10操作，该写 10的起始逻辑地址、长度与所述失败的读 10相同；

C、该写 10 成功后在所述失败的读 10 的数据緩存中写入所述无效数据，返回该读 10成功。

2、如权利要求 1 所述的方法，其特征在于，在步骤 B 之前进一步包括：步骤 D1、判断失败的读 10读取的是否为索引区，如果是，则返回读 10 失败，如果否，则执行步骤 B。

3、如权利要求 2所述的方法，其特征在于，步骤 C进一步包括：如果所述写 10失败，则返回所述读 10失败。

4、如权利要求 3 所述的方法，其特征在于，在步骤 D1 之前进一步包括：

步骤 D2、给所述失败的读 10设置标志，用以表示该读 10经过失败修复处理；

在步骤 A之前进一步包括：

步骤 D3、判断所述失败的读 10是否设置有经过失败修复处理的标志，如果没有，执行步骤 A; 如果有，则进入 Raid 5阵列正常处理流程。

5、如权利要求 4所述的方法，其特征在于，所述步骤 D3进一步包括在所述失败的读 10没有设置经过失败修复处理标志的情况下判断所述读 10失败是否由扇区损坏导致，如果是，执行步骤 A; 如果否，进入 Raid 5阵列正常处理流程。

6、一种 Raid5阵列读 10失败的修复装置，该装置应用于降级的 Raid5 阵列，其特征在于，该装置包括：

修复准备模块，用于将失败的读 10置于失败修复线程队列；

修复执行模块，用于针对失败修复线程队列中所述失败的读 10, 构造内容为无效数据的写 10并执行该写 10操作，该写 10的起始逻辑地址、长度与所述失败的读 10相同；该写 10成功后在所述失败的读 10的数据緩存中写入所述无效数据，返回该读 10成功。

7、如权利要求 6 所述的装置，其特征在于，所述修复准备模块进一步用于对失败修复线程队列中的失败的读 10 进行判断，判断其读取的是否为索引区，如果是，不执行修复处理，如果否，由修复执行模块执行修复处理。

8、如权利要求 7所述的装置，其特征在于，修复执行模块在所述写 10 失败时返回所述读 10失败。

9、如权利要求 8 所述的装置，其特征在于，修复准备模块还用于对失败修复线程队列中的失败的读 10设置标志，用以表示该读 10经过失败修复处理；

10、如权利要求 9所述的装置，其特征在于，所述修复准备模块进一步用于在所述失败的读 10 没有设置经过失败修复处理标志的情况下判断所述读 10失败是否由扇区损坏导致，如果是，将该失败的读 10置于失败修复线程队列；如果否，进入 Raid 5阵列正常处理流程。