WO2015018065A1

WO2015018065A1 - 一种文件处理方法、装置及存储设备

Info

Publication number: WO2015018065A1
Application number: PCT/CN2013/081182
Authority: WO
Inventors: 孔晗; 王静
Original assignee: 华为技术有限公司
Priority date: 2013-08-09
Filing date: 2013-08-09
Publication date: 2015-02-12
Also published as: US9483194B2; US9417806B2; CA2881618C; AU2013392019A1; AU2013392019B2; KR20150034139A; CN103733175B; CN103733175A; JP6069742B2; EP3026546A1; US20150234614A1; CA2881618A1; US20150100729A1; EP3026546A4; JP2015528973A; KR101677473B1

Abstract

本发明实施例提供了一种文件处理方法、装置和存储设备。在该方法中，存储设备通过将接收的F个文件划分为多个数据块，并根据所述多个数据块获得T行的第一矩阵。属于同一个文件的数据块位于所述第一矩阵的同一行中。存储设备再将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入独立磁盘冗余阵列（Redundant Array of Independent Disks，RAID）中。通过该文件处理方法，存储设备能够确保文件存储的安全性的基础上将同一个文件写入RAID的一个存储器中，并能在读取文件时，达到了较好的节能效果。

Description

一种文件处理方法、装置及存殳备技术领域

[0001] 本发明涉及通信技术领域，尤其涉及一种文件处理方法、装置及存储设备。背景技术

[0002] 独立磁盘冗余阵列（Redundant Array of Independent Di sks , RAID ), 又称廉价磁盘冗余阵列（Redundant Array of Inexpens ive Di sks , RAID ), 简称硬盘阵列。 RAID 的原理是通过将多个相对便宜的硬盘组合起来，成为一个硬盘阵列组，使性能达到甚至超过一个价格昂贵、容量巨大的硬盘，并且配合数据分散排列的设计，提升数据的安全性。根据选择的版本不同， RAID 与单颗硬盘相比，不仅能够增大存储容量，还能够增强数据集成度以及数据的容错能力。另外，磁盘阵列对于电脑来说，看起来就像一个单独的硬盘或逻辑存储单元。

[0003] 在归档的场景下，由于需要归档的文件很多。现有技术中通常釆用 RAID来存储归档的文件，且为了提升数据的安全性，通常釆用带校验功能的 RAID 来存储归档的文件，例如： RAID3、 RAID4、 RAID5或 RAID6等形式。现有技术中为了提升数据访问速度，通常将一个文件分割成若干数据块，将属于同一个文件的多个数据块与校验块一起组成 RA I D的一个分条（s t r i pe)写入构建 RA I D的多个磁盘中。由于归档的文件被访问的频率较低，因此，为了达到节能的目的，将文件归档后，通常会将存储系统中的磁盘处于休眠或下电状态，在需要访问某个归档的文件时，才对存储该文件的数据块的多个磁盘进行唤醒或上电操作，以读取文件。发明内容

[0004] 本发明实施例中提供的一种文件处理方法、装置及存储设备，能够在确保文件存储的安全性的同时将同一个文件存储于 RAID的一个存储器中，并能够达到节能效果。 [0005] 第一方面，本发明实施例提供一种文件处理方法，包括：

接收待存储于独立磁盘冗余阵列（Redundant Array of Independent Di sks , RAID )中的 F个文件，所述 RAID由 T个存储器组成， F为不小于 2的自然数， Τ为不小于 3的自然数；

将所述 F个文件按照 RA I D的条带大小划分成至少两个数据块；

根据所述至少两个数据块获得 Τ行的第一矩阵，其中，属于同一个文件的数据块位于所述第一矩阵的同一行中；

将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 Τ个存储器中。。

[0006] 在第一方面的第一种可能的实现方式中，所述根据所述至少两个数据块获得 τ行的第一矩阵包括：

将切分后获得的至少两个数据块排列为 D行的第二矩阵，其中，属于同一个文件的数据块位于所述第二矩阵的同一行中，所述 D为所述 RAID中的数据存储器的数量；

分别在所述第二矩阵的每一列中插入校验块，获得所述 T行的第一矩阵，其中，所述插入的校验块是根据所述第一矩阵中校验块所在列的数据块计算获得的。

[0007] 结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，当所述 RAID中包括独立校验存储器时，所述分别在所述第二矩阵的每一列中插入校验块，获得所述 T行的第一矩阵包括：

根据所述 R A I D中独立校验存储器的位置确定在所述第二矩阵中插入校验块的位置；

根据所述 RA I D的校验算法分别对所述第二矩阵中每一列的数据块进行校验计算，获得每一列数据块的校验块；

根据确定的校验块的位置在第二矩阵的每一列中插入根据该列数据块计算的校验块，获得所述 T行的第一矩阵。

[0008] 结合第一方面的第一种可能的实现方式，在第三种可能的实现方式中，所述 RAID中不包括独立校验存储器时，所述分别在所述第二矩阵的每一列中插入校验块，获得 T行的第一矩阵包括：

确定在所述第二矩阵的各列中插入校验块的位置 A [ X , y] ,其中，所述第二矩阵具有 N列， x和 y均为整数， X的取值由 0递增到 D-l , y的取值由 0递增到 N-1 ; 将所述第二矩阵的 X行中 y列至（N-1 ) 列的数据块顺序移动到 X行中（y+1)列至 N列的位置；

根据所述 RAID的校验算法对所述 y列中的数据块进行校验计算，获得所述 y 列数据块的校验块；

在所述第二矩阵的 y列中的 A [X, y]的位置插入所述 y列数据块的校险块，获得所述 T行的第一矩阵。

[0009] 结合第一方面或者第一方面的第一种至第三种任意一种可能的实现方式，在第四种可能的实现方式中，所述将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中包括：

当所述第一矩阵的 y列中的数据块和根据所述 y列的数据块计算获得的校验块组成的分条中写满数据时，将所述 y列的数据块和所述校验块写入构建所述 RAID的 T个存储器中，其中，所述 y列为所述第一矩阵中的其中一列。

[0010] 结合第一方面或者第一方面的第一种至第三种任意一种可能的实现方式，在第五种可能的实现方式中，所述第一矩阵具有 M列，所述将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中包括：

当所述第一矩阵的 y列中的数据块和根据所述 y列数据块计算获得的校验块组成的分条中未写满数据时，则确定所述 y列中缺少的数据块的数量，其中，所述 y列为所述第一矩阵中的其中一列；

从所述第一矩阵的第 M-1列至第 y+1列中选择所述数量的数据块填充到所述 y 列中没有数据块的位置；

根据填充后的 y列中的数据块更新所述 y列的校验块；

将所述 y列的数据块和所述更新后的 y列的校验块组成分条写入构建所述 RAID的 T个存储器中。

[0011] 结合第一方面或者第一方面的第一种至第三种任意一种可能的实现方式，在第六种可能的实现方式中，所述将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中包括：

当所述第一矩阵的 y列中的数据块和根据所述 y列的数据块计算获得的校验块组成的分条中未写满数据时，将所述 y列中没有数据块的位置填充为 0 , 并将填充后的 y列的数据块和所述校验块组成分条写入构建所述 RAID的存储器中，其中，所述 y列为所述第一矩阵中的其中一列。

[0012] 结合第一方面或者第一方面的第一种至第六种任意一种可能的实现方式，在第七种可能的实现方式中，还包括：

接收主机的访问请求，所述访问请求用于读取存储于所述 RAID中的文件，所述访问请求中携带有要访问的文件的逻辑地址；

根据所述逻辑地址查询存放所述文件的数据块的物理地址；

根据所述物理地址确定存储所述文件的一个存储器；

将存储于所述存储器中的所述文件的数据块返回给所述主机。

[0013] 第二方面，本发明实施例提供一种文件处理方法，包括：

接收待存储于独立磁盘冗余阵列（Redundant Array of Independent Di sks , RAID ) 中的 F个文件；

将所述 F个文件按照所述 RA I D的条带大小划分成至少两个数据块；将切分后获得的至少两个数据块排列成一个数组，在所述数组中，属于同一文件的相邻两个数据块之间间隔 D-1个位置，其中，所述 D的值为所述 RAID中的数据存储器的数量；

顺序将所述数组中的 D个数据块以及根据所述 D个数据块计算获得的 P个校验块组成分条，写入构建所述 RAID的存储器中，其中，所述 P的值为所述 RAID中独立校验存储器的数量。

[0014] 在第二方面的第一种可能的实现方式中，还包括：

根据所述逻辑地址查询存放所述文件的数据块的物理地址；

根据所述物理地址确定存储所述文件的一个存储器；

[0015] 第三方面，本发明实施例提供一种文件处理装置，包括：接收模块，用于接收待存储于独立磁盘冗余阵列（Redundant Array of Independent Di sks , RAID ) 中的 F个文件，所述 RAID由 T个存储器组成， F为不小于 2的自然数， Τ为不小于 3的自然数；

划分模块，用于将所述 F个文件按照所述 RAID的条带大小划分成至少两个数据块；

处理模块，用于根据所述至少两个数据块获得 T行的第一矩阵，其中，属于同一个文件的数据块位于所述第一矩阵的同一行中；

写入模块，用于将所述第一矩阵中的每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中。

[0016] 在第三方面的第一种可能的实现方式中，所述处理模块具体用于：将切分后获得的至少两个数据块排列为 D行的第二矩阵，其中，属于同一个文件的数据块位于所述第二矩阵的同一行中，所述 D为所述 RAID中的数据存储器的数量；

[0017] 结合第三方面的第一种可能的实现方式，在第二种可能的实现方式中，当所述 RAID中包括独立校验存储器时，所述处理模块具体用于：

[0018] 结合第三方面的第一种可能的实现方式，在第三种可能的实现方式中，当所述 RAID中不包括独立校验存储器时，所述处理模块具体用于：

确定在所述第二矩阵的各列中插入校验块的位置 A [X, y] ,其中，所述第二矩阵具有 N列， X和 y均为整数， X的取值由 0递增到 D-l , y的取值由 0递增到 N-1 ; 将所述第二矩阵的 X行中 y列至（N-1 ) 列的数据块顺序移动到 X行中（y+1)列至 N列的位置；根据所述 RAID的校验算法对所述 y列中的数据块进行校验计算，获得所述 y 列数据块的校验块；

在所述第二矩阵的 y列中的 A [ X , y]的位置插入所述 y列数据块的校险块，获得所述 T行的第一矩阵。

[0019] 结合第三方面或者第三方面的第一种至第三种任意一种可能的实现方式，在第四种可能的实现方式中，所述写入模块具体用于：

[0020] 结合第三方面或者第三方面的第一种至第三种任意一种可能的实现方式，在第五种可能的实现方式中，所述第一矩阵具有 M列，所述写入模块具体用于：

根据填充后的 y列中的数据块更新所述 y列的校验块；

[0021] 结合第三方面或者第三方面的第一种至第三种任意一种可能的实现方式，在第六种可能的实现方式中，所述写入模块具体用于：

当所述第一矩阵的 y列中的数据块和根据所述 y列的数据块计算获得的校验块组成的分条中未写满数据时，将所述 y列中没有数据块的位置填充为 0, 并将填充后的 y列的数据块和所述校验块组成分条写入构建所述 RAID的存储器中，其中，所述 y列为所述第一矩阵中的其中一列。

[0022] 结合第三方面或者第三方面的第一种至第六种任意一种可能的实现方式，在第七种可能的实现方式中，所述接收模块，还用于接收主机的访问请求，所述访问请求用于读取存储于所述 RAID中的文件，所述访问请求中携带有要访问的文件的逻辑地址；

所述文件处理装置还包括：

读取模块，用于根据所述逻辑地址查询存放所述文件的数据块的物理地址，根据所述物理地址确定存储所述文件的一个存储器，并将存储于所述 RAID的一个存储器中的所述文件的数据块返回给所述主机。

[0023] 第四方面，本发明实施例提供了一种存储设备，包括控制器和独立磁盘冗余阵列（Redundant Array of Independent Di sks , RAID ),

所述 RAID,用于存储文件；

所述控制器包括：

处理器、存储器、通信总线和通信接口，所述处理器、所述存储器和所述通信接口通过所述通信总线连接并完成相互间的通信；

所述通信接口，用于与主机及所述独立磁盘冗余阵列（ Redundant Array of Independent Di sks , RAID )通信

所述存储器，用于存储计算机执行指令；

所述处理器，用于运行所述计算机执行指令，执行如第一方面或第二方面所述的文件处理方法。

[0024] 第五方面，本发明实施例提供了一种计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令用于执行如第一方面或第二方面所述的文件处理方法。

[0025] 在本发明实施例中提供的文件处理方法中，存储设备通过将接收的 F 个文件划分为多个数据块，并根据所述多个数据块获得 T行的第一矩阵。属于同一个文件的数据块位于所述第一矩阵的同一行中。存储设备再将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条存储在 RAID中，从而可以使得属于同一个文件的数据块能够存储于所述 RAID的一个磁盘中。并且，当一个文件损坏时，存储设备可以根据其他文件以及校验块对损坏的文件进行恢复，保证了文件存储的安全性。进一步的，在归档的场景下，当需要访问 RAID中的文件时，存储设备只需要对存储该文件的一个存储器进行唤醒及操作，节能效果显著。附图说明

[0026] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例。

[0027] 图 1-A为本发明实施例的一种文件处理方法的应用场景图；

[0028] 图 1-B为本发明实施例提供的一种存储设备 110的结构示意图；

[0029] 图 2-A为本发明实施例提供的一种文件处理方法的流程图；

[0030] 图 2-B为本发明实施例提供的又一种文件处理方法的流程图；

[0031] 图 3 为本发明实施例提供的一种文件处理方法中的校验块插入方法的流程图；

[0032] 图 4-A、图 4-B以及图 4-C为本发明实施例提供的一种待存储文件数据块的排列示意图；

[0033] 图 4-D为本发明实施例提供的一种文件存储结构示意图；

[0034] 图 5 为本发明实施例提供的文件处理方法中的又一种校验块插入方法的流程图；

[0035] 图 6-A、图 6-B及图 6-D为本发明实施例提供的又一种待存储文件数据块的排列示意图；

[0036] 图 6-C为本发明实施例提供的又一种文件存储结构示意图；

[0037] 图 7 为本发明实施例提供的一种文件处理方法中的将数据写入构建

RAID的磁盘中的方法流程图；

[0038] 图 8为本发明实施例提供的再一种文件处理方法的流程图；

[0039] 图 9为本发明实施例提供的再一种待存储文件数据块的排列示意图；

[0040] 图 10为本发明实施例提供的一种文件读取方法流程示意图；

[0041] 图 11为本发明实施例提供的一种文件处理装置的结构示意图。具体实施方式

[0042] 为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。 [0043] 如图 1-A所示，图 1-A为本发明实施例的一种应用场景图，在图 1-A 所述的一种应用场景中，该存储系统包括主机 100、连接设备 105和存储设备 110。

[0044] 主机 100可以包括当前技术已知的任何计算设备，如应用服务器、台式计算机等等，在主机 100 中安装有操作系统以及其他应用程序，主机 100 可以有多个。

[0045] 连接设备 105 可以包括当前技术已知的存储设备和主机之间的任何接口，如光纤交换机，或者其他现有的交换机。

[0046] 存储设备 110可以包括当前技术已知的存储设备，如存储阵列、磁盘簇（ Jus t a Bunch Of Di sks, JBOD )、直接存取存储器（ Direct Acces s Storage Device, DASD )的一个或多个互连的磁盘驱动器，其中，直接存取存储器可以包括诸如磁带库、一个或多个存储单元的磁带存储设备。

[0047] 图 1-B为本发明实施例提供的一种存储设备 110的结构示意图，图 1-B所示的存储设备为一种存储阵列。如图 1-B所示，存储设备 110可以包括控制器 115 以及磁盘阵列 125 , 其中，这里的磁盘阵列指的是独立磁盘冗余阵列 ( Redundant Arrays of Independent Di sks , RAID ),磁盘阵列 125可以有多个，磁盘阵列 125由多个磁盘 130构成。

[0048] 控制器 115 是存储设备 110 的 "大脑" ，主要包括处理器 (proces sor) 118、緩存 ( cache ) 120、存储器（memory) 122、通信总线（简称总线） 126以及通信接口（Com醒 nicat ion Interface) 128。处理器 118、緩存 120、存储器 122以及通信接口 128通过通信总线 126完成相互间的通信。

[0049] 通信接口 128 , 用于与主机 100及磁盘阵列 125通信。

[0050] 存储器 122 , 用于存放程序 124 , 存储器 124可能包含高速 RAM存储器，也可能还包括非易失性存储器（non-vola t i le memory ) , 例如至少一个磁盘存储器。可以理解的是，存储器 124可以为随机存储器（Random-Acces s Memory, RAM) ,磁碟、硬盘、 U盘、移动硬盘、光盘、固态硬盘（Sol id State Di sk, SSD ) 或者非易失性存储器等各种可以存储程序代码的非短暂性的（non-trans i tory ) 机器可读介质。

[0051] 程序 124可以包括程序代码，所述程序代码包括计算机操作指令。

[0052] 緩存 120 ( Cache )用于緩存从主机 100接收的数据以及緩存从磁盘阵列 125读取的数据，以提高阵列的性能和可靠性。緩存 120可以是 RAM、 ROM, 闪存（Flash memory )或固态硬盘 ( Sol id State Di sk, SSD )等各种可以存储数据的非短暂性的（non-trans i tory )机器可读介质，在此不做限定。

[0053] 处理器 118可能是一个中央处理器 CPU, 或者是特定集成电路 ASIC ( Appl icat ion Specif ic Integrated Circui t ), 或者是被配置成实施本发明实施例的一个或多个集成电路。在处理器 118中安装有操作系统和其他软件程序，不同的软件程序可以视作一个处理模块，具有不同的功能。例如，处理对磁盘 130的输入 /输出（Input/output , 1/0)请求，对磁盘中的数据进行其他处理，或者修改存储设备中保存的元数据等等。从而使控制器 115可以实现 10操作、 RAID 管理功能，还能够提供如快照、镜像、复制等各种的数据管理功能。在本发明实施例中，处理器 118用于执行程序 124 , 具体可以执行下述方法实施例中的相关步骤。

[0054] 结合图 1-A,任意一个存储设备 110均可以通过连接设备 105接收一个或多个主机 100发送的多个文件，并将接收的多个文件分成多个数据块并存储在构成磁盘阵列 125的多个磁盘 130中。任意一个存储设备 110也可以接收任意一个主机 100发送的文件读取请求，根据文件读取请求将磁盘 130中存储的所述文件的数据块返回给主机。

[0055] 需要说明的是，磁盘 130仅仅是构建磁盘阵列 125的存储器的一种示例，实际应用中，还可以在包含多个磁盘的机拒之间构建磁盘阵列等实施方式。因此，本发明实施例中的存储器可以包括磁盘、固态硬盘（Sol id State Dr ives , SSD ), 由多个磁盘构成的机拒或服务器等装置，在此不做限定。

[0056] 图 2-A为本发明实施例所示的一种文件处理方法的流程图，该方法可以由图 1-B所示的存储设备 110的控制器 115来执行，该方法可以应用于文件归档的场景中，如图 2-A所示，该方法包括：

[0057] 在步骤 200中，存储设备 110接收待存储在 RAID中的 F个文件，其中， F为不小于 2的自然数。在本发明实施例中，存储设备 110的控制器 115可以接收一个或多个主机 100发送的文件存储请求，该文件存储请求用于请求将文件存储于存储设备 110的第一 RA I D中，第一访问请求中可以包含有待存储的 F 个文件。所述第一 RAID中包含有 T个存储器，且所述 T的值为不小于 3的自然数。

[0058] 结合图 1-B所示，在存储设备 110中可以包括多个 RAID。本实施例中所述的第一 RAID或第二 RAID是存储设备 110中包含的多个 RAID中的任意一个，本发明实施例中的第一 RAID和第二 RAID仅仅只是对不同 RAID的一个区分。同一个存储设备 110中包含的多个 RAID的组织形式可以相同，例如，第一 RAID 和第二 RAID都是 RAID5的组织形式。当然，同一个存储设备 110中包含的多个 RAID的组织形式也可以不同，例如，第一 RAID为 RAID3 , 第二 RAID为 RAID5。在此并不限定。可以理解的是，实际操作中，可以先将接收的 F个文件緩存在緩存 120中，对该 F个文件进行处理后再写入磁盘阵列 125中。

[0059] 在步骤 205中，存储设备 110将所述 F个文件按照第一 RAID的条带大小（s t r ip s ize)切分成至少两个数据块。条带（s t r ip )是一个盘区上的连续地址块。在磁盘阵列中，控制器通常釆用条带将虚拟磁盘的块地址（ b lock addres ses )映射到成员盘的块地址。条带也被称为分条元素（ s t r ipe e lement )。条带大小（s t r ip s ize) , 有时也被叫做 b lock s ize, chunk s i ze 或者 granular i ty, 指的是写在每块磁盘上的条带数据块的大小。通常， RAID的条带大小一般在 2KB 到 512KB 之间（或者更大），其数值是 1 的 n 次方，即 2KB, 4KB, 8KB, 16KB 等。

[0060] 当将接收的文件按照第一 RAID的条带大小进行切分时，如果有个文件小于第一 RAID的条带大小的值，可以将该文件作为一个数据块。如果某个文件切分后剩下的数据块小于条带大小的值，则将该文件剩下的数据作为一个数据块。例如，如图 4-A所示，控制器 115接收到 5个待存储的文件 Fl-F5。按照第一 RAID的条带大小进行切分后，将文件 F1切分为 5个数据块： Fl-1、 Fl_2、 Fl-3、 F1-4和 Fl-5。将文件 F2切分为 3个数据块： F2_l、 F2-2和 F2_3。将文件 F3切分为一个数据块： F3-l。将文件 F4切分为 5个数据块： F4-1、F4_2、F4_3、 F4-4和 F4-5。将文件 F5切分为 4个数据块： F5- F5_2、 F5-3和 F5_4。

[0061] 在步骤 210中，存储设备 110根据所述至少两个数据块获得 T行的第一矩阵。其中，属于同一个文件的数据块位于所述第一矩阵的同一行中。并且，在所述第一矩阵的每一列中包含有根据该列的数据块进行计算获得的校验块，所述 T的值等于构建所述第一 RAID中的磁盘的数量。

[0062] 例如，如果所述第一 RAID中共有 4块磁盘，则可以根据上述切分后的 F1-F5的文件的数据块获得 4行的第一矩阵，且属于同一个文件的数据块位于所述第一矩阵的同一行中。如图 4-C所示，文件 F1的数据块 Fl-1、 Fl-2、 Fl_3、 F1-4和 F1-5均位于第一矩阵的第 0行中，文件 F2的数据块 F2_l、 F2_2、和 F2-3 均位于第二矩阵的第 1行中。

[0063] 具体在获得第一矩阵的过程中，可以将第一个文件的第一个数据块确定为第一矩阵的 A [0, 0]位置的数据块，并判断第二数据块是否属于第一文件，如果第二数据块属于第一个文件，则将第二个数据块与所述第一个数据块排列在同一行，如果第二数据块不属于第一个文件，则将第二数据块排列在第一个找到的空行，或将第二数据块排列在第二矩阵最短的行中。依次类推，直到将切分获得的所有数据块排列完毕。当然可以理解的是，还可以釆用其他的方法将切分获得的数据块排列为第一矩阵，只要保证属于同一个文件的数据块位于矩阵的同一行中即可，在此不做限定。排列后的 T行的第一矩阵具体可以如图 4-C或图 6-B 所示。

[0064] 在排列的 T行的第一矩阵中的每一列中包含有根据该列的数据块进行计算获得的校验块，例如，在如图 4-C所示的第一矩阵中，在第 0列中包含有根据第 0列的数据块： Fl-1、 F2-1和 F3-1获得的校验块 P1 , 在第 1列中包含有根据第 1列的数据块： Fl-2、 F2-2和 F3-2获得的校验块 P2。

[0065] 在本发明实施例中，并不对文件在所述第一矩阵中的具体位置做限定，也不对属于同一个文件的数据块之间的排列顺序做任何限定，只要保证同一个文件的数据块位于所述第一矩阵的同一行中即可。实际应用中，可以将属于同一个文件的数据块顺序排列在所述第一矩阵的同一行中。

[0066] 在步骤 215 中，存储设备 110将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条（s tr ipe) , 写入构建所述第一 RAID 的 T个存储器中。

[0067] 在获得第一矩阵后，可以分别将第一矩阵中的每一列的数据块和根据该列的数据块计算获得的校验块组成 RAID 中的一个分条写入构建第一 RAID 的磁盘中。例如，在一种情况下，分别将图 4-C所示的第一矩阵中的每一列数据块和根据该列的数据块计算获得的校验块组成分条写入磁盘中后，形成如图 4-D 所示的存储结构。其中， Fl-1、 F2- F3-1和 P1构成所述第一 RAID的一个分条， Fl-2、 F2-2、 F3-2和 P2构成所述第一 RAID的另一个分条，依次类推。在另一种情况下，分别将图 6-B所示的第一矩阵中的每一列数据块和根据该列的数据块计算获得的校验块组成分条写入磁盘中后，可以形成如图 6 -C所示的存储结构。需要说明的是，本发明实施例中描述的分条（s tr ipe)是指并行写入构建 RAID 的各个存储器上的数据块的集合，其中，分条中的各个数据块的大小相同，且同一个分条上的数据块位于各个存储器中的偏移位置相同。

[0068] 可以理解的是，在实际应用中，可以将图 4-C或图 6-B中所示的第一矩阵中某一列数据块计算获得该列的校验块，并在该列中插入校验块后，将该列数据块和校验块组成一个分条存储在构建所述第一 RA I D的磁盘中。也可以等到该第一矩阵中每一列的校验块均计算完成后，再分别将第一矩阵中的每一列数据块和根据该列数据块计算获得的校验块组成一个分条，存储在构建所述第一 RAID的磁盘中。例如，可以先根据图 4-C所示的第一阵列中的第 0列数据 Fl-1、 F2-1和 F3-1计算获得校验块 P1后，即将图 4-C中的第 0列数据 Fl- F2_l、 F3-1和 P1组成一个分条存储在构建第一 RAID的磁盘 D1-D4中。也可以分别计算获得所有校验块 P1-P7后，再分别将第一矩阵中的各列数据块和校验块组成分条存储在磁盘 D1-D4中。在此不做限定。

[0069] 由上述描述可知，本发明实施例所述的文件处理方法，通过将待存储的文件进行切分、排列之后，再将属于不同文件的数据块组成分条存储在构建第一 RA I D的磁盘中，不仅保证了文件的写入效率，并且可以使得属于同一个文件的数据块能够存储一个磁盘中。例如，属于文件 F1的所有数据块均被存储于磁盘 D1中，属于文件 F2的所有数据块也均被存储于磁盘 D2中。釆用本发明实施例的方法将多个文件存储在 RAID中后。当需要访问存储阵列中的某一个文件时，存储设备 110可以不用将整个 RAID中的磁盘均唤醒，只需要唤醒存储有该文件的一个磁盘，并将该磁盘中的文件返回给主机，从而能够起到了较好节能效果。并且，在本发明实施例的技术方案中，如果某个数据块被损坏，可以通过同件存储的安全性。 [0070] 需要说明的是，本发明实施例中描述的数据块是指由多个数据组成的数据单元。本发明实施例中描述的校验块是指由校验数据组成的数据单元。本发明实施例中描述的矩阵可以为包含多个由数据块组成的队列，还可以为包含多个由数据块和校验块组成的队列。本发明实施例中的行是指包含有属于同一个文件的所有数据块的一个队列。本发明实施例中的列是指与所述行处于垂直方向的队列。换句话说，本发明实施例中定义的行并没有限定为只能是如通常矩阵中定义的横向的队列。当普通矩阵中横向的队列中包含有属于同一个文件的数据块时, 可以将该横向队列（例如如图 4-C中的横向队列）称为本发明实施例中的行。当普通矩阵中纵向的队列中包含有属于同一个文件的数据块时，则将该纵向队列称为本发明实施例中的行。在此不做限定。

[0071] 图 2-B为本发明实施例提供的又一种文件处理方法的流程图，该方法可以由图 1-B所示的存储设备 110的控制器 115来执行，该方法可以应用于文件归档的场景中，如图 2-B所示，该方法与图 2-A所示的方法类似，其中，步骤 207和步骤 209是对图 2-A所示方法中的步骤 210的详细描述。如图 2-B所示，该方法包括：

[0072] 在步骤 200中，存储设备 110接收待存储于第一 RAID中的 F个文件。其中， F为不小于 2的自然数。所述第一 RAID中包含有 T个存储器，所述 T的值为不小于 3的自然数。

[0073] 在步骤 205中，存储设备 110将 F个文件按照第一 RAID的条带大小切分为至少两个数据块。

[0074] 在步骤 207中，存储设备 110将所述至少 1个数据块排列为 D行的第二矩阵，其中，属于同一个文件的数据块位于所述第二矩阵的同一行中，所述 D为所述第一 RAID中的数据盘的数量；

[0075] 在将文件进行切分得到多个数据块后，可以将获得的多个数据块排列为 D行 *N列的第二矩阵，其中， D用于表示第二矩阵的行数， D的值由构建第一 RAID的数据盘的数量来确定， N为正整数。可以理解的是，第一 RAID的数据盘的数量需要根据第一 RAID的组织形式来确定。例如， RAID3 中会包括数据盘和 1个独立校验盘， RAID4中会包括数据盘和 1个独立校验盘。而 RAID5中只有数据盘，没有独立校验盘。 D的值只需要根据第一 RAID中的数据盘的数量来确定。例如，如果所述第一 RAID的组织形式为 RAID3, 且该第一 RAID总共有 4个磁盘，则数据盘的个数为 3个，校验盘的个数为 1个，因此该第二矩阵的行数为 3行，可以排列成如图 4-B所示的第二矩阵。如果所述第一 RAID的组织形式为 RAID5 , 且该第一 RAID总共有 4个磁盘，则数据盘的个数为 4个，校验盘的个数为 0个，则该第二矩阵的行数为 4行，可以排列成如图 6-A所示的第二矩阵。

[0076] N用于表示第二矩阵的列数， N为正整数， N的值可以不用限定，具体可以根据数据块的多少来确定。可以理解的是，在将接收的多个待存储的文件緩存在緩存 120中的情况下， N的大小可以根据緩存 120的大小来确定， N与所述条带大小的乘积不大于緩存 120的容量。具体在排列第二矩阵的过程与上述图 2-A的步骤 210中描述的排列第一矩阵的方法类似，在此不再赘述。

[0077] 需要说明的是，本发明实施例中的数据盘只是存放数据块的数据存储器的一种示例，本发明实施例中的独立校验盘也只是专门用于存储校验数据的独立校验存储器的一种示例。本发明实施例中的数据存储器是指用于存储数据块的存储器，独立校验存储器是指专门用于存储校验块的存储器，其中，存储器包括但不限于磁盘、包含磁盘的机拒或服务器等装置。

[0078] 在本发明实施例中，在具体排列数据块时，必须保证属于同一个文件的数据块位于所述第二矩阵的同一行中，例如，如图 4-B所示，如果第一 RAID 为 RAID3的组织形式，第一 RAID中有 3块数据盘，则可以把文件 F1至 F5切分后获得的数据块排成 3行 *7列的第二矩阵，文件 F1的数据块 Fl-l、Fl-2、Fl-3、 F1-4和 F1-5均位于第二矩阵的第 0行中，文件 F2的数据块 F2_l、 F2_2、和 F2-3 均位于第二矩阵的第 1行中，文件 F5的数据块 F5-l、 F5-2、 F5-3和 F5-4也都位于第二矩阵的第 1行中。

[0079] 在步骤 209 中，存储设备 110分别在所述第二矩阵的各列中插入校验块，获得 T行的第一矩阵。

[0080] 其中，所述第二矩阵的各列中插入的校验块是根据所述第一 RAID的组织形式确定的校验算法对该列数据块进行计算获得的，所述 T 的值与所述 D 的值的差值为所述第一 RAID中独立校验盘的数量。例如，所述 T行的第一矩阵可以为（D+P)行 *M列的第一矩阵，其中，所述 P为所述第一 RAID中的校险盘的数量， M为不小于 N的正整数，且 M与所述条带大小的乘积不大于所述 RAID组中单块磁盘的容量。

[0081] 存储设备 110的控制器 115可以根据第一 RAID的组织形式确定校验算法（即校验块的计算方法），并根据确定的校验算法计算第二矩阵的各列数据块的校验块，并在第二矩阵中分别插入各列数据块的校验块，获得（D+P)行 *M列的第一矩阵。其中 P为第一 RAID中的独立校验盘的数量，Μ的取值应该不小于 N, 且 Μ与所述条带大小的乘积不大于所述 RAID组中单块磁盘的容量。可以理解的是，在将接收的多个待存储的文件緩存在緩存 120中的情况下，则 M与所述条带大小的乘积也不会大于緩存 120的容量。

[0082] 可以理解的是，实际操作中，如果先将接收的多个文件緩存在临时存储区（即緩存 120 ) 中，由于考虑到校验块还需要占用临时存储区的容量，因此，可以设定在第二矩阵中插入校验块的条件。例如，可以设定当临时存储区的数据量超过设定的阈值时，在所述第二矩阵的各列中插入校验块。当然，还可以设定当达到设定的存储时限时，则在所述第二矩阵的各列中插入校验块。其中，存储时限是预先设定的需要将文件写入构建第一 RAID的磁盘的时限。例如，可以规定 1小时存储一次，则存储时限为 1小时。存储时限可以根据需要写入磁盘的数据量等实际情况来确定，可以 1天存储一次也可以 10分钟存储一次，在此不做限定。

[0083] 在步骤 209中，当在第二矩阵中插入校验块时，可以根据第一 RAID 的组织方式分别进行不同的处理。具体可以参见如图 3和图 5的相关描述。

[0084] 在一种情形下，当第一 RAID为带独立校险盘的 RAID组织形式时，例如，当第一 RAID为 RAID3或 RAID4时，控制器 115可以按照图 3所示的方法流程插入校验块。如图 3所示，该方法包括：

[0085] 在步骤 305中，存储设备 110根据所述第一 RAID中独立校验盘的位置确定在所述第二矩阵中插入校验块的位置。

[0086] 例如，如果第一 RAID为 RAID3, 则所述第一 RAID中有一个独立校验盘。如图 4-D所示，如果所述第一 RAID中有 4块磁盘，则可以将 Dl、 D2、 D3 和 D4中任意一块磁盘作为独立校险盘。例如在如图 4-D所示的第一 RAID中将 D4 作为独立校验盘。根据确定的独立校验盘的位置可以确定第二矩阵中插入校验块的位置。例如，根据在如图 4-D所示的独立校验盘 D4的位置，可以确定在图 4-B所示的第二矩阵中最后一行的后面增加一行校验块。根据这种方式，如图 4-B所示的第二矩阵有 3行，则在第二矩阵中增加第 4行来插入校验块。

[0087] 当然，可以理解的是，如果将 D2作为独立校验盘，则在图 4-B所示的第二矩阵中第一行数据与第二行数据之间插入一行作为校验块的位置，使 3 行 *7列的第二矩阵变为 4行 *7列的第一矩阵。上述对独立校验盘的位置的举例并不用于对独立校验盘的位置的任何限定。

[0088] 在步骤 310中，存储设备 110根据所述第一 RAID的校验算法分别对所示第二矩阵中每一列的数据块进行校验计算，获得每一列数据块的校验块。

[0089] 例如，若所述第一 RAID的校验算法为奇偶校验算法，则可以分别根据奇偶校验算法对如图 4-B中所示的第二矩阵中的每一列数据进行校验计算，获得每一列数据块的校验块。例如，根据图 4-B中第 0列数据 Fl-1、 F2-1和 F3-1 进行校验计算，获得校验块 PL 对第 1列数据 Fl-2、 F2-2和 F4-1进行校验计算获得校验块 P2。需要说明的是，在这个实施例中，奇偶校验算法只是一种举例，并不对校验算法进行限制。步骤 305和步骤 310的顺序并不做限定。

[0090] 在步骤 315 中，存储设备 110根据确定的校验块的位置在第二矩阵的每一列中插入根据该列数据块计算的校验块，获得所述 τ行的第一矩阵。

[0091] 例如，在对如图 4-B所示的第二矩阵中插入校险块后可以获得如图 4-C所示的 4行 *7列的第一矩阵，其中，ΡΙ是根据第二矩阵中第 0列数据 F1- F2-1和 F3-1计算获得的校验块， Ρ2是根据第二矩阵中第 1列数据 Fl_2、 F2-2 和 F4-1计算获得的校验块，依次类推。

[0092] 在具有独立校验盘的情况下，可以根据独立校验盘的数量确定在第二矩阵的每一列中插入校验块的数量。因此，插入校验块之后，会使第二矩阵的行数发生变化，而第二矩阵的列数不会变化。换句话说，如果第一 RAID为具有独立校险盘的 RAID的组织方式，则第一矩阵中 M的值等于第二矩阵中 N的值。

[0093] 在另一种情形下，当第一 RAID为不带独立校险盘的 RAID组织形式而是带分布式校验块的 RAID组织形式时，例如，当第一 RAID为 RAID5或 RAID6 时，控制器 115可以按照图 5所示的方法流程插入校验块。如图 5所示，该方法包括： [0094] 在步骤 505 中，存储设备 110确定在所述第二矩阵的各列中插入校验块的位置 A [x, y]。

[0095] 实际应用中，可以才艮据所述第一 RAID的组织形式以及设置的所述第一 RAID 中校验块的分布方式确定在所述第二矩阵的各列中插入校验块的位置 A[x, y]。本领域人员可以知道， RAID5中校验块在磁盘上的分布方式可以为向左对称 ( backward parity或 Lef t Synchronous )、向左非对称 ( backward dynamic 或 Lef t Asynchronous )、向右对称 (forward parity 或 Right Synchronous ) 或向右非对称 ( f orward dynamic 或 Right Asynchronous )。其中, "左"或 "右" 是指校验信息如何分布，而 "对称" 或 "非对称" 是指数据如何分布。在 "左" 的算法中，校验块从最后一个磁盘开始，每一个分条将校验块向靠近第一个磁盘的方向移动一个磁盘的位置（必要时重复循环分布）。而 "右" 算法中，校验块从第一个磁盘开始，每一个分条将校验块向靠近最后一个磁盘的方向移动一个磁盘的位置（必要时重复循环分布）。 RAID6在 RAID5 的基础上又增加了一组校险块。

[0096] 在不具有独立校验盘的 RAID组织方式中，具体校验块在磁盘中如何分布，可以按照所述第一 RAID的组织方式和设置的校验块分布方式来确定。例如，如果所述第一 RAID为 RAID5的组织方式，且设置的校险块的分布方式为向左对称分布，则可以知道校验块在磁盘中是从最后一个磁盘开始，每一个分条将校验块向靠近第一个磁盘的方向移动一个磁盘的位置进行分布。

[0097] 在本发明实施例中，可以根据设置的所述第一 RAID中校验块的分布方式确定在所述第二矩阵中插入校验块的位置 A [X, y]。其中， X为不小于 0且不大于（ D-1 )的整数， y为不小于 0且不大于（ N-1 )的整数，即 0≤ X≤ (D— 1), 0≤ y < (N - 1), 且 X, y的取值随着校险块在所述第二矩阵的位置不同而变化， x的取值由 0递增到（ D-1 ), y的取值由 0递增到（ N-1 )。例如，如果所述第一 RAID 为 RAID5 的组织方式，且设置的校验块的分布方式为向左对称分布，则在如图 6-A所示的第二矩阵中第 0列插入的校验块的位置为 A [3, 0],在第 1列插入校验块的位置为 A [2, 1] ,在第 2列插入校验块的位置为 A[l, 2] ,在第 3列插入校验块的位置为 A[0, 3]。并从第 4列开始下一个循环，即在第 4列插入校验块的位置为 A [3, 4] ,在第 5列插入校验块的位置为 A [2, 5] ,依此类推。具体可以如图 6-B 中所示的 P1-P7所示的位置。

[0098] 在步骤 510中，存储设备 110将所述第二矩阵的 X行中 y列至（ N-1 ) 列的数据顺序移动到 X行中（y+l)列至 N列的位置。

[0099] 确定了在所述第二矩阵的各列中插入校验块的位置 A [x,y]后，需要将第二矩阵的 X行中 y列至（N-1 ) 列的数据块顺序移动到 X行中（y+l)列至 N 列的位置，即需要将第二矩阵中 X行中原 A[x,y]至 A[x,N-l]位置的所有数据块均向右移动一位，顺序移动到 A [X, y+l]至 A [χ,Ν]的位置。例如，当确定在如图 6-Α所示的第二矩阵中第 0列插入的校验块的位置为 A [3, 0]时，需要将第二矩阵中第 3行 A[3, 0]至 A[3, 4]位置的所有数据块均向后移动一位，顺序移动到 A[3, 1] 至 A[3, 5]的位置。根据这种方式可以将原 A[3, 0]位置的数据块 F4-1 移动到 A[3, 1], 将原 A[3, 1]位置的数据块 F4-2移动到 A[3,2],依此类推。其中， x, y 的取值随着校验块在所述第二矩阵的位置不同而变化，每确定一个校验块的位置 A[x,y] , 均需要将 X行中原 A[x,y]至 A[x,N-l]位置的所有数据块均向后移动一位。本发明实施例并不对每一列数据块的校验块的个数进行限定。

[00100] 在步骤 515中，存储设备 110根据所述第一 RAID的校验算法对所述 y列中的数据块进行校验计算，获得所述 y列数据块的校验块。

[00101] 当确定校验块的位置为 A[x, y] ,且将所述第二矩阵的 X行中 y列至

( N-1 )列的数据块顺序移动到 X行中（y+l)列至 N列的位置后，可以根据所述第一 RAID的校验算法对 y列的数据块进行校验计算，获得 y列数据块的校验块。该校验块即为需要插入 A [x,y]位置的校验块。例如，如图 6-B所示，当确定第 0 列的校验块的位置为 A [3, 0] ,并将第二矩阵中原 A [3, 0]位置的数据块 F4-1移动 A [3, 1]位置之后，可以根据新的第 0列的数据块： Fl-1, F2-1和 F3-1计算获得第 0列的校验块 Pl。

[00102] 在步骤 520中, 存储设备 110在所述第二矩阵的 y列中的 A [x,y]的位置插入所述 y列数据块的校验块，获得所述 T行的第一矩阵。

[00103] 当计算获得校验块后，可以在确定的校验块的位置 A [x, y]处插入校验块，从而能够获得 T行的第一矩阵。例如可以获得（D+P)行 *M列的第一矩阵。由于在不具有独立校验盘的 RAID组织方式中，需要在第二矩阵中的每一列中插入校验块，并且需要将插入校验块的位置的原数据块按行顺序向后移动，因此，获得的第一矩阵中 M的值会大于第二矩阵中 N的值。例如，如果第一 RAID的组织方式为 RAID5 , 且校险块为向左对称分布，则当在图 6-A所示的 4*5的第二矩阵的每一列中插入校验块后会得到一个如图 6-B所示的 4*7列的第一矩阵。

[00104] 在步骤 215 中，存储设备 110分别将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述第一 RAID的磁盘中。在实际应用中，在步骤 215中，将第一矩阵中的各列数据块按分条写入构建第一 RAID的磁盘中时，会出现下面几种情况，可以分别进行处理。

[00105] 在一种情形下，当所述第一矩阵的 y列中的数据块和校险块组成的分条中写满数据时，可以直接将所述 y 列的数据块和校验块写入构建所述第一 RAID的磁盘中，其中 y列为所述第一矩阵的 M列中的其中一列。例如，当如图 6-B中第 0列写满数据时，即第 0列的数据块和校验块组成的分条中写满数据时，将第 0列的数据块和校验块组成一个分条写入磁盘中。

[00106] 在另一种情形下，如果所述第一矩阵中第 y列中的数据块和校险块组成的分条中未写满数据时，可以将 y列中没有数据块的位置填充为 0, 并将填充后的 y列的数据块和校验块组成一个分条写入构建所述第一 RAID的磁盘中。其中， y列为所述第一矩阵中的某一列。例如，当如图 6-B所示的第一矩阵中第 4列中未写满数据时，即 A [l, 4]的位置没有写数据，则可以将 A [l, 4]的位置填充为 0, 然后将第 4列中的数据块和校验块组成一个分条写入磁盘中，即将数据块 Fl-4、 0、 F5-3和校验块 P5组成一个分条写入磁盘中。

[00107] 在又一种情形下，如果所述第一矩阵的 y列中的数据块和校险块组成的分条中未写满数据时，如果已达到存储时限，且没有再接收到其他文件，则可以通过图 7所述的方法进行处理。如图 7所示，该方法包括：

[00108] 在步骤 700中，存储设备 110确定所述 y列中缺少的数据块的数量。

[00109] 例如，在如图 4-C所示的第一矩阵的第 5列中的数据块和校险块组成的分条中未写满数据。例如，即在第 5列中存在没有写数据的位置 A [0, 5] , 又如，在如图 6-B所示的第一矩阵的第 y列（y=4 ) 中也存在没有写数据的位置 A [l, 4]。如果此时到达存储时限，则可以确定如图 4-C 所示的第一矩阵中第 5 列中缺少的数据块的数量为 1 , 在如图 6-B所示的第一矩阵中第 4列缺少的数据块的数量也为 1。 [00110] 在步骤 705中，存储设备 110顺序从所述第一矩阵的第 M-1列至第 y+1列中选择所述数量的数据块填充到所述 y列中没有数据块的位置。

[00111] 如果 y列中存在没有写数据的位置，且已到达存储时限，存储设备 110又没有从主机接收到其他待存储文件，则为了节省磁盘的存储空间，存储设备 110可以顺序从第一矩阵中第 M-1列至第 y+1列中选择相应数量的数据块填充到 y列中没有数据块的位置。换句话说，当确定第一矩阵中第 y列中存在没有数据的位置时，存储设备 110可以从第一矩阵的最后一列开始按照从最后一列到第 0列的方向选择相应数量的数据块填充到第 y列中缺少数据的位置。

[00112] 例如，存储设备 110可以从图 4-C所示的第一矩阵中第 6列中选择数据块 F5-4填充到第 5列中缺少数据块的位置，即将第一矩阵中 A [l , 6]位置的数据 F5-4填充到 A [0, 5]的位置。存储设备 110可以从如图 6-B所示的第一矩阵中第 6列的数据（即数据 F5-4和 F4-5 )中任意选择一个数据填充到第 4列 A [1 , 4] 的位置。

[00113] 在步骤 710中，存储设备 110根据填充后的 y列中的数据块更新所述 y列的校验块。

[00114] 由于将 y 列中没有数据的位置填充了新的数据，因此存储设备 110 需要根据确定的校验算法以及第一矩阵中填充后的 y 列中的所有数据块计算并更新 y列的校验块。其中， y的取值随着第一矩阵中缺少数据块的位置的不同而变化。例如，如图 6-B所示，如果将图 6-B所示的 M-1列的数据 F4-5填充到第 y列中后，填充后的 y列数据可以如图 6-D所示的第 y列中的数据块所示，需要根据填充后的第 y列中的数据： Fl-4、 F4-5和 F5-3重新计算并更新校验块 P5。可以理解的是，由于如图 6-B所示的第一矩阵中第 y+1列也存在 1个没有数据的位置，因此存储设备 110也可以从第 M-1列中选择 1个数据填充到第 y+1列中没有数据的位置，并根据更新后的 y+1列的数据 Fl-5、 F5-4和 F4-4重新计算并更新校验块 P6。

[00115] 在步骤 715中，存储设备 110将所述 y列的数据块和校验块组成分条，写入构建所述第一 RAID的 T个磁盘中。

[00116] 当第一矩阵的 y列中缺少数据块的位置被填充上新的数据块，并更新 y列的校验块后，存储设备 110可以将更新后的 y列的数据块和校验块组成一个分条写入所述 τ个磁盘中。

[00117] 可以理解的是，当釆用图 7 所示的方法后第一矩阵中依然存在没有数据的位置时，如果已到达存储时限，可以将没有数据的数据块填充为 0后再写入磁盘，具体可参见前面的描述，在此不再赘述。本领域人员可以知道，将没有数据的数据块填充为 0用于表示该数据块没有使用。

[00118] 由上述描述可知，在将第一矩阵中的数据块写入磁盘中时，釆用如图 7所示的方法在保证同一个文件被存储在尽量少的磁盘中的同时，可以节省磁盘空间。

[00119] 在又一种情形下，文件通过釆用图 2-A或图 2-B所述的方法进行存储时，如果达到存储时限且第一 RAID已经被存满时，可以将第一矩阵中未写入第一 RAID的数据写入第二 RAID中。可以理解的是，在将第一 RAID未写完的数据写入第二 RAID时，如果第二 RAID与第一 RAID的组织方式相同，且第二 RAID 与第一 RAID中的成员盘数相同，例如，第一 RAID和第二 RAID均为 RAID5 , 且第二 RAID与第一 RAID中的磁盘数量相同。可以将所述第一矩阵未写入所述第一 RAID中的数据按照步骤 215的方法写入构建第二 RAID的磁盘中。如果第二 RAID 与第一 RAID的组织方式不同，或第二 RAID与第一 RAID中的成员盘数不同，例如第一 RAID为 RAID3, 第二 RAID为 RAID5。则需要重新才艮据上述文件处理方法将剩余的数据块写入第二 RAID中。

[00120] 图 8 为本发明实施例描述的又一种文件处理方法的流程图。该方法只能应用于具有独立校险盘的 RAID的组织方式中。该方法也可以由图 1-A中所示的存储设备 110来执行。如图 8所示，该方法包括：

[00121] 在步骤 800中，存储设备 110接收待存储于第一 RA I D中的 F个文件。

[00122] 在步骤 805中，存储设备 110将所述 F个文件按照所述第一 RAID的条带大小切分成至少两个数据块。

[00123] 步骤 800与步骤 805的相关描述可以参见图 2-A中步骤 200和步骤 205的相关描述。

[00124] 在步骤 810中，存储设备 110将切分后获得的至少两个数据块排列成一个数组。在所述数组中，属于同一文件的相邻两个数据块之间间隔（D-1 ) 个位置，其中， D的值为所述第一 RAID中的数据盘的数量。

[00125] 具体的，在排列时，需要根据第一 RAID 的组织方式以及第一 RAID 中的数据盘的数量进行确定。如果第一 RAID为带独立校验盘 RAID组织方式，例如 RAID3或 RAID4。则在排列的数组中，属于同一文件的相邻两个数据块之间需要间隔（D-1 )个位置。其中， D的值为所述第一 RAID中的数据盘的数量。例如，结合图 4-D所示，第一 RAID为 RAID3的组织方式。其中，第一 RAID中有 4块磁盘， Dl、 D2和 D3为数据盘， D4为独立校验盘。可以将切分获得的数据块排列为如图 9所示的数组。其中，文件 F1的数据块 F1-1和 F1-2之间间隔有 1个位置，文件 F2的数据块 F2-1和 F2-2之间也间隔有 1个位置，依此类推。

[00126] 在步骤 815中，存储设备 110顺序将所述数组中的 D个数据块以及根据所述 D个数据块计算获得的 P个校验块组成分条，写入构建所述第一 RAID 的磁盘中。其中所述 P的值为所述第一 RAID中独立校验盘的数量。

[00127] 具体的，在将数据块存储在构建第一 RAID的磁盘的过程中，需要根据第一 RAID的校验算法对从数组中顺序选取的 D个数据进行校验计算，获得 P 个校验块。顺序将 D个数据以及计算获得的 P个校验块组成分条，写入构建第一 RAID 的磁盘中。本领域人员可以知道，在将校验块写入磁盘时时，需要将校验块写入第一 RAID中独立校验盘中。例如，将图 9所述的第一数组中的数据写入磁盘后可以得到如图 4-D所述的存储结构。

[00128] 釆用图 8所述的文件处理方法，能够使文件并行写入 RAID, 保证了文件写入的效率，并且能保证同一个文件被存储在一个磁盘中。并且不同的文件的数据块构成一个分条，当一个文件被损坏时，可以才艮据其他文件对损坏的文件进行修复，保证了文件存储的安全性。

[00129] 在本发明实施例中，通过上述图 2-A、图 2-B或图 8所示的文件处理方法将文件存储于构建 RAID的磁盘中后。由于在归档的场景下，存储的文件被访问的频率较低，因此，为了达到节能目的，通常会将磁盘进行休眠或下电。在需要读取文件时，可以按照图 10所述的方法进行读取。下面结合图 1-A、图 1-B 对图 10进行描述。该方法包括：

[00130] 在步骤 225中，存储设备 110接收主机 100的访问请求，所述访问请求用于读取存储于所述 RAID中的文件。其中，所述访问请求中携带有要读取的文件的逻辑地址。可以理解的是，访问请求中还可以携带要访问的文件的文件名。

[00131] 在步骤 230中，存储设备 110根据所述逻辑地址查询存放所述文件的数据块的物理地址。通常，存储设备 110存储数据之后，会构建一个数据存储的物理地址与逻辑地址对应关系的映射表。当接收到读取文件的访问请求后，存储设备 110可以根据访问请求中携带的逻辑地址查映射表，以查询所述数据在磁盘上的物理地址。可以理解的是，在 RAID中，对緩存 120以及磁盘 130上的数据都会建立映射表。查询物理地址时，通常会先查询緩存 120的映射表，再查询磁盘 130的映射表。如果数据在緩存中，则会直接将緩存中的数据返回给主机。

[00132] 在步骤 235 中，存储设备 110根据所述物理地址确定存储所述文件的一个磁盘。由于在本发明实施例中，通过上述实施例中所述的文件处理方法将文件存储于构建 RAID的磁盘中后，能够使一个文件被存储于一个磁盘中，因此在本步骤中，存储设备 110能够根据物理地址确定存储文件的一个磁盘。

[00133] 在步骤 240中，存储设备 110将存储于所述磁盘中的所述文件的数据块返回给所述主机 100。具体的，存储设备 110可以根据所述物理地址唤醒所述文件所在的一个磁盘 130 , 将并根据获得的物理地址读取磁盘 130 中的数据，将数据返回给主机 100。

[00134] 在本发明实施例中，由于文件是按照图 2-A、图 2-B或图 8所示的方法存储的，因此属于同一个文件的数据都被存储在尽可能少的磁盘中。因此，在读取文件时，只需要唤醒存储该文件的一个磁盘，并从唤醒的一个磁盘中读取该文件的数据返回给主机。从而无需唤醒构建整个 RAID的所有磁盘，节能效果显著。

[00135] 本领域人员可以理解的是，在本发明实施例中，存放元数据的磁盘以及緩存 120始终是保持上电状态的，以便于能对主机的访问请求做出及时的响应。其中，本领域人员可以知道，元数据是描述 RAID中存储的数据及其环境的数据，例如元数据中可以包含逻辑地址与物理地址的映射关系。

[00136] 由于磁盘频繁的上电或下电会影响存储系统的节能效果，同时会影响磁盘寿命。为了避免磁盘被频繁的上电或下电，在实际应用中，可以将磁盘进行分级。将少量高性能磁盘始终保持上电状态，大量的高容量磁盘进入节能状态。其中，这里的高性能磁盘指访问时延较低或每秒进行读写（ I/O )操作的次数 (Input/Output Operat ions Per Second, IOPS )较高的磁盘，例如，固态硬盘

( Sol id State Di sk, SSD )。高容量磁盘是指容量比较大的磁盘。存储后，可以根据文件访问情况，将访问频率较高的文件迁移到预留的少量始终上电的磁盘中。以有效减少磁盘被上电或唤醒的次数，提升响应速度。

[00137] 进一步的，为了避免磁盘的频繁上电和下电，在本发明实施例的存储系统中还可以提供预警机制和保护机制。通过统计 RA I D中各磁盘累计上电和下电的次数，当预定时间内某个磁盘的上电和下电次数超过预设的阈值时，系统进行提示或告警，并可以釆取一些保护措施。其中，设置的阈值例如可以为 10 次 /天或 100次 /月。保护措施可以设置为在设定的时间内不再对该磁盘进行上电或下电操作等等，在此不做限定。

[00138] 图 11为本发明实施例一种文件处理装置的结构示意图，如图 11所示，文件处理装置 1100包括：

接收模块 1102 , 用于接收待存储于 RAID中的 F个文件，所述 RAID由 T个存储器组成， F为不小于 2的自然数， T为不小于 3的自然数；

划分模块 1104 , 用于将所述 F个文件按照所述 RAID的条带大小划分成至少两个数据块；

处理模块 1106 , 用于根据所述至少两个数据块获得 T行的第一矩阵，其中，属于同一个文件的数据块位于所述第一矩阵的同一行中；

写入模块 1108 , 用于将所述第一矩阵中的每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中。

[00139] 具体的，所述处理模块 1106用于：

[00140] 在一种情形下，当所述 RAID中包括独立校验存储器时，所述处理模块具体用于：

根据所述 RAI D的校验算法分别对所述第二矩阵中每一列的数据块进行计算，获得每一列数据块的校验块；

[00141] 在另一种情形下，当所述 RAID中不包括独立校验存储器时，所述处理模块具体用于：

确定在所述第二矩阵的各列中插入校验块的位置 A [X, y] ,其中，所述第二矩阵具有 N列， X和 y均为整数， X的取值由 0递增到 D-l , y的取值由 0递增到 N-1 ; 将所述第二矩阵的 X行中 y列至（N-1 ) 列的数据块顺序移动到 X行中（y+1)列至 N列的位置；

[00142] 在一种情形下，所述写入模块 1108具体用于：

[00143] 在另一种情形下，所述写入模块 1108具体用于：

根据填充后的 y列中的数据块更新所述 y列的校验块；

[00144] 在又一种情形下，所述写入模块 1108具体用于：

当所述第一矩阵的 y列中的数据块和根据所述 y列的数据块计算获得的校验块组成的分条中未写满数据时，将所述 y列中没有数据块的位置填充为 0, 并将填充后的 y列的数据块和所述校验块组成分条写入构建所述第一 RAID的存储器中，其中，所述 y列为所述第一矩阵中的其中一列。

[00145] 进一步的，在又一种情形下，所述接收模块 1102 , 还可以用于：接收主机的访问请求，所述访问请求用于读取存储于所述 RAID中的文件，所述访问请求中携带有要访问的文件的逻辑地址；

所述文件处理装置还包括：

读取模块 1110 , 用于根据所述逻辑地址查询存放所述文件的数据块的物理地址，根据所述物理地址确定存储所述文件的一个存储器，并将存储于所述存储器中的所述文件的数据块返回给所述主机。

[00146] 本发明实施例所提供的文件处理装置，可以设置于前面实施例所描述的控制器中，用于执行前面实施例所描述的文件处理方法，各个单元功能的详细描述可参见方法实施例中的描述，在此不再赘述。

[00147] 本发明实施例描述的文件处理装置，能够将属于同一个文件的数据能够被存储于一个磁盘中。并且，本发明实施例描述的文件处理装置能够将不同文件的数据块构成一个分条写入磁盘。当某个数据块被损坏时，文件处理装置可以通过同一个分条中的校验块和其他文件的数据块对损坏的数据块进行恢复，提高了文件存储的安全性。进一步的，本发明实施例描述的文件处理装置在读取文件时，只需要将存储该文件的一个磁盘唤醒或上电，并从该磁盘中读取该文件的数据返回给主机，而无需对 RAID中的所有磁盘进行唤醒或上电，因此达到了较好的节能效果。

[00148] 本发明实施例还提供一种数据处理的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令用于执行前述任意一个方法实施例所述的方法流程。本领域普通技术人员可以理解，前述的存储介质包括： U盘、移动硬盘、磁碟、光盘、随机存储器（Random-Acces s Memory, RAM)、固态硬盘（ Sol id State Di sk, SSD )或者非易失性存储器（ non-volat i le memory ) 等各种可以存储程序代码的非短暂性的（non-t rans i tory )机器可读介质。

[00149] 在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个设备中，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耜合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机 ^¾或其它的形式。

[00150] 所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以才艮据实际的需要选择其中的部分或者全部 , 模块来实现本实施例方案的目的。

[00151] 另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

[00152] 最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权利要求

1、一种文件处理方法，其特征在于，包括：

将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 Τ个存储器中。

2、根据权利要求 1所述的方法，其特征在于，所述根据所述至少两个数据块获得 T行的第一矩阵包括：

3、根据权利要求 2所述的文件处理方法，其特征在于，当所述 RAID中包括独立校验存储器时，所述分别在所述第二矩阵的每一列中插入校验块，获得所述 T 行的第一矩阵包括：

4、根据权利要求 2所述的文件处理方法，其特征在于，当所述 RAID中不包括独立校验存储器时，所述分别在所述第二矩阵的每一列中插入校验块，获得 T行的第一矩阵包括：

5、根据权利要求 1-4任意一项所述的文件处理方法，其特征在于，所述将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中包括：

6、根据权利要求 1-4任意一项所述的文件处理方法，其特征在于，所述第一矩阵具有 M列，所述将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中包括：

根据填充后的 y列中的数据块更新所述 y列的校验块；

7、根据权利要求 1-4任意一项所述的文件处理方法，其特征在于，所述将所述第一矩阵中每一列的数据块和根据该列数据块计算获得的校验块组成分条，写入构建所述 RAID的 T个存储器中包括：当所述第一矩阵的 y列中的数据块和根据所述 y列的数据块计算获得的校验块组成的分条中未写满数据时，将所述 y列中没有数据块的位置填充为 0, 并将填充后的 y列的数据块和所述校验块组成分条写入构建所述 RAID的存储器中，其中，所述 y列为所述第一矩阵中的其中一列。

8、根据权利要求 1-7任意一项所述的文件处理方法，其特征在于，还包括：接收主机的访问请求，所述访问请求用于读取存储于所述 RAID中的文件，所述访问请求中携带有要访问的文件的逻辑地址；

根据所述逻辑地址查询存放所述文件的数据块的物理地址；

根据所述物理地址确定存储所述文件的一个存储器；

9、一种文件处理方法，其特征在于，包括：

接收待存储于独立磁盘冗余阵列（Redundant Array of Independent Di sks ,

RAID ) 中的 F个文件；

10、根据权 9所述的方法，其特征在于，还包括：

根据所述逻辑地址查询存放所述文件的数据块的物理地址；

根据所述物理地址确定存储所述文件的一个存储器；

11、一种文件处理装置，其特征在于，包括：

接收模块，用于接收待存储于独立磁盘冗余阵列（Redundant Array of Independent Di sks , RAID ) 中的 F个文件，所述 RAID由 T个存储器组成， F为不小于 2的自然数， T为不小于 3的自然数；

12、根据权利要求 11所述的文件处理装置，其特在于，所述处理模块具体用于：

13、根据权利要求 12所述的文件处理装置，其特征在于，当所述 RAID中包括独立校验存储器时，所述处理模块具体用于：

14、根据权利要求 12所述的文件处理装置，其特征在于，当所述 RAID中不包括独立校验存储器时，所述处理模块具体用于：

15、根据权利要求 11-14任意一项所述的文件处理装置，其特征在于，所述写入模块具体用于：

16、根据权利要求 11-14任意一项所述的文件处理装置，其特征在于，所述第一矩阵具有 M列，所述写入模块具体用于：

根据填充后的 y列中的数据块更新所述 y列的校验块；

17、根据权利要求 11-14任意一项所述的文件处理装置，其特征在于，所述写入模块具体用于：

18、根据权利要求 11-17任意一项所述的文件处理装置，其特征在于：所述接收模块，还用于接收主机的访问请求，所述访问请求用于读取存储于所述 RAID中的文件，所述访问请求中携带有要访问的文件的逻辑地址；

所述文件处理装置还包括：

19、一种存储设备，包括控制器和独立磁盘冗余阵列（ Redundant Array of Independent Di sks , RAID ), 其特征在于：

所述 RAID,用于存储文件；

所述控制器包括：

所述存储器，用于存储计算机执行指令；

所述处理器，用于运行所述计算机执行指令，执行如权利要求 1-8任意一项所述的方法。

20、一种计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令用于执行如权利要求 1 -8任意一项所述的方法。