WO2018112980A1

WO2018112980A1 - 存储控制器、数据处理芯片及数据处理方法

Info

Publication number: WO2018112980A1
Application number: PCT/CN2016/111930
Authority: WO
Inventors: 曾雁星; 沈建强; 王工艺; 张进毅; 吕温
Original assignee: 华为技术有限公司
Priority date: 2016-12-24
Filing date: 2016-12-24
Publication date: 2018-06-28
Also published as: EP3364541A4; US20180260276A1; CN110089035B; US10210044B2; EP3364541A1; EP3364541B1; CN110089035A

Abstract

一种存储控制器，该存储控制器运行时，根据校验矩阵对从客户端获取的待编码的K个数据大块chunk进行编码，以生成2个校验chunk，以便后续如果有任一chunk损坏的情况下，可以通过该校验矩阵和未损坏的chunk恢复损坏的chunk。该存储控制器提升了恢复损坏的chunk的效率。

Description

存储控制器、数据处理芯片及数据处理方法

技术领域

本申请涉及存储技术领域，尤其涉及一种存储控制器，数据处理芯片以及数据处理方法。

背景技术

大规模存储场景中的存储系统包括多个存储介质和存储控制器，存储介质可以由硬盘(英文：hard disk drive，缩写：HDD)或固态硬盘(英文：solid state drive，缩写：SSD)或两者的组合构成。客户端通过通信网络，将待写入数据发送至存储控制器，存储控制器对待写入的数据进行处理并存入存储介质中。现有的存储系统一般采用了独立磁盘构成的具有冗余能力的阵列(英文：redundant arrays of independent disks，缩写：RAID)技术，而RAID技术的核心就是纠删码(英文：erasure code)的编码和解码技术。

现有的纠删码的编码和解码技术效率较低。

发明内容

本申请提供了一种存储控制器，以提升纠删码的编码和解码效率。

本申请的第一方面提供了一种存储控制器，包括了处理器、存储器和通信接口。该存储控制器运行时，该处理器通过该通信接口获取待编码的K个数据大块chunk，并将所述K个数据chunk缓存入所述存储器，每个数据chunk包括R个数据编码块，R+1为素数且R+1>K。

该处理器通过该通信接口持续接收客户端发来的待写入数据并缓存入该存储器。该存储器中缓存了预设数量大小的待写入数据后，该处理器将所述预设数量的待写入数据分成K个待编码的数据大块，每个数据chunk被分为R个数据编码块。

随后，该处理器，还用于执行所述存储器中的代码执行以下操作：读取所述存储器中存储的所述K个数据chunk，根据校验矩阵和所述K个数据chunk 生成第一校验chunk和第二校验chunk，每个校验chunk包括R个校验编码块。

其中，所述校验矩阵有2*R行，所述校验矩阵中第(k-1)*R+1列至第k*R列为所述K个数据chunk中第k个数据chunk的chunk列集合，K≥k≥1，所述校验矩阵中第K*R+1列至第(K+1)*R列为对应所述第一校验chunk的chunk列集合，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列为所述第二校验chunk的chunk列集合。

所述校验矩阵为标准校验矩阵H或由标准校验矩阵H执行N次调换操作后得到，N≥1，所述调换操作指将任意两个chunk列集合调换；所述标准校验矩阵H中除以下坐标为1外，其余坐标均为0，2*R≥i≥1，(K+2)*R≥j≥1，

如果i<j，则

H[i+1][j*R+(R-j+i)mod R+1]

H[R+i+1][(j+1)*R-(R-j+i)mod R]

如果i>j，则

H[i+1][j*R+(R-1-j+i)mod R+1]

H[R+i+1][(j+1)*R-(R-1-j+i)mod R]。

所述校验矩阵在所述存储器中的存储形态可以有两种。第一种存储形态为一个行数为2*R，列数为(K+2)*R的矩阵。由于校验矩阵的每一行代表了一个异或方程，因此该校验矩阵代表了2*R个异或方程，因此，所述校验矩阵的第二种存储形态为2*R个异或方程，通过这2*R个异或方程也可以获得一个行数为2*R，列数为(K+2)*R的矩阵。

结合第一方面，在第一方面的第一种实现方式中，所述校验矩阵中第(k-1)*R+1列至第k*R列分别对应所述K个数据chunk中第k个数据chunk的R个数据编码块，所述校验矩阵中第K*R+1列至第(K+1)*R列分别对应所述第一校验chunk的R个校验编码块，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列分别对应所述第二校验chunk的R个校验编码块。也即，所述校验矩阵中的每一列，对应一个数据编码块或者一个校验编码块。

所述校验矩阵的第D行有3个坐标为1，所述第D行为所述校验矩阵的任一行。这3个为1的坐标对应了3个编码块。对所述校验矩阵的第D行中为1的坐标对应的3个编码块中的任意2个编码块进行一次异或运算可以得到所述校验矩阵的第D行中为1的坐标对应的3个编码块中未参与本次异或运算的编码块。也即如果所述校验矩阵的某一行的3个为1的坐标分别对应了编码块1、编码块2和编码块3，则编码块1、编码块2和编码块3中任意两个编码块之间进行异或运算可以得到另一个编码块。

结合第一方面的第一种实现方式，在第一方面的第二种实现方式中，所述处理器在根据所述校验矩阵生成第一校验chunk和第二校验chunk的过程中，从起始编码行开始编码。该起始编码行为第一校验chunk和第二校验chunk对应的2*R列中仅有1个坐标为1的行。

由于校验矩阵的每一行对应一个异或方程，而编码开始时，已知的仅有K*R个数据编码块，因此编码只能从起始编码行开始。所述校验矩阵一共有4个起始编码行。

完成第一起始编码行对应的异或方程后(第一起始编码行为4个起始编码行之任一)，获取了校验编码块1。如果校验编码块1在所述校验矩阵对应的列中只有1个坐标为1，则第一起始编码行起始的编码过程完成。如果校验编码块1在所述校验矩阵对应的列中有2个坐标为1，则跳转到这2个坐标所在的行中还未被用于生成校验编码块的行。执行跳转到的行对应的异或方程，获取了校验编码块2。对校验编码块2执行校验编码块1相同的处理。如果校验编码块2在所述校验矩阵对应的列中只有1个坐标为1，则第一起始编码行起始的编码过程完成。如果校验编码块2在所述校验矩阵对应的列中有2个坐标为1，则跳转到这2个坐标所在的行中还未被用于生成校验编码块的行。执行跳转到的行对应的异或方程，获取了校验编码块3，对校验编码块2执行校验编码块1相同的处理，依次类推，直至第一起始编码行起始的编码过程完成。对所述校验矩阵的4个起始编码行，均执行上述第一起始编码行的编码过程，4个起始编码行起始的编码过程均完成后，则获取了2*R个校验编码块。

结合第一方面或第一方面的第一种或第二种实现方式，在第一方面的第三种实现方式中，所述处理器根据所述校验矩阵，获取了所述第一校验chunk和所述第二校验chunk后，通过所述通信接口将所述K个数据chunk、所述第一校验chunk和所述第二校验chunk分别存入所述存储控制器所在的存储系统的K+2个存储介质中。一般不同的chunk存入不同的存储介质中。

获取2*R个校验编码块后，每R个校验编码块形成一个校验chunk，这2个校验chunk和K个数据chunk组成了一个chunk group，一个chunk group中的每个chunk被存入不同的存储介质中，以便后续有存储介质损坏的时候，可以通过该chunk group中未损坏的chunk来恢复损坏的存储介质上存储的chunk。

结合第一方面的第三种实现方式，在第一方面的第四种实现方式中，在所述K个数据chunk、所述第一校验chunk和所述第二校验chunk被存入所述存储控制器所在的存储系统的K+2个存储介质中后，如果所述K+2个存储介质中有存储介质损坏，则所述处理器根据所述校验矩阵和所述K+2存储介质中未损坏的存储介质上存储的数据chunk和所述第一校验chunk和所述第二校验chunk中的至少一个，恢复所述损坏的存储介质。

如果损坏的存储介质上存储的是数据chunk，则根据其余K+1个存储介质上存储的K-1个数据chunk和2个校验chunk恢复损坏的数据chunk。如果损坏的存储介质上存储的是校验chunk，则根据其余K+1个存储介质上存储的K个数据chunk和1个校验chunk，恢复损坏的校验chunk。

恢复过程中，虽然要使用到未损坏的每个数据chunk和未损坏的每个校验chunk，但并不需要使用到未损坏的每个数据chunk的每个数据编码块和未损坏的每个校验chunk的每个校验编码块，具体采用哪些数据编码块和哪些校验编码块来恢复损坏的chunk，需要根据损坏的chunk在所述校验矩阵中对应的列参与了哪几行对应的异或方程决定。

由于解码过程与编码过程强耦合，通过在编码过程中的改进，本申请第一方面提供的存储控制器降低了恢复开销，提升了后续恢复损失的chunk时的效率。

本申请的第二方面提供了一种数据处理芯片，包括电路和读写接口；所述电路用于，通过所述读写接口获取待编码的K个数据大块chunk，每个数据chunk包括R个数据编码块，R+1为素数且R+1>K；所述电路还用于，根据校验矩阵和所述K数据chunk生成第一校验chunk和第二校验chunk，每个校验chunk包括R个校验编码块；其中，所述校验矩阵有2*R行，所述校验矩阵中第(k-1)*R+1列至第k*R列为所述K个数据chunk中第k个数据chunk的chunk列集合，K≥k≥1，所述校验矩阵中第K*R+1列至第(K+1)*R列为应所述第一校验chunk的chunk列集合，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列为所述第二校验chunk的chunk列集合；所述校验矩阵为标准校验矩阵H或由标准校验矩阵H执行N次调换操作后得到，N≥1，所述调换操作指示将任意两个chunk列集合调换；所述标准校验矩阵H中除以下坐标为1外，其余坐标均为0，2*R≥i≥1，(K+2)*R≥j≥1，

如果i<j，则

H[i+1][j*R+(R-j+i)mod R+1]

H[R+i+1][(j+1)*R-(R-j+i)mod R]

如果i>j，则

H[i+1][j*R+(R-1-j+i)mod R+1]

H[R+i+1][(j+1)*R-(R-1-j+i)mod R]。

所述第二方面的具体实现方式及取得的技术效果与所述第一方面的各实现方式类似，在此不再赘述。

本申请的第三方面提供了一种数据处理方法，第一方面中提供的存储控制器和第二方面中提供的数据处理芯片工作时，执行该数据执行方法，包括：

获取待编码的K个数据大块chunk并缓存所述K个数据chunk，每个数据chunk包括R个数据编码块，R+1为素数且R+1>K；

根据校验矩阵和所述K个数据chunk生成第一校验chunk和第二校验chunk，每个校验chunk包括R个校验编码块；

其中，所述校验矩阵有2*R行，所述校验矩阵中第(k-1)*R+1列至第k*R列为所述K个数据chunk中第k个数据chunk的chunk列集合，K≥k≥1，所述校验矩阵中第K*R+1列至第(K+1)*R列为对应所述第一校验chunk的chunk列集合，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列为所述第二校验chunk的chunk列集合；

如果i<j，则

H[i+1][j*R+(R-j+i)mod R+1]

H[R+i+1][(j+1)*R-(R-j+i)mod R]

如果i>j，则

H[i+1][j*R+(R-1-j+i)mod R+1]

H[R+i+1][(j+1)*R-(R-1-j+i)mod R]。

结合第三方面，在第三方面的第一种实现方式中，所述校验矩阵中第(k-1)*R+1列至第k*R列分别对应所述K个数据chunk中第k个数据chunk的R个数据编码块，所述校验矩阵中第K*R+1列至第(K+1)*R列分别对应所述第一校验chunk的R个校验编码块，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列分别对应所述第二校验chunk的R个校验编码块；

所述校验矩阵的第D行有3个坐标为1，所述第D行为所述校验矩阵的任一行，对所述校验矩阵的第D行中为1的坐标对应的3个编码块中的任意2个编码块进行一次异或运算可以得到所述校验矩阵的第D行中为1的坐标对应的3个编码块中未参与本次异或运算的编码块。

结合第三方面的第一种实现方式，在第三方面的第二种实现方式中，在根据所述校验矩阵生成第一校验chunk和第二校验chunk的过程中，从起始编码行开始编码。该起始编码行为第一校验chunk和第二校验chunk对应的2*R列中仅有1个坐标为1的行。

结合第三方面或第三方面的第一种或第二种实现方式，在第三方面的第三种实现方式中，该方法还包括：将所述K个数据chunk、所述第一校验chunk和所述第二校验chunk分别存入执行该数据处理方法的存储控制器所在的存储系统的K+2个存储介质中。

结合第三方面的第三种实现方式，在第三方面的第四种实现方式中，该方法还包括：当所述存储控制器所在的存储系统的K+2个存储介质中有存储介质损坏时，根据所述校验矩阵和所述存储控制器所在的存储系统的K+2存储介质中未损坏的存储介质上存储的数据chunk和所述第一校验chunk和所述第二校验chunk中的至少一个，恢复所述损坏的存储介质。

本申请第三方面提供的数据处理方法通过在编码过程中的改进，降低了恢复开销，提升了后续恢复损失的chunk时的效率。

本申请第四方面提供了一种存储介质，该存储介质中存储了程序，该程序被计算设备运行时，该计算设备执行前述第三方面或第三方面的任一实现方式提供的数据处理方法。该存储介质包括但不限于只读存储器，随机访问存储器，快闪存储器、HDD或SSD。

本申请第五方面提供了一种计算机程序产品，该计算机程序产品包括程序指令，当该计算机程序产品被计算机执行时，该计算机执行前述第三方面或第三方面的任一实现方式提供的数据处理方法。该计算机程序产品可以为一个软件安装包，在需要使用前述第三方面或第三方面的任一实现方式提供的数据处理方法的情况下，可以下载该计算机程序产品并在计算设备上执行该计算机程序产品。

附图说明

为了更清楚地说明本申请实施例的技术方法，下面将对实施例中所需要使用的附图作以简单地介绍。

图1-1为本申请实施例提供的存储系统的组织结构示意图；

图1-2为本申请实施例提供的另一存储系统的组织结构示意图；

图2为本申请实施例提供的又一存储系统的组织结构示意图；

图3为本申请实施例提供的校验矩阵的结构示意图；

图4-1为本申请实施例提供的另一校验矩阵的结构示意图；

图4-2为本申请实施例提供的又一校验矩阵的结构示意图；

图5为本申请实施例提供的又一校验矩阵的结构示意图；

图6为本申请实施例提供的存储控制器的组织结构示意图；

图7为本申请实施例提供的另一存储控制器的组织结构示意图；

图8为本申请实施例提供的又一存储控制器的组织结构示意图；

图9为本申请实施例提供的又一存储控制器的组织结构示意图；

图10为本申请实施例提供的数据处理芯片的组织结构示意图。

具体实施方式

下面结合本申请实施例中的附图，对本申请实施例中的技术方法进行描述。

本申请中各个“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系。

贯穿本说明书，两个编码块之间的异或运算(英文：exclusive OR，缩写：XOR)，指代两个编码块的每一bit数据依次进行异或运算。例如编码块1的第1bit与编码块2的第1bit进行异或运算，得到编码块3的第1bit，依次类推，直至编码块的最后一个bit与编码块2的最后一个bit进行异或运算，得到编码块3的最后一个bit。则，编码块3由编码块1和编码块2之间进行异或运算得到。

贯穿本说明书，恢复开销为衡量存储chunk group的数据的K+2个存储介质中任一存储介质损坏的情况下，恢复损坏的存储介质所需的对存储介质的访问开销的参数。恢复开销等于恢复损坏的存储介质时从未损坏的存储介质读取的编码块的大小与该chunk group中全部数据编码块的大小之比。因此，恢复开销越小，说明了在有存储介质损坏的情况下，所需的恢复时间越短。chunk group的定义，将在下文详细说明。

贯穿本说明书，mod为求余函数，也即A mod B指示A除以B得到的余数，A和B均为整数，例如4mod 3＝1。

本申请实施例所应用的架构

如图1-1和图1-2介绍了两种不同架构的存储系统。图1-1中的存储系统也称为存储阵列，存储控制器和存储介质均设置于存储阵列内部。图1-2为分布式的存储系统，该存储系统包括多个存储节点，每个存储节点实际可以为服务器。该存储系统的至少一个存储节点包括存储控制器，每个存储节点均包括存储介质，各个存储节点通过通信网络建立通信连接。

图1-1的存储阵列中的存储控制器仅对客户端发往该存储阵列的待写入数据进行处理。图1-2中的每个存储控制器均可以接收客户端发来的待写入数据并对其进行纠删码的编码和解码处理。一个存储控制器编码后获取的数据不仅可以被存入该存储控制器所在的存储节点的存储介质，还可以通过通信网络发往其他存储节点的存储介质，以实现分布式的存储。由于分布式的存储系统中，可能存在多个存储控制器并行工作，因此这多个存储控制器中的每个存储控制器负责存储系统中的一个存储节点组，每个存储节点组中包括至少一个存储节点。一个存储节点组中的存储控制器负责接收客户端发来的待写入数据，对其进行编码后存入该存储节点组的存储节点中。下文中的存储控制器，可以指代图1-1或图1-2中的任一存储控制器，该存储控制器用于纠删码的编码和解码。

如图2所示，在存储系统运行过程中，存储控制器持续接收客户端发来的待写入数据，接收到预设数量大小的待写入数据后，存储控制器将所述预设数量的待写入数据分成K个待编码的数据大块(英文：chunk)，每个数据chunk被分为R个数据编码块，并根据这K*R个数据编码块和纠删码的编码方法，生成2个校验chunk，每个校验chunk包括R个校验编码块。每K个数据chunk和通过这K个数据chunk生成的校验chunk组成一个chunk组(英文：group)。其中，每个chunk的大小可以根据需要进行设置，例如为512Byte、4k Byte、8k Byte、32k Byte等。

生成一个chunk group后，存储控制器将该chunk group中的每个chunk存入一个SSD中，存储系统采用的存储介质为HDD或其他种类的设备的情况与之类似。存储控制器将一个chunk group中每个chunk存入对应的SSD 中之后，继续将客户端发来的待写入数据形成另一个chunk group并采用类似的方式存储。

每个chunk在SSD中被分为R个编码块进行存储。图2中，将数据chunk对应的编码块称为数据编码块，将校验chunk对应的编码块称为校验编码块。虽然每个chunk的全部R个编码块都存储于同一个SSD，但这R个编码块的存储地址(可以是物理存储地址或者逻辑存储地址)可以不连续。一般一个chunk group中的每个编码块的大小相同。R和K需要符合以下条件：R+1为素数且R+1>K，R、K均为正整数。R一般为存储系统的配置参数，K一般为用户设置的参数，为了应对用户的不同需求，存储控制器具有应对不同K和R的配置下的纠删码的编码和解码方法。

如果任何一个SSD损坏了，那么需要用到损坏的SSD上的chunk所属的chunk group上的其余chunk来恢复损坏的SSD上的chunk，恢复过程需要使用纠删码的解码方法。

每个校验编码块，是由2个来自2个不同chunk的编码块进行异或运算得到的，这两个chunk可以为一个数据chunk和一个校验chunk，或者这两个chunk均为数据chunk。存储控制器在生成校验chunk的过程中通过预设于存储控制器中的校验矩阵来确定这2*R个校验编码块中的每个校验编码块分别由哪2个编码块运算得到。

由于异或运算的特性，生成一个校验编码块的2个编码块和该校验编码块之中，任意2个编码块进行异或运算都可以得到剩余的1个编码块。因此，当任一SSD损坏时，存储控制器通过该校验矩阵也可以得知该损坏的SSD上存储的chunk的每个编码块可以通过哪2个编码块运算得出。

该校验矩阵的行数为2*R且列数为(K+2)*R。校验矩阵的每一列对应一个编码块，每一行对应一个异或方程。如图3所示，X-Y指代数据chunk X的第Y个编码块，后文称之为数据编码块X-Y，K≥X≥1，R≥Y≥1。而两个校验chunk分别称之为校验chunk P和校验chunk Q，因此P-Y指代校验chunk P的第Y个编码块，后文称之为校验编码块P-Y，而Q-Y指代校验chunk Q的第Y个编码块，后文称之为校验编码块Q-Y，R≥Y≥1。

校验矩阵中每一个chunk对应的R列，合称为一个chunk列集合，因此一个行数为2*R且列数为(K+2)*R的校验矩阵中，一共有K+2个chunk列集合。该校验矩阵的第1至第R列属于数据chunk 1对应的chunk列集合，该校验矩阵的第R+1至第2R列属于数据chunk 2对应的chunk列集合，依次类推，该校验矩阵的第K*R+1至第(K+1)*R列属于校验chunk P对应的chunk列集合，该校验矩阵的第(K+1)*R至第(K+2)*R列属于校验chunk Q对应的chunk列集合。

校验矩阵的每一行有3个坐标为1，指示这3个坐标对应的3个编码块中任意2个之间进行异或运算可以得到另一个编码块。如图3中，校验矩阵第1行指示：数据编码块2-R、数据编码块K-3、校验编码块Q-R三者之中，任意两者之间进行异或运算可以获得没参与异或运算的编码块。需要说明的是，图3仅为示例性的展示校验矩阵的结构。

本申请实施例所应用的校验矩阵

本申请实施例所应用的校验矩阵，可以为标准校验矩阵H，或由标准校验矩阵H执行N次调换操作后得到，N≥1。一次调换操作指，将一个行数为2*R且列数为(K+2)*R的矩阵中任意两个chunk列集合调换。由于标准校验矩阵H实际提供了2*R个异或方程，每个异或方程用于得出1个校验编码块，因此对标准校验矩阵H执行N次调换操作后得到的矩阵，仍然可以得出2*R个校验编码块。

该标准矩阵H符合以下条件，下式中2*R≥i≥1，(K+2)*R≥j≥1：

如果i<j，则

H[i+1][j*R+(R-j+i)mod R+1]＝1 式1

H[R+i+1][(j+1)*R-(R-j+i)mod R]＝1 式2

如果i>j，则

H[i+1][j*R+(R-1-j+i)mod R+1]＝1 式3

H[R+i+1][(j+1)*R-(R-1-j+i)mod R]＝1 式4

除式1至式4指示的坐标外，标准校验矩阵H中其余坐标均为0。

如图4-1为K＝2，R＝4时的标准矩阵H。图4-2为将标准矩阵H的数据chunk 1对应的chunk列集合和数据chunk 2对应的chunk列集合调换后得到的校验矩阵。可以看到，图4-1提供的标准矩阵H的第1列至第4列的内容被调换到了图4-2提供的校验矩阵的第5列至第8列，而图4-1提供的标准矩阵H的第5列至第8列的内容被调换到了图4-2提供的校验矩阵的第1列至第4列。图4-2提供的校验矩阵中，第1列至第4列依然对应数据chunk 1的4个数据编码块，第5列至第8列依然对应数据chunk 5的4个数据编码块。

以下，介绍编码过程。

首先，从校验矩阵中的起始编码行进行编码。

起始编码行为校验矩阵中2个校验chunk对应的2*R列中仅有1个坐标为1的行。由于校验矩阵的每一行对应一个异或方程，而编码开始时，已知的仅有K*R个数据编码块，因此编码只能从起始编码行开始。

每个校验矩阵中，有4个起始编码行。这4个起始编码行对应的编码过程互不干扰，实际使用中可以并行执行。

针对起始编码行1的编码过程如下：

step 1：根据起始编码行1进行异或运算得出校验编码块1。

step 2：如果校验编码块1仅参与了一个异或方程，即校验编码块1所在的列仅有一个坐标为1，则起始编码行1起始的编码结束。

step 3：如果校验编码块1参与了两个异或方程，即校验编码块1所在的列有两个坐标为1。则根据校验编码块1参与的两个异或方程中，未在step 2中使用的异或方程所在的行进行编码，得到校验编码块2。

对校验编码块2继续执行step 2或step 3，也即如果校验编码块2仅参与了一个异或方程，即校验编码块2所在的列仅有一个坐标为1，则起始编码行1起始的编码结束。校验编码块2如果参与了两个异或方程，即校验编码块2所在的列有两个坐标为1，则根据校验编码块2参与的两个异或方程中，未在中使用的异或方程所在的行进行编码，得到校验编码块3。

对校验编码块3继续执行step 2或step 3。依此类推，直至某次编码后，得到的校验编码块仅参与了1个异或方程，则该起始编码行1起始的编码结束。

其中，起始编码行1为一个校验矩阵中的4个起始编码行中之任一。

对校验矩阵的4个起始编码行，均执行上述起始编码行1的编码过程即可获取2*R个校验编码块，则存储控制器获取了全部的数据chunk和校验 chunk。

以K＝2、R＝4，且采用标准校验矩阵的情况为例，如图5，第3、4、7、8行中，校验chunk P和校验chunk Q对应的2*R列内仅有1个坐标为1，因此第3、4、7、8行为该校验矩阵的起始编码行。

根据第3行进行编码：

step 1.1数据编码块1-2XOR数据编码块2-1＝校验编码块Q-4。

由标准校验矩阵的第16列可知，校验编码块Q-4仅参与了一个异或方程，因此由第3行起始的编码结束。

根据第4行进行编码：

step 2.1数据编码块1-3XOR数据编码块2-2＝校验编码块P-1。

由标准校验矩阵的第9列可知，校验编码块P-1参与了两个异或方程，分别对应标准校验矩阵的第4行和第6行，因此，接下来根据第6行进行编码：

step 2.2数据编码块1-4XOR校验编码块P-1＝校验编码块Q-2。

由标准校验矩阵的第14列可知，校验编码块Q-2参与了两个异或方程，分别对应标准校验矩阵的第6行和第1行，因此，接下来根据第1行进行编码：

step 2.3数据编码块2-4XOR校验编码块Q-2＝校验编码块P-3。

由标准校验矩阵的第11列可知，校验编码块P-3仅参与了一个异或方程，因此由第4行起始的编码结束。

根据第7行进行编码：

step 3.1数据编码块1-3XOR数据编码块2-4＝校验编码块Q-1。

由标准校验矩阵的第13列可知，校验编码块Q-1仅参与了一个异或方程，因此由第7行起始的编码结束。

根据第8行进行编码：

step 4.1数据编码块1-2XOR数据编码块2-3＝校验编码块P-4。

由标准校验矩阵的第12列可知，校验编码块P-4参与了两个异或方程，分别对应标准校验矩阵的第2行和第8行，因此，接下来根据第2行进行编码：

step 4.2数据编码块1-1XOR校验编码块P-4＝校验编码块Q-3。

由标准校验矩阵的第15列可知，校验编码块Q-3参与了两个异或方程，分别对应标准校验矩阵的第2行和第5行，因此，接下来根据第5行进行编码：

step 4.3数据编码块2-1XOR校验编码块Q-3＝校验编码块P-2。

由标准校验矩阵的第10列可知，校验编码块P-2仅参与了一个异或方程，因此由第8行起始的编码结束。

至此，4个起始编码行的编码均结束了，校验编码块P-1至校验编码块Q-4已经全部被编码得出，因此存储控制器生成了数据chunk 1和数据chunk2对应的chunk group。

以下，介绍解码过程。

通过上述编码过程，存储控制器获取了待存储的数据chunk对应的chunk group并存入K+2个SSD后，如果这K+2个SSD中有SSD损坏了，则需要用到纠删码的解码方法恢复损坏的SSD上存储的数据chunk或校验chunk。具体的，可以由该存储控制器检测出该损坏的SSD，或者该存储控制器被通知这K+2个SSD中有SSD损坏。

如果K+2个SSD中仅有一个SSD损坏，也即chunk group中只有一个chunk需要恢复。对于该损坏的chunk的每个编码块的恢复过程如下，编码块1为损坏的chunk中的R个编码块中之任一：

则根据该校验矩阵，获取编码块1参与的异或方程，并根据编码块1参与的异或方程获取用于恢复编码块1的其余两个编码块；

将其余两个编码块做异或运算，得到编码块1。

由于任一chunk的R个编码块中，有R-2个编码块参与了两个异或方程。每个参与了两个异或方程的编码块在恢复的过程中，可以使用其参与的两个异或方程中的任何一个。因此，实际的解码方法可以有2^R-2种。

这2^R-2种解码方法虽然都可以完成损坏的chunk的恢复，但由于编码块1的恢复过程中，需要将用于编码块1恢复的两个编码块从SSD中读到存储控制器中，再由存储控制器完成恢复过程。不同的解码方法可能导致恢复全部R个编码块的过程中，需要从SSD中读出的编码块的数量不同，因此对于一个确定的校验矩阵，对于任一chunk损坏的情况下，可以采用一种需要从SSD中读出编码块的数量最少的解码方法。

仍以K＝2、R＝4，且采用标准校验矩阵的情况下为例，如图4-1。

如果数据chunk 1所在的SSD损坏，则需要恢复数据编码块1-1、数据编码块1-2、数据编码块1-3和数据编码块1-4。

数据编码块1-1仅参与了校验矩阵第2行对应的异或方程：

数据编码块1-1＝校验编码块P-4XOR校验编码块Q-3。

数据编码块1-2参与了校验矩阵第3行和校验矩阵第8行对应的异或方程：

数据编码块1-2＝数据编码块2-1XOR校验编码块Q-4；

数据编码块1-2＝数据编码块2-3XOR校验编码块P-4。

数据编码块1-3参与了校验矩阵第4行和校验矩阵第7行对应的异或方程：

数据编码块1-3＝数据编码块2-2XOR校验编码块P-1；

数据编码块1-3＝数据编码块2-4XOR校验编码块Q-1。

数据编码块1-4仅参与了校验矩阵第6行对应的异或方程：

数据编码块1-4＝校验编码块P-1XOR校验编码块Q-2。

由于数据编码块1-2和数据编码块1-3均参与了两个异或方程，因此一共有2²＝4种解码方法。

解码方法1，数据编码块1-2的恢复采用了校验矩阵第3行对应的异或方程，且数据编码块1-3的恢复采用了校验矩阵第4行对应的异或方程，则：

恢复开销＝(校验编码块P-4、校验编码块Q-3、数据编码块2-1、校验编码块Q-4、数据编码块2-2、校验编码块P-1、校验编码块Q-2)/8个数据编码块＝0.875。

解码方法2：数据编码块1-2的恢复采用了校验矩阵第8行对应的异或方程，且数据编码块1-3的恢复采用了校验矩阵第4行对应的异或方程，则：

恢复开销＝(校验编码块P-4、校验编码块Q-3、数据编码块2-3、数据编码块2-2、校验编码块P-1、校验编码块Q-2)/8个数据编码块＝0.75。

解码方法3：数据编码块1-2的恢复采用了校验矩阵第3行对应的异或方程，且数据编码块1-3的恢复采用了校验矩阵第7行对应的异或方程，则：

恢复开销＝(校验编码块P-4、校验编码块Q-3、数据编码块2-1、校验编码块Q-4、数据编码块2-4、校验编码块Q-1、校验编码块P-1、校验编码块Q-2)/8个数据编码块＝1。

解码方法4：数据编码块1-2的恢复采用了校验矩阵第8行对应的异或方程，且数据编码块1-3的恢复采用了校验矩阵第7行对应的异或方程，则：

恢复开销＝(校验编码块P-4、校验编码块Q-3、数据编码块2-3、校验编码块Q-1、数据编码块2-4、校验编码块P-1、校验编码块Q-2)/8个数据编码块＝0.875。

可以看出，解码方法2的恢复开销最小。因此，针对数据chunk 2损坏的情况下，存储控制器可以优选的采用解码方法2来完成数据chunk 2的恢复，以提升恢复效率。

针对每个chunk损坏的情况下，都有至少一种需要读出编码块的数量最少的解码方法。因此存储控制器内可以存储有多种恢复开销最小的解码方法，不同恢复开销最小的解码方法对应不同K和R取值下的校验矩阵。

以上介绍了K+2个SSD中仅有一个SSD损坏的场景，如果K+2个SSD中有两个SSD损坏，那么解码方法与前述编码方法类似，也即将损坏的2个SSD上存储的chunk视为校验chunk，未损坏的K个SSD上存储的chunk的视为数据chunk。根据所述校验矩阵和未损坏的K个SSD上存储的chunk进行解码，以获取损坏的2个SSD上存储的校验chunk。

纠删码的编码方法和解码方法之间强耦合，例如如果编码的时候，数据编码块1-1＝校验编码块P-4XOR校验编码块Q-3，那么如果校验编码块P-4损坏时，需要采用数据编码块1-1XOR校验编码块Q-3恢复校验编码块P-4，而如果校验编码块Q-3损坏时，需要采用数据编码块1-1XOR校验编码块P-4恢复校验编码块Q-3。因此本申请提供的编码方法有效降低了恢复开销，提升了后续恢复损失的chunk时的效率。

本申请实施例所应用的存储控制器

如图6提供了一种存储控制器200，存储控制器200可以运用于图1-1或图1-2所示的存储系统中。存储控制器200包括总线202、处理器204、存储器208和通信接口206。处理器204、存储器208和通信接口206之间通过总线202通信。

其中，处理器204可以为中央处理器(英文：central processing unit，缩写：CPU)。存储器208可以包括易失性存储器(英文：volatile memory)，例如随机存取存储器(英文：random access memory，缩写：RAM)。存储器208还可以包括非易失性存储器(英文：non-volatile memory)，例如只读存储器(英文：read-only memory，缩写：ROM)，快闪存储器，HDD或SSD。

通信接口206包括网络接口和存储介质读写接口，分别用于获取客户端发来的待写入数据和将编码后获得的chunk group写入存储介质中。

如图7，当存储控制器200在执行编码过程中，存储器208中存储有编码程序以及K个数据chunk。

存储控制器200运行时，处理器204从存储器208中读取编码程序和K个数据chunk，以执行前述编码过程生成chunk group，并通过通信接口206将该chunk group中的各个chunk存入不同存储介质中。

如图8，当存储控制器200在执行解码过程中，存储器208中存储有解码程序以及恢复过程中所需的编码块。

当存储控制器200所在的存储系统的存储介质损坏时，处理器204从存储器208中读取解码程序和恢复损坏的存储介质所需的编码块，以执行前述解码过程，恢复损坏的存储介质上存储的chunk。

编码程序和解码程序可以合并为一个程序。

校验矩阵在存储器208中的存储方式有多种，可以直接以矩阵的形式存储，也可以以2*R个异或方程的形式存储。并且将这2*R个异或方程与编码程序和解码程序融合。

以矩阵的形式存储的情况下，在编码过程中，处理器204执行编码程序，访问校验矩阵确定了起始编码行后，每执行完校验矩阵的一行对应的异或运算，处理器204再次访问校验矩阵以执行校验矩阵另一行对应的异或运算，直至校验矩阵每一行对应的异或运算均执行完毕。解码过程类似与编码过程类似。

对于每一个校验矩阵，都可以有确定的编码过程和解码过程，因此存储器208中也可以不存储校验矩阵，而是直接在编码程序和解码程序中存储2*R个异或方程。例如图5对应的编码方法中，编码程序直接指示执行step 1.1，step 2.1-2.3，step 3.1和step 4.1-4.3，无须存储校验矩阵并且在编码过程中逐行访问校验矩阵以确定每一个step中需要对哪两个编码块作异或运算。类似的，在解码程序中也可以直接存储恢复开销最小的解码方法，例如K＝2、R＝4，且采用标准校验矩阵的情况下，如果数据chunk 1损坏，为了恢复数据编码块1-1至数据编码块1-4，解码程序直接指示执行以下异或运算：数据编码块1-1＝校验编码块P-4XOR校验编码块Q-3；数据编码块1-2＝数据编码块2-3XOR校验编码块P-4；数据编码块1-3＝数据编码块2-2XOR校验编码块P-1；数据编码块1-4＝校验编码块P-1XOR校验编码块Q-2。

以上提供的存储控制器降低了恢复开销，提升了后续恢复损失的chunk时的效率。

如图9，提供了另一种存储控制器400，存储控制器400可以运用于图1-1或图1-2所示的存储系统中。存储控制器400包括总线402、处理器404、存储器408、数据处理芯片410和通信接口406。处理器404、存储器408和通信接口406之间通过总线402通信。

其中，处理器404可以为CPU。存储器408可以包括易失性存储器。存储器408还可以包括非易失性存储器。

通信接口406包括网络接口和存储介质读写接口，分别用于获取客户端发来的待写入数据和将编码后获得的chunk group存入存储介质。

数据处理芯片410可以通过电路实现，所述电路可以Wie专用集成电路(英文：application-specific integrated circuit，缩写：ASIC)或可编程逻辑器件(英文：programmable logic device，缩写：PLD)。上述PLD可以是复杂可编程逻辑器件(英文：complex programmable logic device，缩写：CPLD)，现场可编程门阵列(英文：field programmable gate array，缩写：FPGA)，通用阵列逻辑(英文：generic array logic,缩写：GAL)或其任意组合。

如图10所示，数据处理芯片410具体可以包括选址单元4102、运算单元4104、存储单元4106和读写接口4108。选址单元4102、运算单元4104、存储单元4106实际可以集成为一个电路。

读写接口4108与总线402相连，用于在数据处理芯片410执行编码的场景下，通过总线402获取存储器408中存储的数据编码块并存入存储单元4106，并将编码后获取的校验编码块通过总线402发往存储器208，以便存储控制器200将chunk group存入存储介质。读写接口4108还用于在数据处理芯片410执行解码的场景下，通过总线402获取恢复过程中所需的编码块并存入存储单元4106，并将恢复出的编码块通过总线402发往存储器208。

选址单元4102的功能与校验矩阵类似，选址单元4102指示运算单元4104进行一次异或运算的过程中应当将存储单元4106中哪两个编码块进行异或运算，以便运算单元4104从存储单元4106中获取对应的编码块以完成异或运算。

运算单元4104从存储单元4106中获取一次异或运算的过程中需要进行异或运算的两个编码块，执行完一次异或运算后将得到的编码块存入存储单元4106中，接着执行下一次异或运算。

由于纠删码的编码方法和解码方法之间强耦合，因此本申请提供的存储控制器有效降低了恢复开销，提升了后续恢复损失的chunk时的效率。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

结合本申请公开内容所描述的方法可以由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于RAM、快闪存储器、ROM、可擦除可编程只读存储器(英文：erasable programmable read only memory，缩写：EPROM)、电可擦可编程只读存储器(英文：electrically erasable programmable read only memory，缩写：EEPROM)、HDD、SSD、光盘或者本领域熟知的任何其它形式的存储介质中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本申请所描述的功能可以用硬件或软件来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上该的具体实施方式，对本申请的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上该仅为本申请的具体实施方式而已，并不用于限定本申请的保护范围，凡在本申请的技术方案的基础之上，所做的任何修改、改进等，均应包括在本申请的保护范围之内。

Claims

一种存储控制器，其特征在于，包括处理器、存储器和通信接口；

所述处理器，用于通过所述通信接口获取待编码的K个数据大块chunk，并将所述K个数据chunk缓存入所述存储器，每个数据chunk包括R个数据编码块，R+1为素数且R+1>K；

所述处理器，还用于执行所述存储器中的代码执行以下操作：

读取所述存储器中存储的所述K个数据chunk，根据校验矩阵和所述K个数据chunk生成第一校验chunk和第二校验chunk，每个校验chunk包括R个校验编码块；

其中，所述校验矩阵有2*R行，所述校验矩阵中第(k-1)*R+1列至第k*R列为所述K个数据chunk中第k个数据chunk的chunk列集合，K≥k≥1，所述校验矩阵中第K*R+1列至第(K+1)*R列为对应所述第一校验chunk的chunk列集合，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列为所述第二校验chunk的chunk列集合；

所述校验矩阵为标准校验矩阵H或由标准校验矩阵H执行N次调换操作后得到，N≥1，所述调换操作指将任意两个chunk列集合调换；所述标准校验矩阵H中除以下坐标为1外，其余坐标均为0，2*R≥i≥1，(K+2)*R≥j≥1，

如果i<j，则

H[i+1][j*R+(R-j+i)modR+1]

H[R+i+1][(j+1)*R-(R-j+i)mod R]

如果i>j，则

H[i+1][j*R+(R-1-j+i)modR+1]

H[R+i+1][(j+1)*R-(R-1-j+i)modR]。
如权利要求1所述的存储控制器，其特征在于，所述校验矩阵中第(k-1)*R+1列至第k*R列分别对应所述K个数据chunk中第k个数据chunk的R个数据编码块，所述校验矩阵中第K*R+1列至第(K+1)*R列分别对应所述第一校验chunk的R个校验编码块，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列分别对应所述第二校验chunk的R个校验编码块；

所述校验矩阵的第D行有3个坐标为1，所述第D行为所述校验矩阵的任一行，对所述校验矩阵的第D行中为1的坐标对应的3个编码块中的任意2个编码块进行一次异或运算可以得到所述校验矩阵的第D行中为1的坐标对应的3个编码块中未参与本次异或运算的编码块。
如权利要求1或2所述的存储控制器，其特征在于，所述处理器还用于，通过所述通信接口将所述K个数据chunk、所述第一校验chunk和所述第二校验chunk分别存入所述存储控制器所在的存储系统的K+2个存储介质中。
如权利要求3所述的存储控制器，其特征在于，所述处理器还用于，当所述存K+2个存储介质中有存储介质损坏时，根据所述校验矩阵和所述K+2存储介质中未损坏的存储介质上存储的数据chunk和所述第一校验chunk和所述第二校验chunk中的至少一个，恢复所述损坏的存储介质。
一种数据处理芯片，其特征在于，包括电路和读写接口；

所述电路用于，通过所述读写接口获取待编码的K个数据大块chunk，每个数据chunk包括R个数据编码块，R+1为素数且R+1>K；

所述电路还用于，根据校验矩阵和所述K数据chunk生成第一校验chunk和第二校验chunk，每个校验chunk包括R个校验编码块；

其中，所述校验矩阵有2*R行，所述校验矩阵中第(k-1)*R+1列至第k*R列为所述K个数据chunk中第k个数据chunk的chunk列集合，K≥k≥1，所述校验矩阵中第K*R+1列至第(K+1)*R列为应所述第一校验chunk的chunk列集合，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列为所述第二校验chunk的chunk列集合；

所述校验矩阵为标准校验矩阵H或由标准校验矩阵H执行N次调换操作后得到，N≥1，所述调换操作指示将任意两个chunk列集合调换；

所述标准校验矩阵H中除以下坐标为1外，其余坐标均为0，2*R≥i≥1，(K+2)*R≥j≥1，

如果i<j，则

H[i+1][j*R+(R-j+i)modR+1]

H[R+i+1][(j+1)*R-(R-j+i)modR]

如果i>j，则

H[i+1][j*R+(R-1-j+i)modR+1]

H[R+i+1][(j+1)*R-(R-1-j+i)modR]。
如权利要求5所述的数据处理芯片，其特征在于，所述校验矩阵中第(k-1)*R+1列至第k*R列分别对应所述K个数据chunk中第k个数据chunk的R个数据编码块，所述校验矩阵中第K*R+1列至第(K+1)*R列分别对应所述第一校验chunk的R个校验编码块，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列分别对应所述第二校验chunk的R个校验编码块；

所述校验矩阵的第D行有3个坐标为1，所述第D行为所述校验矩阵的任一行，所述电路对所述校验矩阵的第D行中为1的坐标对应的3个编码块中的任意2个编码块进行一次异或运算可以得到所述校验矩阵的第D行中为1的坐标对应的3个编码块中未参与本次异或运算的编码块。
如权利要求5或6所述的数据处理芯片，其特征在于，所述数据处理芯片运用于存储控制器中；

所述电路，还用于通过所述读写接口将所述K个数据chunk、所述第一校验chunk和所述第二校验chunk存入所述存储控制器的存储器中，以便所述存储控制器将所述K个数据chunk、所述第一校验chunk和所述第二校验chunk分别存入所述存储控制器所在的存储系统的K+2个存储介质中。
如权利要求7所述的数据处理芯片，其特征在于，所述电路还用于，当所述K+2个存储介质中有存储介质损坏时，根据所述校验矩阵和所述K+2存储介质中未损坏的存储介质上存储的数据chunk和所述第一校验chunk和所述第二校验chunk中的至少一个，恢复所述损坏的存储介质。
如权利要求5至8任一所述的数据处理芯片，其特征在于，所述数据处理芯片包括现场可编程门阵列FPGA。
一种数据处理方法，其特征在于，所述方法适用于存储控制器；所述方法包括：

获取待编码的K个数据大块chunk并缓存所述K个数据chunk，每个数据chunk包括R个数据编码块，R+1为素数且R+1>K；

根据校验矩阵和所述K个数据chunk生成第一校验chunk和第二校验chunk，每个校验chunk包括R个校验编码块；

其中，所述校验矩阵有2*R行，所述校验矩阵中第(k-1)*R+1列至第k*R 列为所述K个数据chunk中第k个数据chunk的chunk列集合，K≥k≥1，所述校验矩阵中第K*R+1列至第(K+1)*R列为对应所述第一校验chunk的chunk列集合，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列为所述第二校验chunk的chunk列集合；

所述校验矩阵为标准校验矩阵H或由标准校验矩阵H执行N次调换操作后得到，N≥1，所述调换操作指将任意两个chunk列集合调换；所述标准校验矩阵H中除以下坐标为1外，其余坐标均为0，2*R≥i≥1，(K+2)*R≥j≥1，

如果i<j，则

H[i+1][j*R+(R-j+i)modR+1]

H[R+i+1][(j+1)*R-(R-j+i)modR]

如果i>j，则

H[i+1][j*R+(R-1-j+i)modR+1]

H[R+i+1][(j+1)*R-(R-1-j+i)modR]。
如权利要求10所述的数据处理方法，其特征在于，所述校验矩阵中第(k-1)*R+1列至第k*R列分别对应所述K个数据chunk中第k个数据chunk的R个数据编码块，所述校验矩阵中第K*R+1列至第(K+1)*R列分别对应所述第一校验chunk的R个校验编码块，所述校验矩阵中第(K+1)*R+1列至第(K+2)*R列分别对应所述第二校验chunk的R个校验编码块；

所述校验矩阵的第D行有3个坐标为1，所述第D行为所述校验矩阵的任一行，对所述校验矩阵的第D行中为1的坐标对应的3个编码块中的任意2个编码块进行一次异或运算可以得到所述校验矩阵的第D行中为1的坐标对应的3个编码块中未参与本次异或运算的编码块。
如权利要求10或11所述的数据处理方法，其特征在于，还包括：

将所述K个数据chunk、所述第一校验chunk和所述第二校验chunk分别存入所述存储控制器所在的存储系统的K+2个存储介质中。
如权利要求12所述的数据处理方法，其特征在于，还包括：

当所述K+2个存储介质中有存储介质损坏时，根据所述校验矩阵和所述K+2存储介质中未损坏的存储介质上存储的数据chunk和所述第一校验chunk和所述第二校验chunk中的至少一个，恢复所述损坏的存储介质。