WO2023151288A1

WO2023151288A1 - 校验数据生成方法、装置、设备及存储介质

Info

Publication number: WO2023151288A1
Application number: PCT/CN2022/122787
Authority: WO
Inventors: 吴睿振; 陈静静; 张永兴; 王凛
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2022-02-11
Filing date: 2022-09-29
Publication date: 2023-08-17
Also published as: CN114168087A; CN114168087B

Abstract

一种校验数据生成方法、装置、电子设备及计算机非易失性可读存储介质，该方法包括：获取与独立冗余磁盘阵列对应的存储状态矩阵（S101）；在磁盘向量中确定非参照向量，并在非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区（S102）；对存储状态矩阵中的第一数据区和第二数据区进行数据交换处理，得到第一矩阵（S103）；在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，并对各个二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵（S104）；基于第二矩阵进行单纠错编码生成处理，得到第一校验数据（S105）；基于第二矩阵进行双纠错编码生成处理，得到第二校验数据（S106）；该方法可以提高数据恢复速度和效率。

Description

校验数据生成方法、装置、设备及存储介质

相关申请的交叉引用

本申请要求于2022年2月11日提交中国专利局，申请号为202210126966.4，申请名称为“校验数据生成方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及磁盘阵列技术领域，特别涉及一种校验数据生成方法、校验数据生成装置、电子设备及计算机非易失性可读存储介质。

背景技术

RAID(Redundant Arrays of Independent Disks)即具有冗余能力的磁盘阵列，磁盘阵列是通过将多个独立磁盘组合一起，从而得到一个容量巨大的磁盘组。采用RAID存储技术，可以大大提高存储容量，提高系统输入输出的请求处理能力并且通过数据的分布式存储技术，并行访问手段和信息冗余技术提高数据的可靠性。RAID 6是一种带有两个分布存储的奇偶校验码独立磁盘的结构，其能够在同时由两个磁盘发生数据错误时进行数据恢复，进一步提升了磁盘阵列的数据可靠性。然而，RAID 6在向下兼容一个仅有一个磁盘发生数据错误的场景时，数据恢复过程只需要使用其中的一种校验码，且该种校验码需要被全部使用，这使得该校验码对应的存储磁盘IO吞吐数据量极大，导致数据恢复速度较慢。

对发生数据错误的磁盘进行数据恢复时，需要尽可能快的提升数据恢复速度。

发明内容

有鉴于此，本申请的目的在于提供一种校验数据生成方法、校验数据生成装置、电子设备及计算机非易失性可读存储介质，提高数据恢复速度和效率。

为解决上述技术问题，本申请提供了一种校验数据生成方法，包括：

获取与独立冗余磁盘阵列对应的存储状态矩阵；其中，存储状态矩阵包括多个磁盘向量和多个数据向量，磁盘向量和数据向量正交；

在磁盘向量中确定非参照向量，并在非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区；

对存储状态矩阵中的第一数据区和第二数据区进行数据交换处理，得到第一矩阵；

在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，并对各个二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵；

基于第二矩阵进行单纠错编码生成处理，得到第一校验数据，并将第一校验数据存入第一校验磁盘；

基于第二矩阵进行双纠错编码生成处理，得到第二校验数据，并将第二校验数据存入第二校验磁盘。

可选地，获取与独立冗余磁盘阵列对应的存储状态矩阵，包括：

获取独立冗余磁盘阵列的磁盘数量、磁盘容量和条带容量；

利用磁盘数量确定存储状态矩阵的列数，并利用磁盘容量和条带容量确定存储状态矩阵的行数；其中，行数为偶数；

基于列数和行数，以及各个磁盘的数据存储位置相对关系，生成存储状态矩阵。

可选地，基于列数和行数，以及各个磁盘的数据存储位置相对关系，生成存储状态矩阵，包括：

获取各个磁盘中各个数据条带对应的条带标识信息；

按照数据条带在磁盘中的相对位置关系，生成磁盘对应的磁盘向量；

基于列数和行数生成初始矩阵，并利用磁盘向量填充初始矩阵，得到存储状态矩阵。

可选地，在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，包括：

判断第一矩阵中的初始数据区是否具有偶数个磁盘向量；

若具有偶数个磁盘向量，则以两个磁盘向量为粒度对初始数据区进行分组，得到若干个第三数据区；

若具有奇数个磁盘向量，则确定一个目标磁盘向量，并对非目标磁盘向量以两个磁盘向量为粒度进行分组，得到若干个第三数据区；

判断第一矩阵中的初始数据区是否具有偶数个数据向量；

若具有偶数个数据向量，则以两个数据向量为粒度对各个第三数据区进行分组，得到若干个二阶矩阵组；

若具有奇数个数据向量，则确定一个目标数据向量，并对非目标数据向量以两个数据向量为粒度进行分组，得到若干个二阶矩阵组。

可选地，第二矩阵包括多个数据向量，数据向量包括当前数据向量；

基于第二矩阵进行单纠错编码生成处理，得到第一校验数据，包括：

基于当前数据向量，从独立冗余磁盘阵列中读出对应的当前数据条带，并对当前数据条带进行异或处理，得到当前数据向量对应的第一校验数据。

基于第二矩阵进行双纠错编码生成处理，得到第二校验数据，包括：

基于当前数据向量，从独立冗余磁盘阵列中读出对应的当前数据条带；

获取当前数据向量对应的向量序号，并利用向量序号生成各个当前数据条带对应的权重参数；

利用权重参数和数据条带得到加权数据，并对加权数据进行异或处理，得到当前数据向量对应的第二校验数据。

可选地，还包括：

若检测到目标磁盘故障，则从独立冗余磁盘阵列中的非目标磁盘中获取错误恢复数据；

从第一校验磁盘中获取目标第一校验数据，并从第二校验磁盘中获取目标第二校验数据；

利用错误恢复数据、目标第一校验数据和目标第二校验数据对目标磁盘进行数据恢复。

本申请还提供了一种校验数据生成装置，包括：

状态生成模块，用于获取与独立冗余磁盘阵列对应的存储状态矩阵；其中，存储状态矩阵包括多个磁盘向量和多个数据向量，磁盘向量和数据向量正交；

数据分区模块，用于在磁盘向量中确定非参照向量，并在非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区；

位置交换模块，用于对存储状态矩阵中的第一数据区和第二数据区进行数据交换处理，得到第一矩阵；

元素交换模块，用于在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，并对各个二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵；

第一生成模块，用于基于第二矩阵进行单纠错编码生成处理，得到第一校验数据；

第二生成模块，用于基于第二矩阵进行双纠错编码生成处理，得到第二校验数据。

本申请还提供了一种电子设备，包括存储器和处理器，其中：

存储器，用于保存计算机程序；

处理器，用于执行计算机程序，以实现上述的校验数据生成方法。

本申请还提供了一种计算机非易失性可读存储介质，用于保存计算机程序，其中，计算机程序被处理器执行时实现上述的校验数据生成方法。

本申请提供的校验数据生成方法，获取与独立冗余磁盘阵列对应的存储状态矩阵；其中，存储状态矩阵包括多个磁盘向量和多个数据向量，磁盘向量和数据向量正交；在磁盘向量中确定非参照向量，并在非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区；对存储状态矩阵中的第一数据区和第二数据区进行数据交换处理，得到第一矩阵；在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，并对各个二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵；基于第二矩阵进行单纠错编码生成处理，得到第一校验数据；基于第二矩阵进行双纠错编码生成处理，得到第二校验数据。

可见，该方法在校验数据生成前，对校验数据和独立冗余磁盘阵列中各个数据条带的关系进行了重新调度。存储状态矩阵记录了独立冗余磁盘阵列中各个数据条带在各个磁盘中的存储关系，通过第一数据区和第二数据区之间的位置交换以及各个二阶矩阵组内的目标磁盘元素进行位置交换，对第一校验数据和第二校验数据与数据条带的对应关系进行了重新映射。得到的第一校验数据和第二校验数据在进行数据恢复时能够同时参与数据恢复，且无需全部参数数据恢复，因此可以将数据读取量均分为对第一校验数据的读取和对第二校验数据的读取。两种校验数据通常被存储于两个磁盘，可以并行读取，因此可以减少数据读取所需的时间，提高数据恢复速度和效率。

此外，本申请还提供了一种校验数据生成装置、电子设备及计算机非易失性可读存储介质，同样具有上述有益效果。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种校验数据生成方法流程图；

图2为本申请实施例提供的一种具体的存储状态矩阵示意图；

图3为本申请实施例提供的一种具体的参照向量确定示意图；

图4为本申请实施例提供的一种具体的第二矩阵示意图；

图5为本申请实施例提供的一种具体的双纠错编码示意图；

图6为本申请实施例提供的一种具体的数据恢复示意图；

图7为本申请实施例提供的一种校验数据生成装置的结构示意图；

图8为本申请实施例提供的一种电子设备的结构示意图；

图9为本申请实施例提供的一种数据恢复系统的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1，图1为本申请实施例提供的一种校验数据生成方法流程图。该方法包括：

S101：获取与独立冗余磁盘阵列对应的存储状态矩阵。

其中，存储状态矩阵包括多个磁盘向量和多个数据向量，磁盘向量和数据向量正交。独立冗余磁盘阵列中包括多个磁盘，每个磁盘中存储有若干个数据块，其中可以包括有效数据块和空白数据块。磁盘向量，用于表示一个磁盘的各个数据块的向量，数据向量，用于表示各个磁盘中处于统一存储位置或具有同一唯一标识信息的向量。请参考图2，图2为本申请实施例提供的一种具体的存储状态矩阵示意图，其中，盘1、盘2和盘3的三个列向量构成存储状态矩阵。其中，a _1,1表示盘1中1号存储位置存储的数据块，a _2,1表示盘2中1号存储位置存储的数据块，以此类推。可以理解的是，a _x,y元素对应的数据块具体可以为存入的有效数据块，或者可以为没有写入任何有效数据的空白数据块。因此可以确定，图2中的数据向量为行向量，磁盘向量为列向量。存储状态矩阵中的各个元素，例如图2中的a _x,y元素的具体内容不做限定，其能够唯一表示一个数据块即可，例如可以为各个数据块的唯一标识信息，该唯一标识信息的形式可以根据需要设置，例如如图2所示，其采用(磁盘序号，数据块在磁盘中的序号)的方式唯一标识一个数据块。此外，可以理解的是，磁盘向量和数据向量保持相交即可，二者均可以为行向量或列向量。

需要说明的是，独立冗余磁盘阵列中的磁盘数量不做限定，但是每个磁盘能够存储的数据块数量、大小相同，且单个磁盘存储的数据块数量应当为偶数个，以便保证后续校验数据能够正确生成。

本实施例并不限定存储状态矩阵的具体获取方式，例如，执行本申请中各个步骤的电子设备(可称为执行主体设备)可以从其他电子设备处获取存储状态矩阵，或者，执行主体设备可以直接根据其对应的RAID的状态，生成存储状态矩阵。例如在一种实施方式中，可以获取独立冗余磁盘阵列的磁盘数量、磁盘容量和条带容量，其中，条带容量即为一个数据块的数据块大小，需要说明的是，单个磁盘的数据条带(即数据块)的数量应当为偶数，因此，可以利用磁盘数量确定存储状态矩阵的列数，并利用磁盘容量和条带容量确定存储状态矩阵的行数，且行数为偶数。基于得到的列数和行数，以及各个磁盘的数据存储位置相对关系，生成存储状态矩阵。其中，数据存储位置相对关系，是指磁盘中各个数据块在磁盘中的存储位置的相对关系。

具体的，在一种实施方式中，可以获取各个磁盘中各个数据条带(即数据块)对应的条带标识信息，例如图2中的a _1,1这一标识信息，并按照数据条带在磁盘中的相对位置关系，生成磁盘对应的磁盘向量，该相对位置关系，即为上述的数据存储位置相对关系，并基于列数和行数生成初始矩阵，初始矩阵，是指元素未填充的空白矩阵，利用磁盘向量填充初始矩阵，即可得到存储状态矩阵。

S102：在磁盘向量中确定非参照向量，并在非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区。

在得到存储状态矩阵后，从其中的若干个磁盘向量中确定出一个参照向量，并将其他确定为非参照向量。示例性的，请参考图3，图3为本申请实施例提供的一种具体的参照向量确定示意图，其在图2的存储状态矩阵中，将盘1对应的磁盘向量确定为参照向量。在确定非参照向量后，将其所处的区域确定为初始数据区，并将初始数据区中各个数据向量的元素均分为两份，将均分后两份元素分别所处的区域确定为第一数据区和第二数据区。

具体的，请参考图3，数据向量可以分别标记为a组、b组、c组和d组，a ₂和a ₃所属的磁盘向量为非参照向量，因此初始数据区中的元素包括a ₂、b ₂、c ₂、d ₂、a ₃、b ₃、c ₃、d ₃，数据向量元素均分处理，是指按照数据向量(即横向)的方向，进行元素的均分处理，以图3为例，可以将初始数据区中a组和b组的元素划分至第一数据区，初始数据区中c组和d组划分至第二数据区。可以理解的是，还可以按照a组和c组、b组和d组的方式进行划分，或者可以按照a组和d组、b组和c组的方式进行划分。

S103：对存储状态矩阵中的第一数据区和第二数据区进行数据交换处理，得到第一矩阵。

在确定第一数据区和第二数据区后，将两个数据区中的元素进行对调，即进行数据交换处理，即可得到第一矩阵。需要说明的是，在数据对调之后，第一数据区和第二数据区中各个元素之间的相对位置关系不发生变化，例如原本位于第一数据区第一行的数据，在交换至第二数据区后，仍处于第二数据区的第一行。

S104：在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，并对各个二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵。

其中，二阶矩阵组，是指由两行两列共四个元素构成的数据组合，其中四个元素必然分别属于两个磁盘向量和两个数据向量。在得到第一矩阵后，分别在第一数据区和第二数据区中确定若干个二阶矩阵组，二阶矩阵组的具体确定方式不做限定，例如可以按照向量相邻顺序依次选取二阶矩阵组，或者可以随机选取两个磁盘向量和两个数据向量，并将其相交位置的四个元素确定为同属于一个二阶矩阵组。在确定二阶矩阵组后，对于每一个二阶矩阵组来说，其中的元素分别属于两个磁盘向量，可以将同属于一个磁盘向量的任意两个元素确定为目标磁盘元素，并将其位置进行交换。所有的二阶矩阵组均进行上述处理，得到第二矩阵。

示例性的，请参考图4，图4为本申请实施例提供的一种具体的第二矩阵示意图，在对区间1(即第一数据区)和区间2(即第二数据区)进行数据交换后，每个数据区均构成一个二阶矩阵组，将二阶矩阵组中属于盘3的磁盘向量的元素确定为目标磁盘元素，进而进行交换，即可得到如图4所示的第二矩阵。可以理解的是，经过交换后，二阶矩阵组中原本属于不同数据向量的两个元素被重新分配至一个数据向量中。

可以理解的是，由于分别在第一数据区和第二数据区内确定二阶矩阵组，因此可能存在某一数据区内的行数和/或列数为奇数的情况，在这种情况下同样能够生成第二矩阵，使得本申请提供的方法能够具备更广阔的适用范围。具体的，可以首先判断第一矩阵中的初始数据区是否具有偶数个磁盘向量，若具有偶数个磁盘向量，则以两个磁盘向量为粒度对初始数据区进行分组，得到若干个第三数据区。需要说明的是，本申请中的分组时的两个磁盘向量可以相邻或不相邻。若具有奇数个磁盘向量，则确定一个目标磁盘向量，并对非目标磁盘向量以两个磁盘向量为粒度进行分组，得到若干个第三数据区。在划分第三数据区完毕后，可以判断第一矩阵中的初始数据区是否具有偶数个数据向量。若具有偶数个数据向量，则以两个数据向量为粒度对各个第三数据区进行分组，得到若干个二阶矩阵组。若具有奇数个数据向量，则确定一个目标数据向量，并对非目标数据向量以两个数据向量为粒度进行分组，得到若干个二阶矩阵组。

可以理解的是，经过上述处理，同样可以确定若干个二阶矩阵组，只是可能并不是所有的磁盘向量和/或数据向量均能够被划分至某个二阶矩阵组中。对于这个磁盘向量和/或数据向量对应的数据块，在需要对其进行数据恢复时，可以采用传统的RAID6算法对其进行恢复，对于被划分至某个二阶矩阵组的元素对应的数据块来说，在需要对其进行数据恢复时，则可以仅读出部分后续生成的第一校验数据和第二校验数据，减少数据读取时长，提高数据恢复速度。

S105：基于第二矩阵进行单纠错编码生成处理，得到第一校验数据，并将第一校验数据存入第一校验磁盘。

在得到第二矩阵后，对其进行单纠错编码生成处理，其中，单纠错编码生成处理的具体方式不做限定，可以参考相关技术。例如在一种实施方式中，第二矩阵包括多个数据向量，数据向量包括当前数据向量。在计算第一校验数据时，可以基于当前数据向量，从独立冗余磁盘阵列中读出对应的当前数据条带，并对当前数据条带进行异或处理，得到当前数据向量对应的第一校验数据。具体的，以图4为例，P _a、P _b、P _c、P _d即为第一校验数据，采用的单纠错编码生成方式为RAID5的编码方式，由于数据块之间的对应关系发生了变化，因此新的编码关系为：

S106：基于第二矩阵进行双纠错编码生成处理，得到第二校验数据，并将第二校验数据存入第二校验磁盘。

双纠错编码生成处理，是采用双纠错编码算法以实现多数据块纠错运算的处理，双纠错编码算法具体可以为cauchy(柯西)或vandermonde(范德蒙德)等算法。以范德蒙德算法为例，第二矩阵包括多个数据向量，数据向量包括当前数据向量。在计算第二校验盘时，基于当前数据向量，从独立冗余磁盘阵列中读出对应的当前数据条带，并获取当前数据向量对应的向量序号，并利用向量序号生成各个当前数据条带对应的权重参数。利用权重参数和数据条带得到加权数据，并对加权数据进行异或处理，得到当前数据向量对应的第二校验数据。具体的，基于图4，图4中的q _a、q _b、q _c、q _d即为第二校验数据。针对图4中的元素对应关系，引入编码参数，结果如图5所示，图5为本申请实施例提供的一种具体的双纠错编码示意图。在图5所示的矩阵中，因为盘1、盘2、盘3三个列向量所组成的子矩阵满足vandermonde特性，因此一定满秩，因此其任意子矩阵按照vandermonde特性可知，一定也是满秩矩阵，因此说明图5中的矩阵一定是可解逆矩阵，则第二校验数据的计算过程为：

可知上述公式中的编码关系矩阵是基于vandermonde矩阵的矩阵变化所得，满足vandermonde矩阵特性，因此满秩，一定可逆。可以确定，当任意一到两个磁盘发生错误时，vandermonde特性依然成立，因此可以对其中的巨快进行恢复。

进一步的，在得到第一校验数据和第二校验数据，并将其分别存入第一校验磁盘和第二校验磁盘后，若某一个磁盘发生故障，例如若检测到目标磁盘故障，需要对其中的数据进行恢复时，可以从独立冗余磁盘阵列中的非目标磁盘中获取错误恢复数据，从第一校验磁盘中获取目标第一校验数据，并从第二校验磁盘中获取目标第二校验数据。需要说明的是，第一校验数据和第二校验数据通常对应于不同的数据向量，且第一校验数据或第二校验数据与错误恢复数据对应的数据向量相同。利用错误恢复数据、目标第一校验数据和目标第二校验数据对目标磁盘进行数据恢复。具体的，请参考图6，图6为本申请实施例提供的一种具体的数据恢复示意图。若盘1发生故障，则可以从盘2、盘3、校验盘p(即第一校验磁盘)和校验盘q(即第二校验磁盘)中读出虚线圆圈圈出的数据。在恢复时，对于a ₁、b ₁，可以分别使用c ₂、d ₃、p _a以及d ₂、c ₃、p _b进行恢复。对于c ₁、d ₁，可以分别使用c ₂、d ₃、q _c以及d ₂、c ₃、q _d进行恢复。此时对于盘2、盘3、第一校验磁盘和第二校验磁盘来说，被读取的数据块都是两块，相比于传统RAID 6在做数据恢复时，需要读取盘2、盘3、校验盘p每盘四块数据的代价而言，在单纠错恢复时可以减少每盘一半的数据读取量，明显减少数据读取所需时长。

对于双纠错的场景，本申请计算的第一校验数据和第二校验数据同样适用，具体的，若盘1和盘2的数据发生丢失，需要记性恢复，则可以首先利用盘3的存活数据消除掉校验盘p和校验盘q中的相同数据，得到的剩余数据关系，并构建矩阵A为：

此时的恢复方式和纠删方法类似，对矩阵A求秩可得rank(A)＝8，可以确定矩阵可逆，因此通过矩阵的逆矩阵关系，可以求出a ₁、b ₁、c ₁、d ₁、a ₂、b ₂、c ₂、d ₂的值，实现数据恢复。

应用本申请实施例提供的校验数据生成方法，在校验数据生成前，对校验数据和独立冗余磁盘阵列中各个数据条带的关系进行了重新调度。存储状态矩阵记录了独立冗余磁盘阵列中各个数据条带在各个磁盘中的存储关系，通过第一数据区和第二数据区之间的位置交换以及各个二阶矩阵组内的目标磁盘元素进行位置交换，对第一校验数据和第二校验数据与数据条带的对应关系进行了重新映射。得到的第一校验数据和第二校验数据在进行数据恢复时能够同时参与数据恢复，且无需全部参数数据恢复，因此可以将数据读取量均分为对第一校验数据的读取和对第二校验数据的读取。两种校验数据通常被存储于两个磁盘，可以并行读取，因此可以减少数据读取所需的时间，提高数据恢复速度和效率。

下面对本申请实施例提供的校验数据生成装置进行介绍，下文描述的校验数据生成装置与上文描述的校验数据生成方法可相互对应参照。

请参考图7，图7为本申请实施例提供的一种校验数据生成装置的结构示意图，包括：

状态生成模块110，用于获取与独立冗余磁盘阵列对应的存储状态矩阵；其中，存储状态矩阵包括多个磁盘向量和多个数据向量，磁盘向量和数据向量正交；

数据分区模块120，用于在磁盘向量中确定非参照向量，并在非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区；

位置交换模块130，用于对存储状态矩阵中的第一数据区和第二数据区进行数据交换处理，得到第一矩阵；

元素交换模块140，用于在第一矩阵的第一数据区和第二数据区中确定若干个二阶矩阵组，并对各个二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵；

第一生成模块150，用于基于第二矩阵进行单纠错编码生成处理，得到第一校验数据；

第二生成模块160，用于基于第二矩阵进行双纠错编码生成处理，得到第二校验数据。

可选地，状态生成模块110，包括：

获取单元，用于获取独立冗余磁盘阵列的磁盘数量、磁盘容量和条带容量；

计算单元，用于利用磁盘数量确定存储状态矩阵的列数，并利用磁盘容量和条带容量确定存储状态矩阵的行数；其中，行数为偶数；

生成单元，用于基于列数和行数，以及各个磁盘的数据存储位置相对关系，生成存储状态矩阵。

可选地，生成单元，包括：

标识获取单元，用于获取各个磁盘中各个数据条带对应的条带标识信息；

磁盘向量生成单元，用于按照数据条带在磁盘中的相对位置关系，生成磁盘对应的磁盘向量；

填充单元，用于基于列数和行数生成初始矩阵，并利用磁盘向量填充初始矩阵，得到存储状态矩阵。

可选地，元素交换模块140，包括：

第一判断单元，用于判断第一矩阵中的初始数据区是否具有偶数个磁盘向量；

第一划分单元，用于若具有偶数个磁盘向量，则以两个磁盘向量为粒度对初始数据区进行分组，得到若干个第三数据区；

第二划分单元，用于若具有奇数个磁盘向量，则确定一个目标磁盘向量，并对非目标磁盘向量以两个磁盘向量为粒度进行分组，得到若干个第三数据区；

第二判断单元，用于判断第一矩阵中的初始数据区是否具有偶数个数据向量；

第三划分单元，用于若具有偶数个数据向量，则以两个数据向量为粒度对各个第三数据区进行分组，得到若干个二阶矩阵组；

第四划分单元，用于若具有奇数个数据向量，则确定一个目标数据向量，并对非目标数据向量以两个数据向量为粒度进行分组，得到若干个二阶矩阵组。

第一生成模块150，包括：

异或计算单元，用于基于当前数据向量，从独立冗余磁盘阵列中读出对应的当前数据条带，并对当前数据条带进行异或处理，得到当前数据向量对应的第一校验数据。

第二生成模块160，包括：

读取单元，用于基于当前数据向量，从独立冗余磁盘阵列中读出对应的当前数据条带；

权重生成单元，用于获取当前数据向量对应的向量序号，并利用向量序号生成各个当前数据条带对应的权重参数；

加权异或单元，用于利用权重参数和数据条带得到加权数据，并对加权数据进行异或处理，得到当前数据向量对应的第二校验数据。

可选地，还包括：

第一读取模块，用于若检测到目标磁盘故障，则从独立冗余磁盘阵列中的非目标磁盘中获取错误恢复数据；

第二读取模块，用于从第一校验磁盘中获取目标第一校验数据，并从第二校验磁盘中获取目标第二校验数据；

恢复模块，用于利用错误恢复数据、目标第一校验数据和目标第二校验数据对目标磁盘进行数据恢复。

下面对本申请实施例提供的电子设备进行介绍，下文描述的电子设备与上文描述的校验数据生成方法可相互对应参照。

请参考图8，图8为本申请实施例提供的一种电子设备的结构示意图。其中电子设备100可以包括处理器101和存储器102，还可以进一步包括多媒体组件103、信息输入/信息输出(I/O)接口104以及通信组件105中的一种或多种。

其中，处理器101用于控制电子设备100的整体操作，以完成上述的校验数据生成方法中的全部或部分步骤；存储器102用于存储各种类型的数据以支持在电子设备100的操作，这些数据例如可以包括用于在该电子设备100上操作的任何应用程序或方法的指令，以及应用程序相关的数据。该存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，SRAM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、只读存储器(Read-Only Memory，ROM)、磁存储器、快闪存储器、磁盘或光盘中的一种或多种。

多媒体组件103可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或通过通信组件105发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口104为处理器101和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件105用于电子设备100与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near Field Communication，简称NFC)，2G、3G或4G，或它们中的一种或几种的组合，因此相应的该通信组件105可以包括：Wi-Fi部件，蓝牙部件，NFC部件。

电子设备100可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(Digital Signal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述实施例给出的校验数据生成方法。

请参考图9，图9为本申请实施例提供的一种数据恢复系统的结构示意图。如图所示，其中包括CPU、乘加运算部件和存储系统(即独立冗余磁盘阵列)，独立冗余磁盘阵列发生错误后，会将错误情况告知CPU，由CPU决定控制流，控制乘加模块从存储里读取相应需要参加运算的数据块，然后计算所需要的恢复参数，利用CPU或是其他硬件运算方式进行计算，得到的参数传递给乘加运算模块，通过乘加运算，得到需要进行异或运算以更新存储数据的数据块，然后传回给存储进行更新，完成数据块的恢复。

下面对本申请实施例提供的计算机非易失性可读存储介质进行介绍，下文描述的计算机非易失性可读存储介质与上文描述的校验数据生成方法可相互对应参照。

本申请还提供一种计算机非易失性可读存储介质，计算机非易失性可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述的校验数据生成方法的步骤。

该计算机非易失性可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本领域技术人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应该认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语包括、包含或者其他任何变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本申请的限制。

Claims

一种校验数据生成方法，其特征在于，包括：

获取与独立冗余磁盘阵列对应的存储状态矩阵；其中，所述存储状态矩阵包括多个磁盘向量和多个数据向量，所述磁盘向量和所述数据向量正交；

在所述磁盘向量中确定非参照向量，并在所述非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区；

对所述存储状态矩阵中的所述第一数据区和所述第二数据区进行数据交换处理，得到第一矩阵；

在所述第一矩阵的所述第一数据区和所述第二数据区中确定若干个二阶矩阵组，并对各个所述二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵；

基于所述第二矩阵进行单纠错编码生成处理，得到第一校验数据，并将所述第一校验数据存入第一校验磁盘；

基于所述第二矩阵进行双纠错编码生成处理，得到第二校验数据，并将所述第二校验数据存入第二校验磁盘。
根据权利要求1所述的校验数据生成方法，其特征在于，所述获取与独立冗余磁盘阵列对应的存储状态矩阵，包括：

获取所述独立冗余磁盘阵列的磁盘数量、磁盘容量和条带容量；

利用所述磁盘数量确定所述存储状态矩阵的列数，并利用所述磁盘容量和所述条带容量确定所述存储状态矩阵的行数；其中，所述行数为偶数；

基于所述列数和行数，以及各个磁盘的数据存储位置相对关系，生成所述存储状态矩阵。
根据权利要求2所述的校验数据生成方法，其特征在于，所述基于所述列数和行数，以及各个磁盘的数据存储位置相对关系，生成所述存储状态矩阵，包括：

获取各个磁盘中各个数据条带对应的条带标识信息；

按照所述数据条带在所述磁盘中的相对位置关系，生成所述磁盘对应的磁盘向量；

基于所述列数和行数生成初始矩阵，并利用所述磁盘向量填充所述初始矩阵，得到所述存储状态矩阵。
根据权利要求1所述的校验数据生成方法，其特征在于，所述在所述第一矩阵的所述第一数据区和所述第二数据区中确定若干个二阶矩阵组，包括：

响应于所述第一矩阵中的所述初始数据区具有偶数个所述磁盘向量，则以两个磁盘向量为粒度对所述初始数据区进行分组，得到若干个第三数据区；

响应于所述第一矩阵中的所述初始数据区具有奇数个所述磁盘向量，则确定一个目标磁盘向量，并对非目标磁盘向量以两个磁盘向量为粒度进行分组，得到若干个第三数据区；

响应于所述第一矩阵中的所述初始数据区具有偶数个所述数据向量，则以两个数据向量为粒度对各个所述第三数据区进行分组，得到若干个所述二阶矩阵组；

响应于所述第一矩阵中的所述初始数据区具有奇数个所述数据向量，则确定一个目标数据向量，并对非目标数据向量以两个数据向量为粒度进行分组，得到若干个所述二阶矩阵组。
根据权利要求1所述的校验数据生成方法，其特征在于，所述第二矩阵包括多个数据向量，所述数据向量包括当前数据向量；

所述基于所述第二矩阵进行单纠错编码生成处理，得到第一校验数据，包括：

基于所述当前数据向量，从所述独立冗余磁盘阵列中读出对应的当前数据条带，并对所述当前数据条带进行异或处理，得到所述当前数据向量对应的所述第一校验数据。
根据权利要求1所述的校验数据生成方法，其特征在于，所述第二矩阵包括多个数据向量，所述数据向量包括当前数据向量；

所述基于所述第二矩阵进行双纠错编码生成处理，得到第二校验数据，包括：

基于所述当前数据向量，从所述独立冗余磁盘阵列中读出对应的当前数据条带；

获取所述当前数据向量对应的向量序号，并利用所述向量序号生成各个所述当前数据条带对应的权重参数；

利用所述权重参数和所述数据条带得到加权数据，并对所述加权数据进行异或处理，得到所述当前数据向量对应的所述第二校验数据。
根据权利要求1所述的校验数据生成方法，其特征在于，还包括：

若检测到目标磁盘故障，则从所述独立冗余磁盘阵列中的非目标磁盘中获取错误恢复数据；

从所述第一校验磁盘中获取目标第一校验数据，并从所述第二校验磁盘中获取目标第二校验数据；

利用所述错误恢复数据、所述目标第一校验数据和所述目标第二校验数据对所述目标磁盘进行数据恢复。
根据权利要求3所述的校验数据生成方法，其特征在于，在按照所述数据条带在所述磁盘中的相对位置关系，生成所述磁盘对应的磁盘向量之前，还包括：

根据所述条带标识信息，获取所述条带标识信息对应的数据条带的磁盘序号以及所述数据条带在所述磁盘中的序号；

根据所述数据条带的磁盘序号以及所述数据条带在所述磁盘中的序号，确定所述数据条带在所述磁盘中的相对位置关系；
根据权利要求1所述的校验数据生成方法，其特征在于，所述在所述磁盘向量中确定非参照向量，包括：

在所述磁盘向量中确定任意一个磁盘对应的向量为参照向量；

将所述磁盘向量中除了所述参照向量之外的向量确定为所述非参照向量。
根据权利要求1所述德校验数据生成方法，其特征在于，所述在所述非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区，包括：

将所述非参照向量所处的区域确定为初始数据区；

将所述初始数据区中的各个数据向量元素按照所述数据向量的方向平均分为两份，得到两份数据向量元素；

将所述两份数据向量元素所处的区域分别确定为所述第一数据区与所述第二数据区。
根据根据权利要求1所述的校验数据生成方法，其特征在于，对所述存储状态矩阵中的所述第一数据区和所述第二数据区进行数据交换处理，得到第一矩阵，包括：

获取所述第一数据区中的数据向量元素与所述第二数据区中的数据向量元素；

将所述第一数据区中的数据向量元素与所述第二数据区中的数据向量元素在所述存储状态矩阵中的位置进行对调，得到所述第一矩阵。
根据权利要求11所述的校验数据生成方法，其特征在于，在进行数据对调之后，所述第一数据区和所述第二数据区中的各个数据向量元素之间的相对位置关系不发生变化。
根据权利要求1所述的校验数据生成方法，其特征在于，所述对各个所述二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵，包括：

将所述二阶矩阵组中同属于一个磁盘向量的任意两个元素确定为所述目标磁盘元素；

将所述目标磁盘元素在所述二阶矩阵组中的位置进行交换，得到所述第二矩阵。
根据权利要求7所述的校验数据生成方法，其特征在于，所述第一校验数据和所述第二校验数据对应于不同的数据向量，且所述第一校验数据或所述第二校验数据与所述错误恢复数据对应的数据向量相同。
根据权利要求7所述的校验数据生成方法，其特征在于，所述利用所述错误恢复数据、所述目标第一校验数据和所述目标第二校验数据对所述目标磁盘进行数据恢复，包括：

当单个磁盘发生数据缺失时，确定所述目标磁盘的每个数据块对应的所述错误恢复数据、所述第一校验数据和所述第二校验数据；

根据所述错误恢复数据、所述第一校验数据和所述第二校验数据，对所述目标磁盘中对应的数据块进行数据恢复。
根据权利要求7所述的校验数据生成方法，所述利用所述错误恢复数据、所述目标第一校验数据和所述目标第二校验数据对所述目标磁盘进行数据恢复，包括：

当至少两个磁盘发生数据缺失时，消除所述第一校验数据与所述第二校验数据中，与所述错误恢复数据的相同数据，得到剩余数据；

根据所述剩余数据之间的数据关系，构建关系矩阵；

对所述关系矩阵进行计算，得到所述目标磁盘对应的数据块的向量的值；

根据所述目标磁盘对应的数据块的向量的值，对所述目标磁盘进行数据恢复。
一种校验数据生成装置，其特征在于，包括：

状态生成模块，用于获取与独立冗余磁盘阵列对应的存储状态矩阵；其中，所述存储状态矩阵包括多个磁盘向量和多个数据向量，所述磁盘向量和所述数据向量正交；

数据分区模块，用于在所述磁盘向量中确定非参照向量，并在所述非参照向量构成的初始数据区进行数据向量元素均分处理，得到第一数据区和第二数据区；

位置交换模块，用于对所述存储状态矩阵中的所述第一数据区和所述第二数据区进行数据交换处理，得到第一矩阵；

元素交换模块，用于在所述第一矩阵的所述第一数据区和所述第二数据区中确定若干个二阶矩阵组，并对各个所述二阶矩阵组中的目标磁盘元素进行位置交换处理，得到第二矩阵；

第一生成模块，用于基于所述第二矩阵进行单纠错编码生成处理，得到第一校验数据；

第二生成模块，用于基于所述第二矩阵进行双纠错编码生成处理，得到第二校验数据。
根据权利要求17所述的校验数据生成装置，其特征在于，还包括：

第一读取模块，用于若检测到目标磁盘故障，则从独立冗余磁盘阵列中的非目标磁盘中获取错误恢复数据；

第二读取模块，用于从第一校验磁盘中获取目标第一校验数据，并从第二校验磁盘中获取目标第二校验数据；

恢复模块，用于利用错误恢复数据、目标第一校验数据和目标第二校验数据对目标磁盘进行数据恢复。
一种电子设备，其特征在于，包括存储器和处理器，其中：

所述存储器，用于保存计算机程序；

所述处理器，用于执行所述计算机程序，以实现如权利要求1至16任一项所述的校验数据生成方法。
一种计算机非易失性可读存储介质，其特征在于，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至16任一项所述的校验数据生成方法。