WO2014019551A1

WO2014019551A1 - 解码处理方法、装置及编解码系统

Info

Publication number: WO2014019551A1
Application number: PCT/CN2013/080772
Authority: WO
Inventors: 李莉
Original assignee: 中兴通讯股份有限公司
Priority date: 2012-08-03
Filing date: 2013-08-02
Publication date: 2014-02-06
Also published as: CN102833040A; CN102833040B

Abstract

本发明提供了一种解码处理方法、装置及编解码系统，该方法包括：确定包括部分原数据与校验数据的待解码数据，其中，校验数据对应丢失的原数据；根据校验数据以及用于编码的第一生成矩阵，获取与丢失的原数据对应的小生成矩阵，以及与丢失的原数据对应的新的待解码数据；根据新的待解码数据以及小生成矩阵，获取丢失的原数据，通过本发明，解决了相关技术中基于RS纠删码的编解码方法存在编解码计算量庞大，速度慢，以及系统存储的有效利用率低的问题，进而达到了大大减少了编解码的计算量，提高了编解码的处理效率以及系统存储的有效利用率的效果。

Description

解码处理方法、装置及编解码系统技术领域本发明涉及通信领域，具体而言，涉及一种解码处理方法、装置及编解码系统。背景技术云存储是指通过集群应用、网格技术或分布式文件系统等功能，将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作，共同对外提供数据存储和业务访问功能的一个系统。在云计算环境中，文件一般被分片保存在多个云存储服务器中。在数据通讯时，需要通讯的数据也会被分为多个分片，逐片传送给对方。在数据存储时和通讯时，为了解决可靠性的问题，一般采用里德-所罗门 (Reed-Solomon, 简称为 RS) 纠删码（Erasure Codes, 简称为 EC) 技术，将文件编码后，分为大小相同的 m个分片和 n个校验分片，分别进行存储或通讯。对于文件存储或者通讯接收方，只要获得其中任意 m个分片，即可通过解码恢复原文件或者数据，因此可以抗 n个分片损坏或者丢失，大大提高了系统的可靠性。对于计算机文件存储，纠删码系统的存储空间利用率为 m/ (m+n)，远远高于副本存储方式，因此， RS纠删码通过计算能力换取存储能力，显著降低了存储成本和运维成本。

1960年，里德（I.S.Reed) 和所罗门（GSolomon) 提出一种构造纠删码的方法，使用该方法的纠删码被称作 Reed-Solomon码，简称 RS码。基于 RS编码技术构造的纠删码则称作 RS纠删码。一个 (n， k)纠删码是把 k个源数据编码为 n(n>k)个数据，使得用这 n个数据中任意 k个数据均可重构原来的 k个源数据。采用 m个分片和 n个校验分片的纠删码体制就是 (m+n， m)纠删码。

RS纠删码的实现技术关键是寻找一个生成矩阵 G，该矩阵中任意 k列均线性无关。 RS编码技术中，比较常用的生成矩阵是范德蒙矩阵和柯西矩阵。使用范德蒙矩阵生成的编码叫范德蒙码（Vandermond Code), 使用柯西矩阵生成的编码叫柯西码（Cauchy Code)。其编码原理是：原始数据 D[D1， D2， ..Dm]乘以生成矩阵 G，产生 m个原始数据 D[D1， D2， ..Dm]和 n个校验数据 P[P1， P2， ...， Pn]。解码原理是：在 m+n个原始数据和校验数据中任意获得m个数据，组成待解码数据D'，例如[Dl，...Di,Pl..Pj]。在生成矩阵中去掉 n个未出现数据对应的那一列，组成一个新的生成矩阵 G，然后计算 G的逆矩阵 G'，最后 D'*G'=D。为了使矩阵运算的结果保持在实数域，运算改为限定在伽罗瓦 (Galois)域 G(2 )或者 G(2 6)进行。在伽罗瓦域运算，为加快运算速度起见，乘法操作一般采用查双表法，一个乘法操作相当于 5个基本操作；加法和减法则采用异或（XOR) 操作。 RS和伽罗瓦域运算、矩阵求逆等的具体运算流程和特性，早已被研究透彻，在相关数学书籍和刊物上可以查到，因此在此不再赘述。但无论范德蒙矩阵和柯西矩阵的 RS纠删码体制，都有一个共同的缺点，就是编码、解码速度慢，时间复杂度均为 0(ιη^Λ2)。因此 RS编码的原始数据块和校验块数目都不能太大，目前商用系统中分片数量 m—般不超过 10，校验片 n—般不超过 6。为了在计算机通讯领域更好地运用 RS纠删码体制，一般采用专用硬件实现编解码功能，提高编解码速度。另一个缺点是，目前的 RS纠删码体制，都采用双表法进行伽罗瓦域乘法计算，通过查对数-反对数表进行，而双表法需要 5个基本操作才能完成伽罗瓦域乘法，造成计算结果较慢。如果把所有伽罗瓦域乘法数据都移入内存，则需要 8G 内存。在目前计算机硬件配置下，成本太高。一方面， RS纠删码体制在计算机存储和计算机通讯中能显著提高存储和传输可靠性，但是其软件编解码速度慢，而且随着分片 m的增加而呈指数型增长。另一方面，为了提升系统可靠性，校验分片 n不能过小，商用系统应至少保持在 4~6为宜，而 m 又不能增长很多，这就限制了存储系统的有效利用率。例如 m=10， n=6，系统有效存储即编码率只有 10/16=62.5%。如果在 n=6时要求 90%的编码率，则 m必须大于等于 54。在现有 RS纠删码计算方式下，单纯使用软件实现，要么很难做到，要么性能很差不实用。因此，在相关技术中基于 RS纠删码的编解码方法存在编解码计算量庞大，速度慢，以及系统存储的有效利用率低的问题。发明内容本发明提供了一种解码处理方法、装置及编解码系统，以至少解决相关技术中基于 RS纠删码的编解码方法存在编解码计算量庞大，速度慢，以及系统存储的有效利用率低的问题。根据本发明的一个方面，提供了一种解码处理方法，包括：确定包括部分原数据与校验数据的待解码数据，其中，所述校验数据对应丢失的原数据；根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵，以及与所述丢失的原数据对应的新的待解码数据；根据所述新的待解码数据以及所述小生成矩阵，获取所述丢失的原数据。优选地，根据所述校验数据以及用于编码的所述第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵包括：对所述待解码数据进行规格化处理，其中，所述规格化处理包括：保留所述部分原数据在所述待解码数据中的位置与所述部分原数据在编码之前的原始数据中的位置一致，并将所述校验数据填充到所述待解码数据中的剩余位置；获取与经过规格化处理之后的待解码数据对应的第二生成矩阵；根据所述第二生成矩阵以及所述校验数据，获取与所述丢失的原数据对应的小生成矩阵。优选地，获取与经过所述规格化处理之后的待解码数据对应的所述第二生成矩阵包括：保留所述第一生成矩阵的单位矩阵中与所述原数据对应列的列数据；在所述第一生成矩阵的单位矩阵的校验列中填充所述校验数据。优选地，根据所述第二生成矩阵以及所述校验数据，获取与所述丢失的原数据对应的所述小生成矩阵包括：在所述第二生成矩阵中提取所述校验数据出现的行与列；将提取的所述校验数据出现的行与列组成所述丢失的原始数据对应的所述小生成矩阵。优选地，在获取与所述丢失的原数据对应的小生成矩阵之后，还包括：根据所述小生成矩阵包含的校验数据和对应丢失的原始数据之间的关系，判断对应的小生成矩阵逆矩阵文件是否存在；在判断结果为是的情况下，通过读取所述小生成矩阵逆矩阵文件获取小生成矩阵的逆矩阵；和 /或，在判断结果为否的情况下，计算所述小生成矩阵的逆矩阵，并把所述小生成矩阵的逆矩阵写入到所述小生成矩阵逆矩阵文件。优选地，在获取到所述小生成矩阵的逆矩阵后，还包括：建立所述小生成矩阵的逆矩阵中的各个元素与伽罗瓦域中的 0到 65535构成的逆矩阵伽罗瓦域数组。优选地，在根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵之后，通过以下公式获取与所述丢失的原数据对应的新的待

P_j ' = P_j ® ^Dj * P_i]

解码数据： ^ ， j=l ..m，其中，如果第 j个位置不是原数据 1¾而是校验数据 P_x，则计算乘法时把它略过，为所述新的待解码数据， m为编码时输入数据的数量，为解码时使用的校验数据， Dj为编码时输入的数据， Ρ 为所述第二生成矩阵中的校验数据的列， ®为异或操作。优选地，在确定包括所述部分原数据与校验数据的待解码数据之前，通过以下编码方式得到所述待解码数据：建立由所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的生成矩阵伽罗瓦域数组；判断是否存在存储所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果对应的文件；在判断为是的情况下，从所述文件中读取所述生成矩阵伽罗瓦域数组中所存储的乘法操作结果。优选地，在判断是否存在存储所述第一生成矩阵除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果对应的文件之后，还包括：在判断为否的情况下，获取所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果；将获取的所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0 到 65535的乘法操作结果保存在所述生成矩阵伽罗瓦域数组中。根据本发明的另一方面，提供了一种解码处理装置，包括：第一确定模块，设置为确定包括部分原数据与校验数据的待解码数据，其中，所述校验数据对应丢失的原数据；第一获取模块，设置为根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵，以及与所述丢失的原数据对应的新的待解码数据；第二获取模块，设置为根据所述新的待解码数据以及所述小生成矩阵，获取所述丢失的原数据。优选地，所述第一获取模块包括：第一处理单元，设置为对所述待解码数据进行规格化处理，其中，所述规格化处理包括：保留所述部分原数据在所述待解码数据中的位置与所述部分原数据在编码之前的原始数据中的位置一致，并将所述校验数据填充到所述待解码数据中的剩余位置；第一获取单元，设置为获取与经过规格化处理之后的待解码数据对应的第二生成矩阵；第二获取单元，设置为根据所述第二生成矩阵以及所述校验数据，获取与所述丢失的原数据对应的小生成矩阵。优选地，所述第一获取单元包括：保留子单元，设置为保留所述第一生成矩阵的单位矩阵中与所述原数据对应列的列数据；填充子单元，设置为在所述第一生成矩阵的单位矩阵的校验列中填充所述校验数据。优选地，所述第二获取单元包括：提取子单元，设置为在所述第二生成矩阵中提取所述校验数据出现的行与列；组成子单元，设置为将提取的所述校验数据出现的行与列组成所述丢失的原始数据对应的所述小生成矩阵。优选地，还包括：第一判断模块，设置为根据所述小生成矩阵包含的校验数据和对应丢失的原始数据之间的关系，判断对应的小生成矩阵逆矩阵文件是否存在；第三获取模块，设置为在判断结果为是的情况下，通过读取所述小生成矩阵逆矩阵文件获取小生成矩阵的逆矩阵；和 /或，第一写入模块，设置为在判断结果为否的情况下，计算所述小生成矩阵的逆矩阵，并把所述小生成矩阵的逆矩阵写入到所述小生成矩阵逆矩阵文件。优选地，还包括：第一建立模块，设置为建立所述小生成矩阵的逆矩阵中的各个元素与伽罗瓦域中的 0到 65535构成的逆矩阵伽罗瓦域数组。根据本发明的另一方面，提供了一种编解码系统，包括上述任一项所述的装置和编码装置，其中，所述编码装置包括：第二建立模块，设置为建立由所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的生成矩阵伽罗瓦域数组；第二判断模块，设置为判断是否存在存储所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果的对应文件；读取模块，设置为在所述判断模块的判断结果为是的情况下，从所述文件中读取所述生成矩阵伽罗瓦域数组中所存储的乘法操作结果。通过本发明，采用确定包括部分原数据与校验数据的待解码数据，其中，所述校验数据对应丢失的原数据；根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵，以及与所述丢失的原数据对应的新的待解码数据；根据所述新的待解码数据以及所述小生成矩阵，获取所述丢失的原数据，解决了相关技术中基于 RS纠删码的编解码方法存在编解码计算量庞大，速度慢，以及系统存储的有效利用率低的问题，进而达到了在解码处理的过程中与输入数据的数量无关，大大减少了编解码的计算量，提高了编解码的处理效率以及系统存储的有效利用率的效果。附图说明此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：图 1是根据本发明实施例的解码处理方法的流程图；图 2是根据本发明实施例的解码处理装置的结构框图；图 3是根据本发明实施例的解码处理装置中第一获取模块 24的优选结构框图；图 4是根据本发明实施例的解码处理装置中第一获取模块 24中第一获取单元 34 的优选结构框图；图 5是根据本发明实施例的解码处理装置中第一获取模块 24中第二获取单元 36 的优选结构框图；图 6是根据本发明实施例的解码处理装置的优选结构框图一；图 7是根据本发明实施例的解码处理装置的优选结构框图二；图 8是根据本发明实施例的编解码系统的结构框图；图 9是根据本发明实施例的基于 RS纠删码的文件快速编码方法的流程图；图 10是根据本发明实施例的基于 RS纠删码的文件快速解码方法的流程图。具体实施方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。在本实施例中提供了一种解码处理方法，图 1是根据本发明实施例的解码处理方法的流程图，如图 1所示，该流程包括如下步骤：步骤 S102，确定包括部分原数据与校验数据的待解码数据，其中，该校验数据对应丢失的原数据；步骤 S104, 根据上述校验数据以及用于编码的第一生成矩阵，获取与上述丢失的原数据对应的小生成矩阵（以及该小生成矩阵的逆矩阵），以及与上述丢失的原数据对应的新的待解码数据；步骤 S106, 根据上述新的待解码数据以及上述小生成矩阵（或者小生成矩阵的逆矩阵），获取丢失的原数据。通过上述步骤，只针对丢失的数据获取对应的小生成矩阵，以及对应的新的待解码数据，从而得到丢失的数据，即在计算逆矩阵的过程中与数据分片的数量无关，只和使用的校验分片数量有关，并且在编码和解码过程中，使用内存缓存伽罗瓦域乘法取代原有的双表法。相对于原有方法，不仅解决了相关技术中基于 RS纠删码的编解码方法存在编解码计算量庞大，速度慢，以及系统存储的有效利用率低的问题，而且，达到了提高了编解码的处理效率以及系统存储的有效利用率的效果。在根据校验数据以及用于编码的上述第一生成矩阵，获取与丢失的原数据对应的小生成矩阵可以采用较多的处理方式，例如，对于一些简单的小生成矩阵，按照合理的数学逻辑推理，可以针对校验数据以及上述第一生成矩阵，人为地第一生成矩阵中提取出小生成矩阵，当然对于一些复杂的小生成矩阵，还需要按照严密的数学规则获得，较优地，可以采用以下处理方式：对待解码数据进行规格化处理，其中，该规格化处理包括：保留部分原数据在待解码数据中的位置与部分原数据在编码之前的原始数据中的位置一致，并将校验数据填充到待解码数据中的剩余位置（其中，上述填充的顺序可以是依次填充，也可以倒序来填充，具体操作并不限定）；获取与经过规格化处理之后的待解码数据对应的第二生成矩阵；其中，编码时输入的数据与该第二生成矩阵相乘可以得到规格化处理之后的待解码数据，根据上述第二生成矩阵以及校验数据，获取与丢失的原数据对应的小生成矩阵。采用这样的处理方式，可以适用于多种场景，并且操作原理简单，处理时也较为容易。在实施时，采用上述严密的数学规则处理时，获取第二生成矩阵也可以按照以下较为简单的处理方式：保留第一生成矩阵的单位矩阵中与原数据对应列的列数据；在第一生成矩阵的单位矩阵的校验列中填充上述保留完原数据对应列之后的校验数据。另外，根据第二生成矩阵以及校验数据，获取与丢失的原数据对应的小生成矩阵的步骤也可以采用以下较为简单的处理方式：在第二生成矩阵中提取校验数据出现的行与列；将提取的校验数据出现的行与列组成丢失的原始数据对应的小生成矩阵。在获取小生成矩阵后，可以根据小生成矩阵包含的校验数据和对应丢失的原始数据之间的关系，判断对应的小生成矩阵逆矩阵文件是否存在，如果存在，通过读取该文件，直接获得小生成矩阵的逆矩阵；如果不存在，通过逆矩阵计算方法，计算出小生成矩阵的逆矩阵，并把逆矩阵内容写入到对应文件中。较优地，在获得小生成矩阵逆矩阵数据后，还可以建立小生成矩阵逆矩阵中各个元素与伽罗瓦域中的 0到 65535 构成的逆矩阵伽罗瓦域数组，用于随后的解码。优选地，在根据校验数据以及用于编码的第一生成矩阵，获取与丢失的原数据对应的小生成矩阵之后，也可以通过各种方式获得新的与丢失的原数据对应的新的待解码数据。本发明实施例提供了一种处理方式，即通过以下公式获取与丢失的原数据对应的新的待解码数据： Pd ®†^*^， j=l ..m，其中，如果第 j个位置不是原数据 Dj而是校验数据 P_x，则计算乘法时把它略过，为该新的待解码数据， m为编码时输入数据的数量，为解码时使用的校验数据， Dj为编码时输入的数据， Ρ 为第二生成矩阵中的校验数据的列， ®为异或操作。优选地，由于本发明实施例中所提供的解码方法具体相对于相关技术计算量减少，以及解码处理效率高的特点，因此，在对待解码数据进行编码时，可以采用以下编码方式得到该待解码数据：首先，建立由第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的生成矩阵伽罗瓦域内存数据结构，例如数组或者 Hash 表，以下以数组为例说明；在进行编码时，先判断生成矩阵伽罗瓦域数组中是否存在第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果，较简单地，可以判断存储该操作结果的文件是否存在；在判断为是的情况下，直接读取该生成矩阵伽罗瓦域数组中所存储的乘法操作结果。采用这样的处理方式，只需要简单的判断以及读取操作，相比于现有技术中伽罗瓦乘法的多次连续操作，其操作量大大减少，在一定程度上提高了解码的效率。另外，在该数组中不存在第一生成矩阵与伽罗瓦域中从 0到 65535的乘法操作结果时，获取第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域的 0到 65535的乘法操作结果，即计算第一生成矩阵中除单位矩阵外的的各个元素与伽罗瓦域中的 0 到 65535 的乘法操作结果；将获取的第一生成矩阵中除单位矩阵外的各个元素与所述伽罗瓦域中的 0到 65535的乘法操作结果保存到上述生成矩阵伽罗瓦域数组中。生成矩阵伽罗瓦域数组中的数据，不仅用于编码，而且用于解码过程中计算新的待解码数据的步骤中，采用这样的处理之后，在之后采用相同的第一生成矩阵对输入数据进行编码时，就可以直接读取相应的乘法操作结果，节约处理时间，提高效率。需要说明的是，在上述实施例及优选实施方式中，由第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的伽罗瓦域乘法数据，除了按数组方式在内存中保存和寻址外，还可按照 Hash表方式在内存中保存和寻址。当然，其它较为便利的存储方式也同样适用于本发明。在本实施例中还提供了一种解码处理装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语"模块"可以实现预定功能的软件和 /或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。图 2是根据本发明实施例的解码处理装置的结构框图，如图 2所示，该装置包括第一确定模块 22、第一获取模块 24和第二获取模块 26，下面对该装置进行说明。第一确定模块 22，设置为确定包括部分原数据与校验数据的待解码数据，其中，该校验数据对应丢失的原数据；第一获取模块 24，连接至上述第一确定模块 22，设置为根据上述校验数据以及用于编码的第一生成矩阵，获取与丢失的原数据对应的小生成矩阵，以及与丢失的原数据对应的新的待解码数据；第二获取模块 26，连接至上述第一获取模块 24，设置为根据该新的待解码数据以及上述小生成矩阵，获取丢失的原数据。图 3是根据本发明实施例的解码处理装置中第一获取模块 24的优选结构框图，如图 3所示，该第一获取模块 24包括第一处理单元 32、第一获取单元 34和第二获取单元 36，下面对该第一获取模块 24进行说明。第一处理单元 32，设置为对上述待解码数据进行规格化处理，其中，该规格化处理包括：保留部分原数据在上述待解码数据中的位置与该部分原数据在编码之前的原始数据中的位置一致，并将校验数据填充到该待解码数据中的剩余位置；第一获取单元 34，连接至上述第一处理单元 32，设置为获取与经过规格化处理之后的待解码数据对应的第二生成矩阵；第二获取单元 36，连接至上述第一获取单元 34，设置为根据上述第二生成矩阵以及校验数据，获取与丢失的原数据对应的小生成矩阵。图 4是根据本发明实施例的解码处理装置中第一获取模块 24中第一获取单元 34 的优选结构框图，如图 4所示，该第一获取单元 34包括保留子单元 42和填充子单元 44，下面对该第一获取模块 24进行说明。保留子单元 42，设置为保留第一生成矩阵的单位矩阵中与原数据对应列的列数据；填充子单元 44，连接至上述保留子单元 42，设置为在上述第一生成矩阵的单位矩阵的校验列中填充校验数据。图 5是根据本发明实施例的解码处理装置中第一获取模块 24中第二获取单元 36 的优选结构框图，如图 5所示，该第二获取单元 36包括提取子单元 52和组成子单元 54，下面对该第二获取单元 36进行说明。提取子单元 52，设置为在第二生成矩阵中提取上述校验数据出现的行与列；组成子单元 54，连接至上述提取子单元 52，设置为将提取的上述校验数据出现的行与列组成丢失的原始数据对应的小生成矩阵。图 6是根据本发明实施例的解码处理装置的优选结构框图一，如图 6所示，该装置除包括图 2中的所有模块外，还包括第一判断模块 62、第三获取模块 64和 /或第一写入模块 66，下面对该装置进行说明。第一判断模块 62，连接至上述第二获取模块 24，设置为根据小生成矩阵包含的校验数据和对应丢失的原始数据之间的关系，判断对应的小生成矩阵逆矩阵文件是否存在；第三获取模块 64，连接至上述判断模块 62，设置为在判断结果为是的情况下，通过读取小生成矩阵逆矩阵文件获取小生成矩阵的逆矩阵；和 /或，第一写入模块 66，连接至上述第三获取模块 64，设置为在判断结果为否的情况下，计算小生成矩阵的逆矩阵，并把小生成矩阵的逆矩阵写入到小生成矩阵逆矩阵文件。图 7是根据本发明实施例的解码处理装置的优选结构框图二，如图 7所示，该装置除包括图 6中的所有模块外，还包括第一建立模块 72，下面对该第一建立模块 72 进行说明。第一建立模块 72，设置为建立小生成矩阵的逆矩阵中的各个元素与伽罗瓦域中的 0到 65535构成的逆矩阵伽罗瓦域数组。在本实施例中还提供了一种编解码系统，图 8是根据本发明实施例的编解码系统的结构框图，如图 8所示，该系统除包括上述任一项所述的解码处理装置外，还包括一编码装置，其中，该编码装置包括：第二建立模块 82，设置为建立由第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的生成矩阵伽罗瓦域数组; 第二判断模块 84，连接至上述建立模块 82，设置为判断生成矩阵伽罗瓦域数组中是否存在第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果；读取模块 86，连接至上述第二判断模块 84，设置为在判断模块的判断结果为是的情况下，读取生成矩阵伽罗瓦域数组中所存储的乘法操作结果。上述实施例及优选实施方式所提出的在文件存储或数据通讯时，基于 RS纠删码体制下快速编码和快速解码的方法，该方法可以通过软件实现，有效地提升编码和解码速度，并且求逆矩阵、文件编码，以及文件解码的运算量都和分片数目 m无关，只和编码、解码时使用的校验分片数 n有关。在该方法中，通过使用待解码数据的规格化处理，可以用来生成 RS纠删码体制下等效的较小生成矩阵 Gl，该生成矩阵大小为 n*n, 可以远远小于原来的 m*m的生成矩阵 G，因此可以快速计算它的逆矩阵，并用于快速解码。另外，将所有伽罗瓦域乘法由双表法改为查内存法，且内存消耗很小，可以应用于现有的计算机系统中。采用上述实施例及优选实施方式所提出的快速编解码方法，可以在里德-所罗门 (m+n， m)纠删码体制下，有效地提高 m值，从而提高存储空间利用率，或者降低校验数据比例，在数据通讯时提高通讯速度。例如，在 n=6，并且解码时使用全部 6块校验分片的情况下，支持 m高达 64到 128，相应的编码率达到 91.4%和 95.5%，且 m， n可在满足 RS纠删码条件限制和计算机运算能力限制的条件下任意设置。由于求逆矩阵、文件编解码均和分片数量 m无关，因此 m无上限约束，只要保证 m+n小于 2 或 2^16伽罗瓦域计算限制即可。本发明对生成矩阵没有限制，范德蒙矩阵和柯西矩阵均可适用，任何别的符合 RS纠删码体制的生成矩阵也可适用，但使用柯西矩阵可以减少内存使用，获得更佳效果。通过上述实施例及优选实施方式，极大地改善了 RS纠删码体制下的生成矩阵求逆矩阵和编解码性能，不仅在理论上有突破，而且具有较大的实用价值，适用于云存储和数据通讯领域中使用 RS纠删码的体系中。在本实施例中所提供的快速编码解码方法，在保持使用 RS纠删码技术原理的情况下，由数据快速编码和数据快速解码两种方法组成。这两种方法既相互独立，又有联系。它们可以单独使用或者联合使用，分别用于数据快速编码和数据快速解码。数据快速解码方法与相关技术中的数据解码存在较大差异，该数据快速解码方法大致包含以下处理：（1 ) 将待解码数据规格化，并通过文件缓存逆矩阵数据；（2) 快速求解生成矩阵的等效小矩阵的逆矩阵；（3 ) 解码并替换校验数据。需要说明的是，上述所采用上述快速编解码方法，对生成矩阵没有限制，范德蒙矩阵、柯西矩阵或者别的生成矩阵均可适用，并不对此进行限定，但使用柯西矩阵可获得更佳效果。在本实施例中以生成矩阵为柯西矩阵为例进行说明。对于给定的 m， n参数，系统生成矩阵 G使用柯西矩阵，例如， m=5， n=3， BP(8,5) 纠删码，生成矩阵 G为单位阵 I和柯西矩阵 Q的组合。如下显示,共使用 3列校验矩阵， Ρ 表示柯西矩阵中除单位矩阵外的第 i列数据的第 j行元素。

如果输入数据为包含 m个元素的 D，用矩阵表示为 D=[Di， D₂， .D_m]，使用 P 表示校验数据，用矩阵表示为 [P^P^P , 则 RS编码方式为：

D * [I, Q] = [D， P]，或者： [D D₂， ....D_m]*G=[ Di, D₂， ...D_m， Pi,P₂...P_n] 下面分别针对快速编码和快速解码方法进行说明。 1、快速编码方法: 系统预先准备好伽罗瓦域 G(2 6)中所有乘法 X*Y数据，其中 X， Υ从 0到 65535。这些数据大小是 65536*65536*2=8GB，存放在文件 Galois.dat中。实际使用时为读取方便，这些数据可放在若干文件中，在逻辑上组成单个 Galois.dat文件。由于 m， n确定后，生成矩阵 G也就确定，按照其中柯西矩阵 G的列元素对这些数据进行递增计数，共计 m*n个元素，编号从 0到 m*n-l。为 m*n个元素建立编码二维数组 Code[][]，对每个元素 Ρ 计算其在伽罗瓦域中对 0到 65535的乘法操作结果，预先保存在文件中，文件名与！^ η相关。编码时的生成矩阵和具体要编码的文件无关，只和 m， n有关，因此可以预先生成好特定参数下的生成矩阵伽罗瓦域缓存文件。这样，系统初始化时，首先读取相应的生成矩阵伽罗瓦域缓存文件。如果该文件不存在，则将需要的数组元素计算出来并写入文件中，以便以后读取。计算某个元素 Ρ 在伽罗瓦域的全部乘法结果，就是在 Galois.dat中适当位置（Ρ *65536*2字节处）读取连续 65536个字，共计 128K字节。下表 1为生成矩阵伽罗瓦域数组 Code[m*n][65536]组成示意。 Code[i][k]中第一维度所有元素 i均为生成矩阵 G中出现的元素编号，第二维度元素 k从 0到 63335， Code[i][k]存放 G中元素 Ρ 与 k的伽罗瓦域乘法结果。根据生成矩阵算法获得生成矩阵中所有元素后，当需要计算乘以 Ρ 时，只需要找到 Ρ 的编号 χ，然后返回数组 Code [χ]^]的值即可。只需要 1次操作，比原来伽罗瓦域乘法的 5次操作节约 4次。表 1

对于 RS编码，每次需要保存原数据时，都要额外保存 n个效验块，每个效验块数据计算时需要 m次伽罗瓦域乘法和 m-1次加法。由于 1次伽罗瓦域乘法等于 5次基本操作，因此，每个效验块数据计算量大约 6m。总计算量为 6mn。采用上述实施例的快速编码方法后，使用查数组法代替伽罗瓦域乘法，一次伽罗瓦域乘法只需要 1次查数组的内存操作，因此，每个效验块数据计算量大约 2m，总计算量为 2mn，比原来减少 2/3的操作量，编码速度提高两倍。使用的 Code数组大小为 m*n* 128KB。典型的， m=64， n=10时， Code数组大小为 81.92M字节。对于长度为 L的文件，每次取 m个字（两字节）进行编码。按字编码而不是按字节编码，是因为在伽罗瓦域 G(2 6)中计算，且按字编解码适应计算机系统本身的字长，可提高编解码速度。如果 L不是 m整数倍数，则最后补 0补齐到 m的倍数。因此，需要循环计算 L/m 次，原计算量为 6Ln，改进后计算量为 2Ln。文件总的编码计算量和分片数 m无关，只和校验块 n和文件长度 L有关。因此，提高 m数量不会造成文件编码速度下降。相反由于提高分片 m数量后，额外生成和写入磁盘的校验数据大小占原文件的比例下降，因此编码性能反而提高。下表 2是 Dell E6420笔记本下的编码测试结果，单位为秒：表 2

可以看出，相同大小文件的编码，校验分片相同时，随着 m的增大，编码速度反而加快。由于柯西生成矩阵的性质，可以通过适当的参数设置，使得在生成矩阵中的 m*n 个元素，只出现 m+n-1个不同的元素，这样可以将 Code数组大小，从 Code[m*n][65536] 变为 Code[m+n-l][65536]，即大约是原来的 l/n。 2、快速解码方法：本实施例所提供的快速解码方法包含以下步骤：（1 ) 将待解码数据规格化，并计算该情况下的待解码数据 D"和对应的小生成矩阵 G ，通过文件读取 '的逆矩阵数据。（2) 如果逆矩阵文件不存在，则计算该小生成矩阵的逆矩阵，并把逆矩阵数据写入文件。（3 ) 快速解码校验数据。下面对上述步骤进行说明。

( 1 )：将待解码数据规格化，并计算该情况下的待解码数据 D"和对应的小生成矩阵 '文件名，通过文件读取 '的逆矩阵数据。对于一个给定了包含 m个分块的待解码数据 D'，用矩阵表示为 [D . . .Dj,P_x..P_y]，将待解码数据按如下方法进行规格化，生成唯一的排列。其方法是：对于待解码数据 D'= [D,, . . .Dj,P_x..P_y]，对于其中的原文件数据 Ι ，使之位于 D' 中第 i位，即它原来出现的位置。对于 D'中剩余的位置，使用多个校验块 P数据，从左到右（即按照原来校验块的顺序）对 D'进行顺序填充。例如， m=5， n=3 , 使用待解码数据块 D₂， D₅和 P_L P₂， P₃，则规格化后的 D'^P D₂， P₂， P₃， D₅]。这种规格化数据，是使用原数据块和校验数据块组合按此规则的唯一排列。计算待解码数据 D"的原理是:

其中， D_l D₃， D₄是未知数据， P_l P₂，

D1P11+D3P13+D4P14 = Pi - D₂Pi₂-D₅Pi5=Pi'

DiP₂i+D₃P23+D₄P24 = P₂ - D₂P₂₂-D₅P₂₅=P₂'

D1P31+D3P33+D4P34 = P₃ - D₂P₃₂-D₅P₃₅=P₃' 即：

作为一般情况下的通用公式： P₁' = P₁®†_jDj*P_i] , j=l..m。

J=l 其中，表示解码时使用的校验数据， Dj和 Ρ 表示输入数据和生成矩阵 G中的校验数据那一列。如果第 j个位置不是原数据 Α而是校验数据 Ρ_χ，则计算乘法时把它略过。 ®表示是异或操作。在伽罗瓦域中，加减都是异或操作。小生成矩阵是原生成矩阵 G中的 n*n个数据。 n为使用的校验块数量。如果 S={1， 3， 4}是校验块出现的位置，则生成矩阵中的 Ρ 组成小生成矩阵 Gi， i， jes。表 3示意了小生成矩阵的生成，如下表所示：那些生成矩阵中，校验数据出现的行、列组成的数据，组成小生成矩阵 G_lt) P₁'=P₁©D₂*P_l2©D₅*P_l5o 最终的小生成矩阵 G1如表 4所示。表 3

Pi D₂ P₂ P₃ D₅

表 4:

只要记录分片 m数和各个校验数据出现位置和编号，即可构成唯一的文件名。校验数据出现位置（表 3中斜体加粗显示）就是丢失的原数据分块的编号。获得了小生成矩阵 G1 的逆矩阵文件名后，读取该文件。如果该文件存在，读取该文件内容到逆矩阵 '中，直接完成逆矩阵的计算工作，进入到步骤（3 )。如果该文件不存在，则做标志，等步骤（2)完成，生成了逆矩阵后，再将逆矩阵数据写入该文件中。也可以预先计算好若干典型排列对应的逆矩阵文件，保存在存储系统中，以供系统遇到后直接使用。步骤（2): 计算逆矩阵对于上面举例的，上述实施例所使用的规格化排列例子 [D^^P^P^Ds] , 获得了小生成矩阵，但没有对应的缓存文件，则使用常规的计算逆矩阵方法，获得小生成矩阵的逆矩阵计算方阵逆矩阵的常用算法有高斯-若当消元法和伴随矩阵法。对于高斯-若当消元法，计算方阵 m的逆矩阵计算量为 0(m )。由于现在生成矩阵大小下降为 _n*n个元素，计算量下降为 0(ι ^Λ3)。相关原理和具体实现早已被研究清楚，在此不再赘述。上述实施例的优点是，可将生成矩阵从 m*m降低为等效的 η*η，在使用的校验分片 η小于原分片 m时，可以大大减少计算逆矩阵的工作量。只有在使用校验分片 n=m时，才和原来计算量相等。使用伴随矩阵法求逆矩阵，计算量高于高斯-若当消元法。无论采用何种求逆矩阵方法，求出逆矩阵后，都将逆矩阵数据写入规格化列对应的小逆矩阵 D'所对应的文件中。以后遇到使用相同的原数据块和校验块组合，即可直接从文件中读出和生成逆矩阵。一个逆矩阵文件包含 n*n*2字节，对于 n=6，逆矩阵文件大小为 72字节，在当前计算机处理能力下，读取文件时间小到可以忽略不计。因此，采用逆矩阵数据缓存机制后，只有第一次遇到此规格化数据排列时，需要计算逆矩阵，以后就不再需要计算。由于逆矩阵数据取决于损坏的数据位置和使用的校验分片排列，因此逆矩阵数据和实际使用情况有关，在 m， n较大情况下不可能预先全部计算出来，因此采用本发明实施例及优选实施方式的机制，在第一次遇到时计算和保存逆矩阵数据。由于采用了规格化方法，可以唯一确定数据块损坏位置和使用的校验分片编号，因此，以后遇到相同情况的组合，就可以通过读取逆矩阵文件的方式获得逆矩阵。随着系统的不断运行，会生成和保存越来越多组合下的逆矩阵数据，系统性能也就越来越好。采用上述实施例及优选实施方式所提供的方法，由于计算逆矩阵工作量比原来缩小很多，因此，实际编码时可以有效增加校验分块数量 n的值。计算出解码数据后，将这些元素按列从 0进行编号。逆矩阵的 n*n个元素，对应编号为 0到 n*n-l。建立解码数组 Decode[n*n][65536]，存放逆矩阵所有元素对伽罗瓦域的乘法数据。从伽罗瓦域全量文件 Galois.dat中读取这些逆矩阵元素对应的伽罗瓦域乘法结果。每个元素 Χ对应的伽罗瓦域乘法结果有 128K，位于 Galois.dat从 x*65536*2 字节开始处。 Decode矩阵大小为 n*n*128k。如果解码最多支持 10 个校验分片，则 Decode矩阵大小为 12.8M字节。由于解逆矩阵消耗时间很多而需要保存的字节数很少，逆矩阵伽罗瓦域乘法数组数据量很大而生成时间很少，因此，不用保存逆矩阵伽罗瓦域乘法结果，只需要保存逆矩阵数据即可。步骤（3 )，快速解码校验数据对于本发明实施例中所采用的解码体制，只需要恢复 k个校验块数据，其余均为原数据，且位置也相同。例如，例子中使用了 3个效验块数据 Pi， P₂， P₃，则解码时，剩余 D₂， D₅都可直接使用，且在原数据 D中位置也相同。而 Di， D₃， D₄根据前面的数据准备和逆矩阵乘法计算而来。解码时，使用 Decode矩阵进行伽罗瓦域乘法。例如，要计算 '值与逆矩阵 Χ 的乘法时，首先查出 '的编号 χ，然后返回 De_COd_e[x][ Ρ ] 。解码计算量为 0(mk)，比原来的 0(ιη^Λ2)，下降为原来的 k/m。按一个伽罗瓦域等于 5个基本操作计算，原解码计算量总计为 6mm。使用 k个校验块 (k<=n)时，解码计算量为 0(mk)，比原来的 0(ιη^Λ2)，下降为原来的 k/m。按一个伽罗瓦域等于 5个基本操作计算，原解码计算量总计为 6mm; 使用本发明的解码方法，伽罗瓦域乘法全部变为查内存方式，计算量下降为 2mk。当 m>k时，解码速度提高 3m/k倍。快速解码校验数据，具体包括如下步骤：

1 ) 数据准备阶段如果解码时使用 k个校验数据，则需要计算 k个数据，每个数据需要计算 m-k个伽罗瓦域乘法和 m-k个异或加法。由于每个伽罗瓦域乘法是 Dj乘以 Ρ，而 Ρ 是生成矩阵元素，因此，可以利用前述快速编码方法中的"生成矩阵伽罗瓦域数组 Code", 将乘法操作改为直接查数组操作，当计算 Dj乘以 Ρ 时，只需要找到 Ρ 的编号 χ，然后返回数组 Cod_e[_X][Dj]的值即可。只需要 1次操作，加上异或加法，数据准备阶段共需要 2(m-k)k操作。 2) 解码阶段解码阶段是 k个 IV乘以的逆矩阵 Gi'，该矩阵大小为 k*k。由于计算时直接使用查 De_COde[][]数组方式，加上异或的加法运算，需要 2kk个操作。因此解码总计需要 2(m-k)k+2kk=2mk操作，计算量和编码相同。显然，和以前的 2mm操作相比，本发明实施例在使用的校验块 k小于数据分片 m时，总操作数量大大减少。即使和改进型的解码 6mk计算量相比，本发明实施例由于利用了编码缓存矩阵 Code[][]和解码缓存矩阵 Decode[][]，也可减少 2/3的计算量。对于长度为 L的文件，每次取 m个字进行解码。共需要循环 L/m次，总计算量为： 0(mk)*L/m = O(Lk), 具体而言是略大于 2Lk。因此，采用本发明实施例的快速解码方法，总计算量只和文件长度和使用的冗余块 k (k<=n) 有关，和分片 m无关。逆矩阵计算时，也只和使用的冗余分片 k有关，和 m无关。因此，提高分片数 m值不会影响解码速度。相反，由于 m增大后校验数据占原文件的比例下降，因此解码性能反而略有提高。在支持 10个校验分片的情况下，解码时需要使用 12.8M字节内存存放 Decode矩阵数据，在 m=64的情况下，需要 81.92M字节内存存放 Code矩阵数据。如果生成矩阵只出现 m+n-l=73个不同元素，则需要 73*128K=9.344M字节存放 Code编码数组数据。下表 5为不同参数设置下的编解码所需内存数据以及编解码时校验数据占总文件的比例。 Code数组按照 m+n-1个不同元素计算。可以看出，在 10个校验分片的情况下，在分片数量不超过 128时，最多只需要 30.336M的内存，即可将编解码时遇到的所有伽罗瓦域乘法数据全部加载到内存，并不需要 8G内存。

表 5

编码时，需要将校验数据写入文件。解码时，需要将校验数据恢复为原来数据写入文件。因此，校验数据在编解码时的比例越低越好。从上表可以看出，在校验分片 n不变的情况下， m越大，编码、解码时校验数据占的比例就越低，需要额外写入文件的编码数据和解码数据就越少。因此虽然编解码时 RS纠删码计算量和 m无关，只和校验块数有关，但 m越大，额外写入磁盘的数据比例就越少，编码、解码性能也就越好。综上所述，本发明实施例所提供的 RS纠删码体制下快速编码和快速解码的方法，可以通过软件实现，有效地提升编码和解码速度，并且矩阵求逆和文件的编解码速度都和 m无关，只和编码、解码时使用的校验分片数 n有关。通过使用待解码数据的规格化方法，可以用来快速计算 RS纠删码体制下的等效小生成矩阵的逆矩阵，以及快速解码。将逆矩阵计算量从以前的 0 ( m ) 降低为 0(ι ^Λ3)。通过使用很少的内存，将伽罗瓦乘法数据放入内存，计算伽罗瓦域乘法时，使用查内存数组的方法取代以前的双表法，进一步提高了编解码速度。使用本发明实施例提出的快速编解码方法，可以在里德-所罗门 (m+n， m)纠删码体制下，有效地提高编解码速度和 m值，从而提高存储空间利用率，或者降低校验数据在总数据中的比例，并且在数据通讯时提高通讯速度。在 n=6，并且解码时使用全部 6块校验分片的情况下，支持 m高达 64到 128，相应的编码率达到 91.4%和 95.5%，且 m， n可在满足 RS纠删码条件限制和计算机运算能力限制的条件下任意设置。本发明对生成矩阵没有限制，范德蒙矩阵、柯西矩阵或者别的生成矩阵均可适用。但使用柯西矩阵时，可以通过设置参数，减少生成矩阵乘法数组 Code 的大小，从而降低内存消耗，获得更优的效果。在本实施例中提供了一种基于 RS纠删码的快速编解码的方法，其中，包括对数据的编码及解码，下面详细说明。在说明对数据的编码与解码之前，首先对快速编码中的柯西生成矩阵进行说明。

+) A) + ¾) ...

G=| ++) ΙΛ))

++ V¾i)) ......

1/( 5 +yi) 1/( 5 + ¾) 1/( 5 + ¾) ... 1/( 5 + )

1 1/2 1/3 ... \ln

1/2 1/3 1/4 ... l/(w+l)

1/3 1/4 1/5 … l/(w+2)

1/4 1/5 1/6 ... \/(n+3)

1/5 1/6 1/7 ... l/(w+4)

\lm l/(m+l) l/(m+2) ... l/(m+w-l) 由公开的数学知识可知，生成矩阵除去单位方阵 I后的柯西生成矩阵如上述矩阵

G的上半部分所示，矩阵元素 Ρ =1/(_Χι+ )。根据公开知识，柯西矩阵元素限制为：对于 X={xi,x₂,...xm}， Y={yi,y2,...y_n},

1) 对任意 i和 j，有 _Xi+yj!=0;

2) 对 X中任意两个元素 _Xl， _Xj, 有 i!=j 时， _Xl!=_Xj

3) 对 Y中任意两个元素 yi， yj，有 i!=j 时， yi!=yj 因此，选 _Xl=i， yrj-1 , 其中 i从 l ... m， j从 l ..n，获得柯西矩阵上述矩阵 G的下半部分。这样，该柯西生成矩阵中只出现 m+n-1个不同元素。将这些元素转化为伽罗瓦域对应元素，并按列进行编号，从 0到 m+n-2。这样可以确定，每列第一个元素 Ρ 对应的数组编号为 j-l，该列其它元素对应的数组编号递增。下表 6为改进后的伽罗瓦域生成矩阵缓存数据 Code[m+n-l][65536]示例。

表 6

对于 m=64， n=10， Code数组大小为 (m+n-1)* 128k=9.344M字节。对于现有的计算机系统，可全部加载进内存。在获得柯西生成矩阵之后，通过以下步骤对数据进行编码操作:

Sl，对需要编码的数据进行编码：对于 RS纠删码中，确定了分片数目 m和校验数据 n后，即可通过范德蒙德矩阵或者柯西矩阵，通过计算获得生成矩阵0。在本实施例中以 m=5， n=3为例。

Z)* G = [£»!, Z)₂,Z)₃,Z)₄,Z)₅] - [D D₂,D„D₄,D₅,P P₂,P,]

其中，输入待编码数据用 D^D^D^D^D Ds]表示，使用的生成矩阵 G，左边是单位阵 I，右边是包含三列的 3 *5 矩阵。经过编码运算，产生的编码数据为 [D₁,D₂,D₃,D₄,D₅,P₁,P₂,P₃]，其中前 5个为原数据分片，后 3个为冗余分片。在数据接收方，对数据进行解码：在本发明实施例"基于 RS纠删码的快速编解码方法"中，在快速解码时，对待解码数据进行格式化处理：即当需要解码时，首先要任给 5个分片，用 D'表示，例如 D'=[D2， D5， P I , P2， P3]。然后采用本发明的规格化方法，对 D'进行规格化，其方法是：将原数据分片 Di归位，放回原始位置。然后对剩余缺位使用校验块数据按顺序填入。例如，在本实施例中：通过以下处理获得规格化以后的 D'=[P1,D2,P2,P3,D5]。格式化输入

解码给定 D' =[D₂,D₅,Pi,P₂,P₃ D， =[P₁,D₂,P₂,P₃,D:

S2，根据规格化的 D'，计算此情况下的生成矩阵 G。方法是将单位矩阵 I中使用校验数据的那些列数据，用原生成矩阵中对应的校验列数据填入。生成矩阵 G的特点是：那些使用了原有数据块的列 x，还是单位阵中对应的列 x，该列第 X个元素为 1，其余为 0。例如，在本实施例中：

D *G = [D_x,D₂,D ,D₄,D_t

在获得生成矩阵 G后，可以计算新的待解码数据 ΙΤ^ΡΛ Ρ₂'， Ρ₃']。计算公式如

^ ' = ^ ®∑Z) *^ , 其中，当 D'中第 i位是原数据时使用 1^，否则略过。

=1 其中表示解码时使用的校验数据， Dj和 Ρ 表示输入数据和生成矩阵 G中的校验数据那一列。如果第 j个位置不是原数据而是校验数据，则计算时把它略过。在计算 Ι¾*Ρ 时，可以使用快速编码方法中的 "生成矩阵伽罗瓦域数组 Code" , 通过查数组方式取代伽罗瓦域乘法操作，以便提高效率。之后，计算等效的小生成矩阵 G_{l t)} 方法如下:

其中， P P DiP^DsP , P₂'=P₂-D₂P₂₂-D₅P₂₅, P₃'=P₃-D₂P₃₂-D₅P₃₅，由此获得新的待解码数据 D'^P ， Ρ₂'， Ρ₃']，以及小生成矩阵

P3 小生成矩阵是原生成矩阵 G中的 n*n列。 n为使用的校验块

：。如果 S={ 1， 3， 4}是校验块出现的位置，则生成矩阵中的 Ρ 组成小生成矩阵

Gi , i， je s₀ 即在生成矩阵中，校验数据出现的行、列组成的数据，组成小生成矩阵该矩阵在使用 k个校验数据的情况下是 k*k的。

(3 ) 计算逆矩阵，解码获得丢失的原数据采用常规的求逆矩阵法计算矩阵的逆矩阵 G1'之后，获得逆矩阵数据后，从伽罗瓦域文件 Galois.dat中逐个读取逆矩阵元素对应的伽罗瓦域乘法数据，放入"逆矩阵伽罗瓦域数组 Decode"中。使用 ΙΤ^Ρ ,Ρ^Ρ^]乘以逆矩阵 G ，即通过以下公式即可获得丢失的原始数据 1^ D₃， D₄:

[P'l， P'2, P'3] = [Di, D DA]，

并且，解码时只需要计算 k个数据。随后，将丢失的原始数据取代原有输入数据中的 Pi， P₂， P₃，即可获得全部原始数据，解码成功。对输入待解码数据的进行规格化处理，是本发明实施例"基于 RS纠删码的快速编解码方法"的核心思想。在以往的 RS纠删码解码算法中，其待解码数据一般是按照先原数据，后校验数据方式排列，即 D'^Di, D₂， D₅， Pi, P₃]。这样在计算逆矩阵、解码时原数据位置不固定，造成逆矩阵中对应的单位矩阵列、解码后原数据位置不固定，因此计算逆矩阵时无法确定究竟需要计算哪些列，只能按照 m*m矩阵来看待；在解码时，原数据需要进行复制或者交换，才能回到原有位置上，造成大量判断和复制工作，因此，无论是计算逆矩阵还是解码效率都不高。此外这种方式无法直观的看出丢失的原数据和使用的校验数据之间的对应关系，因此无法确定唯一排列关系，也就无法使用文件缓存逆矩阵数据。采用本发明实施例的输入待解码数据的规格化方法后，可以获得以下至少四方面的好处：首先，可以通过记录校验数据位置和编号，快速唯一确定该排列对应的小生成矩阵及其逆矩阵文件名称，并读取逆矩阵文件内容，直接生成逆矩阵通过文件缓存方式，在遇到重复情况下避免了矩阵计算，提高了性能。其次，逆矩阵不存在时，可以根据快速计算逆矩阵 '。由于该矩阵只有 k*k大小， k<m时小于原来的生成矩阵 m*m，因此显著降低了逆矩阵计算量，从 O(m )降低为 0(k )。获得逆矩阵后，将所有逆矩阵元素乘法数据放入 De_COde[][]数组。再次，在解码计算时，只需要计算 k个校验数据即可，剩余 m-k个数据可直接使用原来位置上的数据，提高了解码效率。并且数据准备时，可以使用生成矩阵缓存的伽罗瓦域乘法数组，从而更进一步地提高了解码效率，最后，无论编码、解码，伽罗瓦域所有乘法操作都被放入内存，采用查内存数组的方式取代以前的双表法，进一步提高了编解码速度。需要说明的是，本发明实施例所使用的待解码数据的格式化表示，和生成矩阵算法无关，无论是范德蒙德矩阵、柯西矩阵或别的生成矩阵皆可使用。本发明实施例及优选实施方式将生成矩阵由 m阶方阵降为等效的 k阶方阵后，再计算小矩阵的逆矩阵，和计算逆矩阵的算法也无关，无论是高斯消元法还是伴随矩阵法，使用本发明实施例的编解码方法，均可提高计算逆矩阵的速度。由于柯西矩阵的特性，可以通过参数设置，将柯西矩阵中不同元素的个数从 m*n降低为 m+n-l , 从而可以减少 Code数组的内存占用大小。因此本发明中，生成矩阵采用柯西矩阵可减少内存占用。下面结合附图，对本发明实施例进行说明。图 9是根据本发明实施例的基于 RS纠删码的文件快速编码方法的流程图，如图 9 所示，该方法包括如下步骤：步骤 S902, 系统预先准备好 8G伽罗瓦域乘法数据文件 Galois.dat，这些数据是伽罗瓦域中的所有乘法 X*Y的结果， X， Υ从 0到 65535，乘法结果也是 2字节，共计 64k*64k*2=8GB。第 i个元素的全部伽罗瓦域乘法数据放在文件的 i* 128k开始处，连续 128k字节。为方便读取，可以将这些数据保存在若干文件中，在逻辑上构成统一的 8G伽罗瓦域乘法数据文件。根据给定的 m， n值初始化编码器，根据系统生成矩阵算法，计算生成矩阵，根据 m， n值分配伽罗瓦域乘法二维数组 Code[m*n][65536]使用空间。 Code数组共需要分配 m*n*128k字节的内存。它是 m*n*64k的二维数组，数组中每个元素是 0到 65535之间，对应计算机系统的一个字长度，或者两个字节。如果生成矩阵使用柯西矩阵，则 Code大小可为 (m+n-1) *128k字节。步骤 S904，根据 m， n生成伽罗瓦域乘法缓存文件名称，判断该文件是否存在。如果存在转步骤 S908，。如果不存在，则继续步骤 S906。较优地，系统可以预先准备若干典型 m， n配置下的伽罗瓦域乘法缓存文件，以便导入到 Code数组中。步骤 S906, 伽罗瓦域乘法缓存文件不存在，对生成矩阵中除单位阵以外的那些列数据，总计 m*n个元素递增编号，计算每个元素对 0到 65535的伽罗瓦域乘法结果，保存在 Code中，对元素 x，也可以从 Galois.dat中第 X* 128k处，读取该元素的乘法结果，共计 128K字节，导入 Code数组中，进行步骤 S910。步骤 S908，伽罗瓦域乘法缓存文件存在，直接读取该文件内容到 Code中，进入步骤 S912。步骤 S910，将 Code数组内容写入到 m， n对应的伽罗瓦域乘法缓存文件，进入步骤 S912。步骤 S912，完成编码准备任务后，打开待编码文件？。步骤 S914, 从文件中顺序读入 m个数据：读入 m个字， 2m个字节。如果读入的数据不足 m个，则说明到了文件末尾，补若干 0后补齐到 m的倍数。在读取成功的情况下，进入步骤 S916, 否则进入步骤 S920。步骤 S916，读取成功时，对输入数据 D进行 RS编码。其中，前 m个数据直接返回原数据。后 n个数据需要计算。每个数据需要 m次伽罗瓦域乘法操作和 m-1次加法 (异或）操作。其中，伽罗瓦域乘法采用查 Code数组方法以提高效率，其方法是，对于 Ι *Ρ 的伽罗瓦域乘法，首先确定 Ρ 的编号 χ，然后返回 CodetxlPi]元素。只需要两次操作，而原来伽罗瓦域乘法需要 5次操作。步骤 S918, 将编码后的 m个原数据和 n个校验数据均分别写入 m+n个分块文件中。返回步骤 S914, 继续读取文件下 m个数据。步骤 S920，读取文件失败，说明文件已经编码完毕。关闭待编码文件 F和 m+n 个分块文件，结束编码。需要指出的是，上述图 9所示的基于 RS纠删码的文件快速编码流程只是为了说明本发明实施例所提供的快速编码流程的实现原理。具体实现时还需要提供异常处理、文件按块处理、记录文件元数据等功能。图 10是根据本发明实施例的基于 RS纠删码的文件快速解码方法的流程图，如图 10所示，该基于 RS纠删码的文件快速解码方法的流程包括如下步骤：步骤 S1002, 系统预先准备好 8G伽罗瓦域乘法数据文件 Galois.dat，根据 m， n 初始化解码器，计算原生成矩阵0。由于每个文件采用的 RS纠删码算法中， m， n参数可能不一样，因此只有在解码具体文件时，才能根据该文件的元数据或者分片信息获得 m， n，初始化解码器，计算原生成矩阵。这样做，可以使编码功能和解码功能互相独立。如前所述，在计算生成矩阵后，要将生成矩阵伽罗瓦域数组数据，从文件导入到 Code[][]中。如果文件不存在，则需要计算，也可直接从 Galois.dat文件中读取数据。步骤 S1004, 根据待解码数据块编号，对待解码数据进行格式化排列，产生生成矩阵 G对应的小生成矩阵的逆矩阵文件名。假定待解码数据块中，包含 k个校验数据， 0<k<=n。则小生成矩阵大小为 k*k。步骤 S1006, 读取逆矩阵文件。如果逆矩阵文件存在，进入步骤 S1008, 否则进入步骤 S1010。步骤 S1008, 读取逆矩阵文件内容，恢复逆矩阵 G ，进入步骤 S1022。步骤 S1010, 根据生成矩阵和待解码数据的格式化排列，生成待求逆矩阵的生成矩阵 G和对应的小生成矩阵 G_{l t)} 步骤 S1012, 是否使用高斯消元法求的逆矩阵？如果是，进入步骤 S1014, 否则进入步骤 S1016。步骤 S1014, 采用高斯消元法计算的逆矩阵共需要 0 (k )计算量，进入步骤 S1018。步骤 S1016，使用伴随矩阵法求逆矩阵步骤 S1018, 将计算出的逆矩阵 '数据写入该格式化数据对应的小逆矩阵文件中，以便下次遇到后直接读取逆矩阵数据。步骤 S1020,读取逆矩阵 G1'中所有数据的伽罗瓦域乘法数据到 De_COde[][]数组中。如果 Decode数组对应的文件存在，则直接读取，否则通过对应读取 Galois.dat中相应数据的方式，计算 Decode[][]数组。步骤 S1022, 打开格式化排列对应的 m个分块文件和待恢复文件 F。步骤 S1024, 分别从 m文件中读取 1个数据，共计 m个数据。如果有些分片文件没有数据，则补 0，补齐到 m个数据。在读取成功的情况下，进入步骤 S1026, 否则进入步骤 S1032。步骤 S1026,将待解码的 m个数据复制到输出区内，然后计算新的待解码数据 D"。计算公式：

^' = ^®¾Z) *^ , j=l..m，其中，表示解密时使用的校验数据， D」和 Ρ 表示输入数据和生成矩阵 G中的校验数据那一列。如果第 j个位置不是原数据 Dj而是校验数据 P_x，则计算时把它略过。 ®表示是异或操作。在计算 Ι *Ρ 时，使用快速编码方法中的 Code数组，通过查数组方式取代伽罗瓦域乘法操作，以便提高速度。将 1^个？₁ '数据组织成 D"，例如， D^P A^' 步骤 S1028,使用矩阵乘法： D"*Gi',生成 k个丢失的数据。其中乘法使用 Decode 数组直接查找。解码完毕后逐个替换输出区数据中原来 k个校验码的位置，即可获得全部的原数据码。步骤 S1030, 将输出区内的 m个数据写入到待恢复文件 F中，返回步骤 S1026。步骤 S1032, 读文件失败，表明处理结束。关闭所有文件，结束解码。同样需要说明的是，图 10所示的基于 RS纠删码的文件快速解码流程只是为了说明本发明实施例所提供的快速编码流程的实现原理。具体实现时还需要提供异常处理、文件按块处理、按文件元数据处理最后多补的零等功能。显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求书

1. 一种解码处理方法，包括：

确定包括部分原数据与校验数据的待解码数据，其中，所述校验数据对应丢失的原数据；

根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵，以及与所述丢失的原数据对应的新的待解码数据；

根据所述新的待解码数据以及所述小生成矩阵，获取所述丢失的原数据。

2. 根据权利要求 1所述的方法，其中，根据所述校验数据以及用于编码的所述第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵包括：

对所述待解码数据进行规格化处理，其中，所述规格化处理包括：保留所述部分原数据在所述待解码数据中的位置与所述部分原数据在编码之前的原始数据中的位置一致，并将所述校验数据填充到所述待解码数据中的剩余位置；获取与经过规格化处理之后的待解码数据对应的第二生成矩阵；根据所述第二生成矩阵以及所述校验数据，获取与所述丢失的原数据对应的小生成矩阵。

3. 根据权利要求 2所述的方法，其中，获取与经过所述规格化处理之后的待解码数据对应的所述第二生成矩阵包括：

保留所述第一生成矩阵的单位矩阵中与所述原数据对应列的列数据；在所述第一生成矩阵的单位矩阵的校验列中填充所述校验数据。

4. 根据权利要求 2所述的方法，其中，根据所述第二生成矩阵以及所述校验数据，获取与所述丢失的原数据对应的所述小生成矩阵包括：

在所述第二生成矩阵中提取所述校验数据出现的行与列；

将提取的所述校验数据出现的行与列组成所述丢失的原始数据对应的所述小生成矩阵。

5. 根据权利要求 1至 4中任一项所述的方法，其中，在获取与所述丢失的原数据对应的小生成矩阵之后，还包括：根据所述小生成矩阵包含的校验数据和对应丢失的原始数据之间的关系，判断对应的小生成矩阵逆矩阵文件是否存在；

在判断结果为是的情况下，通过读取所述小生成矩阵逆矩阵文件获取小生成矩阵的逆矩阵；和 /或，

在判断结果为否的情况下，计算所述小生成矩阵的逆矩阵，并把所述小生成矩阵的逆矩阵写入到所述小生成矩阵逆矩阵文件。

6. 根据权利要求 5所述的方法，其中，在获取到所述小生成矩阵的逆矩阵后，还包括：

建立所述小生成矩阵的逆矩阵中的各个元素与伽罗瓦域中的 0到 65535构成的逆矩阵伽罗瓦域数组。

7. 根据权利要求 1至 4中任一项所述的方法，其中，在根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵之后，通过以下公式获取与所述丢失的原数据对应的新的待解码数据：

P₁ ' = P₁ ®†_jDj * P_i] , j=l ..m，其中，如果第 j个位置不是原数据 Dj而是校验数据 P_x，则计算乘法时把它略过，为所述新的待解码数据， m为编码时输入数据的数量，为解码时使用的校验数据， Dj为编码时输入的数据， Ρ 为所述第二生成矩阵中的校验数据的列， ®为异或操作。

8. 根据权利要求 1至 4中任一项所述的方法，其中，在确定包括所述部分原数据与校验数据的待解码数据之前，通过以下编码方式得到所述待解码数据：建立由所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的生成矩阵伽罗瓦域数组；判断是否存在存储所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果对应的文件；

在判断为是的情况下，从所述文件中读取所述生成矩阵伽罗瓦域数组中所存储的乘法操作结果。

9. 根据权利要求 8所述的方法，其中，在判断是否存在存储所述第一生成矩阵除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果对应的文件之后，还包括：

在判断为否的情况下，获取所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果；

将获取的所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0 到 65535的乘法操作结果保存在所述生成矩阵伽罗瓦域数组中。

10. 一种解码处理装置，包括：

第一确定模块，设置为确定包括部分原数据与校验数据的待解码数据，其中，所述校验数据对应丢失的原数据；

第一获取模块，设置为根据所述校验数据以及用于编码的第一生成矩阵，获取与所述丢失的原数据对应的小生成矩阵，以及与所述丢失的原数据对应的新的待解码数据；

第二获取模块，设置为根据所述新的待解码数据以及所述小生成矩阵，获取所述丢失的原数据。

11. 根据权利要求 10所述的装置，其中，所述第一获取模块包括：

第一处理单元，设置为对所述待解码数据进行规格化处理，其中，所述规格化处理包括：保留所述部分原数据在所述待解码数据中的位置与所述部分原数据在编码之前的原始数据中的位置一致，并将所述校验数据填充到所述待解码数据中的剩余位置；

第一获取单元，设置为获取与经过规格化处理之后的待解码数据对应的第二生成矩阵；

第二获取单元，设置为根据所述第二生成矩阵以及所述校验数据，获取与所述丢失的原数据对应的小生成矩阵。

12. 根据权利要求 11所述的装置，其中，所述第一获取单元包括：

保留子单元，设置为保留所述第一生成矩阵的单位矩阵中与所述原数据对应列的列数据；

填充子单元，设置为在所述第一生成矩阵的单位矩阵的校验列中填充所述校验数据。

13. 根据权利要求 11所述的装置，其中，所述第二获取单元包括：提取子单元，设置为在所述第二生成矩阵中提取所述校验数据出现的行与列；

组成子单元，设置为将提取的所述校验数据出现的行与列组成所述丢失的原始数据对应的所述小生成矩阵。

14. 根据权利要求 10至 13中任一项所述的装置，其中，还包括：第一判断模块，设置为根据所述小生成矩阵包含的校验数据和对应丢失的原始数据之间的关系，判断对应的小生成矩阵逆矩阵文件是否存在；

第三获取模块，设置为在判断结果为是的情况下，通过读取所述小生成矩阵逆矩阵文件获取小生成矩阵的逆矩阵；和 /或，

第一写入模块，设置为在判断结果为否的情况下，计算所述小生成矩阵的逆矩阵，并把所述小生成矩阵的逆矩阵写入到所述小生成矩阵逆矩阵文件。

15. 根据权利要求 14所述的装置，其中，还包括：第一建立模块，设置为建立所述小生成矩阵的逆矩阵中的各个元素与伽罗瓦域中的 0到 65535构成的逆矩阵伽罗瓦域数组。

16. 一种编解码系统，包括权利要求 10至 15中任一项所述的装置和编码装置，其中，所述编码装置包括：

第二建立模块，设置为建立由所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535构成的生成矩阵伽罗瓦域数组；

第二判断模块，设置为判断是否存在存储所述第一生成矩阵中除单位矩阵外的各个元素与伽罗瓦域中的 0到 65535的乘法操作结果对应的文件是否存在; 读取模块，设置为在所述判断模块的判断结果为是的情况下，从所述文件中读取所述生成矩阵伽罗瓦域数组中所存储的乘法操作结果。