WO2021088403A1

WO2021088403A1 - 一种数据纠错方法、装置、设备及可读存储介质

Info

Publication number: WO2021088403A1
Application number: PCT/CN2020/102018
Authority: WO
Inventors: 王岩; 李卫军
Original assignee: 深圳大普微电子科技有限公司
Priority date: 2019-11-06
Filing date: 2020-07-15
Publication date: 2021-05-14
Also published as: CN110798225B; US20220255558A1; CN110798225A; US12107601B2

Abstract

一种数据纠错方法、装置、设备及可读存储介质。本申请公开的方法包括：S11、获取待纠错的目标数据；S12、利用纠错码对目标数据进行纠错，获得第一数据；S13、判断第一数据是否纠错成功；若是，则执行S15；若否，则执行S14；S14、利用目标神经网络对目标数据进行修正，获得第二数据，将第二数据确定为目标数据，并执行S12；S15、将第一数据确定为完成纠错的目标数据。本申请可利用纠错码和目标神经网络相配合纠错数据，从而可避免纠错码数据纠错失败和纠错过程中的数据丢失。

Description

一种数据纠错方法、装置、设备及可读存储介质

本申请要求于2019年11月06日提交至中国专利局、申请号为201911077492.3、发明名称为“一种数据纠错方法、装置、设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机编码技术领域，特别涉及一种数据纠错方法、装置、设备及可读存储介质。

背景技术

在数据传输和存储的过程中，因为环境、介质、距离、时间等因素的影响，数据难免会发生错误。为了识别和纠正数据中的错误数据，现有技术常使用纠错码(Error-Correcting Code)来纠正数据。

但是，各种纠错码的纠错能力是有限的。如：海明码(Hamming Code)最多可纠正一位错误；LDPC编码(Low-Density Parity-Check code)一般具有50～60bits/4KB的纠错能力。因此当数据中的错误数据的位数超出纠错码的纠错能力时，数据中的错误数据将不能被定位并纠正，会导致纠错失败，进而发生数据丢失。

因此，如何避免数据纠错过程中的纠错失败和数据丢失，是本领域技术人员需要解决的问题。

发明内容

有鉴于此，本申请的目的在于提供一种数据纠错方法、装置、设备及可读存储介质，以避免数据纠错过程中的纠错失败和数据丢失。其具体方案如下：

第一方面，本申请提供了一种数据纠错方法，包括：

S11、获取待纠错的目标数据；

S12、利用纠错码对目标数据进行纠错，获得第一数据；

S13、判断第一数据是否纠错成功；若是，则执行S15；若否，则执行S14；

S14、利用目标神经网络对目标数据进行修正，获得第二数据，将第二数据确定为目标数据，并执行S12；

S15、将第一数据确定为完成纠错的目标数据。

优选地，利用目标神经网络对目标数据进行修正，获得第二数据，包括：

分离目标数据的数据部分和校验部分；

利用目标神经网络对数据部分进行修正，获得第二数据。

优选地，利用目标神经网络对数据部分进行修正，获得第二数据，包括：

将数据部分倒序输入目标神经网络，获得第二数据。

优选地，利用纠错码对目标数据进行纠错，获得第一数据，包括：

分离目标数据的数据部分和校验部分；

利用纠错码对数据部分的出错数据位进行校正，获得第一数据。

将目标数据倒序输入目标神经网络，获得第二数据。

优选地，目标神经网络的生成过程包括：

构建初始神经网络，初始神经网络包括：编码子网和解码子网；

输入包含不同类型数据的训练数据训练初始神经网络；

若训练过程中，当前初始神经网络的错误损失函数收敛到稳定状态，则将当前初始神经网络确定为目标神经网络。

优选地，将当前初始神经网络确定为目标神经网络之后，还包括：

将训练数据划分为多个数据集合，每个数据集合中的数据具有关联关系；

利用每个数据集合分别训练目标神经网络，获得与每个数据集合对应的多个目标神经网络。

确定目标数据的数据特征，并在多个目标神经网络中选择与数据特征匹配度最高的目标神经网络对目标数据进行修正，获得第二数据。

第二方面，本申请提供了一种数据纠错装置，包括：

获取模块，用于获取待纠错的目标数据；

纠错模块，用于利用纠错码对目标数据进行纠错，获得第一数据；

判断模块，用于判断第一数据是否纠错成功；

修正模块，用于若第一数据纠错未成功，则利用目标神经网络对目标数据进行修正，获得第二数据，将第二数据确定为目标数据，并将目标数据传输至纠错模块；

确定模块，用于若第一数据纠错成功，则将第一数据确定为完成纠错的目标数据。

第三方面，本申请提供了一种数据纠错设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序，以实现前述公开的数据纠错方法。

第四方面，本申请提供了一种可读存储介质，用于保存计算机程序，其中，计算机程序被处理器执行时实现前述公开的数据纠错方法。

通过以上方案可知，本申请提供了一种数据纠错方法，包括：S11、获取待纠错的目标数据；S12、利用纠错码对目标数据进行纠错，获得第一数据；S13、判断第一数据是否纠错成功；若是，则执行S15；若否，则执行S14；S14、利用目标神经网络对目标数据进行修正，获得第二数据，将第二数据确定为目标数据，并执行S12；S15、将第一数据确定为完成纠错的目标数据。

可见，该方法在利用纠错码对目标数据进行纠错，若纠错未成功，那么转而利用目标神经网络对目标数据进行修正，从而获得第二数据，将第二数据确定为目标数据，以便再次利用纠错码对数据进行纠错，从而获得纠错成功的第一数据，那么将第一数据确定为完成纠错的目标数据，也就获得了正确的目标数据。由此可见，本申请可利用纠错码和目标神经网络相配合纠错数据，从而可避免纠错码数据纠错失败和纠错过程中的数据丢失。

相应地，本申请提供的一种数据纠错装置、设备及可读存储介质，也同样具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请公开的第一种数据纠错方法流程图；

图2为本申请公开的第二种数据纠错方法流程图；

图3为本申请公开的第三种数据纠错方法流程图；

图4为本申请公开的第一种错误数据分布示意图；

图5为本申请公开的第二种错误数据分布示意图；

图6为本申请公开的一种LSTM纠错数据示意图；

图7为本申请公开的一种LSTM Cell示意图；

图8为本申请公开的一种LSTM倒序纠错数据示意图；

图9为本申请公开的一种两层结构的LSTM网络示意图；

图10为本申请公开的第四种数据纠错方法流程图；

图11为本申请公开的一种数据纠错装置示意图；

图12为本申请公开的一种数据纠错设备示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

目前，仅利用纠错码纠正数据，数据中的错误数据不能被全部定位并纠正，会导致纠错失败，进而发生数据丢失。为此，本申请提供了一种数据纠错方案，能够避免数据纠错过程中的纠错失败和数据丢失。

参见图1所示，本申请实施例公开了第一种数据纠错方法，包括：

S11、获取待纠错的目标数据；

S12、利用纠错码对目标数据进行纠错，获得第一数据；

S15、将第一数据确定为完成纠错的目标数据。

需要说明的是，纠错码可以为任意种类的纠错码，如：海明码、BCH(Bose Ray-Chaudhuri Hocquenghem)、极化码(Polar Code)等。目标神经网络的也可以为任意种类的神经网络，如：RNN(循环神经网络，Recurrent Neural Networks)、GRU(门控循环单元，Gated Recurrent Unit)、FCN(全连接网络，Fully-Connected Networks)、CNN(卷积神经网络，Convolutional Neural Networks)、Random Forest(随机森林算法)、SVM(支持向量机，Support Vector Machine)、Logical Regression(逻辑回归)等。

具体的，若第一数据纠错成功，则表明第一数据是完成纠错的目标数据，否则，转而利用目标神经网络对目标数据进行修正，以降低目标数据中的错误数据的位数，从而使数据可用纠错码进行纠错。目前编码的译码器一般采用迭代译码的设计方案，如果迭代译码的计算可以顺利地收敛计算完成，即译码成功；反之，译码失败。因此判断纠错成功与否的关键在于：迭代译码的计算能否完成收敛，具体可参见现有技术，本说明书在此不再赘述。

在一种具体实施方式中，利用目标神经网络对目标数据进行修正，获得第二数据，包括：分离目标数据的数据部分和校验部分；利用目标神经网络对数据部分进行修正，获得第二数据。

在一种具体实施方式中，利用纠错码对目标数据进行纠错，获得第一数据，包括：分离目标数据的数据部分和校验部分；利用纠错码对数据部分的出错数据位进行校正，获得第一数据。

需要说明的是，在数据传输或存储时，每个数据包括数据部分与校验部分。其中，数据部分的数据及错误模式相关性更大，并且在一个数据中的比重较大(一般超过90％)，而校验部分对于同一系统中的每个数据而言，都是相同或类似的。因此可利用目标神经网络或纠错码仅对数据的数据部分进行处理，在处理完成后，将处理后的结果与原来的校验部分再合并，从而获得处理后的数据。

在一种具体实施方式中，利用目标神经网络对目标数据进行修正，获得第二数据，包括：将目标数据倒序输入目标神经网络，获得第二数据。将目标数据倒序输入目标神经网络能够使待处理数据的位置与该数据被编码的位置更接近，如此便于信息记录和编码，具体请参见下述实施例的介绍。

可见，本申请实施例在利用纠错码对目标数据进行纠错获得第一数据后，若第一数据纠错未成功，那么转而利用目标神经网络对目标数据进行修正，从而获得第二数据，将第二数据确定为目标数据，以便再次利用纠错码对数据进行纠错，从而获得纠错成功的第一数据，那么将第一数据确定为完成纠错的目标数据，也就获得了正确的目标数据。由此可见，本申请可利用纠错码和目标神经网络相配合纠错数据，从而可避免纠错码数据纠错失败和纠错过程中的数据丢失。

参见图2所示，本申请实施例公开了第二种数据纠错方法，包括：

S201、获取待纠错的目标数据；

S202、利用纠错码对目标数据进行纠错，获得第一数据；

S203、判断第一数据是否纠错成功；若是，则执行S206；若否，则执行S204；

S204、分离目标数据的数据部分和校验部分；

S205、将数据部分倒序输入目标神经网络，获得第二数据，将第二数据确定为目标数据，并执行S202；

具体的，将数据部分倒序输入目标神经网络，得到的输出数据与校验部分重新组合，从而获得第二数据。

S206、将第一数据确定为完成纠错的目标数据。

在本实施例中，当获得第二数据后，可进一步判断第二数据是否纠错成功；若是，则可直接将第二数据确定为完成纠错的目标数据；若否，则将第二数据确定为目标数据，并执行S202。

在本实施例中，将目标数据的数据部分倒序输入目标神经网络能够使待处理数据的位置与该数据被编码的位置更接近，如此便于信息记录和编码。例如：待处理的目标数据的数据部分为：“ABSD”，将其倒序后，即可得到“DSBA”，那么将“DSBA”输入目标神经网络，目标神经网络按照“DSBA”的顺序编码数据，但按照“ABSD”的顺序解码数据，这样对于“A”来说，其编码位置与解码位置就比较近。同样，“B、S、D”编码位置与各自的解码位置也比较近。按照常用的编码和解码方式，按照“ABSD”的顺序编码和解码数据，对于其中的每个字符来说，编码位置与解码位置之间都隔着3个字符，所以不便于字符信息的记录。需要说明的是，上述举例仅是为了说明该方式的技术效果，实际应用过程中数据的编码和解码不应如此简单理解。

需要说明的是，在数据传输或存储时，每个数据包括数据部分与校验部分。其中，数据部分的数据及错误模式相关性更大，并且在一个数据中的比重较大(一般超过90％)，而校验部分对于同一系统中的每个数据而言，都是相同或类似的。因此可利用纠错码仅对数据的数据部分进行处理，在处理完成后，将处理后的结果与原来的校验部分再合并，从而获得修正后的数据。

需要说明的是，本实施例中的其他实现步骤与上述实施例相同或类似，故本实施例在此不再赘述。

由上可见，本实施例在利用纠错码对目标数据进行纠错获得第一数据后，若第一数据纠错未成功，那么转而利用目标神经网络对目标数据进行修正，从而获得第二数据，将第二数据确定为目标数据，以便再次利用纠错码对数据进行纠错，从而获得纠错成功的第一数据，那么将第一数据确定为完成纠错的目标数据，也就获得了正确的目标数据。由此可见，本申请可利用纠错码和目标神经网络相配合纠错数据，从而可避免纠错码数据纠错失败和纠错过程中的数据丢失。

基于上述任意实施例，需要说明的是，目标神经网络的生成过程包括：构建初始神经网络，初始神经网络包括：编码子网和解码子网；利用包含不同类型数据的训练数据训练初始神经网络；若训练过程中，初始神经网络的错误损失函数(比如：交叉熵损失函数)收敛到稳定状态，则将当前初始神经网络确定为目标神经网络。

具体的，错误损失函数也叫loss函数。交叉熵损失函数可在神经网络中作为损失函数，其使用sigmoid函数在梯度下降时能避免均方误差损失函数学习速率降低的问题，因为学习速率可以被输出的误差所控制。具体的错误损失函数可参照现有技术的介绍，本说明书不再赘述。

需要说明的是，利用包含不同类型数据的训练数据训练获得的目标神经网络具有良好的通用性，若想要获得针对性更好的神经网络，可按照在将当前初始神经网络确定为目标神经网络之后，还包括：将训练数据划分为多个数据集合，每个数据集合中的数据具有关联关系；利用每个数据集合分别训练目标神经网络，获得与每个数据集合对应的多个目标神经网络。如此获得的每个目标神经网络将具有特有的特征，如：若数据集合中的数据具有空间上相邻的关联关系，那么由该数据集合训练获得的目标神经网络将能够对空间上相邻数据具有更好的修正效果，因此该目标神经网络的特征可确定为空间上相邻。因此当待处理数据是空间上相邻的数据时，该数据的数据特征与该目标神经网络的匹配度就是最高的，那么该目标神经网络对该数据的处理效果更好。目标神经网络可降低数据中的错误数据量，从而为纠错码的纠错成功提供了保障。

其中，关联关系包括：空间上相邻和/或时间上相邻，还可以包括：业务应用上关联、数据格式相关等。

在一种具体实施方式中，利用目标神经网络对目标数据进行修正，获得第二数据，包括：确定目标数据的数据特征，并在多个目标神经网络中选择与数据特征匹配度最高的目标神经网络对目标数据进行修正，获得第二数据。具体的，数据的数据特征与目标神经网络的匹配度可根据数据的数据特征和目标神经网络的网络特征计算获得。

在神经网络中，编码子网和解码子网独立存在，其中的编码子网可实现共享。也就是多个目标神经网络共享一个编码子网，但各自又具有特定的解码子网，如此在同时使用多个神经网络修正同一个数据时，只需进行一次编码的计算，从而避免重复编码。

按照本申请提供的数据纠错方法可实施如下实例。

在本实施例中，纠错码选用LDPC，神经网络选用LSTM(Long Short-Term Memory，长短期记忆网络)，二者结合纠错数据的过程请参见图3。

图3所示的纠错过程利用固态硬盘的主控芯片实现。经实验验证，仅利用LDPC和固态硬盘的主控芯片，输出数据中的数据错误位为90errors/4KB，具体请参见图4。而图3所示的纠错过程输出数据中没有错误数据位，其中LSTM输出数据中错误数据位减少为42个，具体请参见图5。可见，LDPC无法纠正的错误，本实施例能够解决。图4和图5中的黑色小点表示错误数据位。

在本实施例中，LSTM修正数据的过程请参见图6。在图6中，LSTM将“ABSD”修正为“ABCD”。假设一个文件用ASCII格式保存了“ABCD”四个字母，一共是32bits。由于在SSD中保存时间过久，再读出时，变为“ABSD”。首先，LSTM通过编码识别到这是一个四个字母的字符串，但是“ABSD”是很少连续出现在文件中的，这有可能是读取错误引起的；那么，接下来在解码过程中，LSTM将“ABSD”改为了“ABCD”。图6中的LSTM编码可实现编码复用，适应不同类型错误纠错编解码配对的情况。

其中，图6中的每个LSTM Cell请参见图7。在图7中，x _t和h _t-1为LSTM Cell的输入数据，x _t为当前LSTM Cell待处理数据，h _t-1是前一个LSTM Cell输出的结果，输入数据还包括前一个LSTM Cell输出的c _t-1。图7中“Input Gate”、“Forget Gate”、“Cell Gate”和“Output Gate”为当前LSTM Cell的四个处理门，这四个处理门分别处理x _t和h _t-1。“Input Gate”的处理结果i _t与“Cell Gate”的处理结果c _t进行内积运算，获得第一个内积结果，“Forget Gate”的处理结果f _t与前一个LSTM Cell输出的c _t-1进行内积运算，获得第二个内积结果，进而第一个内积结果与第二个内积结果相加，获得一个新的c _t，这个新的c _t经过激活函数后，与“Output Gate”的处理结果o _t进行内积，从而获得当前LSTM Cell输出的h _t。其中，当前LSTM Cell输出的h _t和c _t会同时输入LSTM Cell下一个计算循环。

图7中的

表示向量矩阵乘法运算，

表示相加，

表示哈达玛积(Hadamard Product)，

表示激活函数。W _x为x _t在当前处理门中的权重值，W _h为h _t-1当前处理门中的权重值。例如，W _xi为x _t在“Input Gate”中的权重值，W _hi为h _t-1“Input Gate”中的权重值，其他以此类推。LSTM中的每个LSTM Cell中有四个处理门。

若将“ABSD”倒序输入图6所示的网络，则编码中的信息位“A”与解码中的“A”更近；同样，这样编码中的信息位“B”与解码中的“B”也更近。倒序输入的场景请参见图8。其中，图6、图8和图9中的每个框为一个LSTM Cell集合。图6、图8和图9中的每个LSTM Cell的结构均可参见图7。

具体的，LSTM的网络参数可按照如下示例进行选择。例如：文件采用的是UTF-32(32-bit Unicode Transformation Format)编码格式，那么采用下面的网络参数可能会更有效：

输入数列长度：128(如果按照2KB/32计算，应为512，但不宜过长；因此，这里选取128)；输出数列长度：128(同输入数列长度)；编码时每步input向量：32行×1列binary；解码时每步input向量：32行×1列binary(需要使用指示函数(indicator function)进行后处理)；Basic LSTM Cells：32个。

其中，还可以设置多层结构，这样网络纠错能力得到增强。如图9所示的两层结构。图9中的每个框即为一个LSTM Cell集合。还可以据此设置更多LSTM Cell，以形成三层、四层、甚至更多层的网络结构，从而提高LSTM的修正精度。

LSTM的训练：收集尽可能全面的、符合错误分布的、多类型的数据对构建的初始LSTM进行训练，从而获得通用的LSTM。进一步地，将训练数据按照空间邻居或时间前后进行划分，得到不同的训练集，用这两个训练集分别训练上述通用的LSTM，从而获得更有针对性的两个LSTM，这样的LSTM针对性更强，成功纠错的概率更高，在数据极其重要的场景下，亦有其价值。

其中，还可以在纠错过程中用待纠错的数据对当前使用的LSTM进行再训练，具体请参见图10。

可见，本实施例在不增加纠错码冗余位的情况下，提高了编解码的纠错能力，在编解码纠错失败的情况下，LSTM依然可以辅助其正确纠错，提高了纠错成功率。

下面对本申请实施例提供的一种数据纠错装置进行介绍，下文描述的一种数据纠错装置与上文描述的一种数据纠错方法可以相互参照。

参见图11所示，本申请实施例公开了一种数据纠错装置，包括：

获取模块1101，用于获取待纠错的目标数据；

纠错模块1102，用于利用纠错码对目标数据进行纠错，获得第一数据；

判断模块1103，用于判断第一数据是否纠错成功；

修正模块1104，用于若第一数据纠错未成功，则利用目标神经网络对目标数据进行修正，获得第二数据，将第二数据确定为目标数据，并将目标数据传输至纠错模块；

确定模块1105，用于若第一数据纠错成功，则将第一数据确定为完成纠错的目标数据。

在一种具体实施方式中，修正模块包括：

第一分离单元，用于分离目标数据的数据部分和校验部分；

修正单元，用于利用目标神经网络对数据部分进行修正，获得第二数据。

在一种具体实施方式中，修正单元具体用于：

将目标数据的数据部分倒序输入目标神经网络，获得第二数据。

在一种具体实施方式中，纠错模块包括：

第二分离单元，用于分离目标数据的数据部分和校验部分；

校正模块，用于利用纠错码对数据部分的出错数据位进行校正，获得第一数据。

在一种具体实施方式中，修正模块具体用于：

将目标数据倒序输入目标神经网络，获得第二数据。

在一种具体实施方式中，还包括用于生成目标神经网络的生成模块，该生成模块包括：

构建单元，用于构建初始神经网络，初始神经网络包括：编码子网和解码子网；

第一训练单元，用于输入包含不同类型数据的训练数据训练初始神经网络；

第三确定单元，用于若训练过程中，当前初始神经网络的错误损失函数收敛到稳定状态，则将当前初始神经网络确定为目标神经网络。

在一种具体实施方式中，生成模块还包括：

划分单元，用于将训练数据划分为多个数据集合，每个数据集合中的数据具有关联关系；

第二训练单元，用于利用每个数据集合分别训练目标神经网络，获得与每个数据集合对应的多个目标神经网络。

在一种具体实施方式中，修正模块具体用于：

其中，关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容，在此不再进行赘述。

可见，本实施例提供了一种数据纠错装置，该装置在利用纠错码对目标数据进行纠错获得第一数据后，若第一数据纠错未成功，那么转而利用目标神经网络对目标数据进行修正，从而获得第二数据，将第二数据确定为目标数据，以便再次利用纠错码对数据进行纠错，从而获得纠错成功的第一数据，那么将第一数据确定为完成纠错的目标数据，也就获得了正确的目标数据。由此可见，本申请可利用纠错码和目标神经网络相配合纠错数据，从而可避免纠错码数据纠错失败和纠错过程中的数据丢失。

下面对本申请实施例提供的一种数据纠错设备进行介绍，下文描述的一种数据纠错设备与上文描述的一种数据纠错方法及装置可以相互参照。

参见图12所示，本申请实施例公开了一种数据纠错设备，包括：

存储器1201，用于保存计算机程序；

处理器1202，用于执行所述计算机程序，以实现上述任意实施例公开的方法。

下面对本申请实施例提供的一种可读存储介质进行介绍，下文描述的一种可读存储介质与上文描述的一种数据纠错方法、装置及设备可以相互参照。

一种可读存储介质，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现前述实施例公开的数据纠错方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容，在此不再进行赘述。

本申请涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。

需要说明的是，在本申请中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种数据纠错方法，其特征在于，包括：

S11、获取待纠错的目标数据；

S12、利用纠错码对所述目标数据进行纠错，获得第一数据；

S13、判断所述第一数据是否纠错成功；若是，则执行S15；若否，则执行S14；

S14、利用目标神经网络对所述目标数据进行修正，获得第二数据，将所述第二数据确定为所述目标数据，并执行S12；

S15、将所述第一数据确定为完成纠错的目标数据。
根据权利要求1所述的数据纠错方法，其特征在于，所述利用目标神经网络对所述目标数据进行修正，获得第二数据，包括：

分离所述目标数据的数据部分和校验部分；

利用所述目标神经网络对所述数据部分进行修正，获得所述第二数据。
根据权利要求2所述的数据纠错方法，其特征在于，所述利用所述目标神经网络对所述数据部分进行修正，获得所述第二数据，包括：

将所述数据部分倒序输入所述目标神经网络，获得所述第二数据。
根据权利要求1所述的数据纠错方法，其特征在于，所述利用目标神经网络对所述目标数据进行修正，获得第二数据，包括：

将所述目标数据倒序输入所述目标神经网络，获得所述第二数据。
根据权利要求1至4任一项所述的数据纠错方法，其特征在于，所述目标神经网络的生成过程包括：

构建初始神经网络，所述初始神经网络包括：编码子网和解码子网；

输入包含不同类型数据的训练数据训练所述初始神经网络；

若训练过程中，当前初始神经网络的错误损失函数收敛到稳定状态，则将当前初始神经网络确定为所述目标神经网络。
根据权利要求5所述的数据纠错方法，其特征在于，所述将当前初始神经网络确定为所述目标神经网络之后，还包括：

将所述训练数据划分为多个数据集合，每个数据集合中的数据具有关联关系；

利用每个数据集合分别训练所述目标神经网络，获得与每个数据集合对应的多个目标神经网络。
根据权利要求6所述的数据纠错方法，其特征在于，所述利用目标神经网络对所述目标数据进行修正，获得第二数据，包括：

确定所述目标数据的数据特征，并在所述多个目标神经网络中选择与所述数据特征匹配度最高的目标神经网络对所述目标数据进行修正，获得所述第二数据。
一种数据纠错装置，其特征在于，包括：

获取模块，用于获取待纠错的目标数据；

纠错模块，用于利用纠错码对所述目标数据进行纠错，获得第一数据；

判断模块，用于判断所述第一数据是否纠错成功；

修正模块，用于若所述第一数据纠错未成功，则利用目标神经网络对所述目标数据进行修正，获得第二数据，将所述第二数据确定为所述目标数据，并将所述目标数据传输至所述纠错模块；

确定模块，用于若所述第一数据纠错成功，则将所述第一数据确定为完成纠错的目标数据。
一种数据纠错设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序，以实现如权利要求1至7任一项所述的数据纠错方法。
一种可读存储介质，其特征在于，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据纠错方法。