CN113314187A

CN113314187A - 一种数据存储方法、解码方法、系统、装置及存储介质

Info

Publication number: CN113314187A
Application number: CN202110583430.0A
Authority: CN
Inventors: 杨旭; 石晓龙; 强小利
Original assignee: Guangzhou University
Current assignee: China Southern Power Grid Internet Service Co ltd; Ourchem Information Consulting Co ltd
Priority date: 2021-05-27
Filing date: 2021-05-27
Publication date: 2021-08-27
Anticipated expiration: 2041-05-27
Also published as: US20220382480A1; CN113314187B; US20220382481A1

Abstract

本发明公开了一种数据存储方法、系统、装置及存储介质。数据存储方法包括：获取第一数据；对第一数据进行分组得到K个分组子数据；将预设引物输入随机生成器，得到4^T个随机数序列，4^T>K；确定第i个随机数序列所对应的分组子数据，并利用确定的分组子数据进行异或运算得到数据信息DATA_i，并根据数据信息DATA_i、预设引物和随机生成器的生成次数容量得到DNA分子链；将若干个DNA分子链进行DNA序列合成得到目标存储数据。本发明通过对第一数据进行编码得到DNA分子链的过程中，对编码过程添加了随机生成器，使得编码过程大为简化，实现高效率且准确地对第一数据进行编码。本发明可广泛应用于数据存储技术领域内。

Description

一种数据存储方法、解码方法、系统、装置及存储介质

技术领域

本发明涉及数据存储技术领域，尤其是一种数据存储方法、系统、装置及存储介质。

背景技术

随着科学技术的发展，人们所面对和接收的数据呈快速增长，如何对海量的数据进行存储是现今面临的重要问题。其中，为了解决这一问题，出现了利用脱氧核糖核酸(DNA)进行数据存储的相关研究，以DNA链的形式存储所有的信息，这种方法从理论上说能够让信息保存较长的时间，而且不会出现任何的数据丢失。而现今的DNA存储技术，当需要获取某个特定位置的数据时，只能对DNA存储的数据进行全部读取再进行筛选，而没有办法指向特定的位置只读取其中一部分的数据，效率低，存在缺陷。

发明内容

本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。

为此，本发明实施例的一个目的在于，提一种数据存储方法、解码方法、系统、装置及存储介质。

为了达到上述技术目的，本发明实施例所采取的技术方案包括：

第一方面，本发明实施例提供了一种数据存储方法，包括以下步骤：

获取第一数据；

对所述第一数据进行分组得到K个分组子数据，其中，所述K为正整数；

将预设引物输入随机生成器，得到4^T个随机数序列，其中，所述T为所述随机生成器的生成次数容量，且4^T>K，所述预设引物前缀中鸟嘌呤和胞嘧啶的含量占所述预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值；

确定第i个所述随机数序列所对应的所述分组子数据，并利用确定的所述分组子数据进行异或运算得到数据信息DATA_i，其中，i为自然数，且1≤i≤4^T，并根据所述数据信息DATA_i、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链；

将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。

进一步，所述对所述第一数据进行分组得到K个分组子数据这一步骤，包括以下步骤：

确定所述第一数据的数据长度和分组长度；

根据所述数据长度和所述分组长度得到K个分组子数据。

进一步，所述将预设引物输入随机生成器，得到4^T个随机数序列这一步骤，具体为：

控制循环次数j，所述随机生成器根据输入的所述预设引物，输出取值范围在[0，2^K]的随机整数，并将所述随机整数转换为二进制形式的随机数序列DATA_j；

其中，1≤j≤4^T。

进一步，每一个所述随机数序列包括K位随机位，所述确定第i个所述随机数序列所对应的所述分组子数据，并利用确定的所述分组子数据进行异或运算得到数据信息DATA_i这一步骤，包括以下步骤：：

当判断第i个所述随机数序列的第m位所述随机位的数值为1，则选取m个随机位对应的所述分组子数据，其中，m为整数且1≤m≤K；

将选取的所述分组子数据进行异或运算，得到所述数据信息DATA_i。

进一步，所述存储方法还包括对所述DNA分子链的随机化处理这一步骤，包括以下步骤：

将预设引物输入随机生成器得到随机整数序列；

将所述随机整数序列转化为二进制序列或对应碱基序列，在所述随机生成器的生成次数的指引下生成度分布序列，指导所述数据信息进行异或运算。

第二方面，本发明实施例提出了一种解码方法，包括以下步骤：

对所述目标数据存储数据进行解码。

第三方面，本发明实施例提出了一种数据存储系统，包括：

数据获取模块，用于获取第一数据；

分组模块，用于对所述第一数据进行分组得到K个分组子数据，其中，所述K为正整数；

随机数序列获取模块，用于将预设引物输入随机生成器，得到4^T个随机数序列，其中，T为所述随机生成器的生成次数容量，且4^T>K，所述预设引物前缀中鸟嘌呤和胞嘧啶的含量占所述预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值；

分组确定模块，用于确定第i个所述随机数序列所对应的所述分组子数据，并利用确定的所述分组子数据进行异或运算得到数据信息DATA_i，其中，i为自然数，且1≤i≤4^T，并根据数据信息DATA_i、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链；

合成模块，用于将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。

进一步，每一个所述随机数序列包括K位随机位，所述分组确定模块包括：判断单元，用于当判断第i个所述随机数序列的第m位所述随机位的数值为1，则选取m个随机位对应的所述分组子数据，其中，m为整数且1≤m≤K；

异或运算单元，用于将选取的所述分组子数据进行异或运算，得到所述数据信息DATA_i。第四方面，本发明实施例提供了一种数据存储装置，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实现所述的一种数据存储方法。

第五方面，本发明实施例提供了一种存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于实现所述的一种数据存储方法。

本发明的优点和有益效果将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到：

本发明实施例通过对第一数据进行编码得到DNA分子链的过程中，对所述编码过程添加了随机生成器，使得编码过程大为简化，实现高效率且准确地对第一数据进行编码，利用DNA分子链的引物作为随机生成器的种子，更是将引物的作用最大化。

附图说明

为了更清楚地说明本发明实施例或者现有技术中的技术方案，下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例，对于本领域的技术人员来说，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。

图1为本发明一种数据存储方法具体实施例的流程示意图；

图2为本发明一种数据存储系统具体实施例的结构示意图；

图3为本发明一种数据存储装置具体实施例的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

下面参照附图详细描述根据本发明实施例提出的一种数据存储方法和系统，首先将参照附图描述根据本发明实施例提出的一种数据存储方法。

参照图1，本发明实施例中所述的一种数据存储方法主要包括以下步骤：

S1、获取第一数据；

S2、对所述第一数据进行分组得到K个分组子数据，其中，K为正整数；

S3、将预设引物输入随机生成器，得到4^T个随机数序列，其中，T为随机生成器的生成次数容量，且4^T>K，预设引物前缀中鸟嘌呤和胞嘧啶的含量占预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值；

S4、确定第i个随机数序列所对应的分组子数据，并利用确定的分组子数据进行异或运算得到数据信息DATA_i，其中，i为自然数，且1≤i≤4^T，并根据数据信息DATA_i、预设引物和随机生成器的生成次数容量得到DNA分子链；

S5、将若干个DNA分子链进行DNA序列合成得到目标存储数据。

具体地，DNA存储，就是将要存储的目标信息，也即是第一数据，转换为DNA碱基编码，存放在DNA链中，在需要读取的时候，再将DNA链进行测序(有时需要先对DNA链进行PCR扩增，再进行测序操作)，得到相应的碱基序列，经过一系列转换，变为电子计算机能识别的信息，进行数据恢复。

首先，将第一数据进行分组，得到K个分组子数据，为：S₁、S₂、S₃……S_K，每个分组子数据的数据长度是固定的。

预设引物是为了后续的PCR扩增或测序而特殊设计的DNA序列，具有特定的碱基排列结构，该预设引物是在对第一数据编码之前就预先确定并将记录下来的。

将预设引物作为随机生成器的种子，输入到随机生成器中，可以得到多个随机数。随机生成器的生成次数容量为T，4^T为随机生成器的生成次数，通过控制随机生成器的循环次数，则该随机生成器可生成4^T个随机数。

例如，第一数据的数据长度为S＝4200(bit)，N＝40(nt)，其中，nt是nucleotide的缩写，即核苷酸，这里是用来表示碱基的数量的单位，1nt可拥有2bit的信息容量，K＝4200/(40*2)＝53(向上取整)。

K＝53，也即是第一数据可以分为53个分组子数据，随机生成器的生成次数长度则必须大于53，取生成次数容量为T＝3nt，因为3nt的信息存储容量是4³次方(1nt拥有4种碱基表达的可能性，所以1nt的信息容量是4)，也可以理解为2⁶(1nt对应2bit，1bit对应0/1两种状态，所以是共有2种状态的3(nt)*2(bit)＝6次方的信息容量)

通过控制随机生成器的循环次数，可以根据输入的预设引物，输出多个随机数。每一个随机数用来从K个分组子数据中选取部分的分组子数据，将选取的部分的分组子数据进行异或运算，得到一个数据信息DATA_i，其中，i为控制循环的次数，且1≤i≤4^T。

将数据信息DATA_i与预设引物及其随机生成器的生成次数容量进行数据拼接，得到DNA分子链，4^T个DNA分子链进行DNA序列合成即可得到目标存储数据。

由上述内容可见，本申请对第一数据进行编码得到DNA分子链的过程中，对编码过程添加了随机生成器，使得编码过程大为简化，实现高效率且准确地对第一数据进行编码。利用DNA分子链的引物作为随机生成器的种子，更是将引物的作用最大化；每一DNA合成的分子链的前缀中鸟嘌呤和胞嘧啶的含量占引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值，使得在需要读取编码数据事先进行测序时，准确率高。

进一步作为可选的实施方式，步骤S2，包括以下步骤S21-S22：

S21、确定第一数据的数据长度S和分组长度N；

S22、根据数据长度S和分组长度N得到K个分组子数据。

具体地，例如，第一数据的数据长度S＝4200bit，分组长度N＝40nt，则可以确定分组数量K为：

其中，ceil(.)为向上整函数。

进一步作为可选的实施方式，步骤S3具体为：

控制循环次数j，随机生成器根据输入的预设引物，输出取值范围在[0，2^K]的随机整数，并将随机整数转换为二进制形式的随机数序列DATA_j；

其中，1≤j≤4^T。

具体地，将预设引物转化为十进制整数作为种子注入随机生成器，随机生成器根据输入的引物输出取值范围在[0，2^K]的十进制的随机整数，将该十进制的随机整数数转化为二进制形式的随机数序列，将随机数序列的高位进行补零，使得该随机数序列的位数为K位，该二进制是随机数序列喷泉码的度分布序列。

通过控制随机生成器的生成次数容量来控制循环次数j，可以输出4^K个随机数序列，其中，1≤j≤4^K。

进一步作为可选的实施方式，每一个随机数序列包括K位随机位，步骤S4包括步骤S41-S42：

S41、当判断第i个随机数序列的第m位随机位的数值为1，则选取m个随机位对应的分组子数据，其中，m为整数且1≤m≤K；

S42、将选取的分组子数据进行异或运算，得到数据信息DATA_i。

具体地，参照表1，每一个随机数序列为K位的二进制形式的随机数序列，判断随机数序列的每一个随机位，当确定当前随机位的数字为1时，则选择与该随机位对应的分组子数据，接着将选择的多个分组子数据进行异或运算，便得到当前随机数序列所对应的数据信息。

按照上述的方式，通过控制随机数序列的循环次数，4^T个随机数序列，对应有4^T个数据信息。将预设引物、随机生成器生成次数容量、数据信息进行拼装，组成一条喷泉码水滴数据，也即是DNA分子链。

表1

进一步作为可选的实施方式，存储方法还包括步骤S6对DNA分子链的随机化处理这一步骤，步骤S6包括步骤S61-S62：

S61、将预设引物输入随机生成器得到随机整数序列；

S62、将随机整数序列转化为二进制序列或对应碱基序列，在随机生成器的生成次数的指引下生成度分布序列，指导数据信息进行异或运算。

具体地，为保证最终生成的目标存储数据的充分杂乱性，在上一步生成的DNA分子链(也即是喷泉码水滴数据)的基础上，再对其进行一次随机化处理，通过将预设引物转换为十进制整数，作为种子注入随机生成器，生成一个数值在[0，4^T+N]的随机整数序列，将此随机整数序列转换为对应碱基序列(或对应的二进制序列)，与随机生成次数容量和数据信息进行异或运算，对存储信息进行随机化。

由于DNA存储中，均聚物不平衡或GC含量不均衡，将会导致在DNA序列生成、PCR扩增、测序阶段会出现不可预知的错误，所以在合成DNA链时，应该对均聚物进行判断，舍弃连续4个碱基为同一碱基的情况。之后对全链进行均聚物和GC含量的检测，若不符合要求(要求连续4个碱基不为同一碱基)，则删除此链。

最后，将通过筛选的DNA分子链，进行DNA序列合成得到目标存储数据，并进行存储。

此外，本申请还提供了一种解码方法，应用于上述的一种数据存储方法得到的目标存储数据，包括以下步骤：

对目标数据存储数据进行解码。

具体的解码过程如下：

进行数据编码与存储时，是预先知道DNA存储数据的预设引物信息和目标存储数据的数据长度的。同时还知道引物的DNA序列。根据引物信息，进行PCR扩增，扩增之后，对数据进行测序。

步骤一：将预设引物，转换为对应的十进制整数，作为随机生成器的种子，注入随机生成器，生成取值范围在[0，4^T+N]的随机数，再将随机数转换成对应的碱基，与DNA链中(目标存储数据)除了预设引物的碱基序列之外的序列进行异或，恢复原来数据。

步骤二：根据恢复之后的数据，将预设引物转换为对应的十进制整数，作为种子，注入随机生成器，根据随机生成器生成次数信息，生成取值范围在[0，2^K]的整数，将生成的整数，转变为K位的二进制形式的随机数序列，记录下次二进制序列D₁，以及数据序列DATA₁，继续抽取测序序列，直到抽出K个不同的序列为止，记录下K个的二进制序列D₁、D₂……D_K，以及数据序列DATA₁、DATA₂……DATA_K。

步骤三：将K个K位的序列Di，组成K阶矩阵D。

步骤四：利用高斯消元法，进行矩阵解法。首先将K阶矩阵D(矩阵D由D₁、D₂……D_K组成)，与K行1列的DATA矩阵组合(DATA矩阵由DATA₁、DATA₂……DATA_K组成)，构建增广矩阵，接下来沿着矩阵对角线进行判断(i从0-K)，若D[i][i]＝1，则沿着列判断其下所有序列，若D[j][i]＝1，则将第i行所有数据与第j行所有数据进行异或。若D[i][i]＝0，则沿着列向下寻找，找到D[j][i]＝1时，互换两行，然后再向下寻找，若还有D[j][i]＝1，则用第i行同第j行进行异或，确保构建出一个上三角矩阵，矩阵对角线下方区域全部为0。

步骤五：再依照上一步，反向操作，将对角线上方为1的全部消为0，即可得到唯一的S1……S_K，以及DATA1……DATA_K完成译码过程。

其次，参照附图描述根据本发明实施例提出的一种数据存储系统。

图2是本发明一个实施例的一种数据存储系统结构示意图。

该系统具体包括：

数据获取模块201，用于获取第一数据；

分组模块202，用于对第一数据进行分组得到K个分组子数据，其中，K为正整数；

随机数序列获取模块203，用于将预设引物输入随机生成器，得到4^T个随机数序列，其中，T为随机生成器的生成次数容量，且4^T>K，预设引物前缀中鸟嘌呤和胞嘧啶的含量占预设引物所含有的鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶的总含量的预设比值；

分组确定模块204，用于确定第i个随机数序列所对应的分组子数据，并利用确定的分组子数据进行异或运算得到数据信息DATA_i，其中，i为自然数，且1≤i≤4^T，并根据数据信息DATA_i、预设引物和随机生成器的生成次数容量得到DNA分子链；

合成模块205，用于将若干个DNA分子链进行DNA序列合成得到目标存储数据。

进一步作为可选的实施方式，每一个随机数序列包括K位随机位，分组确定模块204包括：

判断单元2041，用于当判断第i个随机数序列的第m位随机位的数值为1，则选取m个随机位对应的分组子数据，其中，m为整数且1≤m≤K；

异或运算单元2042，用于将选取的分组子数据进行异或运算，得到数据信息DATA_i。

可见，上述方法实施例中的内容均适用于本系统实施例中，本系统实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

参照图3，本发明实施例提供了一种数据存储装置，包括：

至少一个处理器301；

至少一个存储器302，用于存储至少一个程序；

当至少一个程序被至少一个处理器301执行时，使得至少一个处理器301实现的一种数据存储方法。

同理，上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干程序用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行程序的定序列表，可以具体实现在任何计算机可读介质中，以供程序执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从程序执行系统、装置或设备取程序并执行程序的系统)使用，或结合这些程序执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供程序执行系统、装置或设备或结合这些程序执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的程序执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施方式，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种数据存储方法，其特征在于，包括以下步骤：

获取第一数据；

将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。

2.根据权利要求1所述的一种数据存储方法，其特征在于，所述对所述第一数据进行分组得到K个分组子数据这一步骤，包括以下步骤：

确定所述第一数据的数据长度和分组长度；

根据所述数据长度和所述分组长度得到K个分组子数据。

3.根据权利要求1所述的一种数据存储方法，其特征在于，将预设引物输入随机生成器，得到4^T个随机数序列这一步骤，具体为：

其中，1≤j≤4^T。

4.根据权利要求1所述的一种数据存储方法，其特征在于，每一个所述随机数序列包括K位随机位，所述确定第i个所述随机数序列所对应的所述分组子数据，并利用确定的所述分组子数据进行异或运算得到数据信息DATA_i这一步骤，包括以下步骤：

5.根据权利要求1所述的一种数据存储方法，其特征在于，所述存储方法还包括对所述DNA分子链的随机化处理这一步骤，包括以下步骤：

将预设引物输入随机生成器得到随机整数序列；

6.一种解码方法，应用于权利要求5所述的一种数据存储方法得到的所述目标存储数据，其特征在于，包括以下步骤：

对所述目标数据存储数据进行解码。

7.一种数据存储系统，其特征在于，包括：

数据获取模块，用于获取第一数据；

分组确定模块，用于确定第i个所述随机数序列所对应的所述分组子数据，并利用确定的所述分组子数据进行异或运算得到数据信息DATA_i，其中，i为自然数，且1≤i≤4^T，并根据数据信息DATA_i、所述预设引物和所述随机生成器的生成次数容量得到DNA分子链；合成模块，用于将若干个所述DNA分子链进行DNA序列合成得到目标存储数据。

8.根据权利要求7所述的一种数据存储系统，其特征在于，每一个所述随机数序列包括K位随机位，所述分组确定模块包括：

判断单元，用于当判断第i个所述随机数序列的第m位所述随机位的数值为1，则选取m个随机位对应的所述分组子数据，其中，m为整数且1≤m≤K；

异或运算单元，用于将选取的所述分组子数据进行异或运算，得到所述数据信息DATA_i。

9.一种数据存储装置，其特征在于，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-6中任一项所述的一种数据存储方法。

10.一种存储介质，其中存储有处理器可执行的程序，其特征在于，所述处理器可执行的程序在由处理器执行时用于实现如权利要求1-6中任一项所述的一种数据存储方法。