CN112288089A - 阵列式核酸信息存储方法及装置 - Google Patents

阵列式核酸信息存储方法及装置 Download PDF

Info

Publication number
CN112288089A
CN112288089A CN202011040283.4A CN202011040283A CN112288089A CN 112288089 A CN112288089 A CN 112288089A CN 202011040283 A CN202011040283 A CN 202011040283A CN 112288089 A CN112288089 A CN 112288089A
Authority
CN
China
Prior art keywords
information
nucleic acid
array
stored
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011040283.4A
Other languages
English (en)
Other versions
CN112288089B (zh
Inventor
徐弢
裴犇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202011040283.4A priority Critical patent/CN112288089B/zh
Publication of CN112288089A publication Critical patent/CN112288089A/zh
Priority to PCT/CN2021/107875 priority patent/WO2022062621A1/zh
Application granted granted Critical
Publication of CN112288089B publication Critical patent/CN112288089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Genetics & Genomics (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明公开了一种阵列式核酸信息存储方法及装置,其中,该方法包括:对待存储信息进行格式转换;利用碱基构建不同种类的核酸阵列存储基本单元;根据核酸阵列存储基本单元的种类对格式转换后的待存储信息进行编码,将待存储信息编码为相应的序列码;利用微纳材料递送手段,按照待存储信息的序列码顺序将核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过特定的信息阵列对待存储信息进行存储;通过特定检测方式对存储的特定的信息阵列进行读取得到核酸阵列信息;根据编码算法与解码算法对核酸阵列信息进行解码,还原待存储信息。该方法读写速度快,存储成本低。

Description

阵列式核酸信息存储方法及装置
技术领域
本发明涉及数字信息存储技术领域,特别涉及一种阵列式核酸信息存储方法及装置。
背景技术
如今,人类生活在信息爆炸的时代,每天都有海量的数据产生,也有海量的数据被存储下来,已经离不开各式各样的信息存储介质。随着时代的进步,越来越多的数据将被产生。物联网技术要实现物与物、物与人的广泛连接,则需要通过各种信息传感器实时采集物联网中每个物体的声、光、力、电等信息,因而产生巨量的信息存储需求。随着物联网技术的进一步发展以及其与云计算等技术的融合,其在2020年将把300亿个单位纳入其中,并由此产生海量的信息。2018年,人类共计产生了约33ZB(1ZB=1012GB)的数字信息,并且这一数字仍在以指数形式上升。国际数据中心预计到2025年,全球数据产生量将到达175ZB。然而,传统信息存储技术的容量增长速度有限,并且即将到达其物理极限,在未来的数十年间,传统存储器件可能无法满足存储的需求。为了解决这一问题,DNA作为一种天然的信息存储介质进入了研究人员的视线。
DNA信息存储的概念早在20世纪60年代就出现了,研究人员希望利用DNA的特定序列来存储信息。DNA信息存储技术的工作过程为编码、写入、存储、读取和解码五步。现有DNA信息存储技术的基本载体是DNA链序列,其依托的关键技术为DNA合成与测序。如图1所示,其工作方式如下:对于任意一段需要进行DNA存储的数字信息,首先对其编码,将信息转化为一串DNA序列。之后进行信息的写入,即通过DNA无模板合成技术,得到编码了信息的特定DNA链。将这些DNA链以溶液、干粉或微球等形式保存起来,实现信息的长时间存储。当需要再次获取这些存储的信息时,通过DNA测序技术得到DNA链的序列信息,即实现信息的读取。最终通过DNA序列的解码,便可以复原出一开始存储在DNA中的数字信息。
以选择的特定数字信息为信息存储工作过程的开始,并以这一信息再次被解读出来为过程的结束。首先将数字信息进行编码,得到特定的DNA序列。再将这一序列通过化学方法合成为DNA链,完成信息的写入。这些DNA链被存储在溶液、干粉或微球中,留待读取。读取工作通过DNA测序实现,得到特定DNA序列。最终将序列解码,得到数字信息。
现有的DNA信息存储技术的实现依赖与DNA链的合成与测序,其写入过程主要是DNA合成的过程,读取过程主要是DNA测序的过程。因此受制于DNA合成与测序技术,成本高、读写速度慢。DNA合成技术经过多年的发展,如今已经成为了一种十分成熟的技术,并形成了成熟的商业应用。但是,DNA合成技术目前仍是DNA信息存储技术发展的最大掣肘。作为信息存储中最关键的写入环节,DNA合成技术高昂的成本,缓慢的合成速度以及高出错率导致DNA信息的写入困难重重。由于每合成一个核苷酸便需要四步化学反应,每步反应需要一定的时间,反应后还需要进行清洗,以避免残留的试剂影响进一步的反应。因此合成过程往往耗时长,且消耗的不少试剂更是增大了合成的成本。固相合成法合成每个核苷酸需要花费2min以及0.05美元,这意味着仅写入1MB的信息便需要133333h,并花费200000美元。即便阵列化的合成方法可以实现多达20000个DNA链的并行合成并大幅降低了合成的费用,写入1MB信息仍需约6.6h,花费40美元。这一写入速度和成本对于日常信息存储是完全无法接受的。此外,基于阵列的寡核苷酸合成法仍没有解决DNA合成中出错的问题,并且由于高并行的反应以及选择性合成的操作导致合成的错误率进一步上升。这些错误会导致所存储的信息出现偏差,更加限制了DNA信息存储技术的应用。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种阵列式核酸信息存储方法,该方法解决了现有核酸信息存储技术读写速度慢,施行成本高的缺点。
本发明的另一个目的在于提出一种阵列式核酸信息存储装置。
为达到上述目的,本发明一方面实施例提出了一种阵列式核酸信息存储方法:
对待存储信息进行格式转换;
利用碱基构建不同种类的核酸阵列存储基本单元;
根据所述核酸阵列存储基本单元的种类对格式转换后的所述待存储信息进行编码,将所述待存储信息编码为相应的序列码;
利用微纳材料递送手段,按照所述待存储信息的序列码顺序将所述核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过所述特定的信息阵列对所述待存储信息进行存储;
通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息;
根据编码算法与解码算法对所述核酸阵列信息进行解码,还原所述待存储信息。
为达到上述目的,本发明另一方面实施例提出了一种阵列式核酸信息存储装置,包括:
转换模块,用于对待存储的信息进行格式转换;
构建模块,用于利用碱基构建不同种类的核酸阵列存储基本单元;
编码模块,用于根据所述核酸阵列存储基本单元的种类对格式转换后的所述待存储信息进行编码,将所述待存储信息编码为相应的序列码;
写入模块,用于利用微纳材料递送手段,按照所述待存储信息的序列码顺序将所述核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过所述特定的信息阵列对所述待存储信息进行存储;
读取模块,用于通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息;
解码模块,用于根据编码算法与解码算法对所述核酸阵列信息进行解码,还原所述待存储信息。
本发明实施例的阵列式核酸信息存储方法及装置,通过对待存储信息进行格式转换;利用碱基构建不同种类的核酸阵列存储基本单元;根据核酸阵列存储基本单元的种类对格式转换后的待存储信息进行编码,将待存储信息编码为相应的序列码;利用微纳材料递送手段,按照待存储信息的序列码顺序将核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过特定的信息阵列对待存储信息进行存储,通过特定检测方式对存储的特定的信息阵列进行读取得到核酸阵列信息;根据编码算法与解码算法对核酸阵列信息进行解码,还原所述待存储信息。实现了一种读写速度快,施行成本低的信息存储技术。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为现有的DNA存储方法流程图;
图2为根据本发明一个实施例的阵列式核酸信息存储方法流程图;
图3为根据本发明一个实施例的阵列式DNA信息存储方法工作流程图;
图4为根据本发明一个实施例的使用喷墨打印技术递送DNA微片段示意图;
图5为根据本发明一个实施例的DNA信息阵列示意图;
图6为根据本发明一个实施例的杂交后读取的DNA信息阵列示意图;
图7为根据本发明一个实施例的阵列式核酸信息存储装置结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的阵列式核酸信息存储方法及装置。
首先将参照附图描述根据本发明实施例提出的阵列式核酸信息存储方法。
图2为根据本发明一个实施例的阵列式核酸信息存储方法流程图。
如图2所示,该阵列式核酸信息存储方法包括以下步骤:
步骤S1,对待存储信息进行格式转换。
具体地,对于待存储信息,将其转换为二进制序列,便于后续进行编码。
步骤S2,利用碱基构建不同种类的核酸阵列存储基本单元。
在本发明的实施例中,利用碱基构建的核酸阵列存储基本单元进行信息存储,核酸阵列存储基本单元可以为DNA阵列存储基本单元,也可以为RNA阵列存储基本单元。若为DNA阵列存储基本单元,则碱基包括腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)。若为RNA阵列存储基本单元,则碱基包括腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、脲嘧啶(U)。DNA阵列存储基本单元和RNA阵列存储基本单元存储的原理相同,仅使用的碱基有所区别,以下实施例以DNA的碱基进行说明。
进一步地,通过碱基可以构建出多种不同的核酸微片段,不同的微片段表达不同的信息。
进一步地,在本发明的一个实施例中,利用碱基长度为1的不同碱基对应的核酸片段,构建不同种类的核酸阵列存储基本单元。
进一步地,在本发明的一个实施例中,将多个相同碱基组成的均聚物作为核酸片段,构建不同种类的核酸阵列存储基本单元。
进一步地,在本发明的一个实施例中,将多种碱基进行组合,根据多种碱基组合对应的核酸片段序列,构建不同种类的核酸阵列存储基本单元。
具体地,以DNA阵列存储基本单元为例,构建DNA阵列存储的基本单元,即不同的DNA微片段。最简单的构建方法为直接使用碱基长度为1的DNA片段,即使用碱基分别为A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)的核苷酸作为微片段。利用此四种微片段,可以构建4进制的信息表示方法,如A→0,T→1,G→2,C→3。
为了使不同的DNA更便于检测,可使用均聚物替代单个核苷酸,如AAAAAAAAAA→0,TTTTTTTTTT→1,GGGGGGGGGG→2,CCCCCCCCCC→3。
为了使单个点位能够存储更多的信息,可以将碱基进行组合,形成DNA序列微片段,从而提高存储的进制数。如AA→0,AT→1,AG→2,AC→3,TA→4,TT→5,TG→6,TC→7,GA→8,GT→9,GG→10,GC→11,CA→12,CT→13,CG→14,CC→15。使用16种不同的微片段,可以构建16进制的信息表示方法。
为了使杂交更容易,可以使用特定序列的微片段表示特定位信息,如:AGAGTTGAGCTATAACAATAATCC→0,
AGCCTTCTCCATGGTGGTGAAGAC→1,
AGGGTCTCCGATTTGCATATCTTAC→2,
ATGCTCATCAACGTGAACTTCGTC→3,以此类推,根据存储的不同需求,可构建不同的DNA微片段,形成不同进制的信息表示方法。
需要说明的是,构建RNA阵列存储的基本单元,与上述构建DNA阵列存储基本单元过程类似,仅是使用的碱基不同,此处不再赘述。
步骤S3,根据核酸阵列存储基本单元的种类对格式转换后的待存储信息进行编码,将待存储信息编码为相应的序列码。
通过步骤S2构建了不同种类的核酸阵列存储基本单元,根据核酸阵列存储基本单元的种类对待存储信息进行编码,将待存储信息转化为一个有顺序的序列码。
举例而言,以DNA微片段组成的DNA阵列存储基本单元为例,根据构建的DNA微片段和相应进制的信息表示方法,将需要存储的信息编码为对应的DNA单元序列。如对于A→0,T→1,G→2,C→3的阵列存储基本单元,将需要存储的信息编码为4进制,从而形成DNA单元序列。如对于AT,AC,AG,TC,TG,CG的DNA微片段,则将需要存储的信息编码为6进制。同理,还可以构建16种不同的核酸微片段,进而将待存储信息编码为16进制的序列码。
进一步地,在本发明的一个实施例中,为了保证信息的随机读取和正确性,在此编码序列中再加入地址码和纠错码,地址码每20位有2位,纠错码由奇偶校验编码、R-S编码、喷泉编码等方式产生。
步骤S4,利用微纳材料递送手段,按照待存储信息的序列码顺序将核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过特定的信息阵列对待存储信息进行存储。
进一步地,根据待存储信息的类型选择不同的基底,根据不同的基底选择不同的微纳材料递送手段进行递送。
微纳材料递送手段包括但不限于喷墨打印技术和浸蘸笔纳米刻蚀技术;基底包括但不限于硅片、玻片、尼龙膜和凝胶。
具体地,使用喷墨打印技术或浸蘸笔纳米刻蚀技术等微纳材料递送手段,按照序列码顺序将不同的脱氧核糖核酸/核糖核酸递送至硅片、玻片、尼龙膜、凝胶等特定基底表面的特定位置,并进行固定处理,使其连接在基底上,形成特定的信息阵列,利用其在阵列中的特定排列实现信息的存储。
进一步地,在本发明的实施例中,使用喷墨打印技术,以实现准备好的DNA(RNA)微片段为墨水,将它们按照编码生成的序列顺序打印出来,根据序列排列成特定的阵列来表示信息。打印时,通过带有多色喷头的喷墨打印机可以在单次打印中完成阵列的打印。若所用的微片段种类过多,打印机喷头数量无法实现这么多色墨水的同时打印,可通过多次打印实现阵列制备。DNA(RNA)微片段被递送至基底上,并与基底进行连接,以避免在后续的操作中丢失或改变位置。基底可为玻片、尼龙膜、凝胶等。玻片基底可实现二维平面DNA(RNA)信息存储。尼龙膜基底可实现二维曲面DNA(RNA)信息存储,尼龙膜很薄、且可卷曲、折叠,一定程度上可提升信息存储的密度。凝胶基底通过逐层铺设凝胶、递送DNA(RNA)微片段,可实现三维DNA(RNA)信息存储。
进一步地,在待存储信息存储完成后,还需要进行信息的读取与解码。
步骤S5,通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息。
步骤S6,根据编码算法与解码算法对核酸阵列信息进行解码,得到待存储信息。
读取时,以DNA微片段为例,使用可以与写入的DNA微片段进行碱基互补配对的微片段,进行DNA杂交,从而实现信息的读取。利用荧光素标记法,同位素标记法等方法,通过DNA杂交实现对基底上DNA微片段的识别。
将读取出的信息转化为序列码,再转为二进制,并译码得到存储在其中的信息。
进一步地,在本发明的实施例中,构建与核酸阵列存储基本单元中的核酸片段相互配对的互补核酸片段,并进行标记,在读取信息时,利用标记的互补核酸片段与基底上的特定的信息阵列进行杂交,根据标记的方式选择对应的检测方式进行检测,以得到核酸阵列信息。
具体地,以DNA微片段为例,通过DNA杂交进行DNA信息的读取。根据写入时使用的DNA微片段序列,构建与其相互配对的互补DNA微片段,并分别在其上添加不同的荧光基团、同位素等标记。在需要读取信息时,利用这些带标记的互补DNA微片段与基底上的DNA微片段进行杂交,从而使其进行“显影”,并可直接通过荧光显微镜、同位素检测等检测手段快速、方便地得到基底上不同位置处分别是何种DNA微片段,从而读取出写入的DNA阵列。根据得到的DNA阵列信息,利用编码时规律,将DNA序列转化为二进制序列,并根据此二进制序列解码得到存储的数字信息。
进一步地,在本发明的一个实施例中,通过特定检测方式对存储的特定的信息阵列进行读取得到核酸阵列信息还包括:利用拉曼检测对基底上的阵列进行检测,以得到核酸阵列信息。
综上,通过特定检测方式(杂交显色、拉曼检测等)判断信息阵列中的内容,对已存储信息进行读取,并随后进行解码,还原得到存储在其中的信息。
需要说明的是,对于RNA微片段的读取与解码过程与RNA微片段的读取和解码过程类似,不再进行详细赘述。
下面结合附图详细说明本发明的存储过程。
如图3所示,以DNA为例,展示了阵列式DNA信息存储的工作流程。
1)编码:将数字信息通过适当的编码方法编码形成DNA编码信息,并用特定序列的DNA微片段表示特定DNA信息位。
2)写入:利用喷墨打印、浸蘸笔纳米刻蚀技术等方法将含有不同DNA微片段的墨水递送至基底上的特定位置,形成DNA微片段信息阵列。通过紫外、烘烤、化学键交联等方法使DNA固定在基底上。
3)保存:将含有阵列化DNA信息的基底进行保存。
4)读取:利用带标记的互补DNA微片段与基底上的DNA微片段进行杂交,从而使其方便地被直接观测,区分阵列中不同点位上分别是那种DNA微片段,表示哪一DNA信息位,得到阵列化的DNA信息。
5)解码:对此信息进行解码,得到一开始存储的数字信息。
如图4所示,展示了使用喷墨打印技术递送DNA微片段的过程。标号10为装有4种不同DNA微片段墨水的打印头,其四个喷头分别喷出代表0、1、2、3的DNA微片段。标号11为打印的基底,起承载DNA微片段阵列的作用,并且可使DNA微片段连接于其上。标号12表示载有DNA微片段的液滴。
如图5所示,展示了一种DNA信息阵列。基底上载有DNA片段,不同的微片段被打印至特定的位置,形成了表示信息的阵列。每个位点处为表达0-3中某种信息位的DNA液滴,液滴中含有大量的DNA微片段,并且这些片段通过紫外、烘烤、化学键交联等方法被固定在基底上。图5中表示了0331102210003123的四进制信息。
对于图5中的DNA信息阵列,由于DNA片段过于微小,直接观测手段难以分辨不同点位的DNA信息。使用与基底上DNA片段相配对,并且带有不同荧光/同位素标记等的特定探针与基底上的DNA片段进行杂交,得到图6中用于读取的DNA信息阵列。由于荧光、同位素标记等易于直接观测,因此直接对杂交后的阵列进行观测即可得到存储在其上的DNA信息。图6中,无色代表0,黄色代表1,洋红色代表2,青色代表3,由此可读取出0331102210003123的四进制信息序列。随后将四进制信息序列进行解码,即可得到所存储的信息。
根据本发明实施例提出的阵列式核酸信息存储方法,通过对待存储信息进行格式转换;利用碱基构建不同种类的核酸阵列存储基本单元;根据核酸阵列存储基本单元的种类对格式转换后的待存储信息进行编码,将待存储信息编码为相应的序列码;利用微纳材料递送手段,按照待存储信息的序列码顺序将核酸阵列存储基本单元固定在基底表面的特定位置,形成特定的信息阵列,通过特定的信息阵列对待存储信息进行存储,通过特定检测方式对存储的特定的信息阵列进行读取得到核酸阵列信息;根据编码算法与解码算法对核酸阵列信息进行解码,还原待存储信息。实现了一种读写速度快,施行成本低的信息存储技术。
其次参照附图描述根据本发明实施例提出的阵列式核酸信息存储装置。
图7为根据本发明一个实施例的阵列式核酸信息存储装置结构示意图。
如图7所示,该阵列式核酸信息存储装置70包括:转换模块701、构建模块702、编码模块703、写入模块704、读取模块705和解码模块706。
转换模块701,用于对待存储的信息进行格式转换。
构建模块702,用于利用碱基构建不同种类的核酸阵列存储基本单元。
编码模块703,用于根据核酸阵列存储基本单元的种类对格式转换后的待存储信息进行编码,将待存储信息编码为相应的序列码。
写入模块704,用于利用微纳材料递送手段,按照待存储信息的序列码顺序将核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过特定的信息阵列对待存储信息进行存储。
读取模块705,用于通过特定检测方式对存储的特定的信息阵列进行读取得到核酸阵列信息。
解码模块706,用于根据编码算法与解码算法对核酸阵列信息进行解码,还原待存储信息。
需要说明的是,前述对阵列式核酸信息存储方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
根据本发明实施例提出的阵列式核酸信息存储装置,通过对待存储信息进行格式转换;利用碱基构建不同种类的核酸阵列存储基本单元;根据核酸阵列存储基本单元的种类对格式转换后的待存储信息进行编码,将待存储信息编码为相应的序列码;利用微纳材料递送手段,按照待存储信息的序列码顺序将核酸阵列存储基本单元固定在基底表面的特定位置,形成特定的信息阵列,通过特定的信息阵列对待存储信息进行存储,通过特定检测方式对存储的特定的信息阵列进行读取得到核酸阵列信息;根据编码算法与解码算法对核酸阵列信息进行解码,还原待存储信息。实现了一种读写速度快,施行成本低的信息存储技术。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种阵列式核酸信息存储方法,其特征在于,包括以下步骤:
对待存储信息进行格式转换;
利用碱基构建不同种类的核酸阵列存储基本单元;
根据所述核酸阵列存储基本单元的种类对格式转换后的所述待存储信息进行编码,将所述待存储信息编码为相应的序列码;
利用微纳材料递送手段,按照所述待存储信息的序列码顺序将所述核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过所述特定的信息阵列对所述待存储信息进行存储;
通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息;
根据编码算法与解码算法对所述核酸阵列信息进行解码,还原所述待存储信息。
2.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,所述对待存储信息进行格式转换包括:将所述待存储信息转换为二进制。
3.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,所述利用碱基构建不同种类的核酸阵列存储基本单元包括:
利用碱基长度为1的不同碱基对应的核酸片段,构建不同种类的核酸阵列存储基本单元。
4.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,所述利用碱基构建不同种类的核酸阵列存储基本单元包括:
将多个相同碱基组成的均聚物作为核酸片段,构建不同种类的核酸阵列存储基本单元。
5.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,所述利用碱基构建不同种类的核酸阵列存储基本单元包括:
将多种碱基进行组合,根据多种碱基组合对应的核酸片段序列,构建不同种类的核酸阵列存储基本单元。
6.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,将所述待存储信息编码为相应的序列码时,还包括:
在所述序列码中加入地址码和纠错码。
7.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,根据所述待存储信息的类型选择不同的基底,根据不同的基底选择不同的微纳材料递送手段进行递送;
所述微纳材料递送手段包括喷墨打印技术和浸蘸笔纳米刻蚀技术;
所述基底包括硅片、玻片、尼龙膜和凝胶,所述尼龙膜基底用于二维曲面核酸信息存储,所述凝胶基底用于三维核酸信息存储。
8.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,所述通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息包括:
构建与所述核酸阵列存储基本单元中的核酸片段相互配对的互补核酸片段,并进行标记,在读取信息时,利用标记的互补核酸片段与基底上的所述特定的信息阵列进行杂交,根据标记的方式选择对应的检测方式进行检测,以得到所述核酸阵列信息。
9.根据权利要求1所述的阵列式核酸信息存储方法,其特征在于,所述通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息包括:
利用拉曼检测对基底上的阵列进行检测,以得到所述核酸阵列信息。
10.一种阵列式核酸信息存储装置,其特征在于,包括:
转换模块,用于对待存储的信息进行格式转换;
构建模块,用于利用碱基构建不同种类的核酸阵列存储基本单元;
编码模块,用于根据所述核酸阵列存储基本单元的种类对格式转换后的所述待存储信息进行编码,将所述待存储信息编码为相应的序列码;
写入模块,用于利用微纳材料递送手段,按照所述待存储信息的序列码顺序将所述核酸阵列存储基本单元递送至基底表面的特定位置,并进行固定,形成特定的信息阵列,通过所述特定的信息阵列对所述待存储信息进行存储;
读取模块,用于通过特定检测方式对存储的所述特定的信息阵列进行读取得到核酸阵列信息;
解码模块,用于根据编码算法与解码算法对所述核酸阵列信息进行解码,还原所述待存储信息。
CN202011040283.4A 2020-09-28 2020-09-28 阵列式核酸信息存储方法及装置 Active CN112288089B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011040283.4A CN112288089B (zh) 2020-09-28 2020-09-28 阵列式核酸信息存储方法及装置
PCT/CN2021/107875 WO2022062621A1 (zh) 2020-09-28 2021-07-22 阵列式核酸信息存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011040283.4A CN112288089B (zh) 2020-09-28 2020-09-28 阵列式核酸信息存储方法及装置

Publications (2)

Publication Number Publication Date
CN112288089A true CN112288089A (zh) 2021-01-29
CN112288089B CN112288089B (zh) 2022-12-20

Family

ID=74421613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011040283.4A Active CN112288089B (zh) 2020-09-28 2020-09-28 阵列式核酸信息存储方法及装置

Country Status (2)

Country Link
CN (1) CN112288089B (zh)
WO (1) WO2022062621A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113462710A (zh) * 2021-06-30 2021-10-01 清华大学 一种可随机重写的dna信息存储方法
WO2022062621A1 (zh) * 2020-09-28 2022-03-31 清华大学 阵列式核酸信息存储方法及装置
CN116451780A (zh) * 2022-01-05 2023-07-18 密码子(杭州)科技有限公司 用于在分子中存储信息的方法和设备
WO2023240952A1 (zh) * 2022-06-14 2023-12-21 深圳先进技术研究院 基于重组质粒dna分子的数据信息存储方法
TWI844889B (zh) * 2021-11-23 2024-06-11 美商萬國商業機器公司 用於將資訊儲存至一多核苷酸中之電腦實施方法、電腦程式產品及系統與用於解譯編碼於多個複合片段中之資訊之電腦實施方法及電腦程式產品

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116030895A (zh) * 2022-12-13 2023-04-28 中国科学院深圳先进技术研究院 一种基于天然和非天然碱基的dna信息存储方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104662544A (zh) * 2012-07-19 2015-05-27 哈佛大学校长及研究员协会 利用核酸存储信息的方法
CN108026557A (zh) * 2015-07-13 2018-05-11 哈佛学院董事及会员团体 使用核酸用于可检索信息储存的方法
CN109086890A (zh) * 2017-06-14 2018-12-25 Landigrad有限责任公司 信息编码和信息解码的方法
US20190050495A1 (en) * 2018-06-19 2019-02-14 Intel Corporation Data storage based on encoded dna sequences
WO2019079802A1 (en) * 2017-10-20 2019-04-25 President And Fellows Of Harvard College METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA
CN110431148A (zh) * 2017-01-10 2019-11-08 罗斯威尔生命技术公司 用于dna数据存储的方法和系统
CN111373051A (zh) * 2017-10-10 2020-07-03 罗斯威尔生命技术公司 用于无扩增dna数据存储的方法、装置和系统
CN111489791A (zh) * 2020-04-07 2020-08-04 中国科学院重庆绿色智能技术研究院 固态纳米孔高密度编码dna数字存储读取方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022935A (zh) * 2014-04-22 2015-11-04 中国科学院青岛生物能源与过程研究所 一种利用dna进行信息存储的编码方法和解码方法
CN104850760B (zh) * 2015-03-27 2016-12-21 苏州泓迅生物科技有限公司 人工合成dna存储介质的信息存储读取方法
CN110641014B (zh) * 2019-08-28 2022-01-11 安徽穿越光电科技有限公司 一种利用激光直写技术构建3d微纳通道结构的方法
CN110708076B (zh) * 2019-09-25 2022-12-20 东南大学 一种基于混合模型的dna存储编解码方法
CN112288089B (zh) * 2020-09-28 2022-12-20 清华大学 阵列式核酸信息存储方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104662544A (zh) * 2012-07-19 2015-05-27 哈佛大学校长及研究员协会 利用核酸存储信息的方法
CN108875312A (zh) * 2012-07-19 2018-11-23 哈佛大学校长及研究员协会 利用核酸存储信息的方法
CN108026557A (zh) * 2015-07-13 2018-05-11 哈佛学院董事及会员团体 使用核酸用于可检索信息储存的方法
CN110431148A (zh) * 2017-01-10 2019-11-08 罗斯威尔生命技术公司 用于dna数据存储的方法和系统
CN109086890A (zh) * 2017-06-14 2018-12-25 Landigrad有限责任公司 信息编码和信息解码的方法
CN111373051A (zh) * 2017-10-10 2020-07-03 罗斯威尔生命技术公司 用于无扩增dna数据存储的方法、装置和系统
WO2019079802A1 (en) * 2017-10-20 2019-04-25 President And Fellows Of Harvard College METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA
US20190050495A1 (en) * 2018-06-19 2019-02-14 Intel Corporation Data storage based on encoded dna sequences
CN111489791A (zh) * 2020-04-07 2020-08-04 中国科学院重庆绿色智能技术研究院 固态纳米孔高密度编码dna数字存储读取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHUBHAM TALUJA 等: "A Survey Paper on DNA-Based Data Storage", 《2020 INTERNATIONAL CONFERENCE ON EMERGING TRENDS IN INFORMATION TECHNOLOGY AND ENGINEERING (IC-ETITE)》 *
陈从周: "DNA 折纸术———全编程的信息工具", 《广州大学学报( 自然科学版)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022062621A1 (zh) * 2020-09-28 2022-03-31 清华大学 阵列式核酸信息存储方法及装置
CN113462710A (zh) * 2021-06-30 2021-10-01 清华大学 一种可随机重写的dna信息存储方法
CN113462710B (zh) * 2021-06-30 2023-07-11 清华大学 一种可随机重写的dna信息存储方法
TWI844889B (zh) * 2021-11-23 2024-06-11 美商萬國商業機器公司 用於將資訊儲存至一多核苷酸中之電腦實施方法、電腦程式產品及系統與用於解譯編碼於多個複合片段中之資訊之電腦實施方法及電腦程式產品
CN116451780A (zh) * 2022-01-05 2023-07-18 密码子(杭州)科技有限公司 用于在分子中存储信息的方法和设备
WO2023240952A1 (zh) * 2022-06-14 2023-12-21 深圳先进技术研究院 基于重组质粒dna分子的数据信息存储方法

Also Published As

Publication number Publication date
CN112288089B (zh) 2022-12-20
WO2022062621A1 (zh) 2022-03-31

Similar Documents

Publication Publication Date Title
CN112288089B (zh) 阵列式核酸信息存储方法及装置
US20210210165A1 (en) Systems and methods for storing and reading nucleic acid-based data with error protection
JP7277054B2 (ja) ホモポリマーコード化核酸メモリ
US12086722B2 (en) DNA-based digital information storage with sidewall electrodes
JP7430701B2 (ja) 核酸鎖の大規模並列酵素合成
JP2022165973A (ja) 核酸ベースのデータ記憶のためのシステム
JP2020504849A (ja) 核酸に基づくデータ保存
US9384320B2 (en) Methods of storing information using nucleic acids
US20180211001A1 (en) Trace reconstruction from noisy polynucleotide sequencer reads
JP2018527900A5 (zh)
KR20180058772A (ko) 핵산 합성을 위한 가요성 기판
AU2019270160A1 (en) Printer-finisher system for data storage in DNA
US20230317164A1 (en) Systems and methods for writing by sequencing of nucleic acids
CN112768003B (zh) 一种基于dna短链杂交的信息存储方法
Roquet et al. DNA-based data storage via combinatorial assembly
CN106446605B (zh) 产生聚合物阵列的方法
US11456759B2 (en) Optimized encoding for storage of data on polymers in asynchronous synthesis
JP4532874B2 (ja) 質量分析可能な原子群を構成単位とする鎖状構造を有する分子に対して付加情報を付与して、情報記録コードとして利用する方法
JP7576536B2 (ja) 誤り保護とともに核酸に基づくデータを記憶および読むためのシステムおよび方法
US20200201812A1 (en) Exabyte-scale data storage using sequence-controlled polymers
US20230332140A1 (en) Layered coding architectures for nucleic acid memory
CN114093401A (zh) 一种基于寡核苷酸芯片杂交的信息存储方法
Antkowiak Engineering DNA Data Storage via Low-cost DNA Synthesis and an Automated Storage Architecture
EP3830831A2 (en) Systems and methods for storing and reading nucleic acid-based data with error protection
WO2023249835A1 (en) Apparatus and processes for high throughput automation of synthetic dna and rna on nanostructured ceramic films

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant