CN112002376B - 一种dna分子记录和读取信息的方法 - Google Patents
一种dna分子记录和读取信息的方法 Download PDFInfo
- Publication number
- CN112002376B CN112002376B CN202010810371.1A CN202010810371A CN112002376B CN 112002376 B CN112002376 B CN 112002376B CN 202010810371 A CN202010810371 A CN 202010810371A CN 112002376 B CN112002376 B CN 112002376B
- Authority
- CN
- China
- Prior art keywords
- sequence
- information
- dna
- length
- phosphorylated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000003860 storage Methods 0.000 claims abstract description 73
- 108020004414 DNA Proteins 0.000 claims abstract description 67
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 57
- 238000012163 sequencing technique Methods 0.000 claims abstract description 27
- 108020004638 Circular DNA Proteins 0.000 claims abstract description 25
- 230000003321 amplification Effects 0.000 claims abstract description 16
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 16
- 239000003550 marker Substances 0.000 claims abstract description 14
- 238000005096 rolling process Methods 0.000 claims abstract description 8
- 102000053602 DNA Human genes 0.000 claims description 25
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 23
- 239000000872 buffer Substances 0.000 claims description 19
- 102000012410 DNA Ligases Human genes 0.000 claims description 13
- 108010061982 DNA Ligases Proteins 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000007672 fourth generation sequencing Methods 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 9
- 102000003960 Ligases Human genes 0.000 claims description 7
- 108090000364 Ligases Proteins 0.000 claims description 7
- 108091034117 Oligonucleotide Proteins 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000007363 ring formation reaction Methods 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 5
- 239000000843 powder Substances 0.000 claims description 5
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims description 4
- 239000007853 buffer solution Substances 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 229920004890 Triton X-100 Polymers 0.000 claims description 3
- 239000013504 Triton X-100 Substances 0.000 claims description 3
- 239000007788 liquid Substances 0.000 claims description 2
- 230000026731 phosphorylation Effects 0.000 claims description 2
- 238000006366 phosphorylation reaction Methods 0.000 claims description 2
- 239000007787 solid Substances 0.000 claims description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims 2
- 230000000977 initiatory effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 9
- 238000012545 processing Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000002360 preparation method Methods 0.000 abstract description 3
- 230000007547 defect Effects 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 12
- 239000013598 vector Substances 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000000969 carrier Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 235000005979 Citrus limon Nutrition 0.000 description 4
- 244000131522 Citrus pyriformis Species 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N formaldehyde Substances O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- 235000007516 Chrysanthemum Nutrition 0.000 description 3
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 3
- 244000269722 Thea sinensis Species 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 235000017784 Mespilus germanica Nutrition 0.000 description 2
- 244000182216 Mimusops elengi Species 0.000 description 2
- 235000000560 Mimusops elengi Nutrition 0.000 description 2
- 241000220317 Rosa Species 0.000 description 2
- 235000007837 Vangueria infausta Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000003337 fertilizer Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000010413 gardening Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000003973 paint Substances 0.000 description 2
- 238000002791 soaking Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000008495 Chrysanthemum leucanthemum Nutrition 0.000 description 1
- 244000192528 Chrysanthemum parthenium Species 0.000 description 1
- 235000000604 Chrysanthemum parthenium Nutrition 0.000 description 1
- 244000077995 Coix lacryma jobi Species 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 235000002722 Dioscorea batatas Nutrition 0.000 description 1
- 235000006536 Dioscorea esculenta Nutrition 0.000 description 1
- 240000001811 Dioscorea oppositifolia Species 0.000 description 1
- 235000003416 Dioscorea oppositifolia Nutrition 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101710193865 Exodeoxyribonuclease 1 Proteins 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 240000007098 Vigna angularis Species 0.000 description 1
- 235000010711 Vigna angularis Nutrition 0.000 description 1
- 239000000980 acid dye Substances 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000008384 feverfew Nutrition 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- JGBUYEVOKHLFID-UHFFFAOYSA-N gelred Chemical compound [I-].[I-].C=1C(N)=CC=C(C2=CC=C(N)C=C2[N+]=2CCCCCC(=O)NCCCOCCOCCOCCCNC(=O)CCCCC[N+]=3C4=CC(N)=CC=C4C4=CC=C(N)C=C4C=3C=3C=CC=CC=3)C=1C=2C1=CC=CC=C1 JGBUYEVOKHLFID-UHFFFAOYSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003020 moisturizing effect Effects 0.000 description 1
- 239000010705 motor oil Substances 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- OTYBMLCTZGSZBG-UHFFFAOYSA-L potassium sulfate Chemical compound [K+].[K+].[O-]S([O-])(=O)=O OTYBMLCTZGSZBG-UHFFFAOYSA-L 0.000 description 1
- 229910052939 potassium sulfate Inorganic materials 0.000 description 1
- 235000011151 potassium sulphates Nutrition 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000006257 total synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Wood Science & Technology (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Medical Informatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Biochemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及信息技术领域,针对现有DNA的信息存储方法存在信息存储密度低,信息载体DNA制备成本高昂且不稳定,读取需依靠特殊仪器以及测序数据处理过程繁琐的缺点,提供一种利用DNA分子记录和读取信息的方法,预先确定DNA序列与字符之间的唯一对应关系以及顺序索引序列,结合固定的起始标记序列和终止标记序列将待存储信息划分到若干小型单链环状DNA中;再以这些单链环状DNA为模板进行超分支滚环扩增;然后将扩增得到的长双链产物用纳米孔测序仪测序。本发明以小型单链环状DNA作为信息存储载体,更为稳定,不易降解;存储密度极高,并且处于开放状态;仅需选取少量的测序结果进行比对即可实现对所存储信息的准确读取。
Description
技术领域
本发明涉及信息技术领域,具体涉及一种DNA分子记录和读取信息的方法。
背景技术
现有商品的说明书大多与商品分离,有些也以标签的形式被粘贴于商品的外包装上,或直接被印刷(印刻)在商品的外包装(容器)上。当存放时间过长时,极易丢失、脱落或被损毁。还有不良商家通过偷换商品包装或容器的方式“以假乱真”,牟取暴利,这严重干扰了市场监管秩序、损害了消费者权益。如何将说明书等信息与商品有机结合,使其与商品共存将极大提升商品说明书的使用寿命,且能加大造假难度,有助于维护消费者权益。
基于DNA的信息存储方法因具有存储密度高、稳定性良好等诸多优势而受到广泛关注(Nature,1999,399,533;Science,2001,293,1763;Trends Biotechnol.,2001,19,247;Commun.ACM,2003,46,95;Biotechnol.Lett.,2003,25,1125;Biotechnol.Prog.,2007,23,501;Biotechniques,2009,47,747.)。通过利用数以千计的长链DNA(>1000nt),研究人员成功实现了对维基百科中的信息的存储和读取(Sci Rep.,2015,5,14138.)。但现有基于DNA的语言存储方法被认为难以应用于日常生活。究其原因,主要有以下几个方面:首先,现有基于DNA的信息存储方法大多将DNA序列转化为了二进制代码(0和1),这样几乎所有的信息都可被存储,但由于以下原因降低了信息存储密度:1)计算机会采用16进制,32进制等方式进行运算,因此存储一个信息单位需要较长的DNA序列,2)通常一段DNA序列对应一个字母而不是对应一个单词。例如,哈佛大学的一个研究团队用8bp的DNA序列对应一个字母或特殊字符,成功用含873万个碱基对的DNA编码了一本包含53,426个字和11张JPG格式的图片的图书(平均100多个碱基编码一个单词)(Science,2012,337,1628.)。其次,因为短链DNA在测序后难以被按预定顺序整合,所以现有方法大多使用长链DNA。但以长链DNA作为信息载体时存在诸多缺陷,如其难以被合成且成本高昂;测序和数据分析过程中需要借助特殊仪器或技术(如Illumina);不稳定,易受化学或生物损伤等。再次,现有方法中往往使用的是线性DNA,进行测序前需先进行PCR扩增,或将其转化到质粒DNA中进行扩增。虽然有结合纳米孔测序技术进行信息存储的报道,但利用纳米孔测序技术得到的原始数据中通常含有5-8%的插入、缺失、误读等错误,故需要多倍的数据并进行复杂的比对和计算才能获得正确的序列,工作量巨大。并且纳米孔测序的数据一般大于1G,对于仅含几千至几万个碱基对的序列的测定效率较低,且成本高昂。
因此,要使基于DNA的信息存储与读取方法真正被应用于实际生活,就要对DNA信息存储载体进行优化设计,并对原有的DNA序列和待存储信息之间的对应关系以及DNA信息存储载体的扩增方法进行本质上的革新。
发明内容
针对现有基于DNA的信息存储方法因存在信息存储密度低,使用的长链DNA信息存储载体制备成本高昂且不稳定、所存储信息的读取需依靠特殊仪器以及测序数据的处理过程繁琐、工作量大的缺点而难以进行实际应用的问题,本发明提供了一种利用DNA分子记录和读取信息的方法,将信息存储在多个小型单链环状DNA中,以其为模板进行超分支滚环扩增,得到的长双链产物为以单个环状DNA的序列信息(及其互补序列)为基本重复单元的串联重复序列,再用纳米孔测序仪对这些长双链产物的序列信息进行测定。
本发明采用的技术方案如下:
一种利用DNA分子记录和读取信息的方法,包括以下步骤:
信息记录:
步骤一,定义字符同单链DNA序列的唯一对应关系;
步骤二,定义两段DNA序列分别作为起始标记序列和终止标记序列;
步骤三,定义一段DNA序列作为顺序索引序列,用来对存储信息进行编号;
步骤四,将待存储的信息按照步骤一至步骤三的定义转化成若干条单链DNA序列,每条序列包括四个部分,从5’到3’依次为:起始标记序列、顺序索引序列、待存储信息对应的序列和终止标记序列;
步骤五,准备步骤四中所设计的所有单链DNA序列,其5’端含有磷酸化修饰;
步骤六,将步骤五中的单链DNA分子内环化;
步骤七,将步骤六制备得到的单链环状DNA保存;
信息读取:
步骤一,将作为信息载体的单链环状DNA,进行超分支滚环扩增(HRCA),使单链DNA环以指数形式扩增出含有重复序列的双链DNA序列;
步骤二,对从步骤一中得到的包含串联重复序列的双链扩增产物采用纳米孔测序仪进行测序;
步骤三,选取纳米孔测序结果进行分析,每个读取结果(Read)只映射一个单链环状DNA的序列信息;
步骤四,将分析结果按顺序索引序列排序,并将信息存储部分的序列单独按顺序排列;
步骤五,将上述得到的DNA序列根据字符与DNA序列的对应关系进行翻译,即得到存储在DNA序列中的完整信息。
进一步的,所述信息记录步骤一中所述字符为汉字、字母、数字、标点符号或者运算符号。
进一步的,所述信息记录步骤一中每个字符对应一个8碱基的特定DNA序列。
进一步的,当待存储的信息属于同一个独立文本时,信息记录步骤四设计的所有单链DNA的序列长度均相同。所述单链DNA在具体实施例中被称为信息存储载体。
进一步的,所述信息记录步骤四待存储信息对应的序列其长度范围为40-80nt。
进一步的,所述信息记录步骤中起始标记序列和终止标记序列均为固定序列。
进一步的,所述信息记录步骤中顺序索引序列的长度为16nt;起始标记序列和终止标记序列的长度均为10nt。优选起始标记序列(5’-ACTACAACTA-3’或5’-CATGAGGCTC-3’)和终止标记序列(5’-AGTCAGACCT-3’)。
进一步的,所述信息记录步骤六中,当待存储的信息存储在多条单链DNA中时,多条单链DNA分子使用相同的辅助寡核苷酸链同时环化。
进一步的,所述信息记录步骤六中,环化反应采用Taq DNA连接酶、辅助寡核苷酸链以及连接酶缓冲液;优选在50℃条件下进行环化反应,反应时间为2h,随后在体系中加入EDTA终止反应;优选当成环反应体系中Taq DNA连接酶的缓冲液终浓度为1×时,缓冲液的组成为:25mM KAc,10mM Mg(Ac)2,1mM NAD,20mM Tris-HCl,10mM DTT和0.1%Triton X-100(pH7.6)。
进一步的,所述信息记录步骤六中,环化反应采用T4DNA连接酶、辅助寡核苷酸链以及连接酶缓冲液,当成环反应体系中T4DNA连接酶的缓冲液终浓度为1×时,缓冲液的组成为:10mM MgCl2,0.5mM ATP,40mM Tris-HCl和10mM DTT(pH7.8)。
进一步的,所述信息读取步骤一中,采用Phi29DNA聚合酶、dNTP和两种引物,两种引物分别为起始标记序列(优选10nt)和终止标记序列的互补链(优选10nt);当超分支滚环扩增体系中Phi29DNA聚合酶的缓冲液浓度为1×时,其组成为:50mM Tris-HCl,10mM Mg(Cl)2,10mM(NH4)2SO4和4mM DTT(pH 7.5@25℃);优选在30℃下进行超分支滚环扩增,反应时间为2h。
进一步的,所述信息读取步骤二,包含串联重复序列的双链扩增产物用SQK-LSK109MinION测序仪(ONT)在室温下进行纳米孔测序,测序时长为2h。
进一步的,所述信息读取步骤三从纳米孔测序的结果中选取长度适当的Reads(单链环状DNA的序列及其互补序列)进行分析,所选取Reads的长度应>2000bp,优选长度2000-6000bp。
进一步的,所述信息读取步骤四,以起始标记序列和终止标记序列作为串联重复序列中每个重复单元的起点和终点,对步骤三中选取的Reads进行拆分,得到一组“待比对数据”;根据Reads中的顺序索引序列确定各组“待比对数据”的顺序,以对各段存储信息进行排序。
进一步的,所述信息读取步骤五,按照信息存储步骤一定义的“每个字符对应的DNA的长度均相同”的原则,对每组“待比对数据”进行分析(以8个碱基为单位进行比对),以该组“待比对数据”中各序列的同一(或几乎同一,偏差≤3nt)位置出现频率最高的那段序列(8nt)为准,确定编码所存储信息的DNA序列,并以预先定义的DNA序列与字符的唯一对应关系为依据,对该序列信息进行翻译。
进一步的,本发明中所述的信息存储与读取方法,可存储的信息长度应<10000字符(计空格),优选字数应<500字符(计空格)。
进一步地,信息存储步骤一中汉字与DNA序列之间对应关系的定义按下述规则进行:
1)将汉字按其结构拆分成代表字根,每个代表字根对应2个碱基;
2)对于由1或2个字根组成的汉字,选择组成该字的全部字根作为该字的代表字根;
3)对于由3个及以上字根组成的汉字,按照由上到下、从左到右的书写顺序进行汉字拆分。①若选取该字的前两个字根时有且仅有一个汉字与之相对应,则将这两个字根作为其代表字根;②若选取该字的前两个字根时有多个汉字与之相对应,则取组成该字的前三个字根和最后一个字根作为其代表字根(仅含3个字根的汉字最后一个字根可为空)。
按照上述规则,汉字、英文字母、数字和标点符号被划分为三类(Biouc-表1中所对应的Type I、Type II和Type III)。Type I包含125个常用汉字(由1个字根组成),100个数字、英文字母及标点符号,3’端为CCA;Type II包含1039个汉字(由两个字根所代表),3’端序列为AC;Type III包含剩下的所有汉字(需3个或更多字根方能代表)。在实际使用时只需查阅Biouc-表1即可确定待存储信息所对应的DNA序列,简便快捷。
所述的Biouc软件是开放的,若有新汉字被创造出来,也能按照上述规则对其进行编码。目前,Biouc表中收录有6800个汉字,包括99%的常用汉字。Biouc的汉字存储上限为2万个。
本发明还提供隐形说明书的制作方法:按照本发明中对字符与DNA序列的对应关系,将待存储的说明书中的文字信息转化成若干条单链DNA序列,每条单链DNA的信息存储载体分别存储5个字符,每条单链DNA序列的长度为76nt,再加上一个终止标记序列作为“结束语”;将上述这些单链DNA序列添加到商品(固体粉末或液体)中,以达到存储产品信息的目的。
进一步的,考虑到样品基质可能会对滚环扩增过程以及后期的纳米孔测序过程有影响,有时需先提取出添加进样品中的“隐形说明书”,然后再以其为模板进行滚环扩增。
本发明所涉及的信息存储与读取方法以小型单链环状DNA(尺寸介于76-116nt之间)作为信息存储载体,其本身较线性DNA及大型的环状DNA更为稳定,不易降解。顺序索引序列的引入使得各个单链环状DNA中所存储信息的翻译后整合更为容易。
本发明所涉及的信息存储方法的存储密度极高,以每8个碱基对应一个汉字、英文字母、数字、运算符号或标点符号等字符计算,有4^8=65536种DNA序列,并且处于开放状态,可随时收录新的字符。
本发明在测序后的数据处理过程中,分析每一个足够长的测序结果都可以得到相应的准确存储信息。而采用线性DNA存储时,只有分析所有序列才能获得准确信息,且每次分析都要从所有或大部分序列中找到有用信息。
本发明仅需选取少量的测序结果进行比对即可实现对所存储信息的准确读取,极大降低了测序数据的处理难度,一般的笔记本电脑就可以做到。
本发明只需按顺序分析一定数量的测序结果就可获得相应小型单链环状DNA中存储的信息,并得出整个信息文本。例如,连续分析100个测序结果,就可获得这100个单链环状DNA中存储的序列信息。如果这已经包含了所存储的所有信息,就足够用于后续分析,而不用分析成千上万条测序结果。这极大缩短了数据处理时间,且信息读取的准确率可达到99.99%以上。因此,本发明真正地将基于DNA的信息存储和读取过程有机地结合在一起,使其简便易行。
本发明所述的信息存储与读取方法,除了可以存储中文说明书外,还可存储英文等其他语言的说明书,但需先将英文或其他语言翻译成中文,方能使用本发明中所述的小型单链环状DNA序列的设计原则进行信息存储载体的设计。
附图说明
图1基于DNA的隐形说明书的存读方法示意图;
图2小型单链环状DNA信息存储载体对应线性DNA序列的设计示意图;
图3顺序索引序列的命名规则及举例示意图;
图4小型单链环状DNA信息存储载体的制备过程示意图;
图5超分支滚环扩增(HRCA)反应原理示意图;
图6纳米孔测序结果的处理和后续的信息读取过程示意图。
具体实施方式
下面结合具体实施例及附图对本发明做进一步详细说明。
以下实施例所用材料如下:
DNA序列均购自苏州金唯智生物科技有限公司,为人工合成;Taq DNA ligase及其对应的10×buffer购自安诺伦(北京)生物科技有限公司(NEW ENGLAND BioLabs);Phi29DNA聚合酶及其对应的10×buffer购自安诺伦(北京)生物科技有限公司(NEWENGLAND BioLabs);NEB Next FFPE DNA Repair Mix购自安诺伦(北京)生物科技有限公司(NEW ENGLAND BioLabs);T4PNK(T4Polynucleotide Kinase)及其对应的10×buffer A购自美国赛默飞世尔生物科技有限公司;T4DNA ligase及其对应的10×buffer购自美国赛默飞世尔生物科技有限公司;核酸外切酶I(EXO I)及其对应的10×buffer购自美国赛默飞世尔生物科技有限公司;SQK-LSK109MinION sequencing machine(ONT)购自牛津纳米孔公司(Oxford Nanopore Technologies);核酸染液(Ultra GelRed)购自诺唯赞(南京)生物科技有限公司;其他化学用品购自美国西格玛奥德里奇(Sigma-Aldrich)。
以下实施例是为了证明本发明的方法具有优越性。采用的作为信息存储载体的DNA序列与字符的对应关系是根据本发明所述的定义规则确定的,此处不再赘述。这些用于信息存储的DNA序列的具体构成如图2所示。
以下每一个实施例都是一个独立的待存储文本,因此,同一个实施例只能采用同种尺寸的信息存储载体,比如,所有的信息存储载体中均存储5个字或均存储8个字。
在具体的实施例中,本发明还规定:
①出现一个“空格”表示所存储信息中的上一段内容结束,空格之后即为下一段内容;一个“空格”对应的一段8nt长的DNA序列。
②出现2-6个“空格”表示所存储信息中的上一章节的内容结束,空格之后即为下一章节的内容。数字越大代表的章节越大,如:6个空格代表第一章,5个空格代表第一章中的第一节,4个空格代表第一节中的1.1,3个空格代表1.1.1,2个空格代表1.1.1.1,最多到四级标题。
③每个单链环状DNA(信息存储载体)中可存储的汉字、英文字母、数字、标点符号及运算符号的个数为5-10个。
④当最后一个信息存储载体中所存储的字数不够时(与前面的信息存储载体相比字数不够),不足的部分用“*”补齐,一个“*”对应的一段8nt长的DNA序列。比如,前面的信息存储载体中均存储了5个字,最后只剩下1个字未被存储,则最后一个信息存储载体中的内容应该是这个字所对应的DNA序列加上4段“*”所对应的DNA序列。⑤以固定的一个信息存储载体作为所有待存储文本的“结束语”。每个信息存储载体存储5个字符时,该信息存储载体中所存储的结束语的文本信息为“&完&结&”;每个信息存储载体存储6个字符时,该信息存储载体中所存储的结束语的文本信息为“&完&结&&”;当每个信息存储载体存储7个字符时,结束语的文本信息为“&完&结&&&”;当每个信息存储载体存储8个字符时,结束语的文本信息为“&完&结&&&&”;当每个信息存储载体存储9字符时,结束语信息为“&完&结&&&&&”;当每个信息存储载体存储10个字符时,结束语为“&完&结&&&&&&”。
上述①~⑤,并不是对本发明的进一步限定,本领域技术人员可以进行变形和改进。
实施例1
1)待存储说明书1的原文:
中闽飘香胎菊的使用方法:取胎菊6-8朵,沸水冲泡约300ml水量,静置3-5分钟即可品饮。可搭配本店枸杞,柠檬片,玫瑰花茶口感更佳。
生产日期:2019/05/25
保质期:18个月
2)说明书1对应的DNA序列信息(5’→3’):
按照本发明中对汉字、英文字母、数字、标点符号及运算符号与DNA序列的对应关系(每8个碱基对应一个汉字、英文字母、数字、标点符号或运算符号,且这种对应关系唯一)和“规定”将说明书1中的信息转化成DNA序列。
具体的序列信息列示如下:
3)说明书1对应的20个小型单链环状DNA信息存储载体的序列信息(5’→3’):
按照本发明所规定的小型单链环状DNA信息存储载体所对应的线性DNA的设计原则和“规定”将2)中的DNA序列划分为19个部分(19条序列),作为19个独立的信息存储载体分别存储5个汉字(或英文字母、数字、标点符号、运算符号),每条序列的长度为76nt。再加上一个作为“结束语”的固定信息存储载体“&完&结&”。因此,用于存储说明书1的信息存储载体共有20个。
具体的序列信息列示如下:
1Z1:CATGAGGCTC ATATATATATATATAC TGAGACCA CGGATAAC CTATCGTA CGTATAACACCTGTAT AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z2:CATGAGGCTC ATATATATATATATAG ATTATCCT TGTAACCA GATGGTTG GTCATCCAGTATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z3:CATGAGGCTC ATATATATATATATCA TAACATAC ACAGTCCA ATTGATAC ACCTGTATATTATCCT AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z4:CATGAGGCTC ATATATATATATATCT AGCTTCCA ACATTCCA AGCATCCA TCCTTGACATCAACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z5:CATGAGGCTC ATATATATATATATCG AGGAGAAG TAAGACCA CGCACTTA TAACATGTGTCTTGAC AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z6:CATGAGGCTC ATATATATATATATTA AGAGACCA AGATGCCA AGATGCCA GACTACCAGACTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z7:CATGAGGCTC ATATATATATATATTC TAAGACCA TACAATAC ATCAACCA AGAGATGTTCATTGAT AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z8:CATGAGGCTC ATATATATATATATTG AGAGACCA ACATTCCA AGACACCA GTTCCAACTGGAACCT AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z9:CATGAGGCTC ATATATATATATATGA GAACGATA CTTCTAAC TACACGTA TGGTACCTAGTGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z10:CATGAGGCTC ATATATATATATACAT CTTCTAAC CATATGAT CAGTCTGA CTTATAACGTTCGAAG AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z11:CATGAGGCTC ATATATATATATACAC CTACTCAG CTTGTGAC ATCAACCA CTACTATACAGTTAGC AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z12:CATGAGGCTC ATATATATATATACAG CTCAGTTG ATCAACCA AGCACAAC AGGCGTATATTCCAAG AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z13:CATGAGGCTC ATATATATATATACCA ATTCCTGT TATCGCCA ATGATATG AGTCGTATGATGACTA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z14:CATGAGGCTC ATATATATATATACCT AGTGTCCA ACTGTCCA CTGTGAAC TGTCACCATAGAGCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z15:CATGAGGCTC ATATATATATATACCG ATATAGCG ACAGTCCA AGAGTCCA AGATGCCAAGATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z16:CATGAGGCTC ATATATATATATACTA AGCAACCA ACATGCCA AGATGCCA AGACACCAACATGCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z17:CATGAGGCTC ATATATATATATACTC AGAGTCCA AGACACCA ACTGTCCA GTTAATACCATCATAT AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z18:CATGAGGCTC ATATATATATATACTG ATATAGCG ACAGTCCA AGATACCA AGCATCCAGTAGCAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z19:CATGAGGCTC ATATATATATATACGA TAATACCA AGGTTCCA AGGTTCCA AGGTTCCAAGGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
1Z20:CATGAGGCTC ATATATATATATAGAT ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4)环化1Z1-1Z20,制备单链环状DNA信息存储载体:
将成环反应所需的成环链(1Z1-1Z20)、辅助寡核苷酸链(splint)、连接酶和连接酶缓冲液等混合,该体系含各种成环链各1μM,40μM splint、20U Taq DNA连接酶,1×TaqDNA连接酶缓冲液,总体积为10μL;50℃条件下连接4h。
1×Taq DNA连接酶缓冲液组成:20mM Tris-HCl,25mM KAc,10mM Mg(Ac)2,10mMDTT,1mM NAD和0.1%Triton X-100(pH 7.6@25℃)。
或用T4DNA连接酶进行连接。体系含各种成环链各1μM,40μM splint、10U T4DNA连接酶,1×T4DNA连接酶缓冲液,总体积为10μL;37℃条件下连接4h。
1×T4DNA连接酶的缓冲液组成为:10mM MgCl2,0.5mM ATP,40mM Tris-HCl和10mMDTT(pH 7.8)。
5)将4)中制备得到的单链环状DNA作为“隐形说明书”添加到中闽飘香胎菊中。
6)从中闽飘香胎菊中取样,浸泡后取上清,该上清中含有“隐形说明书”。
7)以从6)中提取得到的“隐形说明书”为模板进行超分支滚环扩增(HRCA):
HRCA体系中包含以下成分:“隐形说明书”,5U Phi29DNA聚合酶,引物1和引物2各1μM,400μM dNTPs,1×Phi29DNA聚合酶缓冲液,总反应体系为10μL。整个反应需在30℃条件下进行1-120min。
1×Phi29DNA聚合酶缓冲液组成:50mM Tris-HCl,10mM Mg(Cl)2,10mM(NH4)2SO4和4mM DTT(pH 7.5@25℃)。
8)使用SQK-LSK109MinION测序仪(ONT)对8)中扩增得到的长双链产物进行测序。测序样品的预处理和正式测序步骤均需遵照ONT的说明书进行,这里不再赘述。整个测序时长为5-120min。
9)选取部分纳米孔测序结果(Reads)进行分析,选择原则为:Read的长度应>2000nt(长度介于2000-6000nt之间时更佳)。
以下为其中的一个Read(1Z10)的结果:
1Z10:CATGAGGCTC ATATATATATATACAT CTTCTAAC CATATGAT CAGTCTGA CTTATAACGTTCGAAG AGTCAGACCT(5’-磷酸化,长度为76nt)
>2d01fbb6-47b9-484b-9831-63484e86de45runid=db8d46041a56fbd122b928e5370f5d6c946a7b53read=1243ch=235start_time=2019-11-15T03:15:45Z flow_cell_id=FAL23517protocol_group_id=20191115Z11sample_id=Z110235
AAGAGATCAGATCTCATGAGGCTCATATATTATATACACATCTTCTAACCATTTGATCAATCTGACTATAACGTTCGAGGAGTCAGACTTCATGAAGGCTCATATATTATATATACATCTTTTCTAACCATATGAATCAGTCTGACTATAACGTTCGAGAGTCCGACCTCATGAGGCTCATATATATATATACATCTCCTAACCATATGATCAGTTGACTTTATAACGTTCGAAAAGTCAGACCTCATGAGCTCATATTATATATACATCTTCTAACCATATTGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACGTCTTCTAAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATAAACATCTTCTAACCATATGATCAGTCTGACTTATAACCTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATACGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATAAATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCGGACCTCATGAGGCTCATATATATATATACATCTTCTAACCACATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTTTCGAAGAGTTAGACCTCATGAGGCTCATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATTATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAGAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATAATTATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATAAATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAAGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATCATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGAACCTCATGAGGCTCATATATTATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATTGAGGCTCATATAATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAAGACCTCATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATAATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAGGCTCATATATATATATACATCTTCCTTAACCATATGATCAGTCTGACTTATAAACGTTCGAAGGAGTCAGACCT
将以上测序所得原始数据按重复单元处理得以下结果:
AAGAGATCAGATCT
1)CATGAGGCTCATATATTATATACACATCTTCTAACCATTTGATCAATCTGACTATAACGTTCGAGGAGTCAGACTTCATG
2)AAGGCTCATATATTATATATACATCTTTTCTAACCATATGAATCAGTCTGACTATAACGTTCGAGAGTCCGACCT
3)CATGAGGCTCATATATATATATACATCTCCTAACCATATGATCAGTTGACTTTATAACGTTCGAAAAGTCAGACCT
4)CATGAGCTCATATTATATATACATCTTCTAACCATATTGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
5)CATGAGGCTCATATATATATATACGTCTTCTAAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
6)CATGAGGCTCATATATATATAAACATCTTCTAACCATATGATCAGTCTGACTTATAACCTTCGAAGAGTCAGACCT
7)CATGAGGCTCATATATATATATACATCTTCTAACCATACGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
8)CATGAGGCTCATAAATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCGGACCT
9)CATGAGGCTCATATATATATATACATCTTCTAACCACATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
10)CATGAGGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTTTCGAAGAGTTAGACCT
11)CATGAGGCTCATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
12)CATGAGGCTCATTATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAGAGAGTCAGACCT
13)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
14)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTTCGAAGAGTCAGACCT
15)CATGAGGCTCATATATATATATACATCTTCTACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
16)CATGAGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
17)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
18)CATGAGGCTCATATATATAATTATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
19)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
20)CATGAGGCTCATATAAATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCTCATGAAGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
21)CATGAGGCTCATATATATATATACATCTTCTAACCATATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
22)CATGAGGCTCATATATATCATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGAACCT
23)CATGAGGCTCATATATTATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
24)CATTGAGGCTCATATAATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
25)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
26)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAAGACCT
27)CATGAGGCTCATATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
28)CATGAGGCTCATAATATATATATACATCTTCTAACCATATGATCAGTCTGACTTATAACGTTCGAAGAGTCAGACCT
29)CATGAGGCTCATATATATATATACATCTTCCTTAACCATATGATCAGTCTGACTTATAAACGTTCGAAGGAGTCAGACCT
可以看出有插入、缺失以及碱基变化等错误。通过Blast等方法比对分析可以得出下面正确结果:
1Z10:CATGAGGCTC ATATATATATATACAT CTTCTAAC CATATGAT CAGTCTGACTTATAAC GTTCGAAG AGTCAGACCT
其中标下划线部分为信息存储部分序列。
10)将分析结果按顺序索引序列排序,并将信息存储部分的序列单独按顺序排列。
11)将从10)中得到的DNA序列根据本发明所定义的汉字、英文字母、数字、标点符号及运算符号与DNA序列的对应关系(8个碱基对应一个汉字、英文字母、数字、标点符号或运算符号)及“规定”翻译成汉语文本,即得到“隐形说明书”中所存储的完整信息。
实施例2
1)待存储说明书2的原文:
中闽飘香柠檬片的冲泡方法:温水冲泡2-3分钟即可饮用,泡过的柠檬片还能敷脸,泡澡不浪费!搭配中闽飘香胎菊,枸杞,玫瑰花茶等口感更佳!
生产日期:2019/09/18
保质期:12个月
2)说明书2对应的DNA序列信息(5’→3’):
同实施例1,将说明书2中的信息转化成DNA序列,具体的序列信息列示如下:
3)说明书2对应的20个小型单链环状DNA信息存储载体的序列信息(5’→3’):
同实施例1,将2)中的DNA序列划分成19条序列,每条序列中存储5个汉字、英文字母、数字、标点符号或运算符号,长度为76nt。具体的序列信息列示如下:
2Z1:CATGAGGCTC ATATATATATATATAC TGAGACCA CGGATAAC CTATCGTA CGTATAACCTACTATA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z2:CATGAGGCTC ATATATATATATATAG CAGTTAGC CTCAGTTG TGTAACCA CGCACTTATAACATGT AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z3:CATGAGGCTC ATATATATATATATCA GTATACCA TAACATAC ACAGTCCA TAACGTTATAAGACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z4:CATGAGGCTC ATATATATATATATCT CGCACTTA TAACATGT AGAGTCCA ACATTCCAAGAGACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z5:CATGAGGCTC ATATATATATATATCG GTTCCAAC TGGAACCT GAACGATA CTTCTAACTGGTACCT AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z6:CATGAGGCTC ATATATATATATATTA GTCATCCA ATCAACCA TAACATGT ACGTGAACTGTAACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z7:CATGAGGCTC ATATATATATATATTC CTACTATA CAGTTAGC CTCAGTTG AGTCATCAATGAATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z8:CATGAGGCTC ATATATATATATATTG AGAGATCT ACCTATAC ATCAACCA TAACATGTTAAGTAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z9:CATGAGGCTC ATATATATATATATGA TGTATCCA TATAAGAT GTAGCATA AGGTACCACATATGAT AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z10:CATGAGGCTC ATATATATATATACAT CAGTCTGA TGAGACCA CGGATAAC CTATCGTACGTATAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z11:CATGAGGCTC ATATATATATATACAC ACCTGTAT ATTATCCT ATCAACCA CTACTCAGCTTGTGAC AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z12:CATGAGGCTC ATATATATATATACAG ATCAACCA AGCACAAC AGGCGTAT ATTCCAAGATTCCTGT AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z13:CATGAGGCTC ATATATATATATACCA CTTGGACT TATCGCCA ATGATATG AGTCGTATGATGACTA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z14:CATGAGGCTC ATATATATATATACCT AGGTACCA ACTGTCCA CTGTGAAC TGTCACCATAGAGCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z15:CATGAGGCTC ATATATATATATACCG ATATAGCG ACAGTCCA AGAGTCCA AGATGCCAAGATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z16:CATGAGGCTC ATATATATATATACTA AGCAACCA ACATGCCA AGATGCCA AGCAACCAACATGCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z17:CATGAGGCTC ATATATATATATACTC AGATACCA AGCATCCA ACTGTCCA GTTAATACCATCATAT AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z18:CATGAGGCTC ATATATATATATACTG ATATAGCG ACAGTCCA AGATACCA AGAGTCCAGTAGCAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z19:CATGAGGCTC ATATATATATATACGA TAATACCA AGGTTCCA AGGTTCCA AGGTTCCAAGGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
2Z20:CATGAGGCTC ATATATATATATAGAT ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
步骤4)-11)同实施例1,步骤11)最终翻译成的汉语文本与“隐形说明书”中所存储的完整信息一致。
实施例3
1)待存储说明书3的原文:
御膳食神山药红豆薏仁粉的食用方法:1本产品适合做早晚餐和下午茶(空腹吃效果更佳,一般一天2次左右);2先将粉粉加3-5勺(约25g的产品)放入杯中,加入200ml水(水温约90度左右),搅拌均匀,温度适宜即可饮用;可根据个人口味增加水量,达到自己想要的口感;3冲泡后有碎物,为食材成分,请放心食用。
生产日期:2019/06/11
保质期:常温6个月
2)说明书3对应的DNA序列信息(5’→3’):
同实施例1,将说明书3中的信息转化成DNA序列,具体的序列信息列示如下:
3)说明书3对应的36个小型单链环状DNA信息存储载体的序列信息(5′→3′):
同实施例1,将2)中的DNA序列划分成35条序列,每条序列中存储5个汉字、英文字母、数字、标点符号或运算符号,长度为76nt。具体的序列信息列示如下:
3Z1:CATGAGGCTC ATATATATATATATAC CTGTATAT ACTATCTA GTATATTC TGTCAGATTAGAACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z2:CATGAGGCTC ATATATATATATATAG ATTCGAAC GTTCTGAC AGTAACGA ATTCTACGGTAGTAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z3:CATGAGGCTC ATATATATATATATCA TGCAAGAC TGTAACCA GTATATTC GTCATCCAGTATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z4:CATGAGGCTC ATATATATATATATCT TAACATAC ACAGTCCA AGATACCA CTTATAACTGTCACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z5:CATGAGGCTC ATATATATATATATCG TACACGTA CTTCTACA GATGGTTA GATCTGTAGATATCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z6:CATGAGGCTC ATATATATATATATTA TACTTGAC AGGTTAAC TGGATCCA AGTAGTACCGATAGAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z7:CATGAGGCTC ATATATATATATATTC ATTCCTGT AGTAGCCA CAATATAC ACTAGAGATAGTATTA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z8:CATGAGGCTC ATATATATATATATTG CGGATAGT TACTGAAC AGTCGTAT GATGACTAATCAACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z9:CATGAGGCTC ATATATATATATATGA TGCAACCA CTTCGAAG TGCAACCA AGTACAACAGAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z10:CATGAGGCTC ATATATATATATACAT CGCGTAAT ATGTTAAC ACATATAC AGTAACCAACTGACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z11:CATGAGGCTC ATATATATATATACAC AGAGTCCA CTTGCTTA CGTCCAAT TGCAAGACTGCAAGAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z12:CATGAGGCTC ATATATATATATACAG TCAGCTAC AGAGACCA ACATTCCA AGACACCACACACTAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z13:CATGAGGCTC ATATATATATATACCA AGTAGCCA GTCTTGAC AGAGTCCA AGACACCAGAATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z14:CATGAGGCTC ATATATATATATACCT TGTAACCA TGTCACCA TACACGTA AGTAACCAGCCAATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z15:CATGAGGCTC ATATATATATATACCG CGTAGAAC CAGTCTAT TGAGACCA ATCAACCATCAGCTAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z16:CATGAGGCTC ATATATATATATACTA CGTAGAAC AGAGTCCA AGATGCCA AGATGCCAGACTACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z17:CATGAGGCTC ATATATATATATACTC GACTTCCA TAAGACCA AGTAGCCA TAAGACCATAACGTTA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z18:CATGAGGCTC ATATATATATATACTG GTCTTGAC AGCAACCA AGATGCCA GTGAACACATGTTAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z19:CATGAGGCTC ATATATATATATACGA ACATATAC AGTAACCA ATCAACCA CAATGTAGCAGAATAG AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z20:CATGAGGCTC ATATATATATATAGAT AGACATTA CACAACAC ATCAACCA TAACGTTAGTGAACAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z21:CATGAGGCTC ATATATATATATAGAC CTTCTACA CTGCTATA GAACGATA CTTCTAACCTTCTAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z22:CATGAGGCTC ATATATATATATAGAG GTCATCCA ACTGACCA CTTCTAAC CTTAGAATCACAATCT AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z23:CATGAGGCTC ATATATATATATAGCA GTAGCAAC TGCATCCA TATCGCCA TACTATTCAGAGATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z24:CATGAGGCTC ATATATATATATAGCT TCAGCTAC TAAGACCA TACAATAC ATCAACCAACATAGAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z25:CATGAGGCTC ATATATATATATAGCG AGAGGTAC CGTAATAC GTTAGCCA TGCTACATTGACACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z26:CATGAGGCTC ATATATATATATAGTA TGTAACCA TATCGCCA ATGATATG ACTGACCAAGAGACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z27:CATGAGGCTC ATATATATATATAGTC CGCACTTA TAACATGT CACGTAAC TATGACCAATCACAGA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z28:CATGAGGCTC ATATATATATATAGTG CTCTTGAC ATCAACCA TGCTTCCA GTATATTCCTATCATA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z29:CATGAGGCTC ATATATATATATAGGA ACACATAC GTTCCAAC ATCAACCA GTAGCTTCGCCAATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z30:CATGAGGCTC ATATATATATATCAAT GATCTCCA GTATATTC GTCATCCA AGTGTCCAACTGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z31:CATGAGGCTC ATATATATATATCAAC CTGTGAAC TGTCACCA TAGAGCCA ATATAGCGACAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z32:CATGAGGCTC ATATATATATATCAAG AGAGTCCA AGATGCCA AGATACCA AGCAACCAACATGCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z33:CATGAGGCTC ATATATATATATCACA AGATGCCA AGCTTCCA ACATGCCA AGATACCAAGATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z34:CATGAGGCTC ATATATATATATCACT ACTGTCCA GTTAATAC CATCATAT ATATAGCGACAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z35:CATGAGGCTC ATATATATATATCACG TAATCAAG TAACGTTA AGCTTCCA GTAGCAACTAATACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
3Z36:CATGAGGCTC ATATATATATATCATA ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
步骤4)-11)同实施例1,步骤11)最终翻译成的汉语文本与“隐形说明书”中所存储的完整信息一致。
实施例4
1)待存储说明书4的原文:
史丹利家庭园艺复合肥的说明书信息如下:
品牌:史丹利
产品名称:家庭园艺复合肥(硫酸钾型)
有效期:3年
使用时期:整个生长期均可使用
注意事项:置于儿童触及不到的地方
2)说明书4对应的DNA序列信息(5’→3’):
同实施例1,将说明书4中的信息转化成DNA序列,具体的序列信息列示如下:
3)说明书4对应的14个小型单链环状DNA信息存储载体的序列信息(5’→3’):
同实施例1,将2)中的DNA序列划分成13条序列,每条序列中存储5个汉字、英文字母、数字、标点符号或运算符号,长度为76nt。具体的序列信息列示如下:
4Z1:CATGAGGCTC ATATATATATATATAC TACACGTA CTCAGTCT ACAGTCCA TCATATACTCGATGAC AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z2:CATGAGGCTC ATATATATATATATAG CGTATCAC ACTGTCCA TGTCACCA TACACGTACATATCAC AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z3:CATGAGGCTC ATATATATATATATCA CTCTAGAC ACAGTCCA TGCTTCAC GTCTGATATCATTAAG AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z4:CATGAGGCTC ATATATATATATATCT ATAGGCAC CTCTCAAT GATGGTTA ACAGGAACAGTAGCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z5:CATGAGGCTC ATATATATATATATCG ATCACACT CTACCGAT CATACAAC AGACTAAGAGTAACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z6:CATGAGGCTC ATATATATATATATTA ACTGTCCA TATGACCA CGGATAGT ATATAGCGACAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z7:CATGAGGCTC ATATATATATATATTC AGAGACCA CAGACAAC ACTGTCCA GATGGTTGGTCATCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z8:CATGAGGCTC ATATATATATATATTG TATGCAAC ATATAGCG ACAGTCCA AGTAATCAGTAGCAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z9:CATGAGGCTC ATATATATATATATGA CTGTGAAC CTCGATAC ATATAGCG AGACATTACTTCTAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z10:CATGAGGCTC ATATATATATATACAT GATGGTTG GTCATCCA ACTGTCCA TATCCTACCGCAATGA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z11:CATGAGGCTC ATATATATATATACAC AGTCTAAC ATATATTG ACAGTCCA TCATTGATAGTAGAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z12:CATGAGGCTC ATATATATATATACAG GTATTCCA CGCAAGAT TGTGGTAG ACCTTCACTGTATCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z13:CATGAGGCTC ATATATATATATACCA AGAGGTAC TGTAACCA TGGTACCA GTATACCAAGGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
4Z14:CATGAGGCTC ATATATATATATACCT ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
步骤4)-11)同实施例1,步骤11)最终翻译成的汉语文本与“隐形说明书”中所存储的完整信息一致。
实施例5
1)待存储说明书5的原文:
美孚汽油的说明书信息如下:
品名:美孚1号
质量等级:APISN
粘度:0W-40
净含量:4L+1L
保质期:5年
机油分类:全合成
2)说明书5对应的DNA序列信息(5’→3’):
同实施例1,将说明书5中的信息转化成DNA序列,具体的序列信息列示如下:
3)说明书5对应的12个小型单链环状DNA信息存储载体的序列信息(5’→3’):
同实施例1,将2)中的DNA序列划分成11条序列,每条序列中存储5个汉字、英文字母、数字、标点符号或运算符号,长度为76nt。具体的序列信息列示如下:
5Z1:CATGAGGCTC ATATATATATATATAC TACACGTA CATATCAC ACAGTCCA CGTGATATACTAGCAC AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z2:CATGAGGCTC ATATATATATATATAG AGATACCA TACTTAAT ACTGTCCA CATCATATTACAATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z3:CATGAGGCTC ATATATATATATATCA CTTGGACT GTTGGAAC ACAGTCCA ATTCGCCAATAGACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z4:CATGAGGCTC ATATATATATATATCT ATGCTCCA ATACACCA ATAGTCCA ACTGTCCATGTCATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z5:CATGAGGCTC ATATATATATATATCG GTGAACAC ACAGTCCA AGATGCCA ATCGTCCAACATTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z6:CATGAGGCTC ATATATATATATATTA AGACTCCA AGATGCCA ACTGTCCA CGCGTATAGAGTTATC AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z7:CATGAGGCTC ATATATATATATATTC TACAATAC ACAGTCCA AGACTCCA ATATGCCAAGTCTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z8:CATGAGGCTC ATATATATATATATTG AGATACCA ATATGCCA ACTGTCCA GTTAATACCATCATAT AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z9:CATGAGGCTC ATATATATATATATGA ATATAGCG ACAGTCCA AGACACCA CAGACAACACTGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z10:CATGAGGCTC ATATATATATATACAT CTTGATAC TAAGCGAC GTTCCAAC TGTACAACACAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z11:CATGAGGCTC ATATATATATATACAC GAGTCTAC GATGGTTA ACACATAC AGGTTCCAAGGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
5Z12:CATGAGGCTC ATATATATATATACAG ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
步骤4)-11)参考实施例1,这里不再赘述。不同的是,步骤6)中需对汽油先进行萃取处理以得到“隐形说明书”,再进行后续的操作。步骤11)最终翻译成的汉语文本与“隐形说明书”中所存储的完整信息一致。
实施例6
1)待存储说明书6的原文:
立邦油漆的说明书信息如下:
商品名称:立邦抗甲醛净味五合一套装
涂层:面漆+底漆
适用部位:内墙
储存:0-35度阴凉干燥处
功能特点:有效净化甲醛
2)说明书6对应的DNA序列信息(5’→3’):
同实施例1,将说明书6中的信息转化成DNA序列,具体的序列信息列示如下:
3)说明书6对应的14个小型单链环状DNA信息存储载体的序列信息(5’→3’):
同实施例1,将2)中的DNA序列划分成13条序列,每条序列中存储5个汉字、英文字母、数字、标点符号或运算符号,长度为76nt。具体的序列信息列示如下:
6Z1:CATGAGGCTC ATATATATATATATAC GAACGAAC TACACGTA CATATCAC CTCTAGACACAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z2:CATGAGGCTC ATATATATATATATAG TAAGGCCA ACCTCACA CAGTATAG TCTATCCACTAGATTG AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z3:CATGAGGCTC ATATATATATATATCA CGCGTATA TACTATTC GATGACCA GATGGTTATGCAACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z4:CATGAGGCTC ATATATATATATATCT ATGTGAAC CGTCTCAT ACTGTCCA TAAGCACTTCCATATC AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z5:CATGAGGCTC ATATATATATATATCG ACAGTCCA ACATGAAC TAACTGAT AGTCTCCAGTCTATAT AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z6:CATGAGGCTC ATATATATATATATTA GAACGAAC TACACGTA CATATCAC CTCTAGACACAGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z7:CATGAGGCTC ATATATATATATATTC TAACTGAT ACTGTCCA CTTCTACA GTCATCCACGGTATAC AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z8:CATGAGGCTC ATATATATATATATTG GTTCTCAC ACAGTCCA TCGACAAC ACTGATCTACTGTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z9:CATGAGGCTC ATATATATATATATGA GAGTTCTC ATGACAAG ACAGTCCA AGATGCCAACATTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z10:CATGAGGCTC ATATATATATATACAT AGAGACCA AGACACCA GTGAACAC ATTGTAACCGGCTAAT AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z11:CATGAGGCTC ATATATATATATACAC TACGTCCA CTCGATTA CTGCATAC ACTGTCCAATAGCAAC AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z12:CATGAGGCTC ATATATATATATACAG ATGAATAC CTGTACTA AGCTCATC ACAGTCCATATGACCA AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z13:CATGAGGCTC ATATATATATATACCA CGGATAGT CGCGTATA GTTCGAAC TCTATCCACTAGATTG AGTCAGACCT(5’-磷酸化,长度为76nt)
6Z14:CATGAGGCTC ATATATATATATACCT ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA AGTCAGACCT(5’-磷酸化,长度为76nt)
步骤4)-11)参考实施例1,这里不再赘述。步骤6)中需对油漆先进行萃取处理以得到“隐形说明书”,再进行后续的操作。步骤11)最终翻译成的汉语文本与“隐形说明书”中所存储的完整信息一致。
实施例7
1)待存储说明书7的原文:
兰蔻大粉水的说明书信息如下:
名称:清莹柔肤水粉水
产地:法国(规格)400ml
保质期:三年
适用肌肤:所有肌肤
特点功效:保湿滋润
2)说明书7对应的DNA序列信息(5’→3’):
同实施例1,将说明书7中的信息转化成DNA序列,具体的序列信息列示如下:
3)说明书7对应的8个小型单链环状DNA信息存储载体的序列信息(5’→3’):
将2)中的DNA序列划分成7条序列,每条序列中存储8个汉字、英文字母、数字、标点符号或运算符号,长度为100nt。具体的序列信息列示如下:
7Z1:CATGAGGCTC ATATATATATATATAC CATATCAC CTCTAGAC ACAGTCCA AGGTTGATATTAACTA ATCAATTG ACATCATC TAAGACCA AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z2:CATGAGGCTC ATATATATATATATAG TGCAAGAC TAAGACCA ACTGTCCA TGTCACCATGGTACCA ACAGTCCA TAACATAC TGGAACCA AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z3:CATGAGGCTC ATATATATATATATCA AGTAGCCA AGATCACT CTCTATAC AGTAACCAAGACTCCA AGATGCCA AGATGCCA GACTACCA AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z4:CATGAGGCTC ATATATATATATATCT GACTTCCA ACTGTCCA GTTAATAC CATCATATATATAGCG ACAGTCCA GTACACCA CAGACAAC AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z5:CATGAGGCTC ATATATATATATATCG ACTGTCCA CTTCTACA GTCATCCA ACTGTGACACATCATC ACAGTCCA CAGCATAC TATGACCA AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z6:CATGAGGCTC ATATATATATATATTA ACTGTGAC ACATCATC CTGTACTA AGCTCATCATAGCAAC CGGATAGT ACAGTCCA GTTAATAC AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z7:CATGAGGCTC ATATATATATATATTC TAACGTAT TAAGATCT TAAGATTA AGGTTCCAAGGTTCCA AGGTTCCA AGGTTCCA AGGTTCCA AGTCAGACCT(5’-磷酸化,长度为100nt)
7Z8:CATGAGGCTC ATATATATATATATTG ACGTTCCA TGTAATAG ACGTTCCA GTCAATACACGTTCCA ACGTTCCA ACGTTCCA ACGTTCCA AGTCAGACCT(5’-磷酸化,长度为100nt)
步骤4)-11)同实施例1,这里不再赘述。应当注意的是,步骤6)中需对化妆水先进行稀释处理,再进行后续的操作。步骤11)最终翻译成的汉语文本与“隐形说明书”中所存储的完整信息一致。
实施例1-7的测序数据的分析结果均表明,本发明所述的信息存读方法简便可行,可实现对产品说明书等信息的长期稳定存储,并且信息读取的准确率较高,能满足实际应用,具有广阔的应用前景。
以上所述的实施例仅是对本发明的优选实施方式的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (5)
1.一种利用DNA分子记录和读取信息的方法,其特征在于,包括以下步骤:
信息记录:
步骤一,定义字符同单链DNA序列的唯一对应关系,每个字符对应的DNA的长度均相同;
步骤二,定义两段DNA序列分别作为起始标记序列和终止标记序列;
步骤三,定义一段DNA序列作为顺序索引序列,用来对存储信息进行编号;
步骤四,将待存储的信息按照步骤一至步骤三的定义转化成若干条单链DNA序列,每条序列包括四个部分,从5’到3’依次为:起始标记序列、顺序索引序列、待存储信息对应的序列和终止标记序列;
步骤五,准备步骤四中所设计的所有单链DNA序列,其5’端含有磷酸化修饰;
步骤六,将步骤五中的单链DNA分子内环化;
步骤七,将步骤六制备得到的单链环状DNA保存;
信息读取:
步骤一,将作为信息载体的单链环状DNA,进行超分支滚环扩增,使单链DNA环以指数形式扩增出含有重复序列的双链DNA序列;
步骤二,对从信息读取步骤一中得到的包含串联重复序列的双链扩增产物采用纳米孔测序仪进行测序;
步骤三,选取纳米孔测序结果进行分析,每个测序读取结果只映射一个单链环状DNA的序列信息;
步骤四,将分析结果按顺序索引序列排序,并将信息存储部分的序列单独按顺序排列;
步骤五,将上述得到的DNA序列根据字符与DNA序列的对应关系进行翻译,即得到存储在DNA序列中的完整信息;
所述信息记录步骤一中每个字符对应一个8碱基的特定DNA序列;
所述信息记录步骤中起始标记序列和终止标记序列均为固定序列;
当待存储的信息属于同一个独立文本时,信息记录步骤四设计的所有单链DNA的序列长度均相同;
所述信息记录步骤四中待存储信息对应的序列其长度范围为40-80 nt;顺序索引序列的长度为16 nt;起始标记序列和终止标记序列的长度均为10 nt;
所述信息记录步骤六中,当待存储的信息存储在多条单链DNA中时,多条单链DNA分子使用相同的辅助寡核苷酸链同时环化。
2.根据权利要求1所述的利用DNA分子记录和读取信息的方法,其特征在于,所述信息记录步骤六中,环化反应采用Taq DNA连接酶、辅助寡核苷酸链以及连接酶缓冲液,当成环反应体系中Taq DNA连接酶的缓冲液终浓度为1×时,缓冲液的组成为:25 mM KAc, 10 mMMg(Ac)2, 1 mM NAD, 20 mM Tris-HCl, 10 mM DTT和0.1% Triton X-100,pH为7.6。
3.根据权利要求1所述的利用DNA分子记录和读取信息的方法,其特征在于,所述信息记录步骤六中,环化反应采用T4 DNA连接酶、辅助寡核苷酸链以及连接酶缓冲液,当成环反应体系中T4 DNA连接酶的缓冲液终浓度为1×时,缓冲液的组成为:10 mM MgCl2, 0.5 mMATP, 40 mM Tris-HCl和10 mM DTT,pH为7.8。
4.根据权利要求1所述的利用DNA分子记录和读取信息的方法,其特征在于,所述信息读取步骤一中,采用Phi29 DNA聚合酶、dNTP和两种引物,一种引物是起始标记序列,另一种引物为终止标记序列的互补链;当超分支滚环扩增体系中Phi29 DNA聚合酶的缓冲液浓度为1×时,缓冲液的组成为:50 mM Tris-HCl, 10 mM Mg(Cl)2, 10 mM (NH4)2SO4和4 mMDTT,pH 为7.5。
5.根据权利要求1所述的利用DNA分子记录和读取信息的方法,其特征在于,将待存储的说明书的文字信息转化成若干条单链环状DNA序列并添加到固体粉末或液体商品中,制作成隐形说明书。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010810371.1A CN112002376B (zh) | 2020-08-13 | 2020-08-13 | 一种dna分子记录和读取信息的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010810371.1A CN112002376B (zh) | 2020-08-13 | 2020-08-13 | 一种dna分子记录和读取信息的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112002376A CN112002376A (zh) | 2020-11-27 |
CN112002376B true CN112002376B (zh) | 2024-03-19 |
Family
ID=73464209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010810371.1A Active CN112002376B (zh) | 2020-08-13 | 2020-08-13 | 一种dna分子记录和读取信息的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112002376B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230244412A1 (en) * | 2022-01-28 | 2023-08-03 | Western Digital Technologies, Inc. | Encoding and integrity markers for molecular storage applications |
CN114807331B (zh) * | 2022-05-12 | 2024-06-18 | 中国海洋大学 | 一种短链dna的纳米孔测序方法 |
CN118280458B (zh) * | 2024-05-29 | 2024-09-20 | 弈芯科技(杭州)有限公司 | 分子动力学模拟方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105022935A (zh) * | 2014-04-22 | 2015-11-04 | 中国科学院青岛生物能源与过程研究所 | 一种利用dna进行信息存储的编码方法和解码方法 |
KR20160001455A (ko) * | 2014-06-27 | 2016-01-06 | 한국생명공학연구원 | 데이터 저장용 dna 메모리 기술 |
CN109460822A (zh) * | 2018-11-19 | 2019-03-12 | 天津大学 | 基于dna的信息存储方法 |
CN109830263A (zh) * | 2019-01-30 | 2019-05-31 | 东南大学 | 一种基于寡核苷酸序列编码存储的dna存储方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017190297A1 (zh) * | 2016-05-04 | 2017-11-09 | 深圳华大基因研究院 | 利用dna存储文本信息的方法、其解码方法及应用 |
-
2020
- 2020-08-13 CN CN202010810371.1A patent/CN112002376B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105022935A (zh) * | 2014-04-22 | 2015-11-04 | 中国科学院青岛生物能源与过程研究所 | 一种利用dna进行信息存储的编码方法和解码方法 |
KR20160001455A (ko) * | 2014-06-27 | 2016-01-06 | 한국생명공학연구원 | 데이터 저장용 dna 메모리 기술 |
CN109460822A (zh) * | 2018-11-19 | 2019-03-12 | 天津大学 | 基于dna的信息存储方法 |
CN109830263A (zh) * | 2019-01-30 | 2019-05-31 | 东南大学 | 一种基于寡核苷酸序列编码存储的dna存储方法 |
Non-Patent Citations (1)
Title |
---|
DNA数据存储;毛秀海 等;电子与信息学报;20200615(06);第4-13页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112002376A (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112002376B (zh) | 一种dna分子记录和读取信息的方法 | |
Garcia et al. | High variability in cellular stoichiometry of carbon, nitrogen, and phosphorus within classes of marine eukaryotic phytoplankton under sufficient nutrient conditions | |
Ohsako et al. | Intra‐and interspecific phylogeny of wild Fagopyrum (Polygonaceae) species based on nucleotide sequences of noncoding regions in chloroplast DNA | |
Pretorius | Conducting wine symphonics with the aid of yeast genomics | |
Hartmann et al. | Efficient CO2 fixation by surface Prochlorococcus in the Atlantic Ocean | |
Choi et al. | Dynamic changes in the composition of photosynthetic picoeukaryotes in the northwestern Pacific Ocean revealed by high-throughput tag sequencing of plastid 16S rRNA genes | |
D'Agata | Native wine grapes of Italy | |
Ramírez-Cruz et al. | Phylogenetic inference and trait evolution of the psychedelic mushroom genus Psilocybe sensu lato (Agaricales) | |
Scutarașu et al. | Effect of different winemaking conditions on organic acids compounds of white wines | |
Chen et al. | The computational wine wheel 2.0 and the TriMax triclustering in wineinformatics | |
Jalobeanu et al. | Treating plants as laboratories: A chemical natural history of vegetation in 17th‐century E ngland | |
Li et al. | Transcriptome analysis of the effects of grafting interstocks on apple rootstocks and scions | |
Mostajir et al. | Seasonal variations of pico-and nano-detrital particles (DAPI Yellow Particles, DYP) in the Ligurian Sea (NW Mediterranean) | |
Lima et al. | Insights into Limnothrix sp. metabolism based on comparative genomics | |
Dasgupta | Drayton's ‘Silent Spring’: Poly-Olbion and the Politics of Landscape | |
CN108384885A (zh) | 一种香樟ssr引物组合及其品种鉴定方法 | |
CN117887874B (zh) | 一种g-ssr标记引物组合及其在古樟树指纹图谱构建中的应用 | |
Templin et al. | Meselson-Stahl experimental simulation using Lego™ building blocks | |
Salas Quesada et al. | New Wine Geographies on the United States-Mexico Border. A Study About the Sense of Place | |
Pineda-Lázaro et al. | Arbuscular mycorrhizal fungi associated with Myrciaria dubia in the Amazonia Region, Peru | |
CN117887874A (zh) | 一种g-ssr标记引物组合及其在古樟树指纹图谱构建中的应用 | |
Sun et al. | Genetic structure and selection signature in flora scent of roses by whole genome re-sequencing | |
Natskoulis et al. | Optimisation of Retsina Wine Quality: Effects of Resin Concentration, Yeast Strain, and Oak Chip Type | |
Walker | Heidi Hartmann and a life with mesembs | |
Walker | State of the world's plants and fungi |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |