CN113299343A - 数据存储方法及数据存储装置 - Google Patents

数据存储方法及数据存储装置 Download PDF

Info

Publication number
CN113299343A
CN113299343A CN202011405329.8A CN202011405329A CN113299343A CN 113299343 A CN113299343 A CN 113299343A CN 202011405329 A CN202011405329 A CN 202011405329A CN 113299343 A CN113299343 A CN 113299343A
Authority
CN
China
Prior art keywords
data
dna
caenorhabditis elegans
data dna
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011405329.8A
Other languages
English (en)
Inventor
张晓红
陈卓君
陈安生
国佳欣
靳亚鑫
陈雨茜
王涛
李金金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan Normal University
Original Assignee
Taiyuan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan Normal University filed Critical Taiyuan Normal University
Priority to CN202011405329.8A priority Critical patent/CN113299343A/zh
Publication of CN113299343A publication Critical patent/CN113299343A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明属于生物信息领域,具体涉及一种数据存储方法及数据存储装置。该方法包括:(1)对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;(2)基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;(3)将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;(4)对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的所述秀丽隐杆线虫样品中存储有所述待存储数据。还提供了一种数据存储装置。应用该方法和装置能够准确、便捷、安全、长久地对信息进行存储。

Description

数据存储方法及数据存储装置
技术领域
本发明涉及生物信息领域,具体涉及一种数据存储方法及数据存储装置。
背景技术
随着技术的发展,有关数据的存储变得越来越重要。为了满足大规模的数据存储需求,数据存储介质也在一直变化。数据存储介质经历过穿孔纸带、磁带、机械硬盘、软盘、光盘等时代,发展演变为现在使用的固态驱动器(SSD)、存储级内存(SCM)等。近年来,随着大数据时代的到来,信息数据存储量呈现出持续的爆发性增长。海量数据的产生给传统数据存储方式带来了巨大挑战,数据增长的速度已经远超过单位成本下存储器容量增长的速度,这会导致数据存储成本越来越高。传统数据存储方法需要占用巨大的空间和产生巨大的生产维护能耗,同时作为存储媒介的保存时间相对有限。当前被广泛使用的机械硬盘、固态硬盘、闪存等,预期寿命均在10年左右,且体积较大,维护成本高昂,而且经常会面临着数据丢失的风险。
而随着生物技术的快速发展,以DNA(脱氧核糖核酸)为代表的核酸信息也被发现可以用于表征和记录数据信息。生物领域的DNA编码在数据密度和保存时间方面较现有存储技术具有一定优势。全球每年产生的数据需要4180亿个1TB硬盘,而放到DNA上,只需1kgDNA。而且DNA存储占用空间小、获取容易,储存时间长。DNA存储信息密度极高,且由于其DNA特殊的双螺旋结构,物理化学特性稳定,当避光且湿度温度适宜时,可保存长达1000年。然而如何利用DNA存储信息,还需要进一步研究和改进。
发明内容
在利用DNA样本存储数据信息时,DNA样本的选择对于存储的难易程度以及存储质量等都会产生重要影响。发明人在研究过程中发现,秀丽隐杆线虫所具有的多种特点,使得其可以作为数据存储的良好的生物样本介质。秀丽隐杆线虫个体小,整个生命周期中通体均透明,易于观察。饲养空间小,培养条件简单,成本低,极易操作。繁殖快,生活史周期短;合成DNA导入便捷,线虫无毒、无害,可长期保存,而无不良影响,冷冻虫体室温复苏即可。秀丽隐杆线虫的上述特点使得其在DNA的存储方面有极大优势。通过对原始数据进行数字与碱基对之间密码转换,以转换且编辑好的碱基序列合成DNA,通过虫体体表进行DNA导入(避免了通过质粒转染技术难度、成本高的缺点),虫体细胞间存在信号传递,可通过细胞传递进行细胞间DNA传递导入,最终导入生殖细胞,外源DNA可以染色体外基因形式(多拷贝游离型DNA)存在进行母代多个体数据储存,也可整合到染色体上进行传代大批量生产。而且秀丽隐杆线虫的存储量大,单个成熟雌雄同体成虫可备份2959(细胞)份(959体细胞+2000生殖细胞),多个虫体备份或传代备份数量将基数增长。同时,在信息保存时,对于秀丽隐杆线虫的发育状态不做特殊要求,使得保存起来非常容易,可将DNA导入到秀丽隐杆线虫成虫虫体、处于L2阶段的幼虫、处于L3阶段的幼虫、L4阶段的幼虫等处于不同阶段的秀丽隐杆线虫体内。而且保存手段也多种多样,可以通过冷冻,也可以干制。还可以将冷冻复苏后的虫体进行自体繁殖进行数据传递扩增。而且数据提取方便,可取成虫、卵、各阶段幼虫进行DNA提取、原合成(数据)DNA的PCR扩增、复原数字与碱基对之间密码转换,而获得原始存储数据。
为此,本发明利用秀丽隐杆线虫提供了一种数据存储方法,其通过将待存储的数据编译为对应碱基密码,PCR扩增合成碱基(数据DNA)序列,然后将数据DNA导入到虫体细胞内,同时可以监测导入数据DNA效果,保存虫体实现数据的保存本发明所提供的方法能最大程度的保证数据存储信息的准确、便捷、安全、长久。在需要这些数据时,只需要从秀丽隐杆线虫虫体内提取DNA,PCR扩增转译碱基序列为二进制或四进制密码,获得原始保存数据即可。
具体而言,本发明提供了如下技术方案:
在本发明的第一方面,本发明提供了一种数据存储方法,包括:
(1)对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;
(2)基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;
(3)将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;
(4)对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的秀丽隐杆线虫样品中存储有所述待存储数据。
根据本发明的实施例,以上所述的数据存储方法可以进一步包括如下技术特征:
进一步地,以上所述的数据存储方法还包括:
(5)对所述经保存的所述秀丽隐杆线虫样品中的DNA进行提取处理,以便获得所述数据DNA;
(6)将所述数据DNA中含有的所述碱基序列信息进行转译处理,以便获得存储数据的信息。
进一步地,步骤(1)中所述编译处理基于二进制或者四进制进行。
其中,步骤(3)基于下述方法中的任意一种获得含有数据DNA的秀丽隐杆线虫:
(i)将秀丽隐杆线虫成熟成虫或幼虫浸泡在含有数据DNA的溶液中,以便获得含有数据DNA的秀丽隐杆线虫;
(ii)将数据DNA导入大肠杆菌DNA中,所获得的重组大肠杆菌饲喂秀丽隐杆线虫,以便获得含有数据DNA的秀丽隐杆线虫;
(iii)基于显微注射法将所述数据DNA导入秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫。
根据本发明的实施例,方法(ii)中所用到的大肠杆菌可以为OP50。根据本发明的实施例,步骤(iii)中所用到的显微注射法可以为简单的显微注射法,例如针扎法。
将外源基因导入到秀丽隐杆线虫体内非常便捷,而且经导入的外源DNA还可以通过细胞传递。外源基因通过体表、针扎注射或饲喂大肠杆菌(OP50)可被秀丽隐杆线虫细胞吸收,如用微米级的玻璃微管注射或针扎入性腺、肠道、体液的DNA可被成熟的卵细胞、肠道细胞、体璧细胞吸收;或把线虫浸泡到含有外源DNA的溶液中,就可以用这种最简单的方式实现外源基因导入,且细胞与细胞之间存在细胞信号传递使其他细胞中基因导入,直至生殖细胞。注射、饲喂和体表导入体内的DNA即以染色体外遗传物质的形式存在(保存DNA存储信息,不会带来生物安全问题),1只线虫可完成DNA存储信息595(体细胞)+2000(生殖细胞)份存储。如需更大量的存储,可多只线虫同时存储,或线虫进行自体繁殖完成传代存储。由于染色体外的DNA片段(多拷贝游离型DNA)在有丝分裂时有一定几率的丢失,会随着线虫传代次数的增加而丢失,即多代遗传不稳定。因此如需多代传递扩增存储可将目的DNA片段整合到染色体上,得到稳定的表达种系实现更大量(595+2000)x300 xN的备份数量)的存储。即在饲喂已有数据DNA的大肠杆菌(OP50)或简单显微注射数据DNA的基础上进行X射线照射或光敏剂补骨脂素加长波紫外线照射(TMP/UV integration),将目的(数据)DNA片段整合到染色体上,形成稳定的整合型基因线虫,实现数据DNA精准传代扩增存储。传代繁殖时可将导入数据DNA的线虫置于加有大肠杆菌OP50的培养板上(或培养液中),室温避光培养5h,使线虫活力恢复,挑取15~25只状态较好的P0代个体,每板1只培养,(或固体培养基切块转移、液体培养基滤纸转移线虫培养),等待大肠杆菌被吃完,挑100~300只F2代,每板1只培养。分别收集培养各阶段P0代、F2代、F4代及各阶段L2-L4幼虫检测是否全部精准传递数据DNA。
进一步地,步骤(4)中根据需要基于下述方法中的任意一种进行所述保存处理:
(a)将所述含有数据DNA的秀丽隐杆线虫的成虫进行冷冻或干制处理;该方法适宜于线虫母代数据存储。
(b)对所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集卵进行冷冻储存;该方法适宜于用卵细胞或者卵细胞传代存储数据。
(c)将所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集L1、L2、L3或L4阶段幼虫,进行冷冻储存;该方法适宜于选择幼虫存储数据。
(d)将所述数据DNA导入到处于L2阶段的秀丽隐杆线虫幼虫体内,并进行滞育处理和冷冻储存;该方法适宜于环境不利时以L2阶段的秀丽隐杆线虫进行数据存储。
(e)对经冷冻的处于L2阶段的秀丽隐杆线虫幼虫进行室温复苏,收集L2、或由L2发育的L3或L4阶段幼虫,进行储存;该方法适宜于选择复苏L2滞育幼虫及后续发育阶段幼虫存储数据;
(f)室温复苏冷冻带有数据DNA的线虫成虫,线虫自体繁殖,循环(b)、(c)、(d),进行数据DNA储存。该方法适宜于线虫传代数据存储。
秀丽隐杆线虫繁殖快、生命史周期很短,处在各个阶段的秀丽隐杆线虫都可以用来作为外源DNA导入的介质材料。秀丽隐杆线虫从卵孵化到性成熟的全过程只有3.5天,成虫寿命2-3周。秀丽隐杆线虫大部分是XX型雌雄同体,可自体受精,产卵300-350个,光滑的卵排成一排。每500个线虫有1个XO型的雄体,仅占群体的0.2%,雄性个体存在时,雌雄同体会优先选择雄性的精子,此时产卵可达1400个以上。20℃下,卵孵化后45-50小时变成成熟的雌雄同体个体,并产下第一个卵。其卵至成虫发育过程经历L1-L4四个幼虫期,在L4期生产精子。在L2幼虫期末期,L2幼虫正常情况下可进入L3幼虫,当食物短缺、个体密度过大或环境不良时,L3、L4幼虫和成虫会死亡,而L2幼虫则进入滞育期(dauer)以度过困境,Dauer幼虫能对抗逆境,且不会老化,在无食物下约可存活6到10天,dauer期的长短并不会影响dauer期后的虫体寿命,滞育时期约二个月。当食物、环境好转,食物供应一个小时内dauer幼虫脱离滞育,2-3个小时后开始进食,进入L3幼虫期,最后在10个小时后会蜕皮进入L4幼虫期。
在本发明的第二方面,本发明提供了一种数据存储装置,包括:
编译模块,所述编译模块对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;
数据DNA获得模块,所述数据DNA获得模块与所述编译模块相连,所述数据DNA获得模块基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;
转化模块,所述转化模块与所述数据DNA获得模块相连,所述转化模块用于将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;
存储模块,所述存储模块与所述转化模块相连,所述存储模块用于对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的所述秀丽隐杆线虫样品中存储有所述待存储数据;
根据本发明的实施例,以上所述的数据存储装置还可以进一步包括如下技术特征:
进一步地,所述编译模块中基于二进制或者四进制进行所述编译处理。
在一些实施例中,以上所述的数据存储装置,进一步包括:
数据DNA提取模块,所述数据DNA提取模块与所述存储模块相连,所述数据DNA提取模块用于对所述经保存的所述秀丽隐杆线虫样品中的DNA进行提取处理,以便获得所述数据DNA;
转译模块,所述转译模块与所述数据DNA提取模块相连,所述转译模块用于将所述数据DNA中含有的所述碱基序列信息进行转译处理,以便获得存储数据的信息。
进一步地,所述转化模块中基于下述方法中至少一种获得含有数据DNA的秀丽隐杆线虫:
(i)将秀丽隐杆线虫成熟成虫或幼虫浸泡在含有数据DNA的溶液中,以便获得含有数据DNA的秀丽隐杆线虫;
(ii)将数据DNA导入大肠杆菌DNA中,所获得的重组大肠杆菌饲喂秀丽隐杆线虫,以便获得含有数据DNA的秀丽隐杆线虫;
(iii)基于显微注射法将所述数据DNA导入秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫。
进一步地,所述存储模块基于下述方法中的至少一种进行所述保存处理:(a)将所述含有数据DNA的秀丽隐杆线虫的成虫进行冷冻或干制处理;(b)对所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集卵进行冷冻储存;(c)将所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集L1、L2、L3或L4阶段幼虫,进行冷冻储存;(d)将所述数据DNA导入到处于L2阶段的秀丽隐杆线虫幼虫体内,并进行滞育处理和冷冻储存;(e)对经冷冻的处于L2阶段的秀丽隐杆线虫幼虫进行室温复苏,收集L2、或由L2发育的L3或L4阶段幼虫,进行储存;(f)复苏冷冻带有数据DNA的线虫成虫,线虫自体繁殖,循环(b)、(c)、(d),进行数据DNA储存。秀丽隐杆线虫保存起来非常方便,秀丽隐杆线虫可以像动物细胞培养一样储存在-80℃冰箱或液氮中长期冻存,需要时随时室温复苏,这就为保存各种带有DNA信息背景的秀丽线虫株系提供了极大的便利;也可以经过干制保存;而且冷冻复苏后还可以通过自体繁殖使存储信息传递扩增。
在本发明的第三方面,本发明提供了一种秀丽隐杆线虫,所述秀丽隐杆线虫中存储有数据DNA,所述数据DNA基于外源数据信息编译的碱基数据信息,经PCR扩增形成;
所述秀丽隐杆线虫基于下述方法获得:
(1)对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;
(2)基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;
(3)将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫。
本发明所取得的有益效果为:
(1)本发明采用的秀丽隐杆线虫易于培养、繁殖率高、生活史周期短,存储信息量大。避免了细胞培养技术要求高、操作难度大、环境条件不易控制、易受污染,而使所存储的信息丢失之弊端。
(2)本发明采用的秀丽隐杆线虫数据DNA导入细胞简单。可以直接将虫体浸泡于数据DNA溶液中即可完成数据DNA导入细胞,使数据直接进入细胞进行存储;从而可避免通过噬菌体转染导入其他微生物细胞所带来的高技术、高难度、高费用问题。
(3)本发明最大程度的保证数据存储量。存入数据DNA的线虫,可通过细胞准确传递数据DNA而导入别的细胞,且短时间内可有多细胞同时存储,而不必通过微生物细胞培养实现。
(4)本发明使数据存储安全、简便。本发明存入数据DNA的线虫,可通过冷冻、干制成体、幼虫多种形式保存。数据DNA单次导入,多细胞、多个体多次读取。虫体保存安全,保存条件简易,常人可操作。
(5)本发明数据存储扩增容易。本发明存入数据DNA的线虫,1只线虫内备份数量大,且可在短时间内培养繁殖获得大量卵、幼虫,使数据DNA存储短时间内迅速扩大。
(6)本发明数据提取方便。根据需要提取数据DNA时,可选择线虫成体、幼虫或卵提取DNA,常规PCR扩增、测序,转译碱基密码为二进制或四进制密码可迅速获得数据。解决当前合成DNA存储设备访问速度慢,存储和读取数据都很费时之不足。
(7)本发明数据存储保证生物安全。本发明导入线虫的数据DNA,可以外源DNA形式(游离型)存储于线虫DNA外,不与线虫DNA重组,避免带来生物安全问题。
附图说明
图1是根据本发明的实施例提供的一种数据存储装置的结构示意图。
图2是根据本发明的实施例提供的一种数据存储装置的结构示意图。
图3是根据本发明的实施例提供的秀丽隐杆线虫在NGM(Nematode GrowthMedium)固体培养基上的解剖镜图。
图4是根据本发明的实施例提供的秀丽隐杆线虫在显微镜下的形态图。
具体实施方式
秀丽隐杆线虫(Caenorhabditis elegans)属于线虫门(Phylum nematoda)、侧尾腺纲(Secernentea)、小杆线虫目(Rhabditida)小杆线虫科(Rhabditidae)小杆线虫属(Caenorhabditis)。本文中所用到的秀丽隐杆线虫不做特殊要求,已有的秀丽隐杆线虫均可以作为数据DNA存储的生物材料。野生型秀丽隐杆线虫可从土壤筛选获得,也可以直接购买获得;还有很多科研用株系主要来自美国(NCRR)支持的Caenorhabditis GeneticsCenter(CGC,University of Minnesota,Minneapolis,MN),由NIH资助的线虫种质中心(CGC)贮藏了大量的线虫品系,免费分发给世界各地的研究者。秀丽隐杆线虫具有多种优点,线虫个体小,材料易得,易于培养,结构简单、繁殖率高,生活史短,基因组测序完成、可进行活体冻存和室温复苏。世界范围内科学家已将线虫作为分子生物学、遗传学、基因组学、发育生物学研究领域的“全能”模式生物。这些优点使得秀丽隐杆线虫能够作为数据DNA存储的优良介质,表现为:
个体小、材料易得、易于培养。秀丽隐杆线虫个体小,成虫体长1-1.5mm,直径0.5mm。秀丽隐杆线虫是一种无毒无害,自由生活的多细胞真核生物,秀丽隐杆线虫以微生物细菌为食,培养时采用标准的线虫固体培养基(NGM)平板培养,50mm培养皿内可以培养数百个,96孔板效率更高,可选择16℃、20℃、25℃温度下培养(温度高繁殖快),只需在NGM平板上涂喂大肠杆菌(尿嘧啶缺陷型OP50)即可,培养的虫体可被冻存,室温复苏后即可使用。
繁殖快、生命史周期很短。秀丽隐杆线虫从卵孵化到性成熟的全过程只有3.5天,成虫寿命2-3周。秀丽隐杆线虫大部分是XX型雌雄同体,可自体受精,产卵300-350个,光滑的卵排成一排。每500个线虫有1个XO型的雄体,仅占群体的0.2%,雄性个体存在时,雌雄同体会优先选择雄性的精子,此时产卵可达1400个以上。20℃下,卵孵化后45-50小时变成成熟的雌雄同体个体,并产下第一个卵。其卵至成虫发育过程经历L1-L4四个幼虫期,在L4期生产精子。在L2幼虫期末期,L2幼虫正常情况下可进入L3幼虫,当食物短缺、个体密度大或环境不良时,L3、L4幼虫和成虫会死亡,而L2幼虫则进入滞育期(dauer)以度过困境,Dauer幼虫能对抗逆境,且不会老化,在无食物下约可存活6到10天,dauer期的长短并不会影响dauer期后的虫体寿命,滞育时期约二个月。当食物、环境好转,食物供应一个小时内dauer幼虫脱离滞育,2-3个小时后开始进食,进入L3幼虫期,最后在10个小时后会蜕皮进入L4幼虫期。
细胞数恒定。秀丽隐杆线虫生活周期各阶段通体均透明,不需染色,解剖镜、显微镜下即可观察到线虫体内的器官如肠道、生殖腺(线虫肠道、生殖腺皆为管状)。秀丽隐杆线虫卵裂(asymmetric)先分裂成5个始祖细胞后各个细胞再分化成线虫的各部分,幼虫含有556个体细胞和2个原始生殖细胞,雌雄同体成虫有959个体细胞和2000个生殖细胞,雄成虫有1031个和1000个生殖细胞。由胚胎发育到成体,始终保持着固定的体细胞数目,不会有变化,且特定细胞位置、细胞命运固定,胚胎期即设置好的胚细胞于4个阶段的幼虫期,以时间及空间规划几乎不变的模式进行分裂,是生物界唯一一个身体中的所有细胞,能被逐个盘点并各归其类的生物。细胞世系的规律在各个个体之间也是几乎不变的,已建立完整的从受精卵到所有成体细胞的谱系图。细胞一旦分化结束后,既是受伤细胞也不会再生。
基因组非常的小。秀丽隐杆线虫有8×107bp分布于6条染色体上,约为人类基因组的3%,约有13500个基因。其全基因组编码约20000个基因,线虫的基因组的80%是单拷贝序列,剩余20%的序列是以2-10重复序列存在,含有300个Tc1转座子,利用重复PCR能够有效制备特定片段大小的DNA分子量标准。
基因导入便捷,通过细胞传递。自体繁殖线虫基因型进行稳定遗传,不会变,雌雄交配为在线虫中引入其它的基因型而进行杂交,提供便利。外源基因通过体表、饲喂大肠杆菌(OP50)或显微注射可被任何细胞吸收,如用微米级的玻璃微管注射入肠道、性腺的DNA可被肠道及成熟的卵细胞吸收;或把线虫浸泡到含有外源DNA的溶液中,就可以用这种最简单的方式实现外源基因导入。线虫是生物界目前发现的唯一的“种”DNA得DNA,“种”RNA得RNA的生物,及可通过细胞与细胞之间存在细胞信号传递使其他细胞中基因导入,直至生殖细胞。简单的针扎注射和体表浸泡导入体内的DNA即以染色体外遗传物质的形式存在(仅保存DNA存储信息,不会带来生物安全问题),1只线虫可完成DNA存储信息595(体细胞)+2000(生殖细胞)份存储。另外,在饲喂已有数据DNA的大肠杆菌(OP50)或简单显微注射数据DNA的基础上进行X射线照射或光敏剂补骨脂素加长波紫外线照射(TMP/UV integration),将目的(数据)DNA片段整合到染色体上,形成稳定的整合型基因线虫,实现数据DNA精准传代扩增存储。传代繁殖时可将导入数据DNA的线虫置于加有大肠杆菌OP50的培养板上(或培养液中),室温避光培养5h,使线虫活力恢复,挑取15~25只状态较好的P0代个体,每板1只培养,(或固体培养基切块转移、液体培养基滤纸转移线虫培养),等待大肠杆菌被吃完,挑100~300只F2代,每板1只培养。分别收集培养各阶段P0代、F2代、F4代及各阶段L2-L4幼虫检测是否全部精准传递数据DNA。
保存容易。秀丽隐杆线虫可以像动物细胞培养一样可长期储存在-80℃冰箱或液氮中,也可以直接干制保存。这就为保存各种带有DNA信息背景的秀丽线虫株系提供了极大的便利,室温复苏后通过自体繁殖使存储信息扩增。
信息容易监测。母代存储可通过提取DNA、PCR扩增、基因检测等步骤来检测信息存储与否。对于能在某些细胞中表达荧光蛋白的线虫品系,可通过荧光标记法,显微镜检测外源基因表达蛋白存在情况,可知外源DNA存储状态。
为了方便本领域技术人员理解,对于本文中的某些术语进行解释和说明,需要说明的是,这些解释和说明不应看作是对本发明保护范围的限制。
本文中,所提到的“数据DNA”是指携带有待存储数据信息的DNA。
本文中,所提到的“编译”做本领域通常理解,是利用编译程序从源语言编写的源程序产生目标程序的过程;具体是指利用将待存储的数据转换为碱基序列信息的过程。例如将计算机程序所识别的二进制语言转换为碱基序列信息。
本文中,术语“转译”和“编译”互为两个相反的方向,指的是将碱基序列信息与存储数据相互翻译的过程。
在本发明的一个方面,本发明提供了一种数据存储方法,包括:(1)对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;(2)基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;(3)将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;(4)对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的所述秀丽隐杆线虫样品中存储有所述待存储数据。本发明所提供的方法能最大程度的保证数据DAN存储信息的准确、便捷、安全、长久。
根据本发明的实施例,可以基于二进制或者四进制进行编译处理。例如,在基于二进制进行编译处理时,可以将计算机的二进制语言0,1转换为对应ATCG的碱基序列密码。具体地,把0转为A或C,把1转成G或者T,并建立DNA链来维系这些编码的顺序和位置。再例如,在基于四进制进行编译处理时,可以将四进制语言00,01,10,11转换为对应ATCG的碱基序列密码。具体地,例如可以将00转A,01转成T,10转成C,11转成G,诸如此推。本文中所提到的编译处理,可以基于已有的编译处理原则进行。例如,可以基于已有的二进制或者四进制编译规则进行编译,从而保证编译的精准性。
根据本发明的实施例,步骤(2)中在基于所述碱基序列信息进行PCR扩增时,可以通过将碱基序列信息分割为易于PCR的小片段,然后设计引物,对不同小片段的碱基序列进行PCR扩增。同时,为了进一步提高PCR扩增的准确性,还可以利用计算机软件对错误碱基进行纠错,以合成数据DNA。可以自己合成,也可以委托基因编辑公司或者基因测序公司等合成相应的序列。
根据本发明的实施例,以上所提供的数据存储方法还可以进一步包括步骤(5)和步骤(6);其中步骤(5)对所述经保存的所述秀丽隐杆线虫样品中的DNA进行提取处理,以便获得所述数据DNA;步骤(6)将所述数据DNA中含有的所述碱基序列信息进行转译处理,以便获得存储数据的信息。根据本发明的实施例,步骤(5)中可以设计引物提取DNA,并进行PCR扩增获得原始DNA,同时为了进一步提高PCR扩增的准确性,还可以利用计算机软件对错误碱基进行纠错。所提取的数据DNA可以通过测序获得数据DNA上的碱基序列信息;然后通过对这些碱基序列信息进行转译处理,获得存储数据的信息。本文中所提到的转译处理,作为编译处理的逆过程,可以基于已有的转译处理的规则进行,例如二进制或者四进制转译规则进行,从而保证准确提取存在于碱基序列中的存储数据的信息。
在本发明的另一方面,本发明提供了一种数据存储装置,如图1所示,包括:编译模块,所述编译模块对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;数据DNA获得模块,所述数据DNA获得模块与所述编译模块相连,所述数据DNA获得模块基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;转化模块,所述转化模块与所述数据DNA获得模块相连,所述转化模块用于将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;存储模块,所述存储模块与所述转化模块相连,所述存储模块用于对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的所述秀丽隐杆线虫样品中存储有所述待存储数据;
根据本发明的实施例,所提供的数据存储装置如图2所示,还可以包括数据DNA提取模块和转译模块。所述数据DNA提取模块与所述存储模块相连,所述数据DNA提取模块用于对所述经保存的所述秀丽隐杆线虫样品中的DNA进行提取处理,以便获得所述数据DNA;所述转译模块与所述数据DNA提取模块相连,所述转译模块用于将所述数据DNA中含有的所述碱基序列信息进行转译处理,以便获得存储数据的信息。
通过本发明提供的数据存储方法或者数据存储装置,能够高效、准确地实现数据的长久保存。根据本发明的实施例,存储前数据和存储后数据进行比对,数据存储的准确性至少能够达到99.5%以上,例如在99.6%以上,在99.7%以上,或者在99.8%以上。根据本发明的优选实施例,数据存储的准确性至少能够达到99.9%以上,例如在99.95%以上,99.96%以上,99.97%以上,99.98%以上,99.99%以上,甚至是99.9999%以上。更多的是能够100%实现数据的存储和保存。
下面详细描述本发明的实施例,需要说明的是,所描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。未提及的,采用本领域通用的方法或者仪器进行。
实施例1
实施例1提供了一种利用秀丽隐杆线虫进行数据存储的方法,包括以下步骤:
(1)编译:对所要存储的数据如图书、图片、视频等进行二进制0,1编译,并转换为对应ATCG相应碱基序列密码。
(2)合成数据DNA:以PCR扩增需要将编译好的过长的碱基序列分割成不同片段,设计不同片段引物,并对错误碱基进行纠错,进行数据DNA合成,合成数据DNA所用试剂为市售的合成DNA所需试剂盒,其中Taq DNA聚合酶为高保真酶,DNA合成由基因公司合成。
(3)线虫培养:
配置秀丽隐杆线虫琼脂固体培养基于培养皿(为线虫常规培养基配方),无菌下,在培养皿上涂大肠杆菌OP50,挑选15~25只状态较好的线虫放于培养皿中,20℃下培养。其中秀丽隐杆线虫的培养图如图3所示。其中秀丽隐杆线虫购自于Caenorhabditis GeneticsCenter(CGC)。
(4)数据DNA导入:
取秀丽隐杆线虫的成熟成虫放于合成好的数据DNA溶液中,使数据DNA导入秀丽隐杆线虫细胞中。
(5)数据DNA存储:
将获得的含有数据DNA的秀丽隐杆线虫成虫进行冷冻处理,进行数据DNA储存。
(6)从秀丽隐杆线虫中提取数据DNA:
对冷冻处理的秀丽隐杆线虫成虫进行复苏处理,然后提取DNA,数据DNA引物合成,PCR扩增,测序。
所用DNA提取和PCR扩增常规试剂为市售试剂盒,其中Taq DNA聚合酶为高保真酶,测序由基因公司完成。
(7)转译:将数据DNA碱基ATCG密码转译为相应二进制0,1密码,获得存储的图书、图片、视频数据等。
其中,图3是根据本发明的实施例提供的秀丽隐杆线虫在NGM(Nematode GrowthMedium)固体培养基上的解剖镜图。图4是根据本发明的实施例提供的秀丽隐杆线虫在显微镜下的形态图。
实验通过对比存储前的数据和经过秀丽隐杆线虫存储后的数据,结果表明,能够100%保持存储数据的完整性以及准确性。
实施例2
实施例2提供了一种数据存储方法,与实施例11的不同之处在于:
将数据DNA按照本领域常规的方法与大肠杆菌(OP50)DNA重组,重组所需的酶为市售连接酶,获得重组的大肠杆菌。然后将重组的大肠杆菌投喂秀丽隐杆线虫,使数据DNA导入线虫细胞。
实验通过对比存储前的数据和经过秀丽隐杆线虫存储后的数据,结果表明,能够100%保持存储数据的完整性以及准确性。
实施例3
实施例3提供了一种数据存储方法,与实施例1-1的不同之处在于:
用简单显微注射法将数据DNA导入到线虫体内。
实验通过对比存储前的数据和经过秀丽隐杆线虫存储后的数据,结果表明,能够100%保持存储数据的完整性以及准确性。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种数据存储方法,其特征在于,包括:
(1)对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;
(2)基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;
(3)将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;
(4)对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的所述秀丽隐杆线虫样品中存储有所述待存储数据。
2.根据权利要求1所述的数据存储方法,其特征在于,进一步包括:
(5)对所述经保存的所述秀丽隐杆线虫样品中的DNA进行提取处理,以便获得所述数据DNA;
(6)对所述数据DNA中含有的所述碱基序列信息进行转译处理,以便获得存储数据的信息。
3.根据权利要求1或2所述的数据存储方法,其特征在于,步骤(1)中所述编译处理基于二进制或者四进制进行。
4.根据权利要求1或2所述的数据存储方法,其特征在于,步骤(3)中根据需要基于下述方法中的任意一种获得含有数据DNA的秀丽隐杆线虫:
(i)将秀丽隐杆线虫成熟成虫或幼虫浸泡在含有数据DNA的溶液中,以便获得含有数据DNA的秀丽隐杆线虫;
(ii)将数据DNA导入大肠杆菌DNA中,所获得的重组大肠杆菌饲喂秀丽隐杆线虫,以便获得含有数据DNA的秀丽隐杆线虫;
(iii)基于显微注射法将所述数据DNA导入秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫。
5.根据权利要求1或2所述的数据存储方法,其特征在于,步骤(4)根据需要基于下述方法中的任意一种进行所述保存处理:
(a)将所述含有数据DNA的秀丽隐杆线虫的成虫进行冷冻或干制处理;
(b)对所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集卵进行冷冻储存;
(c)将所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集L1、L2、L3或L4阶段幼虫,进行冷冻储存;
(d)将所述数据DNA导入到处于L2阶段的秀丽隐杆线虫幼虫体内,并进行滞育处理和冷冻储存;
(e)对经冷冻的处于L2阶段的秀丽隐杆线虫幼虫进行室温复苏,收集L2、或由L2发育的L3或L4阶段幼虫,进行储存;
(f)室温复苏冷冻带有数据DNA的线虫成虫,线虫自体繁殖,循环所述(b)、(c)、(d),进行数据DNA储存。
6.一种数据存储装置,其特征在于,包括:
编译模块,所述编译模块对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;
数据DNA获得模块,所述数据DNA获得模块与所述编译模块相连,所述数据DNA获得模块基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;
转化模块,所述转化模块与所述数据DNA获得模块相连,所述转化模块用于将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫;
存储模块,所述存储模块与所述转化模块相连,所述存储模块用于对所述含有数据DNA的秀丽隐杆线虫进行保存处理,经保存的所述秀丽隐杆线虫样品中存储有所述待存储数据;
任选地,所述编译模块中基于二进制或者四进制进行所述编译处理。
7.根据权利要求6所述的数据存储装置,其特征在于,进一步包括:
数据DNA提取模块,所述数据DNA提取模块与所述存储模块相连,所述数据DNA提取模块用于对所述经保存的所述秀丽隐杆线虫样品中的DNA进行提取处理,以便获得所述数据DNA;
转译模块,所述转译模块与所述数据DNA提取模块相连,所述转译模块用于将所述数据DNA中含有的所述碱基序列信息进行转译处理,以便获得存储数据的信息。
8.根据权利要求6或7所述的数据存储装置,其特征在于,所述转化模块中根据需要基于下述方法中任意一种获得含有数据DNA的秀丽隐杆线虫:
(i)将秀丽隐杆线虫成熟成虫或幼虫浸泡在含有数据DNA的溶液中,以便获得含有数据DNA的秀丽隐杆线虫;
(ii)将数据DNA导入大肠杆菌DNA中,所获得的重组大肠杆菌饲喂秀丽隐杆线虫,以便获得含有数据DNA的秀丽隐杆线虫;
(iii)基于显微注射法将所述数据DNA导入秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫。
9.根据权利要求6或7所述的数据存储装置,其特征在于,所述存储模块根据需要基于下述方法中的任意一种进行所述保存处理:
(a)将所述含有数据DNA的秀丽隐杆线虫的成虫进行冷冻或干制处理;
(b)对所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集卵进行冷冻储存;
(c)将所述含有数据DNA的秀丽隐杆线虫进行培养和自体繁殖,收集L1、L2、L3或L4阶段幼虫,进行冷冻储存;
(d)将所述数据DNA导入到处于L2阶段的秀丽隐杆线虫幼虫体内,并进行滞育处理和冷冻储存;
(e)对经冷冻的处于L2阶段的秀丽隐杆线虫幼虫进行室温复苏,收集L2、或由L2发育的L3或L4阶段幼虫,进行储存;
(f)室温复苏冷冻带有数据DNA的线虫成虫,线虫自体繁殖,循环(b)、(c)、(d),进行数据DNA储存。
10.一种秀丽隐杆线虫,其特征在于,所述秀丽隐杆线虫中存储有数据DNA;
所述数据DNA基于外源数据信息编译的碱基序列信息,经PCR扩增形成;
所述秀丽隐杆线虫基于下述方法获得:
(1)对待存储数据进行编译处理,以便将所述待存储数据转换为碱基序列信息;
(2)基于所述碱基序列信息,进行PCR扩增,以便获得数据DNA,所述数据DNA中含有所述碱基序列信息;
(3)将所述数据DNA导入到秀丽隐杆线虫体内,以便获得含有数据DNA的秀丽隐杆线虫。
CN202011405329.8A 2020-12-03 2020-12-03 数据存储方法及数据存储装置 Pending CN113299343A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011405329.8A CN113299343A (zh) 2020-12-03 2020-12-03 数据存储方法及数据存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011405329.8A CN113299343A (zh) 2020-12-03 2020-12-03 数据存储方法及数据存储装置

Publications (1)

Publication Number Publication Date
CN113299343A true CN113299343A (zh) 2021-08-24

Family

ID=77318387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011405329.8A Pending CN113299343A (zh) 2020-12-03 2020-12-03 数据存储方法及数据存储装置

Country Status (1)

Country Link
CN (1) CN113299343A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012027446A2 (en) * 2010-08-24 2012-03-01 Mayo Foundation For Medical Education And Research Nucleic acid sequence analysis
CN107798219A (zh) * 2016-08-30 2018-03-13 清华大学 将数据进行生物存储并还原的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012027446A2 (en) * 2010-08-24 2012-03-01 Mayo Foundation For Medical Education And Research Nucleic acid sequence analysis
CN107798219A (zh) * 2016-08-30 2018-03-13 清华大学 将数据进行生物存储并还原的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CEZE L, NIVALA J, STRAUSS K.: "Molecular digital data storage using DNA.", 《NAT REV GENET》, pages 456 - 466 *
王学林,吴秀萍,王诃等主编.: "《分子药理学》", 中国医药科技出版社, pages: 99 *

Similar Documents

Publication Publication Date Title
Meneely et al. Working with worms: Caenorhabditis elegans as a model organism
Kohno et al. Production of knockout mutants by CRISPR/Cas9 in the European honeybee, Apis mellifera L.
Jennings Drosophila–a versatile model in biology & medicine
Schulte et al. Highly efficient integration and expression of piggyBac-derived cassettes in the honeybee (Apis mellifera)
Comizzoli Biobanking and fertility preservation for rare and endangered species
Auerbach Mutation research: problems, results and perspectives
Rembold et al. Transgenesis in fish: efficient selection of transgenic fish by co-injection with a fluorescent reporter construct
Abe et al. Retrotransposable elements on the W chromosome of the silkworm, Bombyx mori
Pavlopoulos et al. Establishing genetic transformation for comparative developmental studies in the crustacean Parhyale hawaiensis
Grbic et al. Shifts in the life history of parasitic wasps correlate with pronounced alterations in early development
Sun et al. The amphipod crustacean Parhyale hawaiensis: an emerging comparative model of arthropod development, evolution, and regeneration
CN105505879B (zh) 一种培养转基因动物胚胎细胞或转基因动物的方法及培养基
CN105274140A (zh) 肌细胞特异表达mCherry荧光蛋白斑马鱼家系构建方法
Roszkowska et al. How long can tardigrades survive in the anhydrobiotic state? A search for tardigrade anhydrobiosis patterns
Poprawa et al. Verification of Hypsibius exemplaris Gąsiorek et al., 2018 (Eutardigrada; Hypsibiidae) application in anhydrobiosis research
Takasu et al. Targeted mutagenesis in Bombyx mori using TALENs
Arezo et al. Annual killifish adaptations to ephemeral environments: diapause I in two Austrolebias species
CN113299343A (zh) 数据存储方法及数据存储装置
Schubiger et al. Nuclear transplantation in Drosophila melanogaster
Liu et al. Ciona intestinalis as an emerging model organism: Its regeneration under controlled conditions and methodology for egg dechorionation
Kim et al. Developmental isolation and subsequent adult behavior of Drosophila paulistorum. I. Survey of the six semispecies
Takahashi et al. Hybrid male sterility between the fresh-and brackish-water types of ninespine stickleback Pungitius pungitius (Pisces, Gasterosteidae)
Li et al. Genetic tools for the study of the mangrove killifish, Kryptolebias marmoratus, an emerging vertebrate model for phenotypic plasticity
CN105440111B (zh) 一对转录激活子样效应因子核酸酶及其编码序列与应用
Goldstein Tardigrades

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination