CN110431148A - 用于dna数据存储的方法和系统 - Google Patents

用于dna数据存储的方法和系统 Download PDF

Info

Publication number
CN110431148A
CN110431148A CN201880016800.9A CN201880016800A CN110431148A CN 110431148 A CN110431148 A CN 110431148A CN 201880016800 A CN201880016800 A CN 201880016800A CN 110431148 A CN110431148 A CN 110431148A
Authority
CN
China
Prior art keywords
dna
sensor
sequence
data
molecular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880016800.9A
Other languages
English (en)
Inventor
巴利·L·迈瑞曼
蒂姆·吉索
保罗·莫拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roswell Life Technologies
Roswell Biotechnologies Inc
Original Assignee
Roswell Life Technologies
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roswell Life Technologies filed Critical Roswell Life Technologies
Publication of CN110431148A publication Critical patent/CN110431148A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/403Cells and electrode assemblies
    • G01N27/414Ion-sensitive or chemical field-effect transistors, i.e. ISFETS or CHEMFETS
    • G01N27/4145Ion-sensitive or chemical field-effect transistors, i.e. ISFETS or CHEMFETS specially adapted for biomolecules, e.g. gate electrode with immobilised receptors
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/305Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
    • C07K14/31Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3271Amperometric enzyme electrodes for analytes in body fluids, e.g. glucose in blood
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3275Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/607Detection means characterised by use of a special device being a sensor, e.g. electrode
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3275Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction
    • G01N27/3276Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction being a hybridisation with immobilised receptors

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Electrochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioethics (AREA)
  • Hematology (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Nanotechnology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

在各个实施例中,一种信息存储系统包括:写入装置,用于合成对成组信息编码的核苷酸序列;读出装置,用于解读核苷酸序列,通过将所解读的核苷酸序列解码为成组信息实现,其中读出装置包括分子电子传感器,该传感器包括一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中分子复合物包括桥联分子和探针分子,并且其中分子电子传感器产生当解读核苷酸序列时在分子电子传感器的可测的电参数中的能够辨别的信号。

Description

用于DNA数据存储的方法和系统
相关申请的交叉引用
本申请要求对于美国临时专利申请序列No.62/444,656(2017年1月10日提交,名称为“用于DNA数据存储的方法、设备和系统”)和美国临时专利申请序列No.62/547,692(2017年8月18日提交,名称为“用于DNA数据存储的分子电子传感器”)的优先权和权益,上述文献的公开内容在此通过引用全文并入本文。
技术领域
本公开内容整体涉及电子数据存储和取回,更特别地涉及一种DNA(脱氧核糖核酸)信息存储和取回系统,包括:用于读出DNA序列的分子传感器、和用于DNA序列二进制转换的编码器/解码器算法。
背景技术
20世纪数字计算机的到来形成对大量数字或二进制数据档案存储的需要。档案存储意在长期装容数据,例如几年、几十年或更长时间,采取成本极低且支持再次访问数据的稀少需要的方式。虽然档案存储系统的特征可以是能够以极低成本保持无限量数据,例如通过能够长期维持休眠的物理存储介质实现,不过这种系统中的数据写入和恢复可能相对较慢或者在其他方面处理成本高。目前已经开发出的档案数字数据存储的主流形式包括:磁带,和更近的光盘(CD)。不过,随着数据产生增长,需要更高密度、更低成本、更长持续时间的档案数字数据存储系统。
已发现,在生物学中,活体基因组DNA用作数字信息档案存储的形式。在物种存在的时间规模上(可延续几千至几百万年),基因组DNA实际上存储了限定物种的基因生物信息。在生物学、物种繁殖和生存中实施的复杂的酶生物化学过程提供了写入、读出和保持这种信息档案的手段。此发现激发如下思路:DNA的基本信息存储能力可用作更通用形式的数字信息的高密度、长时间档案存储的基础。
DNA用于信息存储的吸引力在于:由于分子规模的信息存储产生极高信息密度。在理论上,例如,目前记录的所有人类产生的数字信息估计约为1ZB(泽字节)(~1021字节),可记录在少于1022个DNA碱基(或1摩尔DNA碱基的1/60)中,其将具有仅10克的质量。除了高数据密度以外,DNA还是非常稳定的分子,其可易于持续数千年而没有实质损坏,并可能可持续更长时间,几千年或甚至几百万年,例如天然观察到的在冻土中冻结的或在琥珀中包封的DNA。
发明内容
在各种实施例中,公开一种信息存储系统。在各个方案中,该系统包括:DNA读出装置,数字数据编码/解码算法,DNA写入装置,其中这三种元件的性能共同优化以最小化或减小各种成本指标和增强整体系统性能。在各个方案中,共同优化可包括:通过平衡、避免或校正DNA读出和写入错误而减少系统错误率。在其他情况下,共同优化可包括:减少系统中的DNA读出或写入时间,例如通过避免使用较慢速度的DNA序列基序、和/或通过使用错误校正/避免以补偿由于系统快速操作导致的错误而实现。
在本公开内容的各个实施例中,设置DNA数据读出器用于DNA数据存储系统中。特别地,设置分子传感器,其可提取被适合编码到单个DNA分子内的数字信息。在特定方案中,这样的传感器可为基于高密度芯片的格式,可提供大规模DNA数据存储系统所需的高输出、低成本、快速数据提取能力。在各个示例中,用于读出DNA分子中存储数字数据的传感器直接处理各个编码DNA分子,使得不需要复杂的样本制备,例如制造DNA拷贝或克隆种群。在系统的各个方案中,数据直接存储在合成DNA或DNA类似物(通过有益于数字数据存储的特征合成,不能通过标准的DNA拷贝方法复制)中。
在DNA数据存储系统的各个实施例中,恢复的数据可存储于天然DNA中,此外还可存储于多种不同的DNA类似物或修饰DNA分子中,这提供更多数据写入系统的选择和更有效的数据存储系统。在系统的各个方案中,提取被编码在DNA分子中的信息所需的时间较短,例如,在数秒的量级,基本上能够实现对于数据恢复的短周转时间。在各个方案中,系统可对大范围的DNA分子长度良好执行,例如从短至几十个碱基至几百个碱基、几千个碱基、和大于几万个碱基。这种能力对于DNA写入/合成技术的选择提供了更大的适应性,且不需要在在读出之前进一步制备DNA样本以满足读出数字信息的长度限制。
在本公开内容的各个方案中,用于DNA序列读出的分子传感器可采用高度可扩充的、低成本、CMOS芯片格式,从而提供高效的批量化制造、和低成本系统和设施、和读出DNA中存储数字数据的总体低成本。在各个方案中,从DNA数据中读出艾字节规模数字数据所需的系统和装置非常紧凑且能量高效,以支持本地牢靠部署在现场数据中心和支持高可扩充的基于云的档案数据存储服务。
在各个方案中,根据本公开内容读出DNA中存储的数据,在性能、速度、产量和成本上优于读出传统档案存储格式(例如磁带或光盘)中存档的数据。本DNA数据存储系统的优点是:提供用于DNA数字数据存储系统的实现技术,能够实现实用的艾字节规模存储和泽字节规模存储。
在各种实施例中,DNA档案存储系统的DNA写入装置包括:CMOS芯片,其进一步包括分子电子传感器装置。在其他的情况下,DNA写入装置是CMOS芯片,其包括在像素电极上的电压/电流引导的合成部位。
在各种实施例中,施加于DNA存储档案系统的档案操作的各方面,例如,在分子生物学进程中的拷贝、附加、目标删除、目标读出、和检索,在此公开。
在各种实施例中,一种信息存储系统包括:写入装置,用于合成对成组信息编码的核苷酸序列;读出装置,用于解读该核苷酸序列,通过将该解读的核苷酸序列解码为该成组信息实现;其中,该读出装置包括:分子电子传感器,该传感器包括:一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中,该分子复合物包括桥联分子和探针分子;其中,该分子电子传感器产生当解读该核苷酸序列时在该分子电子传感器的可测的电参数中的能够辨别的信号。
在各个方案中,该成组信息包括二进制数据。在特定方案中,该核苷酸序列包括DNA序列。例如,系统提供DNA分子形式的二进制数据存储,并在希望取回时提供存档数据的提取。
在各种实施例中,系统进一步包括:在该DNA序列内的错误探测方案或错误校正方案中的至少一种。在特定方案中,该错误探测方案选自:重复码、校验位、校验和、循环冗余校验、加密散列函数、汉明码;该错误校正方案选自:自动重传请求、卷积码、分组码、混合自动重传请求、里德所罗门码。
在各种实施例中,系统的该写入装置包括用于DNA合成的致动器像素的基于互补金属氧化物半导体(CMOS)芯片的阵列,该致动器像素引导包括亚磷酰胺或连接化学的DNA合成反应内的电压/电流或光调解的脱保护。
在各种实施例中,该探针分子包括聚合酶,其中该传感器的该可测的电参数通过该聚合酶的酶活性调制。聚合酶可以包括:天然聚合酶或基因工程聚合酶,选自Klenow、Phi29、TAQ、BST、T7,或逆转录酶。
在各种实施例中,系统的该读出装置进一步包括:缓冲溶液、用于测量该可测电参数的操作参数、和DNA模板分子的两个或更多个序列区段,该序列区段当以该多聚酶处理时在通过该缓冲溶液和该操作参数提供的条件下执行时产生在该可测电参数中的能够辨别的信号。在特定方案中,该缓冲溶液包括:修饰脱氧核糖核苷酸三磷酸(dNTP)。在各个方案中,该DNA模板分子的产生该能够辨别的信号的该序列区段包括以下中的任一项或不同项的组合:DNA碱基,修饰DNA碱基,DNA碱基类似物,多碱基序列或基序,或者DNA碱基的均聚物类组。
在各种实施例中,该传感器的该可测电参数包括:在分开的电极之间而且通过该分子复合物的源漏电流。该分子电子传感器可以是CMOS传感器阵列芯片的一部分,其中该CMOS传感器阵列芯片进一步包括多个分子电子传感器并支持执行该可测电参数的测量的像素电路。
在各种实施例中,该分子电子传感器进一步包括:栅电极,其邻近于该分开的电极。在各个方案中,系统中的传感器的该桥联分子包括:双链DNA齐聚物、蛋白质阿尔法螺旋、石墨烯纳米带、碳纳米管、抗体、或抗体的Fab臂。
在各种实施例中,公开一种解读在核苷酸序列中编码的成组信息的方法。该方法包括:将该核苷酸序列供应到分子电子传感器,该分子电子传感器能够产生相关于该成组信息的、在该分子电子传感器的可测的电参数中的能够辨别的信号;生成该能够辨别的信号;将该能够辨别的信号转换为该成组信息;其中,该分子电子传感器包括一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中,该分子复合物包括桥联分子和探针分子。在各个方案中,该成组信息包括二进制数据。在特定方案中,该核苷酸序列包括:DNA序列。
在各种实施例中,公开一种将成组信息编码到核苷酸序列中的方法。该方法包括:提供成组信息;将该成组信息转换为一个或多个预定核苷酸,该预定核苷酸能够使用编码方案产生在分子电子传感器的可测电参数中的能够辨别的信号;将该一个或多个核苷酸组装到该核苷酸序列中。在各个方案中,能够产生能够辨别的信号的该一个或多个预定核苷酸包括:与相同核苷酸的变体相比抵制次级结构形态的核苷酸。
在各种实施例中,转换该成组信息到核苷酸序列中包括:使用二进制编码方案(在此表示为BES)。在各个示例中,该BES包括:BES1、BES2、BES3、BES4、BES5、BES6中的任意一种或多种。
在各种实施例中,该方法中的该分子电子传感器包括一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中,该分子复合物包括桥联分子和探针分子;其中,该分子电子传感器产生当解读该核苷酸序列时在该分子电子传感器的可测的电参数中的能够辨别的信号。在各个方案中,该方法中的该成组信息包括二进制数据。
附图说明
图1例示出DNA信息存储系统的实施例的各元件;
图2例示出初步DNA存储系统信息阶段和过程的总体图;
图3通过示意性显示出完美过程针对在读出和写入DNA时引入错误的过程而例示出对错误补偿的需要;
图4例示出理想错误补偿的实施例;
图5例示出在DNA信息存储系统中的错误的注重成本的管理;
图6例示出理想的错误察觉系统;
图7例示出双路错误补偿的示例;
图8例示出用于整体成本减少/优化的双路成本补偿的示例;
图9例示出成本优化的编码系统的示例性因素;
图10A例示出传感相互作用分子与传感器分子复合物相互作用的分子电子传感电路的基本思路;
图10B例示出基于多聚酶的分子传感器的实施例,用作用于编码到合成DNA分子中的数据的读出器;
图11例示出图10B的基于多聚酶的传感器的实施例,其中,多聚酶轭合到跨越各电极的桥联分子;
图12例示出传感器电路的实施例,其中,多聚酶直接轭合到电流路径中,其中,两个臂分子提供与电极的连接;
图13例示出传感器的实施例,其中,多聚酶直接轭合到电极,而没有臂或桥联分子;
图14显示出一个特定多聚酶分子(E.Coli.多聚酶I的克列诺片段)的三维详细蛋白质结构;
图15例示出分子电子传感器的实施例,其中E.Coli.多聚酶I的克列诺片段轭合到跨越各电极之间间隙的桥联分子;
图16例示出分子电子传感器的实施例,其中E.Coli.多聚酶I的克列诺片段通过使用两个臂分子将多聚酶联结到电极而直接轭合到电流路径中;
图17例示出分子电子传感器的实施例,其中E.Coli.多聚酶I的克列诺片段直接轭合到电流路径中且直接轭合到金属电极,而没有臂或桥联分子;
图18例示出分子传感器的实施例,其在本发明的DNA数据存储系统的各方面中可用作DNA读出装置;
图19例示出检测设施的示意图,其用于在分子传感器上对DNA序列进行电测量,包括后处理到CMOS(互补金属氧化物半导体)像素阵列的像素上的分子传感器;
图20提供电极的三个电子显微(EM)图像(以递增的分辨率),其中,金属金点接触部用于桥接在传感器中;
图21显示出通过以图18的传感器测量DNA包含信号而获得的电流(pA)-时间(秒)图线;
图22例示出当多聚酶处理模板DNA(包括修饰dNTP)时使用修饰dNTP从每个碱基产生增强信号,在此情况下产生四个能够辨别的信号特征;
图23例示出使用两个修饰dNTP(在此为修饰dATP(A*)和dCTP(C*))产生两个能够辨别的包含信号,这样提供将二进制位0/1编码到模板DNA中的方式;
图24例示出使用两个不同序列基序(在此为均聚物AA和CCC)产生两个能够辨别的信号,这样提供将二进制位0/1编码到模板DNA中的方式。在这种情况下,AA和CCC通过两个能够辨别的序列基序,可用于信息编码和恢复。这样,即使没有DNA序列的单个碱基解决方案,可用的信息编码和读出通过可替代地依照能够辨别的序列基序也是可行的。
图25显示出通过图18的传感器的实施例产生的实际实验数据,其中聚A和聚C的特定序列基序产生可用于编码0/1二进制数据的能够辨别的信号;
图26A例示出使用两个不同序列基序GATT和ACA产生两个能够辨别的信号,提供一种方法将二进制位0/1编码到模板DNA中;
图26B例示出使用三个不同序列基序(在此为GATT、ACA、AGG)产生三个能够辨别的信号,这样提供以三状态编码对数字数据编码的方式;
图26C例示的实施例中,当由具有标准dNTP的多聚酶处理时,编码DNA通过碱基类似物(标准修饰碱基X和Y)合成以产生两个能够辨别的信号,这提供以两状态编码对数字数据编码的方式(BES4),例如如图17中所示;
图26D例示的实施例中,当由具有标准dNTP的多聚酶处理时,编码DNA通过8种不同碱基和碱基类似物(标准A、C、G、T和修饰碱基X、Y、Z、W)合成以产生8个能够辨别的信号,这提供以8状态编码对数字数据编码的方式,例如如图29中的方案BES5所示;
图27A提出不同的引物构造,可用于信息编码DNA,使得模板可按照正确引发形式呈现以接合于传感器的多聚酶;
图27B提出DNA模板链构造的实施例,其能够使基于多聚酶的传感器多次询问相同DNA数据载荷;
图28示意性例示出物理DNA结构如何与DNA数据存储分子的逻辑结构相关;
图29提出可用于将二进制数据载荷编码到DNA序列中的二进制数据编码方案的各种实施例,包括:用于将数据载荷体现为DNA序列的二进制编码方案(BES)以及在数字数据与编码DNA序列之间初步翻译的示例;
图30A例示出可用于将各个DNA读出传感器以规模化并行阵列的形式设置在芯片上的制造堆叠的实施例;
图30B例示出高级CMOS芯片像素阵列的实施例和阵列中分子电子传感器电路像素的细节;
图31显示出图30的像素电路的电路示意图和模拟测量;
图32例示出注释芯片设计布局文件的实施例和用于比较的对应完成芯片的光学显微图像;
图33显示出图32的制成芯片的SEM图像,包括更大分辨率的SEM图像的套图,显示出像素和纳米电极,其中多聚酶分子复合物就位;
图34显示出用于以基于芯片的DNA读出传感器读出DNA数据的完整系统的示意图;
图35显示出基于云的DNA数据档案存储系统的实施例的示意图,其中,多个图34的DNA读出系统聚集以提供数据读出服务器;
图36例示出DNA数据读出传感器的可替代实施例,其中多聚酶与纳米孔离子电流传感器复合,在处理DNA时产生在纳米孔离子电流中能够辨别的信号特征;
图37显示出DNA数据读出传感器的实施例,其中,多聚酶与纳米孔离子电流传感器复合,其中多聚酶直接轭合到纳米孔,且其中dNTP通过与孔离子电流相互作用并在合并过程中改变孔离子电流的基团进行修饰;
图38例示出DNA数据读出传感器的实施例,其中多聚酶与碳纳米管分子线跨越正、负电极复合,在测得的经过碳纳米管的电流中产生能够辨别的信号特征;
图39例示出零模式波导传感器与单一多聚酶复合(以截面图显示),产生对应于DNA特征的能够辨别的光学信号。
具体实施方式
在各种实施例中,公开一种DNA数据存储系统,利用DNA分子作为数字信息存储的通常目的方式。在特定方面,一种用于数字信息存储的系统包括:DNA读出装置;信息编码/解码算法,和DNA写入装置。在其他方面,公开这三种因素的相互关系及其共同优化。
在各种实施例中,公开一种用于DNA数据存储系统的数据读出器。在各种方面,DNA读出装置包括:传感器,其从单个DNA分子中提取信息。传感器可按基于芯片的形式部署。在各种示例中,公开了支持这种基于芯片的传感器装置的数据读出系统。
定义
如本文中所用,术语“DNA”是指生物DNA分子和合成形式,例如,通过核苷酸亚磷酰胺化学、连接化学或其他有机合成方法制成。如本文中所用的DNA也是指对碱基、糖、和/或骨干的化学修饰形式,例如在核酸生物化学中本领域技术人员已知的那样。这些包括但不限于:甲基化碱基、腺苷酸化碱基、其他表观遗传标记碱基、和非标准或通用的碱基,例如肌苷或3-硝基吡咯,或其他核苷酸类似物,或ribo碱基,或脱碱基位点,或受损位点。DNA还广义地是指DNA类似物,例如肽核酸(PNA)、锁核酸(LNA),等等,包括在生物化学上相似的RNA(核糖核酸)分子及其合成和修饰形式。所有这些在生物化学上紧密相关的形式,在本文中的用于DNA数据存储系统中的数据存储分子的应用环境中,通过使用术语DNA暗示。进一步地,术语DNA在此包括单链形式、双螺旋或双链形式、杂化双链形式、包含失配或非标准碱基对的形式、非标准螺旋形式(例如三链形式)、和部分双链的分子(例如单链DNA结合于寡引物)、或具有发夹次级结构的分子。通常,如在此所用,术语DNA是指一种分子,其包括单链部件,可用作聚合酶的模板以合成与其互补的链。
如在此写入的DNA序列(例如GATTACA)是指沿5’至3’取向的DNA,除非另外指明。例如,如在此写入的GATTACA表示单链DNA分子5’-G-A-T-T-A-C-A-3’。通常,在此所用的惯例遵照在分子生物学领域中所用的对写入DNA序列的标准惯例。
如在此所用,术语“多聚酶/聚合酶”是指一种酶,对于模板DNA或RNA链通过合并DNA或DNA类似物或者RNA或RNA类似物而催化形成核苷酸链。术语多聚酶/聚合酶包括但不限于:宽泛类型和突变形式的DNA多聚酶/聚合酶(例如Klenow、E.Coli Pol I、Bst、Taq、Phi29、T7)、宽泛类型和突变形式的RNA多聚酶/聚合酶(例如T7、RNA Pol I)、宽泛类型和突变的逆转录酶(其对RNA模板操作以产生DNA,例如AMV和MMLV)。
如在此所用,术语“dNTP”是指标准的天然出现的核苷三磷酸(用于生物合成DNA,即,dATP、dCTP、dGTP、dTTP)和它们的天然或合成的类似物或修饰形式,包括承载碱基修饰结构、糖修饰结构、或磷酸基修饰结构(例如α-巯基修饰结构或γ磷酸盐修饰结构、或四、五、六或更长的磷酸盐链形式、或是具有额外基团在链中轭合到任意磷酸盐(例如β、γ或更高级磷酸盐)的任意前述结构)的形式。通常,如在此所述,“dNTP”是指在其延伸引物时可通过聚合酶合并的或者将进入这种酶的活性凹穴并作为试配候选者瞬时接合以合并的任意核苷三磷酸类似物或修饰形式。
如在此所用,“缓冲物”、“缓冲溶液”和“试剂溶液”是指:提供可供多聚酶传感器在其中操作和从所供应模板产生信号的环境的溶液。在各种实施例中,溶液是含水的。缓冲物、缓冲溶液或试剂溶液可包括的组分例如为:盐、pH缓冲物、二价阳离子、洗涤剂、阻滞剂、溶剂、模板引物寡核苷酸、蛋白质,其与多聚酶和多聚酶衬底(例如dNTP,dNTP的类似物或修饰形式,和DNA衬底或模板)复合。
如在此所用,“二进制数据”或“数字数据”是指:使用标准二进制码或基数2{0,1}字母表编码的数据,使用十六进制基数16字母表编码的数据,使用基数10{0-9}字母表编码的数据,使用美国信息交换标准码(ASCII)字符编码的数据,或者使用任意其他不同符号或字符的字母表以线性编码方式编码的数据。
如在此所用,“数字数据编码形式”是指:一系列的二进制数字、或来自用于编码DNA中信息的DNA序列特征的初步翻译的其他符号数字或字符,或这种分类DNA特征的等同逻辑串。在一些实施例中,拟存档为DNA的信息可翻译为二进制的,或者可初始作为二进制数据存在,然后此数据可进一步通过错误校正和组装信息而编码为直接翻译为由能够辨别的DNA序列特征提供的码的形式。这后一种关联是信息的初步编码形式。组装和错误校正进程的施加是进一步的次级级别的解码,回到恢复源信息。
如在此所用,“能够辨别的DNA序列特征”是指:数据编码DNA分子的特征,当通过传感器多聚酶处理时,产生区别性信号可用于编码信息。这样的特征可例如为不同的碱基,不同的修饰碱基或碱基类似物,不同的序列或序列基序,或这样的组合,以实现当通过传感器多聚酶处理时产生能够辨别的信号的特征。
如在此所用,“DNA序列基序”是指:特定字母序列或体现特定组的这种字母序列的任意成员的样式。例如,以下是作为特定字母序列的序列基序:GATTACA,TAC,或C。对照而言,以下是作为样式的序列基序:G[A/T]A是体现显性序列组{GAA,GTA}的样式,G[2-5]是关于序列组{GG,GGG,GGGG,GGGGG}的样式。显性序列组在基序的毫无疑义的描述中,而这样的样式简化标示如同描述这种组的常见紧凑方式那样。在各种应用环境中诸如此类的基序序列可描述天然的DNA碱基,或者可描述修饰碱基。在各种应用环境中,基序序列可描述模板DNA分子的序列,和/或可描述与模板互补的分子上的序列。
如在此所用,“具有能够辨别的信号的序列基序”(在样式情况下)是指:存在第一基序样式体现第一组显性序列且该序列中的任意项产生第一信号,存在第二基序样式体现第二组显性序列且该序列中的任意项产生第二信号,且第一信号区别于第二信号。例如,如果基序G[A/T]A和基序G[3-5]产生能够辨别的信号,则其意味着:组{GAA,GTA}中的任意项产生第一信号,而组{GGG,GGGG,GGGGG}中的任意项产生第二信号(区别于第一信号)。
如在此所用,“能够辨别的信号”是指:来自传感器的一个电信号,其在量上(例如峰值振幅、信号持续时间,等等)或在质上(例如峰形状,等等)明显不同于来自传感器的另一电信号,使得该不同对于特定用途可施加影响。在非限制性示例中,来自操作分子传感器的两个电流峰值(对于时间),如果它们的振幅存在约1x 10-10安培以上的差别,则能够辨别。这种差别足以使用两个峰值作为两个区别性二进制位读数,例如0和1。在一些情况下,第一峰值可具有正振幅,例如从约1x 10-10安培至约20x 10-10安培的振幅,而第二峰值可具有负振幅,例如从约0安培至约-5x 10-10安培的振幅,使得这些峰值明显不同且可用于编码不同的二进制位,即,0或1。
如在此所用,“数据编码DNA分子”或“DNA数据编码分子”是指:被合成以将数据编码到DNA中的分子、或者源自这种分子的拷贝或其他DNA。
如在此所用,“从DNA读出数据”是指:测量能够辨别的信号(其与用于将信息编码到DNA分子中的DNA分子特征相对应)的任意方法。
如在此所用,电极是指:纳米级别的导电金属元件,在独立成对电极中的两个电极之间具有纳米级别尺寸的间隙,在一些实施例中包括栅电极,其通过电容方式联接到间隙区域,可为埋入式或“背”栅、或者侧栅。电极可在一些应用环境中可被称为源电极和漏电极,或者称为正电极和负电极,这样的术语在电子领域中是常用的。纳米级别电极在成对电极中的各电极之间的间隙宽度将在1~100nm的范围内,并将具有也在此范围内的其他临界尺度(例如宽度、高度、长度)。这样的纳米电极可包括各种材料以提供导电性和机械稳定性,例如金属或半导体或这种材料的组合。用于电极的金属的示例包括钛和铬。
根据本公开内容的可用于存档且此后访问所存储数据的DNA数据存储系统的整体方案参照各个附图公开。
图1例示出根据本公开内容的DNA信息存储系统的实施例,此示例显示出DNA存储系统的主要元件,包括:物理系统,其用于在存储过程中处理和保持DNA材料并执行对存储档案的操作,例如拷贝。外部计算机提供系统高级控制,供应用于存储的信息和接收被提取信息。信息被编码为DNA序列、合成、存储,然后被读出、解码和输出。此外,这样的系统也能够实现DNA档案材料样本的物理输入/输出(I/O)。
图2例示出基本DNA存储系统信息阶段和过程,包括:存在于总系统中的主要信息阶段(在图2中图示为框)、以及从一种形式转变为另一形式的基本操作(在图2中由箭头图示)。
在本公开内容的各个方案中,DNA信息存储系统包括:(a)编码器/解码器;DNA写入装置;DNA读出装置。
编码器/解码器:在各个方案中,编码器/解码器包括具有两个功能的算法:编码器部分将给定的数字/二进制信息翻译为特定DNA序列组输入到DNA写入器。解码器部分将由DNA读出器所提供类型的给定的DNA序列组翻译回数字信息。
DNA写入装置:在各个方案中,DNA写入装置包括:采用给定DNA序列组并从这些序列合成DNA分子的任意装置(例如参见Kosuri和Church的Large Scale de novo DNAsynthesis:technologies and applications.Nature Methods,11:499-509,2014)。用于合成DNA分子的方法和装置的非限制性示例包括由Agilent Technologies and TwistBioScience提供的商业技术。对于每个所希望的序列,产生体现该序列的多个DNA分子。对于每个所希望的序列,所产生的多个分子可在DNA分子拷贝的几十倍、几百倍、几千倍、几百万倍或者甚至几十亿倍的范围内。体现所有所希望序列的所有这些拷贝可聚汇到一个主分子池中。典型地,这样的DNA写入系统的写入是不完美的,如果N个分子合成以体现给定的输入序列,则并非所有这些将会实际上实现所希望的序列。例如,它们可包含错误的删除、插入、或不正确的或物理损坏的碱基。
DNA读出装置:在各个方案中,DNA读出装置是采用DNA分子池并产生一组测得DNA序列用于从此池采样或选择的分子的装置。这样的读出器实际上探查被引入系统中的DNA分子的仅一小部分,因而仅一小部分将经历实际读出尝试。进一步地,典型地,这样的DNA读出装置可能无法以最大准确性读出被处理的给定DNA分子,因而在读数中可能存在错误。结果,同样典型地,测得的序列输出包括各种形式的置信度估计值和错失数据指示物。例如,对于测得的序列中的每个字母,可能存在正确的置信度概率或几率(针对其他DNA字母选项),可能存在错失数据指示物而指示出字母特征未知,或者可能存在一组可选的序列候选者,其具有体现一部分读数的不同概率。
如前所述的根据本公开内容的DNA数据存储系统的三个主要元件具有特定作用和相互关系,如在下文中更详细所述。
各主要元件之间的关系和编码器/解码器的中心作用:
信息编码器/解码器基于DNA写入器和DNA读出器装置的性能而选择,以最小化或减少信息存储/取回过程的成本的一些总体措施。系统成本的一个关键组成是取回信息的总体错误率。错误和成本示意性例示在图3-9中。
通常,DNA写入装置可引入写入错误,而DNA读出装置可产生读出错误,因此,将信息存储到系统中并此后将其取回的过程可能导致取回信息中所见的错误率。如图3中示意性所示,需要在系统中补偿错误。图3例示出需要错误校正、错误避免、或一些形式的错误补偿,这是因为,编码信息之后进行信息解码将通常另外不会导致原始信息返回,主要是由于DNA读出和写入时的生理化学错误所致。编码器/解码器算法可基于错误性能和DNA读出器和DNA写入器的性能而选择以最小化或减少此错误率。这些实施例例示在图3-6中。
图4例示出理想错误补偿的实施例。理想错误补偿是知晓合成器和序列器技术的错误模式的错误补偿方案。错误通过以下方式的组合而减少和/或补偿:避免错误产生,使用DNA读出和DNA写入系统的错误模式的常识并基于如在用于写入和读出DNA序列(如通过读出和写入系统所产生)的经验质量分数中反映出的观测数据不确定性而探测和校正错误。
图5例示出在DNA信息存储系统中的错误的注重成本的管理。通常,特定DNA序列,基于与例如错误率、所需时间、试剂消耗、经济成本等相关的成本因素,可具有固有的更大的成本。在本公开内容的各个方案中,与读出和写入技术相关联的成本加以考虑,并通过使用通常使成本最小化的编码/解码方案而减少或优化(例如通过避免高成本、易发生错误、合成缓慢、或读出DNA序列缓慢而实现)。
在各种实施例中,核苷酸可优选地被选择以基于以下因素而合并到核苷酸序列中:其在形成分子的写入过程中的易合成性、在合成分子中形成次级结构的倾向性较小、和/或在数据解码过程中的易读出性。在各个方案中,坏的写入基序和坏的读出基序在选择核苷酸以合并到核苷酸序列中时应避免,其中重点在于将区段合并到核苷酸序列中,当该核苷酸序列被读出以解码被编码信息时,其将产生相互能够辨别的信号。例如,在读出核苷酸序列时,A和T相互能够辨别,C和G相互能够辨别,A、C和G相互能够辨别,AAA和TT相互能够辨别,A、GG和ATA相互能够辨别,C、G、AAA、TTTT、GTGTG相互能够辨别。这些和许多其他组的核苷酸和核苷酸区段在读出器中提供相互能够辨别的信号,因而当将一组信息编码到核苷酸序列中时可被认为合并到核苷酸序列中。
此外,存在难以写入的核苷酸区段,当将一组信息编码到核苷酸序列中时应避免使用该核苷酸区段。在各种实施例中,将一组信息编码到核苷酸序列中包括:使用其余的能够辨别的特征中的一种作为编码符号(其例如可对应于二进制0/1、三进制0/1/2、或四进制0/1/2/3的码,等等)、以及使用错误校正编码而以避免难以读出和难以写入的特征的方式限定该一组信息。以此方式,信息存储系统的整体性能得以改善。
在各种实施例中,公开了将信息存储在核苷酸序列中并取回核苷酸序列中的存储信息的方法。在各个方案中,该方法包括:(a)一种用于合成与给定碱基序列相对应的核苷酸序列(例如合成DNA分子)的系统。如前所述,给定碱基序列可以通过仔细选择编码给定组的信息(例如二进制信息)的核苷酸和核苷酸区段进行确定。在各个方案中,该方法包括:(b)一种用于从核苷酸序列(例如从DNA链)读出信号的系统,其中,核苷酸序列包括一批能够辨别的序列区段,使得通过这样的组{X,Y,Z...},出现在分子内的各个序列区段X,Y,Z当由读出器处理时产生能够辨别的信号。在其他示例中,该方法包括:(c)识别不希望出现的核苷酸和核苷酸区段,基于它们在合成过程中被不正确写入、在合成过程中合并过慢、在合成分子中产生次级结构、或在合成过程中的使用成本过高的倾向性而实现。在各种实施例中,该方法包括:(d)识别不希望出现的核苷酸和核苷酸区段,基于它们当信息从分子中解码时被不正确读出、当信息被解码时读出过慢、等的倾向性而实现。在各个方案中,该方法包括:利用合成方法,包括将一组信息编码到DNA分子中,根据错误探测和/或校正码方案,使用编码方法(其中上述(b)的特征组中的一个用作编码的符号字母表且其中此特征组被选择为不使用任何在上述(c)和(d)中所述的不希望出现的特征),使用上述(b)的读出方法取回先前编码到例如DNA分子中的信息。
在各种实施例中,核苷酸序列(例如DNA分子)中能够辨别的特征可包括:独立的碱基。坏读出特征可包括独立的特定碱基。坏写入特征也可包括独立的特定碱基,其中编码方案对应于对输入信息串使用错误校正二进制码,其中,二进制符号0和1转变为x和y以实现DNA编码。
图6例示出理想的错误察觉系统,其包括错误补偿方案,察觉DNA合成器和序列器技术中固有的错误模式。
图7例示出双路错误补偿的示例。图的左部分显示出在此特定示例中形成的错误,图的右部分显示出通过错误补偿编码/解码方案产生不具有问题DNA序列基序(即,T和C碱基)的输入序列而避免这些错误。在图7的这种例示性示例中,DNA写入器倾向于有时删除T,而DNA读出器倾向于有时将C读为T。在此示例中,使用利用T和C的编码可导致错误,例如传入的编码数据序列GATTACA读出为GATATA,其中,一个T在写入时被删除,且发生C→T的读出错误)。不过,如果理想的数据编码绝不具有T或C(例如,在对所有二进制0/1数据简单直接地以二进制DNA码A=0且G=1编码的情况下),则在数据存储和取回时将不会产生错误。
这样,通常,为了减少错误,数字数据编码/解码算法可包括:错误探测和错误校正码,其被选择使产生的错误最少(给定DNA写入器和DNA读出器的实际错误模式)。这些码的设计可得益于错误模式的现有技术公知常识,即,倾向于写入器和读出器的特定错误。
在各种实施例中,错误校正码驻留在单个核苷酸序列内。例如,二进制数据的一个区段被编码到一个DNA序列中,其中在DNA侧上使用错误校正和/或探测方案。这样的方案还可以涉及:将二进制数据的一个区段编码到多个DNA序列中,以提供另一水平的信息冗余编码,这类似于通过冗余存储进行的错误校正。错误探测方案包括但不限于:重复码,校验位,校验和,循环冗余校验,加密散列函数,错误校正码,例如汉明码。错误校正方案包括但不限于:自动重传请求,错误校正码(例如卷积码和分组码),杂化自动重传请求,和里德所罗门码。
在各种实施例中,一种设计优化的或高效的错误校正编码的方法(其中,传入的数字数据被认为是长度N的二进制字)包括以下步骤:提供长度为M的所有DNA字的空间,使得存在比二进制字更多的可能DNA字(即,4M>>2N);选择DNA字的2N的子组/子集,用作码字,用于编码2N二进制信息字,使得当这些DNA码字中的每个扩展为对于给定字的可能DNA写入错误的组/集合,然后,该组/集合通过可能读出错误字的组/集合进一步扩展,这些结果形成的2N组/集合的DNA字以高概率保持脱离。在这样的情况下,通过读出器读出的任何字可适宜地以极高概率返回关联到理想编码DNA字。这种方法构成了错误校正和错误避免信息编码的组合。此外,解码算法也将自然利用由读出器供应的置信度或几率信息来选择相对于编码方案的最大可能性/最高置信度的解码。
优化DNA数据存储系统整体成本的另一关键方面是:写入数据所需时间。例如,许多实施例中的至关重要的时间成本可为数据写入的时间成本。在各种实施例中,避免写入特定的合成缓慢的碱基和序列基序,以缩短写入总时间。在其他方面,例如通过在多个并行的合成反应中减少一些循环过程的每个化学循环(写入一个碱基)所花费的时间,使写入更快,其中容许更高的整体写入错误率。
类似地,对于读出,可采用更快的读出过程,其代价是更高的读出错误率。在各个示例中,通过避免在编码中引入难以快速读出的特定类型的序列(例如均聚物类),在不增加错误的情况下采用更快的读出过程。在任一种情况下,信息编码/解码算法可通过这些选项共同优化,从而允许更快的读出/写入但避免过多错误模式,或者在编码/解码处理中避免读出/写入较慢的序列基序。
这些成本优化的实施例例示在图8和9中。图8例示出用于整体成本减少/优化的双路成本补偿的示例。在此示例中,同时存在高成本合成T和错误模式,由此C读出为T。在图8的实施例中,用于整体成本优化结果的错误补偿(其减少合成成本和错误)包括:使用避免高成本DNA基序T和C的编码。图9例示出成本优化的编码系统的示例性因素。该因素中包括:当共同优化DNA读出和写入系统的编码/解码算法和性能参数部分时DNA写入器和读出器的经济成本,速度和错误率。写入器和读出器的性能参数取决于DNA序列以及这些系统的其他可调/可选参数,这些参数以及算法选择和参数被共同优化以减少或最小化这些成本。
通常,在信息存储/取回过程的“成本”的总量度中存在各种因素,包括:错误率、速度、试剂或组分的经济成本、系统鲁棒性或失败之间的时间,等等。读出器和写入器的这些性能另外还通常根据操作参数(例如,一些反应完成所允许的时间、所用化学试剂的纯度、操作温度,等等)而可变。
在各种实施例中,编码器/解码器算法和写入器和读出器系统的选项和控制参数设定被共同选择和/或共同优化以减少或最小化一些总成本函数或成本函数的集合(见图9)。以此方式,通过避免或削减较高成本的操作方式,该系统的“成本”性能可显著减少。
DNA读出装置的操作
在本文的DNA信息存储系统的各个实施例中,DNA读出装置包括:规模化并行DNA序列装置,其能够从每个特定DNA分子高速读出碱基,使得对大规模档案信息取回的实际应用而言,存储DNA信息的总读出速率可足够快,且量足够高。读出碱基的速率对数据取回设定最短时间,相关于存储DNA分子的长度。
在各种实施例中,分子电子传感器从单个DNA分子提取信息,采用提供一读出器用于被存储为DNA的数字数据的方式。图10A例示出分子电子传感电路的基本思路,其中传感器分子复合物配全电路,电路参数(例如电流i)随时间(t)测量以提供信号,其中信号变化对应于在传感器环境中传感器分子复合物与相互作用分子的相互作用。如图10A中所示,分子电子传感器包括的电路中,单个分子、或少量分子的复合物形成完整的电路跨越成对纳米级别电极之间的间隙,电子参数通过此单个分子或复合物调制,其中此参数作为信号被测量以指示(传感)在环境中与目标分子相互作用的单个分子或复合物。在各种实施例中,例如如图10A中所示,测得的参数是通过电极的电流(随时间),分子复合物通过特定附接点轭合到电极就位。
图10B例示出基于多聚酶的分子电子传感器的实施例,在此用作用于DNA读出装置。传感器(例如在图10B中所示并包括多聚酶)通过区别性DNA分子特征(在图中简写为Feat.1、Feat.2,等)产生能够辨别的信号。这样的特征可用于将信息编码到合成DNA分子中,其可进而通过传感器读出。
在各种实施例中,独立传感器电路的分子复合物包括单个聚合酶分子,该单个聚合酶分子接合于目标DNA分子以当其处理DNA模板时产生电信号。在适合的条件下,这样的多聚酶将产生能够辨别的电信号特征,对应于模板DNA分子的特定区别性特征,例如在图11中通过信号迹线中的两个不同峰形状例示。这样的能够辨别的信号特征因而能够用于将信息编码到合成DNA分子中(通过多种不同编码方案实现,例如图29所示,在下文论述),因此,这样的传感器提供读出器,用于如此编码的数据。
图11例示的实施例中,多聚酶分子轭合到在成对电极中两个电极之间配全电路的桥联分子。电极之间的电流是测量的电参数。当多聚酶接合于正确模板(例如引发的单链DNA分子)时(在存在适合的缓冲溶液和dNTP的情况下),多聚酶活性在合成互补链时引起与酶活性的详细动力学相关的测量信号扰动。在此情况下,通过电极的电流随时间的图线提供具有能够辨别特征(例如振幅变化)的信号,对应于被处理DNA分子的结构特征。
图12例示出传感器电路的实施例,其中,多聚酶使用两个“臂“分子连线到成对电极中的电极,从而使多聚酶成为电流路径的至关重要的部分。
图13显示出传感器电路的另一实施例,其中不存在臂,多聚酶直接轭合到两个电极。在各种实施例中,轭合到多聚酶且轭合到电极的分子复合物通过一系列一个或多个分子自组装过程形成,该过程通过各个轭合基团和轭合反应的高度特定和高效的化学作用驱动。
图14显示出一个特定多聚酶(即,E.Coli.多聚酶I的克列诺(或大)片段)的分子结构的三维表现。
图15和16例示出分子传感器的实施例,其中,E.Coli.多聚酶I的克列诺(或大)片段轭合到抽取分子桥联分子(由电极之间的粗条指示),或者分别利用两个抽取臂分子直接轭合到电路中。图17例示出分子电子传感器的实施例,其中E.Coli.多聚酶I的克列诺(Klenow)片段直接轭合到电流路径中而且直接轭合到金属电极,而不使用臂或桥联分子。
图18详细例示出工作传感器200的实施例,其在此用作DNA读出装置,用于DNA数据信息系统。分子传感器结构200包括两个电极201、202(包括钛或铬)。电极201、202可包括电路中的源电极和漏电极。电极201、202以约10nm的纳米间隙分离。可能需要其他间隙距离以适应其他长度的生物分子桥。在此示例中,桥联分子203包括:长度约20nm的双链DNA齐聚物分子(例如60个碱基;6个螺旋圈),在3’、5’端处具有巯基团204、205,用于使桥联分子203联接到每个金属电极201、202上设置的金触点206、207。在DNA齐聚物各端与金触点之间的键是硫-金键,从结合到金的DNA桥联分子的5’端上的巯基团可用。在这种传感器中的探针分子包括E.Coli.多聚酶I分子210的克列诺片段,其使用多聚酶上的生物素标记部位在共价联结211处化学交联到链霉亲和素蛋白212,其进而通过在合成寡DNA 203中的生物素标记核苷酸联接到结合部位214。在操作时,传感器200进一步包括DNA链220,其由多聚酶210处理。图中模拟分子和原子的相对尺寸。
在本文中使用的分子电子传感器的各个实施例中,多聚酶可为天然或突变形式的Klenow、Taq、Bst、Phi29或T7,或者可为逆转录酶。在各种实施例中,通过引入多聚酶中的特定轭合部位,突变多聚酶形式将能够实现多聚酶在特定部位轭合到桥联分子、臂分子或电极。这样的轭合部位(通过重组方法或合成生物学方法工程设计到蛋白质中)在各种实施例中可包括:半胱氨酸,醛标签部位(例如肽基序CxPxR),四半胱氨酸基序(例如肽基序CCPGCC),或者非天然或非标准的氨基酸(NSAA)部位(例如通过使用扩展基因码而引入p-乙酰苯丙氨酸),或者非天然的可交联氨基酸(例如通过使用RNA-或DNA-蛋白质交联,其中使用5-溴尿苷)(例如参见Gott,J.M.等人的文献:Biochemistry,30(25),pp 6290–6295(1991))。
桥联分子或臂分子在各种实施例中可包括:双链DNA,其他DNA双链体结构(例如DNA-PNA或DNA-LNA或DNA-RNA双链杂化物),肽,蛋白质α-螺旋结构,抗体或抗体Fabdomains,石墨烯纳米带或碳纳米管,或任何其他分子电子技术领域技术人员公知的宽阵列的分子连线或导电分子。多聚酶轭合到这样的分子或者这样的分子轭合到电极,可通过轭合化学领域技术人员公知的轭合方法的多样化阵列实现,例如生物素-亲和素联接体,巯基-金联接体,半胱氨酸-马来酰亚胺联接体,金或材料结合肽,点击化学联接体,侦探-侦探捕获蛋白质相互作用联接体,抗体-抗原结合体(例如FLAG肽标签/反-FLAG抗体系统)等等。联接到电极可通过材料结合肽实现,或者通过使用SAM(自组装单层)或在电极表面上的其他表面衍生作用实现,以实现用于轭合的适合功能基团,例如叠氮化物或胺基团。电极包括导电结构,导电结构可包括任何金属(例如金、银、铂、钯、铝、铬、或钛),这样的金属的任意组合的层(例如金在铬上),或半导体(例如掺杂硅),或者在其他实施例中为:在包括第二材料的支撑体上的第一材料的触点,使得触点所处部位引导分子复合物化学自组装到电极。
在各种实施例中,传感器(例如图18中所示传感器)中测得的电参数通常可为传感器有源时可测得的传感器电路的任意电性能。在一个实施例中,该参数是当电压(固定或变化的)施加于电极之间时随时间通过电极之间的电流,连续地或在分立的时间采样。在各种实施例中,栅电极以电容方式联接到分子结构,例如为埋入式栅或背栅,其在测量过程中施加栅电压(固定或变化的)。在各种其他实施例中,测得的参数可为两个电极之间的电阻、电导率、或阻抗,随时间连续测量或周期性地采样。在各个方案中,测得的参数包括电极之间的电压。如果存在栅电极,则测得的参数可为栅电压。
在各种实施例中,分子电子传感器(例如图18的传感器)中测得的参数可包括:联接到电路的电容器上的电容、或积聚的电荷量或电压。测量可为电压频谱测量,使得测量过程包括捕获I-V或C-V曲线。测量可为频率响应测量。在所有这样的测量中,对于所有这样的测得参数,存在这样的实施例,其中在测量过程中栅电极在分子复合物近处施加栅电压(固定或可变的)。这样的栅将典型地物理位于微米距离内,在各种实施例中在分子复合物的200nm距离内。对于点测量,在一些实施例中,将存在基准电极,例如Ag/AgCl基准电极,或铂电极,在溶液中与传感器接触,并保持外部电势,例如接地,使溶液保持在稳定或可监控的电势下,由此使电测量更好地限定或控制。此外,当进行电参数测量时,各种其他电参数可保持固定在规定值,或以规定方式改变,例如源-漏电极电压,栅电压(若存在栅电极),或源-漏电流。
使用传感器(例如图18中所示传感器)测量DNA分子的能够辨别的特征,要求多聚酶保持在使多聚酶激活的适合的物理和化学条件下,以处理DNA模板和产生高于任意背景噪音的能够辨别的信号(即,高信噪比或SNR)。为实现这一目的,多聚酶可停留在水性的缓冲溶液中。在各种实施例中,缓冲溶液可包括盐的任意组合,例如,Nalco或KCl,pH缓冲物,三羟甲基氨基甲烷盐酸盐,多价阳离子辅因子,Mg、Mn、Ca、Co、Zn、Ni、Fe或Cu,或其他离子、表面活性剂(例如Tween)、螯合剂(例如EDTA)、还原剂(例如DTT或TCEP)、溶剂(例如甜菜碱或DMSO)、体积浓缩剂(例如PEG)、和在分子生物应用中用于聚合酶且分子生物学领域技术人员公知的任意其他典型缓冲物的组分。传感器信号也可通过这种缓冲剂(保持在特定pH或温度范围内、或者处于特定离子强度)而增强。在各种实施例中,离子强度可被选择以获得有利于电信号产生的溶液中的德拜长度(电荷屏蔽距离),其可例如在约0.3nm至约100nm的范围内,在特定实施例中在约1nm至约10nm的范围内。被配置具有更大德拜长度的这种缓冲剂可更加稀释或者具有较低的离子强度,相对于例行用于标准分子生物学进程(例如聚合酶链反应PCR)中的缓冲物浓度而言为1/10、1/100、1/1000、1/10,000、或1/1,000,000。缓冲物的成分、浓度和条件(例如pH、温度、或离子强度)也可被选择或优化以改变酶动力学,从而在读出DNA分子中所存储数据的应用环境中有利地增大传感器的信噪比(SNR)、总信号产生率、或总信息产生率。这可包括通过这些方法减缓或加速酶活性,或改变多聚酶的保真度或准确度。这种优化缓冲物选择过程包括从所有这些参数变化的矩阵中选择测试条件,根据经验测量效益图(例如相关于能够辨别的特征的分辨、或相关于当处理模板时的特征辨别总速度),使用各种检索策略(例如在统计学试验设计(DOE)方法中应用的检索策略),以得到优化参数组合。
使用传感器(例如图18的传感器)测量DNA分子的能够辨别特征,要求为多聚酶提供dNTP供应,使得多聚酶可对模板单链DNA分子逐步作用以合成互补链。标准的或天然的dNTP是dATP,dCTP,dGTP,dTTP,其提供A,C,G,T碱基单体用于聚合到DNA链中,其形式适于酶作用其(作为衬底)上所需。聚合酶(天然的或突变的)也可接受这些天然dNTP或修饰形式的类似物,其可增强或实现能够辨别的信号的产生。
在本文中的DNA读出的各个方案中,如果系统以一个碱基/10分钟的速度读出DNA分子(对于当前下一代光学染料标记终止序列器而言是代表性的),则读出300碱基的DNA分子花费至少3000分钟(50小时),还不算制备样本用于读出所需的任意时间。这样的相对较慢的系统因而有利于存储较大数量的较短读出的信息,例如,30个碱基读出可按5小时读出。不过,这需要较大量的总读出,因而系统必须支持十亿或更多的这种读出,如对于这种序列的情况。当代的光学批量化并行序列器,每6分钟循环读出30亿量级的DNA字母,或大致等同于每分钟10亿数位,或每秒2MB,不过对于存储为100碱基的DNA字而言,这也将需要600分钟(5小时)。这可见为相对较低的数据读出速率,不过在实践层面内,由于典型书籍可包含1MB的文字数据。总速率是实用的,但对于每个碱基的慢速使其对于读出单本书籍数据时相当低效,理想地被匹配以在5小时中并行读取36000书籍。这样,在这种当前能力中还缺乏可扩充性,而且读出装置的资金成本也较高(可选的DNA序列器的成本目前在10-100万美元的范围内)。更重要的是,在这种当前系统上,对人类基因组DNA(1000亿碱基)测定序列的成本约为1000美元,这意味着,读出信息的成本为1000美元/200GB,或40美元/GB。这显著高于从磁带存储装置或CD读出信息的成本(其在1美元/10,000GB、或0.0001美元/GB的量级,成本为其1/400,000)。这样,在不考虑其他优点的情况下,读出DNA的成本应减少多个数量级(甚至为1/1,000,000),以使其在大规模、长期档案存储上具有吸引力。这样的改进可确实可行,如以下事实证实:自从制造出第一个商业序列器,序列测定成本已经减少至1/1,000,000。
在各个实施例中,本系统的DNA读出器包括与当前可用的光学下一代序列测定设施相比显著更低的设施资金成本、和更高的单位碱基读出速度、和单位运行内读出总数的更大可扩充性。在各个方案中,在此所用的读出装置基于CMOS芯片传感器阵列装置以增大速度和可扩充性并减小资金成本。这种装置的实施例包括CMOS传感器阵列装置,其中每个传感器像素包含分子电子传感器,能够读出单个分子或DNA,而无需任何分子放大或拷贝(例如PCR)。在各种实施例中,CMOS芯片包括可扩充像素阵列,其中每个像素包含分子电子传感器,这样的传感器包括桥联分子和聚合酶,被构造为:当酶处理DNA模板分子时产生对电流(或相关电参数,例如电压,电导率,等等)的与序列相关的调制。
在本DNA数据存储系统中可用作DNA读出装置的分子传感器和芯片组合图示在图18、19、30A、30B、31-33中。如前所述,图18例示出示例性分子传感器,其包括桥和探针分子结构,进一步包括约20nm长(约60个碱基)的双链DNA的桥,其中巯基团在5’端用于联接到金属电极上的金触点。图18的实施例包括:聚合酶,其联接到由DNA构成的分子连线,其插入纳米电极对中以形成传感器,该传感器当聚合酶处理被引发的DNA模板时能够产生与序列相关的信号。
如图19中所示,这种纳米传感器可通过后处理到CMOS传感器像素阵列的像素上而安置,CMOS传感器像素阵列进一步包括从大量并行操作传感器中产生这些信号所需的所有支持测量值、读数和控制电路。图19例示出分子传感器中各种电部件和连接的实施例。在图的上部分中,例示出电极衬底结构300的截面,其中与分析器301的附接用于施加电压和测量通过传感器桥联分子的电流。在图的下部分中,例示出电极阵列302的立体图,其可用于桥接电路。每对电极包括第一金属(例如Metal-1),和第二金属(例如Metal-2)的触点或岛,其处于每个电极端处接近于使各电极分离的间隙。在各个实施例中,Metal-1和Metal-2可包括相同的金属或不同的金属。在其他方案中,触点是金(Au)岛,处于金属电极(包括不同金属)的顶上。在各个试验中,触点包括金(Au)珠或金(Au)涂层电极尖端,其支持各电极对之间每个间隙上的单个桥联分子的自组装,例如通过巯基-金结合实现。
图20显示出包括金金属点触点用于DNA传感器中桥接结合的电极的电子显微(EM)图像。在此示例中,电极处于硅衬底上,并通过电子束光刻(lithography)产生。图20的左部分显示出具有金点触点的钛电极的阵列。在图20的中间,放大EM显示出约7nm的电极间隙,其中具有金点触点并具有约15nm的金-金间隔。在图20的右部分,放大EM显示出尺寸约10nm的金点,位于电极尖端处。
图21提供电流-时间图线,通过以图18的传感器测量DNA合并信号获得。图线显示出来自传感器的电流信号,传感器被供应以各种引发的单股DNA序列模板和dNTP用于合并和聚合。在每种情况下,主信号尖峰体现来自分立合并事件的信号,其中聚合酶将另一碱基添加到延伸链。在图21的左上部,模板是20T碱基;在右上部,模板是20G碱基;在左下部,模板是20A碱基;在右下部,模板是20C碱基。观察到的近似合并速率约为10-20碱基/秒,与标准酶动力学一致,除非由于速率限制因素(例如较低的dNTP浓度)而导致较低的速率,约1碱基/秒。
图22例示出使用dNTP的修饰形式产生能够辨别的信号的原理,其中所示示例中,所有4个dNTP承载区别性的修饰形式而从模板DNA的四个碱基产生4种能够辨别的信号。许多这样的修饰形式对于核酸生物化学领域技术人员而言是公知的,所有这样的形式在各个实施例中可实现信号产生。这包括具有对于碱基、糖、或磷酸基的修饰的dNTP。例如,dNTP的常用的修饰形式包括:在分子上的各个部位的脱氮、硫代、溴代、碘代修饰形式,或者在各种部位包含金属离子或不同的同位素,在各种部位包含多种染料分子,或各种部位的甲基化作用,或者各种部位的生物素化作用。各种修饰形式包括具有延伸磷酸链的形式,超过天然的三磷酸酯,至例如四、五、六、七或更大长度(4或更大,至11或更大)的磷酸酯。其他修饰示例包括:添加到磷酸链的末端磷酸酯或者在合并过程中裂开的任意磷酸酯(除了α-磷酸酯或链中第一个磷酸酯)。多聚酶高度容忍这样的基团,且在它们存在的情况下保持高度活性。这样,这种基团为修饰dNTP提供更大能力,有助于形成能够辨别的信号。在各种实施例中,这样的基团可具有不同电荷状态、或不同尺寸、或不同疏水度程度,这可有助于产生不同的信号,或者,这种添加的基团可选择性地与桥联分子上或多聚酶或模板DNA上的部位相互作用以产生能够辨别的信号。图22例示出将这样的基团添加到磷酸链上,以产生用于模板四个碱基的合并的能够辨别的信号。
图23例示出使用两个区别性的修饰dNTP(修饰dATP如A*所示,修饰dCTP如C*所示)提供两个能够辨别的信号,其来自它们针对模板DNA的相应互补标准碱基T和G的合并。使用两个修饰dNTP提供一种方法,将二进制位0/1编码到模板DNA中。这样,DNA模板的T和G特征产生能够辨别的信号,并可用于编码能够由此传感器读出的信息。
图24例示出使用两种不同序列基序(在此为均聚物AA和CCC)产生两种能够辨别的信号,其提供一种方式,将二进制位0/1编码到模板DNA中。在此情况下,AA和CCC提供两种能够辨别的序列基序,可用于信息编码和恢复。这样,可用的信息编码和读出是可行的,即使没有DNA序列的单个碱基分辨率,而是依赖于能够辨别的序列基序。
图25显示出从图18的传感器获得的试验数据,其中特定序列基序产生可用于编码0/1二进制数据的信号。图18的传感器包括轭合到DNA桥的克列诺多聚酶,其从试验模板DNA中的编码DNA序列基序20A、3C、30A产生能够辨别的信号。这样的信号通过使用图18的传感器并结合标准1X克列诺缓冲物和相对较高浓度的dTTP(10μM)和浓度为1/100的其他dNTP而产生。较低浓度的其他dNTP(尤其是低浓度的dGTP)有利于通过浓度限制合并速率而从CCC区域实现能够辨别的信号。结果是,聚-A带具有高峰信号特征,聚-C带具有低谷信号特征,它们能够容易地辨别。该峰和谷可用于以所示简单方式编码0/1二进制数据,其中,0通过聚-A带编码并从具有多秒持续时间的高峰信号读出,1通过CCC带编码并从具有多秒持续时间的低谷特征读出。
图26A例示出二进制编码的实施例,其中,两个不同的序列基序(GATT和ACA)产生两个能够辨别的信号,提供一种方法将二进制位0/1编码到模板DNA中。
图26B例示出二进制编码的另一实施例,其中,三个不同的序列基序(GATT、ACA、AGG)产生三个能够辨别的信号,提供一种方法将数字数据以三状态编码方式编码。
使用本公开内容的传感器测量DNA分子的能够辨别的特征,要求在产生相关联信号的过程中为多聚酶提供引发的单链模板DNA分子作为衬底用于互补链的聚合。在编码合成DNA分子中的信息的应用环境中,这些模板分子可为完全化学合成的,并因而可设置有超出这些天然DNA的化学或结构修饰或性能,其可用于对于各个实施例实现或增强能够辨别的信号的产生。多聚酶(天然的或工程突变的)可作为衬底接收大量这种DNA修饰或类似物形式,其中许多形式对于分子生物学领域技术人员是公知的。对模板DNA使用这种修饰可用于形成具有能够辨别的信号的特征。图26C显示的情况中,模板DNA通过两个碱基类似物X和Y(为A和C的类似物)合成。所提供的dNTP是标准的dATP和dCTP,它们当针对模板中的修饰碱基X和Y合并时产生增强的能够辨别的信号。这样,使用X和Y类似物合成的DNA模板可用于编码可通过此传感器读出的信息。图26D显示出对此的进一步延伸,其中,编码DNA通过8个不同碱基和碱基类似物(即,四个标准碱基A,C,G,T,和它们的相应的修饰碱基类似物X,Y,Z,W)合成,当标准dNTP针对它们以互补方式合并时产生8种能够辨别的信号。这样,通过这8个碱基和类似物A,C,G,T,X,Y,Z,W合成的模板DNA提供8种能够辨别的信号,因而可用于8状态编码(例如图29中所示,方案BES5)。
在各种实施例中,作为模板被供应到多聚酶的DNA包括一些形式的引发的(双链/单链过渡)部位以用作多聚酶的初始部位。为实现将数字数据存储到DNA中的目的,在各种实施例中,这种引发将预组装到编码分子中,使得不需进一步的样本制备引发DNA模板分子。
图27A和27B显示的实施例中,DNA数据存储分子具有被预组装的通用的引发结构。
图27A提供可用于存储模板的引物构造的四个实施例。这些包括(在例示中按降序):(1)引发链,具有杂化到模板的寡引物;(2)引物交联到链以实现稳定性;(3)发夹引物,具有DNA的发夹弯曲部或其他联结分子,例如PEG(聚乙二醇)聚合物联结物;(4)发夹引物,其交联就位。图27B提供链构造的实施例,能够使基于多聚酶的传感器多次询问相同的数据载荷。对这四个实施例的进一步考虑在本文中详细描述。
在各种实施例中,引物结构包括以下中的任意项:
1)预杂化的通用寡引物(例如天然DNA的),可选地具有高熔点或高GC含量、或更稳定的杂化形式,例如PNA(肽核酸)或LNA;
2)以额外交联碱基(例如溴脱氧尿苷)修饰的寡引物,其共价结合或以其他方式牢固化学联接就位,使得引物脱位的可能性显著减少;
3)发夹引物,作为DNA模板的一部分,使得分子优选地自引发,其中发夹引物可完全由DNA构成,或者允许发夹弯曲的发夹环(其在各个实施例中为DNA,或可替代的柔性分子,例如PEG聚合物链或多碳联结物(例如C3,C6或更长联结物),其附接到杂化寡部分(其可为DNA,例如具有高熔点和高GC含量、或更稳定的杂化类似物,例如PNA或LNA);
4)发夹引物,其中杂化寡聚物通过额外交联碱基修饰,其共价结合或以其他方式牢固化学联接就位,使得引物脱位的可能性显著减少。在各种实施例中,卤化硫基嘧啶和溴脱氧尿苷(例如5’-溴-2’-脱氧尿嘧啶核苷作为胸苷的替代物)是光敏性卤化碱基,可合并到寡核苷酸中以将它们交联到DNA、RNA或者蛋白质(其对紫外光曝光)。在各个示例中,交联通过波长为308nm的光实现最大效率。例如参见Cleaver,J.E.撰文Biophys.J.,8,775-91(1968);Zeng,Y.等人撰文Nucleic Acids Res.,34(22),6521-29(2006);Brem,H.等人撰文J.of Photochemistry and Photobiology B:Biology,145,216-223(2015)。
由于DNA模板的次级结构可干扰多聚酶的逐步动作,因而可能有利的是:减少或消除DNA数据读出传感器中所用DNA数据编码模板分子中的次级结构。减少次级结构干扰的许多方法对于分子生物学领域技术人员是公知的。减少、避免或消除次级结构的方法包括但不限于:使用拥有强大次级结构移位能力的多聚酶(例如Phi29或Bst或T7,它们的天然或突变形式);添加到缓冲溶液(例如甜菜碱、DMSO(二甲基亚砜)、乙二醇或1,2-丙二醇);减小缓冲物的盐浓度;增大溶液的温度;添加单链结合蛋白或者退化结合寡聚物以沿单链杂化。诸如此类的方法具有的有益效果可以是:减少次级结构对于聚合物处理编码DNA和产生正确信号的干扰。
根据本公开内容的可用于减少对于DNA数据读出不利的次级结构的另外的方法包括:对于通过合成化学产生的DNA分子添加性能。例如,在本公开内容的一些实施例中,编码DNA分子自身的数据可通过减少次级结构的碱基类似物合成,其中,例如使用deaza-G(7-deaza-2′-脱氧鸟苷)替代G而削弱G:C碱基配对,或者通过使用链中的锁核酸(LNA)而强化骨干以减少次级结构。各种具有这种效果的这样的类似物对于核酸化学领域技术人员是公知的。
进一步的方法可用于本公开内容中以减少对于DNA数据读出传感器不利的次级结构,这是因为,DNA编码方案确定模板序列,并因而可能选择编码方案以避免倾向于次级结构的序列。这样的次级结构避免(SSA)编码方案因而是本公开内容的有益的方面。通常,对于如本文中所述的编码方案(其使用能够辨别的信号序列特征作为编码元素,且其程度足以在选择编码规则时存在选项,例如在图29中所示),所有这样的可替代方案可被考虑,产生较少(或最少)次级结构的方案将有利地使用。可替代方案相对于特定数字数据载荷或者在拟编码的这种数据载荷的代表性群体中以统计学方式评估。
例如,SSA编码的重要性例示在传感器提供三种能够辨别的信号序列特征(AAAAA,TTTTT,CCCCC)的实施例中。如果所有三种特征用于在相同的链(或在其他链上)编码,则很可能AAAAA和TTTTT编码元素(互补)在链内或在DNA链之间杂化并导致次级结构。这样,如果可替代地数据完全通过0→AAAAA且1→CCCCC(即,完全不使用TTTTT)的方案编码,则避免所有这样的潜在的次级结构。这样,这种编码(或其他SSA选择,0→TTTTT且1→CCCCC)优于使用自互补序列的方案,即使由于放弃三种可用编码元素中的一种使信息密度减小。这样,通常,当存在编码选项时而且当存在形成DNA次级结构的可能性时可使用SSA码。如此实施例中所示,所希望的用于减少DNA次级结构的SSA码的信息密度可小于能够辨别的信号状态的理论可能值。不过,通过避免与DNA次级结构相关的数据损失,这种折衷可引起信息密度的净增益、或相关总成本或速度的改善。
在各种实施例中,用于减少次级结构的方法包括:使用结合寡聚物来保护单链,其中,寡聚物通过将优选地结合到编码特征的序列或序列成分而选择。这样的结合寡聚物可更有效地保护单链和通常退化寡聚物。例如,在上述具有三种能够辨别的信号序列特征AAAAA,TTTTT,CCCCC的情况下,所有三种可用作编码特征,它们可通过将模板结合到寡聚物TTTTT,AAAAA,GGGGG或者它们的增强结合类似物(例如RNA、LNA或PNA形式,而非DNA)而在单链形式中受到保护。这样,结合寡聚物的使用(优选地结合到编码特征)是减轻不利次级结构影响的另一方式,不过这样的结合寡聚物必须用于链移位多聚酶,例如天然或突变形式的Klenow、Bst或Phi29,使得寡聚物自身不发生干扰。一种用于避免次级结构的进一步的方法是:以初步双链形式制备信息编码DNA,在引物部位处具有缝隙或间隙用于多聚酶初始,分子的其余部分采取双式形式,例如在图27B中通过第二链所示(存在或不存在发夹弯曲部),使得DNA分子以大致双式形式存在于溶液中,没有在分子内或分子之间因单链相互作用所致的次级结构。
在各种实施例中,用于编码信息供同源分子传感器读出的DNA分子可通过有利于读出过程以及编码和解码过程的架构制备。DNA架构的各种实施例例示在图28中。所示为引发单链DNA模板(在图的顶部)的代表性物理形式以及用于数字数据存储系统中的信息编码分子的逻辑形式。示例性形式可包括:左、右衔接头(显示为L衔接头和R衔接头),以利于操控信息码分子;引物(例如预引发或自引发的,显示为引物);左、右缓冲区段(显示为L-缓冲和R-缓冲);和数据载荷区段(data payload)。
继续参见图28,衔接头(adapter)可例如包括:用于通用放大过程的引物,用于拷贝被存储数据;或者可包括:杂化捕获部位或其他选择性结合目标,用于从集池中目标性选择分子。在各种实施例中,引物区段包含引物目标/结构,L-缓冲区段可包含用于读出器的信号校准序列、或者在数据载荷区段之前的缓冲序列,其包含信息存储编码序列和相关的错误校正序列(例如校验位)。在各个方案中,R-缓冲可包含另外的校准序列以及当读出数据时防止聚合酶过度接近于模板端部的缓冲序列。在各种实施例中,L衔接头和R衔接头可为与相关联DNA区段的存储或操控相关的序列元件,例如用于PCR放大外引发援引物、基于杂化的选择、或者体现对此插件(包括作为载体插入到宿主有机基因组中)的周围载体DNA的衔接头。在各种实施例中,衔接头可以包括周围或载体DNA,例如在DNA数据分子存储在活体宿主基因组中(例如在细菌质粒或存活有机体的其他基因组组分中)的情况下。
进一步参见图28,L-缓冲和R-缓冲区段可包括支持多聚酶结合踪迹的DNA区段、或用于协助解读来自数据载荷区域的信号的各种校准或初始序列。这些缓冲区段可包含分子条码序列,用于辨别特有分子或识别源于相同原始单分子的的复制分子。一种这样的条码方法(在DNA寡聚物合成领域对于本领域技术人员是公知的)包括:添加短的随机N-mer序列,其典型地为1至20碱基长,例如通过以碱基的退化混合物(而非特定碱基)执行合成步骤而制成。
继续参见图28,DNA逻辑结构包括数据载荷区段,其中,特定数据被编码。在各种实施例中,数据载荷区段包括实际初步数字数据,其与用于存储方法的元数据一起存储,该元数据可包括与将这种信息片断正确组装为更长串相关的数据、和/或与错误探测和校正相关的数据(例如校验位、校验和、或其他这样的高架数据)。
在各种实施例中,数据载荷DNA结构源自施加于源数字数据载荷(例如二进制数据)的传感器专用信息编码方案,如图29中所示。在此场景中,未存储为DNA的原始数字数据将典型地具有作为电子二进制数据(1/0位)的先前表现。在编码的各种实施例中,这种原始数据将:(i)分为各区段;(ii)通过再组装数据而增强;(iii)通过错误校正适于DNA存储的编码而变换,以产生实际二进制数据载荷区段,例如在图29的示例中所示。这些实际二进制数据载荷区段然后需要翻译为可用于随后的DNA物理存储分子合成的DNA载荷序列。在各种实施例中,初步翻译通过二进制编码方案(BES)执行,例如显示在图29中。这些编码方案提供从数字数据格式(例如二进制)初步翻译到DNA分子序列格式。
哪种BES适合,直接相关于传感器(如图11中所示)的能够辨别的信号特征组。图29例示出多个这样的初步编码,其中使用示例性的二进制数据载荷,即,图顶部所示的32位字。示例性的二进制编码方案(BES)显示如下:
-BES1:四个2位标准编码为四个标准DNA字母(1个DNA字母/两个二进制位),用于能够辨别这些特征的读出器传感器(例如图22);
-BES2:两个二进制数字编码为两个碱基(1个DNA字母/1个二进制位),用于能够辨别它们的读出器传感器(例如在图23中的T和G之间辨别);
-BES3:两个二进制数字编码为两个碱基类组:AA和CCC(一个类组的DNA字母/一个二进制位),以将两个二进制状态编码用于能够辨别这些特征的读出器传感器(例如在图24中的AA和CCC之间辨别);
-BES4:使用通过两个修饰碱基X、Y构成的DNA分子(1个修饰碱基/1个二进制位)编码两个二进制状态,用于能够在模板中辨别这些修饰碱基的读出器传感器(例如辨别图26C中的X和Y);
-BES5:使用通过4个天然碱基和4个修饰碱基构成的DNA分子编码8个可能的1/0的3位状态(1个DNA碱基或修饰碱基/3位数据),用于能够在所有8种碱基特征之间辨别的传感器(例如在图26D中的A,C,G,T,X,Y,Z,W之间辨别);
-BES6:使用两个DNA序列基序编码两个二进制状态(1个DNA序列基序/1个二进制位),用于能够辨别这些基序的信号的读出器传感器(例如在图26A中的GATT和ACA之间辨别)。
如图29的示例中所见,用于多位的编码方案BES1和BES5的二进制数据载荷的编码缩短了从二进制进行到DNA序列的编码串的长度,而多碱基的编码方案BES3和BES6在编码时延长了编码串的长度。当减少合成DNA信息编码分子的长度具有高优先级时(例如当对于写入技术的寡聚物长度存在实际限制时),产生较短序列的码方案是优选的。进一步如图29的示例中所见,BES2和BES4方案在从二进制进行到DNA序列时保持编码串的长度。进一步参见图29,图的下部分提供当示例性二进制数据载荷字(在图的顶部)通过编码方案BES1、BES2、BES3、BES5转变时获得的DNA序列。
本文中使用的二进制编码方案不限于图29中提出的示例,对图29中所示的多种变化或类似的编码方案也在这些示例中暗示,例如通过取代所用字母、或改变序列基序的长度、序列基序的成分、和/或修饰或类似碱基的选择而实现。还应理解,所有这样的编码方案具有同源传感器,能够辨别编码特征的信号,使得BES的选择直接相关于传感器辨别特征的性能。还应理解,即使图29的示例例示出具有2、4或8个能够辨别的特征的情况,为便于描述1、2或4位的位编码,二进制数据的编码可基于任意数量的能够辨别的信号特征而进行,例如,如图26B的传感器中的3个能够辨别的特征。
在各种实施例中,作为二进制数据的信息(例如010011100010)可使用三状态A,B,C编码,其中,0编码为A,1编码为B,00编码为C(只要00出现)(即,00不编码为AA)。根据此方案,二进制字010011100010等同于编码形式ABCBBBCABA。类似地,不同于二进制的数字数据形式或字母表(例如十六进制、十进制、ASCII等等)可同样通过与图29中所示类似的方案编码。这样的方法对于计算机科学领域的技术人员是公知的。比所示更复杂的方案,根据优化信息密度(例如Lempel-Ziv编码),能够将数据从一个字母表高效地转变和压缩到另一字母表中。
通常,为了将二进制或其他数字数据载荷串或串集合转变为DNA序列串或这种串的集合,许多无损和有损的编码或压缩方法(例如在计算机科学中公知的方法)可用于设计方案,用于将输入的数字数据载荷初步转变为DNA序列数据载荷,作为能够辨别的特征DNA区段的串,概括图29的示例。在此较宽应用环境中,图29中所示的BES方案例示出的特征元件类型可变为数据编码字母表的符号,例如标准碱基、修饰碱基、或序列基序或类组,这样的元件必须具有同源的读出器传感器。
在所示实施例中,传感器在传感器基序CCC,AA,G(在此分别表示为a、b、c)之间辨别,其中,二进制数据串根据无损或有损的数据编码或压缩方案被编码为这些符号,为串aabcacb。在此实施例中,串aabcacb将直接翻译碗DNA序列CCC,CCC,AA,G,CCC,G,AA。这些区段可然后直接转变为DNA数据载荷序列,在此情况下为CCCCCCAAGCCCGAA。
在特定变例中,可存在“标点”序列插入到能够辨别的信号特征之间,其不会改变能够辨别的特征,而可提供益处(例如适应DNA合成化学的特定性能或限制),或提供分隔用于在信号特征之间形成添加的时间分离,或改善DNA分子的次级结构。例如,如果T是这样的标点序列,则上述示例中的DNA编码序列将变为TCCCTCCCTAATGTCCCTGTAAT(即,标点T插入到各个序列区段CCC,CCC,AA,G,CCC,G,AA之间)。通常,插入这种标点序列或填充序列可为从数字数据载荷翻译到拟合成DNA编码序列的过程的一部分。
在本公开内容的各个方案中,所关注的DNA数据载荷通过多聚酶传感器多次处理,以提供来自DNA存储的更牢靠的数字数据恢复。在其他方案中,一批这种载荷平均被处理多次(某预计数量)。这些示例得益于通过聚集多次观测而更准确地估计能够辨别的编码特征。多次处理具有的益处还包括:克服基本泊松采样统计学可变性以确保所关注的数据载荷以高置信度采样并被观测至少一次、或至少某期望最小数量的次数。
在各种实施例中,这种重复询问的次数在1至约1000次的范围内,或在约10至约100次的范围内。这样的多次观测可包括:(i)通过多聚酶传感器观测相同的物理DNA分子,和/或(ii)一个或多个多聚酶传感器处理承载相同数据载荷的多个物理上有区别的DNA分子。在后一种情况下,这样的具有相同数据载荷的多个物理上有区别的DNA分子可为通过相同批量合成反应产生的DNA分子、从不同合成反应获得的目标在于相同数据载荷的分子、或者通过施加放大或复制方法(例如PCR、T7放大、滚环放大、或分子生物学领域技术人员公知的其他复制形式)产生的复制分子。这样的多次观测的聚集可以通过许多方法进行,例如平均或投票、最大似然估计、贝叶斯估计、隐藏马尔科夫方法、图线理论或优化方法、或深度学习神经网络方法。
在本公开内容的各个方案中,分子生物学方法能够使多聚酶传感器对相同的DNA分子数据载荷询问多次。模板架构的三种这样的实施例显示在图27B中。一种这样的方法是:使分子形成环(上图),例如通过端绑缚实现,并使用能够沿该环多次重复该过程的链移位多聚酶,由此产生对相同分子的多次读出。另一方法是:具有发夹双结构(中图),并使用链移位多聚酶而处理下链、沿发夹特征卷绕、和处理包括互补序列的分子上链(其在一些实施例中也可以提供与下链的能够辨别的信号相关的能够辨别的信号)。图27B的下图中所示的一种其他实施例为:构建具有数据载荷串联重复的模板分子,其中重复一次获多次,使得进行性酶将通过相同数据载荷的多个情形进行处理。
在本公开内容的各个实施例中,被存储于DNA中的数字数据以高速读出,例如接近1Gb/秒以恢复数字数据,如通过大规模磁带存储系统可实现的那样。由于聚合酶的最大处理速度在100~1000碱基/秒的范围内(根据类型而定),因而基于多聚酶的传感器的位恢复速率受限于相当的速度。这样,在各个实施例中,几百万个传感器以经济有效方式采用以实现所希望的数据读出能力。
在各种实施例中,多个独立分子传感器在此以CMOS芯片上的大规模传感器阵列的方式使用,这是最经济有效的半导体芯片制造工艺。图30A例示出可用于形成芯片上分子传感器批量化并行阵列的制造堆叠的实施例。在此示例中,传感器测量电路用作可扩充像素阵列作为CMOS芯片,纳米级别光刻过程用于制造纳米电极,分子自组装化学反应(在溶液中)用于在传感器阵列中的每个纳米电极上建立分子复合物。这种制造堆叠的结果是:完成的DNA读出器传感器阵列芯片,显示在图30A底部。在各种实施例中,纳米级别光刻使用高分辨率CMOS结(例如28nm、22nm、20nm、16nm、14nm、10nm、7nm或5nm的结)进行,以影响CMOS芯片制造的经济性。对照而言,像素电子结构可以通过更适合于混合信号装置的更粗糙的结(例如180nm、130nm、90nm、65nm、40nm、32nm或28nm)实现。可替代地,纳米电极可通过纳米制造领域技术人员公知的各种其他制造方法中的任一种制造,例如,电子束光刻、纳米压印光刻、离子束光刻、或先进影像光刻方法(例如极紫外或深紫外光刻、多图形、或相移掩模的任意组合)。
图30B例示出用于DNA序列化芯片的高级别CMOS芯片像素阵列架构的实施例(在图的左侧),包括可扩充的传感器像素阵列,具有相关联的功率和控制电路和主要模块,例如偏压、模拟-数字变换器、和时序。在图中的套图显示出作为小的桥结构的独立传感器像素,其中这种独立电子传感器位于传感器像素阵列中。图30B还例示出(在图的右侧)阵列中的分子电子传感器电路像素的实施例的细节。如图30B中所示,传感器像素包括:放大器、重置开关、和用于供应源、栅和漏电压的电路、和结果读数。在各种实施例中,单个像素电路包括:转移阻抗电流放大器、能够偏置的电压源、重置开关。图31在图的左侧详细显示出像素放大器的电路示意图的实施例,并在图的右侧的模拟结果中显示出用于测量10pA电流时的电压信号随时间变化,其中周期性施加重置,如图线中所示。此实施例例示出电路部件和参数的一种非限制性选择(晶体管、电阻器、电容器,等等)。
图32例示出注释芯片设计布局文件的实施例和用于比较的对应完成芯片的实施例。在图32的左侧是用于芯片设计的表现布局(GDS)文件的注释图像,包括:图30B的CMOS像素阵列(具有256像素),注释显示出芯片的偏压、阵列和解码器区域的位置。在图32的右侧是基于最终设计的对应完成芯片(在TSMC,Inc.半导体代工厂(San Jose,CA)生产,TSMC180nm CMOS处理,没有钝化层)的光学显微图像。
图33显示出图32的完成芯片的SEM图像,其中高分辨率图像进一步显示出80μm像素,用于读出系统,其包括:纳米电极和在电极之间就位的多聚酶分子复合物。在图33的左侧是CMOS芯片的SEM图像,其中没有顶钝化层和外露的平面化金属6层。中间的更高分辨率的图像清晰显示出80μm像素的子光学表面特征,尤其是外露的通孔(源、栅和漏),其中纳米电极通过后CMOS纳米制造处理步骤沉积并电连接到放大器电路中,如图30B的右部分中所示。图33中更右侧的SEM图像显示出电子束光刻制造的成对的分开的纳米电极,其中分子复合物就位。图33右下的简图例示出分子电子传感器,其包括多聚酶分子复合物,通过金点标记。
在DNA读出装置的各种实施例中,使用CMOS芯片装置并结合纳米级别制造技术,最终产生更低成本、高产出、快速、且可扩充的系统。例如,诸如此类的传感器可按照10个以上碱基/秒的速率(其为当前光学序列器的100倍以上)处理DNA模板。CMOS芯片技术的使用确保了可扩充性和可规模化生产格式的低系统成本,这影响到半导体产业的广大基础设施。应注意,无论何种错误模式或准确度限制存在于DNA传感器中或可出现在更快读出速度时(例如通过修饰酶或缓冲物或温度或环境因素、或在更低时间分辨率下的样本数据),其可在所述的整体编码器/解码器-读出器-写入器框架中进行补偿。
在本公开内容的各个实施例中,在此所使用的DNA读出器芯片包括:至少100万传感器、至少1000万传感器、至少1亿传感器、或至少10亿传感器。应认识到,典型的传感器数据采样速率为10kHz且每次测量记录1字节,则1亿传感器芯片以1兆兆字节(TB)/秒产生原始信号数据。考虑单个芯片上希望有多少传感器,则一个至关重要的考虑是:这种芯片可将存储于DNA中的数字数据解码的速率与所希望的数字数据读出速率相比的情况。例如,希望具有的读出速率高至约1GB/秒。应注意,被编码为DNA的数字数据的每个位将需要多个信号测量值以恢复(给定用于存储此信息的信号的特征),因而用于测得信号的此原始信号数据产生速率将比编码数字数据的恢复速率高得多。例如,如果需要10个信号测量值恢复1位存储数字数据(如可为例如图11中的信号特征的情况),则每个测量值是8位字节,也就是说,成倍的80位的信号数据用于恢复1位存储数字数据。这样,数字数据读出速率预计为传感器原始信号数据获取速率的1/100量级。为此原因,实现所希望的1GB/秒的数字数据读出速率将需要几乎0.1TB/秒的可用原始信号数据。进一步地,如果单个芯片中的并非所有传感器可产生可用数据,则基于从存储为DNA的数据恢复数字数据的所希望的最终速率,希望需要芯片产生高至1TB/秒的原始数据。在各种实施例中,这样的恢复速率对应于1亿传感器像素芯片。
在本公开内容的各个实施例中,在读出系统内采用多个芯片以实现所希望的系统级别的数字数据读出速率。图30A的DNA数据读出芯片在各种实施例中用作用于读出存储于DNA中的数字数据的完整系统的一部分。完整系统的实施例的各特征例示在图34中。在各个方案中,参见图34,完整的数字数据读出系统包括:主板,其具有集结区域用于多个芯片的阵列,以提供超过单个芯片限制的数据读出量。这样的芯片各自装容在流通池中,其中射流液体处理系统控制传感器系统液体试剂的添加和去除。此外,射流系统以溶液形式接纳DNA编码数据(源于数据储存源)。在各个方案中,主板进一步包括:适合的第一级数据处理单元,其能够以极高速率(例如超过1TB/秒、超过10TB/秒、超过100TB/秒)接收和减少原始信号数据,所示为初步信号处理器。这种初步处理器可包括:FPGA(现场可编程门阵列)、GPU(图形处理器)或DSP(数字信号处理器)装置中的一个、多个、或它们的组合、或者定制信号处理芯片,这可选地可随后设置类似这种信号处理器的级用于处理管线。这种初步管线的数据输出典型地传送到快速数据存储缓冲器(例如固态驱动器),由此的数据在基于CPU的子系统中经历进一步的处理或解码,数据从该子系统缓冲到较低速度的大存储缓冲器(例如硬盘驱动器或固态驱动器或这种驱动器的阵列)中。其由此传送到辅助数据传送计算机子系统,计算机子系统处理随后的解码数据传送到目的地。所有这些系统操作处于辅助控制计算机的高级别控制下,辅助控制计算机监测、协调和控制这些功能单元和处理的相互作用。
在各种实施例中,读出系统内的芯片可在特定的工作循环(例如24小时至48小时)之后弃置或更换。在其他实施例中,芯片可在这样的使用周期之后被修整就位,由此去除分子复合物和可能的轭合基团,然后通过一系列化学溶液暴露被更换为新的这种部件。去除过程可包括:使用施加于电极的电压以驱动去除,例如采用施加于电极的高电压、施加于电极的交流电压、或电压扫描。该处理还可包括:使用使这种基团变性、溶解或解离、或以其他方式消除的化学物,例如:高摩尔浓度脲、或胍或其他离散剂、蛋白酶(例如蛋白酶K)、酸(例如HCl)、碱(例如KOH或NaOH)、或者在分子生物学和生物化学中用于这种目的的公知的其他试剂。这种处理还可包括:使用所施加的温度或光驱动所述去除,例如采用高温或光结合于在分子复合物中能够光劈裂的基团或轭合基团。
图35例示出基于云的DNA数据档案存储系统的实施例,其中完整的读出系统(例如图34中所示)在特定实施例中采取聚集格式以提供整个档案存储和取回系统的云DNA读出服务器。图35的系统包括云计算机系统,其具有标准的存储格式(图示在图的左上部)。例如,标准云计算机系统包括如图所示的DNA档案数据存储能力。在各个方案中,基于云的DNA合成系统可接收来自云计算机的二进制数据并产生物理数据编码DNA分子。此服务器将输出的分子存储在DNA数据存储档案中(图示在图的右下部),其中编码数据的物理DNA分子在周围温度、冷却温度、或冷冻情况下以干燥或冻干形式存储、或存储在溶液中。当数据拟取回时,来自档案的DNA样本被提供到DNA数据读出服务器,服务器将解码的二进制数据输出回到主云计算机系统。这种DNA数据读出服务器在特定实施例中通过多个基于DNA读出器芯片的系统(例如在图34中所示)驱动,并结合执行对源自DNA的数据最终解码回到主云存储系统的原始数据格式的额外计算机。
在各种实施例中,分子电子传感器包括图36中所示的构造。在此情况下,基本电子测量通过纳米孔离子电流传感器(包括在膜两侧上的电极、位于膜中的孔、和停留在孔两侧上的水溶液相)进行。在此实施例中,孔调节离子电流(通过箭头和i指示)的通行。该孔可包括生物蛋白纳米孔(天然或突变的),该膜可包括类脂膜、或其合成类似物。该孔还可包括固态孔,其中该膜包括由实体材料(例如SiN或特氟隆)构成的加厚膜。该孔可具有相同极性或相反极性(如图所示)的电极。如图36中所示,多聚酶分子进一步与该孔复合,作为分子复合物(包含少量分子而嵌入穿过作为该孔的一部分的膜)的一部分,并提供与多聚酶的轭合。当多聚酶处理DNA模板时,通过该孔的离子电流通过此活性而调制,产生能够辨别的信号特征,对应于区别序列特征。除了不同的纳米电测量几何形状以外,其他考虑因素与本文中已经论述的情况相同。也就是说,基于多聚酶的DNS数字数据读出器的纳米孔电流传感器形式在此具有类似使用。
在各种实施例中,分子电子传感器包括图37中所示构造,其中多聚酶直接或专门轭合到孔,其中修饰dNTP用于从DNA序列特征产生能够辨别的信号,这与图23所示的用于纳米电极传感器的情形相当。对于在纳米孔传感器中产生信号而言,这样的dNTP修饰可包括:在dNTP的γ-磷酸酯上的基团,其可在dNTP经历通过多聚酶的合并时将孔闭塞,由此引起电流抑制特征。在各种实施例中,这样的修饰包括:将3-磷酸酯链延长到4、5、6或最长至12个磷酸酯,添加终端磷酸酯基团、或者在位置2或更多处的任意磷酸酯的基团,其可通过多聚酶合并而被去除,这样的基团包括可通过进入孔而闭塞孔的聚合物,例如包括PEG聚合物或DNA聚合物。多聚酶轭合到该孔可包括任一可行的轭合化学,例如分子系链、或者基于侦探-侦探捕获蛋白质的轭合系统,等等。对于图36和图37中所示的纳米孔传感器实施例,在图10B的应用环境中如前所述的本公开内容的所有方案也适用于此情况,以提供用于读出存储于DNA分子中的数字数据的基于纳米孔离子电流传感器的传感器,和相关的有益方案、编码方案、芯片格式、系统和基于云的DNA数字数据存储系统。
图10B的分子电子传感器的一个实施例(在图15中例示出概念)包括:碳纳米管,作为桥联分子(在图15中由水平粗条表示,桥接正负电极之间的间隙)。此实施例在图38中例示。在各个方案中,碳纳米管桥包括单或多壁的碳纳米管,并在特定部位使用多种可行轭合化学中的任意方式轭合到多聚酶分子。这样的轭合可例如包括:芘联结体(其通过纳米管上的芘的π-堆叠而附接到纳米管),或者可包括附接体(其附接到位于碳纳米管中的缺陷部位)。在这种情况下,通过碳纳米管分子线的电流已知为在周围环境中高敏感的其他分子,例如在图10A中所示。进一步已知的是,通过碳纳米管的电流对正确轭合到该碳纳米管的酶分子(包括聚合酶)的活性敏感。对于这种特定的实施例,如前所述的本公开内容的所有方案适用于这种情况,以提供基于碳纳米管的传感器用于读出存储于DNA分子中的数字数据,包括相关的有益方案、编码方案、芯片格式、系统和基于云的DNA数字数据存储系统。
产生光学信号的可替代的传感器是零模式波导传感器,例如图39中所示的传感器。这样的传感器可包括:如图所示的单个多聚酶,其轭合到金属井底部,在施加于薄衬底的激励场的短暂区中,采取全内反射模式。多聚酶设置有引发模板和dNTP,其中染料标签设置在能够裂开的磷酸酯基团上。当这样的dNTP合并时,染料标签保持在短暂区中,并被刺激发射对应染料能谱或颜色的光子。结果是:在适合条件下,这样的传感器可所示的能够辨别的光学信号,可用于将数字信息编码到DNA分子中。能够辨别的信号在此可为不同能量分布或颜色的光子发射、或具有不同能够辨别的频谱的发射、或频谱随时间的不同的持续时间或强度或形状、或引起能够辨别的特征的这种元素的任意组合。对于图39中所示的这种零模式波导传感器的实施例,在图10B的应用环境中如前所述的本公开内容的所有方案也适用于此情况,以提供用于读出存储于DNA分子中的数字数据的基于零模式波导的传感器,相关的有益方案、编码方案、芯片格式、系统和基于云的DNA数字数据存储系统也适用于这样的传感器。
DNA写入装置的优化
在各种实施例中,本公开内容的DNA信息存储系统进一步包括DNA写入装置,其能够将大量DNA序列并行写入为合成分子,其中,每个所希望的序列实施为多个合成分子,其中合成速率(或时间/碱基)尽可能快而使得写入DNA信息的总速率足够快,且容量足够高,用于大规模档案信息存储的实际应用。
当前的商业DNA合成基于传统的亚磷酰胺化学循环,相对较慢,每次碱基添加需要30分钟的量级。30分钟碱基添加循环的主体是:在延伸寡核苷酸链的远端上的5’-OH的酸调解脱保护。初始序列更长暴露于这些酸条件还由于脱嘌呤而形成序列错误的主要源。这种方法还受困于相对较低的相似度,在昂贵设备上在384多孔板中执行。该处理还由于在分步合成中的效率产出限制而受限于在长度上形成最多几百个碱基的序列。因此,这种方法最适合于形成小数量(1至1000)的相对较短(<~200碱基)DNA序列中的每个的更大量。
已开发出更高产量的商业DNA合成系统以支持DNA微阵列的原位合成。这样的系统实际上印刷原位合成DNA的大微点阵列,从而在一时刻以高度并行方式在各点上添加一个碱基。例如,Agilent的基于喷墨的DNA寡聚物阵列印刷机可将多至100万DNA点的阵列印刷到玻璃显微载片上,其中每个点的直径在20微米的量级,其中30微米的点到点块用于矩形点阵列。合成反应仍然相对较慢,在1碱基/小时的量级,DNA长度甚至比传统多孔板合成更受限制,实际长度最大约100碱基。不过,诸如此类的系统可在数天内合成总共约1亿DNA序列字母(~25MB),完成阵列的成本为数百美元,不过写入设备具有较高的资金成本和复杂度,使其从未商业化,这种DNA阵列的生产以集中工厂格式以有限资金进行。另外,如果其影响已有的喷墨技术(其自身已达到其渐进极限),则这种根据点/阵列的技术的未来升级可能已经处于渐进极限。
这样,对于大规模档案DNA存储,DNA写入装置显著较低的成本、更快的速度、和更低的资金成本是高度期望的。特别地,存储写入成本仍接近于$10/MB,远高于磁带存储写入的估计$0.02/GB(1/500,000或更低)。这样,写入DNA的成本需要大幅度下降以使常用的长期存储应用实用化,优选地下降几个量级,优选地下降为1/1,000,000。
为实现此目的,在本公开内容的特定实施例中,在此使用的DNA写入系统包括基于CMOS芯片的致动器阵列用于DNA合成。DNA写入器包括CMOS芯片,其中致动器像素阵列引导致动器特定电压/电流或光调解的5’-OH脱保护,由此,新的电压或光敏感的保护基团能够实现更快的脱保护动力学,且没有脱嘌呤错误。在各个方案中,芯片包括几百万至几十亿致动器像素。这样的像素可包括纳米电极和/或可选择的光源,在其周围进行DNA合成。施加于此电极的电压、或源于其的电流、或定位光致动,当一系列A,C,G,T,…循环添加反应在芯片上全面进行时,将控制每个5’-OH脱保护反应,其中,每个像素在每次循环过程中通过电压或电流或光而控制是否添加所供应的碱基。
CMOS芯片定标的使用支持在标准的低成本规模化生产的芯片上最终提供几十亿这样的合成部位的能力。定位电压/光致动也可用于加速合成化学和缩短循环时间,例如从约30分钟降至数秒。致动器电极可源自于化学层,将电压或电流转换为其他有用的电化学局部环境改变,例如提供电压生成的酸作为调制非传统亚磷酰胺合成化学的手段。在其他方案中,电压/电流可调制局部聚合物/分子矩阵结构(其中发生合成)的构象或空间或机械变化(其在物理上阻碍或允许碱基添加)。特别地,这种系统的一个实施例可在每个部位处具有微米或纳米井或容器,其装容生长的DNA寡聚物并可被致动以开启/关闭以物理选择性地控制碱基添加反应。添加的碱基也可包含电荷或其他修饰以利于使用电压或光引导和控制该处理。通过CMOS芯片升级以及电压或电流或光引导的亚磷酰胺合成循环合成增强,存在潜力大幅度增大规模和减小用于执行合成的过程和设施的成本。完成的DNA片断(对于每个部位的给定像素,由每个目标序列的多个范例构成)可通过支持后合成松脱,并聚汇到溶液中以形成物理档案。
在这种和其他DNA写入器实施例的应用环境中,编码/解码算法的选择可以最小化系统成本,特别是时间成本。例如,脱磷酸是缓慢的过程,一些碱基和序列(例如,嘌呤-胺,G和C的同质类组)由于化学或次级结构的影响而更难以合成。这提出的选项是:不驱动脱磷酸完成而以更多错误的代价节省时间,而且在编码序列中避免使用特定碱基成分(例如,在编码中不使用嘌呤、或不使用G类组,等等)以在没有主要添加错误负担的情况下允许更快的化学处理。以此方式,合成反应可加速,编码/解码算法可依照错误校正或错误避免编码而补偿。除了避免高错误序列模式以外,标准的错误校正码算法可校正DNA序列中的极高错误率,甚至高至50%或更多的极端错误率。在各个方案中,编码/解码共同优化DNA读出器和DNA写入器的性能,以优化整个系统性能、和/或通过一些所关注的成本措施(例如经济成本时间)减少整体系统成本。
DNA存储档案操作的优化
在特定方案中,DNA信息存储系统进一步包括:DNA存储档案。在DNA信息存储系统的各种实施例中,提供新的方式以实现所希望的与管理存储档案相关的操作。在本系统的各个实施例中,以下类型的操作可以执行:
-创建档案的拷贝;
-将数据附加到档案;
-从档案中读出目标卷;
-从档案中删除卷;或
-检索档案。
在各种实施例中,DNA档案包括DNA分子池,其中每个希望的DNA序列通过多个分子范例表现。这种DNA分子池可在干燥状态下存储,或者溶液相中存储,例如在低温下保持或冰冻存储。在特定示例中,档案可临时升高到工作温度在相容的缓冲溶液中执行这些操作。这些操作将通过物理存储系统(其可包括:冷冻机,冰箱,和用于管处理、液体处理、执行反应、和与保持和操控物理档案材料相关的其他进程的自动化装置)高效地执行。
在各种实施例中,在DNA存储档案中与存储相关的操作可实现如下:
拷贝:拷贝档案可包括:取原液的等份试样,或者,对于未耗尽的拷贝,通过在分子编码中包括放大引物部位、并在线性或指数放大反应中引发和放大,档案先于取等份试样作为拷贝。
附加:附加数据到档案或者合并档案可通过集入和混合于另外的DNA或者档案材料而实现。
目标读出/删除:在档案内通过各个“卷”工作可通过将序列特定的寡聚物结合部位编码到DNA分子中而执行,其中对于每个卷的不同的标识/结合序列被形成为能够访问。然后,为了读出特定卷,基于杂化的捕获可用于选出仅具有所希望结合序列的DNA片断。删除卷可通过减去杂化过程以去除具有给定结合序列的所有DNA片断而执行。在另一实施例中,删除可通过使用寡聚物引导的DNA劈裂/退化(特别是使用Cleavase、DICER或CRISPER用于寡聚物结合引导的目标分子破坏的酶方法)而执行。在又一实施例中,引物结合之后进行合成或连接反应可用于合并允许选择性破坏或去除的碱基或寡聚物,例如通过生物素标记元件(通过链霉亲和素柱去除)。卷标识也可通过合成具有核苷酸修饰的DNA而添加,使得相关的结合目标不通过DNA序列特定杂化自身实现,而是在用于合成的碱基上的其他修饰结构上。例如,使用生物素标记碱基或者具有各种半抗原修饰的碱基等等,通过对于特意引入到合成中的这些修饰结构的对应相互作用配对,类似地提供选择性能力以结合或操控DNA子组。
检索:对于文字输入串的档案检索可通过以下方式实现:将关注的检索串编码到DNA形式中,合成互补形式或相关引物用于所希望的DNA序列,使用杂化或PCR放大以对于这些所希望序列片断的存在而测定档案,根据这种标准测定(分子生物学领域普通技术人员所用)查明DNA片断复合池中的序列区段的存在情况。检索可报告存在或不存在,或者可恢复包含检索串的相关联片断用于完整读出。

Claims (24)

1.一种信息存储系统,包括:
写入装置,用于合成对成组信息编码的核苷酸序列;
读出装置,用于解读所述核苷酸序列,通过将所解读的核苷酸序列解码为所述成组信息实现;
其中所述读出装置包括分子电子传感器,所述传感器包括一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中所述分子复合物包括桥联分子和探针分子;
其中所述分子电子传感器产生当解读所述核苷酸序列时在所述分子电子传感器的可测的电参数中的能够辨别的信号。
2.根据权利要求1所述的系统,其中所述成组信息是二进制的。
3.根据权利要求1所述的系统,其中所述核苷酸序列包括脱氧核糖核酸DNA序列。
4.根据权利要求3所述的系统,进一步包括在所述DNA序列内的错误探测方案或错误校正方案中的至少一种。
5.根据权利要求4所述的系统,其中所述错误探测方案选自:重复码、校验位、校验和、循环冗余校验、加密散列函数、汉明码;并且所述错误校正方案选自:自动重传请求、卷积码、分组码、混合自动重传请求、里德所罗门码。
6.根据权利要求1所述的系统,其中所述写入装置包括用于DNA合成的致动器像素的基于互补金属氧化物半导体CMOS芯片的阵列,所述致动器像素引导包括亚磷酰胺或连接化学的DNA合成反应内的电压/电流或光调解的脱保护。
7.根据权利要求1所述的系统,其中所述探针分子包括聚合酶,并且其中所述传感器的所述可测的电参数通过所述聚合酶的酶活性调制。
8.根据权利要求7所述的系统,其中所述聚合酶包括:天然聚合酶或基因工程聚合酶,选自Klenow、Phi29、TAQ、BST、T7,或者逆转录酶。
9.根据权利要求7所述的系统,其中所述读出装置进一步包括:缓冲溶液、用于测量所述可测电参数的操作参数、和DNA模板分子的两个或更多个序列区段,所述序列区段当以所述多聚酶处理时在通过所述缓冲溶液和所述操作参数提供的条件下执行时产生在所述可测电参数中的能够辨别的信号。
10.根据权利要求9所述的系统,其中所述缓冲溶液包括修饰脱氧核糖核苷酸三磷酸dNTP。
11.根据权利要求9所述的系统,其中所述DNA模板分子的产生所述能够辨别的信号的所述序列区段包括以下中的任一项或不同项的组合:DNA碱基,修饰DNA碱基,DNA碱基类似物,多碱基序列或基序,或者DNA碱基的均聚物类组。
12.根据权利要求1所述的系统,其中所述传感器的所述可测电参数包括在所述分开的电极之间而且通过所述分子复合物的源漏电流。
13.根据权利要求1所述的系统,其中所述分子电子传感器是CMOS传感器阵列芯片的一部分,所述CMOS传感器阵列芯片进一步包括多个分子电子传感器并支持执行所述可测电参数的测量的像素电路。
14.根据权利要求1所述的系统,其中所述分子电子传感器进一步包括栅电极,其邻近于所述分开的电极。
15.根据权利要求1所述的系统,其中所述桥联分子包括:双链DNA齐聚物、蛋白质阿尔法螺旋、石墨烯纳米带、碳纳米管、抗体、或抗体的Fab臂。
16.一种解读在核苷酸序列中编码的成组信息的方法,所述方法包括:
将所述核苷酸序列供应到分子电子传感器,所述分子电子传感器能够产生相关于所述成组信息的、在所述分子电子传感器的可测的电参数中的能够辨别的信号;
生成所述能够辨别的信号;
将所述能够辨别的信号转换为所述成组信息;
其中所述分子电子传感器包括一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中所述分子复合物包括桥联分子和探针分子。
17.根据权利要求16所述的方法,其中所述成组信息是二进制的。
18.根据权利要求16所述的方法,其中所述核苷酸序列包括脱氧核糖核酸DNA序列。
19.一种将成组信息编码到核苷酸序列中的方法,所述方法包括:
提供成组信息;
将所述成组信息转换为一个或多个预定核苷酸,所述预定核苷酸能够使用编码方案产生在分子电子传感器的可测电参数中的能够辨别的信号;
将所述一个或多个核苷酸组装到所述核苷酸序列中。
20.根据权利要求19所述的方法,其中能够产生能够辨别的信号的所述一个或多个预定核苷酸包括:与相同核苷酸的变体相比抵制次级结构形态的核苷酸。
21.根据权利要求19所述的方法,其中转换所述成组信息包括:使用二进制编码方案(BES)。
22.根据权利要求21所述的方法,其中所述BES包括:BES1、BES2、BES3、BES4、BES5、BES6中的任意一种或多种。
23.根据权利要求19所述的方法,其中所述分子电子传感器包括一对分开的电极和附接到每个电极的分子复合物以形成分子电子电路,其中所述分子复合物包括桥联分子和探针分子;并且其中所述分子电子传感器产生当解读所述核苷酸序列时在所述分子电子传感器的可测的电参数中的能够辨别的信号。
24.根据权利要求19所述的方法,其中所述成组信息是二进制的。
CN201880016800.9A 2017-01-10 2018-01-10 用于dna数据存储的方法和系统 Pending CN110431148A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762444656P 2017-01-10 2017-01-10
US62/444,656 2017-01-10
US201762547692P 2017-08-18 2017-08-18
US62/547,692 2017-08-18
PCT/US2018/013140 WO2018132457A1 (en) 2017-01-10 2018-01-10 Methods and systems for dna data storage

Publications (1)

Publication Number Publication Date
CN110431148A true CN110431148A (zh) 2019-11-08

Family

ID=62839566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880016800.9A Pending CN110431148A (zh) 2017-01-10 2018-01-10 用于dna数据存储的方法和系统

Country Status (6)

Country Link
US (2) US10902939B2 (zh)
EP (1) EP3568407A4 (zh)
KR (1) KR102622275B1 (zh)
CN (1) CN110431148A (zh)
CA (1) CA3052062A1 (zh)
WO (1) WO2018132457A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111724841A (zh) * 2020-06-04 2020-09-29 中国科学院上海微系统与信息技术研究所 一种基于生物蛋白的信息存储方法
CN112288089A (zh) * 2020-09-28 2021-01-29 清华大学 阵列式核酸信息存储方法及装置
CN113096742A (zh) * 2021-04-14 2021-07-09 湖南科技大学 一种dna信息存储并行寻址写入方法及系统
WO2022120626A1 (zh) * 2020-12-09 2022-06-16 中国科学院深圳先进技术研究院 基于dna的数据存储方法、数据恢复方法、装置及终端设备
CN115409174A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109071212A (zh) 2016-01-28 2018-12-21 罗斯韦尔生物技术股份有限公司 使用大规模分子电子传感器阵列测量分析物的方法和装置
WO2017132567A1 (en) 2016-01-28 2017-08-03 Roswell Biotechnologies, Inc. Massively parallel dna sequencing apparatus
EP3414784B1 (en) 2016-02-09 2021-04-14 Roswell Biotechnologies, Inc Electronic label-free dna and genome sequencing
US10597767B2 (en) 2016-02-22 2020-03-24 Roswell Biotechnologies, Inc. Nanoparticle fabrication
US9829456B1 (en) 2016-07-26 2017-11-28 Roswell Biotechnologies, Inc. Method of making a multi-electrode structure usable in molecular sensing devices
WO2018039938A1 (zh) * 2016-08-30 2018-03-08 清华大学 将数据进行生物存储并还原的方法
KR102521152B1 (ko) 2016-11-16 2023-04-13 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터 저장용 시스템
US10650312B2 (en) 2016-11-16 2020-05-12 Catalog Technologies, Inc. Nucleic acid-based data storage
KR102622275B1 (ko) 2017-01-10 2024-01-05 로스웰 바이오테크놀로지스 인코포레이티드 Dna 데이터 저장을 위한 방법들 및 시스템들
KR20230158636A (ko) 2017-01-19 2023-11-20 로스웰 바이오테크놀로지스 인코포레이티드 2차원 레이어 재료를 포함하는 솔리드 스테이트 시퀀싱 디바이스들
CA3057151A1 (en) 2017-04-25 2018-11-01 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
US10508296B2 (en) 2017-04-25 2019-12-17 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
CA3057155A1 (en) 2017-05-09 2018-11-15 Roswell Biotechnologies, Inc. Binding probe circuits for molecular sensors
US11612873B2 (en) 2017-05-31 2023-03-28 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
US11174512B2 (en) 2017-05-31 2021-11-16 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
EP3630350A4 (en) * 2017-05-31 2021-03-31 Molecular Assemblies, Inc. HOMOPOLYMIC ENCODED NUCLEIC ACID STORAGE
CN111373049A (zh) * 2017-08-30 2020-07-03 罗斯威尔生命技术公司 用于dna数据存储的进行性酶分子电子传感器
US10810495B2 (en) * 2017-09-20 2020-10-20 University Of Wyoming Methods for data encoding in DNA and genetically modified organism authentication
WO2019075100A1 (en) 2017-10-10 2019-04-18 Roswell Biotechnologies, Inc. METHODS, APPARATUS AND SYSTEMS FOR STORING DNA DATA WITHOUT AMPLIFICATION
KR20200132921A (ko) 2018-03-16 2020-11-25 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터를 저장하기 위한 화학적 방법들
KR102138864B1 (ko) * 2018-04-11 2020-07-28 경희대학교 산학협력단 Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법
CA3100529A1 (en) 2018-05-16 2019-11-21 Catalog Technologies, Inc. Compositions and methods for nucleic acid-based data storage
US11221966B2 (en) * 2018-06-05 2022-01-11 Arizona Board Of Regents On Behalf Of The University Of Arizona Method and system for biological information pattern storage and readout
US20200185057A1 (en) * 2018-08-03 2020-06-11 Catalog Technologies, Inc. Systems and methods for storing and reading nucleic acid-based data with error protection
US11621345B2 (en) * 2018-08-14 2023-04-04 Pawan Tyagi Systems and methods of fabricating gate electrode on trenched bottom electrode based molecular spintronics device
EP3904527A4 (en) * 2018-12-26 2022-08-10 BGI Shenzhen METHOD AND APPARATUS FOR FIXED-POINT EDITING OF A DATA-STORED NUCLEOTIDE SEQUENCE
CA3128358A1 (en) * 2019-01-30 2020-08-06 Arizona Board Of Regents On Behalf Of Arizona State University Bioelectronic circuits, systems and methods for preparing and using them
EP3931342A4 (en) * 2019-03-01 2023-07-12 Universal Sequencing Technology DEVICE AND METHOD FOR IDENTIFICATION OF BIOPOLYMERS
JP2022531790A (ja) 2019-05-09 2022-07-11 カタログ テクノロジーズ, インコーポレイテッド Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作
GB201907460D0 (en) 2019-05-27 2019-07-10 Vib Vzw A method of storing information in pools of nucleic acid molecules
US11710538B2 (en) * 2019-06-07 2023-07-25 Microsoft Technology Licensing, Llc Efficient polymer synthesis
CA3140279A1 (en) * 2019-06-20 2020-12-24 Arizona Board Of Regents On Behalf Of Arizona State University Direct electrical readout of nucleic acid sequences
US11535842B2 (en) 2019-10-11 2022-12-27 Catalog Technologies, Inc. Nucleic acid security and authentication
US20230040158A1 (en) * 2019-11-27 2023-02-09 Technion Research And Development Foundation Ltd. Molecular data storage systems and methods
CN111091876B (zh) * 2019-12-16 2024-05-17 中国科学院深圳先进技术研究院 一种dna存储方法、系统及电子设备
US11913070B2 (en) 2020-02-28 2024-02-27 Arizona Board Of Regents On Behalf Of Arizona State University Methods for sequencing biopolymers
CN111681290B (zh) * 2020-04-21 2023-08-15 华中科技大学鄂州工业技术研究院 一种基于dna编码技术的图片存储方法
WO2021231493A1 (en) 2020-05-11 2021-11-18 Catalog Technologies, Inc. Programs and functions in dna-based data storage
FR3110177A1 (fr) * 2020-05-15 2021-11-19 Université De Bretagne Sud procédé et dispositif de décodage de données stockées dans un système de stockage à base d'ADN
WO2022266398A1 (en) * 2021-06-16 2022-12-22 Roswell Biotechnologies, Inc. Method, system and apparatus for single molecule measurements of binding kinetic and enzyme activities using molecular electronic sensors
WO2024076044A1 (ko) * 2022-10-06 2024-04-11 이근우 Dna 인코딩 및 디코딩 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050172199A1 (en) * 2004-02-03 2005-08-04 Phonex Broadband Corporation. Reliable method and system for efficiently transporting dynamic data across a network
US20070207487A1 (en) * 2006-01-25 2007-09-06 Emig Christopher J Photoelectrochemical synthesis of high density combinatorial polymer arrays
WO2016210386A1 (en) * 2015-06-25 2016-12-29 Roswell Biotechnologies, Inc Biomolecular sensors and methods

Family Cites Families (248)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0233981Y2 (zh) 1986-05-13 1990-09-12
US5082627A (en) 1987-05-01 1992-01-21 Biotronic Systems Corporation Three dimensional binding site array for interfering with an electrical field
US5486449A (en) 1989-02-07 1996-01-23 Rohm Co., Ltd. Photomask, photoresist and photolithography for a monolithic IC
GB2244135B (en) 1990-05-04 1994-07-13 Gen Electric Co Plc Sensor devices
US6051380A (en) 1993-11-01 2000-04-18 Nanogen, Inc. Methods and procedures for molecular biological analysis and diagnostics
IL103674A0 (en) 1991-11-19 1993-04-04 Houston Advanced Res Center Method and apparatus for molecule detection
US5414588A (en) 1993-09-20 1995-05-09 The Regents Of The University Of California High performance capacitors using nano-structure multilayer materials fabrication
US5366140A (en) 1993-09-30 1994-11-22 Minnesota Mining And Manufacturing Company Patterned array of uniform metal microbeads
US5871918A (en) 1996-06-20 1999-02-16 The University Of North Carolina At Chapel Hill Electrochemical detection of nucleic acid hybridization
US5583359A (en) 1995-03-03 1996-12-10 Northern Telecom Limited Capacitor structure for an integrated circuit
US6673533B1 (en) 1995-03-10 2004-01-06 Meso Scale Technologies, Llc. Multi-array multi-specific electrochemiluminescence testing
US5639507A (en) 1995-05-03 1997-06-17 Avx Corporation Method of making a planar multi-layer capacitor
CA2238003C (en) 1995-12-01 2005-02-22 Innogenetics N.V. Impedimetric detection system and method of production thereof
US6033582A (en) 1996-01-22 2000-03-07 Etex Corporation Surface modification of medical implants
US5881184A (en) 1996-05-22 1999-03-09 Eastman Kodak Company Active pixel sensor with single pixel reset
US6506564B1 (en) 1996-07-29 2003-01-14 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US6202471B1 (en) 1997-10-10 2001-03-20 Nanomaterials Research Corporation Low-cost multilaminate sensors
US6110354A (en) 1996-11-01 2000-08-29 University Of Washington Microband electrode arrays
US5767687A (en) 1996-11-29 1998-06-16 Geist; Jon Surface-capacitor type condensable-vapor sensor
US6706473B1 (en) 1996-12-06 2004-03-16 Nanogen, Inc. Systems and devices for photoelectrophoretic transport and hybridization of oligonucleotides
US7169272B2 (en) 1997-04-30 2007-01-30 Board Of Trustees Of The University Of Arkansas Microfabricated recessed disk microelectrodes: characterization in static and convective solutions
US5982018A (en) 1997-05-23 1999-11-09 Micron Technology, Inc. Thin film capacitor coupons for memory modules and multi-chip modules
FR2764386B1 (fr) 1997-06-06 1999-07-16 Commissariat Energie Atomique Support d'electrodes comportant au moins une electrode recouverte par un depot et systeme de lecture de ce support
JP2000033712A (ja) 1997-09-30 2000-02-02 Seiko Epson Corp マイクロセンサーデバイス作成方法及びそれを用いた液体機能評価方法
US6123819A (en) 1997-11-12 2000-09-26 Protiveris, Inc. Nanoelectrode arrays
US6537747B1 (en) * 1998-02-03 2003-03-25 Lucent Technologies Inc. Data transmission using DNA oligomers
US6060023A (en) 1998-03-31 2000-05-09 Motorola, Inc. Molecular sensing apparatus
JP2002517300A (ja) 1998-06-10 2002-06-18 ジョージア テック リサーチ コーポレイション 微小針デバイスおよび製造方法ならびにそれらの使用
AU6412799A (en) 1998-10-05 2000-04-26 Mosaic Technologies Reverse displacement assay for detection of nucleic acid sequences
US6094335A (en) 1998-10-09 2000-07-25 Advanced Micro Devices, Inc. Vertical parallel plate capacitor
AU2640099A (en) 1999-02-25 2000-09-14 Seiko Epson Corporation Structure member excellent in water-repellency and manufacturing method thereof
US6517669B2 (en) 1999-02-26 2003-02-11 Micron Technology, Inc. Apparatus and method of detecting endpoint of a dielectric etch
JP4555484B2 (ja) 1999-04-07 2010-09-29 デニス マイケル コノリー 高解像度のdna検出の方法および装置
DE19916921A1 (de) 1999-04-14 2000-10-19 Fraunhofer Ges Forschung Elektrisches Sensorarray
US7122152B2 (en) 1999-05-10 2006-10-17 University Of Florida Spatiotemporal and geometric optimization of sensor arrays for detecting analytes fluids
WO2001029550A1 (fr) 1999-10-20 2001-04-26 Shigeori Takenaka Puce detecteur de genes, detecteur et methode de detection
DE19960076C2 (de) 1999-12-13 2002-12-05 November Ag Molekulare Medizin Verfahren und Vorrichtung zum Nachweis und zur Quantifizierung von Biomolekülen
US20020090649A1 (en) 1999-12-15 2002-07-11 Tony Chan High density column and row addressable electrode arrays
DE10015818A1 (de) 2000-03-30 2001-10-18 Infineon Technologies Ag Biosensor und Verfahren zum Ermitteln makromolekularer Biopolymere mit einem Biosensor
AU2001252973A1 (en) 2000-04-17 2001-10-30 Purdue Research Foundation Biosensor and related method
AU2001261145B2 (en) 2000-05-03 2005-08-11 The United States Government, As Represented By The Department Of The Navy Biological identification system with integrated sensor chip
FR2811316B1 (fr) 2000-07-06 2003-01-10 Saint Gobain Substrat texture transparent et procedes pour l'obtenir
US6670131B2 (en) 2000-11-30 2003-12-30 Kabushiki Kaisha Toshiba Nucleic acid detection method and apparatus, and vessel for detecting nucleic acid
NL1016779C2 (nl) 2000-12-02 2002-06-04 Cornelis Johannes Maria V Rijn Matrijs, werkwijze voor het vervaardigen van precisieproducten met behulp van een matrijs, alsmede precisieproducten, in het bijzonder microzeven en membraanfilters, vervaardigd met een dergelijke matrijs.
DE10063739B4 (de) 2000-12-21 2009-04-02 Ferro Gmbh Substrate mit selbstreinigender Oberfläche, Verfahren zu deren Herstellung und deren Verwendung
WO2002079514A1 (en) 2001-01-10 2002-10-10 The Trustees Of Boston College Dna-bridged carbon nanotube arrays
US6749731B2 (en) 2001-01-31 2004-06-15 Kyocera Corporation Gene detection chip and detection device
KR100878281B1 (ko) 2001-03-14 2009-01-12 유니버시티 오브 매사츄세츠 나노 제조
DE10113550A1 (de) 2001-03-20 2002-10-02 Infineon Technologies Ag Verfahren zum Erfassen von makromolekularen Biopolymeren mittels einer Elektrodenanordnung
US6824974B2 (en) 2001-06-11 2004-11-30 Genorx, Inc. Electronic detection of biological molecules using thin layers
AU2002363627A1 (en) 2001-06-11 2003-05-26 Genorx, Inc. Electronic detection of biological molecules using thin layers
US20040023253A1 (en) 2001-06-11 2004-02-05 Sandeep Kunwar Device structure for closely spaced electrodes
US7297494B2 (en) 2001-06-25 2007-11-20 Georgia Tech Research Corporation Activatable probes and methods for in vivo gene detection
WO2003006103A2 (en) 2001-07-12 2003-01-23 Merck & Co., Inc. Electrical field stimulation of eukaryotic cells
US6483125B1 (en) 2001-07-13 2002-11-19 North Carolina State University Single electron transistors in which the thickness of an insulating layer defines spacing between electrodes
US20030040000A1 (en) 2001-08-08 2003-02-27 Connolly Dennis M. Methods for attaching nucleic acid molecules to electrically conductive surfaces
US6861224B2 (en) 2001-11-02 2005-03-01 Fujitsu Limited Protein detecting device
JP2006501486A (ja) 2002-05-14 2006-01-12 ナノスフェアー インコーポレイテッド Dnaハイブリダイゼーションおよび特異的結合事象の電気的検出
US20030224387A1 (en) 2002-05-22 2003-12-04 Sandeep Kunwar Association of molecules with electrodes of an array of electrodes
US7377948B2 (en) 2002-06-05 2008-05-27 Reveo, Inc. Layered electrochemical cell and manufacturing method therefor
EP1376111A1 (en) 2002-06-24 2004-01-02 Universite Catholique De Louvain Method and device for high sensitivity detection of the presence of DNA and other probes
JP4196947B2 (ja) 2002-07-02 2008-12-17 パナソニック株式会社 バイオセンサ,バイオセンサチップ及びバイオセンサ装置
US6755423B2 (en) 2002-07-17 2004-06-29 Li Jiun Chiu Tool coupling device for changeable tool members
US7470533B2 (en) 2002-12-20 2008-12-30 Acea Biosciences Impedance based devices and methods for use in assays
DE10242560A1 (de) 2002-09-13 2004-03-25 Creavis Gesellschaft Für Technologie Und Innovation Mbh Herstellung von selbstreinigenden Oberflächen auf textilen Beschichtungen
US20040063100A1 (en) 2002-09-30 2004-04-01 Wang Chung Lin Nanoneedle chips and the production thereof
DE10247679A1 (de) 2002-10-12 2004-04-22 Fujitsu Ltd., Kawasaki Halbleitergrundstruktur für Molekularelektronik und Molekularelektronik-basierte Biosensorik
US7183055B2 (en) 2002-11-01 2007-02-27 Wisconsin Alumni Research Foundation Direct radio-frequency detection of nucleotide hybridization at microelectrodes
CA2516820A1 (en) 2003-02-07 2004-11-18 Wisconsin Alumni Research Foundation Nanocylinder-modified surfaces
US7172917B2 (en) 2003-04-17 2007-02-06 Robert Bosch Gmbh Method of making a nanogap for variable capacitive elements, and device having a nanogap
JP4871726B2 (ja) 2003-04-28 2012-02-08 ナノシス・インク. 超疎液性表面、その作製法及び用途
WO2004096986A2 (en) 2003-04-29 2004-11-11 Integrated Nano-Technologies, Llc Method for quantitative detection of nucleic acid molecules
JP4059181B2 (ja) 2003-09-29 2008-03-12 株式会社村田製作所 多端子型積層セラミック電子部品の製造方法
JP2005109269A (ja) 2003-09-30 2005-04-21 Hitachi Ltd 半導体放射線検出器及び半導体放射線撮像装置
US7132298B2 (en) 2003-10-07 2006-11-07 Hewlett-Packard Development Company, L.P. Fabrication of nano-object array
KR20070001881A (ko) 2003-11-20 2007-01-04 바이오원, 엘엘씨 생물학적 물질 검출 방법 및 장치
WO2005108612A2 (en) 2003-11-28 2005-11-17 Genorx, Inc. Nanoscale biosensor device, system and technique
US7901629B2 (en) 2003-12-16 2011-03-08 Dynabyte Informationssysteme Gmbh Cartridge device for blood analysis
DE10359173B4 (de) 2003-12-17 2006-11-09 Robert Bosch Gmbh Messvorrichtung mit mehreren auf einem Substrat angeordneten potentiometrischen Elektrodenpaaren
US20050247573A1 (en) 2004-03-23 2005-11-10 Hideaki Nakamura Biosensors
US8354066B2 (en) 2004-03-24 2013-01-15 Technion Research & Development Foundation Ltd. Artificial receptors
US20050221473A1 (en) 2004-03-30 2005-10-06 Intel Corporation Sensor array integrated circuits
US20060019273A1 (en) 2004-05-12 2006-01-26 Connolly Dennis M Detection card for analyzing a sample for a target nucleic acid molecule, and uses thereof
US7385295B2 (en) 2004-06-24 2008-06-10 California Institute Of Technology Fabrication of nano-gap electrode arrays by the construction and selective chemical etching of nano-crosswire stacks
US7265019B2 (en) 2004-06-30 2007-09-04 International Business Machines Corporation Elastomeric CMOS based micro electromechanical varactor
US7258731B2 (en) 2004-07-27 2007-08-21 Ut Battelle, Llc Composite, nanostructured, super-hydrophobic material
US7150904B2 (en) 2004-07-27 2006-12-19 Ut-Battelle, Llc Composite, ordered material having sharp surface features
US7655275B2 (en) 2004-08-02 2010-02-02 Hewlett-Packard Delopment Company, L.P. Methods of controlling flow
US20060029808A1 (en) 2004-08-06 2006-02-09 Lei Zhai Superhydrophobic coatings
EP1630127B1 (en) 2004-08-31 2008-09-10 STMicroelectronics S.r.l. Method for realising a hosting structure of nanometric elements
EP1630882B1 (en) 2004-08-31 2012-05-02 STMicroelectronics S.r.l. Nanometric structure and corresponding manufacturing method
DE102004042729B4 (de) 2004-09-03 2018-02-01 Robert Bosch Gmbh Bio-Chip mit einem Elektrodenarray auf einem Substrat
US20070048748A1 (en) 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
US7507320B2 (en) 2004-10-09 2009-03-24 Academia Sinica Single-atom tip and preparation method thereof
KR20070045255A (ko) 2004-10-14 2007-05-02 가부시끼가이샤 도시바 Fet-기반의 핵산 검출 센서
US7785785B2 (en) 2004-11-12 2010-08-31 The Board Of Trustees Of The Leland Stanford Junior University Charge perturbation detection system for DNA and other molecules
US7541004B2 (en) 2004-11-12 2009-06-02 Predict, Inc. MEMS-based sensor for lubricant analysis
DE102004060738B4 (de) 2004-12-15 2008-07-03 Forschungszentrum Jülich GmbH Verfahren zum strukturierten Aufbringen von Molekülen auf eine Leiterbahn
WO2006102292A2 (en) 2005-03-21 2006-09-28 The Trustees Of The University Of Pennsylvania Nanogaps: methods and devices containing same
WO2006102905A1 (en) 2005-03-31 2006-10-05 Gregersen Enterprises 2005 Aps Apparatus and method for a global model of hollow internal organs including the determination of cross-sectional areas and volume in internal hollow organs and wall properties
US7985451B2 (en) 2005-04-01 2011-07-26 Clemson University Method of manufacturing ultrahydrophobic substrates
WO2006130535A2 (en) 2005-06-02 2006-12-07 Michigan State University Methods to increase dynamic range and improve quantitative analysis in rapid biosensors
US7417418B1 (en) 2005-06-14 2008-08-26 Ayliffe Harold E Thin film sensor
WO2007053242A2 (en) 2005-09-19 2007-05-10 Wayne State University Transparent hydrophobic article having self-cleaning and liquid repellant features and method of fabricating same
FR2893266B1 (fr) 2005-11-14 2007-12-21 Commissariat Energie Atomique Produit superhydrophile ou superhydrophobe, procede pour sa realisation et utilisation de ce produit
KR100757389B1 (ko) 2005-12-06 2007-09-11 한국전자통신연구원 나노갭 전극을 갖는 센서 및 그 제조 방법
EP1977444A4 (en) 2005-12-15 2009-05-13 Univ Columbia MEASURING ARRANGEMENTS FROM MOLECULAR ELECTRONIC ARRANGEMENTS
US8706219B2 (en) 2005-12-22 2014-04-22 Board Of Regents, The University Of Texas System Method and apparatus for monitoring an organ of a patient
US7649198B2 (en) 2005-12-28 2010-01-19 Industrial Technology Research Institute Nano-array and fabrication method thereof
US20090018249A1 (en) 2006-01-30 2009-01-15 Subbareddy Kanagasabapathy Hydrophobic self-cleaning coating compositions
US20070184247A1 (en) 2006-02-03 2007-08-09 Simpson John T Transparent, super-hydrophobic, disordered composite material
EP2002248A1 (en) 2006-03-17 2008-12-17 Element Six Limited Microelectrode array
US20090011222A1 (en) 2006-03-27 2009-01-08 Georgia Tech Research Corporation Superhydrophobic surface and method for forming same
US20070227300A1 (en) 2006-03-31 2007-10-04 Quantumsphere, Inc. Compositions of nanometal particles containing a metal or alloy and platinum particles for use in fuel cells
US20070231542A1 (en) 2006-04-03 2007-10-04 General Electric Company Articles having low wettability and high light transmission
GB2437328A (en) 2006-04-10 2007-10-24 Cambridge Display Tech Ltd Electric devices and methods of manufacture
GB0607205D0 (en) 2006-04-10 2006-05-17 Diagnoswiss Sa Miniaturised biosensor with optimized anperimetric detection
US20090162927A1 (en) 2006-05-31 2009-06-25 Yeda Research And Development Company Ltd. Nanotubes and nanowires based electronic devices and method of fabrication thereof
JP2008026109A (ja) 2006-07-20 2008-02-07 Fujifilm Corp 微細構造体及びその製造方法、センサデバイス及びラマン分光用デバイス
US8394590B2 (en) 2006-08-02 2013-03-12 California Institute Of Technology Capture agents and related methods and systems for detecting and/or sorting targets
WO2008020813A1 (en) 2006-08-16 2008-02-21 Agency For Science, Technology And Research Method of electrically detecting a biological analyte molecule
ITTO20060774A1 (it) 2006-10-27 2008-04-28 St Microelectronics Srl Sensore microelettromeccanico avente molteplici valori di fondo scala e di sensibilita'
JP4986138B2 (ja) 2006-11-15 2012-07-25 独立行政法人産業技術総合研究所 反射防止構造を有する光学素子用成形型の製造方法
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
GB0625070D0 (en) 2006-12-15 2007-01-24 Imp Innovations Ltd Characterization of molecules
KR100854486B1 (ko) 2007-04-05 2008-08-26 한국기계연구원 초발수 표면 제조 방법
AT505495A1 (de) 2007-07-04 2009-01-15 Arc Austrian Res Centers Gmbh Verfahren zur identifizierung und quantifizierung von organischen und biochemischen substanzen
US8278188B2 (en) 2007-07-19 2012-10-02 University of Pittsburgh—of the Commonwealth System of Higher Education Manipulation, detection, and assay of small scale biological particles
US8698481B2 (en) 2007-09-12 2014-04-15 President And Fellows Of Harvard College High-resolution molecular sensor
US20100285601A1 (en) 2007-09-28 2010-11-11 Agency For Science, Technology And Research Method of electrically detecting a nucleic acid molecule
WO2009070796A1 (en) 2007-11-29 2009-06-04 President And Fellows Of Harvard College Assembly and deposition of materials using a superhydrophobic surface structure
WO2009082706A1 (en) 2007-12-21 2009-07-02 The Trustees Of Columbia University In The City Of New York Active cmos sensor array for electrochemical biomolecular detection
US8372585B2 (en) 2007-12-31 2013-02-12 Intel Corporation Electronic sensing for nucleic acid sequencing
WO2009131724A2 (en) 2008-01-24 2009-10-29 Massachusetts Institute Of Technology Insulated nanogap devices and methods of use thereof
US8183648B2 (en) 2008-01-25 2012-05-22 Ut-Battelle, Llc Nanoscopic electrode molecular probes
CN101231287B (zh) 2008-02-22 2011-09-14 东南大学 外场诱导电极中排列纳米颗粒制备生物传感器的方法
US20090297913A1 (en) 2008-03-25 2009-12-03 The University Of Georgia Research Foundation, Inc. Nanostructure-Enhanced stereo-electrodes for fuel cells and biosensors
EP2297572A2 (en) 2008-06-19 2011-03-23 Plexigen, Inc. Multi-dimensional fluid sensors and related detectors and methods
US7970332B2 (en) 2008-06-30 2011-06-28 Xerox Corporation Oil less fusing using nano/micro textured fusing surfaces
US10670559B2 (en) 2008-07-11 2020-06-02 Cornell University Nanofluidic channels with integrated charge sensors and methods based thereon
US9108880B2 (en) 2008-08-18 2015-08-18 The Regents Of The University Of California Nanostructured superhydrophobic, superoleophobic and/or superomniphobic coatings, methods for fabrication, and applications thereof
US20100044212A1 (en) 2008-08-21 2010-02-25 Snu R&Db Foundation Vertically standing ionic polymer-metal composite
JP5712129B2 (ja) 2008-09-02 2015-05-07 ザ ガバニング カウンシル オブ ザ ユニバーシティ オブ トロント ナノ構造化微小電極およびそれを組み込んだバイオセンシング装置
US20100132771A1 (en) 2008-10-06 2010-06-03 The Regents Of The University Of California 3D Carbon Nanotubes Membrane as a Solar Energy Absorbing Layer
US8614466B2 (en) 2008-11-18 2013-12-24 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Semiconductor for measuring biological interactions
US8563240B2 (en) 2008-12-31 2013-10-22 Intel Corporation Nucleic acid sequencing and electronic detection
US20100206367A1 (en) 2009-02-18 2010-08-19 Korea Institute Of Industrial Technology Method for fabricating silicon nano wire, solar cell including silicon nano wire and method for fabricating solar cell
EP2419793A1 (en) 2009-04-14 2012-02-22 Nanoink, Inc. Conducting lines, nanoparticles, inks, and patterning
US20110291673A1 (en) 2009-04-27 2011-12-01 Sharp Kabushiki Kaisha Chemical sensor
US20100285272A1 (en) 2009-05-06 2010-11-11 Shari Elizabeth Koval Multi-length scale textured glass substrates for anti-fingerprinting
US8313633B2 (en) 2009-07-28 2012-11-20 Polestar Technologies, Inc. Molecular imprinted nanosensors and process for producing same
US8911972B2 (en) 2009-12-16 2014-12-16 Pacific Biosciences Of California, Inc. Sequencing methods using enzyme conformation
KR20110104245A (ko) 2010-03-16 2011-09-22 주식회사 나노플랫폼 Fet 기반 바이오센서, 이의 제조방법, 및 이를 이용하는 표적 물질 검출방법
US8940663B2 (en) 2010-04-07 2015-01-27 Board Of Regents, The University Of Texas System Nano-scale biosensors
US20110311853A1 (en) 2010-06-17 2011-12-22 Lsi Corporation Electrochemical cell system and apparatus to provide energy to a portable electronic device
WO2011159942A1 (en) 2010-06-18 2011-12-22 Illumina, Inc. Conformational probes and methods for sequencing nucleic acids
KR101136534B1 (ko) 2010-09-07 2012-04-17 한국기계연구원 프로브 카드 및 이의 제조 방법
US9231133B2 (en) 2010-09-10 2016-01-05 International Business Machines Corporation Nanowires formed by employing solder nanodots
WO2012037118A2 (en) 2010-09-14 2012-03-22 The General Hospital Corporation Nanoporous metal multiple electrode array and method of making same
GB2499340B (en) 2010-10-04 2015-10-28 Genapsys Inc Methods for sequencing nucleic acids
WO2012054904A2 (en) 2010-10-21 2012-04-26 The Regents Of The University Of California Microfluidics with wirelessly powered electronic circuits
GB2485559A (en) 2010-11-18 2012-05-23 Univ Plymouth Graphene based electronic device
US20120258881A1 (en) 2010-11-22 2012-10-11 The University Of Chicago Methods and/or Use of Oligonucleotide Conjugates for Assays and Microscopy/Imaging Detections
CN107083421A (zh) 2010-12-17 2017-08-22 纽约哥伦比亚大学理事会 使用经修饰的核苷酸和纳米孔检测的dna边合成边测序
WO2012087352A2 (en) 2010-12-20 2012-06-28 The Regents Of The University Of California Superhydrophobic and superoleophobic nanosurfaces
KR101749045B1 (ko) 2010-12-31 2017-06-20 시락 게엠베하 인터내셔날 고정확도 분석물 측정을 위한 시스템 및 방법
EP2661775A1 (en) 2011-01-04 2013-11-13 Ecole Polytechnique Fédérale de Lausanne (EPFL) Semiconductor device
TW201231948A (en) 2011-01-26 2012-08-01 zhi-yu Zhao Method for forming frozen biological test strip for electron microscope and device thereof
US8652768B1 (en) 2011-01-31 2014-02-18 Sandia Corporation Nanopatterns by phase separation of patterned mixed polymer monolayers
EP2492673A1 (en) 2011-02-28 2012-08-29 Lexogen GmbH Biosensor array formed by junctions of functionalized electrodes
EP2492674A1 (en) 2011-02-28 2012-08-29 Lexogen GmbH Biosensor array formed by junctions of functionalized electrodes
US20140045190A1 (en) 2011-04-19 2014-02-13 The Hong Kong University Of Science And Technology Method and device for monitoring real-time polymerase chain reaction (pcr) utilizing electro-active hydrolysis probe (e-tag probe)
US9994894B2 (en) 2011-04-27 2018-06-12 Agct Gmbh Method and components for detecting nucleic acid chains
KR101548771B1 (ko) 2011-06-23 2015-09-01 삼성전기주식회사 칩 타입 적층 커패시터
EP3385992A1 (en) 2011-07-27 2018-10-10 The Board of Trustees of the University of Illinois Nanopore sensors for biomolecular characterization
JP6137483B2 (ja) 2011-08-04 2017-05-31 日産化学工業株式会社 縮合系ポリマーを有するeuvリソグラフィー用レジスト下層膜形成組成物
US8685858B2 (en) 2011-08-30 2014-04-01 International Business Machines Corporation Formation of metal nanospheres and microspheres
WO2013095730A2 (en) 2011-09-19 2013-06-27 University Of Utah Research Foundation Multimode platform for detection of compounds
WO2013056241A2 (en) 2011-10-14 2013-04-18 Pacific Biosciences Of California, Inc. Real-time redox sequencing
US20130108956A1 (en) 2011-11-01 2013-05-02 Az Electronic Materials Usa Corp. Nanocomposite positive photosensitive composition and use thereof
DE112011105961T5 (de) 2011-12-15 2014-09-18 Intel Corporation Nanolückenwandler mit Diamantelektroden
EP4249605A3 (en) 2011-12-22 2023-11-15 President And Fellows Of Harvard College Methods for analyte detection
US20130183492A1 (en) 2012-01-17 2013-07-18 Snu R&Db Foundation Metal nanoparticles on substrate and method of forming the same
US20130214875A1 (en) 2012-02-16 2013-08-22 Elwha Llc Graphene sheet and nanomechanical resonator
US20130239349A1 (en) 2012-03-14 2013-09-19 Palo Alto Research Center Incorporated Self-powered manual toothbrush with sensors
CN114134207A (zh) 2012-04-09 2022-03-04 一龙公司 用于量化样品中核酸序列的组合物和方法
US9393590B2 (en) 2012-04-16 2016-07-19 Temple University—Of the Commonwealth System of Higher Education Self-assembly of small structures
WO2013165588A1 (en) 2012-05-01 2013-11-07 Life Technologies Corporation Methods for analysis of dna fragments
CN102706940B (zh) 2012-06-15 2014-05-14 湖南大学 可用于检测水体中痕量汞的电化学传感器及其制备方法和应用
US9551682B2 (en) 2012-06-29 2017-01-24 Intel Corporation High throughput biochemical detection using single molecule fingerprinting arrays
BR112015001054A8 (pt) 2012-07-19 2022-08-02 Oxford Nanopore Tech Ltd Helicase monomérica que é membro da superfamília 1 ou superfamília 2, helicase hel308 isolada, método para caracterizar um polinucleotídeo alvo, e, sensor para a caracterização de um polinucleotídeo alvo
US8741688B2 (en) 2012-07-24 2014-06-03 Micron Technology, Inc. Methods of forming a metal chalcogenide material
US20150276709A1 (en) 2012-08-06 2015-10-01 Quantumdx Group Limited Methods and kit for nucleic acid sequencing
TWI492384B (zh) 2012-08-17 2015-07-11 Univ Nat Chiao Tung 蛋白質電晶體裝置
TWI514566B (zh) 2012-09-19 2015-12-21 Univ Nat Chiao Tung 半導體生物奈米線裝置及其製作方法
EP2909601B1 (en) 2012-10-16 2019-09-11 Abbott Laboratories Method of increasing the debye length on a sensor surface within a sample solution and corresponding computer readable strorage medium
EP2912695A4 (en) 2012-10-26 2016-07-06 Res Triangle Inst INTERMEDIATE BELT SLEEVERS, HETERO TRANSITIONS AND OPTOELECTRONIC DEVICES WITH SOLUTION-PROCESSED QUANTUM POINTS AND RELATED METHODS
JPWO2014097943A1 (ja) 2012-12-18 2017-01-12 東レ株式会社 金属ドット基板および金属ドット基板の製造方法
CN103187119B (zh) 2013-02-06 2014-08-06 南昌欧菲光科技有限公司 导电膜及其制备方法以及包含该导电膜的触摸屏
US20140218637A1 (en) 2013-02-06 2014-08-07 Nanchang O-Film Tech. Co., Ltd. Conductive film, manufacturing method thereof, and touch screen including the conducting film
US9040363B2 (en) 2013-03-20 2015-05-26 International Business Machines Corporation FinFET with reduced capacitance
FR3003751A1 (fr) 2013-03-27 2014-10-03 Jacques Geloen Dispositif de visualisation de saturation pour protection de l'incontinence urofecale.
CN105378113B (zh) 2013-05-06 2020-02-21 加利福尼亚太平洋生物科学股份有限公司 实时电子测序
US8901621B1 (en) 2013-06-18 2014-12-02 International Business Machines Corporation Nanochannel process and structure for bio-detection
US9182369B2 (en) 2013-06-19 2015-11-10 Globalfoundries Inc. Manufacturable sub-3 nanometer palladium gap devices for fixed electrode tunneling recognition
TW201502276A (zh) 2013-07-09 2015-01-16 Univ Nat Chiao Tung 單分子無標定核酸定序方法
DE102013012145A1 (de) 2013-07-20 2015-01-22 Borros Arneth Protein-Transistor auf Anti-Silizium Antikörper Basis
US20150049332A1 (en) 2013-07-30 2015-02-19 The Curators Of The University Of Missouri Gold nanoisland arrays
CN106104274B (zh) 2013-09-18 2018-05-22 量子生物有限公司 生物分子测序装置、系统和方法
WO2015102746A2 (en) 2013-11-04 2015-07-09 Massachusetts Institute Of Technology Electronics including graphene-based hybrid structures
EP3974814A1 (en) 2013-11-17 2022-03-30 Quantum-si Incorporated Integrated device with external light source for probing detecting and analyzing molecules
EP3080294B1 (en) 2013-12-12 2018-06-13 Altratech Limited A capacitive sensor and method of use
US9472396B2 (en) 2014-04-15 2016-10-18 University Of Central Florida Research Foundation, Inc. Plasma treated semiconductor dichalcogenide materials and devices therefrom
CN106471359A (zh) 2014-04-28 2017-03-01 量子生物有限公司 纳米间隙电极装置和系统及其形成方法
EP2947779A1 (en) 2014-05-23 2015-11-25 Thomson Licensing Method and apparatus for storing information units in nucleic acid molecules and nucleic acid storage system
AU2015271824B2 (en) 2014-06-03 2020-12-03 Illumina, Inc. Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
US20170114341A1 (en) 2014-06-06 2017-04-27 Solstice Biologics, Ltd. Polynucleotide constructs having bioreversible and non-bioreversible groups
DK3169805T5 (en) 2014-07-15 2018-12-03 Illumina Inc Biochemically activated electronic device
GB2528682A (en) 2014-07-28 2016-02-03 Isis Innovation Plasmonic filter
US9859513B2 (en) 2014-11-25 2018-01-02 University Of Kentucky Research Foundation Integrated multi-terminal devices consisting of carbon nanotube, few-layer graphene nanogaps and few-layer graphene nanoribbons having crystallographically controlled interfaces
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
CN107109466A (zh) 2014-12-18 2017-08-29 加利福尼亚大学董事会 使用纳米管的核酸聚合酶构象变化的检测
US20160187282A1 (en) 2014-12-26 2016-06-30 Intel Corporation Device for single molecule detection and fabrication methods thereof
US9306164B1 (en) 2015-01-30 2016-04-05 International Business Machines Corporation Electrode pair fabrication using directed self assembly of diblock copolymers
FR3035220A1 (fr) 2015-04-20 2016-10-21 Commissariat Energie Atomique " dispositif electronique de mesure d'au moins une caracteristique electrique d'un objet "
MX2017015517A (es) 2015-06-03 2018-11-09 Illumina Inc Composiciones, sistemas y metodos para secuenciar polinucleotidos usando amarres anclados a polimerasas adyacentes a nanoporos.
EP3332033B1 (en) 2015-08-06 2021-04-21 Pacific Biosciences of California, Inc. Single-molecule nanofet sequencing systems and methods
WO2017041056A1 (en) 2015-09-02 2017-03-09 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
EP3347366A1 (en) 2015-09-10 2018-07-18 H. Hoffnabb-La Roche Ag Polypeptide tagged nucleotides and use thereof in nucleic acid sequencing by nanopore detection
JP2018533935A (ja) 2015-10-08 2018-11-22 クオンタムバイオシステムズ株式会社 核酸配列決定の装置、システム、及び方法
CN113985017A (zh) 2016-01-14 2022-01-28 罗斯韦尔生物技术股份有限公司 分子传感器及相关方法
WO2017132567A1 (en) 2016-01-28 2017-08-03 Roswell Biotechnologies, Inc. Massively parallel dna sequencing apparatus
CN109071212A (zh) 2016-01-28 2018-12-21 罗斯韦尔生物技术股份有限公司 使用大规模分子电子传感器阵列测量分析物的方法和装置
EP3414784B1 (en) 2016-02-09 2021-04-14 Roswell Biotechnologies, Inc Electronic label-free dna and genome sequencing
US10597767B2 (en) 2016-02-22 2020-03-24 Roswell Biotechnologies, Inc. Nanoparticle fabrication
JP2019512480A (ja) 2016-02-29 2019-05-16 イリディア・インコーポレイテッドIridia, Inc. 情報保存のための方法、組成物およびデバイス
US10883140B2 (en) 2016-04-21 2021-01-05 President And Fellows Of Harvard College Method and system of nanopore-based information encoding
WO2017199101A1 (en) 2016-05-19 2017-11-23 Dragon Medical Development Limited Guidewire apparatus and method for multiple parameter analysis of coronary stenosis
WO2018011632A1 (en) 2016-07-15 2018-01-18 Dragon Medical Development Limited Multi-spline, multi-electrode catheter and method of use for mapping of internal organs
US9829456B1 (en) 2016-07-26 2017-11-28 Roswell Biotechnologies, Inc. Method of making a multi-electrode structure usable in molecular sensing devices
CN109844513A (zh) 2016-08-01 2019-06-04 罗斯韦尔生物技术股份有限公司 用于分子电子传感器的经修饰的核苷酸三磷酸
WO2018098286A1 (en) 2016-11-22 2018-05-31 Roswell Biotechnologies, Inc. Nucleic acid sequencing device containing graphene
KR102622275B1 (ko) 2017-01-10 2024-01-05 로스웰 바이오테크놀로지스 인코포레이티드 Dna 데이터 저장을 위한 방법들 및 시스템들
KR20230158636A (ko) 2017-01-19 2023-11-20 로스웰 바이오테크놀로지스 인코포레이티드 2차원 레이어 재료를 포함하는 솔리드 스테이트 시퀀싱 디바이스들
CA3057151A1 (en) 2017-04-25 2018-11-01 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
US10508296B2 (en) 2017-04-25 2019-12-17 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
CA3057155A1 (en) 2017-05-09 2018-11-15 Roswell Biotechnologies, Inc. Binding probe circuits for molecular sensors
CN111373049A (zh) 2017-08-30 2020-07-03 罗斯威尔生命技术公司 用于dna数据存储的进行性酶分子电子传感器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050172199A1 (en) * 2004-02-03 2005-08-04 Phonex Broadband Corporation. Reliable method and system for efficiently transporting dynamic data across a network
US20070207487A1 (en) * 2006-01-25 2007-09-06 Emig Christopher J Photoelectrochemical synthesis of high density combinatorial polymer arrays
WO2016210386A1 (en) * 2015-06-25 2016-12-29 Roswell Biotechnologies, Inc Biomolecular sensors and methods

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BORIS AHIMANOVSKY等: "Hiding Data in DNA", 《INTERNATIONAL WORKSHOP ON INFORMATION HIDING,LECTURE NOTES IN COMPUTER SCIENCE》, 18 December 2002 (2002-12-18), pages 379 *
戈里高·海登博格: "中国人民公安大学"十二五"规划教材 数据通信与网络技术", 北京航空航天大学出版社, pages: 195 - 198 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111724841A (zh) * 2020-06-04 2020-09-29 中国科学院上海微系统与信息技术研究所 一种基于生物蛋白的信息存储方法
CN112288089A (zh) * 2020-09-28 2021-01-29 清华大学 阵列式核酸信息存储方法及装置
CN112288089B (zh) * 2020-09-28 2022-12-20 清华大学 阵列式核酸信息存储方法及装置
WO2022120626A1 (zh) * 2020-12-09 2022-06-16 中国科学院深圳先进技术研究院 基于dna的数据存储方法、数据恢复方法、装置及终端设备
CN113096742A (zh) * 2021-04-14 2021-07-09 湖南科技大学 一种dna信息存储并行寻址写入方法及系统
CN113096742B (zh) * 2021-04-14 2022-06-14 湖南科技大学 一种dna信息存储并行寻址写入方法及系统
CN115409174A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Also Published As

Publication number Publication date
CA3052062A1 (en) 2018-07-19
US20190355442A1 (en) 2019-11-21
KR20190116297A (ko) 2019-10-14
US20210225461A1 (en) 2021-07-22
KR102622275B1 (ko) 2024-01-05
EP3568407A4 (en) 2020-12-23
WO2018132457A1 (en) 2018-07-19
EP3568407A1 (en) 2019-11-20
US10902939B2 (en) 2021-01-26

Similar Documents

Publication Publication Date Title
CN110431148A (zh) 用于dna数据存储的方法和系统
US11100404B2 (en) Methods, apparatus and systems for amplification-free DNA data storage
US11371955B2 (en) Processive enzyme molecular electronic sensors for DNA data storage
Doricchi et al. Emerging approaches to DNA data storage: challenges and prospects
CN110945595B (zh) 基于dna的数据存储和检索
Rutten et al. Encoding information into polymers
US20100063264A1 (en) Nucleotide sequencing via repetitive single molecule hybridization
Shomorony et al. Information-theoretic foundations of DNA data storage
US11755922B2 (en) On-chip nanoscale storage system using chimeric DNA
US20230377649A1 (en) Systems And Methods For Digital Information Decoding And Data Storage In Hybrid Macromolecules
WO2019132713A1 (ru) Способ безметочного одномолекулярного секвенирования днк и устройство для его реализации
Wang et al. Oligo design with single primer binding site for high capacity DNA-based data storage
Ezekannagha et al. Design considerations for advancing data storage with synthetic DNA for long-term archiving
Heinis et al. Survey of information encoding techniques for dna
Lau et al. Magnetic DNA random access memory with nanopore readouts and exponentially-scaled combinatorial addressing
JP2016534742A (ja) 量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定
KR102236439B1 (ko) 디지털 정보를 dna 분자에 저장하는 방법 및 그 장치
Zhang et al. Complete mitochondrial genomes of Epeorus carinatus and E. dayongensis (Ephemeroptera: Heptageniidae): Genomic comparison and phylogenetic inference
Suyehira et al. A coding scheme for nucleic acid memory (NAM)
Lavenier DNA Storage: Synthesis and Sequencing Semiconductor Technologies
Limbachiya et al. 10 years of natural data storage
TWI770247B (zh) 核酸用於資料儲存之方法、及其非暫時性電腦可讀儲存介質、系統及電子裝置
Yan Scalable and accurate algorithms for computational genomics and dna-based digital storage
CN114600193A (zh) 使用核酸分子进行数据存储的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191108

WD01 Invention patent application deemed withdrawn after publication