CN112703558A - 用于存储的系统和方法 - Google Patents

用于存储的系统和方法 Download PDF

Info

Publication number
CN112703558A
CN112703558A CN202080003492.3A CN202080003492A CN112703558A CN 112703558 A CN112703558 A CN 112703558A CN 202080003492 A CN202080003492 A CN 202080003492A CN 112703558 A CN112703558 A CN 112703558A
Authority
CN
China
Prior art keywords
wells
data
well
polynucleotide
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080003492.3A
Other languages
English (en)
Inventor
莫瑞克·萧
阿里·阿加
斯坦利·洪
塔伦·库拉纳
阿塔万·卡鲁纳卡拉恩
克雷格·切希拉
阿米尔阿里·基亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Publication of CN112703558A publication Critical patent/CN112703558A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L3/00Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
    • B01L3/50Containers for the purpose of retaining a material to be analysed, e.g. test tubes
    • B01L3/508Containers for the purpose of retaining a material to be analysed, e.g. test tubes rigid containers not provided for above
    • B01L3/5085Containers for the purpose of retaining a material to be analysed, e.g. test tubes rigid containers not provided for above for multiple samples, e.g. microtitration plates
    • B01L3/50855Containers for the purpose of retaining a material to be analysed, e.g. test tubes rigid containers not provided for above for multiple samples, e.g. microtitration plates using modular assemblies of strips or of individual wells
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0021Auxiliary circuits
    • G11C13/003Cell access
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/02Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using elements whose operation depends upon chemical change
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/06Auxiliary integrated devices, integrated components
    • B01L2300/0627Sensor or part of a sensor is integrated
    • B01L2300/0645Electrodes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2300/00Additional constructional details
    • B01L2300/08Geometry, shape and general structure
    • B01L2300/0809Geometry, shape and general structure rectangular shaped
    • B01L2300/0829Multi-well plates; Microtitration plates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/04Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using optical elements ; using other beam accessed elements, e.g. electron or ion beam
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/04Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using optical elements ; using other beam accessed elements, e.g. electron or ion beam
    • G11C13/042Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using optical elements ; using other beam accessed elements, e.g. electron or ion beam using information stored in the form of interference pattern
    • G11C13/045Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using optical elements ; using other beam accessed elements, e.g. electron or ion beam using information stored in the form of interference pattern using photochromic storage elements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/04Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using optical elements ; using other beam accessed elements, e.g. electron or ion beam
    • G11C13/048Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using optical elements ; using other beam accessed elements, e.g. electron or ion beam using other optical storage elements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C2029/0409Online test
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C2029/0411Online error correction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/02Detection or location of defective auxiliary circuits, e.g. defective refresh counters
    • G11C29/028Detection or location of defective auxiliary circuits, e.g. defective refresh counters with adaption or trimming of parameters
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/12Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
    • G11C29/44Indication or identification of errors, e.g. for repair
    • G11C29/4401Indication or identification of errors, e.g. for repair for self repair
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/52Protection of memory contents; Detection of errors in memory contents
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Abstract

用于非易失性存储的设备、系统和方法包括阱激活设备,其可操作以修改来自流通池的多个阱的一个或更多个阱,以提供一组可读阱。可读阱被配置为允许阱暴露于来自核苷酸测序流体的物质,并防止暴露于其他物质和流体,例如核苷酸合成流体。阱激活设备也可以修改阱以提供一组可写阱。这组阱被配置成允许暴露于核苷酸合成流体和物质;并防止暴露于核苷酸测序流体和物质。还可以提供减轻数据错误风险的措施,例如生成命令以将规定数据写入与存储设备中特定位置相关联的核苷酸序列,读取核苷酸序列并进行比较。

Description

用于存储的系统和方法
相关申请
本申请要求于2019年5月31日提交的题为“System and Method for Non-Volatile Polynucleotide Storage”的第62/855,610号美国临时专利申请的优先权,其全部内容通过引用结合于此。本申请还要求于2019年5月31日提交的题为“DNA StorageDevice with In-Situ Quality Control”的第62/855,682号美国临时专利申请的优先权,其全部内容通过引用结合于此。
背景
计算机系统使用各种不同的机制来存储数据,包括磁存储、光存储和固态存储。这种形式的数据存储可能在读写速度、数据保留时间、功耗或数据密度方面存在缺陷。
就像天然存在的DNA可以被读取一样,机器写入的DNA也可以被读取。现有的DNA读取技术可以包括基于阵列的循环测序测定(例如合成测序(SBS)),其中通过酶操作的迭代循环对密集阵列的DNA特征(例如模板核酸)进行测序。在每个循环之后,可以捕获图像,并随后与其他图像一起分析,以确定机器写入的DNA特征的序列。在另一生物化学测定中,具有可识别标记(例如,荧光标记)的未知分析物可暴露于已知探针阵列,该探针在该阵列内具有预定地址。观察探针和未知分析物之间发生的化学反应可以帮助识别或揭示分析物的特性。
概述
本文描述了用于多核苷酸数据存储的设备、系统和方法,包括用于每阱激活、同时读写高速缓存和用于同时读写能力的多卷管理的特征,以及用于减轻这种存储中的错误风险的设备、系统和方法,例如通过在用于读取和写入编码在多核苷酸中的数据的过程中包括质量控制措施。
一种实现涉及一种用于非易失性存储的系统,包括:存储控制器,包括处理器和存储器;存储设备,包括:流通池,该流通池包括多个具有可从流通池的第一表面进入的开口侧的阱,其中所述阱适于容纳多核苷酸,流控接口和测序接口;流控设备,用于向流通池的第一表面提供一种或更多种流体,其中所述一种或更多种流体包括核苷酸写入试剂和核苷酸读取试剂;测序设备,用于通过测序接口对多个阱内的多核苷酸进行测序并确定核苷酸;以及阱激活设备,用于:修改多个阱中的一个或更多个阱以提供一组可读阱,其中该组可读阱允许暴露于核苷酸读取试剂并防止暴露于来自流控设备的其他试剂,以及修改多个阱中的一个或更多个阱以提供一组可写阱,其中该组可写阱允许暴露于核苷酸写入试剂并防止暴露于来自流控设备的其他试剂。
上述实现中的任何一种或更多种存在变化,其中阱激活设备包括多个电极,并且其中:多个电极中的至少一个电极位于多个阱的每个阱附近,存储设备的控制接口与多个电极耦合,并且从存储控制器向多个电极提供一组控制信号,多个电极中的每一个基于该组控制信号产生电压,该电压包括第一电压或第二电压,并且由多个电极中的电极产生的第一电压将邻近产生第一电压的电极的多个阱中的阱修改为可读阱,并且由多个电极中的电极产生的第二电压将邻近产生第二电压的电极的多个阱中的阱修改为可写阱。
上述实现中的任何一种或更多种存在变化,其中至少一个电极位于多个阱的每个阱的侧壁上。
上述实现中的任何一种或更多种存在变化,其中至少一个电极位于多个阱的每个阱的周界处的第一表面上。
上述实现中的任何一种或更多种存在变化,其中至少一个电极位于多个阱的每个阱的底部,并且其中至少一个电极包括环形形状,该环形形状允许光从流通池的与第一表面相对的第二表面穿过环形形状并进入多个阱中的该至少一个电极位于其中的阱中。
上述实现中的任何一种或更多种存在变化,其中第二电压导致产生第二电压的电极附近的多个阱中的阱的酶抑制剂的杂交,并且将期望的核苷酸结合到产生第二电压的电极附近的多个阱中的阱。
上述实现中的任何一个或更多个存在变化,其中:阱激活设备包括多个pH控制设备,每个pH控制设备对应于多个阱的一个阱,并且每个pH控制设备产生控制由流控设备提供的电压敏感功能化流体的pH的电压,以将对应于pH控制设备的多个阱的阱修改为可读阱或可写阱。
上述实现中的任何一种或更多种存在变化,其中:阱激活设备包括空间光调制器(SLM),以将光发射到多个阱的一个或更多个阱中,并且发射的光将一个或更多个阱的每一个修改为可读阱或可写阱。
上述实现中的任何一种或更多种存在变化,其中存储控制器在测序操作期间:从测序设备接收描述多个阱的地址阱中的多核苷酸的核苷酸的一组地址数据,基于该组地址数据从多个阱中确定一组目标阱,并使流控设备仅向该组目标阱提供核苷酸读取试剂。
上述实现中的任何一种或更多种存在变化,其中存储控制器在测序操作期间,通过使流控设备从多个阱中剥离酶,并使阱激活设备提供带电标签来控制核苷酸读取试剂的酶的定位。
上述实现中的任何一种或更多种存在变化,其中阱激活设备包括:产生电压以将阱修改为可写阱的电释放机构,以及产生光子能量以将阱修改为可写阱的光子释放机构,并且其中一组可写阱包括由电释放机构修改的阱和由光子释放机构修改的阱。
上述实现中的任何一种或更多种存在变化,其中:阱激活设备包括靠近流通池的第一表面的电润湿设备,该电润湿设备将流体从流控设备输送到多个阱的任何阱,并且存储控制器在同时测序和合成操作期间:向多个阱的第一阱提供核苷酸读取试剂的液滴,向多个阱中的第二阱提供核苷酸写入试剂的液滴,其中第一阱和第二阱相邻。
上述实现中的任何一种或更多种存在变化,其中多个阱的每一个包括:减少附近阱之间串扰的极化特征,以及减少附近阱之间串扰的光波导特征。
上述实现中的任何一种或更多种存在变化,其中存储控制器在合成操作期间:将一组数据转换成一组核苷酸,基于该组核苷酸在该组可写阱的第一阱中合成第一多核苷酸链,并基于该组核苷酸在该组可写阱的第二阱中合成第二多核苷酸链,其中第一多核苷酸链和第二多核苷酸链在正确合成时是相同的。
上述实现中的任何一种或更多种存在变化,其中存储控制器用测序设备对第一多核苷酸链和第二多核苷酸链进行测序,并且当它们不相同时,提供合成错误的指示。
上述实现中的任何一种或更多种存在变化,还包括空间光调制器,用于通过测序接口将光学图案投射到流通池上,其中存储控制器操作空间光调制器将相同的光学图案投射到第一阱和第二阱中,以合成第一多核苷酸链和第二多核苷酸链。
上述实现中的任何一种或更多种存在变化,其中存储控制器在合成操作期间:将一组数据转换成一组核苷酸,基于该组核苷酸的第一部分在该组可写阱的第一阱中合成第一多核苷酸链,并且与第一多核苷酸链的合成并行,基于该组核苷酸的第二部分,在该组可写阱的第二阱中合成第二多核苷酸链,其中第一多核苷酸链和第二多核苷酸链共同代表该组核苷酸的整体。
上述实现中的任何一种或更多种存在变化,其中存储控制器在合成操作期间:将一组数据转换成一组核苷酸,基于该组核苷酸在该组可写阱的第一阱中合成第一多核苷酸链,基于该组核苷酸在第一阱中合成第二多核苷酸链,其中所述第一多核苷酸链和所述第二多核苷酸链在正确合成时是相同的,并且基于所述一组核苷酸产生链散列值,并且合成所述第一多核苷酸链和所述第二多核苷酸链以添加所述链散列值。
上述实现中的任何一种或更多种存在变化,其中存储控制器在测序操作期间:用测序设备对第一阱中的第一多核苷酸链和第二多核苷酸链进行测序,以确定每个多核苷酸链的测序的一组核苷酸和测序散列值,当第一多核苷酸链和第二多核苷酸链的测序的一组核苷酸不相同时,提供合成错误的指示,并且,当第一多核苷酸链或第二多核苷酸链的测序散列值与测序的一组核苷酸的后续散列值不匹配时,提供散列值不匹配的指示。
另一个实现涉及一种用于非易失性多核苷酸存储的方法,包括:安装存储设备,该存储设备包括:流通池,该流通池包括多个具有可从流通池的第一表面进入的开口侧的阱,其中阱适于容纳多核苷酸,流控接口和测序接口;通过操作流控设备向第一表面提供核苷酸写入试剂,执行合成操作以在多个阱中产生多核苷酸;用测序设备和来自流控设备的核苷酸读取试剂进行测序操作,以确定多个阱中多核苷酸的核苷酸;以及在合成操作和测序操作之前使用阱激活设备,以:修改来自多个阱的一个或更多个阱,以提供一组可读阱,其中该组可读阱允许暴露于核苷酸读取试剂,并防止暴露于来自流控设备的其他试剂流体,以及修改来自多个阱的一个或更多个阱,以提供一组可写阱,其中该组可写阱允许暴露于核苷酸写入试剂,并防止暴露于来自流控设备的其他试剂流体。
上述实现中的任何一种或更多种存在变化,其中使用阱激活设备包括操作阱激活设备的多个电极,并且其中:多个电极中的至少一个电极位于多个阱的每个阱附近,存储设备的控制接口与多个电极耦合,并且向多个电极提供一组控制信号,多个电极中的每一个基于该组控制信号产生电压,该电压包括第一电压或第二电压,并且第一电压将靠近产生第一电压的电极的多个阱中的阱修改为可读阱,并且由多个电极中的电极产生的第二电压将靠近产生第二电压的电极的多个阱中的阱修改为可写阱。
上述实现中的任何一种或更多种存在变化,其中操作多个电极包括操作位于多个阱的阱的侧壁上的至少一个电极。
上述实现中的任何一种或更多种存在变化,其中操作多个电极包括操作位于多个阱的阱的周界处的第一表面上的至少一个电极。
上述实现中的任何一种或更多种存在变化,其中操作多个电极包括操作位于多个阱的阱底部的至少一个电极,并且其中至少一个电极包括环形形状,该环形形状允许光从流通池的与第一表面相对的第二表面穿过环形形状并进入多个阱的阱中,该至少一个电极位于该阱中。
上述实现中的任何一种或更多种存在变化,还包括配置第二电压,以使产生第二电压的电极附近的多个阱中的阱的酶抑制剂的杂交,并将所需核苷酸结合到靠近产生第二电压的电极的多个阱的阱中。
上述实现中的任何一种或更多种存在变化,其中使用阱激活设备包括操作阱激活设备的多个pH控制设备,并且其中:每个pH控制设备对应于多个阱的一个阱,并且每个pH控制设备产生控制由流控设备提供的电压敏感功能化流体的pH的电压,以将对应于pH控制设备的多个阱的阱修改为可读阱或可写阱。
根据权利要求20至26中任一项或更多项所述的方法,其中操作所述阱激活设备包括操作空间光调制器(SLM)以将光发射到所述多个阱中的一个或更多个阱中,并且其中所发射的光将所述一个或更多个阱中的每一个修改为可读阱或可写阱。
上述实现中的任何一种或更多种存在变化,还包括,在测序操作期间:从测序设备接收一组地址数据,该组地址数据描述来自多个阱的地址阱的测序多核苷酸的核苷酸,基于该组地址数据从多个阱中确定一组目标阱,并使流控设备仅向该组目标阱提供核苷酸读取试剂。
上述实现中的任何一种或更多种存在变化,还包括通过使流控设备从多个阱中剥离不需要的酶,并使阱激活设备提供带电标签来控制核苷酸读取试剂的酶的定位。
上述实现中的任何一种或更多种存在变化,其中使用阱激活设备包括:使用阱激活设备的电释放机构来产生电压以将阱修改为可写阱,以及使用阱激活设备的光子释放机构来产生光子能量以将阱修改为可写阱,并且其中一组可写阱包括由电释放机构修改的阱和由光子释放机构修改的阱。
上述实现中的任何一种或更多种存在变化,其中操作阱激活设备包括:操作阱激活设备的电润湿设备以将流体从流控设备输送到多个阱,并且在同时测序和合成操作期间:向多个阱的第一阱提供核苷酸读取试剂的液滴,以及向多个阱的第二阱提供核苷酸写入试剂的液滴,其中第一阱和第二阱相邻。
上述实现中的任何一种或更多种存在变化,在合成操作期间还包括:将一组数据转换成一组核苷酸,基于该组核苷酸在该组可写阱的第一阱中合成第一多核苷酸链,以及基于该组核苷酸在该组可写阱的第二阱中合成第二多核苷酸链,其中第一多核苷酸链和第二多核苷酸链在正确合成时是相同的。
上述实现中的任何一种或更多种存在变化,进一步包括用测序设备对第一多核苷酸链和第二多核苷酸链进行测序,并且当它们不相同时,提供合成错误的指示。
上述实现中的任何一种或更多种存在变化,还包括操作空间光调制器以通过测序接口将相同的光学图案投射到第一阱和第二阱上,其中相同的光学图案用于并行地合成第一多核苷酸链和第二多核苷酸链。
上述实现中的任何一种或更多种存在变化,在合成操作期间还包括:将一组数据转换成一组核苷酸,基于该组核苷酸的第一部分在该组可写阱的第一阱中合成第一多核苷酸链,并与合成第一多核苷酸链并行地,基于该组核苷酸的第二部分,在该组可写阱的第二阱中合成第二多核苷酸链,其中第一多核苷酸链和第二多核苷酸链共同代表该组核苷酸的整体。
上述实现中的任何一种或更多种存在变化,进一步包括,在合成操作期间:将一组数据转换成一组核苷酸,基于该组核苷酸在该组可写阱的第一阱中合成第一多核苷酸链,基于该组核苷酸在第一阱中合成第二多核苷酸链,其中当正确合成时,第一多核苷酸链和第二多核苷酸链是相同的,以及基于该组核苷酸产生链散列值,并合成第一多核苷酸链和第二多核苷酸链以添加链散列值。
上述实现中的任何一种或更多种存在变化,还包括,在测序操作期间:用测序设备对第一阱中的第一多核苷酸链和第二多核苷酸链进行测序,以确定每个多核苷酸链的测序的一组核苷酸和测序散列值,其中第一多核苷酸链和第二多核苷酸链的测序的一组核苷酸不相同,提供了合成错误的指示,基于测序的一组核苷酸确定第一多核苷酸链和第二多核苷酸链中每一个的后续散列值,并且当第一多核苷酸链或第二多核苷酸链的测序散列值与测序的一组核苷酸的后续散列值不匹配时,提供散列值不匹配的指示。
又一实现涉及一种用于非易失性多核苷酸存储的系统,包括:存储控制器,包括处理器和存储器;存储设备,包括:流通池,该流通池包括多个具有可从流通池的第一表面进入的开口侧的阱,其中所述阱适于容纳多核苷酸,流控接口和测序接口;流控设备,用于向流通池的第一表面提供一种或更多种流体,其中所述一种或更多种流体包括核苷酸写入试剂和核苷酸读取试剂;测序设备,用于通过测序接口对多个阱内的多核苷酸进行测序并确定核苷酸;以及高速缓存存储器,其包括电子存储器以存储排队编码成一组核苷酸并合成成多个阱中的多核苷酸的数据。
上述实现中的任何一种或更多种存在变化,其中高速缓存存储器位于存储设备中,并且其中存储设备是可移除存储设备。
上述实现中的任何一种或更多种存在变化,其中高速缓存存储器存储一个或更多个:一组文件索引,其描述作为多核苷酸存储在多个阱内的数据的名称和位置,以及一组校验和值,其可用于验证作为多核苷酸存储在多个阱内的数据的完整性。
上述实现中的任何一种或更多种存在变化,其中存储控制器:接收要作为多个阱中的多核苷酸写入存储设备的一组输入数据,接收从存储在多个阱中的多核苷酸读取输出数据的请求,基于存储设备最近是从流控设备接收到核苷酸写入试剂还是核苷酸读取试剂来确定存储设备是处于写入模式还是读取模式,在存储设备处于写入模式时,在读取输出数据之前写入该组输入数据,并且在存储设备处于读取模式时,在高速缓存存储器上存储该组输入数据,并且在写入该组输入数据之前读取输出数据。
上述实现中的任何一种或更多种存在变化,还包括电润湿设备,该电润湿设备定位在第一表面附近,并将流体从流控设备输送到多个阱中的任何阱,其中存储控制器:操作电润湿设备,以向多个阱中的第一阱提供核苷酸读取试剂的液滴,从而能够对存储在其中的多核苷酸进行测序,同时向第一阱提供核苷酸读取试剂的液滴,基于多个输出数据请求识别最接近第一阱的第二阱,并操作电润湿设备向多个阱中的第二阱提供核苷酸读取试剂的液滴的一部分,以能够对存储在其中的多核苷酸进行测序。
上述实现中的任何一种或更多种存在变化,其中存储控制器:基于过去对输出数据的请求,确定最频繁测序的多个阱的子集,操作测序设备对多个阱的子集进行测序,并产生描述存储在多个阱的子集内的多核苷酸的一组核苷酸,将该组核苷酸转换成一组数字数据,将该组数字数据存储在高速缓存存储器中,并响应于后续请求从高速缓存存储器提供该组数字数据。
又一实现涉及一种用于非易失性多核苷酸存储的系统,包括:存储控制器,包括处理器和存储器;存储设备,包括:包含第一多个阱的第一流通池,其中所述第一多个阱适于容纳多核苷酸;包含第二多个阱的第二流通池,其中所述第二多个阱适于容纳多核苷酸;流控设备,用于向所述第一多个阱和所述第二多个阱提供一种或更多种流体,其中所述一种或更多种流体包括核苷酸写入试剂和核苷酸读取试剂;以及测序设备,用于通过测序接口对第一多个阱和第二多个阱内的多核苷酸进行测序并确定核苷酸,其中当处于镜像模式时,存储控制器:将一组数据转换成一组核苷酸,并操作流控设备以基于该组数据在第一多个阱和第二多个阱中产生相同的多核苷酸。
上述实现中的任何一种或更多种存在变化,还包括空间光调制器,用于通过测序接口将光学图案投射到第一流通池和第二流通池上,其中存储控制器操作空间光调制器,以将相同的光学图案投射到第一多个阱的第一阱和第二多个阱的第二阱中,从而合成第一多核苷酸链和第二多核苷酸链。
上述实现中的任何一种或更多种存在变化,其中当处于专用模式时,存储控制器:将该组数据转换成一组核苷酸,指定第一多个阱用于写入数据,并指定第二多个阱用于读取数据,操作流控设备以基于该组数据在第一多个阱中产生多核苷酸,并操作流控设备和测序设备以基于输出请求对第二多个阱中的多核苷酸进行测序。
上述实现中的任何一种或更多种存在变化,其中存储控制器:确定没有当前输出请求,并且从专用模式切换到镜像模式。
另一实现涉及一种用于减轻存储设备中的错误风险的方法。在这样的实现中,该方法可以包括生成一个或更多个命令,以将规定数据写入与存储设备中的特定位置相关联的多核苷酸。该方法还可以包括读取多核苷酸并进行比较。在这样的实现中,比较可以将存储在存储设备中的多核苷酸与存储在非核苷酸存储器中的特定质量控制值进行比较。在一些这样的实现中,基于该比较,该方法可以包括确定存储设备中的特定位置是否将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中读取多核苷酸、执行比较以及确定存储设备中的特定位置是否将被视为具有损坏的数据是基于接收到写入存储设备的命令而自动执行的。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括确定存储设备中的特定位置将被视为具有损坏的数据。在一些这样的实现中,该方法可以包括,基于确定存储设备中的特定位置将被视为具有损坏的数据,将编码未损坏数据的新多核苷酸写入存储设备中的特定位置。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于从存储设备中的一个或更多个其他位置读取信息来生成未损坏的数据。
上述实现中的任何一个或更多个存在变化,其中该方法可以包括,基于确定存储设备中的特定位置将被视为具有损坏的数据,并且在将编码未损坏数据的新多核苷酸写入存储设备中的特定位置之前,更新存储设备的索引以指示存储设备中的特定位置具有损坏的数据。在一些这样的实现中,该方法可以包括,在将编码未损坏数据的新多核苷酸写入存储设备中的特定位置之后,更新存储设备的索引以指示存储设备中的特定位置没有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于规定数据生成特定质量控制值。
上述实现中的任何一种或更多种存在变化,其中存储设备可以包括多个可寻址位置。在一些这样的实现中,特定位置可以由多个可寻址位置组成。在一些这样的实现中,非核苷酸存储器可以存储多个质量控制值。在一些这样的实现中,特定质量控制值由多个质量控制值组成。在一些这样的实现中,来自多个质量控制值的每个质量控制值与来自多个可寻址位置的对应的可寻址位置相关联。
上述实现中的任何一种或更多种存在变化,其中多核苷酸可以包含检查部分。在一些这样的实现中,该方法可以包括基于规定数据生成检查部分。
上述实现中的任何一种或更多种存在变化,其中检查部分可以是奇偶校验位。
上述实现中的任何一种或更多种存在变化,其中检查部分可以包括多核苷酸中核碱基的甲基化或其他信息保留修饰。
上述实现中的任何一种或更多种存在变化,其中检查部分可以编码与特定质量控制值匹配的数据。
上述实现中的任何一种或更多种存在变化,其中第二多核苷酸可以存储在存储设备中,并且第二多核苷酸可以包含与多核苷酸包含的检查部分相同的第二检查部分。在一些这样的实现中,该方法可以包括基于识别第一多核苷酸和第二多核苷酸之间的差异,确定存储设备中的特定位置将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中特定质量控制值可以是规定数据。在一些这样的实现中,比较可以包括检查存储在多核苷酸中的数据和规定数据之间是否有任何差异。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括确定存储设备中的特定位置不应该被视为具有损坏的数据。在一些这样的实现中,该方法可以包括,基于确定存储设备中的特定位置不应被视为具有损坏的数据,删除存储在非核苷酸存储器中的特定质量控制值。
另一实现涉及一种系统,该系统包括存储设备,该存储设备具有一个或更多个存储用于存储设备执行方法的指令的非暂时性计算机可读介质。在一些这样的实现中,该方法可以包括生成一个或更多个命令,以将规定数据写入与存储设备中的特定位置相关联的多核苷酸。在一些这样的实现中,该方法可以包括读取多核苷酸并进行比较。在一些这样的实现中,比较可以将存储在存储设备中的多核苷酸与存储在非核苷酸存储器中的特定质量控制值进行比较。在一些这样的实现中,该方法可以包括基于比较,确定存储设备中的特定位置是否将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括自动基于接收到写入存储设备的命令来读取多核苷酸、执行比较、以及确定存储设备中的特定位置是否将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括确定存储设备中的特定位置将被视为具有损坏的数据。在一些这样的实现中,该方法可以包括,基于确定存储设备中的特定位置将被视为具有损坏的数据,将编码未损坏数据的新多核苷酸写入存储设备中的特定位置。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于从存储设备中的一个或更多个其他位置读取信息来生成未损坏的数据。
上述实现中的任何一个或更多个存在变化,其中该方法可以包括,基于确定存储设备中的特定位置将被视为具有损坏的数据,并且在将编码未损坏数据的新多核苷酸写入存储设备中的特定位置之前,更新存储设备的索引以指示存储设备中的特定位置具有损坏的数据。在一些这样的实现中,该方法可以包括,在将编码未损坏数据的新多核苷酸写入存储设备中的特定位置之后,更新存储设备的索引以指示存储设备中的特定位置不具有未损坏数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于规定数据生成特定质量控制值。
上述实现中的任何一种或更多种存在变化,其中存储设备可以包括多个可寻址位置。在一些这样的实现中,特定位置可以由多个可寻址位置组成。在一些这样的实现中,非核苷酸存储器可以存储多个质量控制值。在一些这样的实现中,特定质量控制值由多个质量控制值组成。在一些这样的实现中,来自多个质量控制值的每个质量控制值与来自多个可寻址位置的对应的可寻址位置相关联。
上述实现中的任何一种或更多种存在变化,其中多核苷酸可以包含检查部分。在一些这样的实现中,该方法可以包括基于规定数据生成检查部分。
上述实现中的任何一种或更多种存在变化,其中检查部分可以是奇偶校验位。
上述实现中的任何一种或更多种存在变化,其中检查部分可以包括多核苷酸中核碱基的甲基化或其他信息保留修饰。
上述实现中的任何一种或更多种存在变化,其中检查部分可以编码与特定质量控制值匹配的数据。
上述实现中的任何一种或更多种存在变化,其中第二多核苷酸可以存储在存储设备中,并且第二多核苷酸可以包含与多核苷酸包含的检查部分相同的第二检查部分。在一些这样的实现中,该方法可以包括基于识别第一多核苷酸和第二多核苷酸之间的差异,确定存储设备中的特定位置将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中特定质量控制值可以是规定数据。在一些这样的实现中,比较可以包括检查存储在多核苷酸中的数据和规定数据之间是否有任何差异。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括确定存储设备中的特定位置不应该被视为具有损坏的数据。在一些这样的实现中,该方法可以包括,基于确定存储设备中的特定位置不应被视为具有损坏的数据,删除存储在非核苷酸存储器中的特定质量控制值。
又一实现涉及一种或更多种存储用于存储设备执行方法的指令的非暂时性计算机可读介质。在一些这样的实现中,该方法可以包括生成一个或更多个命令,以将规定数据写入与存储设备中的特定位置相关联的多核苷酸。在一些这样的实现中,该方法可以包括读取多核苷酸并进行比较。在一些这样的实现中,比较可以将存储在存储设备中的多核苷酸与存储在非核苷酸存储器中的特定质量控制值进行比较。在一些这样的实现中,该方法可以包括基于比较,确定存储设备中的特定位置是否将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于接收到写入存储设备的命令来自动读取多核苷酸、执行比较、以及确定存储设备中的特定位置是否将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括确定存储设备中的特定位置将被视为具有损坏的数据。在一些这样的实现中,该方法可以包括,基于确定存储设备中的特定位置将被视为具有损坏的数据,将编码未损坏数据的新多核苷酸写入存储设备中的特定位置。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于从存储设备中的一个或更多个其他位置读取信息来生成未损坏的数据。
上述实现中的任何一个或更多个存在变化,其中该方法可以包括,基于确定存储设备中的特定位置将被视为具有损坏的数据,并且在将编码未损坏数据的新多核苷酸写入存储设备中的特定位置之前,更新存储设备的索引以指示存储设备中的特定位置具有损坏的数据。在一些这样的实现中,该方法可以包括,在将编码未损坏数据的新多核苷酸写入存储设备中的特定位置之后,更新存储设备的索引以指示存储设备中的特定位置不具有未损坏数据。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括基于规定数据生成特定质量控制值。
上述实现中的任何一种或更多种存在变化,其中存储设备可以包括多个可寻址位置。在一些这样的实现中,特定位置可以由多个可寻址位置组成。在一些这样的实现中,非核苷酸存储器可以存储多个质量控制值。在一些这样的实现中,特定质量控制值由多个质量控制值组成。在一些这样的实现中,来自多个质量控制值的每个质量控制值与来自多个可寻址位置的对应的可寻址位置相关联。
上述实现中的任何一种或更多种存在变化,其中多核苷酸可以包含检查部分。在一些这样的实现中,该方法可以包括基于规定数据生成检查部分。
上述实现中的任何一种或更多种存在变化,其中检查部分可以是奇偶校验位。
上述实现中的任何一种或更多种存在变化,其中检查部分可以包括多核苷酸中核碱基的甲基化或其他或其他信息保留修饰。
上述实现中的任何一种或更多种存在变化,其中检查部分可以编码与特定质量控制值匹配的数据。
上述实现中的任何一种或更多种存在变化,其中第二多核苷酸可以存储在存储设备中,并且第二多核苷酸可以包含与多核苷酸包含的检查部分相同的第二检查部分。在一些这样的实现中,该方法可以包括基于识别第一多核苷酸和第二多核苷酸之间的差异,确定存储设备中的特定位置将被视为具有损坏的数据。
上述实现中的任何一种或更多种存在变化,其中特定质量控制值可以是规定数据。在一些这样的实现中,比较可以包括检查存储在多核苷酸中的数据和规定数据之间是否有任何差异。
上述实现中的任何一种或更多种存在变化,其中该方法可以包括确定存储设备中的特定位置不应该被视为具有损坏的数据。在一些这样的实现中,该方法可以包括,基于确定存储设备中的特定位置不应被视为具有损坏的数据,删除存储在非核苷酸存储器中的特定质量控制值。
应当理解,前述概念和下面更详细讨论的附加概念的所有组合(只要这些概念不相互矛盾)都被认为是这里公开的发明主题的一部分,并且实现了这里描述的益处/优点。特别是,出现在本公开的结尾处的所要求保护的主题的所有组合被设想为本文公开的创造性主题的一部分。
附图简述
在附图和下面的描述中阐述了一个或更多个实现方案的细节。根据说明书、附图和权利要求,其他特征、方面和优点将变得明显,其中:
图1描绘了可用于进行生化过程的系统的示例的示意框图;
图2描绘了可与图1的系统一起使用的可消耗盒的示例的示意性截面框图;
图3描绘了可用于图1的系统的流通池的示例的透视图;
图4描绘了图3的流通池的通道的放大透视图;
图5描绘了可以结合到图4的通道中的阱的示例的示意性截面图;
图6描绘了用于读取多核苷酸的过程的示例的流程图;
图7描绘了可以结合到图4的通道中的阱的另一个例子的示意性截面图;
图8描绘了用于写入多核苷酸的过程的示例的流程图;
图9描绘了电极组件的示例的俯视图;
图10描绘了可结合到图4的通道中的阱的另一示例的示意性截面图;
图11A描绘了可以结合到图4的通道中的阱的示例的俯视图;
图11B描绘了可结合到图4的通道中的阱的另一示例的俯视图;
图11C描绘了可结合到图4的通道中的阱的又一示例的俯视图;
图12A描绘了可操作以对一个或更多个阱进行读取、写入或读写数据的DNA存储系统的一部分的示例的示意图;
图12B描绘了说明由图12A的DNA存储系统投射到多个阱上的光图案的例子的示意图;
图13A描绘了可操作以向一个或更多个阱读取、写入或读写数据的DNA存储系统的一部分的另一个例子的示意图;
图13B描绘了说明多个阱的电润湿的示例的示意图;
图14描绘了可被执行以向多个阱提供受控的读取和写入区域的过程的流程图;
图15描绘了说明可与DNA存储系统一起使用的存储设备的示例的示意图;
图16描绘了可被执行以向图15的存储设备提供读取和写入操作的缓存的过程的流程图;
图17A描绘了可与DNA存储系统一起使用的存储设备的另一示例的示意图;
图17B描绘了可与DNA存储系统一起使用的多个存储设备的配置的示意图;
图18描绘了可被执行以提供与存储设备的冗余数据写入和读取的过程的流程图;
图19描绘了可被执行以提供与存储设备的高速数据写入和读取的过程的流程图;
图20描绘了可被执行以提供与多个存储设备的同时读取和写入的过程的流程图;和
图21描绘了DNA存储系统的示例的示意图。
图22是可以在一些实现中执行的读取和写入数据的过程的描述。
将认识到,附图中的一些或所有附图是用于说明目的的示意性图示。为了说明一个或更多个实现方案的目的而提供附图,明确地理解这些附图将不用于限制权利要求的范围或含义。
详细描述
在一些方面,本文公开了方法和系统,用于在包含机器写入的DNA的DNA存储设备中提供存储阱的选择性激活、同时的阱读取和写入以及数据错误的缓解,以及用于合成DNA(或其他生物材料)以存储数据或其他信息;和/或读取机器写入的DNA(或其他生物材料)来检索机器写入的数据或其他信息。机器写入的DNA可以替代传统形式的数据存储(如磁存储、光存储和固态存储)。机器写入的DNA可以提供更快的读写速度、更长的数据保留时间、更低的功耗和更高的数据密度。虽然这里描述的例子指的是“DNA存储系统”或“DNA存储设备”,但应该理解这只是多核苷酸存储的一个例子。本文的教导可以容易地应用于利用不一定是DNA形式的多核苷酸的存储系统和设备。因此,本发明不限于使用DNA作为本文所述的唯一一种用于存储的多核苷酸。此外,多核苷酸只是如本文所述可用于存储的生物材料的一个例子。
数字信息如何存储在DNA中的例子在2015年9月17日公布的题为“High-Capacityof Storage of Digital Information in DNA”的第2015/0261664号美国出版物中公开,其全部内容通过引用结合于此。例如,可以使用来自编码理论的方法来增强来自DNA片段的编码消息的可恢复性,包括禁止已知与现有高通量技术中的较高错误率相关联的DNA均聚物(即,多于一个相同碱基的运行)。此外,类似于奇偶校验位的检错部分可以被集成到代码中的索引信息中。更复杂的方案,包括但不限于纠错码,实际上,信息学中目前采用的基本上任何形式的数字数据安全(例如,基于RAID的方案),可以在DNA存储方案的未来发展中实施。信息的DNA编码可以用软件计算。组成每个计算机文件的字节可以由没有均聚物的DNA序列通过编码方案来表示,以产生编码文件,该编码文件用形成DNA序列的五个或六个碱基来替换每个字节。
编码方案中使用的代码可以被构造成允许接近运行长度受限信道的最佳信息容量的直接编码(例如,没有重复的核苷酸),尽管也可以使用其他编码方案。所得的电子DNA序列可能太长,不容易通过标准寡核苷酸合成产生,并且可能被分成长度为100个碱基的重叠片段,其中75个碱基重叠。为了降低系统合成误差引入任何特定碱基运行的风险,片段中的交替片段可以被转换成它们的反向互补,这意味着每个碱基可以被“写”四次,每个方向两次。然后,每个片段可以用索引信息加上简单的错误检测信息来扩充,该索引信息允许确定该段起源的计算机文件及其在该计算机文件中的位置。这种索引信息也可以被编码为非重复的DNA核苷酸,并附加到DNA片段的信息存储碱基上。将DNA片段分成100个碱基的长度和75个碱基的重叠纯粹是任意的和说明性的,应当理解,可以使用其他长度和重叠,而不是限制性的。
可以使用DNA片段的其他编码方案,例如提供增强的纠错性能。可以增加索引信息量,以便允许对更多或更大的文件进行编码。为了避免DNA片段中的系统模式,编码方案的一个扩展可以是添加信息中的改变。一种方法是对DNA片段中的信息进行“混洗”,如果知道混洗的模式,就可以检索到信息。不同模式的混洗可用于不同的DNA片段。另一种方法是在每个DNA片段的信息中加入一定程度的随机性。为此,可以通过使用一系列随机数字和包含编码在DNA片段中的信息的数字的模加来使用一系列随机数字。如果知道所用的一系列随机数字,可以在解码过程中通过模减法检索信息。不同系列的随机数字可用于不同的DNA片段。每个串的数据编码部分可包含香农信息,每DNA碱基5.07位,这接近于运行长度限制为1的基数4通道每DNA碱基5.05位的理论最佳值。索引实现可以允许314=4782969个唯一的数据位置。将用于指定文件和文件内位置的索引三进制数位(因此也是基数)的数量增加两个,即16个,得到316=43046721个唯一位置,超过了嵌套引物分子存储器(NPMM)方案的实际最大值16.8M。
DNA片段设计可以在三个不同的运行中合成(DNA片段随机分配给运行),以创建每个DNA片段设计大约1.2×107个拷贝。可以使用亚磷酰胺化学,并且可以使用原位微阵列合成平台中的喷墨印刷和流通池反应器技术。无水室中的喷墨印刷可以允许将非常少量的亚磷酰胺输送到2D平面表面上的受限耦合区域,导致平行添加数十万个碱基。随后的氧化和脱三苯甲基可以在流通池反应器中进行。一旦完成DNA合成,寡核苷酸就可以从表面切割下来并脱保护。
然后可以将衔接子添加到DNA片段中,以便能够制作DNA片段的多个拷贝。没有衔接子的DNA片段可能需要额外的化学过程,通过在DNA片段的末端添加额外的基团来“启动”合成多个拷贝的化学过程。寡核苷酸可以使用聚合酶链反应(PCR)方法和成对末端PCR引物进行扩增,然后进行珠纯化和定量。然后寡核苷酸可以被测序以产生104个碱基的读数。然后,数字信息解码可以通过从两端测序每个寡核苷酸的中心碱基,并快速计算全长寡核苷酸和去除与设计不一致的序列读数来进行。序列读取可以使用计算机软件进行解码,该软件可以完全逆转编码过程。奇偶校验三进制数位指示错误或可以明确解码或分配给重建的计算机文件的序列读取可以被丢弃。每个解码文件中的位置可以在多个不同的测序DNA寡核苷酸中检测到,简单多数表决可用于解决由DNA合成或测序错误引起的任何差异。
虽然在机器写入的DNA的上下文中提供了几个例子,但是可以设想,这里描述的原理可以应用于其他种类的机器写入的生物材料。
如本文所用,术语“机器写入的DNA”应理解为包括一条或多条多核苷酸链,所述多核苷酸链由机器产生,或以其他方式由机器修饰,以存储数据或其他信息。本文多核苷酸的一个例子是DNA。要注意的是,尽管在本公开全文中使用了在被读取或写入的DNA的上下文中的术语“DNA”,但是该术语仅用作多核苷酸的代表性例子,并且可以包含多核苷酸的概念。“机器”,如这里所使用的“机器写入的”,可以包括专门设计用于写入DNA的仪器或系统,如这里更详细描述的。该系统可以是非生物的或生物的。在一个例子中,生物系统可以包括或者是聚合酶。例如,聚合酶可以是末端脱氧核苷酸转移酶(TdT)。在生物系统中,该过程可以另外由机器硬件(例如,处理器)或算法控制。“机器写入的DNA”可以包括任何具有一个或更多个由机器写入的碱基序列的多核苷酸。虽然机器写入的DNA在本文中被用作例子,但是其它多核苷酸链可以替代本文所述的机器写入的DNA。“机器写入的DNA”可以包括天然碱基和天然碱基的修饰,包括但不限于甲基化或其他化学标签修饰的碱基;一种类似于DNA的人工合成聚合物,如肽核酸(PNA);或者吗啉代DNA。“机器写入的DNA”还可以包括由至少一条来源于自然界(例如,从天然存在的生物体中提取)的碱基链形成的DNA链或其它多核苷酸,机器写入的碱基链以平行方式或端对端方式固定于其上。在其他实现中,“机器写入的DNA”可以由生物系统(例如酶)写入,代替或补充在此描述的非生物系统(例如电极机器)对DNA进行写入。换句话说,“机器写入的DNA”可以是机器直接写入的;或者通过由算法和/或机器控制的酶(例如聚合酶)写入的。
“机器写入的DNA”可以包括已经用已知技术从原始形式(例如,照片、文本文档等)转化为二进制编码序列的转换而来的数据,然后用已知技术将该二进制编码序列转化为DNA碱基序列,然后用机器以一条或多条DNA链或其它多核苷酸的形式产生该DNA碱基序列。或者,可以生成“机器写入的DNA”,以索引或以其他方式跟踪预先存在的DNA,存储来自任何其他来源的数据或信息,并用于任何合适的目的,而不一定需要将原始数据转换成二进制代码的中间步骤。
如下文更详细描述的,机器写入的DNA可以被写入反应位点和/或从反应位点读取。如本文所用,术语“反应位点”是可以发生至少一个指定反应的局部区域。反应位点可以包括反应结构或基底的支撑表面,在该支撑表面上可以固定物质。例如,反应位点可以是一个离散的空间区域,其中写入了一组离散的DNA链或其他多核苷酸。反应位点可以允许与相邻反应位点的反应分离的化学反应。提供DNA机器写入的设备可以包括带有具有写入特征(例如,电极)和/或读取特征的阱的流通池。在一些情况下,反应位点可以包括反应结构的表面(其可以位于流通池的通道中),该表面上已经具有反应组分,例如其上的多核苷酸集落。在一些流通池中,集落中的多核苷酸具有相同的序列,例如,单链或双链模板的克隆拷贝。然而,在一些流通池中,反应位点可以仅包含单个多核苷酸分子,例如单链或双链形式。
多个反应位点可以沿着流通池的反应结构随机分布,或者可以以预定的方式排列(例如,在矩阵中并排排列,例如在微阵列中)。反应位点还可以包括反应室、凹部或阱,其至少部分地限定了被配置成分隔指定反应的空间区域或体积。如本文所用,术语“反应室”或“反应凹部”包括支撑结构的限定空间区域(其通常与流动通道流体地联接)。反应凹部可以至少部分地与周围环境或其他空间区域分离。例如,多个反应凹部可以通过共享的壁彼此分开。作为更具体的例子,反应凹部可以是纳米阱,其包括由检测表面的内表面限定的凹痕、凹坑、阱、凹槽、空腔或凹陷,并且具有开口或孔径(即,侧面开放),使得纳米阱可以与流动通道流体地联接。
多个反应位点可以沿着流通池的反应结构随机分布,或者可以以预定的方式排列(例如,在矩阵中并排排列,例如在微阵列中)。反应位点还可以包括反应室、凹部或阱,其至少部分地限定了被配置成分隔指定反应的空间区域或体积。如本文所用,术语“反应室”或“反应凹部”包括支撑结构的限定空间区域(其通常与流动通道流体地联接)。反应凹部可以至少部分地与周围环境或其他空间区域分离。例如,多个反应凹部可以通过共享的壁彼此分开。作为更具体的例子,反应凹部可以是纳米阱,其包括由检测表面的内表面限定的凹痕、凹坑、阱、凹槽、空腔或凹陷,并且具有开口或孔径(即,侧面开放),使得纳米阱可以与流动通道流体地联接。
为了读取机器写入的DNA,可以定义反应位点的一个或更多个离散的可检测区域。这种可检测区域可以是可成像区域、电检测区域或基于读取过程中存在的核苷酸类型在性质上具有可测量的变化(或性质上没有变化)的其他类型的区域。
如本文所用,术语“像素”是指离散的可成像区域。每个可成像区域可以包括存在多核苷酸的隔室或离散空间区域。在一些情况下,像素可以包括两个或更多个反应位点(例如,两个或更多个反应室、两个或更多个反应凹部、两个或更多个阱等。在一些其他情况下,像素可以仅包括一个反应位点。使用相应的检测设备,例如图像传感器或其他光检测设备来检测每个像素。光检测设备可以使用集成电路制造工艺来制造,例如用于制造电荷耦合设备电路(CCD)或互补金属氧化物半导体(CMOS)设备或电路的工艺。光检测设备因此可以包括例如一种或更多种半导体材料,并且可以采取例如CMOS光检测设备(例如CMOS图像传感器)或CCD图像传感器(另一种类型的图像传感器)的形式。CMOS图像传感器可以包括光传感器阵列(例如光电二极管)。在一个实现中,单个图像传感器可以与物镜一起使用,以在成像事件期间捕获几个“像素”。在一些其他实现中,每个分立的光电二极管或光传感器可以捕获相应的像素。在一些实现中,一个或更多个检测设备的光传感器(例如,光电二极管)可以与相应的反应位点相关联。与反应位点相关联的光传感器可以检测来自相关反应位点的光发射。在一些实现中,当在相关的反应位点发生指定的反应时,可以通过至少一个光导来进行光发射的检测。在一些实现中,多个光传感器(例如,光检测或摄像设备的几个像素)可以与单个反应位点相关联。在一些实现中,单个光传感器(例如,单个像素)可以与单个反应位点或一组反应位点相关联。
如本文所用,术语“合成”应理解为包括由机器产生DNA以存储数据或其他信息的过程。因此,机器写入的DNA可以构成合成的DNA。如本文所用,术语“可消耗的盒”、“试剂盒”、“可移除的盒”和/或“盒”是指构成盒或盒系统的组件的相同盒和/或部件的组合。本文所述的盒可以独立于具有反应位点的元件,例如具有多个阱的流通池。在一些情况下,流通池可以可移除地插入到盒中,然后盒被插入到仪器中。在一些其他实现中,流通池可以在没有盒的情况下可移除地插入到仪器中。如本文所使用的,术语“生化分析”可以包括生物分析或化学分析中的至少一种。
术语“基于”应理解为是指某事物至少部分地由其被指示为“基于”的事物所决定。为了表明某物必须完全由其他东西决定,它被描述为完全基于它完全由什么决定。
术语“非核苷酸存储器”应理解为是指能够以不同于核苷酸的形式存储数据或指令的对象、设备或设备组合,所述数据或指令可由设备检索和/或处理。“非核苷酸存储器”的例子包括固态存储器、磁存储器、硬盘驱动器、光驱和前述的组合(例如,磁光存储元件)。
术语“DNA存储设备”应理解为是指被配置为以多核苷酸序列(如机器写入的DNA)的形式存储数据或指令的对象、设备或设备组合。“DNA存储设备”的例子包括具有如本文所述的可寻址阱的流通池、包含多个这种流通池的系统、以及存储已经从合成核苷酸序列的表面切割下来的核苷酸序列的管或其它容器。如本文所用,术语“核苷酸序列”或“多核苷酸序列”应理解为包括多核苷酸分子,以及分子的基础序列,这取决于上下文。多核苷酸序列可以包含(或编码)指示某些物理特征的信息。
本文所述的实现可用于执行用于可消耗盒制备和/或生物化学分析和/或机器写入的DNA合成的指定反应。
I.系统概述
图1是被配置为进行生化分析和/或合成的系统100的示意图。系统100可以包括基础仪器102,该基础仪器102被配置为接收和可分离地接合可移除盒200和/或具有一个或更多个反应位点的部件。基础仪器102和可移除盒200可以被配置成相互作用以将生物材料运输到系统100内的不同位置和/或进行包括生物材料的指定反应,以便为后续分析(例如,通过合成生物材料)制备生物材料,并且可选地,检测生物材料的一个或更多个事件。在一些实现中,基础仪器102可以被配置成检测直接在可移除盒200上的生物材料的一个或更多个事件。该事件可以指示与生物材料一起的指定反应。可移除盒200可以根据这里描述的任何盒来构造。
尽管下面参考了如图1所示的基础仪器102和可移除盒200,但是应当理解,基础仪器102和可移除盒200仅示出了系统100的一种实现,并且存在其他实现。例如,基础仪器102和可移除盒200包括各种部件和特征,它们共同执行用于制备生物材料和/或分析生物材料的若干操作。此外,尽管本文所述的可移除盒200包括具有反应位点的元件,例如具有多个阱的流通池,但是其他盒可以独立于具有反应位点的元件,并且具有反应位点的元件可以单独插入到基础仪器102中。也就是说,在一些情况下,流通池可以可移除地插入到可移除盒200中,然后可移除盒200被插入到基础仪器102中。在一些其他实现中,流通池可以可移除地直接插入到基础仪器102中,而没有可移除的盒200。在另外的实现中,流通池可以集成到插入到基础仪器102中的可移除盒200中。
在示出的实现中,基础仪器102和可移除盒200中的每一个能够执行某些功能。然而,应理解,基础仪器102和可移除盒200可以执行不同的功能和/或可以共有这样的功能。例如,基础仪器102被显示为包括检测组件110(例如,成像设备),其被配置为检测可移除盒200处的指定反应。在替代实现中,可移除盒200可以包括检测组件,并且可以通信地耦合到基础仪器102的一个或更多个部件。作为另一个示例,基础仪器102是不提供、接纳液体或与可移除盒200交换液体的“干”仪器(“dry”instrument)。也就是说,如图所示,可移除盒200包括可消耗试剂部分210和流通池接收部分220。可消耗试剂部分210可以包含在生化分析和/或合成期间使用的试剂。流通池接收部分220可包括光学透明区域或其他可检测区域,用于检测组件110对流通池接收部分220内发生的一个或更多个事件进行检测。在替代实现中,基础仪器102可以向可移除盒200提供例如试剂或其他液体,这些试剂或其他液体随后被可移除盒200消耗(例如,用于指定的反应或合成过程)。
如本文所用,生物材料可包括一种或更多种生物或化学物质,例如核苷、核苷酸、核酸、多核苷酸、寡核苷酸、蛋白质、酶、肽、寡肽、多肽、抗体、抗原、配体、受体、多糖、碳水化合物、多磷酸盐、纳米孔、细胞器、脂质层、细胞、组织、生物体和/或生物活性化合物,例如上述物种的类似物或模拟物。在一些情况下,生物材料可以包括全血、淋巴液、血清、血浆、汗液、泪液、唾液、痰液、脑脊液、羊水、精液、阴道分泌物、浆液、滑液、心包液、腹膜液、胸膜液、渗出液、渗出物、囊液、胆汁、尿液、胃液、肠液、粪便样本、含有单个或更多个细胞的液体、含有细胞器的液体、流化组织、流化生物体、包括病毒病原体的病毒、含有多细胞生物体的液体、生物拭子和生物洗液。在一些情况下,生物材料可以包括一组合成序列,包括但不限于机器写入的DNA,其可以是固定的(例如,附着在盒中的特定阱中)或不固定的(例如,储存在试管中)。
在一些实现中,生物材料可包括添加的材料,例如水、去离子水、盐水溶液、酸性溶液、碱性溶液、洗涤剂溶液和/或pH缓冲液。添加的材料还可以包括将在指定的测定方案期间使用以进行生化反应的试剂。例如,添加的液体可以包括与生物材料进行多个聚合酶链反应(PCR)循环的材料。在其他方面,添加的材料可以是生物材料的载体,例如细胞培养基或其他缓冲的和/或pH调节的和/或等渗的载体,其可以允许或保持生物材料的生物功能。
然而,应该理解的是,被分析的生物材料可以是与装载到系统100中或由系统100产生的生物材料不同的形式或状态。例如,装载到系统100中的生物材料可以包括全血或唾液或细胞群,其随后被处理(例如,通过分离或扩增程序)以提供制备的核酸。然后可以通过系统100分析(例如,通过PCR定量地或通过SBS测序)制备的核酸。因此,当在描述诸如PCR的第一操作的同时使用术语“生物材料”并且在描述随后的第二操作,例如测序时再次使用时,应当理解,第二操作中的生物材料可以相对于在第一操作之前或在第一操作期间的生物材料被改变。例如,可以对扩增子核酸进行测序(例如SBS),所述扩增子核酸由在先前扩增(例如PCR)中扩增的模板核酸产生。在这种情况下,扩增子是模板的拷贝,并且扩增子与模板的量相比以更高的量存在。
在一些实现中,系统100可以基于用户提供的物质(例如,全血或唾液或细胞群)自动制备用于生化分析的样本。然而,在其它实现中,系统100可分析生物材料,其部分地或预先被制备用于由用户分析。例如,用户可以提供包含已经从全血中分离和/或扩增的核酸的溶液;或者可以提供其中RNA或DNA序列部分或全部暴露用于处理的病毒样品。
如本文中所使用的,“指定反应”包括所讨论的分析物的在化学、电学、物理或光学性质(或特性)中的至少一个方面的改变。在特定的实现中,指定的反应是缔合型结合事件(例如,将所讨论的分析物与荧光标记的生物分子掺合)。指定的反应可以是解离型结合事件(例如,从所讨论的分析物释放荧光标记的生物分子)。指定的反应可以是化学转化、化学变化或化学相互作用。指定的反应也可以是电特性方面的变化。例如,指定的反应可以是溶液中离子浓度的变化。一些反应包括但不限于化学反应,例如,还原、氧化、加成、消除、重排、酯化、酰胺化、醚化、环化或取代;其中第一化学物质结合第二化学物质的结合相互作用;其中两种或更多种化学物质彼此分离的解离反应;荧光;发光;生物发光;化学发光;以及生物反应,例如,核酸复制、核酸扩增、核酸杂交、核酸连接、磷酸化、酶催化、受体结合,或配体结合。指定的反应也可以是质子的添加或移除,例如,作为周围溶液或环境的pH变化而可检测到的。附加的指定的反应可以是检测穿过膜(例如,天然或合成双层膜)的离子流。例如,当离子流过膜时,电流被中断,并且可以检测到中断。也可以使用带电标签的现场感测;热感测和其他合适的分析感测技术也是如此。
在特定的实现中,指定的反应包括将荧光标记的分子掺合到分析物中。分析物可以是寡核苷酸,并且荧光标记的分子可以是核苷酸。当激发光指向具有所标记的核苷酸的寡核苷酸时,可以检测该指定的反应,并且荧光团发射可检测的荧光信号。在可选的实现中,检测到的荧光是化学发光和/或生物发光的结果。指定的反应还可以例如通过使供体荧光团接近受体荧光团而增加荧光共振能量转移(fluorescence(或
Figure BDA0002851377500000261
)resonanceenergy transfer,FRET),通过分离供体荧光团和受体荧光团来减少FRET,通过从荧光团分离猝灭剂来增加荧光或通过共同定位猝灭剂和荧光团来增加荧光。
如本文中所使用的,“反应成分”包括可用于获得指定反应的任何物质。例如,反应成分包括试剂、例如酶的催化剂、用于反应的反应物、样品、反应产物、其它生物分子、盐、金属辅因子、螯合剂以及缓冲溶液(例如,氢化缓冲液)。反应成分可以单独地在溶液中或结合在一种或更多种混合物中被输送到流控网络中的不同位置。例如,反应成分可以被输送到其中生物材料被固定的反应室。反应成分可以与生物材料直接地或间接地相互作用。在一些实现中,可移除盒200预装载有一种或更多种参与执行指定测定方案的反应成分。预装载可以在由使用者(例如,在消费者的设施处)接收到盒200之前在一个位置(例如,制造设施)处发生。例如,一种或更多种反应成分或试剂可以预装载到可消耗试剂部分210中。在一些实现中,可移除盒200也可以在流通池接收部分220中预装流通池。
在一些实现中,基础仪器102可以构造成每个环节与一个可移除盒200相互作用。在该环节之后,该可移除盒200可以由另一个可移除盒200替换。在一些实现中,基础仪器102可以构造成每个环节与一个以上的可移除盒200相互作用。如本文所使用的,术语“环节”包括执行样品制备和/或生化分析方案中的至少一个。样品制备可包括合成生物材料;和/或分离、隔离、修饰和/或扩增生物材料的一种或更多种成分,使得制备的生物材料适于分析。在一些实现中,环节可以包括其中进行多个受控反应的连续活动,直到(a)已经进行指定数量的反应,(b)已经检测指定数量的事件,(c)已经经过指定时间段的系统时间,(d)信噪比已下降到指定阈值;(e)已经识别目标成分;(f)已经检测到系统失效或故障;和/或(g)已经耗尽用于进行反应的一种或更多种资源。可选地,环节可以包括将系统活动暂停一段时间(例如,分钟、小时、天、周)并且稍后完成该环节,直到(a)-(g)中的至少一个发生。
测定方案可以包括用于进行指定的反应、检测指定的反应和/或分析指定的反应的一系列操作。共同地,可移除盒200和基础仪器102可以包括用于执行不同操作的部件。测定方案的操作可以包括流控操作、热控制操作、检测操作和/或机械操作。
流控操作包括控制穿过系统100的流体(例如,液体或气体)的流动,系统100可以由基础仪器102和/或可移除盒200致动。在一个例子中,流体是液体形式。例如,流控操作可以包括控制泵以诱导生物材料或反应成分流入反应室中。
热控制操作可以包括控制系统100的指定部分的温度,例如可移除盒200的一个或更多个部分的温度。举例来说,热控制操作可以包括升高或降低在其包括生物材料的流体储存在其中的聚合酶链反应(PCR)区域的温度。
检测操作可以包括控制检测器的致动或监测检测器的活动以检测生物材料的预定性质、特性或特征。作为一个示例,检测操作可以包括捕获包括生物材料的指定区域的图像以检测来自指定区域的荧光发射。检测操作可以包括控制光源以照射生物材料或控制检测器以观察生物材料。
机械操作可以包括控制指定部件的移动或位置。例如,机械操作可以包括控制马达以移动基础仪器102中的可操作地接合可移除盒200中的可移动阀的阀控制部件。在一些例子中,不同操作的组合可以同时发生。例如,当泵控制穿过反应室的流体流时,检测器可以捕获反应室的图像。在一些例子中,指向不同生物材料的不同操作可以同时发生。例如,第一生物材料可以经历扩增(例如,PCR),同时第二生物材料可以经历检测。
类似或相同的流控元件(例如,通道、端口、储器等)可以被不同地标记,以更容易地区分这些流控元件。例如,端口可以被称为储器端口、供应端口、网络端口、馈送端口等。应理解,被不同地标记的两个或更多个流控元件(例如,储器通道、样本通道、流动通道、桥接通道)不要求流控元件在结构上不同。另外,可以修改权利要求以添加这样的标记以更容易地区分权利要求中的这样的流控元件。
本文所使用的“液体”是相对不可压缩的并且具有流动和符合保持物质的容器或通道的形状的能力的物质。液体可以是水基的,并且包括极性分子,极性分子呈现将液体保持在一起的表面张力。液体还可以包括例如在油基或非水物质中的非极性分子。应当理解,在本申请中提及的液体可以包括包含两种或更多种液体的组合的液体。例如,单独的试剂溶液可以随后组合以进行指定的反应。
一个或更多个实现可以包括将生物材料(例如,模板核酸)保留在分析生物材料的指定位置处。如本文中所使用的,当关于生物材料使用时,术语“保留”包括将生物材料附着到表面或将生物材料限制在指定空间内。如本文中所使用的,当关于生物材料使用时,术语“固定”包括将生物材料附着到固体载体中的表面或固体载体上的表面。固定可以包括将生物材料以分子水平附接到该表面。例如,可以使用包括非共价相互作用(例如,静电力、范德华力以及疏水界面的脱水)和共价结合技术的吸附技术将生物材料固定到基底表面,其中功能团或接头促进将生物样品附接到该表面。将生物材料固定到基底的表面可以基于基底表面、携带生物材料的液体介质的特性以及生物材料自身的特性。在一些例子中,基底表面可以被功能化(例如,化学地或物理地改变)以促进将生物材料固定到基底表面。该基底表面可以首先被改变以具有结合至表面的官能团。然后,官能团可以结合到生物材料以将生物材料固定在其上。在某些情况下,生物材料可以通过凝胶固定在表面上。
在一些实现中,核酸可以固定化到表面并使用桥式扩增进行扩增。另一种在表面上扩增核酸的有用方法是滚环扩增(RCA),例如,使用下面更详细阐述的方法。在一些实现中,核酸可以附接至表面并使用一个或更多个引物对被扩增。例如,一种引物可以在溶液中,并且另一种引物可以固定在表面上(例如,5'-附接)。举例来说,核酸分子可以与表面上的引物中的一个杂交,随后延伸所固定的引物以产生核酸的第一拷贝。溶液中的引物然后与核酸的第一拷贝杂交,核酸的第一拷贝可以使用核酸的第一拷贝作为模板进行延伸。任选地,在产生核酸的第一拷贝之后,原始核酸分子可以与表面上的第二固定化的引物杂交,并且可以同时或在溶液中的引物延伸之后延伸。在任何实现中,使用溶液中的固定引物和引物的重复延伸轮次(例如扩增)可用于提供核酸的多个拷贝。在一些实现中,生物材料可以与构造成在生物材料的扩增(例如,PCR)期间使用的反应成分一起被限定在预定空间内。
本文阐述的一个或更多个实现可以构造成执行是扩增(或PCR)方案或包括扩增(例如PCR)方案的测定方案。在扩增方案期间,可以改变储器或通道内生物材料的温度,以便扩增目标序列或生物材料(例如,生物材料的DNA)。举例来说,生物材料可以经历(1)大约95℃的预加热阶段大约75秒;(2)大约95℃的变性阶段大约15秒;(3)大约59℃的退火-延伸阶段(annealing-extension stage)大约45秒;以及(4)大约72℃的温度保持阶段大约60秒。实现可以执行多个扩增循环。应注意,上述循环仅描述了一个特定的实现,并且可选实现可以包括对扩增方案的修改。
本文阐述的方法和系统可以使用具有多种密度中任何密度的特征的阵列,包括例如至少约10个特征/cm2、约100个特征/cm2、约500个特征/cm2、约1000个特征/cm2、约5000个特征/cm2、约10000个特征/cm2、约50000个特征/cm2、约100000个特征/cm2、约1000000个特征/cm2、约5000000个特征/cm2,或更高。本文阐述的方法和装置可以包括具有至少足以以这些密度中的一个或更多个来解析各个特征的分辨率的检测部件或设备。
基础仪器102可以包括用户界面130,用户界面130构造成接收用于进行指定的测定方案的使用者输入和/或构造成为使用者传送关于测定的信息。用户界面130可以与基础仪器102合并在一起。例如,用户界面130可以包括触摸屏,触摸屏附接到基础仪器102的外壳并且构造成识别来自使用者的触摸和相对于显示在触摸屏上的信息的触摸的位置。可选地,用户界面130可以相对于基础仪器102远离地定位。
II.盒
可移除盒200被构造成在盒室140处可分离地接合或可移除地联接到基础仪器102。如本文所用,当术语“可分离地接合”或“可移除地联接”(或类似术语)用于描述可移除盒200和基础仪器102之间的关系时。该术语旨在表示可移除盒200和基础仪器102之间的连接是可分离的,而不会破坏基础仪器102。因此,可移除盒200可以以电的方式可分离地接合到基础仪器102,使得基础仪器102的电触头不被破坏。可移除盒200可以以机械方式可分离地接合到基础仪器102,使得保持可移除盒200的基础仪器102的特征(例如盒室140)不会被破坏。该可移除盒200可以以流体的方式可分离地接合到基础仪器102,使得基础仪器102的端口不被破坏。例如,如果仅需要对部件进行简单的调整(例如,重新对齐)或者需要简单的更换(例如更换喷嘴),则不认为基础仪器102被“破坏”。当部件可彼此分离而无需过度的努力或在分离部件上花费大量时间时,部件(例如,可移除盒200和基础仪器102)可以是容易地可分离的。在一些实现中,可移除盒200和基础仪器102可以是容易地可分离的,而不破坏可移除盒200或基础仪器102。
在一些实现中,可移除盒200可以在与基础仪器102在一起的时间段期间被永久地改变或部分地损坏。例如,容纳液体的容器可以包括箔盖,该箔盖被刺穿以允许液体流过系统100。在这种实现中,箔盖可能被损坏,使得损坏的容器将被另一个容器替换。在特定的实现中,可移除盒200是一次性盒,使得可移除盒200可以在单次使用之后被替换以及任选地被处理掉。类似地,可移除盒200的流通池可以是单独一次性的,使得流通池可以在单次使用后被替换并可选地被处理掉。
在其它的实现中,可移除盒200可以在与基础仪器102接合时用于一个以上的环节,和/或可以从基础仪器102移除,重新装载试剂,并重新接合到基础仪器102以进行额外的指定反应。因此,在一些情况下,可移除盒200可被整修,使得同一个可移除盒200可以与不同的消耗品(例如,反应成分和生物材料)一起使用。在从位于客户设施处的基础仪器102移除盒200之后,可以在制造设施处进行整修。
盒室140可以包括狭槽、安装件、连接器接口和/或任何其他特征,以接收可移除盒200或其一部分,从而与基础仪器102相互作用。
可移除盒200可以包括流控网络,该流控网络可以保持并引导流体(例如,液体或气体)通过其中。流控网络可以包括多个互连的流控元件,该多个互连的流控元件能够储存流体和/或允许流体流过其中。流控元件的非限制性示例包括通道、通道的端口、腔、储存设备、存储设备的储器、反应室、废物储器、检测室,用于反应和检测的多用途室等。例如,可消耗试剂部分210可以包括一个或更多个储存试剂的试剂阱或试剂室,并且可以是流控网络的一部分或耦合到流控网络。该流控元件可以以指定的方式流体地联接至彼此,使得系统100能够执行样品制备和/或分析。
如本文所使用的,术语“流体地联接”(或类似术语)是指连接在一起的两个空间区域,使得液体或气体可以在该两个空间区域之间被引导。在一些例子中,流体联接允许流体在该两个空间区域之间被来回引导。在另一些例子中,流体联接是单向的,使得在该两个空间区域之间仅存在一个流动方向。例如,测定储器可以与通道流体地联接,使得液体可以从测定储器输送到通道中。然而,在一些实现中,可能不能将通道中的流体引导回至测定储器中。在特定的实现中,流控网络可以构造成接收生物材料并引导生物材料穿过样品制备和/或样品分析。流控网络可以将生物材料其它反应成分引导到废物储器。
图2描绘了可消耗盒300的实现。可消耗盒可以是组合的可移除盒的一部分,例如图1的可移除盒200的可消耗试剂部分210;或者可以是单独的试剂盒。可消耗盒300可以包括外壳302和顶部304。外壳302可以包括非导电聚合物或其他材料,并且被形成为制造一个或更多个试剂室310、320、330。试剂室310、320、330的尺寸可以变化,以适应存储在其中的不同体积的试剂。例如,第一室310可以大于第二室320,第二室320可以大于第三室330。第一室310的尺寸适于容纳更大体积的特定试剂,例如缓冲试剂。第二室320的尺寸可以设置成容纳比第一室310更小体积的试剂,例如容纳裂解试剂的试剂室。第三室330的尺寸可以设置成容纳比第一室310和第二室320更小体积的试剂,例如容纳全功能含核苷酸试剂的试剂室。
在图示的实现中,外壳302具有多个外壳壁或侧面350,在其中形成室310、320、330。在图示的实现中,外壳302形成至少基本上是整体或单片的结构。在替代实现中,外壳302可以由一个或更多个子部件构成,这些子部件被组合以形成外壳302,例如用于室310、320和330的独立形成的隔室。
一旦试剂被提供到相应的室310、320、330中,外壳302可以由顶部304密封。顶部304可以包括导电或非导电材料。例如,顶部304可以是铝箔密封件,其粘接到外壳302的顶面,以将试剂密封在其各自的室310、320、330内。在其他实现中,顶部304可以是塑料密封件,该塑料密封件粘接到外壳302的顶面,以将试剂密封在它们各自的室310、320、330内。
在一些实现中,外壳302还可以包括标识器390。标识器390可以是射频识别(RFID)应答器、条形码、识别芯片和/或其他标识符。在一些实现中,标识器390可以嵌入外壳302中或者附着到外表面。标识器390可以包括用于可消耗盒300的唯一标识符的数据和/或用于可消耗盒300的类型的数据。如本文所述,标识器390的数据可由基础仪器102或被配置用于加热可消耗盒300的单独设备读取。
在一些实现中,可消耗盒300可以包括其他部件,例如阀、泵、流体线路、端口等。在一些实现中,可消耗盒300可以包含在另一个外壳内。
III.系统控制器
基础仪器102还可以包括系统控制器120,该系统控制器120被配置为控制可移除盒200和/或检测组件110中的至少一个的操作。系统控制器120可以利用专用硬件电路、板、DSP、处理器等的任何组合来实现。可选地,系统控制器120可以利用具有单个处理器或多个处理器的现成的PC来实现,其中功能操作分布在处理器之间。作为另一选择,可以利用混合配置来实现系统控制器120,在该混合配置中利用专用硬件来执行某些模块功能,而利用现成的PC等来执行其余的模块功能。
系统控制器120可以包括多个电路模块,多个电路模块构造成控制基础仪器102和/或可移除盒200的某些部件的操作。这里的术语“模块”可以指被配置成执行特定任务的硬件设备。例如,电路模块可以包括流量控制模块,该流量控制模块被配置成控制通过可移除盒200的流控网络的流体流量。流量控制模块可以可操作地连接到阀致动器和/或系统泵。流量控制模块可以选择性地启动阀致动器和/或系统泵,以引导流体流过一个或更多个路径和/或阻止流体流过一个或更多个路径。
系统控制器120还可以包括热控制模块。热控制模块可以控制热循环器或其他热部件,以提供和/或移除来自可移除盒200的样品制备区域和/或可移除盒200的任何其他区域的热能。在一个特定的例子中,热循环器可以根据PCR方案增加和/或降低生物材料经历的温度。
系统控制器120还可以包括检测模块,其构造成控制检测组件110以获得关于生物材料的数据。如果检测组件110是可移除盒200的一部分,则检测模块可以通过直接有线连接或者通过接触阵列来控制检测组件110的操作。检测模块可以控制检测组件110在预定时间或预定时间段获取数据。举例来说,当生物材料具有附着于其上的荧光团时,检测模块可以控制检测组件110捕获可移除盒的流通池接收部分220的反应室的图像。在一些实现中,可以获得多个图像。
任选地,系统控制器120可以包括分析模块,分析模块构造成分析数据以向系统100的使用者提供至少部分结果。例如,分析模块可以分析由检测组件110提供的成像数据。该分析可以包括识别生物材料的核酸序列。
以上描述的系统控制器120和/或电路模块可以包括一个或更多个基于逻辑的设备,包括一个或更多个微控制器、处理器、精简指令集计算机(RISC)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、逻辑电路以及能够执行本文所描述的功能的任何其它电路。在一个实现中,系统控制器120和/或电路模块执行存储在计算机或机器可读介质中的一组指令,以便执行一个或更多个测定方案和/或其他操作。该组指令可以信息源或物理存储元件的形式存储在基础仪器102和/或可移除盒200内。由系统100执行的方案可以用于执行,例如,机器写入DNA或以其他方式合成DNA(例如,将二进制数据转换成DNA序列,然后合成DNA链或代表二进制数据的其他多核苷酸)、DNA或RNA的定量分析、蛋白质分析、DNA测序(例如,合成测序(SBS))、样品制备和/或用于测序的片段库的制备。
指令集可以包括指令系统100执行诸如本文所描述的各种实现的方法和过程的特定操作的各种命令。指令集可以是软件程序的形式。如本文所使用的,术语“软件”和“固件”是可互换的,并且包括储存在包括RAM存储器、ROM存储器、EPROM存储器、EEPROM存储器以及非易失性RAM(NVRAM)存储器的存储器中以由计算机执行的任何计算机程序。上面的存储器类型仅仅是示例,并且因此并不限制可用于储存计算机程序的存储器的类型。
软件可以是各种形式,例如系统软件或应用软件。此外,软件可以是单独程序的集合或者更大程序或程序模块的一部分内的程序模块的形式。软件还可以包括面向对象编程形式的模块化编程。在获得检测数据之后,检测数据可以由系统100自动处理,响应于使用者输入而被处理,或响应于由另一处理机器做出的请求(例如,通过通信链路的远程请求)而被处理。
系统控制器120可以经由可以是硬连线的或无线的通信链路连接到系统100的其它部件或子系统。系统控制器120还可以通信地连接到场外系统或服务器。系统控制器120可以接收来自用户界面130的使用者输入或命令。用户界面130可以包括键盘、鼠标、触摸屏面板和/或语音识别系统等。
系统控制器120用于提供处理能力,例如储存、译解和/或执行软件指令,以及控制系统100的整体操作。系统控制器120可以被配置并且编程以控制各种部件的数据方面和/或功率方面。尽管系统控制器120在图1中被表示为单个结构,但是应理解,系统控制器120可以包括在不同位置遍布系统100分布的多个单独的部件(例如,处理器)。在一些实现中,一个或更多个部件可以与基础仪器102集成,并且一个或更多个部件可以相对于基础仪器102远离地定位。
IV.流通池
图3-4描绘了可用于系统100的流通池400的例子。该示例的流通池包括限定多个细长流动通道410的主体,该流动通道410凹入主体402的上表面404下方。流动通道410通常彼此平行,并且基本上沿着主体402的整个长度延伸。虽然示出了五个流动通道410,但是流通池400可以包括任何其他合适数量的流动通道410,包括多于或少于五个流动通道410。该示例的流通池400还包括一组入口端口420和一组出口端口422,每个端口420、422与相应的流动通道410相关联。因此,每个入口端口420可用于将流体(例如,试剂等)传送到相应的通道410;而每个出口端口422可用于传送来自相应流动通道410的流体。
在一些形式中,流通池400直接集成到可移除盒200的流通池接收部分220中。在一些其它形式中,流通池400可移除地与可移除盒200的流通池接收部分220连接。在流通池400直接集成到流通池接收部分220中或者可移除地与流通池接收部分220耦合的形式中,流通池400的流动通道410可以经由入口端口420从可消耗试剂部分210接收流体,入口端口420可以与存储在可消耗试剂部分210中的试剂流体地联接。当然,流动通道410可以经由端口420、422与各种其他流体源或储器等耦合。作为另一个说明性变型,一些形式的可消耗盒300可以被配置成可移除地接收或以其他方式集成流通池400。在这种形式中,流通池400的流动通道410可以通过入口端口420接收来自试剂室310、320、330的流体。根据这里的教导,流通池400可以结合到系统100中的其他合适的方式对于本领域技术人员来说是明显的。
图4更详细地示出了流通池400的流动通道410。如图所示,流动通道410包括形成在流动通道410的基面412中的多个阱430。如下文将更详细描述的,每个阱430被配置为包含DNA链或其他多核苷酸,例如机器写入的多核苷酸。在一些形式中,每个阱430具有圆柱形构造,具有大致圆形的横截面轮廓。在一些其他形式中,每个阱430具有多边形(例如,六边形、八边形等)截面轮廓。可选地,阱430可以具有任何其他合适的构造。还应当理解,阱430可以以任何合适的图案布置,包括但不限于网格图案。
图5示出了流通池500内的通道的一部分,该流通池500是流通池400的变型的一个例子。换句话说,图5中描绘的通道是流通池400的流动通道410的变型。该流通池500可操作来读取固定到流通池500中的阱530的底面534的多核苷酸链550。仅作为示例,多核苷酸链550被固定的底面534可以包括用叠氮基封端的共嵌段聚合物。仅作为进一步的例子,这种聚合物可以包括根据于2015年4月21日发布的题为“Polymer Coatings”的美国专利第9,012,022号的至少一些教导提供的聚(N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共-丙烯酰胺)(PAZAM)涂层,该专利的全部内容通过引用结合于此。这种聚合物可以掺入本文所述的各种流通池中的任何一种。
在本示例中,阱530由流通池500的基面512提供的间隙空间514分隔开。每个阱530具有侧壁532和底面534。该示例中的流通池500可操作以在每个阱530下方提供图像传感器540。在一些形式中,每个阱530具有至少一个对应的图像传感器540,图像传感器540相对于阱530固定就位。每个图像传感器540可以包括CMOS图像传感器、CCD图像传感器或任何其他合适类型的图像传感器。仅作为示例,每个阱530可以具有一个相关联的图像传感器540或多个相关联的图像传感器540。作为另一种变型,单个图像传感器540可以与两个或更多个阱530相关联。在一些形式中,一个或更多个图像传感器540相对于阱530移动,使得单个图像传感器540或单组图像传感器540可以相对于阱530移动。作为又一变型,流通池500可以相对于单个图像传感器540或单组图像传感器540移动,它们可以至少基本上固定在原位。
每个图像传感器540可以直接结合到流通池500中。可选地,每个图像传感器540可以直接结合到诸如可移除盒200的盒中,流通池500集成到盒中或者以其他方式与盒耦合。作为又一说明性变型,每个图像传感器540可以直接结合到基础仪器102中(例如,作为上述检测组件110的一部分)。无论图像传感器540位于何处,图像传感器540都可以集成到包括其他部件(例如,控制电路等)的印刷电路中。在一个或更多个图像传感器540不直接结合到流通池500中的形式中,流通池500可以包括光学透射特征(例如,窗口等)允许一个或更多个图像传感器540捕获由与多核苷酸链550相关联的一个或更多个荧光团发射的荧光,多核苷酸链550固定到流通池500中的阱530的底面534,如下文更详细描述的。还应该理解,各种光学元件(例如,透镜、光波导等)可以置于阱530的底面534和相应的图像传感器540之间。
同样如图5所示,光源560可操作以将光562投射到阱530中。在一些形式中,每个阱530具有至少一个对应的光源560,光源560相对于阱530固定在原位。仅作为示例,每个阱530可以具有一个相关联的光源560或多个相关联的光源560。作为另一种变型,单个光源560可以与两个或更多个阱530相关联。在一些其他形式中,一个或更多个光源560相对于阱530移动,使得单个光源560或单组光源560可以相对于阱530移动。作为又一变型,流通池500可以相对于单个光源560或单组光源560移动,这些光源可以基本上固定在原位。仅作为示例,每个光源560可以包括一个或更多个激光器。在另一个例子中,光源560可以包括一个或更多个二极管。
每个光源560可以直接结合到流通池500中。可选地,每个光源560可以直接结合到诸如可移除盒200的盒中,流通池500集成到盒中或者以其他方式与盒耦合。作为又一说明性变型,每个光源560可以直接结合到基础仪器102中(例如,作为上述检测组件110的一部分)。在一个或更多个光源560不直接结合到流通池500中的形式中,流通池500可以包括光学透射特征(例如,窗口等)允许阱530接收由一个或更多个光源560发射的光,从而使得光能够到达固定到阱530的底面534的多核苷酸链550。还应该理解,各种光学元件(例如,透镜、光波导等)可以置于阱530和相应的光源560之间。
如本文别处所述以及如图6的框590所示,DNA读取过程可以从在目标阱530中进行测序反应开始(例如,根据于2016年9月27日发布的题为“Methods and Compositions forNucleic Acid Sequencing”的美国专利第9,453,258号的至少一些教导,其全部内容通过引用结合于此)。接下来,如图6的框592所示,光源560在目标阱530上被激活,从而照亮目标阱530。投射光562可以导致与多核苷酸链550相关的荧光团发荧光。因此,如图6的框594所示,相应的图像传感器540可以检测从与多核苷酸链550相关联的一个或更多个荧光团发射的荧光。基础仪器102的系统控制器120可以驱动光源560发光。基础仪器102的系统控制器120还可以处理从图像传感器540获得的图像数据,该图像数据表示来自阱530中的多核苷酸链550的荧光发射分布。使用来自图像传感器540的图像数据,并且如图6的框596所示,系统控制器120可以确定每个多核苷酸链550中的碱基序列。仅作为示例,该方法和装备可用于绘制基因组或以其他方式确定与天然存在的生物体相关的生物信息,其中DNA链或其他多核苷酸从天然存在的生物体获得或以其他方式基于天然存在的生物体。或者,可以利用上述过程和装备来获得存储在机器写入的DNA中的数据,这将在下面更详细地描述。
仅作为进一步的例子,当执行图6所示的上述程序时,时空测序反应可以利用一种或更多种化学和成像事件或步骤来区分在测序反应期间掺入生长的核酸链中的多种分析物(例如,四种核苷酸);或者,在具有四种不同核苷酸的混合物中可以检测到少于四种不同的颜色,同时仍然导致四种不同核苷酸的确定(例如,在测序反应中)。一对核苷酸类型可以在同一波长检测,但基于该对中的一个成员相比于另一个的强度中的差异区分,或基于对该对的一个成员的改变(例如,经由化学修饰、光化学修饰或物理修饰)导致表观信号相比于该对的另一个成员检测的信号出现或消失来区分。
V.机器写入生物材料
在一些实现中,诸如图1中所示的系统100的系统100可以被配置成合成生物材料(例如,多核苷酸,诸如DNA)以编码数据,该数据随后可以通过诸如上述那些的测定的执行来检索。在一些实现中,这种类型的编码可以通过给核苷酸碱基赋值来执行(例如,二进制值,例如0或1,三进制值,例如0、1或2,等等),将待编码的数据转换成相关值的串(例如,使用ASCII编码方案将文本消息转换成二进制串),然后创建由核苷酸组成的一个或更多个多核苷酸,所述核苷酸在对应于通过转换数据获得的串的序列中具有碱基。
在一些实现中,可以使用具有如图7所示配置的阱阵列630的流通池400的形式来进行这种多核苷酸的产生。图7示出了流通池600内的通道的一部分,其是流通池400的变型的例子。换句话说,图7中描绘的通道是流通池400的流动通道410的变型。在该示例中,每个阱630凹入流通池600的基面612之下。因此,阱630通过间隙空间614彼此隔开。仅作为示例,阱630可以沿着流通池600的基面612以网格或任何其他合适的图案布置。该示例的每个阱630包括侧壁632和底面634。该示例的每个阱630还包括位于阱630的底面634上的相应电极组件640。在一些形式中,每个电极组件640仅包括单个电极元件。在一些其他形式中,每个电极组件640包括多个电极元件或段。术语“电极”和“电极组件”在这里应该理解为是可互换的。
基础仪器102可操作以独立地激活电极组件640,使得一个或更多个电极组件640可处于激活状态,而一个或更多个其他电极组件640不处于激活状态。在一些形式中,使用CMOS设备或其他设备来控制电极组件640。这种CMOS设备可以直接集成到流通池600中,可以集成到流通池600所包含的盒(例如,盒200)中,或者可以直接集成到基础仪器102中。如图7所示,每个电极组件640沿着底面634的整个宽度延伸,终止于相应阱630的侧壁632。在其他形式中,每个电极组件640可以仅沿着底面634的一部分延伸。例如,一些形式的电极组件640可以相对于侧壁632在内部终止。虽然每个电极组件540在图5中被示意性地描绘为单个元件,但是应当理解,每个电极组件540实际上可以由多个离散的电极形成,而不仅仅由一个单个电极组成。
如图7所示,通过激活相关阱630的电极组件640来电化学产生酸,可以在单个阱630中产生特定的多核苷酸链650,该酸可以将阱630中的多核苷酸链650的端基脱保护。仅举例来说,多核苷酸链650可以使用一端具有化学物质如硅烷化学物质而另一端具有DNA合成相容化学物质(例如,酶结合的短寡核苷酸)的接头化学连接到阱630底部的表面。
为了便于试剂交换(例如,解封闭剂的传输),在该示例中,每个电极组件640和每个阱630的底面634可以包括至少一个开口660。开口660可以与在阱630下方、底面634下方延伸的流动通道662流体地联接。为了提供穿过电极组件640的这种开口660,电极组件640可以是环形的,可以放置在象限中,可以放置在阱630的周边或侧壁632上,或者可以以其他合适的方式放置或成形,以避免干扰试剂交换和/或光的通过(例如,可以在涉及荧光发射检测的测序过程中使用)。在其他实现中,试剂可以在没有开口660的情况下提供到流通池600的流动通道中。应当理解,开口660可以是可选的,并且在一些形式中可以省略。类似地,流动通道662可以是可选的,并且在一些形式中可以省略。
图9示出了电极组件640可以采取的形式的例子。在该示例中,电极组件640包括四个分立的电极段642、644、646、648,它们一起限定了环形形状。电极段642、644、646、648因此被配置为环的离散但相邻的象限。每个电极段642、644、646、648可以被配置成提供与特定核苷酸唯一相关的预定电荷。例如,电极段642可以被配置成提供与腺嘌呤唯一相关的电荷;电极段644可以被配置成提供与胞嘧啶唯一相关的电荷;电极段646可以被配置成提供与鸟嘌呤唯一相关的电荷;并且电极段648可以被配置成提供与胸腺嘧啶唯一相关的电荷。当这四种核苷酸的混合物流经阱630上方的流动通道时,电极段642、644、646、648的激活可导致来自该流动通道的相应核苷酸粘附到链650上。因此,当电极段642被激活时,它可以实现腺嘌呤向链650的写入;当电极段644被激活时,它可以实现胞嘧啶向链650的写入;当电极段646被激活时,它可以实现鸟嘌呤向链650的写入;并且当电极段648被激活时,它可以实现胸腺嘧啶向链650的写入。这种写入可以通过激活的电极段642、644、646、648将酶的抑制剂与与激活的电极段642、644、646、648相关联的像素杂交来提供。虽然电极段642、644、646、648在图9中显示为形成环形,但是应当理解,电极段642、644、646、648可以形成任何其他合适的形状。在其他实现中,单个电极可用于电极组件640,并且电荷可被调节以掺入要写入DNA链或其他多核苷酸的各种核苷酸。
作为另一个例子,电极组件640可以被激活以提供局部的(例如,位于电极组件640设置于其中的阱630内)电化学产生的pH变化;和/或局部地电化学产生部分(例如,还原或氧化试剂),以从核苷酸中去除嵌段。作为另一种变体,不同的核苷酸可以具有不同的嵌段;并且这些嵌段可以基于传送到阱630的光(例如,从光源560投射的光562)的波长被光切割。作为另一种变体,不同的核苷酸可以具有不同的嵌段;并且这些嵌段可以基于某些其他条件被切割。例如,可以基于还原条件加上高局部pH或低局部pH的组合来移除四个嵌段中的一个;基于氧化条件加上高局部pH或低局部pH的组合,可以除去四个嵌段中的另一个;基于光和高局部pH的组合,可以去除四个嵌段中的另一个;以及基于光和低局部pH的组合,可以去除四个嵌段中的另一个。因此,可以同时掺入四个核苷酸,但是响应于四组不同的条件发生选择性去嵌段。
电极组件640进一步在电极段642、644、646、648的排列中心限定开口660。如上所述,该开口660可以为流动通道662和阱630之间的流体连通提供路径,从而允许流经流动通道662的试剂等到达阱630。同样如上所述,一些变型可以省略流动通道662并以某种其他方式(例如,通过被动扩散等)提供试剂等到阱630的连通。不管流体是否通过开口660连通,开口660可以在读取周期期间提供通过阱630底部的光传输路径,如本文所述。在一些形式中,开口660可以是可选的,因此可以省略。在省略开口660的形式中,流体可以经由位于阱630上方或相对于阱630定位的一个或更多个流动通道连通到阱630。此外,在读取周期期间,可能不需要开口660来提供穿过阱630底部的光传输路径。例如,如下文关于流通池601所述,电极组件640可以包括光学透明材料(例如,光学透明导电膜(TCF)等),并且流通池600本身可以包括光学透明材料(例如,玻璃),使得电极组件640和形成流通池600的材料可以允许从与机器写入的多核苷酸链650相关联的一个或更多个荧光团发射的荧光到达阱630下方的图像传感器540。
图8显示了可在流通池600中用于机器写入多核苷酸或其他核苷酸序列的过程的例子。在该过程开始时,如图8的第一框690所示,核苷酸可以通过阱630流入流通池600。如图8中的下一个框692所示,然后可以激活电极组件640,以将第一核苷酸写入目标阱630底部的引物。如图8的下一个框694所示,终止子随后可从目标阱630中的刚刚写入的第一个核苷酸被切割掉。鉴于本文的教导,终止子可以从第一个核苷酸上切割下来的各种合适的方式对于本领域技术人员来说是明显的。一旦终止子被从第一个核苷酸上切下,如图8的下一个框696所示,电极组件640可以被激活以将第二个核苷酸写入第一个核苷酸。虽然图8中未示出,但是可以将终止子从第二个核苷酸上切下,然后将第三个核苷酸写入第二个核苷酸,以此类推,直到已经写入了所需的核苷酸序列。
在一些实现中,通过诸如DNA的生物材料的合成进行的数据编码可以以其他方式进行。例如,在一些实现中,流通池600可能完全没有电极组件640。例如,去嵌段试剂可以通过开口660从流动通道662选择性地连通到阱630。这可以消除电极组件640选择性激活核苷酸的需要。作为另一个例子,阱630的阵列可以暴露于包含可以用于编码数据的所有核苷酸碱基的溶液中,然后可以通过使用来自空间光调制器(SLM)的光为单个阱630选择性地激活单个核苷酸。作为另一个例子,在一些实现中,可以为单个碱基分配组合值(例如,腺嘌呤可以用于编码二联体00,鸟嘌呤可以用于编码二联体01,胞嘧啶可以用于编码二联体10,胸腺嘧啶可以用于编码二联体11),以增加所产生的多核苷酸的存储密度。根据本公开,其他示例也是可能的,并且对于本领域技术人员来说将是明显的。因此,上述合成生物材料如DNA来编码数据的描述应该理解为仅仅是说明性的;不应被视为限制。
VI.读取机器写入的生物材料
在流通池600的一个或更多个阱630中的多核苷酸链650已经被机器写入之后,多核苷酸链650可以随后被读取以提取机器写入的多核苷酸链650中存储的任何数据或其他信息。这种读取过程可以使用诸如图5所示和上述的布置来执行。换句话说,一个或更多个光源560可用于照射与机器写入的多核苷酸链650相关联的一个或更多个荧光团;并且一个或更多个图像传感器540可以用于检测由与机器写入的多核苷酸链650相关联的被照亮的一个或更多个荧光团发射的荧光。由与机器写入的多核苷酸链650相关联的被照射的一个或更多个荧光团发射的光的荧光分布可以被处理以确定机器写入的多核苷酸链650中的碱基序列。机器写入的多核苷酸链650中的这种确定的碱基序列可以被处理以确定存储在机器写入的多核苷酸链650中的数据或其他信息。
在一些形式中,机器写入的多核苷酸链650在储存期间保留在包含阱630的流通池600中。当需要读取机器写入的多核苷酸链650时,流通池600可以允许直接从流通池读取机器写入的多核苷酸链650。仅作为示例,包含阱630的流通池600可以被容纳在包含光源560和/或图像传感器540的盒(例如,盒200)或基础仪器102中,使得机器写入的多核苷酸链650被直接从阱630读取。
作为另一个说明性例子,包含阱630的流通池可以直接结合光源560或图像传感器540中的一个或两个。图10示出了流通池601的示例,其包括具有电极组件640的阱630、一个或更多个图像传感器540和控制电路670。类似于图5中描绘的流通池500,该示例的流通池601可操作来接收从光源560投射的光562。该投射光562可以导致与机器写入的多核苷酸链650相关联的一个或更多个荧光团发荧光;并且相应的图像传感器540可以捕获从与机器写入的多核苷酸链650相关联的一个或更多个荧光团发出的荧光。
如上在流通池500的情况下所述,流通池601的每个阱650可以包括其自己的图像传感器540和/或其自己的光源560;或者这些部件可以如上所述以其他方式配置和布置。在本示例中,从与机器写入的多核苷酸链650相关联的一个或更多个荧光团发射的荧光可以经由开口660到达图像传感器540。此外,或者替代地,电极组件640可以包括光学透明材料(例如,光学透明导电膜(TCF)等),并且流通池601本身可以包括光学透明材料(例如,玻璃),使得电极组件640和形成流通池601的材料可以允许从与机器写入的多核苷酸链650相关联的一个或更多个荧光团发射的荧光到达图像传感器540。此外,各种光学元件(例如,透镜、光波导等)可以置于阱650和相应的图像传感器之间,以确保图像传感器540仅接收从与所需阱630的机器写入的多核苷酸链650相关的一个或更多个荧光团发出的荧光。
在本示例中,控制电路670直接集成到流通池601中。仅作为示例,控制电路670可以包括CMOS芯片和/或其他印刷电路配置/部件。控制电路670可以与图像传感器540、电极组件640和/或光源560连通。在这种情况下,“连通”意味着控制电路670与图像传感器540、电极组件640和/或光源560电连通。例如,控制电路670可操作来接收和处理来自图像传感器540的信号,该信号代表由图像传感器540拾取的图像。本文中的“连通”还可以包括控制电路670向图像传感器540、电极组件640和/或光源560提供电能。
在一些形式中,每个图像传感器540具有相应的控制电路670。在一些其他形式中,控制电路670与流通池601中的几个(如果不是全部的话)图像传感器耦合。鉴于本文的教导,可用于实现这一点的各种合适的部件和配置对于本领域技术人员来说将是明显的。还应当理解,除了集成到流通池601中之外或代替集成到流通池601中,控制电路670可以整体或部分集成到盒(例如,可移除盒200)中和/或基础仪器102中。
作为又一个说明性例子,不管是使用像图7的流通池600那样的只写流通池还是像图10的流通池601那样的读写流通池,机器写入的多核苷酸链650可以在合成后从阱630转移。这可能发生在合成完成后不久,就在机器写入的多核苷酸链650被读取之前,或在任何其他合适的时间。在这样的形式中,机器写入的多核苷酸链650可以被转移到只读流通池,如图5所示的流通池500;然后在只读流通池500中被读取。或者,可以使用任何其他合适的设备或过程。
在一些实现中,读取通过生物材料合成编码的数据可以通过确定储存感兴趣的合成链650的阱630,然后使用诸如前述的技术(例如,合成测序)对那些链650进行测序来实现。在一些实现中,为了便于读取存储在核苷酸序列中的数据,当存储数据时,可以用显示合成编码该数据的链650所位于的阱630的信息来更新索引。例如,当被配置成合成能够存储高达256位数据的串650的系统100的实现被用于存储一兆位(1,048,576位)文件时,系统控制器120可以执行如下步骤:1)将文件分成4,096个256位段;2)识别流通池600、601中当前未用于存储数据的4096个阱630的序列;3)将4,096段写入4,096个阱430、530;4)更新索引以指示从第一个识别的阱630开始并在最后一个识别的阱630结束的序列正被用于存储该文件。随后,当做出读取文件的请求时,可以使用索引来识别包含相关链650的阱630,可以对来自那些阱630的链650进行测序,并且可以将序列组合并转换成适当的编码格式(例如,二进制),然后可以返回该组合并转换的数据作为对读取请求的响应。
在一些实现中,可以以其他方式读取先前通过生物材料合成编码的数据。例如,在一些实现中,如果要写入对应于4,096个阱630的文件,而不是识别4,096个顺序阱630以将其写入,则控制器可以识别4,096个阱630,然后在那些阱630没有形成连续序列的情况下,用对应于该文件的多个位置更新索引。作为另一个例子,在一些实现中,系统控制器120可以将阱630分组在一起(例如,分成128个阱630的分组),而不是识别单个阱630,从而减少与存储位置数据相关联的开销(即,通过将寻址要求从每个阱630一个地址减少到每组阱630一个地址)。作为另一个例子,在存储反映其中已经合成了DNA链或其他多核苷酸的阱630的位置的数据的实现中,该数据可以以各种方式存储,例如序列标识符(例如,阱1、阱2、阱3等)或坐标(例如,阵列中阱的位置的X和Y坐标)。
作为另一个例子,在一些实现中,不是从其中合成链650的阱630读取链650,而是可以从其他位置读取链650。例如,链650可被合成以包括地址,然后从阱630切割并存储在管中以供以后检索,在此期间,所包括的地址信息可用于识别对应于特定文件的链650。作为另一个说明性的例子,可以使用聚合酶从表面复制链650,然后洗脱并储存在试管中。或者,可以使用与DNA链或其它多核苷酸杂交的生物素化寡核苷酸,并在分配在阱630中的链霉亲和素珠上捕获延伸产物,将链650复制到珠上。根据本公开,其他示例也是可能的,并且对于本领域技术人员来说将是明显的。因此,上述检索通过合成生物材料编码的数据的描述应该理解为仅仅是说明性的;不应被视为限制。
在此描述的实现可以利用用于流通池表面的聚合物涂层,例如在于2015年4月21日发布的题为“Polymer Coatings”的第9,012,022号美国专利中描述的,其全部内容通过引用结合于此。本文所述的实现可以利用一种或更多种具有可检测标记和可切割接头的标记核苷酸,例如于2008年8月19日发布的题为“Labelled Nucleotide Strands”的第7,414,116号美国专利中所述的那些,其全部内容通过引用结合于此。例如,本文所述的实现可利用可切割的接头,该接头可通过与水溶性膦或水溶性含过渡金属的催化剂接触而被切割,该催化剂具有作为可检测标记的荧光团。本文所述的实现可以使用双通道检测方法来检测多核苷酸的核苷酸,例如于2016年9月27日发布的题为“Methods and Compositions forNucleic Acid Sequencing”的第9,453,258号美国专利中所述的方法,其全部内容通过引用结合于此。例如,本文所述的实现可以利用基于荧光的SBS方法,该方法具有在第一通道中检测到的第一核苷酸类型(例如,dATP具有当被第一激发波长激发时在第一通道中检测到的标记),在第二通道中检测到的第二核苷酸类型(例如,dCTP具有当被第二激发波长激发时在第二通道中检测到的标记),在第一和第二通道中都检测到的第三核苷酸类型(例如,当被第一和/或第二激发波长激发时,dTTP具有至少一个在两个通道中被检测到的标记),和第四种核苷酸类型,其缺少在任一通道中未被检测到或最低限度被检测到的标记(例如,无标记的dGTP)。这里描述的盒和/或流通池的实现可以根据以下描述的一个或更多个教导来构造:发布于2014年12月9日的题为“Biosensors for Biological or ChemicalAnalysis and Systems and Methods for Same”的第8,906,320号美国专利,其全部内容通过引用结合于此;题为“Gel Patterned Surfaces”,于2016年12月6日发布的第9,512,422号美国专利,其全部内容通过引用结合于此;题为“Biosensors for Biological orChemical Analysis and Methods of Manufacturing the Same”,于2019年4月9日发布的第10,254,225号美国专利,其全部内容通过引用结合于此;和/或题为“CartridgeAssembly”于2018年5月3日公布的第2018/0117587号美国公开,其全部内容通过引用结合于此。
VII.读写受控区域的系统和方法
与存储设备相关的一个挑战是允许同时或几乎同时读取和写入数据,因为一些流通池的测序和合成操作可能需要调节和制备流通池(例如,热调节至合适的温度,用合适的试剂进行化学调节等)用于在给定时间写入数据或读取数据。对于这种传统的流通池和系统,在“写模式”和“读模式”之间的切换可能需要在一段时间内停止所有操作,同时使阱达到某一温度、冲洗掉先前使用的试剂、接收新的试剂或接收其他输入。利用这种系统,可能无法做到的是:向流通池的第一阱合成数据或写入数据,同时也对来自流通池的第二阱的数据进行测序或读取数据,因为这可能产生提供给流通池的试剂或其他调节输入的冲突。
许多现代数据存储系统被认为具有某种能力,允许这些系统的用户以及可能与这些系统通信的其他系统和设备同时读取和写入数据到卷。因此,不能同时读取数据和向卷写入数据对用户来说可能是不方便的,例如用户可能喜欢在存储设备架中的卷之间交换信息,使得一个设备可以被移除并放置在存储器中(例如,将第一文件从卷A复制到卷B,同时还将第二文件从卷C复制到卷A),因为这可能会产生用户由于不能同时执行的多个排队动作而不能移除卷的情况。对于与卷通信的系统和设备来说,这也可能是一个技术问题,因为软件应用可以被编程为不断地向存储在卷上的数据库或文件系统写入数据,同时也定期地从相同的数据库或文件系统读取数据。在这种动作不能同时执行的情况下,这种软件应用可能会遇到各种意外的行为和错误,例如由于本地存储器和高速缓存被排队的操作淹没而导致硬件性能降低、竞争条件,或者由于在操作时没有所需的输入而导致软件性能降低。
为了解决这些问题,DNA存储设备和相关的可操作来读取数据、写入数据或读写数据的系统和设备可以实现一个或更多个特征,例如选择性激活阱、同时读写高速缓存和使用DNA存储系统的同时读写操作的多卷管理。虽然本文所述的例子指的是“DNA存储系统”,但应该理解这只是多核苷酸储存的一个例子。本文的教导可以容易地应用于利用不一定是DNA形式的多核苷酸的存储系统。因此,本发明不限于使用DNA作为本文所述的唯一一种用于储存的多核苷酸。此外,多核苷酸只是如本文所述可用于储存的生物材料的一个例子。
A.示例性DNA存储系统
当在此描述时,可操作来读取编码为DNA的数字数据,或将数字数据编码和写入DNA或两者的系统可被称为用于DNA存储的系统,或DNA存储系统。应当理解,这样的系统可以包括各种部件和设备,这些部件和设备可以被组装成单件装备(例如,可以被组装并可通信地耦合在壳体内),或者可以是单独的装备,这些装备可以被连接、布置或两者兼有,以便提供所描述的特征。
图21示出了DNA存储系统1300的示例的示意图。DNA存储系统1300包括一组仪器1301和存储设备1320。该组仪器1301可以对应于上述基础仪器102。该组仪器1301可以组装在单个装备内,或者可以是一个或更多个分开的装备,它们被布置、连接或两者兼有,以便提供所描述的功能。该组仪器1301包括存储控制器1302,该存储控制器1302可以是被配置为存储和执行指令以操作该组仪器1301的一个或更多个处理器和存储器。该组仪器1301还包括测序设备1304、合成设备1306、流控设备1308和电接口1310。
在一些实现中,存储控制器1302、测序设备1304、合成设备1306、流控设备1308和电接口1310可以是其间具有一个或更多个流控、电或机械接口的独立设备。在其他实现中,存储控制器1302、测序设备1304、合成设备1306、流控设备1308和电接口1310可以集成到单个设备中,其中测序设备1304、合成设备1306、流控设备1308和电接口1310中的每一个形成其子部件。
存储设备1320可以永久地或可移除地与一组仪器1301耦合;并且包括具有多个阱的流通池1322。存储设备1320还包括测序接口1324、合成接口1326、流控接口1328和一组模块电子设备1330。在一些实现中,流通池1322、测序接口1324、合成接口1326、流控接口1328和一组模块电子设备1330可以是其间具有一个或更多个流控、电或机械接口的独立设备。在其他实现中,流通池1322、测序接口1324、合成接口1326、流控接口1328和一组模块电子设备1330可以集成到单个设备中,其中流通池1322、测序接口1324、合成接口1326、流控接口1328和一组模块电子设备1330中的每一个形成其子部件。
测序设备1304可操作用于读取存储设备1320的一个或更多个阱中编码和存储为DNA的数据,并且可包括诸如成像设备、光学传感器、照明设备(例如LED、照明器)和可用于检测储存在阱中的DNA的特征的其他设备(例如,上述关于SBS的过程和设备,其中与单个核苷酸相关的荧光标记或标签可由光学传感器检测)。测序设备1304通过测序接口1324与流通池1322相互作用。测序接口1324可以是玻璃盖或其他接口表面,其被配置成允许测序设备1304与流动通道410相互作用。在测序设备1304包括可用于检测标记核苷酸的光学传感器和光源的例子中,测序接口1324可以是光学透明玻璃盖,其覆盖流动通道410并防止在每个方向传输光的同时在其中传输的流体泄漏。在一些实现中,测序接口1324可以包括一个或更多个波导,以选择性地照亮流通池1322的一个或更多个部分。
合成设备1306可用于在存储设备1320的流通池1322的一个或更多个阱中合成具有特定核苷酸排列的DNA。在其他实现中,合成设备1306可以在没有阱的流通池1322的特定表面上合成DNA核苷酸。合成设备1306包括单个核苷酸或其他生物材料的储存器和输入递送设备,该输入递送设备可操作以将输入生物材料传送至流通池1322的一个或更多个阱。在一些实现中,这可以包括一组位于阱附近的电极,其可操作以将特定的核苷酸吸引到特定的阱,同时输入递送设备通过入口端口420向流动通道410提供核苷酸载液或核苷酸写入试剂。在一些实现中,这可以包括核苷酸注射头,其可以定位在期望的阱附近,并且可以以期望的顺序释放一个或更多个核苷酸。合成接口1326被配置成允许合成设备1306与一个或更多个阱相互作用,因此将根据特定的合成设备1306而变化。在一些实现中,合成接口可以是导电层或耦合,其从电极接收电特性,并将它们传导至阱附近的区域。在一些实现中,合成接口1326可以包括一些或全部流控接口1328,例如合成设备1306在合成期间提供核苷酸载液的情况。在一些实现中,合成接口1326可以是多孔膜,当由核苷酸注射头在期望的位置注射时,该多孔膜允许核苷酸进入流动通道。在一些实现中,合成接口1326可以由柔性材料形成,或者可以包括多个小阀,或者可以包括被配置为在核苷酸注射头提供核苷酸后自密封的其他特征。
流控设备1308可包括本文所述的与流控相关的任何设备或特征,并可包括流控网络、泵、阀和其他部件,其可操作以在期望的体积和压力下向一个或更多个流动通道410或一个或更多个流动通道410上的特定位置提供期望的流体类型。在一些实现中,流控设备1308可以包括电润湿特征,该电润湿特征可操作以将期望体积的流体精确地引导至期望位置,而不是用流体淹没流动通道410。流控接口1328将基于流控设备1308的特定实现而变化,但是可以包括存储设备1320内的流控网络、入口端口420、出口端口422和其他部件。
流控设备1308提供的流体可以包括用测序设备1304和合成设备1306执行的各种过程中产生和使用的流体试剂,并且还可以包括非功能性流体,例如用于冲洗和清洁DNA存储系统1300的一个或更多个部件的蒸馏水。测序设备1304使用的试剂可以不同于合成设备1306使用的试剂,并且每个设备本身可以在合成和测序的不同部分使用一种或更多种不同的试剂。当在本文中使用时,在测序操作期间可以提供的任何变化的试剂可以统称为核苷酸读取试剂,而在合成操作期间可以提供的任何变化的试剂可以统称为核苷酸写入试剂。
电接口1310可以包括有线的、导电的连接,或者可以包括能够与存储设备的模块电子设备1330交换电力、数据或两者的无线收发器设备(例如,RFID、NFC、蓝牙、光发射器、感应充电设备)。这可以包括提供电力并与存储设备1320的电子存储器交换数据,提供电力并与存储设备1320的一个或更多个传感器交换数据,以及启用模块电子设备1330的其他电子或数据驱动能力(如果存在)。
DNA存储系统1300还可以包括模块接收器1321,该模块接收器1321包括一个或更多个特征,以在使用期间相对于一组仪器1301耦合和静态定位存储设备1320,其中存储设备1320是可移除的盒式存储设备。在其他实现中,存储设备1320可以包括与该组仪器1301的部件接口的流通池1322。模块接收器1321可以包括存储设备1320可以安置在其中的槽,以及引导特征(例如,轨道)和锁定特征,以高度精确和固定地定位存储设备1320,使得一组仪器1301中的一个或更多个可重复地和自动地定位,以与其对应的接口相互作用。
应当理解,DNA存储系统1300是一个例子,并且根据本公开,许多变化是可能的,并且对于本领域技术人员来说是明显的。作为示例,一组仪器1301和存储设备1320可以具有比所示更少的部件或更多的部件。作为另一个例子,存储设备1320的一些实现可以包括该组仪器1301的部件,例如其中测序设备1304的多个电极被集成在流通池1322本身之上或之内。在这种情况下,与该组仪器1301配对的测序设备1304的部分可以包括导电开关网络,该导电开关网络允许电信号产生并传输到流通池1322内的期望电极。
B.选择性激活阱的存储设备
在一些DNA测序系统中,有一种“全有或全无”的方法来用多个阱对DNA进行测序。例如,流通池的特定通道(例如,流动通道410)可以具有数千个单独的阱,每个阱包含至少一条DNA链。为了使用诸如合成测序的过程对该通道中的单条链的DNA进行测序和读取编码数据,可以用化学试剂淹没整个通道,以制备用于与光学标签的核苷酸匹配的储存的DNA,用光源照射以使光学标签可见,并用成像设备或光学传感器成像以捕获标签。可以看出,尽管编码数据可能只需要来自单个阱,但是存储在数千个其他阱中的DNA可能会受到该过程的影响,随着时间的推移和多次读取操作,这可能会导致存储的DNA退化或损坏。
图11A-11C描绘了可以用流通池实现以便解决这些方面和其他方面的阱的俯视图。图11A示出了单阱700,该单阱700可以与多个其它阱一起位于具有多个阱的流动通道或其它流通池结构的表面702上。阱700包括侧壁704,该侧壁704在表面702中限定开口,并下降到流通池的结构中。阱700还包括位于阱700底部的环形电极706,该环形电极706具有与图9和10所示的电极组件640的上下文中描述的特征相似的特征。特别地,环形电极706可响应电信号操作,以在阱700处和阱附近的流体内产生电特性,例如电流和电压。由于其形状,环形电极706还允许阱700底部的端口空间708,其可以是光学端口、流体端口或两者。在端口空间708包括光学端口的情况下,阱700的底部可以由玻璃或其他光学透明材料构成,以允许从阱的下方(例如,通过阱的封闭侧)进行照明、成像或两者。在端口空间708包括流体端口的情况下,开口可以穿过阱的底部到达阱的封闭侧(例如,与阱的开口侧相对,并且即使当提供流体端口时也被称为“封闭的”)。虽然环形电极706在图11A中显示为单个单片电极,但是应当理解,环形电极706实际上可以由多个可单独寻址的电极段(例如,像电极组件640的段642、644、646、648)形成。
流体端口可用于允许冲洗和试剂交换,如图9所示和所述,并且可被提供作为在表面702上流动的流体路径的替代或补充。流体端口可以连接到流控网络,以允许提供流体来从流动通道冲洗用过的试剂(例如,通过阱700的开口侧排出),或者提供吸力来拉动用过的试剂通过阱的底部,这两者中的任一个可以结合沿着表面702的类似操作来执行(例如,可以沿着表面700提供冲洗流体,同时使用流体端口来通过每个阱的底部抽吸冲洗流体和任何剩余的试剂)。在端口空间708中具有流体端口和光学端口的实现可以通过例如将流体端口偏移到端口空间708的边缘并使用端口空间708的剩余空间来对阱进行无障碍成像和照明来组合这两种功能。
对于多个阱,例如每个都具有电极环706的阱700,单个阱可以在测序或合成操作期间被选择性地“激活”或“去激活”,否则可能影响表面702上的每个阱,即使在试剂和其他流体被提供给整个表面702的情况下。作为示例,电极环705可被操作以在一个或更多个阱中产生电流或电压,该电流或电压对一个或更多个核苷酸、酶、测序引物、聚合酶或悬浮在表面702处的流体中的其他物质是吸引的或排斥的,以增加期望的物质从表面702处的流体被拉到阱700本身内的流体的机会(例如,由于吸引的电特性),或者减少不希望的物质从表面702流到阱700内的机会(例如,由于排斥的电特性)。
作为另一个例子,如已经描述的,单个电极如电极环706可以在每阱的基础上被激活,结合用电压敏感功能化流体淹没流通池,以局部影响表面702和阱700内的流体的pH,以帮助吸引或排斥悬浮的核苷酸,或者通过精细控制电极产生的电压来控制电压敏感功能化流体的pH,从而选择性地激活用于结合的核苷酸。
如上所述,对于每个单独的阱可选择性控制的电极允许对DNA进行测序,并允许从被激活用于测序的一组选定的阱中读取数据,同时防止对被去激活用于测序的阱进行测序。所描述的功能可以类似地应用于阱内的DNA合成,因为包括所有类型核苷酸的流体可以被提供给整个表面702,并且各个阱处的电极可以被激活以将合成所需的下一个核苷酸引入阱700。作为一个例子,当存储在特定阱中的数字数据已经被编码成描述诸如“AGCT”的核苷酸有序序列的DNA格式(例如,如上所述,该格式可以容易地从二进制转换或转换成二进制),该阱处的电极可以由来自测序设备1304、存储控制器1302或两者的信号操作,以产生电流、电压或其他电特性的有序序列,从而顺序地将A、G、C、然后T核苷酸吸引到阱700中。
通过能够在每个阱的基础上单独测序或合成,提供受特定读或写操作影响的阱的空间位置的索引或其他寻址信息可用于仅激活那些阱。提供受特定读或写操作影响的阱的空间位置的索引或其他寻址信息也可用于节省试剂、节省硬件使用和节省处理器时间,这些通常在不期望的测序或合成期间被浪费。含有悬浮物质的试剂,如核苷酸和酶,也可以通过结合带电标签和不需要时从阱中剥离酶来控制物质的定位来节省。无源光学特征也可以包括在阱中,包括光波导和材料的偏振,以防止或至少减少阱之间的串扰,并限制照明,无论是为了激活核苷酸和其他物质还是为了产生荧光,以及对期望的阱的光学成像。如上所述,通过在每阱基础上使用电极,可以看出,可以促进或抑制核苷酸和其它物质进出阱的运动,以便控制和产生特定的所需运动。
还应注意,电极的灵活性允许与阱相关联的单个电极在“写入模式”下促进编码数据的期望合成和写入到阱;并且还促进在“读取模式”下对来自同一阱的编码数据进行期望的测序和读取。这种灵活性反过来可以允许对表面702上的不同阱同时进行读取和写入,例如在特定阱可以被激活用于写入以从多物质流体中提取某些核苷酸和其他物质用于合成的情况下;而不同的阱可以被激活用于读取,以从相同的多物质流体中提取某些核苷酸和其他物质用于测序,同时每个阱抑制不需要的物质进入它们各自的阱。这种功能可以如上所述实现;并且也可以用这里公开的一个或更多个其他特征来实现,以帮助同时读取和写入数据到表面702上的分离阱。
图11B和11C各自示出了替代的阱实现,其提供了上述关于阱700的特征。在图11B中,表面702上的阱701不包括电极环706,而是在阱701的底部为端口空间708留出更多地方。如上所述,端口空间708可以是光学端口,其允许从阱701的下侧进行照明和成像。如上所述,流体端口709也显示为偏离端口空间708的边缘,以允许更大的面积用于通过光学透明端口空间708的无障碍成像。电极712安装在阱701的内部,在侧壁704上,在此它可以被操作以在每个阱的基础上产生期望的电条件,同时也最大化端口空间708的尺寸。虽然在图11B中仅示出了一个电极712,但是该阱701可以包括一个以上的电极712。例如,阱701的一些变型可以在沿着侧壁704的相应位置包括四个单独的电极712,每个电极712与相应的核苷酸碱基相关联。
在图11C中,阱703包括安装在阱703周界的表面702上的电极714,正好在侧壁704上方。阱703没有流体端口709,但是如果需要,它可以与阱703一起实施。阱703的端口空间708相对较大,并且完全不受阻碍,这可以允许从阱703下方(例如,从阱703的封闭侧)进行最大程度的光交换。如同先前的例子,电极714可以被操作以在每个阱的基础上在阱703附近产生期望的电条件。
图11A-11C的每个上述电极可以安装到流通池的结构上,电连接嵌入该结构本身内,并布线到该结构的下侧(例如,在阱的封闭侧,与表面702相对)。这些电连接可以与集成电路(IC)或互补金属氧化物半导体(CMOS)耦合,该集成电路或互补金属氧化物半导体被配置为路由电信号和控制电信号提供给期望的电极,例如图10的控制电路670。当与存储设备1320一起使用时,这种控制电路可以集成到存储设备1320中,并且耦合到流通池1322的底面,或者可以是一组仪器1301的一部分,当存储设备1320与一组仪器1301耦合时,控制电路精确地定位成抵靠流通池1322的底面,使得控制电路的每个表面电引线与流通池1322下侧上的相应表面连接成对,并且流通池1322下侧上的每个表面连接通向单个阱的电极。
图12A和12B示出了用于基于每阱选择性地促进和抑制从周围流体中摄取物质的替代系统的各方面。图12A示出了例如DNA存储系统1300的DNA存储系统的一部分,其可操作以选择性地和基于每阱对流通池1322的一个或更多个阱进行读取、写入或读写数据。在该图中,示出了空间光调制器(SLM)系统800,其包括空间光投影仪(SLP)806(例如,与数字微镜器件配对的光源、与光学寻址的一组液晶配对的一组LED、或者另一空间光调制器件)和SLM控制器808。示出了与流通池802相关的SLM系统800,流通池802可以类似于流通池1322和本文描述的流通池的其他示例。虽然流通池802被显示为包括一组阱804,阱804包含三乘三网格中的九个阱,但是应当理解,这是为了帮助系统的可视化,并且SLM系统800可以与具有数千个单独阱804的流通池一起操作。
SLM系统800可以由一组仪器1301的一个或更多个设备操作,例如测序设备1304、合成设备1306或存储控制器1302,以便在流通池802上产生光的图案。投射的光图案包括空间编码的控制信号,该控制信号可以被配置为与阱804附近或阱804内的流体和流体中携带的物质相互作用,以便促进或抑制物质向阱804的移动和从阱804的移动,如以上关于图11A-11C的电极所述。
SLM控制器808与SLP 806耦合,并基于从诸如存储控制器1302的设备接收的指令向SLP 806提供控制信号。这种指令可以响应于从存储设备1320读取数据、向存储设备1320写入数据或两者的请求而生成。为了提供示例,从诸如存储控制器1302的设备提供给SLM控制器808的指令可以包括要被激活以写入数据的第一阱804(例如,第一阱804内的DNA合成)的标识、用于读取数据的第二阱804(例如,第二阱804内的DNA测序)的标识,或者两者。SLM控制器808可以将这些指令转换成控制信号,该控制信号被配置成使得SLP 806将光的空间图案投射到流通池802上,对应于所识别的阱804和每个阱804的期望的读取或写入操作。
由SLP 806提供的空间编码光图案可以包括,在每个像素的基础上,其中多个像素可以对应于流通池802的每个阱804,存在或不存在照明;以及诸如颜色、波长、频率、幅度或亮度等照明特性的变化。投射到单个阱804中的光可以导致该阱804中的核苷酸、酶或其他物质以某种方式被修饰(例如,被切割、降解、破坏、被光吸引、被光排斥),或者可以导致流体的pH值或其他特性的局部变化,以促进或抑制物质向该阱804的传输。以这种方式,SLM系统800提供类似于以上在图11A-11C的电极的上下文中描述的功能,用于测序、合成或同时用于测序和合成的每阱激活或去激活。
结果,复杂的空间编码光图案可以同时投射到多个阱804上,每个阱接收一部分投射,该部分投射被配置为引起该阱804附近的流体和物质的期望行为。图12B示出了与流通池802相关的上述简化示例。示出了空间编码的投影810,其中9个区域对应于图12A中的阱804。用带点图案描绘的区域接收光,该光被配置为促进将读取数据所需的物质从附近流体传输到阱804,而被描绘为纯白色的区域不接收光,或者接收被配置为抑制附近流体中的物质传输到阱804的光。区域814对应于一组阱804的阱1-3,而区域812对应于一组阱804的阱1-1。
可以看出,空间编码投影810向区域812提供光,该区域812被配置成促进阱1-1内期望的DNA合成;并且可以随时间变化以促进特定所需核苷酸以有序序列的摄取和结合,从而构建所需的多核苷酸。并行地,投射到阱1-3上的区域814抑制了阱1-3的一种或更多种物质的摄取,防止试剂浪费在阱1-3上,或者防止已经存储在阱1-3内的DNA受到附近流体的不期望的影响。作为上述示例的替代,其中实心白色区域指示被配置为促进从相应的阱804读取DNA的光,投射到阱1-3上的区域814可以抑制从附近的流体中摄取与阱1-1内的DNA合成相关的物质,同时促进阱1-3内的DNA测序所需的物质的摄取。
在最简单的形式中,空间编码投影的交替区域可以是整个区域有光,或者整个区域没有光。然而,SLM系统800还能够投射更复杂的光图案,使得区域812可以被投射为数百或数千个单独可控的光像素,每个光像素具有其自身的特征并且被单独投射到阱804上,使得SLM系统800既可以促进阱804对特定核苷酸的摄取,也可以将核苷酸引导到阱804内的期望位置(例如,在阱804内居中,偏移到阱804的边缘)。
SLP 806可以定位在流通池1322上方(例如,在阱804的开口侧),以便经由诸如阱804上方的光学透明玻璃测序接口1324的接口从阱804的开口侧投射到阱804中,或者可以定位在流通池1322下方(例如,在阱804的封闭侧),以便经由光学透明测序接口1324(例如配置用于光传输到阱804中的端口空间708)从阱804的封闭侧投射到阱804中,。
结合SLM系统800,DNA存储系统1300的一些实现可以包括电极,该电极可操作来为如图11A-11C中所述的期望过程提供每阱控制和阱的激活或去激活。以这种方式,可以通过所产生的电特性和投射光的组合来激活阱以写入或读取数据,所述组合被配置为提供用于促进或抑制摄取的互补或相加效应。作为另一个例子,第一组阱可以被激活用于基于产生的电特性写入数据,而第二组阱可以被激活用于基于投射的光读取数据。作为另一个例子,电特性和投射光可以用于在单独的阱上执行写操作;或者在单独的阱中进行读取操作。这些组合可以与携带流体的物质的构型配对,该构型允许某些核苷酸或碱基被电释放或运输(例如,基于与电流或电压的相互作用),而不受投射光的影响,而其他核苷酸或碱基仅对投射光有反应性,并且基本上不受电特性的影响。
图11A和11B示出了如上所述的可以提供每阱激活和去激活的系统的另一个例子的方面。图13A描绘了DNA存储系统的一部分的示意图,该DNA存储系统可操作来在每个阱904的基础上对一个或更多个阱904读取、写入或读写数据。电润湿系统900包括与电润湿表面906耦合的电润湿控制器912。电润湿表面906覆盖在流通池902上,具有用于一组阱904的开口。电润湿表面906可以在顶侧(例如,阱的开口侧)与流通池902耦合。还示出了流控控制器908和流体供应端口910,它们可以是流控设备1308的部件,并且可操作来控制流体经由流控接口1328进出流通池902的流动。
电润湿控制器912被配置为向电润湿表面906提供电信号(例如,电流、电压),以便在电润湿表面906上的离散位置处产生变化的电条件。电润湿控制器912可以从诸如存储控制器1302的设备接收指令,该指令识别沿着电润湿表面906的路径,诸如从流体供应端口910通向一个或更多个阱904的路径,或者阱904之间的路径。电润湿控制器912可以基于这些指令在空间上(例如,在特定位置)和电上(例如,特定电流、电压或频率)以高精度在电润湿表面906上产生一系列电条件(例如,电压模式)。流控控制器908可以接收相应的指令,指示流体类型、数量、成分和向电润湿表面906输送流体的顺序。基于这些指令,电润湿控制器912和流控控制器908并行操作,由存储控制器1302管理,或者彼此通信,以便向电润湿表面906的输入区域提供精确量和成分的流体,例如液滴,随后是沿着电润湿表面906的电特性的精确序列,其被配置为将液滴从输入区域传输到一个或更多个阱904。
以这种方式,不是用流体淹没或浸没流通池902的整个表面,而是可以组成单独的液滴并直接输送到相应的阱904,以能够写入或读取数据。这允许对单个阱904进行选择性的读取和写入(例如,在上面关于基于电极和SLM的实现中描述为“激活”和“去激活”阱),以及跨越阱904的同时读取和写入操作,而没有干扰。电润湿系统900还节省试剂,因为它不需要淹没或浸没多物质试剂,多物质试剂可以包括许多核苷酸、酶或在一个阱904中操作所必需的其他物质;但是可能被浪费或者可能干扰另一个阱904中的操作。相反,与阱904体积基本相同并且仅包含阱904中操作所需物质的液滴可以直接输送到阱904。
图13B示出了电润湿过程的例子。表面图920对应于一组阱904。如同先前的例子,为了简单起见,示出了九个阱904,但是应该理解,电润湿系统900可以支持具有数千个阱904的表面,例如通过在电润湿表面906上的离散位置引入额外的流体供应端口910,以便最小化特定液滴的行进距离。第一路径922在表面图920上以虚线示出,在到达阱2-3附近的间隙空间之前,沿着阱1-2和1-3之间的间隙空间行进,并被引导到阱2-3中。第一路径922可由沿着电润湿表面906的一组连续的电条件(例如,施加的电压变化)产生,被配置为将液滴吸引到后续位置、将液滴从当前位置排斥或两者兼有;并且还可以包括围绕第一路径922并将液滴引导回该路径的成对电条件,有点类似于一组既引导液滴又防止偏离第一路径922的“轨道”。
类似地,第二路径924沿着阱904之间的空隙空间行进,直到到达阱2-2,在那里液滴可以被分成两部分,一部分被引入阱2-2,第二部分继续行进到阱3-1。该路径可以类似于第一路径922产生,当路径分支时,具有分裂液滴的附加过程。这可以通过例如沿着液滴的中线创建电条件以将其分成两部分,与电“轨道”或其他条件配对以将每个子液滴从分裂位置引导到后续位置来实现。第二路径924在例如阱2-2和阱3-1各自准备合成DNA因此需要相同或非常相似的流体组成的情况下可能是有用的。
电润湿系统900可以与本文公开的其他系统配对,例如图11A-11C的每阱电极、SLM系统800或两者。作为一个例子,电极的激活可以与液滴的输送配对,以过滤掉在液滴传输期间可能从电润湿表面906收集的痕量的不希望有的物质。或者,液滴可以穿过阱而不是间隙或除间隙之外,穿过阱的电极被激活以防止摄取。作为另一个例子,液滴可以包含物质的混合物,混合物的单独子集用于两个单独的阱。混合液滴可被输送至第一阱,其可激活电极以从液滴中提取其所需的子集,使得液滴可被输送至第二阱以输送剩余的物质。
SLM系统800可以与电润湿系统900配对,并且可以将图案化的光投射到液滴行进经过的阱上,以抑制液滴通过时这些阱意外摄取物质。或者,SLM系统800可以将图案化的光投射到液滴行进的电润湿表面906的间隙空间或其他路径上,以破坏或降解残余物质,并防止它们被后续的珠吸收。
在一些实现中,电润湿表面900可以是存储设备1320的部件;并且可以如图13A所示与流通池表面集成和耦合。在其他实现中,电润湿表面906可以是该组仪器1301(例如,测序设备1304或合成设备1306)的部件,并且可以由于存储设备1320被插入或以其他方式与该组仪器耦合而与流通池1322的表面耦合。作为一个例子,在存储设备1320被插入模块接收器1321的情况下,电润湿表面906可以滑入存储设备1320中的槽或开口中,并且当存储设备1320被锁定就位时自动与流通池1322的阱对齐,如已经描述的,使得电润湿表面906的离散部分仍然可以被精确地寻址到各个阱。
已经公开了几种在每个阱的基础上为读和写操作提供选择性激活和去激活阱的实现。图14描绘了过程1000的流程图,该过程1000可被执行以利用这样的系统和设备来向多个阱提供受控的读取和写入区域。阱的索引可以由诸如存储控制器1302的设备来维护(框1002),并且可以包括诸如流通池1322的每个阱的状态的细节。阱状态信息可以唯一地识别每个阱(例如,通过ID号、流通池1322表面上的物理位置或两者),并且指示每个阱是包含多核苷酸还是空的。阱状态信息还可以包括存储在该阱中的信息的标识符,例如文件列表、数据描述、唯一的写操作标识符、写操作的时间和日期或其他类似信息。这种信息也可以存储为单独的文件索引,该文件索引通过列出这些阱的唯一标识符来指示每个文件存储在其中的一个或更多个阱,阱索引包含唯一标识符和阱的物理位置或地址。阱索引、文件索引或两者可以存储在存储控制器1302可访问的存储器或驱动器上;或者可以存储在作为存储设备1320的部件的电子存储器上,这将在下面更详细地描述。
DNA存储系统1300可以接收(框1004)来自用户或来自其他系统和设备的对要写入存储设备或从存储设备读取数据的请求;并且可以存储与那些请求相关联的数据,直到它们可以完成。当接收到请求时(框1004),DNA存储系统1300可以确定(框1006)受该请求影响的一个或更多个阱。对于读取数据和提供输出的请求,这可以包括参考阱索引来确定可以读取的阱的标识,以便生成其中包含的机器写入的多核苷酸的描述;并将多核苷酸转换成数字数据。对于将输入写入存储设备的请求,这可以包括参考阱索引来识别基于输入大小提供所需存储量的一个或更多个完全或部分空的阱;以及将部分输入分配给每个阱。
DNA存储系统1300可以管理(框1008)受影响阱的阱激活,其可以包括以下任何或全部:(1)激活受影响阱以读取数据或激活受影响阱以写入数据;(2)去激活或以其他方式保护受影响的阱附近或邻近的阱(例如,诸如电润湿系统900可以向目标阱提供液滴,并且邻近的阱可以去激活);和/或(3)去激活不是受影响的阱的每个阱(例如,流通池的整个表面接收多物质流体,并且去激活每个未受影响的阱以防止不希望的合成或测序)。如上所述,阱激活可以包括使用如图11A-11B所示的系统和设备,以促进目标阱中物质的期望运输和结合,抑制非目标阱中物质的不期望摄取,或两者兼有。虽然在一些实现中,可以更准确地说,当阱本身保持不变时,核苷酸或其他物质被激活,但是应当理解,阱的“激活”在本文中用于考虑与阱相关联的特性的变化(例如,阱附近区域的电特性),以及阱附近物质的变化(例如,响应于电压或光子能量的核苷酸的激活)。
DNA存储系统可以使用如本文所述的方法通过在各自激活的阱中测序或合成DNA来执行1010输入和输出请求,该方法可以包括向一些或所有阱提供各种试剂流体,向阱提供核苷酸的有序序列,照亮和成像阱,以及其他。如上所述,要写入到阱中的数据可以被编码成DNA格式(例如,其中核苷酸碱基对应于二进制数据,例如其中每个单独的核苷酸对应于不同的二进制二联体),其用于确定写入到阱中的核苷酸序列。从阱中读取的数据最初将是DNA格式,并将描述核苷酸的有序序列,这些序列可以使用相应的解码规则转换回二进制数据。
B.用于同时读取和写入的高速缓存方法
除了从允许向存储设备同时读取和写入数据的特征中受益之外,诸如DNA存储系统1300的系统还可以从模拟同时读取和写入数据的DNA存储特定的高速缓存方法中受益,使得依赖于DNA存储系统1300的用户或其他系统和设备不会受到DNA存储系统1300向存储设备1320写入数据的能力中的偶然延迟的影响。这些缓存策略的一些实现也可以最小化将来读写冲突的可能性。
虽然该组工具1301可以包括各种系统级高速缓存特征(例如,内置在存储控制器1302中并被配置为自动高速缓存与处理器的基本操作相关的数据的处理器、存储器或主板高速缓存),但是提供与存储设备1320而不是该组工具1301相关联的高速缓存存储器(例如电子存储器)可能是有利的。作为一个例子,当数据被写入存储设备1320并且用户在写入流通池1322之前开始从DNA存储系统1300的一组仪器1301卸载卷时,未写入的数据可以被存储在电子存储器上,并且将与存储设备1320一起移动,直到它可以被写入流通池1322。作为另一个例子,在如图14中所描述的那样维护阱的索引(框1002)的情况下,将该索引维护在与存储设备1320一起移动的电子存储器上,而不是存储在云存储中,或者除了存储在云存储中之外,或者在DNA存储系统1300的一组仪器1301的永久存储卷上,可能是有用的。以这种方式,如果存储设备1320与不同的DNA存储系统1300的一组仪器1301一起运输和安装,阱索引立即可用,而不需要从云存储卷或从DNA存储系统1300的先前耦合的一组仪器1301获得信息。
图15描绘了图示可与诸如DNA存储系统1300的DNA存储系统一起使用的存储设备1100的示例的示意图。存储设备1100包括被配置为将存储设备1100与DNA存储系统接口1108(例如,一组仪器1301、电接口1310)耦合的盒接口1104(例如,测序接口1324、合成接口1326等)。存储设备1100还包括流通池1106,数据可以作为多核苷酸存储和写入其上。高速缓存存储器1102被包括在存储设备1100中,并且可以是模块电子设备1330的一部分,使得当存储设备1320被放置或安装在DNA存储系统1300中时,它与电接口1310耦合。电接口1310既给高速缓存存储器1102供电,又允许高速缓存存储器1102和存储控制器1302或其他设备之间的数据交换。在一些实现中,高速缓存存储器1102可以是非易失性电子固态存储器,其被配置为物理连接用于数据传输。在一些实现中,当耦合到DNA存储系统1300时,高速缓存存储器1102可以被配置用于无线数据传输。在一些实现中,高速缓存存储器1102可以包括几个存储器,例如用于存储数据的大型固态存储器,以及用于存储少量识别信息的小型无线存储器(例如,包含与存储设备1320相关联的唯一标识符的RFID存储器)。
除了已经描述的高速缓存存储器1102的优点之外,可以为高速缓存存储器1102可用的DNA存储系统1300实现特定的高速缓存策略。作为示例,图16描绘了可被执行以向存储设备1100提供读和写操作的高速缓存的过程1120的流程图。当用DNA存储系统1300将数据写入存储设备1100时,可以将附加数据写入高速缓存存储器1102。这可以包括将文件索引写入(框1122)到高速缓存存储器1102,该文件索引可以描述多个阱的内容以及特定文件或数据的位置,无论是存储在多个阱中、存储在高速缓存存储器1102上还是两者都有。这种信息可以用于允许以后访问和检索所请求的数据。单个文件或数据束的校验和数据也可以被写入(框1124)高速缓存存储器1102,并且可以与文件索引相关联。
与在流通池1106上存储这样的数据,并且要求在驱动器内容可访问之前对其进行测序,并且频繁地合成以反映变化;或者将这种数据存储在云存储或服务器上,这可能需要网络连接和访问这种数据的许可,才能访问驱动器内容相比,在高速缓存存储器1102上存储文件和数据的索引、校验和列表或两者可以在将来实现更快的数据读取和写入。除了将其存储在流通池1106本身或网络可访问卷上之外,将这种数据存储在高速缓存存储器1102上还提供了这种数据的冗余存储的额外优点,因为文件表和索引的丢失可能导致存储在流通池1106上的数据的完全丢失,或者大大增加基于逐阱检查重建文件索引的时间和资源成本。
当存储设备1100与DNA存储系统1300耦合时,系统可以从用户或者从与DNA存储系统1300通信的系统和设备接收(框1126)读取操作,并且可以接收(框1136)写入操作。如已经讨论的,在一些情况下,可能不可能允许同时读取和写入数据到流通池1106的分离阱。这可能是由于DNA存储系统1300的限制,或者存储设备1100的限制。作为一个例子,DNA存储系统1300的一些实现可能缺乏用于读取和写入数据的选择性或每阱激活,例如在图9-12的上下文中描述的;而是以可能影响流通池1106的每个阱的批量操作进行测序和合成数据。在这样的实现中,存储设备1100可以被认为具有两种互斥模式——读模式和写模式。
虽然这样的实现可能特别受益于所公开的高速缓存策略,但是应当理解,即使支持同时读取和写入的实现也可能遇到各种情况,其中它们实际上处于读取模式或写入模式,例如其中阱激活特征被限制为在一个时间段内一定数量的同时操作(例如,电润湿系统900可能被限制为它在给定时间段内可以激活的阱的数量,并且大量数据读取请求可能导致后续数据写入请求排队一段时间)。
在接收到读取操作的情况下(框1126),DNA存储系统1300可以检查文件索引,以定位所请求的数据并确定其当前是否存储在高速缓存存储器1102上(框1128)。在不同的情况下,所请求的数据可以在高速缓存存储器1102上可用。作为示例,当数据被写入存储设备1100,然后在不久之后被请求时,它仍然可以被存储在高速缓存存储器1102中。作为另一个例子,在数据最近基于请求从流通池1106读取的情况下,它可以存储在高速缓存存储器1102中,直到被重写。作为另一个例子,DNA存储系统1300可以被配置为在可能的情况下,由于用户的手动配置,或者基于DNA存储系统1300基于对这些数据的读取请求的频率的自动确定,将存储在流通池1106上的某些数据标记为也在高速缓存存储器1102中维护。
在所请求的数据可从高速缓存存储器1102获得的情况下,DNA存储系统1300将从高速缓存存储器1102读取(框1130)数据以服务该请求,这可以允许存储设备1100保持在写模式,同时允许数据被读取(尽管是从高速缓存存储器1102而不是从流通池1106)。在所请求的数据没有存储在高速缓存存储器1102中的情况下,当这种功能可用时(例如,当存储设备1100处于读取模式时,或者当读取操作以其他方式可用时),DNA存储系统可以从流通池1106读取数据(框1132)。在存储设备1100处于写入模式并主动向流通池1106写入数据的情况下,由于在模式和调节阱之间切换的时间和试剂成本,优先切换回读取模式可能不是有利的。然而,在排队待写入的数据具有可存储在高速缓存存储器1102上的大小的情况下,切换到读取模式并允许从阱中读取所请求的数据(框1132)同时输入数据存储在高速缓存存储器1102上可能是有利的。在这种情况下,已经请求写入和读取数据的用户或其他系统或设备察觉到这些动作正在同时执行,因为输出数据正在从流通池1106读取,而输入数据正在被写入高速缓存存储器1102。
在每次读取操作之后,可以更新高速缓存存储器1102上的文件索引或另一个数据集(框1134)以反映最近请求的数据的读取频率,这样的数据集对于将来确定由于使用频率(例如,可以每单个数据请求的数据)或使用模式(例如,每个星期五请求的数据可以在星期四以低优先级被循环到高速缓存存储器1102中,使得它在一段时间内完成,在这段时间内可能有减少的数据读写入请求)而应被循环到高速缓存存储器1102中的数据有用。
继续参考图16,在接收到写操作的情况下(框1136),DNA存储系统1300可以确定(框1138)存储设备1100当前是否处于读模式。在存储设备1100当前处于读取模式的情况下,可以将与写入操作相关联的输入数据写入(框1142)到高速缓存存储器1102,并且标记为在可用时写入到流通池1106。在存储设备已经处于写入模式的情况下,输入数据可以被写入(框1140)到流通池1106的一个或更多个阱。
所公开的高速缓存方法还可能受到高速缓存策略的影响,该高速缓存策略优先于其他考虑因素而停留在当前模式(例如,读取模式或写模式),使得所有排队的读操作可以在切换到写模式之前被执行,而不管请求的到达顺序,并且甚至可以在最后一个读取请求完成之后的短暂时间段内保持读取模式,以便允许其他读取请求在切换模式之前到达并被服务。除了减少在给定时间段内执行的模式切换的总数之外,这种策略还降低了特定于读取的试剂与特定于写入的试剂交叉污染的风险,否则,由于模式切换更频繁,这种交叉污染会更频繁地发生。
C.同步读取和写入的多卷管理方法
诸如DNA存储系统1300之类的系统也可以受益于针对多卷管理的DNA存储特定方法,该方法可以允许数据的同时读取和写入、数据的冗余存储、数据的错误检查以及数据的提高的读取和写入速度。例如,在一些实现中,当数据被写入位置(例如,流通池中的阱)时,镜像拷贝也可以被自动写入第二位置(例如,同一流通池中的第二阱,或者不同流通池中的阱)。在一些这样的实现中,一个或更多个镜像拷贝的存在可以被用来提高系统性能,例如通过支持并行操作。例如,在一些实现中,DNA存储设备可以包括两个流通池(例如,两个流通池601),第一个流通池用于读取操作,第二个流通池用于写入操作。在这种情况下,如果两个不同的用户想要同时读取和写入存储在特定位置的数据,则可以通过对存储在第一流通池601中的数据的拷贝进行测序来满足发出读取请求的用户;同时通过将新的多核苷酸写入第二流通池601中的适当位置来满足写入请求。随后,当请求已经被处理时(例如,在低活动周期期间),第一流通池601可以与第二流通池601重新同步,从而确保无论何时发出下一个读取请求,都可以使用第一流通池601读取已经写入第二流通池601的任何数据。
作为另一个例子,在一些实现中,当要写入数据时,除了写入该数据之外,可以实现系统来写入该数据以及冗余值,该冗余值可以用于即使在数据丢失的情况下重建该数据的一部分。为了说明,考虑下面的表1,其提供了可以为以四个多核苷酸的形式存储的数据生成的冗余值的例子,每个多核苷酸存储四位数据。
数据序列1 数据序列2 数据序列3 数据序列4 冗余序列
1 1 1 1 XOR 0
1 1 1 0 XOR 1
1 1 0 0 XOR 0
1 0 0 0 XOR 1
表1:使用冗余序列存储数据的示例方法,该方法允许即使在数据丢失时重新创建一部分数据。
在一些实现中,16位数据可以被分成四个四位序列,并且可以通过对来自前四个序列的位应用逻辑异或运算符来创建第五个四位序列。然后,这五个序列可以存储在DNA存储设备中五个不同位置的五个多核苷酸中。然后,如果在测序操作期间发现一个位置中的数据被破坏和/或被无意误读,则可以通过对剩余的四个序列应用异或运算符并将编码结果作为新的多核苷酸存储在先前保存被破坏的数据的位置来重新创建该数据。
在读取和/或写入过程中,可能会出现“定相”和/或“预定相”,并在最终的写入或读取序列中引入错误。“定相”是指当第一个掺入核苷酸的可逆终止子被无意中去除(例如通过与尚未从流通池中冲出的残余试剂的相互作用)时,第二个核苷酸被掺入的情况。在写入过程中,这可能导致为特定的DNA序列写入两个核苷酸,而不是一个核苷酸。在读取过程中,这可能导致没有检测到与第一个核苷酸相关的荧光团,从而通过跳过一个核苷酸来偏离读出序列。“预定相”指的是核苷酸未被掺入的情况。在写入过程中,这可能导致没有核苷酸被写入序列。在读取过程中,这可能导致没有与被检测序列的核苷酸相关联的荧光团,或者与先前核苷酸相关联的先前荧光团被再次检测,从而通过滞后或重复读取一个核苷酸来偏离读出序列。冗余序列的使用可以检测写入和/或读取过程中的一个或两个中的错误。
图17A和17B描绘了允许用于DNA存储的多卷管理的存储设备配置的示意图。图17A示出了存储设备1200,其可以与DNA存储系统接口1108耦合(例如,如存储设备1100的上下文中所述)。存储设备1200包括盒接口1202和两个不同的流通池1204、1206,盒接口1202具有与关于盒接口1104描述的相似的特征和能力,两个不同的流通池1204、1206具有与本文描述的其它流通池相似的特征和能力。虽然被称为流通池,但是还应当理解,第一流通池1204和第二流通池1206可以替代地是不同的通道,例如与流动通道410分开的两个通道,其可以从流控、测序和合成的角度独立管理。
图17B示出了类似于图17A所示的存储设备的配置,但是具有两个不同的存储设备1210。该示例的每个存储设备1210具有盒接口1212,该盒接口1212具有与关于盒接口1104描述的相似的特征和能力。该示例的每个存储设备1210还具有流通池1214,该流通池1214具有与这里描述的其他流通池相似的特征和能力。两个不同的存储设备1210中的每一个都与DNA存储系统接口1108耦合,其本身可以被稍微修改以同时与两个不同的存储设备1210耦合。例如,DNA存储系统接口1108可以为每组仪器1301加倍或以其他方式提供额外的能力;或者将两个存储设备1210定位成彼此靠近,并且配置该组仪器1301,使得它们可以在模块之间浮动,例如在照明和光学感测设备可以在模块之间移动的情况下。或者,DNA存储系统接口1108可以提供一组同时与每个模块相互作用的仪器1301,例如在流控设备的情况下,其可以通过流控网络向每个模块提供流体。
图18描绘了过程1220的流程图,该过程1220可被执行以提供与诸如存储设备1200或存储设备1210的存储设备的冗余数据写入和读取操作。当接收到输入请求(框1222)时,提供应该写入流通池的阱的输入数据,DNA存储系统1300可以根据其能力并行或紧密顺序合成(框1224)并将输入数据存储在第一阱中;并且合成(框1228)并且将输入数据存储在第二阱中。虽然图18描述了第一阱和第二阱,但是应当理解,数据可以有利地跨三个或更多阱执行。第一阱和第二阱的冗余可用于错误检查,例如通过对第一阱和/或第二阱的多核苷酸中的一个或两个进行测序,以确定在读取和/或写入过程中是否发生定相或预定相。假设在合成中没有错误,在第一阱和第二阱中对应于输入数据的多核苷酸的相同拷贝。根据第一阱和第二阱的性质,这提供了各种优点。
例如,参照存储设备1200,第一阱可以位于第一流通池1204中,而第二阱可以位于第二流通池1206中。在这种情况下,写入的数据被冗余地存储在两个独立的卷中,这对于数据完整性和最小化数据丢失的风险是理想的。此外,由于数据跨两个不同的流通池克隆,DNA存储系统1300也可以同时读取数据和向卷写入数据,例如,通过将第一流通池1204始终保持在写入模式,同时在接收到输出数据的请求时将第二流通池1206切换到读取模式。这两个优点也适用于第一阱位于一个存储设备1210的流通池1214中并且第二阱位于另一个存储设备1210的流通池1214中的情况。
即使在使用另一个存储设备(例如,存储设备1100)并且第一阱和第二阱各自位于流通池1106中的情况下,跨同一流通池中的各个阱克隆数据也有一些优点。除了提供数据冗余以降低由于阱故障或一个阱内DNA意外降级而导致数据丢失的风险之外,克隆写入的数据还可以提供额外的错误检查能力,无论两个阱位于何处。作为一个例子,在输入数据被写入如图18所示的分开的阱的情况下,然后可以通过测序(框1226)和从第一阱读取数据,以及测序(框1230)和从第二阱读取数据,从两个分开的阱读回输入数据。从每个阱读取的输出(完整文件或数据集,或输出的校验和)的比较(框1232),将指示写入一个细胞的多核苷酸是错误合成的、错误读取的,还是随后由于某种原因降级的。
在一些实现中,第二阱中多核苷酸的合成可以基于第一阱中多核苷酸的合成来完成。也就是说,可以对写入第一阱中的多核苷酸进行克隆扩增,并且可以将一个或更多个克隆的多核苷酸储存在第二阱中和/或流体储存室中。可以对第一阱中克隆扩增的多核苷酸进行测序,以确定第一阱中核苷酸的序列。可以将第一阱中的核苷酸序列与指示的写入多核苷酸进行比较,以确定在写入过程中是否发生了任何定相或预定相错误。如果发生错误,存储在第二阱和/或流体存储室中的一个或更多个克隆的多核苷酸可能由于损坏而被丢弃,并且写入过程可能再次发生。如果没有发生错误,则储存在第二阱和/或流体储存室中的一种或更多种克隆的多核苷酸可以被克隆并储存在第一阱和/或一个或更多个其它阱中,以提供本文所述的两种或更多种相同的多核苷酸。
一些执行如图18所示的数据克隆写入的实现,也包括SLM系统800,其中第一阱和第二阱包含在同一流通池内,可以受益于SLM系统800跨流通池表面投射编码的空间光的能力。在这种情况下,流通池可能已经接收合成所需的试剂并将数据写入第一阱,这意味着第二阱通常也接收相同的试剂。在这种情况下,SLM系统800也可以将图案化的光投射到第一阱上以完成合成,并且由于第二阱在相同的流通池上,并且在SLM系统800的潜在投射覆盖区内,所以在试剂或处理器时间方面复制投射到第一阱上的图案可能需要很少的额外资源,使得相同的图案也投射到第二阱上。
在图18的方法的又一个实现中,单阱可以用作第一阱和第二阱,使得可以在单阱中产生两个相同的多核苷酸。除了提供防止单链降解的冗余之外,两个单独的链可以由光学标签的或标记的核苷酸构建,并在完成后立即在同一阱内照射和成像,以确定其中一个链在写入过程中是否被破坏。一种或更多种公开的实现还可以包括将额外的核苷酸连接到机器写入的多核苷酸上,该额外的核苷酸表示诸如链内核苷酸序列的散列值或校验和、指示特定数据序列末端的间隔值和/或从后续核苷酸序列中分离散列值的信息。如已经描述的,这样的信息可以被写入多核苷酸,作为索引存储在单独的存储介质(例如,高速缓存存储器1102)中,或者两者都存储,并且可以用于帮助验证存储数据的数据完整性。
作为上述的一个例子,在一组输入数据被编码成序列AATTCCGG的情况下,创建相应散列值的一个例子可以包括给每个不同的核苷酸分配任意值(例如,A=1,T=2,C=3,G=4),然后在数学上将该值序列组合成单个值(例如,通过加法、乘法或其他数学运算中的一个或更多个)。还可以将附加值组合到散列中,例如指示序列长度的值(例如,在上述示例中,8)。继续上面的例子,结果散列值将取决于用于产生散列值的数学运算。
例如,结果散列值可以是28(例如,序列值和序列长度相加的结果),4608(例如,序列值和序列长度相乘的结果),或者132(例如,序列值交替相加和相乘的结果,随后是序列长度相加)。不同的方法将提供具有可变数量的可能输入的散列值,其可用于以不同的置信度水平验证输入核苷酸的序列。作为示例,使用四元映射A=0、T=1、C=2和G=3,对应于散列值的上述示例的序列可以是,对于28为TGO,对于4608为TACAAAA,对于132为CATA。
在间隔值被包括在序列中的实现中,间隔值可以与散列值或其他后序列或前序列信息配对,并且可以包括诸如TTTTTTT的任意核苷酸序列,这在输入数据的正常编码中可能不太可能发生,并且在解码测序数据时可以作为间隔值而不是编码数据来处理。
图19描绘了过程1240的流程图,过程1240可被执行以提供与存储设备的高速数据写入和读取。图19的过程可以使用存储设备1200、存储设备1210或支持用于合成和测序的每阱激活的另一存储设备来执行。当接收到输入请求时(框1242),DNA存储系统1300可以将与输入请求相关联的数据分段(框1244)成多个部分(例如,两个或更多)。系统可以将第一部分合成并写入到第一阱中(框1246),并且并行地将第二部分合成并写入到第二阱中(框1248),而不是将整个输入写入到单个阱中。在第一阱和第二阱可以以这种方式分别合成而不影响另一个阱的写入速度的情况下,结果是相对于将整个输入写入单个阱,输入数据可以以大约两倍的速度完全写入DNA储存器。类似地,当接收到输出请求时(框1250),DNA存储系统1300可以测序(框1252)和从第二阱读取第二部分,并且并行地,测序(框1254)和从第一阱读取第一部分。然后,这两个部分可以被重组,并且可以提供完整的输出(框1256)。同样在这种情况下,相对于从单阱中读取数据,可以以约两倍的速度从DNA储存器中读取输出数据。
在此公开的多卷配置也可以被实施以提供同时读取和写入功能,即使在没有每阱激活特征的情况下。作为示例,图20描绘了过程1260的流程图,过程1260可被执行以提供同时读取和写入,其中多个单独的卷(例如,流通池)可用,例如存储设备1200和存储设备1210。当DNA存储系统1300接收到输入请求(框1262)时,系统将默认合成(框1264)并以克隆模式将数据写入每个卷,使得如果没有任何意外的合成错误,在合成后,每个单独卷(例如,第一流通池1204和第二流通池1206)上的单独阱包含相同的多核苷酸。
如果接收到从存储设备1200读取输出的请求(框1266),DNA存储系统1300将切换(框1268)到以混合模式管理多个卷,其中合成(框1270)在第一卷(例如,第一流通池1204)上不间断地继续,但是测序(框1272)开始从第二卷(例如,第二流通池1206)读取所请求的输出。DNA存储系统1300可以以混合模式持续一段时间,在此期间输入可以被连续写入第一卷,而输出可以从第二卷被连续读取,只要在切换到混合模式之前所请求的数据存在于第二卷上。随着时间的推移,第一卷和第二卷的状态将逐渐趋异,因为第一卷将越来越多地包含未克隆到第二卷的数据。
为了解决这个趋异,DNA存储系统1300可以评估几个因素来确定何时返回克隆模式。作为一个例子,在所有排队的输入请求都已完成,并且没有待合成和写入(框1274)到第一卷的数据的未决操作的情况下,系统可以开始以克隆模式测序(框1276)并从多个卷读取数据。以这种方式,如果接收到对存在于由第一卷存储的数据的趋异部分内并且还没有由第二卷存储的数据的输出请求,则可以不间断地从第一卷读取该数据。应当注意,对于趋异的数据,公共文件索引或阱索引可以由多个卷共享,并且被维护以指示多个卷上的阱的可用性。换句话说,虽然没有必要将写入位于第一卷上的坐标为X-Y的阱的数据也写入位于第二卷上的坐标为X-Y的阱,但是当每个卷满时,它们存储的总合数据应该是相同的。在需要实施阱位置的卷与卷对应的情况下,共享的文件和阱索引可用于实施这种行为。
作为另一个例子,在所有排队的输出请求都完成,并且对于要测序和从第二卷读取的数据没有未决操作(框1278)的情况下,系统可以返回到以克隆模式合成(框1280),并且将数据写入多个卷,暂时忽略数据的趋异部分。稍后,当对多个卷的需求最小时,DNA存储系统1300可以合成(框1282)并将趋异数据写入第二卷,以便将其返回到第一卷的真实克隆状态。在一些实现中,可以基于从第一卷读取趋异数据,然后写入第二卷,来执行趋异数据的合成(框1282)。
在一些实现中,合成(框1282)可以通过在储存它们的第一卷的阱中进行趋异数据的多核苷酸的原位克隆(例如克隆扩增),然后将克隆的链直接运输到第二卷的相应阱中并在那里结合它们来进行,如已经描述的。在这种实现中,可以通过第一卷中的每个阱和第二卷中的每个对应阱之间的流控连接来实现克隆链在卷之间的传输,使得流体流可以用于经由流控连接将克隆链从第一卷的阱直接传输到第二卷的对应阱。
作为另一个例子,DNA存储系统1300可以配置有指示允许的时间段或允许的数据趋异的时间阈值。当超过时间或其他阈值时(框1284),由于混合模式下的延长时间段或混合模式下的大量写入,DNA存储系统1300可以在一段时间内禁止从多个卷读取数据,并开始合成(框1282),并将趋异数据写入第二卷,直到赶上为止。
虽然已经在两个卷的上下文中描述了图20的过程,但是应当理解,三个或更多个卷可以在保持数据冗余方面提供显著的优势,同时还降低了特定卷的数据过度趋异的可能性。作为示例,根据图20管理三个或更多个卷,第二和第三卷可以在读取和写入模式之间交替,以便减少任何单个驱动器的趋异数据量,并且使得最近写入的数据可用于读取。例如,如果第三卷在第二卷切换到读取模式三小时后切换到读取模式,为了允许第二卷与第一卷切换回写入模式,直接的结果可能是第二卷的趋异数据可能被限制在三小时的写入输入,并且与第二卷上的可用数据相比,第三卷可以有另外三小时的写入输入可用于从第三卷读取。
VIII.数据错误风险缓解
在一些实现中,被配置为以核苷酸序列(例如机器写入的DNA)的形式对数据进行编码并从中读取数据的系统可以包括减轻数据中可能由写入和/或读取过程中的定相和/或预定相导致的错误风险的特征。例如,在一些实现中,当读取先前作为核苷酸序列写入的数据时,系统可以将从核苷酸序列读取的数据与存储在非核苷酸存储器中的质量控制值进行比较,然后将该比较用作确定核苷酸序列(或存储核苷酸序列的阱,在其中序列存储在作为可寻址元件的阱中的实现中)是否应该被视为具有损坏的数据的基础。在发生这种类型的比较的实现中,可以以多种方式来执行。例如,在一些实现中,核苷酸序列的比较可以通过基于读取的核苷酸序列计算值(例如校验和、散列值或一些其他类型的错误检测值),然后将该值与在应该已经编码在核苷酸序列中的数据被写入时先前已经计算并存储在非核苷酸存储器中的值进行比较来执行。类似地,在一些实现中,当核苷酸序列被写入DNA存储设备时,应该在该序列中编码的数据可以被存储在非核苷酸存储器中,并且该比较可以是从核苷酸序列读取的数据与存储在非核苷酸存储器中的数据的直接比较。在一些实现中也可以使用组合方法。
在一些实现中,也可以使用前面段落中描述的风险缓解方法的组合。为了说明,考虑图22,其描绘了在一些实现中可以执行的读取和写入数据的过程。最初,如图22所示的方法可以包括接收数据写入请求,如图22的框1701所示。例如,这可以是用户通过用户界面130提交的将文件存储在DNA存储设备中的请求,或者自动生成的存储作为过程输出生成的数据的请求,作为内部备份,或者用于其他目的。在接收到数据写入请求之后(框1701),该方法可以包括生成一个或更多个写数据的命令,如图22的框1702所示。这可以包括,例如,在给定DNA存储设备的性质(例如,可能被写入的核苷酸序列的长度、用于数据的编码方案等)的情况下,确定应该如何表示要被写入的数据),确定在DNA存储设备中编码数据的核苷酸序列应该被合成的特定位置,并产生用于合成那些序列的命令(例如,用于激活与流通池600、601中的特定阱630相对应的电极的命令,使得碱基被适当地添加到那些阱630中的链上)。然后可以执行这些命令以将数据写入DNA存储设备,如图22的框1703所示。
在一些实现中,在数据被写入(框1703)到DNA存储设备之后,它可以被自动读取(即,其中写入数据的多核苷酸可以被直接测序,或者通过拷贝多核苷酸并对拷贝测序),如图22的框1704所示。然后,如图22的框1705所示,可以将读取的数据与作为原始写入请求的主题的数据进行比较。例如,在一些实现中,当接收到写入请求时(框1701),将被写入的数据将自动保持在系统的非核苷酸存储器中(例如,在系统控制器120的RAM中),直到接收到成功写入的确认。在这些类型的实现中,从DNA存储设备读取的数据与作为原始请求的主题的数据的比较(框1705)可以通过对存储在系统的非核苷酸存储器中的来自写入请求的数据与通过对写入DNA存储设备的信息进行测序而读取的数据进行位级比较来执行。
在执行如图22所示的过程的实现中,如果从DNA存储设备读取的数据(框1704)与系统的非核苷酸存储器中的数据匹配,则可以存储数据的指纹,并且可以结束写操作,如图22的框1706所示。在一些实现中,存储数据的指纹可以包括计算校验和、循环冗余校验值、散列值或可用于检测编码数据中的变化的其他类似类型的值,然后将该值存储在非易失性存储器中,例如磁盘驱动器、固态存储器、光盘或其他类型的存储元件。在一些实现中,指纹还可以包括关于数据是如何被编码的信息,而不是数据本身。例如,如果核苷酸序列由碱基A、C、T和G组成,那么指纹可以由序列中的实例A的数量、实例C的数量、实例T的数量和实例G的数量组成,而不是反映使用这些碱基编码的数据。其他变化也是可能的(例如,指纹显示序列中包括的每种类型碱基的数量的奇偶性,基于数据和数据如何编码的指纹);并且可以在各种实现中使用。在一些实现中,指纹可以被附加到DNA序列的末端。结束写操作可以包括向写入请求的源发送指示数据已经被成功写入的消息。另外,在一些实现中,结束写操作可以包括从存储器中的一个或更多个位置清除写入请求中包括的数据,使得这些位置可以用于存储其他信息(例如,可以包括在未来写入请求中的新数据)。
在一些实现中,如果从DNA存储设备读取的数据(框1704)与系统的非核苷酸存储器中的数据不匹配,则该数据可以被视为已经被损坏(例如,没有正确写入),如图22的框1707所示。在一些实现中,这种将数据视为损坏的处理可能会触发各种错误处理过程。例如,在一些实现中,如果从DNA存储设备读取的数据(框1704)与系统的非核苷酸存储器中的数据不匹配,则诸如图22所示的过程可以返回到将数据写入(框1703)DNA存储设备,使得数据可以被记录,而不管是什么问题导致了先前的错误。作为另一种方法,在一些实现中,如果从DNA存储设备读取的数据(框1704)与系统的非核苷酸存储器中的数据不匹配,则具有不匹配数据的位置可以被识别为“坏的”(例如,对于该位置,索引中的损坏数据标志可以被翻转),并且正确的数据可以随后(例如,在未来的低利用率期间)被写入损坏数据的位置。作为另一种方法,在一些实现中,如果从DNA存储设备读取的数据(框1704)与系统的非核苷酸存储器中的数据不匹配,则可以生成错误消息(例如,功能返回代码),指示写操作遇到了可能需要系统的某个其他方面或用户补救的问题(例如,可以生成错误代码,将“损坏的”数据的位置标识为硬件故障排除(例如,电极640的替换)可能合适的位置)。在一些实现中也可以使用组合方法。例如,在一些实现中,如果从DNA存储设备读取的数据(框1704)与系统的非核苷酸存储器中的数据不匹配,则可以重试向DNA存储设备写入数据(框1703),并且可以生成错误消息,使得用户可以意识到他或她可能希望在发展成不可恢复的故障之前解决的早期问题。其他方法对于本领域普通技术人员来说将是明显的,并且也可以在没有过度实验的情况下实现,并且可以在其他实现中使用。因此,对执行诸如图22所示的方法的实现如何将数据视为被破坏(框1707)以及这种实现如何潜在地响应这种破坏的描述应该被理解为仅仅是说明性的,而不应该被视为限制性的。
在一些实现中,系统100可以读取核苷酸序列,例如通过如前所述对其进行测序,如图22的框1708所示。这可以例如响应于读取请求(例如,检索先前存储的文件的请求)、作为数据质量检查的一部分(例如,在一些实现中,存储在DNA存储设备中的数据可以被周期性地读取以识别其在存储时是否已经降级)或出于其他合适的原因来完成。在一些实现中,在核苷酸序列被读取之后(框1708),它可以经历额外的风险减轻步骤,例如基于所读取的数据计算指纹,如图22的框1709所示。然后,可以将该指纹与预期对应的另一个指纹进行比较(例如,作为写入过程的一部分而自动创建和存储的指纹(框1706)),以确定检索的数据是否应该被视为损坏的和/或读取过程中是否出现错误,如图22的框1710所示。在一些实现中,如果存在匹配,则可以返回检索到的数据(例如,作为返回值发送给已经发出读取请求的进程),如图22的框1711所示。或者,在一些实现中,可以不返回读取的数据,而是可以提供某种代码(例如,如果作为数据质量检查的一部分读取了数据,则指示没有发现错误的代码(框1708))。类似地,如果比较(框1710)发现指纹不匹配,则数据可以被视为损坏(框1707),并且在一些实现中,可以启动诸如前面描述的各种错误处理过程。
在一些实现中,可以采取其他类型的风险缓解措施,和/或可以在如何将诸如上述的风险缓解措施付诸实践方面存在变化。例如,在一些实现中,当数据被写入位置(例如,流通池中的阱)时,镜像拷贝也可以被自动写入第二位置(例如,同一流通池中的第二阱,或者不同流通池中的阱)。在一些这样的实现中,一个或更多个镜像拷贝的存在可以被用来提高系统性能,例如通过支持并行操作。例如,在一些实现中,DNA存储设备可以包括两个流通池(例如,两个流通池601),第一个流通池用于读取操作,第二个流通池用于写入操作。在这种情况下,如果两个不同的用户想要同时读取和写入存储在特定位置的数据,则可以通过对存储在第一流通池601中的数据的拷贝进行测序来满足发出读取请求的用户;同时通过将新的多核苷酸写入第二流通池601中的适当位置来满足写入请求。随后,当请求已经被处理时(例如,在低活动周期期间),第一流通池601可以与第二流通池601重新同步,从而确保无论何时发出下一个读取请求,都可以使用第一流通池601读取已经写入第二流通池601的任何数据。
作为另一个例子,在一些实现中,当要写入数据时,除了写入该数据之外,可以实现系统来写入该数据以及冗余值,该冗余值可以用于在数据丢失的情况下重新创建该数据的一部分。为了说明,考虑下面的表2,其提供了可以为以四个多核苷酸的形式存储的数据生成的冗余值的例子,每个多核苷酸存储四位数据。
数据序列1 数据序列2 数据序列3 数据序列4 冗余序列
1 1 1 1 XOR 0
1 1 1 0 XOR 1
1 1 0 0 XOR 0
1 0 0 0 XOR 1
表2:使用冗余序列存储数据的方法示例,该序列允许在数据丢失时重新创建一部分数据。
在一些实现中,16位数据可以被分解成四个四位序列,并且可以通过对来自前四个序列的位应用逻辑异或运算符来创建第五个四位序列。然后,这五个序列可以存储在DNA存储设备中五个不同位置的五个多核苷酸中。然后,在发现一个位置中的数据被损坏的情况下,可以通过对剩余的四个序列应用异或运算符,并将结果作为新的多核苷酸编码/存储在先前保存被损坏的数据的位置中,来重新创建该数据。
此外,在一些实现中,当编码多核苷酸以在DNA存储设备中存储数据时,除了存储数据之外,多核苷酸可以被合成以包括错误检测数据,例如前述类型的指纹。例如,在一些实现中,当合成多核苷酸时,可以基于合成多核苷酸来编码的数据来计算奇偶校验位,并且可以向多核苷酸添加甲基化(或非甲基化)碱基来表示该奇偶校验位。类似地,在一些实现中,也可以或替代地使用其他类型的信息保留修饰(即,不干扰被读取的碱基,但也允许修饰的碱基与未修饰的碱基区分的修饰),例如合成碱基或编码奇偶校验或其他错误检查信息的序列的添加。在多核苷酸中包括这种类型的纠错数据的一些实现中,这种类型的数据可能用于识别和补救错误。例如,在一些实现中,当存储每个多核苷酸时,镜像拷贝可以存储在另一个位置。然后,当多核苷酸被读取时,多核苷酸及其镜像拷贝都可以被读取并相互比较。如果该比较表明多核苷酸及其镜像拷贝不相同,则校验和可以被重新计算,并且具有与其甲基化相匹配的重新计算的校验和的任何一条链可以被视为正确的,而另一条链可以被视为损坏的并被替换(例如,作为如先前所述的错误处理例程的一部分)。
作为另一个例子,在一些实现中,为了识别数据是否应该被视为被损坏,可以检查待测试的序列以确定它是否可以结合到多个检错多核苷酸之一。例如,在核苷酸序列以指纹部分结束的例子中,当读取该序列时,可以基于从该序列读取的数据计算新的指纹。然后可以合成一个错误检查链,该链以相反的顺序编码指纹,如果原始核苷酸序列末端的指纹没有结合到新合成的指纹链上,这可以被视为表明数据已经被损坏,应该被替换。
当在CMOS测序芯片上测序时,使用各种图像校正技术(例如不同像素之间的图像光学或光谱串扰)可能是有用的,并且校正过程可能因芯片而异。校正方法可以使用具有多样性的空间控制的流通池训练数据,用于数据的基本调用训练,特别是对于光学系统,其中光学串扰引入需要内部校准的误差。例如,较小节距的流通池在每个阱附近可能会有变形,这可以使用已知的序列来掩盖。校正方法可以包括基于为不同的DNA读取系统写入预定序列的板载QC系统。预定序列可以包含在阱内或阱附近,并且可以为基础调用提供校正因子。这些方法提供单独的阱串扰校正(创建已知真相或真值表)。已知序列可以放置在流通池上的预定空间,用于同步测序器和/或用于可能的随机访问。这些方法可以允许现场校准。
IX.杂项
包括专利、专利申请和文章在内的所有参考文献都通过引用整体明确地并入本文。
提供前述描述是为了使本领域技术人员能够实践这里描述的各种配置。虽然已经参照各种附图和配置具体描述了本主题技术,但是应当理解,这些仅仅是为了说明的目的,并且不应当被视为限制本主题技术的范围。
如本文所使用的,以单数形式叙述并且以单词“一(a)”或“一个(an)”开始的元件或步骤应当被理解为不排除多个所述元件或步骤,除非明确陈述了这种排除。此外,提及“一个实现”并不旨在解释为排除也包含所陈述的特征的另外的实现的存在。另外,除非明确地相反指出,否则“包括(comprising)”或“具有(having)”具有特定特性的一个元件或多个元件的实现可以包括另外元件,而不管它们是否具有该特性。
在整个本说明书中使用的术语“基本上”和“大约”用于描述并考虑到例如由于处理中的变化而引起的小波动。例如,它们可以指小于或等于±5%、例如小于或等于±2%、例如小于或等于±1%、例如小于或等于±0.5%、例如小于或等于±0.2%、例如小于或等于±0.1%、例如小于或等于±0.05%。
实现主题技术可能有许多其他方式。在不脱离本主题技术的范围的情况下,这里描述的各种功能和元件可以不同于那些示出的功能和元件来划分。对这些实现的各种修改对于本领域技术人员来说是明显的,并且这里定义的一般原理可以应用于其他实现。因此,在不脱离本主题技术的范围的情况下,本领域普通技术人员可以对本主题技术进行许多改变和修改。例如,可以使用不同数量的给定模块或单元,可以使用不同类型或类型的给定模块或单元,可以添加给定模块或单元,或者可以省略给定模块或单元。
带下划线和/或斜体的标题和副标题仅用于方便,并不限制主题技术,也不涉及对主题技术描述的解释。本领域普通技术人员已知或以后将会知道的贯穿本公开描述的各种实现的元件的所有结构和功能等同物通过引用明确地结合于此,并且旨在被本主题技术所包含。此外,无论在上面的描述中是否明确叙述了这种公开,本文中公开的任何内容都不旨在献给公众。
应该认识到,前述概念的所有组合和下面更详细讨论的额外概念(假设这样概念不相互不一致)被设想为本文公开的创造性主题的部分。特别是,出现在本公开的结尾处的所要求保护的主题的所有组合被设想为本文公开的创造性主题的一部分。

Claims (89)

1.一种用于非易失性存储的系统,包括:
存储控制器,其包括处理器和存储器;
存储设备,其包括:
流通池,其包括具有从所述流通池的第一表面可进入的开口侧的多个阱,其中所述阱适于容纳多核苷酸,
流控接口,以及
测序接口;
流控设备,其用于向所述流通池的第一表面提供一种或更多种流体,其中所述一种或更多种流体包括核苷酸写入试剂和核苷酸读取试剂;
测序设备,其用于通过所述测序接口对所述多个阱内的多核苷酸进行测序并确定核苷酸;和
阱激活设备,其用于:
修改所述多个阱中的一个或更多个阱,以提供一组可读阱,其中所述一组可读阱允许暴露于所述核苷酸读取试剂,并防止暴露于来自所述流控设备的其他试剂,以及
修改所述多个阱中的一个或更多个阱,以提供一组可写阱,其中所述一组可写阱允许暴露于所述核苷酸写入试剂,并防止暴露于来自流控设备的其他试剂。
2.根据权利要求1所述的系统,其中所述阱激活设备包括多个电极,并且其中:
所述多个电极中的至少一个电极位于所述多个阱中的每个阱附近,
所述存储设备的控制接口与所述多个电极耦合,并从所述存储控制器向所述多个电极提供一组控制信号,
所述多个电极中的每一个基于所述一组控制信号产生电压,所述电压包括第一电压或第二电压,以及
由所述多个电极中的电极产生的第一电压将所述多个阱中的靠近产生所述第一电压的电极的阱修改为可读阱,由所述多个电极中的电极产生的第二电压将所述多个阱中的靠近产生所述第二电压的电极的阱修改为可写阱。
3.根据权利要求2所述的系统,其中所述至少一个电极位于所述多个阱的每个阱的侧壁上。
4.根据权利要求2至3中任一项或更多项所述的系统,其中所述至少一个电极在所述多个阱的每个阱的周界处位于所述第一表面上。
5.根据权利要求2至4中任一项或更多项所述的系统,其中所述至少一个电极位于所述多个阱的每个阱的底部,并且其中所述至少一个电极包括环形形状,所述环形形状允许光从所述流通池的与所述第一表面相对的第二表面穿过所述环形形状并进入所述多个阱中的所述至少一个电极位于其中的阱内。
6.根据权利要求2至5中任一项或更多项所述的系统,其中,所述第二电压导致所述多个阱中靠近产生所述第二电压的电极的阱的酶抑制剂的杂交,并在所述多个阱中靠近产生所述第二电压的电极的阱中结合所需核苷酸。
7.根据权利要求1至6中任一项或更多项所述的系统,其中:
所述阱激活设备包括多个pH控制设备,每个pH控制设备对应于所述多个阱中的一个阱,并且
每个pH控制设备产生控制由所述流控设备提供的电压敏感功能化流体的pH的电压,以将所述多个阱中的对应于所述pH控制设备的阱修改为可读阱或可写阱。
8.根据权利要求1至7中任一项或更多项所述的系统,其中:
所述阱激活设备包括空间光调制器(SLM),以将光发射到所述多个阱中的一个或更多个阱中,以及
发射的光将所述一个或更多个阱的每一个修改为可读阱或可写阱。
9.根据权利要求1至8中任一项或更多项所述的系统,其中所述存储控制器在测序操作期间:
从所述测序设备接收描述所述多个阱的地址阱中的多核苷酸的核苷酸的一组地址数据,
基于所述一组地址数据从所述多个阱确定一组目标阱,以及
使得所述流控设备仅向所述一组目标阱提供所述核苷酸读取试剂。
10.根据权利要求9所述的系统,其中,在测序操作期间,所述存储控制器通过使所述流控设备从所述多个阱中剥离酶,并使所述阱激活设备提供带电标签,来控制所述核苷酸读取试剂的酶的定位。
11.根据权利要求1至10中任一项或更多项所述的系统,其中所述阱激活设备包括:
电释放机构,其用于产生电压以将阱修改为可写阱,以及
光子释放机构,其用于产生光子能量以将阱修改为可写阱,以及
其中所述一组可写阱包括由所述电释放机构修改的阱和由所述光子释放机构修改的阱。
12.根据权利要求1至11中任一项或更多项所述的系统,其中:
所述阱激活设备包括靠近所述流通池的第一表面的电润湿设备,
所述电润湿设备将流体从所述流控设备输送到所述多个阱中的任何一个阱中,并且
在同时测序和合成操作期间,所述存储控制器:
向所述多个阱中的第一阱提供所述核苷酸读取试剂的液滴,
向所述多个阱中的第二阱提供所述核苷酸写入试剂的液滴,其中所述第一阱和所述第二阱相邻。
13.根据权利要求1至12中任一项或更多项所述的系统,其中所述多个阱的每一个包括:
减少附近阱之间串扰的极化特征,以及
减少附近阱之间串扰的光波导特征。
14.根据权利要求1至13中任一项或更多项所述的系统,其中所述存储控制器在合成操作期间:
将一组数据转换成一组核苷酸,
基于所述一组核苷酸在所述一组可写阱的第一阱中合成第一多核苷酸链,以及
基于所述一组核苷酸在所述一组可写阱的第二阱中合成第二多核苷酸链,其中当正确合成时,所述第一多核苷酸链和所述第二多核苷酸链是相同的。
15.根据权利要求14所述的系统,其中所述存储控制器用所述测序设备对所述第一多核苷酸链和所述第二多核苷酸链进行测序,并且在所述第一多核苷酸链和所述第二多核苷酸链不相同的情况下,提供合成错误的指示。
16.根据权利要求14至15中任一项或更多项所述的系统,还包括空间光调制器,以经由所述测序接口将光学图案投射到所述流通池上,其中所述存储控制器操作所述空间光调制器以将相同的光学图案投射到所述第一阱和所述第二阱中,从而合成所述第一多核苷酸链和所述第二多核苷酸链。
17.根据权利要求1至16中任一项或更多项所述的系统,其中所述存储控制器在合成操作期间:
将一组数据转换成一组核苷酸,
基于所述一组核苷酸的第一部分,在所述一组可写阱的第一阱中合成第一多核苷酸链,以及
与合成所述第一多核苷酸链并行地,基于所述一组核苷酸的第二部分,在所述一组可写阱的第二阱中合成第二多核苷酸链,其中所述第一多核苷酸链和所述第二多核苷酸链共同代表所述一组核苷酸的整体。
18.根据权利要求1至17中任一项或更多项所述的系统,其中所述存储控制器在合成操作期间:
将一组数据转换成一组核苷酸,
基于所述一组核苷酸在所述一组可写阱的第一阱中合成第一多核苷酸链,
基于所述一组核苷酸在所述第一阱中合成第二多核苷酸链,其中当正确合成时,所述第一多核苷酸链和所述第二多核苷酸链是相同的,
基于所述一组核苷酸产生链散列值,以及
合成所述第一多核苷酸链和所述第二多核苷酸链以添加所述链散列值。
19.根据权利要求18所述的系统,其中所述存储控制器在测序操作期间:
用所述测序设备对所述第一阱中的第一多核苷酸链和第二多核苷酸链进行测序,以确定每个多核苷酸链的测序的一组核苷酸和测序散列值,
当所述第一多核苷酸链和所述第二多核苷酸链的测序的一组核苷酸不相同时,提供合成错误的指示,和
当所述第一多核苷酸链或第二多核苷酸链的测序散列值与所述测序的一组核苷酸的后续散列值不匹配时,提供散列值不匹配的指示。
20.一种用于非易失性存储的方法,包括:
安装存储设备,所述存储设备包括:
流通池,其包括具有从所述流通池的第一表面可进入的开口侧的多个阱,其中所述阱适于容纳多核苷酸,
流控接口,以及
测序接口;
通过操作流控设备向所述第一表面提供核苷酸写入试剂,执行合成操作以在所述多个阱中产生多核苷酸;
用测序设备和来自所述流控设备的核苷酸读取试剂进行测序操作,以确定所述多个阱中的多核苷酸的核苷酸;和
在所述合成操作和所述测序操作之前使用阱激活设备:
修改所述多个阱中的一个或更多个阱,以提供一组可读阱,其中所述一组可读阱允许暴露于所述核苷酸读取试剂,并防止暴露于来自所述流控设备的其他试剂流体,以及
修改所述多个阱中的一个或更多个阱,以提供一组可写阱,其中所述一组可写阱允许暴露于所述核苷酸写入试剂,并防止暴露于来自所述流控设备的其他试剂流体。
21.根据权利要求20所述的方法,其中使用所述阱激活设备包括操作所述阱激活设备的多个电极,并且其中:
所述多个电极中的至少一个电极位于所述多个阱中的每个阱附近,
所述存储设备的控制接口与所述多个电极耦合,并向所述多个电极提供一组控制信号,
所述多个电极中的每一个基于所述一组控制信号产生电压,所述电压包括第一电压或第二电压,以及
所述第一电压将所述多个阱中的靠近产生所述第一电压的电极的阱修改为可读阱,并且由所述多个电极中的电极产生的第二电压将所述多个阱中的靠近产生第二电压的电极的阱修改为可写阱。
22.根据权利要求21所述的方法,其中操作所述多个电极包括操作位于所述多个阱的阱的侧壁上的至少一个电极。
23.根据权利要求21至22中任一项或更多项所述的方法,其中操作所述多个电极包括操作在所述多个阱的阱的周界处位于所述第一表面上的至少一个电极。
24.根据权利要求21至23中任一项或更多项所述的方法,其中操作所述多个电极包括操作位于所述多个阱的阱的底部的至少一个电极,并且其中所述至少一个电极包括环形形状,所述环形形状允许光从所述流通池的与所述第一表面相对的第二表面穿过所述环形形状并进入所述多个阱中的所述至少一个电极位于其中的阱中。
25.根据权利要求21至24中任一项或更多项所述的方法,还包括配置所述第二电压,以使所述多个阱中靠近产生所述第二电压的电极的阱中的酶的抑制剂发生杂交,并将期望的核苷酸结合到所述多个阱中靠近产生所述第二电压的电极的阱中。
26.根据权利要求20至25中任一项或更多项所述的方法,其中使用所述阱激活设备包括操作所述阱激活设备的多个pH控制设备,并且其中:
每个pH控制设备对应于所述多个阱中的一个阱,和
每个pH控制设备产生控制由所述流控设备提供的电压敏感功能化流体的pH的电压,以将所述多个阱中的对应于所述pH控制设备的阱修改为可读阱或可写阱。
27.根据权利要求20至26中任一项或更多项所述的方法,其中操作所述阱激活设备包括操作空间光调制器(SLM)以将光发射到所述多个阱中的一个或更多个阱中,并且其中所发射的光将所述一个或更多个阱中的每一个修改为可读阱或可写阱。
28.根据权利要求20至27中任一项或更多项所述的方法,还包括,在所述测序操作期间:
从所述测序设备接收一组地址数据,所述一组地址数据描述了来自所述多个阱的地址阱的测序多核苷酸的核苷酸,
基于所述一组地址数据从所述多个阱确定一组目标阱,以及
使得所述流控设备仅向所述一组目标阱提供所述核苷酸读取试剂。
29.根据权利要求28所述的方法,还包括通过使所述流控设备从所述多个阱中剥离不需要的酶,并使所述阱激活设备提供带电标签来控制所述核苷酸读取试剂的酶的定位。
30.根据权利要求20至29中任一项或更多项所述的方法,其中使用所述阱激活设备包括:
使用所述阱激活设备的电释放机构来产生电压以将阱修改为可写阱,以及
使用所述阱激活设备的光子释放机构来产生光子能量以将阱修改为可写阱,以及
其中所述一组可写阱包括由所述电释放机构修改的阱和由所述光子释放机构修改的阱。
31.根据权利要求20至30中任一项或更多项所述的方法,其中操作所述阱激活设备包括:
操作所述阱激活设备的电润湿设备,以将流体从所述流控设备输送到所述多个阱,以及
在同时测序和合成操作期间:
向所述多个阱中的第一阱提供所述核苷酸读取试剂的液滴,以及
向所述多个阱中的第二阱提供所述核苷酸写入试剂的液滴,其中所述第一阱和所述第二阱相邻。
32.根据权利要求20至31中任一项或更多项所述的方法,还包括在所述合成操作期间:
将一组数据转换成一组核苷酸,
基于所述一组核苷酸在所述一组可写阱的第一阱中合成第一多核苷酸链,以及
基于所述一组核苷酸在所述一组可写阱的第二阱中合成第二多核苷酸链,其中当正确合成时,所述第一多核苷酸链和所述第二多核苷酸链是相同的。
33.根据权利要求32所述的方法,还包括用所述测序设备对所述第一多核苷酸链和所述第二多核苷酸链进行测序,并且当所述第一多核苷酸链和所述第二多核苷酸链不相同时,提供合成错误的指示。
34.根据权利要求32至33中任一项或更多项所述的方法,还包括操作空间光调制器以经由所述测序接口将相同的光学图案投射到所述第一阱和所述第二阱上,其中所述相同的光学图案用于并行地合成第一多核苷酸链和第二多核苷酸链。
35.根据权利要求20至34中任一项或更多项所述的方法,还包括在所述合成操作期间:
将一组数据转换成一组核苷酸,
基于所述一组核苷酸的第一部分,在所述一组可写阱的第一阱中合成第一多核苷酸链,以及
与合成所述第一多核苷酸链并行地,基于所述一组核苷酸的第二部分在所述一组可写阱的第二阱中合成第二多核苷酸链,其中所述第一多核苷酸链和所述第二多核苷酸链共同代表所述一组核苷酸的整体。
36.根据权利要求20至35中任一项或更多项所述的方法,还包括在所述合成操作期间:
将一组数据转换成一组核苷酸,
基于所述一组核苷酸在所述一组可写阱的第一阱中合成第一多核苷酸链,
基于所述一组核苷酸在所述第一阱中合成第二多核苷酸链,其中当正确合成时,所述第一多核苷酸链和所述第二多核苷酸链是相同的,
基于所述一组核苷酸产生链散列值,以及
合成所述第一多核苷酸链和所述第二多核苷酸链以添加所述链散列值。
37.根据权利要求36所述的方法,还包括,在所述测序操作期间:
用所述测序设备对所述第一阱中的第一多核苷酸链和第二多核苷酸链进行测序,以确定每个多核苷酸链的测序的一组核苷酸和测序散列值,
在所述第一多核苷酸链和所述第二多核苷酸链的测序的一组核苷酸不相同的情况下,提供合成错误的指示,
基于所述测序的一组核苷酸确定所述第一多核苷酸链和所述第二多核苷酸链中每一多核苷酸链的后续散列值,以及
当所述第一多核苷酸链或所述第二多核苷酸链的测序散列值与所述测序的一组核苷酸的后续散列值不匹配时,提供散列值不匹配的指示。
38.一种用于非易失性存储的系统,包括:
存储控制器,其包括处理器和存储器;
存储设备,其包括:
流通池,其包括具有从所述流通池的第一表面可进入的开口侧的多个阱,其中所述阱适于容纳多核苷酸,
流控接口,以及
测序接口;
流控设备,其用于向所述流通池的第一表面提供一种或更多种流体,其中所述一种或更多种流体包括核苷酸写入试剂和核苷酸读取试剂;
测序设备,其用于通过所述测序接口对所述多个阱内的多核苷酸进行测序并确定核苷酸;和
高速缓存存储器,其包括电子存储器,用于存储排队以被编码成一组核苷酸并在所述多个阱中合成为多核苷酸的数据。
39.根据权利要求38所述的系统,其中所述高速缓存存储器位于所述存储设备中,并且其中所述存储设备是可移除存储设备。
40.根据权利要求38至39中任一项或更多项所述的系统,其中所述高速缓存存储器存储以下中的一项或更多项:
一组文件索引,其描述作为多核苷酸存储在所述多个阱中的数据的名称和位置,以及
一组校验和值,其可用于验证作为多核苷酸存储在所述多个阱中的数据的完整性。
41.根据权利要求38至40中任一项或更多项所述的系统,其中所述存储控制器:
接收要作为所述多个阱中的多核苷酸写入所述存储设备的一组输入数据,
接收从存储在所述多个阱中的多核苷酸读取输出数据的请求,
基于所述存储设备最近是从所述流控设备接收到所述核苷酸写入试剂还是所述核苷酸读取试剂来确定所述存储设备是处于写入模式还是读取模式,
在所述存储设备处于所述写入模式的情况下,在读取所述输出数据之前写入所述一组输入数据,以及
在所述存储设备处于所述读取模式的情况下,将所述一组输入数据存储在所述高速缓存存储器上,并在写入所述一组输入数据之前读取所述输出数据。
42.根据权利要求38至41中任一项或更多项所述的系统,还包括电润湿设备,所述电润湿设备定位在所述第一表面附近,并且将流体从所述流控设备输送到所述多个阱中的任何阱中,其中所述存储控制器:
操作所述电润湿设备以向所述多个阱中的第一阱提供所述核苷酸读取试剂的液滴,从而能够对存储在其中的多核苷酸进行测序,
在向所述第一阱提供所述核苷酸读取试剂的液滴的同时,基于对输出数据的多个请求,识别最接近所述第一阱定位的第二阱,以及
操作所述电润湿设备以向所述多个阱中的第二阱提供所述核苷酸读取试剂的液滴的一部分,从而对存储在其中的多核苷酸进行测序。
43.根据权利要求38至42中任一项或更多项所述的系统,其中所述存储控制器:
基于对输出数据的过去请求,确定所述多个阱中被最频繁测序的子集,
操作所述测序设备对所述多个阱的所述子集进行测序,并产生描述存储在所述多个阱的所述子集内的多核苷酸的一组核苷酸,
将所述一组核苷酸转换成一组数字数据,
将所述一组数字数据存储在所述高速缓存存储器中,以及
响应后续请求,从所述高速缓存存储器中提供所述一组数字数据。
44.一种用于非易失性存储的系统,包括:
存储控制器,其包括处理器和存储器;
存储设备,其包括:
包含第一多个阱的第一流通池,其中所述第一多个阱适于容纳多核苷酸,
包含第二多个阱的第二流通池,其中所述第二多个阱适于容纳多核苷酸,
流控接口,以及
测序接口;
流控设备,其用于向所述第一多个阱和所述第二多个阱提供一种或更多种流体,其中所述一种或更多种流体包括核苷酸写入试剂和核苷酸读取试剂;和
测序设备,其用于通过所述测序接口对第一多个阱和第二多个阱内的多核苷酸进行测序并确定核苷酸;
其中,当处于镜像模式时,所述存储控制器:
将一组数据转换成一组核苷酸,并且
基于所述一组数据,操作所述流控设备以在所述第一多个阱和所述第二多个阱中产生相同的多核苷酸。
45.根据权利要求44所述的系统,还包括空间光调制器,以经由所述测序接口将光学图案投射到所述第一流通池和所述第二流通池上,其中所述存储控制器操作所述空间光调制器,以将相同的光学图案投射到所述第一多个阱的第一阱和所述第二多个阱的第二阱中,从而合成第一多核苷酸链和第二多核苷酸链。
46.根据权利要求44至45中任一项或更多项所述的系统,其中,当处于专用模式时,所述存储控制器:
将所述一组数据转换成一组核苷酸,
指定所述第一多个阱用于写入数据和指定所述第二多个阱用于读取数据,
基于所述一组数据操作所述流控设备以在所述第一多个阱中产生多核苷酸,以及
基于输出请求操作所述流控设备和所述测序设备以对所述第二多个阱中的多核苷酸进行测序。
47.根据权利要求46所述的系统,其中所述存储控制器:
确定没有当前输出请求,并且
从所述专用模式切换到所述镜像模式。
48.一种操作存储设备的方法,包括:
生成一个或更多个命令以将规定数据写入与存储设备中的特定位置相关联的多核苷酸;
读取所述多核苷酸;
进行比较,其中所述比较将存储在所述存储设备中的多核苷酸与存储在非核苷酸存储器中的特定质量控制值进行比较;和
基于所述比较,确定所述存储设备中的所述特定位置是否将被视为具有损坏的数据。
49.根据权利要求48所述的方法,其中读取所述多核苷酸、执行所述比较以及确定所述存储设备中的特定位置是否将被视为具有损坏的数据是基于接收到对所述存储设备写入的命令而自动执行的。
50.根据权利要求48至49中任一项或更多项所述的方法,其中所述方法包括:
确定所述存储设备中的所述特定位置将被视为具有损坏的数据;和
基于确定所述存储设备中的所述特定位置将被视为具有损坏的数据,将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置。
51.根据权利要求50所述的方法,其中所述方法包括基于从所述存储设备中的一个或更多个其他位置读取信息来生成所述未损坏数据。
52.根据权利要求50至51中任一项或更多项所述的方法,其中所述方法包括:
基于确定所述存储设备中的所述特定位置将被视为具有损坏的数据,并且在将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置之前,更新所述存储设备的索引以指示所述存储设备中的所述特定位置具有损坏的数据;和
在将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置之后,更新所述存储设备的索引以指示所述存储设备中的所述特定位置没有损坏的数据。
53.根据权利要求48至52中任一项或更多项所述的方法,其中所述方法包括基于所述规定数据生成特定质量控制值。
54.根据权利要求48至53中任一项或更多项所述的方法,其中:
所述存储设备包括多个可寻址位置;
所述特定位置由所述多个可寻址位置组成;
所述非核苷酸存储器存储多个质量控制值;
所述特定质量控制值由所述多个质量控制值组成;和
来自所述多个质量控制值的每个质量控制值与来自所述多个可寻址位置的相应可寻址位置相关联。
55.根据权利要求48至54中任一项或更多项所述的方法,其中:
所述多核苷酸包含检查部分;和
所述方法包括基于所述规定数据生成所述检查部分。
56.根据权利要求8所述的方法,其中所述检查部分是奇偶校验位。
57.根据权利要求55至56中任一项或更多项所述的方法,其中所述检查部分包括所述多核苷酸中核碱基的甲基化或其他信息保留修饰。
58.根据权利要求55至57中任一项或更多项所述的方法,其中所述检查部分编码与所述特定质量控制值匹配的数据。
59.根据权利要求55至58中任一项或更多项所述的方法,其中:
第二多核苷酸被存储在所述存储设备中,其中所述第二多核苷酸包含与所述多核苷酸包含的检查部分相同的第二检查部分;和
所述方法包括基于识别所述第一多核苷酸和所述第二多核苷酸之间的差异,确定所述存储设备中的所述特定位置将被视为具有损坏的数据。
60.根据权利要求48至52中任一项或更多项所述的方法,其中:
所述特定质量控制值是所述规定数据;和
所述比较包括检查存储在所述多核苷酸中的数据和所述规定数据之间是否有任何差异。
61.根据权利要求48-52或60中任一项或更多项所述的方法,其中所述方法包括:
确定所述存储设备中的所述特定位置不应被视为具有损坏的数据;和
基于确定所述存储设备中的所述特定位置不应被视为具有损坏的数据,删除存储在所述非核苷酸存储器中的特定质量控制值。
62.一种系统,包括存储设备,所述存储设备具有存储指令的一个或更多个非暂时性计算机可读介质,所述指令用于所述存储设备执行一种方法,所述方法包括:
生成一个或更多个命令以将规定数据写入与存储设备中的特定位置相关联的多核苷酸;
读取所述多核苷酸;
进行比较,其中所述比较将存储在所述存储设备中的多核苷酸与存储在非核苷酸存储器中的特定质量控制值进行比较;和
基于所述比较,确定所述存储设备中的所述特定位置是否将被视为具有损坏的数据。
63.根据权利要求62所述的系统,其中所述方法还包括:
读取所述多核苷酸;
执行所述比较;和
基于接收到对所述存储设备写入的命令,自动确定所述存储设备中的特定位置是否将被视为具有损坏的数据。
64.根据权利要求62-63中任一项或更多项所述的系统,其中所述方法包括:
确定所述存储设备中的所述特定位置将被视为具有损坏的数据;和
基于确定所述存储设备中的所述特定位置将被视为具有损坏的数据,将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置。
65.根据权利要求64所述的系统,其中所述方法包括基于从所述存储设备中的一个或更多个其他位置读取信息来生成所述未损坏数据。
66.根据权利要求64-65中任一项或更多项所述的系统,其中所述方法包括:
基于确定所述存储设备中的所述特定位置将被视为具有损坏的数据,并且在将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置之前,更新所述存储设备的索引以指示所述存储设备中的所述特定位置具有损坏的数据;和
在将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置之后,更新所述存储设备的索引以指示所述存储设备中的所述特定位置没有损坏的数据。
67.根据权利要求62-66中任一项或更多项所述的系统,其中所述方法包括基于所述规定数据生成所述特定质量控制值。
68.根据权利要求62-67中任一项或更多项所述的系统,其中:
所述存储设备包括多个可寻址位置;
所述特定位置由所述多个可寻址位置组成;
所述非核苷酸存储器存储多个质量控制值;
所述特定质量控制值由所述多个质量控制值组成;和
来自所述多个质量控制值的每个质量控制值与来自所述多个可寻址位置的相应可寻址位置相关联。
69.根据权利要求62-68中任一项或更多项所述的系统,其中:
所述多核苷酸包含检查部分;和
所述方法包括基于所述规定数据生成所述检查部分。
70.根据权利要求69所述的系统,其中所述检查部分是奇偶校验位。
71.根据权利要求69-70中任一项或更多项所述的系统,其中所述检查部分包括所述多核苷酸中核碱基的甲基化或其他信息保留修饰。
72.根据权利要求69-71中任一项或更多项所述的系统,其中所述检查部分编码与所述特定质量控制值匹配的数据。
73.根据权利要求69-72中任一项或更多项所述的系统,其中:
第二多核苷酸被存储在所述存储设备中,其中所述第二多核苷酸包含与所述多核苷酸包含的检查部分相同的第二检查部分;和
所述方法包括基于识别所述第一多核苷酸和所述第二多核苷酸之间的差异,确定所述存储设备中的所述特定位置将被视为具有损坏的数据。
74.根据权利要求62-66中任一项或更多项所述的系统,其中:
所述特定质量控制值是所述规定数据;和
所述比较包括检查存储在所述多核苷酸中的数据和所述规定数据之间是否有任何差异。
75.根据权利要求62-66或74中任一项或更多项所述的系统,其中所述方法包括:
确定所述存储设备中的所述特定位置不应被视为具有损坏的数据;和
基于确定所述存储设备中的所述特定位置不应被视为具有损坏的数据,删除存储在所述非核苷酸存储器中的特定质量控制值。
76.一个或更多个非暂时性计算机可读介质,其存储用于存储设备执行方法的指令,所述方法包括:
生成一个或更多个命令以将规定数据写入与存储设备中的特定位置相关联的多核苷酸;
读取所述多核苷酸;
进行比较,其中所述比较将存储在所述存储设备中的多核苷酸与存储在非核苷酸存储器中的特定质量控制值进行比较;和
基于所述比较,确定所述存储设备中的所述特定位置是否将被视为具有损坏的数据。
77.根据权利要求76所述的计算机可读介质,其中所述方法还包括:
读取所述多核苷酸;
执行所述比较;和
基于接收到对所述存储设备写入的命令,自动确定所述存储设备中的特定位置是否将被视为具有损坏的数据。
78.根据权利要求76-77中任一项或更多项所述的计算机可读介质,其中所述方法包括:
确定所述存储设备中的所述特定位置将被视为具有损坏的数据;和
基于确定所述存储设备中的所述特定位置将被视为具有损坏的数据,将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置。
79.根据权利要求78所述的计算机可读介质,其中所述方法包括基于从所述存储设备中的一个或更多个其他位置读取信息来生成所述未损坏数据。
80.根据权利要求78-79中任一项或更多项所述的计算机可读介质,其中所述方法包括:
基于确定所述存储设备中的所述特定位置将被视为具有损坏的数据,并且在将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置之前,更新所述存储设备的索引以指示所述存储设备中的所述特定位置具有损坏的数据;和
在将编码未损坏数据的新多核苷酸写入所述存储设备中的所述特定位置之后,更新所述存储设备的索引以指示所述存储设备中的所述特定位置没有损坏的数据。
81.根据权利要求76-80中任一项或更多项所述的计算机可读介质,其中所述方法包括基于所述规定数据生成所述特定质量控制值。
82.根据权利要求76-81中任一项或更多项所述的计算机可读介质,其中:
所述存储设备包括多个可寻址位置;
所述特定位置由所述多个可寻址位置组成;
所述非核苷酸存储器存储多个质量控制值;
所述特定质量控制值由所述多个质量控制值组成;和
来自所述多个质量控制值的每个质量控制值与来自所述多个可寻址位置的相应可寻址位置相关联。
83.根据权利要求76-82中任一项或更多项所述的计算机可读介质,其中:
所述多核苷酸包含检查部分;和
所述方法包括基于所述规定数据生成所述检查部分。
84.根据权利要求83所述的计算机可读介质,其中所述检查部分是奇偶校验位。
85.根据权利要求83-84中任一项或更多项所述的计算机可读介质,其中所述检查部分包括所述多核苷酸中核碱基的甲基化或其他信息保留修饰。
86.根据权利要求83-85中任一项或更多项所述的计算机可读介质,其中所述检查部分编码与所述特定质量控制值匹配的数据。
87.根据权利要求83-90中任一项或更多项所述的计算机可读介质,其中:
第二多核苷酸被存储在所述存储设备中,其中所述第二多核苷酸包含与所述多核苷酸包含的检查部分相同的第二检查部分;和
所述方法包括基于识别所述第一多核苷酸和所述第二多核苷酸之间的差异,确定所述存储设备中的所述特定位置将被视为具有损坏的数据。
88.根据权利要求76-80中任一项或更多项所述的计算机可读介质,其中:
所述特定质量控制值是所述规定数据;和
所述比较包括检查存储在所述多核苷酸中的数据和所述规定数据之间是否有任何差异。
89.根据权利要求76-80或92中任一项或更多项所述的计算机可读介质,其中所述方法包括:
确定所述存储设备中的所述特定位置不应被视为具有损坏的数据;和
基于确定所述存储设备中的所述特定位置不应被视为具有损坏的数据,删除存储在所述非核苷酸存储器中的特定质量控制值。
CN202080003492.3A 2019-05-31 2020-05-26 用于存储的系统和方法 Pending CN112703558A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962855682P 2019-05-31 2019-05-31
US201962855610P 2019-05-31 2019-05-31
US62/855,682 2019-05-31
US62/855,610 2019-05-31
PCT/US2020/034517 WO2020243076A1 (en) 2019-05-31 2020-05-26 System and method for storage

Publications (1)

Publication Number Publication Date
CN112703558A true CN112703558A (zh) 2021-04-23

Family

ID=73554152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080003492.3A Pending CN112703558A (zh) 2019-05-31 2020-05-26 用于存储的系统和方法

Country Status (5)

Country Link
US (2) US11590505B2 (zh)
EP (1) EP3977455A4 (zh)
CN (1) CN112703558A (zh)
SG (1) SG11202012810TA (zh)
WO (1) WO2020243076A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210382888A1 (en) * 2020-06-08 2021-12-09 Mongodb, Inc. Hedged reads
WO2022183121A1 (en) 2021-02-26 2022-09-01 Avery Digital Data, Inc. Semiconductor chip devices and methods for polynucleotide synthesis
US20220280281A1 (en) * 2021-03-05 2022-09-08 Mentor Worldwide Llc Systems, devices and methods of making prosthetic implants having self-sealing membranes for closing punctures and preventing leaks
CN114200151A (zh) * 2022-02-17 2022-03-18 宁波海壹生物科技有限公司 一种全自动化学发光免疫分析仪管理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787032A (en) * 1991-11-07 1998-07-28 Nanogen Deoxyribonucleic acid(DNA) optical storage using non-radiative energy transfer between a donor group, an acceptor group and a quencher group
CN1273609A (zh) * 1997-08-15 2000-11-15 希斯克有限公司 检测或量化核酸物类的方法和组合物
US20140051584A1 (en) * 2010-10-27 2014-02-20 Life Technologies Corporation Methods and Apparatuses for Estimating Parameters in a Predictive Model for Use in Sequencing-by-Synthesis
US20140267669A1 (en) * 2013-03-15 2014-09-18 Intelligent Bio-Systems, Inc. Flow cell alignment methods and systems
US20160110499A1 (en) * 2014-10-21 2016-04-21 Life Technologies Corporation Methods, systems, and computer-readable media for blind deconvolution dephasing of nucleic acid sequencing data

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
AU2012262364B2 (en) * 2011-05-27 2016-02-11 Sequencing Health, Inc. Systems and methods for genetic and biological analysis
EP3981886A1 (en) 2011-09-23 2022-04-13 Illumina, Inc. Compositions for nucleic acid sequencing
US8906320B1 (en) 2012-04-16 2014-12-09 Illumina, Inc. Biosensors for biological or chemical analysis and systems and methods for same
CN104520864B (zh) 2012-06-01 2017-09-05 欧洲分子生物学实验室 Dna中数字信息的高容量存储
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
NL2017959B1 (en) 2016-12-08 2018-06-19 Illumina Inc Cartridge assembly
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
US20140274747A1 (en) * 2013-03-15 2014-09-18 Illumina, Inc. Super resolution imaging
NZ720871A (en) * 2013-12-10 2020-03-27 Illumina Inc Biosensors for biological or chemical analysis and methods of manufacturing the same
EP3792921A1 (en) * 2013-12-11 2021-03-17 Genapsys, Inc. Systems and methods for biological analysis and computation
WO2017087823A1 (en) * 2015-11-18 2017-05-26 Mir Kalim U Super-resolution sequencing
CA3043887A1 (en) * 2016-11-16 2018-05-24 Catalog Technologies, Inc. Nucleic acid-based data storage

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787032A (en) * 1991-11-07 1998-07-28 Nanogen Deoxyribonucleic acid(DNA) optical storage using non-radiative energy transfer between a donor group, an acceptor group and a quencher group
CN1273609A (zh) * 1997-08-15 2000-11-15 希斯克有限公司 检测或量化核酸物类的方法和组合物
US20140051584A1 (en) * 2010-10-27 2014-02-20 Life Technologies Corporation Methods and Apparatuses for Estimating Parameters in a Predictive Model for Use in Sequencing-by-Synthesis
US20140267669A1 (en) * 2013-03-15 2014-09-18 Intelligent Bio-Systems, Inc. Flow cell alignment methods and systems
US20160110499A1 (en) * 2014-10-21 2016-04-21 Life Technologies Corporation Methods, systems, and computer-readable media for blind deconvolution dephasing of nucleic acid sequencing data

Also Published As

Publication number Publication date
EP3977455A4 (en) 2023-07-12
US20210146354A1 (en) 2021-05-20
US11590505B2 (en) 2023-02-28
US20230285974A1 (en) 2023-09-14
WO2020243076A1 (en) 2020-12-03
EP3977455A1 (en) 2022-04-06
SG11202012810TA (en) 2021-01-28

Similar Documents

Publication Publication Date Title
US11590505B2 (en) System and method for storage
US11867672B2 (en) Flow cell with one or more barrier features
US11282588B2 (en) Storage device, system, and method
US11453003B2 (en) Flow cell with selective deposition or activation of nucleotides
US20210147833A1 (en) Systems and methods for information storage and retrieval using flow cells
US20240060954A1 (en) Obtaining information from a biological sample in a flow cell
KR20240027608A (ko) 유기체 서열을 사용하여 훈련된 자체-학습 염기 호출자
CN117501372A (zh) 使用生物体序列训练的自学碱基检出器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination