CN111886339A - 多核苷酸合成方法、试剂盒和系统 - Google Patents
多核苷酸合成方法、试剂盒和系统 Download PDFInfo
- Publication number
- CN111886339A CN111886339A CN201980011491.0A CN201980011491A CN111886339A CN 111886339 A CN111886339 A CN 111886339A CN 201980011491 A CN201980011491 A CN 201980011491A CN 111886339 A CN111886339 A CN 111886339A
- Authority
- CN
- China
- Prior art keywords
- molecule
- feeder
- nanopore
- nucleotide
- transfer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及用于合成具有预定义的如核苷酸等单元序列的聚合物,具体地是多核苷酸分子的新体外方法。为了合成多核苷酸分子,所述方法涉及用转移核苷酸延伸多核苷酸合成分子的过程。所述方法另外涉及多次重复延伸过程以用多个转移核苷酸迭代地延伸所述多核苷酸分子,以便产生具有预定义的核苷酸序列的新多核苷酸分子。本发明还涉及在合成后接合多个合成多核苷酸以形成更大的合成多核苷酸的体外方法以及用于执行本发明的延伸、合成和组装方法的装置和系统。
Description
技术领域
本发明涉及用于合成具有预定义的如核苷酸等单元序列的聚合物,具体地多核苷酸分子的新方法。为了合成多核苷酸分子,所述方法涉及用转移核苷酸延伸多核苷酸合成分子的过程。所述方法另外涉及多次重复延伸过程以用多个转移核苷酸迭代地延伸所述多核苷酸分子,以便产生具有预定义的核苷酸序列的新多核苷酸分子。本发明还涉及在合成后接合多个合成多核苷酸以形成更大的合成多核苷酸的方法,以及用于执行本发明的延伸、合成和组装方法的装置和系统。
背景技术
存在用于合成和组装多核苷酸分子,特别是DNA的两种主要方法。
亚磷酰胺化学是通过逐步过程将化学活化的T、C、A或G的单体组装成长度为大约100/150个碱基的寡核苷酸的合成方法。化学反应步骤是高度敏感的,并且条件在完全无水(完全不存在水)、水性氧化和酸性条件之间交替(Roy和Caruthers,《分子(Molecules),2013,18,14268-14284》)。如果来自先前反应步骤的试剂尚未完全去除,则这将不利于未来的合成步骤。因此,此合成方法限于产生长度为大约100个核苷酸的多核苷酸。
聚合酶合成方法使用聚合酶使用T、C、A和G三磷酸合成与DNA模板的互补链。反应条件是水性的和温和的,并且此方法可以用于合成长度为数千个碱基的DNA多核苷酸。此方法的主要缺点是单链和双链DNA不能通过此方法从头合成,其需要从中制备拷贝的DNA模板。(Kosuri和Church,《自然方法(Nature Methods)》,2014,11,499-507)。
因此,先前的方法不能用于在没有拷贝的预先存在的模板分子的帮助下从头合成双链DNA。
发明人开发了新的方法,可以通过所述方法以逐步方式从头合成单链和双链多核苷酸分子,而无需拷贝预先存在的模板分子。所述方法提供了用于掺入到多核苷酸链中的核苷酸分子的受控递送。不需要洗涤周期或封闭化学(blocking chemisty)。此类方法还避免了与亚磷酰胺化学技术相关的极端条件,并且相比之下所述方法在中性pH附近的温和水性条件下进行。此类方法还使得能够从头合成单链或双链多核苷酸分子与当前合成方法具有>100聚体的核苷酸长度到全基因组相比具有潜在的108改进,在合成生物学中提供了广泛的可能应用。
发明内容
在一方面,本发明提供了一种用转移核苷酸延伸多核苷酸合成分子的方法,所述方法包括延伸过程,所述延伸过程包括:使所述转移核苷酸通过纳米孔的通道从基质的顺式侧移动到反式侧,所述纳米孔安置在所述基质中;以及使所述转移核苷酸与在邻近所述纳米孔的所述基质的所述反式侧上提供的酶接触,此时所述酶催化所述转移核苷酸向所述多核苷酸合成分子转移,由此延伸所述多核苷酸合成分子。
在用本文所描述和定义的转移核苷酸延伸多核苷酸合成分子的任何方法中,转移核苷酸可以是未封闭的核苷酸。
所述转移核苷酸可以连接到饲养分子,并且其中所述转移核苷酸在掺入到所述多核苷酸合成分子中之前从所述饲养分子裂解。转移核苷酸可以在掺入到多核苷酸合成分子中之前由酶裂解。转移核苷酸可以在掺入到多核苷酸合成分子中之前光裂解。
在一个实施例中,一种用根据本发明所述的转移核苷酸延伸多核苷酸合成分子的方法优选地包括延伸过程,所述延伸过程包括:
A.提供包括纳米孔的基质,其中所述纳米孔包括允许流体从所述基质的所述顺式侧流到所述反式侧的通道;在所述基质的所述顺式侧处提供饲养分子,所述饲养分子具有连接的转移核苷酸;在邻近所述纳米孔的所述基质的所述反式侧上提供彼此接近的酶和所述多核苷酸合成分子;以及
B.使所述饲养分子移动通过所述纳米孔,以使所述连接的转移核苷酸与所述酶接触,此时所述酶催化所述转移核苷酸向所述多核苷酸合成分子转移,由此延伸所述多核苷酸合成分子。
以上所定义的这种方法可以进一步包括:
C.在所述转移核苷酸向所述多核苷酸合成分子转移之后,使所述饲养分子移动通过所述纳米孔到达所述基质的所述顺式侧或所述反式侧。
在另一个实施例中,一种用根据本发明所述的转移核苷酸延伸多核苷酸合成分子的方法可以包括延伸过程,所述延伸过程包括:
A.提供包括纳米孔的基质,其中所述纳米孔包括允许流体从所述基质的所述顺式侧流到所述反式侧的通道;在所述基质的所述顺式侧处提供转移核苷酸;在邻近所述纳米孔的所述基质的所述反式侧上提供彼此接近的酶和所述多核苷酸合成分子;以及
B.使所述转移核苷酸移动通过所述纳米孔,以使所述转移核苷酸与所述酶接触,此时所述酶催化所述转移核苷酸向所述多核苷酸合成分子加成,由此延伸所述多核苷酸合成分子。
所述基质的所述顺式侧可以包括转移核苷酸在所述相同反应体积中的混合物,其中所述混合物包括不同转移核苷酸的群体。
可以执行第一验证过程以测定所述转移核苷酸的同一性和/或完整性,其中:
a)如果测定所述转移核苷酸是所述期望转移核苷酸,则使所述转移核苷酸移动以使所述转移核苷酸与所述酶接触;或
b)如果测定所述转移核苷酸不是所述期望转移核苷酸:
i.则使所述转移核苷酸移动到所述基质的所述顺式侧或所述反式侧;
ii.使转移核苷酸从所述基质的所述顺式侧处的所述转移核苷酸的混合物朝着所述反式侧移动到所述纳米孔中;并且
iii.重复所述第一验证过程,直到测定所述转移核苷酸是所述期望转移核苷酸为止,之后将所述转移核苷酸移动以使所述转移核苷酸与所述酶接触。
在本文所描述和定义的任何多核苷酸延伸方法中,可以提供具有邻近所述酶的近端和远端的所述多核苷酸合成分子,其中所述酶催化所述转移核苷酸向所述多核苷酸合成分子的所述近端的加成。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,可以在具有不同连接的转移核苷酸的基质的顺式侧处提供饲养分子。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,所述基质的所述顺式侧可以包括饲养分子在相同反应体积中的混合物,其中所述混合物包括饲养分子的不同群体,其中群体中的每个饲养分子具有连接的相同转移核苷酸,并且其中饲养分子的所述不同群体具有连接的不同转移核苷酸。在任何这种方法中,具有不同连接的转移核苷酸的饲养分子可以是可区分的。例如,饲养分子可以能够提供可标识信号以唯一地标识所述连接的转移核苷酸和/或测定所述连接的转移核苷酸的完整性。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,所述延伸过程可以包括执行第一验证过程以测定所述饲养分子的所述转移核苷酸的同一性和/或完整性,其中:
a)如果测定所述饲养分子具有连接的期望转移核苷酸,则将所述饲养分子移动以使所述转移核苷酸与所述酶接触;或
b)如果测定所述饲养分子不具有连接的所述期望转移核苷酸:
i.则使所述饲养分子往回移动到所述基质的所述顺式侧;
ii.使饲养分子从所述基质的所述顺式侧处的所述饲养分子的混合物朝着所述反式侧移动到所述纳米孔中;并且
iii.重复所述第一验证过程,直到测定所述饲养分子具有连接的所述期望转移核苷酸为止,之后将所述饲养分子移动以使所述转移核苷酸与所述酶接触。
在任何这种方法中,可以执行所述第一验证过程,同时所述饲养分子至少部分地处于所述纳米孔的所述通道内。
在另一个实施例中,所述基质的所述顺式侧可以包括转移核苷酸在所述相同反应体积中的混合物,其中所述混合物包括未连接到饲养分子的不同转移核苷酸的群体。此类方法可以包括执行第一验证过程以测定所述转移核苷酸的同一性和/或完整性,其中:
a)如果测定所述转移核苷酸是所述期望转移核苷酸,则使所述转移核苷酸移动以使所述转移核苷酸与所述酶接触;或
b)如果测定所述转移核苷酸不是所述期望转移核苷酸:
i.则使所述转移核苷酸移动到所述基质的所述顺式侧或所述反式侧;
ii.使转移核苷酸从所述基质的所述顺式侧处的所述转移核苷酸的混合物朝着所述反式侧移动到所述纳米孔中;并且
iii.重复所述第一验证过程,直到测定所述转移核苷酸是所述期望转移核苷酸为止,之后将所述转移核苷酸移动以使所述转移核苷酸与所述酶接触。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,当所述转移核苷酸不再连接到饲养分子时,所述饲养分子可以能够提供不同的可标识信号。可以执行所述第一验证过程,同时所述饲养分子至少部分地处于所述纳米孔的所述通道内。当所述转移核苷酸不再连接到饲养分子时,所述饲养分子可能能够提供不同的可标识信号。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,可以仅在第二验证过程之后执行步骤(C),所述第二验证过程被执行以验证所述酶已经催化所述转移核苷酸从所述饲养分子转移到所述多核苷酸合成分子,其中所述第二验证过程包括:
I.使所述饲养分子在顺式方向上移动通过所述纳米孔,并测定所述转移核苷酸的核碱基的存在或不存在;
II.如果测定所述转移核苷酸的所述核碱基连接到所述饲养分子,则使所述饲养分子在反式方向上往回移动以使所述核苷酸与所述酶接触;以及
III.重复步骤(I)和(II),直到测定所述期望转移核苷酸已经从所述饲养分子去除为止。
在本文所描述和定义的任何多核苷酸延伸方法中,所述核碱基的同一性和/或完整性和/或连接到所述饲养分子的所述转移核苷酸的存在或不存在可以通过测量所述饲养分子来测定。所述转移核苷酸的所述核碱基的同一性和/或完整性可以通过测量所述转移核苷酸来测定。所述饲养分子或所述转移核苷酸的测量可以是相对于所述纳米孔进行的。优选地,所述饲养分子或所述转移核苷酸是在施加在所述基质两端的电势差的作用下通过测量流过所述纳米孔的离子电流来测量的。在任何这种方法中,流过所述纳米孔的所述离子电流的变化取决于所述核苷酸的所述核碱基的存在和/或结构,并且由此提供所述可标识信号以唯一地标识所述转移核苷酸和/或测定所述转移核苷酸的不存在、存在和/或完整性。可替代地,和/或另外,在涉及饲养分子的任何这种方法中,流过所述纳米孔的所述离子电流的变化取决于与所述饲养分子(条形码)成一体的预定义的核碱基序列的存在,并且由此提供所述可标识信号以唯一地标识所述转移核苷酸。在涉及测量流过纳米孔的离子电流的任何这种方法中,测量优选地包括测量流过所述纳米孔的所述离子电流的幅值的变化。
在本文所描述和定义的任何多核苷酸延伸方法中,所述转移核苷酸的同一性和/或结构可以是预定义的。
在本文所描述和定义的任何多核苷酸延伸方法中,所述纳米孔可以是生物纳米孔,如蛋白质纳米孔;合成纳米孔,如DNA折纸纳米孔;固态纳米孔,如设置在固态基质中的孔口;或混合纳米孔,其包括安置在固态基质内的生物纳米孔或合成纳米孔。
在本文所描述和定义的任何多核苷酸延伸方法中,所述纳米孔的内部宽度可以介于约0.5nm到>约10nm之间,优选地0.5nm到3nm。
在本文所描述和定义的任何多核苷酸延伸方法中,所述纳米孔可以是生物纳米孔并且可以包括细胞溶素A(ClyA)或Phi29门户蛋白。所述纳米孔可以包括Curli生产组装/转运组分(CsgG)、α-溶血素、耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白A(MspA)、胞溶素、气单胞菌溶素、细胞毒素K(cytk)或海葵孔蛋白草莓海葵毒素C(actinoporinfragaceatoxin C,FraC)。
在本文所描述和定义的任何多核苷酸延伸方法中,可以在邻近所述纳米孔的所述基质的所述反式侧上以在溶液中游离的形式提供所述酶。
在本文所描述和定义的任何多核苷酸延伸方法中,所述酶可以连接到所述纳米孔;任选地通过基因融合,使得所述纳米孔和所述酶通过一个或多个共价键、通过一个或多个接头或通过亲和力相互作用或通过连接方法的任何组合成为融合蛋白。
在本文所描述和定义的任何多核苷酸延伸方法中,可以提供具有拴系到所述酶的近端的所述多核苷酸合成分子。
在本文所描述和定义的任何多核苷酸延伸方法中,所述多核苷酸合成分子可以包括DNA或RNA,即所述多核苷酸合成分子可以延伸以形成包括DNA或RNA的多核苷酸分子。
在本文所描述和定义的任何多核苷酸延伸方法中,所述多核苷酸合成分子可以与多核苷酸支架分子杂交以形成双链多核苷酸分子。在任何这种方法中,所述支架分子可以是环状多核苷酸分子。在任何这种方法中,所述支架分子可以拴系到所述酶;任选地其中所述多核苷酸合成分子通过与所述支架分子杂交而间接地拴系到所述酶。在任何这种方法中,所述支架多核苷酸分子可以包括序列,所述序列包括一个或多个通用核碱基,如肌苷;任选地其中所述支架多核苷酸分子包括多肌苷序列。
在本文所描述和定义的任何多核苷酸延伸方法中,所述酶可以是DNA引导的DNA聚合酶。所述多核苷酸合成分子可以延伸以形成包括DNA或RNA,优选地DNA的多核苷酸分子。在任何这种方法中,DNA引导的DNA聚合酶可以缺乏3'到5'核酸外切酶活性和/或可以缺乏5'到3'核酸外切酶活性和/或可以具有链置换活性。
在本文所描述和定义的任何多核苷酸延伸方法中,所述转移核苷酸可以作为包括核碱基、核糖和三个或更多个磷酸基的分子提供。
在本文所描述和定义的任何多核苷酸延伸方法中,所述核苷酸可以是脱氧核苷酸三磷酸(dNTP),如dATP、dTTP、dCTP或dGTP或经过修饰的dNTP,如经过修饰的dATP、经过修饰的dTTP、经过修饰的dCTP和/或经过修饰的dGTP。
在本文所描述和定义的任何多核苷酸延伸方法中,所述酶可以是DNA引导的DNA聚合酶,并且其中所述多核苷酸合成分子可以延伸以形成包括RNA或DNA,优选地RNA的多核苷酸分子。在本文所描述和定义的任何多核苷酸延伸方法中,所述多核苷酸延伸核苷酸可以是核苷酸三磷酸(NTP),如ATP、TTP、CTP或GTP或经过修饰的NTP,如经过修饰的ATP、经过修饰的TTP、经过修饰的CTP和/或经过修饰的GTP。
在另一个实施例中,在本文所描述和定义的多核苷酸延伸方法中,所述多核苷酸合成分子可以是单链多核苷酸分子。在这种方法中,酶具有不依赖模板的酶活性,如不依赖模板的聚合酶或转移酶活性。所述酶可以具有末端转移酶活性,例如其中所述酶是末端核苷酸转移酶、polλ、polμ或Φ29DNA聚合酶,并且所述多核苷酸合成分子可以延伸以形成包括DNA或RNA,优选地DNA的多核苷酸分子。在这种方法中,所述酶可以是末端脱氧核苷酸转移酶,并且其中所述多核苷酸合成分子延伸以形成包括DNA或RNA,优选地DNA的多核苷酸分子。
在本文所描述和定义的任何多核苷酸延伸方法中,可以提供具有掺入经过修饰的或非天然的核碱基的能力的酶。
在本文所描述和定义的任何多核苷酸延伸方法中,所述饲养分子可以包括包含以下的分子:DNA、RNA、肽核酸(PNA)、锁核酸(LNA)、解锁核酸(UNA)、桥接核酸(BNA)、甘油核酸(GNA)、苏糖核酸(TNA)、吗啉代、硫代磷酸酯核酸、甲基膦酸酯核酸、肽、寡肽、多肽、聚合物或其任何组合。
在本文所描述和定义的任何多核苷酸延伸方法中,所述酶可以在多核苷酸合成分子的3'端处催化所述多核苷酸合成分子的延伸。
在本文所描述和定义的任何多核苷酸延伸方法中,核苷酸可以在饲养分子的末端处或在沿所述饲养分子的长度的位置处连接到饲养分子。
在本文所描述和定义的任何多核苷酸延伸方法中,所述饲养分子可以包括带负电荷的前导分子,例如包括一个或多个C3间隔区的前导分子。
在本文所描述和定义的任何多核苷酸延伸方法中,转移核苷酸可以通过接头连接到饲养分子。在任何这种方法中,所述接头可以包括包含一个磷酸基的磷酸基接头或包含两个、三个或更多个磷酸基的多磷酸基接头。所述接头可以包括烃链,例如包括2到20个或更多个碳原子的烃链,任选地包括亚烷基,例如,C2-20亚烷基的烃链。所述接头可以具有以下结构:
所述接头可以包括聚合物,例如聚醚聚合物,如聚乙二醇(PEG)。
在本文所描述和定义的任何多核苷酸延伸方法中,所述饲养分子可以包括能够唯一地标识饲养分子和与其连接的转移核苷酸的类型的核苷酸序列(条形码)。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,所述饲养分子可以包括一个或多个封闭部分,其中在所述饲养分子上的位置处提供封闭部分,使得在所述饲养分子移动到纳米孔中到达所述纳米孔中的所关注的位置时,所述封闭部分起到抑制所述饲养分子在所述反式方向上进一步易位的作用,任选地其中一个或多个封闭部分包括可逆的封闭部分。在任何这种方法中,所述一个或多个封闭部分可以沿所述饲养分子的所述长度提供和/或可以在所述饲养分子的末端处提供和/或可以作为所述饲养分子的整体部分提供。在任何这种方法中,封闭部分可以是连接到所述饲养分子的分子,任选地其中封闭部分是肽、寡肽、多肽、蛋白质或其它聚合物。在任何这种方法中,所述封闭部分可以通过一个或多个共价键、通过亲和力相互作用或通过一个或多个接头连接到所述饲养分子。封闭部分可以是包括链霉亲和素或辣根过氧化物酶(HP)的蛋白质。封闭部分可以包括所述饲养分子的一部分,例如封闭部分可以包括在所述饲养分子内形成的二级或三级结构的一部分。所述二级结构的一部分可以包括所述饲养分子的双链区、核酸双螺旋区、核酸茎环结构(发夹)区、核酸十字形或假结结构、未配对核苷酸的环状区、核酸凸起区、四链体区、交联核酸区或其任何组合。
在本文所描述和定义的任何多核苷酸延伸方法中,例如当转移核苷酸包括多个核苷酸时,封闭部分可以连接到转移核苷酸或形成转移核苷酸的一部分。在任何这种方法中,封闭部分可以以与本文关于连接到饲养分子的封闭部分所描述和定义的任何相同方式结构化,并且可以以与本文关于连接到饲养分子的封闭部分所描述和定义的任何相同方式起作用。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,饲养分子可以进一步包括一个或多个饲养分子拴系部分;其中在捕获所述饲养分子并且将其易位到所述纳米孔中之前,饲养分子拴系部分可逆地将饲养分子拴系到所述基质。饲养分子拴系部分可以包括疏水分子。饲养分子拴系部分可以包括脂质分子,任选地固醇分子,如胆固醇。
在本文所描述和定义的涉及一个或多个封闭部分的任何多核苷酸延伸方法中,所述方法可以包括在所述反式方向上使所述纳米孔中的所述饲养分子移动到所述纳米孔中的所关注的第一位置,此时所述封闭部分起到抑制所述饲养分子的进一步易位的作用;并且进一步包括在去除所述封闭部分时、或在所述封闭部分的构象改变时和/或在所述饲养分子的构象改变时,在所述反式方向上使所述纳米孔中的所述饲养分子移动到所述纳米孔中的一个或多个所关注的第二位置。任何这种方法可以进一步包括在在重新连接封闭部分时或在封闭部分的所述构象改变时和/或在所述饲养分子的所述构象改变时,在所述顺式方向上使所述饲养分子通过所述纳米孔往回移动到所述所关注的第一位置或到所关注的第三位置。在任何这种方法中,所述所关注的第一位置或第三位置可以是所述纳米孔中的不足以使所述转移核苷酸接触所述酶的位置,并且其中所述所关注的第二位置中的至少一个是所述纳米孔中的足以使所述转移核苷酸与所述酶接触的位置。在这种方法的一个实例中,所述饲养分子可以包括核酸,所述核酸提供有包括所述饲养分子的双链区的至少一个可逆的封闭部分,所述方法进一步包括使所述纳米孔中的所述饲养分子移动到所述所关注的第一位置,此时所述双链区起到抑制所述饲养分子在所述反式方向上的进一步易位的作用;并且其中所述饲养分子经受使所述双链区的链在所述区内或在所述区的至少一部分内分离的条件,此时所述饲养分子进一步易位到所关注的第二位置。
在本文所描述和定义的涉及饲养分子和第一验证过程的任何多核苷酸延伸方法中,当所述饲养分子在所述纳米孔中移动到所述所关注的第一位置时,可以执行所述第一验证过程。在任何这种方法中,当所述饲养分子处于所关注的第二位置时,所述饲养分子可以经受使所述双链区的所述链在所述区内或在所述区的至少一部分内再粘接的条件,此时所述饲养分子在所述纳米孔中在所述顺式方向上往回移动到所述所关注的第一位置或第三位置。在任何这种方法中,在所述饲养分子在所述顺式方向上往回移动到所述纳米孔中的所述所关注的第一位置或第三位置时,可以执行所述第二验证过程。
在本文所描述和定义的涉及饲养分子的任何多核苷酸延伸方法中,所述方法可以优选地包括通过在所述基质两端施加电势差来使所述纳米孔中的所述饲养分子移动,优选地其中所述电势差是电压(V)。在任何这种方法中,通过改变在所述基质两端施加的电势差,优选地改变电压来控制在所述基质的所述反式方向上使饲养分子移动到纳米孔中、在所述反式方向上使饲养分子移动到所关注的第一位置以及在所述反式方向上使饲养分子移动到所关注的第二位置的步骤。在任何这种方法中,通过改变在所述基质两端施加的电势差,优选地改变电压来控制在所述顺式方向上使饲养分子从所关注的第二位置往回移动到所关注的第一位置或所关注的第三位置的步骤以及使所述饲养分子移出所述纳米孔并且往回移动到所述基质的所述顺式侧的步骤。
在本文所描述和定义的任何多核苷酸延伸方法中,可以通过改变在所述基质两端施加的电势差,优选地改变电压的作用来控制可逆的封闭部分的作用。
在本文所描述和定义的任何多核苷酸延伸方法中,所述纳米孔可以偶联到饲养分子处理部分,所述饲养分子处理部分促进所述饲养分子移动到所述纳米孔中并通过所述纳米孔,并且其中所述延伸过程包括使所述饲养分子与所述饲养分子处理部分接触以及使所述饲养分子移动到所述纳米孔中并通过所述纳米孔。所述饲养分子处理部分可以是例如聚合酶、核酸酶、解旋酶或拓扑异构酶,如旋转酶。所述饲养分子处理部分可以是phi29 DNA聚合酶、T7 DNA聚合酶、His 1DNA聚合酶、His 2DNA聚合酶、芽孢杆菌噬菌体M2 DNA聚合酶、链球菌噬菌体CPI DNA聚合酶、肠杆菌噬菌体PRD1 DNA聚合酶或其任何变体或衍生物。在任何这种方法中,所述纳米孔可以通过基因融合偶联到饲养分子处理部分,使得所述纳米孔和所述饲养分子处理部分通过一个或多个共价键、通过一个或多个接头或通过亲和力相互作用成为融合蛋白。
在本文所描述和定义的任何多核苷酸延伸方法中,所述纳米孔可以偶联到一个或多个纳米孔衔接子部分;其中与在不存在衔接子部分的情况下的效率相比,所述衔接子部分增加了所述纳米孔与所述饲养分子之间相互作用的效率。在任何这种方法中,所述纳米孔衔接子部分可以是环状分子,任选地其中所述衔接子是七聚体的或六聚体的。所述纳米孔衔接子部分可以是例如环糊精或其衍生物,其任选地选自由以下组成的组:γ-环糊精(γ-CD)、β-环糊精(β-CD)、6-单脱氧-6-单氨基-β-环糊精(am1β-CD)、七-6-氨基-β-环糊精(am7-β-CD)、七-(6-脱氧-6-胍基)-环糊精(gu7-β-CD)、α-环糊精(α-CD)。在任何这种方法中,所述纳米孔可以通过基因融合偶联到纳米孔衔接子部分,使得所述纳米孔和所述纳米孔衔接子部分通过一个或多个共价键、通过一个或多个接头或通过亲和力相互作用成为融合蛋白。
在本文所描述和定义的任何多核苷酸延伸方法中,所述基质可以包括包含两亲分子的膜。
在本文所描述和定义的任何多核苷酸延伸方法中,所述基质可以包括包含两亲分子的膜,所述两亲分子包括嵌段共聚物。
在本文所描述和定义的任何多核苷酸延伸方法中,所述基质可以包括固态基质。所述纳米孔可以包括在固态基质中形成的孔口。
在本文所描述和定义的任何多核苷酸延伸方法中,所述纳米孔可以是混合纳米孔,所述混合纳米孔包括安置在固态基质中或安置在形成于固态基质中的孔口中的生物纳米孔或合成纳米孔,优选地其中所述纳米孔是例如如本文所描述或定义的任何生物纳米孔或合成纳米孔。
在本文所描述和定义的任何多核苷酸延伸方法中,所述延伸过程可以是第一延伸过程,并且其中所述方法进一步包括重复所述延伸过程一次或多次以用一个或多个另外的转移核苷酸进一步延伸所述多核苷酸合成分子。
在本文所描述和定义的任何多核苷酸延伸方法中,所述延伸过程可以进一步包括使用所述多核苷酸合成分子作为模板来合成互补多核苷酸分子的步骤,由此形成包括与所述互补多核苷酸分子杂交的所述多核苷酸合成分子的双链多核苷酸分子。
在本文所描述和定义的任何多核苷酸延伸方法中,所述延伸过程可以进一步包括优选地通过聚合酶链反应(PCR)扩增合成的双链多核苷酸分子的步骤。
在本文所描述和定义的任何多核苷酸延伸方法中,所述方法可以进一步包括将双链多核苷酸分子与任选地使用不同纳米孔合成的另一个双链多核苷酸分子连接的步骤,任选地其中在扩增一个或多个合成的双链多核苷酸分子的步骤之后执行所述连接步骤。在本文所描述和定义的任何多核苷酸延伸方法中,所述方法可以进一步包括将单链多核苷酸分子与任选地使用不同纳米孔合成的另一个单链多核苷酸分子连接的步骤,任选地其中在扩增一个或多个合成的单链多核苷酸分子的步骤之后执行所述连接步骤。
在本文所描述和定义的任何多核苷酸延伸方法中,纳米孔可以定位于系统的反应室内,其中所述系统包括纳米孔的阵列,其中所述基质将所述反应室分成顺式反应室部分和反式反应室部分,其中每个纳米孔提供通过所述基质从所述顺式反应室部分到所述反式反应室部分的通道。在任何这种方法中,所述反式反应室部分可以包括彼此流体隔离的反式室的阵列,其中每个反式室通过包括所述纳米孔的基质与所述顺式室分开;其中能够在不同的反式反应室中合成不同序列的多核苷酸合成分子,并且其中能够独立地控制施加在每个反式反应室和所述顺式反应室两端的电势差。在任何这些方法中,顺式反应室部分可以是单个室,并且对于分开的反式反应室部分中的每个反式反应室部分可以是共用的。在任何这些方法中,顺式反应室部分和/或反式反应室部分可以是液滴,任选地包括油包水液滴。液滴可以是电介质上电润湿系统(EWOD)的组件或可以是微流体系统的组件。在任何这些方法中,可以通过饲养分子递送通道(如管,例如碳纳米管)向纳米孔提供饲养分子。
在本文所描述和定义的任何多核苷酸延伸方法中,纳米孔可以偶联到包括以下的电子装置:隧穿电极(tunnelling electrode)、场效应晶体管(FET)装置或互补金属氧化物半导体(CMOS)装置。
本文所描述和定义的任何多核苷酸延伸方法优选地是体外方法。
在另一方面,本发明提供了一种用于执行本文所描述和定义的任何合成方法的多核苷酸合成系统,所述系统包括:
(a)反应室的阵列,所述反应室各自包括纳米孔,其中所述反应室彼此流体隔离;并且其中每个反应室包括包含纳米孔的基质,并且其中所述基质将所述反应室分成顺式反应室部分和反式反应室部分,其中顺式反应室部分和反式反应室部分通过所述纳米孔中的通道彼此流体连通;其中每个反应室进一步包括在邻近所述纳米孔的所述基质的所述反式侧上彼此接近的酶和多核苷酸合成分子;
(b)用于将任选地连接到饲养分子的转移核苷酸递送到顺式反应室部分中的装置,任选地其中每个顺式反应室部分进一步包括一个或多个递送通道,所述一个或多个递送通道被配置成向所述纳米孔递送转移核苷酸;
(c)用于在每个反应室的所述基质两端提供电压的装置;优选地电极,并且其中所述基质安置在阳极与阴极之间;以及
(d)用于检测流过每个反应室的所述纳米孔的离子电流的装置,优选地施加到所述纳米孔或与其邻近的电极。
在任何这种系统中,顺式反应室部分和/或反式反应室部分可以是液滴,任选地包括油包水液滴,例如其中所述基质包括不同液滴之间的界面,并且其中所述纳米孔安置在允许液滴之间连通的所述基质内。在任何这种系统中,液滴可以是电介质上电润湿系统(EWOD)或微流体系统的组件。
在另一方面,本发明提供了一种用于与本文所描述和定义的任何系统一起使用并且用于执行本文所描述和定义的任何延伸方法的试剂盒,所述试剂盒包括反应试剂的体积,所述反应试剂包括任选地连接到饲养分子的转移核苷酸,所述试剂盒任选地进一步包括用于组装反应单元的试剂,所述反应单元包括安置在基质中的纳米孔,任选地酶和任选地多核苷酸合成分子,所述试剂盒进一步任选地包括阵列,所述阵列包括用于组装反应单元的反应室。
附图说明
图1示出了展示本发明的方法的特征的简化示例概述。
图2示出了支架分子介导的合成和无支架分子合成的示例概述。
图3描绘了示例支架分子的用途。
图4描绘了示例饲养分子。
图5示出了饲养分子的实例以及在本发明方法中的用途。
图6示出了通过接头连接到饲养分子的转移核苷酸。
图7提供了对施加到饲养分子的封闭部分的描绘。
图8提供了对施加到饲养分子的封闭部分的描绘。
图9示出了向饲养分子提供的封闭部分的一些示例性布置。
图10描绘了根据纳米孔的尺寸定制饲养分子的设计的要求。
图11描绘了用于饲养分子拴系部分的一些示例性布置。
图12描绘了使用验证过程的本发明的方法的延伸过程的实例。
图13描绘了反应单元的实例。
图14描绘了包括电压偏置和数据处理装置的反应单元的实例。
图15描绘了用于使用本发明的方法执行合成反应的电压控制循环的实例。
图16示出了展示本发明的方法的特征的简化示例概述。
图17示出了展示本发明的涉及连接的方法的特征的简化示例概述。
图18示出了展示本发明的涉及连接的方法的特征的进一步简化示例概述。
图19示出了将多核苷酸合成分子连接到纳米孔的示例概述。
图20示出了饲养分子的实例。
图21示出了根据本发明的涉及连接的方法的示例概述。
图22示出了纳米孔中的饲养分子的分级控制(stepped control)的示例概述。
图23示出了根据本发明的涉及连接的方法的进一步示例概述。
图24示出了根据本发明的涉及连接的方法的进一步示例概述。
具体实施方式
本发明涉及用于合成具有预定义的核苷酸序列的多核苷酸分子的新方法。所述方法涉及用转移核苷酸延伸多核苷酸合成分子的过程。所述方法另外涉及重复延伸过程多次以用多个转移核苷酸迭代地延伸多核苷酸合成分子以产生具有预定义的核苷酸序列的新多核苷酸分子。
图1示出了展示实施本发明的方法的一种方式的简化的非限制性示例性概述。提供了具有连接的转移核苷酸的饲养分子。饲养分子通过放置在基质中的纳米孔从基质的顺式侧移动到基质的反式侧。最初在基质的顺式侧上提供转移核苷酸。然后,将核苷酸移动到基质的反式侧并与在基质的反式侧上提供的酶接触,如聚合酶、连接酶或末端转移酶,此时所述酶催化核苷酸向多核苷酸合成分子的转移以完成延伸过程。可以执行延伸过程的循环以产生合成的多核苷酸分子。
优选使用饲养分子来促进纳米孔中的核苷酸的移动。然而,如本文进一步所描述的,核苷酸可以可控制地移动通过纳米孔而无需连接到饲养分子。
本发明还涉及在通过本发明的方法合成后组装合成的多核苷酸的方法,以及用于执行本发明的延伸、合成和组装方法的装置和系统。
在本发明的方法中,延伸过程不需要拷贝预先存在的模板多核苷酸分子。本发明还涉及存储数据的方法。在一方面,本发明涉及通过产生指示数字信息位的“0”和“1”状态的核苷酸序列来将数字形式的数据存储在多核苷酸分子中的方法。通过重复这些方法,有可能在多核苷酸分子中产生多个信息位。可替代地,由于在多核苷酸分子中掺入至少四种不同碱基的能力,所以可以使用除了二进制之外的系统(例如,碱基-3或碱基-4)来编码数字信息。
另外,在本发明的方法中,延伸过程不需要包括封闭基团、保护基团或可逆终止子基团的转移核苷酸的加成。在掺入下一个转移核苷酸之前,不需要去保护步骤。因此,在本文所描述和定义的任何合成方法中,转移核苷酸可以是未封闭的核苷酸,其中所述核苷酸不包括保护基团、可逆终止子基团或可以通过酶(如聚合酶、连接酶或末端转移酶)抑制进一步延伸的任何其它功能。
除了缺少对模板的要求之外,与当前的多核苷酸合成方法相比,本发明提供了若干个另外的优点。例如,不需要将核苷酸分成相同物种的组。不同核苷酸可以作为异质混合物提供,并且可以在掺入之前选择期望的核苷酸。因此,可以提供单个反应体积以容纳合成所需的所有试剂。洗涤步骤或用于试剂交换的步骤是不必要的。可以实施过程以验证待掺入的核苷酸的完整性,从而减少对高纯度样品的最初提供的需要。可以检测和消除受损或缺失的碱基。所述方法提供了在多反应体积系统中在个体基础上分别寻址包括纳米孔的每个反应体积的可能性,从而提供了反应体积的异步控制,使得每个反应体积可以产生具有不同序列的不同多核苷酸。所述方法提供了多核苷酸分子的高速合成的可能性,例如0.1-1核苷酸/秒(360-3600核苷酸/小时)。因此,本发明提供了显著简化的合成方案。
在本文中更详细描述了本发明的特征。
酶
本发明涉及用转移核苷酸延伸多核苷酸合成分子的方法。贯穿本公开的全部,参考在任何给定的合成循环中用“一个”转移核苷酸延伸多核苷酸合成分子或加成“一个”转移核苷酸还涵盖在同一合成循环中同时以二聚体或聚合形式用两个或多个转移核苷酸延伸多核苷酸合成分子。类似地,以单数形式使用词语“核碱基”还同时包含两个或更多个核碱基。在本发明的方法中,这种延伸是通过酶的作用实现的。
所述酶应该能够催化包括核苷酸向多核苷酸合成分子的加成的反应。通常,但不排他地,所加成的核苷酸是包括糖基、磷酸基和核碱基的分子。通常,所加成的核苷酸是核苷单磷酸。本文进一步定义了核苷酸。条件是所述酶能够催化此反应,可以使用任何合适的酶。因此,可以应用于本发明的任何方法的酶包含聚合酶、核苷酸转移酶和连接酶,以及其任何酶片段、衍生物、类似物或功能等同物,条件是所需核苷酸延伸功能被保存在所述酶中。定向进化技术、常规筛选、合理或半合理工程化/诱变方法或任何其它合适的方法可以用于改变任何此酶以提供和/或优化所需核苷酸延伸功能。
能够延伸单链多核苷酸合成分子的酶
在本发明的一些方法中,多核苷酸合成分子是单链多核苷酸分子,如本文进一步所描述的。
可利用能够通过核苷酸向合成分子的加成来延伸单链多核苷酸合成分子的酶。这包含具有不依赖模板的酶活性的酶,如不依赖模板的聚合酶或不依赖模板的转移酶活性或不依赖模板的连接酶活性。这些酶中的任何一种酶可以用于本发明的方法中,例如其中需要延伸单链多核苷酸合成分子。
一种此优选的酶是末端核苷酸转移酶,如末端脱氧核苷酸转移酶(TdT)(参见例如,Motea等人,2010;Minhaz Ud-Dean,《合成系统生物技术(Syst.Synth.Biol.)》,2008,2(3-4),67-73)。TdT能够催化来自核苷三磷酸基质(NTP或dNTP)的核苷酸分子(核苷单磷酸)向多核苷酸合成分子的加成。TdT能够催化天然和非天然核苷酸的加成。其还能够催化核苷酸类似物的加成(Motea等人,2010)。还可以使用Polλ和polμ酶(Ramadan K等人,《分子生物学杂志(J.Mol.Biol.)》,2004,339(2),395-404),如可以使用Φ29DNA聚合酶。
本领域已经广泛讨论了通过末端转移酶(例如,末端脱氧核苷酸转移酶;TdT)的作用在不存在模板的情况下延伸单链多核苷酸分子DNA和RNA两者以产生人工合成的单链多核苷酸分子的技术。这些技术在例如专利申请公开WO2016/034807、WO 2016/128731、WO2016/139477和WO2017/009663,以及US2014/0363852、US2016/0046973、US2016/0108382和US2016/0168611中公开。这些文献描述了通过TdT的作用产生人工合成的单链多核苷酸分子的单链多核苷酸合成分子的受控延伸。描述了使用这种酶通过天然和非天然/人工核苷酸的延伸,如通过经过修饰的核苷酸的延伸,例如掺入封闭基团的核苷酸的延伸。这些文献中公开的任何末端转移酶及其任何酶片段、衍生物、类似物或功能等同物均可以应用于本发明的方法中,条件是末端转移酶功能被保存在所述酶中。定向进化技术、常规筛选、合理或半合理工程化/诱变方法或任何其它合适的方法可以用于改变任何此酶以提供和/或优化所需功能。可以使用能够在不使用模板的情况下用转移核苷酸延伸单链多核苷酸分子(如包括DNA或RNA的分子)的任何其它酶,例如连接酶。
因此,在本文定义的任何方法中,包括DNA的单链多核苷酸合成分子或包括DNA的多核苷酸合成分子的单链部分可以由酶延伸,所述酶具有不依赖模板的酶活性,如不依赖模板的聚合酶、连接酶或转移酶活性。所述酶可以具有核苷酸转移酶活性,例如脱氧核苷酸转移酶,如末端脱氧核苷酸转移酶(TdT)、polλ、polμ、Φ29DNA聚合酶或其酶片段、衍生物、类似物或功能等同物。通过这种酶的作用延伸的多核苷酸合成分子包括DNA。
在本文定义的任何方法中,包括RNA的单链多核苷酸合成分子或包括RNA的多核苷酸合成分子的单链部分可以由酶延伸,所述酶具有核苷酸转移酶(例如,包含TdT、polλ和polμ)或其酶片段、衍生物、类似物或功能等同物。通过这种酶的作用延伸的多核苷酸合成分子可以包括RNA。对于包括RNA的单链多核苷酸合成分子或包括RNA的多核苷酸合成分子的单链部分的合成,可以使用任何合适的核苷酸转移酶。如聚(U)聚合酶和聚(A)聚合酶等核苷酸转移酶能够向多核苷酸合成分子不依赖模板地添加单磷酸核苷单元。这些酶中的任何一种酶以及其任何酶片段、衍生物、类似物或功能等同物可以应用于本发明的方法中,条件是核苷酸转移酶功能被保存在所述酶中。定向进化技术、常规筛选、合理或半合理工程化/诱变方法或任何其它合适的方法可以用于改变任何此酶以提供和/或优化所需功能。
关于连接酶,可以使用任何合适的连接酶或具有连接酶活性的酶。已经例如由以下对通过DNA连接酶进行的单链DNA的不依赖模板的连接进行描述:Georges,F.等人(《核苷、核苷酸和核酸(Nucleosides,Nucleotides and Nucleic Acids)》,1989,8(8):第1427-1440页)和Kuhn,H.等人(《欧洲联合生化学会杂志(FEBS J.)》2005,272(23):第5991-6000页)。T4 RNA连接酶1(ssRNA连接酶)能够催化单链RNA以及DNA的连接。通过Nichols,N.等人(《分子生物现行方案(Curr Protoc Mol Biol.)》2008,第3章,3.15单元)对一系列RNA连接酶进行描述。因此,用于连接(接合)单链多核苷酸的分子、酶、化学品和方法是技术人员众所周知的。
能够延伸双链多核苷酸合成分子的酶
在本发明的一些方法中,多核苷酸合成分子是双链多核苷酸分子的组分,如本文进一步所描述的。
可利用能够通过核苷酸向双链多核苷酸分子的多核苷酸合成分子的加成来延伸双链多核苷酸分子的一条链(即,多核苷酸合成分子)的酶,如聚合酶和连接酶。这些酶中的任何一种酶以及其任何酶片段、衍生物、类似物或功能等同物可以用于本发明的方法中(其中需要这种延伸),条件是核苷酸延伸功能被保存在所述酶中。定向进化技术、常规筛选、合理或半合理工程化/诱变方法或任何其它合适的方法可以用于改变任何此酶以提供和/或优化所需功能。
对于包括DNA的这种多核苷酸合成分子的延伸,可以使用DNA聚合酶。可以使用任何合适的DNA聚合酶。
DNA聚合酶可以是例如Bst DNA聚合酶全长、Bst DNA聚合酶大片段、Bsu DNA聚合酶大片段、大肠杆菌DNA聚合酶DNA Pol I大(克列诺(Klenow))片段、M-MuLV逆转录酶、phi29 DNA聚合酶、硫化叶菌DNA聚合酶IV、Taq DNA聚合酶、T4 DNA聚合酶、T7 DNA聚合酶和具有逆转录酶活性的酶。
DNA聚合酶可能缺乏3'到5'核酸外切酶活性。可以使用任何这种合适的聚合酶。这种DNA聚合酶可以是例如Bst DNA聚合酶全长、Bst DNA聚合酶大片段、Bsu DNA聚合酶大片段、大肠杆菌DNA聚合酶DNA Pol I大(克列诺)片段、M-MuLV逆转录酶、硫化叶菌DNA聚合酶IV、Taq DNA聚合酶。
DNA聚合酶可以具有链置换活性。可以使用任何这种合适的聚合酶。这种DNA聚合酶可以是例如Bst DNA聚合酶大片段、Bsu DNA聚合酶大片段、大肠杆菌DNA聚合酶DNA PolI大(克列诺)片段、M-MuLV逆转录酶、phi29 DNA聚合酶。
DNA聚合酶可能缺乏3'到5'核酸外切酶活性,并且可以具有链置换活性。可以使用任何这种合适的聚合酶。这种DNA聚合酶可以是例如Bst DNA聚合酶大片段、Bsu DNA聚合酶大片段、大肠杆菌DNA聚合酶DNA Pol I大(克列诺)片段、M-MuLV逆转录酶。
DNA聚合酶可能缺乏5'到3'核酸外切酶活性。可以使用任何这种合适的聚合酶。这种DNA聚合酶可以是例如,
Bst DNA聚合酶大片段、Bsu DNA聚合酶大片段、大肠杆菌DNA聚合酶DNA Pol I大(克列诺)片段、M-MuLV逆转录酶、phi29 DNA聚合酶、硫化叶菌DNA聚合酶IV、T4 DNA聚合酶、T7 DNA聚合酶。
DNA聚合酶可能缺乏3'到5'和5'到3'核酸外切酶活性两者,并且可以具有链置换活性。可以使用任何这种合适的聚合酶。这种DNA聚合酶可以是例如Bst DNA聚合酶大片段、Bsu DNA聚合酶大片段、大肠杆菌DNA聚合酶DNA Pol I大(克列诺)片段、M-MuLV逆转录酶。
DNA聚合酶也可以是经过基因工程化的变体。例如,DNA聚合酶可以是来自高温球菌属(Thermococcus)物种9°N(如物种9°N-7)的天然DNA聚合酶的经过基因工程化的变体。经过修饰的聚合酶的一个这种实例是可从新英格兰生物实验室(New England BioLabs)获得的Therminator IX DNA聚合酶。其它经过工程化或变体DNA聚合酶包含Deep Vent(exo-)、Vent(Exo-)、9°N DNA聚合酶、Therminator DNA聚合酶、克列诺片段(Exo-)、BstDNA聚合酶、Bsu DNA聚合酶、硫化叶菌DNA聚合酶I和Taq聚合酶。
对于包括RNA的这种多核苷酸合成分子的延伸,可以使用任何合适的酶。例如,可以使用RNA聚合酶。可以使用任何合适的RNA聚合酶。
RNA聚合酶可以是T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶、大肠杆菌RNA聚合酶全酶。
关于连接酶,可以使用任何合适的连接酶或具有连接酶活性的酶。连接酶可以是对单碱基突出端基质具有增强的活性的经过修饰的连接酶。连接酶可以是T3 DNA连接酶或T4 DNA连接酶。连接酶可以是平末端TA连接酶(blunt TA ligase)。例如,可从新英格兰生物实验室(NEB)获得平末端TA连接酶。这是T4 DNA连接酶、连接增强子和优化的反应缓冲液的即用型预混合物溶液,其被专门调配以改善平端和单碱基突出端基质两者的连接和转化。用于连接(接合)双链多核苷酸的分子、酶、化学品和方法是技术人员众所周知的。
在本文所描述和定义的任何多核苷酸延伸方法中,所述酶可以在多核苷酸合成分子的3'端处催化所述多核苷酸合成分子的延伸。
除了上述实例之外,可获得根据本发明的方法的能够介导一个或多个核苷酸向多核苷酸合成分子的转移的其它酶。本领域的技术人员将容易地认识到可以使用的具有这种能力的任何酶。此类酶包含但不限于核酸内切酶(包含I型、II型和III型限制性核酸内切酶)、介导基因编辑的酶(如CRISPR,包含CRISPR/Cas核酸内切酶,如CRISPR/Cas9)和CRISPR/Cfp核酸内切酶(如CRISPR/Cfp1)、类转录激活因子效应物核酸(TALEN)酶、锌指核酸酶(ZFN)、异构酶(包含拓扑异构酶)、重组酶(如Cre重组酶、Hin重组酶、Tre重组酶和FLP重组酶)、转座酶和整合酶。
酶与基质的连接
在本发明的方法中,可以在邻近所述纳米孔的所述基质的所述反式侧上以在溶液中游离的形式提供所述酶。此实施例可以通过提供例如其中执行延伸过程的微米或纳米级反应体积来实现,其中微米或纳米级反应体积包括在邻近纳米孔的基质的反式侧处提供的一种或多种酶。这种微米或纳米级反应体积可以包括例如液滴(如油包水液滴)或其它微米或纳米级室(例如,孔或室)作为具有大约约100μm×100μm×100μm尺寸的芯片组件。
在本发明的方法中,优选地提供在邻近纳米孔的基质的反式侧上连接到基质的酶。通过提供连接到基质的酶,预期可以向系统提供更大的控制。
酶可以直接或间接在基质的反式侧上连接到基质。酶可以通过接头在基质的反式侧上连接到基质。酶可以通过反式侧上的纳米孔连接到基质,在这种情况下,所述酶可以优选地通过接头直接连接到纳米孔。
酶可以通过本领域已知的任何合适的方法连接到反式侧上的基质,包含直接连接到纳米孔,条件是所述连接保持酶和纳米孔执行本文所描述的其各自功能的能力。酶可以通过如纳米孔与酶之间的蛋白质:蛋白质相互作用、化学相互作用、共价连接和基因融合的方式连接到基质,包含连接到纳米孔。本文在“接头和连接部分”部分中所描述的任何合适的连接方法可以加上必要的变更而应用于将酶连接到基质(包含连接到纳米孔)的目的。酶可以例如通过如本文所描述的半胱氨酸或点击化学或通过非天然碱(如叠氮化物)直接连接到基质。酶可以通过多核苷酸分子(如DNA、LNA、BNA等)直接连接到基质。在这种情况下,多核苷酸分子可以连接到酶和基质两者,然后所述酶和基质通过多核苷酸分子之间的杂交偶联。
除了如本文所提供的公开内容之外,酶可以直接连接到基质(包含纳米孔)或可以通过接头、通过在例如WO2010/086603、WO2010/004273、WO2010/004265和/或WO 2012/033524中公开的任何合适的方式间接连接到基质(包含纳米孔)。
多核苷酸合成分子
本发明的方法涉及用转移核苷酸延伸多核苷酸合成分子以形成延伸的多核苷酸合成分子的过程。然后可以重复此过程多次以用另外的转移核苷酸进一步延伸多核苷酸合成分子,以形成具有期望长度且具有期望预定义的核苷酸序列的合成多核苷酸分子。
多核苷酸合成分子可以以下形式提供:其中多核苷酸合成分子的一部分连接到可以充当支架分子的另一个分子。支架分子可以是多核苷酸分子或任何其它合适的聚合物,如本文进一步所描述的。支架分子可以是能够与多核苷酸合成分子的全部或一部分杂交以形成支架的多核苷酸分子。
可以提供多核苷酸合成分子而未连接到支架分子。在此类情况下,多核苷酸合成分子通常以单链形式提供。
多核苷酸合成分子可以以以下形式提供:其中多核苷酸合成分子的至少一部分拴系到纳米孔或基质。多核苷酸合成分子可以通过本文所描述和定义的任何合适的方式(包含本文包含在“饲养分子处理部分与基质的连接”部分中所描述的任何连接方法)连接到纳米孔或基质,只要保持如上所述的相关功能和能力。
图2中提供了支架分子介导的合成和无支架分子的合成的示例性非限制性概述。
多核苷酸合成分子可以以各种合适的形式提供。
单链多核苷酸合成分子
在第一延伸过程之前,多核苷酸合成分子可以以单链形式或以基本上单链形式提供。例如,多核苷酸合成分子可以以以下形式提供:其中所述多核苷酸合成分子未与不同多核苷酸分子(如支架分子)杂交或以其它方式与其结合。在此类实施例中,第一延伸过程和随后延伸过程可以包括延伸单链多核苷酸合成分子以形成合成的单链多核苷酸分子。
在基质的反式侧上的酶的附近提供单链多核苷酸合成分子。
所述酶是能够延伸包括核酸的单链分子的单链的任何合适的酶,如本文更详细描述的。这种酶不需要例如使核酸分子与另一个核酸分子杂交以便充当引物,并且因此所述酶可以在不存在支架分子的情况下作用于裸露的未杂交的单链分子。
在第一延伸过程之前,如果酶需要催化延伸过程,则在所述酶附近提供具有3'-OH基团的单链多核苷酸合成分子。
在第一延伸过程之前,单链多核苷酸合成分子可以被提供为长度为六个或更多个核苷酸的寡核苷酸。
优选地,由于酶将天然地与多核苷酸合成分子缔合以便执行其功能的事实,例如充当聚合酶或转移酶等,因此在酶附近提供多核苷酸合成分子。以此方式,不必为酶和/或多核苷酸合成分子提供任何一个或多个特定化学基团或官能团以促进其缔合。
单链多核苷酸合成分子与酶之间的缔合可以任选地通过提供一个或多个偶联部分来提升或促进。偶联部分可以是用于将多核苷酸合成分子拴系到酶的蛋白质、蛋白质复合物、一个或多个化学基团和/或化学复合物。偶联部分可以是本文公开的任何合适的接头。
双链多核苷酸合成分子
在第一延伸过程之前,多核苷酸合成分子可以以双链形式,以基本上双链形式或以包括双链区或部分的形式提供。例如,多核苷酸合成分子可以以以下形式提供:其中所述多核苷酸合成分子与不同多核苷酸分子(例如,支架分子)杂交或以其它方式与其结合以形成双链多核苷酸分子或具有双链区或部分的多核苷酸分子。在此类实施例中,第一延伸过程和随后延伸过程可以包括延伸双链多核苷酸分子的一条链,其中延伸的链是多核苷酸合成分子,从而形成包括延伸的多核苷酸合成分子的合成双链多核苷酸分子。
在基质的反式侧上的酶附近提供包括双链多核苷酸分子或部分的多核苷酸合成分子。
所述酶是能够延伸多核苷酸合成分子的任何合适的酶,其中所述多核苷酸合成分子是包括核酸的双链分子的一条链。为了延伸多核苷酸合成分子,酶(例如,聚合酶)可能需要使多核苷酸合成分子与另一个核酸分子杂交。以此方式,多核苷酸合成分子充当酶的引物,并且所述引物通过酶的正常功能而延伸。
在第一延伸过程之前,如果酶需要催化延伸过程,则在酶附近提供具有3'-OH基团的多核苷酸合成分子,例如多核苷酸合成分子的末端处的3'-OH基团,其中所述多核苷酸合成分子的末端与另一个核酸分子杂交。
在第一延伸过程之前,多核苷酸合成分子可以被提供为长度为六个或更多个核苷酸的寡核苷酸。
优选地,由于酶将天然地与多核苷酸合成分子缔合以便执行其功能的事实,例如充当聚合酶或转移酶等,因此在酶附近提供多核苷酸合成分子。以此方式,不必为酶和/或多核苷酸合成分子提供任何一个或多个特定化学基团或官能团以促进其缔合。
可以通过提供一个或多个偶联部分来提升或促进包括双链多核苷酸分子或其部分的多核苷酸合成分子与酶之间的缔合。偶联部分可以是可以用于将多核苷酸合成分子拴系到酶的蛋白质、蛋白质复合物、一个或多个化学基团和/或化学复合物。偶联部分可以是本文公开的任何合适的接头。
在本发明的方法的一个实施例中,多核苷酸合成分子通过酶(通常是聚合酶)的作用而延伸,所述酶的功能需要将多核苷酸合成分子与另一个核酸分子杂交以便充当酶的引物,并且所述引物通过酶的正常功能而延伸。在此类实施例中,酶的正常功能可以是通过进行另一种核酸分子的“拷贝”来延伸引物。“拷贝”意指从引物延伸的链的新部分的合成,所述引物具有就沃森-克里克(Watson-Crick)碱基配对而言与其它核酸分子的核苷酸序列互补的核苷酸序列。本发明涉及其中多核苷酸合成分子以不依赖模板的方式用期望转移核苷酸延伸的方法。因此,在其中多核苷酸合成分子通过酶(所述酶的功能需要使多核苷酸合成分子与另一个核酸分子杂交以便充当酶的引物)的作用而延伸的实施例中,每个延伸过程使用另一种核酸分子作为支持新合成的链的支架,而不是模板本身,所述模板被“拷贝”以在新合成的链中形成互补的沃森-克里克碱基对。
在一个实施例中,可以充当多核苷酸合成分子的载体的支架多核苷酸分子可以提供有多个通用核苷酸。通用核苷酸能够与多个不同核苷酸进行配对。通用核苷酸可以或可以不与配对的核苷酸形成键。通用核苷酸可以在某种程度上与配对的核苷酸结合。例如,肌苷能够与腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶或胞嘧啶进行配对。通用核苷酸在本文中进一步描述。因此,如果酶(如聚合酶)起到在末端(例如,3'端)延伸多核苷酸合成分子的末端核苷酸的作用,并且杂交的支架多核苷酸分子在“下游”(即,延伸的)方向上在与多核苷酸合成分子的末端相对的下一个核苷酸位置处包括通用核苷酸(如肌苷),则聚合酶将用转移核苷酸向下游延伸多核苷酸合成分子,所述转移核苷酸被饲养分子呈递给酶,不论转移核苷酸含有哪个核碱基。转移核苷酸一旦掺入到多核苷酸合成分子中,然后就将与占据在支架多核苷酸分子中的相反位置的肌苷进行配对。以此方式,在严格的沃森-克里克碱基配对术语中,支架多核苷酸分子的肌苷核苷酸未“拷贝”到延伸的多核苷酸合成分子,而是仅仅“支持”进入的转移核苷酸,所述转移核苷酸通过酶的作用转移到多核苷酸合成分子的末端。
参考图3,仅仅通过说明的方式,如上所述的支架多核苷酸分子可以是环状多核苷酸分子,并且其中所述多核苷酸合成分子或延伸的多核苷酸合成分子或其一部分与所述支架多核苷酸分子的至少一部分杂交,以形成双链分子或形成所述多核苷酸合成分子的双链部分和所述多核苷酸合成分子的单链部分。在此类实施例中,在下一个延伸过程中待延伸的多核苷酸合成分子的末端(通常3'末端)包括在可以被称为例如多核苷酸合成分子的近侧双链区的区中。多核苷酸合成分子的相对端(通常5'末端)可以包括在可以被称为例如多核苷酸合成分子的远侧双链区的区中。或者,多核苷酸合成分子的远侧双链区可以是包括多核苷酸合成分子的双链部分的末端和多核苷酸合成分子的单链部分的起始的区。在此类实施例中,酶在多核苷酸合成分子的近侧双链区中在其末端处延伸多核苷酸合成分子。当酶在近侧双链区中继续延伸多核苷酸合成分子时,由于多核苷酸支架分子的圆度,其可以同时从远侧双链区中的支架分子移位多核苷酸合成分子。以此方式,酶可以“围绕支架分子棘齿”,导致延伸的多核苷酸合成分子的合成链随着单链分子从支架分子远离远侧双链区移位而逐渐延伸。因此,在此类实施例中,酶可以优选地提供有核酸链置换活性。
在第一延伸过程之前提供的多核苷酸合成分子可以作为最终期望的合成多核苷酸分子的一部分被掺入。在这种情况下,在第一延伸过程之前提供的多核苷酸合成分子本身可以包括期望转移核苷酸序列。可替代地,可能期望去除在第一延伸过程之前提供的多核苷酸合成分子的全部或一部分,使得其不成为最终合成多核苷酸分子的一部分。在这种情况下,在第一延伸过程之前提供的多核苷酸合成分子可以包括裂解位点,例如裂解酶(如限制性核酸内切酶)的标识序列。可替代地,这种裂解位点可以作为延伸多核苷酸合成分子的过程的一部分来合成。
因此,在本发明的任何方法中,多核苷酸合成分子可以在第一延伸过程之前提供有裂解位点。本发明的任何方法可以包括重复延伸过程多次以用另外的转移核苷酸进一步延伸多核苷酸合成分子,以便合成包括裂解位点的多核苷酸合成分子,以去除在第一延伸过程之前提供的多核苷酸合成分子或去除其一部分。在本发明的任何方法中,多核苷酸合成分子可以用可裂解的核苷酸延伸。
在本文所描述的所有合成方法中,多核苷酸合成分子在任何给定循环中延伸。然后,这种延伸的多核苷酸合成分子关于下一个合成循环被称为多核苷酸合成分子。因此,术语“多核苷酸合成分子”不旨在排他地指在第一延伸反应之前的分子,而是指在任何给定的合成循环中被延伸的多核苷酸分子的通用术语。
支架分子
支架分子可以包括任何合适的材料,条件是所述支架分子与酶相容并允许酶和所述方法的其它组件执行其各自的功能。
在本发明的任何方法中,支架分子可以包括包含以下的分子:DNA、RNA、肽核酸(PNA)、锁核酸(LNA)、解锁核酸(UNA)、桥接核酸(BNA)、甘油核酸(GNA)、苏糖核酸(TNA)、吗啉代核酸、硫代磷酸酯核酸、甲基膦酸酯核酸、其它核酸、吗啉代、肽、寡肽、多肽或其它聚合物。
支架分子可以由包括以上所描述材料的复合物的分子构成。例如,支架分子可以包括包含多核苷酸的部分和包含另一种不同聚合物的部分。设想材料的任何合适的组合,条件是支架分子能够执行如上所述的其功能。支架分子可以由包括以上材料的任何组合的分子构成。
支架分子可以是线性的或连续的,例如环状的。优选地,支架分子是连续的,例如环状的。
支架分子可以支持包括DNA或RNA的多核苷酸合成分子的延伸。例如,支架分子可以通过使用依赖DNA的DNA聚合酶来支持包括DNA的多核苷酸合成分子的延伸。支架分子可以通过使用依赖DNA的RNA聚合酶来支持包括RNA的多核苷酸合成分子的延伸。
减少酶与多核苷酸合成分子或支架分子的解结合
在本文所定义或描述的任何方法中,用于催化转移核苷酸的掺入的酶可以包括减少或抑制多核苷酸合成分子和/或支架分子与酶的解结合的功能性。提供这种功能性以允许多核苷酸合成分子在转移核苷酸掺入的许多循环中保持拴系到酶。
可以采用用于实现解结合功能的减少的任何合适的方式。
定向进化技术、常规筛选、合理或半合理工程化/诱变方法或任何其它合适的方法可以用于修饰用于催化转移核苷酸的掺入的酶,以提供和/或优化所需解结合功能。
可替代地,可以提供与掺入酶相关的另一种酶或蛋白质,并且如果必要或期望的话,任选地如以上进行修饰以提供所需功能。例如,用于催化转移核苷酸的掺入的酶可以偶联到提供减少的解结合功能的另一种蛋白质或分子。另一种这种酶的实例是解旋酶。
用于通过在多核苷酸分子周围“闭合”酶来修饰蛋白质和酶以提供多核苷酸解结合功能的封闭复合物化学技术是本领域已知的。在WO2014/013260中公开了一个实例。将人工二硫键工程化到酶中也可以提供闭合复合物功能。此类技术可以应用于本发明方法中以增加掺入酶与多核苷酸合成分子之间的结合。解结合功能可以应用于多核苷酸合成分子本身和/或支架分子。
转移核苷酸
用于根据本发明的方法延伸多核苷酸合成分子的核苷酸被称为转移核苷酸。优选地,用于在任何给定循环中延伸多核苷酸合成分子的转移核苷酸是预定义的。换言之,转移核苷酸的同一性是预选的,例如根据需要预选为腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、尿嘧啶或任何其它核苷酸。通过预定义待转移到多核苷酸合成分子的一个、多个或每个核苷酸,有可能合成具有预定义序列的多核苷酸合成分子。
用于根据本发明的方法延伸多核苷酸合成分子的转移核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基通常是杂环的。合适的核碱基包含嘌呤和嘧啶,以及更具体地,腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。糖通常是戊糖。合适的糖包含但不限于核糖和脱氧核糖。核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。
转移核苷酸可以是天然存在的核苷酸。转移核苷酸可以是人工核苷酸(如非天然核苷酸或核苷酸类似物)或通用核苷酸。人工核苷酸可以在碱基、糖或磷酸酯或组合中在结构上进行修饰,并且仍然可以被聚合酶、转移酶或其它酶用于延伸多核苷酸合成分子的目的。
如先前所述,在本发明的任何方法中,参考在任何给定的合成循环中用“一个”转移核苷酸延伸多核苷酸合成分子还涉及在单个转移反应中用多个转移核苷酸延伸多核苷酸合成分子,例如用二核苷酸、三核苷酸等同时延伸多核苷酸合成分子。用于在单个转移反应中用多个核苷酸延伸多核苷酸合成分子的方法和试剂是本领域已知的,如在例如美国申请第US7060440B1号中公开的。此类方法还可以通过使用连接酶来实施,如本文所描述的。
任何以下核苷酸可以用作转移核苷酸以使用本文所描述的本发明的方法延伸多核苷酸合成分子。
天然核苷酸
天然核苷酸可以用于延伸多核苷酸合成分子。天然核苷酸含有天然核碱基、糖和磷酸基。天然核碱基包括腺苷(A)、胸腺嘧啶(T)、尿嘧啶(U)、鸟嘌呤(G)和胞嘧啶(C)。
非天然核苷酸、核苷酸类似物和通用核苷酸
非天然核苷酸也可以用于使用本文所描述的任何方法延伸多核苷酸合成分子。可以使用本文所描述的任何方法掺入任何以下非天然核苷酸、核苷酸类似物、通用核苷酸(包含任何修饰),条件是掺入反应不被不期望地抑制。
非天然核苷酸可以是肽核酸(PNA)、锁核酸(LNA)、解锁核酸(UNA)、桥连核酸(BNA)、甘油核酸(GNA)、苏糖核酸(TNA)、吗啉代核酸、硫代磷酸酯核酸、甲基膦酸酯核酸或其它核酸的核苷酸单元。
非天然核苷酸可以包括经过修饰的糖和/或经过修饰的核碱基。
经过修饰的糖包含但不限于2'-O-甲基核糖。
经过修饰的核碱基包含但不限于甲基化的核碱基。核碱基的甲基化是表观遗传修饰的公认形式,其具有改变基因和其它元件(如微RNA)的表达的能力。核碱基的甲基化发生在离散的基因座处,所述基因座主要是由CpG基序组成的二核苷酸,但也可以在CHH基序(其中H是A、C或T)处发生。通常,在甲基化期间,将甲基添加到胞嘧啶碱基的第五个碳上以产生甲基胞嘧啶。因此,经过修饰的核碱基包含但不限于5-甲基胞嘧啶,如5-羟甲基胞嘧啶(HOMeC)。
本发明的方法可以使用通用核苷酸作为转移核苷酸。通用核苷酸是其中核碱基将在某种程度上与预定义序列的任何核苷酸的核苷碱基结合(例如,氢键)的核苷酸。通用核苷酸优选地是将在某种程度上与包括核苷腺苷(A)、胸腺嘧啶(T)、尿嘧啶(U)、鸟嘌呤(G)和胞嘧啶(C)的核苷酸结合(例如,氢键)的核苷酸。与其它核苷酸相比,通用核苷酸可以更强地与一些核苷酸结合。例如,包括核苷、2'-脱氧肌苷的通用核苷酸(I)将示出I-C>I-A>I-G大约=I-T的配对的优先顺序。
可以使用的可能的通用核苷酸的实例是肌苷或硝基吲哚。通用核苷酸优选地包括以下核碱基之一:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(C6-芳香族环)。通用核苷酸更优选地包括以下核苷之一:2'-脱氧肌苷、肌苷、7-脱氮-2'-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、4-硝基吲哚2'-脱氧核糖核苷、4-硝基吲哚核糖核苷、5-硝基吲哚2'脱氧核糖核苷、5-硝基吲哚核糖核苷、6-硝基吲哚2'脱氧核糖核苷、6-硝基吲哚核糖核苷、3-硝基吡咯2'脱氧核糖核苷、3-硝基吡咯核糖核苷、次黄嘌呤的非环糖类似物、硝基咪唑2'脱氧核糖核苷、硝基咪唑核糖核苷、4-硝基吡唑2'脱氧核糖核苷、4-硝基吡唑核糖核苷、4-硝基苯并咪唑2'脱氧核糖核苷、4-硝基苯并咪唑核糖核苷、5-硝基吲唑2'脱氧核糖核苷、5-硝基吲唑核糖核苷、4-氨基苯并咪唑2'脱氧核糖核苷、4-氨基苯并咪唑核糖核苷、苯基C-核糖核苷或苯基C-2'-脱氧核糖基核苷。
通用碱基的一些实例如下所示:
还可以使用掺入可裂解碱基的通用核苷酸,包含光可裂解碱基和酶可裂解碱基,所述碱基的一些实例如下所示。
光可裂解碱基:
可通过核酸内切酶III裂解的碱基类似物:
可通过甲酰胺基嘧啶DNA糖基化酶(Fpg)裂解的碱基类似物:
可通过8-氧代鸟嘌呤DNA糖基化酶(hOGG1)裂解的碱基类似物:
可通过hNeil1裂解的碱基类似物:
可通过胸腺嘧啶DNA糖基化酶(TDG)裂解的碱基类似物:
可通过人烷基腺嘌呤DNA糖基化酶(hAAG)裂解的碱基类似物:
可通过尿嘧啶DNA糖基化酶裂解的碱基:
可通过人单链选择性单功能的尿嘧啶-DNA糖基化酶(SMUG1)裂解的碱基:
可通过5-甲基胞嘧啶DNA糖基化酶(ROS1)裂解的碱基:
(参见S.S.David,S.D.Williams,《化学综述(Chemical reviews)》1998,98,1221-1262以及M.I.Ponferrada-Marín,T.Roldán-Arjona,R.R.Ariza,《核酸研究(NucleicAcids Res)》2009,37,4264-4274)。
人工核苷酸还包含掺入碱基的核苷酸,如具有其它期望性质(如荧光)的2'-脱氧核苷、α硫代磷酸酯、硫代磷酸酯三磷酸核苷酸、嘌呤或嘧啶缀合物。嘌呤和嘧啶碱基的其它实例包含吡唑并[3,4-d]嘧啶、5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基以及其它烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基以及其它烷基衍生物、2-硫脲嘧啶、2-硫代胸腺嘧啶以及2-硫代胞嘧啶、5-丙炔基尿嘧啶以及胞嘧啶、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫脲嘧啶、8-卤代(例如,8-溴)、8-氨基、8-硫醇、8-硫代烷基、8-羟基以及其它8-取代的腺嘌呤和鸟嘌呤、5-卤代具体地5-溴、5-三氟甲基以及其它5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、脱氮杂鸟嘌呤、7-脱氮杂鸟嘌呤、3-脱氮杂鸟嘌呤、脱氮杂腺嘌呤、7-脱氮杂腺嘌呤、3-脱氮杂腺嘌呤、咪唑并[1,5-a]1,3,5三嗪酮、9-脱氮杂嘌呤、咪唑并[4,5-d]吡嗪、噻唑并[4,5-d]嘧啶、吡嗪-2-酮、1,2,4-三嗪、哒嗪;和1,3,5三嗪。
通常,核苷酸(如以连接饲养分子的形式)将是核苷三磷酸。
通常,所述酶将通过源自核苷三磷酸(任选地连接到饲养分子的核苷三磷酸)的核苷单磷酸单元的加成来催化多核苷酸合成分子的延伸。
因此,在本发明的任何方法中,为了延伸多核苷酸合成分子以形成包括DNA的分子,可以例如通过DNA聚合酶、连接酶或转移酶的作用从dNTP掺入核苷酸。
在本发明的任何方法中,为了延伸多核苷酸合成分子以形成包括RNA的分子,可以例如通过RNA聚合酶、连接酶或转移酶的作用从NTP掺入核苷酸。
可替代地,三磷酸可以被四磷酸或五磷酸(通常为低聚磷酸)取代。这些低聚磷酸可以被其它烷基或酰基取代:
在本文所描述和定义的任何方法中,可以常规地用于掺入dNTP以形成包括DNA的分子的酶也可以用于掺入NTP以形成包括RNA的分子。相反,可以常规地用于掺入NTP以形成包括RNA的分子的酶也可以用于掺入dNTP以形成包括DNA的分子。定向进化技术、常规筛选、合理或半合理工程化/诱变方法或任何其它合适的方法可以用于改变任何此酶以提供和/或优化所需核苷酸掺入功能。
可逆封闭基团
如本文所描述的,本发明的方法不需要通过掺入包括可逆封闭基团的核苷酸,随后在下一个延伸循环之前进行去封闭步骤来延伸多核苷酸合成分子。然而,在某些情况下,可能期望掺入一个或多个核苷酸(其包含包括可逆封闭基团的至少一个核苷酸),以便在期望的点例如在合成期望长度和序列的多核苷酸的循环结束时停止延伸过程,以便防止进一步不期望的掺入。
任何合适的可逆封闭基团可以连接到核苷酸,以防止在给定循环中掺入核苷酸之后酶进一步延伸。在本发明的任何方法中,可逆封闭基团优选地是可逆终止子基团。以下提供了可逆终止子的实例。
炔丙基可逆终止子:
烯丙基可逆终止子:
环辛烯可逆终止子:
氰乙基可逆终止子:
硝基苄基可逆终止子:
二硫化物可逆终止子:
叠氮基甲基可逆终止子:
氨基烷氧基可逆终止子:
具有连接到核碱基的大体积基团(bulky group)的核苷可以用作3'-羟基上的可逆终止子基团的取代基,并且可以封闭进一步掺入。此基团可以通过TCEP或DTT去保护,从而产生天然核苷酸。
为了根据本发明的任何方法合成DNA多核苷酸,经过修饰的核苷可以是3'-O-经过修饰的-2'-脱氧核糖核苷-5'-O-三磷酸。为了根据本发明的任何方法合成RNA多核苷酸,经过修饰的核苷可以是3'-O-经过修饰的-2'-核糖核苷-5'-O-三磷酸。
经过修饰的dNTP可以是3'-O-烯丙基-dNTP和3'-O-叠氮基甲基-dNTP。
3'-O-烯丙基-dNTP如下所示。
3'-O-叠氮基甲基-dNTP如下所示。
如果期望的话,可以使用任何合适的试剂通过去保护步骤去除可逆终止子基团。
去保护试剂可以是三(羧乙基)膦(TCEP)。TCEP可以用于在掺入之后从3'-O-烯丙基-核苷酸(与Pd0结合)和3'-O-叠氮基甲基-核苷酸去除可逆终止子基团。
以下提供了去保护试剂的实例。
炔丙基可逆终止子:
用Pd催化剂—Na2PdCl4、PdCl2处理。
可以使用配体,例如:三苯基膦-3,3',3"-三磺酸三钠盐。
烯丙基可逆终止子:
用Pd催化剂—Na2PdCl4、PdCl2处理。
可以使用配体,例如:三苯基膦-3,3',3"-三磺酸三钠盐。
叠氮基甲基可逆终止子:
通过硫醇(巯基乙醇或二硫苏糖醇)或三(2-羧乙基)膦—TCEP处理。
氰乙基可逆终止子:
通过氟化物—氟化铵、四丁基氯化铵(TBAF)处理。
硝基苄基可逆终止子:
暴露在UV光下
二硫化物可逆终止子:
通过硫醇(巯基乙醇或二硫苏糖醇)或三(2-羧乙基)膦—TCEP处理。
氨基烷氧基可逆终止子:
用亚硝酸盐(NO2 -、HNO2)pH=5.5处理
饲养分子
在本发明的方法中,转移核苷酸移动通过基质中的纳米孔,并通过酶的作用掺入到多核苷酸合成分子中。
在本文所描述和定义的某些实施例中,转移核苷酸可以移动通过纳米孔而不连接到任何其它分子,如饲养分子。在此类方法中,可以通过直接检测纳米孔中的核苷酸以测定转移核苷酸的同一性和/或完整性来执行验证过程。此类方式在例如Clarke等人,《自然纳米技术(Nature Nanotechnology)》,第4卷,第265-270页(2009)中公开。在任何这种方法中,纳米孔可以例如包括内化的分子衔接子,如环糊精。
核苷酸可以可替代地由饲养分子移动通过纳米孔。在此类方法中,在连接到饲养分子的基质的顺式侧上提供核苷酸。然后使饲养分子移动到纳米孔中,使得核苷酸易位到基质的反式侧,并且使得所述核苷酸与酶接触,如本文更详细描述的。“接触”意指使核苷酸足够接近酶,使得所述酶能够催化核苷酸从饲养分子转移到多核苷酸合成分子。因此,饲养分子充当用于将核苷酸从基质的顺式侧移动到反式侧的媒剂。
饲养分子的一部分通过纳米孔从基质的顺式侧到达基质的反式侧。优选地,整个饲养分子不通过纳米孔到达反式侧。相反,饲养分子可以通过纳米孔,使得饲养分子的一部分保持定位于纳米孔内,其中末端和饲养分子的另一部分在基质的反式侧处突出通过纳米孔。因此,通过使用本文所使用的术语“通过”,并不意味着饲养分子必须以其整体通过纳米孔,并跨基质到达反式侧。可以通过一个或多个封闭部分的作用将饲养分子定位于纳米孔内,如本文进一步所描述的。
可以在溶液中游离的基质的顺式侧上提供具有连接的核苷酸的饲养分子。可替代地,饲养分子可以拴系到基质的表面,如本文进一步所描述的,如在国际专利申请公开号WO2012164270中公开的。然后使饲养分子朝向纳米孔移动并到纳米孔中。饲养分子的移动通常是在施加的电势下实现的,通常通过如本文进一步所描述的在基质两端施加电压来实现。在基质两端施加电压导致离子电流流过纳米孔并吸引饲养分子以及其在纳米孔内的捕获,如本文更详细描述的。饲养分子可以作为能够对电荷进行响应并且能够在电控制下移动的带电分子提供。饲养分子优选地由带电材料构成。可替代地,施加的电势可以在纳米孔的通道周围和通道内产生电渗流,其可以用于捕获中性分子。因此,饲养分子可以是不带电的。
饲养分子的尺寸、形式和组成可以变化,条件是饲养分子能够在电控制下移动到纳米孔中和纳米孔内,以便执行如本文所描述的其功能。
在本发明的任何方法中,饲养分子可以包括包含以下的分子:DNA、RNA、肽核酸(PNA)、锁核酸(LNA)、解锁核酸(UNA)、桥接核酸(BNA)、甘油核酸(GNA)、苏糖核酸(TNA)、吗啉代核酸、硫代磷酸酯核酸、甲基膦酸酯核酸、其它核酸、吗啉代、肽、寡肽、多肽或其它聚合物。
饲养分子可以由包括以上所描述材料的复合物的分子构成。例如,饲养分子可以包括包含多核苷酸的部分和包含另一种不同聚合物的部分。设想材料的任何合适的组合,条件是饲养分子能够执行如本文所描述的其功能。饲养分子可以由包括以上材料的任何组合的分子构成。
饲养分子可以是单链的、可以是双链的或可以包括单链区和双链区两者。通常,cDNA、RNA、GNA、TNA或LNA均是单链的。饲养分子可以包括二级或三级结构的区,例如如本文关于封闭部分所描述的。饲养分子可以例如包括发夹结构。
如本文更详细描述的,饲养分子可以提供有通过接头连接到饲养分子的转移核苷酸。在图4和图5中示出了饲养分子的实例以及在本发明方法中的用途。
在优选的实施例中,饲养分子包括包含DNA的多核苷酸分子。
饲养分子通常由以上所描述的任何组合物的寡核苷酸组成或包括所述寡核苷酸。饲养分子可以由任何合适长度的寡核苷酸组成或包括所述寡核苷酸。寡核苷酸的长度可以是10个或更多个核苷酸、11个或更多个核苷酸、12个或更多个核苷酸、13个或更多个核苷酸、14个或更多个核苷酸、15个或更多个核苷酸、16个或更多个核苷酸、17个或更多个核苷酸、18个或更多个核苷酸、19个或更多个核苷酸、20个或更多个核苷酸、21个或更多个核苷酸、22个或更多个核苷酸、23个或更多个核苷酸、24个或更多个核苷酸、25个或更多个核苷酸、26个或更多个核苷酸、27个或更多个核苷酸、28个或更多个核苷酸、29个或更多个核苷酸、30个或更多个核苷酸、40个或更多个核苷酸、50个或更多个核苷酸、60个或更多个核苷酸、70个或更多个核苷酸、18个或更多个核苷酸、90个或更多个核苷酸、100个或更多个核苷酸、110个或更多个核苷酸、120个或更多个核苷酸、130个或更多个核苷酸、140个或更多个核苷酸、150个或更多个核苷酸、160个或更多个核苷酸、170个或更多个核苷酸、180个或更多个核苷酸、190个或更多个核苷酸、200个或更多个核苷酸、210个或更多个核苷酸、220个或更多个核苷酸、230个或更多个核苷酸、240个或更多个核苷酸、250个或更多个核苷酸、260个或更多个核苷酸、270个或更多个核苷酸、280个或更多个核苷酸、290个或更多个核苷酸或300个或更多个核苷酸。
接头和连接部分
在具有连接的核苷酸的基质的顺式侧上提供饲养分子。核苷酸通过本领域已知的任何合适的方式连接到饲养分子。
核苷酸通常作为连接的核苷三磷酸(NTP或dNTP)提供。
核苷酸可以直接连接到饲养分子,如通过核苷三磷酸的第三磷酸基与饲养分子的任何合适的化学基团之间的共价键。
核苷酸可以通过接头连接到饲养分子。可以使用任何合适的接头,条件是其能够允许饲养分子在如本文所描述的控制下移动到纳米孔中和通过纳米孔。接头的选择可以取决于包括饲养分子的材料的选择。
所述接头可以包括包含一个磷酸基的磷酸基接头或包含两个、三个或更多个磷酸基的多磷酸基接头。例如,饲养分子的磷酸基接头可以包括串联连接到核苷三磷酸的三个串联磷酸基的一个或多个磷酸基。
在本发明的任何方法中,接头可以包括烃链。烃链可以包括2到20个或更多个碳原子。烃链可以包括亚烷基,例如C2-20亚烷基。烃链可以任选地被芳基或杂芳基环例如三唑环,例如1,2,3-三唑环中断。烃链可以任选地被酯基(即,–C(O)-O-)或酰胺基(即,-C(O)-N(H)-),优选地酰胺基中断。
接头可以由下式定义:
-R1-X-R2-Y-R3-
其中:
R1、R2和R3是C2-10亚烷基,优选地C3-6亚烷基,
X是芳基或杂芳基环,优选地1,2,3-三唑环,并且
Y是–C(O)-O-或-C(O)-N(H)-,优选地-C(O)-N(H)-基团。
C2-20亚烷基是未取代或取代的二齿部分,其通过从具有2到20个碳原子(除非另有说明)的烃类化合物的相同碳原子去除两个氢原子或从两个不同碳原子各自去除一个氢原子而获得,所述烃类化合物可以是脂肪族或脂环族的并且可以是饱和的、部分不饱和的或完全不饱和的。因此,术语“亚烷基”包含亚类亚烯基、亚炔基、亚环烷基等。亚烷基可以是未取代的或取代的,例如,如以上对于烷基所说明的。通常,取代的亚烷基携带1个、2个或3个取代基,例如1个或2个取代基。在此上下文中,前缀C2-20表示碳原子的数量或碳原子的数量范围。例如,如本文所使用的术语“C2-20亚烷基”涉及具有2到20个碳原子的亚烷基。
芳基是取代或未取代的、单环或双环的芳香族基团,其通常在环部分中含有5到20个碳原子,更通常地5到14个碳原子,优选地6到14个,或例如6到10个或5到10个碳原子。实例包含苯基、萘基、茚基和茚满基。芳基的环原子可以包含一个或多个杂原子(如在杂芳基中)。此杂芳基是取代或未取代的、单环或双环的杂芳族基团,其通常在环部分中含有5到10个原子(包含一个或多个杂原子)(即,其是5到10元环)。
所述接头可以包括以下结构:
核苷酸可以通过本领域已知的任何合适的方法连接到饲养分子,条件是所述连接保持饲养分子移动通过纳米孔以便允许核苷酸接触酶的能力,并且条件是所述连接保持核苷酸充当酶的基质的能力。
核苷酸可以通过如化学相互作用和共价连接等方式连接到饲养分子。本文在“饲养分子处理部分与基质的连接”部分中所描述的任何连接方法可以加上必要的变更而应用于将核苷酸连接到饲养分子的目的,其条件是保持核苷酸和饲养分子的相关功能和能力,如上所述。
除了如本文所提供的公开内容之外,核苷酸可以通过在WO2010/086603、WO2010/004273、WO2010/004265和/或WO 2012/033524中公开的任何合适的方式连接到饲养分子。
接头可以任选地包括一个或多个间隔区分子(单元)。
接头可以包括例如C3间隔区或Sp9间隔区。
接头可以包括例如聚(乙二醇)(PEG)间隔区。
接头可以包括例如聚磷酸酯间隔区。
接头可以包括连接到第一间隔区分子的一个或多个另外的间隔区分子。例如,接头可以包括多个例如C3间隔区分子。
以下示出的是可以用于将核苷酸连接到饲养分子的间隔区分子(C3和Sp9)的一些非限制性实例。
核苷酸与饲养分子的连接点
接头或在不存在接头的情况下的核苷酸本身可以在饲养分子上的任何合适的位置处连接到饲养分子,条件是当饲养分子移动到纳米孔内的合适位置时,核苷酸能够接触酶,如本文所描述的,并且条件是所述连接保持核苷酸充当酶的基质的能力。
接头或核苷酸可以在或接近饲养分子的末端处连接到饲养分子,所述末端是从基质的顺式侧到反式侧通过纳米孔的末端,如图6A中所描绘的。接头或核苷酸可以在沿饲养分子的长度在位置处连接到饲养分子,如图6B所描绘的。
前导分子
通过纳米孔从基质的顺式侧穿过到达反式侧的饲养分子的末端可以包括前导序列或前导分子,特别是在其中接头或核苷酸未连接到饲养分子的末端的实施例中。
前导分子可以帮助促进饲养分子移动到纳米孔中和通过纳米孔的朝向、通过和移动。其可以保护饲养分子的末端并防止不想要的功能作用,如饲养分子的末端与系统的其它组件(如酶和/或多核苷酸合成分子)之间的不期望的反应。
前导分子可以包括任何合适的基团、分子或部分,条件是保持上述功能。
前导分子可以包括烃链。烃链可以包括烷基,例如包括2到20个碳原子,例如C2-20烷基。
所述前导分子可以包括“C3间隔区”,所述间隔区包括3个碳原子(http:// www.idtdna.com/site/Catalog/Modifications/Category/6)。
所述前导分子可以包括聚T DNA。
标识部分
饲养分子可以包括标识部分。标识部分可以提供将饲养分子标识为具有特定特征的能力,例如标识为具有包括特定核碱基(如腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤或尿嘧啶)的连接的核苷酸。
标识部分包括可以测量或检测的特征以便确定其同一性,并且因此标识饲养分子。
标识部分可以是形成饲养分子的一部分的标识基序,如特定的多核苷酸序列。这种序列通常被称为“条形码”序列,并且提供唯一地标识其中包括所述序列的分子的能力。因此,在其中饲养分子可以由包括多核苷酸的分子形成的实施例中,饲养分子可以包括多核苷酸序列标识基序(条形码)。当饲养分子移动通过纳米孔时,充当条形码的多核苷酸基序可以被“读取”,例如被测序。可替代地,条形码可以产生单个唯一电流水平,以便确定饲养分子的同一性。另外,饲养分子可以以分级方式移动通过纳米孔,所述分级方式包括在饲养分子移动通过纳米孔中的一个或多个暂停或停止,以便促进条形码的检测并且因此确定饲养分子的同一性。聚合物通过纳米孔的这种分级移动是本领域已知的,参见例如Derrington,I.M等人,《美国国家科学院院刊(PNAS)》,2010,107(37)16060-16065。
使用纳米孔对多核苷酸分子进行测序是已确定的方法(参见例如WO2016/059427)。这些测序方法可以与本发明的多核苷酸延伸方法组合。
在这些测序方法中,在多核苷酸分子通过纳米孔的易位期间,从包括纳米孔的检测元件进行多核苷酸分子的连续测量。所述系统的一些性质取决于纳米孔中的多核苷酸分子的核苷酸单元,并且对所述性质进行测量。以此方式收集的数据包括测量结果,如离子电流的测量结果,其中序列通过纳米孔的敏感部分的每次易位导致所测量性质的轻微变化。本文进一步描述了出于测定多核苷酸序列的目的,包括纳米孔的检测元件的电操作。
具有包括特定核碱基(如腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤)的连接的核苷酸的饲养分子可以各自提供有多核苷酸序列标识基序(条形码)。饲养分子或其部分通过纳米孔的易位可以允许通过测量关于纳米孔的性质(通常是在施加电势的施加下的离子电流)来测定条形码序列。
向如多核苷酸序列标识基序等饲养分子提供标识部分的系统可以提供实施验证过程的方式,所述验证过程被执行以确定给定的饲养分子是否连接到期望转移核苷酸,如本文进一步所描述的。
除了条形码标识部分之外或作为条形码标识部分的替代物,在纳米孔中产生唯一的电流变化的任何合适的分子可以用于电检测,以便确定饲养分子的同一性。作为另外的实例,标识部分可以是连接到饲养分子的荧光分子。
转移核苷酸的同一性可以在不需要单独的标识部分的情况下确定。在这种情况下,转移核苷酸本身可以在定位于纳米孔内时被直接标识。在转移核苷酸连接到饲养分子时,或在转移核苷酸在不存在饲养分子的情况下移动通过纳米孔时,可以实现此检测。纳米孔内的单个核苷酸的此检测是本领域已知的,参见例如Astier等人,《美国化学学会杂志(J.Am.Chem.Soc.)》,2006,128(5),第1705-1710页。
纳米孔
纳米孔是基质中的任何孔、通道、孔口、洞等或包括基质中的任何孔、通道、孔口、洞等。纳米孔通常具有纳米数量级的大小,其允许如聚合物等分子从其中通过。
纳米孔可以安置在基质内。纳米孔可以是在基质中形成的孔口。纳米孔可以安置在形成于基质中的孔口内。如本文进一步所描述的,基质的存在限定了基质的顺式侧和基质的反式侧。基质的顺式侧和基质的反式侧通常基本上彼此流体隔离,但是其中分子(如离子、核苷酸和聚合物)通过纳米孔的通道从基质的顺式侧到基质的反式侧(并且反之亦然)的移动可以通过在基质两端施加刺激(通常是施加的电势)可控制地允许动。基质的顺式侧在本文中可以被称为顺式室、顺式反应室、顺式部分、顺式反应部分或顺式储存器。类似地,基质的反式侧在本文中可以被称为反式室、反式反应室、反式部分、反式反应部分或反式储存器。
应当理解,术语“顺式”和“反式”在本文中仅用于将包括纳米孔的基质的一侧与基质的另一侧区分开。所述术语可以同样地以相反的朝向使用,条件是保持一致性。
纳米孔允许如核苷酸等聚合物单元在施加的电势的作用下从基质的一侧流到另一侧。纳米孔允许如DNA或RNA等核酸在驱动力(通常是离子电流)下移动通过纳米孔中的通道。在不存在驱动力的情况下,核酸也可以自动地移动通过通道。
可以测量取决于通过纳米孔易位的聚合物单元的性质。所述性质可能与聚合物与纳米孔之间的相互作用相关。聚合物的相互作用可能发生在纳米孔的收缩区。分析系统测量所述性质,产生了取决于聚合物的聚合物单元的测量。优选地,分析系统测量相对于纳米孔的性质,优选地,分析系统对在施加的电势的作用下测量流过所述纳米孔的离子电流。因此,纳米孔被结构化成允许由施加的电势驱动的离子从基质的一侧流到基质的另一侧。
在本文所描述的任何方法中,纳米孔可以是生物纳米孔、固态纳米孔、合成纳米孔或包括固态基质内的生物纳米孔或合成纳米孔的混合纳米孔。
生物纳米孔
生物纳米孔可以是包括多肽或多肽集合的孔。纳米可以是跨膜蛋白孔。
生物纳米孔可以是生物单体或生物寡聚物。纳米孔优选地由若干个重复亚基构成,如6个、7个或8个亚基。纳米孔更优选地是七聚体孔。纳米孔通常包括离子可以流过的桶或通道。纳米孔的亚基通常围绕中心轴线,并且促进跨膜β桶或通道或跨膜α-螺旋束或通道的链。
生物纳米孔可以是跨膜蛋白孔。用于本文所描述的方法中的跨膜蛋白孔可以包括或源自β-桶孔或α-螺旋束孔。纳米孔的桶或通道通常包括促进与聚合物单元(如核苷酸或核酸)相互作用的氨基酸。这些氨基酸优选地位于桶或通道的收缩部附近。纳米孔通常包括一种或多种带正电荷的氨基酸,如精氨酸、赖氨酸或组氨酸。这些氨基酸通常促进纳米孔与聚合物单元(如核苷酸或核酸)之间的相互作用。β-桶孔包括由β-链形成的桶或通道。合适的β-桶孔包含但不限于β-毒素,如α-溶血素、炭疽毒素和杀白细胞素,以及细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌孔蛋白(Msp),例如MspA、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟氏球菌(Neisseria)自转运脂蛋白(NalP)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α-螺旋束孔包含但不限于内膜蛋白和α外膜蛋白,如WZA和ClyA毒素(溶细胞素A(ClyA)门户蛋白)。跨膜孔可以包括或源自Msp或α-溶血素(α-HL)或Phi29门户蛋白。
跨膜孔可以包括或源自Curli生产组装/转运组分(CsgG)、α-溶血素、耻垢分枝杆菌孔蛋白A(MspA)、胞溶素、气单胞菌溶素、细胞毒素K(cytk)或海葵孔蛋白草莓海葵毒素C(FraC)。
合适的跨膜蛋白孔可以源自Msp,优选地源自MspA。这种孔将是寡聚的并且通常包括源自Msp的7个、8个、9个或10个单体。纳米孔可以是源自包括相同单体的Msp的同源寡聚孔。可替代地,纳米孔可以是源自包括不同于其它单体的至少一种单体的Msp的异源寡聚孔。纳米孔还可以包括包含源自Msp的两个或更多个共价连接的单体的一个或多个构建体。合适的孔公开于WO2012/107778中。纳米孔可以源自MspA或其同源物或旁系同源物。
生物孔可以是天然存在的孔或可以是突变孔。通常的孔描述于以下文献中:WO2010/109197;Stoddart D等人,《美国国家科学院院刊》,2009,106(19),第7702-7707页;Stoddart D等人,《德国应用化学会刊(Angew Chem Int Ed Engl.)》2010,49(3),第556-559页;Stoddart D等人,《纳米快报(Nano Lett.)》2010,10(9),第3633-3637页;Butler T等人,《美国国家科学院院刊》,2008,105(52),第20647-20652页;Haque F等人,《今日纳米(Nano Today)》,2013,8(1):第56-74页以及WO2012/107778。
生物孔可以是如在WO2016/059427中所描述的MS-(B1)8或MS-(B2)8。除了突变L88N之外,B2的氨基酸序列与B1的氨基酸序列相同。在WO2016/059427中描述了对MS-(B1)8和MS-(B2)8进行编码的核苷酸序列。
固态、合成和混合纳米孔
纳米孔可以是包括形成于固态基质中的孔口的固态纳米孔。本文中进一步描述了固态基质。
合适的固态纳米孔可以通过已知方法形成,所述方法包含例如在WO2000/79257中描述的方法。
当固态纳米孔是固态基质中的孔口时,可以化学地或以其它方式对孔口进行修改,以增强其作为纳米孔的性质。
在Haque F等人(《今日纳米》,2013,8(1):第56-74页)中所描述的形成于固态基质中的任何纳米孔可以用于本发明方法中。在美国专利第6,464,842号、第WO2003/003446号、第WO2005/061373号、美国专利第7,258,838号、美国专利第7,466,069号、美国专利第7,468,271号和美国专利第7,253,434号中讨论了可以用于本发明方法的其它适合的固态纳米孔及其生产方法。
固态基质可以包括玻璃、硅,如氮化硅(SiN)和/或(SiO2);铝,如氧化铝(Al2O3);钛,如氧化钛(TiO2);铪,如氧化铪(HfO2);石墨烯;以及复合物基质或堆叠结构基质,其包括以上所定义的材料中的两种或更多种材料,如SiO2/SiN/SiO2基质。
纳米孔可以是例如由包含蛋白质、肽、合成有机化合物和核酸的分子形成的合成纳米孔。合成纳米孔可以是例如DNA折纸纳米孔。合成纳米孔是本领域已知的,参见例如Howorka,S.,2017,《自然纳米技术》,12,第619-630页。
纳米孔可以包括在固态基质中形成的孔口,如上所述生物纳米孔或合成纳米孔被插入到所述孔中。这种纳米孔可以被称为如本文进一步描述的混合纳米孔。在本发明的任何方法中,如本文所描述的任何合适的生物纳米孔或合成纳米孔可以与如本文所描述的任何合适的固态基质结合使用。纳米孔可以包括DNA折纸-石墨烯混合纳米孔,参见例如Farimani,A.B.等人,2017,《美国化学学会应用材料与界面(ACSAppl.Mater.Interfaces)》,9(1),第92-100页。
包括纳米孔的装置
由于本发明的方法涉及在如本文所描述的施加的电势的控制下,转移核苷酸(例如,连接到饲养分子的转移核苷酸)移动通过纳米孔,因此在本发明的所有方法中,纳米孔作为包括纳米孔和电控制装置的装置的组件提供。
此外,本发明的方法任选地涉及使用如本文所描述的验证过程来测定例如连接到饲养分子上的核苷酸的同一性和任选地完整性,并且任选地测定存在或不存在例如连接到饲养分子上的核苷酸,以便测定酶是否已经催化了核苷酸向多核苷酸合成分子的转移。如此,在本发明的任何方法中,纳米孔可以作为包括纳米孔、电控制装置和检测装置的检测元件的组件提供,其中所述检测装置可操作以测定例如连接到饲养分子的核苷酸的存在、同一性和任选地完整性。又进一步地,在本发明的任何方法中,可以执行如本文所描述的验证过程,以通过测定多核苷酸序列标识基序(条形码)的序列来测定连接到饲养分子的核苷酸的同一性。如此,在本发明的任何方法中,纳米孔可以作为包括纳米孔、电控制装置和检测装置的检测元件的组件提供,其中所述检测装置可操作以在饲养分子移动通过所述检测元件的纳米孔期间对饲养分子进行连续测量。
本文中进一步描述了包括纳米孔的装置。
基质
在本文所描述的任何方法中,提供了定位于基质中的纳米孔。基质可以是如本文所描述的生物基质或固态基质。可以提供包括提供在固态基质内的生物纳米孔的混合系统。
生物基质
生物纳米孔可以提供在生物基质中。生物纳米孔被插入到生物基质中。
生物基质可以是膜,如两亲层,例如脂质双层。
两亲层是由具有亲水性和亲脂性性质两者的两亲分子(如磷脂)形成的层。两亲层可以是单层或双层。两亲层可以是嵌段共聚物,如通过Gonzalez-Perez等人,(《朗缪尔(Langmuir)》,2009,25,第10447-10450页)或WO2014/064444中所公开的。
膜可以是脂质双层。可以通过单通道记录对插入到脂质双层中的生物纳米孔中的聚合物执行分析。脂质双层可以是任何脂质双层。合适的脂质双层包含但不限于平面脂质双层、支持双层或脂质体。脂质双层优选地是平面脂质双层。合适的脂质双层公开于WO2006/100484、WO2008/102121、WO2009/077734和WO2012/033524中。
用于形成脂质双层的方法是本领域已知的。合适的方法公开于WO2006/100484、WO2008/102121、WO2009/077734和WO2012/033524以及Mental和Mueller(《美国国家科学院院刊》1972;69:3561-3566)中,其中在水溶液/空气界面上携带脂质单层经过垂直于所述界面的孔口的任一侧。所述方法适用于蛋白质纳米孔插入。双层形成的其它常见方法包含脂质体双层的尖端浸没、双层涂刷和贴片夹持。在WO2009/077734中,描述了一种方法,其中脂质双层由经过干燥的脂质形成,并且描述了一种方法,其中脂质双层跨开口形成。
生物基质可以包括两亲分子的外层。生物基质可以包括两亲分子的双层。两亲分子可以是脂质分子。两亲分子可以包括磷脂分子。磷脂分子可以包括非聚乙二醇化磷脂和聚乙二醇化磷脂。
在可以包括包含非聚乙二醇化磷脂分子和聚乙二醇化磷脂分子的两亲分子的外层或双层的任何生物基质中,非聚乙二醇化磷脂分子可以是甘油磷脂和/或聚乙二醇化磷脂可以是甘油磷脂。
在可以包括包含是甘油磷脂的非聚乙二醇化磷脂的两亲分子的外层或双层的任何生物基质中,非聚乙二醇化磷脂可以包括DPhPC。
WO2017/149293中所描述的任何两亲分子可以任选地用于制备用于执行本发明的方法的生物基质。
当磷脂分子包括非聚乙二醇化磷脂和聚乙二醇化磷脂时,2.5mol%到15mol%的磷脂可以是聚乙二醇化磷脂。可替代地,7.5mol%到15mol%的磷脂可以是聚乙二醇化磷脂。可替代地,5mol%到15mol%的磷脂可以是聚乙二醇化磷脂。10mol%到15mol%的磷脂可以是聚乙二醇化磷脂。
可以包括包含聚乙二醇化磷脂的两亲分子的外层或双层的任何生物基质可以包括具有PEG基团的磷脂,所述基团的分子量为1500g/mol到5000g/mol,任选地1800g/mol到2200g/mol。
在可以包括包含非聚乙二醇化甘油磷脂的两亲分子的外层或双层的任何生物基质中,非聚乙二醇化磷脂可以是式(I)的磷脂:
其中:
相同或不同的R1和R2选自C10-C25烷基和C10-C25烯基;
R3不存在,使得OR3是O-,或R3存在并且是H、CH2CH2N(R4)3 +、糖基或氨基酸基团;并且
相同或不同的每个R4独立地选自H和未取代的C1-C4烷基。
在可以包括包含聚乙二醇化甘油磷脂的两亲分子的外层的任何反应容器中,聚乙二醇化磷脂可以是下式(II)的磷脂
其中:
R1和R2是如以上对于式(I)的磷脂所定义的,并且R5是包括聚(乙二醇)的基团。R5可以是-CH2CH2NHC(O)-(OCH2CH2)qOCH3、-CH2CH2NHC(O)(CH2)3C(O)-(OCH2CH2)qOCH3、-CH2CH2NHC(O)-(OCH2CH2)qOH或-CH2CH2NHC(O)(CH2)3C(O)-(OCH2CH2)qOH,其中q是5到10,000的整数。
在可以包括包含是甘油磷脂的聚乙二醇化磷脂的两亲分子的外层或双层的任何生物基质中,聚乙二醇化磷脂可以包括DPPE-mPEG2000。聚乙二醇化磷脂可以包括5mol%到15mol%的DPPE-mPEG2000。
在可以包括包含是甘油磷脂的聚乙二醇化磷脂以及是甘油磷脂的非聚乙二醇化磷脂的两亲分子的外层或双层的任何生物基质中,非聚乙二醇化磷脂可以包括DPhPC,并且聚乙二醇化磷脂可以包括DPPE-mPEG2000。在这种情况下,磷脂可以包括例如2.5mol%到15mol%的DPPE-mPEG2000,优选地5mol%到15mol%的DPPE-mPEG2000。
生物基质可以以一个或多个液滴的形式提供。液滴可以包括例如油包水液滴。纳米孔可以定位于作为液滴或液滴界面的部分形成的层或双层内。通过说明的方式,液滴界面技术是本领域已知的,参见例如Bayley H.等人,2008,《分子生物系统(Mol Biosyst.)》4(12),第1191-1208页。液滴可以由如本文进一步所描述的任何合适的材料构成。
固态基质
固态基质通常不是生物来源的。换言之,固态层通常不是源自生物环境或与其隔离,如生物体或细胞或生物学上可获得的结构的合成制造版本。固态基质可以由有机材料和无机材料两者形成为层,所述材料包含但不限于:微电子材料;绝缘材料,如Si3N4、Al203和SiO;有机和无机聚合物,如聚酰胺;塑料,如或弹性体,如双组分加成固化的硅橡胶;以及玻璃。固态层可以由石墨烯形成。合适的石墨烯层公开于WO2009/035647和WO2011/046706中。
固态纳米孔可以与提供聚合物的替代物或另外测量的另外组件组合使用,如隧穿电极(Ivanov AP等人,《纳米快报》2011年1月12日;11(1):279-85),或场效应晶体管(FET)装置(WO2005/124888)或互补金属氧化物半导体(CMOS)装置(Magierowski,S.,《生物传感器(Biosensor)(巴塞尔(Basel))》,2016年9月;6(3):42)。
在Haque F等人(《今日纳米》,2013,8(1):第56-74页)、美国专利第6,464,842号、第WO2003/003446号、第WO2005/061373号、美国专利第7,258,838号、美国专利第7,466,069号、美国专利第7,468,271号以及美国专利第7,253,434号中所描述的任何固态基质可以用于本发明方法中。
纳米孔装置的电操作
近年来,用于诱导带电聚合物(如多核苷酸分子)通过纳米孔的移动和使用纳米孔作为检测装置的组件来检测聚合物单元的技术已经变得很好地建立(参见例如Stoddart D等人,《美国国家科学院院刊》,2009,106(19),第7702-7707页;Lieberman K等人,《美国化学学会杂志》2010;132(50):17961-72,以及WO2000/28312)。在本发明中,在本文所描述的任何方法中,饲养分子通过纳米孔的移动,以及用于核苷酸的检测和验证过程,都是通过这种建立的技术加上必要的变更来操作。
因此,如本文所定义的,在耐电基质中形成纳米孔。在基质的一侧邻近纳米孔提供酶,从而确定纳米孔/基质的反式侧和顺式侧。待延伸的多核苷酸合成分子也在酶附近提供。如本文所定义的,基质的反式侧是其上提供酶和多核苷酸合成分子的一侧。基质的顺式侧是其上最初提供游离的转移核苷酸和/或具有连接的转移核苷酸的饲养分子的一侧。可以在顺式室和反式室中提供的各自电极之间的在纳米孔两端施加电势梯度,以诱导离子流过纳米孔。根据电极的极性和被吸引到纳米孔中的分子的电荷,包括转移核苷酸的饲养分子或不具有转移核苷酸的饲养分子通常在电势差下将被充电和被吸引到纳米孔中。相反,转移核苷酸或饲养分子可以从纳米孔喷射,在相反方向上移动或通过反转或以其它方式控制电势差而保持在纳米孔内。通过纳米孔的离子流还可以有助于朝着纳米孔孔口吸引馈送分子并且到纳米孔中。包含连接的转移核苷酸的饲养分子的至少一部分在顺式到反式方向上被易位到纳米孔中并且通过纳米孔。饲养分子的部分通过纳米孔的移动可以尤其由在施加电势梯度下的离子电流来驱动。可以在纳米孔两端施加其它梯度(如压力或化学梯度)以诱导饲养分子移动通过纳米孔。通过在基质两端施加的反向施加电势(如反向电压偏置)的作用,可以实现饲养分子的部分在反式到顺式方向上通过纳米孔往回移动。
本发明方法优选地涉及如本文更详细描述的用于核苷酸的检测和验证的过程。这些过程涉及进行关于纳米孔的性质的测量。
测量是电测量,特别是流过纳米孔的离子电流的电流测量。通常,可以使用标准单通道记录设备进行这些和其它电测量,如在Stoddart D等人,《美国国家科学院院刊》,2009,106(19),第7702-7707页;Lieberman K等人,《美国化学学会杂志》2010,132(50),第17961-17972页,以及WO2000/28312中所描述的设备。可替代地,可以使用多通道系统进行电测量,例如如在WO2009/077734和WO2011/067559中所描述的。
通常,当所述测量是电流时,测量是流过纳米孔的离子电流。离子电流通常可以是DC离子电流,但是原则上替代方案使用AC电流(即,在施加AC电压下流动的AC电流的幅值)。
因此,可以通过将纳米孔放置在绝缘基质中和在分析物分子存在的情况下测量通过孔的电压驱动的离子传输来产生传感器。电流中的波动可以揭示占据纳米孔内的空间的分析物(如核苷酸)的同一性。分析物的同一性是通过其独特的电流特征,特别是电流阻断的持续时间和程度来揭示的(Braha,O.,Walker,B.,Cheley,S.,Kasianowicz,J.J.,Song,L.,Gouaux,J.E.,和Bayley,H.(1997)《化学生物(Chem.Biol.)》4,497-505;以及Bayley,H.,和Cremer,P.S.(2001),《自然(Nature)》413,226-230)。电流中的波动出现的频率可以揭示分析物的浓度。
在核苷酸与纳米孔之间的相互作用期间,核苷酸以特定于所述核苷酸的方式影响流过纳米孔的电流。例如,特定核苷酸将在特定平均时间段和特定程度上减少流过纳米孔的电流。换言之,流过纳米孔的电流对于特定核苷酸是独特的。可以进行对照实验以测定特定核苷酸对流过纳米孔的电流的影响。然后可以将对测试样品进行本发明的方法的结果与源自这种对照实验的结果进行比较,以便标识特定核苷酸。
用于检测顺式室与反式室之间的电流的示例性装置已经描述于WO2000/79257、WO2012/033524、美国专利第6,46,594号、第6,673 6,673,615号、第6,627,067号、第6,464,842号、第6,362,002号、第6,267,872号、第6,015,714号和第5,795,782号和美国专利公开第2004/0121525号、第2003/0104428号以及第2003/0104428号中。这种装置包含但不限于与纳米孔直接相关的电极、在纳米孔的孔口处或其附近的电极或放置在基质的顺式和反式侧上的室内的电极。电极可以能够但不限于检测跨两个室的离子电流差或跨纳米孔孔口或通道的电子隧穿电流。传输性质可以是流过孔口的直径的电子流,这可以通过邻近或邻接纳米孔圆周安置的电极来监测。此类电极可以连接到例如用于放大信号的Axopatch 200B放大器。
可以进行除了如上所述的通过纳米孔的离子电流的电流测量之外的类型的电测量。其它可能的电测量包含:电流测量、阻抗测量、隧穿测量(例如,如在Ivanov A等人,《纳米快报》2011,11(1),第279-285页中所公开的),以及场效应晶体管(FET)测量(如在WO2005/124888中所公开的)。
作为电测量的替代方案,光学测量是可能的。一种涉及荧光测量的合适的光学方法公开于Heron J.等人,《美国化学学会杂志》2009,131(5),第1652-1653页。光学测量可以与电测量组合(Heron J.等人,《美国化学学会杂志》2009,131(5),第1652-1653页,以及Soni G.等人,《科学仪器综述(Rev Sci Instrum.)》2010,81(1),014301)。
可以进行不同性质的同时测量。测量可以具有不同性质,因为所述测量是不同物理性质的测量,其可以是上述测量中的任何一种。可替代地,测量可以具有不同的性质,因为所述测量是相同物理性质但在不同条件下的测量,例如电测量,如在不同施加偏置电压下的电流测量。
封闭部分
在本发明的任何方法中,可能期望在饲养分子易位通过纳米孔时控制所述饲养分子的移动。这种控制可以通过各种方式实现。可以使用纳米孔衔接子和/或饲养分子处理部分来实现控制,如本文所描述的。也可以通过提供具有一个或多个封闭部分的饲养分子来实现控制。
如本文所描述的“封闭部分”是可以防止、暂停、阻碍或减缓在饲养分子或所述饲养分子的一部分在施加电势的作用下易位通过纳米孔时饲养分子或所述饲养分子的一部分通过纳米孔的移动的任何结构或组件。
通常,封闭部分是应用到或附加到饲养分子的分子、分子复合物、化学品或化学基团。可以使用任何适合的分子、复合物、化学品或化学基团。封闭部分可以是肽、寡肽、多肽、核酸或任何其它合适的聚合物。封闭部分可以是单个分子,如小分子。
可以使用任何合适的连接方式将封闭部分连接到饲养分子。根据饲养分子的性质和组成,本文在“接头和连接部分”部分中所描述的任何合适的连接方法可以加上必要的变更而应用于将封闭部分连接到饲养分子的目的。
可以使用一个或多个接头将封闭部分连接到饲养分子。可以使用本文所公开的任何合适的接头,并且例如在WO2010/086603、WO2010/004273、WO2010/004265和/或WO 2012/033524中所公开的接头。
封闭部分可以是单个物种的分子,例如蛋白质,如辣根过氧化物酶(HP)。
封闭部分可以是一种或多种分子的复合物,如与抗生物素蛋白/链霉亲和素复合的生物素。
封闭部分还可以包括饲养分子本身的一部分。例如,封闭部分可以包括饲养分子的二级或三级结构的一部分。封闭部分可以包括例如双链核酸的一个或多个区(例如,螺旋)、核酸茎环结构(发夹)的一个或多个区、一个或多个核酸十字形或核酸假结结构、未配对核苷酸的一个或多个环状区、一个或多个凸起区、一个或多个四链体区、交联核酸的一个或多个区或其任何组合。
根据需要,可以在沿饲养分子的长度的任何合适的位置处将一个或多个封闭部分施加到饲养分子。
封闭部分可以是间接施加到饲养分子的分子、分子复合物、化学品或化学基团。例如,封闭部分可以包括与基质或纳米孔相关的蛋白质或其它分子,例如在基质的反式侧上提供的蛋白质或其它分子。此类蛋白质或其它分子可以通过如本文所描述的任何合适的方式连接到基质或纳米孔。例如,在“接头和连接部分”部分中所描述的任何合适的连接方法可以加上必要的变更而应用于将封闭部分根据需要连接到基质或纳米孔的目的。因此,例如,在饲养分子或其一部分跨纳米孔易位时,饲养分子的一部分可以接触连接到基质或纳米孔的封闭部分,此时可以改变饲养分子的移动,例如减缓或以其它方式阻碍移动。这种蛋白可以包括例如核酸结合蛋白,如解旋酶或拓扑异构酶。可以使用任何合适的蛋白质或分子,条件是保持系统的组件的期望功能。图7提供了对施加到饲养分子的封闭部分的描绘。
封闭部分可以被结构化成使得在施加刺激时可以去除其对饲养分子的影响。可以施加任何合适的刺激,如施加电势的变化,用于破坏键或其它连接的方式(如化学或光裂解),和/或用于改变封闭部分的构型或形式的方式。封闭部分可以被结构化成使得其对饲养分子的影响可以在施加第一刺激时被去除,并且然后在施加第二刺激时被再次施加。
参考图8,仅仅通过说明的方式,可以向饲养分子各自提供第一和第二封闭部分B1(双链区)和B2(连接的蛋白质)。当饲养分子在施加电势V1的作用下移动到纳米孔中的第一位置时,封闭部分B1的作用可能是阻止或减缓饲养分子的移动,使得在位置P1处在V1的施加下,具有转移核苷酸的饲养分子被保持在纳米孔中。在这种情况下,在V1下流过纳米孔的离子电流的力不足以克服包括B1的双链区的氢键的强度,并且转移核苷酸保持在位置P1。当施加电压增加到V2时,离子电流的强度增加并且能够克服包括封闭部分B1的双链区的氢键的强度,此时B1的双链区的链分离。饲养分子或部分能够在反式方向上进一步移动到纳米孔中,直到封闭部分B2的作用阻止饲养分子的移动为止,使得在位置P2处在V2的施加下,具有转移核苷酸的饲养分子被保持在纳米孔中。P2可以限定饲养分子的期望位置,如纳米孔中的位置,借此连接的转移核苷酸可以接触酶。通过将电压返回到V1,在顺式方向上往回移动纳米孔中的饲养分子,并且核酸链重新杂交以重新形成封闭部分B1的双链区,此时饲养分子返回到位置P1。通过施加反向施加电势-V,饲养分子可以从纳米孔喷射并且返回到基质的顺式侧。
所施加的封闭部分的性质、类型和数量,以及一个或多个封闭部分沿饲养分子的长度的定位可以取决于其中预期饲养分子起作用的特定条件和环境。例如,饲养分子在纳米孔中的易位速率可能受到各种可变因素的影响,如饲养分子本身的类型和结构布置、待使用的纳米孔的类型、饲养分子或其部分将移动通过的纳米孔的通道的直径、饲养分子处理部分和/或衔接子是否与纳米孔结合使用、施加电压的大小和极性、反应溶液中的离子的浓度和基质的类型。因此,根据饲养分子所期望的特定移动模式,可以以定制的方式定制一个或多个封闭部分沿饲养分子的长度的布置。例如,在上述说明性实例中,B1中的核苷酸的组成以及B2的位置和大小可以被调节,以便“调整”饲养分子在给定环境中的使用和应用。图9示出了向饲养分子提供的封闭部分的一些示例性布置。图10描绘了根据纳米孔的尺寸定制饲养分子的设计的要求。
拴系部分
饲养分子可以任选地包括饲养分子拴系部分。可以提供饲养分子拴系部分,例如优选地其中基质是生物基质,特别是膜,例如包括两亲层的膜,例如脂质层或双层。
饲养分子拴系部分在捕获并易位到纳米孔中之前将饲养分子可逆地拴系到基质。饲养分子拴系部分的施加具有若干个优点。其可以将饲养分子集中在纳米孔附近,从而减少可能需要被提供以合成给定多核苷酸分子的饲养分子的量,并且其可以导致纳米孔更快的捕获速率。
饲养分子拴系部分是优选地能够与如本文所描述和定义的膜偶联的疏水分子。例如,饲养分子拴系部分可以能够结合到膜或掺入到膜中。条件是执行所需功能,饲养分子拴系部分可以是任何合适的部分。饲养分子拴系部分可以例如包括脂质分子,任选地为固醇分子,如胆固醇。
饲养分子拴系部分可以掺入到饲养分子中作为其结构的一部分。饲养分子拴系部分可以连接到饲养分子或连接到封闭部分,所述封闭部分连接到饲养分子。饲养分子拴系部分可以连接在饲养分子或封闭部分上的任何合适的位置处,条件是保持如本文所描述的所有组件的功能。
饲养分子拴系部分可以任选地以这样的方式连接到饲养分子或封闭部分:饲养分子拴系部分可从饲养分子或封闭部分去除,例如在施加刺激时。例如,可以用接头或其它合适的连接基团将饲养分子拴系部分连接到饲养分子或封闭部分,使得在饲养分子(例如,在施加电势的影响下)移动到纳米孔中并且通过纳米孔时,从饲养分子或封闭部分去除或剥离饲养分子拴系部分。以此方式去除封闭部分可以是永久性的。
图11中仅仅通过说明的方式描绘了饲养分子拴系部分的一些示例布置。
本文在“接头和连接部分”部分中所描述的任何合适的连接方法可以加上必要的变更而应用于将饲养分子拴系部分连接到饲养分子或连接到封闭部分的目的。
除了如本文所提供的公开内容之外,可以通过在例如WO2010/086603、WO2010/004273、WO2010/004265和/或WO 2012/033524中公开的任何合适的方式连接饲养分子拴系部分。
验证过程
本发明的方法的一些优选实施例涉及在使转移核苷酸与酶接触的步骤之前,测定转移核苷酸(例如,连接到给定饲养分子的转移核苷酸)的同一性和/或完整性。
本发明的方法的一些优选实施例涉及在使转移核苷酸与酶接触的步骤之后,测定转移核苷酸是否保持连接到给定饲养分子。
本发明的方法的一些优选实施例涉及这些测定的组合。
转移核苷酸(例如,连接到给定饲养分子的转移核苷酸)的存在和/或同一性和/或完整性的测定可以通过利用已经确定的相同技术来实现,所述技术用于测定在施加电势的作用下易位通过纳米孔的带电聚合物的单元的同一性。
如本文所讨论的,聚合物单元的同一性的测定可以通过在所述单元通过纳米孔时测量相对于纳米孔的性质来实现。具体地,这种测定可以通过在施加电势的作用下测量聚合物单元改变或扰动流过纳米孔的离子电流的程度来实现。所测量的流过纳米孔的离子电流由负责使聚合物(即,饲养分子)移动/易位通过或跨纳米孔的相同施加电势来驱动。
当转移核苷酸通过孔或其孔口附近时,此事件会在离子电流中产生破坏。任选地连接到饲养分子的给定转移核苷酸将在离子电流中产生破坏,这是所述给定核苷酸的特征并且可以唯一地标识所述给定核苷酸。通过测量这些离子电流破坏,可以区分不同的核苷酸。例如,与包括腺嘌呤核碱基的核苷酸在纳米孔中的移动相关的离子电流的破坏或变化将不同于与包括胸腺嘧啶核碱基的核苷酸的移动相关的离子电流的破坏或变化。离子电流特征的测量提供了用于执行验证过程的基础,例如测定纳米孔内的给定饲养分子是否连接到所期望转移核苷酸。如果没有,则可以反转施加电势,并且在转移核苷酸已经接触酶之前,并且因此在所述酶已经能够催化多核苷酸合成分子的延伸之前,转移核苷酸或包括连接的转移核苷酸的饲养分子可以从纳米孔喷射。可以施加反向施加电势持续足够的时间段,以从纳米孔喷射转移核苷酸或包括连接的转移核苷酸的饲养分子,此时可以重新施加初始施加电势,以便将不同的转移核苷酸或包括连接的转移核苷酸的饲养分子吸引到纳米孔中。然后可以重复验证过程,直到期望转移核苷酸被捕获在纳米孔内为止,或直到饲养分子被捕获在具有所连接的期望转移核苷酸的纳米孔内为止。
测定纳米孔内的核苷酸的同一性和/或完整性
通常,在本发明的方法中,在基质的顺式侧上提供饲养分子群体,通常,每个群体分别包括具有连接的核苷酸的饲养分子,所述连接的核苷酸包括待掺入到多核苷酸合成分子中的期望核碱基。饲养分子可以作为单一异质混合物提供,全部均在基质的顺式侧上以溶液的形式提供。为了用转移核苷酸延伸多核苷酸合成分子,有必要使酶与具有期望转移核苷酸的饲养分子接触。当给定饲养分子从饲养分子的单一异质混合物在随机基础上移动到纳米孔中时,期望通过验证过程来标识饲养分子是否连接到期望转移核苷酸。如果测定饲养分子连接到期望转移核苷酸,则可以允许其进一步移动通过纳米孔,使得转移核苷酸接触酶。如果测定饲养分子连接到不是期望转移核苷酸的核苷酸,则在核苷酸与酶接触之前,其可以朝着基质的顺式侧通过纳米孔往回移动并返回到顺式侧,即从纳米孔喷射并返回到基质的顺式侧。可以重复进行这种过程,直到在具有连接的期望转移核苷酸的纳米孔中提供饲养分子为止。只有此时,饲养分子才能进一步移动通过纳米孔到达借此转移核苷酸与酶接触的位置。
连接到饲养分子的核苷酸的完整性也可以使用这种过程来测定。例如,期望测定连接到饲养分子的核苷酸是否以某种方式有缺陷,如通过具有受损或结构改变的糖基或核碱基。因此,本文所描述和定义的方法可以包括用于测定核苷酸的完整性(如核苷酸是否包括期望结构)的验证过程。
因此,在本发明的任何方法中,当饲养分子移动通过纳米孔时,可以执行第一验证过程,以测定饲养分子的转移核苷酸的同一性和/或完整性,其中:
a)如果测定所述饲养分子具有连接的期望转移核苷酸,则将所述饲养分子移动以使所述转移核苷酸与所述酶接触;或
b)如果测定所述饲养分子不具有连接的所述期望转移核苷酸:
i.则使所述饲养分子往回移动到所述基质的所述顺式侧;
ii.使饲养分子从所述基质的所述顺式侧处的所述饲养分子的混合物朝着所述反式侧移动到所述纳米孔中;并且
iii.重复所述第一验证过程,直到测定所述饲养分子具有连接的所述期望转移核苷酸为止,之后将所述饲养分子移动以使所述转移核苷酸与所述酶接触。
连接到所述饲养分子的所述核苷酸的所述核碱基的同一性和/或完整性可以通过对饲养分子执行测量来测定。饲养分子可以产生可标识信号以唯一地标识连接的转移核苷酸和/或测定连接的转移核苷酸的完整性。
所述饲养分子的测量可以是相对于纳米孔进行的。例如,核碱基腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤和尿嘧啶的同一性可以通过测量在如本文所描述的施加电势下在饲养分子存在的情况下流过纳米孔的离子电流中的扰动而彼此区分。
因此,在本发明的任何方法中,可以通过测量在施加电势下通过纳米孔的离子电流来确定连接到饲养分子的核碱基的同一性和/或完整性。
还可以通过使用掺入到饲养分子中的多核苷酸序列标识基序(条形码)检测期望转移核苷酸的存在或不存在,来执行其中测定饲养分子具有连接的期望转移核苷酸的验证过程。例如,通过向饲养分子中的四个群体中的每个群体提供单独的多核苷酸序列标识基序(条形码),在饲养分子移动通过纳米孔时对条形码进行测序是可能的。再次,本文所描述的涉及在施加电势下测量通过纳米孔的离子电流的扰动的检测技术可以用于测定条形码的序列。
以上所描述的在纳米孔内的转移核苷酸的检测和验证的相同原理也可以应用于本文所公开的涉及转移核苷酸的移动的方法,所述转移核苷酸是未连接到饲养分子的游离转移核苷酸。
测定连接到饲养分子的核苷酸的存在或不存在
本发明的涉及饲养分子的任何方法可以进一步包括第二验证过程,所述第二验证过程被执行以验证酶已经催化转移核苷酸从饲养分子转移到多核苷酸合成分子。例如,可以使饲养分子移动通过纳米孔到纳米孔中的位置,使得预期连接到饲养分子的转移核苷酸将接触酶。尽管如此,酶由于某种原因可能无法催化核苷酸向多核苷酸合成分子的转移。在从第一延伸循环进行到第二延伸循环之前,可能期望确定多核苷酸合成分子是否已经在第一延伸循环中用转移核苷酸延伸。
因此,在本发明的涉及饲养分子的任何方法中,在假定转移核苷酸转移到多核苷酸合成分子之后,将饲养分子移动到基质的顺式侧之前,可以执行第二验证过程以验证酶实际上已经催化转移核苷酸从饲养分子转移到合成分子。第二验证过程可以包括以下步骤:
i.使所述饲养分子在所述顺式方向上移动通过所述纳米孔,并测定所述连接的转移核苷酸的核碱基的存在或不存在;
ii.如果测定所述连接的转移核苷酸的所述核碱基连接到所述饲养分子,则使所述饲养分子在所述反式方向上往回移动以使所述核苷酸与所述酶接触;以及
iii.重复步骤(i)和(ii),直到测定所述期望转移核苷酸已经从所述饲养分子去除为止。
在使饲养分子在顺式方向上移动通过纳米孔的同时测定连接的转移核苷酸的核碱基的存在或不存在的步骤可以通过对饲养分子执行测量来测定,如在第一验证过程中。饲养分子可以产生可标识信号以标识转移核苷酸是否连接到饲养分子。
与第一验证过程一样,饲养分子的测量可以是相对于纳米孔进行的。例如,可以使用本文所描述的检测技术来确定饲养分子上的核碱基的存在或不存在,涉及当饲养分子定位于纳米孔内时,在施加电势下测量流过纳米孔的离子电流的扰动。
第二验证过程可以包括结合第一验证过程执行的测量比较。在这种比较中,在转移核苷酸与酶接触之前,在使饲养分子在顺式方向上移动通过纳米孔的同时,执行如上所述的第一验证过程以确定转移核苷酸的同一性,以及任选地完整性,因此当连接到饲养分子时获得与期望转移核苷酸相对应的第一测量。在测定连接的转移核苷酸的核碱基的存在或不存在的步骤期间,在使饲养分子在顺式方向上通过纳米孔往回移动的同时,获得相同饲养分子的第二测量。然后对第一和第二测量进行比较以测定测量的变化,所述变化可以提供转移核苷酸已经从饲养分子去除的指示,即通过酶的作用。图12中仅仅通过说明的方式描绘了这种方法方案的实例。
饲养分子处理部分
在本发明的方法中,延伸过程可以涉及饲养分子通过纳米孔的易位。如本文详细描述的,饲养分子可以由包括聚合物的分子构成。在本发明的方法中,可以在基质的顺式侧上提供饲养分子,使得需要饲养分子形式的改变,以便饲养分子或饲养分子的期望部分可以易位到纳米孔中并通过纳米孔。因此,当饲养分子易位到纳米孔中并通过纳米孔时,可能需要处理所述饲养分子。许多部分是可用的,其能够处理如双链核酸等聚合物并引导所述聚合物的一部分通过纳米孔,并控制聚合物的这种部分通过纳米孔的移动和易位。这种部分在本文中被称为饲养分子处理部分。通常,处理部分可以利用或抵抗施加的场使饲养分子移动通过纳米孔。在所述部分是酶的情况下,使用例如酶活性,处理部分可以是分子马达。
饲养分子处理部分可以例如充当“制动器”以在饲养分子易位通过纳米孔时减缓饲养分子的移动。可以期望提供与纳米孔相关的饲养分子处理部分以帮助各种功能。例如,例如当执行如本文中所描述的验证过程时,在饲养分子从纳米孔中的第一位置易位通过纳米孔到一个或多个第二位置时,可能期望控制饲养分子的移动。
饲养分子处理部分可以是能够与饲养分子相互作用并且修饰所述饲养分子的至少一种性质的多肽。处理部分可以通过朝向饲养分子或将其移动到特定位置来修饰饲养分子。处理部分不需要显示酶活性,只要其能够结合靶饲养分子并控制其移动通过纳米孔即可。例如,处理部分可以被修饰以去除其酶活性或可以在防止其充当酶的条件下使用。
因此,在本发明的任何方法中,可以提供与邻近纳米孔提供的饲养分子处理部分相关的纳米孔,并且最优选地在邻近纳米孔的基质的顺式侧上提供。
在优选实施例中,饲养分子由包括核酸的分子构成,在这种情况下,饲养分子处理部分可以被称为核酸处理部分。核酸处理部分也可以被称为核酸处理酶、核酸结合蛋白/酶或进行性酶。核酸处理部分或进行性酶是已知的,并且已经被描述和表征用于引导核酸分子和其它聚合物通过纳米孔,并且控制此类分子和其它聚合物通过纳米孔的移动和易位(例如,WO2010/086603、WO2010/004273、WO2010/004265和WO 2012/033524)。
许多核酸处理酶适用于本申请,条件是其水解、聚合或处理多核苷酸分子以形成单链物种。优选的酶是聚合酶、核酸酶、解旋酶、单链和双链结合蛋白和拓扑异构酶,如旋转酶。
用于本发明的延伸过程的一个有利的机制是在施加电势的作用下,饲养分子的单链核酸部分在顺式到反式或反式到顺式的方向上受控地易位通过纳米孔。逐渐地或进行性地作用于双链核酸(如DNA)的核酸外切酶可以在基质的顺式侧上使用,以在施加电势下在顺式到反式方向上,或在反向电势下在反式到顺式方向上,使其余的单链移动通过纳米孔。同样,解开双链核酸的解旋酶也可以以类似的方式使用。对于需要饲养分子针对施加电势易位的应用还存在可能性,但所述饲养分子必须在反向或无电势下首先被处理部分“捕捉”。在结合之后电势然后切换回的情况下,饲养分子将在顺式到反式方向上移动通过纳米孔并且将通过电流保持在延伸构象中。单链核酸外切酶或单链核酸依赖性聚合酶可以充当分子马达,以针对施加电势以受控方式(反式到顺式)将最近易位的单链拉回通过纳米孔。
用于执行本发明的方法的特别优选的机制是使饲养分子移动通过纳米孔,以使连接的转移核苷酸与酶接触,其中饲养分子包括如本文所描述的单链聚合物的一部分(如核酸、PNA等),并且其中移动(易位)通过或跨纳米孔的饲养分子的部分包括单链部分。转移核苷酸可以在饲养分子的单链部分的末端处或在沿饲养分子的单链部分的长度的位置处连接到饲养分子。WO2012/107778或WO2012/033524中所描述的任何部分、技术或酶均可以用于以这种方式控制饲养分子移动通过纳米孔。
因此,本发明的任何方法包括延伸过程,所述延伸过程包括在包括纳米孔的基质的顺式侧处提供饲养分子,所述饲养分子具有连接的转移核苷酸,并且其中所述纳米孔提供有偶联到所述纳米孔的饲养分子处理部分,并且其中所述过程包括使所述饲养分子与所述饲养分子处理部分接触并使所述饲养分子移动通过所述纳米孔。饲养分子处理部分可以是核酸处理部分,如聚合酶、核酸酶、解旋酶或拓扑异构酶,如旋转酶。饲养分子处理部分可以是核酸处理部分,其包括phi29 DNA聚合酶、T7 DNA聚合酶、His 1DNA聚合酶、His 2DNA聚合酶、芽孢杆菌噬菌体M2 DNA聚合酶、链球菌噬菌体CPI DNA聚合酶、肠杆菌噬菌体PRD1DNA聚合酶或其任何变体。饲养分子处理部分可以是在WO2010/086603、WO2012/107778、WO2010/004273、WO2010/004265、WO2012/033524和Lieberman K等人(《美国化学学会杂志》,2010,132(50),第17961-17972页)中以及在Luan B等人(《物理评论快报(Phys RevLett.)》,2010,104(23),238103)中的电压门控方案中公开的任何饲养分子处理部分。
处理部分可以源自溶核酶。处理部分可以源自任何酶分类(EC)组的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。
用作处理部分的其它合适的酶包含但不限于来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III酶、来自极端嗜热菌的RecJ和噬菌体λ核酸外切酶和其变体。合适的这种酶的实例公开于WO2016/059427中。包括在WO2016/059427中的Seq ID:8中所示的序列或其变体的噬菌体λ核酸外切酶的三个亚基相互作用以形成三聚体核酸外切酶。酶可以源自Phi29 DNA聚合酶,如包括在WO2016/059427中的Seq ID:9中所示的序列或其变体的酶。
变体是具有不同于原始起始参考酶序列的氨基酸序列的氨基酸序列并且保留多核苷酸结合能力的酶。变体可以包含促进多核苷酸的结合和/或促进多核苷酸在高盐浓度和/或室温下的活性的修饰。在氨基酸序列的整个长度内,基于氨基酸同一性,变体将优选地与原始起始参考序列至少50%同源。更优选地,基于氨基酸同一性,变体多肽可以在整个序列内是至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在200个或更多个、例如230个、250个、270个或280个或更多个的连续氨基酸的延伸段内,可能存在至少80%、例如至少85%、90%或95%的氨基酸同一性。
饲养分子处理部分可以包括选自来自由以下组成的组的细菌的酶:富盐菌属(Haloferax)、盐几何形菌属(Halogeometricum)、盐球菌属(Halococcus)、盐土生古菌属(Haloterrigena)、盐红菌属(Halorubrum)、盐盒菌属(Haloarcula)、盐杆菌属(Halobacterium)、肋生盐弧菌(Salinivibrio costicola)、伸长盐单胞菌(Halomonaselongata)、以色列盐单胞菌(Halomonas israelensis)、鲁伯盐碱杆菌(Salinibacterrube)、杜氏盐藻(Dunaliella salina)、金黄色葡萄球菌(Staphylococcus aureus)。嗜盐放线多抱菌(Actinopolyspora halophila)、嗜盐海球菌(Marinococcus halophilus)和肋生盐弧菌。
饲养分子处理部分与基质的连接
饲养分子处理部分(如核酸处理部分)通常通过一个或多个具有优选朝向的侧链的其基质可接近的残基来连接到基质。任何优选的连接残基均可以通过取代进行修饰。一个或多个优选的连接残基可以被半胱氨酸取代。所述部分可以通过多于一个残基连接到基质。
所述部分可以通过一个或多个可接近的半胱氨酸残基连接到基质。所述部分可以在多于一个(如两个或三个)点处连接到基质。在多于一个点处将所述部分连接到基质上可以用于限制所述部分的移动性。例如,可以使用多个连接来限制所述部分旋转的自由度或其移动远离基质的能力。
所述部分可以直接或间接地连接到基质。所述部分可以通过纳米孔连接到基质,在这种情况下,所述部分可以直接连接到纳米孔。
所述部分可以连接到寡聚纳米孔的亚基。如果基质是寡聚纳米孔的亚基,当所述亚基连接到所述部分时(表达后修饰),其可以呈单体形式。可替代地,当亚基连接到所述部分时(寡聚后修饰),其可以是寡聚纳米孔的一部分。
可以使用本领域已知的任何方法将如核酸处理部分等饲养分子处理部分连接到基质。所述部分和基质可以分开产生,并且然后连接在一起。如果基质本身是蛋白质(如孔亚基),则两种组分可以以任何构型连接。例如,所述两种组分可以通过其末端(即,氨基或羧基末端)氨基酸连接。合适的构型包含但不限于处理部分的氨基末端连接到基质的羧基末端,并且反之亦然。可替代地,所述两种成分可以通过其序列内的氨基酸连接。例如,所述部分可以连接到基质的环区中的一个或多个氨基酸。在一个实施例中,所述处理部分的末端氨基酸连接到基质的环区中的一个或多个氨基酸。
所述处理部分可以化学融合到基质。如果两个部分例如通过接头分子化学连接,则处理部分可以化学融合到基质。可以使用任何化学融合或连接的方法。合适的方法包含但不限于亲和力相互作用、组氨酸标签结合到金属亲和力基质、Ni-NTA、生物素结合到链霉亲和素、抗体结合到抗原、伯胺偶联、一个或多个GST标签结合到谷胱甘肽、一个或多个MBP标签结合到糊精、蛋白A结合到IgG、硫醇之间的反应、核酸杂交接头和半胱氨酸连接。处理部分可以共价连接到基质。
如果基质是蛋白质,则处理部分可以基因融合到基质。如果从单个多核苷酸序列表达整个构建体,则处理部分基因融合到蛋白质基质。处理部分和基质的编码序列可以以任何方式组合以形成对构建体进行编码的单个多核苷酸序列。
处理部分和基质可以以任何构型(如通过其末端氨基酸)基因融合。处理部分的氨基酸序列可以以框架形式添加到基质的氨基酸序列中。处理部分可以插入到跨膜蛋白孔或孔亚基的环区中。
饲养分子处理部分(如核酸处理部分)保留其结合核酸的能力。此能力通常由其二级结构元件(α-螺旋和β-链)和三级结构元件提供。为了避免不利地影响处理部分的核酸结合能力,优选地以不影响其二级或三级结构的方式将其连接到基质。
如果基质是孔或孔亚基,则所述孔或孔亚基保留其形成孔的能力。亚基的成孔能力通常由其α-螺旋和β-链提供。β-桶孔包括由β-链形成的桶或通道,而α-螺旋束孔包括由α-螺旋形成的桶或通道。α-螺旋和β-链通常由环区连接。为了避免影响亚基的成孔能力,处理部分优选地连接到亚基的环区。
处理部分可以直接连接到基质。例如,天然和/或非天然可接近的半胱氨酸残基可以直接连接到活化的硫醇-琼脂糖。
处理部分可以在一个或多个位置(如在一个、两个、三个或四个位置)处连接到基质。处理部分优选地在一个或两个位置处连接到基质。在从处理部分去除天然半胱氨酸残基之后,一个或多个半胱氨酸残基可以在用于连接的特定位置处掺入到所述部分中。连接可以通过将处理部分中的半胱氨酸残基(即,通过二硫键)直接交联到基质中的半胱氨酸或通过使用交联剂来进行。在两个位置处的连接可以降低复合物的柔性,并且可以将处理部分以所选的特定朝向固定在基质上。
包括处理部分和纳米孔的示例性构建体公开于WO2010/086603中。这些构建体中的任何一种构建体可以用于本发明的方法中。
处理部分优选地使用一种或多种(如两种或三种)接头连接到基质。一个或多个接头可以被设计成限制处理部分的移动性。接头通常连接到处理部分中的一个或多个可接近的半胱氨酸残基。接头可以连接到基质中的一个或多个反应性基团,如半胱氨酸残基、反应性赖氨酸残基或非天然氨基酸。合适的接头是本领域众所周知的。合适的接头包含但不限于化学交联剂和肽接头。化学交联剂包含核酸杂交接头。核酸杂交接头的长度、柔性和亲水性通常被设计成使得其不会干扰处理部分和基质的功能。使用杂交接头的优点是使不想要的二聚体(基质-基质或蛋白质-蛋白质)的形成最小化。核酸杂交接头可以包括本文所讨论的任何核酸。例如,其可以包括脱氧核糖核酸(DNA)、核糖核酸(RNA)或本领域已知的任何合成核酸,包含本文所描述的核酸,如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其它合成聚合物。接头还可以被修饰成使得一旦所述接头已经杂交,其就彼此反应。可替代地,一旦接头已经彼此杂交,就可以使用试剂来交联接头。
示例性核酸杂交接头公开于WO2010/086603中。例如,核酸杂交接头可以与从如在WO2010/086603中所公开的SEQ ID NO:57的5'端起的前15个、25个或35个核苷酸相对应。接头还可以在3'端处具有TT以提供额外的柔性。在3'端处,接头可以具有允许接头连接到处理部分或基质的基团,如马来酰亚胺或硫醇。马来酰亚胺或硫醇修饰的寡核苷酸可以例如从ATDBio商购获得。更多接头示出于WO2010/086603中的SEQ ID NO:58、59和60中。互补接头示出于WO2010/086603中的SEQ ID NO:61、62和63中。WO2010/086603中的SEQ ID NO:58、59或60可以连接到处理部分和基质中的一个,并且互补接头(分别为SEQ ID NO:61、62或63)可以连接到处理部分和基质中的另一个。然后可以通过使接头杂交将处理部分和基质连接在一起。
杂交的稳定性取决于杂交接头的熔解温度。根据应用和所需的稳定性,这可以通过改变接头的序列(例如,将接头改变成更富含GC将增加其熔解温度并且因此增加稳定性)、接头的长度(即,增加其长度将增加稳定性)或反应条件(例如,增加其浓度将增加稳定性)来优化。
为了杂交的最大稳定性,期望具有高熔解温度的长杂交接头,例如长度大于15个核苷酸的接头,特别是长度为15到45个核苷酸的接头,如长度为15个、20个、25个、30个、35个、40个或45个核苷酸的接头。然而,长接头的使用增加了所述部分之间的距离。这可能是不利的,因为所述部分之间的相互作用被破坏,或因为需要接近基质以检测已经从处理部分释放的基质。增加的距离可能是有利的,因为其可以防止聚集或静电相互作用,并且可以允许挠曲。可以通过改变核酸连接的朝向来克服增加的距离的缺点。优选地,接头包括长度为6到15个核苷酸的核酸,如长度为6个、8个或10个核苷酸。
杂交接头的亲和力优选地在浓度为1pM到1mM下为1fM到1uM。接头的亲和力更优选地在浓度为1pM到1uM下为1fM到10nM。接头的亲和力最优选地在浓度为100pM到10nM下为1pM到100pM。
示例性接头示出于WO2010/086603中的SEQ ID NO:64中。此接头的3'端可以连接到基质上的半胱氨酸残基。接头优选地在3'端处也具有TTTTT以提供额外的柔性。然后WO2010/086603中的SEQ ID NO:65的5'端可以连接到处理部分。在此实例中,SEQ ID NO 64的3'端与SEQ ID NO:65的5'端处的序列的延伸段互补。
一旦接头彼此杂交,所述接头就在某些条件下(例如,在高温或低盐条件下)熔解(分解),除非在两个接头之间存在永久键。为了形成永久键,接头优选地被修饰成使得所述接头一旦已经杂交,其就彼此反应。每个接头可以含有能够与另一个接头中的基团形成共价键的基团。一对接头可以通过一个或多个共价键连接,例如一个、两个或三个共价键。
通常,所述键将是两个接头之间的简单的二硫键。接头还可以被修饰成在一个或多个(如两个)位置处掺入硫醇基。根据应用和偏好,硫醇基可以是内部的或末端的。
接头也可以内部或末端被修饰成包含一个或多个(如两个)碘乙酰胺基团。具有一个或多个碘乙酰胺基团的杂交接头可以共价连接到互补杂交接头上的硫醇。
接头也可以用烯烃基团修饰。可以使在优选位置中的一个或多个内部或末端烯烃基团经受烯烃复分解以在杂交接头中的烯烃之间产生共价键。
如果需要,可以在接头与反应性基团(如硫醇基、碘乙酰胺基团和烯径基团)之间添加小接头,以获得在接头之间形成有效共价键所需的适当距离。
在优选实施例中,可以使用“点击化学”技术来产生接头之间的共价键。点击化学是由Kolb等人于2001年首次引入的术语,以描述在小规模和大规模应用两者中可靠地工作的一组扩展的强大的、选择性的和模块化的组成部分(Kolb HC,Finn,MG,Sharpless KB,《点击化学:来自几个良好反应的不同化学功能(Click chemistry:diverse chemicalfunction from a few good reactions)》,《应用化学国际版(Angew.Chem.Int.Ed.)》40(2001)2004-2021)。其已经定义了点击化学的一组严格标准,如以下所示:“反应必须是模块化的、范围宽、产率非常高、只产生可以通过非色谱方法去除并且可以是立体特异性的(但不一定是对映选择性的)无害副产物。所需的过程特征包含简单的反应条件(理想地,所述过程应该对氧气和水不敏感)、容易获得的起始材料和试剂、不使用溶剂或良性溶剂(如水)或容易去除的溶剂,以及简单的产物分离。如果需要,必须通过如结晶或蒸馏等非色谱方法纯化,并且产物必须在生理条件下是稳定的”。
点击化学的合适的实例包含但不限于以下:
(a)1,3偶极环加成反应的无铜变体,其中叠氮化物与炔烃在应变下反应,例如在环辛烷环中;
(b)一个接头上的氧亲核试剂与另一个接头上的环氧化物或氮丙啶反应性部分的反应;以及
(c)Staudinger连接,其中炔烃部分可以被芳基膦替代,导致与叠氮化物的特定反应以产生酰胺键。
优选地,点击化学是炔烃与叠氮化物之间的Cu(I)催化的1,3偶极环加成反应。已经合成了在优选位置中掺入叠氮化物和炔烃基团的核酸碱基(例如,Kocalka P,El-Sagheer AH,Brown T,《通过点击化学快速且高效的DNA链交联(Rapid and efficient DNAstrand crosslinking by click chemistry)》,《化学生物化学(ChemBioChem.)》2008,9(8):1280-5)。
如果接头的核酸区内的核苷酸被修饰成包含可以形成共价键的基团,则经过修饰的核苷酸优选地彼此偏移一个核苷酸以便实现连接。这是继Tom Brown(Kocalka等人(2008),《化学生物化学》9,8,1280-1285)的出版工作之后发表的。
在一个实施例中,单个叠氮化物基团(例如,WO2010/086603中的SEQ ID NO:66)或更多,如两个(WO2010/086603中的SEQ ID NO:67)可以在15个碱基脱氧核糖核酸序列中的特定位置处掺入到尿嘧啶碱基中。然后可以使用在5'端处的硫醇基(SEQ ID NO:66和67)用这些叠氮化物杂交接头修饰基质上的半胱氨酸残基。炔烃基团也可以在与SEQ ID NO:66和67(分别为WO2010/086603中的SEQ ID NO:68和69)互补的序列中的优选位置处掺入到尿嘧啶碱基中。这些序列可以用于修饰处理部分上的半胱氨酸。使用DNA杂交,然后是叠氮化物与炔烃基团之间的“点击化学”,可以使杂交接头共价交联。
基质与处理部分之间的距离可以通过改变杂交接头的长度来调节。然后需要相应地改变叠氮化物和炔烃修饰的碱基的位置。
在一个实施例中,其中两个尿嘧啶碱基被叠氮化物基团修饰的6聚体(WO2010/086603中的SEQ ID NO 70)、8聚体(WO2010/086603中的SEQ ID NO 71)或10聚体(WO2010/086603中的SEQ ID NO 72)DNA可以连接到所述部分的半胱氨酸。其中两个尿嘧啶碱基被炔烃基团修饰的6聚体(WO2010/086603中的SEQ ID NO 73)、8聚体(WO2010/086603中的SEQID NO 74)或10聚体(WO2010/086603中的SEQ ID NO 75)DNA的互补序列可以连接到如DNA结合蛋白等部分的半胱氨酸。与杂交接头相比,这些杂交接头之间的共价交联将使所述部分彼此更接近(WO2010/086603中的SEQ ID NO 67和69)。ATDBio已经开发了将叠氮化物和炔烃基团掺入到DNA的尿嘧啶碱基单元中。
化学接头的其它实例示出于下表。
接头可以首先连接到处理部分,并且然后连接到基质,首先连接到基质并且然后连接到处理部分,或同时连接到基质和处理部分。当接头连接到孔亚基(作为基质)时,其可以是单体亚基、两种或更多种单体的寡聚物的一部分或完全寡聚孔的一部分。优选的是,在任何纯化步骤之前,使接头反应以去除任何未结合的接头。
一种将处理部分连接到基质的方法是通过半胱氨酸连接。这可以通过双管能化化学接头或通过具有末端呈现的半胱氨酸残基的多肽接头来介导。α-HL(WO2010/086603中的SEQ ID NO:2)缺乏天然半胱氨酸残基,因此将半胱氨酸引入到SEQ ID NO:2的序列中使得能够将处理部分受控共价连接到亚基。半胱氨酸可以在不同位置处引入,如SEQ ID NO:2的位置K8、T9、N17或E287或在SEQ ID NO:2的羧基末端处。任何双管能化接头的长度、反应性、特异性、刚性和溶解性可以被设计成确保酶相对于亚基被正确地定位,并且亚基和酶两者的功能均被保留。合适的接头包含以上所描述的接头。
可以通过将接头的浓度保持在大大超过处理部分和/或基质的浓度来防止亚基或酶与其自身的交联。可替代地,可以使用其中使用两个接头的“锁和钥匙”布置。例如,点击化学(如叠氮化物炔烃Huisgen环加成)可以用于确保处理部分仅结合到基质而不结合到其本身上,并且反之亦然。在一个实施例中,可以使用上表中所示的叠氮化物-PEG-马来酰亚胺和炔烃-PEG-马来酰亚胺接头。一个连接到处理部分,并且另一个连接到基质。这确保了仅在处理部分与基质之间发生结合。
每个接头的仅一端可以一起反应以形成较长接头,并且接头的其它端各自与基质的不同部分(即,亚基或单体)反应。
优选地选择共价连接的位点和方法,使得处理部分的移动性受到限制。这有助于确保处理部分以这样的方式处理靶核酸序列:使靶序列中的核苷酸的一部分与孔相互作用。例如,限制处理部分移动的能力意指其活性位点可以永久地被朝着朝向亚基的形成孔的通道的桶的开口的一部分的部分。核酸结合蛋白的移动性可以通过增加蛋白连接到基质的点的数量和/或使用特异性接头来限制。然后,在核苷酸在相互作用期间影响流过孔的电流的不同方式的基础上来区分核苷酸。
除了上述内容和WO2010/086603的公开内容之外,如WO2010/004273、WO2010/004265和/或WO 2012/033524中所公开的,饲养分子处理部分(如核酸处理部分)可以直接连接到纳米孔,或可以通过接头间接连接。
纳米孔衔接子
在本文所描述的本发明的任何方法中,纳米孔可以包括促进纳米孔与饲养分子之间的相互作用的分子衔接子。衔接子的存在改善了纳米孔和饲养分子中存在的核苷酸的主客体化学。主客体化学的原理是本领域众所周知的。衔接子对纳米孔的物理或化学性质有影响,所述影响改善其与核苷酸的相互作用。衔接子通常改变纳米孔的桶或通道的电荷,或具体地与核苷酸相互作用或结合到核苷酸,由此促进其与纳米孔的相互作用。因此与不存在衔接子情况下的效率相比,所述衔接子增加了所述纳米孔与所述饲养分子之间相互作用的效率。衔接子在本文中可以被称为衔接子部分。
衔接子介导饲养分子中存在的核苷酸与孔之间的相互作用。核苷酸可以通过衔接子或与衔接子结合可逆地结合到纳米孔。核苷酸可以在其基质两端通过纳米孔时通过衔接子或与衔接子结合可逆地结合到纳米孔。核苷酸还可以在其膜两端通过纳米孔时通过衔接子或与衔接子结合可逆地结合到纳米孔的桶或通道。衔接子优选地收缩桶或通道,使得其可以与核苷酸相互作用。
衔接子通常是环状的。衔接子优选地具有与纳米孔相同的对称性。如果纳米孔是七聚体的(例如,具有围绕中心轴线的七个亚基,所述亚基贡献14条链到跨膜β桶),则通常使用具有七重对称性的衔接子。同样,如果纳米孔是六聚体的(例如,具有围绕中心轴线的六个亚基,所述亚基贡献12条链到跨膜β桶,或是12条链的β桶),则通常使用具有六重对称性的衔接子。可以使用促进纳米孔与核苷酸之间的相互作用的任何衔接子。合适的衔接子包含但不限于环糊精、环肽和葫芦脲。衔接子优选地是环糊精或其衍生物。衔接子更优选地是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。下表示出了孔和衔接子的一些合适的组合。
衔接子优选地共价连接到纳米孔。可以使用本领域已知的任何方法将衔接子共价连接到纳米孔。衔接子可以直接连接到纳米孔。衔接子优选地使用双功能交联剂连接到孔。合适的交联剂是本领域众所周知的。优选的交联剂包含3-(吡啶-2-基二磺酰基)丙酸2,5-二氧代吡咯烷-1-基酯、4-(吡啶-2-基二磺酰基)丁酸2,5-二氧代吡咯烷-1-基酯以及8-(吡啶-2-基二磺酰基)辛酸2,5-二氧代吡咯烷-1-基酯。最优选的交联剂是3-(2-吡啶二硫代)丙酸丁二酰亚胺酯(SPDP)。通常,在衔接子/交联剂复合物共价连接到纳米孔之前,衔接子共价连接到双功能交联剂,但也有可能在双功能交联剂/孔复合物连接到衔接子之前,将双功能交联剂共价连接到纳米孔。
选择共价连接的位点,使得衔接子促进从靶核酸序列释放或存在于靶核酸序列中的核苷酸与纳米孔的相互作用,并且由此允许检测核苷酸。对于基于α-HL的纳米孔,可以使用对纳米孔的特异性修饰来促进衔接子在纳米孔的桶或通道内的正确朝向以及衔接子与纳米孔的共价连接。具体地,纳米孔的每个亚基(包含一种或多种构建体)可以在如WO2010/086603中所公开的SEQ ID NO:2的位置139处具有谷氨酰胺。孔的一个或多个亚基(包含一种或多种构建体)可以在WO2010/086603中的SEQ ID NO:2的位置113处具有精氨酸。孔的一个或多个亚基(包含一种或多种构建体)可以在WO2010/086603中的SEQ ID NO:2的位置119、121或135处具有半胱氨酸,以促进分子衔接子与孔的连接。
条件
如本文详细描述的,本发明的方法涉及测量关于纳米孔的性质。这通常是在施加电势的作用下,在与转移核苷酸(例如,饲养分子的转移核苷酸)相互作用期间穿过纳米孔的电流,特别是离子电流。用于测量通过纳米孔的离子电流的合适的条件是本领域众所周知的。合适的条件公开于例如WO2010/086603中,并且其中所描述的任何条件可以应用于当前方法。
通常使用在基质和纳米孔两端施加的电压来执行测量方法。所使用的电压通常是-400mV到+400mV。所使用的电压优选地处于具有下限和上限的范围内,所述下限选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV,并且所述上限独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV。所使用的电压更优选地处于120mV到170mV的范围内。通过改变施加电势,使用纳米孔可以增加不同核苷酸之间的区别。
示例性电压包含以下。为了捕获和保留纳米孔(V1)中的饲养分子,电压可以是例如+40mV到+100mV。为了在反式方向(V2)上移动通过纳米孔(例如,针对封闭部分的作用),电压可以是例如+100mV到+200mV。为了在顺式方向上移动通过纳米孔以将饲养分子喷射到基质的顺式侧,电压可以是例如-100mV到+40mV。
在任何碱金属氯化物盐存在的情况下执行测量方法。在示例性设备中,盐存在于室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)或氯化铯(CsCl)。KCl是优选的。盐浓度可以是0.01M到2.5M。盐浓度通常是0.1M到2.5M、0.3M到1.9M、0.5M到1.8M、0.7M到1.7M、0.9M到1.6M或1M到1.4M。高盐浓度提供高信噪比并且允许在正常电流波动的背景下标识指示核苷酸存在的电流。然而,可能必须使用较低的盐浓度,使得酶能够起作用。
通常在缓冲液存在的情况下执行所述方法。在示例性设备中,缓冲液存在于室中的水溶液中。所述方法中可以使用任何缓冲液。一种合适的缓冲液是Tris-HCl缓冲液。通常在以下的pH下执行所述方法:4.0到10.0、4.5到9.5、5.0到9.0、5.5到8.8、6.0到8.7或7.0到8.8或7.5到8.5。所使用的pH优选地是约7.5。
通常在以下温度下执行所述方法:0℃到100℃、15℃到95℃、16℃到90℃、17℃到85℃、18℃到80℃、19℃到70℃或20℃到60℃。可以在室温下执行所述方法。优选地在支持酶功能的温度、如约37℃下执行所述方法。如果温度增加,则在低盐浓度下可以实现良好的核苷酸区别。然而,较低的温度,特别是低于室温的温度,会导致较长的停留时间,并且因此可以用于获得较高的准确度。
除了增加溶液温度之外,还有许多可以用于增加溶液的电导,同时保持适用于酶活性的条件的其它策略。一种这样的策略是使用脂质双层来分离两种不同浓度的盐溶液,酶侧的盐浓度低并且相反侧的盐浓度较高。此方法的一个实例是在膜的顺式侧使用200mMKCl,并且在反式室中使用500mM KCl。在这些条件下,通过孔的电导预期在正常条件下大致相当于400mM KCl,并且如果放置于顺式侧,则酶仅经历200mM。使用不对称盐条件的另一个可能的益处是纳米孔两端诱导的渗透梯度。此净水流(net flow of water)可以用于将核苷酸拉入到纳米孔中以用于检测。可以使用中性渗透剂(如蔗糖、甘油或PEG)实现类似的效果。另一种可能性是使用具有相对低水平的KCl的溶液,并且依赖于对酶活性具有较小破坏性的另外的携带电荷的物种。
多核苷酸的处理和组装
在本文所定义的任何方法中,延伸过程可以是第一延伸过程,并且其中所述方法进一步包括重复所述延伸过程一次或多次以用一个或多个另外的转移核苷酸进一步延伸多核苷酸合成分子,以合成具有预定义序列的多核苷酸。
可以根据需要进一步处理合成的多核苷酸。
例如,在用于合成单链多核苷酸合成分子的方法中,可以使用单链多核苷酸合成分子作为互补模板,通过另外的聚合酶和引物的作用将多核苷酸合成分子转化成双链分子。
可以扩增使用本文所定义和描述的任何方法合成的双链多核苷酸合成分子或其任何部分或区。可以通过任何合适的方法执行扩增,如聚合酶链反应(PCR)、聚合酶螺旋反应(PSR)、环介导的等温扩增(LAMP)、基于核酸序列的扩增(NASBA)、自主序列复制(3SR)、滚环扩增(RCA)、链置换扩增(SDA)、多重置换扩增(MDA)、连接酶链反应(LCR)、解旋酶依赖性扩增(HDA)、网状分支扩增方法(RAM)等。优选地,通过聚合酶链反应(PCR)执行扩增。
具有通过本文所描述的方法合成的预定义序列的多核苷酸可以接合到一种或多种其它这种多核苷酸,以产生更大的合成多核苷酸。
可以通过本领域熟知的技术实现多个多核苷酸的连接。可以裂解通过本文所描述的方法合成的第一多核苷酸和一种或多种另外的多核苷酸以产生相容的末端,并且然后通过连接将多核苷酸接合在一起。可以通过任何合适的方法实现裂解。通常,可以在多核苷酸中产生限制性酶裂解位点,并且然后使用限制性酶执行裂解步骤,从而从任何锚/支架多核苷酸释放合成的多核苷酸。裂解位点可以被设计为锚/支架多核苷酸的一部分。可替代地,可以在新合成的多核苷酸内产生裂解位点,作为预定义核苷酸序列的一部分。
可以使用固相方法执行多核苷酸的组装。例如,在合成后,可以使第一多核苷酸固定在固体表面上。第一多核苷酸可以在表面固定位点的远侧的合适位置处经受单一裂解。第一多核苷酸将因此保持固定到表面,并且单一裂解将产生对于接合到另一个多核苷酸而言相容的末端。另外的多核苷酸可以在两个合适的位置处经受裂解,以在每个末端处产生用于接合到其它多核苷酸的相容末端。另外的多核苷酸可以与第一多核苷酸相容地接合,因此产生较大的固定化多核苷酸,所述固定化多核苷酸具有预定义序列并且具有对于接合到又另一个另外的多核苷酸而言相容的末端。因此,预选的裂解的合成多核苷酸的接合的迭代循环可以产生长得多的合成多核苷酸分子。另外的多核苷酸的接合顺序将由所需的预定义序列测定。
因此,本发明的组装方法可以允许产生长度为一个或多个Mb数量级的合成多核苷酸分子。
可以使用本领域已知的设备来执行本发明的合成和组装方法。可获得的技术和设备允许非常小体积的试剂选择性地移动、分区并与阵列的不同位置中的其它体积组合,通常以液滴的形式。可以采用电润湿技术,如电介质上电润湿(EWOD),如上所述。可用于本发明的能够操纵液滴的合适的电润湿技术和系统公开于例如在US8653832、US8828336、US20140197028和US20140202863中。因此,可以合成具有预定义序列的多核苷酸,并且然后使其固定到电润湿表面,如上所述。合成的多核苷酸可以从电润湿表面裂解,并且以液滴的形式在电场的影响下移动。液滴可以在表面上的特定反应位点处组合,在所述特定反应位点其可以递送裂解的合成多核苷酸用于与其它裂解的合成多核苷酸连接。然后可以(例如通过连接)接合多核苷酸。使用这些技术,可以根据所期望的预定义序列合成并且依次连接不同多核苷酸的群体。使用这种系统,可以设计完全自动化的多核苷酸合成和组装系统。所述系统可以被编程为接收所期望的序列、供应试剂、执行合成循环并随后根据所期望的预定义序列组装所期望的多核苷酸。
设备
本文所描述的所有方法均涉及使用定位于基质内的纳米孔。
如本文所描述的,所述方法可以涉及验证过程,其涉及检测纳米孔内的转移核苷酸或核苷酸单元,例如在饲养分子易位通过纳米孔时。因此,本发明的方法涉及作为包括电控制装置和检测装置的检测元件的组件的纳米孔,其中所述装置能够检测核苷酸(例如连接到饲养分子的核苷酸)的存在、同一性和/或完整性。
可以使用如WO2008/102120中所描述的设备来执行所述方法。
所述方法涉及在纳米孔与如本文所描述的转移核苷酸或饲养分子相互作用期间测量穿过纳米孔的电流。因此,所述设备还包括能够施加电势并且测量膜和纳米孔两端的电信号的电路。可以使用贴片钳或电压钳来执行所述方法。所述方法优选地涉及使用电压钳。
参考图13,仅仅通过说明的方式,检测装置可以具有包括至少一个检测元件1的任何形式。元件1包括定位于基质11内的纳米孔12。所述元件能够被操作以在饲养分子易位通过纳米孔期间从包括连接的转移核苷酸的饲养分子13进行测量。描绘了能够提供测量的示例系统。所述图示出了电子电路3的布置,所述电子电路可以用于实施包括一个或多个元件的系统的一个元件。电子电路3可以连接到相对于系统的一个或多个检测元件1的电极22,并且连接到公共电极21。电子电路3可以任选地具有如WO2011/067559中所描述的整体布置。可以如下布置电子电路3,以控制每个检测元件1两端的偏置电压的施加并从每个检测元件1进行测量。
图14展示了电子电路3的示例性非限制性布置,所述图示出了相对于单个传感器元件1的组件,所述单个传感器元件可以针对多元件系统中的传感器元件1中的每个传感器元件被复制。在此布置中,电子电路3包含检测通道30和偏置控制电路31,各自连接到传感器元件1的传感器电极22。
检测通道30从传感器电极22进行测量。检测通道30被布置成放大来自传感器电极22的电信号。因此,检测通道30被设计成以足够的分辨率放大非常小的电流,以检测由纳米孔内的核苷酸单元的移动所引起的特征变化。检测通道30还被设计成具有足够高的带宽,以提供检测每个这种相互作用所需的时间分辨率。具体地,检测通道30可以如WO2010/122293或WO2011/067559中详细描述的那样布置。
偏置控制电路31向传感器电极22提供用于关于检测通道30的输入偏置传感器电极22的偏置电压。
在正常操作期间,选择由偏置控制电路31提供的偏置电压,以使饲养分子能够易位通过纳米孔。本文描述了这种偏置电压,并且其通常可以具有高达-200mV的电平。
也可以选择由偏置控制电路31提供的偏置电压,使得其足以从纳米孔喷射易位饲养分子。通过使偏置控制电路31提供这种偏置电压,传感器元件1可操作以喷射易位通过纳米孔的饲养分子。为了确保可靠的喷射,偏置电压通常为反向偏置,尽管这并不总是必需的。当施加此偏置电压时,检测电路30的输入被设计成即使在呈现负电流(与正常电流的幅值类似,通常幅值为50pA到100pA)时也保持在恒定偏置电势下。
通常,每个检测元件的电子电路3连接到数据处理器用于进一步分析。
可以使用适用于实施纳米孔插入到如本文所描述的基质中的纳米孔系统的任何设备来执行本发明的方法。
在本发明的方法中,纳米孔通常作为纳米孔、电控制装置和检测装置的检测元件的组件提供。纳米孔定位于基质内。如本文所描述的,所述基质限定了基质的顺式侧和基质的反式侧。酶和多核苷酸合成分子邻近反式侧上的纳米孔提供。将游离转移核苷酸或具有连接的转移核苷酸的饲养分子从顺式侧引入到纳米孔中。
设备通常包括包含水溶液的室,并且基质将室分成两部分:在基质的顺式侧上的顺式室和在包括酶和多核苷酸合成分子的基质的反式侧上的反式室。基质的顺式侧和反式侧通常包括通过纳米孔的通道流体连通的反应室或反应体积。游离转移核苷酸或包括转移核苷酸的饲养分子通过将转移核苷酸或饲养分子引入到如本文所描述的顺式室中而与纳米孔接触。
可以提供多个检测元件以形成检测元件的系统。可以提供多个检测元件以形成包括系统的检测元件的阵列。所述反应室可以是反应单元的组件。通常,每个检测元件可以作为单独的反应单元的组件提供。每个反应单元可以提供有单独的试剂,并且可以被结构化成以便防止其间的流体和电连通。如此,每个反应单元中的每个纳米孔可以以独立的方式提供,并且具有可单独寻址的能力,以便合成不同预定义序列的不同多核苷酸分子。通过构造包括多个反应单元的系统,可以并行执行多个合成反应,所述多个合成反应各自合成具有预定义序列的不同多核苷酸分子(多重合成)。
在本文所描述和定义的任何方法中,纳米孔可以定位于系统的反应室内,其中所述系统包括纳米孔的阵列,其中所述基质将所述反应室分成顺式反应室部分和反式反应室部分,每个纳米孔提供通过所述基质从所述顺式反应室部分到所述反式反应室部分的通道。
在任何这种方法中,所述系统可以包括公共顺式室部分,并且其中反式反应室部分可以包括彼此流体隔离的反式室的阵列,其中每个反式室通过包括所述纳米孔的基质与所述顺式室分开;其中能够在不同的反式反应室中合成不同序列的多核苷酸合成分子,并且其中能够独立地控制施加在每个反式反应室和所述顺式反应室两端的电势差。
反应室,并且优选地是反式反应室可以作为如上所述的电介质上电润湿系统(EWOD)内的液滴提供。
EWOD系统提供了介质涂覆表面(dielectric-coated surface),其促进了呈微滴形式的非常小的液体体积的微流体操纵(参见例如Chou,W-L.等人(2015)《液滴微流体应用的最新进展(Recent Advances in Applications of Droplet Microfluidics)》,《微型机器(Micromachines)》,6:1249-1271)。可以通过电润湿技术在芯片上可编程地产生、移动、分区和组合液滴体积。
因此,电润湿和其它系统提供了将多核苷酸移动到不同位置的方式,例如在合成之后出于如连接多核苷酸以合成较大的多核苷酸的目的,如本文所述。在被移动之前,多核苷酸可以被扩增,例如通过PCR或通过本文所述的任何其它合适的扩增方法。
可以用于本发明的合成方法的其它微流体平台是可获得的。例如,通常用于核酸操纵的基于乳液的微滴技术可以与微流体装置结合使用。在这种系统中,微滴形成于通过混合两种不混溶流体(通常是水和油)产生的乳液中。乳液微滴可以用作反应室,特别是反式反应室,并且可以可编程地在微流体网络中产生、移动、分区和组合。水凝胶系统也是可获得的。
在本文所描述和定义的用于执行本发明的合成方法的任何设备、装置或系统中,可以提供其中顺式室或顺式反应室或其部分提供有本文所描述和定义的任何类型的一种或多种饲养分子的设备、装置或系统。
数据存储
由于形成多核苷酸分子结构的核碱基的同一性和序列的差异,多核苷酸分子能够天然地存储在其内编码的信息。通过根据特异性核碱基序列合成新的多核苷酸分子,可以利用多核苷酸分子的天然数据存储功能来存储新信息,因此所述核碱基序列可以编码多核苷酸分子内的新信息,随后可以访问或“读取”所述信息以检索信息。
因此,本发明另外提供了一种在多核苷酸分子中存储数据的方法,所述方法包括:(a)通过本文所描述和定义的任何一种合成方法用一个或多个转移核苷酸延伸多核苷酸合成分子来执行第一延伸反应,由此产生第一核苷酸序列;和(b)通过本文所描述和定义的任何一种合成方法用一个或多个另外的转移核苷酸进一步延伸多核苷酸合成分子来执行一个或多个另外的延伸反应,由此在所述多核苷酸合成分子中产生第二或另外的核苷酸序列,其中所述序列指示编码到延伸的多核苷酸分子中的信息。
新信息可以例如以数字形式编码到多核苷酸分子中。
因此,本发明另外提供了一种将数据以数字形式存储在多核苷酸分子中的方法,所述方法包括:(a)通过本文所描述和定义的任何一种合成方法用一个或多个转移核苷酸延伸多核苷酸合成分子来执行第一延伸反应,由此在所述多核苷酸合成分子中产生指示数字信息位的“0”或“1”状态的核苷酸序列;以及(b)通过本文所描述和定义的任何一种合成方法用一个或多个另外的转移核苷酸进一步延伸所述多核苷酸合成分子来执行第二延伸反应,由此在所述多核苷酸合成分子中产生指示所述位与步骤(a)中产生的位相反的状态的核苷酸序列。
任何这种方法可以包括多次重复步骤(a)和(b)以产生指示数字信息的多个位的核苷酸序列。在任何这种方法中,步骤(a)的一个或多个转移核苷酸不同于步骤(b)的一个或多个转移核苷酸。
核苷酸序列可以以任何合适的方式掺入到多核苷酸合成分子中以指示数字信息位的“0”或“1”状态。例如,可以使用两种不同物种的转移核苷酸来产生数字信息位。例如,可以通过在第一循环中掺入腺嘌呤(A)核碱基,然后在第二后续循环中掺入胞嘧啶(C)来延伸多核苷酸合成分子。因此,多核苷酸分子中的A的存在可以指示数字信息位的“0”或“1”状态。因此,邻近A并置的C的存在可以指示位的相反状态。因此,在序列中掺入多个AC核碱基对可以允许数字信息以位的形式编码到多核苷酸分子中。A和C仅作为实例提供。可以使用任何核碱基,条件是所述核碱基可以彼此区分。
掺入交替物种的单个核碱基是产生数字信息位的一种方式。可替代地,可以通过在相同或连续的合成循环中掺入两个或更多个(即,第一串)相同或不能区分的物种的核碱基来产生位,所述合成循环因此可以指示数字信息位的“0”或“1”状态。这之后可以是在相同或连续的合成循环中掺入两个或更多个(即,第二串)相同或不能区分的物种的核碱基,所述合成循环因此可以指示与先前产生的位相反的位状态。可以使用任何核碱基,条件是第一串的核碱基可以与第二串的核碱基区分开。第一和第二串不需要由相同数量的核碱基组成,因为第一与第二串之间的转变指示数字信息位的“0”或“1”状态与所述位的相反状态之间的转变。
本文所描述和定义的任何多核苷酸延伸方法之后可以是测定延伸的多核苷酸序列的步骤。可以使用纳米孔(如在多核苷酸延伸方法中使用的纳米孔)、使用本领域众所周知的纳米孔测序技术来执行这种步骤。通过另外的实例,可以在将数据存储在多核苷酸分子中的方法之后执行测定延伸的多核苷酸序列的步骤,如本文所述,例如以提供写入-读取系统。
可以使用本文所描述和定义的任何装置、设备和系统来执行任何这种数据存储方法。
实例
以下实例提供用于展示本发明,但其不限制本发明。
实例1:示例合成电压循环。
将仅仅通过说明的方式参考图12(A到D)并且进一步参考图1和8来描述示例合成电压循环。
a–提供具有连接的核苷酸的饲养分子的异质混合物
纳米孔定位于基质中。
邻近基质的反式侧上的纳米孔提供酶,如聚合酶。酶优选地通过本文所描述的任何方式连接到纳米孔。
提供在基质的反式侧上待延伸的多核苷酸合成分子。多核苷酸合成分子优选地例如通过如本文所描述的偶联部分拴系到酶。在本实例中,所述偶联部分是由与多核苷酸合成分子杂交的环状多核苷酸分子构成的支架分子。环状多核苷酸支架分子优选地包括如本文所描述的通用核碱基。
在连接到预定义转移核苷酸的膜的顺式侧提供饲养分子的群体。可以连接例如如本文所描述的任何核苷酸。因此,基质将酶/多核苷酸合成分子与饲养分子分开。饲养分子的每个群体具有连接的相同物种的预定义转移核苷酸。出于说明的目的,在本实例中示出了四个群体,所述四个群体各自包括一个饲养分子。实际上,将在每个群体中提供许多饲养分子。每个群体可以与其它群体组合提供,作为在膜的顺式侧的溶液中的群体的异质混合物。
B-捕获饲养分子和检查核碱基
从A移动到B,施加电压+V1以将饲养分子捕获到纳米孔中。当纳米孔接触封闭部分B1(其是饲养分子的双链区(图7))时,饲养分子在纳米孔中暂停,使得待掺入的核碱基保持在孔本身内,并且可以通过如本文所描述的第一验证过程中的检测来标识。在此位置处,待掺入的核苷酸与酶物理分离,使得酶不能作用于核苷酸。
理想地直接检测待掺入的核碱基,并且因此关于其存在、不存在或对其的任何损伤的信息可以用于做出关于是否将饲养分子进一步移动通过纳米孔的决定并且检查核苷酸的成功掺入。可替代地或另外地,可以通过饲养分子序列中的可变条形码部分来标识连接到饲养分子的核碱基。
从B移动回A,如果在执行第一验证过程之后,测定定位于纳米孔中的核碱基不是期望的转移核碱基,或如果测定核碱基损伤,则施加反向电压或减小的电压以使饲养分子通过纳米孔往回移动并将饲养分子往回释放/喷射到膜的顺式侧上的溶液。
C-使核苷酸与酶接触
从B移动到C,如果在执行第一验证过程之后,测定定位于纳米孔中的核碱基是期望的转移核碱基,则电压可以增加到+V2。电压的增加引起饲养分子(B1)的双链区的一部分去杂交。这允许饲养分子进一步移动到纳米孔中。当封闭部分B2与纳米孔接触并延迟进一步移动时,防止进一步易位。在此位置处,饲养分子定位于纳米孔中,使得连接的转移核苷酸接触酶并且可以掺入到多核苷酸合成分子中。饲养分子可以在纳米孔内的此位置处暂停持续限定时间段,以使成功掺入的效率最大化。
D-测试核苷酸的掺入
从C移动到D,电压减小回到+V1。这允许通过杂交重新形成饲养分子的B1的双链区,从而允许饲养分子在顺式方向上移动并且被“上拉”通过纳米孔。较低电压将饲养分子保留在纳米孔内,使得检测步骤能够被执行以检查核碱基的存在或不存在,以验证成功掺入(第二验证过程)。如果测定不存在核碱基,发信号通知核苷酸成功掺入到多核苷酸合成分子中,则施加反向电压或减小的电压以使饲养分子通过纳米孔往回移动并将饲养分子往回释放/喷射到膜的顺式侧上的溶液。然后可以重复整个循环,以便掺入另外的且不同的核苷酸。
从D移动回到C,如果核碱基保持连接到饲养分子,则电压可以增加回到+V2,以使饲养分子返回到纳米孔中的位置,此时核苷酸可以接触酶。
电压循环
图15示出了以上所概述的说明性方案的示例电压循环和对应的电流值。
电压:
V1=足以捕获具有连接的核苷酸的饲养分子的电压。核苷酸保持在纳米孔中以检测核苷酸并检查核苷酸的核碱基的同一性和/或完整性。
V2=如果检测到期望转移核苷酸所施加的电压,较高电压能够使饲养分子在反式方向上移动通过纳米孔到达借此核苷酸可以与酶接触的位置。
VE=喷射电压。这可以是例如反向电压、零电压或低于V1的电压。电压是足以使饲养分子在顺式方向上移动通过纳米孔到从纳米孔喷射并且返回到基质的顺式侧的溶液中的点的任何电压。在将施加电压返回到V1以便将不同的饲养分子吸引到纳米孔中之前,预期VE将被实施为非常短寿命的脉冲。
当前电平:
开孔是当纳米孔未被饲养分子占据时测量的电流。
A/T/G/C/0是在第一验证期间在施加电压V1下针对分别具有A/T/G/C或无核苷酸(0)的饲养分子测量的饲养分子的电流电平。
下降=当饲养分子在较高的V2电压下“下降”时测量的电流电平。换言之,当饲养分子进一步移动通过纳米孔使得连接的转移核苷酸接触酶并且可以掺入到多核苷酸合成分子中时测量的电流电平。
在本实例中,所有的饲养分子示出为具有相同的下降电流—这假设在饲养分子中没有条形码差异、在接头中没有差异并且当核苷酸处于“下降”位置时没有电流变化。
示例施加电压序列:
下文所描述的是受控施加电压和测量电流的示例可能序列,以形成序列ATC。
起始循环:
V1>捕获饲养分子并且检测不想要的T>喷射VE>
V1>捕获饲养分子并且检测不想要的C>喷射VE>
V1>捕获饲养分子并且检测不想要的G>喷射VE>
V1>捕获饲养分子、检测具有损伤碱基的饲养分子>喷射VE>
V1>捕获饲养分子、检测不具有碱基的饲养分子>喷射VE>
V1>捕获饲养分子并且检测期望的A>通过施加V2下降>
V1检查>A仍然存在>通过施加V2再次下降>
V1检查>无碱基存在—指示成功掺入>喷射VE>
重复循环:
V1>捕获饲养分子并且检测不想要的G>喷射VE>
V1>捕获饲养分子并且检测期望的T>通过施加V2下降>
V1检查>无碱基指示成功掺入>喷射VE>
重复循环:
V1>捕获饲养分子并且检测不想要的G>喷射VE>
V1>捕获饲养分子并且检测不想要的G>喷射VE>
V1>捕获饲养分子、检测不具有碱基的饲养分子>喷射VE>
V1>捕获饲养分子并且检测期望的C>通过施加V2下降>
V1检查>C仍然存在>通过施加V2再次下降>
V1检查>无碱基指示成功掺入。
实例2—用于捕获和递送转移分子的示例性系统。
图16是用于在膜(5)中的纳米孔(4)两端捕获和递送转移分子(3)以延伸合成分子(6)的系统的示意性非限制性示例性说明。图1B展示了从转移分子的混合池(标记为A/B/C)捕获的单个转移分子(3)的捕获。转移分子可以例如是核苷酸(如本文所描述的转移核苷酸)。合成分子可以例如是多核苷酸(如本文所描述的多核苷酸合成分子)。
可以通过改变系统的条件来控制转移分子的捕获和递送,例如可以使用具有在膜的任一侧上连接溶液的电极的电子电路来控制系统两端的电压。
软件可以实时监测系统,例如在膜两端施加电压下测量通过纳米孔的电流,并且响应于电流变化主动控制电压。转移分子(3)可以借助于饲养分子(2)通过纳米孔(4)递送到膜(5)的相反侧,此时转移分子从饲养子分离并且转移到合成分子(6),例如通过酶(7)介导的催化。当从转移分子池捕获时,可以测定转移分子和饲养子的同一性。可以通过将不想要的捕获的转移分子喷射回混合源池来控制期望的转移分子的转移。可以通过控制系统的电压和条件来控制捕获和喷射,例如软件可以监测通过纳米孔的电流以测定指示事件的变化,所述事件包含转移分子或饲养分子的捕获、转移分子或饲养分子的丢失、转移分子或饲养分子的同一性等。饲养分子任选地具有暂停或防止饲养分子的部分或完全易位的阻断剂(封闭部分;1)。阻断剂将纳米孔中的转移分子保持在受限体积中,防止丢失到膜的相反侧上的本体溶液(bulk solution)中并且使足够的时间能够用于在受控位置中发生转移反应。在转移到合成分子之后,饲养分子可以任选地被喷射回到膜的原始侧,或通过纳米孔完全易位到达相反侧。
实例3—涉及连接和核酸内切酶的示例性系统。
图17是借助于连接和限制性酶来延伸具有转移核苷酸的多核苷酸合成分子的系统设置的非限制性示例性示意图。图17展示了膜中的纳米孔,所述膜将反式侧上的多核苷酸合成分子与顺式侧上的转移核苷酸池分开。膜的反式侧还含有转移核苷酸(例如酶、辅因子、多核苷酸)的连接和分离所需的组分和/或条件。例如,如图17A)所示,反式侧可以含有用于接合核苷酸的连接酶、用于切割核苷酸的限制性酶以及可以与多核苷酸合成分子和/或转移核苷酸杂交以产生双链多核苷酸的区的互补多核苷酸。所述膜的一侧上的组分理想地是稳定的并且将不会交叉反应。反应理想地仅在转移核苷酸通过纳米孔递送时发生。
施加到膜两端的电极的电压可以用于控制转移核苷酸从顺式侧上的转移核苷酸的混合池的捕获,以将其通过纳米孔递送到多核苷酸合成分子的附近。可以在捕获期间例如通过测量电流的变化来测量转移核苷酸以测定其是否是期望的物种,并且然后如果不是正确的物种,则喷射(通过减小或反转电压),或如果是正确的物种,则穿过到达相邻侧(通过保持或增加所施加的捕获电压)。当易位通过纳米孔时,转移核苷酸可以借助于连接而接合到多核苷酸合成分子。转移核苷酸可以通过限制性核酸内切酶与饲养分子分开。图17展示了多核苷酸合成分子上的粘性双链突出端如何可以与转移核苷酸杂交以帮助连接。所述图展示了小的互补寡核苷酸(hyb)如何可以与转移核苷酸杂交,这产生了限制性核酸内切酶的识别位点以切割链并且还再生了粘性双链突出端用于下一个连接循环。在转移多核苷酸转移之后,可以通过改变电压来喷射饲养分子,或允许其逃逸回到顺式侧(在一些实施例中,饲养子可以完全易位通过到反式侧)。
应当理解,提供上述系统是为了说明多核苷酸合成分子可以通过多个转移核苷酸同时延伸的一种机制。可以通过所述机制实现这一点的其它机制对于技术人员来说将是显而易见的。上述实例不应以任何方式被解释为限制性的。
实例4—涉及连接和核酸内切酶的另外的示例性系统。
图18示出了使用连接和限制通过纳米孔将转移核苷酸转移到多核苷酸合成分子的另外的非限制性实例。在图18(A)中,所述系统在膜的顺式侧上含有转移核苷酸的混合池,以在膜的反式侧上延伸多核苷酸合成分子。系统被设计成使得仅当分离的组分在膜的反式侧上集合在一起时才可以发生反应。
图18展示了具有连接的寡核苷酸系链的纳米孔的使用,所述连接的寡核苷酸系链用于将多核苷酸合成分子保留在纳米孔附近。寡核苷酸系链通过本领域已知的方式例如马来酰亚胺封端的合成寡核苷酸连接到纳米孔,所述马来酰亚胺封端的合成寡核苷酸与引入到纳米孔的外部区的适当暴露区的半胱氨酸修饰反应。如果纳米孔是寡聚的,则纳米孔理想地通过本领域已知的方式产生为具有单个系链,例如通过使用经过修饰的和未经过修饰的蛋白质单体的混合物并纯化具有期望数量的经过修饰的单元的物种。
膜的顺式侧含有转移核苷酸的混合池,例如图18A中标记为A和B的两个物种。转移核苷酸连接到多核苷酸饲养分子。饲养分子被条形码化,使得在纳米孔中捕获时,转移核苷酸的同一性可以通过电流信号的特征(例如,电流阻断的程度)来测定。在其它实例中,在馈送到所述纳米孔中时,可以直接测定转移核苷酸。饲养分子具有阻断剂(封闭部分),例如结合到末端3'-生物素的链霉亲和素。当在施加电势下捕获时,阻断剂阻止转移分子和饲养分子的完全易位,使其能够在合成分子的附近保持足够的时间以使连接过程发生。在图上标记了转移核苷酸的5'端。转移核苷酸的5'端被磷酸化以实现连接。理想地,反式侧上的核苷酸均未被5'-磷酸化以防止任何不想要的连接。
反式侧含有合成多核苷酸。图18A中标记了多核苷酸合成分子的5'端和3'端。合成分子的5'端与纳米孔的反式侧上的纳米孔系链互补,使其在合成过程期间能够保留与纳米孔杂交。末端5'-端具有用于连接测序衔接子的合适的化学物质,例如BCN炔烃点击化学以使得能够连接到测序衔接子上的3'-叠氮化物。5'端被理想地设计成防止在正和负施加电压两者下与纳米孔的任何相互作用,直到连接到测序衔接子为止。这可以通过控制多核苷酸的几何形状、位置和端结构来实现。多核苷酸合成分子的3'端是由通过纳米孔递送的转移核苷酸延伸的端。3'端具有互补多核苷酸,所述互补多核苷酸杂交以产生具有粘性突出端的双链端(例如,由4个碱基凹进的3'-凹陷),以促进有效连接。应当理解,本领域的技术人员可以设计任何数量的端以控制连接化学物质,包含单链、平端双链和5'或3'突出端双链结构。
反式侧还含有促进接合和切割反应以将转移核苷酸递送到合成多核苷酸所需的所有组分和辅因子。例如,所述图展示了连接酶、限制性核酸内切酶和互补寡核苷酸(hyb)的使用。
所述图展示了在施加电压(例如,+100mV)下从膜的顺式侧通过纳米孔转移核苷酸的捕获(A>B)。如果检测到不正确的转移核苷酸,则可以在发生连接/切割反应之前迅速地降低电压(例如,降低到0mV,从而允许核苷酸通过扩散逃逸)或反转(例如,降低到-20mV)(B>A)。如果检测到期望转移核苷酸,则电压可以保持足够长的时间以允许发生连接和切割反应(B)。所述图展示了转移核苷酸的5'-磷酸化端如何与多核苷酸合成分子3'-端的互补突出端杂交,并且借助于连接将转移核苷酸的5'端接合到多核苷酸合成分子的3'端。还可以设计连接序列和端结构,使得新形成的连接不能被也存在于溶液中的限制性酶切割(例如,通过选择转移核苷酸的5'端上的不重建限制性酶的识别序列的核苷酸)。
所述图展示了可以如何借助于限制性核酸内切酶切割将转移核苷酸从饲养分子裂解。例如,这可以涉及来自膜的反式侧上的溶液的小的寡核苷酸与转移核苷酸的杂交,产生识别位点用于序列特异性限制性核酸内切酶的后续结合,其然后切割转移核苷酸以将其从饲养分子释放。所述序列可以被设计成使得例如限制性酶在多核苷酸合成分子的3'端上留下粘性突出端,以促进下一轮连接。在切割反应之后,可以释放饲养分子。理想地,系统被配置成使得饲养分子在切割时丢失回到顺式侧,因为在适度施加电压的电泳条件下没有足够的力来保持其被俘获。这种丢失和返回到开孔电流指示切割反应已经发生,所述切割反应可以通过监测孔的软件检测到,以启动反应的下一个循环。可替代地,可以在指定的时间(对于成功反应的高概率是足够的)之后反转电压,以喷射饲养分子。此过程可以采用不足以捕获多核苷酸合成分子或反式侧上的其它元件的平缓电压。
理想地,连接反应发生在切割反应之前。这可以例如通过控制连接酶和限制性核酸内切酶以及互补hyb的相对浓度来控制。
在延伸过程结束时,可以重复所述方案,将另一个转移核苷酸连接到多核苷酸合成分子。
实例5—描述重复延伸的示例性系统。
此实例详述了其中多核苷酸合成分子(在这种情况下是DNA)通过连接源自从膜的顺式到反式通过纳米孔递送的饲养分子(在这种情况下是DNA寡核苷酸)的转移核苷酸而重复延伸的方案。
表1和图19-21示出了此实例中所描述的序列。多核苷酸合成分子(DL2)与互补寡核苷酸(DL1)杂交,所述互补寡核苷酸与纳米孔系链杂交以将多核苷酸合成分子保留在纳米孔上。图20示出了饲养子-转移核苷酸分子DL3(“A”)和DL4(“B”)。其包含以下元件(参见表1):
●所述饲养子中的条形码部分,用于当在纳米孔中捕获时进行标识,在这种情况下是polydT或polydC;
●通用序列,用于含有在反式溶液中的互补寡核苷酸(DL5)的杂交;
●编码器序列,所述编码器序列用于对所存储的信息进行编码;在这种情况下是polydT或polydC;
●与由限制性核酸内切酶产生的突出端具有互补性的序列;在这种情况下是5'-GTAAC;
●3'-生物素-链霉亲和素连接,用于连接阻断剂链霉亲和素以将饲养分子保留在纳米孔中。
用于重复延伸起始子的示例性方法如下:
●首先使多核苷酸合成DNA分子(具有用于进入的转移核苷酸的3'-粘性凹陷的DL2+DL1)与纳米孔的反式侧上的纳米孔系链杂交(图19);
●具有条形码的饲养子-转移核苷酸分子从顺式体积捕获,并且在施加到顺式的正电势下部分易位(例如,+100mV)通过纳米孔,并且通过生物素-链霉亲和素键保持在纳米孔中(图21A);
●通过在保持在纳米孔中的同时所测量的流过所述纳米孔的电流,通过纳米孔中的条形码区来标识饲养子-转移核苷酸分子;
●如果捕获了不正确的饲养分子,并且电势被反转(例如,-20mV)或降低到较低的施加电势(例如,+20mV)以喷射饲养分子,并且一旦喷射,则再次施加电压以捕获另一个饲养分子(例如+100mV);
●如果检测到正确的转移核苷酸,则将电压保持在适度电压以保留转移核苷酸(例如,+50mV到+100mV)以允许发生以下反应:
○以反式方式提供的DNA连接酶(例如,T3或T4 DNA连接酶)将转移核苷酸(DL3或DL4)的粘性5'-磷酸化/5Phos/GTAAC端连接到多核苷酸合成分子(DL2)的3'端(图21B)。限制性核酸内切酶不能裂解连接的产物,因为其留下了具有限制性酶的不正确的序列的瘢痕位点(scar site);
○与饲养分子的通用部分互补的阻断剂寡核苷酸以反式方式与饲养子-转移核苷酸分子杂交,形成限制性核酸内切酶切割位点(例如,所描述的序列被设计成用于通过BstEII限制性酶切割)(图21C);
○以反式方式提供的合适的限制性酶(例如,BstE II)从转移核苷酸裂解饲养分子(图21D);
●理想地,饲养分子在切割时自发地从纳米孔丢失到顺式侧,因为在适度电压条件下,减少的长度不足以将其保留在纳米孔中(图21E)。可替代地,电压可以降低到零或低电压(例如+20mV到-20mV),以测试是否可以喷射转移核苷酸(即,限制性切割已经发生)。
●在成功延伸之后,循环可以重复任意次数,以进一步延伸合成多核苷酸。
●在合成循环结束时,可以通过纳米孔测序在相同纳米孔上表征最终的多核苷酸合成分子。例如,多核苷酸合成分子(DL2)的示例序列含有允许连接纳米孔测序衔接子的5'点击反应性DBCO基团,然后可以在高负施加电压(例如,-180mV)下将其捕获在纳米孔中,用于测序和验证连接的序列。
实例的详细描述
通过将单价链霉亲和素(500nM四聚体)与含250nM DL3和250nM DL4的5mL缓冲液(25mM磷酸钾,150mM铁氰化钾,150mM亚铁氰化物,pH 8.0)一起温育以产生反式混合溶液来形成饲养子-转移核苷酸-单价链霉亲和素缀合物。
制备含有多个孔(所述多个孔各自包括如本文所描述的反应室)的电化学流动池(flow cell),通过用反式混合溶液填充所述孔、在所述孔的顶部上形成嵌段共聚物膜并且用缓冲液(25mM磷酸钾,150mM铁氰化钾,150mM亚铁氰化物,pH 8.0)填充所述流动池的顶部室,从而将饲养子-转移核苷酸-单价链霉亲和素缀合物截留在所述孔中。将具有单个吗啉代寡核苷酸连接系链的生物纳米孔(序列:5'-GGAACCTCTCTGACAA-接头-3'-纳米孔)插入到膜中。用缓冲液(25mM磷酸钾,150mM铁氰化钾,150mM亚铁氰化物、pH 8.0)从流动池冲洗过量的孔。
多核苷酸合成分子是通过在双工粘接缓冲液(Duplex Annealing Buffer)(美国集成DNA技术公司(Integrated DNA Technologies,Inc.))中粘接40μM的DL001和40μM的DL002而形成的。将混合物加热到95℃,并且以-0.1℃/分钟的速率缓慢冷却到室温。通过使含150μL的1μM多核苷酸合成分子溶液的合成缓冲液(25mM HEPES-KOH(pH 8.0,在37℃下)、400mM谷氨酸钾、20mM乙酸镁、10mM ATP)流入流动池中并将所述流动池温育持续15分钟来将多核苷酸合成分子连接到孔。然后通过将500μL合成缓冲液冲洗通过流动池,将过量的多核苷酸合成分子从流动池去除。
然后将合成混合物(150μL)引入到流动池中,如下所示:10个单位BstEII限制性核酸内切酶(NEB,目录#R0162);3,000个单位T3 DNA连接酶(NEB,目录#M0317);1μM DL005,在合成缓冲液中。
通过将以下电压方案施加到流动池的所选孔在34℃下启动合成,由此使连接到未经过修饰的未选择孔中的纳米孔的多核苷酸合成分子作为内部对照:
●+180mV到流动池的顶部室,1分钟,以允许捕获饲养子-链霉亲和素缀合物并发生连接和限制性反应的时间。所捕获的饲养子-转移核苷酸的同一性由当前电流电平特征标识,如由纳米孔中的碱基组合物(分别为DL3和DL4转移核苷酸的polyT或polyC)测定的;
●-20mV到流动池的顶部室,持续0.1秒,如果阻断剂未杂交,则喷射饲养子;
●重复以上持续20个循环。
以上方案是不具有软件监测的非反馈系统,其不控制在任何一个循环中捕获哪个饲养子-转移核苷酸,并且因此用DL3和DL4单元的随机模式延伸多核苷酸合成分子。
按照上述方案,制备流动池以用于测序。
使用标准纳米孔测序方案执行对多核苷酸合成分子的测序。系统的测序用于验证合成的有效性。在其中未应用电压合成方案的那些孔中,仅观察到具有未延伸的多核苷酸合成分子的衔接子。在其中应用合成电压循环的孔中,多核苷酸合成分子被延伸,并且在每个单独的纳米孔通道中的延伸的多核苷酸合成分子的序列反映了其中转移核苷酸已经被捕获的顺序。将来自测序的数据与合成循环期间记录的电流进行比较,以测量合成的有效性。
表1
实例6—转移核苷酸和/或饲养分子通过纳米孔的顺序步进(Sequential
stepping)。
图22展示了如何使用多种阻断剂来顺序地步进转移核苷酸和/或饲养分子通过纳米孔。顺序步进使得能够随着时间的推移分离不同的反应过程。例如,所述图展示了具有连续的临时阻断剂(例如二级结构,如四链体)的饲养分子如何可以通过控制施加电压,以多个阶段使所述分子从顺式侧步进通过纳米孔到反式侧。所述系统可以由反馈软件控制,所述反馈软件监测电流信号并相应地调整电压。所述图展示了在正施加电压下,可以如何首先在纳米孔中捕获连接到饲养分子的转移核苷酸(步骤A>B)。在步骤B)中,可以在足以防止逃逸但不足以克服阻断剂的适度保持电压(例如40mV到100mV)下将所述分子保持在纳米孔中,使时间能够评估所捕获的分子的同一性。在这种状态中,理想地,将过程接合到多核苷酸合成分子的所述连接不能发生(例如,通过连接),因为转移核苷酸的端被空间阻碍而不能结合连接酶或多核苷酸合成分子。在状态B)中,如果测定已经捕获了转移核苷酸的不正确物种,则可以降低或反转电压以将其喷射回到顺式侧(B>A)。如果测定转移核苷酸是期望的物种,则可以增加电压以克服阻断剂,从而继续使链通过到反式侧(B>C)。所述图在步骤C)中展示了可以保持转移核苷酸(例如,在适度或零施加电压下,例如0mV到100mV)以使得能够发生与合成核苷酸的接合反应(例如,通过连接)。在期望的时间段之后(例如,足以确保成功接合的高概率),转移核苷酸然后可以行进C>D以使切割区暴露于切割化学物质(cutting chemistry)。以此方式,所述步骤方案使得能够对检测、接合和切割阶段进行更多的控制。分离检测阶段和接合阶段有助于确保错误的转移核苷酸没有接合到多核苷酸合成分子,并且分离接合阶段和切割阶段有助于防止转移核苷酸在接合发生之前丢失到反式溶液中。
电压方案:
合适的阻断剂是本领域已知的。例如,二级结构(如dsDNA hybs、发夹、四链体)全部可以用于在适度施加电压下暂时暂停多核苷酸。还可以通过施加更高的电压以解链杂交来克服这些类型的阻断剂。可以施加较高的施加电压持续短暂的时间量以使链向前移动,并且在检测到由于多核苷酸向前行进而引起的电流变化时,迅速下降到较低电压。可替代地,可以在短脉冲中增加电压,以试图概率地使链向前移动,穿插有适度保持电压以测量电流,从而测定所述链是否已经行进。
实例7—通过纳米孔递送完整的双链转移核苷酸。
图23展示了完整的双链转移核苷酸通过纳米孔以延伸多核苷酸合成分子的递送。此系统可以通过使用大通道纳米孔来实现,所述大通道纳米孔可以通过完整的双链多核苷酸(未解链),例如包含ClyA、Phi29的纳米孔,或范围为约3nm到约10nm的其它孔。图23示出了如何可以将完整通过纳米孔的dsDNA转移核苷酸接合到多核苷酸合成分子的实例(例如,通过连接)。dsDNA转移核苷酸可以任选地从饲养分子裂解(例如,通过限制性酶)。
实例8—多核苷酸合成分子的连接介导的延伸的另外的实例。
图24展示了另外的连接实例,但不需要从饲养分子分离转移核苷酸。在步骤A)>B)中,具有二级结构的转移核苷酸被捕获在纳米孔中并且部分易位。二级结构(例如,如所示的发夹dsDNA部分)防止在中等施加电压下的完全易位。在捕获期间,可以测量转移核苷酸以测定期望转移核苷酸是否已经从可获得的池中被捕获,并且如果捕获了不正确的物种,则可以(通过降低或反转施加电压)将其喷射回。转移核苷酸可以在中等施加电压下保持在纳米孔中,以使易位部分能够连接到多核苷酸合成分子的时间足够长。连接可以通过酶催化来介导,例如通过包含在含有多核苷酸合成分子的一侧上的连接酶。连接可以通过设计如图所示的组件来改善,以产生dsDNA的短部分,从而夹住接合的间隙。例如,转移核苷酸可以被设计成包含dsDNA的发夹部分,其可以在易位通过纳米孔期间被解链之后再杂交,形成夹住转移核苷酸的递送端的短的互补杂交区。可替代地,可以通过在含有多核苷酸合成分子的区室中包含互补寡核苷酸链来产生dsDNA到夹板连接的部分。在连接之后,通过短暂施加高电压以克服二级/封闭结构,转移核苷酸可以完全易位通过纳米孔。图24展示了发夹如何在易位后重新形成,以提供用于连接下一个转移核苷酸的位点。可以重复所述过程以继续延伸多核苷酸合成分子,挑选哪些转移核苷酸通过以用于连接。
应当理解,所公开方法和产品的不同应用可以根据本领域的特定需要而定制。还应理解,本文所使用的术语仅出于对本发明的特定实施例进行描述的目的而并不旨在是限制性的。
如在本说明书和所附权利要求中所使用的,单数形式“一个(a)”、“一种(an)”和“所述(the)”包含复数指示物,除非上下文另外明确指明。因此,例如,提及“连接多核苷酸”包含两个或更多个这样的多核苷酸,提及“支架多核苷酸”包含两个或更多个这样的支架多核苷酸等。
本文所引用的所有公开、专利和专利申请特此通过引用整体并入。
Claims (108)
1.一种用转移核苷酸延伸多核苷酸合成分子的方法,所述方法包括延伸过程,所述延伸过程包括:使所述转移核苷酸通过纳米孔的通道从基质的顺式侧移动到反式侧,所述纳米孔安置在所述基质中;以及使所述转移核苷酸与在邻近所述纳米孔的所述基质的所述反式侧上提供的酶接触,此时所述酶催化所述转移核苷酸向所述多核苷酸合成分子转移,由此延伸所述多核苷酸合成分子。
2.根据权利要求1所述的方法,其中所述转移核苷酸是未封闭的核苷酸。
3.根据权利要求1或权利要求2所述的方法,其中所述转移核苷酸连接到饲养分子,并且其中所述转移核苷酸在掺入到所述多核苷酸合成分子中之前从所述饲养分子裂解。
4.根据权利要求3所述的方法,其中所述转移核苷酸通过所述酶裂解。
5.一种用根据权利要求1到4中任一项所述的转移核苷酸延伸多核苷酸合成分子的方法,所述方法包括:延伸过程,所述延伸过程包括:
A.提供包括纳米孔的基质,其中所述纳米孔包括允许流体从所述基质的所述顺式侧流到所述反式侧的通道;在所述基质的所述顺式侧处提供饲养分子,所述饲养分子具有连接的转移核苷酸;在邻近所述纳米孔的所述基质的所述反式侧上提供彼此接近的酶和所述多核苷酸合成分子;以及
B.使所述饲养分子移动通过所述纳米孔,以使所述连接的转移核苷酸与所述酶接触,此时所述酶催化所述转移核苷酸向所述多核苷酸合成分子转移,由此延伸所述多核苷酸合成分子。
6.根据权利要求5所述的方法,其进一步包括:
C.在所述转移核苷酸向所述多核苷酸合成分子转移之后,使所述饲养分子移动通过所述纳米孔到达所述基质的所述顺式侧或所述反式侧。
7.一种用根据权利要求1或权利要求2所述的转移核苷酸延伸多核苷酸合成分子的方法,所述方法包括:延伸过程,所述延伸过程包括:
A.提供包括纳米孔的基质,其中所述纳米孔包括允许流体从所述基质的所述顺式侧流到所述反式侧的通道;在所述基质的所述顺式侧处提供转移核苷酸;在邻近所述纳米孔的所述基质的所述反式侧上提供彼此接近的酶和所述多核苷酸合成分子;以及
B.使所述转移核苷酸移动通过所述纳米孔,以使所述转移核苷酸与所述酶接触,此时所述酶催化所述转移核苷酸向所述多核苷酸合成分子加成,由此延伸所述多核苷酸合成分子。
8.根据权利要求3到7中任一项所述的方法,其中提供具有邻近所述酶的近端和远端的所述多核苷酸合成分子,其中所述酶催化所述转移核苷酸向所述多核苷酸合成分子的所述近端加成。
9.根据权利要求3到6和权利要求8中任一项所述的方法,其中在具有不同连接的转移核苷酸的所述基质的所述顺式侧处提供饲养分子。
10.根据权利要求9所述的方法,其中所述基质的所述顺式侧包括饲养分子在相同反应体积中的混合物,其中所述混合物包括饲养分子的不同群体,其中群体中的每个饲养分子具有连接的相同转移核苷酸,并且其中饲养分子的所述不同群体具有连接的不同转移核苷酸。
11.根据权利要求9或权利要求10所述的方法,其中具有不同连接的转移核苷酸的饲养分子是能区分的。
12.根据权利要求11所述的方法,其中饲养分子能够提供可标识信号以唯一地标识所述连接的转移核苷酸和/或测定所述连接的转移核苷酸的完整性。
13.根据权利要求12所述的方法,其包括:执行第一验证过程以测定所述饲养分子的所述转移核苷酸的同一性和/或完整性,其中:
a)如果测定所述饲养分子具有连接的期望转移核苷酸,则将所述饲养分子移动以使所述转移核苷酸与所述酶接触;或
b)如果测定所述饲养分子不具有连接的所述期望转移核苷酸:
i.则使所述饲养分子移动到所述基质的所述顺式侧或所述反式侧;
ii.使饲养分子从所述基质的所述顺式侧处的所述饲养分子的混合物朝着所述反式侧移动到所述纳米孔中;以及
iii.重复所述第一验证过程,直到测定所述饲养分子具有连接的所述期望转移核苷酸为止,之后将所述饲养分子移动以使所述转移核苷酸与所述酶接触。
14.根据权利要求7所述的方法,其中所述基质的所述顺式侧包括转移核苷酸在相同反应体积中的混合物,其中所述混合物包括不同转移核苷酸的群体。
15.根据权利要求14所述的方法,其包括:执行第一验证过程以测定所述转移核苷酸的同一性和/或完整性,其中:
c)如果测定所述转移核苷酸是所述期望转移核苷酸,则使所述转移核苷酸移动以使所述转移核苷酸与所述酶接触;或
d)如果测定所述转移核苷酸不是所述期望转移核苷酸:
i.则使所述转移核苷酸移动到所述基质的所述顺式侧或所述反式侧;
ii.使转移核苷酸从所述基质的所述顺式侧处的所述转移核苷酸的混合物朝着所述反式侧移动到所述纳米孔中;以及
iii.重复所述第一验证过程,直到测定所述转移核苷酸是所述期望转移核苷酸为止,之后将所述转移核苷酸移动以使所述转移核苷酸与所述酶接触。
16.根据权利要求13所述的方法,其中执行所述第一验证过程,同时所述饲养分子至少部分地处于所述纳米孔的所述通道内。
17.根据权利要求12、13和16中任一项所述的方法,其中当所述转移核苷酸不再连接到饲养分子时,所述饲养分子能够提供不同的可标识信号。
18.根据权利要求17所述的方法,其包括步骤(C):在所述转移核苷酸向所述多核苷酸合成分子转移之后,使所述饲养分子移动通过所述纳米孔到达所述基质的所述顺式侧或所述反式侧,其中仅在第二验证过程之后执行步骤(C),所述第二验证过程被执行以验证所述酶已经催化所述转移核苷酸从所述饲养分子转移到所述多核苷酸合成分子,其中所述第二验证过程包括:
I.使所述饲养分子在顺式方向上移动通过所述纳米孔,并测定所述转移核苷酸的核碱基的存在或不存在;
II.如果测定所述转移核苷酸的所述核碱基连接到所述饲养分子,则使所述饲养分子在反式方向上往回移动以使所述核苷酸与所述酶接触;以及
III.重复步骤(I)和(II),直到测定所述期望转移核苷酸已经从所述饲养分子去除为止。
19.根据权利要求12、13和16到18中任一项所述的方法,其中所述核碱基的同一性和/或完整性和/或连接到所述饲养分子的所述转移核苷酸的存在或不存在是通过测量所述饲养分子来测定的。
20.根据权利要求7、14和15中任一项所述的方法,其中所述转移核苷酸的核碱基的同一性和/或完整性是通过测量所述转移核苷酸来测定的。
21.根据权利要求14或权利要求15所述的方法,其中所述饲养分子或所述转移核苷酸的测量是相对于所述纳米孔进行的。
22.根据权利要求21所述的方法,其中所述饲养分子或所述转移核苷酸是在施加在所述基质两端的电势差的作用下通过测量流过所述纳米孔的离子电流来测量的。
23.根据权利要求22所述的方法,其中流过所述纳米孔的所述离子电流的变化取决于所述核苷酸的核碱基的存在和/或结构,并且由此提供可标识信号以唯一地标识所述转移核苷酸和/或测定所述转移核苷酸的不存在、存在和/或完整性。
24.根据权利要求22或权利要求23所述的方法,其中转移核苷酸连接到饲养分子,并且其中流过所述纳米孔的所述离子电流的变化取决于与所述饲养分子(条形码)成一体的预定义的核碱基序列的存在,并且由此提供所述可标识信号以唯一地标识所述转移核苷酸。
25.根据权利要求23或24所述的方法,其中测量流过所述纳米孔的所述离子电流的变化包括测量流过所述纳米孔的所述离子电流的幅值。
26.根据前述权利要求中任一项所述的方法,其中所述转移核苷酸的所述同一性和/或结构是预定义的。
27.根据前述权利要求中任一项所述的方法,其中所述纳米孔是生物纳米孔,如蛋白质纳米孔;合成纳米孔,如DNA折纸纳米孔;固态纳米孔,如设置在固态基质中的孔口;或混合纳米孔,其包括安置在固态基质内的生物纳米孔或合成纳米孔。
28.根据前述权利要求中任一项所述的方法,其中所述纳米孔的内部宽度介于约0.5nm到>约10nm之间,优选地0.5nm到3nm。
29.根据权利要求27或权利要求28所述的方法,其中所述纳米孔是生物纳米孔,并且包括细胞溶素A(ClyA)或Phi29门户蛋白。
30.根据权利要求27或权利要求28所述的方法,其中所述纳米孔是生物纳米孔,并且包括Curli生产组装/转运组分(CsgG)、α-溶血素、耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白A(MspA)、胞溶素、气单胞菌溶素、细胞毒素K(cytk)或海葵孔蛋白草莓海葵毒素C(actinoporin fragaceatoxin C,FraC)。
31.根据前述权利要求中任一项所述的方法,其中在邻近所述纳米孔的所述基质的所述反式侧上以在溶液中游离的形式提供所述酶。
32.根据权利要求1到30中任一项所述的方法,其中所述酶连接到所述纳米孔;任选地通过基因融合,使得所述纳米孔和所述酶通过一个或多个共价键、通过一个或多个接头或通过亲和力相互作用成为融合蛋白。
33.根据前述权利要求中任一项所述的方法,其中提供了具有拴系到所述酶的近端的所述多核苷酸合成分子。
34.根据前述权利要求中任一项所述的方法,其中所述多核苷酸合成分子包括DNA或RNA。
35.根据权利要求34所述的方法,其中所述多核苷酸合成分子与多核苷酸支架分子杂交以形成双链多核苷酸分子。
36.根据权利要求35所述的方法,其中所述支架分子是环状多核苷酸分子。
37.根据权利要求35或权利要求36所述的方法,其中所述支架分子拴系到所述酶;任选地其中所述多核苷酸合成分子通过与所述支架分子杂交而间接地拴系到所述酶。
38.根据权利要求35到37中任一项所述的方法,其中所述支架多核苷酸分子包括序列,所述序列包括一个或多个通用核碱基,如肌苷;任选地其中所述支架多核苷酸分子包括多肌苷序列。
39.根据权利要求34到38中任一项所述的方法,其中所述酶是DNA引导的DNA聚合酶,并且所述多核苷酸合成分子延伸以形成包括DNA的多核苷酸分子。
40.根据权利要求39所述的方法,其中所述DNA聚合酶缺乏3'到5'核酸外切酶活性和/或缺乏5'到3'核酸外切酶活性和/或具有链置换活性。
41.根据前述权利要求中任一项所述的方法,其中所述转移核苷酸作为包括核碱基、核糖和三个或更多个磷酸基的分子提供。
42.根据权利要求41所述的方法,其中所述核苷酸是脱氧核苷酸三磷酸(dNTP),如dATP、dTTP、dCTP或dGTP或经过修饰的dNTP。
43.根据权利要求34到38中任一项所述的方法,其中所述酶是DNA引导的RNA聚合酶,并且所述多核苷酸合成分子延伸以形成包括RNA的多核苷酸分子。
44.根据权利要求43所述的方法,其中所述核苷酸是核苷酸三磷酸(NTP),如ATP、TTP、CTP或GTP或经过修饰的NTP。
45.根据权利要求1到34中任一项所述的方法,其中所述多核苷酸合成分子是单链多核苷酸分子。
46.根据权利要求45所述的方法,其中所述酶具有末端转移酶活性,例如其中所述酶是末端核苷酸转移酶、polλ、polμ或Φ29 DNA聚合酶,并且所述多核苷酸合成分子延伸以形成包括DNA或RNA的多核苷酸分子。
47.根据权利要求46所述的方法,其中所述酶是末端脱氧核苷酸转移酶,并且所述多核苷酸合成分子延伸以形成包括DNA的多核苷酸分子。
48.根据前述权利要求中任一项所述的方法,其中所述酶能够掺入经过修饰的或非天然的核碱基。
49.根据权利要求3到6、8到13和16到48中任一项所述的方法,其中所述饲养分子包括包含以下的分子:DNA、RNA、肽核酸(PNA)、锁核酸(LNA)、解锁核酸(UNA)、桥接核酸(BNA)、甘油核酸(GNA)、苏糖核酸(TNA)、吗啉代、硫代磷酸酯核酸、甲基膦酸酯核酸、肽、寡肽、多肽、聚合物或其任何组合。
50.根据权利要求3到6、8到13和16到49中任一项所述的方法,其中所述核苷酸在所述饲养分子的末端处连接到所述饲养分子。
51.根据权利要求3到6、8到13和16到49中任一项所述的方法,其中所述转移核苷酸在沿所述饲养分子的长度的位置处连接到所述饲养分子。
52.根据权利要求3到6、8到13和16到51中任一项所述的方法,其中所述饲养分子包括带负电荷的前导分子,例如包括一个或多个C3间隔区的前导分子。
53.根据权利要求3到6、8到13和16到52中任一项所述的方法,其中转移核苷酸通过接头连接到饲养分子。
54.根据权利要求53所述的方法,其中所述接头包括包含一个磷酸基的磷酸基接头或包含两个、三个或更多个磷酸基的多磷酸基接头。
55.根据权利要求53所述的方法,其中所述接头包括烃链,例如包括2到20个或更多个碳原子的烃链,任选地包括亚烷基,例如C2-20亚烷基的烃链。
57.根据权利要求53所述的方法,其中所述接头包括聚合物,例如聚醚聚合物,如聚乙二醇(PEG)。
58.根据权利要求3到6、8到13和16到57中任一项所述的方法,其中所述转移核苷酸连接到饲养分子,并且其中所述饲养分子包括能够唯一地标识饲养分子和与其连接的转移核苷酸的类型的核苷酸序列(条形码)。
59.根据权利要求3到6、8到13和16到58中任一项所述的方法,其中所述饲养分子包括一个或多个封闭部分,其中在所述饲养分子上的位置处提供封闭部分,使得在所述饲养分子移动到纳米孔中到达所述纳米孔中的所关注的位置时,所述封闭部分起到抑制所述饲养分子在所述反式方向上进一步易位的作用,任选地其中一个或多个封闭部分包括可逆的封闭部分。
60.根据权利要求59所述的方法,其中所述一个或多个封闭部分沿所述饲养分子的所述长度提供和/或在所述饲养分子的末端处提供和/或作为所述饲养分子的整体部分提供。
61.根据权利要求59或权利要求60所述的方法,其中封闭部分是连接到所述饲养分子的分子,任选地其中封闭部分是肽、寡肽、多肽、蛋白质或其它聚合物。
62.根据权利要求61所述的方法,其中所述封闭部分通过一个或多个共价键、通过亲和力相互作用或通过一个或多个接头连接到所述饲养分子。
63.根据权利要求61或权利要求62所述的方法,其中封闭部分是包括链霉亲和素或辣根过氧化物酶(HP)的蛋白质。
64.根据权利要求59或权利要求60所述的方法,其中封闭部分包括所述饲养分子的一部分。
65.根据权利要求64所述的方法,其中所述封闭部分包括在所述饲养分子内形成的二级或三级结构的一部分。
66.根据权利要求65所述的方法,其中所述二级结构的一部分包括所述饲养分子的双链区、核酸双螺旋区、核酸茎环结构(发夹)区、核酸十字形或假结结构、未配对核苷酸的环状区、核酸凸起区、四链体区、交联核酸区或其任何组合。
67.根据权利要求3到6、8到13和16到66中任一项所述的方法,其中所述饲养分子进一步包括一个或多个饲养分子拴系部分;其中在捕获所述饲养分子并且将其易位到所述纳米孔中之前,饲养分子拴系部分可逆地将饲养分子拴系到所述基质。
68.根据权利要求67所述的方法,其中所述饲养分子拴系部分包括疏水分子。
69.根据权利要求68所述的方法,其中所述饲养分子拴系部分包括脂质分子,任选地固醇分子,如胆固醇。
70.根据权利要求59到69中任一项所述的方法,其包括在所述反式方向上使所述纳米孔中的所述饲养分子移动到所述纳米孔中的所关注的第一位置,此时所述封闭部分起到抑制所述饲养分子进一步易位的作用;并且进一步包括在去除所述封闭部分时、或在所述封闭部分的构象改变时和/或在所述饲养分子的构象改变时,在所述反式方向上使所述纳米孔中的所述饲养分子移动到所述纳米孔中的一个或多个所关注的第二位置。
71.根据权利要求70所述的方法,其进一步包括在重新连接封闭部分时或在封闭部分的所述构象改变时和/或在所述饲养分子的所述构象改变时,在所述顺式方向上使所述饲养分子通过所述纳米孔往回移动到所述所关注的第一位置或到所关注的第三位置。
72.根据权利要求70或权利要求71所述的方法,其中所述所关注的第一位置或第三位置是所述纳米孔中的不足以使所述转移核苷酸接触所述酶的位置,并且其中所述所关注的第二位置中的至少一个是所述纳米孔中的足以使所述转移核苷酸与所述酶接触的位置。
73.根据权利要求70到72中任一项所述的方法,其中所述饲养分子包括核酸并且提供有包括所述饲养分子的双链区的至少一个可逆的封闭部分,所述方法进一步包括使所述纳米孔中的所述饲养分子移动到所述所关注的第一位置,此时所述双链区起到抑制所述饲养分子在所述反式方向上进一步易位的作用;并且其中所述饲养分子经受使所述双链区的链在所述区的至少一部分内分离的条件,此时所述饲养分子进一步易位到所关注的第二位置。
74.根据权利要求70到72中任一项所述的方法,其中在所述饲养分子在所述纳米孔中移动到所述所关注的第一位置时,执行所述第一验证过程。
75.根据权利要求73或权利要求74所述的方法,其中当所述饲养分子处于所关注的第二位置时,所述饲养分子经受使所述双链区的所述链在所述区的至少一部分内再粘接的条件,此时所述饲养分子在所述纳米孔中在所述顺式方向上往回移动到所述所关注的第一位置或第三位置。
76.根据权利要求71到75中任一项所述的方法,其中在所述饲养分子在所述顺式方向上往回移动到所述纳米孔中的所述所关注的第一位置或第三位置时,执行所述第二验证过程。
77.根据权利要求3到6、8到13和16到76中任一项所述的方法,其包括通过在所述基质两端施加电压(V)来使所述纳米孔中的所述饲养分子移动。
78.根据权利要求77所述的方法,其中通过改变施加在所述基质两端的电压来控制在所述基质的所述反式方向上使饲养分子移动到纳米孔中、在所述反式方向上使饲养分子移动到所关注的第一位置以及在所述反式方向上使饲养分子移动到所关注的第二位置的步骤。
79.根据权利要求77或权利要求78所述的方法,其中通过改变施加在所述基质两端的电压来控制在所述顺式方向上使饲养分子从所关注的第二位置往回移动到所关注的第一位置或所关注的第三位置的步骤以及使所述饲养分子移出所述纳米孔并且往回移动到所述基质的所述顺式侧的步骤。
80.根据权利要求3到6、8到13和16到79中任一项所述的方法,其中可逆的封闭部分的作用是通过施加在所述基质两端的电压的作用来控制的。
81.根据权利要求3到6、8到13和16到80中任一项所述的方法,其中所述纳米孔偶联到饲养分子处理部分,所述饲养分子处理部分促进所述饲养分子移动到所述纳米孔中并通过所述纳米孔,并且其中所述延伸过程包括使所述饲养分子与所述饲养分子处理部分接触以及使所述饲养分子移动到所述纳米孔中并通过所述纳米孔。
82.根据权利要求81所述的方法,其中所述饲养分子处理部分是聚合酶、核酸酶、解旋酶或拓扑异构酶,如旋转酶。
83.根据权利要求82所述的方法,其中所述饲养分子处理部分是phi29 DNA聚合酶、T7DNA聚合酶、His 1 DNA聚合酶、His 2 DNA聚合酶、芽孢杆菌噬菌体M2 DNA聚合酶、链球菌噬菌体CPI DNA聚合酶、肠杆菌噬菌体PRD1 DNA聚合酶或其任何变体或衍生物。
84.根据权利要求81到83中任一项所述的方法,其中所述纳米孔通过基因融合偶联到饲养分子处理部分,使得所述纳米孔和所述饲养分子处理部分通过一个或多个共价键、通过一个或多个接头或通过亲和力相互作用成为融合蛋白。
85.根据前述权利要求中任一项所述的方法,其中所述纳米孔偶联到一个或多个纳米孔衔接子部分;其中与在不存在衔接子部分的情况下的效率相比,所述衔接子部分增加了所述纳米孔与所述饲养分子之间相互作用的效率。
86.根据权利要求85所述的方法,其中所述纳米孔衔接子部分是环状分子,任选地其中所述衔接子是七聚体的或六聚体的。
87.根据权利要求86所述的方法,其中所述纳米孔衔接子部分是环糊精或其衍生物,其任选地选自由以下组成的组:γ-环糊精(γ-CD)、β-环糊精(β-CD)、6-单脱氧-6-单氨基-β-环糊精(am1β-CD)、七-6-氨基-β-环糊精(am7-β-CD)、七-(6-脱氧-6-胍基)-环糊精(gu7-β-CD)、β-环糊精(α-CD)。
88.根据权利要求85到87中任一项所述的方法,其中所述纳米孔通过基因融合偶联到纳米孔衔接子部分,使得所述纳米孔和所述纳米孔衔接子部分通过一个或多个共价键、通过一个或多个接头或通过亲和力相互作用成为融合蛋白。
89.根据前述权利要求中任一项所述的方法,其中所述基质包括包含两亲分子的膜。
90.根据权利要求1到89中任一项所述的方法,其中所述基质是固态基质。
91.根据权利要求90所述的方法,其中所述纳米孔是在固态基质中形成的孔口。
92.根据权利要求90或权利要求91所述的方法,其中所述纳米孔是混合纳米孔,所述混合纳米孔包括安置在所述固态基质中或安置在形成于所述固态基质中的孔口中的生物纳米孔或合成纳米孔,优选地其中所述纳米孔是如在权利要求27到30中定义的任何纳米孔。
93.根据前述权利要求中任一项所述的方法,其中所述延伸过程是第一延伸过程,并且所述方法进一步包括重复所述延伸过程一次或多次以用一个或多个另外的转移核苷酸进一步延伸所述多核苷酸合成分子。
94.根据前述权利要求中任一项所述的方法,其进一步包括使用所述多核苷酸合成分子作为模板来合成互补多核苷酸分子的步骤,由此形成包括与所述互补多核苷酸分子杂交的所述多核苷酸合成分子的双链多核苷酸分子。
95.根据权利要求94所述的方法,其进一步包括优选地通过聚合酶链反应(PCR)扩增所述双链多核苷酸分子的步骤。
96.根据权利要求94或权利要求95所述的方法,其进一步包括将双链多核苷酸分子与使用不同纳米孔合成的另一个双链多核苷酸分子连接的步骤。
97.根据前述权利要求中任一项所述的方法,其中纳米孔定位于系统的反应室内,其中所述系统包括纳米孔的阵列,其中所述基质将所述反应室分成顺式反应室部分和反式反应室部分,每个纳米孔提供通过所述基质从所述顺式反应室部分到所述反式反应室部分的通道。
98.根据权利要求97所述的方法,其中所述反式反应室部分包括彼此流体隔离的反式室的阵列,其中每个反式室通过包括纳米孔的基质与所述顺式室分开;其中能够在不同的反式反应室中合成不同序列的多核苷酸合成分子,并且其中能够独立地控制施加在每个反式反应室和所述顺式反应室两端的电势差。
99.根据权利要求97或98所述的方法,其中顺式反应室部分和/或反式反应室部分是液滴,任选地包括油包水液滴。
100.根据权利要求99所述的方法,其中液滴是电介质上电润湿系统(EWOD)或微流体系统的组件。
101.根据前述权利要求中任一项所述的方法,其中能够通过饲养分子递送通道如管,例如碳纳米管向纳米孔提供饲养分子。
102.一种用于执行根据前述权利要求中任一项所述的方法的多核苷酸合成系统,所述系统包括:
(a)反应室的阵列,所述反应室各自包括纳米孔,其中反应室彼此流体隔离;并且其中每个反应室包括包含纳米孔的基质,并且其中所述基质将所述反应室分成顺式反应室部分和反式反应室部分,其中顺式反应室部分和反式反应室部分通过所述纳米孔中的通道彼此流体连通;其中每个反应室进一步包括在邻近所述纳米孔的所述基质的所述反式侧上彼此接近的酶和多核苷酸合成分子;
(b)用于将任选地连接到饲养分子的转移核苷酸递送到顺式反应室部分中的装置,任选地其中每个顺式反应室部分进一步包括一个或多个递送通道,所述一个或多个递送通道被配置成向所述纳米孔递送转移核苷酸;
(c)用于在每个反应室的所述基质两端提供电压的装置;优选地电极,并且其中所述基质安置在阳极与阴极之间;以及
(d)用于检测流过每个反应室的所述纳米孔的离子电流的装置,优选地施加到所述纳米孔或与其邻近的电极。
103.根据权利要求102所述的系统,其中顺式反应室部分和/或反式反应室部分是液滴,任选地包括油包水液滴,例如其中所述基质包括不同液滴之间的界面,并且其中所述纳米孔安置在允许液滴之间连通的所述基质内。
104.根据权利要求103所述的系统,其中液滴是电介质上电润湿系统(EWOD)或微流体系统的组件。
105.一种用于与根据权利要求102到104中任一项所述的系统一起使用并且用于执行根据权利要求1到101中任一项所述的方法的试剂盒,所述试剂盒包括反应试剂的体积,所述反应试剂包括任选地连接到饲养分子的转移核苷酸,所述试剂盒任选地进一步包括用于组装反应单元的试剂,所述反应单元包括安置在基质中的纳米孔,任选地酶和任选地多核苷酸合成分子,所述试剂盒进一步任选地包括阵列,所述阵列包括用于组装反应单元的反应室。
106.一种在多核苷酸分子中存储数据的方法,所述方法包括:(a)通过根据权利要求1到100中任一项所述的方法用一个或多个转移核苷酸延伸多核苷酸合成分子来执行第一延伸反应,由此产生第一核苷酸序列;以及(b)通过根据权利要求1到100中任一项所述的方法用一个或多个另外的转移核苷酸进一步延伸所述多核苷酸合成分子来执行一个或多个另外的延伸反应,由此在所述多核苷酸合成分子中产生第二核苷酸序列或另外的核苷酸序列,其中序列指示编码到延伸的多核苷酸分子中的信息。
107.一种在多核苷酸分子中以数字形式存储数据的方法,所述方法包括:(a)通过根据权利要求1到100中任一项所述的方法用一个或多个转移核苷酸延伸多核苷酸合成分子来执行第一延伸反应,由此在所述多核苷酸合成分子中产生指示数字信息位的“0”或“1”状态的核苷酸序列;以及(b)通过根据权利要求1到100中任一项所述的方法用一个或多个另外的转移核苷酸进一步延伸所述多核苷酸合成分子来执行第二延伸反应,由此在所述多核苷酸合成分子中产生指示所述位与步骤(a)中产生的位相反的状态的核苷酸序列。
108.根据权利要求107所述的方法,其包括:重复步骤(a)和(b)多次以产生指示数字信息的多个位的核苷酸序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1801768.1 | 2018-02-02 | ||
GBGB1801768.1A GB201801768D0 (en) | 2018-02-02 | 2018-02-02 | Synthesis method |
PCT/GB2019/050296 WO2019150134A1 (en) | 2018-02-02 | 2019-02-04 | Polynucleotide synthesis method, kit and system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111886339A true CN111886339A (zh) | 2020-11-03 |
Family
ID=61730837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980011491.0A Pending CN111886339A (zh) | 2018-02-02 | 2019-02-04 | 多核苷酸合成方法、试剂盒和系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220177937A1 (zh) |
EP (1) | EP3746553A1 (zh) |
CN (1) | CN111886339A (zh) |
GB (1) | GB201801768D0 (zh) |
WO (1) | WO2019150134A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201604316WA (en) | 2011-05-27 | 2016-07-28 | Oxford Nanopore Tech Ltd | Coupling method |
GB201406155D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB2559117B (en) | 2017-01-19 | 2019-11-27 | Oxford Nanopore Tech Ltd | Double stranded polynucleotide synthesis method, kit and system |
GB201811811D0 (en) | 2018-07-19 | 2018-09-05 | Oxford Nanopore Tech Ltd | Method |
GB201913039D0 (en) * | 2019-09-10 | 2019-10-23 | Oxford Nanopore Tech Ltd | Polynicleotide synthesis method kit and system |
GB201917742D0 (en) * | 2019-12-04 | 2020-01-15 | Oxford Nanopore Tech Ltd | Method |
CN115398008A (zh) * | 2020-04-14 | 2022-11-25 | 成都今是科技有限公司 | 纳米孔制备和检测方法及其检测装置 |
EP4177331A4 (en) * | 2020-07-02 | 2024-07-31 | Geneus Tech Chengdu Co Ltd | METHOD AND DEVICE FOR NUCLEIC ACID SEQUENCING |
WO2022038144A1 (en) * | 2020-08-18 | 2022-02-24 | Kemijski inštitut | Novel nanopore-forming polypeptides |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111534504B (zh) * | 2014-01-22 | 2024-06-21 | 牛津纳米孔科技公开有限公司 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
WO2016028843A2 (en) * | 2014-08-19 | 2016-02-25 | President And Fellows Of Harvard College | Rna-guided systems for probing and mapping of nucleic acids |
GB201418469D0 (en) * | 2014-10-17 | 2014-12-03 | Oxford Nanopore Tech Ltd | Method |
WO2017184677A1 (en) * | 2016-04-21 | 2017-10-26 | President And Fellows Of Harvard College | Method and system of nanopore-based information encoding |
GB201609221D0 (en) * | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
-
2018
- 2018-02-02 GB GBGB1801768.1A patent/GB201801768D0/en not_active Ceased
-
2019
- 2019-02-04 US US16/966,430 patent/US20220177937A1/en active Pending
- 2019-02-04 WO PCT/GB2019/050296 patent/WO2019150134A1/en unknown
- 2019-02-04 CN CN201980011491.0A patent/CN111886339A/zh active Pending
- 2019-02-04 EP EP19704433.2A patent/EP3746553A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220177937A1 (en) | 2022-06-09 |
WO2019150134A1 (en) | 2019-08-08 |
EP3746553A1 (en) | 2020-12-09 |
GB201801768D0 (en) | 2018-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111886339A (zh) | 多核苷酸合成方法、试剂盒和系统 | |
CN116334200B (zh) | 使用纳米孔确定多核苷酸特征的方法和用于该方法的复合物 | |
US20200239950A1 (en) | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores | |
CN103733063B (zh) | 偶联方法 | |
CN109312401B (zh) | 连接的核酸的纳米孔测序方法 | |
CN106687574B (zh) | 使用对纳米颗粒或纳米颗粒附近锚定的系链检测事件的组合物,系统和方法 | |
CN106715453B (zh) | 用于生产带标签的核苷酸的化学方法 | |
US8324360B2 (en) | High throughput nucleic acid sequencing by expansion | |
CN117363706A (zh) | 通过纳米孔指导的核酸检测方法 | |
US20220042967A1 (en) | Method of encoding data on a polynucleotide strand | |
CN115976176A (zh) | 靶分析物测定方法、突变CsgG单体及其构筑体、及聚核苷酸和寡聚孔 | |
CN109196116B (zh) | 一种表征靶多核苷酸的方法 | |
CN116334198A (zh) | 分析物的测定和表征方法及试剂盒 | |
CN115968410A (zh) | 表征移动穿过纳米孔的多核苷酸的方法 | |
CN112189054A (zh) | 方法 | |
CN118574941A (zh) | 方法 | |
CN112204154A (zh) | Dna-孔隙-聚合酶复合物的酶促富集 | |
WO2023222657A1 (en) | Method and adaptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Oxfordshire Applicant after: Oxford nanopore technology disclosure Co.,Ltd. Address before: Oxfordshire Applicant before: OXFORD NANOPORE TECHNOLOGIES LTD. |
|
CB02 | Change of applicant information |