CN117083392A

CN117083392A - 用于有效掺入核苷酸与3’-磷酸酯和其他3’-终止子的聚合酶

Info

Publication number: CN117083392A
Application number: CN202280022539.XA
Authority: CN
Inventors: 拉多吉·T·德尔马纳茨; 马修·J·卡洛; 斯尼泽纳·德尔马纳茨
Original assignee: MGI Tech Co Ltd
Current assignee: MGI Tech Co Ltd
Priority date: 2021-03-19
Filing date: 2022-03-17
Publication date: 2023-11-17
Also published as: EP4308718A1; WO2022194244A1

Abstract

提供了将3’‑阻断核苷酸掺入DNA延伸产物中的变体家族A聚合酶、包含此类聚合酶的试剂盒以及在DNA延伸反应(例如测序反应)中使用聚合酶的方法。

Description

用于有效掺入核苷酸与3’-磷酸酯和其他3’-终止子的聚合酶

相关申请的交叉引用

本申请要求2021年3月19日提交的临时申请号63/163,629的优先权，该临时申请通过引用并入以用于所有目的。

背景技术

先前建议将3’-磷酸酯-修饰的可逆核苷酸掺入模板化DNA链中以用于序列测定的目的。Tsien等人.,WO1991006678A1报道了利用T4多核苷酸激酶的3’磷酸酶活性作为磷酸酯阻断基团转化为可延伸的3’-羟基基团的机制。尽管建议使用DNA聚合酶进行链延伸，但没有提供可掺入3’磷酸酯的合适聚合酶的信息。

还提出了以与3’OH基团可逆的方式将延伸的非模板化DNA链的3’磷酸酯阻断基团掺入以进一步延伸的可能性的报告。美国专利号5,990,300描述了出于链合成而非模板序列确定的目的而添加核苷酸，并建议使用脱氧核苷酸末端转移酶来添加终止子。建议的掺入条件包括使用锰和100μM核苷酸浓度。

Zhou等人.(美国专利号9,650,406)进一步报道了利用3’单磷酸酯作为阻断基团但没有成功的尝试；并进一步注意到在糖部分的3’氧上掺入了包含磷酸二酯基团的可逆终止子。他们建议将9°N-7(外切)聚合酶的突变体形式例如Therminator^TM(New EnglandBiolabs)、KOD DNA聚合酶和增强型DNA聚合酶的外切突变体、或EDP(WO 2005/024010)作为适合掺入的聚合酶。

Fa等人.2004(Fa等人.,J.Am.Chem.Soc.126,1748–175,2004)报道了使用噬菌体展示与表达酶和寡核苷酸引物底物的共定位来确认具有掺入2’-O-甲基核糖核苷三磷酸能力的Taq聚合酶Stoffel片段突变体。他们在Ile614、Glu615、Phe667、Tyr671、Asn750和Gln754位点进行随机诱变，因为据报道它们与镁和三磷酸酯核苷酸结合相关联。在单独的文库中，选择了Arg573、Met747、Gln754、Val783、His784和Glu786，因为据报道它们与引物末端结合相关联。他们选择了多个候选物，并确定了一种SFM19(其具有Ile614Glu和Glu615Gly突变)作为掺入2’-O-甲基核糖核苷三磷酸的最强候选物。氨基酸614和615形成聚合酶中保守的基序A的一部分，并且如在聚合酶(如Klenow)的同源区域中一样，被认为形成限制2’-OH核苷酸掺入的立体门(steric gate)的一部分。Glu615，或Klenow中的同源Glu710处的突变先前已显示促进rNTP的掺入(Astatke,等人.,Proc.Natl.Acad.Sci.USA95:3402–3407；1998；Patel等人.,J.Biol.Chem.275:40266–40272,2000).)。还提出适应取代的核苷酸而进行的Taq 615的突变然后需要614突变来维持活性(Fa等人，同上)。

Chen等人.(Chen等人.,Nat Chem.8:556–562,2016)在SFM19底物上进行了多达4轮的选择，以修饰氨基酸，这些氨基酸被认为对于允许C2’-OMe修饰的核苷酸在C2’-OMe修饰的引物上的持续掺入很重要。他们确认了SFM19的几种变体为SFM4-3、SFM4-6和SFM4-9。据报道，每个变体都能完全转录C2’-OMe修饰的寡核苷酸，但在SFM4-6中观察到最大的活性。对其中一种突变体(SFM4-3)的分析表明，扩增C2’-修饰的寡核苷酸的能力是由于稳定了手指和拇指结构域之间的相互作用，这有利于催化活性阻断复合物的形成。Ong等人(Ong,等人.,J Mol Biol.361:537–550,2006)报道了突变体AA40(E602V、A608V、I614M、E615G)，其具有掺入2’取代核苷酸(例如2’-氟-和2’-叠氮基-衍生物)的类似特性，但值得注意的取代基(如NH2或OCH3)仅延伸得很差。

Ghadessy等人.(Ghadessy等人.,Proc.Natl.Acad.Sci.USA 98,4552–4557,2001)确认肝素耐受性增加的突变体，其与4-3和4-6共有一些相同的突变。H15(K225E、E388V、K540R、D578G、N583S、M747R)是在高达肝素抑制浓度130倍的情况下在PCR中保持完全功能的Taq聚合酶的一种变体。

Davis等人.(WO2001014568)报道了在E681处进行取代的Taq聚合酶，其具有改善的耐盐性。

Brandis等人.(美国专利申请公开号20150232822)报道了D655和E681是可被取代以提高标记核苷酸接受度的几个氨基酸中的两个。

Guo于2016年选择SFM19聚合酶用于掺入2’磷酸酯修饰的核苷酸(哥伦比亚大学2016Guo论文)。Guo报道了确认可掺入3’阻断核苷酸的聚合酶的困难，但描述了使用SFM19掺入2’-磷酸酯-修饰的核苷酸，并具有抑制掺入后进一步延伸的相关益处。通过酶去除2’磷酸酯基团可以继续延伸。然而，尚不清楚SFM19是否可以维持持续的掺入和切割循环以及在延伸引物上生成2’-OH残基。

Taq聚合酶残基667和T7 DNA聚合酶762被认为是用于掺入双脱氧核苷酸的重要残基，当苯丙氨酸被酪氨酸取代时，这些修饰核苷酸的接受度增加(Tabor,等人.,Proc NatlAcad Sci USA 92:6339–6343,1995)。

Taq 614位的野生型氨基酸是疏水性异亮氨酸，但在sfm19中它被带负电荷的谷氨酸取代。Patel等人.(Patel,等人,J Biol Chem.276:5044–5051,2001)报道I614转化为带正电荷的赖氨酸增加了在受损底物上延伸引物的能力，但可能会降低保真度。

Chen等人.(F.Chen,等人,Proc.Natl.Acad.Sci.USA 107:1948–1953,2010)使用重建进化适应性路径(REAP)过程来识别可以促进3’-ONH2修饰核苷酸掺入的关键氨基酸。接受修饰核苷酸的活性变体包括L616A和F667Y的取代。与I614G和F667Y相比，单独的L616A似乎对3’–ONH2有最大改善的接受度，但I614G和F667Y两者都被证明有与野生型相比对修饰核苷酸的有所改善的接受度。它们还被证明有L616A修饰的能力以改善双脱氧核苷酸的接受度。

掺入庞大3’-基团(BG9、KOD、Taq475、测序酶)的许多聚合酶尚未被证明能有效掺入3’磷酸酯阻断基团。如上所述已知掺入2’磷酸酯核苷酸的SFm19也尚未被证明掺入3’磷酸酯核苷酸。

Thermosequenase具有F667Y突变，使其能够掺入ddNTP，其中酪氨酸(Y)提供–OH基团(在ddNTP的3’位置处缺失)以便Mg++进行结合。Taq475没有F667Y突变，仍然掺入3’–O-NH2，但不掺入3’-磷酸酯核苷酸。

掺入2’-磷酸酯核苷酸的SFm19在A基序中有两个氨基酸突变(位置614和615)。然而，在相应的A-基序(408、409、410)中具有3个突变的变体聚合酶9°N(也称为BG9)不掺入2’-磷酸酯。

发明内容

本节提供了本公开的某些方面的摘要。本发明不限于本节中概括的实施方案。

本公开提供了变体工程化家族A聚合酶，例如Taq聚合酶，其具有突变，这些突变允许3’-磷酸酯核苷酸和3’-O-阻断核苷酸(例如3’-O-硝基苄基(NB)-修饰的核苷酸)模板定向掺入到引物的延伸产物中。一方面，本公开的特征在于包含多肽序列的工程化DNA聚合酶，所述多肽序列包含如参考SEQ ID NO:1所确定的在位置610、611、612、613、614、615、616和617中的三个、四个或五个或更多个处的取代；并且其中多肽序列与SEQ ID NO:1具有至少90％的同一性并且将3’-阻断核苷酸掺入核酸链中。在一些实施方案中，多肽序列包含位置613、614、615、616或617中的三个或更多个处的取代。在一些实施方案中，两个位置被G取代；并且第三个位置被S或T取代。在一些实施方案中，多肽序列在位置613、614、615、616或617中的三个或更多个处包含A或G。在一些实施方案中，位置614、615和616中的每一个均包含相对于SEQ ID NO:1的取代。在一些实施方案中，位置614处的取代是E、A、D、S或G；位置615处的取代是A、G或S；或位置616处的取代是A、G或S。在一些实施方案中，位置614处的取代是E或S；位置615处的取代是G；以及位置616处的取代是A。在一些实施方案中，位置614处的取代是S。在一些实施方案中，位置614是E或S；位置615是G或E；以及位置616是A。在一些实施方案中，工程化聚合酶进一步包含如参考SEQ ID NO:1所确定的在位置667处的取代，例如Y。在一些实施方案中，工程化聚合酶进一步包含如参考SEQ ID NO:1所确定的在位置655、657、681、742和747中的一个、两个、三个或四个处的取代。在一些实施方案中，工程化聚合酶进一步包含如参考SEQ ID NO:1所确定的在位置655、657、681、742和747中的每一个处的取代。在一些实施方案中，位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；或位置747处的取代是R。在一些实施方案中，位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；以及位置747处的取代是R。在一些实施方案中，聚合酶包含位置614处的E、A、D、S或G；位置615处的G；位置616处的A或G；以及位置667处的Y。在一些实施方案中，聚合酶进一步包含位置655处的N；位置657处的M；位置681处的K；位置742处的Q或N；以及位置747处的T。

另一方面，本文提供了包含多肽序列的工程化DNA聚合酶，所述多肽序列包含如参考SEQ ID NO:1所确定的在位置613、614、615、616和617中的两个处的取代；以及在位置667处的取代；其中多肽序列与SEQ ID NO:1具有至少90％的同一性并且将3’-阻断核苷酸掺入核酸链中。在一些实施方案中，两个位置中的每一个处的取代是A、G或S。在一些实施方案中，多肽序列包含如参考SEQ ID NO:1所确定的在位置614和615处的取代。在一些实施方案中，位置614处的取代是E、A、D、S或G；位置615处的取代是G；或位置667处的取代是Y。在一些实施方案中，位置614处的取代是E、A、D、S或G；位置615处的取代是G；以及位置667处的取代是Y。在一些实施方案中，位置614处的残基是A或G。在一些实施方案中，多肽序列包含如参考SEQ ID NO:1所确定的位置615和616处的取代。在一些实施方案中，位置615和616中的每一个处的取代是S、G或A。在一些实施方案中，位置615和616中的每一个处的取代是G或A。在一些实施方案中，工程化聚合酶进一步包含位置655、657、681、742和747中的每一个处的取代。在一些实施方案中，位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；或位置747处的取代是R。在一些实施方案中，位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；以及位置747处的取代是R。

另一方面，本公开的特征在于工程化的家族A聚合酶，其相对于野生型家族A聚合酶序列包含一组两个或更多个取代，所述取代一起提供用于容纳3’-磷酸酯或更大的3’-阻断基团的更大空间，其中取代各自选自由A、G、S、T和C组成的组。在一些实施方案中，家族A聚合酶在家族A聚合酶的对应于Taq聚合酶位置667的位置处进一步包含Y。在一些实施方案中，家族A聚合酶包含基序A中的至少两个位置，其中用G或A取代野生型残基；并且基序A中的至少一个位置包含S或T。在一些实施方案中，基序A的野生型L或I残基在工程化家族A聚合酶中被E、S或T取代。

另一方面，本公开提供了一种将包含3’-阻断取代基的核苷酸掺入DNA分子中的方法，该方法包括在反应混合物中温育本文(例如本节段落中)所述的聚合酶，所述反应混合物包含模板核酸、引物、具有3’-阻断基团的核苷酸；以及用于延伸引物的试剂，其中包含3’-阻断基团的核苷酸与模板核酸中的碱基互补并掺入DNA分子中。在一些实施方案中，核苷酸用可检测标记进行标记。

在附加方面中，本公开提供了一种将包含可逆3’-阻断取代基的第一核苷酸掺入DNA分子中的方法，该方法包括在反应混合物中温育如本文(例如本节段落中)所述的聚合酶，所述反应混合物包含模板核酸、引物、具有3’-阻断基团的核苷酸；以及用于延伸引物的试剂，其中包含3’-阻断基团的核苷酸与模板核酸中的碱基互补，并掺入从引物延伸的延伸分子中；检测包含被掺入延伸分子中的3’-阻断基团的核苷酸；以及除去3’阻断取代基。在一些实施方案中，核苷酸用可检测标记进行标记。在一些实施方案中，该方法进一步包括将反应混合物中的延伸分子与包含可逆阻断取代基的第二核苷酸一起温育；其中包含3’-阻断基团的第二核苷酸与模板核酸中的碱基互补并掺入延伸分子中。

另一方面，本公开提供了一种包含如本文(例如本节段落中)所述的聚合酶的试剂盒。在一些实施方案中，试剂盒进一步包含一种或多种3’-阻断核苷酸。

在其他方面，本公开提供：多核苷酸，其包含编码如本文(例如，本节的段落中)所述的聚合酶的核酸序列；以及包含所述多核苷酸的宿主细胞。

附图说明

图1.一个测序周期的DNB强度图。将从大肠杆菌基因组文库制备的DNB加载到MGI-SEQ 2000测序仪流通池上，然后进行引物杂交。通过将4种核苷酸(dATP-3P、dCTP-3P、dGTP-3P、dTTP-3P)的混合物与DNB反应，用SFr52聚合酶将3’磷酸酯阻断核苷酸掺入。洗掉多余的反应成分后，则使DNB与四种荧光标记抗体的混合物反应，其中每种抗体类型用不同的荧光团标记。抗体克隆是A-18B10、C-2F7、G-6B9和T-12D6。让抗体结合4分钟，然后清洗过量未结合的抗体并成像。表示来自一个成像场的DNB强度。

图2A.MGI-SEQ2000测序仪上连续测序周期的强度变化。显示了背景扣除、相位校正和光谱串扰校正的强度。对于每个成像通道(对应于每个碱基)，描绘了该通道中强度最高的DNB的平均强度。显示6个预选字段的组合数据。上线(X符号)，T；第二行(菱形符号)，A；第三行(方形符号)，G；第四行(圆圈符号)，C。

图2B.在MGI-SEQ2000测序仪上经过20个测序周期，测序的DNB相对于参考人类序列的位置不一致。显示6个预选字段的组合数据。

具体实施方式

术语

本文使用的术语“一种”、“一个”或“该”不仅包括具有一个成员的方面，而且还包括具有多于一个成员的方面。例如，单数形式“一种”、“一个”和“该”包括复数指示物，除非上下文另有明确说明。因此，例如，提及“试剂”包括提及本领域技术人员已知的一种或多种试剂，等等。

如本文所用，“天然”核苷酸是指不包括外源标记(例如，荧光染料或其他标记)或化学修饰(例如阻断取代基)的天然存在的核苷酸。如本文所用，“核苷酸类似物”具有一个或多个修饰，例如化学部分，其替换、去除和/或修饰天然核苷酸的任何组分(例如，含氮碱基、五碳糖或磷酸酯基团)。

核苷酸类似物可以是核酸聚合反应中聚合酶可掺入的或不可掺入的。在一些实施方案中，核苷酸类似物的3’-OH基团用可以是聚合酶延伸的可逆或不可逆终止子的部分修饰。核苷酸的碱基可以是腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶或其类似物中的任一种。任选地，核苷酸具有肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤、硝基吡咯(包括3-硝基吡咯)或硝基吲哚(包括5-硝基吲哚)碱基。核苷酸可包括但不限于ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dUTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。核苷酸还可以含有DNA聚合酶、双脱氧核苷酸或2',3'双脱氧核苷酸的终止抑制剂，其缩写为ddNTP(ddGTP、ddATP、ddTTP、ddUTP和ddCTP)。

如本文所用，“阻断部分”当关于核苷酸类似物使用时，是在核酸聚合反应的掺入步骤期间抑制或防止核苷酸与第二核苷酸形成共价连接(例如，通过核苷酸类似物的3’-OH)的核苷酸的一部分。“可逆终止子”核苷酸的阻断部分可以被修饰或从核苷酸类似物中去除以允许核苷酸掺入。这种阻断部分在本文中被称为“可逆终止子部分”。等效或替代术语包括“阻断基团”、“可逆阻断基团”、“保护基团”、“可切割保护基团”等。示例性可逆终止子部分在WO2016/065248和US2018/0223358中阐述，其通过引用并入。

本文所用的术语“3’-阻断”核苷酸是指具有嘌呤或嘧啶核糖或脱氧核糖部分的核苷酸，其中天然存在的游离3’糖羟基被阻断基团取代，该阻断基团不允许另外的核苷酸被掺入以延伸核苷酸链。在一些实施方案中，3’羟基被3’磷酸酯基团取代。在一些实施方案中，例如，为了测序，然后可以去除3’阻断基团以允许根据需要掺入另外的核苷酸。在本申请中，术语“3’-阻断核苷酸”和“3’-终止子核苷酸”可互换使用。

本文使用的“3’-磷酸酯”核苷酸是指具有嘌呤或嘧啶碱基和核糖或脱氧核糖部分的核苷酸，其中3’糖羟基被修饰以用磷酸酯取代天然存在的3’羟基。

如本文所用的术语“大3’阻断取代基”是指3’糖羟基处的取代基，其尺寸大于天然存在的3’羟基基团。为了说明而非限制，WO 2004/018497和WO2018/148727中还公开了在3’糖羟基处已被修饰使得取代基尺寸大于天然存在的3’羟基基团的核苷酸。

本文中，“掺入”意指通过与修饰的核苷酸的5'磷酸酯基团形成磷酸二酯键，将修饰的核苷酸连接至第二核苷酸的游离3’羟基基团。修饰的核苷酸所连接的第二核苷酸将通常出现在多核苷酸链的3'端。

如本文所用，“模板核酸”是使用本文公开的方法或组合物作用(例如，扩增、检测或测序)的核酸。

可以根据本领域的惯例使用三字母代码或单字母代码来识别氨基酸。

缩写	单字母缩写	氨基酸名称
			Ala	A	丙氨酸
Arg	R	精氨酸
			Asn	N	天冬酰胺
Asp	D	天冬氨酸
			Cys	C	半胱氨酸
Gln	Q	谷氨酰胺
			Glu	E	谷氨酸
Gly	G	甘氨酸
			His	H	组氨酸
Ile	I	异亮氨酸
			Leu	L	亮氨酸
Lys	K	赖氨酸
			Met	M	蛋氨酸
Phe	F	苯丙氨酸
			Pro	P	脯氨酸
Pyl	O	吡咯赖氨酸
			Ser	S	丝氨酸
Sec	U	硒代半胱氨酸
			Thr	T	苏氨酸
Trp	W	色氨酸
			Tyr	Y	酪氨酸
Val	V	缬氨酸
			Asx	B	天冬氨酸或天冬酰胺
Glx	Z	谷氨酸或谷氨酰胺
			Xaa	X	任何氨基酸
Xle	J	亮氨酸或异亮氨酸

如本文所用的“保守”取代是指氨基酸的取代，使得侧基链的电荷、极性、亲水性(疏水性、中性或亲水性)和/或大小得以保持。可相互取代的示例性氨基酸组包括(i)带正电荷的氨基酸Lys和Arg；以及His，pH值约为6；(ii)带负电荷的氨基酸Glu和Asp；(iii)芳香族氨基酸Phe、Tyr和Trp；(iv)脂肪族疏水性氨基酸Ala、Val、Leu和Ile；以及疏水性氨基酸Met；(v)非极性氨基酸Ala、Val、Leu、Ile、Pro、Phe、Trp和Met；(vi)小的极性不带电荷的氨基酸，例如Ser、Thr和Asn；(vii)中性亲水性氨基酸Cys、Ser、Thr、Asn、Gln；(viii)小的疏水性或中性氨基酸Gly、Ala和Pro；(ix)含酰胺氨基酸Asn和Gln；以及(x)支链氨基酸Thr、Val和Ile。在一些实施方案中，保守取代可以基于大小，例如，小的氨基酸可以被另一个小的氨基酸(例如Gly或Ala)取代。在一些实施方案中，含羟基氨基酸(Ser、Thr或Tyr)可以被替代的含羟基氨基酸取代。本段中提到的氨基酸电荷是指pH 6-7的电荷。

当在多肽序列中给定氨基酸残基的确认的上下文中使用时，术语“对应于”、“参考……确定”或“参考……编号”是指当给定的氨基酸序列与参考序列最大比对并比较时指定参考序列的残基的位置。与参考序列比对的多肽不需要与参考序列具有相同的长度。

适合于确定序列同一性和序列相似性百分比的算法是BLAST和BLAST 2.0算法，这些算法分别在Altschul等人.(1990)J.Mol.Biol.215:403-410以及Altschul等人.(1977)Nucleic Acids Res.25:3389-3402中进行了描述。用于执行BLAST分析的软件可通过国家生物技术信息中心(NCBI)网站公开获取。该算法涉及首先通过识别查询序列中长度为W的短单词来识别高分序列对(HSP)，当与数据库序列中相同长度的单词比对时，这些短单词匹配或满足某个正值阈值分数T。T被称为邻域词得分阈值(Altschul等人，同上)。这些最初的邻域单词命中充当启动搜索的种子，以找到包含它们的更长的HSP。然后，单词命中沿着每个序列在两个方向上延伸，直到可以增加累积比对分数。对于核苷酸序列，使用参数M(一对匹配残基的奖励分数；总是>0)和N(不匹配残基的惩罚分数；总是<0)来计算累积分数。对于氨基酸序列，使用评分矩阵来计算累积分数。在以下情况下，每个方向上的单词命中的扩展都会停止：累积比对得分从其最大实现值下降了数量X；由于一个或多个负评分残基比对的累积，累积分数降至零或更低；或者到达任一序列的末尾。BLAST算法参数W、T和X决定了比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用默认字长(W)28、期望值(E)10、M＝1、N＝-2以及两条链的比较。对于氨基酸序列，BLASTP程序默认使用字长(W)3、期望值(E)10和BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。出于本申请的目的，使用具有默认参数的BLASTP来确定氨基酸序列同一性。

如本文所用，术语烷基、烯基和炔基包括直链和支链一价取代基。示例包括甲基、乙基、异丁基、3-丁炔基等。可用于本文所述的化合物和方法的这些基团的范围包括C₁-C₂₀烷基、C₂-C₂₀烯基和C₂-C₂₀炔基。可用于本文所述的化合物和方法的这些基团的附加范围包括C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₁-C₆烷基、C₂-C₆烯基、C₂-C₆炔基、C₁-C₄烷基、C₂-C₄烯基和C₂-C₄炔基。

芳基分子包括例如掺入一组或多组平面碳原子(通常为六个碳原子)的环烃，所述碳原子通过编号相同的离域电子连接，就如同它们由交替的单共价键和双共价键组成一样。芳基分子的一个示例是苯。杂芳基分子包括沿着其原子主环链的取代基，例如O、N或S。当引入杂原子时，一组五个原子，例如四个碳和一个杂原子，可以形成芳香族系统。杂芳基分子的示例包括呋喃、吡咯、噻吩、咪唑、噁唑、吡啶和吡嗪。芳基和杂芳基分子还可以包括另外的稠合环，例如苯并呋喃、吲哚、苯并噻吩、萘、蒽和喹啉。除非另有说明，否则芳基和杂芳基分子可以连接在环上的任何位置。

本文所用的术语烷氧基是通过单个末端醚键连接的烷基基团。同样，本文所用的术语芳氧基是通过单个末端醚键连接的芳基基团。

本文所用的术语胺或氨基由式—NZ¹Z²表示，其中Z¹和Z²各自可以是本文所述的取代基，例如氢、烷基、卤代烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基，如上文所述。

本文使用的烷氧基、芳氧基、氨基、烷基、烯基、炔基和芳基分子可以是取代的或未取代的。如本文所用，术语取代包括将取代基团添加至与烷氧基、芳氧基、氨基、烷基、烯基、炔基和芳基的主链连接的位置，例如，用取代基团取代氢。取代基团的示例包括但不限于羟基、卤素(例如F、Br、Cl或I)和羧基基团。相反，如本文所用，术语未取代表示烷氧基、芳氧基、氨基、烷基、烯基、炔基或芳基具有完整的氢补体，即与其饱和水平相当，没有取代，例如直链癸烷(–(CH₂)₉–C。

聚合酶变体

本公开的特征在于家族A聚合酶变体，例如Taq聚合酶变体，其可以掺入阻断3’-磷酸酯核苷酸或其他3’-终止子核苷酸，其中阻断取代基的大小与磷酸酯相似或大于磷酸酯。聚合酶家族A的成员(包括细菌和噬菌体聚合酶)根据与大肠杆菌聚合酶I的氨基酸序列同源性进行分类(Braithwaite和Ito,Nuc.Acids.Res.21:787-802,1993)。因此，家族A聚合酶家族也称为pol I家族。A型聚合酶包括大肠杆菌pol I、水生栖热菌DNA pol I(Taq聚合酶)、黄栖热菌DNA pol I、肺炎链球菌DNA pol I、嗜热脂肪芽孢杆菌pol I、噬菌体聚合酶T5、噬菌体聚合酶T7、线粒体DNA聚合酶polγ，等等。

三个基序A、B和C在所有DNA聚合酶中都是保守的，其中基序A和C在RNA聚合酶中也可见。在一些实施方案中，根据本公开的工程化的家族A聚合酶可以掺入相对于野生型家族A聚合酶序列具有至少两个突变的3’-阻断核苷酸。在一些实施方案中，阻断基团具有3-5或4-15个非H原子。在一些实施方案中，本公开的家族A聚合酶在基序A中具有至少2个或至少3个突变，其产生更大的聚合酶口袋和/或将羟基基团定位得更近以促进与Mg⁺²的相互作用。在一些实施方案中，工程化的家族A聚合酶还在对应于SEQ ID NO:1的位置667的位置处包含Y。在一些实施方案中，工程化的家族A聚合酶包含对基序A中的野生型残基或靠近引物3’末端的基序A区域后面的残基的G、A、S、T或C取代(例如，家族A聚合酶的基序A的区域，其对应于SEQ ID NO:1的位置614-616)。在一些实施方案中，与野生型家族A聚合酶序列相比，工程化的家族A聚合酶在基序A中包含三个或更多个取代。在一些实施方案中，G取代天然残基以便产生最大口袋开口。在一些实施方案中，基序A的至少两个位置是G或A并且至少一个位置是S。在替代实施方案中，基序A的野生型残基被T取代。在其他实施方案中，基序A的多个位置，例如两个或更多个位置，可以具有S、G或A。在一些实施方案中，基序A的三个或更多个位置是S、G或A。在一些实施方案中，家族A聚合酶的基序A的野生型L或I或类似残基被E、S或T或类似残基取代，例如以提供疏水性较小且带更多负电荷或极性中性的环境。在一些实施方案中，工程化的家族A聚合酶可在引物结合结构域中具有一个或多个突变。

在天然存在的聚合酶中，基序A在掌型亚结构域中的β链和α螺旋的连接处含有保守的天冬氨酸。在Taq聚合酶的情况下，该催化天冬氨酸对应于残基D610，使用全长Taq聚合酶序列进行编号。据报道，残基D610与传入的dNTP相互作用并稳定导致磷酸二酯键形成的过渡态。Taq聚合酶的基序A对应于来自位置605-617的13个残基，其中基序的最保守区域对应于残基610至617。

在一些实施方案中，掺入3’-阻断核苷酸的本文所述的聚合酶是生物活性片段。Taq聚合酶的540-氨基酸片段(Stoffel片段，在本领域中也称为KlenTaq片段)的序列提供于SEQ ID NO:1中。该片段缺少N-末端292氨基酸。出于本申请的目的，残基的编号采用全长Taq聚合酶中的位置的编号。SEQ ID NO:1显示Taq聚合酶的残基293至832。因此，在本申请中，SEQ ID NO:1的序列的第一个位置被指定为位置293。Taq聚合酶基序A的来自位置610-617的高度保守部分标有下划线。残基667也加了下划线。

在一些实施方案中，掺入3’-阻断核苷酸的根据本公开的工程化聚合酶，例如工程化Taq聚合酶，在基序A中具有至少两个突变并且在位置667处具有突变。在一些实施方案中，两个或更多个突变位于位置613、614、615、616或617处。在一些实施方案中，位置613、614、615、616或617中的两个或更多个处的取代是G、A、S、T或C。在一些实施方案中，工程化Taq聚合酶在基序A中具有产生更大聚合酶口袋和/或定位羟基基团以促进与Mg⁺²相互作用的至少3个突变，例如在位置613、614、615、616和/或617中的三个或更多个处的取代。在一些实施方案中，聚合酶在位置613、614、615、616或617中的一个或多个处包含S或T。在一些实施方案中，G取代天然残基以便产生最大口袋开口。在一些实施方案中，残基613、614、615、616或617中的至少两个是G或A并且至少一个位置是S。在一些实施方案中，位置614被S取代。在替代实施方案中，位置613、614、615、616或617是T。例如，在一些实施方案中，位置614被苏氨酸取代。在一些实施方案中，位置614是D或T。在一些实施方案中，位置616处的残基被A或G替换。在其他实施方案中，多个位置，例如位置613、614、615、616或617中的两个或更多个是S、G或A。在一些实施方案中，位置613、614、615、616或617中的三个或更多个是S、G或A。在一些实施方案中，位置613和/或位置617是S或T。在一些实施方案中，位置614是S，位置615是G，并且位置616是A。在一些实施方案中，位置614是T，位置615是G，并且位置616是A。在一些实施方案中，位置617是F或K。在一些实施方案中，工程化聚合酶包含位置667处的取代，例如位置667处Y取代F；和/或引物结合结构域中(例如在位置655、657、681、742和747中的一个或多个处)的一个或多个突变，如参考SEQ ID NO:1所确定的。在一些实施方案中，聚合酶包含：位置655处的N；位置657处的M，位置681处的K，位置742处的Q或N，或者位置747处的R。在一些实施方案中，聚合酶包含：位置655处的D或N；位置657处的M或L；位置681处的E或K；位置742处的E、N或Q；以及位置747处的M或R。

在一些实施方案中，掺入3’-阻断核苷酸的工程化聚合酶包含相对于SEQ ID NO:1，在614、615和616处的取代；以及在位置667处的取代。在一些实施方案中，位置614、615和616中的一个、两个或全部是A或G。在一些实施方案中，位置614、615和616中的两个是A或G并且第三个位置是S。在一些实施方案中，位置614处的残基是S或T。在一些实施方案中，位置614处的残基是S或T，位置615处的残基是G或A，并且位置616处的残基是G或A。在一些实施方案中，位置614处的残基是S或T，位置615处的残基是G，并且位置616处的残基是L。在其他实施方案中，位置614处的残基是E，位置615处的残基是G，并且位置616处的残基是L或A。在一些实施方案中，位置614是S，位置615是G，并且位置616是A。在一些实施方案中，工程化聚合酶还可以包含位置613和/或位置617处的A、G或S。在一些实施方案中，工程化聚合酶还可以包含位置613和/或位置617处的T。在一些实施方案中，位置667处的残基是Y。在一些实施方案中，如本段落所述的工程化聚合酶还包含位置655处的N、位置657处的M、位置681处的K、位置742处的N和位置747处的R。

在一些实施方案中，可掺入3’-阻断核苷酸的工程化聚合酶与天然存在的家族A聚合酶具有至少70％、至少75％、至少80％或至少85％同一性。在一些实施方案中，工程化聚合酶与天然存在的家族A聚合酶具有至少90％的同一性。在进一步的实施方案中，工程化聚合酶与天然存在的家族A聚合酶具有至少95％的同一性。在一些实施方案中，聚合酶与天然存在的聚合酶具有不超过99％的同一性，但与天然存在的家族A聚合酶具有至少70％、至少75％、至少80％、至少85％、或至少90％、或95％的同一性。在一些实施方案中，掺入3’-阻断核苷酸的工程化聚合酶与天然存在的家族A聚合酶具有至少70％、至少75％、至少80％或至少85％的同一性；或至少90％的同一性或95％的同一性，并且包含在对应于SEQ ID NO:1的位置614、615和616的位置处的如本文所述的取代；以及在对应于SEQ ID NO:1的位置667的位置处的取代。

在一些实施方案中，可掺入3’-阻断核苷酸的工程化聚合酶包含与SEQ ID NO:1具有至少70％、至少75％、至少80％或至少85％同一性的多肽序列。在一些实施方案中，工程化聚合酶包含与SEQ ID NO:1具有至少90％同一性的多肽序列。在进一步的实施方案中，工程化聚合酶包含与SEQ ID NO:1具有至少95％或更高同一性的氨基酸序列。

在一些实施方案中，聚合酶包含与SEQ NO:2具有至少95％同一性的多肽序列，其中多肽序列包含位置614处的S、位置615处的G、位置616处的A、位置655处的N、位置657处的M、位置667处的Y，位置681处的K，位置742处的N，以及位置747处的R。

聚合酶可以通过重组DNA技术使用任何表达系统产生，即细菌、古细菌或真核生物，包括酵母、哺乳动物等。示例性表达系统描述于例如许多手册中，例如Sambrook&Russell,Molecular Cloning,A Laboratory Manual(2012第4版)；和现行分子生物学方案(Ausubel,等人.,John Wiley and Sons,纽约,1987-第133卷,2020年12月)。因此，本公开附加地提供了编码变体家族A聚合酶(例如Taq聚合酶)的多核苷酸，如本文所述，其掺入3’-阻断核苷酸；包含此类多核苷酸的表达载体；以及表达由多核苷酸编码的蛋白质的转基因宿主细胞。

变体分析

可以对本文所述的变体进行掺入3’阻断核苷酸能力的分析，例如，如实施例部分中所述。在一些实施方案中，对变体进行掺入3’-磷酸阻断核苷酸能力的测试。在一些实施方案中，对变体进行掺入替代性3’-阻断核苷酸(例如3’-O-硝基苄基-修饰的核苷酸)能力的分析。下面详述了评估3’-阻断核苷酸掺入的说明性测定，包括反应条件的示例。这种特殊的测定涉及两个掺入步骤：第一个是测试3’-阻断核苷酸和聚合酶，而第二个是使用不同聚合酶的报告基因核苷酸。引物和模板寡核苷酸在室温下以各自2μM的最终浓度在Tris缓冲盐水(pH 7.5)中组合足以允许引物和模板杂交的时间，例如1小时。聚合酶延伸的反应组分可以分为两部分：一部分包含酶和反应缓冲液，而另一部分具有核苷酸、引物和模板。将两种反应组分在PCR机器中于55℃温育1分钟，然后将核苷酸、引物和模板添加到酶混合物中，然后立即混合。在此说明性测定中，最终反应混合物为10mM Tris缓冲液pH 7.5、50mMKCl、5mM MgSO₄、1μM MnCl₂、0.1μg/μBSA、0.05％triton X-100和3μM核苷酸。引物和模板的最终浓度均为0.1μM，酶的浓度通常为0.05μg/μl。20秒后，通过添加EDTA至最终浓度为20mM来终止反应。然后使反应混合物与96孔微孔板的链霉亲和素包被的孔结合1小时，然后冲洗孔，例如用5X SSC缓冲液冲洗几次，调节至pH 7.0，随后在50mM NaCl、50mM Tris缓冲液pH8.8中冲洗几次。

通过报告基因核苷酸的掺入来检测掺入的阻断终止子的存在。例如，可以使用接受碱基标记的2’,3’双脱氧-修饰的核苷酸的9°N DNA聚合酶变体来执行标记的报告基因核苷酸的掺入。报告基因核苷酸，例如浓度为0.5μM，可以用附着在碱基上的荧光报告基因(例如Cy5或Cy3)进行修饰，并在包括在50mM Tris缓冲液pH 8.8中的50mM NaCl的反应条件下在55℃下进行报告基因核苷酸的掺入反应5分钟。然后用5X SSC缓冲液pH7冲洗板孔，然后在Tris缓冲NaCl pH 8.8中多次冲洗。在Cy3和Cy5染料的适当激发和发射设置下扫描荧光强度。

报告基因核苷酸与模板的P1(引物末端后的第一个位置)和/或P2位置(引物末端后的第二个位置)互补。如果测试核苷酸在P1处成功掺入，则P1报告基因通常会被阻止在P1处掺入。报告基因信号与来自不含测试核苷酸的孔的信号强度的比较用于确定掺入不完全的百分比并设定为100％掺入不完全。最小强度通过在报告基因掺入混合物中不添加聚合酶确定。类似地，100％P2强度水平是由无测试核苷酸反应混合物和延伸1个碱基的引物确定的，以及最小P2强度水平通过未向报告基因掺入混合物中添加聚合酶确定。通过同时报告P2强度，可估计未阻断的核苷酸掺入水平，因为P2强度需要掺入未阻断的P1核苷酸。

本文所述的变体通常表现出在上述测定条件下掺入3’-阻断的终止子核苷酸的至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少75％、至少80％、至少85％或至少90％或95％或更高效率。本领域技术人员理解，还可以使用替代测定来评估3’-阻断终止子核苷酸的掺入。用于确定掺入效率的其他方法包括对在溶液相中延伸1或2或更多个位置的引物进行丙烯酰胺凝胶尺寸分离分析。延长的引物长度的质谱分析也可用于评估核苷酸的掺入。用于确定掺入效率的其他方法可以依赖于附着在碱基上的荧光标记，为此已经确定荧光标记修饰不会干扰掺入潜力。

当变体聚合酶在上述条件下测定时在一分钟内在掺入3’-阻断的终止子核苷酸方面具有至少20％效率或至少50％效率或至少70％效率时，该变体聚合酶即“有效地掺入”3’-阻断核苷酸，例如，3’-磷酸酯-阻断核苷酸。在一些实施方案中，例如，用于测序应用时，变体聚合酶在上述条件下测定时在一分钟内在掺入3’-阻断的终止子核苷酸(例如，3’-磷酸酯-阻断核苷酸)方面可以具有至少90％、至少95％或至少99％的效率。变体聚合酶在掺入3’阻断核苷酸中的每个(即dATP、dTTP、dCTP或dATP 3’-阻断核苷酸中的每个)时通常可以具有至少20％的效率，或至少50％的效率，或至少70％的效率。掺入3’-阻断核苷酸(例如3’-磷酸酯-阻断核苷酸)的变体聚合酶通常对天然核苷酸的偏好低于3’-阻断核苷酸。在一些实施方案中，本发明的变体聚合酶与对应物3’-阻断核苷酸相比对天然核苷酸没有偏好，或者当使用上述测定进行测量时对天然核苷酸具有＜2x或＜3x、＜4x或＜5x的偏好。另外，掺入3’-阻断核苷酸的本发明的变体聚合酶通常表现出对互补碱基的特异性，例如对互补碱基的较多特异性>5x、>10x或>30x至>100x。

使用变体聚合酶的试剂盒/方法

本公开还提供了包括本文公开的变体聚合酶的试剂盒。在一些实施方案中，试剂盒还包含3’-阻断的寡核苷酸和任选的一种或多种用于进行核苷酸聚合的缓冲液。在一些实施方案中，试剂盒包含用于测序的试剂。

在一些实施方案中，所公开的聚合酶组合物和包含此类组合物的试剂盒可用于从核酸分子获得序列信息，例如在大规模并行测序方法中。在一些实施方案中，本文公开的变体聚合酶用于边合成边测序，其中使用可逆3’-终止子核苷酸。在这种方法中，连续的核苷酸被掺入链中。3’阻断核苷酸的存在阻止了核酸链中下一个核苷酸的掺入。在确认3’-阻断核苷酸之后，然后可以例如通过切割去除阻断取代基，以提供游离的3’羟基以允许掺入下一个核苷酸。

在一些实施方案中，3’阻断核苷酸是3’-磷酸酯阻断核苷酸。在一些情况下，此类3’磷酸酯-阻断核苷酸通过用磷酸酶进行酶促切割来去除，所述磷酸酶包括但不限于诸如虾碱性磷酸酶、南极磷酸酶(New England Biolabs)、犊牛肠磷酸酶(Promega Corp.)或快速AP(Thermo-Fisher)之类的磷酸酶。在一些实施方案中，可以使用T4多核苷酸激酶(T4-PNK)实现3’磷酸酯基团的去除。

在一些实施方案中，聚合酶可用于单分子测序。

在一些实施方案中，聚合酶可用于其他目的，例如使用3’-阻断核苷酸来标记核酸。

在一些实施方案中，本公开的变体聚合酶与可逆的3’-阻断核苷酸类似物一起使用。这种类似物包括由式I表示的化合物：

在式I中，R¹是适合用作核苷碱基的含氮碱基。例如，R¹可以是选自由腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)、肌苷(I)和它们的衍生物组成的组的碱基。在一些示例中，R¹可以选自由以下组成的组：

以及/>

在式I中，R²是阻断基团(本文也称为3’-阻断基团)。如上所述，术语“阻断基团”是指可被切割以在核苷酸类似物的3’-位提供羟基基团的任何基团。阻断基团可以通过物理手段、化学手段、热和/或光切割。任选地，阻断基团可通过酶促方式切割。

在一些实施方案中，R²可以是取代或未取代的芳基或杂芳基基团。任选地，R²可以是取代或未取代的苄基基团，任选地具有以下结构：

其中：

n为0、1、2、3或4；并且

R³、R⁴、R⁵、R⁶和R⁷各自独立地选自氢、卤素、氰基、硝基、三氟甲基、烷氧基、芳氧基、取代的或未取代的烷基、取代的或未取代的烯基、取代的或未取代的炔基、取代或未取代的杂烷基、取代或未取代的杂烯基、取代或未取代的杂炔基、取代或未取代的芳基、取代或未取代的杂芳基、取代或未取代的环烷基以及取代或未取代的杂环烷基。

任选地，R²可以是硝基苄基阻断基团。任选地，R²可以选自以下结构：

在一些实施方案中，R²可以是含磷酸酯的阻断基团、含膦酸盐的阻断基团或含次膦酸盐的阻断基团。例如，阻断基团可以是-PO₂H或-

PO₃H₂。在一些实施方案中，R²是含氨基的阻断基团(例如–NH₂)。在一些实施方案中，R²是含烯丙基的阻断基团(例如–CH₂CH＝CH₂)。在一些实施方案中，R²是含叠氮基的阻断基团(例如–CH₂N₃)。在一些实施方案中，R²是含烷氧基的阻断基团(例如–CH₂OCH₃)。在一些实施方案中，R²是聚乙二醇(PEG)。上述R²基团可以是取代的或未取代的。在一些实施方案中，R²是取代的或未取代的烷基(即，取代的或未取代的烃)。

任选地，R²可以是选自由以下组成的组的阻断基团：

本文描述的化合物可以以有机合成领域已知的多种方式或其变形来制备，如本领域技术人员所理解的。本文描述的化合物可以由容易获得的起始材料制备。最佳反应条件可以随所用的特定反应物或溶剂而变化，但此类条件可由本领域技术人员确定。

本文所述的式I和化合物的变化包括如针对每种化合物所述的各种成分的添加、减去或移动。类似地，当分子中存在一个或多个手性中心时，可以改变分子的手性。此外，化合物合成可能涉及各种化学基团的保护和脱保护。保护和脱保护的使用以及适当保护基团的选择可由本领域技术人员确定。保护基团的化学性质可以例如在Wuts,Greene’sProtective Groups in Organic Synthesis,第5版,Wiley&Sons,2014中找到，其通过引用以其整体并入本文。考虑了本文所述的各种化合物的合成和随后的测试以确定功效。

产生本文描述的化合物的反应可以在溶剂中进行，溶剂可以由有机合成领域的技术人员选择。在反应进行的条件(即温度和压力)下，溶剂可以基本上不与起始材料(反应物)、中间体或产物反应。反应可以在一种溶剂或多于一种溶剂的混合物中进行。产物或中间体的形成可以根据本领域已知的任何合适的方法来监测。例如，产物形成可以通过光谱手段如核磁共振光谱法(例如，¹H或¹³C)、红外光谱法、分光光度法(例如，UV-可见光)，或质谱法，或通过色谱法如高效液相色谱法(HPLC)或薄层色谱法来监测。

任选地，本文描述的化合物可以通过使用市售的dNTP来合成。dNTP的3’-位可以通过使化合物与保护基团反应来阻断。

使用包含磷酸酯3’阻断基团的可逆终止子脱氧核糖核苷酸进行边合成边测序(SBS)

本文公开的聚合酶可用于其中组合脱氧核糖核苷酸(dNTP)以产生或延伸核酸聚合物的任何合适的应用。在某些情况下，聚合酶用于大规模并行DNA测序(MPS)方法，包括边合成边测序(SBS)方法。在一些情况下，本文公开的聚合酶变体用于SBS方法，其中通过对可逆终止子核苷酸(RT)的模板-引导的掺入来延伸引物。一方面，可逆终止子核苷酸包括3’磷酸酯阻断基团。SBS需要基于与被测序的多核苷酸的碱基互补性的多个循环的受控(例如，一次一个)核苷酸掺入。在将RT添加到延伸引物的末端后，可以检测掺入。从末端核苷酸中去除3’-阻断基团并再生3’-OH末端后，该过程可以在新的循环中重复。SBS测序反应可以包括10-200或更多个掺入循环。

在常用的SBS方法中，每个RT包含(1)确保DNA聚合酶只能将单个碱基添加到正生长的DNA链(“GDS”，也称为“延伸引物”)3’端的阻断基团，以及(2)可以通过相机检测到的荧光或发光标记。参见，例如Bentley等人.,Nature 456,53-59,2008。荧光或发光标记可以通过可切割接头连接至核苷酸碱基或糖部分。在这种方法中，RT是“标记RT”。

基于SBS的MPS的另一种方法使用直接或间接标记的亲和试剂(例如单克隆抗体或适体)，这些试剂特异性识别和确认其中掺入了未标记RT的延伸DNA引物的末端碱基。参见Drmanac,等人.bioRxiv,doi:10.1101/2020.02.19.953307(2020年2月20日),Drmanac等人.,美国专利申请公开US20180223358和国际公开WO 2020/097607，各自通过引用并入本文。该方法的商业实施方案被称为在该方法中，每个RT包含修饰的核苷酸，其包含阻断基团，该阻断基团确保单个碱基只能通过DNA聚合酶被添加到正生长的DNA拷贝链的3’端但未连接(例如，通过接头)至荧光或发光标记。在该方法中，RT是“未标记RT”或“NLRT”。

在一种方法中，预期标记RT或未标记RT包括作为磷酸酯阻断基团的3’阻断基团。在一种方法中，预期标记RT或未标记RT包括作为磷酸酯阻断基团的3’阻断基团，并且标记RT或未标记RT通过本文所述的DNA聚合酶变体掺入延伸的引物中。在一种方法中，预期标记RT或未标记RT包括3’阻断基团，其是磷酸酯阻断基团并且通过除本文所述的聚合酶变体之外的DNA聚合酶掺入延伸的引物中。还预期本文所述的DNA聚合酶变体用于掺入标记RT或未标记RT，其具有磷酸酯以外的3’阻断基团(例如，叠氮甲基-或3’-O-硝基苄基-修饰的核苷酸)。在一种方法中，预期使用一组核苷酸类似物(例如包含不同碱基的一组4个核苷酸类似物)进行测序，其中一个或多个核苷酸类似物包含3’-磷酸酯阻断基团并且一个或多个核苷酸类似物包含不是3’-磷酸酯阻断基团的阻断基团。

标记RT

在一种方法中，使用至少一种包含3’磷酸酯阻断基团的标记核苷酸类似物进行测序。在该方法中，标记的核苷酸类似物被掺入延伸的引物中，并且基于来自标记的荧光或发光信号来检测掺入。此后，例如通过将标记连接到核苷碱基或糖的接头的切割来去除标记，并且例如通过3’阻断基团的切割来解阻断3’-OH，从而导致3’OH的再生。切割的3’阻断基团和释放的标记在下一个掺入循环之前被洗掉。

未标记RT(NLRT)

在一种方法中，使用至少一种包含3’磷酸酯阻断基团的NLRT进行测序。在该方法中，NLRT被掺入到延伸引物中。使用直接或间接标记的亲和试剂(例如抗体或适体)检测掺入，该试剂根据对指定核碱基的亲和力、对磷酸酯阻断基团的亲和力或对以指定核碱基和磷酸酯阻断基团两者为特征的核苷酸的亲和力，特异性结合掺入的NLRT。此后，(1)将直接或间接标记的亲和试剂去除，以及(2)将3’-磷酸酯基团去除，从而导致3’OH基团的再生。将亲和试剂和磷酸酯基团洗掉。可以按任一顺序或同时除去亲和试剂和磷酸酯基团。参见，例如，美国专利申请公开US 2018/0223358和国际公开WO 2020/097607。

在该方法中，亲和试剂可以是单克隆抗体(mAb)。识别具有3’磷酸酯阻断基团的核苷酸类似物的单克隆抗体可以通过本领域已知的手段来制备。参见下面的实施例5。抗体可以通过与蛋白质IgG重链和轻链内的赖氨酸氨基酸的NHS酯反应进行荧光标记，如先前所描述的(Drmanac等人，bioRxiv，2020，同上)那样。在一些实施方案中，如本文所述的聚合酶用于用3’-磷酸酯-阻断的核苷酸类似物进行的测序，其中亲和剂是识别阻断核苷酸的单克隆抗体。

磷酸酯阻断基团的去除

DNA 3’磷酸酯基团的酶促切割可通过用磷酸酶处理来实现，所述磷酸酶包括但不限于虾碱性磷酸酶、南极磷酸酶(New England Biolabs)、犊牛肠磷酸酶(Promega Corp.)和Fast AP(Thermo-Fisher)。这些和其他磷酸酶是可商购的并且用于酶促去除磷酸酯的条件是已知的。激酶，例如T4多核苷酸激酶(T4-PNK)也可用于去除3’磷酸酯基团(Cameron等人.,1977,3′-Phosphatase Activity in T4 Polynucleotide Kinase.Biochemistry.16,5120–5126)。参见下面的实施例5。

亲和试剂的去除

在检测步骤之后，可以使用任何合适的方法除去亲和试剂，包括例如Drmanac,等人.bioRxiv,doi:10.1101/2020.02.19.953307,2020年2月20日发布；Drmanac等人.,PCT公开WO 2020/097607和美国专利申请公开US20180223358中描述的方法。

***

尽管已经通过说明和示例的方式详细描述了前述内容，但是本领域技术人员将理解，可以在所附权利要求的范围内实施某些改变和修改。

实施例

实施例1.F667Y突变的掺入是A类基序突变

本实施例描述了工程化Taq聚合酶以生成可掺入3’磷酸酯的酶。我们与突变I614E和E615G；以及突变I614E、E615G和L616A一起，纳入了突变F667Y。我们证明，纳入F667Y显著改善了3’磷酸酯掺入的效率。在聚合酶背景中与突变I614E,E615G,D655N,L657M,E681K,E742N和M747R(SFSFr52与SF73相比)一起，纳入F667Y和L616A突变提供了比仅具有I614E、E615G和F667Y突变的聚合酶高一个数量级的效率。引入L616A还提供了约3-4倍的实质性改进(SFr53对比SFM19r5)。

表1.聚合酶变体和相关的氨基酸变化。所有变体均源自Taq DNA聚合酶，并且SF指定变体源自Stoffel片段(Lawyer,等人,PCR Methods Appl.

2,275–287,1993)。第2列中的“Pos’n”是指Taq聚合酶序列中的位置；数字列标题指Taq聚合酶序列中的位置)

/>

通用板测定设计

测试聚合酶的掺入效率。引物和模板寡核苷酸在96孔链霉亲和素包被的微孔板中退火。将模板进行5’生物素化，并在Tris缓冲盐水中以0.1uM模板浓度与链霉亲和素包被的表面结合30-60分钟。然后将引物以1uM引物浓度与结合的模板杂交10分钟。然后将具有碱基A、C、G或T中的每一个的特定测试核苷酸三磷酸酯掺入到模板引物中，所述模板引物与引物末端之后的第一个位置(描述为P1)互补或错配。掺入后，除去反应混合物并洗涤孔，然后添加标记的报告基因核苷酸和聚合酶的第二掺入混合物。报告基因核苷酸通常是双脱氧核苷酸，其在碱基上连接有荧光报告基因，例如Cy5或Cy3。报告基因核苷酸与模板的P1和/或P2位置(引物末端后的第二个位置)互补。如果测试核苷酸在P1处成功掺入，则P1报告基因通常会被阻止在P1处掺入。报告基因信号与来自不含测试核苷酸的孔的信号强度的比较用来确定掺入不完全的百分比。100％强度表明没有测试核苷酸掺入，因为最大报告基因可以掺入，而0％强度表明测试核苷酸完全占据P1位点。通过同时报告P2强度，可估计未阻断的核苷酸掺入水平，因为P2强度需要掺入未阻断的P1核苷酸。

3’磷酸酯终止核苷酸的掺入.

下面的表2(a)显示了从引物末端开始的第一个延伸位置处荧光标记的核苷酸的掺入百分比。由于报告基因的最大掺入是可能的，因此测试掺入反应中不包含核苷酸的情况被设定为100％。当测试温育中包含0.06uM或0.12uMd NTP时，在某些条件下会观察到报告基因强度的一些抑制，这表明天然核苷酸部分占据了一些可用的P1位置。对于0.12uM天然dTTP核苷酸的BG9聚合酶，发生大量占据率(>95％)，但对于某些变体，不到5％的位点被天然核苷酸占据。当使用3’磷酸化终止子时，对于变体sfr51、sfr53和sf73，可用位点的百分比下降至5％以下。其他变体也表现出不同程度的下降。这表明3’磷酸化核苷酸可以在这些条件下有效地掺入。当天然dNTP核苷酸包含有3’磷酸化核苷酸，但3’磷酸化核苷酸的浓度仅为2％或4％时，看到大多数变体的P1报告基因强度几乎没有变化。BG9没有显示出3’磷酸化核苷酸的显著掺入，但仍然显示出对天然核苷酸的偏好。即使添加了包含有3’磷酸化核苷酸的天然核苷酸，变体也表现出对修饰核苷酸的偏好。

表2(a).3’磷酸化核苷酸的掺入效率(在1mM Mn⁺²中)。值表示荧光标记报告基因核苷酸的掺入量相对于通过不包含测试核苷酸确定的最大掺入量的百分比。当位点未被测试核苷酸占据时，报告基因核苷酸可以在P1处掺入。

表2(b)显示了掺入测试核苷酸位置后第二个位置的相对报告基因强度。在P1处掺入未阻断的核苷酸将显示P2处报告基因强度增加。这可以通过天然核苷酸掺入BG9聚合酶和一些变体(例如sf73)看出，当使用0.12uM天然dTTP核苷酸时，该变体的最大P2强度为91.8％。值得注意的是，一些变体，例如具有1.9％P2报告基因强度的sfr53，显示出非常小的P2强度，这表明即使不存在竞争性3’磷酸化dTTP核苷酸，P1处天然dTTP的掺入量也较低。

表2(b).P1处掺入了3’磷酸化核苷酸的情况下P2处的报告基因掺入效率。值表示荧光标记的报告基因核苷酸的掺入量相对于通过不包含测试核苷酸和允许在P2处掺入的引物所确定的最大掺入量的百分比。当位点未被占用且在P1处掺入的核苷酸未被阻断时，报告基因核苷酸可在P2处掺入。

表3显示了在核苷酸反应混合物的不同温育时间下核苷酸与SFr51变体的掺入效率。不完全百分比随着时间的增加而普遍降低表明掺入具有时间依赖性，但测定设计的某些方面可能限制并阻止100％掺入(在表3中表示为0％报告基因强度)。

表3.核苷酸与SFr51变体的掺入效率.引物和5’生物素化模板在溶液中杂交，然后在反应缓冲液中添加酶和核苷酸的混合物。3uM核苷酸与0.05ug/ul酶反应指定时间，然后添加EDTA至最终浓度10mM。然后使具有延伸引物的生物素化模板与微孔板的链霉亲和素包被的孔结合。洗涤以除去过量的未结合反应组分后，通过报告基因核苷酸的掺入来检测掺入的阻断终止子的存在。

	0.5分钟	1分钟	2分钟	3分钟
					3'磷酸酯-dATP	5.6	5.8	5.6	4.3
2'磷酸酯-dATP	5.8	4.8	4.6	3.9
					双脱氧ATP	13.6	11.4	9.6	6.0

表4显示了多种SF变体与Firebird 3’–ONH2修饰的dGTP的掺入效率。所有变体似乎都显示出显著的掺入。所有变体都具有F667Y突变，一些具有L616A突变，这些在此前已显示支持核苷酸与–ONH2部分的掺入(15)。

表4.Firebird核苷酸与SF变体的掺入.生物素化模板与微孔板的链霉亲和素包被的孔结合。将引物杂交，然后用3uM firebird核苷酸延伸2分钟。P1处的100％值表示没有掺入测试核苷酸，如通过在没有核苷酸的情况下温育聚合酶获得的值所确定的，而0％表示通过掺入firebird核苷酸阻断P1位置。类似地，P2处的100％值表示P1处未阻断的核苷酸的掺入。

表5显示了5分钟温育时间和5uM核苷酸浓度下多种SF变体的掺入效率。SFm19.7是性能更好的变体之一，仅在614-616位阻门区域处发生变化。最值得注意的是L616A修饰。对引物结合位点氨基酸的修饰似乎也影响了SFm19r3和SFm19r5的掺入效率，从而显著提高了掺入效率。SFm19r5作为唯一具有额外F667Y氨基酸变化的变体，似乎是该比较组中对3’磷酸酯掺入最有效的。值得注意的是，在所有情况下(SFm19.3除外)，P2掺入百分比很低，这表明天然核苷酸的污染水平较低和/或3’磷酸酯在这些测试条件下具有解阻断稳定性。这里，低P2掺入百分比表明由于P1处的核苷酸被阻断而无法添加P2报告基因。切割后，如果3’磷酸酯阻断基团转化回3’-OH以允许继续延伸，则P2强度会增加，这是预期的。SFm19.3的P2强度高于预期，这可能表明酶制剂中存在一些残留的天然核苷酸，或者表明掺入对天然核苷酸的偏好增强。

表5. 3’-磷酸酯dTTP核苷酸与SF变体的掺入.生物素化模板与微孔板的链霉亲和素包被的孔结合。使引物杂交，然后用5uM核苷酸在设定温度60℃和0.05ug/ul酶下延伸5分钟。P1处的100％值表示没有测试核苷酸的掺入，如通过在没有核苷酸的情况下温育聚合酶获得的值所确定的，而0％表示通过掺入测试核苷酸阻断P1位置。P2值表示荧光标记报告基因核苷酸的掺入量相对于通过不包含测试核苷酸和允许在P2处掺入的引物确定的最大掺入量的百分比。

在2分钟反应时间内测试了多种SF变体的掺入效率，如表6所示。变体SFr51、SFr52和SFr53显示出最完全的掺入，其中大约1％的可用引物位点未延伸。与SFm19r5相比，这些变体在位置614处被修饰为丝氨酸和/或在616处被修饰为丙氨酸。与SFm19r5一样，它们也具有F667Y突变和据报道改善2’修饰引物接受度的突变(SFm 4.6突变)。SF71、SF72和SF73不具有这些SFm 4.6变化，并且在2分钟温育内似乎显示出较慢的掺入效率。在这些条件下，SFm19似乎没有显示3’磷酸酯的掺入。

表6. 3’-磷酸酯dATP核苷酸与SF变体的掺入.生物素化模板与微孔板的链霉亲和素包被的孔结合。使引物杂交，然后用3uM核苷酸在设定温度60℃和0.1ug/ul酶下延伸2分钟。P1处的100％值表示没有测试核苷酸的掺入，如通过在没有核苷酸的情况下温育聚合酶获得的值所确定的，而0％表示通过掺入测试核苷酸阻断P1位置。

聚合酶	P1
		SFm19r5	22.0％
SF71	82.6％
		SF72	62.7％
SF73	11.7％
		SFr51	0.7％
SFr52	0.9％
		SFr53	1.1％
SFm19	103.7％

进一步测试了多种SF变体在20秒反应时间内的掺入效率，如表7所示。变体SFr51和SFr52显示出最完全的掺入，其中大约4％的可用引物位点未延伸。这两个突变体在位置614处被修饰为丝氨酸，与SFr5一样，它们也具有F667Y突变和据报道改善2’修饰引物接受度的突变(SFm4.6)。SF71、SF72和SF73不具有这些SFm 4.6变化，并且似乎显示出较慢的掺入效率，而SFr72在这些条件下似乎未掺入可检测到的3’磷酸酯。

表7. 3’磷酸酯阻断dATP核苷酸与多个SF变体的掺入效率.引物和5’生物素化模板在溶液中杂交，然后在反应缓冲液中添加酶和核苷酸的混合物。3uM核苷酸与0.05ug/ul酶在55℃反应20秒，然后添加EDTA至最终浓度10mM。然后使带有延伸引物的生物素化模板结合至微孔板的链霉亲和素包被的孔上。洗涤以除去过量的未结合反应组分后，通过标记报告基因核苷酸的掺入来检测掺入的阻断终止子的存在。P1处的100％值表示没有掺入测试核苷酸，如通过在没有核苷酸或聚合酶的情况下温育所获得的值确定的，而0％表示通过掺入测试核苷酸阻断P1位置。类似地，P2处的100％值表示P1处未阻断核苷酸的掺入，而0％值表示P1掺入被阻断或没有掺入。P2 100％值是用允许P2位置确定的引物确定的。

聚合酶	P1最大％	P2最大％
			SF71	77.3	0.4
SF72	119.5	0.0
			SF73	71.1	0.6
SFr51	4.3	0.3
			SFr52	4.2	0.3
SFr53	8.2	1.8
			SFm19r5	27.7	2.7

目标变体残基614、615、616和667处的氨基酸变化

表8显示了变体SFm51、SFm52和SFm53的关键位置处的氨基酸差异。之前报道过SFm4-6具有促进2’O-Me修饰核苷酸掺入的特性(Chen等人，2016，同上)。在此变体中，位置616L和667F是野生型，但位置614和615携带SFm19变异。相对于SFm4-6，SFm19r5变体在位置667处有一个氨基酸变化。先前报道，将位置667从苯丙氨酸(F)转换为酪氨酸(Y)有利于增强2’,3’双脱氧修饰核苷酸的掺入。

表8优选变体和参考聚合酶关键位置的氨基酸.A：丙氨酸，E：谷氨酸，I：异亮氨酸，F：苯丙氨酸，G：甘氨酸，L：亮氨酸，S：丝氨酸，Y：酪氨酸。

表9显示，向SFm4-6引入F667Y修饰导致3’磷酸酯修饰的核苷酸掺入增加，这一点通过在10uM锰条件下20秒掺入期内不完全位点从74.8％减少到11.5％得到证明。1uM的锰浓度显示出类似的改进，当包含F667Y修饰时，不完全度从91.1％降至7.2％。在保持F667Y氨基酸变化的同时，SFr51中基序A区位置614处从谷氨酸进一步修饰为丝氨酸，导致在两种锰浓度下约1.8％至5％不完全度的掺入效率提高。这与SFr53中616处的单一附加变化的4-5.5％不完全度或SFr52中614和616处的双重修饰(不完全度值为3-4.9％)相当。

表9. 3’-磷酸酯阻断的dATP核苷酸在优选SF变体中的掺入效率.引物和5’生物素化模板在溶液中杂交，然后在反应缓冲液中添加酶和核苷酸的混合物。3uM核苷酸与0.05ug/ul酶在55℃反应20秒，然后加入EDTA以终止反应。然后使带有延伸引物的生物素化模板结合至微孔板的链霉亲和素包被的孔上。洗涤以除去过量的未结合反应组分后，通过标记报告基因核苷酸的掺入来检测掺入的阻断终止子的存在。100％值表示没有掺入测试核苷酸，如根据在没有核苷酸或聚合酶的情况下温育所获得的值确定的，而0％表示通过掺入测试核苷酸来阻断P1位置。

20秒温育后3’磷酸酯修饰核苷酸在所有4种碱基类型中的掺入效率.

表10显示了7种变体酶在所有4种碱基上的相对掺入效率。百分比值越低，20秒温育时间内3’磷酸酯修饰核苷酸的掺入越完全。与SFr53中单一616A变化相比，在基序A区域中具有一个变化614S的SFr51和在基序A区域中具有两个变化614S和616A的SFr52均显示出普遍改善的掺入水平。所有三种变体(SFr51、SFr52和SFr53)均包括先前报道的SFm4-6的位置655、657、681、742和747处的引物结合氨基酸变化(Chen等人，2016，同上)。在Chen等人描述的不包括引物结合氨基酸变化的变体SF71、SF72和SF73中，包括614S氨基酸的SF73变体通常比具有614E或614A的变体表现更好。

表2(a)[其中掺入时间为2分钟，并且掺入条件略有不同(表面结合与溶液相掺入以及1mM与1μMMn⁺²)]也显示，与SFr53相比，SFr51在3’磷酸化核苷酸的掺入方面有总体改进。表2(a)还显示，具有614S修饰的SF73在3’磷酸化dTTP和dGTP核苷酸掺入方面表现最佳。

表2(b)还表明，当dGTP和dATP以2％比率掺和到3’磷酸化核苷酸时，SFr51掺入天然核苷酸的程度低于SFr53，但dTTP或4％dATP掺和则不然。然而，总体而言，当3’磷酸化核苷酸和天然核苷酸之间存在竞争时，与SF71、SF72和SF73变体相比，SFr51和SFr53变体掺入的天然核苷酸较少。

表10.SF变体中3’-磷酸酯阻断核苷酸的掺入效率百分比.引物和5’生物素化模板在溶液中杂交，然后在反应缓冲液中添加酶和核苷酸的混合物。3uM核苷酸与0.05ug/ul酶在含有1uM Mn⁺²的缓冲液中于55℃反应20秒，然后添加EDTA以终止反应。然后使带有延伸引物的生物素化模板结合至微孔板的链霉亲和素包被的孔上。洗涤以除去过量的未结合反应组分后，通过标记报告基因核苷酸的掺入来检测掺入的阻断终止子的存在。100％值表示没有掺入测试核苷酸，如根据在没有核苷酸或聚合酶的情况下温育所获得的值确定的，而0％表示通过掺入测试核苷酸来阻断P1位置。显示关键位置的氨基酸以供参考(阴影框)。

实施例2. 3’-O-硝基苄基阻断核苷酸的SF变体掺入效率.

表11显示了几种SF变体聚合酶对3’-O-硝基苄基(NB)修饰核苷酸的P1掺入效率。在此测定中，0％掺入值是通过已知掺入修饰核苷酸的9°N变体DNA聚合酶(BG9)掺入3’-O-硝基苄基修饰核苷酸来设定的。优选的变体SFr51和SFr52都能够在2分钟的温育时间段内有效地掺入NB-dCTP核苷酸，其中有1％的残留未掺入。NB-dATP和NB-dTTP效率较低，其中有21％至43％的残留未掺入靶标。SFm19r5和SFr53都是没有614S修饰的变体，在2分钟温育期内，3’-O-硝基苄基的掺入普遍较差。

表11. 3’-O-硝基苄基(NB)阻断dATP、dCTP和dTTP核苷酸在优选SF变体中的掺入效率.生物素化模板与96孔微孔板的链霉亲和素包被的孔结合。然后将引物与2uM3’-硝基苄基修饰的核苷酸在55℃、100uM MnCL₂存在下杂交并延伸2分钟。100％值表示没有测试核苷酸的掺入，如根据通过在没有核苷酸的情况下温育9°N变体聚合酶(BG9)相同时间段获得的值所确定的，并且0％值表示通过经由9°N变体聚合酶进行的3’-硝基苄基核苷酸的掺入阻断第一个位置。

	NB_A	NB_C	NB_T
				SFm19r5	93％	60％	102％
SFr51	21％	1％	43％
				SFr52	29％	1％	23％
SFr53	78％	67％	83％

该结果证明了614S氨基酸的重要性，其独立于3’磷酸酯基团(带高负电荷的基团)，从而允许掺入更大且化学上非常不同的NB基团(大苄基环，更疏水)。614S提供比614E或614A更有效的3’磷酸酯的掺入(比较带有614E的SFm19r5、带有614A的SF71和带有614S的SF72和SFr51两者)，这进一步表明614S的重要性不仅在于提供更多空间(小于E)，还在于具有重要的化学意义(与A大小相似，但比A更有效)。S具有-OH基团，当3’-OH被3’阻断基团取代时，该基团对于与Mg++的相互作用可能很重要。可以使用其他类似的氨基酸。

为了创建更大的聚合酶口袋以最有效地掺入较大的3’阻断基团(例如，NB总体上比较小的磷酸酯或NH2阻断基团更难掺入，即使是通过具有614S和616A的SFr52也如此)，可以将S(或类似的氨基酸，如苏氨酸)放置在位置613或616或617处，并用614G和/或616G替换614S和/或616A，以获得该位置处的最大口袋开口和最小其他化学干扰，因为G没有侧链(没有电荷，ho疏水基团)。此外，多个位置可以具有S(或类似的氨基酸)，例如613和616或613和614，或614和616或与617的任意组合。

温度对3’-磷酸酯-阻断和天然-未阻断核苷酸的相对掺入效率的影响.

表12显示了温育温度对3’磷酸酯阻断核苷酸和天然未阻断核苷酸的相对掺入效率的影响。反应混合物中天然核苷酸的相对“掺和”百分比为4％(0.12uM)，因此聚合酶在第一个位置(P1)掺入天然或3’磷酸酯阻断核苷酸的倾向相同，可以预期，P2强度将为P1处天然核苷酸潜在完全掺入的约4％。这里，P2测量在初始测试核苷酸被允许在P1处掺入后在第二个位置处掺入报告基因的能力，并且预期报告在P1处天然核苷酸掺入的水平。然而，观察到的P2掺入百分比通常高于3’磷酸酯和天然核苷酸的相同掺入效率所预期的百分比，并且根据酶变体和反应温度而变化。SFm19r5似乎表现出对天然核苷酸的最高偏好，而SFr51表现出对天然核苷酸的最低偏好。温育温度似乎也影响天然和3’磷酸酯-阻断核苷酸与SFr51的相对掺入效率，显示P2强度从55℃时的18.8％下降到65℃时的10.7％，这表明在较高的温度下掺入了更多3’磷酸酯，因为在P1处成功掺入阻断的核苷酸不应允许报告基因在P2处掺入。SFr52和SFm19r5两者在相对掺入效率方面也显示出类似的趋势，其中P2百分比较低，这表明阻断的核苷酸掺入相对于较高温度下天然未阻断的核苷酸掺入效率更高。

P2百分比值较低的另一种解释可能是，在较高温度下，聚合酶错配率增加，使得在P1处掺入天然核苷酸(T：A完全匹配)后，在P2处掺入天然核苷酸(T：G错配)并因此阻断了P2报告基因核苷酸(ddCTP-Cy5)掺入的能力。在温度变化10℃的情况下P2强度相对下降近两倍，这表明错配倾向将需要发生很大变化，这是随温度升高P2强度降低的唯一解释。

表2还显示了天然和3’磷酸酯阻断核苷酸混合掺入后的P2强度值。与溶液相中的短温育反应(表12)相反，在链霉亲和素包被的底物上进行延长时间(2分钟)的实验(表2)通常证明报告基因的P2掺入较低，这表明P1处的天然核苷酸掺入较少。对于这一观察结果的一种可能的解释是，当天然核苷酸在P1(T：A完全匹配)处掺入较长时间和更高的Mn⁺²时，天然核苷酸第二个位置(T：G错配)的“强制”掺入增加。在这种条件下，P2报告基因的掺入能力降低，并且可能看起来不利于天然核苷酸掺入。

随着温度的升高，还普遍观察到P1百分比强度的增加(表12)。这可能表明在较高温度下整体掺入效率已略有下降，因为天然未阻断和3’磷酸阻断的核苷酸掺入都会抑制P1处的报告基因强度。虽然不能排除P1处掺入量的减少导致P2值较低，但由于P2值较低可以源自P1处掺入未阻断或P1处无掺入，所以P2百分比值的相对改善表明在较高的温育温度下，仍可能出现对天然核苷酸的偏好到对3’磷酸酯阻断核苷酸的偏好的相对转移。

表12.3uM 3’-磷酸酯阻断的dTTP核苷酸和0.12uM未阻断的天然dTTP的混合物的百分比掺入效率.引物和5’生物素化模板在溶液中杂交，然后在反应缓冲液中添加酶和核苷酸的混合物。核苷酸与0.05ug/ul酶和10uM Mn⁺²在55℃、60℃或65℃反应20秒，然后加入EDTA以终止反应。然后使带有延伸引物的生物素化模板结合至微孔板的链霉亲和素包被的孔上。洗涤以除去过量的未结合反应组分后，通过标记报告基因核苷酸的掺入来检测掺入的阻断终止子的存在。100％P1值表示没有掺入测试核苷酸，如通过在没有核苷酸或聚合酶的情况下温育所获得的值所确定的，而0％表示通过掺入测试核苷酸而完全阻断P1位置，如通过具有占据P1位置的一个额外碱基核苷酸的引物所确定的。100％P2值表示由于P1处存在未阻断的核碱基而导致P2处的掺入。

酶	温度	P1	P2
				SFm19r5	55℃	4.9	95.3
SFm19r5	60℃	6.7	80.1
				SFm19r5	65℃	9.7	79.9

				SFr51	55℃	3.6	18.8
SFr51	60℃	5.6	13.4
				SFr51	65℃	6.2	10.7

				SFr52	55℃	5.8	25.3
SFr52	60℃	4.7	18.1
				SFr52	65℃	6.1	14.5

实施例3.额外变异聚合酶

使用SFr52作为起始序列，产生了在以下残基处具有取代的额外聚合酶变体：A616G(SFr85)、R617F(SFr86)和R617K(SFr87)(表13)。表14证明这些突变体能够掺入3P核苷酸，尽管它们在指定的测试时间内没有达到与SFr51和SFr52突变体相同的掺入水平。

SFr51突变体还用作SFr88和SFr89中额外氨基酸改变S614D和S614T的碱基序列。同样，尽管证明有掺入，但掺入效率似乎低于亲本SFr51变体。变体SF74(带有A616L的SF73)和SF75(带有A616G的SF73)似乎没有比亲本SF73变体具有更高的掺入效率，并且总体上显示所有碱基的掺入较差，其中dGTP-3P表现最佳。

表13.Taq聚合酶Stoffel片段变体中关键位置的氨基酸.

表14. 3’磷酸化核苷酸的掺入效率。值表示荧光标记的报告基因核苷酸的掺入量相对于通过不包含测试核苷酸确定的最大掺入量的百分比。当位点未被测试核苷酸占据时，报告基因核苷酸可以在P1处掺入。(负值表示过度减去估算掺入背景水平.)

3'Phos	SFr85	SFr86	SFr87	SFr88	SFr89	SFr51	SFr52	SF73	SF74	SF75
											dATP-3P	20.8	76.6	16.3	13.3	52.4	4.4	5.0	44.8	65.4	67.6
dTTP-3P	-5.3	39.4	-11.9	-5.8	-6.4	-8.3	2.7	60.1	45.5	35.2
											dGTP-3P	5.1	21.1	9.8	19.4	21.3	4.6	3.9	6.6	12.0	12.6
dCTP-3P	2.8	21.0	7.3	3.9	2.6	3.0	1.4	111.6	60.1	38.9

围绕位置613-616创建了一系列额外变体。这些包括SFr90；(具有613S的SFr51)，SFr91；(具有613S和614G的SFr51)，SFr92：(具有614G、616S的SFr51)，SFr93；(具有613S、614G、616S的SFr51)。表15显示大多数这些变体变化不利于掺入效率，尽管变体SFr90相对于SFr51通常表现出掺入效率的较小降低，但dATP-3P除外，其效率似乎为六分之一。这里的测试条件使用0.5uM而不是标准3uM的核苷酸浓度。

表15. 3’磷酸化核苷酸的掺入效率.值表示荧光标记报告基因核苷酸的掺入量相对于通过不包含测试核苷酸确定的最大掺入量的百分比。当位点未被测试核苷酸占据时，报告基因核苷酸可以在P1处掺入。(负值表示过度减去估算掺入背景水平.)

3'Phos	SFr90	SFr91	SFr92	SFr93	SFr51	SFr52
							dATP-3P	69.3	100.8	93.0	147.1	12.3	12.7
dTTP-3P	4.1	33.5	71.2	80.5	2.1	4.3
							dGTP-3P	3.6	30.9	55.8	92.3	2.2	1.5
dCTP-3P	4.2	38.2	84.7	61.3	1.0	2.0

实施例4. 3’磷酸酯基团的抗体检测

已经报道了使用抗体检测核碱基的小化学修饰的能力(Drmanac,等人.bioRxiv,doi:10.1101/2020.02.19.953307,发布于2020年2月20日；Drmanac等人.,美国专利申请公开US20180223358)。检测到的修饰包括3’叠氮甲基和3’硝基苄基。这里，我们描述了兔单克隆抗体的生产，该抗体特异性识别延伸DNA引物的末端碱基和3’阻断基团，在本例中为磷酸酯部分。如先前所述制备单克隆抗体并通过与蛋白质IgG重链和轻链内的赖氨酸氨基酸的NHS酯反应进行荧光标记(Drmanac等人，bioRxiv，2020，同上)。

抗体克隆的选择

通过ELISA筛选克隆B细胞上清液，以确定对3’磷酸酯阻断核苷的特异性阳性反应。对精选克隆的表达IgG重链和轻链进行测序而另外子集用于细胞质粒表达，从中进一步测试纯化的克隆抗体的特异性以及从寡核苷酸底物上的3’磷酸酯掺入核苷酸中去除的情况。表16A和16B显示通过IMGT指定的所选克隆的重链可变区(表16A)和轻链可变区(表16B)的预测CDR序列。

表16A—结合3’磷酸酯阻断核苷的抗体的示例性重链可变区CDR序列

表16B—结合3’磷酸酯阻断核苷的抗体的示例性轻链可变区CDR序列

3P-dA	CDR1	CDR2
				18B10	QSVYNNNL	KTS	LGGYYSGSGWYST
19F1	QSVYDNNL	KTS	LGGYYSSSGWYST

3P-dG
				17C2	QSVNKNNY	SAS	LGSGDFSSGDSIV
6B9	QSVNKNNY	SAS	LGSGDFSGGDSIV

3P-dC
				20E9	QSVDNNNN	LAS	AGYSGGTTDGSA
2F7	QSINSW	AAS	QSYDMIVNHGAP

3P-dT
				12D6-L	QSVYGHNR	YTS	AGGYNGNIYA
6F11-L	QSISTY	RAS	QSNYYISSGNYGAV

使用微量滴定板中的抗体检测3’磷酸酯引物

3’磷酸酯阻断核苷酸被掺入引物的末端位置之上，然后与未标记或标记的抗体反应。在不到5分钟的短反应时间后，从反应孔中洗掉过量的抗体并检测结合的抗体。在未标记的抗体的情况下，在荧光检测之前使用第二荧光标记抗体或纳米抗体与初级IgG结合。在直接标记的初级抗体的情况下，洗掉多余的未结合抗体，并用荧光板读数器测量反应孔中的荧光。

表17显示了与没有引物延伸的相同反应条件相比，从与3’磷酸酯延伸引物结合的抗体获得的荧光强度。在某些结合和洗涤条件下，靶标上会发生抗体的某些非特异性结合。然而，在镁的存在下，非特异性结合显著减少。镁与DNA磷酸二酯键的磷酸酯的相互作用可能会抑制抗体与内部磷酸酯反应的能力，但仍允许识别末端磷酸酯。在镁的存在下特异性结合比没有引物时高10-27倍。

表17.将寡核苷酸模板结合到96孔微量滴定板的链霉亲和素包被的反应孔上。引物在一些孔中与模板杂交，或者在无引物条件下仅添加缓冲液。将3’磷酸酯核苷酸掺入引物的末端位置，该引物与该位置的模板链序列互补。洗涤以除去过量的反应组分后，选自A-18B10、C-2F7、G-17C2或T-12D6组的单一荧光标记抗体与含镁或不含镁缓冲液的模板/引物底物反应。结合5分钟后，在60℃下洗涤过量的抗体，并在相应的荧光染料激发和发射波长下扫描板。

		强度	与无引物的比率
				A	无引物	88385
A	引物	265039	3.0
				A-20mM Mg	无引物	8820
A-20mM Mg	引物	238771	27.1
				G	无引物	37695
G	引物	94247	2.5
				G420mM Mg	无引物	4978
G-20mM Mg	引物	53159	10.7
				T	无引物	206733
T	引物	345210	1.7
				T-20mMMg	无引物	13278
T-20mMMg	引物	273502	20.6
				C	无引物	19124
C	引物	167623	8.8
				C-20mM Mg	无引物	11357
C-20mM Mg	引物	183669	16.2

在MGI-SEQ 2000上使用抗体检测3’磷酸酯引物

图1显示了使用四种荧光标记抗体的一个成像周期的DNB的强度聚类图。聚类中的每个点表示单个DNB的两个光谱波长通道中的强度分布。可以看出，DNB是根据DNB的主要强度进行聚类的。远离轴的位置表明来自替代强度通道的强度贡献，这可能是由于荧光团的光谱串扰，如C-G轮廓中聚类之间的较小角度所示。移动远离轴的其他原因可能是识别末端替代碱基的抗体的非特异性结合或更普遍的与DNB结构元件的非特异性结合。混合DNB(每个结合位点2个或更多个DNB)也可能移动远离轴。

图1表明大多数DNB聚类在不同的组中，从而允许准确的碱基识别和DNB序列确定。

实施例5.在MGI-SEQ 2000上使用3’磷酸酯核苷酸和抗体进行测序

采用与先前针对3’叠氮甲基阻断基团描述的类似方法(Drmanac等人，bioRxiv，2020，同上)，将3’磷酸酯阻断核苷酸掺入到与附着于流动池表面的DNB纳米球杂交的引物上。在掺入3’P阻断核苷酸后、结合荧光标记抗体之前，用缓冲液清洗流动池表面。在另一次清洗步骤后，使用MGI-SEQ 2000DNB测序仪对流动池表面进行成像，并分析DNB的荧光强度。使用T4 PNK，温育时间为3分钟，浓度为0.1单位/μl，以去除3’磷酸酯阻断基团并再生3’-OH，以便掺入下一个测序周期的核苷酸。

然后对DNB强度进行聚合和处理，以去除背景并标准化4个不同的波长通道。DNB的处理强度如下图2A所示。在最初的强度峰值之后，在测序的早期周期中，随着周期的进行，显示强度逐渐下降。图2B显示了将20个碱基读数映射到人类基因组参考序列之后的不一致或碱基识别误差估计。随着强度下降和DNB异相亚基频率增加，不一致率随着周期的增加而增加。

应当理解，本文描述的示例和实施方案仅用于说明性目的，并且本领域技术人员将根据其提出各种修改或改变，并且这些修改或改变将被包括在本申请的精神和范围以及所附权利要求的范围内。

对于明确引用它们的材料，本文引用的所有出版物、专利和专利申请均通过引用并入本文中。

3’-磷酸酯核苷示例性抗体的可变区序列

dATP-3P抗体可变区序列:

18B10-重链可变区

METGLRWLLLVAVLKGVQCQSVEESGGRLVTPGTPLTLTCTVSGIDLSSYAMGWVRQAPGKGLEWIGMISRRGTSYYASWARGRFTISKTSTTVDLKITSPTTEETATYFCARATYDDYTDLNLWGQGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

18B10-轻链可变区

MDTRAPTQLLGLLLLWLPGATFAQVLTQTPSSVSAAVGGTVTINCQSSQSVYNNNLLSWYQQKPGQPPKLLIYKTSSLASGVPSRFSGSGSGTQFTLTISGVQCDDAATYYCLGGYYSGSGWYSTFGGGTEVVVKGDPVAPTVLIFPPSADLVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

19F1-重链可变区

METGLRWLLLVAVLKGVQCQSVEESGGRLVTPGTPLTLTCTVSGIDLSSYAMGWVRQAPGKGLEWIGMISRRGRSYYASWARGRFTISKTSTTVDLKITSPTTEETATYFCARATYDDYTDLNLWGQGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

19F1-轻链可变区

MDTRAPTQLLGLLLLWLPGATFAQVLTQTPSSVSAAVGGTVTINCQASQSVYDNNLLSWYQQKPGQPPKLLIYKTSSLASGVPSRFSGSGSGTQFTLTISGVQCDDAATYYCLGGYYSSSGWYSTFGGGTEVVVKGDPVAPTVLIFPPSADLVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

dCTP-3P抗体可变区序列:

2F7-重链可变区

METGLRWLLLVAVLKGVQCQSVEESGGRLVTPGTPLTLTCTVSGFSLSNYAI IWVRQAPGEGLEYIGFISRTGSINYANWAKGRFTISKTSTTVDLKITSPTTEDTATYFCARTDYFANGDIWGPGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

2F7-轻链可变区

MDTRVPTQLLGLLLLWLPGARCADVVMTQTPASVSEPVGGTVTIKCQASQSINSWLSWYQQKPGQPPKLLIYAASTLASGVPSRFKGSGSGTQFTLTISDLECADAATYFCQSYDMIVNHGAPFGGGTGVVVSGDPVAPTVLIFPPAADQVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

20E9-重链可变区

METGLRWLLLVAVLKGVQCQSVEESGGRLVTPGTPLTLTCTVSGFSLSAYHITWVRQAPGKGLEWIGIITRSASTYYASWAIGRFTISKTSSTTVDLKMTSLTTEDTATYFCVRGSIAATSTGTGLWGPGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

20E9-轻链可变区

MDTRAPTQLLGLLLLWLPGATFAIVMIQTPSPVSAAVGGTVTITCQASQSVDNNNNLAWYQQKPGQPPKLLIYLASTLASGVPSRFKGSGSGTQFTLTISDVVCDDAATYYCAGYSGGTTDGSAFGGGTEVVVKGDPVAPTVLIFPPAADQVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

dGTP-3P抗体可变区序列:

6B9-重链可变区

METGLRWLLLVAVLKGVQCQSLEESGGRLVTPGTPLTLTCTVSGFSLGSFGLIWVRQAPGKGLEWIGIIYGDTGNTYYASWAKGRFTISKTSTTVDLRITSPTTEDTATYFCARTSYGGSRSQGFQLWGQGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

6B9-轻链可变区

MDTRAPTQLLGLLLLWLPGATFAQIVMTQTPASVSATVGGTVTINCQASQSVNKNNYLSWYQQKPGQPPKLLIYSASWLASGVPSRFKGSGSGTQFTLTISDVQCDDAATYYCLGSGDFSGGDSIVFGGGTEVVVRGDPVAPTVLIFPPAADQVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

17C2-重链可变区

METGLRWLLLVAVLKGVQCQSLEESGGRLVTPGTSLTLTCTVSGFSLSSFGLIWVRQAPGKGLEWIGIIYGDTGNTYYASWAKGRFTISKTSTTIDLRITNPTTEDTATYFCARASYGFSRGQGFKLWGQGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

17C2-轻链可变区

MDTRAPTQLLGLLLLWLPGATFAQIVMTQTPASVSAAVGGTVTINCQASQSVNKNNYLSWYQQKPGQPPKLLIYSASWLASGVPSRFSGSGSGTQFTLTISDVQCDDAATYYCLGSGDFSSGDSIVFGGGTEVVVRGDPVAPTVLIFPPAADQVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

dTTP-3P抗体可变区序列:

12D6-重链可变区

METGLRWLLLVAVLKGVQCQSLEESGGRLVTPGTPLTLTCTVSGIDLSSYTITWVRQAPGKGLEWIGYIYVHDGATYYANWAKGRFTISRTSSTTVDLKMTSLTTEDTATYFCASGGGTTYYRIWGPGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

12D6-轻链可变区

MDTRAPTQLLGLLLLWLPGATFAQLLTQTPPSVSAPVGGTVTINCQSSQSVYGHNRLSWYQQKPGQPPKLLIYYTSTLASGVPSRFKGSGSGTQFTLTISDLECDDAATYYCAGGYNGNIYAFGGGTEVVVKGDPVAPTVLIFPPAADQVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

6F11-重链可变区

METGLRWLLLVAVLKGVQCQSVEESGGRLVTPGTPLTLTCTVSGFSLSNYPMNWVRQAPGKGLEYIGIISRKGTTYYASWAKGRFTISKTSTTVDLKMTSPTIEDTGTYFCARGEYYGDILNYENYFSAWGPGTLVTVSSGQPKAPSVFPLAPCCGDTPSSTVTLGCLVKGYLPEPVTVTWNSGTLTNGVRTFPSVRQSSGLYSLSSVVSVTSSSQPVTCNVAHPATNTKVDKTVAPSTCSKPMCPPPELPGGPSVFIFPPKPKDTLMISRTPEVTCVVVDVSQDDPEVQFTWYINNEQVRTARPPLREQQFNSTIRVVSTLPIAHQDWLRGKEFKCKVHNKALPAPIEKTISKARGQPLEPKVYTMGPPREELSSRSVSLTCMINGFYPSDISVEWEKNGKAEDNYKTTPTVLDSDGSYFLYSKLSVPTSEWQRGDVFTCSVMHEALHNHYTQKSISRSPGK*

6F11-轻链可变区

MDTRAPTQLLGLLLLWLPGARCDVVMTQTPSSVSAAVGDTVTIKCQASQSISTYLSWYQQ

KPGQPPKLLIYRASTLESGVPSRFKGSGSGTQFTLTISDLECADAATYYCQSNYYISSGN

YGAVFGGGTEVVVKGDPVAPTVLIFPPSADLVATGTVTIVCVANKYFPDVTVTWEVDGTTQTTGIENSKTPQNSADCTYNLSSTLTLTSTQYNSHKEYTCKVTQGTTSVVQSFNRGDC*

Claims

1.一种工程化DNA聚合酶，其包含多肽序列，所述多肽序列包含如参考SEQ ID NO:1所确定的在位置610、611、612、613、614、615、616和617中的三个、四个或五个或更多个处的取代；并且其中所述多肽序列与SEQ ID NO:1具有至少90％的同一性并且将3’-阻断核苷酸掺入核酸链中。

2.根据权利要求1所述的工程化DNA聚合酶，其中所述多肽序列包含在位置613、614、615、616或617中的三个或更多个处的取代。

3.根据权利要求1或2所述的工程化DNA聚合酶，其中两个位置被G取代；并且第三个位置被S或T取代。

4.根据权利要求1所述的工程化DNA聚合酶，其中所述多肽序列在位置613、614、615、616或617中的三个或更多个处包含A或G。

5.根据权利要求1所述的工程化DNA聚合酶，其中位置614、615和616中的每一个均包含相对于SEQ ID NO:1的取代。

6.根据权利要求5所述的工程化DNA聚合酶，其中位置614处的取代是E、A、D、S、T或G；位置615处的取代是A、G或S；或者位置616处的取代是A、G或S。

7.根据权利要求6所述的工程化DNA聚合酶，其中位置614处的取代是E、S或T；位置615处的取代是G；位置616处的取代是A。

8.根据权利要求6或7所述的工程化DNA聚合酶，其中位置614处的取代是S或T。

9.根据权利要求1所述的工程DNA聚合酶，位置614是E或S；位置615是G或E；位置616是A。

10.根据权利要求1至9所述的工程化DNA聚合酶，其还包含如参照SEQ ID NO:1确定的在位置667处的取代。

11.根据权利要求10所述的工程化DNA聚合酶，其中位置667处的取代是Y。

12.根据权利要求1至11中任一项所述的工程化DNA聚合酶，其还包含如参照SEQ IDNO:1确定的在位置655、657、681、742和747中的一个、二个、三个或四个处的取代。

13.根据权利要求1至12中任一项所述的工程化DNA聚合酶，其还包含如参考SEQ IDNO:1所确定的在位置655、657、681、742和747中的每一个处的取代。

14.根据权利要求12或13所述的工程化DNA聚合酶，其中位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；或者位置747处的取代是R。

15.根据权利要求12或13所述的工程化DNA聚合酶，其中位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；并且位置747处的取代是R。

16.根据权利要求5所述的工程化DNA聚合酶，其包含在位置614处的E、A、D、S、T或G；位置615处的G或A；位置616处的A或G；以及位置667处的Y。

17.根据权利要求16所述的工程化DNA聚合酶，其还包含位置655处的N；位置657处的M；位置681处的K；位置742处的Q或N；以及位置747处的T。

18.一种工程化DNA聚合酶，其包含多肽序列，所述多肽序列包含如参考SEQ ID NO:1所确定的位置613、614、615、616和617中的两个处的取代；以及位置667处的取代；其中所述多肽序列与SEQ ID NO:1具有至少90％的同一性，并且将3’-阻断核苷酸掺入核酸链中。

19.根据权利要求18所述的工程化DNA聚合酶，其中所述两个位置中的每一个处的取代是A、G或S。

20.根据权利要求18或19所述的工程化DNA聚合酶，其中所述多肽序列包含如参考SEQID NO:1确定的在位置614和615处的取代。

21.根据权利要求18所述的工程化DNA聚合酶，其中位置614处的取代是E、A、D、S、T或G；位置615处的取代是G或A；或者位置667处的取代是Y。

22.根据权利要求20所述的工程化DNA聚合酶，其中位置614处的取代是E、A、D、S、T或G；位置615处的取代是G或A；并且位置667处的取代是Y。

23.根据权利要求22所述的工程化DNA聚合酶，其中位置614处的残基是A、S、G或T。

24.根据权利要求18或19所述的工程化DNA聚合酶，其中所述多肽序列包含如参考SEQID NO:1确定的在位置615和616处的取代。

25.根据权利要求27所述的工程化DNA聚合酶，其中位置615和616中的每一个处的取代是S、G或A。

26.根据权利要求28所述的工程化DNA聚合酶，其中位置615和616中的每一个处的取代是G或A。

27.根据权利要求18至26中任一项所述的工程化DNA聚合酶，其还包含在位置655、657、681、742和747中的每一个处的取代。

28.根据权利要求27所述的工程化DNA聚合酶，其中位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；或者位置747处的取代是R。

29.根据权利要求27所述的工程化DNA聚合酶，其中位置655处的取代是N；位置657处的取代是M；位置681处的取代是K；位置742处的取代是Q或N；并且位置747处的取代是R。

30.家族A聚合酶，其相对于野生型家族A聚合酶序列，包含一组两个或更多个取代，所述取代一起提供用于容纳3’-磷酸酯或更大的3’-阻断基团的更大空间，其中所述取代各自选自由A、G、S、T和C组成的组。

31.根据权利要求30所述的家族A聚合酶，其还包含在家族A聚合酶的对应于Taq聚合酶位置667的位置处的Y。

32.根据权利要求30或31所述的家族A聚合酶，其包含基序A中的至少两个位置，其中G或A取代野生型残基；并且基序A中的至少一个位置包含S或T。

33.根据权利要求30至32中任一项所述的家族A聚合酶，其中基序A的野生型L或I残基被E、S或T取代。

34.一种将包含3’-阻断取代基的核苷酸掺入DNA分子的方法，所述方法包括在反应混合物中温育根据权利要求1至33中任一项所述的聚合酶，所述反应混合物包含模板核酸、引物、具有所述3’-阻断基团的所述核苷酸；以及用于延伸所述引物的试剂，其中包含所述3’-阻断基团的所述核苷酸与所述模板核酸中的碱基互补并被掺入所述DNA分子中。

35.根据权利要求34所述的方法，其中所述核苷酸用可检测标记进行标记。

36.一种将包含可逆3’-阻断取代基的第一核苷酸掺入DNA分子的方法，所述方法包括：

在反应混合物中温育根据权利要求1至33中任一项所述的聚合酶，所述反应混合物包含模板核酸、引物、具有所述3’-阻断基团的所述核苷酸；以及用于延伸所述引物的试剂，其中包含所述3'-阻断基团的所述核苷酸与所述模板核酸中的碱基互补，并掺入从所述引物延伸的延伸分子中；

检测被掺入所述延伸分子中的包含所述3’-阻断基团的所述核苷酸；以及

去除所述3’阻断取代基。

37.根据权利要求36所述的方法，其中所述核苷酸用可检测标记进行标记。

38.根据权利要求36或37所述的方法，其还包含将所述反应混合物中的所述延伸分子与包含可逆阻断取代基的第二核苷酸一起温育；其中包含所述3’-阻断基团的所述第二核苷酸与所述模板核酸中的碱基互补并掺入所述延伸分子中。

39.根据权利要求36所述的方法，其中用识别所述3’-阻断核苷酸的亲和剂检测包含所述3’-阻断基团的所述核苷酸。

40.一种试剂盒，其包含根据权利要求1至33中任一项所述的聚合酶。

41.根据权利要求40所述的试剂盒，其还包含3’-阻断核苷酸。

42.一种多核苷酸，其包含编码根据权利要求1至33中任一项所述的聚合酶的核酸序列。

43.一种宿主细胞，其包含根据权利要求42所述的多核苷酸。