CN101180390B

CN101180390B - 改进的聚合酶

Info

Publication number: CN101180390B
Application number: CN200680016045.1A
Authority: CN
Inventors: 托拜厄斯·威廉·巴尔·奥斯特; 杰弗里·保罗·史密斯; 尚卡尔·巴拉苏布拉马尼亚姆; 罗伯托·里加蒂; 拉克尔·马里亚·桑切斯
Original assignee: Solexa Ltd Great Britain
Current assignee: Solexa Ltd Great Britain
Priority date: 2005-05-10
Filing date: 2006-05-10
Publication date: 2013-04-03
Anticipated expiration: 2026-05-10
Also published as: CN101180390A; ATE518948T1; GB0509508D0

Abstract

经修饰的DNA聚合酶对DNA具有亲和力，使得所述聚合酶能够在每个反应循环中将一个或多个核苷酸掺入多个分开的DNA模板中。所述聚合酶能够在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物。所述经修饰的聚合酶可以用于许多DNA测序应用中，尤其是在聚簇阵列中。

Description

改进的聚合酶

技术领域

本发明涉及聚合酶，更具体地涉及经修饰的DNA聚合酶，其具有对DNA的亲和力，从而所述聚合酶能够在每个反应循环中将核苷酸掺入多个分开的DNA模板中，并能够在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物。本发明的范围中还包括使用所述经修饰的聚合酶用于测序尤其是在聚簇阵列中的方法。

背景技术

某些DNA聚合酶的三维晶体结构显示为三个单独的亚结构域，称为掌(palm)、指(finger)和拇指(thumb)(Joyce，C.M.和Steiz，T.A.(1994)Function and structure relationships in DNA polymerases，Annu.Rev.Biochem.，63，777-822)，每个亚结构域在DNA聚合期间均发挥关键作用。

已发现DNA聚合酶的C端拇指结构域与DNA结合和持续合成能力相关(Doublie等1998.Nature 391，251；Truniger等2004.Nucleic AcidsResearch 32，371)。DNA聚合酶这一区域中的残基与“引物：模板”双链体相互作用。

通过引入定点突变或者通过缺失少量氨基酸的截短来破坏这一区域的结构已证明变体的DNA亲和力和持续合成能力降低，而其他物理特性如dNTP亲和力和核苷酸插入保真度则没有重大变化(Truniger等2004.Nucleic Acids Research 32，371；Minnick等1996.J.Biol.Chem.，271，24954；Polesky等1990.J.Bio1.Chem.，265，14579)。

聚合酶可分为两个结构不同的家族，称为A家族和B家族。

对B家族聚合酶C端亚结构域的研究不多，但相信其参与DNA结合，这主要是基于对聚合酶RB69封闭形式(与DNA结合)X射线晶体结构的观察。已经在两个B家族类别实例(即Phi29和T4)的这一拇指结构域中进行了诱变研究。然而，这些研究仅限于该结构域中大部分氨基酸的缺失。对Klenow(A家族的聚合酶)进行了同样类型的缺失。就其结合和掺入dNTP的能力、该缺失对保真度的影响、其对DNA的亲和力及其与辅助蛋白的相互作用来评价这些研究中变体的性能。

之前还未对来自嗜热古细菌(thermophilic archaeon)聚合酶的拇指结构域进行过研究。

发明内容

本发明基于聚合酶与DNA模板的紧密结合并不总是有利特性这一认识。在每个反应循环中仅需要单个核苷酸掺入事件的测序反应中尤其是这样。因此，对于与DNA紧密结合的聚合酶，该聚合酶参与将核苷酸掺入多个DNA链的能力较之对DNA亲和力较低的聚合酶变体来说受到限制。

本发明设计了DNA测序方法，所述方法使用在3’糖羟基中具有修饰的核苷酸类似物，从而阻断其它核苷酸的掺入(参阅WO03/048387的实施例及其所述引用文献)。使用带有3’阻断的核苷酸允许以受控方式将连续的核苷酸掺入多核苷酸链中。在加入每个核苷酸后，3’阻断的存在阻止其它核苷酸掺入所述链中。一旦确定了所掺入核苷酸的性质之后，可以去除该阻断，留下游离的3’羟基基团用于加入下一个核苷酸。

另外，在诸如涉及经修饰核苷酸的测序反应(如上所述，并在下文中有更详细讨论)之类的反应中，聚合酶的紧密结合实际上可能就反应的完成而言表现为某些缺点。例如，如果具有紧密DNA结合亲和力的无活性聚合酶分子与模板DNA分子形成稳定的复合体，则该特定模板DNA分子不可能得到延伸。

有了这样的认识，本发明提供了与模板DNA具有较弱相互作用的改变的聚合酶。因此，本发明的所述聚合酶具有改进的能力，在反应循环中从一个模板DNA分子移动到另一个上。这种形成数目增加的生产性聚合酶-DNA复合物的能力优点在于：可以显著改进在每个反应循环中加入单个核苷酸的反应的水平或反应完成情况。

未修饰的聚合酶倾向于以高亲和力与DNA结合，从而方程：

强烈偏移而有利于形成[Pol:DNA]复合物。

相反，在本发明中，所述改变的聚合酶与DNA结合得较差，意味着平衡位置向左侧移动。

因此，本发明提供了改变的聚合酶，其具有降低的DNA亲和力，从而该聚合酶能够在每个反应循环中将核苷酸掺入多个分开的DNA模板中。

“DNA模板”指可以与所述聚合酶结合并用作核酸合成模板的任何DNA分子。

本文定义的“核苷酸”包括核苷酸和核苷。就核苷酸而言，核苷包含通过糖苷键与核糖或脱氧核糖连接的嘌呤或嘧啶，但是它们缺乏使其成为核苷酸的磷酸残基。该定义中包括合成的和天然存在的核苷酸。该定义中包括标记的核苷酸。该聚合酶的有利特性是由于它们对DNA模板的亲和力降低，同时保持了与所掺入核苷酸的亲和力和保真度。

在一个优选的方面中提供了改变的聚合酶，其对DNA的亲和力降低，从而所述聚合酶能够在每个反应循环中将至少一个合成核苷酸掺入多个DNA模板中。在本发明之前，从未认识或提出过修饰聚合酶使之适合掺入非天然核苷酸、在降低其DNA亲和力而同时保持其有利特性的问题。

在一个实施方案中，所述核苷酸包含在熟知的Sanger测序反应中使用的双脱氧核苷三磷酸(ddNTP)。这些核苷酸可以是标记的，例如用任何质量标记、放射性标记或荧光标记进行标记。

在另一个实施方案中，所述核苷酸包含这样的核苷酸：其在3’糖羟基处进行了修饰，从而与对照聚合酶比较，该取代基大于天然存在的3’羟基。

在优选的实施方案中，所述核苷酸包含具有嘌呤或嘧啶碱基以及核糖或脱氧核糖糖部分的核苷酸，该糖部分具有与其共价连接的可去除的3′-OH阻断基团，从而3’碳原子连接在以下结构的基团上：

-O-Z

其中Z为-C(R’)₂-O-R”、-C(R’)₂-N(R”)₂、-C(R’)₂-N(H)R”、-C(R’)₂-S-R”和-C(R’)₂-F中的任何一种，

其中每个R”为可去除的保护基团或其部分；

每个R’独立地为氢原子、烷基、取代烷基、芳基烷基、烯基、炔基、芳基、杂芳基、杂环基、酰基、氰基、烷氧基、芳氧基、杂芳氧基或氨基，或通过连接基连接的检测标记；或者(R’)₂代表式为＝C(R_)₂的亚烷基，其中每个R_可以是相同的或不同的，并且选自氢、卤素原子和烷基；并且

其中所述分子可以反应生成中间体，其中每个R″替换为H，或者当Z为-C(R’)₂-F时，F替换为OH、SH或NH₂，优选OH，所述中间体在水性条件下解离以提供带有游离3′OH的分子；

其满足以下条件：当Z为-C(R’)₂-S-R”时，两个R’基团不全是H。

根据一个实施方案，通过本发明聚合酶掺入的核苷或核苷酸包含嘌呤或嘧啶碱基以及核糖或脱氧核糖糖部分，该糖部分具有与其共价连接(优选在3’O位置)的阻断基，所述阻断基使所述分子可用于需要阻断3′-OH基团以阻止掺入其他核苷酸的技术中，例如在测序反应、多核苷酸合成、核酸扩增、核酸杂交分析、单核苷酸多态性研究及其它此类技术。

一旦去除所述阻断基，便可能将另一个核苷酸掺入到游离的3′-OH基团上。

优选的经修饰核苷酸在Solexa Limited名下的国际专利申请公布号WO 2004/018497中有举例，所述参考文献以其整体并入本文。

在优选的实施方案中，经修饰核苷酸或核苷的R’基团是烷基或取代烷基。在另一个实施方案中，经修饰核苷酸或核苷的-Z基团的式为-C(R′)₂-N₃。在最优选的实施方案中，经修饰核苷酸或核苷包含Z基团，所述Z基团为叠氮基甲基基团。

如下所详述的，本发明的优选聚合酶特别优选用于掺入其中Z为叠氮基甲基基团的核苷酸类似物。

所述经修饰核苷酸可通过碱基由期望的接头与检测标记连接，其中所述标记可以是例如荧光团。需要时，所述检测标记也可以掺入式“Z”的阻断基中。所述接头可以是酸不稳定的、光不稳定的或者含有二硫键。本发明可使用其它连接，尤其是可被磷化氢切割的含有叠氮化物的接头，如WO 2004/018497中的详细描述，其内容以其整体并入本文。

优选的标记和连接包括WO 03/048387公开的标记和连接。此参考文献以其整体并入本文。

在一个实施方案中，所述经修饰的核苷酸或核苷具有通过可切割的接头与检测标记连接的碱基，其特征在于所述可切割接头含有选自以下的结构：

(其中X选自包括以下的集合：O、S、NH和NQ，其中Q为C_1-10的取代或未取代的烷基，Y选自O、S、NH和N(烯丙基)，T为氢或C_1-10的取代或未取代烷基，^*表示该部分与核苷酸或核苷的其它部分相连的位置)。

在一个实施方案中，所述检测标记包含荧光标记。合适的荧光团在本领域中是众所周知的。在优选的实施方案中，每种不同的核苷酸类型带有不同的荧光标记。这有利于识别和掺入特定的核苷酸。因此，例如修饰的腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶都与各自的荧光团结合，从而容易地将它们彼此进行区分。令人惊奇地，已发现改变的聚合酶能够掺入带有多种不同荧光标记的修饰核苷酸类似物。而且，所述聚合酶能掺入所有四种碱基。就本发明聚合酶在核酸测序方案中的用途而言，这些特性提供了重要的优势。

如上所述，优选的核苷酸类似物包括在3’位置包含O-叠氮甲基功能性的核苷酸类似物。应该理解，对于其它核苷酸类似物来说，显著影响DNA结合的C端拇指亚结构域区域中的优选聚合酶氨基酸序列可以为了实现最佳掺入而有所改变。对于任何给定的核苷酸类似物，可以通过实验来确定C末端拇指亚结构区域(例如在RB69中的Lys790、800、844、874、878和Arg 806残基，以及在9°N聚合酶中的Arg 743、Arg 713和Lys 705残基，下文将有更详细的讨论)中最佳的序列偏好，例如构建文库或离散数(discrete number)的突变体，之后在掺入测定系统中测试各个变体。

如上所提及的，本发明的改变聚合酶能够改善所有核苷酸的掺入，包括多种具有不同尺寸和多种化学性质的大3’取代基的修饰核苷酸。所述聚合酶的有利特性是由于其对DNA模板的亲和力降低，导致该聚合酶与DNA的解离增加，而不对与掺入核苷酸的亲和力和保真度产生不利影响。

由于本发明聚合酶的DNA结合亲和力降低，因此能够在单个反应循环中将一个或多个核苷酸掺入若干不同的DNA分子中。因此提高了反应的总体效率，引起完成水平的提高。

“反应循环”指允许核苷酸掺入模板中的适当反应时间段。单个反应循环的示例性条件为一个30分钟、45℃孵育的时间段。

许多聚合反应在过量于聚合酶的DNA存在下发生。本发明的聚合酶使这样的聚合反应更加有效地进行，因为该聚合酶可以在分开的模板DNA分子上催化多轮核苷酸掺入。另一方面，未改变的聚合酶特别是与DNA结合更为紧密的聚合酶不具备这种能力，因为它在每个反应循环中更可能只在单个模板上参与核苷酸掺入。本发明的聚合酶允许在就DNA浓度而言，聚合酶浓度为限制性的条件下实现高水平的反应完成。具体地，所述聚合酶在DNA∶聚合酶比为至少约2∶1、3∶1或5∶1的条件下表现出提高的将一个或多个核苷酸掺入分开的DNA分子的能力。然而，在高聚合酶浓度下，该提高可能被掩盖。

因此，改变的聚合酶具有对DNA的亲和力，从而该聚合酶能够在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物。

本发明聚合酶的改进特性可以与适当的对照进行比较。本文定义的“对照聚合酶”定义为改变聚合酶的活性与其进行比较的聚合酶。对照聚合酶与改变聚合酶为同样的类型，但是不带有降低聚合酶对DNA的亲和力的改变。因此，在非常优选的实施方案中，所述对照聚合酶为9°N聚合酶，所述修饰聚合酶为同一9°N聚合酶，只是存在降低9°N聚合酶与DNA的亲和力的一种或多种修饰。

在一个实施方案中，所述对照聚合酶为野生型聚合酶，对其进行改变以提供改变的聚合酶，所述改变聚合酶可以直接与未改变的聚合酶进行比较。

在一个实施方案中，所述对照聚合酶在与9°N DNA聚合酶氨基酸序列中Leu408、Tyr409和Pro410功能等价的位置上包含替换突变。因此，在该实施方案中，该对照聚合酶具有以下替换突变：第408位从亮氨酸替换为不同的氨基酸，第409位从酪氨酸替换为不同的氨基酸以及第410位从脯氨酸替换为不同的氨基酸；或者，如果该聚合酶不是9°N DNA聚合酶时则在功能等价的位置上。

在另一个实施方案中，所述对照聚合酶在9°N DNA聚合酶氨基酸序列中包含与Leu408Tyr、Tyr409Ala和Pro410Val功能等价的替换突变。因此，在该实施方案中，该对照聚合酶带有以下替换突变：第408位从亮氨酸替换为酪氨酸，第409位从酪氨酸替换为丙氨酸以及第410位从脯氨酸替换为缬氨酸；或者，如果该聚合酶不是9°N DNA聚合酶时则在功能等价的位置上。在优选的实施方案中，所述对照聚合酶为包含所述替换突变的9°N DNA聚合酶。

所述对照聚合酶还可以在与9°N DNA聚合酶氨基酸序列中Cys223功能等价的位置上包含替换突变。因此，在该实施方案中，所述对照聚合酶带有第223位从半胱氨酸替换为不同的氨基酸的替换突变，或者如果该聚合酶不是9°N DNA聚合酶时则在功能等价的位置上。在优选的实施方案中，该对照聚合酶是包含所述替换突变的9°N DNA聚合酶。在另一个实施方案中，该对照聚合酶包含与9°N DNA聚合酶氨基酸序列中Cys223Ser功能等价的替换突变。因此，在该实施方案中，所述对照聚合酶具有第223位从半胱氨酸替换为丝氨酸的替换突变，或者如果该聚合酶不是9°N DNA聚合酶时则在功能上等同的位置上。在优选的实施方案中，该对照聚合酶是包含所述替换突变的9°N DNA聚合酶。

优选地，所述对照聚合酶是包含上述突变的组合的9°N DNA聚合酶。

所述聚合酶一般具有降低的DNA亲和力。这可以通过解离常数来定义。因此，野生型聚合酶倾向于具有纳摩尔-皮摩尔范围内的解离常数。就本发明目的而言，与对照未改造聚合酶相比具有降低的DNA亲和力的聚合酶是适合的。优选的，由于所述改变，该聚合酶的解离常数与对照未改造聚合酶相比提高至少或大约2倍、3倍、4倍或5倍。

“功能等价”指氨基酸替换认为在另一聚合酶中与所述酶功能相同的氨基酸位置上发生。例如，Vent DNA聚合酶中第412位从酪氨酸替换为缬氨酸的突变(Y412V)与9°N聚合酶中第409位从酪氨酸替换为缬氨酸的替换(Y409V)功能等价。认为该氨基酸残基的体积是作为阻断核苷酸糖的2’-羟基进入结合位点的“立体闸门(steric gate)”。同样地，认为Vent聚合酶中的488位残基与9°N聚合酶中485位氨基酸等价，从而认为Vent中488位从丙氨酸变为亮氨酸的突变(A488L)与9°N聚合酶中A485L突变等价。

通常地，两个或多个不同聚合酶中功能等价的替换突变发生在这些聚合酶的氨基酸序列中同源的氨基酸位置上。因此，本文使用的术语“功能等价”也包括与给定的突变“位置等价”或“同源”的突变，而不管该突变氨基酸的具体功能是否已知。基于序列比对和/或分子建模有可能鉴定两个或多个不同聚合酶的氨基酸序列中位置等价或同源的氨基酸残基。

所述改变聚合酶一般是“分离的”或“纯化的”多肽。“分离的多肽”指基本上与污染细胞组分分离的多肽，所述污染细胞组分为例如可与所述多肽天然相关的碳水化合物类、脂类、核酸类或其它蛋白质杂质。一般地，分离聚合酶的制备物包含高度纯化形式的所述聚合酶，即至少约80％的纯度，优选至少约90％的纯度，更优选至少约95％的纯度，更优选至少约98％的纯度并且最优选至少约99％的纯度。所述酶制备物的纯度可通过例如在标准SDS-聚丙烯酰胺电泳凝胶上出现单一条带来评估。

所述改变聚合酶可以是“重组”多肽。

本发明的改变聚合酶可以是任何DNA聚合酶。更具体地，所述改变的聚合酶可以是B家族类型的DNA聚合酶，或者其突变体或变体。B家族DNA聚合酶包括许多古细菌DNA聚合酶，人DNA聚合酶α以及T4、RB69和φ29噬菌体DNA聚合酶。对这些聚合酶的研究弱于包含诸如Taq和T7 DNA聚合酶之类聚合酶的A家族聚合酶。在一个实施方案中，所述聚合酶选自任何B家族古细菌DNA聚合酶、DNA聚合酶α或T4、RB69和φ29噬菌体DNA聚合酶。

所述古细菌DNA聚合酶在许多情况中来自超嗜热古细菌(hyperthermophilic archea)，这意味着该聚合酶常常是热稳定性的。因此，在另一个优选的实施方案中，所述聚合酶是嗜热古细菌聚合酶，并优选地选自Vent、Deep Vent、9°N和Pfu聚合酶。Vent和Deep Vent分别是分离自超嗜热古细菌Thermococcus litoralis和激烈热球菌(PyrococcuSfuriosus)的B家族DNA聚合酶的商品名。9°N聚合酶也鉴定自Thermococcus sp。Pfu聚合酶分离自激烈热球菌。如上所述，在本发明之前尚未研究过嗜热聚合酶的拇指结构域。本发明中最优选的聚合酶是9°N聚合酶，包括其突变体和变体。9°N聚合酶不需要辅助蛋白。这与先前研究过的聚合酶相反，在所述聚合酶中拇指结构域的缺失显示出对与辅助蛋白之间相互作用的不利影响，而不改变该聚合酶的其它特性。相反地，如下文实验章节中所示，9°N中大量残基的缺失对于9°N的重要特性具有显著的不利影响，从而使催化活性严重受损。

应该理解，本发明并不旨在限于B家族聚合酶的突变体或变体。所述改变的聚合酶也可以是A家族聚合酶或其突变体或变体，例如Taq或T7 DNA聚合酶的突变体或变体，或既不属于A家族也不属于B家族的聚合酶，例如逆转录酶。然而，如本文所述的原因，B家族聚合酶是特别优选的。

本发明考虑使聚合酶由于DNA亲和力降低而表现出所需的特性的多种不同类型的改变。虽然添加和缺失突变也可以产生有用的聚合酶，但是特别优选在所述聚合酶的原始氨基酸序列中进行替换突变。适当的改变技术如定点诱变是本领域公知的。

因此，“改变的聚合酶”指与对照聚合酶相比具有至少一个氨基酸改变的聚合酶。通常，这种改变包括至少将一个氨基酸替换成其他氨基酸。在优选的实施方案中，这些改变是非保守性改变，尽管本发明也考虑可以维持蛋白质的总体电荷分布的保守性改变。而且，本发明的预期中包括所述聚合酶序列中的修饰可以是蛋白质中一个或多个氨基酸的缺失或添加，只要得到的聚合酶与对照聚合酶相比具有降低的DNA亲和力以及在每个反应循环中将核苷酸掺入多个分开的DNA模板中的能力。

在一个实施方案中，形成本发明聚合酶的改变包含所述聚合酶残基中的至少一种突变，优选至少一种替换突变，所述突变使该聚合酶与DNA的相互作用不稳定。因此，得到的聚合酶以较不稳定的方式与DNA相互作用。如上所述，该聚合酶对DNA亲和力的降低使其在单个反应循环中将一个或多个核苷酸掺入若干不同DNA分子中。因此，反应的总体效率得到提高，引起反应完成水平的提高。

在另一个实施方案中，所述改变包括所述聚合酶中与DNA结合的残基处至少一种突变，优选至少一种替换突变。可以根据适当聚合酶的可用晶体结构选择用于突变的适当靶残基，特别是在以封闭状态(与DNA结合)结晶时。通过减少与DNA结合接触的数目，可以实现DNA结合亲和力的总体降低。因此，所得的聚合酶在核苷酸掺入反应中表现出的改进的特征，在所述核苷酸掺入反应中与DNA的紧密结合是不利的。

以相似的方式，所述聚合酶也可以带有包含这样的改变：其包含所述聚合酶DNA结合结构域中的残基处的至少一种突变，优选至少一种替换突变。同样，预计这样的突变降低所述改变聚合酶的DNA结合亲和力，以使其能够在反应期间更容易地与分开的模板DNA分子结合和解离。

在一个实施方案中，该聚合酶包含这样的改变：其包含所述聚合酶中碱性氨基酸处的至少一种突变，优选至少一种替换突变。如本领域所公知，聚合酶中许多带正电荷的氨基酸残基与整体带负电荷的DNA双螺旋相互作用，尤其与DNA中核苷酸的特定磷酸基团相互作用。

如上所述，得到本发明聚合酶的优选改变类型包含至少一种替换突变。如以下实验章节所示，在所述聚合酶氨基酸序列中缺失残基可导致DNA亲和力降低同时由于催化活性被破坏而不具有总体有利特性的聚合酶。在一个特别优选的实施方案中，所述聚合酶包含两个替换突变，也可以包含四、五、六或七个等突变，只要得到的聚合酶具有所需特性。

优选地，所述聚合酶与核苷酸的亲和力基本不受所述改变的影响。如实验章节(尤其是实施例6)所示，有可能突变聚合酶以使其DNA亲和力降低，而该聚合酶与核苷酸的亲和力不受负影响，所述核苷酸可以是例如dNTP或ddNTP或其修饰形式(参见上文对核苷酸的定义)。在该上下文中，“基本不受影响”指与核苷酸的亲和力维持在与未改变聚合酶相同的数量级。优选地，与核苷酸的亲和力不受改变的影响。

优选地，所述聚合酶的保真度基本不受改变的影响。如实验章节(尤其是实施例6)所示，可以突变聚合酶以使其DNA亲和力降低，同时该聚合酶的保真度基本不受该改变的影响。在该上下文中，“基本不受影响”指每个核苷酸的误掺入率的数量级与未改变聚合酶相同。优选地，对核苷酸的保真度不受所述改变的影响。

就具体的和优选的结构突变体而言，它们可以基于最优选的聚合酶，即9°N DNA聚合酶。如下文实施例1中所述，使用对9°N-7 DNA聚合酶开放形式的晶体结构(PDB＝1qht)、密切相关的DNA聚合酶RB69的开放结构(PDB＝1ih7)以及RB69的封闭形式(PDB＝1ig9)进行的能量最小化重叠比对(通过Cresset实现)作为鉴定参与DNA结合的关键残基的结构模型。因此，改变的聚合酶在9°N DNA聚合酶氨基酸序列中Lys705、Arg713和/或Arg743位置或与其功能等价的位置上包含或掺入了一个、两个或三个替换成不同氨基酸的氨基酸替换突变。优选地，所述聚合酶为包含这些突变的9°N DNA聚合酶。所有一个、两个或三个突变的组合和排列均考虑在本发明的范围内。

基于“开放式”(即不与DNA结合)9°N DNA聚合酶结构和与DNA结合的RB69聚合酶已知晶体结构的比对，也可以在其它特定残基处产生突变。因此，改变的聚合酶在9°N DNA聚合酶氨基酸序列中Arg606和/或His679位置或与其功能等价的位置上包含或掺入了一个或两个替换成不同氨基酸的氨基酸替换突变。优选地，所述聚合酶为包含这些突变的9°NDNA聚合酶。所有不同的突变的组合和排列均考虑在本发明的范围内。因此，这些突变可以与上述其它突变组合产生。

在一个优选的实施方案中，所述聚合酶在9°N DNA聚合酶氨基酸序列中Arg713或Arg743位置或与其功能等价的位置包含至少一个替换为不同氨基酸的替换突变。如下文实验章节中更详细的描述，这两个位置代表了特别优选的突变位点。可以将同一个聚合酶中的这两个残基都突变为不同的氨基酸。

就所述不同氨基酸的性质而言，所述替换突变或突变优选地将被替换氨基酸转换为非碱性氨基酸(即，不是赖氨酸或精氨酸)。可以选择任何非碱性氨基酸。

优选的替换突变或突变将被替换氨基酸转换为以下的氨基酸：

(i)酸性氨基酸，

(ii)芳香氨基酸，尤其是酪氨酸(Y)或苯丙氨酸(F)；和

(iii)非极性氨基酸，尤其是丙氨酸(A)、甘氨酸(G)或甲硫氨酸(M)。

在一个实施方案中，所述替换突变或突变将替换氨基酸转换为丙氨酸。

在更具体的实施方案中，改变的聚合酶包含与9°N DNA聚合酶氨基酸序列中Lys705Ala和/或Arg713Ala和/或Arg743Ala功能等价的替换突变或突变。因此，在该实施方案中，所述聚合酶具有以下替换突变：705位从赖氨酸替换为丙氨酸和/或713位从精氨酸替换为丙氨酸和/或743位从精氨酸替换为丙氨酸，或者如果该聚合酶不是9°N DNA聚合酶时则在功能等价的位置上。在优选的实施方案中，所述聚合酶是包含所述替换突变的9°N DNA聚合酶。

在一个实施方案中，所述改变的聚合酶包含与Arg713Ala功能等价的氨基酸替换，并且在另一个实施方案中，所述改变的聚合酶包含与Arg743Ala功能等价的氨基酸替换。优选地，改变的聚合酶为9°N DNA聚合酶。

特定的结构突变体也可以基于其它类型的聚合酶，如“开放式”和“封闭式”结构已知的RB69聚合酶。因此，改变的聚合酶在RB69 DNA聚合酶氨基酸序列中Lys790、Lys800、Arg806、Lys844、Lys874和/或Lys878位置或与其功能等价的位置上包含或掺入了一个、两个、三个、四个、五个或六个替换为不同氨基酸的氨基酸替换突变。优选地，所述聚合酶为包含这些类似的或功能等价的突变的9°N DNA聚合酶。所有一个、两个、三个、四个、五个或六个突变的组合和排列均考虑在本发明的范围内。

(i)酸性氨基酸，

(ii)芳香氨基酸，尤其是酪氨酸(Y)或苯丙氨酸(F)；和

在一个实施方案中，所述替换突变或突变将被替换氨基酸转换为丙氨酸。

应该注意，本发明不限于只以上述方式进行改变的聚合酶。本发明的聚合酶可以包括许多其他突变，例如详细公开于WO 2005/024010的优选的突变体聚合酶。具体地，考虑在与9°N DNA聚合酶氨基酸序列中Leu408和Tyr409和Pro410功能等价位置上包含替换突变的聚合酶。在优选的实施方案中，该聚合酶为包含所述替换突变的9°N DNA聚合酶。

在具体的实施方案中，所述聚合酶包含与9°N DNA聚合酶氨基酸序列中Leu408Tyr、Tyr409Ala和Pro410Val中至少一种或两种但优选全部功能等价的替换突变。在优选的实施方案中，所述聚合酶为包含所有所述替换突变的9°N DNA聚合酶。

所述聚合酶还可以包含与9°N DNA聚合酶氨基酸序列中Cys223功能等价的位置上的替换突变。在优选的实施方案中，所述聚合酶为包含所述替换突变的9°N DNA聚合酶。在一个实施方案中，所述聚合酶包含与9°NDNA聚合酶氨基酸序列中Cys223Ser功能等价的替换突变。在优选的实施方案中，所述聚合酶为包含所述替换突变的9°N DNA聚合酶。

优选地，所述聚合酶为包含上述突变组合的9°N DNA聚合酶。

本发明还涉及包含SEQ ID NO：1、3、5或21任一项所示氨基酸序列、基本由上述序列组成或由上述序列组成的9°N聚合酶分子。本发明还包括仅有在物质程度上不影响该聚合酶功能的氨基酸改变中不同于SEQ IDNO：1、3、5和21所示氨基酸序列的聚合酶。在这种情况下，所述聚合酶的相关功能定义为DNA亲和力的降低，从而该聚合酶能够在每个反应循环中将核苷酸掺入多个分开的DNA模板(与对照聚合酶比较)和/或该聚合酶能够在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物(与对照聚合酶比较)。

因此，对DNA亲和力降低的聚合酶变体的这种活性不重要的残基进行保守性替换包括在本发明的范围内。可以容易地测试其他突变对所述酶功能的影响，例如使用众所周知的核苷酸掺入测定(如描述于WO2005/024010实施例中以及下文实施例3和实施例4中的测定)。

本发明的改变聚合酶也可以直接用其DNA亲和力的降低来定义，这与基本不改变的对核苷酸的保真度和亲和力一起产生了与本发明聚合酶相关的优势。因此，改变的聚合酶与DNA的解离常数(K_D)至少比未改变的对照聚合酶约高2倍、高3倍、高4倍或高5倍，或在上述范围之间。

在一个实施方案中，改变的聚合酶在盐溶液存在时从DNA上解离，所述盐溶液优选NaCl溶液，浓度低于或等于约500mM，优选低于500mM。所述盐溶液可以为适当的浓度，从而可以区分本发明亲和力降低的聚合酶以及与DNA结合更为紧密的未改变聚合酶。适当的盐溶液浓度(优选NaCl)在约150mM、200mM、250mM、300mM或350mM、优选200mM的范围内。任何适当的双链DNA分子均可用于检测所述改变是否具有降低DNA亲和力的理想效果。优选地，与所述聚合酶解离的DNA分子包含SEQ ID No.：18公开的序列。优选地，至少约40％、50％、60％、70％等的所述聚合酶将在洗涤溶液中相关的NaCl浓度下从DNA解离。

可以通过任何已知的方法进行解离实验，例如使用详细描述于下文实验章节的实施例5中的洗涤测定(还可参见图6和7)。

如上所述，(优选)实现DNA亲和力的降低而不显著或严重降低该聚合酶与核苷酸的亲和力。令人惊讶的是，尽管DNA结合亲和力已降低，但本发明的改变的聚合酶还可表现出与未修饰的聚合酶相当的活性，例如就Vmax而言。本发明聚合酶所表现出的这一令人惊讶的特性显示在本发明某些酶的动力学分析中，尤其是在下文实验章节的实施例6及作为参考的图8中。

本发明的改变的聚合酶也可以直接就其从表达所述聚合酶的宿主细胞纯化的能力上的改善来定义。因此，由于所述改变的聚合酶的DNA亲和力降低(这与基本不改变的对核苷酸的亲和力和保真度一起形成了与本发明聚合酶相关的优势)，所以该聚合酶可以更容易地进行纯化。在所述酶的纯化中遗留的宿主细胞内源DNA较少。因此，由于纯化方法之后仍与所述聚合酶结合的内源DNA较少，所以得到了更纯的产物。该改变的聚合酶与DNA的亲和力降低的另外一个优势是，需要较不苛刻的纯化方案以提供基本上纯净的聚合酶制备物。因此，受到纯化方法本身不利影响的聚合酶较少，导致聚合酶制备物具有较高水平的总体活性。另外，更均一的纯化应该成为可能，导致聚合酶各批次之间的差异降低。在纯化方案中内源DNA遗留的改善的代表性数据示于下文实验章节的实施例7中。

优选地，在对所述聚合酶进行纯化后遗留的宿主DNA为低于约60ng/ml、50ng/ml、40ng/ml、30ng/ml、20ng/ml、10ng/ml，更优选低于约5ng/ml。可以使用标准纯化方案，参阅如Colley等，J.Biol.Chem.264：17619-17622(1989)；Guide to Protein Purification，in Methods inEnzymology，vol.182(Deutscher编辑，1990)。

因此，本发明提供了改变的聚合酶，其与DNA的亲和力使得：

(i)该聚合酶与DNA的解离常数高出未改变的/对照聚合酶至少约为或近似为2倍、3倍、4倍或5倍；和/或

(ii)当对其应用浓度为约200nM至500nM之间、优选约200nM至300nM之间的氯化钠溶液时，至少50％、60％、70％或80％的聚合酶从与其结合的DNA上解离；和/或

(iii)在从表达所述聚合酶的细胞中进行纯化后，低于约60、50、45、40、35、30、25、20、15、10、5、3、1或0.5ng/ml的内源DNA保持与聚合酶结合；

所述改变不对核苷酸结合亲和力或保真度产生显著的不利影响，从而该聚合酶能够：

(a)在一个反应循环中形成数目增加的生产性聚合酶-DNA复合物(提高了反应完成的水平)，和/或

(b)催化总体水平改善(提高/升高)的核苷酸掺入；尤其是在聚合酶浓度就DNA浓度而言是限制性的条件下。

本发明还涉及编码本发明的改变聚合酶的核酸分子。

对于任何给定的改变聚合酶，其为氨基酸序列已知、优选编码该聚合酶的野生型核苷酸序列已知的聚合酶的突变体形式，可以根据分子生物学的基本原理获得编码该突变体的核苷酸序列。例如，假设编码9°N聚合酶的野生型核苷酸序列已知，则可以使用标准遗传密码推导出编码具有一个或多个氨基酸替换的任何9°N突变体形式的核苷酸序列。类似地，可以容易地得出来自A家族和B家族聚合酶的其它聚合酶突变体形式的核苷酸序列，所述其它聚合酶为例如Vent^TM、Pfu、Tsp JDF-3、Taq等。之后，可以使用本领域已知的标准分子生物学技术构建具有所需核苷酸序列的核酸分子。

在一个具体的实施方案中，本发明涉及编码9°N聚合酶突变体形式的核酸分子。

因此，本发明提供编码改变的9°N聚合酶的核酸分子，该核酸分子包含SEQ ID NO：2、4、6、19或20中任何核苷酸序列，或者基本上由其组成或由其组成。

根据本发明，确定的核酸不仅包括相同的核酸，也包括任何微小的碱基变化，具体地，包括在保守性氨基酸替换中由于简并密码而产生同义密码子(不同的密码子代表相同的氨基酸残基)的替换。关于碱基变化，术语“核酸序列”也包括任何给定单链序列的互补序列。

有利地，本文所述的核酸分子也可以包括在适当的表达载体中，以在适当的宿主中表达其编码的聚合酶蛋白。因此，表达载体包含SEQ IDNO：2、4、6、19或20中的任何核苷酸序列，或者基本上由其组成或由其组成。将克隆的DNA整合到适当的表达载体中随后用于其后转化所述细胞以及随后选择转化细胞是本领域的技术人员公知的，如Sambrook等(1989)，Molecular cloning：A Laboratory Manual，Cold Spring HarbourLaboratory中所提供。

这样的表达载体包括与调节序列如启动子有效连接的本发明核酸，所述调节序列能够影响所述DNA片段的表达。术语“有效连接”指使所述组分以其预期方式发挥作用的排列。这样的载体可以转化进适当的宿主细胞中，从而用于表达根据本发明的蛋白质。

所述核酸分子可以编码成熟的蛋白质或具有前体序列(prosequence)的蛋白质，包括编码前蛋白上前导序列的蛋白质，所述前导序列其后被宿主细胞切割以形成成熟蛋白。

所述载体可以是，例如质粒、病毒或噬菌体载体，其具有复制起点和任选的用于表达所述核苷酸的启动子以及任选的启动子调节子。载体可以包含一个或多个选择标记，例如抗生素抗性基因。

表达所需的调节元件包括结合RNA聚合酶并且指导正确的转录起始水平的启动子序列，还包括用于核糖体结合的翻译起始序列。例如，细菌表达载体可以包括启动子(如lac启动子)和用于翻译起始的Shine-Delgarno序列以及起始密码子AUG。类似地，真核表达载体可以包括用于RNA聚合酶II的异源或同源启动子、下游聚腺苷酸化信号、起始密码子AUG以及用于核糖体分离的终止密码子。这样的载体可以从商业途径获得，或者通过本领域所公知的方法由所述序列装配而成。

通过高等真核细胞转录编码本发明聚合酶的DNA可以通过在载体中包括增强子序列进行优化。增强子是DNA顺式作用元件，其作用于启动子从而提高转录水平。除了选择标记以外，载体也通常包括复制起点。

所述改变聚合酶的优选用途

在另一方面中，本发明涉及根据本发明与DNA亲和力降低的改变聚合酶在将核苷酸掺入多核苷酸中的用途。如上所述，所述核苷酸的性质无限制性，因为本发明的改变聚合酶保持对相关核苷酸的亲和力。

如上所述，本发明基于如下的认识：聚合酶与DNA模板的紧密结合不总是有利的特性。在每个反应循环中针对每个模板DNA分子只发生一次核苷酸掺入事件的测序反应中尤其是这样。在许多这样的测序反应中使用标记的核苷酸。

因此，本发明提供聚合酶的用途，所述聚合酶已经改变，使其表现出降低的DNA亲和力，以及为了将标记核苷酸掺入多核苷酸而在每个反应循环中将标记核苷酸掺入多个分开的DNA模板中的能力，其中所述标记用于确定所添加核苷酸的性质。

在一个实施方案中，所述核苷酸包含ddNTP。因此，本发明的聚合酶可以用于常规的Sanger测序反应，其详细内容是本领域公知的。

在优选的实施方案中，所述核苷酸是经修饰的核苷酸，其已在3’糖羟基处进行修饰，从而该取代物的大小比天然存在的3’羟基更大。

本发明的所述聚合酶可以用于任何需要/期望能将核苷酸掺入多核苷酸链的任何技术领域，所述核苷酸为例如在3’糖羟基位置具有比天然存在的羟基更大的取代基的修饰核苷酸。它们可以用于需要所述酶的任何期望的特性的任何技术领域，所述特性为例如甚至在DNA过量存在条件下提高核苷酸掺入率，以及在上述条件下提高反应的完成水平。这可以是实践上、技术上或经济上的优势。

虽然所述改变的聚合酶由于其与DNA亲和力降低而表现出可以掺入具有大3’取代基的修饰核苷酸的期望特性，但是该酶的用途不仅限于掺入这样的核苷酸类似物。与本领域已知的酶相比，所述改变的聚合酶由于其与DNA的亲和力降低而具有的期望特性可以为掺入任何其它核苷酸提供优势，包括未修饰的核苷酸。实际上，本发明的改变的聚合酶可用于掺入其有能力掺入的任何类型核苷酸。

本发明所述的聚合酶可用于多种需要将核苷酸掺入多核苷酸的技术，所述技术包括测序反应、多核苷酸合成、核酸扩增、核酸杂交实验、单核苷酸多态性研究以及其它这样的技术。在测序反应中的用途代表了非常优选的实施方案。所有使用本发明的修饰聚合酶的这些用途和方法都包括在本发明的范围内。

本发明还涉及将核苷酸掺入DNA的方法，包括使以下组分相互作用：

(i)本发明的聚合酶；

(ii)DNA模板；以及

(iii)核苷酸溶液。

如上所述，本发明所述的聚合酶在每个反应循环中仅需掺入单个或相对少量核苷酸的反应中尤其有用。在这些反应中常常标记一个或多个核苷酸。因此，本发明提供将标记核苷酸掺入DNA的方法，包括使以下组分相互作用：

(i)聚合酶，经改变以使其表现出降低的DNA亲和力以及在每个反应循环中将标记核苷酸掺入多个分开的DNA模板的能力；

(ii)DNA模板；以及

(iii)核苷酸溶液。

在一个具体的实施方案中，本发明提供将核苷酸掺入DNA的方法，所述核苷酸在3’糖羟基处进行修饰，从而该取代基的大小比天然存在的3’羟基更大，所述方法包括使以下组分相互作用：

(i)本发明的聚合酶(如上所述)；

(ii)DNA模板；以及

(iii)含有核苷酸的核苷酸溶液，所述核苷酸在3’糖羟基处进行修饰，从而该取代基的大小比天然存在的3’羟基更大。

特别优选在聚簇阵列(clustered array)上进行的用途和方法。核酸分子的聚簇阵列可以使用本领域通常已知的技术生产。例如，WO98/44151和WO 00/18957(均作为参考并入本文)都描述了核酸扩增的方法，该方法使扩增产物固定在固体支持物上，以形成了包含固定核酸分子的簇或“集落”的阵列。还参考WO 2005/078130，包括其中的引用文献，上述所有内容作为参考并入本文。在聚簇上掺入尤其是在聚簇阵列上测序提供了特有的优势，因为所述聚合酶能够将核苷酸掺入位置十分接近的多个DNA模板中，因而提供高反应效率。

使以上组分在允许核苷酸的5’磷酸基与DNA模板上3’游离羟基之间形成磷酸二酯键的条件下相互作用，由此将该核苷酸掺入多核苷酸中。优选的核苷酸包括修饰核苷酸在上文有详细描述。

所述掺入反应可以在游离溶液中进行，或者所述DNA模板可以固定在固体支持物上。

突变体酶表现的核苷酸掺入率可以与未改变酶表现的核苷酸掺入率类似。由于所述修饰酶的改进活性，由于其与DNA的亲和力降低，同样的掺入率与单个反应循环中将核苷酸掺入多个模板中能力的组合提高了总体完成率。然而，突变体酶的核苷酸掺入率不需与未改变酶的核苷酸掺入率完全相同就可以有实际用途。只要就反应完成而言总体反应效率提高，核苷酸掺入率可以低于、等于或高于未改变酶的核苷酸掺入率。

在本发明的一个具体实施方案中，本发明的聚合酶可以在合成测序方案中用于将修饰核苷酸掺入多核苷酸链中。在所述方法的这一具体方面中，在3’糖羟基处进行修饰，从而该取代基的大小比天然存在的3’羟基更大。检测这些核苷酸以确定DNA模板的序列。

因此，另一方面中本发明提供一种DNA测序方法，该方法包括使以下组分相互作用：

-根据本发明的聚合酶(如上所述)；

-DNA模板；以及

-含有核苷酸的核苷酸溶液，所述核苷酸在3’糖羟基处进行修饰，从而该取代基的大小比天然存在的3’羟基更大，这样其后检测掺入的修饰核苷酸使得可以对DNA模板进行测序。

用于测序反应的DNA模板一般包含具有3’游离羟基的双链区域，其在测序反应中作为添加其他核苷酸的引物或起始点。待测序的DNA模板区悬挂在互补链的这种3’游离羟基上。具有3’游离羟基的引物可以作为与待测序模板区杂交的单独组分加入(例如短的寡核苷酸)。或者，引物与待测模板链可各自形成能够形成分子内双链体的自身互补核酸链的一部分，例如发夹环结构。核苷酸连续添加到3’游离羟基上，使多核苷酸链以5’至3’的方向合成。每添加一个核苷酸之后，所添加碱基的性质即被确定，由此提供了DNA模板的序列信息。

如果修饰核苷酸可以作为链终止子的话，就可以实现这样的DNA测序。一旦该修饰核苷酸掺入与被测序模板区的正在延长的多核苷酸链中，将没有可用的游离3’-OH基团用于指导进一步的序列延伸，该聚合酶因此不能再添加核苷酸。一旦确定了掺入逐渐延长的链中的碱基性质，可以去除3’阻断从而使得可以添加下一个连续的核苷酸。通过使用这些修饰核苷酸对得到的产物进行排序，有可能推导出DNA模板的DNA序列。如果每种修饰核苷酸连接已知对应于特定碱基的不同标记，以便于区分每个掺入步骤中添加的碱基，则该反应可以在单个实验中完成。或者，可以进行分别包含每种修饰核苷酸的分开的反应。

在优选的实施方案中，修饰核苷酸带有标记以便于其检测。优选地，所述标记为荧光标记。每种核苷酸类型可以带有不同的荧光标记。然而，该检测标记不需要为荧光标记。可以使用允许检测核苷酸掺入DNA序列中的任何标记。

适用于本发明的一种检测荧光标记核苷酸的方法包括使用波长特异针对所述标记核苷酸的激光，或使用其它适当的光源。

在一个实施方案中，所述核苷酸上的标记荧光可以通过CCD相机进行检测。

如果将所述DNA模板固定在表面上，它们可以优选地固定于表面上以形成高密度阵列，优选地为如上所述的聚簇或“集落”阵列。在一个实施方案中，根据该申请人为本发明开发的技术，所述高密度阵列包含单分子阵列，其中在阵列上每个可检测离散位点上有单个DNA分子。由通过光学手段可各个分辨的(individually resolvable)的核酸分子组成的单分子阵列以及这些阵列在测序中的用途描述于例如WO 00/06770，其内容作为参考并入本文。由包括发夹环结构的可各个分辨的核酸分子组成的单分子阵列描述于WO 01/57248，其内容也作为参考并入本文中。本发明的聚合酶适于与根据WO 00/06770或WO 01/57248的公开内容制备的单分子阵列一起使用。然而，应该理解，本发明的范围并非意在限制于所述聚合酶与单分子阵列一起的用途。

基于单分子阵列的测序方法可以通过向单分子阵列中添加荧光标记的修饰核苷酸以及改变的聚合酶来实现。互补核苷酸与每个核苷酸片段的第一个碱基配对，并随后在所述改进的聚合酶所催化的反应中加入到引物上。去除剩余的游离核苷酸。

然后，波长特异性针对每种修饰核苷酸的激光激发掺入的修饰核苷酸上适当的标记，引起该标记发出荧光。荧光可以通过合适的CCD相机进行检测，该相机可以扫描整个阵列从而鉴定每个片段上掺入的修饰核苷酸。因此，有可能平行地检测数以百万计的位点。然后可以去除荧光。

掺入的修饰核苷酸的身份表明了样品序列中与其配对的碱基的身份。然后可以将掺入、检测和鉴定的循环重复约25次，从而确定附着在阵列上的每个可检测寡核苷酸片段中的前25个碱基。

因此，通过对所述阵列上的所有可检测分子同时进行测序，可以确定数以亿计以单拷贝附着在所述阵列的寡核苷酸片段的前25个碱基。本发明显然不仅限于测序25个碱基。取决于所需序列信息的详细程度以及阵列的复杂性，可以对多得多的碱基或更少的碱基进行测序。

使用适当的生物信息学程序，可以将产生的序列与特定参照序列进行比对和比较。这允许确定任意数目的已知或未知遗传变异，例如单核苷酸多态性(SNP)。

本发明的改变聚合酶的功用不限制于使用单分子阵列进行的测序应用。该聚合酶可以与需要使用聚合酶将核苷酸掺入多核苷酸链的任何类型基于阵列(特别是任何基于高密度阵列)的测序技术一起使用，特别是依赖掺入具有大3’取代基(比天然羟基更大)如3’阻断基的修饰核苷酸的任何基于阵列的测序技术。

本发明所述的聚合酶可以用于在基本上任何类型的阵列上进行核酸测序，所述阵列通过将核酸分子固定在固体支持物上而形成。除了单分子阵列以外，合适的阵列也包括例如多重多核苷酸(multi-polynucleotide)或聚簇阵列，其中所述阵列上的不同区域包含一种多核苷酸分子的多个拷贝或者甚至是少量不同多核苷酸分子(例如两条互补核酸链的多个拷贝)的多个拷贝。

具体地，本发明聚合酶可以用于WO 98/44152描述的核酸测序方法，其内容作为参考并入本文中。该国际申请描述了一种对位于固体支持物上不同位置的多个模板进行平行测序的方法。该方法依赖于将标记核苷酸掺入多核苷酸链。

本发明的聚合酶可以用于国际申请WO 00/18957描述的方法，其内容作为参考并入本文中。该申请描述了固相核酸扩增和测序的方法，其中将大量不同的核酸分子排成阵列并通过形成核酸集落以高密度同时扩增，随后对核酸集落进行测序。本发明的改变聚合酶可以用于该方法的测序步骤中。

核酸分子的多重多核苷酸或聚簇阵列可以使用本领域中一般已知的技术进行合成。例如，WO 98/44151和WO 00/18957均描述了核酸扩增的方法，该方法使得扩增产物固定于固体支持物上，从而形成由固定核酸分子的簇或“集落”组成的阵列。涉及制备聚簇阵列的以及使用该阵列作为核酸测序的模板的WO 98/44151和WO 00/18957内容作为参考并入本文中。根据所述方法制备的聚簇阵列上的核酸分子为使用本发明聚合酶进行测序的合适模板。然而，本发明并非意在限于所述聚合酶在测序反应中的用途，该测序反应在根据这些特定方法制备的聚簇阵列上进行。

本发明的聚合酶还可以用于荧光原位测序方法中，如描述于Mitra等Analytical Biochemistry 320，55-65，2003中的方法。

本发明还考虑包含本发明聚合酶的试剂盒，所述聚合酶可能与适当的使用说明书包装在一起。所述聚合酶将以适于使用的形式提供，例如在适当的缓冲液中提供或以能够重建使用的形式(例如以冻干的形式)提供。

因此，提供了用于核苷酸掺入反应或测定的试剂盒，其包含本发明的聚合酶以及核苷酸溶液，所述核苷酸使得聚合酶能够将其掺入正在延长的DNA链中。优选的核苷酸包括适当标记的核苷酸，例如可由此用于测序反应的核苷酸。标记可包括本领域中公知的荧光标记、放射性标记和/或质量标记。

在一个优选的实施方案中，所述核苷酸溶液包含诸如ddNTP之类的合成(即非天然)的核苷酸，或基本由其组成或者由其组成。该试剂盒因此可以用于例如Sanger测序反应中。

在另一个实施方案中，所述核苷酸溶液包含修饰核苷酸，或基本由其组成或者由其组成。优选的修饰核苷酸已在上文就本发明的聚合酶进行了定义，并且该描述在加以必要的修正后也可应用于此处。

在另一个实施方案中，该试剂盒也可以掺入使得核苷酸掺入反应得以进行的适当引物和/或DNA模板分子。

在另一个方面中，本发明提供了用于合成本发明聚合酶的方法，包括：

(i)选择聚合酶中用于诱变的残基；

(ii)根据(i)的选择产生突变体聚合酶；

(iii)测定该突变体聚合酶与DNA的亲和力；和

(iv)如果与DNA的亲和力有所降低，则测试该聚合酶在每个反应循环中形成更多生产性聚合酶-DNA复合物的能力。

优选地，与核苷酸的亲和力不受影响，但是如果其保持与未经修饰聚合酶的亲和力相同的数量级也可以认为是满足条件。

在一个实施方案中，该方法还包括在诱变后确保所述聚合酶保持相同数量级的保真度。

优选地，保真度不受影响，但是如果其保持与未经修饰聚合酶的保真度相同的数量级也可以认为是可接受的。

反应循环在上文有所描述。

在优选的实施方案中，聚合酶的测试包括使用合成核苷酸来确定是否形成数目增加的生产性聚合酶-DNA复合物。可以测试聚合酶的适当的核苷酸掺入测定是本领域已知的(参阅如WO2005/024010)，并且在下文实验章节有更详细的描述。

在一个实施方案中，基于9°N的一级氨基酸序列选择残基。在一个实施方案中，通过预测哪些氨基酸会与DNA接触来进行选择。或者，可以选择下述残基：预计其稳定聚合酶与DNA的相互作用，和/或可见于聚合酶的DNA结合结构域中，和/或其为碱性的。如上文和实验章节所述，预测可基于适当聚合酶的晶体结构(实施例1)。

诱变尤其是定点诱变的方法在本领域有完善的表征，并有市售试剂盒。因此，这些技术不再详细讨论。任何适当的技术均可以用于本发明的方法中。

可以通过任何适当的方法测量与DNA亲和力的降低。优选地，与原始的未改变聚合酶相比，亲和力至少降低或约降低1.5倍、2倍、3倍、4倍或5倍等。亲和力可以利用例如解离常数来衡量。

在优选的实施方案中，所述聚合酶是B家族聚合酶，优选来自嗜热古细菌，最优选为9°N聚合酶。

附图说明

参照以下的实验章节和附图可进一步理解本发明，其中：

图1显示本发明突变体酶的过表达。

图2显示使用所述突变体酶的粗制备物进行NUNC管测定的结果。

图3显示使用所述突变体酶进行单碱基掺入测定的结果。

图4进一步表现出所述突变体酶的活性。

图5显示[DNA]＞[聚合酶](比例为5∶1)时，对对照聚合酶(YAV)以及三种突变体酶(K705A、R713A和R743A)中的每一种进行单碱基掺入测定的时间过程结果。

图6用所示NUNC孔的荧光影像显示洗涤测定的结果。

图7也展示洗涤测定的结果，显示各种聚合酶与DNA模板的亲和力(为清楚起见省略了K705A的数据)。

图8展示了显示聚合酶的动力学特征的Michaelis曲线，其为重叠显示。

图9展示由已修饰密码子的克隆9基因编码的核苷酸和氨基酸序列。

图10展示SDS-PAGE实验的结果，将未诱导的(凝胶I)和经诱导的(凝胶I、II)培养粗裂解物中Pol52(在pET11-a表达载体中表达时已修饰密码子的克隆9基因)的3个克隆(1、2和4)与Pol19(在pNEB917表达载体中表达的克隆9基因)和Pol43(从pET11-a表达载体中表达的克隆9基因)的表达进行比较。缩写：MW-分子量；PM-蛋白标记；cl9-克隆9。

发明详述

实验章节

实施例1-制备改变的聚合酶

原理

在9°N-7 YAV C223S聚合酶的C端区域中引入定点突变，从而降低该酶与DNA的亲和力(野生型9°N-7聚合酶具有非常高的DNA亲和力，Kd＝50pM；Southworth等1996.PNAS.93，5281)。

使用9°N-7 DNA聚合酶开放形式的晶体结构(PDB＝1qht)、密切相关的DNA聚合酶RB69开放结构(PDB＝1ih7)以及RB69封闭形式(PDB＝1ig9)的能量最小化重叠比对(通过Cresset进行)作为鉴定参与DNA结合的关键残基的结构模型。RB69聚合酶封闭形式的晶体结构(Franklin等2001.Cell 105，657)鉴定了许多与复合的DNA形成氢键或静电相互作用的残基，直接与核苷酸碱基或者与磷酸骨架起作用。这些残基中很大一部分是碱性的(Lys790、800、844、874、878和Arg806)，这与它们可能与酸性磷酸基相互作用一致。对封闭RB69结构的观察显示这些残基中大多数采取朝向结合双链体的取向。不存在与9°N-7聚合酶封闭形式类似的结构，所以我们使用我们的结构比对来鉴定9°N-7聚合酶开放形式中采取与RB69开放结构中碱性残基(上述的残基)类似的构象的碱性残基。在来自RB69的6个碱性残基中，发现其中3个在9°N-7中具有相应碱性残基，它们是：Arg743(RB69 Lys878)、Arg713(Lys800)和Lys705(Lys844)。决定改造4个突变体酶：所示残基的丙氨酸变体(R743A、R713A和K705A)以及71位氨基酸的缺失(A71)，所述缺失去除了拇指亚结构域的α-螺旋(在9°N-7聚合酶结构中发生异常的残基)，上述三个残基就位于其中。

诱变和克隆

使用Stratagene Quikchange XL试剂盒及其操作方案，通过PCR方法将突变引入pSV19(编码9°N-7 YAV C223S exo-聚合酶的载体)(还参阅WO 2005/024010)。

使用的诱变引物：

R743A

正向 5′-CCCGGCGGTGGAGGCGATTCTAAAAGCC-3′(SEQ ID NO：9)

反向 3′GGGCCGCCACCTCCGCTAAGATTTTCGG-5′(SEQ ID NO：10)

R713A

正向 5′-GAAGGATAGGCGACGCGGCGATTCCAGCTG-3′(SEQID NO：11)

反向 3′-CTTCCTATCCGCTGCGCCGCTAAGGTCGAC-5′(SEQ ID NO：12)

K705A

正向 5′GCTACATCGTCCTAGCGGGCTCTGGAAGG-3′ (SEQ ID NO：13)

反向 3′-CGATGTAGCAGGATCGCCCGAGACCTTCC-5′(SEQ ID NO：14)

A71(C端704)

正向 5′GCTACATCGTCCTATGAGGCTCTGGAAGG-3′(SEQ ID NO：15)

反向 3′-CGATGTAGCAGGATACTCCGAGACCTTCC-5′(SEQ ID NO：16)

选择潜在的克隆并对基因的PCR片段进行测序从而证实突变的存在。产生所有突变体的阳性克隆。

过表达和培养

转化进表达菌株Novagen RosettaBlue DE3 pLysS

如WO 2005/024010的实验章节所述进行培养和诱导。

如WO 2005/024010的实验章节所述进行收获和裂解。

如WO 2005/024010的实验章节所述进行纯化。

结果：

实现了突变体酶成功的过表达。过表达了所有突变体酶。对SDS-PAGE凝胶进行电泳以检查所述构建体的过表达(-＝未诱导的；+＝IPTG诱导的)。得到的凝胶示于图1。

实施例2-使用粗蛋白制备物进行NUNC管测定。

如WO 2005/024010中所述，对突变体酶的5ml小培养物(同时使用YAV C223S exo-培养物用作直接比较)进行快速纯化直至热处理步骤。此时，认为该样品足够纯净可以测试其活性。

使用S300凝胶过滤离心柱将每种粗制备物的缓冲液更换为酶学缓冲液(50mM Tris pH8.0、6mM MgSO4、1mM EDTA、0.05％Tween20)。该样品未对浓度进行归一化。所使用的测试为简单地将ffTTP掺入表面偶联A模板发夹。根据产品说明书，将2皮摩的5’-氨基寡聚物815

(5′-CGATCACGATCACGATCACGATCACGATCACGATCACGCTGATGTGCATGCTGTTG

TTTTTTTACAACAGCATGCACATCAGCG-3′) (SEQ ID NO：12)

与NUNC-nucleolink胶条偶联。

洗涤后，将每个孔与20μl等分试样的粗酶制备物(以下列出酶的性质)以及5μM ffTN3-647一起孵育。接着将胶条在45℃孵育30分钟。该实验以一式两份进行。孵育30分钟完成后，用3×100μl高盐洗涤缓冲液(10mM Tris pH8.0，、1M NaCl、10mM EDTA)以及其后3×100μl的MiiliQ水洗涤小孔。在typhoon荧光成像仪(CY5滤光器，PMT＝450V)上对胶条进行扫描。

该结果示于图2，其中孔如下所示：

1＝仅为20μl酶学缓冲液+1μl 100μM ffT-N3-647

2＝20μl粗YAV C223S exo-+1μl 100μM ffT-N3-647

3＝20μl粗YAV C223S R743A exo-(克隆12)+1μl100 μM ffT-N3-647

4＝20μl粗YAV C223S K705A exo-(克隆15)+1μl 100μM ffT-N3-647

5＝20μl粗YAV C223S R743A exo-(克隆16)+1μl 100μM ffT-N3-647

6＝20μl粗YAV C223S R713A exo-(克隆24)+1μl 100μM ffT-N3-647

7＝20μl粗YAV C223S Δ71 exo-(克隆38)+1μl 100μM ffT-N3-647

8＝20μl粗YAV C223S R713A exo-(克隆39)+1μl 100μM ffT-N3-647

结果

除了背景孔(只有MilliQ)和孔1(不含酶的对照)以外，在所有的孔中均观察到酶学反应。荧光强度与掺入ffTTP的量成正比——孔越暗，掺入水平越高。相对于YAV(克隆9)(YAV C223S exo-)描述突变体酶的作用。缺失拇指亚结构域的尖部(Δ71突变体)得到催化作用严重受损的酶，并且仅掺入克隆9 35％的水平。突变体K705A与克隆9等价。两种精氨酸突变体R743A和R713A显示掺入水平的提高，表现出对克隆9约45％的提高。

结论

突变体酶K705A、R713A和R743A表现出掺入水平的提高以及酶与DNA亲和力的降低。去除所有这三个碱性残基与缺失其他残基的组合破坏其活性(Δ71突变体)。可能在不存在其他突变/缺失时，全部替换这三个残基不会导致活性的降低。

实施例3-单碱基掺入测定

使用描述于WO 2005/024010的单碱基掺入测定对粗酶制备物(归一化的浓度)的活性进行测量。在2μM ffT-N3-cy3和20nM 10A发夹DNA(³²p-标记的)存在下，用30或3μg/ml粗酶制备物孵育10分钟，在0、30、60、180和600秒取出反应混合物的等分试样并在12％丙烯酰胺凝胶上电泳。

结果

凝胶图象显示于图3。

使用Imagequant对条带强度进行定量，荧光强度对孵育时间作图产生示于图4的时间过程。

这些数据给出了对突变体酶相对于YAV的ffTTP第一个碱基掺入性能的估计。由于浓度的归一化，所述活性可直接比较。Δ71突变体基本无活性(kobs为YAV所观察到的21％)，R743A和K705A具有与YAV相当的活性，但R713A显示出kobs(2倍于YAV所观察到的)和循环完成水平的显著提高。

实施例4-在[DNA]高于[聚合酶]的条件下用于纯化的聚合酶的单碱基掺入测定。

使用描述于WO 2005/024010的单碱基掺入测定对克隆9聚合酶(YAV C223S exo-)以及拇指亚结构域突变体K705A、R713A和R743A的纯化酶制备物的活性进行测量。该实验在DNA和聚合酶各自的浓度比约为5∶1时进行。因此，研究了所述酶在单个反应循环中将核苷酸掺入多个DNA模板分子的能力。在20nM 10A发夹DNA(³²P-标记的)和2μMffT-N3-cy3存在下用4nM纯化的酶孵育30分钟，在0、15、30、60、180、480、900和1800秒间隔时取出该反应混合物的等分试样并在12％丙烯酰胺凝胶上电泳。

结果

使用Imagequant对条带强度进行定量，转换为完成百分比(基于凝胶上起始材料和终产物条带的相对强度)的荧光强度对孵育时间作图得到的时间过程示于图5。

克隆9和K705A的时间过程曲线的性质是二相性的，显示为最初的指数“激增”期(黑线)和之后产物随时间转换的线性依赖性(灰线)。K705A激增期的幅度比克隆9更高(分别为～28％和19％)，并且K705A的线性期的梯度比克隆9的更陡(因此更快)。这一观察的重要性将在下文讨论。

与此相反，R713A和R743A突变体酶并不显示这种二相性性质，取而代之地，只观察到快速指数期。在这两种情况中指数期的幅度均为～90％，表明指数期中的产物转换程度比克隆9或K705A更高。激增期等同于反应起始前聚合酶相关DNA分子群的ffTTP掺入率，即聚合酶:DNA:ffTTP三元复合物可以转换的最高速率。任何随后的时期都归因于较慢的解离/再结合过程，该过程是所述聚合酶分离新底物分子(DNA和ffTTP)所需要的。所观察到的克隆9和K705A的二相性性质提示，较慢的激增后期是由酶与DNA解离和再结合的困难程度造成的，很可能是由于其较低的Kd(DNA)。

突变在与聚合酶结合时可以接触双链体DNA的碱性残基(即R713和R743)以消除该功能性产生仅显示突发动力学的突变体酶(R713A和R743A)。我们用两种方法中的一种来解释这一点：i)通过降低与DNA的亲和力(提高Kd(DNA))来提高酶与DNA解离和再结合的能力，和/或ii)在这些突变体中DNA亲和力的降低导致聚合酶制备物中出现大的“活性酶”级分。已显示不纯的DNA聚合酶(由裂解中保留的大肠杆菌基因组DNA污染)通过减少制备物中的活性酶级分而抑制酶。

所述时间过程的粗拟合提示，所观察到的克隆9和K705A的激增期的速率常数相当(kobs～0.06s-1)，而R713A(kobs～0.01s-1)和R743A(kobs～0.004s-1)的速率常数较小。在这些实验条件下，克隆9和K705A的激增比R713A或R743A的激增更快，但是由于缺乏克隆9和K705A固有的较慢并且线性的解离/再结合期，所以后两种酶在较短的时间内完成反应。

实施例5-洗涤测定

使用洗涤测定定性评估纯化的酶制备物与DNA的亲和力。根据生产商的方案，用2皮摩的5’-氨基A-模板发夹寡聚物815(5′H2N-

CGATCACGATCACGATCACGATCACGATCACGATCACGCTGATGTGCATGCTGTTGTTTT

TTTACAACAGCATGCACATCAGCG-3′)(SEQ ID NO：18) 对4(1×8)个NUNC nucleolink胶条进行功能化。

洗涤后，将每个孔与20μl等分试样的500nM酶(克隆9、K705A、R713A或R743A突变体)在45℃孵育30分钟。孵育后，用包括不同浓度NaCl(0、0.05、0.1、0.3、0.4、0.75、1.0、2.0 M)的3×100ml 10mMTris pH8.0，10mM EDTA对每个孔进行洗涤，然后用3×100ml MilliQ水进行洗涤。随后，用酶学缓冲液将孔预平衡，之后再次与20μl的2μMffT-N3-647在45℃孵育30分钟。用3×100ml的高盐洗涤缓冲液(10mMTris pH8.0，1M NaCl，10mM EDTA)对孔进行洗涤，然后用3×100mlMilliQ水进行洗涤。在Typhoon荧光成像仪上扫描胶条(y5滤光器，PMT＝500 V)。

结果

NUNC孔的荧光图像显示于图6。

孔中的任何荧光都是由于洗涤后与表面偶联DNA结合的残余酶。提高孵育之间洗涤缓冲液的离子强度会通过遮蔽静电相互作用而使聚合酶和DNA之间的相互作用不稳定。在更高的离子强度下，酶会更加高效地从DNA上洗脱。

当在孵育之间使用低离子强度洗涤时，所有测试酶都显示出高水平的掺入，因此酶从DNA解离的效率较低。随着洗涤缓冲液中NaCl浓度的提高，酶的表现相对于彼此来说有所变化。[NaCl]＜200mM时，突变体酶R713A和R743A更有效地从DNA上移除，而K705A和克隆9表现出彼此相似的反应，需要较高的[NaCl]使它们从DNA上移除。即使在用2MNaCl洗涤后，克隆9仍观察到相对于0M NaCl洗涤来说显著水平(约75％)的掺入。这在图7所示曲线中有清楚的展示(为了清楚起见，K705A的数据已被省略)。有趣的是，测试酶在经历了2M NaCl洗涤后似乎无一从DNA上完全移除。

从该实验很明显看出，对残基R713和R743进行突变得到显示低于克隆9的DNA亲和力的酶，证据为它们被较低离子强度的洗涤从DNA洗脱的能力。

实施例6-克隆9、R713A和R743A的ffT-N3-cy3掺入动力学

使用NUNC管测定对所述酶进行动力学表征，包括在各种[ffNTP]下测量[DNA]＜＜[聚合酶]或[ffNTP]时ffT N3 cy3的一阶(first order)掺入率常数。以下描述测试这三种聚合酶所使用的方法。

根据生产商的方案，用2皮摩的5’-氨基A模板发夹寡聚物815(5’H2N-

CGATCACGATCACGATCACGATCACGATCACGATCACGCTGATGTGCATGCTGTTGTTTT

TTTACAACAGCATGCACATCAGCG-3′)(SEQID NO：18)，对6个(1×8)NUNC nucleolink胶条进行功能化。

在特定的[ffT-N3-cy3]下，使用每个胶条进行时间过程实验。在45℃下在每个NUNC孔中将20μl的酶学缓冲液(50mM Tris pH8.0，6mMMgSO4，1mM EDTA，0.05％Tween20)孵育2分钟。

使用8-通道多道移液器通过加入在45℃预平衡2分钟的20μl等分试样2×酶学混合物(X μM ffT-N3-cy3，酶学缓冲液中1.1μM聚合酶)来起始时间过程，从而各个孔在相同的时间点开始反应。向孔中的缓冲液加入2×酶学混合物足以产生适当的混合。通过加入125μl 250mM EDTA使反应终止在所需的时间点。在所有8个孔中的反应均终止后，用3×100ml高盐洗涤液(10mM TrispH 8.0，1M NaCl，10mM EDTA)对胶条进行洗涤，之后用3×100ml MilliQ水进行洗涤，然后在Typhoon荧光成像仪(Cy3滤光器，PMT＝500V)上进行扫描。使用Imagequant对每个孔中的荧光强度进行定量。将Cy3荧光强度的变化对时间作图得到时间过程图。在我们的实验条件下，这些时间过程图将孔评价为单指数式衰减过程(拟合于方程：y＝yo+Aexp(x/t))，由此可以确定反应的半衰期t，其倒数称为观察速率常数knobs(kobs＝1/t)。

观察速率常数的大小取决于ffT-N3-cy3的浓度，因此通过在不同ffT-N3-cy3浓度下重复该实验可以确定特定酶的knobs值范围。根据标准酶学分析，knobs随ffT-N3-cy3浓度的变化为双曲线形，并与Michealis-Menten方程：Vmax＝(kpol×[S])/(Kd+[S])拟合良好，这里S＝ffT N3-cy3。从Michaelis曲线可以获得特定酶催化特定反应的特征性关键值，即kpol(定义为底物浓度无限大时该过程的速率常数)和Kd(定义为底物浓度为kpol/2时的解离常数)。对克隆9、R713A和R743A突变体重复该过程。

所有酶的Michaelis曲线在图8中重叠显示。

结果

测试酶的ffT-N3-cy3掺入的动力学特征总结如下。

	克隆9	R713A	R743A
				K_pol/S^-1	0.061	0.10	0.068
K_d/μM	1.72	3.32	1.92

从该结果看来，似乎聚合酶DNA结合区的突变不会对酶的活性(在高底物浓度时，kpol接近Vmax)或酶对完整功能核苷酸(在该情况中为ffT-N3-cy3，但是认为趋势是适用于所有碱基)的亲和力产生不利影响。这是理想的情形，因为该突变具有修饰酶的DNA结合亲和力而不影响其它关键催化特性的理想效果。

实施例7-纯化聚合酶和测量遗留DNA的水平。

DNA污染

Pico绿测定

(Molecular Probes试剂盒，目录号P11496)

所需溶液

TE缓冲液

10mM Tris.HCl pH7.5

1mM EDTA

需要40mL，将2mL 20×TE缓冲液加入38mL H₂O中

λDNA

溶液1(2μg/mLλDNA)用735μL的1×TE缓冲液稀释15μLλDNA。

溶液2(50ng/mLλ)用975μL1×TE缓冲液稀释25μLλDNA。

标准曲线

在2mL eppendorf管中配制以下的样品：

样品λDNA(ng)	λDNA2mg mL(μL)	λDNA50ng mL(μL)	甘油贮存缓冲液(μL)	TE(uL)
					100	160		400	1040
25	40		400	1160
					10	16		400	1184
2.5		160	400	1040
					1		64	400	1136
0.25		16	400	1184
					0.025		1.6	400	1198.4
0			400	1200

将3×500μL每个样品放入3个eppendorf管中。

酶样品

在5mL bijou瓶中配制以下的样品：

样品		用量(μL)	甘油贮存缓冲液(μL)	TE(μL)
					1	酶原液	400		1800
2	样品1	1100	200	900
					3	样品2	1100	200	900
4	样品3	1100	200	900

将2×500μL每个样品放入2个eppendorf管中。

制备picogreen溶液；将85μL的picogreen原液加入17mL 1×TE缓冲液中。

将500μL该溶液加入每个标准曲线和酶样品中，并使用移液器充分混合，然后将所有的样品转移到1.5mL荧光计比色杯中。

使用荧光计

使用Cary Eclipse文件的高级读取程序。将λ激发光设置为480nm，并且λ发射光设置为520nm，并使用1000伏特。

分析

将标准曲线的数据输入Graph pad Prism，与方程式y＝ax+c的标准曲线拟合。之后测定浓度值x。

结果

聚合酶样品	纯化的聚合酶中伴随的DNA浓度
		克隆9第5批	62.9ng±1.9ng
克隆9第6批	63.7ng±2.1ng
		克隆9 R743A	0.04ng±6.4ng
克隆9 R713A	8.2ng±4.2ng

从该实验可见，很明显所述聚合酶中的改变增强了酶的纯化，因为在纯化中遗留了较少的内源DNA。如上所述，内源DNA的遗留可对酶的活性产生负影像，因此该突变很明显是有利的。

实施例8-制备编码克隆9聚合酶的经修饰优化了密码子使用的核酸序列。

使用每个密码子上编码所需的/理想的氨基酸的最佳核酸序列将SEQ ID NO 1中显示的氨基酸序列翻译成核酸序列。

推导出的核酸序列示于SEQ ID NO.19。

在类似的情况中，基于SEQ ID NO：21所示的聚合酶序列推导出SEQ ID NO：20所示的核酸序列。具有SEQ ID NO：21所示氨基酸序列的聚合酶包含R743A突变，并且还带有141位和143位残基均替换为丝氨酸的突变。包含各个核苷酸和氨基酸序列的核酸分子和蛋白质组成了本发明的一部分。

利用NdeI-Nhe I位点(以保留内部的Bam H I位点)将克隆9的已修饰密码子基因克隆进表达载体pET11-a

合成克隆9的密码子优化基因

由GENEART合成SEQ ID NO 19的核酸序列并以pPCR-Script提供。确认DNA和蛋白质的序列(结果未显示)。

将DSV57(pPCRScript载体中克隆9的已修饰密码子基因)克隆进pET11-a (下文称为pSV 52)

制备DET11-a载体

用Nde I和Nhe I消化pET11-a载体(Novagen目录号69436-3)，去磷酸化，并使用标准技术连接任何未消化的载体。

使用Qiagen_的MinElute_凝胶提取试剂盒在0.8％琼脂糖凝胶上纯化经消化的载体。

使用聚丙烯酰胺TB 4-20％凝胶对经消化和纯化的pET11-a载体进行定量。

制备插入片段(克隆9的已修饰密码子基因)

用Nde I和Nhe消化pPCRSCript载体中GENEART合成的克隆9的已修饰密码子基因(下文称为pSV 57)。

使用来自Qiagen_的MinElute_凝胶提取试剂盒在0.8％琼脂糖凝胶上纯化经消化的插入片段。

使用聚丙烯酰胺TB 4-20％凝胶对经消化和纯化的插入片段进行定量。

连接

使用Quick连接试剂盒(NEB，M2200S)在Nde I和Nhe I限制性位点处将pET11-a载体和插入片段进行连接(比例1∶3)。

转化

使用2μl连接混合物转化XL10-gold超级感受态细胞(Stratagene目录号200315)。PCR筛选含有所述插入片段的克隆。

挑取转化株，并制备3个用连接产物转化的XL10-gold阳性克隆的DNA微量制备物。在克隆位点处对这三种经纯化的质粒(下文称为pSV52，克隆1、2和4)进行测序，并发现所有这三个克隆在克隆位点处都具有正确的序列。

所述微量制备物还用于转化如下所述的表达大肠杆菌宿主BL21-CodonPlus(DE3)-RIL(Stratagene目录号230245)。

Southern 印迹

对pVent(pNEB917来源的载体)、pSV43(pET11a中的克隆9)、pSV54(pET11-a中的密码子优化克隆)和pSV57(GENEART提供的pPCR-Script中的已修饰密码子基因)进行限制性酶切和Southern印迹以检查基因间的交叉杂交(结果未显示)。

Pol52的表达研究

将pSV52(克隆1、2和4)转化进表达宿主大肠杆菌BL21-CodonPlus(DE3)RIL(Stratagene目录号230245)中。

按照生产商的说明书，使用21-25ng纯化的pSV52质粒DNA(克隆1、2和4)转化表达宿主大肠杆菌BL21-CodonPlus(DE3)RIL(下文称为RIL)的感受态细胞。

将50μl每种转化产物铺在含有100μg/ml羧苄青霉素和34μg/ml氯霉素的新鲜Luria-Bertani(LB)琼脂培养基(LBCC琼脂培养基)上，并在37℃下孵育过夜。

将以下的甘油储液也铺在LBCC琼脂板上用作表达研究的对照，并于37℃孵育过夜。

SOL10204：RIL-pSV19(pNEB 917载体中的克隆9)

SOL10354：RIL-pSV43(pET11-a载体中的克隆9)。

生产表达Pol52和克隆9阳性对照的细胞沉淀

使用单个转化大肠杆菌克隆接种培养管中的3ml LBCC起始培养基，并在37℃下摇动(225rpm)孵育过夜。

将起始培养物1/100稀释到无菌开口锥形瓶中的50ml LBCC培养基中，并在37℃下剧烈摇动(300rpm)孵育约4小时，直至OD_600nm约为1.0。

取出10ml未诱导的培养物并收集细胞(如下所述)。

加入IPTG至终浓度为1mM，并于37℃剧烈摇动(300rpm)诱导培养物2小时

取出10ml经诱导的培养物并如下收集细胞：

通过在4℃下以5000×g离心30分钟来收集经诱导的和未诱导的细胞。

洗涤细胞沉淀并重悬于1/10培养物体积的1×磷酸缓冲盐水(PBS)中，并按上文进行离心。

轻轻倒出上清液，并将沉淀保存在-20℃直至其需要用于细胞裂解以及纯化步骤。

Pol 52和克隆9的细胞裂解和粗纯化

将所述沉淀解冻并重悬于1/50培养物体积的1×洗涤缓冲液(50mM Tris-HCl pH7.9，50mM葡萄糖，1mM EDTA)中并在室温下孵育15分钟，所示洗涤缓冲液含有新加入1×缓冲液中的4mg/ml溶菌酶。

在细胞中加入含有0.5％(重量/体积)Tergitol NP-40和1×“完全不含EDTA的”蛋白酶抑制剂混合物(二者均新加进1×裂解缓冲液中)的等体积1×裂解缓冲液(10mM Tris-HCl pH7.9，50mM KCl，1mMEDTA，0.5％(w/v)Tween 20)，轻柔混合细胞并在室温下孵育30分钟。

将细胞在水浴中以80℃加热1小时，然后在4℃下以38,800×g离心30分钟以去除细胞碎片和变性蛋白质。

制备体积归一化的样品和SDS-PAGE分析

通过在考马斯蓝染色后分析SDS-PAGE上未诱导和诱导对照样品的粗裂解物来评估Pol 52和克隆9 DNA聚合酶的表达。

仔细地移出上清液，通过加入50∶50(体积/体积)的1×洗涤缓冲液和1×裂解缓冲液来对样品体积进行归一化，终体积为370μl。

制备用于凝胶I的样品

将10μl归一化粗裂解物(来自未诱导和诱导的样品)与10μl含有143mM DTT的加样缓冲液混合。

制备用于凝胶II的样品

来自经诱导样品的归一化粗裂解物仅用蒸馏水稀释1/10至终体积为10μl，并将其与10μl含有143mM DTT的加样缓冲液混合。

将所有的样品在70℃加热10分钟。

SDS-PAGE

根据生产商的说明制备NuPage_4-12％Bis-Tris凝胶(Invitrogen目录号NP0321BOX)。

将10μl SeeBlue_Plus2预染蛋白标准品(Invitrogen目录号LC5925)和μl每种样品进行加样，凝胶以恒定的200V电泳50分钟。

用考马斯蓝(SimplyBlue^TM Safe stain，Invitrogen，目录号LC 6060)将凝胶染色。

结果

SDS-PAGE的结果显示于图10。

该实验中估计的表达水平为20mg/L培养物。

与相同细胞中使用pNEB917(Pol19)或pET11(Pol 43)表达载体的克隆9未修饰基因相比，使用表达载体pET11-a获得了大肠杆菌宿主BL21-CodonPlus(DE3)-RIL(Pol52)中克隆9已修饰密码子的基因相似的表达水平。

Pol52的3个不同克隆的表达水平未观察到显著差异。

参考文献

·Crystal structure of a bacteriophage T7 DNA replication complex at 2.2_ resolution.

Doublie等1998.Nature 391，251.

·Function of the C-terminus of Phi29 DNA polymerase in DNA andterminal protein binding.

Truniger等2004.Nucleic Acids Research 32，371.

·A拇指subdomain mutant of the large fragment of Escherichia coliDNA polymerase I with reduced DNA binding affinity，processivity andframeshift fidelity.

Minnick等1996.J.Biol.Chem.，271.24954.

·Identification of residues critical for the polymerase activity of theKlenow fragment of DNA polymerase I from Escherichia coli.

Polesky等1990.J.Biol.Chem.，265，14579.

·Cloning of thermostable DNA polymerases from hyperthermophilicmarine archaea with emphasis on Thermococcus sp.9°N-7 and mutationsaffecting 3’-5’exonuclease activity.

Southworth等1996.PNAS.93，5281

·Structure of the replicating complex of a pol alpha family DNApolymerase.

Frahklin等2001.Ceu 105，657.

·Crystal structure of a pol alpha family DNA polymerase from thehyperthermophilic afchaeon Thermococcus sp.9°N-7.

Rodriguez等2000.J.Mol. Biol.，299，471.

序列表

<110>索莱克萨有限公司

<120>改进的聚合酶

<130>P79219WO00

<160>21

<170>PatentIn version 3.3

<210>1

<211>775

<212>PRT

<213>人工序列

<220>

<223>突变体聚合酶

<400>1

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile

1 5 10 15

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg

20 25 30

Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile

35 40 45

Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys

50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile

65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile

85 90 95

Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr

100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro

115 120 125

Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Ala Ile Ala Thr

130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile

145 150 155 160

Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile

165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys

180 185 190

Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr

195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu

210 215 220

Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys

225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile

245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr

260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu

275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly

290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr

305 310 315 320

Glu Leu Gly Arg Glu Phe Phe Pro MetGlu Ala Gln Leu Ser Arg Leu

325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu

340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala

355 360 365

Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr

370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile

385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Tyr Ala Val Ser Ile Ile Ile Thr His

405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp

420 425 430

Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe

435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys

450 455 460

Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp

465 470 475 480

Tyr Arg Gln Arg Leu Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr

485 490 495

Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser

500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Glu Met Val Ile Arg Glu Leu

515 520 525

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu

530 535 540

His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lyg Lys Lys Ala

545 550 555 560

Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu

565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys

580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu

595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala

610 615 620

Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val

625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro

645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp

660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala

675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu

690 695 700

Ala Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Ala Asp Glu Phe

705 710 715 720

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln

725 730 735

Val Leu Pro Ala Val Glu Arg Ile Leu Lys Ala Phe Gly Tyr Arg Lys

740 745 750

Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp

755 760 765

Leu Lys Val Lys Gly Lys Lys

770 775

<210>2

<211>2328

<212>DNA

<213>人工序列

<220>

<223>突变体聚合酶

<400>2

atgattctcg ataccgacta catcaccgag aacgggaagc ccgtgataag ggtcttcaag 60

aaggagaacg gcgagtttaa aatcgagtac gacagaacct tcgagcccta cttctacgcc 120

cttctgaagg acgattctgc gatagaggac gtcaagaagg taaccgcaaa gaggcacgga 180

acggttgtca aggtgaagcg cgccgagaag gtgcagaaga agttcctcgg caggccgata 240

gaggtctgga agctctactt caaccatcct caggacgtcc cggcgattcg agacaggata 300

cgtgcccacc ccgctgtcgt tgacatctac gagtacgaca tacccttcgc caagcgctac 360

ctcatcgaca agggcctgat tccgatggag ggcgacgagg agcttacgat gctcgccttc 420

gcgatcgcaa ccctctatca cgagggcgag gagttcggaa ccgggccgat tctcatgata 480

agctacgccg acgggagcga ggcgagggtg ataacctgga agaagattga ccttccgtac 540

gttgacgtcg tctcgaccga gaaggagatg attaagcgct tcctccgcgt cgtcagggag 600

aaggaccccg acgtgctcat cacctacaac ggcgacaact tcgacttcgc ctacctgaag 660

aagcgctctg aggaactcgg aataaagttc acactcggca gggacgggag cgagccgaag 720

atacagcgaa tgggcgaccg ctttgccgtt gaggtgaagg gcaggattca cttcgacctc 780

taccccgtca taaggcgcac gataaacctc ccgacctaca cccttgaggc cgtttacgag 840

gccgtctttg gaaagcccaa ggagaaggtt tacgcagagg agatagcgca ggcctgggag 900

agcggggagg gccttgaaag ggttgcaaga tactcgatgg aggacgctaa ggtgacctac 960

gagctgggaa gggagttctt cccgatggag gcccagcttt cgaggcttat aggccagagc 1020

ctctgggacg tctcgcgctc gagcaccgga aatttggtgg agtggttcct cctgcggaag 1080

gcctacaaga ggaacgagct cgccccaaac aagcccgacg agagggagct cgcgagacgg 1140

cgcgggggct acgctggcgg gtacgttaag gaaccagagc ggggattgtg ggacaacatt 1200

gtgtatctag acttccgctc gtatgcggtt tcaatcatca taacccacaa cgtctcgccg 1260

gataccctca accgcgaggg ctgtaaagag tacgacgtcg cccctgaggt tggacacaag 1320

ttctgcaagg acttccccgg cttcatacca agcctcctgg gagatttgct cgaggagagg 1380

cagaagataa agcggaagat gaaggcaacg gttgacccgc tggagaagaa actcctcgat 1440

tacaggcaga ggctgatcaa aatcctcgcc aacagcttct acggctacta cggctacgcc 1500

aaggcccggt ggtactgcaa ggagtgcgcc gagagcgtta cggcctgggg aagggagtat 1560

atagaaatgg ttatccggga actcgaagaa aaattcggtt ttaaagttct ctatgccgat 1620

acagacggtc tccatgctac cattcccgga gcagacgctg aaacagtcaa gaaaaaagca 1680

aaggagttct taaaatacat taatccaaaa ctgcccggcc tgctcgaact tgagtacgag 1740

ggcttctacg tgaggggctt cttcgtcacg aagaagaagt acgctgtgat agacgaggag 1800

ggcaagataa ccacgagggg tcttgagatt gtgaggcgcg actggagcga gatagcgaag 1860

gagacccagg ccagggtctt agaggcgata ctcaagcacg gtgacgtcga ggaggccgtt 1920

aggatagtca aggaagtgac ggaaaagctg agcaagtatg aggtcccgcc cgagaagctg 1980

gtaatccacg agcagataac gcgcgatttg agggattaca aagccaccgg cccgcacgtt 2040

gccgttgcga agaggctcgc ggcgcgtgga gtgaaaatcc ggcccggcac ggtgataagc 2100

tacatcgtcc tagcgggctc tggaaggata ggcgacaggg cgattccagc tgatgagttc 2160

gacccgacga agcaccgcta cgatgcggaa tactacatcg agaaccaggt tctcccggcg 2220

gtggagagga ttctaaaagc cttcggctat cggaaggagg atttgcgcta ccagaagacg 2280

aagcaggtcg gcttgggcgc gtggctgaag gtgaagggga agaagtga 2328

<210>3

<211>775

<212>PRT

<213>人工序列

<220>

<223>突变体聚合酶

<400>3

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile

1 5 10 15

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg

20 25 30

Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile

35 40 45

Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys

50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile

65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile

85 90 95

Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr

100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro

115 120 125

Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Ala Ile Ala Thr

130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile

145 150 155 160

Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile

165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys

180 185 190

Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr

195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu

210 215 220

Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys

225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile

245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr

260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu

275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly

290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr

305 310 315 320

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu

325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu

340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala

355 360 365

Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr

370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile

385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Tyr Ala Val Ser Ile Ile Ile Thr His

405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp

420 425 430

Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe

435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys

450 455 460

Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp

465 470 475 480

Tyr Arg Gln Arg Leu Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr

485 490 495

Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser

500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Glu Met Val Ile Arg Glu Leu

515 520 525

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu

530 535 540

His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala

545 550 555 560

Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu

565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys

580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu

595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala

610 615 620

Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val

625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro

645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp

660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala

675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu

690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Ala Ala Ile Pro Ala Asp Glu Phe

705 710 715 720

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln

725 730 735

Val Leu Pro Ala Val Glu Arg Ile Leu Lys Ala Phe Gly Tyr Arg Lys

740 745 750

Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp

755 760 765

Leu Lys Val Lys Gly Lys Lys

770 775

<210>4

<211>2328

<212>DNA

<213>人工序列

<220>

<223>突变体聚合酶

<400>4

atgattctcg ataccgacta catcaccgag aacgggaagc ccgtgataag ggtcttcaag 60

aaggagaacg gcgagtttaa aatcgagtac gacagaacct tcgagcccta cttctacgcc 120

cttctgaagg acgattctgc gatagaggac gtcaagaagg taaccgcaaa gaggcacgga 180

acggttgtca aggtgaagcg cgccgagaag gtgcagaaga agttcctcgg caggccgata 240

gaggtctgga agctctactt caaccatcct caggacgtcc cggcgattcg agacaggata 300

cgtgcccacc ccgctgtcgt tgacatctac gagtacgaca tacccttcgc caagcgctac 360

ctcatcgaca agggcctgat tccgatggag ggcgacgagg agcttacgat gctcgccttc 420

gcgatcgcaa ccctctatca cgagggcgag gagttcggaa ccgggccgat tctcatgata 480

agctacgccg acgggagcga ggcgagggtg ataacctgga agaagattga ccttccgtac 540

gttgacgtcg tctcgaccga gaaggagatg attaagcgct tcctccgcgt cgtcagggag 600

aaggaccccg acgtgctcat cacctacaac ggcgacaact tcgacttcgc ctacctgaag 660

aagcgctctg aggaactcgg aataaagttc acactcggca gggacgggag cgagccgaag 720

atacagcgaa tgggcgaccg ctttgccgtt gaggtgaagg gcaggattca cttcgacctc 780

taccccgtca taaggcgcac gataaacctc ccgacctaca cccttgaggc cgtttacgag 840

gccgtctttg gaaagcccaa ggagaaggtt tacgcagagg agatagcgca ggcctgggag 900

agcggggagg gccttgaaag ggttgcaaga tactcgatgg aggacgctaa ggtgacctac 960

gagctgggaa gggagttctt cccgatggag gcccagcttt cgaggcttat aggccagagc 1020

ctctgggacg tctcgcgctc gagcaccgga aatttggtgg agtggttcct cctgcggaag 1080

gcctacaaga ggaacgagct cgccccaaac aagcccgacg agagggagct cgcgagacgg 1140

cgcgggggct acgctggcgg gtacgttaag gaaccagagc ggggattgtg ggacaacatt 1200

gtgtatctag acttccgctc gtatgcggtt tcaatcatca taacccacaa cgtctcgccg 1260

gataccctca accgcgaggg ctgtaaagag tacgacgtcg cccctgaggt tggacacaag 1320

ttctgcaagg acttccccgg cttcatacca agcctcctgg gagatttgct cgaggagagg 1380

cagaagataa agcggaagat gaaggcaacg gttgacccgc tggagaagaa actcctcgat 1440

tacaggcaga ggctgatcaa aatcctcgcc aacagcttct acggctacta cggctacgcc 1500

aaggcccggt ggtactgcaa ggagtgcgcc gagagcgtta cggcctgggg aagggagtat 1560

atagaaatgg ttatccggga actcgaagaa aaattcggtt ttaaagttct ctatgccgat 1620

acagacggtc tccatgctac cattcccgga gcagacgctg aaacagtcaa gaaaaaagca 1680

aaggagttct taaaatacat taatccaaaa ctgcccggcc tgctcgaact tgagtacgag 1740

ggcttctacg tgaggggctt cttcgtcacg aagaagaagt acgctgtgat agacgaggag 1800

ggcaagataa ccacgagggg tcttgagatt gtgaggcgcg actggagcga gatagcgaag 1860

gagacccagg ccagggtctt agaggcgata ctcaagcacg gtgacgtcga ggaggccgtt 1920

aggatagtca aggaagtgac ggaaaagctg agcaagtatg aggtcccgcc cgagaagctg 1980

gtaatccacg agcagataac gcgcgatttg agggattaca aagccaccgg cccgcacgtt 2040

gccgttgcga agaggctcgc ggcgcgtgga gtgaaaatcc ggcccggcac ggtgataagc 2100

tacatcgtcc taaagggctc tggaaggata ggcgacgcgg cgattccagc tgatgagttc 2160

gacccgacga agcaccgcta cgatgcggaa tactacatcg agaaccaggt tctcccggcg 2220

gtggagagga ttctaaaagc cttcggctat cggaaggagg atttgcgcta ccagaagacg 2280

aagcaggtcg gcttgggcgc gtggctgaag gtgaagggga agaagtga 2328

<210>5

<211>775

<212>PRT

<213>人工序列

<220>

<223>突变体聚合酶

<400>5

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile

1 5 10 15

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg

20 25 30

Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile

35 40 45

Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys

50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile

65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile

85 90 95

Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr

100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro

115 120 125

Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Ala Ile Ala Thr

130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile

145 150 155 160

Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile

165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys

180 185 190

Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr

195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu

210 215 220

Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys

225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile

245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr

260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu

275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly

290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr

305 310 315 320

Glu Leu Gly Arg Glu Phe Phe ProMet Glu Ala Gln Leu Ser Arg Leu

325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu

340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala

355 360 365

Pro Asn Lys ProAsp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr

370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile

385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Tyr Ala Val Ser Ile Ile Ile Thr His

405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp

420 425 430

Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe

435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys

450 455 460

Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp

465 470 475 480

Tyr Arg Gln Arg Leu Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr

485 490 495

Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser

500 505 510

Val Thr Ala Trp Gly Arg Glu TyrIle Glu Met Val Ile Arg Glu Leu

515 520 525

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu

530 535 540

His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala

545 550 555 560

Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu

565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys

580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu

595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala

610 615 620

Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val

625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro

645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp

660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala

675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu

690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Ala Asp Glu Phe

705 710 715 720

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln

725 730 735

Val Leu Pro Ala Val Glu Ala Ile Leu Lys Ala Phe Gly Tyr Arg Lys

740 745 750

Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp

755 760 765

Leu Lys Val Lys Gly Lys Lys

770 775

<210>6

<211>2328

<212>DNA

<213>人工序列

<220>

<223>突变体聚合酶

<400>6

atgattctcg ataccgacta catcaccgag aacgggaagc ccgtgataag ggtcttcaag 60

aaggagaacg gcgagtttaa aatcgagtac gacagaacct tcgagcccta cttctacgcc 120

cttctgaagg acgattctgc gatagaggac gtcaagaagg taaccgcaaa gaggcacgga 180

acggttgtca aggtgaagcg cgccgagaag gtgcagaaga agttcctcgg caggccgata 240

gaggtctgga agctctactt caaccatcct caggacgtcc cggcgattcg agacaggata 300

cgtgcccacc ccgctgtcgt tgacatctac gagtacgaca tacccttcgc caagcgctac 360

ctcatcgaca agggcctgat tccgatggag ggcgacgagg agcttacgat gctcgccttc 420

gcgatcgcaa ccctctatca cgagggcgag gagttcggaa ccgggccgat tctcatgata 480

agctacgccg acgggagcga ggcgagggtg ataacctgga agaagattga ccttccgtac 540

gttgacgtcg tctcgaccga gaaggagatg attaagcgct tcctccgcgt cgtcagggag 600

aaggaccccg acgtgctcat cacctacaac ggcgacaact tcgacttcgc ctacctgaag 660

aagcgctctg aggaactcgg aataaagttc acactcggca gggacgggag cgagccgaag 720

atacagcgaa tgggcgaccg ctttgccgtt gaggtgaagg gcaggattca cttcgacctc 780

taccccgtca taaggcgcac gataaacctc ccgacctaca cccttgaggc cgtttacgag 840

gccgtctttg gaaagcccaa ggagaaggtt tacgcagagg agatagcgca ggcctgggag 900

agcggggagg gccttgaaag ggttgcaaga tactcgatgg aggacgctaa ggtgacctac 960

gagctgggaa gggagttctt cccgatggag gcccagcttt cgaggcttat aggccagagc 1020

ctctgggacg tctcgcgctc gagcaccgga aatttggtgg agtggttcct cctgcggaag 1080

gcctacaaga ggaacgagct cgccccaaac aagcccgacg agagggagct cgcgagacgg 1140

cgcgggggct acgctggcgg gtacgttaag gaaccagagc ggggattgtg ggacaacatt 1200

gtgtatctag acttccgctc gtatgcggtt tcaatcatca taacccacaa cgtctcgccg 1260

gataccctca accgcgaggg ctgtaaagag tacgacgtcg cccctgaggt tggacacaag 1320

ttctgcaagg acttccccgg cttcatacca agcctcctgg gagatttgct cgaggagagg 1380

cagaagataa agcggaagat gaaggcaacg gttgacccgc tggagaagaa actcctcgat 1440

tacaggcaga ggctgatcaa aatcctcgcc aacagcttct acggctacta cggctacgcc 1500

aaggcccggt ggtactgcaa ggagtgcgcc gagagcgtta cggcctgggg aagggagtat 1560

atagaaatgg ttatccggga actcgaagaa aaattcggtt ttaaagttct ctatgccgat 1620

acagacggtc tccatgctac cattcccgga gcagacgctg aaacagtcaa gaaaaaagca 1680

aaggagttct taaaatacat taatccaaaa ctgcccggcc tgctcgaact tgagtacgag 1740

ggcttctacg tgaggggctt cttcgtcacg aagaagaagt acgctgtgat agacgaggag 1800

ggcaagataa ccacgagggg tcttgagatt gtgaggcgcg actggagcga gatagcgaag 1860

gagacccagg ccagggtctt agaggcgata ctcaagcacg gtgacgtcga ggaggccgtt 1920

aggatagtca aggaagtgac ggaaaagctg agcaagtatg aggtcccgcc cgagaagctg 1980

gtaatccacg agcagataac gcgcgatttg agggattaca aagccaccgg cccgcacgtt 2040

gccgttgcga agaggctcgc ggcgcgtgga gtgaaaatcc ggcccggcac ggtgataagc 2100

tacatcgtcc taaagggctc tggaaggata ggcgacaggg cgattccagc tgatgagttc 2160

gacccgacga agcaccgcta cgatgcggaa tactacatcg agaaccaggt tctcccggcg 2220

gtggaggcga ttctaaaagc cttcggctat cggaaggagg atttgcgcta ccagaagacg 2280

aagcaggtcg gcttgggcgc gtggctgaag gtgaagggga agaagtga 2328

<210>7

<211>704

<212>PRT

<213>人工序列

<220>

<223>突变体聚合酶

<400>7

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile

1 5 10 15

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg

20 25 30

Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile

35 40 45

Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys

50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile

65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile

85 90 95

Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr

100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro

115 120 125

Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Ala Ile Ala Thr

130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile

145 150 155 160

Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile

165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys

180 185 190

Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr

195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu

210 215 220

Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys

225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile

245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr

260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu

275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly

290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr

305 310 315 320

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu

325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu

340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala

355 360 365

Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr

370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile

385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Tyr Ala Val Ser Ile Ile Ile Thr His

405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp

420 425 430

Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe

435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys

450 455 460

Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp

465 470 475 480

Tyr Arg Gln Arg Leu Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr

485 490 495

Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser

500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Glu Met Val Ile Arg Glu Leu

515 520 525

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu

530 535 540

His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala

545 550 555 560

Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu

565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys

580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu

595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala

610 615 620

Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val

625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro

645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp

660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala

675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu

690 695 700

<210>8

<211>2328

<212>DNA

<213>人工序列

<220>

<223>突变体聚合酶

<400>8

atgattctcg ataccgacta catcaccgag aacgggaagc ccgtgataag ggtcttcaag 60

aaggagaacg gcgagtttaa aatcgagtac gacagaacct tcgagcccta cttctacgcc 120

cttctgaagg acgattctgc gatagaggac gtcaagaagg taaccgcaaa gaggcacgga 180

acggttgtca aggtgaagcg cgccgagaag gtgcagaaga agttcctcgg caggccgata 240

gaggtctgga agctctactt caaccatcct caggacgtcc cggcgattcg agacaggata 300

cgtgcccacc ccgctgtcgt tgacatctac gagtacgaca tacccttcgc caagcgctac 360

ctcatcgaca agggcctgat tccgatggag ggcgacgagg agcttacgat gctcgccttc 420

gcgatcgcaa ccctctatca cgagggcgag gagttcggaa ccgggccgat tctcatgata 480

agctacgccg acgggagcga ggcgagggtg ataacctgga agaagattga ccttccgtac 540

gttgacgtcg tctcgaccga gaaggagatg attaagcgct tcctccgcgt cgtcagggag 600

aaggaccccg acgtgctcat cacctacaac ggcgacaact tcgacttcgc ctacctgaag 660

aagcgctctg aggaactcgg aataaagttc acactcggca gggacgggag cgagccgaag 720

atacagcgaa tgggcgaccg ctttgccgtt gaggtgaagg gcaggattca cttcgacctc 780

taccccgtca taaggcgcac gataaacctc ccgacctaca cccttgaggc cgtttacgag 840

gccgtctttg gaaagcccaa ggagaaggtt tacgcagagg agatagcgca ggcctgggag 900

agcggggagg gccttgaaag ggttgcaaga tactcgatgg aggacgctaa ggtgacctac 960

gagctgggaa gggagttctt cccgatggag gcccagcttt cgaggcttat aggccagagc 1020

ctctgggacg tctcgcgctc gagcaccgga aatttggtgg agtggttcct cctgcggaag 1080

gcctacaaga ggaacgagct cgccccaaac aagcccgacg agagggagct cgcgagacgg 1140

cgcgggggct acgctggcgg gtacgttaag gaaccagagc ggggattgtg ggacaacatt 1200

gtgtatctag acttccgctc gtatgcggtt tcaatcatca taacccacaa cgtctcgccg 1260

gataccctca accgcgaggg ctgtaaagag tacgacgtcg cccctgaggt tggacacaag 1320

ttctgcaagg acttccccgg cttcatacca agcctcctgg gagatttgct cgaggagagg 1380

cagaagataa agcggaagat gaaggcaacg gttgacccgc tggagaagaa actcctcgat 1440

tacaggcaga ggctgatcaa aatcctcgcc aacagcttct acggctacta cggctacgcc 1500

aaggcccggt ggtactgcaa ggagtgcgcc gagagcgtta cggcctgggg aagggagtat 1560

atagaaatgg ttatccggga actcgaagaa aaattcggtt ttaaagttct ctatgccgat 1620

acagacggtc tccatgctac cattcccgga gcagacgctg aaacagtcaa gaaaaaagca 1680

aaggagttct taaaatacat taatccaaaa ctgcccggcc tgctcgaact tgagtacgag 1740

ggcttctacg tgaggggctt cttcgtcacg aagaagaagt acgctgtgat agacgaggag 1800

ggcaagataa ccacgagggg tcttgagatt gtgaggcgcg actggagcga gatagcgaag 1860

gagacccagg ccagggtctt agaggcgata ctcaagcacg gtgacgtcga ggaggccgtt 1920

aggatagtca aggaagtgac ggaaaagctg agcaagtatg aggtcccgcc cgagaagctg 1980

gtaatccacg agcagataac gcgcgatttg agggattaca aagccaccgg cccgcacgtt 2040

gccgttgcga agaggctcgc ggcgcgtgga gtgaaaatcc ggcccggcac ggtgataagc 2100

tacatcgtcc tgacgggctc tggaaggata ggcgacaggg cgattccagc tgatgagttc 2160

gacccgacga agcaccgcta cgatgcggaa tactacatcg agaaccaggt tctcccggcg 2220

gtggagagga ttctaaaagc cttcggctat cggaaggagg atttgcgcta ccagaagacg 2280

aagcaggtcg gcttgggcgc gtggctgaag gtgaagggga agaagtga 2328

<210>9

<211>28

<212>DNA

<213>人工序列

<220>

<223>正向引物

<400>9

cccggcggtg gaggcgattc taaaagcc 28

<210>10

<211>28

<212>DNA

<213>人工序列

<220>

<223>反向引物

<400>10

gggccgccac ctccgctaag attttcgg 28

<210>11

<211>30

<212>DNA

<213>人工序列

<220>

<223>正向引物

<400>11

gaaggatagg cgacgcggcg attccagctg 30

<210>12

<211>30

<212>DNA

<213>人工序列

<220>

<223>反向引物

<400>12

cttcctatcc gctgcgccgc taaggtcgac 30

<210>13

<211>29

<212>DNA

<213>人工序列

<220>

<223>正向引物

<400>13

gctacatcgt cctagcgggc tctggaagg 29

<210>14

<211>29

<212>DNA

<213>人工序列

<220>

<223>反向引物

<400>14

cgatgtagca ggatcgcccg agaccttcc 29

<210>15

<211>29

<212>DNA

<213>人工序列

<220>

<223>正向引物

<400>15

gctacatcgt cctatgaggc tctggaagg 29

<210>16

<211>29

<212>DNA

<213>人工序列

<220>

<223>反向引物

<400>16

cgatgtagca ggatac tccg agaccttcc 29

<210>17

<211>84

<212>DNA

<213>人工序列

<220>

<223>模板DNA

<400>17

cgatcacgat cacgatcacg atcacgatca cgatcacgct gatgtgcatg ctgttgtttt 60

tttacaacag catgcacatc agcg 84

<210>18

<211>84

<212>DNA

<213>人工序列

<220>

<223>NH2偶联模板

<220>

<221>misc_feature

<222>(1)..(1)

<223>附着在5′端的NH2基团

<400>18

cgatcacgat cacgatcacg atcacgatca cgatcacgct gatgtgcatg ctgttgtttt 60

tttacaacag catgcacatc agcg 84

<210>19

<211>2328

<212>DNA

<213>人工序列

<220>

<223>密码子优化的聚合酶

<400>19

atgatcttag ataccgacta tatcaccgag aacggtaaac cggtgataag ggtgttcaaa 60

aaggaaaatg gcgaattcaa gatcgagtat gatagaacct tcgaaccgta cttctacgcc 120

ttgttgaagg acgatagtgc catcgaagat gtgaaaaaag ttaccgccaa acgtcacggc 180

accgtggtaa aggttaaacg cgccgaaaag gttcagaaga agttcctagg ccgtccgatc 240

gaggtgtgga aattgtactt taaccatccg caggatgtcc cggcgattag agatcgtatt 300

cgtgcccacc cggcggtagt ggatatctat gagtacgata tcccgttcgc aaaaagatac 360

ttgattgata aaggactaat cccgatggaa ggcgatgaag aattaaccat gttagcgttc 420

tccatctcca ccctgtacca cgaaggcgaa gagttcggca ccggtccgat tctgatgatc 480

tcctacgcag acggtagcga agcacgtgtg ataacctgga agaaaataga cctaccttac 540

gtggacgtcg taagtaccga gaaggagatg atcaaaagat tcctgagggt ggtccgtgag 600

aaggatccgg acgtactgat tacctataac ggcgataact tcgacttcgc ctacttgaaa 660

aagagatctg aggaattagg catcaaattc accctgggcc gtgatggcag tgagccgaaa 720

atccaacgta tgggcgaccg cttcgccgtc gaggtgaaag gccgtataca tttcgacttg 780

tatccggtga ttaggcgtac cattaatttg ccgacctaca ccttggaagc ggtgtacgag 840

gcggtcttcg gcaagccgaa ggaaaaggtg tacgccgaag agatcgcgca ggcgtgggag 900

agcggtgagg gtctagaacg tgttgcaaga tatagcatgg aggacgccaa agttacctac 960

gaattgggcc gcgagttttt tccgatggag gcccagttat ctcgtttaat tggccagtcc 1020

ctgtgggatg ttagccgcag ttctactggt aatttggtag aatggttctt actgcgcaaa 1080

gcgtataaac gtaacgagtt agcgccaaat aagccggacg aacgtgaact ggcccgtcgt 1140

cgtggtggct atgccggcgg ttacgtgaag gaaccggagc gtggcctatg ggataacatt 1200

gtgtaccttg actttagaag ctatgcggtt agcatcatca tcacccataa tgttagtccg 1260

gacacattga atcgtgaagg atgcaaagaa tatgacgtcg ccccagaggt gggccacaaa 1320

ttttgtaaag atttcccagg attcatccca agtttgttgg gtgatctgct ggaagaacgc 1380

cagaaaatca aacgtaagat gaaggcgacc gtcgatccac tggagaaaaa gctattggac 1440

taccgtcagc gcctgatcaa gattttggcg aattctttct atggatacta cggctacgcc 1500

aaagcccgtt ggtattgtaa agagtgcgcc gagtctgtca ctgcctgggg tcgtgaatat 1560

atcgaaatgg tgatccgcga gctggaagag aaatttggat tcaaagtctt gtacgccgat 1620

accgatggtc tgcacgcgac cattccgggt gccgatgccg agaccgtgaa gaaaaaggcg 1680

aaagagtttt tgaaatatat caatccgaag ttgccgggat tattagaatt ggaatacgaa 1740

ggtttctatg ttcgcggctt tttcgtgacc aagaaaaaat acgccgtgat cgacgaggaa 1800

ggaaaaatta ccacccgtgg tctagagatt gttcgtcgtg actggtccga aatcgccaaa 1860

gaaacccagg cccgtgtact ggaagcgatt ttgaagcatg gcgatgtgga ggaggcggtt 1920

cgtatcgtca aagaagtgac cgaaaagctg agcaagtatg aagtgccgcc ggagaaattg 1980

gtcatacacg aacaaatcac acgtgacctg cgcgattata aggcgaccgg tccgcacgtt 2040

gccgtggcga agcgtttggc ggcccgtggt gttaagattc gtccaggaac cgtgattagt 2100

tacatagtgt tgaagggcag tggtcgtatt ggtgaccgtg ccatcccggc ggatgagttt 2160

gacccgacca agcatcgtta tgacgccgaa tattatatcg agaatcaggt gctaccagcg 2220

gttgaacgta ttttgaaggc attcggctat cgtaaagaag acctgcgcta ccagaaaacc 2280

aagcaggttg gtctgggtgc ctggttgaaa gtgaaaggca aaaaataa 2328

<210>20

<211>2328

<212>DNA

<213>人工序列

<220>

<223>密码子优化的thumb突变体聚合酶

<400>20

atgatcttag ataccgacta tatcaccgag aacggtaaac cggtgataag ggtgttcaaa 60

aaggaaaatg gcgaattcaa gatcgagtat gatagaacct tcgaaccgta cttctacgcc 120

ttgttgaagg acgatagtgc catcgaagat gtgaaaaaag ttaccgccaa acgtcacggc 180

accgtggtaa aggttaaacg cgccgaaaag gttcagaaga agttcctagg ccgtccgatc 240

gaggtgtgga aattgtactt taaccatccg caggatgtcc cggcgattag agatcgtatt 300

cgtgcccacc cggcggtagt ggatatctat gagtacgata tcccgttcgc aaaaagatac 360

ttgattgata aaggactaat cccgatggaa ggcgatgaag aattaaccat gttagcgttc 420

tccatctcca ccctgtacca cgaaggcgaa gagttcggca ccggtccgat tctgatgatc 480

tcctacgcag acggtagcga agcacgtgtg ataacctgga agaaaataga cctaccttac 540

gtggacgtcg taagtaccga gaaggagatg atcaaaagat tcctgagggt ggtccgtgag 600

aaggatccgg acgtactgat tacctataac ggcgataact tcgacttcgc ctacttgaaa 660

aagagatctg aggaattagg catcaaattc accctgggcc gtgatggcag tgagccgaaa 720

atccaacgta tgggcgaccg cttcgccgtc gaggtgaaag gccgtataca tttcgacttg 780

tatccggtga ttaggcgtac cattaatttg ccgacctaca ccttggaagc ggtgtacgag 840

gcggtcttcg gcaagccgaa ggaaaaggtg tacgccgaag agatcgcgca ggcgtgggag 900

agcggtgagg gtctagaacg tgttgcaaga tatagcatgg aggacgccaa agttacctac 960

gaattgggcc gcgagttttt tccgatggag gcccagttat ctcgtttaat tggccagtcc 1020

ctgtgggatg ttagccgcag ttctactggt aatttggtag aatggttctt actgcgcaaa 1080

gcgtataaac gtaacgagtt agcgccaaat aagccggacg aacgtgaact ggcccgtcgt 1140

cgtggtggct atgccggcgg ttacgtgaag gaaccggagc gtggcctatg ggataacatt 1200

gtgtaccttg actttagaag ctatgcggtt agcatcatca tcacccataa tgttagtccg 1260

gacacattga atcgtgaagg atgcaaagaa tatgacgtcg ccccagaggt gggccacaaa 1320

ttttgtaaag atttcccagg attcatccca agtttgttgg gtgatctgct ggaagaacgc 1380

cagaaaatca aacgtaagat gaaggcgacc gtcgatccac tggagaaaaa gctattggac 1440

taccgtcagc gcctgatcaa gattttggcg aattctttct atggatacta cggctacgcc 1500

aaagcccgtt ggtattgtaa agagtgcgcc gagtctgtca ctgcctgggg tcgtgaatat 1560

atcgaaatgg tgatccgcga gctggaagag aaatttggat tcaaagtctt gtacgccgat 1620

accgatggtc tgcacgcgac cattccgggt gccgatgccg agaccgtgaa gaaaaaggcg 1680

aaagagtttt tgaaatatat caatccgaag ttgccgggat tattagaatt ggaatacgaa 1740

ggtttctatg ttcgcggctt tttcgtgacc aagaaaaaat acgccgtgat cgacgaggaa 1800

ggaaaaatta ccacccgtgg tctagagatt gttcgtcgtg actggtccga aatcgccaaa 1860

gaaacccagg cccgtgtact ggaagcgatt ttgaagcatg gcgatgtgga ggaggcggtt 1920

cgtatcgtca aagaagtgac cgaaaagctg agcaagtatg aagtgccgcc ggagaaattg 1980

gtcatacacg aacaaatcac acgtgacctg cgcgattata aggcgaccgg tccgcacgtt 2040

gccgtggcga agcgtttggc ggcccgtggt gttaagattc gtccaggaac cgtgattagt 2100

tacatagtgt tgaagggcag tggtcgtatt ggtgaccgtg ccatcccggc ggatgagttt 2160

gacccgacca agcatcgtta tgacgccgaa tattatatcg agaatcaggt gctaccagcg 2220

gttgaagcta ttttgaaggc attcggctat cgtaaagaag acctgcgcta ccagaaaacc 2280

aagcaggttg gtctgggtgc ctggttgaaa gtgaaaggca aaaaataa 2328

<210>21

<211>775

<212>PRT

<213>人工序列

<220>

<223>密码子优化的thumb突变体聚合酶

<400>21

Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile

1 5 10 15

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg

20 25 30

Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile

35 40 45

Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys

50 55 60

Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile

65 70 75 80

Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile

85 90 95

Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr

100 105 110

Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro

115 120 125

Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Ser Ile Ser Thr

130 135 140

Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile

145 150 155 160

Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile

165 170 175

Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys

180 185 190

Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr

195 200 205

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu

210 215 220

Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys

225 230 235 240

Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile

245 250 255

His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr

260 265 270

Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu

275 280 285

Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly

290 295 300

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr

305 310 315 320

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu

325 330 335

Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu

340 345 350

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala

355 360 365

Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr

370 375 380

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile

385 390 395 400

Val Tyr Leu Asp Phe Arg Ser Tyr Ala Val Ser Ile Ile Ile Thr His

405 410 415

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp

420 425 430

Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe

435 440 445

Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys

450 455 460

Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp

465 470 475 480

Tyr Arg Gln Arg Leu Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr

485 490 495

Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser

500 505 510

Val Thr Ala Trp Gly Arg Glu Tyr Ile Glu Met Val Ile Arg Glu Leu

515 520 525

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu

530 535 540

His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala

545 550 555 560

Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu

565 570 575

Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys

580 585 590

Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu

595 600 605

Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala

610 615 620

Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val

625 630 635 640

Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro

645 650 655

Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp

660 665 670

Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala

675 680 685

Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu

690 695 700

Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Ala Asp Glu Phe

705 710 715 720

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln

725 730 735

Val Leu Pro Ala Val Glu Ala Ile Leu Lys Ala Phe Gly Tyr Arg Lys

740 745 750

Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp

755 760 765

Leu Lys Val Lys Gly Lys Lys

770 775

Claims

1.改变的聚合酶，其在位置等价于9°N DNA聚合酶氨基酸序列中Lys705、Arg713和/或Arg743的位置上包含一个、两个或三个替换为不同氨基酸的氨基酸替换突变，使得所述改变的聚合酶与DNA的亲和力降低，从而使所述聚合酶与对照聚合酶相比能够在每个反应循环中将核苷酸掺入多个分开的DNA模板中，并且使所述聚合酶与对照聚合酶相比能够在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物。

2.根据权利要求1的聚合酶，其在位置等价于9°N DNA聚合酶氨基酸序列中Arg713或Arg743的位置上包含至少一个替换为不同氨基酸的氨基酸替换突变。

3.根据权利要求1至2中任一项的聚合酶，其中所述替换突变将被替换的氨基酸转换为非碱性氨基酸。

4.根据权利要求4的聚合酶，其中所述替换突变将被替换氨基酸转换为选自以下的氨基酸：

(i)酸性氨基酸，

(ii)芳族氨基酸，和

(iii)非极性氨基酸。

5.根据权利要求4的聚合酶，其中所述芳族氨基酸是酪氨酸(Y)或苯丙氨酸(F)。

6.根据权利要求4的聚合酶，其中所述非极性氨基酸是丙氨酸(A)、甘氨酸(G)或甲硫氨酸(M)。

7.根据权利要求4的聚合酶，其中所述替换突变将被替换氨基酸转换为丙氨酸。

8.改变的聚合酶，其包含位置等价于9°N DNA聚合酶氨基酸序列中Lys705Ala和/或Arg713Ala和/或Arg743Ala的替换突变，使得所述改变的聚合酶与DNA的亲和力降低，从而使所述聚合酶与对照聚合酶相比能够在每个反应循环中将核苷酸掺入多个分开的DNA模板中，并且使所述聚合酶与对照聚合酶相比能够在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物。

9.权利要求8所述改变的聚合酶，其包含位置等价于Arg713Ala的氨基酸替换。

10.权利要求8或9所述改变的聚合酶，其包含位置等价于Arg743Ala的氨基酸替换。

11.核酸分子，其编码权利要求1至10中任一项所述改变的聚合酶。

12.表达载体，其包含权利要求11的核酸分子。

13.包含权利要求12所述载体的宿主细胞。

14.权利要求1至10中任一项的聚合酶用于将标记核苷酸掺入多核苷酸的用途，所述标记用于确定加入的核苷酸的性质。

15.权利要求1至10中任一项的聚合酶用于将核苷酸掺入多核苷酸的用途。

16.根据权利要求14或15的用途，其中所述掺入发生在聚簇阵列上。

17.将标记核苷酸掺入DNA的方法，包括使以下组分相互作用：

(i)权利要求1至10中任一项的聚合酶；

(ii)DNA模板；和

(iii)核苷酸溶液。

18.将核苷酸掺入DNA的方法，包括使以下组分相互作用：

(i)根据权利要求1至10中任一项的聚合酶；

(ii)DNA模板；和

(iii)核苷酸溶液。

19.根据权利要求17或18的方法，其中所述DNA模板包含聚簇阵列。

20.用于进行核苷酸掺入反应的试剂盒，其包含：

权利要求1至10任一项中所述聚合酶和核苷酸溶液。

21.权利要求20的试剂盒，其中所述核苷酸溶液包含标记核苷酸。

22.权利要求20或21的试剂盒，其中所述核苷酸包含合成核苷酸。

23.权利要求20或21的试剂盒，其中所述核苷酸包含修饰的核苷酸。

24.权利要求23所述的试剂盒，其中所述核苷酸已在3’糖羟基处进行了修饰，以使取代基在大小上大于天然存在的3’羟基。

25.根据权利要求24的试剂盒，其中所述已在3’糖羟基处进行修饰以使取代基在大小上大于天然存在之3’羟基的核苷酸包含修饰的核苷酸或核苷分子，所述修饰的核苷酸或核苷分子包含嘌呤或嘧啶碱基以及具有与其共价连接的可去除3′-OH阻断基的核糖或脱氧核糖糖部分，从而使3’碳原子与以下结构的基团连接：

-O-Z

其中Z代表C(R’)₂-O-R”、-C(R’)₂-N(R”)₂、-C(R’)₂-N(H)R”、-C(R’)₂-S-R”和-C(R’)₂-F中的任何一种，

其中每个R”为可去除保护基团或其一部分；

每个R’独立地为氢原子、烷基、取代烷基、芳基烷基、烯基、炔基、芳基、杂芳基、杂环基、酰基、氰基、烷氧基、芳氧基、杂芳氧基或氨基，或者通过连接基团连接的检测标记；或者(R’)₂代表式为＝C(R”’)₂的亚烷基，其中每个R”’可以是相同或不同的，并选自氢、卤素原子和烷基；以及

其中所述分子可以反应生成中间体，其中每个R″交换为H，或者当Z为-C(R’)₂-F时F交换为OH、SH或NH₂，所述中间体在水性条件下发生解离，从而提供带有游离3′OH的分子；

其条件为当Z为-C(R’)₂-S-R”时，两个R’基团不全是H。

26.根据权利要求25的试剂盒，其中所述F交换为OH。

27.根据权利要求25的试剂盒，其中所述修饰的核苷酸或核苷的R’为烷基或取代烷基。

28.根据权利要求27的试剂盒，其中所述修饰的核苷酸或核苷的-Z为式-C(R′)₂-N₃。

29.根据权利要求28的试剂盒，其中Z为叠氮甲基。

30.根据权利要求24的试剂盒，其中所述已在3’糖羟基处进行修饰以使取代基在大小上大于天然存在之3’羟基的核苷酸已被标记，以允许进行检测。

31.根据权利要求24的试剂盒，其中所述已在3’糖羟基处进行修饰以使取代基在大小上大于天然存在之3’羟基的核苷酸包含碱基通过可切割连接子与检测标记连接的核苷酸或核苷，其特征在于所述可切割连接子含有选自以下的部分：

其中X选自包括以下的集合：O、S、NH和NQ，其中Q为C_1-10的取代或未取代烷基，Y选自O、S、NH和N(烯丙基)，T为氢或C_1-10的取代或未取代烷基，＊表示所述部分与核苷酸或核苷的其它部分相连的位置。

32.根据权利要求31的试剂盒，其中所述检测标记包括荧光标记。

33.根据权利要求20或21的试剂盒，其还包含一种或多种DNA模板分子和/或引物。

34.权利要求1至10中任一项所述聚合酶的生产方法，包括：

(i)选择聚合酶中用于诱变的适当残基；

(ii)根据(i)的选择产生突变体聚合酶；

(iii)检测所述突变体聚合酶与DNA的亲和力；和

(iv)如果与DNA的亲和力降低，则检测所述聚合酶在每个反应循环中形成数目增加的生产性聚合酶-DNA复合物的能力。