CN105765082A - 聚合酶组合物、制得和使用其的方法 - Google Patents

聚合酶组合物、制得和使用其的方法 Download PDF

Info

Publication number
CN105765082A
CN105765082A CN201480064864.8A CN201480064864A CN105765082A CN 105765082 A CN105765082 A CN 105765082A CN 201480064864 A CN201480064864 A CN 201480064864A CN 105765082 A CN105765082 A CN 105765082A
Authority
CN
China
Prior art keywords
seqidno
polymerase
certain embodiments
restructuring
bioactive fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480064864.8A
Other languages
English (en)
Other versions
CN105765082B (zh
Inventor
P·范德霍恩
D·梅热
T·尼基福罗夫
M·兰德斯
E·托泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Life Technologies Corp
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN105765082A publication Critical patent/CN105765082A/zh
Application granted granted Critical
Publication of CN105765082B publication Critical patent/CN105765082B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供适用于核酸聚合的组合物、方法、套组、系统以及设备。具体来说,提供允许核酸扩增的经修饰的聚合酶和其生物活性片段。在一些方面中,本发明提供与参考聚合酶相比系统误差更低的经修饰的聚合酶。在一个方面中,本发明涉及适用于核酸测序、基因分型、拷贝数变异分析、双端测序以及基因分析的其它形式的经修饰的聚合酶。在一些方面中,本发明涉及适用于产生核酸库或核酸模板的经修饰的聚合酶。在一些方面中,本发明涉及鉴别可以跨越聚合酶的类别或家族转移的同源氨基酸突变以提供具有改变的特性的新颖聚合酶。

Description

聚合酶组合物、制得和使用其的方法
相关申请的交叉引用
本申请要求依据35U.S.C.§119(e)于2013年9月30日提交的标题为“聚合酶组合物、制得和使用其的方法(POLYMERASECOMPOSITIONS,METHODSOFMAKINGANDUSINGSAME)”的美国临时申请第61/884,921号的优先权,所述申请的公开内容以全文引用的方式并入本文中。
序列表
本申请在此以引用的方式并有与此同时提交的电子序列表材料。电子序列表中的材料以标题为“2014-09-29LT00858PCT_ST25.txt”、创建于2014年9月29日的文件大小为148KB的文本(.txt)文档形式提交,以及以全文引用的方式并入本文中。
技术领域
在一些实施例中,本发明大体上涉及聚合酶组合物、制得和使用其的方法。在一些实施例中,本发明大体上涉及一种或多种经修饰的聚合酶,其中所述一种或多种经修饰的聚合酶与参考聚合酶相比含有至少一个氨基酸突变(例如取代、缺失或添加)。在一些实施例中,本发明大体上涉及包含经修饰的DNA或RNA聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与参考DNA聚合酶相比系统误差更低的经修饰的DNA聚合酶的组合物。在一些实施例中,组合物可以包括来自A家族DNA聚合酶、B家族DNA聚合酶或C家族DNA聚合酶的经修饰的聚合酶。在一些实施例中,本发明大体上涉及同源氨基酸突变(例如取代、缺失或添加)跨越聚合酶类别或家族的转移。在一些实施例中,本发明大体上涉及用于核酸测序,包括下一代测序的聚合酶组合物。在一些实施例中,本发明大体上涉及用于产生核酸库或核酸模板的经修饰的聚合酶组合物。在一些实施例中,本发明大体上涉及用于扩增核酸库或核酸模板的经修饰的聚合酶组合物。在一些实施例中,本发明涉及含有经修饰的聚合酶中的一种或多种的系统、设备以及套组。在一些实施例中,所述组合物、系统、设备以及套组可以用于合成DNA链。在一些实施例中,所述组合物、系统、设备以及套组可以用于进行聚合。在一些实施例中,所述组合物、系统、设备以及套组可以用于扩增DNA分子。在一些实施例中,所述组合物、系统、设备以及套组可以用于在单一反应中扩增至少10、50、100、500、1000、2500、5000、7500、10000、25000、50000、100000或更多个核酸模板。在一些实施例中,所述组合物、系统、设备以及套组可以用于在单一反应器中扩增至少10、50、100、500、1000、2500、5000、7500、10000、25000、50000、100000或更多个核酸模板。
背景技术
酶催化生物反应的能力对生命来说是基本的。一系列生物应用使用酶来体外合成各种生物分子。一种尤其适用的类别的酶为聚合酶,其可以催化生物分子(例如核苷酸或氨基酸)聚合成生物聚合物(例如核酸或肽)。举例来说,尤其以模板依赖性方式可以将核苷酸聚合成核酸的聚合酶适用于重组DNA技术和核酸测序应用中。许多核酸测序方法在由聚合酶催化的体外模板依赖性核酸合成期间监测核苷酸掺入。单分子测序(SMS)和双端测序(PES)典型地包括用于模板依赖性核酸合成的聚合酶。聚合酶也适用于产生核酸库,如在乳液PCR或桥式PCR期间产生的库。使用此类聚合酶产生的核酸库可以用于多种下游工艺中,如基因分型;核苷酸多态性(SNP)分析;拷贝数变异分析;表观遗传分析;基因表达分析;杂交阵列;基因突变分析,包括(但不限于)疾病病况的检测、预后和/或诊断;罕见或低频等位基因突变的检测和分析;以及核酸测序,包括(但不限于)从头测序或目标重测序。
当进行聚合酶依赖性核酸合成或扩增时,其可以适用于修饰聚合酶(例如经由突变或化学修饰)以改变其催化特性。在一些情况下,其可以适用于修饰聚合酶以增强其催化特性。在一些实施例中,其可以适用于经由定点氨基酸取代或缺失来增强聚合酶的催化特性。可以通过聚合酶对核苷酸底物的动力学行为来限制涉及核酸合成的各种生物分析中的聚合酶性能。举例来说,聚合酶活性分析可以因以下非所需行为而变得复杂:如给定聚合酶从模板解离;结合和/或掺入不正确(例如非沃森-克里克(Watson-Crick)碱基配对)的核苷酸;或释放正确(例如沃森-克里克碱基配对)的核苷酸而非掺入的倾向。这些和其它所需特性可以经由所选聚合酶的适合的选择、工程化和/或修饰来增强。举例来说,可以进行此类修饰以有利地改变聚合酶的核苷酸掺入比率、结合到模板的亲和力、持续合成能力、平均阅读长度、核苷酸掺入准确度、链偏差、系统误差、总测序通量;此类改变可以提高序列信息量和/或获自单一测序反应的测序信息的质量。在所属领域中仍需要展现改变的特性,例如提高的持续合成能力、增加的阅读长度(包括无误差阅读长度)、提高的原始准确度和/或对DNA模板的亲和力、增加的测序通量、减少的链偏差和/或减少的系统误差的改进的聚合酶组合物。此类聚合酶组合物可以适用于广泛多种涉及聚合酶依赖性核酸合成的分析,包括核酸测序、qPCR、PCR、桥式PCR、等温扩增、克隆扩增以及核酸库产生。
发明内容
在一些实施例中,本发明大体上涉及一种用于进行核苷酸聚合反应的方法,其包含或其组成为在一种或多种核苷酸存在下使经修饰的聚合酶或其生物活性片段与核酸模板接触,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰,并且其中经修饰的聚合酶或其生物活性片段具有与参考聚合酶相比减少的系统误差、减少的链偏差、提高的原始阅读准确度和/或提高的总测序通量;以及使用经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,本发明大体上涉及一种用于进行核苷酸聚合反应的方法,其包含或其组成为在一种或多种核苷酸存在下使经修饰的聚合酶或其生物活性片段与核酸模板接触,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰,并且其中经修饰的聚合酶或其生物活性片段具有相对于参考聚合酶提高的解离时间常数;以及使用经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,所述方法包括在较高离子强度溶液存在下使用经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,所述方法可以进一步包括以模板依赖性方式使至少一种核苷酸聚合。在一些实施例中,所述方法可以进一步包括在接触之前、期间或之后使引物与模板杂交,并且其中聚合包括使用经修饰的聚合酶或其生物活性片段使至少一种核苷酸聚合到引物一端上。在一些实施例中,在能够通过经修饰的聚合酶或其生物活性片段检测到至少一种核苷酸的聚合的传感器附近进行聚合。在一些实施例中,所述方法可以进一步包括使用传感器检测指示通过经修饰的聚合酶或其生物活性片段进行的一种或多种核苷酸中的至少一种的聚合的信号。在一些实施例中,所述传感器可以是ISFET。
在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与含有选自由以下组成的群组的氨基酸序列的家族ADNA聚合酶具有至少90%一致性的分离的多肽:SEQIDNO:2、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37。在一些实施例中,经修饰的聚合酶或其生物活性片段包含来自聚合酶催化域的至少25个连续氨基酸。在一些实施例中,经修饰的聚合酶或其生物活性片段包含来自聚合酶DNA结合域的至少25个连续氨基酸。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少100个氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少90%一致性的聚合酶催化域的至少150个氨基酸残基。
在一些实施例中,本发明大体上涉及一种用于进行核酸扩增的方法,其包含或其组成为产生具有经修饰的聚合酶或其生物活性片段、引物、核酸模板以及一种或多种核苷酸的扩增反应混合物,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰,并且具有相对于参考聚合酶减少的系统误差;以及使扩增反应混合物经受扩增条件,其中使用经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合到引物的末端上。在一些实施例中,所述方法包括具有减少的系统误差的经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性。在一些实施例中,所述方法包括具有减少的系统误差的经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,所述方法包括具有减少的系统误差的经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括具有减少的系统误差的经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括具有减少的系统误差的经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,所述方法包括具有减少的系统误差的经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。
在一些实施例中,本发明大体上涉及一种用于进行核酸扩增的方法,其包含或其组成为产生具有经修饰的聚合酶或其生物活性片段、引物、核酸模板以及一种或多种核苷酸的扩增反应混合物,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失和/或添加)并且具有相对于参考聚合酶提高的解离时间常数;以及使扩增反应混合物经受扩增条件,其中使用经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合到引物的末端上。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包含聚合酶催化域的至少25个连续氨基酸。在一些实施例中,经修饰的聚合酶或其生物活性片段包含聚合酶DNA结合域的至少25个连续氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的聚合酶催化域的至少100个连续氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少90%一致性的聚合酶催化域的至少150个连续氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少95%一致性的聚合酶催化域的至少150个连续氨基酸残基。在一些实施例中,所述方法包括具有较高离子强度溶液的扩增条件。在一些实施例中,具有较高离子强度溶液的扩增条件包括至少120mM盐。在一些实施例中,具有较高离子强度溶液的扩增条件包括125mM盐。在一些实施例中,具有较高离子强度溶液的扩增条件包括至少125mM到200mM盐。在一些实施例中,所述盐可以包括KCl和/或NaCl。
在一些实施例中,本发明大体上涉及一种用于进行聚合的方法,其包含或其组成为提供包括与引物杂交并且结合到经修饰的聚合酶的核酸的反应混合物;以及使核酸与至少一种类型的核苷酸接触,其中所述接触包括将至少一种核苷酸掺入到引物上,从而产生延伸的引物产物。在一些实施例中,所述方法进一步包括检测反应混合物中延伸的引物产物的存在,从而判定是否已发生核苷酸掺入。在一些实施例中,所述方法进一步包括重复接触和检测步骤超过一次,从而检测多种核苷酸掺入。在一些实施例中,所述方法进一步包括鉴别多种核苷酸掺入中的至少一种。在一些实施例中,所述聚合方法可以包括PCR、qPCR、桥式PCR、RT-PCR、连接介导的PCR、等温扩增或乳液PCR。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶,其包含与含有选自由以下组成的群组的氨基酸序列的家族ADNA聚合酶具有至少90%一致性的分离的多肽:SEQIDNO:2、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37。
在一些实施例中,本发明大体上涉及一种用于进行核苷酸聚合反应的方法,其包含或其组成为在一种或多种核苷酸存在下将经修饰的聚合酶或其生物活性片段与核酸模板混合,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰并且具有相对于参考聚合酶提高的准确度;以及使用混合物中的经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,所述方法包括具有提高的准确度的经修饰的聚合酶或其生物活性片段,如通过在较高离子强度溶液存在下测量提高的准确度所确定。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。在一些实施例中,具有提高的准确度的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的聚合酶催化域的至少150个氨基酸残基。在一些实施例中,具有提高的准确度的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少95%一致性的聚合酶催化域的至少150个氨基酸残基。在一些实施例中,具有提高的准确度的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少98%一致性的聚合酶催化域的至少150个氨基酸残基。
在一些实施例中,本发明大体上涉及一种检测核苷酸掺入的方法,其包含或其组成为使用与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的经修饰的聚合酶或其生物活性片段;核酸模板;以及一种或多种三磷酸核苷酸来进行核苷酸掺入;产生核苷酸掺入的一种或多种副产物;检测核苷酸掺入的一种或多种副产物中的至少一种的存在;以及从而检测核苷酸掺入。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,所述方法包括或其组成为通过包括聚合酶催化域或聚合酶DNA结合域的至少25个连续氨基酸残基的经修饰的聚合酶或其生物活性片段来检测核苷酸掺入。在一些实施例中,所述方法包含或其组成为测定核苷酸掺入中一种或多种核苷酸的一致性。在一些实施例中,核苷酸掺入的副产物可以包括氢离子。在一些实施例中,核苷酸掺入的副产物可以包括焦磷酸根或磷酸根离子。
在一些实施例中,本发明大体上涉及一种检测核苷酸聚合反应期间离子浓度变化的方法,其包含或其组成为使用与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的经修饰的聚合酶或其生物活性片段来进行核苷酸聚合反应,其中在核苷酸聚合反应过程期间至少一种类型离子的浓度改变;以及检测指示至少一种类型离子的浓度变化的信号。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,离子可以包括氢离子。在一些实施例中,检测离子浓度变化的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的聚合酶催化域的至少150个连续氨基酸残基。
在一些实施例中,检测离子浓度变化的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少95%一致性的聚合酶的至少200个连续氨基酸残基。在一些实施例中,检测离子浓度变化的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少98%一致性的聚合酶的至少200个连续氨基酸残基。
在一些实施例中,本发明大体上涉及一种用于扩增核酸的方法,其包含或其组成为在用于核酸扩增的适合条件下使核酸与包含与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性的经修饰的聚合酶或其生物活性片段接触;以及扩增核酸。在一些实施例中,扩增可以通过聚合酶链反应、乳液聚合酶链反应、等温扩增、重组酶聚合酶扩增、邻位连接扩增、滚环扩增、环介导的等温扩增或链置换扩增来进行。在一些实施例中,所述方法包括使用包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性的经修饰的聚合酶或其生物活性片段来扩增核酸。在一些实施例中,所述方法包括使用包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性的经修饰的聚合酶或其生物活性片段来扩增核酸。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括使用包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性的经修饰的聚合酶或其生物活性片段来扩增核酸。在一些实施例中,所述方法包括使用用于扩增包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少150个连续氨基酸残基的核酸的经修饰的聚合酶或其生物活性片段来扩增核酸。在一些实施例中,用于扩增核酸的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少90%一致性的至少150个连续氨基酸残基。在一些实施例中,用于扩增核酸的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少95%一致性的至少150个连续氨基酸残基。
在一些实施例中,用于扩增核酸的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少98%一致性的至少150个连续氨基酸残基。在一些实施例中,用于扩增核酸的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少99%一致性的至少150个连续氨基酸残基。
在一些实施例中,本发明大体上涉及包含或其组成为具有与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的聚合酶催化域的至少25个连续氨基酸残基的分离的聚合酶或其生物活性片段的组合物。在一些实施例中,分离的聚合酶或其生物活性片段具有可检测聚合酶活性。在一些实施例中,分离的聚合酶或其生物活性片段可以包括DNA聚合酶。在一些实施例中,分离的聚合酶包含非天然存在的基因工程化聚合酶。在一些实施例中,分离的聚合酶包含保留聚合酶活性的一种或多种基因工程化聚合酶的融合物。在一些实施例中,聚合酶活性测量为原始阅读准确度、系统误差、链偏差、平均阅读长度或总测序通量。在一些实施例中,如本文所公开的经分离或修饰的聚合酶可以包括第一天然存在的聚合酶域(例如催化域)与第一基因工程化聚合酶域(例如结合域)的融合物。在一些实施例中,本文所公开的经分离或修饰的聚合酶可以包括第一基因工程化聚合酶域(例如催化域)与第二基因工程化聚合酶域(例如结合域)的融合物,从而形成保留聚合酶活性的经分离或修饰的聚合酶。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:25的至少90%的一致性的经分离和纯化的多肽,并且其包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775、H576、E515以及N529,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及与SEQIDNO:2具有至少90%一致性的经分离和纯化的多肽,并且其包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480、H281、E220以及N234,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:28的至少90%的一致性的经分离和纯化的多肽,并且其包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N780、E788、A558、D559、H823、H568、D775以及D718,其中编号相对于SEQIDNO:28。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:37的至少90%的一致性的经分离和纯化的多肽,并且其包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N485、E493、A263、D264、H528、H273、D423以及D480,其中编号相对于SEQIDNO:37。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:1或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变(例如取代基):N31R、N31K、H46R、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、A263K、D264A、D264R、D264Q、D264S、D264K、Y272R、H273N、H273R、L280R、H281A、H281M、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485KN485W、N485Y、N487H、N487RN487W、N487F、N487I、V488R、E493Q、E493R、M495Q、H528A、H528F、H528S、V533I、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:2或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变(例如取代基):N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264A、D264R、D264Q、D264S、D264K、Y272R、H273N、H273R、L280R、H281A、H281M、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485KN485W、N485Y、N487H、N487RN487W、N487F、N487I、V488R、E493Q、E493R、M495Q、H528A、H528F、H528S、V533I、W577Y以及D579F,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变(例如取代):N782R、N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R、H576M、E515K以及N529R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,其中所述多肽包含相对于SEQIDNO:16的突变或突变组合,其选自以下中的任何一个或多个:N782、N780、E788、A558、D559、H823、H568、D718、D775、H576、E515以及N529,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,其具有选自由N782R和D718K组成的群组的一个或多个氨基酸取代,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,其具有选自由H576M、N782R以及D718K组成的群组的一个或多个氨基酸取代,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,其具有选自由以下组成的群组的一个或多个氨基酸取代:D559A、H568N、H576M、E788R以及N782R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少90%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代D559A、H568N、H576M、E788R以及N782R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少95%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代D559A、H568N、H576M、E788R以及N782R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少98%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代D559A、H568N、H576M、E788R以及N782R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少90%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代H576M、N782R以及D718K,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少95%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代H576M、N782R以及D718K,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少98%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代H576M、N782R以及D718K,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少90%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代D718K,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:16或其生物活性片段的至少90%的一致性的经分离和纯化的多肽,并且其进一步包含氨基酸取代N782R和H576M,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:25或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R、H576M、E515K以及N529R,其中编号相对于SEQIDNO:25的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:26或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、D775R、H576M、H568N、E515K以及N529R,其中编号相对于SEQIDNO:26的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:27或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、D775R、H576M、E515K以及N529R,其中编号相对于SEQIDNO:27的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:28或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、D718K、D775R、H568N、E515K以及N529R,其中编号相对于SEQIDNO:28的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:29或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:N780K、E788R、A558K、D559A、D559R、D718K、D775R、H576M、H568N、E515K以及N529R,其中编号相对于SEQIDNO:29的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37或其生物活性片段的至少90%的一致性的经分离和纯化的多肽,并且可以任选地进一步包括选自由E515K和N529R组成的群组的一个或多个氨基酸突变,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:15或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R以及E745Q,其中编号相对于SEQIDNO:15的氨基酸序列。
在一些实施例中,本发明大体上涉及包含或其组成为与SEQIDNO:18或其生物活性片段的至少80%的一致性的经分离和纯化的多肽,并且其具有选自由以下组成的群组的一个或多个氨基酸突变:E245K、S259R、T266K、E290K、A448K、D505R、A512W、R513R以及E518Q,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含或其组成为编码与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的多肽的核酸序列的分离的核酸序列。在一些实施例中,包含或其组成为编码经修饰的聚合酶或其生物活性片段的核酸序列的分离的核酸序列包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,包含或其组成为编码经修饰的聚合酶或其生物活性片段的核酸序列的分离的核酸序列包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,包含或其组成为编码经修饰的聚合酶或其生物活性片段的核酸序列的分离的核酸序列包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,包含或其组成为编码经修饰的聚合酶或其生物活性片段的核酸序列的分离的核酸序列包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,包含或其组成为编码经修饰的聚合酶或其生物活性片段的核酸序列的分离的核酸序列包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。
在一些实施例中,本发明大体上涉及包含编码与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的多肽的分离的核序列的载体。在一些实施例中,包含编码经修饰的聚合酶或其生物活性片段的分离的核序列的载体包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少85%的一致性。在一些实施例中,包含编码经修饰的聚合酶或其生物活性片段的分离的核序列的载体包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,包含编码经修饰的聚合酶或其生物活性片段的分离的核序列的载体包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,包含编码经修饰的聚合酶或其生物活性片段的分离的核序列的载体包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,包含编码经修饰的聚合酶或其生物活性片段的分离的核序列的载体包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的分离的多肽的套组。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少150个连续氨基酸残基。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少95%一致性的至少150个连续氨基酸残基。在一些实施例中,套组包含分离的多肽,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少98%一致性的至少150个连续氨基酸残基。在一些实施例中,分离的多肽包含来自多肽催化域和/或DNA结合域的至少25个连续氨基酸残基。
在一些实施例中,本发明大体上涉及一种用于鉴别基因中的一个或多个突变的方法,其包含在允许扩增的条件下使用与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的经修饰的聚合酶或其生物活性片段来扩增所述基因中的所述一个或多个突变;以及检测所述基因中的所述一个或多个突变。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少90%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少95%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少98%的一致性。在一些实施例中,所述方法包括经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少99%的一致性。
在一些实施例中,本发明大体上涉及一种用于鉴别基因中的一个或多个突变(例如缺失、插入、取代、重排、剪接和/或融合)的方法,其包含在允许扩增的条件下使用与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的经修饰的聚合酶或其生物活性片段来扩增跨越一个或多个突变的基因的至少一部分;以及检测基因中的一个或多个突变。在一些实施例中,基因可能临床上与癌症或遗传疾病相关。在一些实施例中,基因可能与产前或初生儿遗传异常相关。在一些实施例中,疾病可能与致病性相关。在一些实施例中,基因可能与感染性疾病相关。在一些实施例中,基因可能与植物或动物的疾病抗性相关。在一些实施例中,基因可能与病变相关,所述病变与人类或动物疾病相关。在一些实施例中,基因可能与细菌对一种或多种抗生素的抗性相关。在一些实施例中,基因可能与经遗传修饰的植物或食物相关。在一些实施例中,基因可能与动物或人类中疾病的预测或预后药物处理相关。在一些实施例中,允许基因内一个或多个突变的扩增的条件包括聚合酶链反应、乳液聚合酶链反应、等温扩增、环介导的等温扩增、重组酶聚合酶扩增、邻位连接扩增、滚环扩增或链置换扩增。在一些实施例中,所述方法包括使用经修饰的聚合酶或其生物活性片段,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少150个连续氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含来自聚合酶催化域和/或DNA结合域的至少25个连续氨基酸残基。
在一些实施例中,本发明大体上涉及具有DNA聚合酶活性和与SEQIDNO:1、SEQIDNO:2、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性的聚合酶或其生物活性片段,其中聚合酶或其生物活性片段包括相比于SEQIDNO:1、SEQIDNO:2、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少一个氨基酸突变。在一些实施例中,聚合酶或其生物活性片段包含位于聚合酶DNA结合域或催化域中的至少一个氨基酸突变。在一些实施例中,聚合酶或其生物活性片段包含在相对于SEQIDNO:1、SEQIDNO:15、SEQIDNO:16、SEQIDNO.18、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的任何部分的至少150个连续氨基酸残基中的基本一致性。在一些实施例中,聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域或催化域的任何部分的150个连续氨基酸残基。在一些实施例中,聚合酶或其生物活性片段包含在相对于SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的任何部分的150个连续氨基酸残基中的至少90%的一致性。
在一些实施例中,本发明大体上涉及基本上纯化的聚合酶或其生物活性片段,其具有包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性的氨基酸序列。在一些实施例中,本发明大体上涉及基本上纯化的聚合酶或其生物活性片段,其具有包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少95%一致性的序列变异体的氨基酸序列。在一些实施例中,本发明大体上涉及基本上纯化的聚合酶或其生物活性片段,其具有包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少98%一致性的序列变异体的氨基酸序列。在一些实施例中,本发明大体上涉及基本上纯化的聚合酶或其生物活性片段,其具有包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少99%一致性的序列变异体的氨基酸序列。在一些实施例中,本发明大体上涉及基本上纯化的聚合酶,其具有包含或其组成为保留聚合酶活性的SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的片段的氨基酸序列。在一些实施例中,聚合酶活性选自DNA结合活性、引物延伸活性、链置换活性、校正活性、切口引发聚合酶活性、逆转录酶活性准确度、平均阅读长度、热稳定性、系统误差、总测序通量、链偏差或核苷酸聚合活性。在一些实施例中,聚合酶活性选自一个或多个基于测序的度量,其选自原始阅读准确度、平均阅读长度、系统误差、总测序通量或链偏差。在一些实施例中,本发明大体上涉及基本上纯化的聚合酶,其具有包含或其组成为具有聚合酶活性的SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的生物活性片段的氨基酸序列,所述聚合酶活性选自与SEQIDNO.1或SEQIDNO:16的聚合酶活性相比提高的准确度、增加的平均阅读长度、减少的系统误差、增加的总测序通量或减少的链偏差。在一些实施例中,在较高离子强度溶液存在下测定聚合酶活性。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含选自H46R的相对于SEQIDNO:1的突变或突变组合,并且其中聚合酶进一步包括在E446Q、H572R、H273R、H281A、H473R、Y477F、D480R或H528A中的一个或多个处的突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含选自E446Q的相对于SEQIDNO:1的突变或突变组合,其中聚合酶进一步包括在H46R、H572R、H273R、H281A、H473R、Y477F、D480R或H528A中的一个或多个处的突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含选自H572R的相对于SEQIDNO:1的突变或突变组合,其中聚合酶进一步包括在H46R、E446Q、H572R、H273R、H281A、H473R、Y477F、D480R或H528A中的一个或多个处的突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含C93突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含Q238突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含H273突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含H281突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含H473突变,其中编号相对于SEQIDNO:1。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源、与SEQIDNO:1或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:1同源的重组聚合酶包含H528突变,其中编号相对于SEQIDNO:1。
在一些实施例中,与SEQIDNO:1同源的重组聚合酶包含与不具有相对于与SEQIDNO:1同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高解离时间常数、提高持续合成能力、提高准确度、增加平均阅读长度、增加最小阅读长度、提高AQ20或提高200Q17值的突变。在一些实施例中,与SEQIDNO:1同源的重组聚合酶包含与不具有相对于与SEQIDNO:1同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的准确度。在一些实施例中,与SEQIDNO:1同源的重组聚合酶包含与不具有相对于与SEQIDNO:1同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,与SEQIDNO:1同源的重组聚合酶包含在较高离子强度溶液存在下与不具有相对于与SEQIDNO:1同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的测序通量。在一些实施例中,与SEQIDNO:1同源的重组聚合酶包含与不具有相对于与SEQIDNO:1同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的解离时间常数。在一些实施例中,使用ISFET测量提高的解离时间常数、提高的持续合成能力、提高的准确度、增加的平均阅读长度、增加的最小阅读长度、提高的AQ20或提高的200Q17值。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是个人基因组机器或质子测序仪。在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含选自N487R的相对于SEQIDNO:2的突变或突变组合,并且其中重组聚合酶进一步包括在H281M、D423K、H273N、E493R以及D264A中的一个或多个处的突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含选自H281M的相对于SEQIDNO:2的突变或突变组合,其中重组聚合酶进一步包括在N487R、D264A、H273N以及E493R中的一个或多个处的突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含选自E493R的相对于SEQIDNO:2的突变或突变组合,其中重组聚合酶进一步包括在N487R、H281M、D423K、D264A或H273N中的一个或多个处的突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含D264A或D264R突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含H273N突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含D423K突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:2同源的重组聚合酶包含H281M突变,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含含有与SEQIDNO:2或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶的组合物,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2。在一些实施例中,重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487R、N485K、E493R、A263K、D264A、D264R、H528S、H528F、H273N、D423K、D480R以及H281M,其中编号相对于SEQIDNO:2。在一些实施例中,经修饰的聚合酶包含具有对应于在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的氨基酸序列的重组聚合酶:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2。
在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高准确度、增加平均阅读长度、增加最小阅读长度、提高AQ20、提高200Q17、增加总测序通量、减少链偏差或减少系统误差的突变。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的原始阅读准确度。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含在较高离子强度溶液存在下与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的测序通量。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的链偏差。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的系统误差。在一些实施例中,使用ISFET测量提高的准确度、增加的平均阅读长度、增加的最小阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高解离时间常数、提高持续合成能力、提高AQ20或提高200Q17值的突变。在一些实施例中,与SEQIDNO:2同源的重组聚合酶包含与不具有相对于与SEQIDNO:2同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的解离时间常数。在一些实施例中,使用ISFET测量提高的解离时间常数、提高的持续合成能力、提高的AQ20或提高的200Q17值。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含选自N782R的相对于SEQIDNO:16的突变或突变组合,并且其中重组聚合酶进一步包括在N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R、E515K、N529R或H576M中的一个或多个处的突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中所述重组聚合酶包含选自N780K的相对于SEQIDNO:16的突变或突变组合,其中重组聚合酶进一步包括在N782R、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R、E515K、N529R或H576M中的一个或多个处的突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含选自E788R的相对于SEQIDNO:16的突变或突变组合,其中重组聚合酶进一步包括在N782R、N780K、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R、E515K、N529R或H576M中的一个或多个处的突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含A558K突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含D559A或D559R突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含H568N突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含H823S或H823F突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含D718K突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含D775R突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶包含H576M突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源、与SEQIDNO:16或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:16同源的重组聚合酶任选地包括选自由E515K和N529R组成的群组的一个或多个氨基酸突变,其中编号相对于SEQIDNO:16。
在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高准确度、增加平均阅读长度、增加最小阅读长度、提高AQ20、提高200Q17、增加总测序通量、减少链偏差或减少系统误差的突变。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的原始阅读准确度。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含在较高离子强度溶液存在下与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的测序通量。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的链偏差。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的系统误差。在一些实施例中,使用ISFET测量提高的准确度、增加的平均阅读长度、增加的最小阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高解离时间常数、提高持续合成能力、提高AQ20或提高200Q17值的突变。在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含与不具有相对于与SEQIDNO:16同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的解离时间常数。在一些实施例中,使用ISFET测量提高的解离时间常数、提高的持续合成能力、提高的AQ20或提高的200Q17值。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:15或其生物活性片段同源、与SEQIDNO:15或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:15同源的重组聚合酶包含选自E471K的相对于SEQIDNO:15的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:N485R、R492K、D513K、A675K、D732R、S739W、V740R以及E745Q,其中编号相对于SEQIDNO:15。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:15或其生物活性片段同源、与SEQIDNO:15或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:15同源的重组聚合酶包含选自V740R的相对于SEQIDNO:15的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:E471K、N485R、D513K以及E745Q,其中编号相对于SEQIDNO:15。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:15或其生物活性片段同源、与SEQIDNO:15或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:15同源的重组聚合酶包含N485突变,其中编号相对于SEQIDNO:15。在一些实施例中,本发明大体上涉及包含与SEQIDNO:15或其生物活性片段同源、与SEQIDNO:15或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:15同源的重组聚合酶包含选自D513突变的相对于SEQIDNO:15的突变或突变组合,其中编号相对于SEQIDNO:15。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:15或其生物活性片段同源、与SEQIDNO:15或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:15同源的重组聚合酶包含选自D732突变的相对于SEQIDNO:15的突变或突变组合,其中编号相对于SEQIDNO:15。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:15或其生物活性片段同源、与SEQIDNO:15或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:15同源的重组聚合酶包含选自E745突变的相对于SEQIDNO:15的突变或突变组合,其中编号相对于SEQIDNO:15。
在一些实施例中,与SEQIDNO:15或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:15的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:15的突变或突变组合的参考聚合酶相比提高的解离时间常数;或与不具有相对于SEQIDNO:15的突变或突变组合的参考聚合酶相比增加的最小阅读长度;或在较高离子强度溶液存在下与不具有相对于与SEQIDNO:15同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的测序性能;或与不具有相对于SEQIDNO:15的突变或突变组合的参考聚合酶相比增加的平均阅读长度。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含选自E245K的相对于SEQIDNO:18的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:S259R、T266K、E290K、A448K、D505R、A512W、R513R以及E518Q,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含选自E245K的相对于SEQIDNO:18的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:S259R、T266K、E290K、A448K、D505R、A512W、R513R以及E518Q,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含选自D505R的相对于SEQIDNO:18的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:E245K、S259R、T266K、E290K、A448K、A512W、R513R以及E518Q,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含E290突变,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含S259突变,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含R513突变,其中编号相对于SEQIDNO:18。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18或其生物活性片段同源、与SEQIDNO:18或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:18同源的重组聚合酶包含A512突变,其中编号相对于SEQIDNO:18。
在一些实施例中,与SEQIDNO:18或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:18的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:18的突变或突变组合的参考聚合酶相比提高的解离时间常数活性;或与不具有相对于SEQIDNO:18的突变或突变组合的参考聚合酶相比增加的最小阅读长度;或在较高离子强度存在下与不具有相对于与SEQIDNO:18同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的测序性能;或与不具有相对于SEQIDNO:18的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶包含选自D718K的相对于SEQIDNO:25的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D775R以及H576M,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶包含选自H568N的相对于SEQIDNO:25的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、D718K、D775R或H576M,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶包含D718K突变,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶包含相对于SEQIDNO:25的突变或突变组合(包含H823S或H823F突变),其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶包含选自N780K突变的相对于SEQIDNO:25的突变或突变组合,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶包含选自E788R突变的相对于SEQIDNO:25的突变或突变组合,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:25或其生物活性片段同源、与SEQIDNO:25或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:25同源的重组聚合酶任选地包括选自由E515K和N529R组成的群组的一个或多个氨基酸突变,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明涉及与SEQIDNO:25或其生物活性片段同源的重组聚合酶,其包含:与不具有相对于SEQIDNO:25的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:25的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于SEQIDNO:25的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:25的突变或突变组合的参考聚合酶相比减少的系统误差;或与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:25的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,包含与SEQIDNO:25或其生物活性片段同源的重组聚合酶的组合物包含与SEQIDNO:25或其生物活性片段的至少90%的一致性。
在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高准确度、增加平均阅读长度、增加最小阅读长度、提高AQ20、提高200Q17、增加总测序通量、减少链偏差或减少系统误差的突变。在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的准确度。在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量。在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的链偏差。在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的系统误差。在一些实施例中,使用ISFET测量提高的准确度、增加的平均阅读长度、增加的最小阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高解离时间常数、提高持续合成能力、提高AQ20或提高200Q17值的突变。在一些实施例中,与SEQIDNO:25同源的重组聚合酶包含与不具有相对于与SEQIDNO:25同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的解离时间常数。
在一些实施例中,本发明大体上涉及含有与SEQIDNO:25或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。在一些实施例中,重组聚合酶含有与SEQIDNO:25或其生物活性片段至少80%一致的氨基酸序列,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。在一些实施例中,重组聚合酶展现与在对应于选自由以下组成的群组的位置的位置处不具有一个或多个氨基酸取代的参考聚合酶相比提高的原始阅读准确度、减少的系统误差、减少的链偏差、增加的平均阅读长度或增加的总测序通量:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少95%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶包含选自H568N的相对于SEQIDNO:26的突变或突变组合,其中聚合酶进一步包括在N780K、E788R、A558K、D559A、D559R、H823S、H823F、D775R或H576M中的一个或多个处的突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶包含A558K突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶包含D559A或D559R突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶包含H568N突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中重组聚合酶包含H823S或H823F突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶包含D775R突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶包含H576M突变,其中编号相对于SEQIDNO:26。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:26或其生物活性片段同源、与SEQIDNO:26或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:26同源的重组聚合酶任选地包括选自由E515K和N529R组成的群组的一个或多个氨基酸突变,其中编号相对于SEQIDNO:26。
在一些实施例中,与SEQIDNO:26或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:26的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:26的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于与SEQIDNO:26同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:26的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:26的突变或突变组合的参考聚合酶相比减少的系统误差。
在一些实施例中,使用ISFET测量提高的准确度、增加的阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:28或其生物活性片段同源、与SEQIDNO:28或其生物片段具有至少80%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:28或其生物活性片段同源、与SEQIDNO:28或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:28同源的重组聚合酶包含选自D718K的相对于SEQIDNO:28的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:A558K、H823S、H823F、D559A、D559R、D568N、D775R、E788R、N780K、E515K以及N529R,其中编号相对于SEQIDNO:28。
在一些实施例中,与SEQIDNO:28或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:28的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:28的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于与SEQIDNO:28同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:28的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:28的突变或突变组合的参考聚合酶相比减少的系统误差。
在一些实施例中,使用ISFET测量提高的准确度、增加的阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(LifeTechnologiesCorporation)(加利福尼亚州(CA))的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:29或其生物活性片段同源、与SEQIDNO:29或其生物片段具有至少80%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:29或其生物活性片段同源、与SEQIDNO:29或其生物片段具有至少80%一致性的重组聚合酶的组合物,并且其中重组聚合酶包含选自D718K的相对于SEQIDNO:29的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:A558K、D559A、D559R、D568N、D775R、E788R、H576M、N780K、E515K以及N529R,其中编号相对于SEQIDNO:29。在一些实施例中,与SEQIDNO:29或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:29的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:29的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于与SEQIDNO:29同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:29的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:29的突变或突变组合的参考聚合酶相比减少的系统误差。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:30或其生物活性片段同源、与SEQIDNO:30或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:30同源的重组聚合酶包含选自N782R的相对于SEQIDNO:30的突变或突变组合,其中聚合酶进一步包括在A558K、D559A、D559R、H823S、H823F、H568N以及H576M中的一个或多个处的突变,其中编号相对于SEQIDNO:30。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:30或其生物活性片段同源、与SEQIDNO:30或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:30同源的重组聚合酶包含选自H568N的相对于SEQIDNO:30的突变或突变组合,其中聚合酶进一步包括在以下各项中的一个或多个处的突变:N780K、E788R、A558K、D559A、D559R、H823S、H823F、D775R或H576M,其中编号相对于SEQIDNO:30。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:30或其生物活性片段同源、与SEQIDNO:30或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:30同源的重组聚合酶包含选自H823S或H823F突变的相对于SEQIDNO:30的突变或突变组合,其中编号相对于SEQIDNO:30。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:30或其生物活性片段同源、与SEQIDNO:30或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:30同源的重组聚合酶包含选自N782R突变的相对于SEQIDNO:30的突变或突变组合,其中编号相对于SEQIDNO:30。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:30或其生物活性片段同源、与SEQIDNO:30或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:30同源的重组聚合酶包含选自H668N突变的相对于SEQIDNO:30的突变或突变组合,其中编号相对于SEQIDNO:30。
在一些实施例中,本发明涉及与SEQIDNO:30或其生物活性片段同源的重组聚合酶,其包含:与不具有相对于SEQIDNO:30的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:30的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于SEQIDNO:30的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:30的突变或突变组合的参考聚合酶相比减少的系统误差;或与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:30的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,包含与SEQIDNO:30或其生物活性片段同源的重组聚合酶的组合物包含与SEQIDNO:30或其生物活性片段的至少90%的一致性。
在一些实施例中,与SEQIDNO:30同源的重组聚合酶包含与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变(或突变组合)的参考聚合酶相比提高准确度、增加平均阅读长度、增加最小阅读长度、提高AQ20、提高200Q17、增加总测序通量、减少链偏差或减少系统误差的突变。在一些实施例中,与SEQIDNO:30同源的重组聚合酶包含与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变或突变组合的参考聚合酶相比提高的准确度。在一些实施例中,与SEQIDNO:30同源的重组聚合酶包含与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的平均阅读长度。在一些实施例中,与SEQIDNO:30同源的重组聚合酶包含与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量。在一些实施例中,与SEQIDNO:30同源的重组聚合酶包含与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的链偏差。在一些实施例中,与SEQIDNO:30同源的重组聚合酶包含与不具有相对于与SEQIDNO:30同源的重组聚合酶的突变或突变组合的参考聚合酶相比减少的系统误差。在一些实施例中,使用ISFET测量提高的准确度、增加的平均阅读长度、增加的最小阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少95%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:31同源的重组聚合酶包含选自H568N的相对于SEQIDNO:31的突变或突变组合,其中聚合酶进一步包括在N780K、E788R、A558K、D559A、D559R、H823S、H823F、D775R或H576M中的一个或多个处的突变,其中编号相对于SEQIDNO:31。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:31同源的重组聚合酶包含D559A突变,其中编号相对于SEQIDNO:31。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:31同源的重组聚合酶包含E788R突变,其中编号相对于SEQIDNO:31。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:31同源的重组聚合酶包含H568N突变,其中编号相对于SEQIDNO:31。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中重组聚合酶包含H823S或H823F突变,其中编号相对于SEQIDNO:31。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:31或其生物活性片段同源、与SEQIDNO:31或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:31同源的重组聚合酶包含D775R突变,其中编号相对于SEQIDNO:31。
在一些实施例中,与SEQIDNO:31或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:31的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:31的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于与SEQIDNO:31同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:31的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:31的突变或突变组合的参考聚合酶相比减少的系统误差。
在一些实施例中,使用ISFET测量提高的准确度、增加的阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少80%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少95%一致性的重组聚合酶的组合物。在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:32同源的重组聚合酶包含选自D718K的相对于SEQIDNO:32的突变或突变组合,其中聚合酶进一步包括在N780K、A558K、H823S、H823F或D775R中的一个或多个处的突变,其中编号相对于SEQIDNO:32。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:32同源的重组聚合酶包含D718K突变,其中编号相对于SEQIDNO:32。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:32同源的重组聚合酶包含E788R突变,其中编号相对于SEQIDNO:32。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中重组聚合酶包含H823S或H823F突变,其中编号相对于SEQIDNO:32。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:32或其生物活性片段同源、与SEQIDNO:32或其生物活性片段具有至少80%一致性的重组聚合酶的组合物,并且其中与SEQIDNO:32同源的重组聚合酶包含D775R突变,其中编号相对于SEQIDNO:32。
在一些实施例中,与SEQIDNO:32或其生物活性片段同源的重组聚合酶包含:与不具有相对于SEQIDNO:32的突变或突变组合的参考聚合酶相比提高的准确度;或与不具有相对于SEQIDNO:32的突变或突变组合的参考聚合酶相比增加的阅读长度;或与不具有相对于与SEQIDNO:32同源的重组聚合酶的突变或突变组合的参考聚合酶相比增加的总测序通量;或与不具有相对于SEQIDNO:32的突变或突变组合的参考聚合酶相比减少的链偏差;或与不具有相对于SEQIDNO:32的突变或突变组合的参考聚合酶相比减少的系统误差。
在一些实施例中,使用ISFET测量提高的准确度、增加的阅读长度、增加的测序通量、减少的链偏差或减少的系统误差。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,与SEQIDNO:16、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31或SEQIDNO:32同源的重组聚合酶可以任选地进一步包括选自由E515K和N529R组成的群组的一个或多个突变,其中编号相对于SEQIDNO:16。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源的重组聚合酶的组合物,其中重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:1的突变或突变组合:N31、D77、D113、D114、D130、D144、L212、E220、N234、V241、V251、A263K、D264、Y272、H273、L280、H281、E294、V299、D303、I331、E325、L335、E336、I354、I370、Q409、G416、V418、G420、D423、G425、Q428、N429、E446、F448、N457、A462、H473、Y477、D480、N485、N487、V488、E493、M495、H528、V533、H572、W577以及D579。在一些实施例中,本发明大体上涉及包含与SEQIDNO:1或其生物活性片段同源的重组聚合酶的组合物,所述重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:1的突变或突变组合:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、A263K、D264A、D264R、D264Q、D264S、D264K、Y272R、H273N、H273R、L280R、H281A、H281M、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485K、N485W、N485Y、N487R、N487H、N487W、N487F、N487I、V488R、E493Q、E493R、M495Q、H528A、H528F、H528S、H528R、H528K、V533I、H572R、W577Y以及D579F。
在一些实施例中,与SEQIDNO:1同源并且包含相对于SEQIDNO:1的突变或突变组合的重组聚合酶包括保留聚合酶活性的重组聚合酶的任何生物活性片段。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:16或其生物活性片段同源的重组聚合酶的组合物,其中与SEQIDNO:16同源的重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:16的突变或突变组合:H341、C388、Q533、H568、H576、E741、H768、Y772、H823、C845、H867、N782、N780、E788、A558、D559、D718、D775、E515以及N529。
在一些实施例中,与SEQIDNO:16同源的重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:16的突变或突变组合:H341R、C388R、Q533C、H568R、H576A、E741Q、H768R、Y772F、H823A、C845Q、H867R、N782R、N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R、H576M、E515K以及N529R。在一些实施例中,与SEQIDNO:16同源并且包含相对于SEQIDNO:16的突变或突变组合的重组聚合酶包括保留聚合酶活性的重组聚合酶的任何生物片段。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:15同源的重组聚合酶的组合物,其中重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:15的突变或突变组合:E471、N485、R492、D513、A675、D732、S739、V740以及E745。在一些实施例中,与SEQIDNO:15同源的重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:15的突变或突变组合:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R以及E745Q。在一些实施例中,与SEQIDNO:15同源并且包含相对于SEQIDNO:1的突变或突变组合的重组聚合酶包括保留聚合酶活性的重组聚合酶的任何生物片段。
在一些实施例中,本发明大体上涉及包含与SEQIDNO:18同源的重组聚合酶的组合物,其中重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:18的突变或突变组合:E245、S259、T266、E290、A448、D505、A512以及E518。在一些实施例中,与SEQIDNO:18同源的重组聚合酶包含选自以下各项中的任何一个或多个的相对于SEQIDNO:18的突变或突变组合:E245K、S259R、T266K、E290K、A448K、D505R、A512W以及E518Q。在一些实施例中,与SEQIDNO:18同源并且包含相对于SEQIDNO:1的突变或突变组合的重组聚合酶包括保留聚合酶活性的重组聚合酶的任何生物片段。
在一些实施例中,本发明大体上涉及包含与含有选自由以下组成的群组的氨基酸序列的家族ADNA聚合酶具有至少90%一致性的分离的多肽的组合物:SEQIDNO:2、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37。在一些实施例中,分离的多肽包含与SEQIDNO:25的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775、H576、E515以及N529,其中编号相对于SEQIDNO:25。在一些实施例中,组合物包含分离的多肽,其包含与SEQIDNO:2的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480、H281、E220以及N234,其中编号相对于SEQIDNO:2。在一些实施例中,组合物包含分离的多肽,其包含与SEQIDNO:28的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N780、E788、A558、D559、H823、H568、D775以及D718,其中编号相对于SEQIDNO:28。在一些实施例中,组合物包含分离的多肽,其包含与SEQIDNO:37的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N485、E493、A263、D264、H528、H273、D423以及D480,其中编号相对于SEQIDNO:37。
在一些实施例中,本发明大体上涉及包含含有与SEQIDNO:25或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶的组合物,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。在一些实施例中,重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R以及H576M,其中编号相对于SEQIDNO:25。
在一些实施例中,本发明大体上涉及包含含有与SEQIDNO:2或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶的组合物,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2。在一些实施例中,重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487R、N485K、E493R、A263K、D264A、D264R、H528S、H528F、H273N、D423K、D480R以及H281M,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及包含含有与SEQIDNO:37或其生物活性片段具有至少80%同源性的氨基酸序列的分离的多肽的组合物,其中分离的多肽包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:D423、D264、H273以及E493,其中编号相对于SEQIDNO:37,并且其中分离的多肽展现相对于SEQIDNO:2减少的解离速率常数。
在一些实施例中,本发明大体上涉及包含含有与SEQIDNO:2或其生物活性片段具有至少80%同源性的氨基酸序列的重组聚合酶的组合物,其中重组聚合酶包含在对应于选自由以下组成的群组的位置的位置处具有一个或多个氨基酸取代的家族ADNA聚合酶:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2,并且其中重组聚合酶展现与SEQIDNO:2相比减少的解离速率常数。
在一些实施例中,组合物包含与SEQIDNO:2或其生物活性片段同源、与SEQIDNO:2或其生物活性片段具有至少90%一致性的重组聚合酶,其中与SEQIDNO:2或其生物活性片段同源的重组聚合酶包含具有对应于氨基酸位置N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281的氨基酸取代或氨基酸取代组合的家族A或家族BDNA聚合酶,其中编号相对于SEQIDNO:2。
在一些实施例中,本发明大体上涉及一种用于进行聚合的方法,其包含:(a)提供包括与引物杂交并且结合到经修饰的聚合酶的核酸的反应混合物;以及(b)使核酸与至少一种类型的核苷酸接触,其中所述接触包括将至少一种核苷酸掺入到引物上,从而产生延伸的引物产物。
在一些实施例中,本发明大体上涉及一种用于从核酸模板获得序列信息的方法,其包含:(a)提供包括与测序引物杂交并且结合到经修饰的聚合酶的模板核酸的反应混合物;(b)使模板核酸与至少一种类型的核苷酸接触,其中所述接触包括使来自至少一种类型的核苷酸的一种或多种核苷酸掺入到测序引物的3'端上,并且产生延伸的引物产物;(c)检测反应混合物中延伸的引物产物的存在,从而判定是否已发生核苷酸掺入;以及(d)从至少一种类型的核苷酸鉴别所掺入的一种或多种核苷酸中的至少一种。在一些实施例中,所述方法进一步包括检测反应混合物中延伸的引物产物的存在,从而判定是否已发生核苷酸掺入。在一些实施例中,所述方法重复接触和检测超过一次,从而检测多种核苷酸掺入。在一些实施例中,所述方法进一步包括鉴别多种核苷酸掺入中的至少一种。在一些实施例中,所述聚合方法可以包括PCR、qPCR、桥式PCR、RT-PCR、连接介导的PCR、等温扩增或乳液PCR。在一些实施例中,获得序列信息的方法可以包括PCR、qPCR、桥式PCR、RT-PCR、连接介导的PCR、等温扩增或乳液PCR。
在一些实施例中,组合物(和相关方法、套组、系统以及设备)进一步包括至少一种类型的链终止核苷酸类似物。在一些实施例中,通过含有与SEQIDNO:2或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶将至少一种类型的链终止核苷酸类似物掺入到引物中,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2。
在一些实施例中,以模板依赖性方式将链终止核苷酸类似物掺入到引物中。在一些实施例中,用第一可检测标记来标记链终止核苷酸类似物。
在一些实施例中,组合物(和相关方法、套组、系统以及设备)包括超过一种类型的链终止核苷酸类似物。在一些实施例中,针对每种类型的链终止核苷酸类似物,组合物进一步包含不同可检测标记。在一些实施例中,链终止核苷酸类似物包括双脱氧核苷酸。在一些实施例中,双脱氧核苷酸选自由以下组成的群组:ddATP、ddTTP、ddCTP以及ddGTP。所属领域的技术人员将显而易见,可以使用其它类型的链终止核苷酸类似物,例如3'-O-封端和3'-未封端可逆终止子、3'-O-N3可逆终止子、3'-ONH2可逆终止子、3'-O-烯丙基可逆终止子和/或虚拟终止子(参见Chen等人,《基因组学蛋白质组研究和生物资讯(GenomicsProteomicsandBioinformatics)》(2013)11:34-40,其以全文引用的方式并入本文中)。在一些实施例中,可以用第二可检测标记来标记引物。在一些实施例中,组合物进一步包括连接酶。
在一些实施例中,本发明大体上涉及一种用于进行核酸测序的方法,其包含在一种或多种核苷酸存在下使经修饰的聚合酶或其生物活性片段与核酸模板接触,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰,并且其中经修饰的聚合酶或其生物活性片段具有相对于参考聚合酶提高的解离时间常数或减少的系统误差;以及使用经修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,核酸模板可以是DNA模板。在一些实施例中,核酸模板可以包括cDNA。在一些实施例中,核酸模板可以包括衍生自RNA样品的cDNA。在一些实施例中,一种或多种核苷酸不含有可检测标记。在一些实施例中,经修饰的聚合酶或其生物活性片段是家族A或家族BDNA聚合酶。在一些实施例中,经修饰的聚合酶是DNA或RNA聚合酶。在一些实施例中,本发明大体上涉及经修饰的DNA聚合酶,其包含与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性。在一些实施例中,本发明大体上涉及经修饰的聚合酶,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37至少95%一致的序列变异体。在一些实施例中,本发明大体上涉及经修饰的聚合酶,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37至少98%一致的序列变异体。在一些实施例中,本发明大体上涉及经修饰的聚合酶,其包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37至少99%一致的序列变异体。
在一些实施例中,本发明大体上涉及经修饰的聚合酶,其包含保留聚合酶活性的SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的生物活性片段。在一些实施例中,经修饰的聚合酶包含与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的任何片段具有至少80%一致性并且保留聚合酶活性的生物活性片段。在一些实施例中,经修饰的聚合酶包含具有聚合酶催化域的至少25个连续氨基酸和与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的至少80%的一致性的生物活性片段。在一些实施例中,生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少100个连续氨基酸残基。在一些实施例中,所述方法进一步包括通过经修饰的聚合酶测定聚合的一种或多种核苷酸的一致性。在一些实施例中,所述方法进一步包括通过经修饰的聚合酶测定聚合的核苷酸的编号。在一些实施例中,鉴别通过经修饰的聚合酶聚合的一种或多种核苷酸的至少50%。在一些实施例中,鉴别基本上所有通过经修饰的聚合酶聚合的一种或多种核苷酸。在一些实施例中,聚合在较高离子强度溶液存在下进行。在一些实施例中,较高离子强度溶液包含约125mM到约200mM盐。在一些实施例中,聚合在至少125mM盐的离子强度溶液存在下进行。在一些实施例中,较高离子强度溶液包含KCl和/或NaCl。
在一些实施例中,本发明大体上涉及一种用于进行核苷酸聚合反应的方法,其包含在一种或多种核苷酸存在下使经修饰的聚合酶或其生物活性片段与核酸模板接触,其中经修饰的聚合酶或其生物活性片段包括一种或多种相对于参考聚合酶的氨基酸修饰(例如取代、添加、缺失、重排、融合和/或剪接)并且相对于参考聚合酶具有提高的准确度,以及使用经修饰的聚合酶使一种或多种核苷酸中的至少一种聚合。在一些实施例中,具有提高的准确度的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少150个连续氨基酸残基。在一些实施例中,具有提高的准确度的经修饰的聚合酶或其生物活性片段包含来自聚合酶催化域或DNA结合域、与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少25个连续氨基酸残基。在一些实施例中,具有提高的准确度的经修饰的聚合酶或其生物活性片段包含来自SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的聚合酶催化域或DNA结合域的至少25个连续氨基酸残基。在一些实施例中,聚合在较高离子强度溶液存在下进行。在一些实施例中,较高离子强度溶液可以包括至少125mMKCl。
在一些实施例中,本发明大体上涉及一种用于进行核酸测序的方法,其包含或其组成为在一种或多种核苷酸存在下使经修饰的聚合酶与核酸模板接触,其中经修饰的聚合酶包括一种或多种相对于参考聚合酶的氨基酸修饰并且相对于参考聚合酶具有提高的准确度,以及使用经修饰的聚合酶使一种或多种核苷酸中的至少一种聚合。在一些实施例中,经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少150个连续氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含来自聚合酶催化域或DNA结合域、与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少25个连续氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段包含来自SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的聚合酶催化域或DNA结合域的至少25个连续氨基酸残基。在一些实施例中,聚合可以在较高离子强度溶液存在下进行。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括DNA或RNA聚合酶。
在一些实施例中,本发明大体上涉及一种用于进行核酸测序的方法,其包含或其组成为在一种或多种核苷酸存在下使经修饰的聚合酶与核酸模板接触,其中经修饰的聚合酶包括一种或多种相对于参考聚合酶的氨基酸修饰并且相对于参考聚合酶具有提高的信噪比,以及使用经修饰的聚合酶使一种或多种核苷酸中的至少一种聚合。在一些实施例中,具有提高的信噪比的经修饰的聚合酶或其生物活性片段包含或其组成为与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少150个连续氨基酸残基。在一些实施例中,具有提高的信噪比的经修饰的聚合酶或其生物活性片段包含来自聚合酶催化域或DNA结合域、与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37具有至少80%一致性的至少25个连续氨基酸残基。在一些实施例中,具有提高的信噪比的经修饰的聚合酶或其生物活性片段包含来自SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的聚合酶催化域或DNA结合域的至少25个连续氨基酸残基。在一些实施例中,具有提高的信噪比的经修饰的聚合酶或其生物活性片段是DNA聚合酶。
附图说明
并入到说明书中并且形成说明书的一部分的随附图式说明一个或多个示例性实施例并且用以解释各个例示性实施例的原理。图式仅是示例性和解释性的,并且不应理解为以任何方式限制或约束。
图1是概述根据本发明的示例性解离速率曲线的示意图。
图2显示概述根据本发明进行的示例性解离分析的曲线图。
图3是提供相比于参考聚合酶,针对根据本发明获得的经修饰的聚合酶所获得的示例性模板亲和性数据的表。
图4是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图5是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图6显示提供如在使用根据本发明的示例性经修饰的聚合酶获得的碱基长度上测量的示例性误差率数据的曲线图。
图7显示提供如在使用根据本发明的示例性经修饰的聚合酶获得的碱基长度上测量的示例性误差率数据的曲线图。
图8显示概述根据本发明获得的示例性经修饰的聚合酶的示例性解离速率曲线的曲线图。
图9是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性结合亲和性分析数据的曲线图。
图10是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性结合亲和性分析数据的曲线图。
图11是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性结合亲和性分析数据的曲线图。
图12是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性结合亲和性分析数据的曲线图。
图13是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图14是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图15是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图16是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图17是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图18是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图19是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图20是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图21是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图22是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图23是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图24是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图25是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图26是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图27是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图28是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图29是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图30是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性均聚物数据的曲线图和表。
图31是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性均聚物数据的曲线图和表。
图32是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
图33是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性均聚物数据的曲线图和表。
图34是显示使用根据本发明获得的示例性经修饰的聚合酶进行的示例性均聚物数据的曲线图和表。
图35是提供使用根据本发明的示例性经修饰的聚合酶获得的示例性核酸测序数据的表。
具体实施方式
除非另外定义,否则本文所使用的所有技术和科学术语都具有与本发明所属领域的一般技术人员通常所理解相同的含义。本文(上文和下文)中所提及的所有专利、专利申请、公布的申请、论文和其它公开案都以全文引用的方式并入。如果在本文中明确地或隐含地阐述的定义和/或描述与以引用的方式并入本文中的专利、专利申请、公布的申请和其它公开案中所阐述的任何定义相反或不一致,那么本文中所阐述的定义和/或描述优先于以引用的方式并入的定义。
除非另外指示,否则本发明的实践将采用在所属领域技术内的分子生物学、微生物学以及重组DNA技术的常规技术。在文献中全面解释了此类技术。参见例如Sambrook,J.,和Russell,D.W.,2001,《分子克隆实验指南(MolecularCloning:ALaboratoryManual)》,第三版;Ausubel,F.M.等人编,2002,《分子生物学简洁方案(ShortProtocolsInMolecularBiology)》,第五版。
应注意,并非所有一般描述或实例中所描述的活动都是需要的,一部分具体活动可能是不需要的,并且可以进行一种或多种除所描述的活动之外的其它活动。再者,活动所列的顺序不一定是执行它们的顺序。
在一些情况下,已参考特定实施例描述了一些概念。然而,所属领域的技术人员了解,可以在不脱离如下文权利要求书中所阐述的本发明范围的情况下进行各种修改和变化。因此,说明书和图式应该以说明性而不是限制性意义来看待,并且所有此类修改意图包括在本发明范围内。
如本文所使用,术语“包含(comprising)”(和包含的任何形式或变化形式,如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(和具有的任何形式或变化形式,如“具有(have)”和“具有(has)”)、“包括(including)”(和包括的任何形式或变化形式,如“包括(includes)”和“包括(include)”)或“含有(containing)”(和含有的任何形式或变化形式,如“含有(contains)”和“含有(contain)”)是包括性或开放性的并且并不排除额外的、未列出的添加剂、组分、整体、要素或方法步骤。举例来说,包括一列特征的工艺、方法、物品或装置不一定仅限于那些特征,但可以包括没有明确列出或此类工艺、方法、物品或装置所固有的其它特征。
除非有明确的相反陈述,否则“或”是指包括性的或,而非排它性的或。举例来说,条件A或B通过以下中的任一种来得到满足:A是真的(或存在的)并且B是假的(或不存在的)、A是假的(或不存在的)并且B是真的(或存在的)以及A和B都是真的(或存在的)。
已关于特定实施例描述了益处、其它优势和问题解决方案。然而,此类益处、优势、问题解决方案以及可以使任何益处、优势或解决方案出现或变得更显著的任何特征不应解释为任何或所有权利要求关键的、必需的或基本的特征。
在阅读本说明书之后,所属领域的技术人员将了解,为了清楚起见在单独实施例的情况下于本文所描述的某些特征也可以在单个实施例中组合提供。相反地,为了简洁起见在单个实施例的情况下所描述的各种特征也可以单独地或以任何次组合形式提供。此外,提及范围中所陈述的值包括在那个范围内的每一个值。
此外,如“一(a/an)”或“所述”的冠词的使用用于描述本文所描述的要素和组分。这样做只是为了方便起见并且给出本发明范围的一般性意义。除非明显指的是其它情况,否则本说明书应该被解读为包括一个或至少一个,并且单数也包括多个,或反之亦然。因此,本文所使用的术语“一(a/an)”和“所述”以及类似指示物应理解为涵盖单数和复数,除非其在上下文中用途另外指示。因此,当在权利要求或说明书中使用时,包括与术语“包含”结合使用时,使用词“一(a/an)”或“所述”可以意指“一个”,但其也与“一个或多个”、“至少一个”以及“一个或一个以上”的含义一致。
如本文所使用,术语“聚合酶”和其变化形式包含可以催化核苷酸(包括其类似物)聚合成核酸链的任何酶。典型地但未必,此类核苷酸聚合可以模板依赖性方式进行。此类聚合酶可以包括(但不限于)天然存在的聚合酶和其任何次单元和截断、突变化形式聚合酶、变异体聚合酶、重组、融合或以其它方式工程化的聚合酶、经化学修饰的聚合酶、合成分子或组件以及保留催化此类聚合的能力的任何类似物、同源物、衍生物或其片段。任选地,聚合酶可以是包含一个或多个突变的突变化形式聚合酶,所述突变涉及用其它氨基酸替换一个或多个氨基酸,来自聚合酶的一个或多个氨基酸的插入或缺失或两个或更多个聚合酶的部分的连接。典型地,聚合酶包含可以进行核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些示例性聚合酶包括(但不限于)DNA聚合酶(如Phi-29DNA聚合酶、逆转录酶以及大肠杆菌DNA聚合酶)和RNA聚合酶。如本文所使用,术语“聚合酶”和其变化形式也指包含至少两个彼此连接的部分的融合蛋白,其中第一部分包含可以催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包含第二多肽的第二部分。在一些实施例中,第二多肽可以包括报导子酶或增强持续合成能力的域。
如本文所使用,术语“连接(link)”、“连接(linked)”、“连接(linkage)”和其变化形式包含任何类型的融合、粘合、粘附或缔合,其具有足够的稳定性以耐受在相关特定生物应用中使用。此类连接可以包含例如共价、离子、氢、偶极-偶极、亲水性、疏水性或亲和性粘合、涉及范德华力(vanderWaalsforce)的粘合或缔合、机械粘合等。任选地,此类连接可以在不同分子的组合之间发生,包括(但不限于):在纳米粒子与蛋白质之间;在蛋白质与标记之间;在连接子与官能化纳米粒子之间;在连接子与蛋白质之间;在核苷酸与标记之间等等。连接的一些实例可以见于例如Hermanson,G.,《生物结合物技术(BioconjugateTechniques)》,第二版(2008);Aslam,M.,Dent,A.,《生物结合:生物医学科学的蛋白质偶联技术(Bioconjugation:ProteinCouplingTechniquesfortheBiomedicalSciences)》,伦敦:麦克米伦(Macmillan)(1998);Aslam,M.,Dent,A.,《生物结合:生物医学科学的蛋白质偶联技术》,伦敦:麦克米伦(1998)中。
如本文参考多肽或蛋白质(例如聚合酶)所使用的术语“修饰”或“经修饰的”和其变化形式包含蛋白质的结构、生物和/或化学特性的任何变化。在一些实施例中,修饰可以包括蛋白质的氨基酸序列变化。举例来说,修饰可以任选地包括一个或多个氨基酸突变,包括(但不限于)氨基酸添加、缺失和取代(包括保守性和非保守性取代两种)。
如本文参考氨基酸序列的任何变化所使用的术语“保守性”和其变化形式是指其中一个或多个氨基酸被另一个具有高度类似特性的氨基酸取代的氨基酸突变。举例来说,包含非极性或脂肪族侧链的一种或多种氨基酸(例如甘氨酸、丙氨酸、缬氨酸、白氨酸或异白氨酸)可以彼此取代。类似地,包含极性不带电侧链的一种或多种氨基酸(例如丝氨酸、苏氨酸、半胱氨酸、甲硫氨酸、天冬酰胺或谷氨酰胺)可以彼此取代。类似地,包含芳香族侧链的一种或多种氨基酸(例如苯丙氨酸、酪氨酸或色氨酸)可以彼此取代。类似地,包含带正电侧链的一种或多种氨基酸(例如赖氨酸、精氨酸或组氨酸)可以彼此取代。类似地,包含带负电侧链的一种或多种氨基酸(例如天冬氨酸或谷氨酸)可以彼此取代。在一些实施例中,经修饰的聚合酶是包含这些保守性氨基酸取代或其任何组合中的一个或多个的变异体。在一些实施例中,白氨酸的保守性取代包括:丙氨酸、异白氨酸、缬氨酸、苯丙氨酸、色氨酸、甲硫氨酸以及半胱氨酸。在其它实施例中,天冬酰胺的保守性取代包括:精氨酸、赖氨酸、天冬氨酸、谷氨酸以及谷氨酰胺。
在本发明通篇中,包括例如氨基酸取代的各种氨基酸突变使用氨基酸单字母密码提及,并且指示参考氨基酸序列内残基的位置。在氨基酸取代的情况下,取代基的一致性也使用氨基酸单字母密码指示。举例来说,参考假设氨基酸取代“D166A”(其中编号相对于SEQIDNO:7的氨基酸序列)指示其中在SEQIDNO:7的氨基酸序列的氨基酸位置166处丙氨酸(A)残基取代通常出现的天冬氨酸(D)残基的氨基酸取代。本文所公开的许多氨基酸序列以甲硫氨酸残基(“M”)开始,其典型地在编码于细菌宿主细胞中表达所需的肽的核酸序列的开端处引入。然而,应理解,本发明也涵盖从前面氨基酸残基开始的所有此类氨基酸序列,而不包括第一甲硫氨酸残基。
如本文所使用,当在两个或更多个核酸或多肽序列的上下文中使用时,术语“一致”或“一致性百分比”和其变化形式是指当比较和比对最大对应性时相同或指定百分比的氨基酸残基或核苷酸相同的两个或更多个序列或子序列,如使用以下序列比较算法中的任何一种或多种所测量:尼德曼-翁施(Needleman-Wunsch)(参见例如Needleman,SaulB.和Wunsch,ChristianD.(1970).“适用于搜索两个蛋白质的氨基酸序列的相似性的一般方法(Ageneralmethodapplicabletothesearchforsimilaritiesintheaminoacidsequenceoftwoproteins)”《分子生物学杂志(JournalofMolecularBiology)》48(3):443-53);史密斯-沃特曼(Smith-Waterman)(参见例如Smith,TempleF.和Waterman,MichaelS.,“鉴别常见分子子序列(IdentificationofCommonMolecularSubsequences)”(1981)《分子生物学杂志》147:195-197);或BLAST(基本局部对比搜索工具(BasicLocalAlignmentSearchTool);参见例如AltschulSF,GishW,MillerW,MyersEW,LipmanDJ,“基本局部对比搜索工具”(1990)《分子生物学杂志(JMolBiol)》215(3):403-410)。
如本文所使用,当在两个或更多个核酸或多肽序列的上下文中使用时,术语“基本上一致”或“基本一致性”和其变化形式是指当比较和比对最大对应性时,具有至少60%、至少70%、、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%核苷酸或氨基酸残基一致性的两个或更多个序列或子序列(如生物活性片段),如使用序列比较算法或通过目视检验所测量。基本上一致的序列典型地被认为是同源的,无论实际来源于何种家系。在一些实施例中,在所比较的序列的区域中存在“基本一致性”。在一些实施例中,在长度为至少25个残基、长度为至少50个残基、长度为至少100个残基、长度为至少150个残基、长度为至少200个残基或长度为至少200个残基的区域中存在基本一致性。在一些实施例中,所比较的序列在所比较的序列全长中基本上一致。典型地,基本上一致的核酸或蛋白质序列包括小于100%核苷酸或氨基酸残基一致性,如此序列一般应被视为“一致的”。
当蛋白质和/或蛋白质子序列(如生物活性片段)天然地或人工地衍生自共同的祖先蛋白质或蛋白质序列时,蛋白质和/或蛋白质子序列(如生物活性片段)是“同源的”。类似地,当核酸和/或核酸序列天然地或人工地衍生自共同的祖先核酸或核酸序列时,核酸和/或核酸序列是同源的。一般从两个或更多个核酸或蛋白质(或其生物活性片段或序列)之间的序列相似性推断同源性。适用于建立同源性的序列之间的精确相似性百分比随在争论中的核酸和蛋白质变化而变化,但25、50、100、150或更多个核酸或氨基酸残基中少到25%的序列相似性常规用于建立同源性。也可以使用更高水平的序列相似性,例如30%、40%、50%、60%、70%、80%、85%、90%、95%、98%或99%来建立同源性。
用于测定同源性或序列相似性百分比的方法(例如使用默认参数的BLASTP和BLASTN)描述于本文中并且一般是可获得的。对于序列比较和同源性测定,典型地一个序列充当与测试序列进行比较的参考序列。本文所提供的表1提供了跨越四种不同类别的DNA聚合酶的同源氨基酸突变的示例性清单,即全长BstDNA聚合酶(SEQIDNO:16)、BstDNA聚合酶的较大片段(SEQIDNO:1)、TaqDNA聚合酶(SEQIDNO:15)以及克列诺(Klenow)片段聚合酶(SEQIDNO:18)。表1提供SEQIDNO:1中可能发生突变的若干氨基酸位置的示例性清单并且鉴别出在所呈现的其它聚合酶(即,同系物)中的任一个中相应的氨基酸位置。举例来说,发现SEQIDNO:1中的氨基酸取代E220K与SEQID16中的E515K、SEQIDNO:18中的E245K以及SEQIDNO:15中的E471K同源。熟练的技术人员将显而易见,可以使用多种公众可获得的比对工具来鉴别跨越聚合酶氨基酸序列的同源氨基酸突变(如氨基酸取代),例如NCBI比对和BLAST工具。一般来说,使用序列比较算法时,将测试及参考序列输入计算机,必要时指定子序列座标,并且指定序列算法程式参数。接着,序列比较算法根据所指定的程式参数来计算测试序列相对于参考序列的序列一致性百分比。可以例如通过Smith&Waterman,《应用数学进展(Adv.Appl.Math.)》2:482(1981)的局部同源算法,通过Needleman&Wunsch,分子生物学杂志《(J.Mol.Biol.)》48:443(1970)的同源性比对算法,通过Pearson&Lipman,《美国国家科学院学报(Proc.Nat'l.Acad.Sci.USA)》85:2444(1988)的相似性方法搜索,通过这些算法(威斯康星遗传学软件包(WisconsinGeneticsSoftwarePackage),遗传学计算机组(GeneticsComputerGroup),575科学博士(ScienceDr.),威斯康星州麦迪逊(Madison,Wis.)中的GAP、BESTFIT、FASTA和TFASTA)的计算机化实施方案,或通过目视检验(一般参见《最新分子生物学实验方法汇编(CurrentProtocolsinMolecularBiology)》,Ausubel等人编,实验室指南(CurrentProtocols),格林出版联合公司与约翰·威利父子公司之间的合资企业(GreenePublishingAssociates,Inc.andJohnWiley&Sons,Inc.),2004年增补)来进行序列的最佳比对以便比较。适用于测定序列一致性百分比和序列相似性的算法的一个实例是BLAST算法,其描述于Altschul等人,《分子生物学杂志》215:403-410(1990)中。用于进行BLAST分析的软件通过国家生物技术信息中心(NationalCenterforBiotechnologyInformation)公开可用。此算法涉及通过识别查询序列中的长度“W”的短字来首先识别高评分序列对(HSP),所述短字当与数据库序列中相同长度的字比对时匹配或满足某些正值阈值分数“T”。“T”称为邻近字分数阈值(Altschul等人,前述)。这些初始邻近字命中点充当开始检索以找到含有其的更长HSP的种子。接着,字命中点沿各序列在两个方向上延伸,只要累积比对分数可以增加即可。对于核苷酸序列来说,累积分数使用参数“M”(一对匹配残基的奖励分数;始终>0)及“N”(失配残基的罚分;始终<0)计算。对于氨基酸序列,使用计分矩阵计算累积分数。当累积比对分数从其达到的最大值降低量X;累积分数因一次或多次负分残基比对的累积而变成0或低于0;或到达任一序列的末端时,中断字命中点在各方向上的延伸。BLAST算法参数“W”、“T”和“X”确定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字长(W)11、预期(E)10、截止值100、M=5、N=-4以及两条链的比较作为默认值。对于氨基酸序列来说,BLASTP程序使用字长(W)3、预期(E)10以及BLOSUM62计分矩阵(参见Henikoff&Henikoff(1989)《美国国家科学院学报(Proc.Natl.Acad.Sci.USA)》89:10915)作为默认值。
除计算序列一致性百分比以外,BLAST算法也进行两个序列之间的相似性统计分析(参见例如Karlin&Altschul,《美国国家科学院学报》90:5873-5787(1993))。由BLAST算法提供的一种相似性度量为最小总和机率(P(N)),其提供两个核苷酸或氨基酸序列之间随机出现匹配的机率的指示。举例来说,如果测试核酸与参考核酸比较的最小和概率小于约0.1、小于约0.01或小于约0.001,那么认为核酸与参考序列相似。
如本文所使用,当参考给定聚合酶使用术语“引物延伸活性”和其变化形式时,其包含涉及催化核苷酸掺入到延伸核酸分子的末端3'OH端上的给定聚合酶的任何体内或体外酶活性特征。典型地但未必,此类核苷酸掺入以模板依赖性方式进行。在一些实施例中,给定聚合酶的引物延伸活性可以定量为在一组具体反应条件下每单位时间(秒)通过单位量聚合酶(以摩尔计)掺入的核苷酸的总数目(如通过例如辐射测量或其它适合分析所测量)。
如本文所使用,当参考给定聚合酶使用术语“DNA结合活性”和其变化形式时,其包含涉及以基于识别的方式聚合酶与DNA序列相互作用的给定聚合酶的任何体内或体外酶活性特征。典型地但未必,此类相互作用包括聚合酶结合,并且更尤其聚合酶的DNA结合域与识别的DNA序列的结合。在一些实施例中,识别包括聚合酶与序列特异性或非序列特异性DNA序列的结合。在一些实施例中,给定聚合酶的DNA结合活性可以定量为聚合酶识别并且结合到所识别的DNA序列的亲和性。举例来说,当在一组具体反应条件下形成蛋白质-DNA复合物时,可以使用各向异性信号变化(或其它适合的分析)来监测并且测定DNA结合活性。
如本文所使用,当参考给定生物分子使用术语“生物活性片段”和其变化形式时,其是指具有生物分子自身特有的体内或体外活性的生物分子的任何片段、衍生物、同系物或类似物。举例来说,聚合酶可以通过各种生物活性来表征,所述生物活性例如DNA结合活性、核苷酸聚合活性、引物延伸活性、链置换活性、逆转录酶活性、切口引发聚合酶活性、3'-5'核酸外切酶(校正)活性等。在一些实施例中,聚合酶的“生物活性片段”是可以催化核苷酸(包括其同源物和类似物)聚合成核酸链的聚合酶的任何片段、衍生物、同系物或类似物。在一些实施例中,聚合酶的生物活性片段、衍生物、同系物或类似物在任何相关体内或体外分析中具有聚合酶的10%、20%、30%、40%、50%、60%、70%、75%、80%、85%或90%或更大的生物活性,所述分析如DNA结合分析、核苷酸聚合分析(其可以是模板依赖性或模板非依赖性的)、引物延伸分析、链置换分析、逆转录酶分析、校正分析等。在一些实施例中,可以通过在限定的反应条件下测量片段的体外引物延伸活性来分析聚合酶片段的生物活性。在一些实施例中,可以通过在限定的反应条件下测量片段的体外聚合活性来分析聚合酶片段的生物活性。在一些实施例中,可以通过在限定的反应条件下测量片段的体外DNA结合活性来分析聚合酶片段的生物活性。在一些实施例中,可以通过在限定的反应条件下测量片段的体外链置换活性来分析聚合酶片段的生物活性。在一些实施例中,可以通过在限定的反应条件下测量片段的体外逆转录酶活性来分析聚合酶片段的生物活性。在一些实施例中,可以通过在限定的反应条件下测量片段的体外切口引发聚合酶活性来分析聚合酶片段的生物活性。在一些实施例中,可以通过在限定的反应条件下测量片段的体外校正活性来分析聚合酶片段的生物活性。在一些实施例中,聚合酶的生物活性片段可以包括测量本文中所概述的聚合酶生物活性中的任何一种或多种的生物活性。
在一些实施例中,生物活性片段可以包括经修饰的聚合酶的DNA结合域的任何部分或催化域的任何部分。在一些实施例中,生物活性片段可以任选地包括DNA结合域或催化域的任何25、50、75、100、150或更多个连续氨基酸残基。在一些实施例中,经修饰的聚合酶的生物活性片段可以包括与本发明所涵盖的聚合酶中的任何一个或多个具有至少80%、85%、90%、95%、98%或99%一致性的催化域或DNA结合域的至少25个连续氨基酸残基。在一些实施例中,经修饰的聚合酶的生物活性片段可以包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37中的任何一个或多个具有至少80%、85%、90%、95%、98%或99%一致性的催化域或DNA结合域的至少25个连续氨基酸残基。
生物活性片段可以任选地在体内存在,如由转录后加工产生或由选择性剪接的RNA的转译产生或替代地可以经由工程化、总合成或其它适合的操作产生的片段。生物活性片段包括在天然或内源细胞中表达的片段以及在表达系统中如在细菌、酵母、昆虫或哺乳动物细胞中制得的那些片段。
在一些实施例中,本发明大体上不仅涉及本文所公开的特定聚合酶,还涉及涵盖在本发明的范围内的此类聚合酶的任何生物活性片段。在一些实施例中,本发明的任何聚合酶的生物活性片段包括展现体外引物延伸活性的任何片段。
在一些实施例中,本发明大体上不仅涉及本文所公开的特定聚合酶,还涉及涵盖在本发明的范围内的此类聚合酶的任何生物活性片段。在一些实施例中,本发明的任何聚合酶的生物活性片段包括展现体外DNA结合活性的任何片段。
在一些实施例中,本发明大体上不仅涉及本文所公开的特定聚合酶,还涉及涵盖在本发明的范围内的此类聚合酶的任何生物活性片段。在一些实施例中,本发明的任何聚合酶的生物活性片段包括保留体外聚合酶活性的任何片段。可以通过领域中已知的任何方法测定聚合酶活性。举例来说,聚合酶活性的测定可以基于在模板上延伸引物的活性。
在一些实施例中,本发明大体上涉及相对于不具有一个或多个氨基酸突变的参考聚合酶具有一个或多个氨基酸突变(如缺失、取代或添加)的经修饰的聚合酶,并且其中经修饰的聚合酶保留体外聚合酶活性,展现体外DNA结合活性或展现体外引物延伸活性。在一些实施例中,经修饰的聚合酶包括保留体外聚合酶活性、展现体外DNA结合活性或展现体外引物延伸活性的此类聚合酶的任何生物活性片段。
在一些实施例中,本发明大体上涉及相对于不具有一个或多个氨基酸突变的参考聚合酶具有一个或多个氨基酸突变(如缺失、取代或添加)的经修饰的聚合酶,并且其中经修饰的聚合酶保留体外校正活性。在一些实施例中,本发明大体上涉及相对于不具有一个或多个氨基酸突变的参考聚合酶具有一个或多个氨基酸突变(如缺失、取代或添加)的经修饰的聚合酶,并且其中经修饰的聚合酶保留体外校正活性,展现体外切口引发聚合酶活性或体外逆转录酶活性。在一些实施例中,经修饰的聚合酶包括保留体外校正活性、展现体外切口引发聚合酶活性或展现体外逆转录酶活性的此类聚合酶的任何生物活性片段。判定聚合酶是否展现活性核酸外切酶或展现降低的核酸外切酶活性可以通过标准方法容易地测定。举例来说,可以合成聚核苷酸以使得放射性标记可检测比例的核苷酸。这些聚核苷酸可以在适当的缓冲液中在待测试多肽存在下培育。培育后,聚核苷酸沉淀并且由于上清液中的游离核苷酸,核酸外切酶活性可检测为放射性计数。如所属领域的技术人员将了解,基于上述生物活性中的任一个或其组合,取决于相关应用,适当的聚合酶或生物活性片段可以选自本文所描述的那些。
如本文所使用,术语“核苷酸”和其变化形式包含可以与聚合酶选择性结合或可以通过聚合酶聚合的任何化合物。典型地但未必,核苷酸与聚合酶的选择性结合后面是核苷酸通过聚合酶聚合成核酸链;然而偶尔,核苷酸可以从聚合酶解离而不变得掺入到核酸链中,这是在本文中被称为“非生产性”事件的事件。此类核苷酸不仅包括天然存在的核苷酸而且包括可以与聚合酶选择性结合或可以通过聚合酶聚合的任何类似物(与其结构无关)。虽然天然存在的核苷酸典型地包含碱基、糖和磷酸酯部分,但本发明的核苷酸可以包括不具有此类部分中的任一者、一些或全部的化合物。在一些实施例中,核苷酸可以任选地包括包含三个、四个、五个、六个、七个、八个、九个、十个或更多个磷原子的磷原子链。在一些实施例中,磷链可以连接到糖环的任何碳,如5'碳。磷链可以用介入O或S连接到糖。在一个实施例中,链中的一个或多个磷原子可以是具有P和O的磷酸酯基的一部分。在另一个实施例中,链中的磷原子可以用介入O、NH、S、亚甲基、经取代的亚甲基、亚乙基、经取代的亚乙基、CNH2、C(O)、C(CH2)、CH2CH2或C(OH)CH2R(其中R可以是4-吡啶或1-咪唑)连接在一起。在一个实施例中,链中的磷原子可以具有含O、BH3或S的侧基。在磷链中,磷原子与除O外的侧基一起可以是经取代的磷酸酯基。核苷酸类似物的一些实例描述于Xu的美国专利第7,405,281号中。在一些实施例中,核苷酸包含标记(例如报告子部分)并且在本文中被称为“经标记的核苷酸”;经标记的核苷酸的标记在本文中被称为“核苷酸标记”。在一些实施例中,标记可以呈连接到末端磷酸酯基(即,距糖最远端的磷酸酯基或替代磷酸酯基)的荧光染料形式。可以用于所公开的方法和组合物中的核苷酸的一些实例包括(但不限于)核糖核苷酸、脱氧核糖核苷酸、经修饰的核糖核苷酸、经修饰的脱氧核糖核苷酸、核糖核苷酸聚磷酸酯、脱氧核糖核苷酸聚磷酸酯、经修饰的核糖核苷酸聚磷酸酯、经修饰的脱氧核糖核苷酸聚磷酸酯、肽核苷酸、金属核苷酸、膦酸酯核苷和经修饰的磷酸酯-糖主链核苷酸,前述化合物的类似物、衍生物或变化形式等。在一些实施例中,核苷酸可以包含非氧部分(如硫基或硼烷部分)代替氧部分,所述氧部分桥连核苷酸的α磷酸酯与糖、或核苷酸的α与β磷酸酯、或核苷酸的β与γ磷酸酯、或核苷酸的任何其它两种磷酸酯之间、或其任何组合。
如本文所使用,术语“核苷酸掺入”和其变化形式包含使一个或多个核苷酸聚合以形成核酸链,所述核酸链包括至少两个典型地但未必经由磷酸二酯键彼此连接的核苷酸,但在特定核苷酸类似物的情况下替代性键可以是可能的。
如本文所使用,术语“持续合成能力”和其变化形式包含聚合酶保留结合到单一引物/模板杂交体的能力。在一些实施例中,可以通过在聚合酶从引物/模板杂交体解离之前聚合酶掺入核酸(如测序引物)中的核苷酸数目来测量持续合成能力。在一些实施例中,聚合酶具有至少100个核苷酸的持续合成能力,但在其它实施例中,其可以包括至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸或更多个的持续合成能力。所属领域的技术人员应理解,聚合酶的持续合成能力越高,在解离之前可以掺入的核苷酸越多,并且因此可以获得的序列(阅读-长度)越长。换句话说,具有较低持续合成能力的聚合酶将典型地提供与具有更高持续合成能力的聚合酶相比更短的平均阅读-长度。在一个实施例中,含有一个或多个氨基酸突变的本发明的聚合酶可以与不具有一个或多个氨基酸突变的亲本聚合酶相比具有增强的持续合成能力。
在一个示例性分析中,给定聚合酶的持续合成能力可以通过在核苷酸掺入条件下用引物:模板双螺旋体培育聚合酶并且使用任何适合的方法,例如经由凝胶电泳分解所得引物延伸产物来测量。引物可以任选地包括标记以增强引物延伸产物的检测能力。核苷酸掺入反应混合物典型地包括大量过量的未标记的竞争模板,从而确保几乎所有延伸产物经由单一模板结合作用产生。在此类分解之后,平均量的全长延伸产物可以使用任何适合的手段,包括全长延伸产物的荧光或辐射测量的检测来进行定量。为了比较两种或更多种不同酶(例如参考和经修饰的聚合酶)的持续合成能力,可以在平行和单独反应中采用各种酶,之后可以分解和测量所得全长引物延伸产物,并且比较此类测量值。
在其它示例性实施例中,给定聚合酶的持续合成能力可以使用所属领域中已知的任何适合的分析测量,所述分析包括(但不限于)VonHippel,P.H.,Faireld,F.R.和Dolejsi,M.K.,关于聚合酶的持续合成能力(Ontheprocessivityofpolymerases),《纽约科学院年报(Ann.NYAcad.Sci.)》,726:118-131(1994);Bambara,R.A.,Uyemura,D.和Choi,T.,关于大肠杆菌DNA聚合酶I的进行机制.持续合成能力的定量评估(OntheprocessivemechanismofEscherichiacoliDNApolymeraseI.Quantitativeassessmentofprocessivity),《生物化学杂志(J.Biol.Chem.)》,253:413-423(1978);Das,S.K.和Fujimura,R.K.,DNA聚合酶的进行性.使用简单程序的比较性研究(ProcessivenessofDNApolymerases.Acomparativestudyusingasimpleprocedure),《生物化学杂志》,254:1227-1232(1979);Nasir,M.S.和Jolley,M.E.,荧光偏振:用于免疫分析和药物发现、组合化学过程和高产量筛选的分析型工具(Fluorescencepolarization:AnAnalyticalToolforImmunoassayandDrugDiscovery,CombinationalChemistryandHighThroughputScreening),2:177-190(1999);Mestas,S.P.,Sholders,A.J.,和Peersen,O.B.,用于核酸聚合酶延长活性的基于荧光偏振的筛选分析(AFluorescencePolarizationBasedScreeningAssayforNucleicAcidPolymeraseElongationActivity),《分析生物化学》,365:194-200(2007);Nikiforov,T.T.,基于用单一荧光团标记的DNA底物的荧光聚合酶、核酸内切酶和连接酶分析(Fluorogenicpolymerase,endonuclease,andligaseassaysbasedonDNAsubstrateslabledwithasinglefluorophore),《分析生物化学(AnalyticalBiochemistry)》412:229-236;以及YanWang,DennisE.Prosen,LiMei,JohnC.Sullivan,MichaelFinney和PeterB.VanderHorn,《核酸研究(NucleicAcidsResearch)》,32(3):1197-1207(2004)中所描述的分析。
如本文所使用,术语“阅读长度”或“阅读-长度”和其变化形式是指以模板依赖性方式在从模板核酸链解离之前通过聚合酶聚合(或掺入到现有核酸链中)的核苷酸数目。在一些实施例中,五次掺入之后从模板核酸链解离的聚合酶将典型地提供具有5个核苷酸的阅读长度的序列,而500个核苷酸掺入之后从模板核酸链解离的聚合酶将典型地提供具有约500个核苷酸的阅读长度的序列。虽然给定聚合酶的实际或绝对持续合成能力(或聚合酶所产生的聚合产物的实际阅读长度)可以因反应不同而不同(或甚至在单一反应混合物内,其中聚合酶产生具有不同阅读长度的不同产物),但聚合酶可以通过在一组限定的反应条件下观测到的平均持续合成能力(或聚合产物的平均阅读长度)来表征。“无误差阅读长度”包含在无误差(即,无失配和/或与确定和可预测组的碱基配对规则有偏差)的情况下相继并且连续地掺入到新合成的核酸链中的核苷酸的数目。
如本文所使用,术语“系统误差”或“SE”和其变化形式是指含有限定长度的均聚物(HP)的序列基元中误差的百分比,其中系统缺失以指定最小频率在链上出现并且具有指定最小频率的测序覆盖度。举例来说,在一些实施例中,系统误差可以测量为含有长度1-6的均聚物的序列基元中的误差的百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率出现在链上。在一些实施例中,系统误差估算为含有长度1-6的均聚物的序列基元中的随机误差的百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率出现在链上;此类实施例是本文所公开的若干工作实例的焦点。在一些实施例中,当使用如本文所公开的经修饰的聚合酶时,与不含有一个或多个氨基酸修饰的参考聚合酶(例如野生型聚合酶)相比,系统误差百分比降低。虽然给定聚合酶的实际系统误差可以因反应不同而不同(或甚至在单一反应混合物内),但聚合酶可以通过在一组限定的反应条件下观测到的系统误差百分比来表征。在一些实施例中,与不具有一个或多个氨基酸修饰的相应的参考聚合酶相比,本申请的经修饰的聚合酶具有降低的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于3%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于1%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.9%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.8%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.7%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.6%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.5%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.4%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.3%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.2%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.1%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.09%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.08%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.05%的系统误差百分比。在一些实施例中,如本文所公开的经修饰的聚合酶含有小于0.04%的系统误差百分比。
如本文所使用,术语“链偏差”是指测序操作中的目标碱基百分比,其中来自一条链(例如正链)的阅读(基因分型)与从另一条(例如负)链推断的阅读(基因分型)不同。给定目标碱基的覆盖度通过计数在比对中映射到其的阅读碱基的数目来计算。平均覆盖度通过跨越目标中的每个碱基取此值的平均值来计算。接着特定碱基的相对覆盖度计算为这些值的比率。1的相对覆盖度指示特定碱基以预期平均比率覆盖。大于1的相对覆盖度指示高于预期覆盖度并且小于1指示低于预期覆盖度。一般来说,不明确的映射的机率随着读数变得更小或更不精确而提高。对于从重复或低复杂性区域的基因组(包括具有极端GC含量的一些区域)导出的读数,不明确的映射也更有可能。在一些实施例中,与不含有相应的一个或多个氨基酸修饰的参考聚合酶(例如野生型聚合酶)相比,当使用如本文所公开的经修饰的聚合酶时,链偏差百分比降低。在一些实施例中,本申请的经修饰的聚合酶具有与相应的未经修饰的聚合酶相比减少的链偏差。虽然给定聚合酶的实际链偏差可以因反应不同而不同(或甚至在单一反应混合物内),但聚合酶可以通过在一组限定的反应条件下观测到的不具有链偏差的目标碱基百分比来表征。在一些实施例中,如本文所公开的经修饰的聚合酶包含高于25%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约30%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约40%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约45%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约50%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约60%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约70%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约75%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约80%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经修饰的聚合酶包含约85%的无链偏差的目标碱基百分比。相反地,在一些实施例中,如本文所公开的经修饰的聚合酶可以包括约15%的具有链偏差的目标碱基百分比。在另一个实施例中,如本文所公开的经修饰的聚合酶可以包括约20%、25%、30%、35%、40%、45%或50%的具有链偏差的目标碱基百分比。
术语“信噪比”或“SNR”是指信号功率与噪声功率的比率。一般来说,SNR是一种测量与背景噪声水平相比的所需信号的方法。在一些实施例中,“信噪比”可以指在测序操作期间获得的信号功率与相同测序操作的背景噪声相比的比率。在一些实施例中,本申请公开提供提高信噪比的手段的方法、套组、设备以及组合物。在一些实施例中,本发明大体上涉及一种用于进行核酸测序的方法,其包含在一种或多种核苷酸存在下使经修饰的聚合酶与核酸模板接触,其中经修饰的聚合酶包括一种或多种相对于参考聚合酶的氨基酸修饰并且相对于不具有一个或多个氨基酸突变的参考聚合酶具有提高的信噪比,以及使用经修饰的聚合酶使一种或多种核苷酸中的至少一种聚合。
在一些实施例中,本发明大体上涉及包含通过与其未经修饰的对应物(例如参考聚合酶)相比提高的持续合成能力、阅读长度(包括无误差阅读长度)、总测序通量和/或准确度表征的经修饰的聚合酶的组合物、方法、系统、设备以及套组;以及涉及用于在广泛范围的生物和化学反应(如核苷酸聚合、引物延伸、核酸库产生和核酸测序反应)中制得和使用此类经修饰的聚合酶的方法。在一些实施例中,本发明大体上涉及包含通过与其未经修饰的对应物(例如参考聚合酶)相比减少的链偏差和/或系统误差表征的经修饰的聚合酶的组合物、方法、系统、设备以及套组;以及涉及用于在广泛范围的生物和化学反应(如核苷酸聚合、引物延伸、核酸库产生和核酸测序反应)中制得和使用此类经修饰的聚合酶的方法。在一些实施例中,经修饰的聚合酶包括相对于其相应未经修饰的对应物的一个或多个氨基酸突变(例如氨基酸取代、添加或缺失)。在一些实施例中,如本文所使用的术语准确度可以通过测定与在聚合期间不正确核苷酸的掺入速率相比在聚合期间正确核苷酸的掺入速率来测量。在一些实施例中,在与标准(较低)盐条件相比提高的盐条件(较高离子强度溶液)下,不正确核苷酸的掺入速率可以大于0.3、0.4、0.5、0.6、0.7秒或更久。虽然不希望受任何特定理论束缚,但申请人已发现,在聚合期间提高的盐的存在使不正确核苷酸掺入速率减慢,从而产生不正确核苷酸的较慢掺入常数。在一些实施例中,本发明的经修饰的聚合酶具有与相对聚合酶相比增强的准确度,任选地经修饰的聚合酶或其生物片段在较高离子强度溶液存在下具有增强的准确度(与相对聚合酶相比)。
在一些实施例中,本发明大体上涉及在较高离子强度溶液存在下保留聚合酶活性的经修饰的聚合酶。在一些实施例中,较高离子强度溶液可以是约120mM到约300mM盐。在一些实施例中,较高离子强度溶液可以是130mM盐。在一些实施例中,较高离子强度溶液可以是至少125mM盐,如KCl和/或NaCl。在一些实施例中,较高离子强度溶液可以是约225mM到约250mM盐。在一些实施例中,盐可以包括钾盐和/或钠盐,如KCl和/或NaCl。所属领域的技术人员将显而易见,可以替代使用各种其它适合的盐或与KCl和/或NaCl组合使用。在一些实施例中,离子强度溶液可以进一步包括硫酸盐。
在一些实施例中,经修饰的聚合酶可以在较高离子强度溶液存在下扩增和/或测序核酸分子。在一些实施例中,在相同条件下,与不具有相同突变(或同源突变)中的一个或多个的参考聚合酶相比,经修饰的聚合酶能够在更大程度上(例如,如通过准确度所测量)在较高离子强度溶液存在下扩增(和/或测序)核酸分子。在一些实施例中,在标准离子强度条件(即,与较高离子强度溶液相比降低的离子强度)下,与不具有突变(或同源突变)中的一个或多个的参考聚合酶相比,经修饰的聚合酶能够以更大能力(例如,如通过准确度所测量)在较高离子强度溶液存在下扩增(和/或测序)核酸分子。
在一些实施例中,本发明大体上涉及可以在与参考聚合酶相比提高的盐条件(超过120mM盐)存在下进行核苷酸聚合或核苷酸掺入的经修饰的聚合酶或其生物活性片段。
在一些实施例中,本发明大体上涉及在与参考聚合酶相比提高的盐条件(超过120mM盐)存在下具有提高的准确度或提高的解离时间常数的经修饰的聚合酶或其生物活性片段。
在一些实施例中,本发明大体上涉及可以在核苷酸聚合期间在与参考聚合酶相比提高的盐条件(超过120mM盐)存在下检测到离子浓度变化的经修饰的聚合酶或其生物片段。
在一些实施例中,本发明大体上涉及可以在提高的盐条件(超过120mM盐)存在下扩增或测序核酸分子的经修饰的聚合酶或其生物活性片段。
在一些实施例中,本发明大体上涉及与参考聚合酶相比具有提高的准确度的经修饰的聚合酶或其生物活性片段。
在一些实施例中,本发明大体上涉及包含在核苷酸聚合反应中使用此类经修饰的聚合酶的方法、组合物、系统以及套组,所述反应包括核苷酸聚合反应,其中序列信息获自核酸分子。在一些实施例中,本发明大体上涉及包含在包括核酸库合成的克隆扩增反应中使用此类经修饰的聚合酶的方法、组合物、系统以及套组。在一些实施例中,本发明涉及在基于离子的核酸测序反应中使用此类经修饰的聚合酶的方法,其中使用基于离子的测序系统从模板核酸获得序列信息。在一些实施例中,本发明大体上涉及使用电子传感器的大规模阵列,例如场效应晶体管(“FET”)进行多种无标记DNA测序反应(例如基于离子的测序反应)的组合物、方法、系统、套组以及设备。
在一些实施例中,本发明涉及在测序反应中的核酸扩增期间使用此类经修饰的聚合酶的方法,其中使用基于固体载体的测序系统(例如基于桥式PCR的测序)从核酸扩增获得序列信息。在一些实施例中,本发明大体上涉及使用固体载体系统扩增一个或多个核酸,从而在固体载体上克隆扩增核酸的方法。
在一些实施例中,本发明大体上涉及包含相对于参考聚合酶(其中参考聚合酶不包括至少一个修饰)包括至少一种氨基酸修饰(例如氨基酸取代、添加、缺失、或化学修饰)的经修饰的聚合酶的组合物(以及使用此类组合物的相关方法、系统、套组以及设备),其中经修饰的聚合酶任选地通过相对于参考聚合酶以下特性中的任何一个或多个的变化(例如提高或减少)来表征:解离时间常数、聚合酶从给定核酸模板解离的速率(在本文中也称为“解离速率”)、聚合酶对给定核酸模板的结合亲和性、平均阅读长度、最小阅读长度、准确度、链偏差、原始阅读准确度、系统误差、总测序通量、盐中的性能(即,离子强度)、AQ20、平均无误差阅读长度、100Q17值、200Q17值以及持续合成能力。
如本文所使用,当参考给定聚合酶使用术语“Q17”或“Q20”和其变化形式时,其是指聚合酶性能的某些方面,尤其给定聚合酶反应中,例如基于聚合酶的合成测序反应中的准确度。举例来说,在特定测序反应中,可以经由预测算法或经由与已知参考基因组的实际比对来计算准确度度量值。预测的质量分数(“Q”分数)可以从查看输入信号的固有特性的算法导出并且关于测序“阅读”中所包括的给定单一碱基是否将比对获得极其精确的估计值。在一些实施例中,此类预测的质量分数可以适用于在下游比对之前过滤并且去除较低质量读数。在一些实施例中,可以依据测量对数尺度上的准确度的类似Phred的Q分数报导准确度以使得:Q10=90%、Q17=98%、Q20=99%、Q30=99.9%、Q40=99.99%以及Q50=99.999%。Phred质量分数(“Q”)定义为与碱基判读误差概率(“P”)对数相关的特性。通常针对计算“Q”给出的式是Q=10×log10(1/误差率)。在一些实施例中,可以过滤获自给定聚合酶反应的数据以仅仅测量聚合酶读数,其测量“N”个核苷酸或更长核苷酸并且具有超过一定阈值的Q分数,例如Q10、Q17、Q100(在本文中被称作“NQ17”分数)。举例来说,100Q20分数可以指示获自给定反应的阅读数目,其长度为至少100个核苷酸并且Q分数为Q20(99%)或更大。类似地,200Q20分数可以指示长度为至少200个核苷酸并且Q分数为Q20(99%)或更大的阅读数目。
在一些实施例中,也可以基于使用参考基因组序列的恰当比对计算准确度,在本文中被称作“原始”准确度。与测量作为与多个读数结果的共同序列的误差率的共同准确度相反,这是涉及测量与单一读数相关的“真实”每个碱基误差的单向准确度。原始准确度测量值可以依据“AQ”分数(针对比对质量)报导。在一些实施例中,可以过滤获自给定聚合酶反应的数据以仅仅测量聚合酶读数,其测量“N”个核苷酸或更长核苷酸,具有超过一定阈值的AQ分数,例如AQ10、AQ17、AQ100(在本文中被称作“NAQ17”分数)。举例来说,100AQ20分数可以指示获自给定聚合酶反应的阅读数目,其长度为至少100个核苷酸并且AQ分数为AQ20(99%)或更大。类似地,200AQ20分数可以指示长度为至少200个核苷酸并且AQ分数为AQ20(99%)或更大的阅读数目。
在一些实施例中,聚合酶的准确度(包括例如给定测序反应中的准确度)可以依据获自聚合酶反应的“完美”(即,零误差)阅读总数测量,其长度大于100、200、300、400、500、750、1000、5000、10000、100000或更多个核苷酸。
在一些实施例中,聚合酶的准确度可以依据获自聚合酶反应的最长完美阅读测量(典型地就阅读中所包括的核苷酸数目来说测量)。
在一些实施例中,聚合酶的准确度可以依据给定测序反应中所获得的测序通量的倍数增加测量。举例来说,在一些实施例中,本申请的示例性经修饰的聚合酶可以具有与参考聚合酶相比2倍、5倍、10倍、20倍、50倍、75倍、100倍、150倍、200倍、400倍、500倍或更多倍的准确度的提高的准确度。
准确度度量的一些示例性非限制性描述可以见于:EwingB,HillierL,WendlMC,GreenP.(1998):使用phred的自动化测序仪迹线的碱基判读(Base-callingofautomatedsequencertracesusingphred).I.准确度评估(Accuracyassessment).《基因组研究(GenomeRes.)》8(3):175-185;EwingB,GreenP.(1998):使用phred的自动化测序仪迹线的碱基判读.II.误差概率(Errorprobabilities).《基因组研究》8(3):186-194;DearS,StadenR(1992):DNA测序仪器的数据的标准文件格式(AstandardfileformatfordatafromDNAsequencinginstruments).《DNA序列(DNASequence)》,3,107-110;BonfieldJK,StadenR(1995):DNA测序项目的碱基判读准确度的数值估计值的应用(TheapplicationofnumericalestimatesofbasecallingaccuracytoDNAsequencingprojects).《核酸研究》1995年4月25日;23(8):1406-10,其全部内容以引用的方式并入本文中。
在一些实施例中,可以在基于离子的测序反应操作中测量给定组聚合酶(包括本文所描述的参考或经修饰的聚合酶中的任一种)的测序准确度;此类准确度可以任选地彼此比较以判定给定氨基酸突变是否相对于参考或未经修饰的聚合酶而提高或降低测序准确度。在一些实施例中,一种或多种聚合酶的测序准确度可以使用离子激流技术供应的基于任何离子的测序设备测量(离子激流系统(IonTorrentSystems),生命技术,卡尔斯巴德(Carlsbad),加利福尼亚州),包括例如离子激流PGMTM测序仪(离子激流系统,生命技术,部件号4462917),任选地使用离子激流系统提供的测序方案和试剂。使用此类基于离子的测序系统计算给定聚合酶的准确度度量值的一些实例进一步描述于标题为“离子激流:离子个人基因组MachineTM性能综述,性能弹簧2011(IonTorrent:IonPersonalGenomeMachineTMPerformanceOverview,PerfomanceSpring2011)”的离子激流应用施加(IonTorrentApplicationNote)中,其以引用的方式并入在此。
如本文所使用,当参考给定聚合酶使用术语“解离速率常数”和“解离时间常数”时,其是指在一组限定的反应条件下聚合酶从核酸模板解离的时间常数(“koff”)。用于测量聚合酶的解离时间常数的一些示例性分析进一步描述于下文中。在一些实施例中,解离时间常数可以反时间,例如sec-1或min-1为单位测量。
在一些实施例中,本发明大体上涉及相对于参考聚合酶包括至少一种氨基酸修饰并且相对于使用参考聚合酶获得的引物延伸产物的平均阅读长度,提供使用经修饰的聚合酶的引物延伸反应中引物延伸产物的增加的平均阅读长度的分离的经修饰的聚合酶。在一些实施例中,相对于使用参考聚合酶获得的引物延伸产物的平均无误差阅读长度,分离的经修饰的聚合酶提供使用经修饰的聚合酶的引物延伸反应中引物延伸产物的增加的平均无误差阅读长度。任选地,经修饰的聚合酶包括相对于参考聚合酶的两个或更多个氨基酸取代。
在一些实施例中,引物延伸反应是基于离子的测序反应。
在一些实施例中,相对于使用参考聚合酶获得的100Q17或200Q17值,分离的经修饰的聚合酶提供核酸测序反应(例如在基于离子的测序反应中)中的提高的100Q17或200Q17值。
在一些实施例中,参考聚合酶包括天然存在的或野生型聚合酶。在其它实施例中,参考聚合酶包括与经修饰的聚合酶不同(例如具有与经修饰的聚合酶相比省去的一个或多个氨基酸突变)的天然存在的聚合酶的衍生物、截断、突变体或变异体形式。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法,其包含:在一种或多种核苷酸存在下使经修饰的聚合酶与核酸模板接触;以及使用经修饰的聚合酶使一种或多种核苷酸中的至少一种聚合。聚合任选地进一步包括以模板依赖性方式使至少一种核苷酸聚合。在一些实施例中,相对于不包括一个或多个氨基酸取代的参考聚合酶,经修饰的聚合酶包括一个或多个氨基酸取代。
在一些实施例中,所述方法进一步包括在接触之前、期间或之后使引物与模板杂交。聚合可以包括使用经修饰的聚合酶使至少一种核苷酸聚合到引物的一端上。
在一些实施例中,在能够通过经修饰的聚合酶检测到至少一种核苷酸的聚合的传感器附近进行聚合。
在一些实施例中,所述方法进一步包括使用传感器检测指示通过经修饰的聚合酶进行的一种或多种核苷酸中的至少一种的聚合的信号。
在一些实施例中,经修饰的聚合酶、参考聚合酶或经修饰的聚合酶和参考聚合酶两者是DNA聚合酶。DNA聚合酶可以包括(但不限于)细菌DNA聚合酶、原核DNA聚合酶、真核DNA聚合酶、古细菌DNA聚合酶、病毒DNA聚合酶或噬菌体DNA聚合酶。
在一些实施例中,DNA聚合酶选自由以下组成的群组:A家族DNA聚合酶、B家族DNA聚合酶、混合型聚合酶、未分类的DNA聚合酶和RT家族聚合酶以及其变体和衍生物。
在一些实施例中,DNA聚合酶是A家族DNA聚合酶,其选自由以下组成的群组:PolI型DNA聚合酶,如大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶的克列诺片段、BstDNA聚合酶、TaqDNA聚合酶、铂TaqDNA聚合酶系列、OmniKlenTaqDNA聚合酶系列、KlenTaqDNA聚合酶系列T7DNA聚合酶以及TthDNA聚合酶。在一些实施例中,DNA聚合酶是BstDNA聚合酶。在其它实施例中,DNA聚合酶是大肠杆菌DNA聚合酶I。在一些实施例中,DNA聚合酶是大肠杆菌DNA聚合酶的克列诺片段。在一些实施例中,聚合酶是TaqDNA聚合酶。在一些实施例中,聚合酶是T7DNA聚合酶。
在其它实施例中,DNA聚合酶是B家族DNA聚合酶,其选自由以下组成的群组:Tli聚合酶、Pfu聚合酶、Pfuturbo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Sac聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、Pho聚合酶、ES4聚合酶、VENT聚合酶、DEEPVENT聚合酶、TherminatorTM聚合酶、噬菌体Phi29聚合酶以及噬菌体B103聚合酶。在一些实施例中,聚合酶是KOD聚合酶。在一些实施例中,聚合酶是TherminatorTM聚合酶。在一些实施例中,聚合酶是噬菌体Phi29DNA聚合酶。在一些实施例中,聚合酶是噬菌体B103聚合酶,包括例如以引用的方式并入本文中的美国专利公开案第20110014612号中所公开的变体。
在其它实施例中,DNA聚合酶是混合型聚合酶,其选自由以下组成的群组:EX-Taq聚合酶、LA-Taq聚合酶、扩展聚合酶系列以及Hi-Fi聚合酶。在又其它实施例中,DNA聚合酶是未分类的DNA聚合酶,其选自由以下组成的群组:Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶以及Tfi聚合酶。
在其它实施例中,DNA聚合酶是RT聚合酶,其选自由以下组成的群组:HIV逆转录酶、M-MLV逆转录酶以及AMV逆转录酶。在一些实施例中,聚合酶是HIV逆转录酶或其具有DNA聚合酶活性的片段。
适合的细菌DNA聚合酶包括(但不限于)大肠杆菌DNA聚合酶I、II和III、IV和V;大肠杆菌DNA聚合酶的克列诺片段;粪堆梭菌(Clostridiumstercorarium,Cst)DNA聚合酶、热纤维梭菌(Clostridiumthermocellum,Cth)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus,Bst)DNA聚合酶以及硫磺矿硫化叶菌(Sulfolobussolfataricus,Sso)DNA聚合酶。
适合的真核DNA聚合酶包括(但不限于)DNA聚合酶α、δ、ε、η、ζ、γ、β、σ、λ、μ、ι和κ以及Rev1聚合酶(末端脱氧胞苷酸转移酶)和末端脱氧核苷酸转移酶(TdT)。
适合的病毒和/或噬菌体DNA聚合酶包括(但不限于)T4DNA聚合酶、T5DNA聚合酶、T7DNA聚合酶、Phi-15DNA聚合酶、Phi-29DNA聚合酶(参见例如美国专利第5,198,543号;还不同地称作Φ29聚合酶、phi29聚合酶、phi29聚合酶、Phi29聚合酶以及Phi29聚合酶);Φ15聚合酶(在本文中也被称作Phi-15聚合酶);Φ21聚合酶(Phi-21聚合酶);PZA聚合酶;PZE聚合酶;PRD1聚合酶;Nf聚合酶;M2Y聚合酶;SF5聚合酶;f1DNA聚合酶;Cp-1聚合酶;Cp-5聚合酶;Cp-7聚合酶;PR4聚合酶;PR5聚合酶;PR722聚合酶;L17聚合酶;M13DNA聚合酶;RB69DNA聚合酶;G1聚合酶;GA-1聚合酶;BS32聚合酶;B103聚合酶;获自任何phi-29的聚合酶,如噬菌体或其衍生物等。参见例如1993年2月11日提交的美国专利第5,576204号、2007年8月23日公布的美国专利申请第2007/0196846号。
适合的古细菌DNA聚合酶包括(但不限于)耐热和/或嗜热性DNA聚合酶,如从以下分离的DNA聚合酶:水生栖热菌(Thermusaquaticus,Taq)DNA聚合酶、丝状栖热菌(Thermusfiliformis,Tfi)DNA聚合酶、兹氏热球菌(Thermococcuszilligi,Tzi)DNA聚合酶、嗜热栖热菌(Thermusthermophilus,Tth)DNA聚合酶、黄栖热菌(Thermusflavus,Tfl)DNA聚合酶、沃氏火球菌(Pyrococcuswoesei,Pwo)DNA聚合酶、激烈火球菌(Pyrococcusfuriosus,Pfu)DNA聚合酶以及TurboPfuDNA聚合酶、海滨嗜热球菌(Thermococcuslitoralis,Tli)DNA聚合酶或VentDNA聚合酶、火球菌属物种GB-D聚合酶(“DeepVent”DNA聚合酶,新英格兰生物实验室(NewEnglandBiolabs))、海栖热袍菌(Thermotogamaritima,Tma)DNA聚合酶、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶、鹿儿岛高温球菌(PyrococcusKodakaraensis,KOD)DNA聚合酶、PfxDNA聚合酶、热球菌属物种JDF-3(JDF-3)DNA聚合酶、高氏热球菌(Thermococcusgorgonarius,Tgo)DNA聚合酶、嗜酸热球菌(Thermococcusacidophilium)DNA聚合酶;嗜酸热硫化叶菌DNA聚合酶;热球菌属物种9°N-7DNA聚合酶;热球菌属物种NA1;隐蔽热网菌(Pyrodictiumoccultum)DNA聚合酶;沃氏甲烷球菌(Methanococcusvoltae)DNA聚合酶;热自养甲烷杆菌(Methanococcusthermoautotrophicum)DNA聚合酶;詹氏甲烷球菌(Methanococcusjannaschii)DNA聚合酶;除硫球菌属(Desulfurococcus)菌株TOKDNA聚合酶(D.TokPol);深海火球菌(Pyrococcusabyssi)DNA聚合酶;堀越火球菌(Pyrococcushorikoshii)DNA聚合酶;海岛火球菌(Pyrococcusislandicum)DNA聚合酶;福氏热球菌(Thermococcusfumicolans)DNA聚合酶;敏捷气热菌(Aeropyrumpernix)DNA聚合酶;异二聚体DNA聚合酶DP1/DP2等。
在一些实施例中,经修饰的聚合酶是RNA聚合酶。适合的RNA聚合酶包括(但不限于)T3、T5、T7和SP6RNA聚合酶。
在一些实施例中,聚合酶是逆转录酶。适合的逆转录酶包括(但不限于)来自HIV、HTLV-I、HTLV-II、FeLV、FIV、SIV、AMV、MMTV和MoMuLV的逆转录酶以及市售的“上标”逆转录酶(生命技术公司,卡尔斯巴德,加利福尼亚州)和端粒酶。
在一些实施例中,经修饰的聚合酶衍生自已知DNA聚合酶。基于氨基酸序列比较和三维结构分析两者,DNA聚合酶已被分为七种不同家族。DNA聚合酶I(polI)或类型A聚合酶家族包括修复型聚合酶大肠杆菌DNApolI、水生栖热菌polI以及嗜热脂肪芽孢杆菌polI、来自一些噬菌体(T3、T5和T7)的复制型DNA聚合酶和真核线粒体DNA聚合酶。DNA聚合酶α(polα)或类型B聚合酶家族包括所有真核复制DNA聚合酶以及古细菌DNA聚合酶、病毒DNA聚合酶、在各种真菌和植物的线粒体质粒中经编码的DNA聚合酶以及来自噬菌体T4和RB69的聚合酶。家族C聚合酶是初级细菌染色体复制型酶。这些有时被视为家族Y的子组,其含有真核聚合酶polβ以及其它真核聚合酶,如polσ、polλ、polμ以及末端脱氧核苷酸转移酶(TdT)。家族D聚合酶都可见于古细菌的广古菌子域中并且被认为是复制型聚合酶。家族Y聚合酶由于其经由受损DNA复制的能力而被称为跨损伤合成(TLS)聚合酶。其也称为易错聚合酶,因为其在未受损模板上具有较低保真度。此家族包括Polη、Polζ、Polι(iota)、Polκ(kappa)和Rev1以及来自大肠杆菌的PolIV和PolV。最终,逆转录酶家族包括来自逆转录病毒和真核聚合酶的逆转录酶,通常限于端粒酶。这些聚合酶使用RNA模板来合成DNA链,并且也称为RNA依赖型DNA聚合酶。
在一些实施例中,经修饰的聚合酶或其生物活性片段可以使用所属领域的技术人员已知的任何适合的方法或分析来制备。在一些实施例中,本发明涵盖用以获得经修饰的聚合酶或其生物活性片段的蛋白质工程化的任何适合的方法。举例来说,定点突变诱发是可以用于在DNA构筑体内引入一种或多种已知或随机突变的技术。一个或多个氨基酸突变的引入可以例如相对于标准或参考聚合酶或经由核酸测序来验证。在验证后,含有氨基酸突变中的一种或多种的构筑体可以转化到细菌细胞中并且表达。
典型地,在采集(通常经由离心)和纯化上清液之前,在诱发并且生长到所需光密度的培养基中接种含有突变表达构筑体的菌落。所属领域的技术人员将显而易见,上清液可以通过任何适合的手段纯化。典型地,选择用于分析型或制备型蛋白质纯化的柱。在一些实施例中,使用方法制备的经修饰的聚合酶或其生物活性片段可以(但不限于)主要根据制造商的说明书在肝素柱上纯化。
在纯化后,可以使用针对各种聚合酶活性的任何适合的方法评估经修饰的聚合酶或其生物活性片段。在一些实施例中,将取决于相关应用评估聚合酶活性。举例来说,用于扩增或测序长度为约400bp的核酸分子的聚合酶可以包括如相对于参考聚合酶提高的持续合成能力和/或提高的解离时间常数的聚合酶活性。在另一个实例中,需要长度为约100bp的核酸分子的深度目标重测序的应用可以包括具有提高的校正活性、提高的原始准确度、增加的总测序通量、减少的链偏差、减少的系统误差或增加的最小阅读长度的聚合酶。在一些实施例中,所评估的一种或多种聚合酶活性可能与在较高离子强度溶液(例如较高盐条件)存在下的聚合酶性能或聚合酶活性相关。
在一些实施例中,可以评估根据所述方法制备的经修饰的聚合酶或其生物活性片段的DNA结合活性、核苷酸聚合活性、引物延伸活性、链置换活性、逆转录酶活性、3'-5'核酸外切酶(校正)活性等。
在一些实施例中,可以评估根据所述方法制备的经修饰的聚合酶或其生物活性片段与参考聚合酶相比提高的准确度、提高的持续合成能力、增加的平均阅读长度、增加的最小阅读长度、增加的总测序通量、减少的链偏差、减少的系统误差、提高的AQ20、提高的200Q17值或进行核苷酸聚合的能力。在一些实施例中,可以评估经修饰的聚合酶或其生物活性片段在较高离子强度溶液存在下的聚合酶活性中的任一种。
在一些实施例中,经修饰的聚合酶或其生物活性片段任选地通过以下特性(通常相对于不具有一个或多个氨基酸突变的聚合酶)中的任何一个或多个的变化(例如提高或减少)来表征:解离时间常数、聚合酶从给定核酸模板解离的速率、聚合酶对给定核酸模板的结合亲和性、平均阅读长度、最小阅读长度、准确度、完美阅读总数、总测序通量、链偏差、系统误差、测序反应通量的倍数增加、盐中的性能(即,离子强度)、AQ20、平均无误差阅读长度、误差率、100Q17值、200Q17值、Q分数、原始阅读准确度以及持续合成能力。
在一些实施例中,可以单独地相对于相似聚合酶的所属领域中的已知值来评估经修饰的聚合酶或其生物活性片段。在一些实施例中,可以在类似或相同条件下相对于已知或参考聚合酶评估根据所述方法制备的经修饰的聚合酶或其生物活性片段。在一些实施例中,条件可以包括在较高离子强度溶液存在下扩增或测序核酸分子。
在一些实施例中,本发明大体上涉及用于产生多种经修饰的聚合酶或生物活性片段的方法。在一些实施例中,本发明大体上涉及使用高通量或自动化系统产生多种经修饰的聚合酶或生物活性片段的方法。在一些实施例中,所述方法包含将多种经修饰的聚合酶或生物活性片段与一系列蛋白质纯化所需试剂混合并且从混合物中提取经纯化的聚合酶或生物活性片段。在一个实例中,可以在96孔或384孔培养盘中制备多种随机或定点突变诱发反应物。任选地,96孔或384孔培养盘的内含物可以经受初始筛检以鉴别聚合酶突变构筑体。可以将各个别孔的内含物(或来自初始筛检的各孔的内含物)递送到一连串烧瓶、试管或振荡器中以便接种和诱发。在所需光密度下时,可以离心烧瓶、试管或振荡器并且回收上清液。各上清液可以经受蛋白质纯化,例如经由全自动柱纯化(例如参见Camper和Viola,《分析生物化学》,2009,第176-181页)。可以评估经纯化的经修饰的聚合酶或生物活性片段的聚合酶活性中的一个或组合,如DNA结合、引物延伸、链置换、逆转录酶活性等。据设想,所属领域的技术人员可以使用所述方法(或在本发明的范围内的所述方法的变化形式)来鉴别多种经修饰的聚合酶或生物活性片段。在一些方面中,所述方法可以用于鉴别与参考聚合酶相比具有增强的准确度的多种经修饰的聚合酶或生物活性片段。在一些实施例中,所述方法可以用于鉴别在较高离子强度溶液存在下具有增强的准确度的多种经修饰的聚合酶或其生物活性片段。在一些实施例中,较高离子强度溶液可以包括KCl和/或NaCl盐。在一些实施例中,较高离子强度溶液可以是约120到300mM盐。在一些实施例中,较高离子强度溶液可以是约120mM到约200mM盐。在一些实施例中,较高离子强度溶液可以是至少125mM盐。所属领域的技术人员将显而易见,可以替代使用各种其它适合的盐或与KCl和/或NaCl组合使用。在一些实施例中,离子强度溶液可以进一步包括硫酸盐。
如所属领域的技术人员将显而易见,本发明概述用以产生经修饰的聚合酶或生物活性片段库的示例性自动化和高通量方法(和相关设备和系统)。本发明还概述用以评估此类经修饰的聚合酶或生物活性片段的聚合酶活性的方法(和相关套组、组合物、设备以及系统)。本发明也涵盖,所属领域的技术人员可以容易地产生构筑体的诱变处理库,其中可以使相关聚合酶内的每个氨基酸突变。在一些实施例中,可以制备诱变处理库,其中通过每种可能的氨基酸组合使聚合酶内的各个氨基酸突变。在一些实施例中,可以制备诱变处理库,其中使聚合酶内的各个氨基酸突变,并且其中可能的氨基酸突变的组合限于保守性或非保守性氨基酸取代。在两个实例中,可以产生诱变处理库,其含有可以经由纯化或初始筛检的自动化或高通量系统应用的大量突变构筑体。在一些实施例中,可以使用On-PGM聚合酶筛检,使用个人基因组机器和离子PGM测序芯片(生命技术公司,加利福尼亚州)来评估具有代表诱变处理库的96或384库构筑体的培养盘的一种或多种聚合酶活性。在一个实例中,On-PGM聚合酶筛检可以包括一种或多种代表诱变处理库的96或384培养盘;其中培养盘的各孔由与相同培养盘上至少一个孔中的参考聚合酶(不具有至少一个或多个氨基酸突变)相比含有至少一个或更多个氨基酸突变不同构筑体(经修饰的聚合酶)组成。在一些实施例中,参考聚合酶充当96或384培养盘内的对照样品以评估培养盘的孔内的各种经修饰的聚合酶的聚合酶活性。在一些实施例中,培养盘内的构筑体库和参考聚合酶可以进一步包括培养盘内各种经修饰的聚合酶的独特条码。因此,如果培养盘内的各孔含有参考聚合酶或经修饰的聚合酶构筑体,那么96孔培养盘可以含有96个条码。在纯化后,可以评估蛋白质的诱变处理库的聚合酶活性中的一个或组合,如DNA结合、引物延伸、链置换、逆转录酶、切口引发聚合酶活性、原始准确度、增加的总测序通量、减少的链偏差、减少的系统误差、阅读长度等。在一些实施例中,所述库可以进一步包括已知在所提出的扩增条件下表现良好的模板库,以使得良好表现的模板库可以充当基线或对照阅读。
任选地,可以进一步评估经纯化的经修饰的聚合酶或其生物活性片段的其它特性,如在较高盐(离子强度)存在下扩增或测序核酸分子的能力。一般不认为待突变的聚合酶的来源或起源是关键的。举例来说,所述方法中可以使用真核、原核、古细菌、细菌、噬菌体或病毒聚合酶。在一些实施例中,聚合酶可以是DNA或RNA聚合酶。在一些实施例中,DNA聚合酶可以包括家族A或家族BDNA聚合酶。考虑到蛋白质工程化和酶学(enzymatics)的领域,本文所提供的示例性方法应为说明性的,并且不应以任何方式解释为限制性的。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括位于经修饰的聚合酶的催化域内部的一个或多个氨基酸突变。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括催化域的至少25、50、75、100、150或更多个氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括包含至少25、50、75、100、150或更多个连续氨基酸残基的催化域的任何部分。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括催化域的至少25个连续氨基酸残基并且可以任选地包括催化域外部的C端或N端处的一个或多个氨基酸残基。在一些实施例中,经修饰的聚合酶或生物活性片段可以包括耦合到任何一个或多个非催化域氨基酸残基的催化域的任何25、50、75、100、150或更多个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶(或其生物活性片段)包括位于经修饰的聚合酶的催化域内部的一个或多个氨基酸突变,并且其中聚合酶与本文所公开的经修饰的聚合酶中的任一种具有至少80%、85%、90%、95%、96%、97%、98%、99%或更大的一致性。在一些实施例中,经修饰的聚合酶(或其生物活性片段)包括位于经修饰的聚合酶的催化域内部的一个或多个氨基酸突变,并且其中聚合酶与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更大的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少85%的一致性。在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少95%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少98%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少85%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少97%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括催化域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少98%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括位于聚合酶的DNA结合域内部的一个或多个氨基酸突变。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括经修饰的聚合酶的DNA结合域的至少25、50、75、100、150或更多个氨基酸残基。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括包含至少25、50、75、100、150或更多个连续氨基酸残基的DNA结合域的任何部分。在一些实施例中,经修饰的聚合酶或其生物活性片段可以包括结合域的至少25个连续氨基酸残基并且可以任选地包括结合域外部的C端或N端处的一个或多个氨基酸残基。在一些实施例中,经修饰的聚合酶或生物活性片段可以包括耦合到任何一个或多个非结合域氨基酸残基的结合域的任何25、50、75、100、150或更多个连续氨基酸残基。在一些实施例中,经修饰的聚合酶(或其生物活性片段)包括位于经修饰的聚合酶的DNA结合域内部的一个或多个氨基酸突变,并且其中聚合酶与本文所公开的经修饰的聚合酶中的任一种具有至少80%、85%、90%、95%、96%、97%、98%、99%或更大的一致性。在一些实施例中,经修饰的聚合酶(或其生物活性片段)包括位于经修饰的聚合酶的DNA结合域内部的一个或多个氨基酸突变,并且其中聚合酶与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更大的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少85%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28和SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少95%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少98%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少85%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少95%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括DNA结合域的至少50个连续氨基酸残基并且与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少98%的一致性。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括位于聚合酶的催化域(在本文中也被称作DNA结合裂隙)外部的一个或多个氨基酸突变。A家族DNA聚合酶、B家族DNA聚合酶和逆转录酶以及RNA依赖性RNA聚合酶的催化域是熟知的;所有都享有共同的总结构和催化机制。所有这些聚合酶的催化域具有与右手相比的形状并且由“手掌”、“拇指”以及“手指”域组成。手掌域典型地含有用于磷酰基转移反应的催化位点。拇指被认为起定位双螺旋体DNA和持续合成和易位的作用。手指与引入的核苷酸以及与其配对的模板碱基相互作用。手掌域在A、B和RT家族中是同源的,但手指和拇指的布置不同。不同聚合酶家族的拇指域享有共同的特征,含有平行或反平行的α-螺旋,妻子至少一种α-螺旋与引物-模板复合物的小沟相互作用。手指域也保存安置在引物-模板复合物的平头末端处的α-螺旋。此螺旋线含有高度保守性侧链(B基元)。
已针对A家族聚合酶鉴别出三个保守性基元A、B和C。A和C基元在B家族聚合酶和RT聚合酶中典型地都是保守性的。(Delarue等人,《蛋白质工程化(ProteinEngineering)》3:461-467(1990))。
在一些实施例中,对于A家族聚合酶,A基元包含共同序列:
DXSXXE(SEQIDNO:5)。
在一些实施例中,对于A家族聚合酶,B基元包含共同序列:
KXXXXXXYG(SEQIDNO:6)
在一些实施例中,对于A家族聚合酶,C基元包含共同序列:
VHDE(SEQIDNO:7)
在一些实施例中,聚合酶任选地包含任何A家族聚合酶或其生物活性片段、突变体、变异体或截断,其中连接部分连接到位于A、B或C基元外部的A家族聚合酶或其生物活性片段、突变体、变异体或截断的任何氨基酸残基。在一些实施例中,连接部分连接到位于A基元、B基元或C基元外部的A家族聚合酶或生物活性片段的任何氨基酸残基。
A和C基元典型地形成手掌域的一部分,并且各基元典型地含有严格保守性天冬氨酸残基,其涉及所有DNA聚合酶共同的催化机制。DNA合成可以通过将磷酰基从引入的核苷酸转移到DNA的3'OH,释放多磷酸部分并且形成新的DNA磷酸二酯键来介导。此反应典型地通过涉及两种金属离子(通常Mg2+)和两种保守性天冬氨酸残基的机制催化。
在一些实施例中,A家族DNA聚合酶的基元A中的保守性谷氨酸残基在正确核苷酸的掺入方面发挥重要作用,与B家族成员中的相应的保守性酪氨酸一般(Minnick等人,《美国国家科学院学报》99:1194-1199(2002);Parsell等人,《核酸研究》35:3076-3086(2002))。基元A的保守性Leu处的突变影响复制保真度(Venkatesan等人,《生物化学杂志》281:4486-4494(2006))。
在一些实施例中,B基元含有保守性赖氨酸、酪氨酸和甘氨酸残基。已显示,大肠杆菌polI的B基元结合核苷酸底物并且含有已显示于活性位点中的保守性酪氨酸。
在一些实施例中,对于B家族聚合酶,A基元包含共同序列:
DXXSLYPS(SEQIDNO:8)。
在一些实施例中,对于B家族聚合酶,B基元包含共同序列:
KXXXNSXYG(SEQIDNO:9)
在一些实施例中,对于B家族聚合酶,C基元包含共同序列:
YGDTDS(SEQIDNO:10)
粗体的残基指示不变的残基。
在一些实施例中,经修饰的聚合酶任选地包含任何B家族聚合酶或其生物活性片段、突变体、变异体或截断,其中连接部分连接到位于A、B或C基元外部的B家族聚合酶或其生物活性片段、突变体、变异体或截断的任何氨基酸残基。在一些实施例中,连接部分连接到位于A基元、B基元或C基元外部的B家族聚合酶或生物活性片段的任何氨基酸残基。
在一些实施例中,B家族聚合酶含有六个保守性基元,其中区域I和II对应于A家族的A和C基元。区域III涉及核苷酸结合并且在功能上与基元B同源。区域I、II和III在来自手掌(I)、手指(II)和拇指(III)的碱基的活性位点的中心处汇聚以产生连续保守性表面。在这些区域内,一组高度保守性残基形成分别由暴露的芳香族残基、带负电残基以及带正电残基组成的三个化学上不同的群集。举例来说,在细菌噬菌体RB69的复制聚合酶中,这三个群集对应于以下氨基酸残基:Y416、Y567和Y391(暴露的芳香族残基);D621、D623、D411、D684和E686(带负电残基);以及K560、R482和K486(带正电残基)。参见Wang等人,《细胞(Cell)》89:1087-1099(1997)。这三个群集典型地涵盖其中引物末端和引入的核苷酸预期结合的区域。在一些实施例中,经修饰的聚合酶任选地包含任何B家族聚合酶或其生物活性片段、突变体、变异体或截断,其中连接部分连接到位于这些保守性氨基酸群集或基元中的一个或多个外部的B家族聚合酶或其生物活性片段、突变体、变异体或截断的任何氨基酸残基。在一些实施例中,连接部分连接到位于这些保守性氨基酸群集或基元中的任一个外部的B家族聚合酶或其生物活性片段、突变体、变异体或截断的任何氨基酸残基。
RT聚合酶含有四个保守序列基元(Poch等人,《欧洲分子生物学杂志(EMBOJ.)》12:3867-3874(1989)),其中基元A和C含有保守性催化天冬氨酸。对于逆转录酶功能来说,还需要基元B的完整性。
基元A的共同序列是DXXXXF/Y(SEQIDNO:11)
基元B的共同序列是FXGXXXS/A(SEQIDNO:12)
基元C的共同序列是YXDD(SEQIDNO:13)
基元D的共同序列是GXXXXXXXK(SEQIDNO:14)。
YXDD基元(基元C)(这些基元中最高度保守性的)中的突变可以消除聚合酶活性并且改变持续合成能力和保真度(Sharma等人,《抗病毒化学和化学疗法(AntiviralChemistryandChemotherapy)》16:169-182(2005))。另外,基元D中的保守性赖氨酸残基(对于RT聚合酶是唯一的环)是对于核苷酸结合是重要的不变的残基(Canard等人,《生物化学杂志》274:35768-35776(1999))。
在一些实施例中,经修饰的聚合酶任选地包含任何RT聚合酶或其生物活性片段、突变体、变异体或截断,其中连接部分连接到位于A、B、C和D基元中的一个或多个外部的RT聚合酶或其生物活性片段、突变体、变异体或截断的任何氨基酸残基。在一些实施例中,连接部分连接到位于这些基元中的任一个外部的RT聚合酶或其生物活性片段、突变体、变异体或截断的任何氨基酸残基。
在一些实施例中,经修饰的聚合酶包括位于除保守性或不变残基外的任何位置处的一种或多种修饰(包括氨基酸取代、缺失、添加或化学修饰)。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少80%一致性的至少25个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少85%一致性的至少25个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少85%一致性的至少50个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%一致性的至少50个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少90%一致性的至少100个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少95%一致性的至少100个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少95%一致性的至少150个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少98%一致性的至少25个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少98%一致性的至少50个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28以及SEQIDNO:29中的任一个具有至少99%一致性的至少25个连续氨基酸残基。
在一些实施例中,经修饰的聚合酶或其生物活性片段包括与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:16、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37中的任一个具有至少99%一致性的至少50个连续氨基酸残基。
在一些实施例中,除聚合酶域以外,经修饰的聚合酶可以包括一个或多个额外功能域,包括介导新合成的DNA链的校正的3'->5'(反)核酸外切酶活性或介导在DNA修复期间切口平移的5'->3'(前)核酸外切酶活性或FLAP核酸内切酶活性所需的域。在一些实施例中,经修饰的聚合酶具有链置换活性并且可以通过使核苷酸聚合到双链核酸模板内切口的3'端中而同时置换位于切口下游的核酸来催化核酸合成。经修饰的聚合酶任选地同样具有这些活性中的任何一个或多个。
A和B家族DNA聚合酶的3'到5'核酸外切酶校正域都含有三个保守性基元,称为ExoI、ExoII和ExoIII,其中的每一个都含有对于金属结合和核酸外切酶功能来说必需的天冬氨酸残基。这些保守性天冬氨酸残基的改变产生保留聚合酶活性但核酸外切酶活性有缺陷的蛋白质(Hall等人,《普通病毒学杂志(J.Gen.Virol.)》76:2999-3008(1995))。也已鉴别影响核酸外切酶活性的5'到3'核酸外切酶域中的保守性基元和氨基酸改变(美国专利第5,466,591号)。
A家族酶的代表性实例是大肠杆菌PolI或大肠杆菌PolI的克列诺片段、BstDNA聚合酶、TaqDNA聚合酶、T7DNA聚合酶以及TthDNA聚合酶。A家族酶也包括铂TaqDNA聚合酶系列。
在一些实施例中,A家族酶的特征为较高DNA延长率但可以具有较差保真度,因为不具有3'-5'核酸外切酶活性。在一些实施例中,B家族酶由于其3'-5'核酸外切酶活性可以具有高保真度,但可以实现较低DNA延长率。
其它类型的聚合酶包括例如Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶、Tfi聚合酶等。RT聚合酶包括HIV逆转录酶、莫洛尼小鼠白血病病毒(MoloneyMurineLeukemiaVirus,M-MLV)逆转录酶、禽成髓细胞瘤病毒(AvianMyeloblastosisVirus,AMV)逆转录酶或劳斯氏肉瘤病毒(RousSarcomaVirus,RSV)逆转录酶。也可使用其变异体、经修饰的产物以及衍生物。类似地,Taq、铂Taq、Tth、Tli、Pfu、Pfutubo、Pyrobest、Pwo和KOD、VENT、DEEPVENT、EX-Taq、LA-Taq、TherminatorTM、扩展系列和铂TaqHi-Fi都是市售的。所属领域的技术人员可以容易地从特定细菌中分离其它酶。
一个示例性聚合酶大肠杆菌DNA聚合酶I(“PolI”)具有三种酶活性:5'到3'DNA聚合酶活性;介导校正的3'到5'核酸外切酶活性;以及介导在DNA修复期间的切口平移的5'到3'核酸外切酶活性。克列诺片段是当通过枯草杆菌蛋白酶蛋白水解裂解大肠杆菌PolI时产生的较大蛋白质片段。其保留聚合酶和校正核酸外切酶活性,但不具有5'到3'核酸外切酶活性。也可获得已经突变以去除校正核酸外切酶活性的克列诺外片段。克列诺片段的结构显示与DNA相互作用的高度保守性残基包括N675、N678、K635、R631、E611、T609、R835、D827、S562以及N579(Beese等人,《科学(Science)》260:352-355(1993))。
大肠杆菌DNA聚合酶I(polI)的克列诺片段中的Arg682对于模板依赖性核苷酸-结合功能来说是重要的,并且似乎维持DNA聚合酶的较高持续合成能力(Pandey等人,《欧洲生物化学杂志(EuropeanJournalofBiochemistry)》,214:59-65(1993))。
在一些实施例中,经修饰的聚合酶衍生自TaqDNA聚合酶,其是衍生自嗜热性细菌水生栖热菌的A家族DNA聚合酶。已知其最佳用于聚合酶链反应中。Taq聚合酶不具有校正活性,并且因此具有相对较低的复制保真度(Kim等人,《自然(Nature)》376:612-616(2002))。
在一些实施例中,经修饰的聚合酶衍生自细菌噬菌体T7的T7DNA聚合酶,其是由病毒T7基因5蛋白质(80kDa)与大肠杆菌硫氧还蛋白(12kDa)的1:1复合物组成的A家族DNA聚合酶。其不具有5'->3'核酸外切酶域,但3'->5'核酸外切酶活性比大肠杆菌克列诺片段的活性大约1000倍。核酸外切酶活性似乎对这一酶的高保真度负责并且防止链置换合成。这一聚合酶典型地展现较高水平的持续合成能力。
在一些实施例中,经修饰的聚合酶衍生自KODDNA聚合酶,其是衍生自鹿儿岛高温球菌(Thermococcuskodakaraensis)的B家族DNA聚合酶。KOD聚合酶是具有高保真度和持续合成能力的耐热DNA聚合酶。
在一些实施例中,经修饰的聚合酶衍生自TherminatorTMTMDNA聚合酶,其也是B家族DNA聚合酶。TherminatorTM是来自热球菌属物种9oN-7的DNA聚合酶的A485L点突变(Ichida等人,《核酸研究》33:5214-5222(2005))。TherminatorTM聚合酶具有增强的能力以掺入经修饰的底物,如双脱氧核苷酸、核糖核苷酸以及无环核苷酸。
在一些实施例中,经修饰的聚合酶衍生自Phi29聚合酶或Phi29型聚合酶,例如衍生自细菌噬菌体B103的聚合酶。Phi29和B103DNA聚合酶是来自相关细菌噬菌体的B家族聚合酶。除A、B和C基元外,DNA聚合酶的Phi29家族含有额外保守性基元:区域Y中的KXY(Blanco等人,《生物化学杂志》268:16763-16770(1993))。影响聚合酶活性和核苷酸结合亲和性的Phi29和B103聚合酶的突变描述于美国专利公开案第20110014612号和其优先文献美国临时申请第61/307,356号、第61/299,917号、第61/299,919号、第61/293,616号、第61/293,618号、第61/289,388号、第61/263,974号、第61/245,457号、第61/242,771号、第61/184,770号以及第61/164,324号中,所述专利以全文引用的方式并入本文中。
在一些实施例中,经修饰的聚合酶衍生自来自1型人类免疫缺陷病毒(HIV-1)的逆转录酶,其是由一个66kDa次单元和一个51kDa次单元组成的杂二聚体。p66次单元含有聚合酶和RNA酶H域两者;p66的蛋白水解裂解去除RNA酶H域以产生p51次单元(Wang等人,PNAS91:7242-7246(1994))。HIV-1逆转录酶的结构显示RNA模板的2'-OH基团与逆转录酶之间的多种相互作用。p66拇指中的螺旋I的残基Ser280和Arg284涉及RNA-RT相互作用,如同p66手掌中的模板夹的残基Glu89和Gln91一样。p51次单元也在RNA-DNA双螺旋体与RT之间的相互作用方面发挥作用,其中p51次单元的残基Lys395、Glu396、Lys22以及Lys390也与DNA:RNA双螺旋体相互作用(Kohlstaedt等人,《科学》256:1783-1790(1992)和Safarianos等人,《欧洲分子生物学杂志(TheEMBOJournal)》20:1449-1461(2001))。
在一些实施例中,经修饰的聚合酶衍生自嗜热脂肪芽孢杆菌的BstDNA聚合酶或其任何生物活性片段。Bst聚合酶可以是家族ADNA聚合酶。天然产生的BstDNA聚合酶的较大片段等效于大肠杆菌PolI的克列诺片段,保留聚合酶和校正核酸外切酶活性,同时不具有5'到3'核酸外切酶活性。在一些实施例中,衍生自BstDNA聚合酶的聚合酶可以不具有3'到5'核酸外切酶活性。如本文所使用,术语“BstDNA聚合酶”可以指全长蛋白质或Bst大片段。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含SEQIDNO:1的氨基酸序列(其是BstDNA聚合酶的大片段(C端部分)的氨基酸序列)的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:1对应于BstDNA聚合酶的较大片段并且包括分别在残基358-363、411-420和533-536处的DNA聚合酶基元A、B和C(参见例如Delarue,前述),如SEQIDNO:1中所示。基元带下划线,并且各基元内不变的残基用粗体表示。在一些实施例中,为了保留Bst聚合酶的聚合酶活性,可以对在基元A、B或C内非高度保守性的氨基酸残基做出任何取代、缺失或化学修饰,所述氨基酸残基如聚合酶活性所需的不变的天冬氨酸残基D358和D535。在一些实施例中,经修饰的聚合酶包括保留可检测水平的聚合酶活性的BstDNA聚合酶的突变体或变异体形式。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:1的氨基酸序列至少80%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,参考聚合酶或经修饰的聚合酶是包含SEQIDNO:1的氨基酸序列的BstDNA聚合酶的分离的变异体,其中变异体包含与SEQIDNO:1至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:1的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含SEQIDNO:1的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:1的氨基酸序列至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:2的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:2包括相对于SEQIDNO:1的三个氨基酸取代,即:His46Arg(H46R)、Glu446Gln(E446Q)以及His572Arg(H572R),其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,经修饰的聚合酶聚合酶由具有或包含与SEQIDNO:2的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:2的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:2至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:2的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有SEQIDNO:2的氨基酸序列并且进一步包括选自由D264S、D423K以及D480R组成的群组的任何一个或多个氨基酸突变的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括SEQIDNO:2或其任何生物活性片段的氨基酸序列,其包括选自由以下组成的群组的任何一个或多个氨基酸取代:E220K、N234R、A263K、D264A、D264R、H273N、H281M、D423K、D480R、N485K、N487R、E493R、H528F以及H528S,其中编号相对于SEQIDNO:2的氨基酸残基。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代E220K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代N234R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代A263K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代D264A,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代D264R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代H273N,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代H281M,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代D423K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代D423K和N487R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代H281M和N487R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代D480R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代N485K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代N487R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代E493R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代H528F,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代H528S,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含或其组成为SEQIDNO:2或其任何生物活性片段的氨基酸序列,并且进一步包含氨基酸取代E220K、N234R以及D423K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括SEQIDNO:2或其任何生物片段的氨基酸序列,其进一步包含选自由以下组成的群组的任何一个或多个氨基酸取代:D264A、H273N、H281M、D423K、N487R以及E493R,其中编号相对于SEQIDNO:2的氨基酸残基。
在一些实施例中,经修饰的聚合酶由具有氨基酸序列SEQIDNO:2并且进一步包含氨基酸取代D264A、H273N、H281M、D423K、N487R以及E493R的经修饰的聚合酶组成或包含所述经修饰的聚合酶,其中编号相对于SEQIDNO:2的氨基酸残基。在一些实施例中,经修饰的聚合酶可以包括SEQIDNO:2或其任何生物片段的氨基酸序列,其进一步包含选自由以下组成的群组的任何一个或多个氨基酸取代:H281M、D423K以及N487R,其中编号相对于SEQIDNO:2的氨基酸残基。
在一些实施例中,经修饰的聚合酶由具有氨基酸序列SEQIDNO:2并且进一步包含氨基酸取代H281M、D423K以及N487R的经修饰的聚合酶组成或包含所述经修饰的聚合酶,其中编号相对于SEQIDNO:2的氨基酸残基。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:2的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:2的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含SEQIDNO:3的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:3包括相比于SEQIDNO:2的两个其它氨基酸取代,即:His473Arg(H473R)和His528Ala(H528A),其中编号相对于SEQIDNO:2的氨基酸序列。因此,与SEQIDNO:1的较大片段野生型序列相比,SEQIDNO:3含有总共五个氨基酸取代。与SEQIDNO:1相比经取代的氨基酸带下划线并且加粗。
在一些实施例中,经修饰的聚合酶由具有或包含与SEQIDNO:3的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:3的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:3至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:3的氨基酸序列的BstDNA聚合酶,并且所述经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:3的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:3的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:3的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:4的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:4含有相比于SEQIDNO:3的三个额外氨基酸取代,即:H281A、H273R以及Y477F,其中编号相对于SEQIDNO:3的氨基酸序列。因此,与SEQIDNO:1的较大片段野生型序列相比,SEQIDNO:4含有总共八个氨基酸取代。与SEQIDNO:1相比经取代的氨基酸带下划线并且加粗。
在一些实施例中,参考聚合酶、经修饰的聚合酶由具有或包含与SEQIDNO:4的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:4的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:4至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:4的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:4的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:4的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:4的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:33的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:33包括相对于SEQIDNO:2的一个氨基酸取代,即:D423K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶聚合酶由具有或包含与SEQIDNO:33的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:33的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:33至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:33的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:34的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:34包括相对于SEQIDNO:2的六个氨基酸取代,即:D423KN487R、H281M、D264A、H273N以及E493R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶聚合酶由具有或包含与SEQIDNO:34的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:34的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:34至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:34的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:34的氨基酸序列。在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:35的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:35包括相对于SEQIDNO:2的三个氨基酸取代,即:D423K、N487R以及H281M,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶聚合酶由具有或包含与SEQIDNO:35的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:35的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:35至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:35的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:36的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:36包括相对于SEQIDNO:2的两个氨基酸取代,即:D423K和N487R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶聚合酶由具有或包含与SEQIDNO:36的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:36的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:36至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:36的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:37的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:37包括相对于SEQIDNO:2的两个氨基酸取代,即:N487R和H281M,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,经修饰的聚合酶聚合酶由具有或包含与SEQIDNO:37的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:37的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:37至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:37的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,本发明大体上涉及包括BstDNA聚合酶的分离的变异体的经修饰的聚合酶,所述BstDNA聚合酶包含选自由以下组成的群组的氨基酸序列:SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:16、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37,并且进一步包括一个或多个氨基酸修饰。任选地,经修饰的聚合酶包括相对于SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:16、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列的一个、两个、三个、四个或更多个氨基酸取代。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:16、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶是参考聚合酶的突变体或变异体并且进一步包括一种或多种相对于参考聚合酶的氨基酸突变。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。存在于经修饰的聚合酶中的相对于参考聚合酶的一个或多个氨基酸取代可以包括至少一个保守性氨基酸取代。
在一些实施例中,参考聚合酶可以具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:16、SEQIDNO:25、SEQIDNO:26、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列,并且经修饰的聚合酶可以具有或包含参考聚合酶的氨基酸序列,进一步包括相比于参考聚合酶的一个或多个氨基酸突变。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变:H46R、C93R、Q238C、H273R、H281A、E446Q、H473R、Y477F、H528A、C550Q、H572R、E220K、N234R、A263K、D264A、D264R、H273N、H281M、D423K、D480R、N485K、N487R、E493R、H528F以及H528S,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶具有相对于参考聚合酶降低的缓冲能力。不受任何特定操作理论限制,可以观测到,在一些实施例中,前述突变中的一个或多个可以相对于未经修饰的聚合酶的缓冲能力改变,例如提高或降低经修饰的聚合酶。因此,此类突变可以被称作“缓冲”突变。在一些实施例中,此类缓冲能力提高或降低可以增加基于离子的测序反应中观测到的信号。关于此类突变和其对聚合酶的缓冲能力的可能的作用的其它信息可以见于例如2010年2月26日提交的美国临时申请第60/308,863号、2011年2月25日提交的美国专利申请序列号13/035,081、2011年2月25日提交的序列号13/035,177、2011年2月28日提交的序列号13/036,526以及2011年2月25日提交的序列号13/036,623中以及2011年2月25日提交的国际PCT申请第PCT/US2011/026219号、2011年2月25日提交的第PCT/US2011/026228号、2011年2月28日提交的第PCT/US2011/026450号以及2011年2月28日提交的第PCT/US2011/026468号;所有前述申请都以全文引用的方式并入在此。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。可以降低或消除聚合酶的核酸外切酶活性的一些示例性突变进一步描述于本文中。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列,进一步包括相比于参考聚合酶的一个或多个氨基酸突变。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括在选自由以下组成的群组的任何一个或多个位置处的一个或多个氨基酸取代:46、93、220、234、238、263、264、273、281、423、446、473、477、480、485、487、493、528、550以及572,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,相对于具有SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:34、SEQIDNO:35或SEQIDNO:37的氨基酸序列的相应的参考聚合酶,前述氨基酸取代中的一个或多个可以改变(例如提高或降低)经修饰的聚合酶的缓冲能力。因此,此类突变可以被称作“缓冲”突变。在一些实施例中,此类缓冲能力提高或降低可以增加基于离子的测序反应中观测到的信号。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:平均阅读长度、准确度、总测序通量、链偏差、减少的系统误差、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、缓冲能力、解离速率、解离时间常数、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3或SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列并且进一步包含一个或多个额外氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶包含SEQIDNO:1的氨基酸序列并且进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、A263K、D264A、D264R、D264Q、D264S、D264K、Y272R、H273N、H273R、L280R、H281A、H281M、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485K、N485W、N485Y、N487H、N487R、N487W、N487F、N487I、V488R、E493Q、E493R、M495Q、H528A、H528F、H528SH528R、H528K、V533I、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。不受任何特定操作理论限制,可以观测到,在一些实施例中,包括上述氨基酸突变中的一个或多个的经修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如提高或降低)的核酸模板结合亲和性或相对于未经修饰的聚合酶或相对于具有SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列的参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”),其中经修饰的聚合酶含有至少一个相对于参考或未经修饰的聚合酶的额外氨基酸取代。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的平均阅读长度或改变的最小阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的AQ20、100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、准确度、链偏差、系统误差、总测序通量、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。相对于具有SEQIDNO:2的氨基酸序列的参考聚合酶的解离速率和解离时间常数,本文所提供的实例说明在具有SEQIDNO:2的氨基酸序列并且进一步包括来自上述清单的各种示例性氨基酸取代的各种示例性经修饰的聚合酶中观测到的解离速率和解离时间常数变化在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3或SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列并且进一步包括相对于参考聚合酶的一个或多个氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括在选自由以下组成的群组的任何一个或多个位置处的一个或多个氨基酸取代:31、77、113、114、130、144、212、220、234、241、251、263、264、272、273、280、281、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、448、457、462、480、485、487、488、493、495、528、533、577以及579,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,相对于相应的未经修饰的聚合酶或参考聚合酶,包括这些突变中的一个或多个的经修饰的聚合酶展现改变(例如提高或降低)的核酸模板结合亲和性。在一些实施例中,经修饰的聚合酶具有相对于未经修饰的聚合酶或参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、缓冲能力、解离速率、100Q17值、AQ20以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列并且进一步包括至少一个相对于参考聚合酶的氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括在选自由以下组成的群组的任何一个或多个位置处的一个或多个氨基酸取代:31、46、77、93、113、114、130、144、212、220、234、238、241、251、263、264、272、273、280、281、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、446、448、457、462、473、477、480、485、487、488、493、495、528、533、550、572、577以及579,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:核酸模板结合亲和性、缓冲能力、平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、AQ20、解离时间常数、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3或SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列并且进一步包括至少一个相对于参考聚合酶的氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变:N31R、N31K、H46A、H46R、D77K、D77H、C93R、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、Q238C、V241K、V251K、A263K、D264A、D264R、D264Q、D264S、D264K、Y272R、H273A、H273N、H273R、L280R、H281A、H281R、H281M、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473A、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485K、N485W、N485Y、N487H、N487R、N487W、N487F、N487I、V488R、E493R、E493Q、M495Q、H528A、H528F、H528SH528R、H528K、V533I、C550Q、H572A、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。
不受任何特定操作理论限制,可以观测到,在一些实施例中,包括这些突变中的一个或多个的经修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如提高或降低)的核酸模板结合亲和性或相对于未经修饰的聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于未经修饰的聚合酶,经修饰的聚合酶展现改变(例如提高或降低)的缓冲能力。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变的解离时间常数或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、解离速率、平均阅读长度、最小阅读长度、原始准确度、总测序通量、系统误差、链偏差、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括在选自由以下组成的群组的任何一个或多个位置处的氨基酸取代:46、93、238、273、281、446、473、477、528、550以及572,以及选自由以下组成的群组的一个或多个氨基酸取代:31、77、113、114、130、144、212、220、234、241、251、263、264、272、280、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、448、457、462、480、485、487、488、493、495、533、577以及579,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:核酸模板结合亲和性、缓冲能力、平均阅读长度、最小阅读长度、原始准确度、总测序通量、系统误差、链偏差、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、AQ20、解离时间常数、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的一个或多个氨基酸取代:H46A、H46R、C93R、Q238C、H273A、H273R、H281A、H281R、H281M、E446Q、H473A、H473R、Y477F、H528A、H528R、H528K、C550Q、H572A以及H572R,以及选自由以下组成的群组的一个或多个氨基酸取代:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、E325R、I331Q、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、平均阅读长度、最小阅读长度、原始准确度、总测序通量、系统误差、链偏差、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、AQ20、解离时间常数、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,本发明大体上涉及具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列;或具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列的聚合酶并且进一步包括相对于具有SEQIDNO:1、SEQIDNO:2、SEQIDNO:3或SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列的参考聚合酶的氨基酸序列的至少一个氨基酸突变的任何生物活性片段的氨基酸序列的经修饰的聚合酶。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶可以至少包括氨基酸突变D480R,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变D264K和E493Q,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变E220K、N234R以及D423K,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变E220K、N234R、D423K以及H528A,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变E220K、N234R、D423K、H473R以及H528A,其中编号相对于SEQIDNO:2的氨基酸序列(参见SEQIDNO:20)。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变D423K,其中编号相对于SEQIDNO:2的氨基酸序列(参见SEQIDNO:33)。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N487R、H281M、D264A、H273N以及E493R,其中编号相对于SEQIDNO:2的氨基酸序列(参见SEQIDNO:34)。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N487R、H281M以及D423K,其中编号相对于SEQIDNO:2的氨基酸序列(参见SEQIDNO:35)。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N487R和D423K,其中编号相对于SEQIDNO:2的氨基酸序列(参见SEQIDNO:36)。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N487R和H281M,其中编号相对于SEQIDNO:2的氨基酸序列(参见SEQIDNO:37)。
在一些实施例中,根据本发明的经修饰的聚合酶可以包括选自由以下组成的群组的任何一个或多个氨基酸突变:E220K、N234R、V241K、A263K、D264R、D264K、H273N、H281M、D423K、D480R、N485K、N487RN487W、V488R、H473R、E493R、H528F、H528S、H528A以及E493Q,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,相对于相应的未经修饰的聚合酶或参考聚合酶,包括这些突变中的一个或多个的经修饰的聚合酶展现改变(例如提高或降低)的结合亲和性和/或减少的系统误差和/或减少的核酸模板链偏差。在一些实施例中,经修饰的聚合酶具有相对于未经修饰的聚合酶或参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、原始准确度、总测序通量、系统误差、链偏差、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基的缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:2的氨基酸序列或具有SEQIDNO:2的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:2的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:3的氨基酸序列或具有SEQIDNO:3的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:3的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:4的氨基酸序列或具有SEQIDNO:4的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:4的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:33的氨基酸序列或具有SEQIDNO:33的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:33的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:34的氨基酸序列或具有SEQIDNO:34的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:34的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:35的氨基酸序列或具有SEQIDNO:35的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:35的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:36的氨基酸序列或具有SEQIDNO:36的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:36的氨基酸序列的氨基酸突变。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:37的氨基酸序列或具有SEQIDNO:37的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。经修饰的聚合酶可以进一步包括一个或多个相对于SEQIDNO:37的氨基酸序列的氨基酸突变。在一些实施例中,经修饰的聚合酶包括一个或多个选自氨基酸取代、缺失或添加的氨基酸突变。
在一些实施例中,经修饰的聚合酶具有聚合酶活性。聚合酶或生物活性片段可以具有体内或体外引物延伸活性。
在一些实施例中,经修饰的聚合酶包含与SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。在一些实施例中,至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:46、220、234、263、264、273、281、423、446、473、477、480、485、487、493、528以及572,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶包括在选自这一群组的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。不希望受任何特定作用理论束缚,可以观测到,在一些实施例中,相对于相应的未经修饰的聚合酶或相对于参考聚合酶,此类位置处的氨基酸取代可以改变(例如提高或降低)经修饰的聚合酶的缓冲能力。因此,此类突变可以被称作“缓冲”突变。在一些实施例中,此类缓冲能力提高或降低可以增加基于离子的测序反应中观测到的信号。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:1的氨基酸序列;或包括具有SEQIDNO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,或包括与SEQIDNO:1的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列,并且进一步包括选自由以下组成的群组的至少一个氨基酸取代:H46A、H46R、H273A、H273R、H281A、H281R、E446Q、H473A、H473R、Y477F、H528A、H528R、H572A以及H572R,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶包括这些氨基酸取代中的任何两个、三个、四个、五个或更多个。
在一些实施例中,经修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:31、77、113、114、130、144、212、220、234、241、251、264、272、280、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、448、457、462、480、485、487、488、493、495、533、577以及579,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶包括在选自这一群组的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。不受任何特定操作理论限制,可以观测到,在一些实施例中,包括此类氨基酸取代中的任一个的经修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如提高或降低)的核酸模板结合亲和性或相对于相应的未经修饰的聚合酶或相对于参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变(例如提高或降低)的平均无误差阅读长度或改变(例如提高或降低)的解离时间常数或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现选自由以下组成的群组的任何一个或多个特性的变化(例如提高或降低):DNA结合亲和性、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的特性来观测变化。
在一些实施例中,经修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:31、46、77、113、114、130、144、212、220、234、241、251、263、264、272、273、280、281、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、446、448、457、462、473、477、480、485、487、488、493、495、528、533、572、577以及579,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶包括在选自这一群组的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。在一些实施例中,经修饰的聚合酶包括SEQIDNO:1的氨基酸序列;或包括具有SEQIDNO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列;或包括与SEQIDNO:1的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列,并且进一步包括在选自由以下组成的群组的任何一个或多个位置处的至少一个氨基酸取代:46、273、281、446、473、477、528以及572,以及在选自由以下组成的群组的任何一个或多个位置处的至少一个氨基酸取代:31、77、113、114、130、144、212、220、234、241、251、264、272、280、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、448、457、462、480、485、487、488、493、495、533、577以及579,其中编号相对于SEQIDNO:1的氨基酸序列,在一些实施例中,经修饰的聚合酶包括在选自这两个氨基酸取代群组中的每一个的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:1的氨基酸序列;或包括具有SEQIDNO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列;或包括与SEQIDNO:1的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列,并且进一步包括选自由以下组成的群组的至少一个氨基酸取代:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶包括这些氨基酸取代中的任何两个、三个、四个、五个或更多个。
在一些实施例中,经修饰的聚合酶包括经设计以用不同氨基酸残基替换先前存在的半胱氨酸残基或用半胱氨酸残基替换非半胱氨酸氨基酸残基的至少一个氨基酸取代。至少一个氨基酸取代任选地包括选自由以下组成的群组的一个或多个氨基酸取代:C93R、Q238C以及C550Q,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:2的氨基酸序列;或包括具有SEQIDNO:2的氨基酸序列的聚合酶的生物活性片段的氨基酸序列;或包括与SEQIDNO:2的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列,并且进一步包括选自由以下组成的群组的至少一个氨基酸取代:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y以及D579F,其中编号相对于SEQIDNO:2的氨基酸序列。任选地,经修饰的聚合酶可以进一步包括选自由以下组成的群组的至少一个氨基酸取代:H46A、H46R、H273A、H273R、H281A、H281R、H281M、E446Q、H473A、H473R、Y477F、H528A、H528R、H528K、H572A以及H572R,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,经修饰的聚合酶包括选自这两个氨基酸取代群组中的每一个的任何两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:1的氨基酸序列;或包括具有SEQIDNO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列;或包括与SEQIDNO:1的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列,并且进一步包括选自由以下组成的群组的至少一个氨基酸取代:N31R、N31K、H46A、H46R、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273A、H273R、L280R、H281A、H281R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473A、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528R、V533I、H572R、H578A、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,经修饰的聚合酶包括这些氨基酸取代中的任何两个、三个、四个、五个或更多个。
在一些实施例中,相对于参考聚合酶,经修饰的聚合酶具有改变(例如提高或降低)的核酸模板结合亲和性。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶具有改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变(例如增加或减少)的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下特性中的任何一个或多个的变化(例如提高或降低):核酸模板结合亲和性、解离时间常数、解离速率、100Q17值以及200Q17值。在一些实施例中,相对于相应的未经修饰的聚合酶或参考聚合酶,改变的特性提高或降低了至少10%、20%、30%、40%、50%、75%、90%、100%、200%、300%、500%、750%、1000%、3000%或更大。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的特性来观测变化。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。
任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除聚合酶的任何核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含SEQIDNO:16的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体:
SEQIDNO:16包含天然存在的(野生型)BstDNA聚合酶的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:16的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶是参考聚合酶的突变体或变异体,并且进一步包括一个或多个相对于参考聚合酶的氨基酸突变。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。任选地,存在于经修饰的聚合酶中的相对于参考聚合酶的一个或多个氨基酸取代可以包括至少一个保守性氨基酸取代。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含SEQIDNO:25的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。SEQIDNO:25具有相比于SEQIDNO:16的一个氨基酸取代,即:N782R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含与SEQIDNO:25的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,聚合酶是包含SEQIDNO:25的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:25至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:26的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:26含有相比于SEQIDNO:16的两个氨基酸取代,即:N782R和D718K,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:26的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:26的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:26至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:26的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:26的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:26的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:26的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:27的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:27的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:27的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:27的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
SEQIDNO:27含有相比于SEQIDNO:16的三个氨基酸取代,即:N782R、D718K以及H568N,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含与SEQIDNO:27的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:27的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:27至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:27的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:27的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:28的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:28含有相比于SEQIDNO:16的两个氨基酸取代,即:N782R和H576M,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:28的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:28的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:28至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:28的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:28的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:28的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:28的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:29的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:29含有相比于SEQIDNO:16的两个氨基酸取代,即:N782R和H823S,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:29的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:29的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:29至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:29的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:29的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:29的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:29的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:30的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:30含有相比于SEQIDNO:16的一个氨基酸取代,即:D718K,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:30的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:30的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:30至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:30的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:30的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:30的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:30的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:31的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:31含有相比于SEQIDNO:16的三个氨基酸取代,即:D718K、N782R以及H576M,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:31的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:31的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:31至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:31的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:31的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:31的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:31的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:32的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:32含有相比于SEQIDNO:16的五个氨基酸取代,即:N782R、H576M、D559A、H568N以及E788R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:32的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:32的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:32至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:32的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:32的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:32的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:32的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:33的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:33含有相比于SEQIDNO:2的一个氨基酸取代,即D423K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:33的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:33的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:33至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:33的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:33的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:33的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:33的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:34的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:34含有相对于SEQIDNO:2的五个氨基酸取代,即N487R、H281M、D264A、H273N以及E493R,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:34的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:34的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:34至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:34的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:34的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:34的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:34的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:35的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:35含有相比于SEQIDNO:2的三个氨基酸取代,即N487R、H281M以及D423K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:35的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:35的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:35至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:35的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:35的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:35的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:35的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:36的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:36含有相比于SEQIDNO:2的两个氨基酸取代,即N487R和D423K,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:36的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:36的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:36至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:36的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:36的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:36的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:36的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶由具有或包含SEQIDNO:37的氨基酸序列的BstDNA聚合酶的分离的变异体组成或包含所述分离的变异体。
SEQIDNO:37含有相比于SEQIDNO:2的两个氨基酸取代,即N487R和H281M,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者由具有或包含与SEQIDNO:37的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体组成或包含所述分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:37的氨基酸序列的BstDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:37至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,参考聚合酶是具有或包含SEQIDNO:37的氨基酸序列的BstDNA聚合酶,并且经修饰的聚合酶进一步包括一种或多种相对于参考聚合酶的氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号相对于SEQIDNO:37的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有或包含SEQIDNO:37的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。在一些实施例中,参考聚合酶和/或经修饰的聚合酶可以包括具有或包含与SEQIDNO:37的氨基酸序列至少90%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列。
在一些实施例中,经修饰的聚合酶包含含有与SEQIDNO:2或其生物活性片段具有至少80%同源性的氨基酸序列的重组聚合酶,其中重组聚合酶包含具有在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的家族ADNA聚合酶:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2,并且其中重组聚合酶相比于SEQIDNO:2展现降低的解离速率常数。在一些实施例中,重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487R、N485K、E493R、A263K、D264A、D264R、H528S、H528F、H273N、D423K、D480R以及H281M,其中编号相对于SEQIDNO:2。
在一些实施例中,经修饰的聚合酶包含含有与SEQIDNO:25或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。在一些实施例中,经修饰的聚合酶包含含有与SEQIDNO:25或其生物活性片段至少80%一致的氨基酸序列的重组聚合酶,其中重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R以及H576M,其中编号相对于SEQIDNO:25。在一些实施例中,经修饰的聚合酶包含相比于不具有在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的参考聚合酶展现提高的原始阅读准确度、减少的系统误差、减少的链偏差、增加的平均阅读长度或增加的总测序通量的重组聚合酶:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。
在一些实施例中,经修饰的聚合酶包含含有与SEQIDNO:37或其生物活性片段具有至少80%同源性的氨基酸序列的分离的多肽,其中分离的多肽包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:D423、D264、H273以及E493,其中编号相对于SEQIDNO:37,并且其中分离的多肽展现相对于SEQIDNO:2降低的解离速率常数。
在一些实施例中,经修饰的聚合酶包含含有与SEQIDNO:2或其生物活性片段具有至少80%同源性的氨基酸序列的重组聚合酶,其中重组聚合酶包含具有在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的家族ADNA聚合酶:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2,并且其中重组聚合酶相比于SEQIDNO:2展现降低的解离速率常数。
在一些实施例中,参考聚合酶可以具有或包含SEQIDNO:16的氨基酸序列,并且经修饰的聚合酶可以具有或包含参考聚合酶的氨基酸序列,并且进一步包括至少一个相对于参考聚合酶的氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。经修饰的聚合酶可以进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变:H341R、C388R、E515K、N529RQ533C、A558K、D559A、D559R、H568R、H568N、H576A、H576M、D718K、E741Q、H768R、Y772F、D775R、N780K、N782R、E788R、H823A、H823S、H823F、C845Q以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,经修饰的聚合酶具有相对于参考聚合酶降低的缓冲能力。不受任何特定操作理论限制,可以观测到,在一些实施例中,前述突变中的一个或多个可以相对于未经修饰的聚合酶降低经修饰的聚合酶的缓冲能力。在一些实施例中,此类缓冲能力降低可以增加基于离子的测序反应中观测到的信号。关于此类突变和其对聚合酶的缓冲能力的可能的作用的其它信息可以见于例如2010年2月26日提交的美国临时申请第60/308,863号、2011年2月25日提交的美国专利申请序列号13/035,081、2011年2月25日提交的序列号13/035,177、2011年2月28日提交的序列号13/036,526以及2011年2月25日提交的序列号13/036,623中以及2011年2月25日提交的国际PCT申请第PCT/US2011/026219号、2011年2月25日提交的第PCT/US2011/026228号、2011年2月28日提交的第PCT/US2011/026450号以及2011年2月28日提交的第PCT/US2011/026468号;所有前述申请都以全文引用的方式并入在此。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。可以降低或消除聚合酶的核酸外切酶活性的一些示例性突变进一步描述于本文中。在一些实施例中,参考聚合酶具有或包含SEQIDNO:16的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列,并且进一步包括至少一个相对于参考聚合酶的氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、A558K、D559A、D559R、D559Q、D559S、Y567R、H568N、L575R、H576M、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N780K、N782H、N782W、N782F、N782I、E782Q、V783R、E788R、E788Q、M790Q、H823S、H823FV828I、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。不受任何特定操作理论限制,可以观测到,在一些实施例中,包括这些突变中的一个或多个的经修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如提高或降低)的解离时间常数。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、原始准确度、链偏差、系统误差、总测序通量、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:16的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列,并且进一步包括至少一个相对于参考聚合酶的氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括在选自由以下组成的群组的任何一个或多个位置处的氨基酸取代:326、341、372、388、408、409、425、439、507、515、529、533、536、546、558、559、567、568、575、576、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、741、743、752、757、768、772、775、780、782、783、788、790、823、828、845、867、872以及874,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,经修饰的聚合酶可以包括具有SEQIDNO:16的氨基酸序列并且进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变的聚合酶的任何生物活性片段的氨基酸序列:N782R、D780K、E788R、A588K、H568N、H576M、H823S、H823F、D559A、D559R、D559S、D718K以及D775R。
在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:平均阅读长度、最小阅读长度、原始准确度、链偏差、系统误差、总测序通量、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、AQ20、缓冲能力、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的任何一个或多个氨基酸突变:N326R、N326K、H341R、D372K、D372H、C388R、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、Q533C、D559A、D559Q、D559S、Y567R、H568R、L575R、H576A、H576M、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782R、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A、H823S、V828I、C845Q、H867R、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。不受任何特定操作理论限制,可以观测到,在一些实施例中,包括这些突变中的一个或多个的经修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于未经修饰的聚合酶,经修饰的聚合酶展现改变(例如提高或降低)的解离时间常数。在一些实施例中,相对于未经修饰的聚合酶,经修饰的聚合酶展现改变(例如提高或降低)的缓冲能力。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、平均阅读长度、最小阅读长度、原始准确度、链偏差、系统误差、总测序通量、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,参考聚合酶具有或包含SEQIDNO:16的氨基酸序列,并且经修饰的聚合酶具有或包含参考聚合酶的氨基酸序列,并且进一步包括至少一个相对于参考聚合酶的氨基酸取代。在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:341、388、533、568、576、741、768、772、823、845以及867。在一些实施例中,经修饰的聚合酶可以进一步包括在选自由以下组成的群组的一个或多个位置处的至少一个氨基酸取代:326、372、408、409、425、439、507、515、529、536、546、559、567、575、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、743、752、757、775、780、782、783、788、790、828、872以及874,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、平均阅读长度、最小阅读长度、原始准确度、链偏差、系统误差、总测序通量、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的一个或多个氨基酸取代:H341A、H341R、C388R、Q533C、H568A、H568R、H576A、H576M、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、C845Q、H867A以及H867R,以及选自由以下组成的群组的一个或多个氨基酸取代:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,本发明大体上涉及包含SEQIDNO:16的氨基酸序列的经修饰的聚合酶,或具有或包含SEQIDNO:16的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列,并且进一步包括至少一个相对于参考聚合酶的氨基酸序列的氨基酸突变,其中参考聚合酶由SEQIDNO:16的氨基酸序列组成。
在一些实施例中,经修饰的聚合酶包含与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶具有聚合酶活性。经修饰的聚合酶或生物活性片段可以具有体内或体外引物延伸活性。
在一些实施例中,经修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:341、388、533、568、576、741、768、772、823、845以及867,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括在选自这一群组的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。不希望受任何特定作用理论束缚,可以观测到,在一些实施例中,相对于相应的未经修饰的聚合酶或相对于参考聚合酶,此类位置处的氨基酸取代可以改变(例如提高或降低)经修饰的聚合酶的缓冲能力。因此,此类突变可以被称作“缓冲”突变。在一些实施例中,此类缓冲能力提高或降低可以增加基于离子的测序反应中观测到的信号。
在一些实施例中,经修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:326、372、408、409、425、439、507、515、529、536、546、559、567、575、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、743、752、757、775、780、782、783、788、790、828、872以及874,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括在选自这一群组的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。不受任何特定操作理论限制,可以观测到,在一些实施例中,包括此类氨基酸取代中的任一个的经修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如提高或降低)的核酸模板结合亲和性或相对于相应的未经修饰的聚合酶或相对于参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变(例如提高或降低)的平均无误差阅读长度或改变(例如提高或降低)的解离时间常数或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现选自由以下组成的群组的任何一个或多个特性的变化(例如提高或降低):DNA结合亲和性、原始准确度、链偏差、系统误差、总测序通量、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的特性来观测变化。
在一些实施例中,经修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处存在:326、341、372、408、409、425、439、507、515、529、536、546、559、567、568、575、576、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、741、743、752、757、768、772、775、780、782、783、788、790、823、828、867、872以及874,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括在选自这一群组的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:16的氨基酸序列或具有SEQIDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,并且进一步包括在选自由以下组成的群组的任何一个或多个位置处的至少一个氨基酸取代:341、568、576、741、768、772、823、845以及867,以及在选自由以下组成的群组的任何一个或多个位置处的至少一个氨基酸取代:326、372、408、409、425、439、507、515、529、536、546、559、567、575、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、743、752、757、775、780、782、783、788、790、828、872以及874,其中编号相对于SEQIDNO:16的氨基酸序列,在一些实施例中,经修饰的聚合酶包括在选自这两个氨基酸取代群组中的每一个的位置处出现的至少两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,经修饰的聚合酶包括SEQIDNO:16的氨基酸序列或具有SEQIDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列。在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的至少一个氨基酸取代:H341A、H341R、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、H867A以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括这些氨基酸取代中的任何两个、三个、四个、五个或更多个。
在一些实施例中,经修饰的聚合酶包括经设计以用不同氨基酸残基替换先前存在的半胱氨酸残基或用半胱氨酸残基替换非半胱氨酸氨基酸残基的至少一个氨基酸取代。至少一个氨基酸取代任选地包括选自由以下组成的群组的一个或多个氨基酸取代:C388R、Q533C、C845Q,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的至少一个氨基酸取代:H341A、H341R、H568A、H568R、H576A、H576R、H576M、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、H867A以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括这些氨基酸取代中的任何两个、三个、四个、五个或更多个。
在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的至少一个氨基酸取代:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。任选地,经修饰的聚合酶可以进一步包括选自由以下组成的群组的至少一个氨基酸取代:H341A、H341R、H568A、H568R、H576A、H576R、H576M、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、H867A以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括选自这两个氨基酸取代群组中的每一个的任何两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,经修饰的聚合酶进一步包括选自由以下组成的群组的至少一个氨基酸取代:N326R、N326K、H341A、H341R、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、H568A、H568R、L575R、H576A、H576R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768A、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A、H823R、V828I、H867A、H867R、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,经修饰的聚合酶包括这些氨基酸取代中的任何两个、三个、四个、五个或更多个。
在一些实施例中,根据本发明的经修饰的聚合酶可以至少包括氨基酸突变D775R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变D559K和E788Q,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变E515K、N529R以及D718K,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变E515K、N529R、D718K以及H823A,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变E515K、N529R、D718K、H768R以及H823A,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括选自由以下组成的群组的任何一个或多个氨基酸突变:E515K、N529R、V536K、D559K、D718K、H768R、D775R、N782W、V783R、E788Q以及H823A,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R和D718K,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R、D718K以及H568N,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R和H576M,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R和H823S,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变D718K,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R、D718K以及H576M,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶可以包括氨基酸突变N782R、D718K、H576M、D559A、H5678N以及E788R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,相对于相应的未经修饰的聚合酶或参考聚合酶,包括这些突变中的一个或多个的经修饰的聚合酶展现改变(例如提高或降低)的核酸模板结合亲和性。在一些实施例中,经修饰的聚合酶具有相对于未经修饰的聚合酶或参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或提高的原始准确度或减少的链偏差或减少的系统误差或增加的总测序通量或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、原始准确度、链偏差、系统误差、总测序通量、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,相对于参考聚合酶,经修饰的聚合酶具有改变(例如提高或降低)的核酸模板结合亲和性。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶具有改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变(例如增加或减少)的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下特性中的任何一个或多个的变化(例如提高或降低):核酸模板结合亲和性、解离时间常数、解离速率、100Q17值以及200Q17值。在一些实施例中,相对于相应的参考聚合酶,改变的特性提高或降低了至少10%、20%、30%、40%、50%、75%、90%、100%、200%、300%、500%、750%、1000%、3000%或更大。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的特性来观测变化。
任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除聚合酶的任何核酸外切酶活性的一个或多个氨基酸突变。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者是具有校正核酸外切酶活性的BstDNA聚合酶。在不同实施例中,经修饰的BstDNA聚合酶的校正核酸外切酶活性是相应的野生型蛋白质的活性的至少约40%、50%、60%、70%、80%或90%。为了保留经修饰的BstDNA聚合酶的校正核酸外切酶活性,所属领域的技术人员将理解,应对在ExoI、ExoII以及ExoIII基元内非高度保守性的氨基酸残基进行任何取代、缺失或化学修饰。
在一些实施例中,经修饰的聚合酶是TaqDNA聚合酶。在一些实施例中,聚合酶是以铂Taq高保真度DNA聚合酶(生命技术公司,加利福尼亚州)市售的TaqDNA聚合酶,其包括一个或多个相比于参考铂Taq高保真度DNA聚合酶的氨基酸突变。在一些实施例中,经修饰的聚合酶是具有或包含SEQIDNO:15的氨基酸序列的TaqDNA聚合酶,其是TaqPolA聚合酶的较大片段的氨基酸序列:
在一些实施例中,经修饰的聚合酶包括保留可检测水平的聚合酶活性的TaqDNA聚合酶的突变体或变异体形式。为了保留TaqDNA聚合酶的聚合酶活性,将对非高度保守性的氨基酸残基进行任何取代、缺失或化学修饰,所述氨基酸残基如聚合酶活性所需的不变天冬氨酸残基。在一些实施例中,经修饰的聚合酶可以包括TaqDNA聚合酶、hot-startTaqDNA聚合酶、化学hot-startTaqDNA聚合酶、PlatiniumTaqDNA聚合酶等。
在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:15的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:15的氨基酸序列的TaqDNA聚合酶的变异体,其中所述变异体包含与SEQIDNO:15至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶包括具有氨基酸突变E471K的TaqDNA聚合酶的突变体或变异体形式,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变N485R,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变R492K,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变D513K,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变A675K,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变D732R,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变S739W,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变V740R,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的TaqDNA聚合酶可以包括氨基酸突变E745Q,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含选自由以下组成的群组的以下氨基酸突变中的一个或多个的TaqDNA聚合酶的变异体或突变体:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R以及E745Q,其中编号相对于SEQIDNO:15的氨基酸序列。
在一些实施例中,相对于相应的未经修饰的聚合酶或参考聚合酶,包括这些突变中的一个或多个的经修饰的聚合酶展现改变(例如提高或降低)的核酸模板结合亲和性。在一些实施例中,经修饰的Taq聚合酶具有相对于未经修饰的聚合酶或参考聚合酶改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的Taq聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的Taq聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的Taq聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的Taq聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、AQ20、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的Taq聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的Taq聚合酶或参考和经修饰的Taq聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,经修饰的聚合酶是具有或包含SEQIDNO:15的氨基酸序列(除了SEQIDNO:15的第一残基(N端甲硫氨酸),其不包括于经修饰的聚合酶中)的TaqDNA聚合酶。
如所属领域的技术人员将容易地了解,本发明的范围不仅涵盖本文所公开的特定氨基酸和/或核苷酸序列,还涵盖例如编码具有本文所描述的功能特性的基因和/或肽的多种相关序列。举例来说,本发明的范围和精神涵盖编码本文所公开的各种聚合酶的保守性变异体的任何核苷酸和氨基酸序列。所属领域的技术人员也将显而易见,本文中氨基酸序列所公开的经修饰的聚合酶可以在无过度实验的情况下转换成相应的核苷酸序列,例如使用许多可自由获得的序列转化应用(例如“计算机操作(in-silco)”)。
在一些实施例中,经修饰的聚合酶是大肠杆菌DNA聚合酶I的克列诺片段。来自大肠杆菌的DNA聚合酶I含有5'到3'核酸外切酶域(典型地对应于氨基酸残基:7-252)。然而,为了产生克列诺片段,这些和额外的氨基酸残基(1-323)裂解。大肠杆菌DNA聚合酶I的氨基酸残基324-928构成克列诺片段(本文中以SEQIDNO:18形式提供,其编码克列诺片段多肽)大肠杆菌DNA聚合酶I和克列诺片段都含有位于氨基酸残基345-539处的3'到5'核酸外切酶(校正)域和负责新的DNA链的聚合的聚合酶域(氨基酸残基547-926)。总的来说,相比于大肠杆菌聚合酶I,克列诺片段一般不具有氨基酸1-323。
在一些实施例中,经修饰的聚合酶是具有或包含SEQIDNO:18的氨基酸序列的大肠杆菌DNA聚合酶的克列诺片段。
在一些实施例中,经修饰的聚合酶包括保留可检测水平的聚合酶活性的DNA聚合酶I的克列诺片段的突变体或变异体形式。为了保留克列诺片段的聚合酶活性,将对非高度保守性的氨基酸残基进行任何取代、缺失或化学修饰,所述氨基酸残基如聚合酶活性所需的不变天冬氨酸残基。
在一些实施例中,经修饰的聚合酶可以包括具有或包含与SEQIDNO:18的氨基酸序列至少90%一致的氨基酸序列的聚合酶的分离的变异体。在一些实施例中,经修饰的聚合酶是包含SEQIDNO:18的氨基酸序列的DNA聚合酶I的克列诺片段的变异体,其中所述变异体包含与SEQIDNO:18至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
在一些实施例中,经修饰的聚合酶包括具有氨基酸突变E245K的DNA聚合酶I的克列诺片段的突变体或变异体形式,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,经修饰的聚合酶包括具有氨基酸突变S259R的DNA聚合酶I的克列诺片段的突变体或变异体形式,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,经修饰的聚合酶包括具有氨基酸突变T266K的DNA聚合酶I的克列诺片段的突变体或变异体形式,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,经修饰的聚合酶包括具有氨基酸突变E290K的DNA聚合酶I的克列诺片段的突变体或变异体形式,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,经修饰的聚合酶包括具有氨基酸突变A448K的DNA聚合酶I的克列诺片段的突变体或变异体形式,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,DNA聚合酶I的经修饰的克列诺片段可以包括氨基酸突变D505R,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,经修饰的聚合酶包括具有氨基酸突变A512W的DNA聚合酶I的克列诺片段的突变体或变异体形式,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,DNA聚合酶I的经修饰的克列诺片段可以包括氨基酸突变E518Q,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,经修饰的聚合酶可以包括具有或包含选自由以下组成的群组的以下氨基酸突变中的一个或多个的DNA聚合酶I的克列诺片段的变异体或突变体:E245K、S259R、T266K、E290K、A448K、D505R、A512W以及E518Q,其中编号相对于SEQIDNO:18的氨基酸序列。
在一些实施例中,相对于相应的未经修饰的聚合酶或参考聚合酶,包括上述突变中的一个或多个的DNA聚合酶I的经修饰的克列诺片段展现改变(例如提高或降低)的核酸模板结合亲和性。在一些实施例中,相对于未经修饰的聚合酶或参考聚合酶,DNA聚合酶I的经修饰的克列诺片段具有改变(例如提高或降低)的从核酸模板解离的速率(“解离速率”)。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。在一些实施例中,氨基酸取代包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守性取代;替代地,氨基酸取代可以是非保守性取代。在一些实施例中,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现任何一个或多个选自由以下组成的群组的参数的变化:平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、缓冲能力、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。
在本发明的一个方面中,已发现,聚合酶(例如参考聚合酶)的氨基酸可以突变以产生具有改变的催化特性的经修饰的聚合酶。在一些实施例中,SEQIDNO:16(对应于全长野生型BstDNA聚合酶)可以在表1中所提供的氨基酸中的一个或多个处突变以获得相比于参考聚合酶(例如全长野生型Bst聚合酶)具有改变的催化特性的一种或多种聚合酶。在一些实施例中,SEQIDNO:1(对应于野生型BstDNA聚合酶的截断形式)可以在表1中所提供的氨基酸中的一个或多个处突变以获得相比于参考聚合酶(例如截断野生型Bst聚合酶)具有改变的催化特性的一种或多种聚合酶。在一些实施例中,SEQIDNO:18(对应于来自大肠杆菌的DNA聚合酶I的克列诺片段)可以在表1中所提供的氨基酸中的一个或多个处突变以获得相比于参考聚合酶(例如DNA聚合酶I的克列诺片段)具有改变的催化特性的一种或多种聚合酶。在一些实施例中,SEQIDNO:15(对应于野生型TaqDNA聚合酶)可以在表1中所提供的氨基酸中的一个或多个处突变以获得相比于参考聚合酶(例如TaqDNA聚合酶)具有改变的催化特性的一种或多种聚合酶。在一些实施例中,掺入表1中所鉴别的氨基酸突变中的一个或多个可以产生具有增强的催化特性的经修饰的聚合酶。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现改变(例如增加或减少)的阅读长度或改变的平均无误差阅读长度或改变(例如提高或降低)的观测到的100Q17或200Q17值。在一些实施例中,相对于参考聚合酶,经修饰的聚合酶展现以下动力学参数中的任何一个或多个的变化:平均阅读长度、最小阅读长度、在更高离子强度溶液中表现增强、改进的持续合成能力、聚合酶链反应中的性能、乳液聚合酶链反应中的性能、解离时间常数、解离速率、AQ20100Q17值以及200Q17值。
表1.
SEQ ID NO:16 SEQ ID NO:1 SEQ ID NO:18 SEQ ID NO:15
E515K E220K E245 E471
N529R N234R S259R N485R
V536K V241K T266K R492K
D559K D264 E290K D513K
D718K D423K A448K A675K
D775R D480R D505R D732R
N782W N487W A512W S739W
V783R V488R V740R
E788Q E493Q E518 E745
虽然不希望受任何特定理论束缚,但观测到,在四种聚合酶(全长Bst聚合酶、较大片段Bst聚合酶、TaqDNA聚合酶以及大肠杆菌PolI的克列诺片段)中每种聚合酶(表的聚合酶)九个不同氨基酸突变为可转移(同源)的。因此,有理由相信,在聚合酶中鉴别出氨基酸突变提供改变的催化特性后,可以使用所属领域的一般技术人员已知的方法(如氨基酸或核苷酸序列比对)筛选氨基酸突变以确定氨基酸突变是否可以转移到不同聚合酶,如不同物种、类别或聚合酶家族(如本文所展示)。在一些实施例中,可转移(或同源)氨基酸突变可以包括如以下增强催化特性的氨基酸突变:增加的阅读-长度、提高的原始准确度、减少的链偏差、减少的系统误差、改进的均聚物准确度、增加的总测序通量、增加的无误差阅读长度、增强的持续合成能力、提高的100Q17值、提高的200Q17值等。在一些实施例中,可转移(或同源)氨基酸突变可以包括如以下降低催化特性的氨基酸突变:减少的阅读-长度、减少的无误差阅读长度、降低的持续合成能力、降低的100Q17值、降低的200Q17值等。在一些实施例中,可转移(或同源)氨基酸突变可以包括在DNA聚合酶家族内或之间将一个或多个氨基酸突变转移到另一种聚合酶,所述家族如DNA聚合酶家族A、DNA聚合酶家族B或DNA聚合酶家族C。熟练的技术人员将显而易见,可转移(即,同源)氨基酸突变(如存在于第一聚合酶中的氨基酸取代)可以转移到同源聚合酶中的相应氨基酸位置。举例来说,具有第一氨基酸取代的第一聚合酶与B家族DNA聚合酶、A家族DNA聚合酶或C家族DNA聚合酶的序列比对可以产生同源A家族、B家族或C家族DNA聚合酶中的相应氨基酸残基的鉴别。B家族DNA聚合酶比对的实例在所属领域中是众所周知的并且包括例如Hopfner等人,《美国国家科学院院刊》(1999),96:3600-3605以及Kahler和Antranikian,《细菌学(Bacteriol.)》,(2000),182:655-663,其以全文引用的方式并入本文中。A和C家族DNA聚合酶比对的实例也是所属领域中熟知的并且包括例如Ito和Braithwaite,《核酸研究》,(1991),第19卷,15:4045-4057以及Braithwaite和Ito,《核酸研究》,(1993),第21卷,4:787-802,其以全文引用的方式并入本文中。在一些实施例中,可转移(或同源)氨基酸突变可以包括在DNA聚合酶家族内或之间,如跨越细菌、病毒、古细菌、真核或噬菌体DNA聚合酶将一个或多个氨基酸突变转移到一种或多种聚合酶。
在一些实施例中,根据本发明的经修饰的聚合酶可以包括具有一个或多个与本文所公开的氨基酸突变中的一个或多个同源的氨基酸突变(如取代、插入或缺失)的任何聚合酶。举例来说,本发明涵盖包括与本文针对BstDNA聚合酶所提供的一个或多个氨基酸突变(例如SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:16、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37)同源的一个或多个氨基酸突变的经修饰的聚合酶。在一些实施例中,根据本发明的经修饰的聚合酶可以包括具有与本文针对TaqDNA聚合酶所提供的一个或多个氨基酸突变(例如对应于SEQIDNO:15的一个或多个氨基酸突变的一个或多个同源氨基酸突变)同源的一个或多个氨基酸突变的任何聚合酶。在一些实施例中,根据本发明的经修饰的聚合酶可以包括具有与本文针对大肠杆菌DNA聚合酶I的克列诺片段所提供的一个或多个氨基酸突变(例如对应于SEQIDNO:18的一个或多个氨基酸突变的一个或多个同源氨基酸突变)同源的一个或多个氨基酸突变的任何聚合酶。
在一些实施例中,本发明涉及具有与BstDNA聚合酶的一个或多个氨基酸突变(例如H46R、E446Q以及H572R,其中编号相对于SEQIDNO:1的氨基酸序列)同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段。在一些实施例中,本发明涉及具有与BstDNA聚合酶的一个或多个氨基酸突变(H473R和H528A,其中编号相对于SEQIDNO:1的氨基酸序列)同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段。在一些实施例中,本发明涉及含有与BstDNA聚合酶的一个或多个氨基酸突变(H273R、H281A以及Y477F,其中编号相对于SEQIDNO:1的氨基酸序列)同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H46R、C93R、E220K、N234R、Q238C、A263K、D264A、D264R、H273N、H273R、H281A、H281M、D423K、E446Q、H473R、Y477F、D480R、N485K、N487R、E493R、H528A、H528F、H528S、H528R、H528K、C550Q以及H572R,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、V533I、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:N31R、N31K、H46A、H46R、D77K、D77H、C93R、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、Q238C、V241K、V251K、D264Q、D264S、D264K、Y272R、H273A、H273R、L280R、H281A、H281R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473A、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528R、V533I、C550Q、H572A、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H46A、H46R、C93R、Q238C、H273A、H273R、H281A、H281R、H281M、E446Q、H473A、H473R、Y477F、H528A、H528R、H528K、C550Q、H572A以及H572R,以及选自由以下组成的群组的一个或多个氨基酸取代:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、E325R、I331Q、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y以及D579F,其中编号相对于SEQIDNO:1的氨基酸序列。任选地,具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶可以进一步包括与选自由以下组成的群组的BstDNA聚合酶中的氨基酸取代同源的至少一个氨基酸取代:H46A、H46R、H273A、H273R、H281A、H281R、E446Q、H473A、H473R、Y477F、H528A、H528R、H572A以及H572R,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H46A、H46R、H273A、H273R、H281A、H281R、E446Q、H473A、H473R、Y477F、H528A、H528R、H572A以及H572R,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H46R、E446Q、H572R以及D775R,其中编号相对于SEQIDNO:1的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的氨基酸突变D775R同源的至少一个氨基酸突变的任何聚合酶,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H341R、C388R、E515K、Q533C、A558K、D559A、D559R、H568R、H568N、H576A、H576M、D718K、E741Q、H768R、Y772F、D775R、N780K、E788R、H823A、H823S、H823F、C845Q和H867R以及N529R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、Y567R、L575R、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:N326R、N326K、H341R、D372K、D372H、C388R、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、Q533C、D559Q、D559S、Y567R、H568R、L575R、H576A、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A、V828I、C845Q、H867R、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H341A、H341R、C388R、Q533C、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、C845Q、H867A以及H867R,以及选自由以下组成的群组的一个或多个氨基酸取代:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H341A、H341R、C388R、Q533C、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、C845Q、H867A以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:H341A、H341R、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、H867A以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。任选地,具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段可以进一步包括选自由以下组成的群组的至少一个氨基酸取代:H341A、H341R、H568A、H568R、H576A、H576R、H576M、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、H867A以及H867R,其中编号相对于SEQIDNO:16的氨基酸序列。在一些实施例中,具有与BstDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段包括选自这两个氨基酸取代群组中的每一个的任何两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与TaqDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R以及E745Q,其中编号相对于SEQIDNO:15的氨基酸序列。在一些实施例中,具有与TaqDNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段包括任何两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,根据本发明的经修饰的聚合酶或聚合酶的任何生物活性片段可以包括具有与克列诺片段DNA聚合酶I的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自由以下组成的群组的任何一个或多个氨基酸突变:E245K、S259K、T266K、E290K、A448K、D505R、A512W以及E518Q,其中编号相对于SEQIDNO:18的氨基酸序列。在一些实施例中,具有与克列诺片段DNA聚合酶I的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段包括任何两个、三个、四个、五个或更多个氨基酸取代。
在一些实施例中,具有与本文针对BstDNA聚合酶、TaqDNA聚合酶或来自大肠杆菌的克列诺片段DNA聚合酶I所公开的氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段可以任选地包括至少一个氨基酸取代,其经设计以用半胱氨酸残基替换非半胱氨酸氨基酸残基。举例来说,BstDNA聚合酶(例如SEQIDNO:16)可以任选地包括选自由以下组成的群组的一个或多个氨基酸取代:C388R、Q533C以及C845Q,其可以任选地包括于具有一个或多个同源氨基酸取代的任何经修饰的聚合酶中。
在一些实施例中,具有与BstDNA聚合酶、TaqDNA聚合酶或来自大肠杆菌DNA聚合酶I的克列诺片段的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处被任何其它氨基酸残基取代,其中编号相对于SEQIDNO:1、SEQIDNO:2、SEQIDNO:15、SEQIDNO:16以及SEQIDNO:18的氨基酸序列。
在一些实施例中,相对于参考聚合酶,具有与BstDNA聚合酶、TaqDNA聚合酶或克列诺片段DNA聚合酶I的一个或多个氨基酸突变同源的一个或多个氨基酸突变的经修饰的聚合酶或聚合酶的任何生物活性片段可以展现任何一个或多个选自由以下组成的群组的参数的变化:缓冲能力、解离时间常数、解离速率、100Q17值以及200Q17值。任选地,通过比较基于离子的测序反应中参考和经修饰的聚合酶的性能来观测变化。任选地,参考聚合酶、经修饰的聚合酶或参考和经修饰的聚合酶两者可以进一步包括降低或消除核酸外切酶活性的一个或多个氨基酸突变。
在一些实施例中,本发明大体上涉及编码包含本文所公开的特定氨基酸序列中的任一个的蛋白质的。举例来说,在一些实施例中,本发明大体上涉及编码具有或包含SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:18、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列或本文所公开的特定聚合酶(包括任何经修饰的聚合酶和参考聚合酶)的任何其它氨基酸序列的蛋白质的核苷酸序列。在一些实施例中,本发明大体上涉及编码与SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4、SEQIDNO:15、SEQIDNO:18、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列的任何核苷酸序列。一般技术者将容易地能够基于核苷酸序列与相应的蛋白质序列之间的已知对应性来确定编码本发明的氨基酸序列中的任一个的核苷酸序列。
在一些实施例中,本发明涉及编码具有或包含SEQIDNO:2的氨基酸序列的BstDNA聚合酶的分离的变异体的经修饰的聚合酶的核酸序列,其中所述变异体包含与SEQIDNO:2至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列。
举例来说,本发明大体上涉及具有或包含SEQIDNO:17的核酸序列的核酸序列:
SEQIDNO:17包括编码具有SEQIDNO:2的氨基酸序列并且进一步包括突变D775R的示例性经修饰的聚合酶的核酸序列。所属领域的技术人员显而易见如何修饰SEQIDNO:17的核酸序列以产生编码本文所公开的其它示例性参考或经修饰的聚合酶中的任一个的核酸序列。
在一些实施例中,本发明涉及与SEQIDNO:17的核酸序列至少50%、60%、70%、80%、90%、95%或99%一致的核酸序列。在一些实施例中,核酸序列编码具有SEQIDNO:2的氨基酸序列并且进一步包括选自由以下组成的群组的任何一个或多个突变的聚合酶:N31R、N31K、H46R、D77K、D77H、C93R、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、Q238C、V241K、V251K、D264Q、D264S、Y272R、H273R、L280R、H281A、H281M、E294S、E294F、E294G、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528K、V533I、C550Q、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:2的氨基酸序列。
在一些实施例中,核酸序列编码具有SEQIDNO:16的氨基酸序列并且进一步包括选自由以下组成的群组的任何一个或多个突变的聚合酶:N326R、N326K、H341R、D372K、D372H、C388R、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、Q533C、D559Q、D559S、Y567R、H568R、L575R、H576A、H576M、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A、H823K、V828I、C845Q、H867R、W872Y以及D874F,其中编号相对于SEQIDNO:16的氨基酸序列。
在一些实施例中,核酸序列编码具有SEQIDNO:15的氨基酸序列并且进一步包括选自由以下组成的群组的任何一个或多个突变的聚合酶:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R以及E745Q,其中编号相对于SEQIDNO:15的氨基酸序列。
在一些实施例中,核酸序列编码具有SEQIDNO:18的氨基酸序列并且进一步包括选自由以下组成的群组的任何一个或多个突变的聚合酶:E245K、S259R、T266K、E290K、A448K、D505R、A512W、R513R以及E518Q,其中编号相对于SEQIDNO:18的氨基酸序列。
在一些实施例中,可以采用密码子偏好原则设计核苷酸序列以提高给定宿主生物体中蛋白质的表达水平。
在一些实施例中,为了减慢模板从聚合酶解离的速率(并且提高其持续合成能力),经修饰的聚合酶或聚合酶的任何生物活性片段可以包括使得经修饰的聚合酶更缓慢地从核酸模板解离的一个或多个氨基酸突变。此类突变可以具有增加经修饰的聚合酶的阅读长度(或无误差阅读长度)的额外作用,相对于其未经修饰的对应物。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段可以包括一个或多个引入的半胱氨酸。此类引入的半胱氨酸可以充当连接聚合酶与另一个部分、底物或表面的位点。在一些实施例中,在选自由Q238和Q248组成的群组的至少一个位置处引入半胱氨酸,其中编号相对于SEQIDNO:2的氨基酸序列。举例来说,聚合酶可以包括以下氨基酸取代中的一个或两个:Q238C和Q248C。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段具有或包括SEQIDNO:2的氨基酸序列并且进一步包括利用不包括硫氢基侧链的其它氨基酸残基的半胱氨酸残基C93和C550的替换。举例来说,聚合酶可以包括以下氨基酸取代中的一个或两个:C93R和C550Q。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段具有(或包含)SEQIDNO:2的氨基酸序列,并且进一步包括氨基酸取代C93R、C550Q以及Q238C,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,引入的半胱氨酸残基(Q238C)直接或经由连接部分连接到桥连部分。桥连部分可以包括抗生物素蛋白。连接部分(在存在时)可以包括生物素。在一些实施例中,在位置238处引入的半胱氨酸残基可以经生物素化。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段具有(或包含)SEQIDNO:2的氨基酸序列,并且进一步包括氨基酸取代C93R、C550Q以及Q248C,其中编号相对于SEQIDNO:2的氨基酸序列。在一些实施例中,引入的半胱氨酸残基(Q248C)直接或经由连接部分连接到桥连部分。桥连部分可以包括抗生物素蛋白。连接部分(在存在时)可以包括生物素。在一些实施例中,在位置248处引入的半胱氨酸残基可以经生物素化。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段具有或包括SEQIDNO:2的氨基酸序列,并且进一步包括突变C93R和C550Q,以及半胱氨酸替换取代Q238C。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段具有或包括SEQIDNO:2的氨基酸序列,并且进一步包括突变C93R和C550Q,以及半胱氨酸替换取代Q248C。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段可以包括一个或多个生物素部分。如本文所使用,术语“生物素”和“生物素部分”以及其变化形式包含生物素(顺-六氢-2-氧代-1H-噻吩并[3,4]咪唑-4-戊酸)和其任何衍生物和类似物,包括生物素类化合物。此类化合物包括例如生物素-e-N-赖氨酸、生物胞素酰肼、2-亚氨基生物素的氨基或硫氢基衍生物和生物素基-ε-氨基己酸-N-羟基琥珀酰亚胺酯、磺酸基琥珀酰亚胺亚氨基生物素、生物素溴乙酰基酰肼、对重氮苯甲酰基生物胞素、3-(N-马来酰亚氨基丙酰基)生物胞素等,以及可以特异性结合到抗生物素蛋白部分的任何生物素变异体。如本文所使用,术语“抗生物素蛋白”和“抗生物素蛋白部分”以及其变化形式包含天然卵白糖蛋白抗生物素蛋白以及可以特异性结合到生物素部分的抗生物素蛋白的任何衍生物、类似物以及其它非天然形式。在一些实施例中,抗生物素蛋白部分可以包含抗生物素蛋白的去糖基化形式、由所选链霉菌属(例如阿维丁链霉菌(Streptomycesavidinii))病毒株产生的细菌抗生蛋白链菌素到截断抗生蛋白链菌素以及到重组抗生物素蛋白和抗生蛋白链菌素以及天然、去糖基化和重组抗生物素蛋白的衍生物所述天然、重组和截断抗生蛋白链菌素的衍生物,例如N-酰基抗生物素蛋白(例如N-乙酰基、N-苯二甲酰基以及N-丁二酰基抗生物素蛋白)以及市售产品 以及Neutralite包括天然和重组抗生物素蛋白和抗生蛋白链菌素以及衍生分子(例如非糖基化抗生物素蛋白、N-酰基抗生物素蛋白以及截断抗生蛋白链菌素)的抗生物素蛋白类型分子的所有形式都涵盖在术语“抗生物素蛋白”和“抗生物素蛋白部分”内。典型地但未必,抗生物素蛋白以四聚体蛋白质形式存在,其中四种四聚体中的每一种能够结合至少一个生物素部分。如本文所使用,术语“生物素-抗生物素蛋白键”和其变化形式是指在生物素部分与抗生物素蛋白部分之间形成的特定键。典型地,生物素部分可以高亲和力结合到抗生物素蛋白部分,其中解离常数Kd典型地大约为10-14到10-15mol/L。典型地,此类结合经由非共价相互作用进行。
在一些实施例中,经修饰的聚合酶或聚合酶的任何生物活性片段可以包括一个或多个相对于参考聚合酶经修饰或经取代的氨基酸,并且可以进一步包括连接到一个或多个经修饰或经取代的氨基酸中的至少一个的生物素部分。可以使用任何适合的连接方法将生物素部分连接到经修饰的聚合酶。在一些实施例中,经修饰的聚合酶包括一个或多个半胱氨酸替换取代,并且连接部分包括连接到一个或多个半胱氨酸替换取代中的至少一个的生物素部分。
在一些实施例中,经修饰的聚合酶是生物素化聚合酶。如本文所使用,术语“生物素化”和其变化形式是指生物素与其它部分的任何共价或非共价加合物,所述其它部分如生物分子,例如蛋白质、核酸(包括DNA、RNA、DNA/RNA嵌合分子、核酸类似物以及肽核酸);蛋白质(包括酶、肽以及抗体);碳水化合物;脂质等。
在一些实施例中,本发明大体上也涉及包含相对于参考聚合酶包括至少一个氨基酸修饰的经修饰的聚合酶的组合物(以及相关方法、套组以及设备),其中经修饰的聚合酶具有相对于参考聚合酶更慢地从核酸模板解离的速率。在一些实施例中,可以改变解离速率以使得解离速率提高结合亲和性,例如在中性渗透剂存在下,所述渗透剂如甜菜碱、三甲胺N-氧化物、海藻糖、蔗糖、乙二醇等。
如本文所使用,术语“解离速率(dissociationrate)”或“解离速率(off-rate)”是指给定聚合酶从给定模板核酸解离的速率。解离速率(dissociationrate/off-rate)可以随着反应条件变化,所述反应条件包括温度、盐浓度、聚合酶和模板的相对浓度等。在一些实施例中,解离速率可以通过测量在给定反应条件下结合到模板核酸的聚合酶总量的减少来估算。此类分析可以任选地使用防止聚合酶从模板解离之后聚合酶再结合到模板的条件进行。举例来说,在典型的解离结合实验中,为了测量从核酸模板解离的聚合酶的「解离速率」,起初允许聚合酶和核酸模板结合,任选地平衡。任选地,可以使用任何适合的标记(例如放射性或荧光标记)标记聚合酶。此时,可以任选地阻隔聚合酶进一步结合到模板以简化从模板解离的速率的测量。可以使用任何适合的方法进行此类阻隔。举例来说,在模板被固定到表面并且聚合酶被标记的实施例中,可以通过以下实现阻隔:(1)去除包括标记的聚合酶的缓冲液并且用不包括标记的聚合酶的缓冲液替换;或(2)将极高浓度未标记的聚合酶添加到反应混合物中;或(3)以较大因子稀释反应混合物(例如至少20倍或100倍),尤其当标记的聚合酶的初始浓度较低时。在此类阻隔之后,可以在此类阻隔之后不同时间点测量结合到模板的聚合酶的总量以测定聚合酶从模板解离的速度。可以映射结合到模板的聚合酶的量(Y轴线)与时间(X轴)。在一些实施例中,所得曲线接近单一指数衰减曲线。图1描绘来自典型的实验的解离速率曲线。
在一些实施例中,结合实验的分析可以基于衍生自质量作用定律的简单模型。这一模型假定结合是可逆的并且允许计算koff(解离速率常数)。(在以下分析中,聚合酶和核酸模板称为“配体”和“受体”):
在一些实施例中,当聚合酶和模板核酸由于扩散而碰撞时,并且当碰撞具有正确定向和足够的能量时结合发生。缔合速率是:
每时间单位结合事件次数=[配体]·[受体]·kon。
在结合已发生后,配体和受体可以保持结合在一起持续随机的时间量。在每个时刻,解离的机率相同。
解离速率是:
每单位时间解离事件次数=[配体·受体]·koff。
当新的配体·受体复合物形成速率等于配体·受体复合物解离速率时,达到平衡。平衡时:
这一等式可以重新排列以定义平衡解离常数Kd。
如果在上述等式中[配体]设定为等于Kd,那么Kd项抵消,并且
[受体]/[配体·受体]=1,
因此,[受体]等于[配体·受体]。因为所有受体是自由的或结合到配体,这意味着一半受体是自由的并且一半结合到配体。换句话说,当配体的浓度等于Kd时,平衡时将占据一半受体。如果受体对配体具有高亲和力,那么Kd将较低,因为其将采用低浓度配体来结合一半受体。
在此类模型中,Kd(平衡解离常数)与koff(解离速率常数)(在本文中也被称作“解离时间常数”)不同。
在一个示例性分析中,如本文实例中所描述,可以通过在限定的条件下用包括荧光标记的经标记的寡核苷酸(在本文中被称作“寡核苷酸221”)培育聚合酶来测量给定聚合酶的解离时间常数。当寡核苷酸未被聚合酶结合时,寡核苷酸上荧光标记的荧光猝灭;聚合酶与寡核苷酸结合导致寡核苷酸标记的去猝灭和荧光的所得增加。通过将未标记的竞争寡核苷酸添加到反应混合物中来引发阻隔;随着聚合酶从荧光标记的寡核苷酸221解离,竞争寡核苷酸与寡核苷酸221杂交并且防止聚合酶的进一步结合。随时间推移监测荧光。在添加竞争寡核苷酸后不同时间点测量反应混合物的荧光。绘制所观测到的荧光(以RFU或相对荧光单位计)(Y轴线)与时间(X轴)。为了比较两种或更多种不同酶(例如参考和经修饰的聚合酶)的解离速率,可以在平行和单独反应中采用各种酶,其中在不同时间点测量各反应混合物的荧光,其后各种酶的解离速率可以使用任何适合的方法计算并比较。在本文所提供的实例中,根据下式计算解离速率:
Y=(Y0-平线区)*exp(-K*X)+平线区
其中:
Y0是X(时间)是零时的Y值。其以与Y相同的单位表示,
平线区是无限时间时的Y值,以与Y相同的单位表示。
K是速率常数,以X轴时间单位的倒数表示。如果X以分钟计,那么K以相反分钟表示。
Tau是时间常数,以与X轴相同的单位表示。其以K的倒数形式计算。
半衰期以X轴的时间单位计。其以ln(2)/K形式计算。
时间间隔,即(Y0-平线区)是Y0与平线区之间的差值,以与你的Y值相同的单位表示。
图2描绘如实例中所描述进行的示例性分析的结果,其中在不同盐浓度下测量各种示例性Bst突变体的解离时间常数并比较。
在一些实施例中,本发明大体上涉及一种用于将至少一种核苷酸掺入到引物中的方法,其包含:在一种或多种核苷酸存在下使包括模板核酸的核酸复合物与引物和经修饰的聚合酶接触,以及使用所述经修饰的聚合酶以模板依赖性方式将一种或多种核苷酸中的至少一种掺入到引物中。
用于核苷酸掺入的方法在所属领域中是众所周知的并且典型地包含使用聚合酶反应混合物,其中在核苷酸掺入条件下使聚合酶与模板核酸接触。当核苷酸掺入反应包含使核苷酸聚合到引物末端上时,所述过程典型地称为“引物延伸”。典型地但未必,此类核苷酸掺入以模板依赖性方式进行。引物延伸和其它核苷酸掺入分析典型地通过在核苷酸存在下在水溶液中在核苷酸掺入条件下使模板核酸与聚合酶接触来进行。在一些实施例中,核苷酸掺入反应可以包括引物,其可以任选地与模板杂交以形成引物-模板双螺旋体。典型的核苷酸掺入条件在模板、聚合酶、核苷酸以及任选地引物在适合的水性调配物中彼此混合,从而形成核苷酸掺入反应混合物(或引物延伸混合物)后实现。水性调配物可以任选地包括二价阳离子和/或盐,尤其Mg++和/或Ca++离子。水性调配物可以任选地包括二价阴离子和/或盐,尤其SO4 2-。典型的核苷酸掺入条件已包括时间、温度、pH、试剂、缓冲液、试剂、盐、辅因子、核苷酸、靶DNA、引物DNA、酶(如核酸依赖性聚合酶)、量和/或反应中组分的比率等熟知参数。试剂或缓冲液可以包括单价离子源,如KCl、K-乙酸盐、NH4-乙酸盐、K-谷氨酸、NH4Cl或硫酸铵。试剂或缓冲液可以包括二价离子源,如Mg2+和/或Mn2+、MgCl2或Mg-乙酸盐。在一些实施例中,试剂或缓冲液可以包括洗涤剂来源,如曲拉通(Triton)和/或吐温(Tween)。大多数聚合酶在约5.0到约9.5的pH范围,更典型在约pH7与约pH9之间,有时在约pH6到约pH8之间,并且有时在7与8之间展现一定水平的核苷酸掺入活性。缓冲液可以包括螯合剂,如EDTA和EGTA等。尽管在一些实施例中,核苷酸掺入反应可以包括缓冲剂,如Tris、麦黄酮(Tricine)、HEPES、MOPS、ACES或MES,其可以提供约5.0到约9.5的pH范围,可以任选地在进行需要检测离子副产物的基于离子的反应时减少或省去此类缓冲剂。进行核酸合成的方法是熟知的并且在所属领域中广泛实施并且教示广泛范围的核酸合成技术的参考文献是容易获得的。关于进行核酸合成的一些示例性教示内容(包括例如模板依赖性核苷酸掺入以及引物延伸方法)可以见于例如Kim等人,《自然》376:612-616(2002);Ichida等人,《核酸研究》33:5214-5222(2005);Pandey等人,《欧洲生物化学杂志》,214:59-65(1993);Blanco等人,《生物化学杂志》268:16763-16770(1993);现公开为美国专利公开案第2009/0026082号的美国专利申请序列号12/002781;现公开为美国专利公开案第2010/0137143号的美国专利申请序列号12/474897;以及现公开为美国专利公开案第2010/0282617号的美国专利申请序列号12/492844;现公开为美国专利公开案第20110014612号的美国专利申请序列号12/748359中。考虑到在所属领域中引物延伸和其它核苷酸掺入反应的充分教示,所属领域的技术人员将显而易见使用本发明的经修饰的聚合酶来进行核苷酸掺入的适合的反应条件。
在一些实施例中,本发明大体上涉及适用于使用经修饰的聚合酶进行核苷酸聚合反应的试剂(例如缓冲液组合物)和套组,所述经修饰的聚合酶包括此处所描述的示例性经修饰的聚合酶中的任一种。核苷酸聚合反应可以包括(但不限于)核苷酸掺入反应(包括模板依赖性和模板非依赖性核苷酸掺入反应)以及引物延伸反应。在一些实施例中,缓冲液组合物可以包括以下各者中的任何一个或多个:单价金属盐、二价金属盐、二价阴离子以及洗涤剂。举例来说,缓冲液组合物可以包括钾盐或钠盐。在一些实施例中,缓冲液组合物可以包括锰盐或镁盐。在一些实施例中,缓冲液组合物可以包括硫酸盐,如硫酸钾和/或硫酸镁。在一些实施例中,缓冲液组合物可以包括选自由曲拉通和吐温组成的群组的洗涤剂。
在一些实施例中,缓冲液组合物可以包括至少一种钾盐、至少一种锰盐以及曲拉通X-100(皮尔斯生物化学公司(PierceBiochemicals))。盐可以任选地为氯化物盐或硫酸盐。
在一些实施例中,缓冲液组合物可以包括至少一种钾盐、至少一种镁盐以及曲拉通X-100(皮尔斯生物化学公司)。盐可以任选地为氯化物盐或硫酸盐。
在一些实施例中,缓冲液组合物具有约7.3到约8.0,典型地约7.4到约7.9的pH。
在一些实施例中,缓冲液组合物包括浓度在1mM与20mM之间,尤其6-15mM的镁盐或锰盐。
在一些实施例中,缓冲液组合物包括浓度在1mM与100mM之间,尤其5-50mM的硫酸盐。
在一些实施例中,缓冲液组合物包括浓度在0.001%到1%之间,典型地在0.0025%与0.0125%之间的洗涤剂(例如曲拉通X-100或吐温-20)。
在一些实施例中,所公开的经修饰的聚合酶组合物(以及相关方法、系统、设备以及套组)可以用于从核酸分子获得序列信息。从核酸分子获得序列信息的许多方法是所属领域中已知的,并且将容易了解,所有此类方法都在本发明的范围内。使用所公开的经修饰的聚合酶测序的适合的方法包括(但不限于):桑格测序(Sangersequencing)、基于连接的测序(也称为杂交测序)以及合成测序。基于模板核酸的序列,合成测序方法典型地涉及模板依赖性核酸合成(例如使用与模板核酸或自引发模板杂交的引物,如所属领域的技术人员将了解)。即,新合成的核酸链的序列典型地与模板核酸的序列互补,并且因此知道核苷酸掺入到合成链中的顺序和一致性可以提供关于模板核酸链的序列的信息。当通过经修饰的聚合酶以模板依赖性方式使核苷酸聚合时,使用本发明的经修饰的聚合酶的合成测序将典型地涉及检测核苷酸掺入的顺序和一致性。使用标记的核苷酸的合成测序的一些示例性方法包括单分子测序(参见例如美国专利第7,329,492号和U.S.7,033,764),其典型地涉及使用标记的核苷酸来检测核苷酸掺入。在一些实施例中,所公开的聚合酶组合物(和相关方法、套组、系统以及设备)可以用于获得针对全基因组测序、扩增子测序、目标再测序、单分子测序、多重或带条码的测序以及配对端测序应用的序列信息。
在一些实施例中,所公开的经修饰的聚合酶组合物以及相关方法、系统、设备和套组可以用于扩增核酸分子。在一些实施例中,核酸分子可以使用经修饰的聚合酶,例如通过焦磷酸测序、聚合酶链反应、乳液聚合酶链反应、桥式聚合酶链反应等来扩增。
在一些实施例中,所公开的经修饰的聚合酶组合物(以及相关方法、系统、设备和套组)可以用于产生核酸库。在一些实施例中,所公开的经修饰的聚合酶组合物可以用于产生多种下游工艺的核酸库。用于产生核酸库的许多方法是所属领域中已知的,并且将容易了解,所有此类方法都在本发明的范围内。适合的方法包括(但不限于)使用乳液PCR、桥式PCR、PCR、qPCR、RT-PCR以及核酸扩增的其它形式产生的核酸库,取决于聚合。在一些实施例中,所述方法可以包括模板依赖性核酸扩增。在一些实施例中,所述方法可以包括引物:模板双螺旋体或核酸模板,根据所述引物:模板双螺旋体或核酸模板,经修饰的聚合酶可以进行核苷酸掺入。在一些实施例中,核酸可以包括具有二级结构的单链核酸,所述二级结构如发夹或茎环,其可以提供在聚合期间经修饰的聚合酶可以掺入核苷酸的单链突出端。在一些实施例中,使用根据本发明的经修饰的聚合酶中的一种或多种产生核酸库的方法可以包括产生长度为50、100、200、300、400、500、600或更多个碱基对的核酸库。在一些实施例中,经修饰的聚合酶可以进行核苷酸掺入的核酸模板可以附接、连接或结合到载体,如固体载体。在一些实施例中,载体可以包括平坦载体,如载玻片。在一些实施例中,载体可以包括粒子,如IonSphereTM粒子(由加利福尼亚州生命技术公司出售)。
在一些实施例中,本发明大体上涉及一种用于产生核酸库的方法,其包含在聚合条件下使核酸模板与经修饰的聚合酶和一种或多种dNTP接触;从而将一种或多种dNTP掺入到核酸模板中以产生核酸库。在一些实施例中,所述方法可以进一步包括在较高离子强度溶液存在下产生核酸库或测序核酸库。在一些实施例中,本发明大体上涉及在较高离子强度溶液存在下保留聚合酶活性的经修饰的聚合酶。在一些实施例中,较高离子强度溶液可以是约150mM盐150。在一些实施例中,较高离子强度溶液可以是约120mM到约200mM盐。在一些实施例中,较高离子强度溶液可以是约130mMmM盐。在一些实施例中,较高离子强度溶液可以是至少125mM盐。在一些实施例中,所述盐可以包括钾盐和/或钠盐。在一些实施例中,离子强度溶液可以进一步包括硫酸盐。在一些实施例中,在相同条件下,与不具有相同突变(或同源突变)中的一个或多个的参考聚合酶相比,经修饰的聚合酶能够在较高离子强度溶液存在下以更大能力扩增(和/或测序)核酸分子(例如,如通过原始准确度或均聚物准确度所测量)。在一些实施例中,在标准离子强度条件(即,低于更高离子强度溶液,例如50mM盐)下,与不具有突变(或同源突变)中的一个或多个的参考聚合酶相比,经修饰的聚合酶能够在较高离子强度溶液存在下以更大能力扩增(和/或测序)核酸分子(例如,如通过原始准确度或均聚物准确度所测量)。
任选地,所述方法进一步包括在聚合条件下重复添加一种或多种dNTP以将多种dNTP掺入到核酸模板中以产生核酸库。在一些实施例中,所述方法包括在聚合条件下检测一种或多种dNTP的添加。在一些实施例中,所述方法包括在聚合条件下鉴别一种或多种dNTP的添加(例如A、G、C、T、A核苷酸流和核苷酸掺入)。
在一些实施例中,所述方法可以进一步包括在聚合期间检测核苷酸掺入副产物。在一些实施例中,核苷酸掺入副产物可以包括氢、焦磷酸根或磷酸根离子。
在一些实施例中,所述方法进一步包括测定核酸库中掺入的dNTP的一致性。在一些实施例中,所述方法进一步包括测定核酸库中掺入的核苷酸的数目。在一些实施例中,检测可以进一步包括测序核酸库。
在一些实施例中,所公开的经修饰的聚合酶组合物(以及相关方法、系统、设备和套组)可以用于经由核苷酸掺入事件期间副产物形成产生来检测核苷酸掺入。检测核苷酸掺入副产物的许多方法是所属领域中已知的,并且将容易了解,所有此类方法都在本发明的范围内。核苷酸副产物检测的适合的方法包括(但不限于)检测氢离子、无机磷酸盐、无机焦磷酸盐等。若干这些副产物检测方法典型地涉及模板依赖性核苷酸掺入。
在一些实施例中,经修饰的聚合酶可以用于进行无标记核酸测序,并且尤其基于离子的核酸测序。包括基于离子的核酸测序的无标记核酸测序的概念(包括以下参考文献)以引用的方式并入:Rothberg等人的美国专利公开案第2009/0026082号、第2009/0127589号、第2010/0301398号、第2010/0300895号、第2010/0300559号、第2010/0197507号以及第2010/0137143号,所述专利以全文引用的方式并入本文中。简单来说,在此类核酸测序应用中,通过检测聚合酶催化的核酸合成反应的天然副产物的存在来确定核苷酸掺入,所述副产物包括氢离子、多磷酸盐、PPi以及Pi(例如在焦磷酸酶存在下)。
在基于离子的核酸测序的典型实施例中,通过检测由聚合酶催化的核酸合成反应(包括例如引物延伸反应)产生的氢离子的存在和/或浓度来检测核苷酸掺入。在一个实施例中,对可操作地结合到引物和聚合酶并且位于反应腔室(如上文列举的Rothberg等人中所公开的微孔)内的模板进行聚合酶催化的核苷酸添加到引物(“添加步骤”)中继而洗涤(“洗涤步骤”)的重复循环。在一些实施例中,此类模板可以作为克隆种群连接到固体载体,如微粒、珠粒等,并且将所述克隆种群装载到反应腔室中。如本文所使用,“可操作地结合”意指引物退火到模板以使得引物可以通过聚合酶延伸并且聚合酶结合到此类引物-模板双螺旋体或与其极为接近以使得每当供应核苷酸时,发生引物延伸。
在循环的各个添加步骤中,通过以模板依赖性方式掺入添加的核苷酸,聚合酶使引物延伸,以使得核苷酸仅在模板中的下一个碱基是所添加的核苷酸的补体时才掺入。如果存在一个互补碱基,那么存在一次掺入,如果存在两个互补碱基,那么存在两次掺入,如果存在三个互补碱基,那么存在三次掺入,以此类推。伴随各次此类掺入存在所释放的氢离子,并且模板释放氢离子群体共同地改变反应腔室的局部pH。在一些实施例中,氢离子的产生与模板中的连续互补碱基数目(以及具有参与延伸反应的引物和聚合酶的模板分子的总数)成正比(例如单调相关)。因此,当模板中存在许多连续一致互补碱基(即,均聚物(HP)区域)时,所产生的氢离子的数目以及因此局部pH变化的幅值与连续一致互补碱基的数目成正比。如果模板中下一个碱基不与所添加的核苷酸互补,那么不会发生掺入并且不会释放氢离子。在一些实施例中,在添加核苷酸的各个步骤之后,进行洗涤步骤,其中使用在预定pH下的无缓冲洗涤溶液来前述步骤的核苷酸以防止随后循环中的误掺入。在一些实施例中,在添加核苷酸的各个步骤之后,可以进行额外步骤,其中用核苷酸破坏剂(如腺苷三磷酸双磷酸酶)处理反应腔室以消除残留在腔室中的任何残余核苷酸,从而使后续循环中假延伸的机率减到最小。在一些实施例中,可以包括处理作为洗涤步骤自身的一部分。
在一个示例性实施例中,将不同种类(或“类型”)的核苷酸依次添加到反应腔室中,以使得各种反应物一次一个地曝露于不同核苷酸类型。举例来说,核苷酸类型可以按以下顺序添加:dATP、dCTP、dGTP、dTTP、dATP、dCTP、dGTP、dTTP等;其中每次曝露后接洗涤步骤。循环可以重复50次、100次、200次、300次、400次、500次、750次或更多次,取决于所需序列信息长度。在一些实施例中,可以取决于所需测序信息,改变将各种核苷酸依次施加到反应腔室中(即,流循环)所花费的时间。举例来说,当测序长核酸分子时,流循环可以在一些情况下减少以减少测序整个核酸分子所需的总时间。在一些实施例中,可以增加流循环,例如当测序短核酸或扩增子时。在一些实施例中,流循环可以是约0.3秒到约3秒,并且更典型地约0.5秒到约1.5秒。
在一个示例性实施例中,本发明大体上涉及一种用于从核酸模板获得序列信息的方法,其包含:
(a)提供包括与测序引物杂交并且结合到经修饰的聚合酶的模板核酸的反应混合物,其中经修饰的聚合酶包含经由聚合酶内一个或多个连接位点连接到桥连部分的聚合酶。
(b)使模板核酸与核苷酸接触,其中如果核苷酸与模板核酸中的相应核苷酸互补,那么接触包括将核苷酸掺入到测序引物中并且产生测序副产物;以及
(c)检测反应混合物中测序副产物的存在,从而判定是否已发生核苷酸掺入。
在一些实施例中,所述方法可以进一步包括重复接触和检测步骤至少一次。
在一些实施例中,经修饰的聚合酶的聚合酶包括单一连接位点,并且桥连部分经由单一连接位点直接或经由连接部分连接到聚合酶。在一些实施例中,单一连接位点可以连接到生物素部分,并且桥连部分可以包括抗生物素蛋白部分。在一些实施例中,在另外类似或相同的反应条件下,相对于聚合酶的未经修饰的形式,经修饰的聚合酶展现增加的阅读长度和/或持续合成能力。
在一些实施例中,检测测序副产物的存在包括使反应混合物与能够感测测序副产物存在的传感器接触。所述传感器可以包括场效应晶体管,例如chemFET或ISFET。
在一些实施例中,测序副产物包括氢离子、染料连接部分、多磷酸盐、焦磷酸盐或磷酸盐部分,并且检测测序副产物的存在包括使用ISFET来检测测序副产物。在一些实施例中,检测测序副产物包括使用ISFET检测氢离子。
在另一个实施例中,本发明大体上涉及一种检测核苷酸掺入的方法,其包含:
(a)使用经修饰的聚合酶进行核苷酸掺入并且产生核苷酸掺入的一种或多种副产物;以及
(b)检测核苷酸掺入的一种或多种副产物中的至少一种的存在,从而检测核苷酸掺入。
在一些实施例中,经修饰的聚合酶包括连接到桥连部分的聚合酶。桥连部分任选地经由经修饰的聚合酶内的一个或多个连接位点连接到聚合酶。在一些实施例中,桥连部分经由连接部分连接到聚合酶。连接部分可以连接到聚合酶的一个或多个连接位点中的至少一个。在一些实施例中,经修饰的聚合酶的聚合酶包括单一连接位点,并且桥连部分经由单一连接位点直接或经由连接部分连接到聚合酶。在一些实施例中,单一连接位点可以连接到生物素部分,并且桥连部分可以包括抗生物素蛋白部分。在一些实施例中,桥连部分经由至少一个生物素-抗生物素蛋白键连接到聚合酶。在一些实施例中,在另外类似或相同的反应条件下,相对于参考聚合酶提高,经修饰的聚合酶展现增加的阅读长度和/或持续合成能力和/或阅读准确度、增加的总通量、减少的链偏差、减少的系统误差。
在一些实施例中,所述方法可以进一步包括重复进行和检测步骤至少一次。
在一些实施例中,检测核苷酸掺入的至少一种副产物的存在包括使用能够感测副产物的存在的传感器。所述传感器可以包括场效应晶体管,例如chemFET或ISFET。
在一些实施例中,核苷酸掺入的至少一种副产物包括氢离子、染料连接部分、多磷酸盐、焦磷酸盐或磷酸盐部分,并且检测至少一种副产物的存在包括使用ISFET来检测至少一种副产物。在一些实施例中,至少一种副产物包括氢离子,并且检测测序副产物的存在包括使用ISFET检测氢离子。
在一些实施例中,本发明大体上涉及一种检测核苷酸聚合反应期间离子浓度变化的方法,其包含:
(a)使用经修饰的聚合酶(包括连接到桥连部分的聚合酶)进行核苷酸聚合反应,其中在核苷酸聚合反应过程期间至少一种类型离子的浓度改变;以及
(b)检测指示至少一种类型离子的浓度变化的信号。
在一些实施例中,桥连部分经由经修饰的聚合酶内的一个或多个连接位点连接到聚合酶。在一些实施例中,桥连部分经由连接部分连接到聚合酶。连接部分可以连接到聚合酶的一个或多个连接位点中的至少一个。在一些实施例中,经修饰的聚合酶的聚合酶包括单一连接位点,并且桥连部分经由单一连接位点直接或经由连接部分连接到聚合酶。在一些实施例中,单一连接位点可以连接到生物素部分,并且桥连部分可以包括抗生物素蛋白部分。在一些实施例中,桥连部分经由至少一个生物素-抗生物素蛋白键连接到聚合酶。在一些实施例中,在另外类似或相同的反应条件下,相对于聚合酶的参考形式,经修饰的聚合酶展现增加的阅读长度和/或持续合成能力。
在一些实施例中,所述方法可以进一步包括重复进行和检测步骤至少一次。
在一些实施例中,检测至少一种类型离子的浓度变化包括使用能够感测副产物的存在的传感器。所述传感器可以包括场效应晶体管,例如chemFET或ISFET。
在一些实施例中,至少类型离子包括氢离子、染料连接部分、多磷酸盐、焦磷酸盐或磷酸盐部分,并且检测至少一种类型离子的浓度变化包括使用ISFET来检测至少一种类型的离子。在一些实施例中,至少一种类型的离子包括氢离子,并且检测至少一种类型的离子的存在包括使用ISFET检测氢离子。
在一个示例性实施例中,本发明大体上涉及一种用于从核酸模板获得序列信息的方法,其包含:
(a)提供包括与测序引物杂交并且结合到经修饰的聚合酶的模板核酸的反应混合物;
(b)使模板核酸与核苷酸接触,其中接触包括将核苷酸掺入到测序引物中并且产生延伸的引物产物;以及
(c)检测反应混合物中延伸的引物产物的存在,从而判定是否已发生核苷酸掺入。在一些实施例中,经修饰的聚合酶包含SEQIDNO:2、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:31、SEQIDNO:32、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37。
在一个示例性实施例中,本发明大体上涉及一种用于扩增核酸模板的方法,其包含:
(a)提供包括与引物杂交并且结合到经修饰的聚合酶的核酸模板的反应混合物;
(b)使核酸模板与核苷酸接触,其中接触包括将核苷酸掺入到引物中并且产生延伸的引物产物;以及
(c)检测反应混合物中延伸的引物产物的存在,从而判定是否已发生核苷酸掺入。在一些实施例中,经修饰的聚合酶包含SEQIDNO:2、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:31、SEQIDNO:32、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36或SEQIDNO:37。
以下非限制性实例仅借助于说明示例性实施例提供,并且决不限制本发明的范围和精神。此外,应理解,本文中所公开或要求的任何本发明涵盖本文所描述的任何一个或多个特征的所有变型、组合以及置换。任何一个或多个特征可以明确地从权利要求排除,即使特定排除未明确阐述于本文中。还应理解,除非所属领域的一般技术人员应另外理解,否则根据本文所公开的特定方法或所属领域中已知的其它方法,适用于方法中的试剂的公开内容意图与涉及所述试剂的使用的方法同义(并且提供支持)。另外,除非所属领域的一般技术人员应另外理解,否则在说明书和/或权利要求公开一种方法的情况下,本文所公开的试剂中的任何一种或多种可以用于所述方法中。
实例
实例1:示例性经修饰的聚合酶的纯化
经由定点突变诱发将各种示例性突变引入到具有SEQIDNO:2的氨基酸序列的示例性参考聚合酶中。将编码这些经修饰的聚合酶的重组表达构筑体转化到细菌中。将含有表达构筑体的菌落接种到BRM培养基中,生长到OD=0.600并且通过添加IPTG达到1mM的最终浓度来进行诱导。接着在37℃下使细胞另外生长3小时。
在6000rpm下离心经诱导的细胞10分钟,丢弃上清液,并且使细胞再悬浮于再悬浮缓冲液(10mMTris,pH7.5,100mMNaCl)中。在60的设定(幅值)下超声处理再悬浮细胞一分钟,并且接着放置在冰上1分钟。以此方式重复超声处理总共5次。
在65℃下培育样品10分钟。样品在9000rpm下离心30分钟。回收上清液并且在肝素柱上进一步纯化。分析经纯化的聚合酶以测量解离速率常数,如以下实例中所描述。
实例2:测量示例性经修饰的聚合酶和参考聚合酶的解离速率
分析根据实例1制备的经修饰的聚合酶以及具有SEQIDNO:2的氨基酸序列的参考聚合酶的样品以测量解离速率常数。这一分析的目标是测量聚合酶从具有以下核苷酸序列的荧光标记的DNA模板(寡核苷酸221)解离的速率:
TTTTTTTGCAGGTGACAGGTTTTTCCTGTCACCNGC(SEQIDNO:21),其中N是荧光素-dT。
通过Bst聚合酶从模板解离时发生的荧光减少来测量解离。通过添加大量过量具有以下核苷酸序列的未标记的竞争DNA(发夹寡核苷酸173)来引发解离:
TTTTTTTCCCTTTCCTTTCGGGTGACAGGTTTTTCCTGTCACCC(SEQIDNO:22)。
当聚合酶从寡核苷酸221解离时,其通过竞争者结合并且因此无法再结合初始221模板。
为了进行分析,在96孔培养盘中组装含有30mMTris(pH7.5)、20mMNaCl、50nM寡核苷酸221的反应物(75μl)和约10-200nM部分聚合酶样品(根据实例1制备)。接着在使用490nm激发和525nm发射波长的分光光度计上获取基线读数。接着将173竞争寡核苷酸(2μM最终浓度)快速添加到各孔中并且将培养盘快速传回到分光光度计中以便每30秒读取持续5分钟。通过使用根据下式,使数据与单相指数衰减等式拟合来计算解离速率:
Y=(Y0-平线区)*exp(-K*X)+平线区
其中:
Y0是X(时间)是零时的Y值。其以与Y相同的单位表示,
平线区是无限时间时的Y值,以与Y相同的单位表示。
K是速率常数,以X轴时间单位的倒数表示。如果X以分钟计,那么K以相反分钟表示。
Tau是时间常数,以与X轴相同的单位表示。其以K的倒数形式计算。
半衰期以X轴的时间单位计。其以ln(2)/K形式计算。
时间间隔,即(Y0-平线区)是Y0与平线区之间的差值,以与你的Y值相同的单位表示。
图2中描绘了分析的代表性结果,其中各种经修饰的聚合酶以及具有SEQIDNO:2的氨基酸序列的参考聚合酶的解离速率常数(也称为“解离时间常数”)在不同盐浓度下测量。分析中所包括的聚合酶在图2中表示如下:Bst1=具有SEQIDNO:2的氨基酸序列的参考聚合酶;480R=具有SEQIDNO:2的氨基酸序列并且进一步包括突变D480R的经修饰的聚合酶;425R=具有SEQIDNO:2的氨基酸序列并且进一步包括突变G425R的经修饰的聚合酶;144K=具有SEQIDNO:2的氨基酸序列并且进一步包括突变D144K的经修饰的聚合酶;以及488K=具有SEQIDNO:2的氨基酸序列并且进一步包括突变F448K的经修饰的聚合酶。如图2中所指示,在给定盐浓度下,相比于具有SEQIDNO:2的参考聚合酶,经修饰的聚合酶中的一些展现明显更高的解离时间常数。
图3提供相对于针对具有SEQIDNO:2的氨基酸序列的参考聚合酶(在图3中称为“BST”)所观测到的模板亲和性,针对根据实例1和2制备的各种经修饰的聚合酶所观测到的相对模板亲和性的表清单。各种经修饰的聚合酶具有SEQIDNO:2的氨基酸序列,加上表第一列中列出的氨基酸取代。如图3中所指示,相对于参考聚合酶Bst,经修饰的聚合酶中的一些展现明显提高的模板亲和性;在一些情况下,模板亲和性的提高为20倍、30倍、100倍或更大。
实例3:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
包含具有SEQIDNO:2的氨基酸序列并且进一步包括氨基酸取代D480R(其中编号相对于SEQIDNO:2的氨基酸序列)的突变体Bst聚合酶的经修饰的聚合酶基本上如实例1中所描述经纯化。接着评估经修饰的聚合酶和参考聚合酶(具有SEQIDNO:2的氨基酸序列)(对照反应物)在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(UserGuidefortheIonFragmentLibraryKit)(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM314测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司的子公司(卡尔斯巴德,加利福尼亚州)。
分析使用参考或经修饰的聚合酶的所得测序读数组来测量50Q17读数、100Q17读数以及200Q17读数的数值。使用PGMTM测序系统所供应的标准软件,测量并且比较在使用参考和经修饰的聚合酶的测序反应中获得的100Q17或200Q17读数的总数值。相对于参考聚合酶(数据未示),包括突变D480R的示例性经修饰的聚合酶提供明显提高的50Q17读数、100Q17读数以及200Q17读数的数值。
实例4:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
包含具有SEQIDNO:2的氨基酸序列并且进一步包括氨基酸取代D264K和E493Q(其中编号相对于SEQIDNO:2的氨基酸序列)的突变体Bst聚合酶的经修饰的聚合酶基本上如实例1中所描述经纯化。接着评估经修饰的聚合酶和参考聚合酶(具有SEQIDNO:2的氨基酸序列)(对照反应物)在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM314测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析使用参考和经修饰的聚合酶的所得测序读数组来测量50Q17读数、100Q17读数以及200Q17读数的数值。使用PGMTM测序系统所供应的标准软件,测量并且比较在使用参考和经修饰的聚合酶的测序反应中获得的100Q17或200Q17读数的总数值。相对于参考聚合酶(数据未示),包括突变D264K和E493Q的示例性经修饰的聚合酶提供明显提高的50Q17读数、100Q17读数以及200Q17读数的数值。
实例5:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
包含具有SEQIDNO:2的氨基酸序列并且进一步包括氨基酸取代E220K、N234R以及D423K(其中编号相对于SEQIDNO:2的氨基酸序列)的突变体Bst聚合酶的经修饰的聚合酶基本上如实例1中所描述经纯化。接着评估经修饰的聚合酶和具有SEQIDNO:2的氨基酸序列的参考聚合酶(对照反应物)在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM314测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析使用参考和经修饰的聚合酶的所得测序读数组来测量50Q17读数、100Q17读数以及200Q17读数的数值。使用PGMTM测序系统所供应的标准软件,测量并且比较在使用参考和经修饰的聚合酶的测序反应中获得的100Q17或200Q17读数的总数值。相对于参考聚合酶(数据未示),包括突变E220K、N234R以及D423K的示例性经修饰的聚合酶提供明显提高的50Q17读数、100Q17读数以及200Q17读数的数值。
实例6:比较基于离子的核酸测序系统中示例性经修饰的聚合酶和参考聚合酶的性能
包含具有SEQIDNO:2的氨基酸序列并且进一步包括以下示例性氨基酸取代中的三个的突变体Bst聚合酶的示例性经修饰的聚合酶基本上如实例1中所描述经纯化:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、V533I、H572R、W577Y以及D579F,其中编号相对于SEQIDNO:2的氨基酸序列。接着评估经修饰的聚合酶和参考聚合酶(具有SEQIDNO:2的氨基酸序列)(对照反应物)在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM314测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析使用参考或经修饰的聚合酶的所得测序读数组来测量所得测序读数的原始阅读准确度(如通过装备有离子激流测序系统的离子激流标准软件所报告)、50Q17读数、100Q17读数以及200Q17读数的数值。使用PGMTM测序系统所供应的标准软件,测量并且比较在使用参考和经修饰的聚合酶的测序反应中获得的100Q17或200Q17读数的总数值。
图4-7描绘相比于使用包含SEQIDNO:2的氨基酸序列并且进一步包括不同组氨基酸取代(LR2)的参考聚合酶(即,示例性Bst聚合酶)所获得的准确度,使用包含SEQIDNO:2的氨基酸序列并且进一步包括氨基酸取代E220K、N234R以及D423K(其中编号相对于SEQIDNO:2)的示例性经修饰的聚合酶(A5)所获得的准确度的提高。如图4-7中所示,相对于参考聚合酶(LR2),包括突变的示例性经修饰的聚合酶(A5)提供明显提高的准确度(如通过误差率和原始阅读准确度所测量)。在图4-7中示出为A5的经修饰的聚合酶的氨基酸序列在下文以SEQIDNO:19形式提供。
编码经修饰的聚合酶(A5)的相应核酸序列(即,SEQIDNO:19)在下文以SEQIDNO:23形式提供。所属领域的一般技术人员将显而易见,本发明所公开或提出的参考或经修饰的聚合酶中的任何一种或多种可以容易地转换(例如反转译)成编码参考或经修饰的聚合酶的相应核酸序列。所属领域的技术人员也将显而易见,由于密码子的简并性质,各多肽的核酸序列是可变的。举例来说,编码亮氨酸存在六个密码子(CTT、CTC、CTA、CTG、TTA和TTG)。因此,在这一密码子的位置1处的碱基可以是C或T,这一密码子的位置2始终是T,并且在位置3处的碱基可以是T、C、A或G。因此,本发明所公开或提出的任何参考或经修饰的聚合酶可以转译成简并密码子核酸序列中的任何一个或多个。
实例7:从一种经修饰的聚合酶到另一种聚合酶的突变转移
经由定点突变诱发将各种示例性突变引入到具有SEQIDNO:2、SEQIDNO:16、SEQIDNO:15以及SEQIDNO:18的氨基酸序列的示例性参考聚合酶(参见表1)中。在序列验证之后,使含有氨基酸突变的经修饰的聚合酶(例如具有氨基酸突变D732R的TaqDNA聚合酶,其中编号对应于SEQIDNO.15;以及具有氨基酸突变D505R的克列诺片段DNA聚合酶,其中编号对应于SEQIDNO.18)转化到细菌细胞中以便表达。将含有表达构筑体的菌落接种到BRM培养基中,生长到OD=0.600并且通过添加IPTG达到1mM的最终浓度来进行诱导。接着在37℃下使细胞另外生长3小时。
接着在6000rpm下离心经诱导的细胞10分钟,丢弃上清液,并且使细胞再悬浮于再悬浮缓冲液(100mMTris,pH7.5,100mMNaCl)中。在60的设定(幅值)下超声处理再悬浮细胞一分钟,并且接着放置在冰上1分钟。以此方式重复超声处理总共5次。样品在65℃下培育10分钟并且在9000rpm下离心。回收上清液并且在肝素柱上进一步纯化。分析经纯化的聚合酶以测量解离速率常数,如实例2中所描述。
肝素DNA亲和性柱
在经修饰的聚合酶在肝素柱上的纯化期间观测到以下结果。所有突变体都展现与肝素柱更紧密的结合。TaqD732R在43mS/cm的导电率下离开柱,其中野生型在39mS/cm下离开。克列诺D505R在47mS/cm的导电率下离开柱,其中野生型克列诺在32mS/cm下离开。
模板亲和性/解离分析:
在过量竞争DNA(发夹寡核苷酸173)存在下测量各种经修饰的聚合酶和参考聚合酶从DNA模板(寡核苷酸221)解离的速率。当聚合酶从荧光素标记的模板解离时,随时间推移在分光光度计上监测不断减少的荧光通过使数据与单相指数衰减等式拟合来计算解离速率。
图8中描绘了分析的代表性结果,其中各种经修饰的聚合酶以及具有SEQIDNO:2或SEQIDNO:18的氨基酸序列的参考聚合酶的解离速率常数(也称为“解离时间常数”)在时间间隔下测量。分析中所包括的聚合酶在图8中表示如下:Bst1.0=具有SEQIDNO:2的氨基酸序列的参考聚合酶;BSTD775R=具有SEQIDNO:2的氨基酸序列并且进一步包括突变D775R的经修饰的聚合酶;克列诺WT=具有SEQIDNO:18的氨基酸序列的参考聚合酶;克列诺D505R=具有SEQIDNO:18的氨基酸序列并且进一步包括突变D505R的经修饰的聚合酶。如图8中所指示,相比于相应的参考聚合酶,经修饰的聚合酶展现明显更高的解离时间常数。
实例8:Bst聚合酶、克列诺片段DNA聚合酶以及TAQDNA聚合酶突变体的DNA结合亲和力的评估
经由定点突变诱发将各种示例性突变引入到示例性参考聚合酶中以产生经修饰的聚合酶。在本实例中,参考聚合酶SEQIDNO:2经修饰以含有另一个氨基酸突变(D480R)。参考聚合酶SEQIDNO:15也经修饰以含有另一个氨基酸突变(D732R)。另外,参考聚合酶SEQIDNO:18经修饰以含有氨基酸突变(D505R)。经修饰的聚合酶经序列验证,并且基本上根据实例1的程序表达。接着分析经修饰的聚合酶以基本上根据实例2的程序测量解离速率常数。
图9-11中描绘了分析的代表性结果,其中经修饰的聚合酶以及参考聚合酶的解离速率常数(也称为“解离时间常数”)在特定时间间隔下测量。分析中所包括的聚合酶在图9中表示如下:Bst1.0=具有SEQIDNO:2的氨基酸序列的参考聚合酶;LR1=具有SEQIDNO:2的氨基酸序列并且进一步包括突变D775R的经修饰的聚合酶。图9也提供各种聚合酶的速率常数(K)。这些值的比率(KBst1.0/KBstLR1)是4.7,其意指Bst1.0聚合酶解离速度比LR1突变体快4.7倍。因此,LR1突变体以降低约4.7的因子从核酸模板解离。
分析中所包括的聚合酶在图10中表示如下:WT=具有SEQIDNO:18的氨基酸序列(克列诺)的参考聚合酶;LR1=具有SEQIDNO:18的氨基酸序列并且进一步包括突变D505R的经修饰的聚合酶。图10也提供各种聚合酶的速率常数(K)。这些值的比率(KWT/KLR1)是13,其意指克列诺聚合酶解离速度比LR1突变体快13倍。因此,LR1突变体以降低约13的因子从核酸模板解离。
分析中所包括的聚合酶在图11中表示如下:WT=具有SEQIDNO:15的氨基酸序列的参考聚合酶(野生型TaqDNA聚合酶);LR1=具有SEQIDNO:18的氨基酸序列并且进一步包括突变D505R的经修饰的聚合酶。图11也提供各种聚合酶的速率常数(K)。在此情况下,在实验中,野生型TaqDNA聚合酶以较快速率从模板解离,以至于无法记录速率常数。然而,如图11中所提到,使用相同实验条件检测LR1-TaqDNA聚合酶突变体,并且可以因此推断与相应的野生型TaqDNA聚合酶相比,以慢得多的速率从核酸模板解离。
实例9:TAQDNA聚合酶突变体的DNA结合亲和力的进一步评估
经由定点突变诱发将各种示例性突变引入到示例性参考聚合酶(野生型TaqDNA聚合酶SEQIDNO:15)中以产生一系列经修饰的TaqDNA聚合酶。在本实例中,参考聚合酶SEQIDNO:15经修饰以含有选自D732R、E745Q或E471K的单一氨基酸突变。各种经修饰的聚合酶经序列验证,并且基本上根据实例1表达。接着分析经修饰的聚合酶以基本上根据实例2测量解离速率常数。
图12中描绘了分析的代表性结果,其中经修饰的聚合酶以及参考聚合酶的解离速率常数(也称为“解离时间常数”)在特定时间间隔下测量。分析中所包括的聚合酶在图12中表示如下:wtTaq=具有SEQIDNO:15的氨基酸序列的参考聚合酶;D732R=具有SEQIDNO:15的氨基酸序列并且进一步包括突变D732R的经修饰的聚合酶;E745Q=具有SEQIDNO:15的氨基酸序列并且进一步包括突变E745Q的经修饰的聚合酶;E471K=具有SEQIDNO:15的氨基酸序列并且进一步包括突变E471K的经修饰的聚合酶。
图12也提供各种聚合酶的速率常数(K)。野生型Taq与D732R突变体的比率(Kwttaq/KD732R)是14.1,其意指野生型TaqDNA聚合酶解离速度比TaqDNA聚合酶突变体快14倍。因此,Taq突变体以降低约14的因子从核酸模板解离。
野生型Taq与E745Q突变体的比率(Kwttaq/KE745Q)是4.7,其意指野生型TaqDNA聚合酶解离速度比TaqDNA聚合酶突变体快4.7倍。因此,Taq突变体以降低约4.7的因子从核酸模板解离。
野生型Taq与E471K突变体的比率(Kwttaq/KE471K)是5,其意指野生型Taq聚合酶解离速度比Taq突变体快5倍。因此,Taq突变体以降低约5的因子从核酸模板解离。
如本实例中所制备的所有三种示例性经修饰的TaqDNA聚合酶证明,相比于参考聚合酶(野生型TaqDNA聚合酶(SEQIDNO:15)),从核酸模板解离降低。
实例10:评估核酸测序中经修饰的聚合酶性能
包含具有SEQIDNO:2的氨基酸序列并且进一步包括两个氨基酸取代D264K和E493Q(其中编号相对于SEQIDNO:2的氨基酸序列)的突变体Bst聚合酶的经修饰的聚合酶基本上如实例1中所描述经纯化。接着评估经修饰的聚合酶在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM318测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组c2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析使用经修饰的聚合酶的所得测序读数组来测量AQ17碱基、AQ20碱基的数值、AQ17平均值、AQ20平均值、库读数的数值以及AQ7比对。使用PGMTM测序系统所供应的标准软件,测量并且比较在使用经修饰的聚合酶的测序反应中获得的AQ17或AQ20读数的总数值。如本实例中所概述进行的四个非依赖性测序操作的数据显示于图13中。如可见,四个测序操作中的每一个产生超过1Gb(千兆字节)的AQ17数据(平均值=1.091Gb)。
实例11:评估核酸测序中经修饰的聚合酶性能
包含具有SEQIDNO:2的氨基酸序列并且进一步包括两个氨基酸取代D264K和E493Q(其中编号相对于SEQIDNO:2的氨基酸序列)的突变体Bst聚合酶的两批次经修饰的聚合酶基本上如实例1中所描述经纯化。接着评估经修饰的聚合酶的各批次(旧的LR2或新的LR2)在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM318测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析使用旧的LR2批次或新的LR2批次的经修饰的聚合酶的所得测序读数组来测量AQ17碱基、AQ20碱基的数值、AQ17平均值以及AQ20平均值。使用PGMTM测序系统所供应的标准软件,测量并且比较在使用经修饰的聚合酶的测序反应中获得的AQ17或AQ20读数的总数值。如本实例中所概述进行的七个非依赖性测序操作的数据显示于图14中。如可见,七个测序操作中的每一个产生超过1Gb(千兆字节)的AQ17数据;同时测序操作中的五个产生超过1Gb的AQ20数据。
实例12:评估核酸测序中经修饰的聚合酶性能
包含具有SEQIDNO:20的氨基酸序列的突变体Bst聚合酶的经修饰的聚合酶基本上如实例1中所描述经纯化。接着评估经修饰的聚合酶在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中的性能。简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。接着基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)\离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)以及离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM316测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析使用经修饰的聚合酶的所得测序读数来测量映射Q17碱基的数值、映射Q20碱基的数值、在Q17下的平均覆盖深度、在Q20下的平均覆盖深度、最长Q17和Q20比对以及Q17和Q20比对。如本实例中所概述进行的测序操作的数据显示于图15中。如可见,测序操作产生超过1Gb(千兆字节)的Q17数据(1.02Gb);482个碱基对的Q17准确度速率以及471个碱基对的Q20准确度速率。
实例13:评估乳液PCR中经修饰的聚合酶性能
包含具有SEQIDNO:15的氨基酸序列并且进一步包括氨基酸突变D732R的突变体TaqDNA聚合酶的经修饰的聚合酶基本上如实例1中所描述经纯化(SEQIDNO:24)。这一经修饰的聚合酶先前已显示相比于野生型TaqDNA聚合酶,模板解离速率降低14倍(参见实例9)。接着评估经修饰的TaqDNA聚合酶在乳液PCR反应中产生核酸库的性能。使用400bp插入片段和与先前评估相比更高的盐条件(125mM)制备核酸库。在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中,在下游应用使用来自乳液PCR(emPCR)的经修饰的TaqDNA聚合酶所获得的库。
简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。在本实例中,约400bp的DNA片段用作产生核酸库的核酸模板。接着,除了用经修饰的TaqDNA聚合酶取代套组DNA聚合酶并且在提高的盐浓度(150mMKCl)下进行emPCR过程以外,基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM316测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析在emPCR期间使用经修饰的TaqDNA聚合酶的所得测序读数来测量AQ17碱基、AQ20碱基的数值、AQ17平均值、AQ20平均值、库读数的数值以及AQ7比对。如本实例中所概述进行的测序操作的数据显示于图16中。如可见,测序操作产生超过1Gb(千兆字节)的Q17数据(1.025Gb);443个碱基对的Q17准确度速率以及443个碱基对的Q20准确度速率。由于在emPCR过程期间已产生大量核酸库数值,经修饰的DNA聚合酶能够产生显著测序数据。
实例14:评估乳液PCR中经修饰的聚合酶性能
针对在产生核酸库的乳液PCR反应中的性能,将包含具有SEQIDNO:24的氨基酸序列的突变体TaqDNA聚合酶的经修饰的聚合酶与野生型TaqDNA(SEQIDNO:15)聚合酶进行比较。使用突变体TaqDNA聚合酶产生的核酸库使用400bp插入片段和与野生型TaqDNA聚合酶所用相比更高的盐条件制备。在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中,在下游应用使用来自乳液PCR(emPCR)的经修饰的或野生型TaqDNA聚合酶所获得的库。
简单来说,基因组DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。在本实例中,约400bp的DNA片段用作产生核酸库的核酸模板。接着,除了用经修饰的TaqDNA聚合酶取代套组DNA聚合酶的乳液并且在提高的盐浓度(150mMKCl)下进行emPCR过程以外,基本上根据IonXpressTM模板套组v2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案,使DNA片段扩增到IonSphereTM粒子(离子激流系统,部件号602-1075-01)上。接着将扩增的DNA装载到PGMTM316测序芯片中。将芯片装载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714RevA)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
分析在emPCR期间使用经修饰的TaqDNA聚合酶(SEQIDNO:24-LR1Taq)或野生型TaqDNA聚合酶(Taq-SEQIDNO:15)的所得测序读数以测量AQ17碱基、AQ20碱基的数值、AQ17平均值、关键信号、信噪比以及库读数的数值。如本实例中所概述进行的测序操作的数据显示于图17中。如可见,使用乳液的测序操作用与野生型TaqDNA聚合酶的平均0.26千兆碱基Q17数据(0.263Gb)相比,平均0.87千兆碱基Q17数据(0.874Gb)的经修饰的TaqDNA聚合酶(LR1Taq)进行。由于在emPCR过程期间已产生大量核酸库数值,经修饰的DNA聚合酶能够产生显著测序数据。
实例15:构筑示例性经修饰的聚合酶
经由定点突变诱发将各种示例性突变引入到具有SEQIDNO:16的氨基酸序列的示例性参考聚合酶中。所属领域的技术人员将显而易见,本实例概述用以产生经修饰的聚合酶或生物活性片段的库的示例性高通量方法。以下实例还概述了用以评估此类经修饰的聚合酶或生物活性片段的聚合酶活性的方法。
在本实例中,基于SEQIDNO:16的氨基酸序列制备构筑体的诱变处理库;其中聚合酶中的每个氨基酸单独突变。另外在这一示例性实例中,以所选氨基酸残基下氨基酸的每种可能的组合使SEQIDNO.16内的所选氨基酸残基突变。接着将突变体构筑体的所得库施加到许多96孔培养盘中,其中在30℃下在BRM培养基中使突变体构筑体生长过夜。将含有突变体构筑体的培养基接种到深96孔培养盘中并且在37℃下生长3小时,并且通过添加IPTG达到1mM的最终浓度来进行诱导。接着在37℃下使细胞另外生长3小时。在3700rpm下离心经诱导的细胞10分钟,丢弃上清液,并且使细胞再悬浮于100μl再悬浮缓冲液(10mMTris,pH7.5,100mMNaCl)中。在60的设定(幅值)下超声处理再悬浮细胞一分钟,并且接着在80℃下放置过夜。
在65℃下培育上述样品10分钟。样品接着在3700rpm下离心12分钟。回收上清液并且使用生物素化捕获寡核昔酸与亲和树脂和myOne珠粒一起进一步纯化。经纯化的突变聚合酶或生物活性片段在较高NaCl中洗脱并且进行缓冲液更换。接着分析经纯化的突变体聚合酶或生物活性片段以测量各种聚合酶活性,如信噪比、系统误差、阅读长度、原始准确度、链偏差以及总测序通量,如以下实例中所概述。
实例16:评估系统误差,
在本实例中,所述方法适用于评估一般与一条链或两条链的过早衰减、极端链偏差、系统链误差以及较高GC含量相关的系统误差。所属领域的技术人员将显而易见,可以修改本文所公开的方法以评估与系统误差相关的其它度量,或可以经修改以测量与如模板解离常数的聚合酶活性相关的一个或多个其它度量。
经纯化的聚合酶或其生物活性片段基本上根据实例15制备并且用于使用个人基因组机器和离子PGM318芯片(生命技术公司,加利福尼亚州)来评估系统误差。
针对在产生核酸库的乳液PCR反应中的性能,将根据实例15制备的突变体聚合酶或其生物活性片段的库直接与SEQIDNO:16(充当对照组)进行比较。使用大肠杆菌500bp插入片段制备核酸库。在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中,在下游应用获自乳液PCR(emPCR)反应的核酸库。简单来说,模板DNA经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。如下文所概述,使模板DNA扩增到IonSphereTM粒子上。此处,用于96孔乳液PCR反应中的核酸库含有:在一条链上具有过早衰减的24个核酸模板;在两条链上含有过早衰减的12个核酸模板;含有极端链偏差的12个核酸模板;含有系统链误差的24个核酸模板;含有较高GC含量的12个核酸模板;以及在所提出和测试的测序条件下表现规律良好的12个核酸模板。
对于96带条码乳液中的每一种,将离子球体粒子(ISP,2-4千万)单独添加到个别PCR试管中。接着用退火缓冲液填充试管并且涡旋。在台式离心机中以最大速度(16,500RPM)使试管旋转4分钟并且去除上清液。添加测序引物,通过吸液混合,并且通过热循环退火到珠粒。将再悬浮的引物退火ISP添加到96孔培养盘的各孔中以产生每孔400,000个珠粒。将个别诱变处理的聚合酶或其生物活性片段添加到各孔中,其中每孔仅添加1种突变体聚合酶或生物活性片段。在室温下培育突变体聚合酶(或生物活性片段)和ISP40分钟,继而添加α-硫基dGTP/α-硫基dTTP的混合物以允许经扩增核酸库的富集。将所有96孔合并到储存器中,转移到2ml导管中,并且以最大速度旋转3分钟。去除上清液,导管短暂涡旋,并且接着将导管放置在磁块上。在磁块上培育样品30秒,去除上清液并且使用制造商所提供的标准装载方案将整个样品装载到离子318芯片(生命技术公司,加利福尼亚州,目录号4484354)上。在装载完成之后,通过经由装载孔口吸液洗涤溶液来洗涤芯片。洗涤步骤重复两次,总共洗涤3次。在装载到离子PGM(生命技术公司,加利福尼亚州,目录号4462921)上之前从芯片去除所有液体,并且根据制造商说明书用标准测序400套组(生命技术公司,加利福尼亚州,目录号4482002)进行测序。
评估获自诱变处理聚合酶或生物活性片段的库的所得测序操作的系统误差。具体来说,测量如以下度量:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。任选地,除直接比较SEQIDNO.16的聚合酶以外,使用与其它已知聚合酶相同的度量进一步评估突变体聚合酶中的一些。如本实例中所概述进行的示例性测序操作的数据显示于图18-28中,更详细论述于下。
实例17:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
由SEQIDNO:16的氨基酸序列组成的参考聚合酶用于产生聚合酶或其生物活性片段的突变诱发库,基本上如实例15中所描述。根据实例16筛选突变诱发聚合酶或其生物活性片段库以评估聚合酶活性,包括信噪比、链偏差、系统误差、阅读长度和/或原始阅读准确度,以便于聚合酶或生物活性片段中的每一种产生于库中。在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基782处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。
在本实例中,构筑18种不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图18中。
实例18:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基780处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑18种不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图19中。
实例19:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基788处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑16种不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图20中。
实例20:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基558处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑18种不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图21中。
实例21:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基559处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑18种不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图22中。
实例22:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基559处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑2种具有559(559A和559R)处取代的不同突变诱发聚合酶,纯化并且根据实例15和16评估并且直接比较以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图23中。
实例23:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基823处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑14种具有823处取代的不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图24中。
实例24:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,具有SEQIDNO.16的氨基酸序列的参考聚合酶用于产生在氨基酸残基568处具有氨基酸取代的聚合酶的突变诱发库,其中编号相对于SEQIDNO:16的氨基酸序列。在本实例中,构筑18种不同突变诱发聚合酶,纯化并且根据实例15和16评估以下聚合酶活性中的每一种:AQ20总碱基数(总测序通量)、AQ20平均值、原始阅读准确度、链偏差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图25中。
实例25:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,评估根据实例15制备、相对于SEQIDNO.16的氨基酸序列具有一个或多个氨基酸突变的四种聚合酶的各种聚合酶活性。第一聚合酶含有相比于SEQIDNO.16的单一氨基酸取代782R。第二聚合酶含有相比于SEQIDNO.16的两个氨基酸取代(782R和718K)。第三聚合酶含有相比于SEQIDNO.16的一个氨基酸取代(718K)。第四聚合酶含有相比于SEQIDNO.16的三个氨基酸取代(E515K、N529R和D718K)。对于各种聚合酶,尤其评估以下聚合酶活性:AQ17碱基、SNR、原始阅读准确度以及系统误差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图26中。
实例26:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,评估根据实例15制备、相对于SEQIDNO.16的氨基酸序列具有一个或多个氨基酸突变的两种聚合酶的各种聚合酶活性。第一聚合酶含有相比于SEQIDNO:16的三个氨基酸取代(782R、718K和568N)。第二聚合酶含有相比于SEQIDNO.16的单一氨基酸取代(718K)。对于各种聚合酶,尤其评估以下聚合酶活性:AQ20碱基、SNR、原始阅读准确度以及系统误差(不具有链偏差的目标碱基)以及系统误差百分比(在本实例中测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。本实例的数据呈现在图27中。
实例27:比较核酸测序中经修饰的聚合酶和参考聚合酶的性能
在本实例中,评估根据实例15制备、相对于SEQIDNO:16的氨基酸序列具有一个或多个氨基酸突变的两种聚合酶的各种聚合酶活性。第一聚合酶含有相比于SEQIDNO:16的两个氨基酸取代(782R和576M)。第二聚合酶含有相比于SEQIDNO:16的单一氨基酸取代(718K)。对于各种聚合酶,尤其评估以下聚合酶活性:AQ20碱基、SNR以及原始阅读准确度。本实例的数据呈现在图28中。
实例28:针对系统误差,比较经修饰的聚合酶的性能
在本实例中,根据实例1制备两种经修饰的聚合酶。两种经修饰的聚合酶是SEQIDNO:34和SEQIDNO:35。
SEQIDNO:34含有相比于SEQIDNO:2的五个氨基酸取代,即N487R、H281M、D264A、H273N和E493R。
SEQIDNO:35含有相比于SEQIDNO:2的三个氨基酸取代,即N487R、H281M和D423K。
在本实例中,所述方法适用于评估系统误差。所属领域的技术人员将显而易见,可以修改本文所公开的方法以评估与系统误差相关的其它度量,或可以修改所述方法以测量与如模板解离常数的聚合酶活性相关的一个或多个其它度量。
经修饰的聚合酶基本上根据实例1制备并且用于使用个人基因组机器(PGMTM)和离子PGM314或离子PGM318芯片(生命技术公司,加利福尼亚州)来评估系统误差。
使用大肠杆菌270bp插入片段(短插入片段)制备第一组核酸库。使用大肠杆菌510bp插入片段(长插入片段)制备第二组核库。在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应下游应用经由乳液PCR(emPCR)反应获得的核酸库。
简单来说,模板核酸经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。如下文所概述,使模板核酸扩增到IonSphereTM粒子上。
此处,经历乳液PCR的各核酸库含有:在一条链上具有过早衰减的24个核酸模板;在两条链上含有过早衰减的12个核酸模板;含有极端链偏差的12个核酸模板;含有系统链误差的24个核酸模板;含有较高GC含量的12个核酸模板;以及在所提出的测序条件下表现规律良好的12个核酸模板。
对于带条码乳液中的每一种,将离子球体粒子(ISP,2-4千万)单独添加到个别PCR试管中。接着用退火缓冲液填充试管并且涡旋。在台式离心机中以最大速度(16,500RPM)使试管旋转4分钟并且去除上清液。添加测序引物,通过吸液混合,并且通过热循环退火到珠粒。将再悬浮的引物退火ISP添加到培养盘的各孔中以产生每孔400,000个珠粒。将SEQIDNO:34或SEQIDNO:35经修饰的聚合酶添加到各核酸库的等分试样(长和短大肠杆菌插入片段)中。在室温下培育经修饰的聚合酶和ISP40分钟,继而添加α-硫基dGTP/α-硫基dTTP的混合物以允许经扩增核酸库的富集。将所有孔(每种经修饰的聚合酶)合并到储存器中,转移到2ml导管中,并且以最大速度旋转3分钟。去除上清液,导管短暂涡旋,并且接着将导管放置在磁块上。在磁块上培育样品30秒,去除上清液并且使用制造商所提供的标准装载方案将整个样品装载到离子314或离子318芯片(生命技术公司,加利福尼亚州)上。在装载完成之后,通过经由装载孔口吸液洗涤溶液来洗涤314或318离子芯片。洗涤步骤重复两次,总共洗涤3次。在装载到离子PGM(生命技术公司,加利福尼亚州,目录号4462921)上之前从芯片去除所有液体,并且根据制造商说明书用标准测序套组(生命技术公司,加利福尼亚州)进行测序。
评估所得测序操作的系统误差。具体来说,测量如以下度量:AQ47碱基(总测序通量)、AQ47平均值、原始阅读准确度、SNR(信噪比)以及系统误差(SSE)(测量为含有长度1-6的均聚物的序列基元中的随机误差百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率在链上出现)。
在离子314芯片或离子318芯片上使用SEQIDNO:34或SEQIDNO:35以及短插入片段大肠杆菌库的示例性测序操作的数据显示于图29中。显示在离子314芯片上使用短插入片段大肠杆菌库进行的示例性均聚物数据的曲线图显示于图30中。显示在离子318芯片上使用短插入片段大肠杆菌库进行的示例性均聚物数据的曲线图显示于图31中。
在离子314芯片或离子318芯片上使用SEQIDNO:34或SEQIDNO:35以及长插入片段大肠杆菌库的示例性测序操作的额外数据显示于图32中。显示在离子314芯片上使用长插入片段大肠杆菌库进行的示例性均聚物数据的曲线图显示于图33中。显示在离子318芯片上使用长插入片段大肠杆菌库进行的示例性均聚物数据的曲线图显示于图34中。
实例29:针对系统误差,比较经修饰的聚合酶的性能
在本实例中,根据实例1制备两种经修饰的聚合酶。两种经修饰的聚合酶是LR2和SEQIDNO:35。
LR2含有相比于SEQIDNO:2的两个氨基酸取代,即D264K和E493Q。
SEQIDNO:35含有相比于SEQIDNO:2的三个氨基酸取代,即N487R、H281M和D423K。
在本实例中,所述方法适用于评估系统误差。所属领域的技术人员将显而易见,可以修改本文所公开的方法以评估与系统误差相关的其它度量,或可以修改所述方法以测量与如模板解离常数的聚合酶活性相关的一个或多个其它度量。
经修饰的聚合酶基本上根据实例1制备并且用于使用个人基因组机器(PGMTM)和离子PGM314和离子PGM318芯片(生命技术公司,加利福尼亚州)来评估系统误差。
使用大肠杆菌270bp插入片段(短插入片段)制备核酸库。在使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应下游应用经由乳液PCR(emPCR)反应获得的核酸库。
简单来说,模板核酸经纯化、衔接子连接并且选择大小,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开案部件号4467320RevB)中所描述。如下文所概述,使模板核酸扩增到IonSphereTM粒子上。
此处,经历乳液PCR的核酸库含有:在一条链上具有过早衰减的24个核酸模板;在两条链上含有过早衰减的12个核酸模板;含有极端链偏差的12个核酸模板;含有系统链误差的24个核酸模板;含有较高GC含量的12个核酸模板;以及在所提出的测序条件下表现规律良好的12个核酸模板。
对于带条码乳液中的每一种,将离子球体粒子(ISP,2-4千万)单独添加到个别PCR试管中。接着用退火缓冲液填充试管并且涡旋。在台式离心机中以最大速度(16,500RPM)使试管旋转4分钟并且去除上清液。添加测序引物,通过吸液混合,并且通过热循环退火到珠粒。将再悬浮的引物退火ISP添加到培养盘的各孔中以产生每孔400,000个珠粒。将LR2或SEQIDNO:35经修饰的聚合酶添加到核酸库的等分试样(短大肠杆菌插入片段)中。在室温下培育经修饰的聚合酶和ISP40分钟,继而添加α-硫基dGTP/α-硫基dTTP的混合物以允许经扩增核酸库的富集。将所有孔(每种经修饰的聚合酶)合并到储存器中,转移到2ml导管中,并且以最大速度旋转3分钟。去除上清液,导管短暂涡旋,并且接着将导管放置在磁块上。在磁块上培育样品30秒,去除上清液并且使用制造商所提供的标准装载方案将整个样品装载到离子314或离子318芯片(生命技术公司,加利福尼亚州)上。在装载完成之后,通过经由装载孔口吸液洗涤溶液来洗涤314或318离子芯片。洗涤步骤重复两次,总共洗涤3次。在装载到离子PGM(生命技术公司,加利福尼亚州,目录号4462921)上之前从芯片去除所有液体,并且根据制造商说明书用标准测序套组(生命技术公司,加利福尼亚州)进行测序。
评估所得测序操作的系统误差。具体来说,测量如以下度量:AQ47碱基(总测序通量)、AQ20平均值、原始阅读准确度以及系统误差(SSE)。
在离子314芯片或离子318芯片上使用经修饰的聚合酶LR2或SEQIDNO:35以及短插入片段大肠杆菌库的示例性测序操作的数据显示于图35中。在本实例中,在相同条件下,相比于LR2,SEQIDNO:35显示经过滤的变异体和SSE改进10倍。

Claims (25)

1.一种组合物,其包含分离的多肽,所述多肽与含有选自由以下组成的群组的氨基酸序列的家族ADNA聚合酶具有至少90%一致性:SEQIDNO:2、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37。
2.根据权利要求1所述的组合物,其中所述分离的多肽保留聚合酶活性。
3.根据权利要求2所述的组合物,其中所述聚合酶活性测量为原始阅读准确度、系统误差、链偏差、平均阅读长度或总测序通量。
4.根据权利要求1所述的组合物,其中所述分离的多肽包含与SEQIDNO:25的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775、H576、E515以及N529,其中编号相对于SEQIDNO:25。
5.根据权利要求1所述的组合物,其中所述分离的多肽包含与SEQIDNO:2的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480、H281、E220以及N234,其中编号相对于SEQIDNO:2。
6.根据权利要求1所述的组合物,其中所述分离的多肽包含与SEQIDNO:28的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N780、E788、A558、D559、H823、H568、D775以及D718,其中编号相对于SEQIDNO:28。
7.根据权利要求1所述的组合物,其中,所述分离的多肽包含与SEQIDNO:37的至少90%的一致性并且包括在对应于选自由以下组成的群组的位置的一个或多个位置处的氨基酸取代:N485、E493、A263、D264、H528、H273、D423以及D480,其中编号相对于SEQIDNO:37。
8.一种组合物,其包含重组聚合酶,所述重组聚合酶含有与SEQIDNO:25或其生物活性片段至少80%一致的氨基酸序列,其中所述重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25。
9.根据权利要求8所述的组合物,其中所述重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N780K、E788R、A558K、D559A、D559R、H823S、H823F、H568N、D718K、D775R以及H576M,其中编号相对于SEQIDNO:25。
10.根据权利要求8所述的组合物,其中所述重组聚合酶或其生物活性片段保留聚合酶活性。
11.根据权利要求8所述的组合物,其中相比于不具有在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的参考聚合酶:N780、E788、A558、D559、H823、H568、D718、D775以及H576,其中编号相对于SEQIDNO:25,所述重组聚合酶展现提高的原始阅读准确度、减少的系统误差、减少的链偏差、增加的平均阅读长度或增加的总测序通量。
12.一种组合物,其包含重组聚合酶,所述重组聚合酶含有与SEQIDNO:2或其生物活性片段至少80%一致的氨基酸序列,其中所述重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2。
13.根据权利要求12所述的组合物,其中所述重组聚合酶包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:N487R、N485K、E493R、A263K、D264A、D264R、H528S、H528F、H273N、D423K、D480R以及H281M,其中编号相对于SEQIDNO:2。
14.一种用于进行聚合的方法,其包含:
(a)提供包括与引物杂交并且结合到经修饰的聚合酶的核酸的反应混合物;以及
(b)使所述核酸与至少一种类型的核苷酸接触,其中所述接触包括将至少一种核苷酸掺入到所述引物上,从而产生延伸的引物产物。
15.根据权利要求14所述的方法,其中所述经修饰的聚合酶包含分离的多肽,所述多肽与含有选自由以下组成的群组的氨基酸序列的家族ADNA聚合酶具有至少90%一致性:SEQIDNO:2、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37。
16.根据权利要求14所述的方法,其中所述经修饰的聚合酶包含具有对应于在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的氨基酸序列的重组聚合酶:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2。
17.根据权利要求14所述的方法,其中所述方法进一步包括检测所述反应混合物中所述延伸的引物产物的存在,从而判定是否已发生核苷酸掺入。
18.根据权利要求17所述的方法,其中所述接触和所述检测重复超过一次,从而检测多种核苷酸掺入。
19.根据权利要求18所述的方法,其中所述方法进一步包括鉴别多种核苷酸掺入中的至少一种。
20.根据权利要求14所述的方法,其中所述聚合方法包括PCR、qPCR、桥式PCR、RT-PCR、连接介导的PCR、等温扩增或乳液PCR。
21.一种用于从核酸模板获得序列信息的方法,其包含:
(a)提供包括与测序引物杂交并且结合到经修饰的聚合酶的模板核酸的反应混合物;
(b)使所述模板核酸与至少一种类型的核苷酸接触,其中所述接触包括使来自所述至少一种类型的核苷酸的一种或多种核苷酸掺入到所述测序引物的3'端上,并且产生延伸的引物产物;
(c)检测所述反应混合物中所述延伸的引物产物的存在,从而判定是否已发生核苷酸掺入;以及
(d)从所述至少一种类型的核苷酸鉴别所掺入的一种或多种核苷酸中的至少一种。
22.根据权利要求21所述的方法,其中所述经修饰的聚合酶包含分离的多肽,所述多肽与含有选自由以下组成的群组的氨基酸序列的家族ADNA聚合酶具有至少90%一致性:SEQIDNO:2、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36以及SEQIDNO:37。
23.根据权利要求21所述的方法,其中所述接触、检测以及鉴别步骤重复超过一次,从而鉴别多种连续核苷酸掺入。
24.一种组合物,其包含分离的多肽,所述多肽含有与SEQIDNO:37或其生物活性片段具有至少80%同源性的氨基酸序列,其中所述分离的多肽包括在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代:D423、D264、H273以及E493,其中编号相对于SEQIDNO:37,并且其中所述分离的多肽相对于SEQIDNO:2展现降低的解离速率常数。
25.一种组合物,其包含重组聚合酶,所述重组聚合酶含有与SEQIDNO:2或其生物活性片段具有至少80%同源性的氨基酸序列,其中所述重组聚合酶包含具有在对应于选自由以下组成的群组的位置的位置处的一个或多个氨基酸取代的家族ADNA聚合酶:N487、N485、E493、A263、D264、H528、H273、D423、D480以及H281,其中编号相对于SEQIDNO:2,并且其中重组聚合酶相比于SEQIDNO:2展现降低的解离速率常数。
CN201480064864.8A 2013-09-30 2014-09-30 聚合酶组合物、制得和使用其的方法 Active CN105765082B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361884921P 2013-09-30 2013-09-30
US61/884,921 2013-09-30
PCT/US2014/058361 WO2015048763A1 (en) 2013-09-30 2014-09-30 Polymerase compositions, methods of making and using same

Publications (2)

Publication Number Publication Date
CN105765082A true CN105765082A (zh) 2016-07-13
CN105765082B CN105765082B (zh) 2019-09-27

Family

ID=51842797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480064864.8A Active CN105765082B (zh) 2013-09-30 2014-09-30 聚合酶组合物、制得和使用其的方法

Country Status (5)

Country Link
US (6) US9657281B2 (zh)
EP (2) EP3052652B1 (zh)
CN (1) CN105765082B (zh)
ES (1) ES2938585T3 (zh)
WO (1) WO2015048763A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110684752A (zh) * 2019-10-08 2020-01-14 南京诺唯赞生物科技有限公司 一种耐受性提高的突变型Taq DNA聚合酶及其制备方法和应用
CN113583996A (zh) * 2021-09-29 2021-11-02 翌圣生物科技(上海)股份有限公司 Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法
CN113817708A (zh) * 2021-11-23 2021-12-21 中国医学科学院北京协和医院 一种重组dna聚合酶及其制备方法和应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3052652B1 (en) 2013-09-30 2022-11-23 Life Technologies Corporation Polymerase compositions, methods of making and using same
US10344268B2 (en) 2015-10-01 2019-07-09 Life Technologies Corporation Polymerase compositions and kits, and methods of using and making the same
US10219599B2 (en) 2015-11-06 2019-03-05 JRSK, Inc. Hard-shell luggage systems
CN109154024B (zh) 2016-04-29 2022-03-04 欧姆尼欧美公司 核酸序列测定方法
US10597643B2 (en) * 2016-04-29 2020-03-24 Omniome, Inc. Polymerases engineered to reduce nucleotide-independent DNA binding
US10829747B2 (en) * 2016-09-22 2020-11-10 Roche Sequencing Solutions, Inc. Polymerase variants
EP4361287A2 (en) * 2016-09-28 2024-05-01 Life Technologies Corporation Methods for sequencing nucleic acids using termination chemistry
WO2019074963A1 (en) * 2017-10-09 2019-04-18 Strata Oncology, Inc. CHARACTERIZATION OF THE INSTABILITY OF MICROSATELLITES
GB201721053D0 (en) * 2017-12-15 2018-01-31 Univ I Tromsø - Norges Arktiske Univ DNA polymerases
CN112639983A (zh) 2018-06-29 2021-04-09 豪夫迈·罗氏有限公司 微卫星不稳定性检测

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040365A1 (en) * 2011-08-10 2013-02-14 Life Technologies Corporation Polymerase compositions, methods of making and using same
CN103097547A (zh) * 2010-02-26 2013-05-08 生命技术公司 经修饰的蛋白及其制备和使用方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US278107A (en) 1883-05-22 dowson
US1024013A (en) 1906-09-20 1912-04-23 Adder Machine Co Eliminating-key for adding-machines.
US5466591A (en) 1986-08-22 1995-11-14 Hoffmann-La Roche Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
CN100462433C (zh) 2000-07-07 2009-02-18 维西根生物技术公司 实时序列测定
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CN101365807A (zh) 2005-12-22 2009-02-11 加利福尼亚太平洋生物科学股份有限公司 用于掺入核苷酸类似物的聚合酶
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2653861B1 (en) 2006-12-14 2014-08-13 Life Technologies Corporation Method for sequencing a nucleic acid using large-scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20110014612A1 (en) 2009-03-27 2011-01-20 Life Technologies Corporation Polymerase compositions & methods
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
EP3052652B1 (en) 2013-09-30 2022-11-23 Life Technologies Corporation Polymerase compositions, methods of making and using same
US10344325B2 (en) * 2014-11-11 2019-07-09 Life Technologies Corporation Thiolated nucleotide analogues for nucleic acid synthesis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103097547A (zh) * 2010-02-26 2013-05-08 生命技术公司 经修饰的蛋白及其制备和使用方法
US20130040365A1 (en) * 2011-08-10 2013-02-14 Life Technologies Corporation Polymerase compositions, methods of making and using same

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SENG-MENG PHANG等: "Cloning and complete sequence of the DNA polymerase-encoding gene(BstpolI)and characterisation of the Klenow-like fragment from Bacillus stearothermophilus", 《GENE》 *
黄维华等: "Bst DNA 聚合酶大片段的克隆、表达、性质及其应用", 《生物化学与生物物理学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110684752A (zh) * 2019-10-08 2020-01-14 南京诺唯赞生物科技有限公司 一种耐受性提高的突变型Taq DNA聚合酶及其制备方法和应用
CN110684752B (zh) * 2019-10-08 2020-09-29 南京诺唯赞生物科技股份有限公司 一种耐受性提高的突变型Taq DNA聚合酶及其制备方法和应用
CN113583996A (zh) * 2021-09-29 2021-11-02 翌圣生物科技(上海)股份有限公司 Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法
CN113583996B (zh) * 2021-09-29 2022-01-14 翌圣生物科技(上海)股份有限公司 Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法
CN113817708A (zh) * 2021-11-23 2021-12-21 中国医学科学院北京协和医院 一种重组dna聚合酶及其制备方法和应用
CN113817708B (zh) * 2021-11-23 2022-02-18 中国医学科学院北京协和医院 一种重组dna聚合酶及其制备方法和应用

Also Published As

Publication number Publication date
US20200002688A1 (en) 2020-01-02
EP3052652B1 (en) 2022-11-23
US20200299655A1 (en) 2020-09-24
US10240134B2 (en) 2019-03-26
CN105765082B (zh) 2019-09-27
US9657281B2 (en) 2017-05-23
US20210371834A1 (en) 2021-12-02
US20240067941A1 (en) 2024-02-29
US11821011B2 (en) 2023-11-21
US11091746B2 (en) 2021-08-17
EP4219739A2 (en) 2023-08-02
US20150094211A1 (en) 2015-04-02
ES2938585T3 (es) 2023-04-12
EP3052652A1 (en) 2016-08-10
EP4219739A3 (en) 2023-08-23
WO2015048763A1 (en) 2015-04-02
US10676724B2 (en) 2020-06-09
US20170260512A1 (en) 2017-09-14

Similar Documents

Publication Publication Date Title
CN105765082A (zh) 聚合酶组合物、制得和使用其的方法
CN103857805B (zh) 聚合酶组合物、制备和使用所述聚合酶组合物的方法
US11319584B2 (en) Polymerase compositions and methods of making and using same
CN108350496B (zh) 聚合酶组合物和套组以及其使用与制造方法
US11208636B2 (en) Polymerase compositions, methods of making and using same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant