CN107326079A - 聚合酶组合物、制备和使用所述聚合酶组合物的方法 - Google Patents

聚合酶组合物、制备和使用所述聚合酶组合物的方法 Download PDF

Info

Publication number
CN107326079A
CN107326079A CN201710614722.XA CN201710614722A CN107326079A CN 107326079 A CN107326079 A CN 107326079A CN 201710614722 A CN201710614722 A CN 201710614722A CN 107326079 A CN107326079 A CN 107326079A
Authority
CN
China
Prior art keywords
polymerase
seq
amino acid
modification
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710614722.XA
Other languages
English (en)
Other versions
CN107326079B (zh
Inventor
P·范德霍恩
T·尼基弗罗夫
罗国斌
M·兰狄斯
D·马祖尔
E·托泽
T·林斯库姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Life Technologies Corp
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN107326079A publication Critical patent/CN107326079A/zh
Application granted granted Critical
Publication of CN107326079B publication Critical patent/CN107326079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6846Common amplification features
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Polyesters Or Polycarbonates (AREA)

Abstract

本公开内容提供了用于核酸聚合的组合物、方法、试剂盒、系统和装置。具体地,提供了允许核酸扩增的修饰的聚合酶及其生物活性片段。在一个方面,本公开内容涉及用于核酸测序、基因分型、拷贝数变异分析、双端测序和其它形式的遗传分析的修饰的聚合酶。在一些方面,本公开内容涉及用于产生用于各种下游过程的核酸文库或核酸模板的修饰的聚合酶。在一些方面,本公开内容涉及可跨聚合酶的种类或家族转移以提供具有改变的催化性质的新型聚合酶的同源氨基酸突变的鉴定。在一些方面,本公开内容提供了相较于参照聚合酶具有增强的催化性质的修饰的聚合酶。

Description

聚合酶组合物、制备和使用所述聚合酶组合物的方法
本申请是申请日为2012年8月10日、发明名称为“聚合酶组合物、制备和使用所述聚合酶组合物的方法”的中国发明专利申请No.201280048344.9的分案申请。
相关申请的交叉参考
本申请要求在35 U.S.C.§119(e)下保护2011年8月10日提交的美国临时申请号61/522,125、2011年10月10日提交的美国临时申请号61/545,434、2012年1月10日提交的美国临时申请号61/585,133、2012年5月7日提交的美国临时申请号61/643,844和2012年8月9日提交的标题为"POLYMERASE COMPOSITIONS,METHODS OF MAKING AND USING THE SAME"的美国临时申请号61/681,593的优先权的利益,将所述美国临时申请的公开内容通过引用整体并入本文。
序列表
本申请因此通过引用并入与其一起提交的电子序列表的材料。将电子序列表中的材料以2012年8月9日创建的标题为“LT00556PCT_Sequence_Listing_ST25.txt”的文本(.txt)文件提交,所述文件具有65KB的文件大小,将其通过引用整体并入本文。
技术领域
在一些实施方案中,本公开内容总地来说涉及聚合酶组合物、制备和使用所述聚合酶组合物的方法。在一些实施方案中,本公开内容总地来说涉及一种或多种修饰聚合酶,其中一种或多种修饰聚合酶相较于参照聚合酶包含至少一个氨基酸突变。在一些实施方案中,本公开内容总地来说涉及包含修饰DNA或RNA聚合酶的组合物。在一些实施方案中,组合物可包含来自A家族DNA聚合酶或B家族DNA聚合酶的修饰聚合酶。在一些实施方案中,本公开内容总地来说涉及跨越聚合酶种类或家族的同源氨基酸突变的转移。在一些实施方案中,本公开内容总地来说涉及用于核酸测序包括下一代测序的聚合酶组合物。在一些实施方案中,本公开内容总地来说涉及用于产生核酸文库或核酸模板的修饰聚合酶组合物。在一些实施方案中,本公开内容涉及包含一种或多种修饰聚合酶的系统、装置和试剂盒。在一些实施方案中,组合物、系统、装置和试剂盒可用于合成DNA链。在一些实施方案中,组合物、系统、装置和试剂盒可用于在单个反应中扩增至少10、50、100、500、1000、2500、5000、7500、10000、25000、50000、100000或更多个核酸模板。
背景
酶催化生物反应的能力是生命的基础。一些生物应用使用酶来体外合成各种生物分子。一个特别有用的种类的酶是聚合酶,其可催化生物分子(例如,核苷酸或氨基酸)至生物聚合物(例如,核酸或肽)的聚合。例如,可将核苷酸聚合成核酸(特别地以模板依赖性方式)的聚合酶在重组DNA技术和核酸测序应用中是有用的。许多核酸测序法在通过聚合酶催化的体外模板依赖性核酸合成过程中监控核苷酸的掺入。单分子测序(SMS)和双端测序(PES)通常包括用于模板依赖性核酸合成的聚合酶。聚合酶还用于产生核酸文库例如在乳液PCR或桥式PCR过程产生的文库。使用这样的聚合酶产生的核酸文库可用于多种下游过程,例如基因分型、核苷酸多态性(SNP)分析、拷贝数变异分析、表观遗传学分析、基因表达分析、杂交测定、基因突变的分析包括但不限于疾病状态的检测、预后和/或诊断、稀有或低频等位基因突变的检测和分析,以及核酸测序包括但不限于从头测序或目标区域重测序。
当进行聚合酶依赖性核酸合成或扩增时,可有用地修饰聚合酶(例如通过突变或化学修饰),以改变其催化性质。在一些情况下,可有用地修饰聚合酶以增强其催化性质。聚合酶在不同的涉及核酸合成的生物测定中的性能可受聚合酶对核苷酸底物的动力学行为限制。例如,聚合酶活性的分析可因不期望的行为例如给定的聚合酶与模板解离、结合和/或掺入不正确的例如非Watson-Crick碱基配对的核苷酸或释放正确的例如Watson-Crick碱基配对的核苷酸(而不掺入)的倾向而复杂化。这些和其它期望的性质可通过聚合酶的适当选择、选择的聚合酶的工程化和/或修饰来增强。例如,可进行这样的修饰以有利地改变聚合酶的核苷酸掺入速率、结合模板的亲和力、持续合成能力或平均阅读长度;这样的改变可增加从单个测序反应获得的序列信息量。在本领域仍然存在对显示改变的例如增强的持续合成能力、阅读长度(包括无错误阅读长度)和/或对于DNA模板的亲和力的改良聚合酶组合物的需要。这样的聚合酶组合物可用于许多种涉及聚合酶依赖性核酸合成(包括核酸测序和核酸文库的产生)的测定。
附图概述
并入本说明书并且形成本说明书的部分的附图举例说明了一个或多个示例性实施方案,并且用于解释不同示例性实施方案的原理。附图仅是示例性的和解释性的,并且不被解释为以任意方式进行的限定或限制。
图1是概述根据本公开内容的示例性解离速率曲线的示意图。
图2是概述根据本公开内容进行的示例性解离测定的示意图。
图3是提供根据本公开内容获得的修饰聚合酶相较于参照聚合酶的示例性模板亲和力数据的表。
图4是提供使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据的表。
图5是提供使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据的表。
图6显示提供使用根据本公开内容的示例性修饰聚合酶获得的示例性差错率数据的图。
图7显示提供使用根据本公开内容的示例性修饰聚合酶获得的示例性差错率数据的图。
图8是概述根据本公开内容获得的示例性修饰聚合酶的示例性解离速率曲线的示意图。
图9是使用根据本公开内容获得的示例性修饰聚合酶进行的示例性结合亲和力测定。
图10是使用根据本公开内容获得的示例性修饰聚合酶进行的示例性结合亲和力测定。
图11是使用根据本公开内容获得的示例性修饰聚合酶进行的示例性结合亲和力测定。
图12是使用根据本公开内容获得的示例性修饰聚合酶进行的示例性结合亲和力测定。
图13是提供使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据的表。
图14是提供使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据的表。
图15是提供使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据的表。
图16是提供使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据的表。
图17提供了使用根据本公开内容的示例性修饰聚合酶获得的示例性核酸测序数据。
概述
在一些实施方案中,本公开内容总地来说涉及用于进行核苷酸聚合反应的方法,所述方法包括如下步骤或由如下步骤组成:在一种或多种核苷酸存在的情况下将修饰聚合酶或其生物活性片段与核酸模板接触,其中修饰聚合酶或其生物活性片段相对于参照聚合酶包括一个或多个氨基酸修饰并且其中修饰聚合酶或其生物活性片段相对于参照聚合酶具有增加的解离时间常数,以及使用修饰聚合酶或其生物活性片段聚合一个或多个核苷酸的至少一个。在一些实施方案中,方法包括在高离子强度溶液存在的情况下使用修饰聚合酶或其生物活性片段聚合一个或多个核苷酸的至少一个。在一些实施方案中,方法还可包括以模板依赖性方式聚合至少一个核苷酸。在一些实施方案中,方法还可包括在接触之前、期间或之后将引物与模板杂交,并且其中聚合包括使用修饰聚合酶或其生物活性片段将至少一个核苷酸聚合至引物的末端。在一些实施方案中,在能够检测至少一个核苷酸被修饰聚合酶或其生物活性片段聚合的传感器附近进行聚合。在一些实施方案中,方法还可包括使用传感器检测表明一个或多个核苷酸的至少一个被修饰聚合酶或其生物活性片段聚合的信号。在一些实施方案中,传感器是ISFET。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQID NO:24具有至少80%的同一性的氨基酸或由所述氨基酸组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含来自聚合酶催化结构域的至少25个连续氨基酸。在一些实施方案中,修饰聚合酶或其生物活性片段包含来自聚合酶DNA结合结构域的至少25个连续氨基酸。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的至少100个氨基酸残基或由所述氨基酸残基组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少90%的同一性的聚合酶催化结构域的至少150个氨基酸残基或由所述氨基酸残基组成。
在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增的方法,所述方法包括如下步骤或由如下步骤组成:产生具有修饰聚合酶或其生物活性片段、引物、核酸模板和一个或多个核苷酸的扩增反应混合物,其中修饰聚合酶或其生物活性片段相对于参照聚合酶包括一个或多个氨基酸修饰并且相对于参照聚合酶具有增加的解离时间常数;和将扩增反应混合物经历扩增条件,其中使用修饰聚合酶或其生物活性片段将一个或多个核苷酸的至少一个聚合至引物的末端。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的氨基酸或由所述氨基酸组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含聚合酶催化结构域的至少25个连续氨基酸。在一些实施方案中,修饰聚合酶或其生物活性片段包含聚合酶DNA结合结构域的至少25个连续氨基酸。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的聚合酶催化结构域的至少100个连续氨基酸残基或由所述氨基酸组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少90%的同一性的聚合酶催化结构域的至少150个连续氨基酸残基或由所述氨基酸残基组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少95%的同一性的聚合酶催化结构域的至少150个连续氨基酸残基或由所述氨基酸残基组成。在一些实施方案中,方法包括具有高离子强度溶液的扩增条件。
在一些实施方案中,本公开内容总地来说涉及用于进行核苷酸聚合反应的方法,所述方法包括如下步骤或由如下步骤组成:在一个或多个核苷酸存在的条件下将修饰聚合酶或其生物活性片段与核酸模板混合,其中修饰聚合酶或其生物活性片段相对于参照聚合酶包含一个或多个氨基酸修饰并且相对于参照聚合酶具有增加的准确性;和使用混合物中的修饰聚合酶或其生物活性片段聚合一个或多个核苷酸的至少一个。在一些实施方案中,修饰聚合酶或其生物活性片段具有增加的准确性,如通过在高离子强度溶液存在的情况下测量增加的准确性测定的。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的氨基酸或由所述氨基酸组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的聚合酶催化结构域的至少150个氨基酸残基或由所述氨基酸残基组成。
在一些实施方案中,本公开内容总地来说涉及检测核苷酸掺入的方法,所述方法包括如下步骤或由如下步骤组成:使用与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的修饰聚合酶或其生物活性片段、核酸模板和一个或多个核苷三磷酸进行核苷酸掺入;产生核苷酸掺入的一种或多种副产品,检测核苷酸掺入的一种或多种副产品的至少一种的存在,和从而检测核苷酸掺入。
在一些实施方案中,方法包括包含聚合酶催化结构域或聚合酶DNA结合结构域的至少25个连续氨基酸残基的修饰聚合酶或其生物活性片段或由所述酶或其生物活性片段组成。在一些实施方案中,方法包括测定核苷酸掺入的身份或由所述测定组成。在一些实施方案中,核苷酸掺入的副产品是氢离子。
在一些实施方案中,本公开内容总地来说涉及检测核苷酸聚合反应过程中离子浓度的变化的方法,其包括如下步骤或由如下步骤组成:使用与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的修饰聚合酶或其生物活性片段进行核苷酸聚合反应,其中至少一种类型的离子的浓度在核苷酸聚合反应过程中改变,和检测表明至少一种类型的离子的浓度的变化的信号。在一些实施方案中,离子是氢离子。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的聚合酶催化结构域的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。
在一些实施方案中,本公开内容总地来说涉及用于扩增核酸的方法,其包括如下步骤或由如下步骤组成:在适合用于扩增核酸的条件下将核酸与包含与SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的聚合酶或其生物活性片段接触,以及扩增所述核酸。在一些实施方案中,通过聚合酶链式反应、乳液聚合酶链式反应、等温扩增、重组酶聚合酶扩增或链置换扩增进行扩增。在一些实施方案中,聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少90%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少95%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。
在一些实施方案中,本公开内容总地来说涉及包含分离的聚合酶或其生物活性片段或由其组成的组合物,所述聚合酶或其生物活性片段具有与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的聚合酶催化结构域的至少25个连续氨基酸残基。在一些实施方案中,分离的聚合酶或其生物活性片段具有可检测的聚合酶活性。在一些实施方案中,分离的聚合酶或其生物活性片段是DNA聚合酶。
在一些实施方案中,本公开内容总地来说涉及分离且纯化的多肽,所述多肽包含与SEQ ID NO:1具有至少80%的同一性的氨基酸或由所述氨基酸组成,并且具有一个或多个选自N31R、N31K、H46R、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、V533I、H572R、W577Y和D579F的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及分离且纯化的多肽,所述多肽包含与SEQ ID NO:2具有至少80%的同一性的氨基酸或由所述氨基酸组成,并且具有一个或多个选自N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、V533I、W577Y和D579F的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及分离且纯化的多肽,所述多肽包含与SEQ ID NO:15具有至少80%的同一性的氨基酸或由所述氨基酸组成,并且具有一个或多个选自E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及分离且纯化的多肽,所述多肽包含与SEQ ID NO:18具有至少80%的同一性的氨基酸或由所述氨基酸组成,并且具有一个或多个选自E245K、S259R、T266K、E290K、A448K、D505R、A512W、R513R和E518Q的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及分离的核酸序列,所述核酸序列包含编码与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ IDNO:24具有至少80%的同一性的多肽的核酸序列或由所述核酸序列组成。
在一些实施方案中,本公开内容总地来说涉及包含分离的核酸序列的载体,所述核酸序列编码与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的多肽。
在一些实施方案中,本公开内容总地来说涉及包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的分离的多肽的试剂盒。在一些实施方案中,试剂盒包括分离的多肽,所述多肽包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,分离的多肽包含来自多肽催化和/或DNA结合结构域的至少25个连续氨基酸残基。
在一些实施方案中,本公开内容总地来说涉及用于鉴定基因中一个或多个突变的方法,其包括在允许扩增的条件下使用与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的修饰聚合酶或其生物活性片段扩增所述基因。在一些实施方案中,所述基因在临床上与癌症或遗传性疾病相关。在一些实施方案中,疾病与致病性相关。在一些实施方案中,基因与感染性疾病相关。在一些实施方案中,基因与植物或动物的抗病性相关。在一些实施方案中,基因与与人或动物疾病相关的病理学相关。在一些实施方案中,基因与对一种或多种抗生素的细菌抗性相关。在一些实施方案中,允许扩增的条件包括聚合酶链式反应、乳液聚合酶链式反应、等温扩增、重组酶聚合酶扩增或链置换扩增。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少80%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含来自聚合酶催化和/或DNA结合结构域的至少25个连续氨基酸残基。
在一些实施方案中,本公开内容总地来说涉及聚合酶或其生物活性片段,所述聚合酶或其生物活性片段具有DNA聚合酶活性并且与SEQ ID NO:1、SEQ ID NO:15、SEQ IDNO:16或SEQ ID NO:18具有至少80%的同一性,其中聚合酶或其生物活性片段相较于SEQID NO:1、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:18包括至少一个氨基酸突变。在一些实施方案中,聚合酶或其生物活性片段包含至少一个位于聚合酶DNA结合或催化结构域中的氨基酸突变。在一些实施方案中,聚合酶或其生物活性片段包含在至少150个连续氨基酸残基上与SEQ ID NO:1、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO.18的任意部分的大体同一性。在一些实施方案中,聚合酶或其生物活性片段包含聚合酶DNA结合或催化结构域的任意部分的150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,聚合酶或其生物活性片段在150个连续氨基酸残基上包含至少90%的同一性。
在一些实施方案中,本公开内容总地来说涉及大体上纯化的聚合酶,所述聚合酶具有包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQID NO.24具有至少80%的同一性的序列或由所述序列组成的氨基酸序列。在一些实施方案中,本公开内容总地来说涉及大体上纯化的聚合酶,所述聚合酶具有包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24具有至少95%的同一性的序列变体或由所述序列变体组成的氨基酸序列。在一些实施方案中,本公开内容总地来说涉及大体上纯化的聚合酶,所述聚合酶具有包含SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24的保留聚合酶活性的片段或由所述片段组成的氨基酸序列。在一些实施方案中,聚合酶活性选自DNA结合活性、引物延伸活性、链置换活性、校正活性、切口引发聚合酶活性、逆转录酶活性或核苷酸聚合活性。在一些实施方案中,在高离子强度溶液存在的情况下测定聚合酶活性。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:1包含选自H46R的突变或突变的组合,并且其中聚合酶还包括E446Q、H572R、H273R、H281A、H473R、Y477F、D480R或H528A的一个或多个突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:1包含选自E446Q的突变或突变的组合,其中聚合酶还包括H46R、H572R、H273R、H281A、H473R、Y477F、D480R或H528A的一个或多个的突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:1包含选自H572R的突变或突变的组合,其中聚合酶还包括E446Q、H572R、H273R、H281A、H473R、Y477F、D480R或H528A的一个或多个的突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含C93突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含Q238突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含H273突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含H281突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含H473突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或与SEQ ID NO:1具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含H528突变。在一些实施方案中,与SEQ ID NO:1同源的重组聚合酶与相对于与SEQ ID NO:1同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较包含增加解离时间常数,增加持续合成能力,增加准确度,增加平均阅读长度,增加最小阅读长度,增加AQ20或增加200Q17值的突变。在一些实施方案中,与SEQ IDNO:1同源的重组聚合酶与相对于与SEQ ID NO:1同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较包含增加的准确度。在一些实施方案中,与SEQ ID NO:1同源的重组聚合酶与相对于与SEQ ID NO:1同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较包含增加的平均阅读长度。在一些实施方案中,与SEQ ID NO:1同源的重组聚合酶在高离子强度溶液存在的情况下与相对于SEQ ID NO:1同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较包含增加测序通量。在一些实施方案中,与SEQ ID NO:1同源的重组聚合酶与相对于与SEQ ID NO:1同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较包含增加的解离时间常数。在一些实施方案中,使用ISFET测量增加的解离时间常数、增加的持续合成能力、增加的准确度、增加的平均阅读长度、增加的最小阅读长度、增加的AQ20或增加的200Q17值。在一些实施方案中,将ISFET与基于半导体的测序平台偶联。在一些实施方案中,基于半导体的测序平台是个体化基因组测序仪(Personal GenomeMachine)或Proton测序仪。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:15同源的重组聚合酶或与SEQ ID NO:15具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:15包含选自E471K的突变或突变的组合,其中聚合酶还包括:N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q的一个或多个的突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:15同源的重组聚合酶或与SEQ ID NO:15具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:15包含选自V740R的突变或突变的组合,其中聚合酶还包括:E471K、N485R、D513K和E745Q的一个或多个的突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ ID NO:15同源的重组聚合酶或与SEQ ID NO:15具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶包含选自N485的突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ ID NO:15同源的重组聚合酶或与SEQ ID NO:15具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:15包含选自D513的突变或突变的组合。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:15同源的重组聚合酶或与SEQ ID NO:15具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:15包含选自D732的突变或突变的组合。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:15同源的重组聚合酶或与SEQ ID NO:15具有至少80%的同一性的其生物活性片段或其生物活性片段,并且其中重组聚合酶相对于SEQ ID NO:15包含选自E745的突变或突变的组合。在一些实施方案中,与SEQ ID NO:15同源的重组聚合酶或其生物活性片段与相对于SEQID NO:15不存在突变或突变的组合的参照聚合酶相比较包含增加的准确度,或与相对于SEQ ID NO:15不存在突变或突变的组合的参照聚合酶相比较包含增加的解离时间常数,或与相对于SEQ ID NO:15不存在突变或突变的组合的参照聚合酶相比较包含增加的最小阅读长度,或与相对于与SEQ ID NO:15同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较在高离子强度溶液存在的情况下包含增强的测序性能,或与相对于SEQ ID NO:15不存在突变或突变的组合的参照聚合酶相比较包含增加的平均阅读长度。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶相对于SEQ ID NO:18包含选自E245K的突变或突变的组合,其中聚合酶还包含:S259R、T266K、E290K、A448K、D505R、A512W、R513R和E518Q的一个或多个的突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQID NO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶相对于SEQ ID NO:18包含选自E245K的突变或突变的组合,其中聚合酶还包含:S259R、T266K、E290K、A448K、D505R、A512W、R513R和E518Q的一个或多个的突变。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶相对于SEQ ID NO:18包含选自D505R的突变或突变的组合,其中聚合酶还包含:E245K、S259R、T266K、E290K、A448K、A512W、R513R和E518Q的一个或多个的突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQID NO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶包含E290突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ ID NO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶包含S259突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ ID NO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶包含R513突变。在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ ID NO:18同源的重组聚合酶或与SEQ ID NO:18具有至少80%的同一性的其生物活性片段或其生物学片段,并且其中重组聚合酶包含A512突变。在一些实施方案中,与SEQ ID NO:18同源的重组聚合酶或其生物活性片段与相对于SEQ IDNO:18不存在突变或突变的组合的参照聚合酶相比较包含增加的准确度,或与相对于SEQID NO:18不存在突变或突变的组合的参照聚合酶相比较包含增加的解离时间常数活性,或与相对于SEQ ID NO:18不存在突变或突变的组合的参照聚合酶相比较包含增加的最小阅读长度,或与相对于与SEQ ID NO:18同源的重组聚合酶不存在突变或突变的组合的参照聚合酶相比较在高离子强度存在的情况下包含增强的测序性能,或与相对于SEQ ID NO:18不存在突变或突变的组合的参照聚合酶相比较包含增加的平均阅读长度。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或其生物活性片段,其中重组聚合酶相对于SEQ ID NO:1包含选自如下突变的任一个或多个的突变或突变的组合:N31、D77、D113、D114、D130、D144、L212、E220、N234、V241、V251、D264、Y272、H273、L280、H281、E294、V299、D303、I331、E325、L335、E336、I354、I370、Q409、G416、V418、G420、D423、G425、Q428、N429、E446、F448、N457、A462、H473、Y477、D480、N485、N487、V488、E493、M495、H528、V533、H572、W577和D579。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:1同源的重组聚合酶或其生物活性片段,所述重组聚合酶或其生物活性片段相对于SEQID NO:1包含选自如下突变的任一个或多个的突变或突变的组合:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、H281M、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528R、H528K,V533I、H572R、W577Y和D579F。在一些实施方案中,与SEQID NO:1同源的重组聚合酶是保持聚合酶活性的重组聚合酶的任意生物活性片段。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:16同源的重组聚合酶或其生物活性片段,其中重组聚合酶相对于SEQ ID NO:16包含选自如下突变的任一个或多个的突变或突变的组合:H341、C388、Q533、H568、H576、E741、H768、Y772、H823、C845和H867。在一些实施方案中,与SEQ ID NO:16同源的重组聚合酶相对于SEQ ID NO:16包含选自如下突变的任一个或多个的突变或突变的组合:H341R、C388R、Q533C、H568R、H576A、E741Q、H768R、Y772F、H823A、C845Q和H867R。在一些实施方案中,与SEQID NO:16同源的重组聚合酶是保持聚合酶活性的重组聚合酶的任意生物学片段。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:15同源的重组聚合酶,其中重组聚合酶相对于SEQ ID NO:15包含选自如下突变的任一个或多个的突变或突变的组合:E471、N485、R492、D513、A675、D732、S739、V740和E745。在一些实施方案中,与SEQ ID NO:15同源的重组聚合酶相对于SEQ ID NO:15包含选自如下突变的任一个或多个的突变或突变的组合:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q。在一些实施方案中,与SEQ ID NO:15同源的重组聚合酶是保持聚合酶活性的重组聚合酶的任意生物学片段。
在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含与SEQ IDNO:18同源的重组聚合酶,其中重组聚合酶相对于SEQ ID NO:18包含选自如下突变的任一个或多个的突变或突变的组合:E245、S259、T266、E290、A448、D505、A512和E518。在一些实施方案中,与SEQ ID NO:18同源的重组聚合酶相对于SEQ ID NO:18包含选自如下突变的任一个或多个的突变或突变的组合:E245K、S259R、T266K、E290K、A448K、D505R、A512W和E518Q。在一些实施方案中,与SEQ ID NO:18同源的重组聚合酶是保持聚合酶活性的重组聚合酶的任意生物学片段。
在一些实施方案中,本公开内容总地来说涉及用于进行核酸测序的方法,其包括在一个或多个核苷酸存在的情况下将修饰聚合酶或其生物活性片段与核酸模板接触,其中修饰聚合酶或其生物活性片段相对于参照聚合酶包含一个或多个氨基酸修饰、并且其中修饰聚合酶或其生物活性片段相对于参照聚合酶具有增加的解离时间常数;以及使用修饰聚合酶或其生物活性片段聚合一个或多个核苷酸的至少一个。在一些实施方案中,核酸模板是DNA模板。在一些实施方案中,一个或多个核苷酸不包含可检测的标记。在一些实施方案中,修饰聚合酶或其生物活性片段是家族A或家族B DNA聚合酶。在一些实施方案中,本公开内容总地来说涉及与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO 15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24具有至少80%的同一性的修饰聚合酶。在一些实施方案中,本公开内容总地来说涉及修饰聚合酶,所述修饰聚合酶包含与SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20或SEQ ID NO.24具有至少95%的同一性的序列变体或由所述序列变体组成。
在一些实施方案中,本公开内容总地来说涉及包含保持聚合酶活性的SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO 20、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24的片段的修饰聚合酶。在一些实施方案中,修饰聚合酶包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO 15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24的任意片段具有至少80%的同一性的生物活性片段。在一些实施方案中,修饰聚合酶包含具有聚合酶催化结构域的至少25个连续氨基酸并且与SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO 15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQID NO.24具有至少80%的同一性的生物活性片段。在一些实施方案中,生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO 15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24具有至少80%的同一性的至少100个连续氨基酸残基。在一些实施方案中,方法还包括测定被修饰聚合酶聚合的一个或多个核苷酸的身份。在一些实施方案中,方法还包括测定被修饰聚合酶聚合的核苷酸的数目。在一些实施方案中,至少50%的被修饰聚合酶聚合的一个或多个核苷酸被鉴定。在一些实施方案中,基本上全部被修饰聚合酶聚合的一个或多个核苷酸被鉴定。在一些实施方案中,聚合在高离子强度溶液存在的情况下发生。在一些实施方案中,高离子强度溶液包含约200mM至约250mM的盐。在一些实施方案中,高离子强度溶液包含KCl和/或NaCl。
在一些实施方案中,本公开内容总地来说涉及用于进行核苷酸聚合反应的方法,其包括在一个或多个核苷酸存在的情况下将修饰聚合酶或其生物活性片段与核酸模板接触,其中修饰聚合酶或其生物活性片段相对于参照聚合酶包含一个或多个氨基酸修饰并且相对于参照聚合酶具有增加的准确度,以及使用修饰聚合酶聚合一个或多个核苷酸的至少一个。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ IDNO.24具有至少80%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含来自聚合酶催化或DNA结合结构域的与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO 15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24具有至少80%的同一性的至少25个连续氨基酸残基。在一些实施方案中,修饰聚合酶或其生物活性片段包含来自SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO 15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24的聚合酶催化或DNA结合结构域的至少25个连续氨基酸残基。在一些实施方案中,在高离子强度溶液存在的情况下进行聚合。
在一些实施方案中,本公开内容总地来说涉及用于进行核酸测序的方法,其包括如下步骤或由如下步骤组成:在一个或多个核苷酸存在的情况下将修饰聚合酶与核酸模板接触,其中修饰聚合酶相对于参照聚合酶具有一个或多个氨基酸修饰并且相对于参照聚合酶具有增加的准确度,以及使用修饰聚合酶聚合一个或多个核苷酸的至少一个。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24具有至少80%的同一性的至少150个连续氨基酸残基或由所述连续氨基酸残基组成。在一些实施方案中,修饰聚合酶或其生物活性片段包含与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24具有至少80%的同一性的来自聚合酶催化或DNA结合结构域的至少25个连续氨基酸残基。在一些实施方案中,修饰聚合酶或其生物活性片段包含来自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO.24的聚合酶催化或DNA结合结构域的至少25个连续氨基酸残基。在一些实施方案中,在高离子强度溶液存在的情况下进行聚合。在一些实施方案中,修饰聚合酶或其生物活性片段是DNA或RNA聚合酶。
发明详述
除非另外定义,否则本文中使用的全部技术和科学术语具有与这些发明所属的领域内的技术人员通常所理解的含义相同的含义。将本文中(上文和下文)提及的全部专利、专利申请、公开申请、论文及其它出版物通过引用整体并入本文。如果在本文中明确或暗示地提出的定义和/或描述与通过引用并入本文的专利、专利申请、公开申请和其它出版物中所示的任何定义相反或不一致,则本文中所示的定义和/或描述优于通过引用并入的定义。
除非另外指出,否则本公开内容的实践将使用常规的分子生物技术、微生物学技术和重组DNA技术,所述技术在本领域技术人员的能力之内。这样的技术在文献中进行了详尽描述。参见,例如,Sambrook,J.和Russell,D.W.,2001,Molecular Cloning:ALaboratory Manual,第3版;Ausubel,F.M.,等人,eds.,2002,Short Protocols InMolecular Biology,第5版。
要指出的是不一定需要全部一般描述或实施例中描述的活动,和一部分特定活动可能是不需要的,以及除了描述的那些活动以外还可进行一个或多个其它活动。此外,活动中所列的顺序不一定是进行它们时所按的顺序。
在一些情况下,已描述了关于特定实施方案的一些概念。然而,本领域技术人员应理解,可进行各种修饰和变化而不背离下文中的权利要求中所示的本发明的范围。因此,说明书和附图被认为是举例说明性的而非限制性的,并且所有这样的变动意欲包括在本发明的范围内。
如本文中所用,术语“包含”(及包含的任何形式或变型,例如“包括”和“含有”)、“具有”(及具有的任何形式或变型)、“包括”(及包括的任何形式或变型)或“含有”(及含有的任何形式或变型,)是包含性的或开放性的,并且不排除另外的未引述的添加物、组分、整体、元素和方法步骤。例如,包括一列特性的过程、方法、制品或装置不一定仅限于这些特性,而且还可包括其它未明确列出的或这样的过程、方法、制品或装置所固有的其它特性。
除非明确地声明相反,否则“或”是指包涵或(inclusive-or)并且不是指的互斥或(exclusive-or)。例如,条件A或B满足于下列的任一项:A为真(或存在)并且B为假(或不存在),A为假(或不存在)并且B为真(或存在),以及A和B都为真(或存在)。
已描述了关于特定实施方案的益处、其它有利方面以及对问题的解决。然而,这样的益处、有利方面、对问题的解决以及可导致任何益处、有利方面或解决产生或变得更明显的任何特性不被解释为任何或全部所述项的至关重要的、需要的或必需特性。
在阅读本说明书后,本领域技术人员将理解,为了清楚起见在本文中在单独的实施方案的上下文中描述的某些特性也可在单个实施方案中组合地提供。相反地,为了简明起见,在单个实施方案的上下文中描述的各种特性还可单独地或以任意亚组合提供。此外,范围中提及的值包括在该范围内的每一个值。
同样地,冠词例如“一个/一种(a)”、“一个/一种(an)”或“所指物(the)”的用途是用于描述本文中描述的元素和组分。这仅为了方便和给出本发明的范围的一般意义。应当理解这样的描述为包括一个或至少一个,并且除非很明显其另有所指,否则单数还包括复数。因此,除非它们在上下文中的使用另有所指,否则本文中使用的术语“一个/一种(a)”、“一个/一种(an)”和“所指物(the)”和类似指示物被解释为覆盖单数和复数。因此,当用于权利要求或说明书中时,包括当与术语“包含”组合使用时,单词“一个/一种(a)”、“一个/一种(an)”或“所指物(the)”的使用可意指“一个/种”,但其还与“一个/一种或多个/多种”、“至少一个/一种”和“一个/一种或超过一个/一种”的含义一致。
如本文中所用,术语“聚合酶”及其变体包括可催化核苷酸(包括其类似物)聚合成核酸链的任何酶。通常地但非必定地,这样的核苷酸聚合可以以模板依赖性方式发生。这样的聚合酶可包括但不限于天然存在的聚合酶及其任意亚单位和截短形式、突变聚合酶、变异聚合酶、重组聚合酶、融合聚合酶或另外改造的聚合酶、化学修饰聚合酶、合成分子或装配体及保持催化这样的聚合的能力的任何类似物、同源物、衍生物或其片段。任选地,聚合酶可以是突变聚合酶,其包含一个或多个突变(包括用其它氨基酸对一个或多个氨基酸的替换、一个或多个氨基酸从聚合酶的插入或缺失或两个或更多个聚合酶的部分的连接)。通常地,聚合酶包含一个或多个可在其上发生核苷酸结合和/或核苷酸聚合的催化的活性部位。一些示例性聚合酶包括但不限于DNA聚合酶(例如Phi-29DNA聚合酶、逆转录酶和大肠杆菌(E.coli)DNA聚合酶)和RNA聚合酶。如本文中所用,术语“聚合酶”及其变体还指包含至少两个彼此连接的部分的融合蛋白,其中第一部分包含可催化核苷酸至核酸链的聚合并且连接至包含第二多肽的第二部分的肽。在一些实施方案中,第二多肽可包括报告酶或持续合成能力增强结构域。
如本文中所用,术语“连接”、“连接的”、“联接”及其变型包括融合、键合、粘附或缔合的任何类型,其具有足够的稳定性来经受住在特定目的生物应用中的使用。这样的连接可包括例如共价、离子、氢、偶极-偶极、亲水、疏水或亲和力键合、键或缔合(涉及范德瓦尔斯力)、机械键合等。任选地,这样的连接可在不同分子的组合之间发生,包括但不限于:纳米颗粒与蛋白质之间;蛋白质与标记物之间;接头与官能化纳米颗粒之间;接头与蛋白质之间;核苷酸与标记物之间等。连接的一些实例可见于例如Hermanson,G.,BioconjugateTechniques,第二版(2008);Aslam,M.,Dent,A.,Bioconjugation:Protein CouplingTechniques for the Biomedical Sciences,London:Macmillan(1998);Aslam,M.,Dent,A.,Bioconjugation:Protein Coupling Techniques for the Biomedical Sciences,London:Macmillan(1998)中。
如本文中所用,对于多肽或蛋白质例如聚合酶,术语“修饰”或“修饰的”及其变型包括蛋白质的结构、生物学和/或化学性质的任何变化。在一些实施方案中,修饰可包括蛋白质的氨基酸序列的变化。例如,修饰可任选地包括一个或多个氨基酸突变,包括但不限于氨基酸添加、缺失和置换(包括保守和非保守置换)。
如本文中所用,对于氨基酸序列的任何变化,术语“保守的”及其变型是指其中一个或多个氨基酸被另一个具有高度相似性质的氨基酸置换的氨基酸突变。例如,一种或多种包含非极性或脂肪族侧链的氨基酸(例如,甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸)可彼此置换。类似地,一种或多种包含极性、不带电荷的侧链的氨基酸(例如,丝氨酸、苏氨酸、半胱氨酸、甲硫氨酸、天冬酰胺或谷氨酰胺)可彼此置换。类似地,一种或多种包含芳香族侧链的氨基酸(例如,苯丙氨酸、酪氨酸或色氨酸)可彼此置换。类似地,一种或多种包含带正电荷侧链的氨基酸(例如,赖氨酸、精氨酸或组氨酸)可彼此置换。类似地,包含带负电荷侧链的一种或多种氨基酸(例如,天冬氨酸或谷氨酸)可彼此置换。在一些实施方案中,修饰聚合酶是包含这类保守氨基酸置换的一个或多个或其任意组合的变体。在一些实施方案中,亮氨酸的保守置换包括:丙氨酸、异亮氨酸、缬氨酸、苯丙氨酸、色氨酸、甲硫氨酸和半胱氨酸。在其它实施方案中,天冬酰胺的保守置换包括:精氨酸、赖氨酸、天冬氨酸、谷氨酸和谷氨酰胺。
在整个本公开内容中,通过使用氨基酸单字母代码并且标明残基在参照氨基酸序列内的位置来引用各种氨基酸突变(包括例如氨基酸置换)。在氨基酸置换的情况下,置换基的身份也使用氨基酸单字母代码来标示。例如,假定的氨基酸置换“D166A,其中编号是相对于SEQ ID NO:7的氨基酸序列的”的引述表示其中用丙氨酸(A)残基替换SEQ ID NO:7的氨基酸序列的氨基酸位置166上通常存在的天冬氨酸(D)残基的氨基酸置换。许多本文中公开的氨基酸序列始于甲硫氨酸残基(“M”),常在编码期望在细菌宿主细胞中表达的肽的核酸序列的起始点引入其。然而,应理解,本公开内容还包括所有这样的从第二氨基酸残基起始,而不包含第一甲硫氨酸残基的氨基酸序列。
如本文中所用,术语“同一的”或“百分比同一性”及其变型,当用于两个或更多个核酸或多肽序列的背景中时,是指当就最大对应性进行比较和对齐时,为相同的或具有指定百分比的相同的氨基酸残基或核苷酸的两个或更多个序列或子序列,如使用下列序列比较算法的任一个或多个测量的:Needleman-Wunsch(参见,例如,Needleman,Saul B.;和Wunsch,Christian D.(1970)."A general method applicable to the search forsimilarities in amino acid sequence of two proteins"Journal of MolecularBiology 48(3):443–53);Smith-Waterman(参见,例如,Smith,Temple F.;和Waterman,Michael S.,“Identification of Common Molecular Subsequences"(1981)Journal ofMolecular Biology147:195–197);或BLAST(碱基局部比对检索工具;参见,例如,AltschulSF,Gish W,Miller W,Myers EW,Lipman DJ,"Basic local alignment search tool"(1990)J Mol Biol 215(3):403–410)。
如本文中所用,术语“大体上同一的”或“大体同一性”及其变型,当用于两个或更多个核酸或多肽序列的背景中时,是指当就最大对应性进行比较和对齐时,具有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的核苷酸或氨基酸残基同一性的两个或更多个序列或子序列(例如生物活性片段),如使用序列比较算法或通过目测检查测量的。大体上同一的序列通常被认为是同源的,不论实际祖先。在一些实施方案中,“大体同一性”存在于正在比较的序列的区域上。在一些实施方案中,大体同一性存在于在长度上为至少25个残基,在长度上为至少50个残基,在长度上为至少100个残基,在长度上为至少150个残基,在长度上为至少200个残基,或在长度上大于200个残基的区域上。在一些实施方案中,正在比较的序列在正在比较的序列的全长上大体上同一。通常地,大体上同一的核酸或蛋白质序列包括小于100%的核苷酸或氨基酸残基同一性,因为这样的序列通常被认为是“同一的”。
蛋白质和/或蛋白质子序列(例如生物活性片段),当从共同的祖先蛋白质或蛋白质序列天然或人工地衍生时,是“同源的”。类似地,核酸和/或核酸序列,当从共同的祖先核酸或核酸序列天然或人工地衍生时,是同源的。同源性通常从两个或更多个核酸或蛋白质(或其生物活性片段或序列)之间的序列相似性推导而来。用于建立同源性的序列之间的相似性的精确百分比随讨论中的核酸和蛋白质的变化而变化,但在25、50、100、150或更多个核酸或氨基酸残基上至少25%的序列相似性常规地用于建立同源性。更高水平的序列相似性例如30%、40%、50%、60%、70%、80%、85%、90%、95%、98%或99%也可用于建立同源性。
用于测定序列相似性百分比的方法(例如,使用缺省参数的BLASTP和BLASTN)描述于本文中,并且通常是可获得的。为了进行序列比较和同源性测定,通常一个序列用作与测试序列比较的参照序列。一般而言,当使用序列比较算法时,将测试和参照序列输入计算机,必要时,指定子序列坐标,和指定序列算法程序参数。序列比较算法随后基于指定的程序参数计算测试序列相对于参照序列的百分比序列同一性。可以例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法,通过Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)的相似性搜索法,通过这些算法的计算机化实现(Wisconsin Genetics Software Package,Genetics Computer Group,575Science Dr.,Madison,Wis.中的GAP、BESTFIT、FASTA和TFASTA),或通过目测观察(通常参见CurrentProtocols in Molecular Biology,Ausubel等人,eds.,Greene Publishing Associates,Inc.与John Wiley&Sons,Inc.联合运营的Current Protocols,增刊至2004年)进行用于比较的序列的最佳比对。适合用于测定百分比序列同一性和序列相似性的算法的一个实例是BLAST算法,其描述于Altschul等人,J.Mol.Biol.215:403-410(1990)中。用于进行BLAST分析的软件可通过国家生物技术信息中心(National Center for BiotechnologyInformation)公共地获得。该算法包括通过鉴定查询序列中的长度为“W”的短字母来首先鉴定高分序列对(HSP),其在与数据库序列中具有相同长度的字母对齐时匹配或满足某一正值阈值得分“T”。“T”被称为邻近字母得分阈值(Altschul等人、同上)。这些初始邻近字母命中用作用于起始搜索以发现含有字母命中的更长HSP的种子。随后沿着每一个序列在两个方向上延伸字母命中,进行远至可增加累积的比对分数。对于核苷酸序列,使用参数累积分数“M”(一对匹配残基的奖励分;总是>0)和“N”(错配残基的罚分;总是<0)来计算累积分数。对于氨基酸序列,将打分矩阵用于计算累积分数。当:累积比对分数从其最大获得值下降数量X;由于一个或多个负分残基比对的积累,累积分数变成0或小于0;或到达任一序列的末端时,停止字母命中在每一个方向上的延伸。BLAST算法参数“W”、“T”和“X”决定比对的敏感性和速率。BLASTN程序(对于核苷酸序列)使用为11的字长(W)、为10的期望值(E)、为100的截短值、M=5、N=-4以及两条链的比较为缺省值。对于氨基酸序列、BLASTP程序使用为3的字长(W)、为10的期望值(E)截短和BLOSUM62打分矩阵(参见Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)为缺省值。
除了计算百分比序列同一性外,BLAST算法还可进行两个序列之间的相似性的统计分析(参见,例如,Karlin&Altschul、Proc.Nat'l.Acad.Sci.USA 90:5873-5787(1993))。由BLAST算法提供的相似性的一个测量是最小和概率(smallest sum probability)(P(N)),其提供两个核苷酸或氨基酸序列之间的匹配会偶然发生的概率的指标。例如,如果测试核酸与参照核酸的比较的最小和概率小于约0.1,小于约0.01或小于约0.001,则核酸被认为与参照序列相似。如本文中所用,术语“引物延伸活性”及其变型,当用于指给定的聚合酶时,包括给定聚合酶的涉及催化核苷酸至正在延伸的核酸分子的3’OH末端掺入的任何体内或体外酶促活性特征。通常地但非必定地,这样的核苷酸掺入以模板依赖性方式发生。在一些实施方案中,给定的聚合酶的引物延伸活性可被定量为在特定的一组反应条件下由单位量的聚合酶(以摩尔表示)每单位时间(秒)掺入的核苷酸总数(如通过例如放射性测量或其它适当测定法测量的)。
如本文中所用,术语“DNA结合活性”及其变型,当用于指给定的聚合酶时,包括给定聚合酶的与聚合酶以基于识别的方式与DNA序列的相互作用相关的任何体内或体外酶促活性特征。通常地但非必定地,这样的相互作用包括聚合酶对识别的DNA序列的结合,更具体地聚合酶的DNA结合结构域对识别的DNA序列的结合。在一些实施方案中,识别包括聚合酶对序列特异性或非序列特异性DNA序列的结合。在一些实施方案中,给定的聚合酶的DNA结合活性可定量为聚合酶识别并且结合识别的DNA序列的亲和力。例如,当在特定的一组反应条件下形成蛋白质-DNA复合物时,可使用各向异性信号变化(或其它适当的测定)监控和测定DNA结合活性。
如本文中所用,术语“生物活性片段”及其变型,当用于指给定的生物分子时,是指具有作为生物分子本身的特征的体内或体外活性的生物分子的任意片段、衍生物、同源物或类似物。例如,聚合酶可通过各种生物活性例如DNA结合活性、核苷酸聚合活性、引物延伸活性、链置换活性、逆转录酶活性、切口引发聚合酶活性、3’-5’外切核酸酶(校正读码)活性等来表征。在一些实施方案中,聚合酶的“生物活性片段”是聚合酶的可催化核苷酸(包括其同源物和类似物)至核酸链的聚合的任意片段、衍生物、同源物或类似物。在一些实施方案中,聚合酶的生物活性片段、衍生物、同源物或类似物在任何体内或体外目标测定(例如,DNA结合测定、核苷酸聚合测定(其可以是模板依赖性的或不依赖于模板的)、引物延伸测定、链置换测定、逆转录酶测定、校正读码测定等)中具有10%、20%、30%、40%、50%、60%、70%、75%、80%、85%或90%或更高的聚合酶的生物活性。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外引物延伸活性来测定。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外聚合活性来测定。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外DNA结合活性来测定。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外链置换活性来测定。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外逆转录酶活性来测定。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外切口引发的聚合酶活性来测定。在一些实施方案中,聚合酶片段的生物活性通过在确定的反应条件下测量片段的体外校正读码活性来测定。在一些实施方案中,聚合酶的生物活性片段可包括测量本文中概述的聚合酶生物活性的任一个或多个的生物活性。
在一些实施方案中,生物活性片段可包括修饰聚合酶的DNA结合结构域的任意部分或催化结构域的任意部分。对于本领域技术人员来说很显然的是即使在密切相关的聚合酶之间,DNA结合和催化结构域可在氨基酸残基的绝对数目或序列上不同。进化上相关的聚合酶家族成员可能共有高度的序列同源性。对于本领域技术人员来说也显然的是目标聚合酶的结合结构域或催化结构域可使用本领域技术人员已知的标准方法来确定。例如,晶体学、原子力显微镜检查和各种生物化学测定可用于测定每一个结构域的氨基酸基序。在一些实施方案中,生物活性片段可任选地包括DNA结合或催化结构域的任意25、50、75、100、150或更多个连续氨基酸残基。在一些实施方案中,修饰聚合酶的生物活性片段可包括与本公开内容包括的聚合酶的任一个或多个具有至少80%、85%、90%、95%、98%或99%的同一性的催化结构域或DNA结合结构域的至少25个连续氨基酸残基。在一些实施方案中,修饰聚合酶的生物活性片段可包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个或多个具有至少80%、85%、90%、95%、98%或99%的同一性的催化结构域或DNA结合结构域的至少25个连续氨基酸残基。
生物活性片段可任选地体内存在,例如从转录后加工产生的或从选择性剪接的RNA的翻译产生的,或可选择地可通过工程、批量合成或其它适当的操作产生的片段。生物活性片段包括在天然或内源细胞中表达的片段以及在表达系统中例如在细菌、酵母、昆虫或哺乳动物细胞中产生的那些片段。
在一些实施方案中,本公开内容总地来说不令涉及本文中公开的特定聚合酶,而且还涉及这样的聚合酶的任意生物活性片段,所述聚合酶或生物活性片段包括在本公开内容的范围内。在一些实施方案中,本公开内容的任何聚合酶的生物活性片段包括显示体外引物延伸活性的任意片段。
在一些实施方案中,本公开内容总地来说不仅涉及本文中公开的特定聚合酶而且还涉及这样的聚合酶的任意生物活性片段,所述聚合酶或其生物活性片段包括在本公开内容的范围内。在一些实施方案中,本公开内容的任何聚合酶的生物活性片段包括显示体外DNA结合活性的任意片段。
在一些实施方案中,本公开内容总地来说不仅涉及本文中公开的特定聚合酶,而且还涉及这样的聚合酶的任意生物活性片段,所述聚合酶或其生物活性片段包括在本公开内容的范围内。在一些实施方案中,本公开内容的任何聚合酶的生物活性片段包括保持体外聚合酶活性的任意片段。聚合酶活性可通过本领域已知的任何方法来测定。例如,聚合酶活性的测定可基于在模板上延伸引物的活性。
在一些实施方案中,本公开内容总地来说涉及相对于不存在一个或多个氨基酸突变的参照聚合酶具有一个或多个氨基酸突变(例如缺失、置换或添加)的修饰聚合酶,并且其中修饰聚合酶保持体外聚合酶活性,显示体外DNA结合活性或显示体外引物延伸活性。在一些实施方案中,修饰聚合酶包括这样的聚合酶的任意生物活性片段,所述生物活性片段保持体外聚合酶活性,显示体外DNA结合活性或显示体外引物延伸活性。
在一些实施方案中,本公开内容总地来说涉及相对于不存在一个或多个氨基酸突变的参照聚合酶具有一个或多个氨基酸突变(例如缺失、置换或添加)的氨基酸突变的修饰聚合酶,并且其中修饰聚合酶保持体外校正读码活性,显示体外切口引发的聚合酶活性或体外逆转录酶活性。在一些实施方案中,修饰聚合酶包括这样的聚合酶的任意生物活性片段,所述生物活性片段保持体外校正读码活性,显示体外切口引发的聚合酶活性或体外逆转录酶活性。聚合酶显示外切核酸酶活性或是显示减小的外切核酸酶活性的测定可容易地通过标准方法来测定。例如,可这样合成多核苷酸,以便可检测比例的核苷酸被放射性标记。可在待测试的多肽存在的情况下在适当的缓冲液中温育这些多核苷酸。温育后,沉淀多核苷酸,由于上清液中存在游离核苷酸,因此外切核酸酶活性可被检测为放射性计数。如将被本领域技术人员所理解的,取决于目的应用,可基于上述生物活性的任何活性或其组合,从本文中描述的那些聚合酶或生物活性片段选择适当的聚合酶或生物活性片段。
如本文中所用,术语“核苷酸”及其变型包括可选择性结合聚合酶或可被聚合酶聚合的任何化合物。通常地但非必定地,在核苷酸与聚合酶选择性结合后,聚合酶将核苷酸聚合成核酸链;然而偶然地,核苷酸可与聚合酶解离而不被掺入核酸链,此为在本文中被称为“非生产性”事件的事件。这样的核苷酸不仅包括天然存在的核苷酸而且还包括任何类似物,不论其结构,所述核苷酸或类似物可选择性结合聚合酶或可被聚合酶聚合。虽然天然存在的核苷酸通常包括碱基、糖和磷酸部分,然而本公开内容的核苷酸可包括不存在这样的部分的任一个、多个或全部的化合物。在一些实施方案中,核苷酸可任选地包括包含3、4、5、6、7、8、9、10或更多个磷原子的磷原子的链。在一些实施方案中,磷链可连接至糖环的任意碳,例如5’碳。磷链可通过插入的O或S连接至糖。在一个实施方案中,链中的一个或多个磷原子可以是具有P和O的磷酸基团的部分。在另一个实施方案中,链中的磷原子可通过插入的O、NH、S、亚甲基、取代的亚甲基、乙烯、取代的乙烯、CNH2、C(O)、C(CH2)、CH2CH2或C(OH)CH2R(其中R可以是4-吡啶或1-咪唑)连接在一起。在一个实施方案中,链中的磷原子可具有拥有O、BH3或S的侧链。在磷链中,具有除O外的侧基的磷原子可以是取代的磷酸基团。核苷酸类似物的一些实例描述于Xu、美国专利号7,405,281中。在一些实施方案中,核苷酸包括标记(例如,报道部分),并且在本文中称为“标记核苷酸”;标记核苷酸的标记物在本文中称为“核苷酸标记”。在一些实施方案中,标记物可以以连接至末端磷酸基团即离糖最远的磷酸基团或取代磷酸基团的荧光染料的形式存在。可用于公开的方法和组合物中的核苷酸的一些实例包括但不限于核糖核苷酸、脱氧核糖核苷酸、修饰核糖核苷酸、修饰脱氧核糖核苷酸、核糖核苷酸多磷酸、脱氧核糖核苷酸多磷酸、修饰核糖核苷酸多磷酸、修饰脱氧核糖核苷酸多磷酸、肽核苷酸、金属核苷、膦酸酯核苷和修饰磷酸-糖主链核苷酸、前述化合物的类似物、衍生物或变型等。在一些实施方案中,核苷酸可包含非氧部分例如硫-或硼烷-部分,以替代桥连核苷酸的α磷酸酯与糖,或核苷酸的α与β磷酸酯,或核苷酸的β与γ磷酸酯,或核苷酸的任何其它两个磷酸酯之间或其任意组合的氧部分。
如本文中所用,术语“核苷酸掺入”及其变型包括聚合一个或多个核苷酸以形成核酸链,所述核酸链包括至少两个通常地但非必定地通过磷酸二酯键彼此连接的核苷酸,尽管在特定核苷酸类似物的背景中替代性连接可以是可能的。
如本文中所用,术语“持续合成能力”及其变型包括聚合酶保持与单个引物/模板杂交体结合的能力。在一些实施方案中,持续合成能力可通过聚合酶在其与引物/模板杂交体解离之前掺入核酸(例如测序引物)的核苷酸数目来测量。在一些实施方案中,聚合酶具有至少100个核苷酸的持续合成能力,尽管在其它实施方案中其具有至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸或更多核苷酸的持续合成能力。本领域技术人员应理解,聚合酶的持续合成能力越高,可在解离前掺入的核苷酸越多,从而可获得的序列(阅读长度)更长。换句话说,具有低持续合成能力的聚合酶通常会提供比具有更高持续合成能力的聚合酶会提供的更短的平均阅读长度。在一个实施方案中,本公开内容的包含一个或多个氨基酸突变的聚合酶可相较于不存在一个或多个氨基酸突变的亲代聚合酶拥有增强的持续合成能力。
在一个示例性测定中,给定的聚合酶的持续合成能力可通过在核苷酸掺入条件下将聚合酶与引物:模板双链体一起温育,和使用任何适当的方法例如通过凝胶电泳分辨所得的引物延伸产物来测量。引物可任选地包括标记物以增强引物延伸产物的可检测性。核苷酸掺入反应混合物通常包括大大过量的未标记的竞争模板,从而确保实际上全部延伸产物都通过单模板结合事件产生。在这样的分辨后,全长延伸产物的平均量可使用任何适当的方法包括全长延伸产物的荧光或放射性测量检测来进行定量。为了比较两种或更多种不同酶(例如,参照和修饰聚合酶)的持续合成能力,可在平行和分开的反应中使用每一种酶,随后可分辨和测量所得的全长引物延伸产物,然后比较这样的测量。
在其它示例性实施方案中,给定的聚合酶的持续合成能力可使用本领域已知的任何适当测定来测量,包括但不限于如下文献中描述的测定:Von Hippel,P.H.,Faireld,F.R.和Dolejsi,M.K.,On the processivity of polymerases,Ann.NY Acad.Sci.,726:118-131(1994);Bambara,R.A.,Uyemura,D.和Choi,T.,On the processive mechanism ofEscherichia coli DNA polymerase I.Quantitative assessment of processivity,J.Biol.Chem.,253:413-423(1978);Das,S.K.和Fujimura,R.K.,Processiveness of DNApolymerases.A comparative study using a simple procedure,J.Biol.Chem.,254:1227-1232(1979);Nasir,M.S.and Jolley,M.E.,Fluorescence polarization:AnAnalytical Tool for Immunoassay and Drug Discovery,Combinational Chemistryand High Throughput Screening,2:177-190(1999);Mestas,S.P.,Sholders,A.J.和Peersen,O.B.,A Fluorescence Polarization Based Screening Assay for NucleicAcid Polymerase Elongation Activity,Anal.Biochem.,365:194-200(2007);Nikiforov,T.T.,Fluorogenic polymerase,endonuclease,and ligase assays based onDNA substrates labled with a single fluorophore,Analytical Biochemistry 412:229-236;和Yan Wang,Dennis E.Prosen,Li Mei,John C.Sullivan,Michael Finney和Peter B.Vander Horn,Nucleic Acids Research,32(3):1197-1207(2004)。
如本文中所用,术语“阅读长度”或“阅读-长度”及其变型,是指在与模板核酸链解离之前被聚合酶以模板依赖性方式聚合的(或掺入已存在的核酸链中的)核苷酸的数目。在一些实施方案中,在5个掺入后与模板核酸链解离的聚合酶通常提供具有5个核苷酸的阅读长度的序列,然而,在500个核苷酸掺入后与模板核酸链解离的聚合酶通常提供具有约500个核苷酸的阅读长度的序列。虽然给定的聚合酶的实际或绝对持续合成能力(或由聚合酶产生的聚合产物的实际阅读长度)可在反应间(或甚至在其中聚合酶产生具有不同阅读长度的不同产物的单个反应混合物内)变化,但聚合酶可通过在确定的一组反应条件下观察到的平均持续合成能力(或聚合产物的平均阅读长度)来表征。“无错误阅读长度”包括不间断地和持续地无错误(即,无错配和/或不偏离已建立的和可预测的一套碱基配对法则)掺入新合成的核酸链的核苷酸的数目。
在一些实施方案中,本公开内容总地来说涉及包含修饰聚合酶的组合物、方法、系统、装置和试剂盒,相较于它们未修饰的对应物所述修饰聚合酶的特征在于增强的持续合成能力、增加的阅读长度(包括无错误阅读长度)和/或准确度,以及涉及用于制备这样的修饰聚合酶和在多种生物和化学反应例如核苷酸聚合、引物延伸、核酸文库的产生和核酸测序反应中使用所述修饰聚合酶的方法。在一些实施方案中,修饰聚合酶相对于它们相应的未修饰对应物包含一个或多个氨基酸突变(例如,氨基酸置换、添加或缺失)。在一些实施方案中,如本文中所用,术语准确度可通过相较于聚合过程中不正确核苷酸的掺入速率测定在聚合过程中正确核苷酸的掺入速率来进行测量。在一些实施方案中,不正确核苷酸的掺入速率在升高的盐条件(高离子强度溶液)下相较于标准(更低)盐条件下可大于0.3、0.4、0.5、0.6、0.7秒或更长时间。虽然不希望受任何特定理论束缚,但本申请人已发现在聚合过程中升高的盐的存在减慢不正确核苷酸的掺入速率,从而产生更慢的不正确核苷酸的掺入常数。在一些实施方案中,本公开内容的修饰聚合酶相较于相关聚合酶具有增加的准确度,任选地修饰聚合酶或其生物片段在高离子强度溶液存在的情况下具有增加的准确度(相较于相关聚合酶)。
在一些实施方案中,本公开内容总地来说涉及在高离子强度溶液存在的情况下保持聚合酶活性的修饰聚合酶。在一些实施方案中,高离子强度溶液可以为约10、20、40、50、60、80、100、150、200、250、300、400、500、750mM或更高的盐浓度。在一些实施方案中,高离子强度溶液可以为约100mM至约500mM的盐。在一些实施方案中,高离子强度溶液可以为约125mM至约400mM的盐。在一些实施方案中,高离子强度溶液可以为约200mM至约275mM的盐。在一些实施方案中,高离子强度溶液可以为约225mM至约250mM的盐。在一些实施方案中,盐可包括钾盐和/或钠盐,例如KCl和/或NaCl。对于本领域技术人来说很明显地可替代地或与KCl和/或NaCl组合地使用各种其它适当的盐。在一些实施方案中,离子强度溶液还可包括硫酸盐。
在一些实施方案中,修饰聚合酶可在高离子强度溶液存在的情况下扩增核酸分子和/或测定核酸分子的序列。在一些实施方案中,修饰聚合酶能够在高离子强度溶液存在的情况下相较于在相同条件下的不存在一个或多个相同突变(或同源突变)的参照聚合酶,更大程度地(例如通过准确度测量的)扩增(和/或测序)核酸分子。在一些实施方案中,修饰聚合酶能够在高离子强度溶液存在的情况下相较于在标准离子强度条件(即,相较于高离子强度溶液更低的离子强度)下的不存在一个或多个突变(或同源突变)的参照聚合酶,以更大的能力(例如如通过准确度测量的)扩增(和/或测序)核酸分子。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶或其生物活性片段,其可相较于参照聚合酶在升高的盐条件存在的情况下进行核苷酸聚合或核苷酸掺入。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶或其生物活性片段,其相较于参照聚合酶在升高的盐条件存在的情况下具有增加的准确度或增加的解离时间常数。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶或其生物学片段,其可相较于参照聚合酶在升高的盐条件存在的情况下在核苷酸聚合过程中检测离子浓度的变化。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶或其生物活性片段,其可在升高的盐条件存在的情况下扩增核酸分子或测定其序列。
在一些实施方案中,本公开内容总地来说涉及相较于参照聚合酶具有增加的准确度的修饰聚合酶或其生物活性片段。
在一些实施方案中,本公开内容总地来说涉及包括在核苷酸聚合反应中使用这样的修饰聚合酶的方法、组合物、系统和试剂盒,所述核苷酸聚合反应包括其中从核酸分子获得序列信息的核苷酸聚合反应。在一些实施方案中,本公开内容总地来说涉及包括在克隆扩增反应(包括核酸文库合成)中使用这样的修饰聚合酶的方法、组合物、系统和试剂盒。在一些实施方案中,本公开内容涉及在基于离子的核酸测序反应中使用这样的修饰聚合酶的方法,其中使用基于离子的测序系统从模板核酸获得序列信息。在一些实施方案中,本公开内容总地来说涉及使用大规模阵列的电子传感器例如场效应晶体管(“FET”)进行多个无标记DNA测序反应(例如,基于离子的测序反应)的组合物、方法、系统、试剂盒和装置。
在一些实施方案中,本公开内容总地来说涉及包含修饰聚合酶的组合物(以及使用这样的组合物的相关方法、系统、试剂盒和装置),所述修饰聚合酶相对于参照聚合酶包括至少一个氨基酸修饰(例如,氨基酸置换、添加、缺失或化学修饰)(其中参照聚合酶不包括该至少一个修饰),其中修饰聚合酶任选地特征在于相对于参照聚合酶下列性质的任一个或多个的变化(例如,增加或减少):解离时间常数、聚合酶从给定的核酸模板解离的速率(在本文中也称为“解离速率(off-rate)”)、聚合酶对于给定的核酸模板的结合亲和力、平均阅读长度、最小阅读长度、准确度、在盐(即,离子强度)中的性能、AQ20、平均无错误阅读长度、100Q17值、200Q17值和持续合成能力。
如本文中所用,术语“Q17”或“Q20”及其变型,当用于指给定的聚合酶时,是指给定的聚合酶反应中,例如通过合成反应进行的基于聚合酶的测序中聚合酶性能的某些方面,尤其是准确度。例如,在特定的测序反应中,可通过预测算法或通过与已知参照基因组的实际比对计算准确度度量(accuracy metrics)。预测质量分数(“Q分数”)可来源于观察输入信号的固有性质并且根据测序“阅读”中包含的给定的单个碱基是否会对齐作出相当准确的评价的算法。在一些实施方案中,这样的预测质量分数可用于在下游比对之前过滤和除去更低质量的阅读。在一些实施方案中,准确度可以以在对数标度上测量准确度的Phred样Q分数的方式来报告,以便:Q10=90%、Q17=98%、Q20=99%、Q30=99.9%、Q40=99.99%和Q50=99.999%。Phred质量分数(“Q”)被定义为与碱基错判概率(base-calling errorprobability)(“P”)对数相关的性质。通常地,给予用于计算“Q”的公式为Q=10*log10(1/错误率)。在一些实施方案中,从给定的聚合酶反应获得的数据可被过滤以仅测量测定“N”个核苷酸或更长的核苷酸并且具有通过特定阈值的Q分数例如Q10、Q17、Q100(在本文中称为“NQ17”分数)的聚合酶阅读。例如,100Q20分数可表示从给定的反应获得的阅读的数目,其在长度上为至少100个核苷酸,并且具有Q20(99%)或更大的Q分数。类似地,200Q20分数可表示在长度上为至少200个核苷酸并且具有Q20(99%)或更大的Q分数的阅读的数目。
在一些实施方案中,还可使用参照基因组序列,基于适当的比对计算准确度,在本文中称为“原始”准确度。这是单通道准确度(single pass accuracy),其包括与单个阅读相关的“真”/碱基错误的测量,这与从作为多个阅读的结果的共有序列中测量错误率的共有准确度相反。原始准确度测量可用“AQ”分数(对于对齐的质量)来报告。在一些实施方案中,从给定的聚合酶反应获得的数据可被过滤以仅测量测定“N”个核苷酸或更长的核苷酸且具有通过特定阈值的AQ分数例如AQ10、AQ17、AQ100(在本文中称为“NAQ17”分数)的聚合酶阅读。例如,100AQ20分数可表示从给定的聚合酶反应获得的阅读的数目,其在长度上为至少100个核苷酸并且具有AQ20(99%)或更大的AQ分数。类似地,200AQ20分数可表示在长度上为至少200个核苷酸并且具有AQ20(99%)或更大的AQ分数的阅读的数目。
在一些实施方案中,聚合酶的准确度(包括例如给定的测序反应中的准确度)可用从聚合酶反应获得的“完美”(即,零错误)阅读的总数来测量,所述完美阅读在长度上大于100、200、300、400、500、750、1000、5000、10000、100000个核苷酸。
在一些实施方案中,聚合酶的准确度可用从聚合酶反应获得的最长完美阅读(通常用阅读中包括的核苷酸的数目来测量)来测量。
在一些实施方案中,聚合酶的准确度可用在给定的测序反应中获得的测序通量的倍数增加来测量。例如,在一些实施方案中,本申请的示例性修饰聚合酶可具有相较于参照聚合酶2倍、5倍、10倍、20倍、50倍、75倍、100倍、150倍、200倍、400倍、500倍或更高的准确度的增加的准确度。
准确度度量的一些示例性非限定性描述可见于:Ewing B,Hillier L,Wendl MC,Green P.(1998):Base-calling of automated sequencer traces usingphred.I.Accuracy assessment.Genome Res.8(3):175-185;Ewing B,Green P.(1998):Base-calling of automated sequencer traces using phred.II.Errorprobabilities.Genome Res.8(3):186-194;Dear S,Staden R(1992):A standard fileformat for data from DNA sequencing instruments.DNA Sequence,3,107-110;Bonfield JK,Staden R(1995):The application of numerical estimates of basecalling accuracy to DNA sequencing projects.Nucleic Acids Res.1995Apr 25;23(8):1406-10(通过引用将所述文献整体并入本文)。
在一些实施方案中,可在基于离子的测序反应运行中测量给定的一组聚合酶(包括本文中描述的任何参照或修饰聚合酶)的测序准确度;可任选地将这样的准确度彼此进行比较以确定给定的氨基酸突变相对于参照或未修饰聚合酶增加还是减小测序准确度。在一些实施方案中,可使用由Ion Torrent Technologies(Ion Torrent Systems,LifeTechnologies,Carlsbad,California)提供的任何基于离子的测序装置,包括例如IonTorrent PGMTM测序仪(Ion Torrent Systems,Life Technologies,Part No.4462917),任选地使用由Ion Torrent Systems提供的测序方案和试剂测量一种或多种聚合酶的测序准确度。使用这样的基于离子的测序系统计算给定的聚合酶的准确度度量的一些实例进一步描述于标题为“Ion Torrent:Ion Personal Genome MachineTM Performance Overview,Perfomance Spring 2011”的Ion Torrent应用注解(通过引用并入本文)中。
如本文中所用,术语“解离速率常数”和“解离时间常数”,当用于指给定的聚合酶时,是指在确定的一组反应条件下聚合酶从核酸模板解离的时间常数(“koff”)。用于测量聚合酶的解离时间常数的一些示例性测定在下文中进一步描述。在一些实施方案中,可以以反时单位例如sec-1或min-1来测量解离时间常数。
在一些实施方案中,本公开内容总地来说涉及分离的修饰聚合酶,所述修饰聚合酶相对于参照聚合酶包含至少一个氨基酸修饰,并且相对于使用参照聚合酶获得的引物延伸产物的平均阅读长度在使用修饰聚合酶的引物延伸反应中提供增加的引物延伸产物的平均阅读长度。在一些实施方案中,分离的修饰聚合酶,相对于使用对应的未修饰聚合酶获得的引物延伸产物的平均无错误阅读长度,在使用修饰聚合酶的引物延伸反应中提供了增加的引物延伸产物的平均无错误阅读长度。任选地,修饰聚合酶相对于未修饰聚合酶包含两个或更多个氨基酸置换。
在一些实施方案中,引物延伸反应是基于离子的测序反应。
在一些实施方案中,分离的修饰聚合酶,相对于使用参照聚合酶获得的100Q17或200Q17值,在核酸测序反应中(例如在基于离子的测序反应中)提供增加的100Q17或200Q17值。
在一些实施方案中,参照聚合酶包括天然存在的或野生型聚合酶。在其它实施方案中,参照聚合酶包括天然存在的聚合酶的衍生、截短、突变或变体形式。
在一些实施方案中,本公开内容总地来说涉及用于进行核苷酸聚合反应的方法,包括:在一个或多个核苷酸存在的情况下将修饰聚合酶与核酸模板接触;和使用修饰聚合酶聚合一个或多个核苷酸的至少一个。聚合任选地还包括以模板依赖性方式聚合该至少一个核苷酸。在一些实施方案中,修饰聚合酶相对于不包含一个或多个氨基酸置换的参照聚合酶包含一个或多个氨基酸置换。
在一些实施方案中,方法还包括在接触之前、期间或之后将引物与模板杂交。聚合可包括使用修饰聚合酶将至少一个核苷酸聚合至引物的末端。
在一些实施方案中,在能够检测至少一个核苷酸被修饰聚合酶聚合的传感器附近进行聚合。
在一些实施方案中,方法还包括使用传感器检测表明修饰聚合酶聚合一个或多个核苷酸的至少一个的信号。
在一些实施方案中,修饰聚合酶、参照聚合酶或修饰与参照聚合酶是DNA聚合酶。DNA聚合酶可包括但不限于细菌DNA聚合酶、原核生物DNA聚合酶、真核生物DNA聚合酶、古细菌DNA聚合酶、病毒DNA聚合酶或噬菌体DNA聚合酶。
在一些实施方案中,DNA聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未分类的DNA聚合酶和RT家族聚合酶以及其变体和衍生物。
在一些实施方案中,DNA聚合酶是选自Pol I-型DNA聚合酶例如大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段、Bst DNA聚合酶、Taq DNA聚合酶、Platinum Taq DNA聚合酶系列、Omni Klen Taq DNA聚合酶系列、Klen Taq DNA聚合酶系列、T7DNA聚合酶和Tth DNA聚合酶的A家族DNA聚合酶。在一些实施方案中,DNA聚合酶是Bst DNA聚合酶。在其它实施方案中,DNA聚合酶是大肠杆菌DNA聚合酶I。在一些实施方案中,DNA聚合酶是大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,聚合酶是Taq DNA聚合酶。在一些实施方案中,聚合酶是T7DNA聚合酶。
在其它实施方案中,DNA聚合酶是选自Bst聚合酶、Tli聚合酶、Pfu聚合酶、Pfuturbo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Sac聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、Pho聚合酶、ES4聚合酶、VENT聚合酶、DEEPVENT聚合酶、TherminatorTM聚合酶、噬菌体Phi29聚合酶和噬菌体B103聚合酶的B家族DNA聚合酶。在一些实施方案中,聚合酶是KOD聚合酶。在一些实施方案中,聚合酶是TherminatorTM聚合酶。在一些实施方案中,聚合酶是噬菌体Phi29DNA聚合酶。在一些实施方案中,聚合酶是噬菌体B103聚合酶、包括例如,美国专利公布号20110014612(将其通过引用并入本文)中公开的变体。
在其它实施方案中,DNA聚合酶是选自EX-Taq聚合酶、LA-Taq聚合酶、Expand聚合酶系列和Hi-Fi聚合酶的混合型聚合酶。在其它实施方案中,DNA聚合酶是选自Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶和Tfi聚合酶的未分类的DNA聚合酶。
在其它实施方案中,DNA聚合酶是选自HIV逆转录酶、M-MLV逆转录酶和AMV逆转录酶的RT聚合酶。在一些实施方案中,聚合酶是HIV逆转录酶或其具有DNA聚合酶活性的片段。
适当的细菌DNA聚合酶包括但不限于大肠杆菌DNA聚合酶I、II和III、IV和V、大肠杆菌DNA聚合酶的Klenow片段、粪堆梭菌(Clostridium stercorarium)(Cst)DNA聚合酶、热纤梭菌(Clostridium thermocellum)(Cth)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)(Bst)DNA聚合酶和硫矿硫化叶菌(Sulfolobus solfataricus)(Sso)DNA聚合酶。
适当的真核生物DNA聚合酶包括但不限于DNA聚合酶α、δ、ε、η、ζ、γ、β、σ、λ、μ、ι和κ,以及Rev1聚合酶(末端脱氧胞嘧啶核苷转移酶)和末端脱氧核苷酸转移酶(TdT)。
适当的病毒和/或噬菌体DNA聚合酶包括但不限于T4 DNA聚合酶、T5 DNA聚合酶、T7 DNA聚合酶、Phi-15 DNA聚合酶、Phi-29 DNA聚合酶(参见,例如,美国专利号5,198,543;也不同地称为Φ29聚合酶、phi29聚合酶、phi 29聚合酶、Phi 29聚合酶和Phi29聚合酶);Φ15聚合酶(在本文中也称为Phi-15聚合酶);Φ21聚合酶(Phi-21聚合酶);PZA聚合酶;PZE聚合酶、PRD1聚合酶;Nf聚合酶;M2Y聚合酶;SF5聚合酶;f1DNA聚合酶、Cp-1聚合酶;Cp-5聚合酶;Cp-7聚合酶;PR4聚合酶;PR5聚合酶;PR722聚合酶;L17聚合酶;M13DNA聚合酶、RB69DNA聚合酶、G1聚合酶;GA-1聚合酶、BS32聚合酶;B103聚合酶;从任何phi-29样噬菌体获得的聚合酶或其衍生物等。参见,例如,1993年2月11日提交的美国专利号5,576204;2007年8月23日公布的美国专利申请号2007/0196846。
适当的古细菌DNA聚合酶包括但不限于热稳定性和/或嗜热性DNA聚合酶例如,从栖热水生菌(Thermus aquaticus)(Taq)DNA聚合酶、丝状栖热菌(Thermus filiformis)(Tfi)DNA聚合酶、速生热球菌(Thermococcus zilligi)(Tzi)DNA聚合酶、嗜热栖热(Thermus thermophilus)(Tth)DNA聚合酶、黄栖热菌(Thermus flavus)(Tfl)DNA聚合酶、沃氏热球菌(Pyrococcus woesei)(Pwo)DNA聚合酶、激烈热球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶以及Turbo Pfu DNA聚合酶、海栖热球菌(Thermococcus litoralis)(Tli)DNA聚合酶或Vent DNA聚合酶、热球菌属的种(Pyrococcus sp.)的GBD聚合酶、“Deep Vent”DNA聚合酶(New England Biolabs)、喜温海洋杆菌(Thermotoga maritima)(Tma)DNA聚合酶、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶、古生热球菌(Pyrococcus Kodakaraensis)(KOD)DNA聚合酶、Pfx DNA聚合酶、热球菌属的种(Thermococcus sp.)的JDF-3(JDF-3)DNA聚合酶、Thermococcus gorgonarius(Tgo)DNA聚合酶、嗜酸热球菌(Thermococcusacidophilium)DNA聚合酶;酸热硫化叶菌(Sulfolobus acidocaldarius)DNA聚合酶;热球菌属的种9°N-7DNA聚合酶;热球菌属的种NA1;隐蔽热网菌(Pyrodictium occultum)DNA聚合酶;沃氏甲烷球菌(Methanococcus voltae)DNA聚合酶;热自养甲烷球菌(Methanococcusthermoautotrophicum)DNA聚合酶;詹氏甲烷球菌(Methanococcus jannaschii)DNA聚合酶;脱硫球菌属(desulfurococcus)菌株TOK的DNA聚合酶(D.Tok Pol);火球菌(Pyrococcusabyssi)DNA聚合酶;超嗜热古菌(Pyrococcus horikoshii)的DNA聚合酶;海岛热球菌(Pyrococcus islandicum)DNA聚合酶;栖烟囱高温球菌(Thermococcus fumicolans)的DNA聚合酶;敏捷气热菌(Aeropyrum pernix)DNA聚合酶;异二聚体DNA聚合酶DP1/DP2等分离的DNA聚合酶。
在一些实施方案中,修饰聚合酶是RNA聚合酶。适当的RNA聚合酶包括但不限于T3、T5、T7和SP6RNA聚合酶。
在一些实施方案中,聚合酶是逆转录酶。适当的逆转录酶包括但不限于来自HIV、HTLV-I、HTLV-II、FeLV、FIV、SIV、AMV、MMTV和MoMuLV的逆转录酶,以及商购可得的“Superscript”逆转录酶(Life Technologies Corp.,Carlsbad,CA)和端粒酶。
在一些实施方案中,修饰聚合酶来源于已知的DNA聚合酶。DNA聚合酶基于氨基酸序列比较和三维结构分析已被分类为7个不同的家族。DNA聚合酶I(pol I)或A型聚合酶家族包括修复聚合酶大肠杆菌DNA pol I、栖热水生菌pol I和嗜热脂肪芽孢杆菌pol I、来自一些细菌噬菌体(T3、T5和T7)的复制型DNA聚合酶和真核生物线粒体DNA聚合酶。DNA聚合酶α(polα)或B型聚合酶家族包括所有真核生物复制型DNA聚合酶以及古细菌DNA聚合酶、病毒DNA聚合酶、各种真菌和植物的线粒体质粒中编码的DNA聚合酶和来自细菌噬菌体T4和RB69的聚合酶。家族C聚合酶是主要细菌染色体复制酶。这些酶有时被认为是家族Y的亚组,该亚组包括真核生物聚合酶polβ以及其它真核生物聚合酶例如polσ、polλ、polμ和末端脱氧核苷酸转移酶(TdT)。家族D聚合酶全都发现于古细菌的阔古细菌界亚域(Euryarchaeotasubdomain)中并且被认为是复制性聚合酶。家族Y聚合酶因其能穿过受损DNA复制的能力而被称为跨损伤合成(TLS)聚合酶。它们也称为易错聚合酶,因为它们在未受损的模板上具有低保真度。该家族包括Polη、Polζ、Polι(iota)、Polκ(kappa)和Rev1,以及来自大肠杆菌的Pol IV和PolV。最后,逆转录酶家族包括来自逆转录病毒的逆转录酶和真核生物聚合酶,通常限制于端粒酶。这类聚合酶使用RNA模板来合成DNA链,并且也称为依赖于RNA的DNA聚合酶。
在一些实施方案中,可使用本领域技术人员已知的任何适当的方法或测定来制备修饰聚合酶或其生物活性片段。在一些实施方案中,本公开内容包括进行蛋白质工程以获得修饰聚合酶或其生物活性片段的任何适当方法。例如,定点诱变是可用于在DNA构建体中引入一个或多个已知或随机突变的技术。可以例如与标准或参照聚合酶相比较或通过核酸测序来验证一个或多个氨基酸突变的引入。确认后,可将包含一个或多个氨基酸突变的构建体转化进入细菌细胞并表达。
通常地,将包含突变表达构建体的菌落接种于培养基中,随后诱导,生长至期望的光密度,随后收集(通常通过离心)和纯化上清液。对于本领域技术人员来说很显然的是可通过任何适当的方法来纯化上清液。通常地,选择用于分析性或制备性蛋白质纯化的柱子。在一些实施方案中,可以基本上按照制造商的说明书,在(但不限于)肝素柱子上纯化使用本方法制备的修饰聚合酶或其生物活性片段。
纯化后,可使用任何适当的方法评价修饰聚合酶或其生物活性片段的各种聚合酶活性。在一些实施方案中,待评价的聚合酶活性将取决于目的应用。例如,用于扩增长度为约400bp的核酸分子或测定其序列的聚合酶可包括聚合酶活性例如相对于参照聚合酶增强的持续合成能力和/或增加的解离时间常数。在另一个实例中,需要长度为约100bp的核酸分子的深度目标区域重测序的应用可包括具有增加的校正读码活性或增加的最小阅读长度的聚合酶。在一些实施方案中,在高盐存在的情况下评价的一个或多个聚合酶活性可涉及聚合酶性能或聚合酶活性。
在一些实施方案中,可评价按照本方法制备的修饰聚合酶或其生物活性片段的DNA结合活性、核苷酸聚合活性、引物延伸活性、链置换活性、逆转录酶活性、3’-5’外切核酸酶(校正读码)活性等。
在一些实施方案中,可评价相较于参照聚合酶,按照本方法制备的修饰聚合酶或其生物活性片段的增加的准确度、增强的持续合成能力、增加的平均阅读长度、增加的最小阅读长度、增加的AQ20、增加的200Q17值或进行核苷酸聚合的能力。在一些实施方案中,可在高离子强度溶液存在的情况下评价修饰聚合酶或其生物活性片段的聚合酶活性的任一个。
在一些实施方案中,修饰聚合酶或其生物活性片段任选地通过下列性质的任一个或多个中的变化(例如,增加或减少)(通常地,相对于不存在一个或多个氨基酸突变的聚合酶)来表征:解离时间常数、聚合酶从给定的核酸模板的解离速率、聚合酶对于给定的核酸模板的结合亲和力、平均阅读长度、最小阅读长度、准确度、完美阅读的总数、测序反应的通量中的倍数增加、盐(即,离子强度)中的性能、AQ20、平均无错误阅读长度、错误率、100Q17值、200Q17值、Q分数、原始阅读准确度和持续合成能力。
在一些实施方案中,可针对本领域中类似聚合酶的已知的值个别地评价修饰聚合酶或其生物活性片段。在一些实施方案中,可在相似或相同条件下根据已知的或参照聚合酶来评价按照本方法制备的修饰聚合酶或其生物活性片段。在一些实施方案中,所述条件可包括在高离子强度溶液存在的情况下扩增核酸分子或测定其序列。
在一些实施方案中,本公开内容总地来说涉及用于生产众多修饰聚合酶或生物活性片段的方法。在一些实施方案中,本公开内容总地来说涉及使用高通量或自动化系统产生众多修饰聚合酶或生物活性片段的方法。在一些实施方案中,所述方法包括将众多的修饰聚合酶或生物活性片段与一系列进行蛋白质纯化所必需的试剂混合和从混合物提取纯化的聚合酶或生物活性片段。在一个实例中,可在96或384孔板中制备众多的随机或定点诱变反应。任选地,96或384孔板的内容物可经历初始筛选来鉴定聚合酶突变构建体。可将每一个单个的孔的内容物(或来自初始筛选的每一个孔的内容物)递送至一系列烧瓶、菌管或摇瓶以进行接种和诱导。在达到必需的光密度后,可将烧瓶、菌管或摇瓶离心并回收上清液。每一个上清液可经历蛋白质纯化,例如通过完全自动化柱纯化(例如参见,Camper和Viola,Analytical Biochemistry,2009,p176-181)。可评价纯化的修饰聚合酶或生物活性片段的聚合酶活性例如DNA结合、引物延伸、链置换、逆转录酶活性等的一种或组合。预期本领域技术人员可使用本方法(或在本公开内容的范围内的方法的变型)来鉴定众多的修饰聚合酶或生物活性片段。在一些方面,本方法可用于鉴定众多的相较于参照聚合酶具有增加的准确度的修饰聚合酶或生物活性片段。在一些实施方案中,本方法可用于鉴定众多在高离子强度溶液存在的情况下具有增加的准确度的修饰聚合酶或其生物活性片段。在一些实施方案中,高离子强度溶液可包括KCl和/或NaCl盐。在一些实施方案中,高离子强度溶液可以为约10、20、30、40、50、60、80、100、150、200、225、250、275、300、350、400、450、500、550、600、700、750mM或更高的盐浓度。在一些实施方案中,高离子强度溶液可以为约100mM至约500mM的盐。在一些实施方案中,高离子强度溶液可以为约125mM至约400mM的盐。在一些实施方案中,高离子强度溶液可以为约200mM至约275mM的盐。在一些实施方案中,高离子强度溶液可以为约225mM至约250mM的盐。对于本领域技术人员将明显的是可替代地或与KCl和/或NaCl组合地使用各种其它适当的盐。在一些实施方案中,离子强度溶液还可包括硫酸盐。
如对于本领域技术人员来说将很显然的,本公开内容概述了产生修饰聚合酶或生物活性片段的文库的示例性自动化和高通量方法。本公开内容还概述了评价这样的修饰聚合酶或生物活性片段的聚合酶活性的方法。本公开内容还包括本领域技术人员可容易地制备构建体的诱变处理的文库,其中可突变目标聚合酶内的每一个氨基酸。在一些实施方案中,可制备其中按每一个可能的氨基酸组合突变聚合酶中的每一个氨基酸的诱变处理的文库。在一些实施方案中,可制备诱变处理的文库,其中对聚合酶中的每一个氨基酸进行突变,并且其中将可能的氨基酸突变的组合限定于保守或非保守氨基酸置换。在两个实例中,可产生包含大量突变构建体的诱变处理的文库,所述诱变处理的文库可通过自动化或高通量系统用于纯化或用于初始筛选。纯化后,可评价蛋白质的诱变处理的文库的聚合酶活性例如DNA结合、引物延伸、链置换、逆转录酶、切口引发的聚合酶活性等的一种或组合。任选地,还可评价纯化的修饰聚合酶或其生物活性片段的其它性质例如在高盐存在的情况下扩增核酸分子或测定其序列的能力。待突变的聚合酶的来源或起源通常被认为不是至关重要的。例如,真核生物的、原核生物的、古细菌的、细菌的、噬菌体的或病毒的聚合酶可用于本方法。在一些实施方案中,聚合酶可以是DNA或RNA聚合酶。在一些实施方案中,DNA聚合酶可包括家族A或家族B聚合酶。本文中提供的示例性方法从蛋白质工程和酶学领域来看将被认为是举例说明性的,并且不应当被解释为任何方式的限定。
在一些实施方案中,修饰聚合酶或其生物活性片段包含位于修饰聚合酶的催化结构域内的一个或多个氨基酸突变。在一些实施方案中,修饰聚合酶或其生物活性片段可包含催化结构域的至少25、50、75、100、150或更多个氨基酸残基。在一些实施方案中,修饰聚合酶或其生物活性片段可包括催化结构域的包含至少25、50、75、100、150或更多个连续氨基酸残基的任意部分。在一些实施方案中,修饰聚合酶或其生物活性片段可包括催化结构域的至少25个连续氨基酸残基,并且可任选地在C末端或N末端上包含存在于催化结构域外部的一个或多个氨基酸残基。在一些实施方案中,修饰聚合酶或生物活性片段可包括偶联至任一个或多个非催化结构域氨基酸残基的催化结构域的任意25、50、75、100、150或更多个连续氨基酸残基。
在一些实施方案中,修饰聚合酶(或其生物活性片段)包括一个或多个位于修饰聚合酶的催化结构域内的氨基酸突变,并且其中聚合酶与本文中公开的修饰聚合酶的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更高的同一性。在一些实施方案中,修饰聚合酶(或其生物活性片段)包含一个或多个位于修饰聚合酶的催化结构域内的氨基酸突变,并且其中聚合酶与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更高的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少80%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少85%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少90%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少95%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少98%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少80%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少85%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少90%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少95%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括催化结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少98%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括一个或多个位于聚合酶的DNA结合结构域内的氨基酸突变。在一些实施方案中,修饰聚合酶或其生物活性片段可包括修饰聚合酶的DNA结合结构域的至少25、50、75、100、150或更多个氨基酸残基。在一些实施方案中,修饰聚合酶或其生物活性片段可包括DNA结合结构域的包含至少25、50、75、100、150或更多个连续氨基酸残基的任意部分。在一些实施方案中,修饰聚合酶或其生物活性片段可包括结合结构域的至少25个连续氨基酸残基,并且可任选地在C末端或N末端上包括存在于结合结构域的外部的一个或多个氨基酸残基。在一些实施方案中,修饰聚合酶或生物活性片段可包括偶联至任一个或多个非结合结构域氨基酸残基的结合结构域的任意25、50、75、100、150或更多个连续氨基酸残基。在一些实施方案中,修饰聚合酶(或其生物活性片段)包括位于修饰聚合酶的DNA结合结构域内的一个或多个氨基酸突变,并且其中聚合酶与本文中公开的修饰聚合酶的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更高的同一性。在一些实施方案中,修饰聚合酶(或其生物活性片段)包括一个或多个位于修饰聚合酶的DNA结合结构域内的氨基酸突变,并且其中聚合酶与SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20和SEQ ID NO:24的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更高的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少80%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少85%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少90%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少95%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少25个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少98%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少80%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少85%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少90%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少95%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括DNA结合结构域的至少50个连续氨基酸残基,并且与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:24的任一个具有至少98%的同一性。
在一些实施方案中,修饰聚合酶或其生物活性片段包括一个或多个位于聚合酶的催化结构域(在本文中也称为DNA结合裂隙)外部的氨基酸突变。A家族DNA聚合酶、B家族DNA聚合酶和逆转录酶以及依赖于RNA的RNA聚合酶的催化结构域是公知的;上述全部聚合酶共有共同的总体结构和催化机制。所有这些聚合酶的催化结构域具有已与右手相比较并且由“手掌”、“拇指”和“手指”结构域组成的形状。手掌结构域通常包含磷酰基转移反应的催化部位。拇指被认为起着定位双链DNA的作用并在持续合成能力和易位中起作用。手指与新进的核苷酸以及与该核苷酸配对的模板碱基相互作用。手掌结构域在A、B和RT家族中是同源的,但手指和拇指的排列不同。不同聚合酶家族的拇指结构域确实共有共同的特性,其包含平行或反向平行的α-螺旋,并且至少一个α-螺旋与引物-模板复合物的小沟相互作用。手指结构域还保留了位于引物-模板复合物的平端的α-螺旋。该螺旋包含高度保守的侧链(B基序)。
已鉴定了A家族聚合酶的3个保守基序A、B和C。A和C基序在B家族聚合酶和RT聚合酶中通常是保守的。(Delarue等人,Protein Engineering 3:461-467(1990))。
在一些实施方案中,对于A家族聚合酶,A基序包含共有序列:
(SEQ ID NO:5)。
在一些实施方案中,对于A家族聚合酶,B基序包含共有序列:
(SEQ ID NO:6)
在一些实施方案中,对于A家族聚合酶,C基序包含共有序列:
(SEQ ID NO:7)
在一些实施方案中,聚合酶任选地包括任意A家族聚合酶或其生物活性片段、突变体、变体或截短体,其中连接部分连接至A家族聚合酶或其生物活性片段、突变体、变体或截短体的任意氨基酸残基,所述氨基酸残基位于A、B或C基序的外部。在一些实施方案中,连接部分连接至A家族聚合酶或生物活性片段的任意氨基酸残基,所述氨基酸残基位于A基序、B基序或C基序的外部。
A和C基序通常形成手掌结构域的部分,并且每一个基序通常包含严格保守的天冬氨酸残基,所述残基参与所有DNA聚合酶共有的催化机制。DNA合成可通过将磷酰基从新进的核苷酸转移至DNA的3’OH(从而释放多磷酸酯部分并且形成新的DNA磷酸二酯键)来介导。该反应通常由涉及两个金属离子(通常地Mg2+)和两个保守天冬氨酸残基的机制来催化。
在一些实施方案中,A家族DNA聚合酶的基序A中的保守谷氨酸残基在正确核苷酸的掺入中起着重要作用,对于B家族成员中对应的保守酪氨酸也同样如此(Minnick等人,Proc.Natl.Acad.Sci.USA99:1194-1199(2002);Parsell等人,Nucleic Acids Res.35:3076-3086(2002)。基序A的保守Leu上的突变会影响复制保真度(Venkatesan等人,J.Biol.Chem.281:4486-4494(2006))。
在一些实施方案中,B基序包含保守的赖氨酸、酪氨酸和甘氨酸残基。已显示大肠杆菌pol I的B基序结合核苷酸底物并且其包含已显示位于活性部位的保守酪氨酸。
在一些实施方案中,对于B家族聚合酶,A基序包含共有序列:
(SEQ ID NO:8)。
在一些实施方案中,对于B家族聚合酶,B基序包含共有序列:
(SEQ ID NO:9)
在一些实施方案中,对于B家族聚合酶,C基序包含共有序列:
(SEQ ID NO:10)
加以粗体的残基表示的残基表示不变的残基。
在一些实施方案中,修饰聚合酶任选地包括任意B家族聚合酶或其生物活性片段、突变体、变体或截短体,其中连接部分连接至B家族聚合酶或其生物活性片段、突变体、变体或截短体的任意氨基酸残基,所述氨基酸残基位于A、B或C基序的外部。在一些实施方案中,连接部分连接至B家族聚合酶或生物活性片段的任意氨基酸残基,所述氨基酸残基位于A基序、B基序或C基序的外部。
在一些实施方案中,B家族聚合酶包含6个保守基序,所述基序的区域I和II对应于A家族的A和C基序。区域III参与核苷酸结合并且在功能上与基序B同源。区域I、II和III会聚在来自手掌(I)的活性部位、手指(II)和拇指(III)基部的中央,以产生连续的保守表面。在这些区域内,一组高度保守的残基形成3个化学上不同的簇,所述簇分别由暴露的芳香族残基、带负电荷的残基和带正电荷的残基组成。例如,在细菌噬菌体RB69的复制型聚合酶中,这3个簇对应于下列氨基酸残基:Y416、Y567和Y391(暴露的芳香族残基),D621、D623、D411、D684和E686(带负电荷的残基),以及K560、R482和K486(带正电荷的残基)。参见Wang等人,Cell 89:1087-1099(1997)。这3个簇通常包含其中预期引物末端和新进的核苷酸会结合的区域。在一些实施方案中,修饰聚合酶任选地包含任意B家族聚合酶或其生物活性片段、突变体、变体或截短体,其中连接部分连接至B家族聚合酶或其生物活性片段、突变体、变体或截短体的任意氨基酸残基,所述残基位于这些保守的氨基酸簇或基序的一个或多个的外部。在一些实施方案中,连接部分连接至B家族聚合酶或其生物活性片段、突变体、变体或截短体的任意氨基酸残基,所述残基位于这些保守氨基酸簇或基序的任一个的外部。
RT聚合酶包含4个保守序列基序(Poch等人,EMBO J.12:3867-3874(1989)),其基序A和C包含保守的催化性天冬氨酸。基序B的完整性也是逆转录酶功能所需的。
基序A的共有序列是DXXXXF/Y(SEQ ID NO:11)
基序B的共有序列是FXGXXXS/A(SEQ ID NO:12)
基序C的共有序列是YXDD(SEQ ID NO:13)
基序D的共有序列是GXXXXXXXK(SEQ ID NO:14)。
YXDD基序(基序C)(这些基序中的最高度保守的基序)中的突变可消除聚合酶活性和改变持续合成能力及保真度(Sharma等人,Antiviral Chemistry and Chemotherapy16:169-182(2005))。此外,基序D(RT聚合酶特有的环)中的保守赖氨酸残基是对于核苷酸结合重要的不变的残基(Canard等人、J.Biol.Chem.274:35768-35776(1999))。
在一些实施方案中,修饰聚合酶任选地包括任意RT聚合酶或其生物活性片段、突变体、变体或截短体,其中连接部分连接至RT聚合酶或其生物活性片段、突变体、变体或截短体的任意氨基酸残基,所述残基位于A、B、C和D基序的一个或多个的外部。在一些实施方案中,连接部分连接至RT聚合酶或其生物活性片段、突变体、变体或截短的任意氨基酸残基,所述残基位于这些基序的任一个的外部。
在一些实施方案中,修饰聚合酶包括一个或多个位于除保守或不变的残基外的任意位置上的修饰(包括氨基酸置换、缺失、添加或化学修饰)。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少80%的同一性的至少25个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少85%的同一性的至少25个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少85%的同一性的至少50个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少90%的同一性的至少50个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少90%的同一性的至少100个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少95%的同一性的至少100个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少95%的同一性的至少150个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少98%的同一性的至少25个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少98%的同一性的至少50个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少99%的同一性的至少25个连续氨基酸残基。
在一些实施方案中,修饰聚合酶或其生物活性片段包括与SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20和SEQ ID NO:24的任一个具有至少99%的同一性的至少50个连续氨基酸残基。
在一些实施方案中,除了聚合酶结构域以外,修饰聚合酶可包括一个或多个另外的功能结构域,包括3'->5'(反向)外切核酸酶活性所需的结构域,所述外切核酸酶活性介导新合成DNA链的校正读码,或5'->3'(正向)外切核酸酶活性所需的结构域,所述外切核酸酶活性介导DNA修复期间的切口平移,或FLAP内切核酸酶活性所需的结构域。在一些实施方案中,修饰聚合酶具有链置换活性,并且可通过将核苷酸聚合至双链核酸模板内的切口的3’端,同时置换位于切口下游的核酸来催化核酸合成。修饰聚合酶任选地也具有这些活性的任一个或多个。
A和B家族DNA聚合酶的3’至5’外切核酸酶校正读码结构域包含3个保守基序,称为Exo I、Exo II和Exo III,其每一个包含金属结合和外切核酸酶功能所必需的不变的天冬氨酸残基。这些保守天冬氨酸残基的改变导致保持聚合酶活性但缺失外切核酸酶活性的蛋白质(Hall等人,J.Gen.Virol.76:2999-3008(1995))。5’至3’外切核酸酶结构域中的保守基序和影响外切核酸酶活性的氨基酸改变也已被鉴定(美国专利号5,466,591)。
A家族酶的代表性实例是大肠杆菌Pol I或大肠杆菌Pol I的Klenow片段、Bst DNA聚合酶、Taq DNA聚合酶、T7DNA聚合酶和Tth DNA聚合酶。A家族酶还包括Platinum Taq DNA聚合酶系列。
在一些实施方案中,A家族酶的特征在于高DNA延伸速率但因缺乏3'-5'外切核酸酶活性可具有低保真度。在一些实施方案中,B家族酶因它们的3'-5'外切核酸酶活性可具有高保真度但是可获得低DNA延伸速率。
其它类型的聚合酶包括例如Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶、Tfi聚合酶等。RT聚合酶包括HIV逆转录酶、莫洛尼鼠白血病病毒(M-MLV)逆转录酶、鸟类成髓细胞白血病病毒(AMV)逆转录酶或劳斯肉瘤病毒(RSV)逆转录酶。所述聚合酶的变体、修饰产物和衍生物也是可用的。类似地,Taq、Platinum Taq、Tth、Tli、Pfu、Pfutubo、Pyrobest、Pwo和KOD、VENT、DEEPVENT、EX-Taq、LA-Taq、TherminatorTM、Expand系列和Platinum Taq Hi-Fi全都商购可得。其它酶可由本领域技术人员从特定细菌容易地分离而来。
一个示例性聚合酶大肠杆菌DNA聚合酶I(“Pol I”)具有3个酶促活性:5’至3’DNA聚合酶活性;介导校正读码的3’至5’外切核酸酶活性;和在DNA修复期间介导切口平移的5’至3’外切核酸酶活性。Klenow片段是当大肠杆菌Pol I被枯草杆菌蛋白酶蛋白水解切割时产生的大的蛋白质片段。其保留聚合酶和校正读码外切核酸酶活性,但缺乏5’至3’外切核酸酶活性。已被突变以除去校正读码外切核酸酶活性的exo-Klenow片段也是可获得的。Klenow片段的结构显示与DNA相互作用的高度保守的残基包括N675、N678、K635、R631、E611、T609、R835、D827、S562和N579(Beese等人,Science 260:352-355(1993))。
大肠杆菌DNA聚合酶I(pol I)的Klenow片段中的Arg682对于模板依赖性核苷酸结合功能是重要的,并且似乎维持DNA聚合酶的高持续合成能力(Pandey等人,EuropeanJournal of Biochemistry,214:59-65(1993))。
在一些实施方案中,聚合酶来源于Taq DNA聚合酶,其为来源于嗜热菌栖热水生菌的A家族DNA聚合酶。Taq DNA聚合酶因其在聚合酶链式反应中的用途而最为有名。Taq聚合酶缺少校正读码活性,从而具有相对低的复制保真度(Kim等人,Nature 376:612-616(2002))。
在一些实施方案中,聚合酶来源于细菌噬菌体T7的T7DNA聚合酶,其为由病毒T7基因5蛋白(80k Da)与大肠杆菌硫氧还蛋白(12kDa)的1:1络合物组成的A家族DNA聚合酶。其不存在5'->3'外切核酸酶结构域,但3'->5'外切核酸酶活性比大肠杆菌Klenow片段的3'->5'外切核酸酶活性大约1000倍。外切核酸酶活性似乎负责该酶的高保真度并且阻止链置换合成。该聚合酶通常显示高水平的持续合成能力。
在一些实施方案中,聚合酶来源于KOD DNA聚合酶,其为来源于古生嗜热菌(Thermococcus kodakaraensis)的B家族DNA聚合酶。KOD聚合酶是具有高保真度和持续合成能力的热稳定性DNA聚合酶。
在一些实施方案中,聚合酶来源于TherminatorTMTM DNA聚合酶,其也是B家族DNA聚合酶。TherminatorTM是来自热球菌属的种9oN-7的DNA聚合酶的A485L点突变(Ichida等人、Nucleic Acids Res.33:5214-5222(2005))。TherminatorTM聚合酶具有增强的掺入修饰底物例如双脱氧核苷酸、核糖核苷酸和非环核苷酸的能力。
在一些实施方案中,聚合酶来源于Phi29聚合酶或Phi29-型聚合酶,例如来源于细菌噬菌体B103的聚合酶。Phi29和B103DNA聚合酶为来自相关细菌噬菌体的B家族聚合酶。除了A、B和C基序外,DNA聚合酶的Phi29家族还在区域Y中包含额外的保守基序KXY(Blanco等人,J.Biol.Chem.268:16763-16770(1993))。影响聚合酶活性和核苷酸结合亲和力的Phi29和B103聚合酶的突变描述于美国专利公布号20110014612及其优先权文献美国临时申请号61/307,356;61/299,917;61/299,919;61/293,616;61/293,618;61/289,388;61/263,974;61/245,457;61/242,771;61/184,770和61/164,324(将上述文献通过引用整体并入本文)中。
在一些实施方案中,聚合酶来源于人免疫缺陷病毒1型(HIV-1)的逆转录酶,其为由1个66-kDa亚单位和1个51-kDa亚单位组成的异二聚体。p66亚单位包含聚合酶和核糖核酸酶H结构域;p66的蛋白水解切割除去核糖核酸酶H结构域以产生p51亚单位(Wang等人,PNAS 91:7242-7246(1994))。HIV-1逆转录酶的结构显示RNA模板的2’-OH基团与逆转录酶之间的多个相互作用。p66拇指中的螺旋I的残基Ser280和Arg284和p66手掌中的模板柄的残基Glu89和Gln91都参与RNA-RT相互作用。p51亚单位还在RNA-DNA双链体与RT之间的相互作用中起作用,并且p51亚单位的残基Lys395、Glu396、Lys22和Lys390也与DNA:RNA双链体相互作用(Kohlstaedt等人,Science 256:1783-1790(1992)和Safarianos等人,The EMBOJournal 20:1449-1461(2001))。
在一些实施方案中,聚合酶来源于嗜热脂肪芽孢杆菌的Bst DNA聚合酶或其任意生物活性片段。Bst聚合酶可以是家族A DNA聚合酶。天然存在的Bst DNA聚合酶的大片段相当于大肠杆菌Pol I的Klenow片段,其保留了聚合酶和校正读码的外切核酸酶活性,然而不存在5’至3’外切核酸酶活性。在一些实施方案中,来源于Bst DNA聚合酶的聚合酶可以不存在3’至5’外切核酸酶活性。如本文中所用,术语“Bst DNA聚合酶”可指全长蛋白质或Bst大片段。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含SEQ ID NO:1的氨基酸序列的Bst DNA聚合酶的分离的变体组成或包含所述变体,所述SEQ ID NO:1的氨基酸序列是Bst DNA聚合酶的大片段(C末端部分)的氨基酸序列:
(SEQ ID NO:1)
SEQ ID NO:1对应于Bst DNA聚合酶的大片段,并且分别在残基358-363、411-420和533-536上包括DNA聚合酶基序A、B和C(参见,例如,Delarue,同上),如SEQ ID No:1中显示的。基序加以下划线,每一个基序内的不变残基加以粗体显示。在一些实施方案中,为了保持Bst聚合酶的聚合酶活性,可对基序A、B或C内不是高度保守的氨基酸残基例如聚合酶活性所需的不变的天冬氨酸残基D358和D535进行任何置换、缺失或化学修饰。在一些实施方案中,修饰聚合酶包括保持可检测水平的聚合酶活性的Bst DNA聚合酶的突变体或变体形式。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含与SEQ ID NO:1的氨基酸序列具有至少80%的同一性的氨基酸序列的聚合酶的分离的变体组成或包含所述变体。在一些实施方案中,参照聚合酶或修饰聚合酶是包含SEQ IDNO:1的氨基酸序列的Bst DNA聚合酶的分离的变体,其中变体包含与SEQ ID NO:1具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,参照聚合酶是具有或包含SEQ ID NO:1的氨基酸序列的BstDNA聚合酶,并且修饰聚合酶相对于参照聚合酶包括一个或多个氨基酸修饰(例如,氨基酸置换、缺失、添加或化学修饰)。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者包括位置1上的甲硫氨酸残基的缺失或置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。
在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含SEQ ID NO:1的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含与SEQ ID NO:1的氨基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含SEQ ID NO:2的氨基酸序列的Bst DNA聚合酶的分离的变体组成或包含所述变体:
(SEQ ID NO:2)
SEQ ID NO:2相对于SEQ ID NO:1包括3个氨基酸置换,即:His46Arg(H46R)、Glu446Gln(E446Q)和His572Arg(H572R),其中编号是相对于SEQ ID NO:1的氨基酸序列的。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含与SEQ ID NO:2的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的分离的变体组成或包含所述变体。在一些实施方案中,聚合酶是包含SEQ ID NO:2的氨基酸序列的BstDNA聚合酶的变体,其中变体包含与SEQ ID NO:2具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,参照聚合酶是具有或包含SEQ ID NO:2的氨基酸序列的BstDNA聚合酶,并且修饰聚合酶相对于参照聚合酶包括一个或多个氨基酸修饰(例如,氨基酸置换、缺失、添加或化学修饰)。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者包括位置1上的甲硫氨酸残基的缺失或置换,其中编号是相对于SEQ ID NO:2的氨基酸序列的。
在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有SEQ ID NO:2的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列,并且还包括选自D264S、D423K和D480R的任一个或多个氨基酸突变。
在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含SEQ ID NO:2的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含与SEQ ID NO:2的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含SEQ ID NO:3的氨基酸序列的Bst DNA聚合酶的分离的变体组成或包含所述变体:
(SEQ ID NO:3)
SEQ ID NO:3相较于SEQ ID NO:2包括两个其它的氨基酸置换,即:His473Arg(H473R)和His528Ala(H528A),其中编号是相对于SEQ ID NO:2的氨基酸序列的。因此SEQID NO:3相较于SEQ ID NO:1的参照野生型序列包含总共5个氨基酸置换。相较于SEQ IDNO:1的置换的氨基酸加以下划线和粗体显示。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含与SEQ ID NO:3的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的分离的变体组成或包含所述变体。在一些实施方案中,聚合酶是包含SEQ ID NO:3的氨基酸序列的BstDNA聚合酶的变体,其中变体包含与SEQ ID NO:3具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,参照聚合酶是具有或包含SEQ ID NO:3的氨基酸序列Bst DNA聚合酶,并且修饰聚合酶相对于参照聚合酶包括一个或多个氨基酸修饰(例如,氨基酸置换、缺失、添加或化学修饰)。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者包括位置1上的甲硫氨酸残基的缺失或置换,其中编号是相对于SEQ ID NO:3的氨基酸序列的。
在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含SEQ ID NO:3的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含与SEQ ID NO:3的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含SEQ ID NO:4的氨基酸序列的Bst DNA聚合酶的分离的变体组成或包含所述变体:
(SEQ ID NO:4)
SEQ ID NO:4相较于SEQ ID NO:3包含3个另外的氨基酸置换,即:H281A、H273R和Y477F,其中编号是相对于SEQ ID NO:3的氨基酸序列的。因此SEQ ID NO:4相对于SEQ IDNO:1的参照野生型序列包含总共8个氨基酸置换。相较于SEQ ID NO:1的置换的氨基酸加以下划线和粗体表示。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含与SEQ ID NO:4的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的分离的变体组成或包含所述变体。在一些实施方案中,聚合酶是包含SEQ ID NO:4的氨基酸序列的Bst DNA聚合酶的变体,其中变体包含与SEQ ID NO:4具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,参照聚合酶是具有或包含SEQ ID NO:4的氨基酸序列Bst DNA聚合酶,并且修饰聚合酶相对于参照聚合酶包括一个或多个氨基酸修饰(例如,氨基酸置换、缺失、添加或化学修饰)。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者包括位置1上的甲硫氨酸残基的缺失或置换,其中编号是相对于SEQ ID NO:4的氨基酸序列的。
在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含SEQ ID NO:4的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有或包含与SEQ ID NO:4的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶,所述聚合酶包括包含选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4的氨基酸序列的Bst DNA聚合酶的分离的变体,并且还包括一个或多个氨基酸修饰。任选地,修饰聚合酶相对于SEQ IDNO:1、2、3或4的氨基酸序列包括1、2、3、4或更多个氨基酸置换。
在一些实施方案中,参照聚合酶是具有或包含SEQ ID NO:1、2、3或4的氨基酸序列的Bst DNA聚合酶,并且修饰聚合酶是参照聚合酶的突变体或变体并且还相对于参照聚合酶包括一个或多个氨基酸突变。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。存在于修饰聚合酶中的相对于参照聚合酶的一个或多个氨基酸置换可包括至少一个保守氨基酸置换。
在一些实施方案中,参照聚合酶可具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶可具有或包含参照聚合酶的氨基酸序列,其相较于参照聚合酶还包括一个或多个氨基酸突变。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还可包括选自:H46R,C93R,Q238C,H273R,H281A,E446Q,H473R,Y477F,H528A,C550Q和H572R的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶具有减小的缓冲能力。不束缚于任何特定的操作理论,可观察到在一些实施方案中,上述突变的一个或多个可改变,例如增加或减小修饰聚合酶相对于未修饰聚合酶的缓冲能力。这样的突变从而可称为“缓冲”突变。在一些实施方案中,这样的缓冲能力的增加或减小可在基于离子的测序反应中增强观察到的信号。关于这样的突变及其对聚合酶的缓冲能力的可能影响的其它信息可见于例如2010年2月26日提交的美国临时申请号60/308,863;2011年2月25日提交的美国专利申请系列号13/035,081;2011年2月25日提交的13/035,177;2011年2月28日提交的13/036,526;和2011年2月25日提交的13/036,623的美国专利申请系列;以及2011年2月25日提交的申请号PCT/US2011/026219;2011年2月25日提交的PCT/US2011/026228;2011年2月28日提交的PCT/US2011/026450和2011年2月28日提交的PCT/US2011/026468的国际PCT申请中;将所有上述申请通过引用整体并入本文。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失,或用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。可减小或消除聚合酶的外切核酸酶活性的一些示例性突变进一步描述于本文中。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列,其相较于参照聚合酶还包括一个或多个氨基酸突变。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括选自:46,93,238,273,281,446,473,477,528,550和572的任一个或多个位置上的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,上述置换的一个或多个可改变,例如增加或减小修饰聚合酶相对于对应的未修饰聚合酶或相对于具有SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶的缓冲能力。这样的突变从而可称为“缓冲”突变。在一些实施方案中,这样的缓冲能力的增加或减小可在基于离子的测序反应中增强观察到的信号。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失、或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自:平均阅读长度、最小阅读长度、在更高离子强度的浓度中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、缓冲能力、解离速率、解离时间常数、AQ20、100Q17值和200Q17值的任一个或多个参数的变化。任选地,通过参照与修饰聚合酶在基于离子的测序反应中的性能观察上述变化。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还可包括选自:N31R,N31K,D77K,D77H,D113N,D114R,D130A,D130H,D144M,D144K,L212A,E220K,N234R,N234K,V241K,V251K,D264Q,D264S,D264K,Y272R,H273R,L280R,H281A,H281M,E294S,E294F,E294G,E294K,V299K,V299H,V299F,D303R,I331Q,E325R,L335T,E336P,I354W,I354F,I370A,Q409R,G416K,V418M,V418I,G420K,D423S,D423K,D423N,D423R,D423T,D423G,D423I,D423K,G425R,Q428W,N429R,N429K,E446Q,F448K,N457T,A462T,H473R,Y477F,D480R,D480F,D480H,D480A,D480S,D480N,D480Q,N485W,N485Y,N487H,N487W,N487F,N487I,V488R,E493Q,M495Q,H528A,H528R,H528K,V533I,H572R,W577Y和D579F的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:1的氨基酸序列的。不受任何特定的操作理论的束缚,可观察到在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力,或相对于未修饰聚合酶,或相对于具有SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减少的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减小的平均阅读长度,或改变的最小阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的AQ20、100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的任一个或多个的变化:平均阅读长度、最小阅读长度、在更高离子强度的溶液中增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20、100Q17值和200Q17值。任选地,通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察上述变化。本文中提供的实例举例说明在不同的示例性修饰聚合酶(所述聚合酶具有SEQ ID NO:2的氨基酸序列并且还包括上文列出的各种示例性氨基酸置换)中观察到的其解离速率和解离时间常数中相对于具有SEQ ID NO:2的氨基酸序列的参照聚合酶的解离速率和解离时间常数的变化。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者可还包括位置1上的甲硫氨酸残基的缺失,或利用任意其它氨基酸残基对位置1的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括减小或消除外切核酸酶活性的一个或多个氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还在选自:31,77,113,114,130,144,212,220,234,241,251,264,272,280,294,299,303,331,325,335,336,354,370,409,416,418,420,423,425,428,429,448,457,462,480,485,487,488,493,495,533,577和579的任一个或多个位置上包括氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,包含这些突变的一个或多个的修饰聚合酶相对于对应的未修饰聚合酶或相对于包含SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,修饰聚合酶相对于未修饰聚合酶或相对于包含SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的任一个或多个的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20,100Q17值和200Q17值。任选地,上述变化可通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自下列的参数的任一个或多个参数的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、缓冲能力、解离速率、100Q17值、AQ20和200Q17值。任选地,通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察上述变化。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还在选自:31,46,77,93,113,114,130,144,212,220,234,238,241,251,264,272,273,280,281,294,299,303,331,325,335,336,354,370,409,416,418,420,423,425,428,429,446,448,457,462,473,477,480,485,487,488,493,495,528,533,550,572,577和579的任一个或多个位置上包括氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:对于核酸模板的结合亲和力、缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、解离时间常数、解离速率、100Q17值和200Q17值。参照聚合酶可具有SEQ ID NO:1、2、3或4的氨基酸序列。任选地,上述变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚酶合还包括一个或多个选自如下突变的任一个或多个氨基酸突变:N31R,N31K,H46A,H46R,D77K,D77H,C93R,D113N,D114R,D130A,D130H,D144M,D144K,L212A,E220K,N234R,N234K,Q238C,V241K,V251K,D264Q,D264S,D264K,Y272R,H273A,H273R,L280R,H281A,H281R,H281M,E294S,E294F,E294G,E294K,V299K,V299H,V299F,D303R,I331Q,E325R,L335T,E336P,I354W,I354F,I370A,Q409R,G416K,V418M,V418I,G420K,D423S,D423K,D423N,D423R,D423T,D423G,D423I,D423K,G425R,Q428W,N429R,N429K,E446Q,F448K,N457T,A462T,H473A,H473R,Y477F,D480R,D480F,D480H,D480A,D480S,D480N,D480Q,N485W,N485Y,N487H,N487W,N487F,N487I,V488R,E493Q,M495Q,H528A,H528R,H528K,V533I,C550Q,H572A,H572R,W577Y和D579F,其中编号是相对于SEQ ID NO:1的氨基酸序列。不受任何特定的操作理论束缚,可观察到在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力,或相对于未修饰聚合酶显示改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)缓冲能力。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的解离时间常数或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、解离速率、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、100Q17值和200Q17值。任选地,上述变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括在选自如下位置的任一个或多个位置上的氨基酸置换:46,93,238,273,281,446,473,477,528,550和572,以及一个或多个选自31,77,113,114,130,144,212,220,234,241,251,264,272,280,294,299,303,331,325,335,336,354,370,409,416,418,420,423,425,428,429,448,457,462,480,485,487,488,493,495,533,577和579的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:对于核酸模板的结合亲和力、缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、解离时间常数、解离速率、100Q17值和200Q17值。任选地,上述变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:1、2、3或4的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括一个或多个选自:H46A、H46R、C93R、Q238C、H273A、H273R、H281A、H281R、H281M、E446Q、H473A、H473R、Y477F、H528A、H528R、H528K、C550Q、H572A和H572R的氨基酸置换,以及一个或多个选自N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、E325R、I331Q、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y和D579F的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、解离时间常数、解离速率、100Q17值和200Q17值。任选地,上述变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶,其具有或包含SEQ IDNO:1、2、3或4的氨基酸序列或具有或包含SEQ ID NO:1、2、3或4的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列,并且相对于具有SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶的氨基酸序列还包括至少一个氨基酸突变。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,根据本公开内容的修饰聚合酶可包括至少氨基酸突变D480R,其中编号是相对于SEQ ID NO:2的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变D264K和E493Q,其中编号是相对于SEQ ID NO:2的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变E220K、N234R和D423K,其中编号是相对于SEQ ID NO:2的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变E220K,N234R,D423K和H528A,其中编号是相对于SEQ IDNO:2的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变E220K,N234R,D423K,H473R和H528A,其中编号是相对于SEQ ID NO:2的氨基酸序列的(参见SEQ ID NO:20)。
(SEQ ID NO:20)
在一些实施方案中,根据本公开内容的修饰聚合酶可包括选自:E220K、N234R、V241K、D264K、D423K、D480R、N487W、V488R、H473R、H528A和E493Q的任一个或多个的氨基酸突变,其中编号是相对于SEQ ID NO:2的氨基酸序列的。在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于对应的未修饰聚合酶或相对于包含SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,修饰聚合酶相对于未修饰聚合酶或相对于包含SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶具有改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的任一个或多个的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,氨基酸置换包括用任意其它氨基酸残基(包括天然存在的和非天然的氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失,或用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换。在一些实施方案中,修饰聚合酶显示相对于参照聚合酶选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高离子强度的浓度中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:1的氨基酸序列,或具有SEQ IDNO:1的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。修饰聚合酶相对于SEQ IDNO:1的氨基酸序列还可包括一个或多个氨基酸突变。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:2的氨基酸序列,或具有SEQ IDNO:2的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。修饰聚合酶相对于SEQ IDNO:2的氨基酸序列还可包括一个或多氨基酸突变。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:3的氨基酸序列,或具有SEQ IDNO:3的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列。修饰聚合酶相对于SEQ IDNO:3的氨基酸序列还可包括一个或多个氨基酸突变。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:4的氨基酸序列,或具有SEQ IDNO:4的氨基酸序列的任意生物活性片段的氨基酸序列。修饰聚合酶相对SEQ ID NO:4的氨基酸序列还可包括一个或多个氨基酸突变。
在一些实施方案中,修饰聚合酶具有聚合酶活性。聚合酶或生物活性片段可具有体内或体外引物延伸活性。
在一些实施方案中,修饰聚合酶包含与SEQ ID NO:1、2、3、4或25的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,修饰聚合酶中的一个或多个突变可包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:46、273、281、446、473、477、528和572的任一个或多个位置上,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自该组的位置上的氨基酸置换。不期望受任何特定的作用理论束缚,可观察到在一些实施方案中,这样的位置上的氨基酸置换可相对于对应的未修饰聚合酶或相对于具有SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶改变例如增加或减小修饰聚合酶的缓冲能力。这样的突变从而可称为“缓冲”突变。在一些实施方案中,这样的缓冲能力的增加或减小可在基于离子的测序反应中增强观察到的信号。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:1的氨基酸序列,或包括具有SEQID NO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,或包括与SEQ ID NO:1的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列,并且还包括至少一个选自:H46A、H46R、H273A、H273R、H281A、H281R、E446Q、H473A、H473R、Y477F、H528A、H528R、H572A和H572R的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括这些氨基酸置换的任意2、3、4、5或更多个。
在一些实施方案中,修饰聚合酶中的一个或多个突变可包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:31、77、113、114、130、144、212、220、234、241、251、264、272、280、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429,、448、457、462、480、485、487、488、493、495、533、577和579的任一个或多个位置上,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自该组的位置上的氨基酸置换。不受任何特定操作理论束缚,可观察到在一些实施方案中,包括这样的氨基酸置换的任一个的修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力,或相对于对应的未修饰聚合酶或相对于参照聚合酶显示改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。参照聚合酶可包括SEQ ID NO:1、2、3或4的氨基酸。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的(例如,增加的或减小的)阅读长度,或改变的(例如,增加的或减小的)平均无错误阅读长度,或改变的(例如,增加的或减小的)解离时间常数,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下性质的任一个或多个性质的变化(例如,增加或减小):DNA结合亲和力、解离速率、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性质来观察。
在一些实施方案中,修饰聚合酶中的一个或多个突变可包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:31、46、77、113、114、130、144、212、220、234、241、251、264、272、273、280、281、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、446、448、457、462、473、477、480、485、487、488、493、495、528、533、572、577和579的任一个或多个位置上,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自该组的位置上的氨基酸置换。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:1的氨基酸序列,或包括具有SEQID NO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,或包括与SEQ ID NO:1的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列,并且还在选自:46、273、281、446、473、477、528和572的任一个或多个位置上包括至少一个氨基酸置换,以及在选自:31、77、113、114、130、144、212、220、234、241、251、264、272、280、294、299、303、331、325、335、336、354、370、409、416、418、420、423、425、428、429、448、457、462、480、485、487、488、493、495、533、577和579的任一个或多个位置上包括至少一个氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自这两组氨基酸置换的每一个组的位置上的氨基酸置换。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:1的氨基酸序列,或包括具有SEQID NO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,或包括与SEQ ID NO:1的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列,并且还包括至少一个选自:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y和D579F的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括这些氨基酸置换的任意2、3、4、5或更多个。
在一些实施方案中,修饰聚合酶包括至少一个被设计来利用不同的氨基酸残基替代预先存在的半胱氨酸残基,或利用半胱氨酸残基替代非半胱氨酸氨基酸残基的氨基酸置换。至少一个氨基酸置换任选地包括一个或多个选自:C93R、Q238C和C550Q的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:1的氨基酸序列,或包括具有SEQID NO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,或包括与SEQ ID NO:1的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列,并且还包括至少一个选自:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y和D579F的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。任选地,修饰聚合酶还可包括至少一个选自:H46A、H46R、H273A、H273R、H281A、H281R、H281M、E446Q、H473A、H473R、Y477F、H528A、H528R、H528K、H572A和H572R的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括任意2、3、4、5或更多个选自这两组氨基酸置换的每一个组的氨基酸置换。
在一些实施方案中,修饰聚合酶包括SEQ ID NO:1的氨基酸序列,或包括具有SEQID NO:1的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,或包括与SEQ ID NO:1的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列,并且还包括至少一个选自:N31R、N31K、H46A、H46R、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273A、H273R、L280R、H281A、H281R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473A、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528R、V533I、H572R、H578A、W577Y和D579F的氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,修饰聚合酶包括这些氨基酸置换的任意2、3、4、5或更多个。
在一些实施方案中,修饰聚合酶相对于参照聚合酶具有改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,修饰聚合酶相对于参照聚合酶具有改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。参照聚合酶可任选地具有SEQ ID NO:1、2、3或4的氨基酸序列。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的(例如,增加的或减小的)阅读长度,或改变的(例如,增加的或减小的)平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列性质的任一个或多个性质的变化(例如,增加或减小):对于核酸模板的结合亲和力、解离时间常数、解离速率、100Q17值和200Q17值。在一些实施方案中,相对于对应的未修饰聚合酶或参照聚合酶,改变的性质增加或减少至少10%、20%、30%、40%、50%、75%、90%、100%、200%、300%、500%、750%、1000%、3000%或更大。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性质来观察。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除聚合酶的任何外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者由具有或包含SEQ ID NO:16的氨基酸序列的Bst DNA聚合酶的分离的变体组成或包含所述变体:
(SEQ ID NO:16)
SEQ ID NO:16包含天然存在的Bst DNA聚合酶的氨基酸序列。
在一些实施方案中,参照聚合酶是具有或包含SEQ ID NO:16的氨基酸序列的BstDNA聚合酶,并且修饰聚合酶是参照聚合酶的突变体或变体,并且相对于参照聚合酶还包括一个或多个氨基酸突变。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。相对于参照聚合酶,存在于修饰聚合酶中的一个或多个氨基酸置换可包括至少一个保守氨基酸置换。
在一些实施方案中,参照聚合酶可具有或包含SEQ ID NO:16的氨基酸序列,并且修饰聚合酶可具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。修饰聚合酶还可包括选自:H341R、C388R、Q533C、H568R、H576A、E741Q、H768R、Y772F、H823A、C845Q和H867R的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶具有减小的缓冲能力。不受任何特定的操作理论束缚,可观察到在一些实施方案中,上述突变的一个或多个相对于未修饰聚合酶可减小修饰聚合酶的缓冲能力。在一些实施方案中,这样的缓冲能力的减小可在基于离子的测序反应增强观察到的信号。关于这样的突变及其对聚合酶的缓冲能力的可能影响的其它信息可见于例如2010年2月26日提交的美国临时申请号60/308,863;2011年2月25日提交的美国专利申请系列号13/035,081;2011年2月25日提交的13/035,177;2011年2月28日提交的13/036,526;和2011年2月25日提交的13/036,623的美国专利申请系列中;以及2011年2月25日提交的申请号PCT/US2011/026219;2011年2月25日提交的PCT/US2011/026228;2011年2月28日提交的PCT/US2011/026450和2011年2月28日提交的PCT/US2011/026468的国际PCT申请中;将所有上述申请通过引用整体并入本文。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ IDNO:16的氨基酸序列的。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。可减小或消除聚合酶的外切核酸酶活性的一些示例性突变进一步描述于本文中。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:16的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括选自:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、Y567R、L575R、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y和D874F的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。不受任何特定的操作理论束缚,可观察到在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的解离时间常数。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的任一个或多个的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:16的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还在选自:326、341、372、388、408、409、425、439、507、515、529、533、536、546、559、567、568、575、576、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、741、743、752、757、768、772、775、780、782、783、788、790、823、828、845、867、872和874的任一个或多个位置上包括氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,参照聚合酶和/或修饰聚合酶可包括具有SEQ ID NO:16的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列,并且还包括选自D559S、D718K和D775R的任一个或多个氨基酸突变。
在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、缓冲能力、解离速率、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:16的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括选自如下突变的任一个或多个氨基酸突变:N326R、N326K、H341R、D372K、D372H、C388R、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、Q533C、D559Q、D559S、Y567R、H568R、L575R、H576A、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A,V828I、C845Q、H867R、W872Y和D874F,其中编号是相对于SEQ ID NO:16的氨基酸序列的。不受任何特定的操作理论束缚,可观察到在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)解离时间常数。在一些实施方案中,修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)缓冲能力。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:16的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:341、388、533、568、576、741、768、772、823、845和867的任一个或多个位置上。在一些实施方案中,修饰聚合酶还可在选自:326、372、408、409、425、439、507、515、529、536、546、559、567、575、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、743、752、757、775、780、782、783、788、790、828、872和874的任一个或多个位置上包括至少一个氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,参照聚合酶具有或包含SEQ ID NO:16的氨基酸序列,并且修饰聚合酶具有或包含参照聚合酶的氨基酸序列。
在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,修饰聚合酶还包括一个或多个选自:H341A、H341R、C388R、Q533C、H568A、H568R、H576A、H576M、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、C845Q、H867A和H867R的氨基酸置换,以及一个或多个选自:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y和D874F的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、解离时间常数、解离速率、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及修饰聚合酶,所述聚合酶包含SEQID NO:16的氨基酸序列,或具有或包含SEQ ID NO:16的氨基酸序列的聚合酶的任意生物活性片段的氨基酸序列,并且相对于具有SEQ ID NO:16的氨基酸序列的参照聚合酶的氨基酸序列还包括至少一个氨基酸突变。
在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,修饰聚合酶具有聚合酶活性。聚合酶或生物活性片段可具有体内或体外引物延伸活性。
在一些实施方案中,修饰聚合酶中的一个或多个突变可包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:341、388、533、568、576、741、768、772、823、845和867的任一个或多个位置上,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自该组的位置上的氨基酸置换。不意欲受任何特定的作用理论束缚,可观察到在一些实施方案中,这样的位置上的氨基酸置换可相对于对应的未修饰聚合酶或相对于具有SEQ ID NO:1、2、3或4的氨基酸序列的参照聚合酶,改变例如增加或减小修饰聚合酶的缓冲能力。这样的突变从而可称为“缓冲”突变。在一些实施方案中,这样的缓冲能力的增加或减小可在基于离子的测序反应中增强观察到的信号。
在一些实施方案中,修饰聚合酶中的一个或多个突变可包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:326、372、408、409、425、439、507、515、529、536、546、559、567、575、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、743、752、757、775、780、782、783、788、790、828、872和874的任一个或多个位置上,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自该组的位置上的氨基酸置换。不受任何特定的操作理论束缚,可观察到在一些实施方案中,包括这样的氨基酸置换的任一个的修饰聚合酶相对于未修饰聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力,或相对于对应的未修饰聚合酶或相对于参照聚合酶显示改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。参照聚合酶可包括SEQ ID NO:1、2、3或4的氨基酸。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的(例如,增加的或减小的)阅读长度,或改变的(例如,增加的或减小的)平均无错误阅读长度,或改变的(例如,增加的或减小的)解离时间常数,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下性质的任一个或多个性质的变化(例如,增加或减小):DNA结合亲和力、解离速率、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性质来观察。
在一些实施方案中,修饰聚合酶中的一个或多个突变可包括至少一个氨基酸置换。至少一个氨基酸置换可任选地存在于选自:326、341、372、408、409、425、439、507、515、529、536、546、559、567、568、575、576、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、741、743、752、757、768、772、775、780、782、783、788、790、823、828、867、872和874的任一个或多个位置上,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自该组的位置上的氨基酸置换。
在一些实施方案中,修饰聚合酶包含SEQ ID NO:16的氨基酸序列,或具有SEQ IDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列,并且还在选自:341、568、576、741、768、772、823、845和867的任一个或多个位置上包括至少一个氨基酸置换,以及在选自:326、372、408、409、425、439、507、515、529、536、546、559、567、575、589、594、598、626、630、631、649、665、704、711、713、715、718、720、723、724、743、752、757、775、780、782、783、788、790、828、872和874的任一个或多个位置上包括至少一个氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的,在一些实施方案中,修饰聚合酶包括至少2、3、4、5或更多个存在于选自这两组氨基酸置换的每一个组的位置上的氨基酸置换。
在一些实施方案中,修饰聚合酶包含SEQ ID NO:16的氨基酸序列,或具有SEQ IDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括至少一个选自:H341A、H341R、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、H867A和H867R的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括这些氨基酸置换的任意2、3、4、5或更多个。
在一些实施方案中,修饰聚合酶包括至少一个被设计来利用不同的氨基酸残基替代预先存在的半胱氨酸残基,或利用半胱氨酸残基替代非半胱氨酸氨基酸残基的氨基酸置换。至少一个氨基酸置换任选地包括一个或多个选自:C388R、Q533C、C845Q的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,修饰聚合酶包含SEQ ID NO:16的氨基酸序列,或具有SEQ IDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括至少一个选自:H341A、H341R、H568A、H568R、H576A、H576R、H576M、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、H867A和H867R的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括这些氨基酸置换的任意2、3、4、5或更多个。
在一些实施方案中,修饰聚合酶包含SEQ ID NO:16的氨基酸序列,或具有SEQ IDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括至少一个选自:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y和D874F的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。任选地,修饰聚合酶还可包括至少一个选自:H341A、H341R、H568A、H568R、H576A、H576R、H576M、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、H867A和H867R的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括选自这两组氨基酸置换的每一组的任意2、3、4、5或更多个氨基酸置换。
在一些实施方案中,修饰聚合酶包含SEQ ID NO:16的氨基酸序列或具有SEQ IDNO:16的氨基酸序列的聚合酶的生物活性片段的氨基酸序列。在一些实施方案中,修饰聚合酶包含与参照聚合酶的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。在一些实施方案中,修饰聚合酶还包括至少一个选自:N326R、N326K、H341A、H341R、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、H568A、H568R、L575R、H576A、H576R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768A、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A、H823R、V828I、H867A、H867R,W872Y和D874F的氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶包括这些氨基酸置换的任意2、3、4、5或更多个。
在一些实施方案中,根据本公开内容的修饰聚合酶可包括至少氨基酸突变D775R,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变D559K和E788Q,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变E515K、N529R和D718K,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变E515K、N529R、D718K和H823A,其中编号是相对于SEQID NO:16的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括氨基酸突变E515K、N529R、D718K、H768R和H823A,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶可包括选自:E515K、N529R、V536K、D559K、D718K、H768R、D775R、N782W、V783R、E788Q和H823A的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于对应的未修饰聚合酶或相对于包含SEQ ID NO:16的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,修饰聚合酶相对于未修饰聚合酶或相对于包含SEQ ID NO:16的氨基酸序列的参照聚合酶具有改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的任一个或多个变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离速率、AQ20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,修饰聚合酶相对于参照聚合酶具有改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,修饰聚合酶相对于参照聚合酶具有改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。参照聚合酶可任选地具有SEQ ID NO:16、1、2、3或4的氨基酸序列。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的(例如,增加的或减小的)阅读长度,或改变的(例如,增加的或减小的)平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列性质的任一个或多个的变化(例如,增加或减小):对于核酸模板的结合亲和力、解离时间常数、解离速率、100Q17值和200Q17值。在一些实施方案中,改变的性质相对于对应的未修饰聚合酶或相对于参照聚合酶增加或减少至少10%、20%、30%、40%、50%、75%、90%、100%、200%、300%、500%、750%、1000%、3000%或更多。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性质来观察。
在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除聚合酶的任何外切核酸酶活性的氨基酸突变。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者是具有校正读码的外切核酸酶活性的Bst DNA聚合酶。在多个实施方案中,修饰Bst DNA聚合酶的校正读码的外切核酸酶活性是对应的野生型蛋白的所述外切核酸酶活性的至少约40%、50%、60%、70%、80%或90%。为了保持修饰Bst DNA聚合酶的校正读码的外切核酸酶活性,本领域技术人员将理解,应当对Exo I、ExoII和Exo III基序内的不是高度保守的氨基酸残基进行任何置换、缺失或化学修饰。
在一些实施方案中,修饰聚合酶是Taq DNA聚合酶。在一些实施方案中,聚合酶是作为Platinum Taq High Fidelity DNA聚合酶(Life Technologies,CA)商购可得的TaqDNA聚合酶,其相较于参照Platinum Taq High Fidelity DNA聚合酶包括一个或多个氨基酸突变。在一些实施方案中,修饰聚合酶是具有或包含SEQ ID NO:15的氨基酸序列的TaqDNA聚合酶,该氨基酸序列是Taq Pol A聚合酶的大片段的氨基酸序列:
(SEQ ID NO:15)
在一些实施方案中,修饰聚合酶包括Taq DNA聚合酶的保持可检测水平的聚合酶活性的突变体或变体形式。为了保留Taq DNA聚合酶的聚合酶活性,可对不是高度保守的氨基酸残基例如聚合酶活性所需的不变的天冬氨酸残基进行任何置换、缺失或化学修饰。在一些实施方案中,修饰聚合酶可包括Taq DNA聚合酶、热启动Taq DNA聚合酶、化学热启动Taq DNA聚合酶、Platinium Taq DNA聚合酶等。
在一些实施方案中,修饰聚合酶可包括具有或包含与SEQ ID NO:15的氨基酸序列具有至少90%的同一性的氨基酸序列的聚合酶的分离的变体。在一些实施方案中,聚合酶是包含SEQ ID NO:15的氨基酸序列的Taq DNA聚合酶的变体,其中变体包含与SEQ ID NO:15具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,修饰聚合酶包括具有氨基酸突变E471K的Taq DNA聚合酶的突变体或变体形式,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变N485R,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变R492K,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变D513K,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变A675K,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变D732R,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变S739W,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变V740R,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq DNA聚合酶可包括氨基酸突变E745Q,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰聚合酶可包括Taq DNA聚合酶的变体或突变体,其具有或包含下列氨基酸突变的一个或多个:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,包括这些突变的一个或多个的修饰聚合酶相对于对应的未修饰聚合酶或包含SEQ ID NO:15的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,修饰Taq聚合酶相对于未修饰聚合酶或包含SEQ ID NO:15的氨基酸序列的参照聚合酶具有改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰Taq聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰Taq聚合酶相对于参照聚合酶显示下列动力学参数的任一个或多个变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ 20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰Taq聚合酶或参照与修饰Taq聚合酶还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,修饰Taq聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:缓冲能力、平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、AQ20、解离速率、100Q17值和200Q17值。任选地,变化通过比较参照与修饰Taq聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰Taq聚合酶或参照与修饰Taq聚合酶还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,修饰聚合酶是Taq DNA聚合酶,其具有或包含除SEQ ID NO:15的第一残基(N-末端甲硫氨酸)(该残基不包含在修饰聚合酶中)之外的SEQ ID NO:15的氨基酸序列。
如本领域技术人员将容易理解的,本公开内容的范围不仅包括本文中公开的特定氨基酸和/或核苷酸序列,而且还包括例如许多编码具有本文中描述的功能性质的基因和/或肽的相关序列。例如,本公开内容的范围和精神包括编码本文中公开的各种聚合酶的保守变体的任何核苷酸和氨基酸序列。对于本领域技术人员还将很显然的是,可以例如使用许多可自由获得的序列转换应用(例如,“in-silco”)将本文中通过氨基酸序列公开的修饰聚合酶转换成对应的核苷酸序列而无需过度实验。
在一些实施方案中,修饰聚合酶是大肠杆菌DNA聚合酶I的Klenow片段。来自大肠杆菌的DNA聚合酶I包含5’至3’外切核酸酶结构域(通常对应于氨基酸残基:7-252)。然而,为了产生Klenow片段,可切除这些和另外的氨基酸残基(1-323)。大肠杆菌DNA聚合酶I的氨基酸残基324-928构成Klenow片段(在本文中提供为SED ID NO:23)。大肠杆菌DNA聚合酶I和Klenow片段都包含位于氨基酸残基345-539的3’至5’外切核酸酶(校正读码的)结构域;和负责新DNA链(氨基酸残基547-926)的聚合的聚合酶结构域。总体上,Klenow片段相较于大肠杆菌聚合酶I通常不存在氨基酸1-323。
在一些实施方案中,修饰聚合酶是具有或包含SEQ ID NO:18的氨基酸序列的大肠杆菌DNA聚合酶的Klenow片段。
(SEQ ID NO:18)
在一些实施方案中,修饰聚合酶包括DNA聚合酶I的Klenow片段的保持可检测水平的聚合酶活性的突变体或变体形式。为了保持Klenow片段的聚合酶活性,将对不是高度保守的氨基酸残基例如聚合酶活性所需的不变天冬氨酸残基进行任何置换、缺失或化学修饰。
在一些实施方案中,修饰聚合酶可包括聚合酶的分离的变体,所述变体具有或包含与SEQ ID NO:18的氨基酸序列具有至少90%的同一性的氨基酸序列。在一些实施方案中,聚合酶是包含SEQ ID NO:18的氨基酸序列的DNA聚合酶I的Klenow片段的变体,其中变体包含与SEQ ID NO:18具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
在一些实施方案中,修饰聚合酶包括具有氨基酸突变E245K的DNA聚合酶I的Klenow片段的突变体或变体形式,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶包括具有氨基酸突变S259R的DNA聚合酶I的Klenow片段的突变体或变体形式,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶包括具有氨基酸突变T266K的DNA聚合酶I的Klenow片段的突变体或变体形式,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶包括具有氨基酸突变E290K的DNA聚合酶I的Klenow片段的突变体或变体形式,其中编号是相对于SEQID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶包括具有氨基酸突变A448K的DNA聚合酶I的Klenow片段的突变体或变体形式,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,DNA聚合酶I的修饰Klenow片段可包括氨基酸突变D505R,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶包括具有氨基酸突变A512W的DNA聚合酶I的Klenow片段突变体或变体,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,DNA聚合酶I的修饰Klenow片段可包括氨基酸突变E518Q,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶可包括具有或包含下列氨基酸突变的一个或多个的DNA聚合酶I的Klenow片段的变体或突变体,所述氨基酸突变选自:E245K、S259R、T266K、E290K、A448K、D505R、A512W和E518Q,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,包括这些突变的一个或多个的DNA聚合酶I的修饰Klenow片段相对于对应的未修饰聚合酶或包含SEQ ID NO:18的氨基酸序列的参照聚合酶显示改变的(例如,增加的或减小的)对于核酸模板的结合亲和力。在一些实施方案中,DNA聚合酶I的修饰Klenow片段相对于未修饰聚合酶或包含SEQ IDNO:18的氨基酸序列的参照聚合酶具有改变的(例如,增加的或减小的)从核酸模板解离的速率(“解离速率”)。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的的任一个或多个的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ 20、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。在一些实施方案中,氨基酸置换包括利用任意其它氨基酸残基(包括天然存在的和非天然氨基酸残基)对指定位置上的现有氨基酸残基的置换。在一些实施方案中,氨基酸置换是保守置换;或者,氨基酸置换可以是非保守置换。在一些实施方案中,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括位置1上的甲硫氨酸残基的缺失或利用任意其它氨基酸残基对位置1上的甲硫氨酸残基的置换,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示选自如下参数的任一个或多个参数的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、缓冲能力、解离速率、100Q17值和200Q17值。任选地,变化通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。
在本公开内容的一个方面,已发现可突变聚合酶(例如,参照聚合酶)的氨基酸以产生具有改变的催化性质的修饰聚合酶。在一些实施方案中,可在表1中提供的氨基酸的一个或多个上突变SEQ ID NO:16(对应于全长野生型Bst DNA聚合酶)以获得一个或多个相较于参照聚合酶(全长野生型Bst聚合酶)具有改变的催化性质的聚合酶。在一些实施方案中,可在表1中提供的氨基酸的一个或多个上突变SEQ ID NO:1(对应于野生型Bst DNA聚合酶的截短形式)以获得一个或多个相较于参照聚合酶(截短的野生型Bst聚合酶)具有改变的催化性质的聚合酶。在一些实施方案中,可在表1中提供的氨基酸的一个或多个上突变SEQID NO:18(对应于大肠杆菌的DNA聚合酶I的Klenow片段)以获得一个或多个相较于参照聚合酶(DNA聚合酶I的Klenow片段)具有改变的催化性质的聚合酶。在一些实施方案中,可在表1中提供的氨基酸的一个或多个上突变SEQ ID NO:15(对应于野生型Taq DNA聚合酶)以获得一个或多个相较于参照聚合酶(Taq DNA聚合酶)具有改变的催化性质的聚合酶。在一些实施方案中,掺入表1中鉴定的氨基酸突变的一个或多个可产生具有增强的催化性质的修饰聚合酶。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示改变的例如增加的或减少的阅读长度,或改变的平均无错误阅读长度,或改变的(例如,增加的或减小的)观察到的100Q17或200Q17值。在一些实施方案中,修饰聚合酶相对于参照聚合酶显示下列动力学参数的的任一个或多个的变化:平均阅读长度、最小阅读长度、在更高的离子强度的溶液中的增强的性能、改善的持续合成能力、聚合酶链式反应中的性能、乳液聚合酶链式反应中的性能、解离时间常数、解离速率、AQ20、100Q17值和200Q17值。
表1.
不希望受任何特定理论束缚,观察到每聚合酶的9个不同的氨基酸突变(表中的)在4种聚合酶间是可转移的(同源的)。因此,合理地建议一旦在聚合酶中鉴定了提供改变的催化性质的氨基酸突变,就可使用本领域技术人员已知的方法(例如氨基酸或核苷酸序列比对)来筛查氨基酸突变,以确定所述氨基酸突变是否可被转移至不同的聚合酶,例如不同的物种、种类或聚合酶家族。在一些实施方案中,可转移(或同源)的氨基酸突变可包括增强催化性质例如增加的阅读长度、增加的无错误阅读长度、增强的持续合成能力、增加的100Q17值、增加的200Q17值等的氨基酸突变。在一些实施方案中,可转移(或同源)的氨基酸突变可包括减弱催化性质例如减短的阅读长度、减短的无错误阅读长度、减小的持续合成能力、减小的100Q17值、减小的200Q17值等的氨基酸突变。在一些实施方案中,可转移(或同源)的氨基酸突变可包括将一个或多个氨基酸突变在DNA聚合酶家族例如DNA聚合酶家族A或DNA聚合酶家族B内或之间转移至另一种聚合酶。在一些实施方案中,可转移(或同源)的氨基酸突变可包括将一个或多个氨基酸突变在DNA聚合酶家族(例如跨细菌、病毒、古细菌、真核生物或噬菌体的DNA聚合酶)内或之间转移至一种或多种聚合酶。
在一些实施方案中,根据本公开内容的修饰聚合酶可包括具有与本文中公开的氨基酸突变的一个或多个类似或同源的一个或多个氨基酸突变(例如置换、插入或缺失)的任何聚合酶。例如,本公开内容包括包含与本文中针对Bst DNA聚合酶(例如,SEQ ID NO:2、3或4)提供的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶。在一些实施方案中,根据本公开内容的修饰聚合酶可包括具有一个或多个与本文中针对Taq DNA聚合酶提供的一个或多个氨基酸突变同源的氨基酸突变(例如,一个或多个对应于SEQ IDNO:15的一个或多个氨基酸突变的同源氨基酸突变)的任何聚合酶。在一些实施方案中,根据本公开内容的修饰聚合酶可包括具有一个或多个与本文中针对大肠杆菌DNA聚合酶I的Klenow片段提供的一个或多个氨基酸突变同源的氨基酸突变(例如,一个或多个对应于SEQID NO:18的一个或多个氨基酸突变的同源氨基酸突变)的任何聚合酶。
在一些实施方案中,本公开内容涉及修饰聚合酶,或具有与Bst DNA聚合酶的一个或多个氨基酸突变(例如,H46R;E446Q;和H572R,其中编号是相对于SEQ ID NO:1的氨基酸序列的)同源的一个或多个氨基酸突变的聚合酶的任意生物活性片段。在一些实施方案中,本公开内容涉及修饰聚合酶或具有与Bst DNA聚合酶的一个或多个氨基酸突变(H473R和H528A,其中编号是相对于SEQ ID NO:1的氨基酸序列的)同源的一个或多个氨基酸突变的聚合酶的任意生物活性片段。在一些实施方案中,本公开内容涉及修饰聚合酶,或包含与Bst DNA聚合酶的一个或多个氨基酸突变(H273R;H281A和Y477F,其中编号是相对于SEQ IDNO:1的氨基酸序列的)同源的一个或多个氨基酸突变的聚合酶的任意生物活性片段。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自:H46R、C93R、Q238C、H273R、H281A、H281M、E446Q、H473R、Y477F、H528A、H528R、H528K、C550Q和H572R的任意一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合物,包括选自:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、V533I、H572R、W577Y和D579F的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:1的氨基酸序列的。在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,包括选自:N31R、N31K、H46A、H46R、D77K、D77H、C93R、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、Q238C、V241K、V251K、D264Q、D264S、D264K、Y272R、H273A、H273R、L280R、H281A、H281R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473A、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528R、V533I、C550Q、H572A、H572R、W577Y和D579F的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:1的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶可包括具有与针对Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H46A、H46R、C93R、Q238C、H273A、H273R、H281A、H281R、H281M、E446Q、H473A、H473R、Y477F、H528A、H528R、H528K、C550Q、H572A和H572R的任一个或多个氨基酸突变,以及选自N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、L280R、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、E325R、I331Q、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、F448K、N457T、A462T、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、V533I、W577Y和D579F的一个或多个氨基酸置换,其中编号是相对于SEQ ID NO:1的氨基酸序列的。任选地,具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶还可包括至少一个与Bst DNA聚合酶中的氨基酸置换同源的氨基酸置换,其选自:H46A、H46R、H273A、H273R、H281A、H281R、E446Q、H473A、H473R、Y477F、H528A、H528R、H572A和H572R,其中编号是相对于SEQ ID NO:1的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H46A、H46R、H273A、H273R、H281A、H281R、E446Q、H473A、H473R、Y477F、H528A、H528R、H572A和H572R的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:1的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H46R、E446Q、H572R和D775R的任一个或多个氨基酸突变,其中编号是相对于SEQ IDNO:1的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有至少一个与Bst DNA聚合酶的氨基酸突变D775R同源的氨基酸突变的任何聚合酶,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H341R、C388R、Q533C、H568R、H576A、E741Q、H768R、Y772F、H823A、C845Q和H867R的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、Y567R、L575R、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y和D874F的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:N326R、N326K、H341R、D372K、D372H、C388R、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、Q533C、D559Q、D559S、Y567R、H568R、L575R、H576A、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A,V828I、C845Q、H867R、W872Y和D874F的任一个或多个氨基酸突变,其中编号是相对于SEQ IDNO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H341A、H341R、C388R、Q533C、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、C845Q、H867A和H867R的任一个或多个氨基酸突变,以及选自:326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y和D874F的一个或多个氨基酸置换,其中编号是相对于SEQ IDNO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H341A、H341R、C388R、Q533C、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、C845Q、H867A和H867R的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:H341A、H341R、H568A、H568R、H576A、H576R、E741Q、H768A、H768R、Y772F、H823A、H823R、H867A和H867R的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:N326R、N326K、D372K、D372H、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、D559Q、D559S、D559K、Y567R、L575R、E589S、E589F、E589G、E589K、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、F743K、N752T、A757T、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、V828I、W872Y和D874F的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:16的氨基酸序列的。任选地,具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的聚合酶的修饰聚合酶或任意生物活性片段,还可包括选自:H341A、H341R、H568A、H568R、H576A、H576R、H576M、E741Q、H768A、H768R、Y772F、H823A、H823R、H823K、H867A和H867R的至少一个氨基酸置换,其中编号是相对于SEQ ID NO:16的氨基酸序列的。在一些实施方案中,具有与Bst DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶或聚合酶的任意生物活性片段,包括选自这两个组的每一个组的氨基酸置换的任意2、3、4、5或更多个氨基酸置换。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括具有与Taq DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:15的氨基酸序列的。在一些实施方案中,具有与Taq DNA聚合酶的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶或聚合酶的任意生物活性片段包括任意2、3、4、5或更多个氨基酸置换。
在一些实施方案中,根据本公开内容的修饰聚合酶或聚合酶的任意生物活性片段可包括任何具有与DNA聚合酶I的Klenow片段的一个或多个氨基酸突变同源的一个或多个氨基酸突变的任何聚合酶,所述氨基酸突变包括选自:E245K、S259K、T266K、E290K、A448K、D505R、A512W和E518Q的任一个或多个氨基酸突变,其中编号是相对于SEQ ID NO:18的氨基酸序列的。在一些实施方案中,具有与DNA聚合酶I的Klenow片段的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶或聚合酶的任意生物活性片段包括任意2、3、4、5或更多个氨基酸置换。
在一些实施方案中,具有与本文中公开的Bst DNA聚合酶、Taq DNA聚合酶或大肠杆菌的DNA聚合酶I的Klenow片段的氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶或聚合酶的任意生物活性片段,可任选地包括至少一个被设计来利用半胱氨酸残基替代非半胱氨酸氨基酸残基的氨基酸置换。例如,Bst DNA聚合酶(例如,SEQ ID NO:16)可任选地包括选自:C388R、Q533C和C845Q的一个或多个氨基酸置换,所述氨基酸置换可任选地包括在具有一个或多个同源氨基酸置换的任何修饰聚合酶中。
在一些实施方案中,具有与Bst DNA聚合酶、Taq DNA聚合酶或大肠杆菌DNA聚合酶I的Klenow片段的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶或聚合酶的任意生物活性片段,还可包括位置1上的甲硫氨酸残基的缺失,或利用任意其它氨基酸残基在位置1上进行的置换,其中编号是相对于SEQ ID NO:1、20、21和23的氨基酸序列的。
在一些实施方案中,具有与Bst DNA聚合酶、Taq DNA聚合酶或DNA聚合酶I的Klenow片段的一个或多个氨基酸突变同源的一个或多个氨基酸突变的修饰聚合酶或聚合酶的任意生物活性片段,相对于参照聚合酶可显示选自:缓冲能力、解离时间常数、解离速率、100Q17值和200Q17值的任一个或多个参数的变化。任选地,所述变化可通过比较参照与修饰聚合酶在基于离子的测序反应中的性能来观察。任选地,参照聚合酶、修饰聚合酶或参照与修饰聚合酶两者还可包括一个或多个减小或消除外切核酸酶活性的氨基酸突变。
在一些实施方案中,本公开内容总地来说涉及编码包含本文中公开的特定氨基酸序列的任一个的蛋白质的核苷酸序列。例如,在一些实施方案中,本公开内容总地来说涉及编码具有或包含SEQ ID NO:1、2、3、4、20、21、23、25的氨基酸序列的蛋白质或本文中公开的特定聚合酶的任何其它特定聚合酶(包括任何修饰和参照聚合酶)的核苷酸序列。在一些实施方案中,本公开内容总地来说涉及编码与SEQ ID NO:1、2、3、4、20、21、23或25的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列的任何核苷酸序列。本领域技术人员将能够容易地基于核苷酸序列与对应的蛋白质序列之间的已知对应性测定编码本公开内容的任何氨基酸序列的核苷酸序列。
在一些实施方案中,本公开内容涉及编码作为具有或包含SEQ ID NO:2的氨基酸序列的Bst DNA聚合酶的分离的变体的修饰聚合酶的核酸序列,其中变体包含与SEQ IDNO:2具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同一性的氨基酸序列。
例如,本公开内容总地来说涉及具有或包含SEQ ID NO:17的核酸序列的核酸序列:
(SEQ ID NO:17)
SEQ ID NO:17包括编码具有SEQ ID NO:2的氨基酸序列并且还包括突变D775R的示例性修饰聚合酶的核酸序列。本领域技术人员非常了解如何修饰SEQ ID NO:17的核酸序列来产生编码本文中公开的任何其它示例性参照或修饰聚合酶的核酸序列。
在一些实施方案中,本公开内容涉及与SEQ ID NO:17的核酸序列具有至少50%、60%、70%、80%、90%、95%或99%的同一性的核酸序列。在一些实施方案中,核酸序列编码具有SEQ ID NO:1、2、3、4、21或25的氨基酸序列的聚合酶。在一些实施方案中,核酸序列编码具有SEQ ID NO:2的氨基酸序列并且还包括选自如下突变的任一个或多个突变的聚合酶:N31R、N31K、H46R、D77K、D77H、C93R、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、Q238C、V241K、V251K、D264Q、D264S、Y272R、H273R、L280R、H281A、H281M、E294S、E294F、E294G、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、H528K、V533I、C550Q、H572R、W577Y和D579F,其中编号是相对于SEQ ID NO:2的氨基酸序列的。
在一些实施方案中,核酸序列编码具有SEQ ID NO:16的氨基酸序列并且还包括选自如下突变的任一个或多个突变的聚合酶:N326R、N326K、H341R、D372K、D372H、C388R、D408N、D409R、D425A、D425H、D439M、D439K、L507A、E515K、N529R、N529K、V536K、V546K、Q533C、D559Q、D559S、Y567R、H568R、L575R、H576A、H576M、E589S、E589F、E589G、V594K、V594H、V594F、D598R、I626Q、L630T、E631P、I649W、I649F、I665A、Q704R、G711K、V713M、V713I、G715K、D718S、D718K、D718N、D718R、D718T、D718G、D718I、D718K、G720R、Q723W、N724R、N724K、E741Q、F743K、N752T、A757T、H768R、Y772F、D775R、D775F、D775H、D775A、D775S、D775N、D775Q、N780W、N780Y、N782H、N782W、N782F、N782I、E782Q、V783R、E788Q、M790Q、H823A、H823K、V828I、C845Q、H867R、W872Y和D874F,其中编号是相对于SEQ ID NO:16的氨基酸序列的。
在一些实施方案中,核酸序列编码具有SEQ ID NO:15的氨基酸序列并且还包括选自如下突变的任一个或多个突变的聚合酶:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q,其中编号是相对于SEQ ID NO:15的氨基酸序列的。
在一些实施方案中,核酸序列编码具有SEQ ID NO:18的氨基酸序列并且还包括选自如下突变的任一个或多个突变的聚合酶:E245K、S259R、T266K、E290K、A448K、D505R、A512W、R513R和E518Q,其中编号是相对于SEQ ID NO:18的氨基酸序列的。
在一些实施方案中,可使用密码子偏爱性的原理来设计核苷酸序列以提高蛋白质在给定的宿主生物中的表达水平。
在一些实施方案中,为了减慢模板从聚合酶解离的速率(和增强其持续合成能力),修饰聚合酶或聚合酶的任意生物活性片段可包括一个或多个引起修饰以更慢地从核酸模板解离的氨基酸突变。这样的突变可具有增加修饰聚合酶(相对于其未修饰对应物)的阅读长度(或无错误阅读长度)的额外作用。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段可包括一个或多个引入的半胱氨酸。这样的引入的半胱氨酸可用作用于将聚合酶附着至另一个部分、底物或表面的位点。在一些实施方案中,将半胱氨酸引入至至少一个选自Q238和Q248的位置,其中编号是相对于SEQ ID NO:2的氨基酸序列的。例如,聚合酶可包括下列氨基酸置换的一个或两个:Q238C和Q248C。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段具有或包括SEQ IDNO:2的氨基酸序列并且还包括利用不包含硫氢基侧链的其它氨基酸残基对半胱氨酸残基C93和C550的替代。例如,聚合酶可包括下列氨基酸置换的一个或两个:C93R和C550Q。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段具有(或包含)SEQID NO:2的氨基酸序列,并且还包括氨基酸置换C93R、C550Q和Q238C,其中编号是相对于SEQID NO:2的氨基酸序列的。在一些实施方案中,直接或通过连接部分将引入的半胱氨酸残基(Q238C)连接至桥连部分。桥连部分可包括抗生物素蛋白。连接部分(当存在时)可包括生物素。在一些实施方案中,可生物素化在位置238上的引入的半胱氨酸残基。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段具有(或包含)SEQID NO:2的氨基酸序列,并且还包括氨基酸置换C93R、C550Q和Q248C,其中编号是相对于SEQID NO:2的氨基酸序列的。在一些实施方案中,直接或通过连接部分将引入的半胱氨酸残基(Q248C)连接至桥连部分。桥连部分可包括抗生物素蛋白。连接部分(当存在时)可包括生物素。在一些实施方案中,可生物素化在位置248上的引入的半胱氨酸残基。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段具有或包括SEQ IDNO:2的氨基酸序列,并且还包括突变C93R和C550Q,以及半胱氨酸替代置换Q238C。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段具有或包括SEQ IDNO:2的氨基酸序列,并且还包括突变C93R和C550Q,以及半胱氨酸替代置换Q248C。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段可包括一个或多个生物素部分。如本文中所用,术语“生物素”和“生物素部分”及其变型包括生物素(顺-六氢-2-氧-1H-噻吩并[3,4]咪唑-4-戊酸)及其任意衍生物和类似物,包括生物素样化合物。这样的化合物包括例如生物素-e-N-赖氨酸、酰肼生物素、2-亚胺基生物素的氨基或硫氢基衍生物和生物素基-ε-氨基己酸-N-羟基琥珀酰亚胺酯、磺基琥珀酰亚胺亚胺基生物素、生物素溴乙酰基酰肼、对叠氮苯甲酰基生物素、3-(N-马来酰亚胺基丙酰基)生物素等,以及可特异性结合抗生物素蛋白部分的任何生物素变体。如本文中所用,术语“抗生物素蛋白”和“抗生物素蛋白部分”及其变型包括天然卵白糖蛋白抗生物素蛋白,以及抗生物素蛋白的任意衍生物、类似物和其它非天然形式,其可特异性结合生物素部分。在一些实施方案中,抗生物素蛋白部分可包括由选择的链霉菌属(Streptomyces)的菌株例如亲和素链霉菌(Streptomyces avidinii)产生的抗生物素蛋白,细菌链霉抗生物素蛋白的脱糖基化形式,截短的链霉抗生物素蛋白和重组抗生物素蛋白和链霉抗生物素蛋白以及天然的脱糖基化重组抗生物素蛋白和天然重组截短的链霉抗生物素蛋白的衍生物例如N-酰基抗生物素蛋白例如N-乙酰基、N-邻苯二甲酰基和N-琥珀酰基抗生物素蛋白,和商业产品 和Neutralite 抗生物素蛋白-类型分子的所有形式,包括天然和重组抗生物素蛋白及链霉抗生物素蛋白以及衍生的分子,例如非糖基化抗生物素蛋白、N-酰基抗生物素蛋白和截短的链霉抗生物素蛋白包括在术语“抗生物素蛋白”和“抗生物素蛋白部分”之内。通常地,但不一定地,抗生物素蛋白以四聚体蛋白形式存在,其中4个四聚体的每一个能够结合至少一个生物素部分。如本文中所用,术语“生物素-抗生物素蛋白键”及其变体是指在生物素部分与抗生物素蛋白部分之间形成的特殊连接。通常地,生物素部分可以以高亲和力(以通常在10-14至10-15mol/L的数量级的解离常数Kd)结合抗生物素蛋白部分。通常地,这样的结合通过非共价相互作用发生。
在一些实施方案中,修饰聚合酶或聚合酶的任意生物活性片段相对于未修饰参照聚合酶可包括一个或多个修饰或置换的氨基酸,并且还可包括连接至一个或多个修饰或置换的氨基酸中的至少一个的生物素部分。可使用任何适当的连接法将生物素部分连接至修饰聚合酶。在一些实施方案中,修饰聚合酶包括一个或多个半胱氨酸替代置换,并且连接部分包括连接至一个或多个半胱氨酸替代置换中的至少一个的生物素部分。
在一些实施方案中,修饰聚合酶是生物素化聚合酶。如本文中所用,术语“生物素化的”及其变型是指生物素与其它部分例如生物分子例如蛋白质、核酸(包括DNA,RNA,DNA/RNA嵌合分子、核酸类似物和肽核酸)、蛋白质(包括酶、肽和抗体)、碳水化合物、脂质等的任意共价或非共价加合物。
在一些实施方案中,本公开内容总地来说还涉及包含修饰聚合酶的组合物(以及相关方法、试剂盒和装置),所述修饰聚合酶相对于参照聚合酶包括至少一个氨基酸修饰,其中修饰聚合酶相对于参照聚合酶具有更慢的与核酸模板解离的速率。在一些实施方案中,可改变解离速率以便解离速率例如在中性渗透剂例如甜菜碱、三甲胺、N-氧化物、海藻糖、蔗糖、乙二醇等存在的情况下增加结合亲和力。
如本文中所用,术语“解离速率(dissociation rate)”或“解离速率(off-rate)”是指给定的聚合酶从给定的模板核酸解离的速率。解离速率(off-rate)可随反应条件包括温度、盐浓度、聚合酶与模板的相对浓度等变化而变化。在一些实施方案中,解离速率可通过测量在给定的反应条件下结合至模板核酸的聚合酶的总量的下降来估计。这样的测定可任选地使用其中在聚合酶与模板解离后聚合酶对模板的重新结合被阻止的条件来进行。例如,在测量聚合酶从核酸模板解离的“解离速率”的典型解离结合实验中,最初使聚合酶和核酸模板结合,任选地至平衡状态。任选地,聚合酶可使用任何适当的标记物(例如,放射性或荧光标记物)来标记。此时,可任选地阻断聚合酶对模板的进一步结合以简化从模板的解离速率的测量。这样的阻断可使用任何适当的方法来进行。例如,在其中将模板固定至表面和聚合酶被标记的实施方案中,可通过(1)除去包含标记聚合酶的缓冲液并用不包含标记聚合酶的缓冲液替代,或(2)将极高浓度的未标记聚合酶添加至反应混合物;或(3)大稀释度地(例如,至少20或100倍)稀释反应混合物(特别是当标记聚合酶的初始浓度较低时)来实现阻断。在这样的阻断后,可在这样的阻断后不同时间测量结合至模板的聚合酶的总量以测定聚合酶从模板解离有多快。可将结合至模板的聚合酶的量(Y轴)针对时间(X轴)作图。在一些实施方案中,所得的曲线接近单指数式衰减曲线。图1描述了来自典型实验的解离速率曲线。
在一些实施方案中,结合实验的分析可基于源自质量作用定律的简单模型。该模型假定结合是可逆的并且允许计算koff(解离速率常数)。(在下列分析中,聚合酶和核酸模板被称为“配体”和“受体”):
在一些实施方案中,当聚合酶与模板核酸因扩散而碰撞,并且当碰撞具有正确的方向和足够的能量时,结合发生。结合速率为:
每单位时间结合事件的数目=[配体]·[受体]·kon
在结合发生后,配体与受体可保持结合在一起进行随机量的时间。解离的概率在每一瞬间是相同的。
解离速率为:
每单位时间的解离事件的数目=[配体·受体]·koff
当新配体受体复合物形成的速率等于配体受体复合物离解的速率时,达到平衡。平衡时:[配体]·[受体]·Kon=[配体·受体]·koff
该公式可被重排来定义平衡解离常数Kd。
如果[配体]在上述方程式中被设置为等于Kd,Kd项被消去,从而
[受体]/[配体·受体]=1,
这样,[受体]等于[配体·受体]。由于所有受体要么是游离的,要么是结合至配体的,因此这意味着一半的受体是游离的并且一半结合至配体。换句话说,当配体的浓度等于Kd时,一半的受体在平衡时将被占据。如果受体对于配体具有高亲和力,则Kd将较低,因为其将以低浓度的配体结合一半的受体。
在这样的模型中,Kd(平衡解离常数)与koff(解离速率常数)(在本文中也称为“解离时间常数”)是不同的。
在一个示例性测定中,如本文中的实施例中所描述的,给定的聚合酶的解离时间常数可通过在确定的条件下用包含荧光标记的标记寡核苷酸(在本文中称为“寡核苷酸221”)温育聚合酶来测量。当寡核苷酸未被聚合酶结合时,寡核苷酸上的荧光标记的荧光被淬灭;聚合酶对寡核苷酸的结合导致寡核苷酸标记的去淬灭和导致荧光的增强。通过将未标记竞争寡核苷酸添加至反应混合物来起始阻断;当聚合酶与荧光标记寡核苷酸221解离时,竞争寡核苷酸与寡核苷酸221杂交,从而阻止聚合酶的进一步结合。随时间监测荧光。在添加竞争寡核苷酸后不同的时间点上测量反应混合物的荧光。将观察到的荧光(以RFU或相对荧光单位表示)(Y轴)对时间(X轴)作图。为了比较两种或更多种不同的酶(例如,参照与修饰聚合酶)的解离速率,可将每一种酶用于平行和单独的反应中,在所述反应中,在不同的时间点测量每一种反应混合物的荧光,随后可使用任何适当的方法计算每一种酶的解离速率并进行比较。在本文中提供的实例中,按照下式计算解离速率:
Y=(Y0–平台)*exp(-K*X)+平台
其中:
Y0是当X(时间)为0时的Y值。以与Y相同的单位表示,
平台是在无限时间时的Y值,以与Y相同的单位表示。
K是速率常数,以X轴时间单位的倒数表示。如果X是分钟,则K以分钟的倒数表示。
Tau是时间常数,以与X轴相同的单位表示。其被计算为K的倒数。
半衰期是X轴以时间单位表示。其被计算为ln(2)/K。
跨度,即(Y0–平台),是Y0与平台之间的差,以与Y值相同的单位表示。
图2描述了如实施例中所述进行的示例性测定的结果,其中在不同盐浓度下测量不同示例性Bst突变体的解离时间常数,并且进行比较。
在一些实施方案中,本公开内容总地来说涉及用于将至少一个核苷酸掺入引物的方法,包括:在一个或多个核苷酸存在的情况下将核酸复合物(包括模板核酸)与引物和修饰聚合酶接触,随后使用所述修饰聚合酶以模板依赖性方式将一个或多个核苷酸的至少一个掺入引物。
用于核苷酸掺入的方法在本领域是公知的并且通常包括聚合酶反应混合物的使用,其中在核苷酸掺入条件下将聚合酶与模板核酸接触。当核苷酸掺入反应包括将核苷酸聚合至引物的末端时,该过程通常称为“引物延伸”。通常地但不一定地,这样的核苷酸掺入以模板依赖性方式发生。通常通过在核苷酸掺入条件下,在水溶液中存在核苷酸的情况下,将模板核酸与聚合酶接触来进行引物延伸和其它核苷酸掺入测定。在一些实施方案中,核苷酸掺入反应可包括引物,其可任选地与模板杂交来形成引物-模板双链体。在将模板、聚合酶、核苷酸和任选地引物在适当的含水制剂中彼此混合从而形成核苷酸掺入反应混合物(或引物延伸混合物)后,获得常见的核苷酸掺入条件。含水制剂可任选地包含二价阳离子和/或盐,特别是Mg++和/或Ca++离子。含水制剂可任选地包含二价阴离子和/或盐,特别是SO4 2-。常见核苷酸掺入条件已包括公知的参数,例如时间、温度、pH、试剂、缓冲剂、试剂、盐、辅因子、核苷酸、靶DNA、引物DNA、酶例如核酸依赖性聚合酶、反应中的组分的量和/或比率等。试剂或缓冲剂可包括单价离子来源例如KCl、醋酸钾、醋酸铵、谷氨酸钾,NH4Cl或硫酸铵。试剂或缓冲剂可包括二价离子来源例如Mg2+和/或Mn2+的来源MgCl2或醋酸镁。在一些实施方案中,试剂或缓冲剂可包括去垢剂来源例如Triton和/或Tween。大多数聚合酶在约5.0至约9.5、更常见地约pH 7至约pH 9,有时约pH 6至约pH 8以及有时7至8的pH范围内显示一定水平的核苷酸掺入活性。缓冲剂可包括螯合剂例如EDTA和EGTA等。虽然在一些实施方案中,核苷酸掺入反应可包括缓冲剂例如Tris,Tricine,HEPES,MOPS,ACES或MES,所述缓冲剂可提供约5.0至约9.5的pH范围,但当进行需要检测离子副产品的基于离子的反应时,这样的缓冲剂可任选地被减少或消除。进行核酸合成的方法在本领域是公知的并且被广泛地实践,教导众多核酸合成技术的参考资料是可容易获得的。关于核酸合成(包括,例如,模板依赖性核苷酸掺入以及引物延伸法)的性能的一些示例性教导可见于例如Kim等人,Nature376:612-616(2002);Ichida等人,Nucleic Acids Res.33:5214-5222(2005);Pandey等人,European Journal of Biochemistry,214:59-65(1993);Blanco等人,J.Biol.Chem.268:16763-16770(1993);美国专利申请系列号12/002781(现公开为美国专利公布号2009/0026082);美国专利申请系列号12/474897(现公开为美国专利公布号2010/0137143);和美国专利申请系列号12/492844(现公开为美国专利公布号2010/0282617);和美国专利申请系列号12/748359(现公开为美国专利公布号20110014612)中。鉴于本领域内引物延伸和其它核苷酸掺入反应的丰富教导,使用本公开内容的修饰聚合酶进行核苷酸掺入的适当反应条件对于本领域技术人员来说将是很显然的。
在一些实施方案中,本公开内容总地来说涉及用于使用聚合酶,包括本文中描述的任何示例性聚合酶进行核苷酸聚合反应的试剂(例如,缓冲组合物)和试剂盒。核苷酸聚合反应可包括但不限于核苷酸掺入反应(包括模板依赖性和模板非依赖性的核苷酸掺入反应)以及引物延伸反应)。在一些实施方案中,缓冲组合物可包含下列试剂的任一种或多种:单价金属盐、二价金属盐、二价阴离子和去垢剂。例如,缓冲组合物可包括钾盐或钠盐。在一些实施方案中,缓冲组合物可包含锰盐或镁盐。在一些实施方案中,缓冲组合物可包含硫酸盐例如硫酸钾和/或硫酸镁。在一些实施方案中,缓冲组合物可包括选自:Triton和Tween的去垢剂。
在一些实施方案中,缓冲组合物可包含至少一种钾盐、至少一种锰盐和Triton X-100(Pierce Biochemicals)。盐可任选地是盐酸盐或硫酸盐。
在一些实施方案中,缓冲组合物可包含至少一种钾盐、至少一种镁盐和Triton X-100(Pierce Biochemicals)。盐可任选地是盐酸盐或硫酸盐。
在一些实施方案中,缓冲组合物具有约7.3至约8.0,通常地约7.4至约7.9的pH。
在一些实施方案中,缓冲组合物包含浓度为5-250mM,通常地12-200mM,甚至更常见地25-125mM(取决于二价)的钾盐。
在一些实施方案中,缓冲组合物包含浓度为1mM至20mM,特别地6-15mM的锰盐。
在一些实施方案中,缓冲组合物包含浓度为1mM至100mM,特别地5-50mM的硫酸盐。
在一些实施方案中,缓冲组合物包含浓度为0.005%至1%、通常地0.01-0.1%的去垢剂(例如,Triton X-100或Tween-20)。
在一些实施方案中,公开的修饰聚合酶组合物(以及相关方法、系统、装置和试剂盒)可用于从核酸分子获得序列信息。从核酸分子获得序列信息的许多方法在本领域是已知的,并且很容易理解,所有这样的方法在本公开内容的范围内。使用本文公开的修饰聚合酶的适当测序方法包括但不限于:Sanger测序、基于连接的测序(也称为杂交测序)和边合成边测序。边合成边测序法通常涉及基于模板核酸序列的模板依赖性核酸合成(例如,使用与模板核酸或自身引导模板杂交的引物,如本领域技术人员将理解的)。即,新合成的核酸链的序列通常与模板核酸的序列互补,从而核苷酸至合成链的掺入的顺序和身份的知识可提供关于模板核酸链的序列的信息。当利用修饰聚合酶以模板依赖性方式聚合核苷酸时,使用本公开内容的修饰聚合酶的边合成边测序通常涉及检测核苷酸掺入的顺序和身份。使用标记核苷酸的边合成边测序的一些示例性方法包括单分子测序(参见,例如,美国专利号7,329,492和U.S.7,033,764),其通常涉及使用标记核苷酸来检测核苷酸掺入。在一些实施方案中,公开的聚合酶组合物(和相关方法、试剂盒、系统和装置)可用于获得序列信息以进行全基因组测序、扩增子测序、靶向重测序、单分子测序、多重或或条码测序和双端测序应用。
在一些实施方案中,公开的修饰聚合酶组合物以及相关方法、系统、装置和试剂盒可用于扩增核酸分子。在一些实施方案中,核酸分子可使用修饰聚合酶例如通过焦磷酸测序、聚合酶链式反应、乳液聚合酶链式反应或桥式聚合酶链式反应来扩增。
在一些实施方案中,公开的修饰聚合酶组合物(以及相关方法、系统、装置和试剂盒)可用于产生核酸文库。在一些实施方案中,公开的修饰聚合酶组合物可用于产生用于多种下游过程的核酸文库。用于产生核酸文库的许多方法在本领域是已知的,可容易理解,所有这样的方法在本公开内容的范围内。适当的方法包括但不限于,使用乳液PCR、桥式PCR、PCR、qPCR、RT-PCR和依赖于聚合的核酸扩增的其它形式产生的核酸文库。在一些实施方案中,方法可包括模板依赖性核酸扩增。在一些实施方案中,方法可包括修饰聚合酶可对其进行核苷酸掺入的引物:模板双链体或核酸模板。在一些实施方案中,核酸可包括具有二级结构例如发夹或茎环的单链核酸,其可提供修饰聚合酶可在聚合过程中将核苷酸掺入其的单链悬突。在一些实施方案中,用于使用根据本公开内容的一种或多种修饰聚合酶产生核酸文库的方法可包括产生长度为50,100,200,300,400,500,600或更多个碱基对的核酸文库。在一些实施方案中,可将修饰聚合酶可对其进行核苷酸掺入的核酸模板附着、连接或结合至支持物例如固体支持物。在一些实施方案中,支持物可包括平面支持物例如载玻片。在一些实施方案中,支持物可包括颗粒例如Ion SphereTM颗粒。
在一些实施方案中,本公开内容总地来说涉及用于产生核酸文库的方法,包括在聚合条件下将核酸模板与修饰聚合酶和一种或多种dNTP接触;从而将一个或多个dNTP掺入核酸模板来产生核酸文库。在一些实施方案中,方法还可包括在高离子强度溶液存在的情况下产生核酸文库或对核酸文库进行测序。在一些实施方案中,本公开内容总地来说涉及在高离子强度溶液存在的情况下保持聚合酶活性的修饰聚合酶。在一些实施方案中,高离子强度溶液可以为约50、75、100、150、200、250、300、400、500、750mM或更高浓度的盐。在一些实施方案中,高离子强度溶液可以为约175mM至约300mM的盐。在一些实施方案中,高离子强度溶液可以为约200mM至约275mM的盐。在一些实施方案中,高离子强度溶液可以为约225mM至约250mM的盐。在一些实施方案中,盐可包括钾盐和/或钠盐。在一些实施方案中,离子强度溶液还可包含硫酸盐。在一些实施方案中,相较于不存在一个或多个相同突变(或同源突变)的参照聚合酶,修饰聚合酶能够在相同条件下在高离子强度溶液存在的情况下扩增(和/或测序)核酸分子至更大的容量(例如通过准确度测量的)。在一些实施方案中,修饰聚合酶相较于不存在一个或多个突变(或同源突变)的参照聚合酶在标准离子强度条件(即,低于更高的离子强度溶液,例如20mM的盐)下,能够在存在高例子强度溶液存在的情况下扩增(和/或测序)核酸分子至更大的容量(例如如通过准确度测量的)。
任选地,方法还包括在聚合条件下重复一个或多个dNTP的添加以将多个dNTP掺入核酸模板来产生核酸文库。
在一些实施方案中,方法还包括在聚合过程中检测核苷酸掺入副产品。在一些实施方案中,核苷酸掺入副产品可包括氢离子。
在一些实施方案中,方法还包括测定核酸文库中掺入的dNTP的身份。在一些实施方案中,方法还包括测定核酸文库中掺入的核苷酸的数目。在一些实施方案中,检测还包括对核酸文库进行测序。
在一些实施方案中,本公开的修饰聚合酶组合物(以及相关方法、系统、装置和试剂盒)可用于通过核苷酸掺入事件过程中副产品形成的产生来检测核苷酸掺入。检测核苷酸掺入副产品的许多方法在本领域中是已知的,可容易地理解,所有这样的方法在本公开内容的范围内。核苷酸副产品检测的适当方法包括但不限于氢离子、无机磷酸盐、无机焦磷酸盐等的检测。这些副产品检测法中的几种方法通常涉及模板依赖性核苷酸掺入。
在一些实施方案中,修饰聚合酶可用于进行无标记核酸测序,具体地基于离子的核酸测序。无标记核酸测序的概念,包括基于离子的核酸测序,包括通过引用并入的下列参考资料:Rothberg等人,美国专利公布号2009/0026082,2009/0127589,2010/0301398,2010/0300895,2010/0300559,2010/0197507和2010/0137143,通过引用将所述专利公布整体并入本文。简而言之,在这样的核酸测序应用中,核苷酸掺入可通过检测聚合酶-催化的核酸合成反应的天然副产品、包括氢离子、多磷酸盐、PPi和Pi(例如,在焦磷酸酶存在的情况下)的存在来测定。
在基于离子的核酸测序的常见实施方案中,核苷酸掺入可通过检测由聚合酶-催化的核酸合成反应包括例如引物延伸反应产生的氢离子的存在和/或浓度来检测。在一个实施方案中,将有效地连接至引物和聚合酶并且位于反应室(例如Rothberg等人(上文中引用的)中公开的微孔)中的模板经历重复循环的聚合酶-催化的核苷酸至引物的添加(“添加步骤”),随后进行洗涤(“洗涤步骤”)。在一些实施方案中,可将这样的模板作为克隆群体连接至固体支持物,例如微粒、珠粒等,将所述克隆群体加载至反应室中。如本文中所用,“有效结合的”意指引物与模板退火以便引物可通过聚合酶延伸,以及聚合酶结合至这样的引物-模板双链体或靠近其,以便每当提供核苷酸时引物延伸就可发生。
在循环的每一个添加步骤中,聚合酶通过以模板依赖性方式掺入添加的核苷酸来延伸引物,以便仅当模板中的下一个碱基与添加的核苷酸互补时核苷酸才被掺入。如果存在一个互补碱基,则存在一个掺入,如果存在2个,则存在2个掺入,如果存在3个,则存在3个掺入,依此类推。对于每一个这样的掺入,存在释放的氢离子,总体地一群模板释放氢离子改变了反应室的局部pH。在一些实施方案中,氢离子的产量与模板中连续互补碱基的数目(以及参与延伸反应的模板分子与引物和聚合酶的总数)成比例(例如,单调相关)。因此,当模板中存在许多连续相同的互补碱基(即,同聚物区域)时,产生的氢离子的数目、从而局部pH变化的幅度与连续相同的互补碱基的数目成比例。如果模板中的下一个碱基不与添加的核苷酸互补,则掺入不发生,从而无氢离子释放。在一些实施方案中,在每一个添加核苷酸的步骤后,进行洗涤步骤,其中将具有预定pH的未缓冲的洗涤溶液用于除去先前步骤的核苷酸以在以后的循环中阻止错误掺入。在一些实施方案中,在每一个添加核苷酸的步骤后,进行另外的步骤,其中用核苷酸破坏剂例如腺苷三磷酸双磷酸酶处理反应室,以消除保留在室内任何残留核苷酸,从而在随后循环中使假延伸的概率降至最低。在一些实施方案中,可包括处理,作为洗涤步骤本身的部分。
在一个示例性实施方案中,将不同种类(或“类型”)的核苷酸相继添加至反应室,以便每一个反应一次一种地暴露于不同的核苷酸类型。例如,可按下列顺序添加核苷酸类型:dATP、dCTP、dGTP、dTTP、dATP、dCTP、dGTP、dTTP等;每一次暴露之后进行洗涤步骤。取决于期望的序列信息的长度,可重复循环50次、100次、200次、300次、400次、500次、750次或更多次。在一些实施方案中,将每一种核苷酸相继地施用至反应室所花的时间(即流动循环(flow cycle))取决于期望的测序信息可变化。例如,当测序长核酸分子时在一些情况下可减少流动循环以减少完整核酸分子测序所需的总体时间。在一些实施方案中,可增加流动循环,例如当对短核酸或扩增子测序时。在一些实施方案中,流动循环可以为约0.5秒至约3秒,更常见地约1秒至约1.5秒。
在一个示例性实施方案中,本公开内容总地来说涉及用于从核酸模板获得序列信息的方法,包括:
(a)提供包含杂交至测序引物和结合至修饰聚合酶的模板核酸的反应混合物,其中修饰聚合酶包括通过聚合酶内一个或多个连接位点连接至桥连部分的聚合酶;
(b)将模板核酸与核苷酸接触,其中接触包括将核苷酸掺入测序引物并且产生测序副产品,如果核苷酸与模板核酸中的对应核苷酸互补的话;和
(c)检测测序副产品在反应混合物中的存在,从而确定核苷酸掺入是否已发生。
在一些实施方案中,方法还可包括重复接触和检测步骤至少一次。
在一些实施方案中,修饰聚合酶的聚合酶包括单个连接位点,并且桥连部分通过单个连接位点直接地或通过连接部分连接至聚合酶。在一些实施方案中,可将单个连接位点连接至生物素部分,桥连部分可包括抗生物素蛋白部分。在一些实施方案中,修饰聚合酶相对于聚合酶的未修饰形式在相似或相同的反应条件下显示增加的阅读长度和/或增强的持续合成能力。
在一些实施方案中,检测测序副产品的存在包括将反应混合物与能够感知测序副产品的存在的传感器接触。传感器可包括场效应晶体管例如chemFET或ISFET。
在一些实施方案中,测序副产品包括氢离子、染料连接的部分、聚磷酸盐、焦磷酸盐或磷酸盐部分,检测测序副产品的存在包括使用ISFET检测测序副产品。在一些实施方案中,检测测序副产品包括使用ISFET检测氢离子。
在其它实施方案中,本公开内容总地来说涉及检测核苷酸掺入的方法,包括:
(a)使用修饰聚合酶进行核苷酸掺入,产生一个或多个核苷酸掺入的副产品;和
(b)检测核苷酸掺入的一种或多种副产品的至少一种的存在,从而检测核苷酸掺入。
在一些实施方案中,修饰聚合酶包括连接至桥连部分的聚合酶。桥连部分任选地通过修饰聚合酶内的一个或多个连接位点连接至聚合酶。在一些实施方案中,桥连部分通过连接部分连接至聚合酶。连接部分可连接至聚合酶的一个或多个连接位点的至少一个。在一些实施方案中,修饰聚合酶的聚合酶包括单个连接位点,桥连部分通过单个连接位点直接地或通过连接部分连接至聚合酶。在一些实施方案中,可将单个连接位点连接至生物素部分,桥连部分可包括抗生物素蛋白部分。在一些实施方案中,桥连部分通过至少一个生物素-抗生物素蛋白键连接至聚合酶。在一些实施方案中,修饰聚合酶相对于参照聚合酶在相似或相同的反应条件下显示增加的阅读长度和/或增强的持续合成能力。
在一些实施方案中,方法还可包括重复进行和检测步骤至少一次。
在一些实施方案中,检测核苷酸掺入的至少一种副产品的存在包括使用能够感知副产品的存在的传感器。传感器可包括场效应晶体管,例如chemFET或ISFET。
在一些实施方案中,核苷酸掺入的至少一种副产品包括氢离子、染料连接的部分、多磷酸盐、焦磷酸盐或磷酸盐部分,检测至少一种副产品的存在包括使用ISFET检测至少一种副产品。在一些实施方案中,至少一种副产品包括氢键,检测测序副产品的存在包括使用ISFET检测氢离子。
在一些实施方案中,本公开内容总地来说涉及在核苷酸聚合反应过程中检测离子浓度的变化的方法,包括:
(a)使用包括连接至桥连部分的聚合酶的修饰聚合酶进行核苷酸聚合反应,其中至少一种类型的离子的浓度在核苷酸聚合反应过程中改变;和
(b)检测表明至少一种类型的离子的浓度的变化的信号。
在一些实施方案中,桥连部分通过修饰聚合酶内的一个或多个连接位点连接至聚合酶。在一些实施方案中,桥连部分通过连接部分连接至聚合酶。连接部分可连接至聚合酶的一个或多个连接位点中的至少一个。在一些实施方案中,修饰聚合酶的聚合酶包括单个连接位点,桥连部分通过单个连接位点直接地或通过连接部分连接至聚合酶。在一些实施方案中,单个连接位点可连接至生物素部分,桥连部分可包括抗生物素蛋白部分。在一些实施方案中,桥连部分通过至少一个生物素-抗生物素蛋白键连接至聚合酶。在一些实施方案中,修饰聚合酶相对于聚合酶的参照形式在相似或相同的反应条件下显示增加的阅读长度和/或增强的持续合成能力。
在一些实施方案中,方法还可包括重复进行和检测步骤至少一次。
在一些实施方案中,检测至少一种类型的离子的浓度的变化包括使用能够感知副产品的存在的传感器。传感器可包括场效应晶体管,例如chemFET或ISFET。
在一些实施方案中,至少一种类型的离子包括氢离子、染料连接的部分、多磷酸盐、焦磷酸盐或磷酸盐部分,检测至少一种类型的离子的浓度的变化包括使用ISFET检测至少一种类型的离子。在一些实施方案中,至少一种类型的离子包括氢离子,检测至少一种类型的离子的存在包括使用ISFET检测氢离子。
下列非限定性实例仅通过示例性实施方案的举例说明方式来提供,并且绝不限定本公开内容的范围和精神。此外,应理解,本文中公开或声明的任何发明包括本文中描述的任一个或多个特性的所有变化、组合和排列。可从权利要求明确地排除任一个或多个特性,即使特定的排除未在本文中明确地显示出来。还应当理解,除非本领域技术人员另有理解,否则根据本文中公开的特定方法或本领域中已知的其它方法,方法中使用的试剂的公开内容意欲与涉及该试剂的使用的该方法同义(和为其提供支持)。此外,在说明书和/或权利要求公开方法中,除非本领域技术人员另有理解,否则本文中公开的试剂的任一种或多种可用于所述方法。
实施例
实施例1:示例性修饰聚合酶的纯化
通过定点诱变将不同的示例性突变引入具有SEQ ID NO:2的氨基酸序列的示例性参照聚合酶中。将编码这些修饰聚合酶的重组表达构建体转化进入细菌。将包含表达构建体的菌落接种至BRM培养基中,生长至OD=0.600,通过将IPTG添加至1mM的终浓度来进行诱导。随后将细胞在37℃进一步生长3小时。
以6000rpm将诱导的细胞离心10分钟,弃去上清液,将细胞重悬浮于重悬浮缓冲液(10mM Tris,pH 7.5,100mM NaCl)中。以60(振幅)的设置对重悬浮的细胞超声处理1分钟,随后置于冰上1分钟。以该方式重复超声处理,进行总共5次。
将样品在65℃温育10分钟。以9000rpm离心样品30分钟。回收上清液,在肝素柱上进一步纯化。如下面实施例中所述,测定纯化的聚合酶以测量解离速率常数。
实施例2:测量示例性修饰和参照聚合酶的解离速率
测定按照实施例1制备的修饰聚合酶以及具有SEQ ID NO:2的氨基酸序列的参照聚合酶的样品,以测量解离速率常数。本测定的目的是测量聚合酶从具有下列核苷酸序列的荧光标记的DNA模板(oligo221)的解离速率:
TTTTTTTGCAGGTGACAGGTTTTTCCTGTCACCNGC(SEQ ID NO:21),其中N为荧光素-dT。
通过当Bst聚合酶从模板解离时发生的荧光的减少来测定解离。通过添加大大过量的具有下列核苷酸的未标记竞争DNA(发夹oligo173)来起始解离:
TTTTTTTCCCTTTCCTTTCGGGTGACAGGTTTTTCCTGTCACCC(SEQ ID NO:22)。
当聚合酶与oligo 221解离时,其被竞争剂结合,从而不能再结合原始221模板。
为了进行测定,在96孔板中装配包含30mM Tris(pH 7.5),20mM NaCl,50nM oligo221和~10-200nM部分聚合酶样品(按照实施例1制备的)的反应物(75μl)。随后使用490nm激发波长和525nm发射波长在分光光度计上进行基线读数。随后将173竞争oligo(2μM终浓度)快速添加至每一个孔中,将板快速放回至分光光度计以进行读数,每30秒读取一次,进行5分钟。按照下列公式使用通过将数据与单相指数式衰减方程拟合来计算离解速率:
Y=(Y0–平台)*exp(-K*X)+平台
其中:
Y0是当X(时间)为0时的Y值。其以与Y相同的单位表示,
平台是在无限时间时的Y值,以与Y相同的单位表示。
K是速率常数,以X轴时间单位的倒数表示。如果X是分钟,则K以分钟的倒数表示。
Tau是时间常数,以与X轴相同的单位表示。其被计算为K的倒数。
半衰期以X轴的时间单位表示。其被计算为ln(2)/K。
跨度,即(Y0–平台),是Y0与平台之间的差,以与Y值相同的单位表示。
其中在不同的盐浓度下测量各种修饰聚合酶以及具有SEQ ID NO:2的氨基酸序列的参照聚合酶的解离速率常数(也称为“解离时间常数”)的测定的代表性结果描述于图2中。测定中包括的聚合酶如下示于图2中:Bst 1=具有SEQ ID NO:2的氨基酸序列的参照聚合酶;480R=具有SEQ ID NO:2的氨基酸序列并且还包括突变D480R的修饰聚合酶;425R=具有SEQ ID NO:2的氨基酸序列并且还包括突变G425R的修饰聚合酶;144K=具有SEQ IDNO:2的氨基酸序列并且还包括突变D144K的修饰聚合酶;488K=具有SEQ ID NO:2的氨基酸序列并且还包括突变F448K的修饰聚合酶。如图2中所示,一些修饰聚合酶与SEQ ID NO:2的参照聚合酶相比较在给定的盐浓度显示显著更高的解离时间常数。
图3提供的表列出对于根据实施例1和2制备的各种修饰聚合酶观察到的相对于具有SEQ ID NO:2的氨基酸序列的参照聚合酶(在图3中称为“Bst 1”)观察到的模板亲和力的相对模板亲和力。每一种修饰聚合酶具有SEQ ID NO:2的氨基酸序列,加上表的第1列中所列的氨基酸置换。如图3中所示,一些修饰聚合酶相对于参照聚合酶Bst1显示显著增强的模板亲和力;在一些情况下,模板亲和力的增加为20倍、100倍或更大。
实施例3:比较修饰聚合酶与参照聚合酶在核酸测序中的性能
基本上如实施例1中所述,纯化修饰聚合酶,其包括具有SEQ ID NO:2的氨基酸序列并且还包括氨基酸置换D480R(其中编号是相对于SEQ ID NO:2的氨基酸序列的)的突变Bst聚合酶。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,PartNo.4462917)评价修饰聚合酶和具有SEQ ID NO:2的氨基酸序列的参照聚合酶(对照反应)在基于离子的测序反应中的性能。简而言之,如Ion Fragment Library试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(Ion Torrent Systems,Part No.4469004A)中提供的方案,使用IonTemplate Preparation试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4466461)、Ion Template Reagents试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4466462)和Ion Template Solutions试剂盒(Ion TorrentSystems/Life Technologies,Part No.4466463)中提供的试剂将DNA片段扩增在IonSphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 314测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/Life Technologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒的用户指南v2.0(Ion Torrent Systems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,PartNo.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4462923)中提供的试剂进行测序。Ion Torrent Systems是Life Technologies Corp.,Carlsbad,California)的子公司。
分析使用参照或修饰聚合酶获得的组的测序读数以测量50Q17读数、100Q17读数和200Q17读数的数目。通过使用与PGMTM测序系统一起提供的标准软件,测量和比较使用参照与修饰聚合酶在测序反应中获得的100Q17或200Q17读数的总数。包括突变D480R的示例性修饰聚合酶相对于参照聚合酶提供了显著增加的数目的50Q17读数、100Q17读数和200Q17读数(数据未显示)。
实施例4:比较修饰与参照聚合酶在核酸测序中的性能
基本上如实施例1中所述纯化修饰聚合酶,其包括具有SEQ ID NO:2的氨基酸序列并且还包括氨基酸置换D264K和E493Q(其中编号是相对于SEQ ID NO:2的氨基酸序列的)的突变Bst聚合酶。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,PartNo.4462917)评价修饰聚合酶和具有SEQ ID NO:2的氨基酸序列的参照聚合酶(对照反应)在基于离子的测序反应中的性能。简而言之,如Ion Fragment Library试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(Ion Torrent Systems,Part No.4469004A)中提供的方案,使用IonTemplate Preparation试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4466461)、Ion Template Reagents试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4466462)和Ion Template Solutions试剂盒(Ion TorrentSystems/Life Technologies,Part No.4466463)中提供的试剂将DNA片段扩增在IonSphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM314测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/Life Technologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,PartNo.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4462923)中提供的试剂进行测序。
分析使用参照和修饰聚合酶获得的组的测序读数以测量50Q17读数、100Q17读数和200Q17读数的数目。通过使用与PGMTM测序系统一起提供的标准软件,测量和比较使用参照与修饰聚合酶在测序反应中获得的100Q17或200Q17读数的总数。包括突变D264K和E493Q的示例性修饰聚合酶相对于参照聚合酶提供了显著增加的数目的50Q17读数、100Q17读数和200Q17读数(数据未显示)。
实施例5:比较修饰与参照聚合酶在核酸测序中的性能
基本上如实施例1中所述纯化修饰聚合酶,其包括具有SEQ ID NO:2的氨基酸序列并且还包括氨基酸置换E220K、N234R和D423K(其中编号是相对于SEQ ID NO:2的氨基酸序列的)的突变Bst聚合酶。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,Part No.4462917)评价修饰聚合酶和具有SEQ ID NO:2的氨基酸序列的参照聚合酶(对照反应)在基于离子的测序反应中的性能。简而言之,如Ion Fragment Library试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(Ion Torrent Systems,Part No.4469004A)中提供的方案,使用Ion Template Preparation试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4466461)、Ion Template Reagents试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4466462)和Ion Template Solutions试剂盒(Ion TorrentSystems/Life Technologies,Part No.4466463)中提供的试剂将DNA片段扩增在IonSphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 314测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/Life Technologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714 Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,PartNo.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4462923)中提供的试剂进行测序。
分析使用参照和修饰聚合酶获得的组的测序读数以测量50Q17读数、100Q17读数和200Q17读数的数目。通过使用与PGMTM测序系统一起提供的标准软件,测量和比较使用参照与修饰聚合酶在测序反应中获得的100Q17或200Q17读数的总数。包括突变E220K、N234R和D423K的示例性修饰聚合酶相对于参照聚合酶提供了显著增加的数目的50Q17读数、100Q17读数和200Q17读数(数据未显示)。
实施例6:比较示例性修饰与参照聚合酶在基于离子的核酸测序系统中的性能
基本上如实施例1中所述,纯化示例性修饰聚合酶,其包括具有SEQ ID NO:2的氨基酸序列并且还包括下列示例性氨基酸置换中的3个的突变Bst聚合酶:N31R、N31K、D77K、D77H、D113N、D114R、D130A、D130H、D144M、D144K、L212A、E220K、N234R、N234K、V241K、V251K、D264Q、D264S、D264K、Y272R、H273R、L280R、H281A、E294S、E294F、E294G、E294K、V299K、V299H、V299F、D303R、I331Q、E325R、L335T、E336P、I354W、I354F、I370A、Q409R、G416K、V418M、V418I、G420K、D423S、D423K、D423N、D423R、D423T、D423G、D423I、D423K、G425R、Q428W、N429R、N429K、E446Q、F448K、N457T、A462T、H473R、Y477F、D480R、D480F、D480H、D480A、D480S、D480N、D480Q、N485W、N485Y、N487H、N487W、N487F、N487I、V488R、E493Q、M495Q、H528A、V533I、H572R、W577Y和D579F,其中编号是相对于SEQ ID NO:2的氨基酸序列的。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,Part No.4462917)评价修饰聚合酶和具有SEQ ID NO:2的氨基酸序列的参照聚合酶(对照反应)在基于离子的测序反应中的性能。简而言之,如Ion Fragment Library试剂盒的用户指南(Ion TorrentSystems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照Ion XpressTMTemplate试剂盒的用户指南v2.0(Ion Torrent Systems,Part No.4469004A)中提供的方案,使用Ion TemplatePreparation试剂盒(Ion Torrent Systems/Life Technologies,Part No.4466461)、IonTemplate Reagents试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4466462)和Ion Template Solutions试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4466463)中提供的试剂将DNA片段扩增在Ion SphereTM颗粒(IonTorrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 314测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/LifeTechnologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,PartNo.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4462923)中提供的试剂进行测序。
分析使用参照和修饰聚合酶获得的组的测序读数以测量所得测序读数的原始读数准确度(如通过与Ion Torrent测序系统一起提供的Ion Torrent标准软件报告的)、50Q17读数、100Q17读数和200Q17读数的数目。通过使用与PGMTM测序系统一起提供的标准软件,测量和比较使用参照和修饰聚合酶在测序反应中获得的100Q17或200Q17读数的总数。
图4-7描述了使用包含SEQ ID NO:2的氨基酸序列并且还包括氨基酸置换:E220K、N234R和D423K的示例性修饰聚合酶(A5)获得的准确度相对于使用包含SEQ ID NO:2的氨基酸序列并且还包括不同组的氨基酸置换(LR2)的参照聚合酶(即示例性Bst聚合酶)获得的准确度的增加,其中编号是相对于SEQ ID NO:2的。如图4-7中显示的,包括提供的突变的示例性修饰聚合酶(A5)相对于参照聚合酶(LR2)显著增加了准确度(如通过错误率和原始读数准确度测量的)。在图4-7中被称为A5的修饰聚合酶的氨基酸序列在下文中提供为SEQ IDNO:19。
(SEQ ID NO:19)
编码修饰聚合酶(A5)(即,SEQ ID NO:19)的对应核酸序列在下文中提供为SEQ IDNO:23。对于本领域技术人员来说很显然的是,由本公开内容公开或提及的参照或修饰聚合酶的任一种或多种可被容易地转化(例如,反向翻译)成编码参照或修饰聚合酶的对应核酸序列。对于本领域技术人员来说还显然的是,每一个多肽的核酸序列因密码子的简并性质而可变。例如,存在6个编码亮氨酸的密码子(CTT,CTC,CTA,CTG,TTA和TTG)。因此,该密码子的位置1上的碱基可以是C或T,该密码子的位置2总是T,位置3上的碱基可以是T,C,A或G。因此,本公开内容公开或提及的任何参照或修饰聚合酶可被翻译成简并密码子核酸序列的任一个或多个。
ATGGCTAAAATGGCTTTTACTCTTGCTGATCGTGTTACTGAAGAAATGCTTGCTGATAAAGCTGCTCTTGTTGTTGAAGTTGTTGAAGAAAATTATCATGATGCTCCTATTGTTGGTATTGCTGTTGTTAATGAACGTGGTCGTTTTTTTCTTCGTCCTGAAACTGCTCTTGCTGATCCTCAATTTGTTGCTTGGCTTGGTGATGAAACTAAAAAAAAATCTATGTTTGATTCTAAACGTGCTGCTGTTGCTCTTAAATGGAAAGGTATTGAACTTTGTGGTGTTTCTTTTGATCTTCTTCTTGCTGCTTATCTTCTTGATCCTGCTCAAGGTGTTGATGATGTTGCTGCTGCTGCTAAAATGAAACAATATGAAGCTGTTCGTCCTGATGAAGCTGTTTATGGTAAAGGTGCTAAACGTGCTGTTCCTGATGAACCTGTTCTTGCTGAACATCTTGTTCGTAAAGCTGCTGCTATTTGGGAACTTGAACGTCCTTTTCTTGATGAACTTCGTCGTAATGAACAAGATCGTCTTCTTGTTGAACTTGAACAACCTCTTTCTTCTATTCTTGCTGAAATGGAATTTGCTGGTGTTAAAGTTGATACTAAACGTCTTGAACAAATGGGTAAAGAACTTGCTGAACAACTTGGTACTGTTAAACAACGTATTTATGAACTTGCTGGTCAAGAATTTAATATTCGTTCTCCTAAACAACTTGGTGTTATTCTTTTTGAAAAACTTCAACTTCCTGTTCTTAAAAAAACTAAAACTGGTTATTCTACTTCTGCTGATGTTCTTGAAAAACTTGCTCCTTATCATGAAATTGTTGAAAATATTCTTCATTATCGTCAACTTGGTAAACTTCAATCTACTTATATTGAAGGTCTTCTTAAAGTTGTTCGTCCTGATACTAAAAAAGTTCATACTATTTTTAATCAAGCTCTTACTCAAACTGGTCGTCTTTCTTCTACTGAACCTAATCTTCAAAATATTCCTATTCGTCTTGAAGAAGGTCGTAAAATTCGTCAAGCTTTTGTTCCTTCTGAATCTGATTGGCTTATTTTTGCTGCTGATTATTCTCAAATTGAACTTCGTGTTCTTGCTCATATTGCTGAAGATGATAATCTTATGGAAGCTTTTCGTCGTGATCTTGATATTCATACTAAAACTGCTATGGATATTTTTCAAGTTTCTGAAGATGAAGTTACTCCTAATATGCGTCGTCAAGCTAAAGCTGTTAATTTTGGTATTGTTTATGGTATTTCTAAATATGGTCTTGCTCAAAATCTTAATATTTCTCGTAAAGAAGCTGCTGAATTTATTGAACGTTATTTTCAATCTTTTCCTGGTGTTAAACGTTATATGGAAAATATTGTTCAAGAAGCTAAACAAAAAGGTTATGTTACTACTCTTCTTCATCGTCGTCGTTATCTTCCTGATATTACTTCTCGTAATTTAATGTTCGTTCTTTTGCTGAACGTATGGCTATGAATACTCCTATTCAAGGTTCTGCTGCTGATATTATTAAAAAAGCTATGATTGATCTTAATGCTCGTCTTAAAGAAGAACGTCTTCAAGCTCATCTTCTTCTTCAAGTTCATGATGAACTTATTCTTGAAGCTCCTAAAGAAGAAATGGAACGTCTTTGTCGTCTTGTTCCTGAAGTTATGGAACAAGCTGTTACTCTTCGTGTTCCTCTTAAAGTTGATTATCGTTATGGTTCTACTTGGTATGATGCTAAA
(SEQ ID NO:23)
实施例7:突变从一种修饰聚合酶至另一种聚合酶的转移
通过定点诱变将不同的示例性突变引入具有SEQ ID NO:2,20,21和23的氨基酸序列的示例性参照聚合酶(参见表1)。在序列验证后,将包含氨基酸突变的修饰聚合酶(例如,具有氨基酸突变D732R的Taq DNA聚合酶,其中编号对应于SEQ ID NO.20;和具有氨基酸突变D505R的DNA聚合酶的Klenow片段,其中编号对应于SEQ ID NO.23)转化进入细菌细胞以进行表达。将包含表达构建体的菌落接种至BRM培养基中,生长至OD=0.600,通过添加IPTG至1mM的终浓度进行诱导。随后将细胞在37℃再生长3小时。
随后以6000rpm离心诱导的细胞10分钟,弃去上清液,将细胞重悬浮于重悬浮缓冲液(100mM Tris,pH 7.5,100mM NaCl)中。以60(振幅)的设置对重悬浮的细胞超声处理1分钟,随后置于冰上1分钟。以该方式重复超声处理,进行总共5次。将样品在65℃温育10分钟,随后以9000rpm离心。回收上清液,在肝素柱上进一步纯化。如实施例2中所述,测定纯化的聚合酶以测量解离速率常数。
肝素DNA亲和柱
在于肝素柱上纯化修饰聚合酶的过程中观察到下列结果。所有突变体显示对肝素柱的更紧密结合。Taq D732R在43mS/cm的导电率处离开柱子,而野生型在39mS/cm处离开。Klenow D505R在47mS/cm的导电率处离开柱子,而野生型Klenow在32mS/cm处离开。
模板亲和力/解离测定:
测量在过量竞争DNA(发夹oligo 173)存在的情况下每一种修饰和参照聚合酶从DNA模板(oligo 221)的解离速率。在分光光度计上随时间监测逐渐减弱的荧光,作为聚合酶从荧光素标记的模板的解离。解离速率通过将数据与单相指数式衰减方程式拟合来计算。
其中在时间间隔上测量各种修饰聚合酶以及具有SEQ ID NO:16或SEQ ID NO:18的氨基酸序列的参照聚合酶的解离速率常数(也称为“解离时间常数”)的测定的代表性结果描述于图8中。测定中包括的聚合酶如下示于图8中:Bst 1.0=具有SEQ ID NO:16的氨基酸序列的参照聚合酶;BST D775R=具有SEQ ID NO:16的氨基酸序列并且包括突变D775R的修饰聚合酶;Klenow WT=具有SEQ ID NO:18的氨基酸序列的参照聚合酶;Klenow D505R=具有SEQ ID NO:18的氨基酸序列并且还包括突变D505R的修饰聚合酶。如图8中显示的,修饰聚合酶相对于对应的参照聚合酶显示显著更高的解离时间常数。
实施例8:Bst聚合酶、DNA聚合酶的KLENOW片段和TAQ DNA聚合酶突变体的DNA结合亲和力的评价
通过定点诱变将各种示例性突变引入示例性参照聚合酶以产生修饰聚合酶。在该实施例中,修饰参照聚合酶EQ ID NO:2以包含其它氨基酸突变(D480R)。还修饰参照聚合酶EQ ID NO:15以包含其它氨基酸突变(D732R)。此外,修饰参照聚合酶EQ ID NO:18以包含氨基酸突变(D505R)。验证修饰聚合酶的序列,基本上按照实施例1的方法表达所述聚合酶。随后基本上按照实施例2的方法测定修饰聚合酶以测量解离速率常数。
其中在时间间隔上测量修饰聚合酶以及参照聚合酶的解离速率常数(也称为“解离时间常数”)的测定的代表性结果描述于图9-11中。测定中包括的聚合酶如下示于图9中:Bst 1.0=具有SEQ ID NO:16的氨基酸序列的参照聚合酶;LR1=具有SEQ ID NO:16的氨基酸序列并且包括突变D775R的修饰聚合酶。图9还提供了每一种聚合酶的速率常数(K)。这些值的比率(KBst1.0/KBstLR1)为4.7,其意指Bst 1.0聚合酶的解离速率为LR1突变体的4.7倍。因此,LR1突变体使从核酸模板的解离减慢约4.7倍。
测定中包括的聚合酶如下示于图10中:WT=具有SEQ ID NO:18的氨基酸序列的参照聚合酶(Klenow);LR1=具有SEQ ID NO:18的氨基酸序列并且还包括突变D505R的修饰聚合酶。图10还提供了每一种聚合酶的速率常数(K)。这些值的比率(KWT/KLR1)为13,其意指Klenow聚合酶的解离速率为LR1突变体的13倍。因此,LR1突变体使从核酸模板的解离减慢约13倍。
图11中显示的测定中包括的聚合酶如下:WT=具有SEQ ID NO:15的氨基酸序列的参照聚合酶(野生型Taq DNA聚合酶);LR1=具有SEQ ID NO:18的氨基酸序列并且还包含突变D505R的修饰聚合酶。图11还提供了每一种聚合酶的速率常数(K)。在该情况下,野生型Taq DNA聚合酶在实验中与模板快速解离,该速率常数不能被记录。然而,如图11所指出的,LR1-Taq DNA聚合酶突变体可使用相同的实验条件来检测,从而可得出结论:其以比对应的野生型Taq DNA聚合酶慢得多的速率与核酸模板解离。
实施例9:TAQ DNA聚合酶突变体的DNA结合亲和力的进一步评价
通过定点诱变将各种示例性突变引入示例性参照聚合酶(野生型Taq DNA聚合酶-SEQ ID NO:15)以产生一系列修饰聚合酶。在本实例中,修饰参照聚合酶SEQ ID NO:20以包含选自D732R、E745Q或E471K的单氨基酸突变。验证每一种修饰聚合酶的序列,基本上按照实施例1进行表达。随后基本上按照实施例2测定修饰聚合酶以测量解离速率常数。
其中在指定的时间间隔上测量修饰聚合酶以及参照聚合酶的解离速率常数(也称为“解离时间常数”)的测定的代表性结果描述于图12中。测定中包括的聚合酶如下示于图12中:wt Taq=具有SEQ ID NO:15的氨基酸序列的参照聚合酶;D732R=具有SEQ ID NO:15的氨基酸序列并且还包括突变D732R的修饰聚合酶;E745Q=具有SEQ ID NO:15的氨基酸序列并且还包括突变E745Q的修饰聚合酶;E471K=具有SEQ ID NO:15的氨基酸序列并且还包括突变E471K的修饰聚合酶。
图12还提供了每一种聚合酶的速率常数(K)。野生型Taq对D732R突变体的比率(Kwt taq/KD732R)为14.1,其意指野生型Taq DNA聚合酶的解离速率为Taq DNA聚合酶突变体的14倍。因此,Taq突变体使从核酸模板的解离减慢约14倍。
野生型Taq对E745Q突变体的比率(Kwt taq/KE745Q)为4.7,其意指野生型Taq DNA聚合酶的解离速率为Taq DNA聚合酶突变体的4.7倍。因此,Taq突变体使从核酸模板的解离减慢约4.7倍。
野生型Taq对E471K突变体的比率(Kwt taq/KE471K)为5,其意指野生型Taq DNA聚合酶的解离速率为Taq突变体的5倍。因此,Taq突变体使从核酸模板的解离减慢约5倍。
本实施例中制备的所有3种示例性修饰Taq DNA聚合酶相较于参照聚合酶(野生型Taq DNA聚合酶)显示减慢的从核酸模板的解离。
实施例10:修饰聚合酶在核酸测序中的性能的评价
基因上如实施例1中所述,纯化修饰聚合酶,其包括具有SEQ ID NO:2的氨基酸序列并且还包括2个氨基酸置换D264K和E493Q(其中编号是相对于SEQ ID NO:2的氨基酸序列的)的突变Bst聚合酶。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,PartNo.4462917)评价修饰聚合酶在基于离子的测序反应中的性能。简而言之,如Ion FragmentLibrary试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication PartNo.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照IonXpressTM Template试剂盒的用户指南v 2.0(Ion Torrent Systems,Part No.4469004A)中提供的方案,使用Ion Template Preparation试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4466461)、Ion Template Reagents试剂盒(Ion TorrentSystems/Life Technologies,Part No.4466462)和Ion Template Solutions试剂盒(IonTorrent Systems/Life Technologies,Part No.4466463)中提供的试剂将DNA片段扩增在Ion SphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 318测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion TorrentSystems/Life Technologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/LifeTechnologies,Part No.4466456)和Ion Chip试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4462923)中提供的试剂进行测序。
分析使用修饰聚合酶获得的组的测序读数以测量AQ17碱基、AQ20碱基、AQ17平均值、AQ20平均值的数目、文库读数的数目和AQ7比对。通过使用与PGMTM测序系统一起提供的标准软件,测量和比较使用修饰聚合酶在测序反应中获得的AQ17或AQ20读数的总数。如本实施例中所述进行的4个独立测序运行的数据示于图13中。如可看到的,4个测序运行中的每一个在AQ17上产生超过1Gb(gigabases)的数据(平均值=1.09Gb)。
实施例11:评价修饰聚合酶在核酸测序中的性能
基本上如实施例1中所述,纯化两批修饰聚合酶,其包括具有SEQ ID NO:2的氨基酸序列并且还包括2个氨基酸置换D264K和E493Q的突变Bst聚合酶(其中编号是相对于SEQID NO:2的氨基酸序列的)。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,Part No.4462917)评价每一批(Old LR2或New LR2)的修饰聚合酶在基于离子的测序反应中的性能。简而言之,如Ion Fragment Library试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(IonTorrent Systems,Part No.4469004A)中提供的方案,使用Ion Template Preparation试剂盒(Ion Torrent Systems/Life Technologies,Part No.4466461)、Ion TemplateReagents试剂盒(Ion Torrent Systems/Life Technologies,Part No.4466462)和IonTemplate Solutions试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4466463)中提供的试剂将DNA片段扩增在Ion SphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 318测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/Life Technologies,PartNo.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion TorrentSystems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用IonSequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,Part No.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,Part No.4462923)中提供的试剂进行测序。
分析使用LR2批次或新型LR2批次的修饰聚合酶获得的组的测序读数,以测量AQ17碱基、AQ 20碱基、AQ17平均值和AQ20平均值的数目。通过使用与PGMTM测序系统一起提供的标准软件,测量和比较使用修饰聚合酶在测序反应中获得的AQ17或AQ20读数的总数。如本实施例中所述进行的7个独立测序运行的数据示于图14中。如可看到的,7个测序运行中的每一个在AQ17上产生超过1Gb(gigabases)的数据;而测序运行中的5个在AQ20上产生超过1Gb的数据。
实施例12:评价修饰聚合酶在核酸测序中的性能
基本上如实施例1中所述,纯化修饰聚合酶,其包括具有SEQ ID NO:20的氨基酸序列的突变Bst聚合酶。随后使用Ion Torrent PGMTM测序系统(Ion Torrent Systems,PartNo.4462917)评价修饰聚合酶在基于离子的测序反应中的性能。简而言之,如Ion FragmentLibrary试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication PartNo.4467320 Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(Ion Torrent Systems,PartNo.4469004A)中提供的方案,使用Ion Template Preparation试剂盒(Ion TorrentSystems/Life Technologies,Part No.4466461)、Ion Template Reagents试剂盒(IonTorrent Systems/Life Technologies,Part No.4466462)和Ion Template Solutions试剂盒(Ion Torrent Systems/Life Technologies,Part No.4466463)中提供的试剂将DNA片段扩增在Ion SphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 316测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(IonTorrent Systems/Life Technologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714RevA)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/LifeTechnologies,Part No.4466456)和Ion Chip试剂盒(Ion Torrent Systems/LifeTechnologies,Part No.4462923)中提供的试剂进行测序。
分析使用修饰聚合酶获得的测序读数以测量定位的Q17碱基的数目、定位的Q20碱基的数目、在Q17上的平均覆盖深度、在Q20上的平均覆盖深度、最长的Q17和Q20的比对、以及Q17和Q20的比对。如本实施例中所述进行的测序运行的数据示于图15中。如可看到的,测序运行在Q17(1.02Gb)上产生超过1Gb(gigabases)的数据;482个碱基对的Q17准确率和471个碱基对的Q20准确率。
实施例13:评价修饰聚合酶在乳液PCR中的性能
基本上如实施例1中所述,纯化修饰聚合酶,其包括具有SEQ ID NO:15的氨基酸序列并且还包括氨基酸突变D732R的突变Taq DNA聚合酶(SEQ ID NO:24)。
(SEQ ID NO:24)
该修饰聚合酶先前已显示相较于野生型Taq DNA聚合酶模板解离速率减小14倍(参见实施例9)。随后测定修饰的Taq DNA聚合酶后在乳液PCR反应中产生核酸文库的能力。使用400bp插入物和比先前估计的更高的盐条件制备核酸文库。将使用修饰的Taq DNA聚合酶从乳液PCR(emPCR)获得的文库在下游用于使用Torrent PGMTM测序系统(Ion TorrentSystems,Part No.4462917)的基于离子的测序反应。
简而言之,如Ion Fragment Library试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。在本实施例中,将约400bp的DNA片段用作用于产生核酸文库的核酸模板。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(Ion TorrentSystems,Part No.4469004A)中提供的方案(除用修饰的Taq DNA聚合酶替代试剂盒DNA聚合酶和以升高的盐浓度(150mM KCl)进行emPCR过程外)将DNA片段扩增在Ion SphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 316测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/LifeTechnologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,PartNo.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4462923)中提供的试剂进行测序。
分析在emPCR过程中使用修饰Taq DNA聚合酶获得的测序读数,以测量AQ17碱基、AQ20碱基、AQ17平均值、AQ20平均值的数目、文库读数的数目和AQ7的比对。如本实施例中所述进行的测序运行的数据示于图16中。如可看到的,测序运行在Q17(1.025Gb)上产生超过1Gb(gigabases)的数据;443个碱基对的Q17准确率和443个碱基对的Q20准确率。作为在emPCR过程中已产生大量核酸文库的结果,修饰DNA聚合酶能够产生大量测序数据。
实施例14:评价修饰聚合酶在乳液PCR中的性能
比较修饰聚合酶(包括具有SEQ ID NO:24的氨基酸序列的突变Taq DNA聚合酶)与野生型Taq DNA聚合酶在产生核酸文库的乳液PCR反应中的性能。使用400bp的插入物和比用于野生型Taq DNA聚合酶的更高的盐条件制备使用突变Taq DNA聚合酶产生的核酸文库。将使用修饰或野生型Taq DNA聚合酶从乳液PCR(emPCR)获得的文库在下游用于使用IonTorrent PGMTM测序系统(Ion Torrent Systems,Part No.4462917)的基于离子的测序反应。
简而言之,如Ion Fragment Library试剂盒的用户指南(Ion Torrent Systems,Part No.4466464;Publication Part No.4467320Rev B)中所述,纯化基因组DNA,进行接头连接和大小选择。在本实施例中,将约400bp的DNA片段用作用于产生核酸文库的核酸模板。随后基本上按照Ion XpressTM Template试剂盒的用户指南v 2.0(Ion TorrentSystems,Part No.4469004A)中提供的方案(除用修饰Taq DNA聚合酶替代试剂盒DNA聚合酶和以升高的盐浓度(150mM KCl)进行emPCR过程外)将DNA片段扩增在Ion SphereTM颗粒(Ion Torrent Systems,Part No.602-1075-01)上。随后将扩增的DNA加载至PGMTM 316测序芯片上。将芯片加载至Ion Torrent PGMTM测序系统(Ion Torrent Systems/LifeTechnologies,Part No.4462917)中,基本上按照Ion Sequencing试剂盒v2.0的用户指南(Ion Torrent Systems/Life Technologies,Part No.4469714Rev A)中提供的方案,使用Ion Sequencing试剂盒v2.0(Ion Torrent Systems/Life Technologies,PartNo.4466456)和Ion Chip试剂盒(Ion Torrent Systems/Life Technologies,PartNo.4462923)中提供的试剂进行测序。
分析在emPCR过程中使用修饰Taq DNA聚合酶(LR1Taq)或野生型Taq DNA聚合酶(Taq)所得的测序读出以测量AQ17碱基、AQ20碱基、AQ17平均值的数目、关键信号、信噪比和文库读数的数目。如本实施例中所述进行的测序运行的数据示于图17中。如可看到的,相较于野生型Taq DNA聚合酶的在Q17(0.263Gb)上产生的平均0.26Gigabases的数据,使用利用修饰Taq DNA聚合酶(LR1Taq)制备的乳液进行的测序运行在Q17(0.874Gb)上产生平均0.87Gigabases的数据。作为在emPCR过程中已产生大量核酸文库的结果,修饰DNA聚合酶能够产生大量测序数据。
本发明涉及以下实施方式:
1.一种用于进行核苷酸聚合反应的方法,包括:
在一个或多个核苷酸存在的情况下,在高离子强度溶液存在的情况下,将修饰的聚合酶或其生物活性片段与核酸模板接触,其中所述修饰的聚合酶或其生物活性片段相对于参照聚合酶包括一个或多个氨基酸修饰并且相对于参照聚合酶具有增加的解离时间常数;和
使用修饰的聚合酶或其生物活性片段聚合所述一个或多个核苷酸的至少一个。
2.实施方式1的方法,其中所述聚合还包括以模板依赖性方式聚合至少一个核苷酸。
3.实施方式1的方法,还包括在接触之前、期间或之后将引物与核酸模板杂交,并且其中所述聚合包括使用修饰的聚合酶或其生物活性片段将至少一个核苷酸聚合至引物的末端。
4.实施方式1的方法,其中在能够检测至少一个核苷酸被所述修饰的聚合酶或其生物活性片段聚合的传感器附近进行所述聚合。
5.实施方式1的方法,还包括使用传感器检测表明一个或多个核苷酸的至少一个被所述修饰的聚合酶或其生物活性片段聚合的信号。
6.实施方式5的方法,其中所述传感器是ISFET。
7.实施方式1的方法,其中所述高离子强度溶液含有约200mM至约300mM的盐。
8.实施方式7的方法,其中所述盐包括NaCl和/或KCl。
9.实施方式1的方法,其中所述修饰的聚合酶或其生物活性片段包含与SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:19、SEQ ID NO:20或SEQ ID NO:24具有至少90%的同一性的至少100个氨基酸残基。
10.一种用于进行核酸扩增的方法,包括:
产生具有修饰的聚合酶或其生物活性片段、引物、核酸模板以及一个或多个核苷酸的扩增反应混合物,其中所述修饰的聚合酶或其生物活性片段相对于参照聚合酶包括一个或多个氨基酸修饰并且相对于参照聚合酶具有增加的解离时间常数;和
将扩增反应混合物经历扩增条件,其中使用所述修饰的聚合酶或其生物活性片段将所述一个或多个核苷酸的至少一个聚合至引物的末端,并且其中所述扩增条件包括高离子强度溶液的存在。
11.实施方式10的方法,其中所述高离子强度溶液包含约200mM至约300mM NaCl或KCl。
12.实施方式10的方法,其中所述扩增条件包括通过聚合酶链式反应、乳液聚合酶链式反应、等温扩增、重组聚合酶扩增或链置换扩增扩增核酸模板。
13.一种检测核苷酸掺入的方法,包括:
在高离子强度溶液存在的情况下使用修饰的聚合酶或其生物活性片段、核酸模板和一个或多个核苷三磷酸进行核苷酸掺入;从而产生核苷酸掺入的一种或多种副产品;和
检测核苷酸掺入的一种或多种副产品的至少一种的存在,从而检测核苷酸掺入。
14.实施方式13的方法,其中所述检测包括测定核苷酸掺入的身份。
15.实施方式13的方法,其中核苷酸掺入的副产品是氢离子。
16.实施方式15的方法,其中所述离子是氢离子。
17.一种用于进行核酸测序的方法,包括:
在一个或多个核苷酸存在的情况下,在高离子强度溶液存在的情况下,将修饰的聚合酶或其生物活性片段与核酸模板接触,其中所述修饰的聚合酶或其生物活性片段相对于参照聚合酶包括一个或多个氨基酸修饰,并且其中所述修饰的聚合酶或其生物活性片段相对于参照聚合酶具有增加的解离时间常数;和
使用所述修饰的聚合酶或其生物活性片段聚合一个或多个核苷酸的至少一个。
18.实施方式17的方法,其中所述一个或多个核苷酸不包含可检测标记物。
19.实施方式17的方法,其中所述修饰的聚合酶具有与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20或SEQ IDNO.24的至少95%的同一性。
20.实施方式17的方法,其中所述方法还包括测定被修饰的聚合酶聚合的一个或多个核苷酸的身份。
序列表
<110> Life Technologies Corporation
VANDER HORN, Peter
NIKIFOROV, Theo
LUO, Guobin
LANDES, Mindy
MAZUR, Daniel
TOZER, Eileen
LINCECUM, Tommie
<120> 聚合酶组合物、制备和使用所述聚合酶组合物的方法
<130> LT00556PCT
<150> 61/522,125
<151> 2011-08-10
<150> 61/545,434
<151> 2011-10-10
<150> 61/585,133
<151> 2012-01-10
<150> 61/643,844
<151> 2012-05-07
<150> 61/681,593
<151> 2012-08-09
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 581
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 1
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala His
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 2
<211> 581
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 2
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu Arg Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Gln Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala His
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr Arg Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 3
<211> 581
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 3
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu Arg Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Gln Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu Arg Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Ala
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr Arg Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 4
<211> 581
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 4
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu Arg Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
Arg Glu Ile Val Glu Asn Ile Leu Ala Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Gln Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu Arg Arg Arg Arg Phe Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Ala
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr Arg Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 5
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 基序A家族A聚合酶的共有序列
<220>
<221> 杂项特征
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 杂项特征
<222> (4)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<400> 5
Asp Xaa Ser Xaa Xaa Glu
1 5
<210> 6
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 基序B家族A聚合酶的共有序列
<220>
<221> 杂项特征
<222> (2)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<400> 6
Lys Xaa Xaa Xaa Xaa Xaa Xaa Tyr Gly
1 5
<210> 7
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 基序C家族A聚合酶的共有序列
<400> 7
Val His Asp Glu
1
<210> 8
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 基序A家族B聚合酶的共有序列
<220>
<221> 杂项特征
<222> (2)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<400> 8
Asp Xaa Xaa Ser Leu Tyr Pro Ser
1 5
<210> 9
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 基序B家族B聚合酶的共有序列
<220>
<221> 杂项特征
<222> (2)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 杂项特征
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<400> 9
Lys Xaa Xaa Xaa Asn Ser Xaa Tyr Gly
1 5
<210> 10
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 基序C家族B聚合酶的共有序列
<400> 10
Tyr Gly Asp Thr Asp Ser
1 5
<210> 11
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 基序A的共有序列
<220>
<221> 杂项特征
<222> (2)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<400> 11
Asp Xaa Xaa Xaa Xaa Phe Tyr
1 5
<210> 12
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 基序B的共有序列
<220>
<221> 杂项特征
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 杂项特征
<222> (4)..(6)
<223> Xaa可以是任何天然存在的氨基酸
<400> 12
Phe Xaa Gly Xaa Xaa Xaa Ser Ala
1 5
<210> 13
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 基序C的共有序列
<220>
<221> 杂项特征
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<400> 13
Tyr Xaa Asp Asp
1
<210> 14
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 基序D的共有序列
<220>
<221> 杂项特征
<222> (2)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<400> 14
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys
1 5
<210> 15
<211> 832
<212> PRT
<213> 从栖热水生菌
<400> 15
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 16
<211> 876
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 16
Met Lys Lys Lys Leu Val Leu Ile Asp Gly Ser Ser Val Ala Tyr Arg
1 5 10 15
Ala Phe Phe Ala Leu Pro Leu Leu His Asn Asp Lys Gly Ile His Thr
20 25 30
Asn Ala Val Tyr Gly Phe Thr Met Met Leu Asn Lys Ile Leu Ala Glu
35 40 45
Glu Glu Pro Thr His Met Leu Val Ala Phe Asp Ala Gly Lys Thr Thr
50 55 60
Phe Arg His Glu Ala Phe Gln Glu Tyr Lys Gly Gly Arg Gln Gln Thr
65 70 75 80
Pro Pro Glu Leu Ser Glu Gln Phe Pro Leu Leu Arg Glu Leu Leu Arg
85 90 95
Ala Tyr Arg Ile Pro Ala Tyr Glu Leu Glu Asn Tyr Glu Ala Asp Asp
100 105 110
Ile Ile Gly Thr Leu Ala Ala Arg Ala Glu Gln Glu Gly Phe Glu Val
115 120 125
Lys Val Ile Ser Gly Asp Arg Asp Leu Thr Gln Leu Ala Ser Pro His
130 135 140
Val Thr Val Asp Ile Thr Lys Lys Gly Ile Thr Asp Ile Glu Pro Tyr
145 150 155 160
Thr Pro Glu Thr Val Arg Glu Lys Tyr Gly Leu Thr Pro Glu Gln Ile
165 170 175
Val Asp Leu Lys Gly Leu Met Gly Asp Lys Ser Asp Asn Ile Pro Gly
180 185 190
Val Pro Gly Ile Gly Glu Lys Thr Ala Val Lys Leu Leu Arg Gln Phe
195 200 205
Gly Thr Val Glu Asn Val Leu Ala Ser Ile Asp Glu Ile Lys Gly Glu
210 215 220
Lys Leu Lys Glu Thr Leu Arg Gln His Arg Glu Met Ala Leu Leu Ser
225 230 235 240
Lys Lys Leu Ala Ala Ile Arg Arg Asp Ala Pro Val Glu Leu Ser Leu
245 250 255
Asp Asp Ile Ala Tyr Gln Gly Glu Asp Arg Glu Lys Val Val Ala Leu
260 265 270
Phe Lys Glu Leu Gly Phe Gln Ser Phe Leu Glu Lys Met Glu Ser Pro
275 280 285
Ser Ser Glu Glu Glu Lys Pro Leu Ala Lys Met Ala Phe Thr Leu Ala
290 295 300
Asp Arg Val Thr Glu Glu Met Leu Ala Asp Lys Ala Ala Leu Val Val
305 310 315 320
Glu Val Val Glu Glu Asn Tyr His Asp Ala Pro Ile Val Gly Ile Ala
325 330 335
Val Val Asn Glu His Gly Arg Phe Phe Leu Arg Pro Glu Thr Ala Leu
340 345 350
Ala Asp Pro Gln Phe Val Ala Trp Leu Gly Asp Glu Thr Lys Lys Lys
355 360 365
Ser Met Phe Asp Ser Lys Arg Ala Ala Val Ala Leu Lys Trp Lys Gly
370 375 380
Ile Glu Leu Cys Gly Val Ser Phe Asp Leu Leu Leu Ala Ala Tyr Leu
385 390 395 400
Leu Asp Pro Ala Gln Gly Val Asp Asp Val Ala Ala Ala Ala Lys Met
405 410 415
Lys Gln Tyr Glu Ala Val Arg Pro Asp Glu Ala Val Tyr Gly Lys Gly
420 425 430
Ala Lys Arg Ala Val Pro Asp Glu Pro Val Leu Ala Glu His Leu Val
435 440 445
Arg Lys Ala Ala Ala Ile Trp Glu Leu Glu Arg Pro Phe Leu Asp Glu
450 455 460
Leu Arg Arg Asn Glu Gln Asp Arg Leu Leu Val Glu Leu Glu Gln Pro
465 470 475 480
Leu Ser Ser Ile Leu Ala Glu Met Glu Phe Ala Gly Val Lys Val Asp
485 490 495
Thr Lys Arg Leu Glu Gln Met Gly Lys Glu Leu Ala Glu Gln Leu Gly
500 505 510
Thr Val Glu Gln Arg Ile Tyr Glu Leu Ala Gly Gln Glu Phe Asn Ile
515 520 525
Asn Ser Pro Lys Gln Leu Gly Val Ile Leu Phe Glu Lys Leu Gln Leu
530 535 540
Pro Val Leu Lys Lys Thr Lys Thr Gly Tyr Ser Thr Ser Ala Asp Val
545 550 555 560
Leu Glu Lys Leu Ala Pro Tyr His Glu Ile Val Glu Asn Ile Leu His
565 570 575
Tyr Arg Gln Leu Gly Lys Leu Gln Ser Thr Tyr Ile Glu Gly Leu Leu
580 585 590
Lys Val Val Arg Pro Asp Thr Lys Lys Val His Thr Ile Phe Asn Gln
595 600 605
Ala Leu Thr Gln Thr Gly Arg Leu Ser Ser Thr Glu Pro Asn Leu Gln
610 615 620
Asn Ile Pro Ile Arg Leu Glu Glu Gly Arg Lys Ile Arg Gln Ala Phe
625 630 635 640
Val Pro Ser Glu Ser Asp Trp Leu Ile Phe Ala Ala Asp Tyr Ser Gln
645 650 655
Ile Glu Leu Arg Val Leu Ala His Ile Ala Glu Asp Asp Asn Leu Met
660 665 670
Glu Ala Phe Arg Arg Asp Leu Asp Ile His Thr Lys Thr Ala Met Asp
675 680 685
Ile Phe Gln Val Ser Glu Asp Glu Val Thr Pro Asn Met Arg Arg Gln
690 695 700
Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile Ser Asp Tyr Gly
705 710 715 720
Leu Ala Gln Asn Leu Asn Ile Ser Arg Lys Glu Ala Ala Glu Phe Ile
725 730 735
Glu Arg Tyr Phe Glu Ser Phe Pro Gly Val Lys Arg Tyr Met Glu Asn
740 745 750
Ile Val Gln Glu Ala Lys Gln Lys Gly Tyr Val Thr Thr Leu Leu His
755 760 765
Arg Arg Arg Tyr Leu Pro Asp Ile Thr Ser Arg Asn Phe Asn Val Arg
770 775 780
Ser Phe Ala Glu Arg Met Ala Met Asn Thr Pro Ile Gln Gly Ser Ala
785 790 795 800
Ala Asp Ile Ile Lys Lys Ala Met Ile Asp Leu Asn Ala Arg Leu Lys
805 810 815
Glu Glu Arg Leu Gln Ala His Leu Leu Leu Gln Val His Asp Glu Leu
820 825 830
Ile Leu Glu Ala Pro Lys Glu Glu Met Glu Arg Leu Cys Arg Leu Val
835 840 845
Pro Glu Val Met Glu Gln Ala Val Thr Leu Arg Val Pro Leu Lys Val
850 855 860
Asp Tyr His Tyr Gly Ser Thr Trp Tyr Asp Ala Lys
865 870 875
<210> 17
<211> 1746
<212> DNA
<213> 嗜热脂肪芽孢杆菌
<400> 17
atggcaaaaa tggcatttac cctggcagat cgtgttaccg aagaaatgct ggcagataaa 60
gcagcactgg ttgttgaagt tgtggaagaa aactatcatg atgcaccgat tgttggtatt 120
gccgttgtta atgaacgcgg tcgttttttt ctgcgtccgg aaaccgcact ggcagatccg 180
cagtttgttg catggctggg tgatgaaacc aaaaagaaaa gcatgttcga cagcaaacgt 240
gcagcagttg cactgaaatg gaaaggtatt gaactgtgcg gtgtgtcatt tgatctgctg 300
ctggcagcat atctgctgga tccggcacag ggtgttgatg atgttgcagc agcagcaaaa 360
atgaaacagt atgaagcagt tcgtccggat gaagcagttt atggtaaagg tgcaaaacgt 420
gcagttccgg atgaaccggt tctggcagaa catctggttc gtaaagcagc agcaatttgg 480
gaactggaac gtccgtttct ggatgaactg cgtcgtaatg aacaggatcg tctgctggtt 540
gaactggaac agccgctgag cagcattctg gcagaaatgg aatttgccgg tgttaaagtt 600
gataccaaac gtctggaaca aatgggtaaa gaactggccg aacaactggg caccgttgaa 660
cagcgtattt atgaactggc aggccaagaa tttaacatta atagcccgaa acagctgggc 720
gttatcctgt ttgaaaaact gcagctgccg gttctgaaaa aaaccaaaac cggttatagc 780
accagcgcag atgttctgga aaaactggca ccgtatcatg aaattgtgga aaacattctg 840
cactatcgtc agctgggtaa actgcagagc acctatattg aaggtctgct gaaagttgtg 900
cgtccggata ccaaaaaagt gcataccatt tttaaccagg cactgaccca gaccggtcgt 960
ctgagcagca ccgaaccgaa tctgcagaat attccgattc gtctggaaga aggtcgtaaa 1020
attcgtcagg catttgttcc gagcgaaagc gattggctga tttttgcagc agattatagc 1080
cagattgaac tgcgtgttct ggcacatatt gccgaagatg ataatctgat ggaagcattt 1140
cgtcgcgatc tggatattca taccaaaacc gccatggata tttttcaggt tagcgaagat 1200
gaagtgaccc cgaatatgcg tcgtcaggca aaagcagtta attttggtat tgtgtatggc 1260
atcagcgatt atggtctggc acagaatctg aatattagcc gtaaagaagc agccgaattt 1320
atcgaacgtt actttcagag ctttccgggt gttaaacgct atatggaaaa cattgtccaa 1380
gaagccaaac agaaaggtta tgttaccacc ctgctgcatc gtcgtcgtta tctgccgcgt 1440
attaccagcc gtaactttaa tgttcgtagc tttgcagaac gcatggcaat gaataccccg 1500
attcagggta gcgcagcaga tattatcaaa aaagccatga tcgatctgaa cgcacgtctg 1560
aaagaagaac gtctgcaggc acatttactg ctgcaggttc atgatgaact gattctggaa 1620
gcaccgaaag aagaaatgga acgtctttgt cgtctggttc cggaagttat ggaacaggca 1680
gttaccctgc gtgttccgct gaaagttgat tatcgttatg gtagcacctg gtatgatgcc 1740
aaataa 1746
<210> 18
<211> 606
<212> PRT
<213> 大肠杆菌
<400> 18
Met Val Ile Ser Tyr Asp Asn Tyr Val Thr Ile Leu Asp Glu Glu Thr
1 5 10 15
Leu Lys Ala Trp Ile Ala Lys Leu Glu Lys Ala Pro Val Phe Ala Phe
20 25 30
Asp Thr Glu Thr Asp Ser Leu Asp Asn Ile Ser Ala Asn Leu Val Gly
35 40 45
Leu Ser Phe Ala Ile Glu Pro Gly Val Ala Ala Tyr Ile Pro Val Ala
50 55 60
His Asp Tyr Leu Asp Ala Pro Asp Gln Ile Ser Arg Glu Arg Ala Leu
65 70 75 80
Glu Leu Leu Lys Pro Leu Leu Glu Asp Glu Lys Ala Leu Lys Val Gly
85 90 95
Gln Asn Leu Lys Tyr Asp Arg Gly Ile Leu Ala Asn Tyr Gly Ile Glu
100 105 110
Leu Arg Gly Ile Ala Phe Asp Thr Met Leu Glu Ser Tyr Ile Leu Asn
115 120 125
Ser Val Ala Gly Arg His Asp Met Asp Ser Leu Ala Glu Arg Trp Leu
130 135 140
Lys His Lys Thr Ile Thr Phe Glu Glu Ile Ala Gly Lys Gly Lys Asn
145 150 155 160
Gln Leu Thr Phe Asn Gln Ile Ala Leu Glu Glu Ala Gly Arg Tyr Ala
165 170 175
Ala Glu Asp Ala Asp Val Thr Leu Gln Leu His Leu Lys Met Trp Pro
180 185 190
Asp Leu Gln Lys His Lys Gly Pro Leu Asn Val Phe Glu Asn Ile Glu
195 200 205
Met Pro Leu Val Pro Val Leu Ser Arg Ile Glu Arg Asn Gly Val Lys
210 215 220
Ile Asp Pro Lys Val Leu His Asn His Ser Glu Glu Leu Thr Leu Arg
225 230 235 240
Leu Ala Glu Leu Glu Lys Lys Ala His Glu Ile Ala Gly Glu Glu Phe
245 250 255
Asn Leu Ser Ser Thr Lys Gln Leu Gln Thr Ile Leu Phe Glu Lys Gln
260 265 270
Gly Ile Lys Pro Leu Lys Lys Thr Pro Gly Gly Ala Pro Ser Thr Ser
275 280 285
Glu Glu Val Leu Glu Glu Leu Ala Leu Asp Tyr Pro Leu Pro Lys Val
290 295 300
Ile Leu Glu Tyr Arg Gly Leu Ala Lys Leu Lys Ser Thr Tyr Thr Asp
305 310 315 320
Lys Leu Pro Leu Met Ile Asn Pro Lys Thr Gly Arg Val His Thr Ser
325 330 335
Tyr His Gln Ala Val Thr Ala Thr Gly Arg Leu Ser Ser Thr Asp Pro
340 345 350
Asn Leu Gln Asn Ile Pro Val Arg Asn Glu Glu Gly Arg Arg Ile Arg
355 360 365
Gln Ala Phe Ile Ala Pro Glu Asp Tyr Val Ile Val Ser Ala Asp Tyr
370 375 380
Ser Gln Ile Glu Leu Arg Ile Met Ala His Leu Ser Arg Asp Lys Gly
385 390 395 400
Leu Leu Thr Ala Phe Ala Glu Gly Lys Asp Ile His Arg Ala Thr Ala
405 410 415
Ala Glu Val Phe Gly Leu Pro Leu Glu Thr Val Thr Ser Glu Gln Arg
420 425 430
Arg Ser Ala Lys Ala Ile Asn Phe Gly Leu Ile Tyr Gly Met Ser Ala
435 440 445
Phe Gly Leu Ala Arg Gln Leu Asn Ile Pro Arg Lys Glu Ala Gln Lys
450 455 460
Tyr Met Asp Leu Tyr Phe Glu Arg Tyr Pro Gly Val Leu Glu Tyr Met
465 470 475 480
Glu Arg Thr Arg Ala Gln Ala Lys Glu Gln Gly Tyr Val Glu Thr Leu
485 490 495
Asp Gly Arg Arg Leu Tyr Leu Pro Asp Ile Lys Ser Ser Asn Gly Ala
500 505 510
Arg Arg Ala Ala Ala Glu Arg Ala Ala Ile Asn Ala Pro Met Gln Gly
515 520 525
Thr Ala Ala Asp Ile Ile Lys Arg Ala Met Ile Ala Val Asp Ala Trp
530 535 540
Leu Gln Ala Glu Gln Pro Arg Val Arg Met Ile Met Gln Val His Asp
545 550 555 560
Glu Leu Val Phe Glu Val His Lys Asp Asp Val Asp Ala Val Ala Lys
565 570 575
Gln Ile His Gln Leu Met Glu Asn Cys Thr Arg Leu Asp Val Pro Leu
580 585 590
Leu Val Glu Val Gly Ser Gly Glu Asn Trp Asp Gln Ala His
595 600 605
<210> 19
<211> 581
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 19
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu Arg Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Lys Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Arg Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Lys Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Gln Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala His
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr Arg Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 20
<211> 581
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 20
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu Arg Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Lys Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Arg Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Lys Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Gln Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu Arg Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Ala
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr Arg Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 21
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> DNA寡核苷酸
<220>
<221> 杂项特征
<222> (34)..(34)
<223> N = fluorescein-dT
<400> 21
tttttttgca ggtgacaggt ttttcctgtc accngc 36
<210> 22
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> DNA寡核苷酸
<400> 22
tttttttccc tttcctttcg ggtgacaggt ttttcctgtc accc 44
<210> 23
<211> 1743
<212> DNA
<213> 嗜热脂肪芽孢杆菌
<400> 23
atggctaaaa tggcttttac tcttgctgat cgtgttactg aagaaatgct tgctgataaa 60
gctgctcttg ttgttgaagt tgttgaagaa aattatcatg atgctcctat tgttggtatt 120
gctgttgtta atgaacgtgg tcgttttttt cttcgtcctg aaactgctct tgctgatcct 180
caatttgttg cttggcttgg tgatgaaact aaaaaaaaat ctatgtttga ttctaaacgt 240
gctgctgttg ctcttaaatg gaaaggtatt gaactttgtg gtgtttcttt tgatcttctt 300
cttgctgctt atcttcttga tcctgctcaa ggtgttgatg atgttgctgc tgctgctaaa 360
atgaaacaat atgaagctgt tcgtcctgat gaagctgttt atggtaaagg tgctaaacgt 420
gctgttcctg atgaacctgt tcttgctgaa catcttgttc gtaaagctgc tgctatttgg 480
gaacttgaac gtccttttct tgatgaactt cgtcgtaatg aacaagatcg tcttcttgtt 540
gaacttgaac aacctctttc ttctattctt gctgaaatgg aatttgctgg tgttaaagtt 600
gatactaaac gtcttgaaca aatgggtaaa gaacttgctg aacaacttgg tactgttaaa 660
caacgtattt atgaacttgc tggtcaagaa tttaatattc gttctcctaa acaacttggt 720
gttattcttt ttgaaaaact tcaacttcct gttcttaaaa aaactaaaac tggttattct 780
acttctgctg atgttcttga aaaacttgct ccttatcatg aaattgttga aaatattctt 840
cattatcgtc aacttggtaa acttcaatct acttatattg aaggtcttct taaagttgtt 900
cgtcctgata ctaaaaaagt tcatactatt tttaatcaag ctcttactca aactggtcgt 960
ctttcttcta ctgaacctaa tcttcaaaat attcctattc gtcttgaaga aggtcgtaaa 1020
attcgtcaag cttttgttcc ttctgaatct gattggctta tttttgctgc tgattattct 1080
caaattgaac ttcgtgttct tgctcatatt gctgaagatg ataatcttat ggaagctttt 1140
cgtcgtgatc ttgatattca tactaaaact gctatggata tttttcaagt ttctgaagat 1200
gaagttactc ctaatatgcg tcgtcaagct aaagctgtta attttggtat tgtttatggt 1260
atttctaaat atggtcttgc tcaaaatctt aatatttctc gtaaagaagc tgctgaattt 1320
attgaacgtt attttcaatc ttttcctggt gttaaacgtt atatggaaaa tattgttcaa 1380
gaagctaaac aaaaaggtta tgttactact cttcttcatc gtcgtcgtta tcttcctgat 1440
attacttctc gtaattttaa tgttcgttct tttgctgaac gtatggctat gaatactcct 1500
attcaaggtt ctgctgctga tattattaaa aaagctatga ttgatcttaa tgctcgtctt 1560
aaagaagaac gtcttcaagc tcatcttctt cttcaagttc atgatgaact tattcttgaa 1620
gctcctaaag aagaaatgga acgtctttgt cgtcttgttc ctgaagttat ggaacaagct 1680
gttactcttc gtgttcctct taaagttgat tatcgttatg gttctacttg gtatgatgct 1740
aaa 1743
<210> 24
<211> 832
<212> PRT
<213> 从栖热水生菌
<400> 24
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Arg Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830

Claims (13)

1.一种用于进行核酸扩增的方法,包括:
产生具有修饰的聚合酶、引物、核酸模板以及一个或多个核苷酸的扩增反应混合物,其中所述修饰的聚合酶具有SEQ ID NO:15所示的序列,并且还包含选自下组的一个或多个氨基酸取代:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q,其中所述编号是相对于SEQ ID NO:15的氨基酸序列的,并且所述修饰的聚合酶相对于具有SEQ ID NO:15所示序列的参照聚合酶具有增加的解离时间常数;和
将扩增反应混合物经历扩增条件,其中使用所述修饰的聚合酶将所述一个或多个核苷酸的至少一个聚合至引物的末端。
2.权利要求1所述的方法,其中所述扩增条件包括高离子强度溶液的存在。
3.权利要求2所述的方法,其中所述高离子强度溶液含有约100mM至约500mM的盐。
4.权利要求3所述的方法,其中所述盐包括NaCl和/或KCl。
5.权利要求1所述的方法,其中所述修饰的聚合酶包含D732R。
6.权利要求1所述的方法,其中所述修饰的聚合酶具有SEQ ID NO:24所示的序列。
7.权利要求1所述的方法,其中所述修饰的聚合酶包含E745Q。
8.权利要求1所述的方法,其中所述修饰的聚合酶包含E471K。
9.权利要求1所述的方法,其中所述核酸扩增反应是克隆扩增反应。
10.权利要求1所述的方法,其中所述扩增条件包括通过乳液聚合酶链式反应扩增所述核酸模板。
11.一种修饰的聚合酶,其包含SEQ ID NO:1的氨基酸序列,并且相对于具有SEQ IDNO:1所示氨基酸序列的参照聚合酶包括一个或多个氨基酸修饰。
12.一种修饰的聚合酶,其具有SEQ ID NO:16的氨基酸序列,并且还包括选自D559S、D718K和D775R的任一个或多个氨基酸突变,其中氨基酸编号是相对于SEQ ID NO:16的氨基酸序列的。
13.一种修饰的聚合酶,其具有SEQ ID NO:15的氨基酸序列,并且还包括下列氨基酸突变中的一个或多个:E471K、N485R、R492K、D513K、A675K、D732R、S739W、V740R和E745Q,其中编号是相对于SEQ ID NO:15的氨基酸序列的。
CN201710614722.XA 2011-08-10 2012-08-10 聚合酶组合物、制备和使用所述聚合酶组合物的方法 Active CN107326079B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201161522125P 2011-08-10 2011-08-10
US61/522,125 2011-08-10
US201161545434P 2011-10-10 2011-10-10
US61/545,434 2011-10-10
US201261585133P 2012-01-10 2012-01-10
US61/585,133 2012-01-10
US201261643844P 2012-05-07 2012-05-07
US61/643,844 2012-05-07
US201261681593P 2012-08-09 2012-08-09
US61/681,593 2012-08-09
CN201280048344.9A CN103857805B (zh) 2011-08-10 2012-08-10 聚合酶组合物、制备和使用所述聚合酶组合物的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280048344.9A Division CN103857805B (zh) 2011-08-10 2012-08-10 聚合酶组合物、制备和使用所述聚合酶组合物的方法

Publications (2)

Publication Number Publication Date
CN107326079A true CN107326079A (zh) 2017-11-07
CN107326079B CN107326079B (zh) 2021-04-20

Family

ID=46755104

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280048344.9A Active CN103857805B (zh) 2011-08-10 2012-08-10 聚合酶组合物、制备和使用所述聚合酶组合物的方法
CN201710614722.XA Active CN107326079B (zh) 2011-08-10 2012-08-10 聚合酶组合物、制备和使用所述聚合酶组合物的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280048344.9A Active CN103857805B (zh) 2011-08-10 2012-08-10 聚合酶组合物、制备和使用所述聚合酶组合物的方法

Country Status (6)

Country Link
US (4) US20130040365A1 (zh)
EP (2) EP2742151B1 (zh)
CN (2) CN103857805B (zh)
IN (1) IN2014CN01834A (zh)
LT (1) LT2742151T (zh)
WO (1) WO2013023176A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111454926A (zh) * 2020-05-11 2020-07-28 南京君华基因科技有限公司 一种优化的扩增目标核酸的聚合酶、复合体系及应用

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN2014CN01834A (zh) * 2011-08-10 2015-05-29 Life Technologies Corp
US11208636B2 (en) 2011-08-10 2021-12-28 Life Technologies Corporation Polymerase compositions, methods of making and using same
US8906660B2 (en) 2012-02-01 2014-12-09 Pacific Biosciences Of California, Inc. Recombinant polymerases with increased phototolerance
WO2013158313A1 (en) 2012-04-19 2013-10-24 Life Technologies Corporation Nucleic acid amplification
EP3461910B1 (en) 2012-04-19 2020-08-26 Life Technologies Corporation Nucleic acid amplification
EP2895620B1 (en) 2012-09-11 2017-08-02 Life Technologies Corporation Nucleic acid amplification
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
US9399766B2 (en) 2012-10-01 2016-07-26 Pacific Biosciences Of California, Inc. Recombinant polymerases for incorporation of protein shield nucleotide analogs
CA2888455C (en) * 2012-10-16 2021-11-09 Dna Polymerase Technology, Inc. Inhibition-resistant polymerases
US10758700B2 (en) 2013-09-30 2020-09-01 Arizona Board Of Regents On Behalf Of The University Of Arizona Home-based heliox system with carbon dioxide removal
EP3052652B1 (en) * 2013-09-30 2022-11-23 Life Technologies Corporation Polymerase compositions, methods of making and using same
WO2016077324A1 (en) 2014-11-11 2016-05-19 Life Technologies Corporation Thiolated nucleotide analogues for nucleic acid synthesis
WO2016100438A2 (en) 2014-12-16 2016-06-23 Life Technologies Corporation Polymerase compositions and methods of making and using same
CA2974456A1 (en) 2015-02-02 2016-08-11 F. Hoffmann-La Roche Ag Polymerase variants
WO2016183294A1 (en) 2015-05-12 2016-11-17 Dna Polymerase Technology, Inc. Mutant polymerases and uses thereof
US10526588B2 (en) 2015-05-14 2020-01-07 Roche Sequencing Solutions, Inc. Polymerase variants and uses thereof
CN116218815A (zh) 2015-10-01 2023-06-06 生命技术公司 聚合酶组合物和套组以及其使用与制造方法
CN108699540A (zh) 2016-02-29 2018-10-23 吉尼亚科技公司 用于纳米孔测序的聚合酶-模板复合物
US10590480B2 (en) 2016-02-29 2020-03-17 Roche Sequencing Solutions, Inc. Polymerase variants
US10266813B2 (en) 2016-02-29 2019-04-23 Genia Technologies, Inc. Exonuclease deficient polymerases
CN109154024B (zh) 2016-04-29 2022-03-04 欧姆尼欧美公司 核酸序列测定方法
US10597643B2 (en) 2016-04-29 2020-03-24 Omniome, Inc. Polymerases engineered to reduce nucleotide-independent DNA binding
WO2017196676A1 (en) 2016-05-10 2017-11-16 Life Technologies Corporation Metal chelation post incorporation detection methods
US11268117B2 (en) 2016-06-10 2022-03-08 Life Technologies Corporation Methods and compositions for nucleic acid amplification
JP7157048B2 (ja) 2016-09-22 2022-10-19 エフ.ホフマン-ラ ロシュ アーゲー Pol6ポリメラーゼバリアント
EP3568490B1 (en) * 2017-01-10 2021-03-10 Omniome, Inc. Polymerases engineered to reduce nucleotide-independent dna binding
CN111566223B (zh) 2017-11-07 2024-04-12 生命技术公司 用于操纵核酸的方法和组合物
GB201721053D0 (en) * 2017-12-15 2018-01-31 Univ I Tromsø - Norges Arktiske Univ DNA polymerases
US10961518B2 (en) 2018-01-19 2021-03-30 Bio-Rad Laboratories, Inc. Mutant DNA polymerases
CN112941155B (zh) * 2018-05-14 2023-07-14 北京艾克伦医疗科技有限公司 具有茎环结构的dna引物对及其应用
WO2020185705A1 (en) 2019-03-10 2020-09-17 Abclonal Science, Inc. Mutant taq polymerase for amplification in increased salt concentration or body fluids
WO2020185702A2 (en) * 2019-03-13 2020-09-17 Abclonal Science, Inc. Mutant taq polymerase for faster amplification
WO2020227031A1 (en) 2019-05-03 2020-11-12 Life Technologies Corporation Methods and compositions for manipulating nucleic acids
US11613738B2 (en) 2019-05-14 2023-03-28 Abclonal Science, Inc. Mutant Taq polymerase resistant to inhibition of amplification in the presence of cyanine dye
CN111154739B (zh) * 2020-02-06 2021-03-02 广州普世利华科技有限公司 一种新型重组酶依赖型扩增方法及试剂盒
US11649441B2 (en) * 2020-10-07 2023-05-16 Abclonal Science, Inc. Taq DNA polymerase mutants for probe qPCR
TW202330915A (zh) * 2021-09-29 2023-08-01 呈堯 陳 用於無模板rna合成的核酸聚合酶變體、試劑套組及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101180390A (zh) * 2005-05-10 2008-05-14 索莱克萨有限公司 改进的聚合酶
WO2010062777A2 (en) * 2008-11-03 2010-06-03 Kapabiosystems Modified type a dna polymerases
CN103025870A (zh) * 2010-06-18 2013-04-03 霍夫曼-拉罗奇有限公司 具有增强的3’-错配辨别力的dna聚合酶

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3508111A (en) 1966-09-21 1970-04-21 Ibm Light emitting semiconductor device with light emission from selected portion(s) of p-n junction
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US5466591A (en) 1986-08-22 1995-11-14 Hoffmann-La Roche Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
CA2090614C (en) * 1990-09-28 2001-12-11 David H. Gelfand 5' to 3' exonuclease mutations of thermostable dna polymerases
EP1233061A3 (en) * 1991-06-03 2002-09-04 Takara Shuzo Co., Ltd. A method for cloning of a gene for pol I type DNA polymerase
US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
US5830714A (en) * 1996-04-17 1998-11-03 Molecular Biology Resources, Inc. Biologically active fragment of bacillus stearothermophilus DNA polymerase
US6395524B2 (en) 1996-11-27 2002-05-28 University Of Washington Thermostable polymerases having altered fidelity and method of identifying and using same
EP2202312B1 (en) * 1997-03-12 2016-01-06 Applied Biosystems, LLC DNA polymerases having improved labelled nucleotide incorporation properties
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
GB9918150D0 (en) * 1999-08-03 1999-10-06 Univ Sheffield Nuclease variant
US6329178B1 (en) 2000-01-14 2001-12-11 University Of Washington DNA polymerase mutant having one or more mutations in the active site
CA2410072C (en) 2000-05-24 2011-07-19 Third Wave Technologies, Inc. Polymerase cleavage agents and detection of rna
US6214557B1 (en) 2000-06-06 2001-04-10 Washington University Cold sensitive mutant DNA polymerases
US20070172866A1 (en) * 2000-07-07 2007-07-26 Susan Hardin Methods for sequence determination using depolymerizing agent
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
GB0022458D0 (en) 2000-09-13 2000-11-01 Medical Res Council Directed evolution method
US6768004B2 (en) * 2001-01-11 2004-07-27 Mueller Sybille Nucleotide sequences encoding variable regions of heavy and light chains of monoclonal antibody 1F7, an anti-idiotypic antibody reactive with anti-HIV antibodies
AU2002258997A1 (en) * 2001-04-24 2002-11-05 Li-Cor, Inc. Polymerases with charge-switch activity and methods of generating such polymerases
US20030180741A1 (en) * 2001-12-21 2003-09-25 Holly Hogrefe High fidelity DNA polymerase compositions and uses therefor
GB0208768D0 (en) * 2002-04-17 2002-05-29 Univ Newcastle DNA polymerases
EP1801213A3 (en) 2003-11-03 2007-10-24 Medical Research Council Polymerase
US7417133B2 (en) 2004-02-27 2008-08-26 Institut Pasteur Methods for obtaining thermostable enzymes, DNA polymerase I variants from Thermus aquaticus having new catalytic activities, methods for obtaining the same, and applications of the same
US7462475B2 (en) 2004-05-20 2008-12-09 Dna Poleymerase Technology, Inc. Use of whole blood in PCR reactions
US20060223067A1 (en) 2005-03-31 2006-10-05 Paolo Vatta Mutant DNA polymerases and methods of use
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CN101365807A (zh) 2005-12-22 2009-02-11 加利福尼亚太平洋生物科学股份有限公司 用于掺入核苷酸类似物的聚合酶
JP5457184B2 (ja) 2006-09-14 2014-04-02 ディエヌエイ・ポリメラーゼ・テクノロジー・インコーポレイテッド Pcr阻害物質の存在下におけるdna増幅のためのtaqポリメラーゼ変異体酵素の使用
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
EP2674751B1 (en) * 2006-12-14 2017-02-01 Life Technologies Corporation Apparatus for measuring analytes using large scale FET arrays
EP2942404B1 (en) 2008-03-31 2016-11-23 Pacific Biosciences of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US8481685B2 (en) 2008-11-03 2013-07-09 Kapa Biosystems Modified DNA polymerases
US8603792B2 (en) 2009-03-27 2013-12-10 Life Technologies Corporation Conjugates of biomolecules to nanoparticles
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US9523085B2 (en) 2009-07-31 2016-12-20 Agilent Technologies Inc. Thermostable type-A DNA polymerase mutants with increased polymerization rate and resistance to inhibitors
US20110318748A1 (en) * 2010-02-26 2011-12-29 Life Technologies Corporation Modified Proteins and Methods of Making and Using Same
US20110301041A1 (en) * 2010-02-26 2011-12-08 Life Technologies Corporation Modified Proteins and Methods of Making and Using Same
WO2012097318A2 (en) 2011-01-14 2012-07-19 Kap Abiosystems Modified dna polymerases for improved amplification
GB201113430D0 (en) 2011-08-03 2011-09-21 Fermentas Uab DNA polymerases
IN2014CN01834A (zh) * 2011-08-10 2015-05-29 Life Technologies Corp

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101180390A (zh) * 2005-05-10 2008-05-14 索莱克萨有限公司 改进的聚合酶
WO2010062777A2 (en) * 2008-11-03 2010-06-03 Kapabiosystems Modified type a dna polymerases
CN103025870A (zh) * 2010-06-18 2013-04-03 霍夫曼-拉罗奇有限公司 具有增强的3’-错配辨别力的dna聚合酶

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LSHINO,Y.,: ""DNA polymerase [Thermus aquaticus]"", 《GENBANK DATABASE》 *
Y.ISHINO ET AL.: "Overproduction of Thermus aquaticus DNA Polymerase and Its Structural Analysis by Ion-Spray Mass Spectrometry", 《J.BIOCHEM.》 *
阮红等: "《基因工程原理》", 30 September 2007, 浙江大学出版社 *
陈宁等: "《高等学校专业教材 酶工程》", 30 June 2011, 中国轻工业出版社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111454926A (zh) * 2020-05-11 2020-07-28 南京君华基因科技有限公司 一种优化的扩增目标核酸的聚合酶、复合体系及应用

Also Published As

Publication number Publication date
EP3293274A2 (en) 2018-03-14
US9976128B2 (en) 2018-05-22
EP2742151B1 (en) 2017-10-25
US20220162573A1 (en) 2022-05-26
CN103857805A (zh) 2014-06-11
EP3293274B1 (en) 2020-04-01
US10633641B2 (en) 2020-04-28
WO2013023176A2 (en) 2013-02-14
LT2742151T (lt) 2018-02-12
CN103857805B (zh) 2017-07-18
US20130040365A1 (en) 2013-02-14
CN107326079B (zh) 2021-04-20
EP3293274A3 (en) 2018-03-28
EP2742151A2 (en) 2014-06-18
US20180305673A1 (en) 2018-10-25
IN2014CN01834A (zh) 2015-05-29
US20150368626A1 (en) 2015-12-24
WO2013023176A3 (en) 2013-04-18

Similar Documents

Publication Publication Date Title
CN103857805B (zh) 聚合酶组合物、制备和使用所述聚合酶组合物的方法
CN105765082B (zh) 聚合酶组合物、制得和使用其的方法
US11319584B2 (en) Polymerase compositions and methods of making and using same
JP2018515103A (ja) ポリメラーゼバリアントおよびその使用
CN108350496B (zh) 聚合酶组合物和套组以及其使用与制造方法
US11208636B2 (en) Polymerase compositions, methods of making and using same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant