CN111433373A - Dna聚合酶 - Google Patents

Dna聚合酶 Download PDF

Info

Publication number
CN111433373A
CN111433373A CN201880079055.2A CN201880079055A CN111433373A CN 111433373 A CN111433373 A CN 111433373A CN 201880079055 A CN201880079055 A CN 201880079055A CN 111433373 A CN111433373 A CN 111433373A
Authority
CN
China
Prior art keywords
dna polymerase
seq
leu
glu
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880079055.2A
Other languages
English (en)
Other versions
CN111433373B (zh
Inventor
A·N·拉森
Y·彼得罗夫斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universitetet I Tromso UIT
Original Assignee
Universitetet I Tromso UIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universitetet I Tromso UIT filed Critical Universitetet I Tromso UIT
Publication of CN111433373A publication Critical patent/CN111433373A/zh
Application granted granted Critical
Publication of CN111433373B publication Critical patent/CN111433373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供一种DNA聚合酶,其包括SEQ ID NO.1的序列或与所述SEQ ID NO.1的序列具有至少70%同一性的序列,但是其中所述SEQ ID NO.1的第18位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。本发明进一步提供包含SEQ ID NO.2、11和12的氨基酸序列及其变体的DNA聚合酶。本发明还提供编码所述DNA聚合酶的核酸,生产所述DNA聚合酶的方法,以及包含所述DNA聚合酶的组合物、表达载体和宿主细胞或病毒。本发明还提供所述DNA聚合酶在核苷酸聚合、扩增和测序反应中的用途。

Description

DNA聚合酶
本发明涉及DNA聚合酶。特别地,本发明涉及具有增强的链置换活性(SDA)的经修饰DNA聚合酶。
微生物鉴定的黄金标准仍然是致病原的培养和随后的表型分化,这个过程通常需要花费几天的时间进行并分析,这种延迟可能会对传染病的发病率和死亡率产生重大影响。另外,多种生物不能在培养基上生长,因此,将无法通过现有的培养方法进行检测。
全球范围内的需求是监测和诊断诸如HIV/AIDS、肺结核、疟疾、霍乱等重大传染病。在诸如埃博拉病毒、禽流感和猪流感爆发的潜在流行情况下,挑战变得更加严峻。尽管诊断技术取得了进步,但许多疑似感染的患者仍在接受经验性的抗菌疗法,而不是由迅速鉴定出传染原所决定的适当治疗。结果是过度使用了我们库存少的有效抗菌剂,由于抗菌剂耐药性的发展,有效抗菌剂的数量持续减少。明确需要使得能够鉴定特定病原体的新型快速原位分子诊断测试。
聚合酶链反应(PCR)在多个方面革新了分子遗传学和诊断领域。PCR技术中的主力军是热稳定的高保真DNA聚合酶,其与加热和冷却以获得链分离、引物退火和延伸的循环事件一起,导致目标DNA序列的扩增。PCR技术现已广泛应用于生物医学和生命科学研究以及分子诊断中。
即时护理(POC)诊断被描述为能够在医院环境外的患者社区中进行疾病诊断的医疗工具或装置。理想的诊断测试应符合“ASSURED”标准:价格实惠(Affordable)、灵敏(Sensitive)、特异(Specific)、用户友好(User-friendly)、快速(Rapid)而稳健、无需设备(Equipment-free)且交付(Delivered)给需要的人。POC方法优选是简单的,并且不需要热源或稳定的电源,因为这些通常在POC中是不可用的。因此,所使用的酶和试剂应在环境温度下使用。
尽管PCR技术具有高潜力,但它仍然具有严格的局限性,并且需要使用高精度电动热循环设备以进行重复的加热和冷却过程,并需要技术熟练的人员来运行所述设备。由于退火过程中的虚假引发而导致的非特异性扩增是有问题的,PCR也易于受“粗”样品中的抑制性化合物的影响。此外,PCR装置的庞大设计使得PCR成为并入POC技术平台的有缺陷的解决方案,并使得基于PCR的方法难以用作POC诊断的主要技术推动者。
最近,已经显现出对基于非PCR的方法,特别是等温扩增(IA)方法的越来越多的关注。在这些方法中,核酸扩增在恒定温度下进行,并且不需要高精度的温度循环和控制,也不需要在高温下稳定的酶。据报道,等温扩增方法具有与PCR相当的分析灵敏度和特异性,并且对抑制性化合物具有更高的耐受性,同时缩短了产生结果的时间,并且更易于使用。这些功能使得等温扩增方法对于那些正在开发POC分子诊断平台并旨在满足“ASSURED”标准的人们而言非常期望。在过去的十年中,已经发布了多种不同的核酸(RNA和DNA两者)等温扩增方法(Gill,P.和A.Ghaemi(2008)审阅的《核苷,核苷酸和核酸(NucleosidesNucleotides Nucleic Acids)》27(3):224-243;Craw,P.和W.Balachandran(2012)《芯片实验室(Lab Chip)》12(14):2469-2486;de Paz,H.D.等人(2014)《分子诊断学专家综述(Expert Rev Mol Diagn)》14(7):827-843;Yan,L.等人(2014)《分子生物系统(MolBiosyst)》10(5):970-1003和正在不断开发中的新产品(Liu,W.等人(2015)《科学报告(SciReports)》5:12723)。在多种方法中,成功取决于反应装置中使用的DNA聚合酶的固有链置换活性(SDA)。术语链置换描述了聚合酶置换在合成过程中遇到的下游DNA的能力。
除(POC)诊断外,其它所关注的领域也受益于DNA聚合酶助力的等温扩增技术。在这方面,全基因组扩增(多重置换扩增)很重要,特别是例如在单细胞方法中当存在极其有限量的DNA时。同样,在下一代测序方法中,链置换聚合酶也很重要,如太平洋生物科学公司(Pacific Biosciences)的单分子实时(Single Molecule Real Time)(SMRT)DNA测序技术和由Ma等人在2013年发表的用于下一代测序的等温扩增方法所例示。(Ma,Z.等人《美国科学院院报》110(35):14320-14323)。
然而,在环境温度很好发挥作用的当前的聚合酶工具箱非常有限。通常,不同的等温方法需要在30-65℃之间的反应温度,该温度主要由反应中使用的聚合酶的工作范围决定,并且易于被盐抑制。
已经表征了一种属于DNA聚合酶A家族的来自嗜冷芽胞杆菌属(Psychrobacillussp)(PB)的冷适应性聚合酶。该酶在环境温度下具有高聚合酶活性,但在高达40℃的高温下仍具有良好的稳定性。特别引人关注的是,源自海洋的酶还具有良好的耐盐性和强的链置换活性(SDA)以及25℃下的熟练持续合成能力,可与最新的商业酶相当(WO 2017/162765)。
在多种IA方法中,仅需要聚合酶,并且该方法的有效性在很大程度上取决于聚合酶的SDA。因此,非常需要用于增加IA中使用的PB或其它聚合酶的SDA的任何物质。
本发明人惊奇地发现,A家族中某些聚合酶的指状结构域中的单点突变,特别是单个Asp残基的置换,导致SDA显着增强。
因此,在第一方面,本发明提供一种DNA聚合酶,所述DNA聚合酶包括SEQ ID NO.1的序列或与SEQ ID NO.1的序列具有至少70%,优选至少75%、78%、80%、82%、85%、88%、90%、92%或95%同一性的序列,但其中SEQ ID NO.1第18位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基置换。
SEQ ID NO.1是PB聚合酶I的氨基酸序列的片段,其跨越截短的(缺少5'-3'-核酸外切酶结构域)野生型PB序列的405-436位氨基酸。指状结构域中的该区域(405-436)在某些DNA聚合酶A家族(也称为pol I家族)中高度保守,参见图1和图5。本发明的DNA聚合酶通常将被分类为DNA聚合酶I或A型。
本发明的优选的DNA聚合酶包含SEQ ID NO.6、7、8、9或10的序列,但是其中每个序列第18位处的天冬氨酸残基已被非负电荷的氨基酸残基置换。
在一些实施例中,本发明的DNA聚合酶包含与SEQ ID NO:1相比具有单个或多个氨基酸改变(添加、取代、插入或缺失)的氨基酸序列。除上述Asp残基的置换之外,此类序列优选地可以包含多达8个、7个或6个,例如仅1、2、3、4或5个,优选地1、2或3个,更优选地1或2个被改变的氨基酸。可以由保守或非保守氨基酸进行取代。优选地,所述改变是保守氨基酸取代。
本发明的优选的聚合酶是经修饰PB聚合酶,进一步优选的聚合酶是来自嗜热脂肪土芽胞杆菌(Geobacillus stearothermophilus)种属(称为Bst)、来自枯草杆菌(Bacillussubtilis)(称为Bsu)、来自史密斯芽胞杆菌(Bacillus smithii)(称为Bsm)和嗜热球形脲芽胞杆菌(Ureibacillus thermosphaericus)(被称为Ubts)的经修饰聚合酶。
术语“DNA聚合酶”是指可催化来自单个核苷酸的DNA的5'→3'合成的酶,该反应基于引物延伸和碱基配对至模板链的标准Watson–Crick规则。同样,“DNA聚合酶活性”是指来自单个核苷酸的DNA的5'→3'合成,反应基于引物延伸和碱基配对至模板链的标准Watson–Crick规则。天然存在的或经修饰的聚合酶的酶促活性(催化活性)片段包括在术语“DNA聚合酶”内。聚合酶也可以具有但也可以不具有3'→5'核酸外切酶和/或5'→3'核酸外切酶活性。优选地,本发明的DNA聚合酶缺乏5'→3'核酸外切酶活性。
本发明人发现,上述天冬氨酸残基的置换显着增加了家族中多种不同的DNA聚合酶(称为DNA聚合酶A)中的SDA,可受益于根据本发明的修饰的酶的特征在于与SEQ ID NO.1(PB酶的指状结构域的特定区域)高序列同一性和在第18位或其它酶/序列的等效位置处的天冬氨酸残基。通过使用标准序列比对技术(例如Clustal X2(Larkin,M.A.等人(2007)Clustal W和Clustal X版本2.0.《生物信息学(Bioinformatics)》,23:2947-2948),可以容易识别除SEQ ID NO.1(或其它序列)以外的“其它序列中的等效天冬氨酸残基”。
当然,SEQ ID NO.1本身并不定义完全功能的DNA聚合酶。在优选的实施例中,本发明的DNA聚合酶基于PB DNA聚合酶I的氨基酸序列,优选地缺乏野生型嗜冷芽胞杆菌属DNA聚合酶I序列中存在的5′-3′核酸外切酶结构域。在优选的实施例中,DNA聚合酶中不存在5′-3′核酸外切酶结构域,因为通常不需要5′-3′核酸外切酶活性,因为它可能降解扩增混合物中的引物和/或产物。该截短的野生型PB序列在本文中称为SEQ ID NO.2。
本发明提供一种DNA聚合酶,其包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少60%同一性的氨基酸序列或由SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少60%同一性的氨基酸序列组成,但是其中SEQ ID NO:2的第422位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基置换。
在优选的方面和实施例中,本发明的DNA聚合酶包含与SEQ ID NO:2具有至少70%、或75%,优选至少80%、85%、90%或95%,例如至少98%或99%或99.5%同一性的氨基酸序列或由其组成,但是其中SEQ ID NO.2的第422位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基置换。应当理解,SEQ ID NO.1中的第18位和SEQ ID NO.2中的第422位是等效的,SEQ ID NO.1是SEQ ID NO.2的从405到436位的片段。
图5示出了PB、Bst和Ubts DNA聚合酶的比对。关键的Asp残基分别在位置422处。
在其它优选的实施例或方面中,本发明的DNA聚合酶包含与SEQ ID NO.11或12具有至少60%、70%或75%,优选至少80%、85%、90%或95%,例如至少98%或99%或99.5%同一性的氨基酸序列或由其组成,但是其中SEQ ID NO.11或12的第422位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已经被非负电荷的氨基酸残基取代。编号基于图5的序列比对。SEQ ID NO.11和12分别是野生型Bst和Ubts聚合酶序列的(截短的)变体。
优选地,本发明的DNA聚合酶包含SEQ ID NO:2、11或12的氨基酸序列或由其组成,但是其中SEQ ID NO.2、11或12的第422位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基取代。
在一个实施例中,DNA聚合酶包含SEQ ID NO:4的氨基酸序列(还并入5'→3'核酸外切酶结构域)或其变体或片段或由其组成,但是其中SEQ ID NO.4的第719位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基取代。本文所述的SEQID NO:2的变体和片段的类型在细节上作必要修改后适用于SEQ ID NO:4的变体和片段,例如,变体将与SEQ ID.NO:4具有至少70%,优选至少80%或90%的序列同一性。
本发明的DNA聚合酶包括天然聚合酶的酶促活性片段。酶促活性片段是具有DNA聚合酶活性的片段。酶促活性片段的长度可以是至少400、至少450、至少475、至少500、至少525、至少550、至少560、至少570或至少575个氨基酸。优选的片段的长度为至少525、至少550、至少560、至少570或至少575个氨基酸。所述片段与SEQ ID NO:2、11或12的相应部分具有至少70%,优选至少80%、至少85%或至少90%,更优选至少95%(例如至少98%或99%或99.5%)或100%同一性,但其中SEQ ID NO.2、11或12的第422位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基置换。
可以使用带有环状结构并在8mer茎部内使用FAM作为荧光供体和使用Dabcyl作为受体(非荧光猝灭剂)的分子信标评估DNA聚合酶活性。该茎部具有3'-延伸,其可结合引物并充当DNA聚合酶的模板。当延伸进行时,茎部将被DNA聚合酶打开。通过恢复FAM发射记录两个标签的以下分离。实例中描述了这种类型的合适测定。
本发明的DNA聚合酶具有良好的链置换活性。这是一个重要的特性,因为在多种等温扩增方法中,成功取决于在反应装置中使用的DNA聚合酶的固有链置换活性。术语“链置换”描述聚合酶置换在合成过程中遇到的下游DNA的能力。
评估DNA聚合酶的链置换活性的合适测定是本领域已知的,技术人员很容易能够选择合适的测定。在示例性的链置换活性测定中,将“冷”引物和在其3'末端标记有荧光团(例如TAMRA)的报道分子链退火至在其5'末端具有猝灭剂(例如BHQ2)的模板链(因此,通过猝灭剂的紧密接近而将荧光团猝灭),使得在退火的“冷”引物的3'末端与退火的报道分子链的5'末端之间存在一个核苷酸间隙;当DNA聚合酶具有链置换活性时,荧光团标记的寡核苷酸(报道分子链)被从模板链上置换出来,因此荧光团和淬灭剂不再紧密相邻,可以测量荧光的增加。
可以通过具有以下步骤的测定评估链置换活性:(i)提供在其5'末端具有猝灭剂(荧光猝灭剂)的模板DNA分子,(ii)将冷引物(即,非荧光寡核苷酸)和在其3'末端标记有荧光团的报道分子链(报道分子寡核苷酸)退火至所述模板DNA分子,其中在退火的“冷”引物的3'末端和退火的报道分子链的5'末端之间存在一个核苷酸间隙,由此淬灭剂借助于彼此紧密靠近而淬灭荧光团;(iii)将所述模板冷引物-报道分子链复合物与DNA聚合酶、Me2+和dNTP一起温育,以及(iv)测量之前淬灭的荧光团的荧光增加,其中所述荧光指示链置换活性。
优选的引物、报道分子链和模板链如实例中所述。
在一个优选的实施例中,根据在实例部分中描述的链置换活性测定评估链置换活性(SDA)。优选在聚合酶的约最佳温度下测量SDA。对于PB和其它嗜温菌,可以在25℃-37℃左右。
本发明允许增强野生型DNA聚合酶的SDA。在PB的情况下,与大多数市售聚合酶相比,SDA已经很高,但是通过如本文所述的在第18/422位处进行氨基酸修饰,SDA仍可以显着增加(参见图3)。对于包括在本发明中的热稳定聚合酶,例如Ubts和Bst,原生SDA在环境温度(25-37℃)下非常低。然而,当天冬氨酸残基被一个非负电荷的氨基酸残基置换时,SDA在37℃下仍显着增强。不同的聚合酶可能在不同的情况下有用,例如Bst和Ubts是热稳定的(Tm分别为66℃和62℃),因此增强这些酶中任一种酶的SDA的能力非常有用(参见图6和7)。
因此,在优选的实施例中,本发明的DNA聚合酶比具有完全相同的序列但相对于SEQ ID NO.1和SEQ ID NO.2分别在第18或422位或其它序列的等效位置处具有天冬氨酸的DNA聚合酶具有高至少30%,优选至少50%,更优选至少100%的SDA。优选地,在每种酶表现出其最大SDA的条件下将至少观察到的增加百分比。换句话说,为了使每种酶都能发挥最佳作用,本发明的聚合酶将优选具有比其含天冬氨酸的等效物高至少30%,更优选至少50%,最优选至少100%的SDA。
上面讨论的天冬氨酸残基(其修饰对于本发明提供的益处是关键的)被非负电荷的残基置换。置换通常将涉及用另一个氨基酸残基取代,但是在一些实施例中,天冬氨酸残基可能已经被修饰以去除其负电荷。因此,本发明聚合酶的第18/422位处的残基将是中性或带正电荷的。中性氨基酸包括极性氨基酸和疏水性氨基酸。合适的置换氨基酸包括Ser、Thr、Asn、Gln、Ala、Ile、Leu、Tyr、Val、Lys和Arg。可以并入中性或带正电荷的非标准氨基酸,即非基因编码的氨基酸。Ala是特别优选的。
发明人还发现,与包含上述Asp残基的酶相比,本发明的某些聚合酶在升高的[NaCl]和[KCl]下表现出改善的SDA性能(参见表2和表4)。因此,增强的耐盐性是本发明可以提供的另一优点。
本发明的优选的DNA聚合酶在一定盐(NaCl和/或KCl)浓度范围内具有有用水平的聚合酶活性。换句话说,本发明的优选DNA聚合酶在大范围的盐浓度内表现出在观察到最大聚合酶活性的盐浓度下观察到的DNA聚合酶活性的相当大比例。用于确定DNA聚合酶活性的合适测定在本文其它地方描述。用于确定DNA聚合酶活性的优选测定在实例部分中描述。
在一些实施例中,在约20mM至200mM NaCl或KCl或其混合物的浓度范围内,本发明的DNA聚合酶表现出它们最大聚合酶活性的相当大的比例(例如至少40%,优选至少50%,更优选至少60%)。
在另一方面,本发明提供包含本发明的DNA聚合酶的分子(例如蛋白,例如融合蛋白)。
在整个申请中使用的术语“一”和“一个”以如下意义使用:它们是指所引用部件或步骤的“至少一个”、“至少第一”、“一个或多个”或“多个”,除非是其中在下文中明确规定上限或排除的情况。根据本公开,组合的可操作极限和参数,以及任何单一试剂的量,对于本领域普通技术人员而言将是已知的。
包含编码如本文所定义的本发明的DNA聚合酶或其片段或与之基本同源的核酸分子的核苷酸序列的核酸分子,形成本发明的又一方面。优选的核酸分子是编码SEQ ID NO:2或与其基本同源的序列(例如与其具有至少60%、70%、75%、80%、85%、90%或95%同一性)的DNA聚合酶I的核酸,但是其中SEQ ID NO.2的第422位处的天冬氨酸残基或其它序列中的等效天冬氨酸残基已被非负电荷的氨基酸残基置换。
优选的核酸分子包含如在SEQ ID NO:13、14或15或与其基本同源的序列所示的核苷酸序列,或由其组成。任选地,可以略去SEQ ID NO:13、14或15的最后三个核苷酸。本发明的核酸序列包括与SEQ ID NO:13、14或15具有至少70%或75%,优选至少80%,甚至更优选至少85%、90%、95%、96%、97%、98%、99%或99.5%的序列同一性的序列。因此,本发明的核酸序列包括对SEQ ID NO:13、14或15的序列的单个或多个碱基改变(添加、取代、插入或缺失)。
特别优选的核酸分子包含如SEQ ID NO:13、14或15所示的核苷酸序列或由其组成。
本发明还涉及包含作为本文所述核酸分子的简并形式(例如包含SEQ ID NO:13、14或15或由SEQ ID NO:13、14或15核酸分子组成的核酸分子简并形式)的核苷酸序列的核酸分子(或由其组成)。
本发明的核酸分子优选是“分离的”或“纯化的”。
同源性(例如序列同一性)可以通过任何方便的方法进行评估。然而,为了确定序列之间的同源性(例如同一性)程度,进行序列的多重比对的计算机程序是有用的,例如Clustal W(Thompson,Higgins,Gibson,《核酸研究(Nucleic Acids Res)》22:4673-4680,1994)。如果需要,可以将Clustal W算法与BLOSUM 62评分矩阵(Henikoff和Henikoff,《美国科学学院学报》,89:10915-10919,1992)一起使用并且空位开放罚分为10,空位延伸罚分为0.1,使得在两个序列之间获得最高阶匹配,其中序列之一的总长度的至少50%参与比对。Clustal X是Clustal W的便捷Windows界面(Thompson,J.D等人(1997)Clustal XWindows界面:质量分析工具辅助的多序列比对的灵活策略(The Clustal X windowsinterface:flexible strategies for multiple sequence alignment aided byquality analysis tools).《核酸研究》,25:4876-4882)。
可以用于比对序列的其它方法是Needleman和Wunsch的比对方法(Needleman和Wunsch,《分子生物学杂志(J.Mol.Biol)》,48:443,1970),由Smith和Waterman修订(Smith和Waterman,《应用数学进展(Adv.Appl.Math)》2:482,1981),使得在两个序列之间获得最高阶的匹配,并且在两个序列之间确定相同氨基酸的数目。用于计算两个氨基酸序列之间的同一性百分比的其它方法通常是本领域公知的,包括例如由Carillo和Lipton描述的那些方法(Carillo和Lipton,《SIAM应用数学杂志(SIAM J.Applied Math)》,48:1073,1988)和在《计算分子生物学(Computational Molecular Biology)》,Lesk编辑,牛津大学出版社(Oxford University Press),纽约,1988,“生物计算:信息学和基因组学项目(Biocomputing:Informatics and Genomics Projects)”中描述的那些方法。
通常,将使用计算机程序进行此类计算。比较和比对序列的程序,例如ALIGN(Myers和Miller,CABIOS,4:11-17,1988)、FASTA(Pearson和Lipman,《美国科学学院学报》,85:2444-2448,1988;Pearson,《酶学方法(Methods in Enzymology)》,183:63-98,1990)和有缺口的BLAST(Altschul等人,《核酸研究》,25:3389-3402,1997)、BLASTP、BLASTN或GCG(Devereux,Haeberli,Smithesies,《核酸研究》,12:387,1984)也可用于此目的。此外,欧洲生物信息学研究所的Dali服务器提供基于结构的蛋白序列比对(Holm,《生物化学科学的行业动态(Trends in Biochemical Sciences)》,20:478-480,1995;Holm,《分子生物学杂志》,233:123-38,1993;Holm,《核酸研究》,26:316-9,1998)。
通过提供参考点,具有60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的本发明的序列可以使用带有默认参数的ALIGN程序(例如,在法国蒙彼利埃IGH的GENESTREAM网络服务器上的因特网上可用)来确定。
如本文所用,“保守氨基酸取代”是其中氨基酸残基被具有相似侧链的另一个氨基酸残基置换。具有相似侧链的氨基酸残基家族已在本领域中定义。
本发明的DNA聚合酶包含遗传编码的氨基酸,但是也可以包含一种或多种非遗传编码的氨基酸。
当与诸如DNA聚合酶的蛋白或多肽分子结合使用时,术语“分离的”或“纯化的”通常是指基本上不含细胞材料的蛋白或其它蛋白(来自产生其的来源)。在一些实施例中,当通过重组技术制备时,此类分离的或纯化的蛋白基本上不含培养基,或者当通过化学合成时,此类分离的或纯化的蛋白基本上不含化学前体或其它化学物质。
在另一方面,本发明提供表达载体(优选重组表达载体),其包含本发明的核酸分子或其片段,以及由本发明的核酸分子编码的蛋白序列的转录和翻译所必需的调控序列。
可能的表达载体包括但不限于粘粒或质粒,只要载体与所用宿主细胞相容即可。表达载体“适于宿主细胞的转化”,这意味着表达载体包含本发明的核酸分子和与核酸分子可操作地连接的基于要用于表达的宿主细胞选择的调控序列。可操作地连接意指核酸以允许核酸表达的方式与调控序列连接。
合适的调控序列可源自多种来源,包括细菌、真菌、病毒、哺乳动物或昆虫基因,并且是本领域众所周知的。合适的调控序列的选择取决于如下所述所选择的宿主细胞,并且可以由本领域普通技术人员容易地完成。此类调控序列的示例包括:转录启动子和增强子或RNA聚合酶结合序列、核糖体结合序列,包括翻译起始信号。另外,取决于所选择的宿主细胞和所使用的载体,可以将其它序列,例如复制起点、另外的DNA限制位点、增强子和赋予转录诱导性的序列引入表达载体中。
本发明的重组表达载体还可以包含选择性标志物基因,其促进对用本发明的重组分子转化或转染的宿主细胞的选择。
重组表达载体还可以包含编码融合部分的基因,所述融合部分提供重组蛋白的增加的表达;重组蛋白的溶解度增加和/或通过在亲和纯化中充当配体来帮助纯化目标重组蛋白(例如,可以存在能够纯化和/或鉴定的合适“标签”,例如,His标签或myc标签)。
可以将重组表达载体引入宿主细胞以产生转化的宿主细胞。术语“用……转化”、“用……转染”、“转化”和“转染”旨在涵盖通过本领域已知的多种可行技术中的一种将核酸(例如载体)引入细胞中。在Sambrook等人,1989(Sambrook,Fritsch和Maniatis,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,第二版,冷泉港出版社(Spring Harbor Press),冷泉港,纽约,1989)和其它实验室教科书中可以找到用于转化和转染宿主细胞的合适方法。
合适的宿主细胞包括各种各样的原核宿主细胞和真核细胞。优选地,本发明的蛋白可以在细菌宿主细胞例如大肠杆菌中表达。
包含DNA聚合酶的N末端或C末端融合蛋白和与其它分子缀合的本发明蛋白,例如蛋白(例如表位标签),可以通过重组技术融合来制备。
又一个方面提供包含本发明的一种或多种表达构建体或表达载体的宿主细胞或病毒。还提供包含本发明的一种或多种核酸分子的宿主细胞或病毒。能够表达本发明的DNA聚合酶的宿主细胞或病毒形成又一方面。优选的宿主细胞包括Rosetta 2(DE3)细胞(安诺伦(Novagen))。
本发明的DNA聚合酶可以在宿主细胞中重组制备并从其分离和纯化。因此,本发明的DNA聚合酶可以被认为是重组酶,特别是分离的重组酶。在某些实施例中,DNA聚合酶是通过重组技术在宿主细胞中制备的,所述宿主细胞不是或不是来自与所述DNA聚合酶来源的生物相同的生物。
本发明的DNA聚合酶可以使用重组DNA技术来产生。可替代地,无细胞表达系统可以用于制备DNA聚合酶。可替代地,可以使用化学合成来产生本发明的DNA聚合酶,从而通过一次一个氨基酸的逐步延伸来产生DNA聚合酶。此类化学合成技术(例如固相合成)在蛋白化学中是众所周知的。
本发明的另一方面提供制备本发明的DNA聚合酶的方法,其包含培养本发明的宿主细胞的步骤。优选的方法包含以下步骤:(i)在适合于表达编码的DNA聚合酶或蛋白的条件下,培养包含一种或多种重组表达载体或一种或多种本发明的核酸分子的宿主细胞;以及任选地(ii)从宿主细胞或从生长培养基/上清液中分离或获得DNA聚合酶或蛋白。此类制备方法还可包含纯化DNA聚合酶或蛋白产物和/或将DNA聚合酶或产物配制成包括至少一种另外的组分例如可接受的缓冲剂或载体的组合物的步骤。
可以使用本领域已知的并且在文献中广泛描述的蛋白的任何纯化技术或其任何组合从宿主细胞/培养基中分开或分离DNA聚合酶。此类技术可以包括例如沉淀,超滤,渗析,各种层析技术,例如,尺寸排阻层析、离子交换层析、亲和层析、电泳、离心分离等。如上所述,可以对本发明的DNA聚合酶进行修饰以携带氨基酸基序或其它蛋白或非蛋白标签,例如聚组氨酸标签(例如His6-标签),以帮助分离、增溶和/或纯化或鉴定。
在另一方面,本发明提供本发明的DNA聚合酶用于核苷酸(例如dNTP)聚合的用途。因此,本发明的DNA聚合酶可用于将核酸(DNA)链延伸一个或多个核苷酸。
在另一方面,本发明提供本发明的DNA聚合酶在核酸(DNA)扩增或测序反应中的用途。
在另一方面,本发明提供本发明的DNA聚合酶在分子信标测定或链置换测定中的用途,例如,如本文所述。
优选地,在本发明的用途和方法中,本发明的DNA聚合酶在恒定温度下,即在没有热循环的情况下使用。因此,在等温反应中使用本发明的DNA聚合酶是特别优选的。
在等温扩增反应中使用本发明的DNA聚合酶是特别优选的。等温反应在恒定温度下进行。多种等温扩增技术是本领域已知的,包括环介导等温扩增(LAMP)、滚环扩增(RCA)、链置换扩增(SDA)、多重置换扩增(MDA)和交叉引物扩增(CPA)。
另一方面,本发明提供使用本发明的DNA聚合酶进行核苷酸聚合的方法。优选地,所述方法包含提供反应混合物,其包含本发明的DNA聚合酶、模板核酸分子、能够退火至模板核酸分子的一部分的寡核苷酸引物和一种或多种核苷酸(例如,三磷酸脱氧核糖核苷,dNTP);并在寡核苷酸引物退火至模板核酸分子且所述DNA聚合酶通过使一个或多个核苷酸聚合而延伸所述寡核苷酸引物的条件下温育所述反应混合物。合适的条件是本领域众所周知的。优选地,使用恒定温度,并且优选的温度在本文其它地方列出。可选地,检测多核苷酸产物的产生(例如,通过凝胶电泳)。
另一方面,本发明提供使用本发明的DNA聚合酶扩增核酸(DNA)的方法。通常,所述方法包含提供反应混合物,其包含本发明的DNA聚合酶、模板核酸分子、能够退火至模板核酸分子的一部分的寡核苷酸引物(例如2个或更多个引物,例如2、3、4、5或6个引物)和核苷酸(例如三磷酸脱氧核糖核苷,dNTP);并在寡核苷酸引物退火至模板核酸分子和所述DNA聚合酶通过聚合一个或多个核苷酸以产生多核苷酸来延伸所述寡核苷酸引物的条件下温育所述反应混合物。合适的条件是本领域众所周知的。核酸扩增的优选的方法是等温扩增方法。本发明的等温扩增方法在恒定温度下进行,并且优选的温度在本文其它地方列出。可选地,检测多核苷酸产物的产生(例如,通过凝胶电泳)。
示例性的等温扩增方法包括环介导等温扩增(LAMP)、滚环扩增(RCA),链置换扩增(SDA)、多置换扩增(MDA)和交叉引物扩增(CPA)。
在一些实施例,特别是那些使用基于PB序列的DNA聚合酶的实施例中,在本发明的方法和用途中使用的恒定温度是低至中等的温度,例如选自0℃至约42℃的范围内,优选选自约10℃至约40℃、或约20℃至约40℃、或约25℃至约40℃、或约30℃至约40℃、或约35℃至约40℃、或约37℃至约40℃的范围内。在一些实施例中,恒定温度选自约10℃至约15℃,或约10℃至约20℃的范围内。在一些实施例中,恒定温度选自约10℃至约30℃的范围内。在一些实施例中,恒定温度选自约20℃至约30℃的范围内。在一些实施例中,恒定温度选自约10℃至约25℃的范围内。在一些实施例中,恒定温度选自约20℃至约25℃的范围内。约25℃的恒定温度是优选的。在一些实施例中,恒定温度为25℃。
对于本发明的其它聚合酶,例如那些基于来自嗜热生物体的序列的聚合酶,恒定温度可以是中等温度至高温,例如选自25℃至65℃,优选40℃至65℃的范围内。
当在反应过程中没有采取任何主动步骤来改变温度时,例如没有热循环时,可以认为温度是恒定的。在此方法期间,“恒”温可能仍会导致例如至多约为5℃,通常不超过3℃或2℃的温度波动。
本发明的DNA聚合酶可以用于即时护理分子诊断平台。
本发明的DNA聚合酶可用于全基因组扩增。
本发明的DNA聚合酶可用于下一代测序方法中。所谓的“下一代”或“第二代”测序方法(参考作为“第一代”方法的桑格(Sanger)双脱氧核苷酸方法)已经普及。这些较新的技术的特征在于产出量高,例如由于使用并行,例如大规模并行测序反应,或通过耗时较少的步骤。各种高产出量测序方法可提供单分子测序,并采用诸如焦磷酸测序、可逆终止子测序、通过结扎的可切割的探针测序、通过结扎的不可切割的探针测序、DNA纳米球和实时单分子测序的技术。
本文中对本发明的DNA聚合酶的引用包括活性片段,除非上下文另有明确说明。
本发明的用途和方法通常在体外进行。
本发明还提供包含本发明的DNA聚合酶的组合物。此类组合物优选包含缓冲剂。任选地,本发明的组合物进一步包含用于进行核酸扩增反应(例如等温扩增反应)的一种或多种必要的试剂,例如能够退火至待扩增的模板DNA的区域的寡核苷酸引物和/或核苷酸(例如dNTP)。通常,组合物将是水性的,并用标准缓冲剂(例如Tris、HEPES等)缓冲。
本发明进一步包括试剂盒,其包含一种或多种本发明的DNA聚合酶、或一种或多种本发明的组合物、或一种或多种本发明的核酸分子、或一种或多种本发明的表达载体、或一种或多种本发明的宿主细胞或病毒。优选地,所述试剂盒用于本文所述的方法和用途,例如,用于核酸扩增方法,例如等温扩增反应。优选地,所述试剂盒包含用于使用试剂盒组分,例如用于核酸扩增的说明书。
本文公开的核苷酸和氨基酸序列及其序列标识符(SEQ ID NO)
根据本技术领域的惯例,所有核苷酸序列在本文中以5'至3'记载。
SEQ ID NO:1–来自嗜冷芽胞杆菌属的DNA聚合酶I的指状结构域区域的氨基酸序列。
SEQ ID NO:1
MRRAAKAVNFGIVYGISDYGLSQNLDITRKEA
SEQ ID NO:2-从嗜冷芽胞杆菌属分离的截短的DNA聚合酶I的氨基酸序列。(PB)
SEQ ID NO:2
TEVAFEIVEEIDSTILDKVMSVHLEMYDGQYHTSELLGIALSDGEKGYFAPADIAFQSKDFCSWLENATNKKYLADSKATQAVSRKHNVNVHGVEFDLLLAAYIVNPAISSEDVAAIAKEFGYFNLLTNDSVYGKGAKKTAPEIEKIAEHAVRKARAIWDLKEKLEVKLEENEQYALYKEIELPLASILGTMESDGVLVDKQILVEMGHELNIKLRAIEQDIYALAGETFNINSPKQLGVILFEKIGLTPIKKTKTGYSTAADVLEKLASEHEIIEQILLYRQLGKLNSTYIEGLLKEIHEDDGKIHTRYQQALTSTGRLSSINPNLQNIPVRLEEGRKIRKAFVPSQPGWVMFAADYSQIELRVLAHMSEDENLVEAFNNDLDIHTKTAMDVFHVEQEAVTSDMRRAAKAVNFGIVYGISDYGLSQNLDITRKEAATFIENYLNSFPGVKGYMDDIVQDAKQTGYVTTILNRRRYLPEITSSNFNLRSFAERTAMNTPIQGSAADIIKKAMIDMAERLISENMQTKMLLQVHDELIFEAPPEEIAMLEKIVPEVMENAIKLIVPLKVDYAFGSSWYDTK
SEQ ID NO:3–编码SEQ ID NO:2的嗜冷芽胞杆菌属DNA聚合酶I序列的核酸序列。
SEQ ID NO:3
ACAGAAGTAGCATTCGAGATTGTTGAAGAAATTGACTCTACAATATTAGATAAAGTAATGTCAGTCCATTTAGAAATGTATGATGGGCAATATCATACAAGCGAATTATTAGGTATTGCTTTATCAGATGGAGAAAAGGGTTATTTTGCTCCTGCTGATATAGCTTTTCAATCGAAGGATTTTTGTTCTTGGTTAGAAAATGCTACGAATAAAAAGTATTTAGCAGACTCCAAAGCAACACAAGCAGTGAGTAGAAAACATAATGTGAATGTACATGGAGTGGAATTCGACCTTCTTTTAGCAGCGTATATAGTAAATCCTGCTATCTCTTCAGAGGATGTTGCTGCTATTGCTAAAGAATTTGGATATTTTAACTTGCTGACAAACGATAGTGTTTATGGGAAAGGTGCCAAAAAAACCGCACCTGAAATCGAGAAAATTGCAGAACATGCCGTAAGAAAAGCAAGGGCTATTTGGGACTTGAAAGAAAAGTTAGAAGTAAAACTGGAAGAAAATGAACAATATGCGTTGTATAAAGAAATAGAGCTACCGCTTGCATCTATCCTTGGTACGATGGAATCAGATGGGGTGCTGGTGGATAAACAAATTCTTGTAGAAATGGGTCATGAGCTTAATATTAAGTTACGAGCGATTGAACAAGACATTTATGCGTTAGCTGGTGAAACGTTTAATATTAATTCACCTAAACAATTAGGTGTAATACTATTTGAAAAAATTGGTCTTACCCCTATTAAAAAGACAAAAACGGGCTATTCAACTGCAGCAGATGTTTTGGAAAAACTAGCAAGTGAACATGAAATAATAGAGCAAATTTTACTATATCGTCAATTAGGTAAACTCAATTCCACATATATCGAAGGATTATTAAAAGAGATTCATGAAGATGATGGGAAGATCCATACCCGATATCAACAAGCCCTAACTTCAACTGGGCGTTTGAGTTCGATCAATCCAAACCTTCAAAATATACCAGTTCGTTTAGAAGAAGGTAGAAAAATACGTAAAGCCTTTGTTCCTTCACAACCGGGATGGGTAATGTTTGCGGCGGATTACTCTCAAATTGAATTGCGTGTTCTTGCCCATATGTCTGAGGATGAAAACCTGGTAGAAGCTTTTAATAATGATCTGGATATTCATACTAAAACGGCTATGGATGTATTCCATGTGGAGCAGGAAGCAGTAACGTCCGATATGCGCCGTGCTGCTAAGGCAGTTAACTTTGGGATTGTGTATGGTATTAGTGATTATGGTTTATCACAAAACCTAGATATTACTAGAAAAGAAGCGGCGACATTTATCGAGAATTATTTAAATAGCTTCCCAGGTGTAAAAGGATATATGGATGATATCGTTCAAGATGCGAAACAAACAGGCTACGTTACAACAATTTTGAATAGACGAAGATATTTGCCTGAAATAACAAGTTCTAACTTTAATCTCCGCAGTTTTGCAGAACGTACTGCTATGAATACACCAATTCAAGGGAGTGCAGCCGATATTATTAAAAAAGCAATGATCGATATGGCGGAAAGATTAATATCAGAAAATATGCAGACCAAAATGCTACTACAAGTACATGATGAATTAATTTTTGAGGCTCCACCAGAGGAAATTGCAATGCTAGAAAAAATAGTGCCAGAGGTGATGGAAAACGCTATTAAACTGATTGTACCTTTGAAAGTGGATTATGCCTTTGGTTCATCTTGGTATGACACGAAGTAG
SEQ ID NO:4–从嗜冷芽胞杆菌属分离的全长DNA聚合酶I的氨基酸序列。
SEQ ID NO:4
MYLSTEKILLLDGNSLAYRAFFALPLLTNEHGIHTNAVYGFTMMLQKIMDEENPTHMLVAFDAGKTTFRHSTFGDYKGGRQKTPPELSEQFPYIRKLIDAYGIKRYELEMYEADDIIGTLSKRADEKGQQVVIVSGDKDLTQLATDKTTVYITRKGITDIEKYTPEHVQEKYGLTPLQIIDMKGLMGDASDNIPGVPGVGEKTAIKLLKEHGSVEDLYKALDTVSGVKLKEKLIANEEQAIMSKALATIETAAPIQISIDDLSYTGPNMEEVIEVWKELAFKTLLEKSDYISEESETTEVAFEIVEEIDSTILDKVMSVHLEMYDGQYHTSELLGIALSDGEKGYFAPADIAFQSKDFCSWLENATNKKYLADSKATQAVSRKHNVNVHGVEFDLLLAAYIVNPAISSEDVAAIAKEFGYFNLLTNDSVYGKGAKKTAPEIEKIAEHAVRKARAIWDLKEKLEVKLEENEQYALYKEIELPLASILGTMESDGVLVDKQILVEMGHELNIKLRAIEQDIYALAGETFNINSPKQLGVILFEKIGLTPIKKTKTGYSTAADVLEKLASEHEIIEQILLYRQLGKLNSTYIEGLLKEIHEDDGKIHTRYQQALTSTGRLSSINPNLQNIPVRLEEGRKIRKAFVPSQPGWVMFAADYSQIELRVLAHMSEDENLVEAFNNDLDIHTKTAMDVFHVEQEAVTSDMRRAAKAVNFGIVYGISDYGLSQNLDITRKEAATFIENYLNSFPGVKGYMDDIVQDAKQTGYVTTILNRRRYLPEITSSNFNLRSFAERTAMNTPIQGSAADIIKKAMIDMAERLISENMQTKMLLQVHDELIFEAPPEEIAMLEKIVPEVMENAIKLIVPLKVDYAFGSSWYDTK
SEQ ID NO:5–编码SEQ ID NO:4的嗜冷芽胞杆菌属DNA聚合酶I序列的核酸序列。
SEQ ID NO:5
ATGTATTTGTCAACCGAGAAAATCCTATTATTAGACGGCAATAGTTTGGCATACCGAGCTTTTTTTGCCCTACCTTTATTAACAAATGAACATGGAATACATACAAACGCAGTATATGGCTTTACAATGATGCTACAAAAAATTATGGATGAAGAAAATCCTACTCATATGCTCGTGGCATTTGATGCCGGGAAAACGACCTTCCGTCACTCTACTTTTGGGGATTATAAAGGTGGAAGACAAAAAACACCACCAGAACTATCGGAACAATTCCCTTATATACGCAAGTTAATCGATGCTTATGGTATTAAGCGATACGAACTGGAAATGTACGAAGCAGACGATATTATCGGTACTTTAAGCAAGCGTGCAGACGAAAAAGGGCAGCAAGTTGTAATTGTCTCAGGTGATAAAGATTTAACACAACTAGCTACAGATAAAACAACTGTGTATATCACAAGAAAAGGCATAACCGATATTGAAAAATATACACCTGAACATGTACAAGAAAAGTATGGCTTAACTCCATTACAGATTATAGACATGAAAGGTTTAATGGGAGATGCTTCTGATAATATTCCAGGAGTTCCTGGTGTCGGAGAAAAAACAGCTATTAAGCTTTTAAAAGAACATGGTTCGGTAGAGGATTTATATAAAGCACTTGATACAGTTAGTGGTGTTAAACTAAAGGAAAAACTCATCGCCAACGAAGAGCAGGCAATTATGAGTAAGGCATTAGCTACGATTGAAACAGCTGCACCGATACAGATTTCTATAGACGATCTTTCATATACTGGTCCTAATATGGAAGAAGTAATTGAAGTTTGGAAGGAACTAGCTTTTAAAACTCTTCTTGAGAAATCTGACTATATTTCTGAGGAATCCGAAACTACAGAAGTAGCATTCGAGATTGTTGAAGAAATTGACTCTACAATATTAGATAAAGTAATGTCAGTCCATTTAGAAATGTATGATGGGCAATATCATACAAGCGAATTATTAGGTATTGCTTTATCAGATGGAGAAAAGGGTTATTTTGCTCCTGCTGATATAGCTTTTCAATCGAAGGATTTTTGTTCTTGGTTAGAAAATGCTACGAATAAAAAGTATTTAGCAGACTCCAAAGCAACACAAGCAGTGAGTAGAAAACATAATGTGAATGTACATGGAGTGGAATTCGACCTTCTTTTAGCAGCGTATATAGTAAATCCTGCTATCTCTTCAGAGGATGTTGCTGCTATTGCTAAAGAATTTGGATATTTTAACTTGCTGACAAACGATAGTGTTTATGGGAAAGGTGCCAAAAAAACCGCACCTGAAATCGAGAAAATTGCAGAACATGCCGTAAGAAAAGCAAGGGCTATTTGGGACTTGAAAGAAAAGTTAGAAGTAAAACTGGAAGAAAATGAACAATATGCGTTGTATAAAGAAATAGAGCTACCGCTTGCATCTATCCTTGGTACGATGGAATCAGATGGGGTGCTGGTGGATAAACAAATTCTTGTAGAAATGGGTCATGAGCTTAATATTAAGTTACGAGCGATTGAACAAGACATTTATGCGTTAGCTGGTGAAACGTTTAATATTAATTCACCTAAACAATTAGGTGTAATACTATTTGAAAAAATTGGTCTTACCCCTATTAAAAAGACAAAAACGGGCTATTCAACTGCAGCAGATGTTTTGGAAAAACTAGCAAGTGAACATGAAATAATAGAGCAAATTTTACTATATCGTCAATTAGGTAAACTCAATTCCACATATATCGAAGGATTATTAAAAGAGATTCATGAAGATGATGGGAAGATCCATACCCGATATCAACAAGCCCTAACTTCAACTGGGCGTTTGAGTTCGATCAATCCAAACCTTCAAAATATACCAGTTCGTTTAGAAGAAGGTAGAAAAATACGTAAAGCCTTTGTTCCTTCACAACCGGGATGGGTAATGTTTGCGGCGGATTACTCTCAAATTGAATTGCGTGTTCTTGCCCATATGTCTGAGGATGAAAACCTGGTAGAAGCTTTTAATAATGATCTGGATATTCATACTAAAACGGCTATGGATGTATTCCATGTGGAGCAGGAAGCAGTAACGTCCGATATGCGCCGTGCTGCTAAGGCAGTTAACTTTGGGATTGTGTATGGTATTAGTGATTATGGTTTATCACAAAACCTAGATATTACTAGAAAAGAAGCGGCGACATTTATCGAGAATTATTTAAATAGCTTCCCAGGTGTAAAAGGATATATGGATGATATCGTTCAAGATGCGAAACAAACAGGCTACGTTACAACAATTTTGAATAGACGAAGATATTTGCCTGAAATAACAAGTTCTAACTTTAATCTCCGCAGTTTTGCAGAACGTACTGCTATGAATACACCAATTCAAGGGAGTGCAGCCGATATTATTAAAAAAGCAATGATCGATATGGCGGAAAGATTAATATCAGAAAATATGCAGACCAAAATGCTACTACAAGTACATGATGAATTAATTTTTGAGGCTCCACCAGAGGAAATTGCAATGCTAGAAAAAATAGTGCCAGAGGTGATGGAAAACGCTATTAAACTGATTGTACCTTTGAAAGTGGATTATGCCTTTGGTTCATCTTGGTATGACACGAAGTAG
与SEQ ID NO:1一样,SEQ ID NO:6-10是来自芽胞杆菌属C3_41*、嗜热球形脲芽胞杆菌、枯草芽胞杆菌、史密斯芽胞杆菌和嗜热脂肪土芽胞杆菌的DNA聚合酶I的指状结构域的区域的氨基酸序列。(*=Bei等人.2005,《微生物学文献集(Arch Microbiol)》,186:203-209;基因库登录号DQ309765)。
SEQ ID NO:6
MRRAAKAVNFGIVYGISDYGLSQNLDITRKEA
SEQ ID NO:7
MRRAAKAVNFGIIYGISDYGLSQNLDISRKEA
SEQ ID NO:8
MRRQAKAVNFGIVYGISDYGLSQNLGITRKEA
SEQ ID NO:9
MRRQAKAVNFGIVYGISDYGLSQNLGITRKEA
SEQ ID NO:10
MRRQAKAVNFGIVYGISDYGLAQNLNISRKEA
SEQ ID NO:11是从嗜热脂肪土芽胞杆菌(Bst)分离的截短的DNA聚合酶I的氨基酸序列。
SEQ ID NO:11
AKMAFTLADRVTEEMLADKAALVVEVVEENYHDAPIVGIAVVNEHGRFFLRPETALADPQFVAWLGDETKKKSMFDSKRAAVALKWKGIELCGVSFDLLLAAYLLDPAQGVDDVAAAAKMKQYEAVRPDEAVYGKGAKRAVPDEPVLAEHLVRKAAAIWELERPFLDELRRNEQDRLLVELEQPLSSILAEMEFAGVKVDTKRLEQMGKELAEQLGTVEQRIYELAGQEFNINSPKQLGVILFEKLQLPVLKKTKTGYSTSADVLEKLAPYHEIVENILHYRQLGKLQSTYIEGLLKVVRPDTKKVHTIFNQALTQTGRLSSTEPNLQNIPIRLEEGRKIRQAFVPSESDWLIFAADYSQIELRVLAHIAEDDNLMEAFRRDLDIHTKTAMDIFQVSEDEVTPNMRRQAKAVNFGIVYGISDYGLAQNLNISRKEAAEFIERYFESFPGVKRYMENIVQEAKQKGYVTTLLHRRRYLPDITSRNFNVRSFAERMAMNTPIQGSAADIIKKAMIDLNARLKEERLQAHLLLQVHDELILEAPKEEMERLCRLVPEVMEQAVTLRVPLKVDYHYGSTWYDAK
SEQ ID NO:12是从嗜热球形脲芽胞杆菌(Ubts)分离的截短的DNA聚合酶I的氨基酸序列。
SEQ ID NO:12
AALSFKIVREIAEDLFTDTMAVHVELENEHYHTCNILGFGFTDGSNTFFVPTEVLQKSERLKSYFEDETKKKYMSDLKAAQCILKRHGINLRGVEFDLLLASYIVNPAISGDDVATLAKEFGYTDVRSNEAVYGKGAKWALPSEEVLAEHVCRKAFAIWSCKERVSNKLKENEQFDLYHDLELPLAVILGKMESEGIKVNISTLETMGQELEDKIAKLETEIYELAGETFNINSPKQLGVILFEKLGLPVIKKTKTGYSTAADVLEKLKSEHQIVQLILEYRTLAKLQSTYIEGLIKEVHPKDSKVHTRFMQALTSTGRLSSTDPNLQNIPIRLEEGRKIRKAFVPSHDGWLLFSADYSQIELRVLAHMSKDKNLVEAFNQGMDIHTRTAMEVFHVSQDDVTSNMRRAAKAVNFGIIYGISDYGLSQNLDISRKEAGEFIEKYFESFPGVKEYMDNIVQEAKLKGYVTTILNRRRYLPDITSKNFNLRSFAERTAMNTPIQGSAADIIKKAMLDIDARLNSEGLQAKLLLQVHDELIFEAPKEEIEKLEKIVPEVMESAILLDVPLKVDISYGETWYDAK
SEQ ID NO:13是编码PB D422A突变体的密码子优化的(用于大肠杆菌表达)核酸序列。
SEQ ID NO:13
ACCGAAGTTGCATTTGAAATTGTGGAAGAAATCGATAGCACCATCCTGGATAAAGTTATGAGCGTTCATCTGGAAATGTATGATGGTCAGTATCATACCAGCGAACTGCTGGGTATTGCACTGAGTGATGGTGAAAAAGGTTATTTTGCACCGGCAGATATTGCCTTTCAGAGCAAAGATTTTTGTAGCTGGCTGGAAAATGCCACCAACAAAAAATACCTGGCAGATAGCAAAGCAACCCAGGCAGTTAGCCGTAAACATAATGTTAATGTTCACGGCGTGGAATTTGATCTGCTGCTGGCAGCATATATTGTTAATCCGGCAATTAGCAGCGAAGATGTTGCAGCAATTGCAAAAGAATTCGGCTATTTTAACCTGCTGACCAACGATAGCGTTTATGGTAAAGGTGCAAAAAAAACCGCACCGGAAATTGAAAAAATTGCCGAACATGCAGTTCGTAAAGCACGTGCAATTTGGGATCTGAAAGAAAAACTGGAAGTGAAACTGGAAGAGAACGAACAGTATGCCCTGTATAAAGAAATTGAACTGCCGCTGGCAAGCATTCTGGGCACCATGGAAAGTGATGGTGTTCTGGTTGATAAACAAATCCTGGTTGAAATGGGTCACGAGCTGAACATTAAACTGCGTGCAATTGAACAGGATATTTATGCACTGGCAGGCGAAACCTTTAACATTAATAGCCCGAAACAGCTGGGTGTGATCCTGTTTGAAAAAATCGGTCTGACCCCGATCAAAAAAACCAAAACCGGTTATAGCACCGCAGCAGATGTTCTGGAAAAACTGGCAAGCGAACATGAAATTATTGAGCAGATTCTGCTGTATCGTCAGCTGGGTAAACTGAATAGCACCTATATTGAAGGTCTGCTGAAAGAAATCCATGAGGATGATGGTAAAATCCATACCCGTTATCAGCAGGCACTGACCAGCACCGGTCGTCTGAGCAGCATTAATCCGAATCTGCAGAATATTCCGGTTCGTCTGGAAGAAGGTCGTAAAATTCGTAAAGCATTTGTTCCGAGCCAGCCTGGTTGGGTTATGTTTGCAGCAGATTATAGCCAGATTGAACTGCGTGTTCTGGCACATATGAGCGAAGATGAAAATCTGGTTGAAGCCTTTAACAACGATCTGGATATTCATACCAAAACCGCCATGGATGTTTTTCACGTTGAACAAGAAGCAGTTACCAGCGATATGCGTCGTGCAGCAAAAGCAGTTAATTTTGGTATTGTGTATGGCATCAGCGCTTATGGTCTGAGCCAGAATCTGGATATTACCCGTAAAGAAGCAGCCACCTTTATCGAAAACTACCTGAATAGCTTTCCGGGTGTGAAAGGCTATATGGATGATATTGTTCAGGATGCAAAACAGACCGGTTATGTTACCACCATTCTGAATCGTCGTCGTTATCTGCCGGAAATTACCAGCAGCAACTTTAATCTGCGTAGCTTTGCAGAACGTACCGCAATGAATACCCCGATTCAGGGTAGCGCAGCAGATATTATCAAAAAAGCCATGATTGATATGGCCGAACGTCTGATTAGCGAAAATATGCAGACCAAAATGCTGCTGCAGGTTCATGATGAACTGATTTTTGAAGCACCGCCTGAAGAAATTGCAATGCTGGAAAAAATTGTTCCGGAAGTGATGGAAAACGCCATTAAACTGATTGTTCCGCTGAAAGTGGATTATGCATTTGGTAGCAGTTGGTACGATACCAAATAA
SEQ ID NO:14–是编码Bst D→A突变体的密码子优化的核酸序列。
SEQ ID NO:14
GCCAAAATGGCATTTACCCTGGCAGATCGTGTTACCGAAGAAATGCTGGCAGATAAAGCAGCACTGGTTGTTGAAGTTGTGGAAGAAAATTATCATGATGCACCGATTGTTGGTATTGCCGTTGTTAATGAACATGGCCGTTTTTTTCTGCGTCCGGAAACCGCACTGGCCGATCCGCAGTTTGTTGCATGGCTGGGTGATGAAACCAAAAAAAAGAGCATGTTTGATAGCAAACGTGCAGCAGTTGCACTGAAATGGAAAGGTATTGAACTGTGCGGTGTTTCATTTGATCTGCTGCTGGCAGCATATCTGCTGGATCCGGCACAGGGTGTTGATGATGTTGCAGCAGCAGCAAAGATGAAACAGTATGAAGCAGTTCGTCCGGATGAAGCCGTTTATGGTAAAGGTGCAAAACGTGCCGTGCCGGATGAACCGGTGCTGGCCGAACATCTGGTTCGTAAAGCAGCCGCAATTTGGGAATTAGAACGTCCGTTTCTGGATGAACTGCGTCGTAATGAACAGGATCGTCTGCTGGTTGAACTGGAACAGCCGCTGAGCAGCATTCTGGCAGAAATGGAATTTGCCGGTGTTAAAGTGGATACCAAACGTCTGGAACAAATGGGTAAAGAACTGGCAGAACAGCTGGGCACCGTTGAACAGCGTATTTATGAGCTGGCAGGTCAAGAATTTAACATCAATAGCCCGAAACAACTGGGCGTGATTCTGTTTGAAAAACTGCAGCTGCCGGTTCTGAAAAAAACCAAAACCGGTTATAGCACCAGCGCAGATGTTCTGGAAAAACTGGCACCGTATCATGAAATTGTGGAAAACATTCTGCATTATCGCCAGCTGGGTAAACTGCAGAGCACCTATATTGAAGGTCTGCTGAAAGTTGTTCGTCCCGATACCAAAAAAGTGCACACCATTTTTAACCAGGCACTGACCCAGACCGGTCGTCTGAGCAGTACCGAACCGAATCTGCAGAATATTCCGATTCGTCTGGAAGAAGGTCGTAAAATTCGTCAGGCCTTTGTTCCGAGCGAAAGCGATTGGCTGATTTTTGCAGCAGATTATAGCCAGATTGAACTGCGCGTTCTGGCACATATTGCCGAAGATGATAATCTGATGGAAGCATTTCGTCGCGATCTGGATATTCATACCAAAACAGCCATGGATATTTTTCAGGTGAGCGAAGATGAAGTTACCCCGAATATGCGTCGTCAGGCAAAAGCAGTTAATTTTGGTATTGTGTATGGCATTAGCGCATATGGTCTGGCACAGAATCTGAATATTAGCCGTAAAGAAGCAGCCGAGTTTATCGAACGTTATTTTGAAAGTTTTCCGGGTGTGAAACGCTATATGGAAAATATTGTTCAAGAAGCCAAACAGAAAGGCTATGTTACCACACTGCTGCATCGTCGTCGTTATCTGCCGGATATTACCAGCCGTAACTTTAATGTTCGTAGCTTTGCAGAACGTATGGCAATGAATACCCCGATTCAGGGTAGCGCAGCCGATATTATCAAAAAAGCAATGATTGATCTGAACGCACGCCTGAAAGAAGAACGTCTGCAGGCACATCTGCTGTTACAGGTTCATGATGAACTGATTCTGGAAGCCCCTAAAGAAGAGATGGAACGTCTTTGTCGTCTGGTTCCGGAAGTTATGGAACAGGCAGTTACCCTGCGTGTTCCGCTGAAAGTGGATTATCATTATGGTAGCACCTGGTATGATGCCAAATAA
SEQ ID NO:15–是编码Ubts D→A突变体的密码子优化核酸序列。
SEQ ID NO:15
GCAGCACTGAGCTTTAAAATCGTTCGTGAAATTGCAGAGGACCTGTTTACCGATACCATGGCAGTTCATGTTGAACTGGAAAACGAACATTATCACACGTGCAACATTCTTGGTTTTGGTTTTACCGATGGCAGCAACACCTTTTTTGTTCCGACCGAAGTGCTGCAGAAAAGCGAACGTCTGAAAAGCTATTTTGAGGATGAAACCAAAAAAAAGTATATGAGCGATCTGAAAGCAGCCCAGTGTATTCTGAAACGTCATGGTATTAATCTGCGTGGCGTTGAATTTGATCTGCTGCTGGCAAGCTATATTGTTAATCCGGCAATTAGCGGTGATGATGTTGCAACCCTGGCAAAAGAATTTGGCTATACCGATGTTCGTAGCAATGAAGCCGTTTATGGTAAAGGTGCAAAATGGGCACTGCCGAGCGAAGAGGTTCTGGCAGAACATGTTTGTCGTAAAGCATTTGCAATTTGGAGCTGCAAAGAACGCGTTAGCAATAAACTGAAAGAGAACGAACAGTTCGATCTGTATCATGATCTGGAACTGCCGCTGGCCGTTATTCTGGGTAAAATGGAAAGCGAAGGCATCAAAGTGAATATCAGCACCCTGGAAACCATGGGTCAAGAACTGGAAGATAAAATTGCCAAACTGGAAACCGAGATCTATGAACTGGCAGGCGAAACCTTTAACATTAATAGCCCGAAACAGCTGGGTGTGATCCTGTTTGAAAAACTGGGTCTGCCGGTTATCAAAAAAACGAAAACCGGTTATAGCACCGCAGCAGATGTTCTGGAAAAACTGAAATCAGAACATCAGATTGTGCAGCTGATTCTGGAATATCGTACCCTGGCCAAACTGCAGAGCACCTATATTGAAGGTCTGATCAAAGAAGTGCATCCGAAAGATAGCAAAGTGCATACCCGTTTTATGCAGGCACTGACCAGCACCGGTCGTCTGAGCAGCACCGATCCGAATCTGCAGAATATTCCGATTCGTCTGGAAGAAGGTCGTAAAATTCGCAAAGCCTTTGTGCCGAGCCATGATGGTTGGCTGCTGTTTAGCGCAGATTATAGCCAGATTGAACTGCGTGTTCTGGCACATATGAGCAAAGATAAAAATCTGGTGGAAGCCTTTAACCAAGGCATGGATATTCATACCCGTACCGCAATGGAAGTTTTTCATGTTAGCCAGGATGATGTGACCAGCAATATGCGTCGTGCAGCAAAAGCAGTTAATTTCGGTATTATCTATGGCATTAGCGCATATGGTCTGAGCCAGAATCTGGATATTTCACGTAAAGAAGCAGGCGAATTCATCGAGAAATACTTTGAAAGTTTTCCGGGTGTGAAAGAATATATGGACAACATTGTTCAAGAGGCCAAGCTGAAAGGTTATGTTACCACCATTCTGAATCGTCGTCGTTATCTGCCGGATATTACCAGCAAAAATTTCAATCTGCGTAGCTTTGCAGAACGTACCGCCATGAATACCCCGATTCAGGGTAGCGCAGCCGATATCATCAAAAAAGCAATGCTGGATATTGATGCCCGTCTGAATAGCGAAGGTCTGCAGGCAAAACTGCTGCTGCAGGTTCACGATGAACTGATTTTTGAAGCACCGAAAGAAGAGATCGAGAAGCTGGAAAAAATTGTTCCGGAAGTTATGGAAAGTGCCATTCTGCTGGATGTTCCGCTGAAAGTTGATATTAGCTATGGTGAAACCTGGTACGATGCCAAATAA
现在将参考以下附图通过非限制性实例描述本发明,其中:
图1给出了来自可根据本发明修饰的多个物种的DNA聚合酶I的指状结构域内的区域的序列。关键的天冬氨酸残基为粗体。
图2示出了链置换活性测定装置的概观。F=荧光团。Q=淬灭剂。
图3示出了PB和PB D422A突变体以及包括克列诺片段(KF)的各种商业酶在25℃下的链置换活性的比较。
图4示出了在各种NaCl和KCl浓度(25℃)下野生型和突变型PB聚合酶的聚合酶活性。
图5是来自PB、Bst和Ubts的DNA聚合酶的野生型(截短的)氨基酸序列的序列比对。大箭头指示第422位,其中Asp(D)突变为Ala(A)。比对是使用Clustal X2生成的,并使用ESPript 3.0服务器可视化。
图6示出了在37℃下在10mM KCl存在下D422A突变对嗜热脂肪芽胞杆菌(大片段)聚合酶I(Bst)的链置换活性的影响。
图7示出了在37℃下在10mM KCl存在下D422A突变对嗜热球形脲芽胞杆菌(大片段)聚合酶I(Ubts)的链置换活性的影响。
实例
实例1
序列克隆
PB聚合酶I野生型(大片段)和D422A突变体
将编码来自嗜冷芽胞杆菌属的DNA聚合酶I大片段(即略去蛋白的5'-3'核酸外切酶结构域)的基因(SEQ ID NO:3)克隆到载体pET151/
Figure BDA0002526514260000173
中。将还包含D422A突变(SEQ ID NO:13)的密码子优化的变体克隆到载体pET-11a中。在每种情况下,构建体在聚合酶的N端编码His6标签,随后是TEV蛋白酶的识别序列,从而允许标签的切割。
Bst聚合酶I(大片段)和Ubts聚合酶I(大片段)及其D422A突变体
编码来自嗜热脂肪土芽胞杆菌(Bst)和嗜热球形脲芽胞杆菌(Ubts,基因库登录号WP_016837139)的聚合酶I大片段的密码子优化基因购自赛默飞世尔科技公司(ThermoFisher Scientific)的Invitrogen GeneArt基因合成与服务。通过FastCloning将基因(SEQ ID NO:14和SEQ ID NO:15)克隆到编码N端His6标签的载体pTrc99A中(Li等人(2011),《BMC生物技术(BMC Biotechnology)》,11:92)。使用QuikChange II定点诱变试剂盒(安捷伦科技(Agilent Technologies))引入在第422位(PB聚合酶I大片段)的从Asp到的Ala的相应突变,并通过序列分析进行确认。
蛋白制备和纯化
PB聚合酶I野生型(大片段)和D422A突变体
在Rosetta 2(DE3)细胞
Figure BDA0002526514260000172
中进行重组蛋白制备。使细胞在TerrificBroth培养基中生长,并通过添加0.1mM IPTG在OD600nm 1.0诱导基因表达。蛋白制备在15℃下进行6-8小时。为了纯化蛋白,将1-l培养物的沉淀物重悬于50mM HEPES、500mM NaCl、10mM咪唑、5%甘油、pH 7.5、0.15mg/ml溶菌酶、1蛋白酶抑制剂片剂(cOmpleteTM,微型,无EDTA蛋白酶抑制剂混合物,罗氏公司(Roche))中,并在冰上温育30分钟。通过弗氏压碎器(1.37kbar)进行细胞破碎,然后用来自
Figure BDA0002526514260000171
的VCX 750进行超声处理(脉冲1.0/1.0,5分钟,振幅25%)。在第一步中,通过固定化的Ni2+亲和层析对离心(48384g,45分钟,4℃)后存在的His6标记蛋白的可溶性部分进行纯化。在用50mM HEPES、500mM NaCl、50mM咪唑、5%甘油(pH 7.5)进行洗涤后,将蛋白以250mM的咪唑浓度洗脱,然后使用脱盐柱进一步转移到50mM HEPES、500mM NaCl、10mM MgCl2、5%甘油(pH 7.5)中。
第二步是在50mM Tris pH 8.0、0.5mM EDTA和1mM DTT中于4℃下过夜进行通过TEV蛋白酶切割标签。为了从His6标签和带有His6标签的TEV蛋白酶中分离出蛋白,在第三步中通过应用50mM HEPES、500mM NaCl、5%甘油(pH 7.5)进行第二次Ni2+亲和层析。蛋白纯化的第四步且最后一步是在50mM HEPES、500mM NaCl、5%甘油(pH 7.5)中在HiLoad 16/600Superdex 200pg(通用医疗(GE Healthcare))上进行尺寸排阻层析。将最终的蛋白溶液浓缩并在-20℃下与50%甘油一起储存。
Bst聚合酶I和Ubts聚合酶I(大片段)及其D422A突变体
Bst和Ubts聚合酶I(大片段)及其D422A突变体的重组蛋白制备在Rosetta 2(DE3)细胞
Figure BDA0002526514260000184
中进行。使细胞在37℃下在Luria Bertani培养基中生长,并通过添加0.5mM IPTG在OD600 nm 0.5诱导基因表达。蛋白制备在37℃下进行4小时。为了纯化蛋白,将0.5-l培养物的沉淀物重悬于50mM Tris pH 8.0、300mM NaCl、1mM EDTA、1mM DTT、10mM咪唑、0.15mg/ml溶菌酶、1蛋白酶抑制剂片剂(cOmpleteTM,微型,无EDTA蛋白酶抑制剂混合物,罗氏公司)中,并在冰上温育30分钟。通过使用来自
Figure BDA0002526514260000183
的VCX 750的超声处理进行细胞破碎(脉冲1.0/1.0,15分钟,振幅25%)。通过固定化的Ni2+亲和层析对离心(48384g,45分钟,4℃)后存在的带有His6标签的蛋白的可溶性部分进行纯化。用50mM Tris pH 8.0、300mM NaCl、1mM EDTA、1mM DTT、10mM咪唑进行洗涤步骤后,将咪唑逐渐增加至500mM对蛋白进行洗脱。收集含有蛋白的级分,并通过脱盐将缓冲液交换至20mM Tris pH 7.1、100mMKCl、2mM DTT、0.2mM EDTA和0.2Triton X-100中。将最终的蛋白溶液浓缩并在-20℃下与50%甘油一起储存。
活性测量
聚合酶活性
聚合酶活性测定基于分子信标测定(由Summerer(2008)修订,《分子生物学方法(Methods Mol.Biol.)》,429:225-235)。分子信标模板由23mer环组成,所述23mer环由富含GC的8mer茎部区(斜体表示序列)和43mer 3'延伸区连接。由于茎部环结构,FAM(供体)和Dabcyl(受体,非荧光猝灭剂)分子非常接近,因此FAM荧光信号被猝灭。通过DNA聚合酶延伸引物后,茎部被打开,并通过在485nm处激发并在518nm处记录发射在适当的时间间隔内将FAM荧光性恢复为相对荧光单位来测量两种染料的距离增加。该测量在
Figure BDA0002526514260000182
M2e酶标仪(分子器件(Molecular Devices))中进行。
分子信标模板
5′-GGCCCGTDabcylAGGAGGAAAGGACATCTTCTAGCATFAMACGGGCCGTCAAGTTCATGGCCAGTCAAGTCGTCAGAAATTTCGCACCAC-3'(SEQ ID NO:16)
引物
5′-GTGGTGCGAAATTTCTGAC-3'(SEQ ID NO:17)
通过将20μl 10μM分子信标模板和15μM引物在10mM Tris-HCl pH 8.0、100mMNaCl中于95℃下温育5分钟,从而制备分子信标底物。然后使反应在室温下冷却2小时。将底物溶液在-20℃下储存,最终浓度为10μM。
分析不同[盐]对PB和PB D422A聚合酶活性影响的测定装置
五十微升反应物由200nM底物和200μM dNTP(等摩尔量的dATP、dGTP、dCTP和dTTP)组成。反应物进一步包含pH 8.5的在50mM BIS-Tris丙烷中的5mM MgCl2、1mM DTT、0.2mg/ml BSA和2%甘油。反应缓冲液中的最终盐浓度已针对PB调节为25mM、40mM、60mM、80mM、110mM、160mM和210mM NaCl或KCl,并针对PB D422A调节为20mM、40mM、60mM、80mM、100mM、150mM和200mM NaCl或KCl。活性测定在25℃下于黑色96孔荧光测定板
Figure BDA0002526514260000181
中进行。通过添加蛋白溶液,即添加聚合酶来引发反应。
结果如图4所示。
用于分析PB和PB D422A在100mM、150mM和200mM NaCl中的特异性聚合酶活性的测 定装置
五十微升反应物由200nM底物和200μM dNTP(等摩尔量的dATP、dGTP、dCTP和dTTP)组成。反应物进一步包含pH 8.5的在50mM BIS-Tris丙烷中的5mM MgCl2、1mM DTT、0.2mg/ml BSA和2%甘油。反应缓冲液中的最终盐浓度已分别调节为100mM、150mM和200mM NaCl。该测定在25℃下于黑色96孔荧光测定板
Figure BDA0002526514260000193
中进行。通过添加蛋白溶液,即添加聚合酶来引发反应。
结果示于表3(实例末尾处)。
链置换活性测定
图2示出了测定装置的概观。该测定基于荧光信号的增加,荧光信号的增加是在仅可通过DNA聚合酶的链置换活性实现的淬灭的报道分子链的置换时测量的。
用于链置换活性测定的底物由19个寡核苷酸的“冷”引物(SEQ ID NO:18)和由20个寡核苷酸组成的报道分子链组成,该报道分子链在其3'端用TAMRA荧光团(F)标记(SEQID NO:19)。模板链由40个寡核苷酸组成,并在其5'端用黑洞淬灭剂2(BHQ2)标记(SEQ IDNO:20)。引物退火至模板链,在模板链的第20位留下一个核苷酸缺口。标记非常接近,因此荧光团TAMRA被BHQ2淬灭。当DNA聚合酶I具有链置换活性时,TAMRA标记的寡核苷酸被从模板链置换。结果,荧光团和淬灭剂不再紧密靠近,可以在适当的时间间隔(525nm处激发,598nm处发射,
Figure BDA0002526514260000191
M2e酶标仪(分子器件))中以相对荧光单位测量TAMRA荧光的增加。
5'-TATCCACCAATACTACCCT CGATACTTTGTCCACTCAAT[TAMRA]-3'
3'-ATAGGTGGTTATGATGGGATGCTATGAAACAGGTGAGTTA[BHQ2]-5'
通过在10mM Tris-HCl pH 8.0、100mM NaCl中于95℃下温育20μl 10μM“冷”引物、10μM报道分子链和10μM模板链5分钟,制备用于链置换活性测定的底物。然后使反应在室温下冷却2小时。将底物溶液在-20℃下储存,最终浓度为10μM。
用于比较PB、PB D422A和商业上已知的聚合酶的特定链置换活性的测定装置
五十微升反应物由200nM底物和200μM dNTP(等摩尔量的dATP、dGTP、dCTP和dTTP)组成。对于PB聚合酶I,反应物进一步包含pH 8.5的在50mM BIS-TRIS丙烷中的5mM MgCl2、100mM NaCl、1mM DTT、0.2mg/ml BSA和2%甘油。对于商业上已知的聚合酶I,已经使用了新英格兰生物学实验室(New England Biolabs)提供的相应反应缓冲液。根据相应聚合酶的最佳盐浓度,将反应缓冲液中的最终盐浓度调整为100mM。活性测定在25℃下于黑色96孔荧光测定板
Figure BDA0002526514260000192
中进行。通过添加蛋白溶液(即添加聚合酶)来引发反应。
结果如图3所示。
PB和PB D422A在100mM、150mM和200mM NaCl中的特定链置换活性的测定装置
五十微升反应物由200nM底物和200μM dNTP(等摩尔量的dATP、dGTP、dCTP和dTTP)组成。反应物进一步包含pH 8.5的在50mM BIS-Tris丙烷中的5mM MgCl2、1mM DTT、0.2mg/ml BSA和2%甘油。反应缓冲液中的最终盐浓度已分别调节为100mM、150mM和200mM NaCl。该测定在25℃下于黑色96孔荧光测定板
Figure BDA0002526514260000201
中进行。通过添加蛋白溶液,即添加聚合酶来引发反应。
结果示于下表2。
用于分析Bst/BstD422A和Ubts/UbtsD422A的链置换活性的测定装置
五十微升反应物由200nM底物和200μM dNTP(等摩尔量的dATP、dGTP、dCTP和dTTP)组成。反应物进一步包含20mM Tris pH 7.9(在25°下)、10mM KCl、10mM(NH4)2SO4、2mMMgSO4、0.1%Triton X-100。
该测定在37℃下于黑色96孔荧光测定板
Figure BDA0002526514260000202
中进行。通过添加蛋白溶液(对于Bst和BstD422A为20ng,对于Ubts和UbtsD422A为100ng),即添加聚合酶来引发反应。为了确定在较高KCl下的特定链置换活性(mRFU/min/μg),最终浓度已设置为150mM KCl。通过在525nm处激发并在598nm处记录发射,以适当的时间间隔以相对荧光单位测量TAMRA荧光的增加。该测量在
Figure BDA0002526514260000203
M2e酶标仪(分子器件)中进行。
基于链置换活性测定的结果示于下面的图6和7以及表4中。突变酶均显示出增强的活性。
表1.wtPB和D422A突变体(在25℃下)的不同酶促性质的总结。
Figure BDA0002526514260000204
表2。与存在100-200mM NaCl的wtPB相比,PB D422A突变体的链置换活性。
Figure BDA0002526514260000205
表3。与存在100-200mM NaCl的wt PB相比,PB D422A突变体的DNA聚合酶活性。
Figure BDA0002526514260000206
Figure BDA0002526514260000211
表4。与存在150mM KCl的wt酶相比,Bst和Ubts的D422A突变体的链置换活性。
Figure BDA0002526514260000212
实例2
另外的嗜冷芽胞杆菌属(PB)DNA聚合酶突变体也已制备并测试:
定点诱变
使用QuikChange II定点诱变试剂盒(安捷伦科技公司)在第422位引入分别从Asp到Ser、Lys、Val、Leu和Asn的突变。
D422V和D422L(不同长度的疏水残基),
D422S(亲水性小),
D422N(亲水性较大)和
D422K(带正电荷)。
起始点是D422A突变体的质粒DNA。通过测序分析确认突变。
蛋白制备和蛋白纯化
在Rosetta 2(DE3)细胞
Figure BDA0002526514260000213
中进行重组蛋白制备。使细胞在TerrificBroth培养基中生长,并通过添加0.1mM IPTG在OD600nm1.0诱导基因表达。蛋白制备在15℃下进行6-8小时。为了纯化蛋白,将50ml培养物的沉淀重悬于1ml 50mM HEPES、500mM NaCl、10mM咪唑、5%甘油、pH 7.5、0.15mg/ml溶菌酶中,并在冰上温育20分钟。通过使用来自
Figure BDA0002526514260000214
的VCX 750的超声处理进行细胞破碎(脉冲1.0/1.0,1分钟,振幅20%)。
用PureProteomeTM磁珠(密理博(Millipore))对离心(16000g,30分钟,4℃)后存在的带有His6标签的蛋白的可溶性部分进行纯化,并在pH 7.5的50μl 50mM HEPES、500mMNaCl、500mM咪唑、5%的甘油中洗脱。
如实例1中所述进行链置换测定。
与wt PB聚合酶相比,所有这些其它突变体在链置换活性的测定中表现较好(数据未示出),但不及PB D422A突变体。
序列表
<110> 特罗姆瑟大学-挪威北极圈大学
<120> DNA聚合酶
<130> FSP1V201176ZX
<150> GB1721053.5
<151> 2017-12-15
<160> 20
<170> PatentIn版本3.5
<210> 1
<211> 32
<212> PRT
<213> 嗜冷芽胞杆菌属
<400> 1
Met Arg Arg Ala Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile
1 5 10 15
Ser Asp Tyr Gly Leu Ser Gln Asn Leu Asp Ile Thr Arg Lys Glu Ala
20 25 30
<210> 2
<211> 580
<212> PRT
<213> 嗜冷芽胞杆菌属
<400> 2
Thr Glu Val Ala Phe Glu Ile Val Glu Glu Ile Asp Ser Thr Ile Leu
1 5 10 15
Asp Lys Val Met Ser Val His Leu Glu Met Tyr Asp Gly Gln Tyr His
20 25 30
Thr Ser Glu Leu Leu Gly Ile Ala Leu Ser Asp Gly Glu Lys Gly Tyr
35 40 45
Phe Ala Pro Ala Asp Ile Ala Phe Gln Ser Lys Asp Phe Cys Ser Trp
50 55 60
Leu Glu Asn Ala Thr Asn Lys Lys Tyr Leu Ala Asp Ser Lys Ala Thr
65 70 75 80
Gln Ala Val Ser Arg Lys His Asn Val Asn Val His Gly Val Glu Phe
85 90 95
Asp Leu Leu Leu Ala Ala Tyr Ile Val Asn Pro Ala Ile Ser Ser Glu
100 105 110
Asp Val Ala Ala Ile Ala Lys Glu Phe Gly Tyr Phe Asn Leu Leu Thr
115 120 125
Asn Asp Ser Val Tyr Gly Lys Gly Ala Lys Lys Thr Ala Pro Glu Ile
130 135 140
Glu Lys Ile Ala Glu His Ala Val Arg Lys Ala Arg Ala Ile Trp Asp
145 150 155 160
Leu Lys Glu Lys Leu Glu Val Lys Leu Glu Glu Asn Glu Gln Tyr Ala
165 170 175
Leu Tyr Lys Glu Ile Glu Leu Pro Leu Ala Ser Ile Leu Gly Thr Met
180 185 190
Glu Ser Asp Gly Val Leu Val Asp Lys Gln Ile Leu Val Glu Met Gly
195 200 205
His Glu Leu Asn Ile Lys Leu Arg Ala Ile Glu Gln Asp Ile Tyr Ala
210 215 220
Leu Ala Gly Glu Thr Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly Val
225 230 235 240
Ile Leu Phe Glu Lys Ile Gly Leu Thr Pro Ile Lys Lys Thr Lys Thr
245 250 255
Gly Tyr Ser Thr Ala Ala Asp Val Leu Glu Lys Leu Ala Ser Glu His
260 265 270
Glu Ile Ile Glu Gln Ile Leu Leu Tyr Arg Gln Leu Gly Lys Leu Asn
275 280 285
Ser Thr Tyr Ile Glu Gly Leu Leu Lys Glu Ile His Glu Asp Asp Gly
290 295 300
Lys Ile His Thr Arg Tyr Gln Gln Ala Leu Thr Ser Thr Gly Arg Leu
305 310 315 320
Ser Ser Ile Asn Pro Asn Leu Gln Asn Ile Pro Val Arg Leu Glu Glu
325 330 335
Gly Arg Lys Ile Arg Lys Ala Phe Val Pro Ser Gln Pro Gly Trp Val
340 345 350
Met Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His
355 360 365
Met Ser Glu Asp Glu Asn Leu Val Glu Ala Phe Asn Asn Asp Leu Asp
370 375 380
Ile His Thr Lys Thr Ala Met Asp Val Phe His Val Glu Gln Glu Ala
385 390 395 400
Val Thr Ser Asp Met Arg Arg Ala Ala Lys Ala Val Asn Phe Gly Ile
405 410 415
Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ser Gln Asn Leu Asp Ile Thr
420 425 430
Arg Lys Glu Ala Ala Thr Phe Ile Glu Asn Tyr Leu Asn Ser Phe Pro
435 440 445
Gly Val Lys Gly Tyr Met Asp Asp Ile Val Gln Asp Ala Lys Gln Thr
450 455 460
Gly Tyr Val Thr Thr Ile Leu Asn Arg Arg Arg Tyr Leu Pro Glu Ile
465 470 475 480
Thr Ser Ser Asn Phe Asn Leu Arg Ser Phe Ala Glu Arg Thr Ala Met
485 490 495
Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala Met
500 505 510
Ile Asp Met Ala Glu Arg Leu Ile Ser Glu Asn Met Gln Thr Lys Met
515 520 525
Leu Leu Gln Val His Asp Glu Leu Ile Phe Glu Ala Pro Pro Glu Glu
530 535 540
Ile Ala Met Leu Glu Lys Ile Val Pro Glu Val Met Glu Asn Ala Ile
545 550 555 560
Lys Leu Ile Val Pro Leu Lys Val Asp Tyr Ala Phe Gly Ser Ser Trp
565 570 575
Tyr Asp Thr Lys
580
<210> 3
<211> 1743
<212> DNA
<213> 嗜冷芽胞杆菌属
<400> 3
acagaagtag cattcgagat tgttgaagaa attgactcta caatattaga taaagtaatg 60
tcagtccatt tagaaatgta tgatgggcaa tatcatacaa gcgaattatt aggtattgct 120
ttatcagatg gagaaaaggg ttattttgct cctgctgata tagcttttca atcgaaggat 180
ttttgttctt ggttagaaaa tgctacgaat aaaaagtatt tagcagactc caaagcaaca 240
caagcagtga gtagaaaaca taatgtgaat gtacatggag tggaattcga ccttctttta 300
gcagcgtata tagtaaatcc tgctatctct tcagaggatg ttgctgctat tgctaaagaa 360
tttggatatt ttaacttgct gacaaacgat agtgtttatg ggaaaggtgc caaaaaaacc 420
gcacctgaaa tcgagaaaat tgcagaacat gccgtaagaa aagcaagggc tatttgggac 480
ttgaaagaaa agttagaagt aaaactggaa gaaaatgaac aatatgcgtt gtataaagaa 540
atagagctac cgcttgcatc tatccttggt acgatggaat cagatggggt gctggtggat 600
aaacaaattc ttgtagaaat gggtcatgag cttaatatta agttacgagc gattgaacaa 660
gacatttatg cgttagctgg tgaaacgttt aatattaatt cacctaaaca attaggtgta 720
atactatttg aaaaaattgg tcttacccct attaaaaaga caaaaacggg ctattcaact 780
gcagcagatg ttttggaaaa actagcaagt gaacatgaaa taatagagca aattttacta 840
tatcgtcaat taggtaaact caattccaca tatatcgaag gattattaaa agagattcat 900
gaagatgatg ggaagatcca tacccgatat caacaagccc taacttcaac tgggcgtttg 960
agttcgatca atccaaacct tcaaaatata ccagttcgtt tagaagaagg tagaaaaata 1020
cgtaaagcct ttgttccttc acaaccggga tgggtaatgt ttgcggcgga ttactctcaa 1080
attgaattgc gtgttcttgc ccatatgtct gaggatgaaa acctggtaga agcttttaat 1140
aatgatctgg atattcatac taaaacggct atggatgtat tccatgtgga gcaggaagca 1200
gtaacgtccg atatgcgccg tgctgctaag gcagttaact ttgggattgt gtatggtatt 1260
agtgattatg gtttatcaca aaacctagat attactagaa aagaagcggc gacatttatc 1320
gagaattatt taaatagctt cccaggtgta aaaggatata tggatgatat cgttcaagat 1380
gcgaaacaaa caggctacgt tacaacaatt ttgaatagac gaagatattt gcctgaaata 1440
acaagttcta actttaatct ccgcagtttt gcagaacgta ctgctatgaa tacaccaatt 1500
caagggagtg cagccgatat tattaaaaaa gcaatgatcg atatggcgga aagattaata 1560
tcagaaaata tgcagaccaa aatgctacta caagtacatg atgaattaat ttttgaggct 1620
ccaccagagg aaattgcaat gctagaaaaa atagtgccag aggtgatgga aaacgctatt 1680
aaactgattg tacctttgaa agtggattat gcctttggtt catcttggta tgacacgaag 1740
tag 1743
<210> 4
<211> 877
<212> PRT
<213> 嗜冷芽胞杆菌属
<400> 4
Met Tyr Leu Ser Thr Glu Lys Ile Leu Leu Leu Asp Gly Asn Ser Leu
1 5 10 15
Ala Tyr Arg Ala Phe Phe Ala Leu Pro Leu Leu Thr Asn Glu His Gly
20 25 30
Ile His Thr Asn Ala Val Tyr Gly Phe Thr Met Met Leu Gln Lys Ile
35 40 45
Met Asp Glu Glu Asn Pro Thr His Met Leu Val Ala Phe Asp Ala Gly
50 55 60
Lys Thr Thr Phe Arg His Ser Thr Phe Gly Asp Tyr Lys Gly Gly Arg
65 70 75 80
Gln Lys Thr Pro Pro Glu Leu Ser Glu Gln Phe Pro Tyr Ile Arg Lys
85 90 95
Leu Ile Asp Ala Tyr Gly Ile Lys Arg Tyr Glu Leu Glu Met Tyr Glu
100 105 110
Ala Asp Asp Ile Ile Gly Thr Leu Ser Lys Arg Ala Asp Glu Lys Gly
115 120 125
Gln Gln Val Val Ile Val Ser Gly Asp Lys Asp Leu Thr Gln Leu Ala
130 135 140
Thr Asp Lys Thr Thr Val Tyr Ile Thr Arg Lys Gly Ile Thr Asp Ile
145 150 155 160
Glu Lys Tyr Thr Pro Glu His Val Gln Glu Lys Tyr Gly Leu Thr Pro
165 170 175
Leu Gln Ile Ile Asp Met Lys Gly Leu Met Gly Asp Ala Ser Asp Asn
180 185 190
Ile Pro Gly Val Pro Gly Val Gly Glu Lys Thr Ala Ile Lys Leu Leu
195 200 205
Lys Glu His Gly Ser Val Glu Asp Leu Tyr Lys Ala Leu Asp Thr Val
210 215 220
Ser Gly Val Lys Leu Lys Glu Lys Leu Ile Ala Asn Glu Glu Gln Ala
225 230 235 240
Ile Met Ser Lys Ala Leu Ala Thr Ile Glu Thr Ala Ala Pro Ile Gln
245 250 255
Ile Ser Ile Asp Asp Leu Ser Tyr Thr Gly Pro Asn Met Glu Glu Val
260 265 270
Ile Glu Val Trp Lys Glu Leu Ala Phe Lys Thr Leu Leu Glu Lys Ser
275 280 285
Asp Tyr Ile Ser Glu Glu Ser Glu Thr Thr Glu Val Ala Phe Glu Ile
290 295 300
Val Glu Glu Ile Asp Ser Thr Ile Leu Asp Lys Val Met Ser Val His
305 310 315 320
Leu Glu Met Tyr Asp Gly Gln Tyr His Thr Ser Glu Leu Leu Gly Ile
325 330 335
Ala Leu Ser Asp Gly Glu Lys Gly Tyr Phe Ala Pro Ala Asp Ile Ala
340 345 350
Phe Gln Ser Lys Asp Phe Cys Ser Trp Leu Glu Asn Ala Thr Asn Lys
355 360 365
Lys Tyr Leu Ala Asp Ser Lys Ala Thr Gln Ala Val Ser Arg Lys His
370 375 380
Asn Val Asn Val His Gly Val Glu Phe Asp Leu Leu Leu Ala Ala Tyr
385 390 395 400
Ile Val Asn Pro Ala Ile Ser Ser Glu Asp Val Ala Ala Ile Ala Lys
405 410 415
Glu Phe Gly Tyr Phe Asn Leu Leu Thr Asn Asp Ser Val Tyr Gly Lys
420 425 430
Gly Ala Lys Lys Thr Ala Pro Glu Ile Glu Lys Ile Ala Glu His Ala
435 440 445
Val Arg Lys Ala Arg Ala Ile Trp Asp Leu Lys Glu Lys Leu Glu Val
450 455 460
Lys Leu Glu Glu Asn Glu Gln Tyr Ala Leu Tyr Lys Glu Ile Glu Leu
465 470 475 480
Pro Leu Ala Ser Ile Leu Gly Thr Met Glu Ser Asp Gly Val Leu Val
485 490 495
Asp Lys Gln Ile Leu Val Glu Met Gly His Glu Leu Asn Ile Lys Leu
500 505 510
Arg Ala Ile Glu Gln Asp Ile Tyr Ala Leu Ala Gly Glu Thr Phe Asn
515 520 525
Ile Asn Ser Pro Lys Gln Leu Gly Val Ile Leu Phe Glu Lys Ile Gly
530 535 540
Leu Thr Pro Ile Lys Lys Thr Lys Thr Gly Tyr Ser Thr Ala Ala Asp
545 550 555 560
Val Leu Glu Lys Leu Ala Ser Glu His Glu Ile Ile Glu Gln Ile Leu
565 570 575
Leu Tyr Arg Gln Leu Gly Lys Leu Asn Ser Thr Tyr Ile Glu Gly Leu
580 585 590
Leu Lys Glu Ile His Glu Asp Asp Gly Lys Ile His Thr Arg Tyr Gln
595 600 605
Gln Ala Leu Thr Ser Thr Gly Arg Leu Ser Ser Ile Asn Pro Asn Leu
610 615 620
Gln Asn Ile Pro Val Arg Leu Glu Glu Gly Arg Lys Ile Arg Lys Ala
625 630 635 640
Phe Val Pro Ser Gln Pro Gly Trp Val Met Phe Ala Ala Asp Tyr Ser
645 650 655
Gln Ile Glu Leu Arg Val Leu Ala His Met Ser Glu Asp Glu Asn Leu
660 665 670
Val Glu Ala Phe Asn Asn Asp Leu Asp Ile His Thr Lys Thr Ala Met
675 680 685
Asp Val Phe His Val Glu Gln Glu Ala Val Thr Ser Asp Met Arg Arg
690 695 700
Ala Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile Ser Asp Tyr
705 710 715 720
Gly Leu Ser Gln Asn Leu Asp Ile Thr Arg Lys Glu Ala Ala Thr Phe
725 730 735
Ile Glu Asn Tyr Leu Asn Ser Phe Pro Gly Val Lys Gly Tyr Met Asp
740 745 750
Asp Ile Val Gln Asp Ala Lys Gln Thr Gly Tyr Val Thr Thr Ile Leu
755 760 765
Asn Arg Arg Arg Tyr Leu Pro Glu Ile Thr Ser Ser Asn Phe Asn Leu
770 775 780
Arg Ser Phe Ala Glu Arg Thr Ala Met Asn Thr Pro Ile Gln Gly Ser
785 790 795 800
Ala Ala Asp Ile Ile Lys Lys Ala Met Ile Asp Met Ala Glu Arg Leu
805 810 815
Ile Ser Glu Asn Met Gln Thr Lys Met Leu Leu Gln Val His Asp Glu
820 825 830
Leu Ile Phe Glu Ala Pro Pro Glu Glu Ile Ala Met Leu Glu Lys Ile
835 840 845
Val Pro Glu Val Met Glu Asn Ala Ile Lys Leu Ile Val Pro Leu Lys
850 855 860
Val Asp Tyr Ala Phe Gly Ser Ser Trp Tyr Asp Thr Lys
865 870 875
<210> 5
<211> 2634
<212> DNA
<213> 嗜冷芽胞杆菌属
<400> 5
atgtatttgt caaccgagaa aatcctatta ttagacggca atagtttggc ataccgagct 60
ttttttgccc tacctttatt aacaaatgaa catggaatac atacaaacgc agtatatggc 120
tttacaatga tgctacaaaa aattatggat gaagaaaatc ctactcatat gctcgtggca 180
tttgatgccg ggaaaacgac cttccgtcac tctacttttg gggattataa aggtggaaga 240
caaaaaacac caccagaact atcggaacaa ttcccttata tacgcaagtt aatcgatgct 300
tatggtatta agcgatacga actggaaatg tacgaagcag acgatattat cggtacttta 360
agcaagcgtg cagacgaaaa agggcagcaa gttgtaattg tctcaggtga taaagattta 420
acacaactag ctacagataa aacaactgtg tatatcacaa gaaaaggcat aaccgatatt 480
gaaaaatata cacctgaaca tgtacaagaa aagtatggct taactccatt acagattata 540
gacatgaaag gtttaatggg agatgcttct gataatattc caggagttcc tggtgtcgga 600
gaaaaaacag ctattaagct tttaaaagaa catggttcgg tagaggattt atataaagca 660
cttgatacag ttagtggtgt taaactaaag gaaaaactca tcgccaacga agagcaggca 720
attatgagta aggcattagc tacgattgaa acagctgcac cgatacagat ttctatagac 780
gatctttcat atactggtcc taatatggaa gaagtaattg aagtttggaa ggaactagct 840
tttaaaactc ttcttgagaa atctgactat atttctgagg aatccgaaac tacagaagta 900
gcattcgaga ttgttgaaga aattgactct acaatattag ataaagtaat gtcagtccat 960
ttagaaatgt atgatgggca atatcataca agcgaattat taggtattgc tttatcagat 1020
ggagaaaagg gttattttgc tcctgctgat atagcttttc aatcgaagga tttttgttct 1080
tggttagaaa atgctacgaa taaaaagtat ttagcagact ccaaagcaac acaagcagtg 1140
agtagaaaac ataatgtgaa tgtacatgga gtggaattcg accttctttt agcagcgtat 1200
atagtaaatc ctgctatctc ttcagaggat gttgctgcta ttgctaaaga atttggatat 1260
tttaacttgc tgacaaacga tagtgtttat gggaaaggtg ccaaaaaaac cgcacctgaa 1320
atcgagaaaa ttgcagaaca tgccgtaaga aaagcaaggg ctatttggga cttgaaagaa 1380
aagttagaag taaaactgga agaaaatgaa caatatgcgt tgtataaaga aatagagcta 1440
ccgcttgcat ctatccttgg tacgatggaa tcagatgggg tgctggtgga taaacaaatt 1500
cttgtagaaa tgggtcatga gcttaatatt aagttacgag cgattgaaca agacatttat 1560
gcgttagctg gtgaaacgtt taatattaat tcacctaaac aattaggtgt aatactattt 1620
gaaaaaattg gtcttacccc tattaaaaag acaaaaacgg gctattcaac tgcagcagat 1680
gttttggaaa aactagcaag tgaacatgaa ataatagagc aaattttact atatcgtcaa 1740
ttaggtaaac tcaattccac atatatcgaa ggattattaa aagagattca tgaagatgat 1800
gggaagatcc atacccgata tcaacaagcc ctaacttcaa ctgggcgttt gagttcgatc 1860
aatccaaacc ttcaaaatat accagttcgt ttagaagaag gtagaaaaat acgtaaagcc 1920
tttgttcctt cacaaccggg atgggtaatg tttgcggcgg attactctca aattgaattg 1980
cgtgttcttg cccatatgtc tgaggatgaa aacctggtag aagcttttaa taatgatctg 2040
gatattcata ctaaaacggc tatggatgta ttccatgtgg agcaggaagc agtaacgtcc 2100
gatatgcgcc gtgctgctaa ggcagttaac tttgggattg tgtatggtat tagtgattat 2160
ggtttatcac aaaacctaga tattactaga aaagaagcgg cgacatttat cgagaattat 2220
ttaaatagct tcccaggtgt aaaaggatat atggatgata tcgttcaaga tgcgaaacaa 2280
acaggctacg ttacaacaat tttgaataga cgaagatatt tgcctgaaat aacaagttct 2340
aactttaatc tccgcagttt tgcagaacgt actgctatga atacaccaat tcaagggagt 2400
gcagccgata ttattaaaaa agcaatgatc gatatggcgg aaagattaat atcagaaaat 2460
atgcagacca aaatgctact acaagtacat gatgaattaa tttttgaggc tccaccagag 2520
gaaattgcaa tgctagaaaa aatagtgcca gaggtgatgg aaaacgctat taaactgatt 2580
gtacctttga aagtggatta tgcctttggt tcatcttggt atgacacgaa gtag 2634
<210> 6
<211> 32
<212> PRT
<213> 芽胞杆菌属C3_41
<400> 6
Met Arg Arg Ala Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile
1 5 10 15
Ser Asp Tyr Gly Leu Ser Gln Asn Leu Asp Ile Thr Arg Lys Glu Ala
20 25 30
<210> 7
<211> 32
<212> PRT
<213> 嗜热球形脲芽胞杆菌
<400> 7
Met Arg Arg Ala Ala Lys Ala Val Asn Phe Gly Ile Ile Tyr Gly Ile
1 5 10 15
Ser Asp Tyr Gly Leu Ser Gln Asn Leu Asp Ile Ser Arg Lys Glu Ala
20 25 30
<210> 8
<211> 32
<212> PRT
<213> 枯草芽胞杆菌
<400> 8
Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile
1 5 10 15
Ser Asp Tyr Gly Leu Ser Gln Asn Leu Gly Ile Thr Arg Lys Glu Ala
20 25 30
<210> 9
<211> 32
<212> PRT
<213> 史密斯芽胞杆菌
<400> 9
Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile
1 5 10 15
Ser Asp Tyr Gly Leu Ser Gln Asn Leu Gly Ile Thr Arg Lys Glu Ala
20 25 30
<210> 10
<211> 32
<212> PRT
<213> 嗜热脂肪土芽胞杆菌
<400> 10
Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly Ile Val Tyr Gly Ile
1 5 10 15
Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile Ser Arg Lys Glu Ala
20 25 30
<210> 11
<211> 580
<212> PRT
<213> 嗜热脂肪土芽胞杆菌
<400> 11
Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met Leu
1 5 10 15
Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr His
20 25 30
Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg Phe
35 40 45
Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala Trp
50 55 60
Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg Ala
65 70 75 80
Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Cys Gly Val Ser Phe
85 90 95
Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val Asp
100 105 110
Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg Pro
115 120 125
Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp Glu
130 135 140
Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp Glu
145 150 155 160
Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp Arg
165 170 175
Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu Met
180 185 190
Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met Gly
195 200 205
Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Glu Gln Arg Ile Tyr Glu
210 215 220
Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly Val
225 230 235 240
Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys Thr
245 250 255
Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr His
260 265 270
Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu Gln
275 280 285
Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr Lys
290 295 300
Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg Leu
305 310 315 320
Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu Glu
325 330 335
Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp Leu
340 345 350
Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His
355 360 365
Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu Asp
370 375 380
Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp Glu
385 390 395 400
Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly Ile
405 410 415
Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile Ser
420 425 430
Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe Pro
435 440 445
Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln Lys
450 455 460
Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp Ile
465 470 475 480
Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala Met
485 490 495
Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala Met
500 505 510
Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala His Leu
515 520 525
Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu Glu
530 535 540
Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala Val
545 550 555 560
Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr Trp
565 570 575
Tyr Asp Ala Lys
580
<210> 12
<211> 580
<212> PRT
<213> 嗜热球形脲芽胞杆菌
<400> 12
Ala Ala Leu Ser Phe Lys Ile Val Arg Glu Ile Ala Glu Asp Leu Phe
1 5 10 15
Thr Asp Thr Met Ala Val His Val Glu Leu Glu Asn Glu His Tyr His
20 25 30
Thr Cys Asn Ile Leu Gly Phe Gly Phe Thr Asp Gly Ser Asn Thr Phe
35 40 45
Phe Val Pro Thr Glu Val Leu Gln Lys Ser Glu Arg Leu Lys Ser Tyr
50 55 60
Phe Glu Asp Glu Thr Lys Lys Lys Tyr Met Ser Asp Leu Lys Ala Ala
65 70 75 80
Gln Cys Ile Leu Lys Arg His Gly Ile Asn Leu Arg Gly Val Glu Phe
85 90 95
Asp Leu Leu Leu Ala Ser Tyr Ile Val Asn Pro Ala Ile Ser Gly Asp
100 105 110
Asp Val Ala Thr Leu Ala Lys Glu Phe Gly Tyr Thr Asp Val Arg Ser
115 120 125
Asn Glu Ala Val Tyr Gly Lys Gly Ala Lys Trp Ala Leu Pro Ser Glu
130 135 140
Glu Val Leu Ala Glu His Val Cys Arg Lys Ala Phe Ala Ile Trp Ser
145 150 155 160
Cys Lys Glu Arg Val Ser Asn Lys Leu Lys Glu Asn Glu Gln Phe Asp
165 170 175
Leu Tyr His Asp Leu Glu Leu Pro Leu Ala Val Ile Leu Gly Lys Met
180 185 190
Glu Ser Glu Gly Ile Lys Val Asn Ile Ser Thr Leu Glu Thr Met Gly
195 200 205
Gln Glu Leu Glu Asp Lys Ile Ala Lys Leu Glu Thr Glu Ile Tyr Glu
210 215 220
Leu Ala Gly Glu Thr Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly Val
225 230 235 240
Ile Leu Phe Glu Lys Leu Gly Leu Pro Val Ile Lys Lys Thr Lys Thr
245 250 255
Gly Tyr Ser Thr Ala Ala Asp Val Leu Glu Lys Leu Lys Ser Glu His
260 265 270
Gln Ile Val Gln Leu Ile Leu Glu Tyr Arg Thr Leu Ala Lys Leu Gln
275 280 285
Ser Thr Tyr Ile Glu Gly Leu Ile Lys Glu Val His Pro Lys Asp Ser
290 295 300
Lys Val His Thr Arg Phe Met Gln Ala Leu Thr Ser Thr Gly Arg Leu
305 310 315 320
Ser Ser Thr Asp Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu Glu
325 330 335
Gly Arg Lys Ile Arg Lys Ala Phe Val Pro Ser His Asp Gly Trp Leu
340 345 350
Leu Phe Ser Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His
355 360 365
Met Ser Lys Asp Lys Asn Leu Val Glu Ala Phe Asn Gln Gly Met Asp
370 375 380
Ile His Thr Arg Thr Ala Met Glu Val Phe His Val Ser Gln Asp Asp
385 390 395 400
Val Thr Ser Asn Met Arg Arg Ala Ala Lys Ala Val Asn Phe Gly Ile
405 410 415
Ile Tyr Gly Ile Ser Asp Tyr Gly Leu Ser Gln Asn Leu Asp Ile Ser
420 425 430
Arg Lys Glu Ala Gly Glu Phe Ile Glu Lys Tyr Phe Glu Ser Phe Pro
435 440 445
Gly Val Lys Glu Tyr Met Asp Asn Ile Val Gln Glu Ala Lys Leu Lys
450 455 460
Gly Tyr Val Thr Thr Ile Leu Asn Arg Arg Arg Tyr Leu Pro Asp Ile
465 470 475 480
Thr Ser Lys Asn Phe Asn Leu Arg Ser Phe Ala Glu Arg Thr Ala Met
485 490 495
Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala Met
500 505 510
Leu Asp Ile Asp Ala Arg Leu Asn Ser Glu Gly Leu Gln Ala Lys Leu
515 520 525
Leu Leu Gln Val His Asp Glu Leu Ile Phe Glu Ala Pro Lys Glu Glu
530 535 540
Ile Glu Lys Leu Glu Lys Ile Val Pro Glu Val Met Glu Ser Ala Ile
545 550 555 560
Leu Leu Asp Val Pro Leu Lys Val Asp Ile Ser Tyr Gly Glu Thr Trp
565 570 575
Tyr Asp Ala Lys
580
<210> 13
<211> 1743
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 13
accgaagttg catttgaaat tgtggaagaa atcgatagca ccatcctgga taaagttatg 60
agcgttcatc tggaaatgta tgatggtcag tatcatacca gcgaactgct gggtattgca 120
ctgagtgatg gtgaaaaagg ttattttgca ccggcagata ttgcctttca gagcaaagat 180
ttttgtagct ggctggaaaa tgccaccaac aaaaaatacc tggcagatag caaagcaacc 240
caggcagtta gccgtaaaca taatgttaat gttcacggcg tggaatttga tctgctgctg 300
gcagcatata ttgttaatcc ggcaattagc agcgaagatg ttgcagcaat tgcaaaagaa 360
ttcggctatt ttaacctgct gaccaacgat agcgtttatg gtaaaggtgc aaaaaaaacc 420
gcaccggaaa ttgaaaaaat tgccgaacat gcagttcgta aagcacgtgc aatttgggat 480
ctgaaagaaa aactggaagt gaaactggaa gagaacgaac agtatgccct gtataaagaa 540
attgaactgc cgctggcaag cattctgggc accatggaaa gtgatggtgt tctggttgat 600
aaacaaatcc tggttgaaat gggtcacgag ctgaacatta aactgcgtgc aattgaacag 660
gatatttatg cactggcagg cgaaaccttt aacattaata gcccgaaaca gctgggtgtg 720
atcctgtttg aaaaaatcgg tctgaccccg atcaaaaaaa ccaaaaccgg ttatagcacc 780
gcagcagatg ttctggaaaa actggcaagc gaacatgaaa ttattgagca gattctgctg 840
tatcgtcagc tgggtaaact gaatagcacc tatattgaag gtctgctgaa agaaatccat 900
gaggatgatg gtaaaatcca tacccgttat cagcaggcac tgaccagcac cggtcgtctg 960
agcagcatta atccgaatct gcagaatatt ccggttcgtc tggaagaagg tcgtaaaatt 1020
cgtaaagcat ttgttccgag ccagcctggt tgggttatgt ttgcagcaga ttatagccag 1080
attgaactgc gtgttctggc acatatgagc gaagatgaaa atctggttga agcctttaac 1140
aacgatctgg atattcatac caaaaccgcc atggatgttt ttcacgttga acaagaagca 1200
gttaccagcg atatgcgtcg tgcagcaaaa gcagttaatt ttggtattgt gtatggcatc 1260
agcgcttatg gtctgagcca gaatctggat attacccgta aagaagcagc cacctttatc 1320
gaaaactacc tgaatagctt tccgggtgtg aaaggctata tggatgatat tgttcaggat 1380
gcaaaacaga ccggttatgt taccaccatt ctgaatcgtc gtcgttatct gccggaaatt 1440
accagcagca actttaatct gcgtagcttt gcagaacgta ccgcaatgaa taccccgatt 1500
cagggtagcg cagcagatat tatcaaaaaa gccatgattg atatggccga acgtctgatt 1560
agcgaaaata tgcagaccaa aatgctgctg caggttcatg atgaactgat ttttgaagca 1620
ccgcctgaag aaattgcaat gctggaaaaa attgttccgg aagtgatgga aaacgccatt 1680
aaactgattg ttccgctgaa agtggattat gcatttggta gcagttggta cgataccaaa 1740
taa 1743
<210> 14
<211> 1743
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 14
gccaaaatgg catttaccct ggcagatcgt gttaccgaag aaatgctggc agataaagca 60
gcactggttg ttgaagttgt ggaagaaaat tatcatgatg caccgattgt tggtattgcc 120
gttgttaatg aacatggccg tttttttctg cgtccggaaa ccgcactggc cgatccgcag 180
tttgttgcat ggctgggtga tgaaaccaaa aaaaagagca tgtttgatag caaacgtgca 240
gcagttgcac tgaaatggaa aggtattgaa ctgtgcggtg tttcatttga tctgctgctg 300
gcagcatatc tgctggatcc ggcacagggt gttgatgatg ttgcagcagc agcaaagatg 360
aaacagtatg aagcagttcg tccggatgaa gccgtttatg gtaaaggtgc aaaacgtgcc 420
gtgccggatg aaccggtgct ggccgaacat ctggttcgta aagcagccgc aatttgggaa 480
ttagaacgtc cgtttctgga tgaactgcgt cgtaatgaac aggatcgtct gctggttgaa 540
ctggaacagc cgctgagcag cattctggca gaaatggaat ttgccggtgt taaagtggat 600
accaaacgtc tggaacaaat gggtaaagaa ctggcagaac agctgggcac cgttgaacag 660
cgtatttatg agctggcagg tcaagaattt aacatcaata gcccgaaaca actgggcgtg 720
attctgtttg aaaaactgca gctgccggtt ctgaaaaaaa ccaaaaccgg ttatagcacc 780
agcgcagatg ttctggaaaa actggcaccg tatcatgaaa ttgtggaaaa cattctgcat 840
tatcgccagc tgggtaaact gcagagcacc tatattgaag gtctgctgaa agttgttcgt 900
cccgatacca aaaaagtgca caccattttt aaccaggcac tgacccagac cggtcgtctg 960
agcagtaccg aaccgaatct gcagaatatt ccgattcgtc tggaagaagg tcgtaaaatt 1020
cgtcaggcct ttgttccgag cgaaagcgat tggctgattt ttgcagcaga ttatagccag 1080
attgaactgc gcgttctggc acatattgcc gaagatgata atctgatgga agcatttcgt 1140
cgcgatctgg atattcatac caaaacagcc atggatattt ttcaggtgag cgaagatgaa 1200
gttaccccga atatgcgtcg tcaggcaaaa gcagttaatt ttggtattgt gtatggcatt 1260
agcgcatatg gtctggcaca gaatctgaat attagccgta aagaagcagc cgagtttatc 1320
gaacgttatt ttgaaagttt tccgggtgtg aaacgctata tggaaaatat tgttcaagaa 1380
gccaaacaga aaggctatgt taccacactg ctgcatcgtc gtcgttatct gccggatatt 1440
accagccgta actttaatgt tcgtagcttt gcagaacgta tggcaatgaa taccccgatt 1500
cagggtagcg cagccgatat tatcaaaaaa gcaatgattg atctgaacgc acgcctgaaa 1560
gaagaacgtc tgcaggcaca tctgctgtta caggttcatg atgaactgat tctggaagcc 1620
cctaaagaag agatggaacg tctttgtcgt ctggttccgg aagttatgga acaggcagtt 1680
accctgcgtg ttccgctgaa agtggattat cattatggta gcacctggta tgatgccaaa 1740
taa 1743
<210> 15
<211> 1743
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 15
gcagcactga gctttaaaat cgttcgtgaa attgcagagg acctgtttac cgataccatg 60
gcagttcatg ttgaactgga aaacgaacat tatcacacgt gcaacattct tggttttggt 120
tttaccgatg gcagcaacac cttttttgtt ccgaccgaag tgctgcagaa aagcgaacgt 180
ctgaaaagct attttgagga tgaaaccaaa aaaaagtata tgagcgatct gaaagcagcc 240
cagtgtattc tgaaacgtca tggtattaat ctgcgtggcg ttgaatttga tctgctgctg 300
gcaagctata ttgttaatcc ggcaattagc ggtgatgatg ttgcaaccct ggcaaaagaa 360
tttggctata ccgatgttcg tagcaatgaa gccgtttatg gtaaaggtgc aaaatgggca 420
ctgccgagcg aagaggttct ggcagaacat gtttgtcgta aagcatttgc aatttggagc 480
tgcaaagaac gcgttagcaa taaactgaaa gagaacgaac agttcgatct gtatcatgat 540
ctggaactgc cgctggccgt tattctgggt aaaatggaaa gcgaaggcat caaagtgaat 600
atcagcaccc tggaaaccat gggtcaagaa ctggaagata aaattgccaa actggaaacc 660
gagatctatg aactggcagg cgaaaccttt aacattaata gcccgaaaca gctgggtgtg 720
atcctgtttg aaaaactggg tctgccggtt atcaaaaaaa cgaaaaccgg ttatagcacc 780
gcagcagatg ttctggaaaa actgaaatca gaacatcaga ttgtgcagct gattctggaa 840
tatcgtaccc tggccaaact gcagagcacc tatattgaag gtctgatcaa agaagtgcat 900
ccgaaagata gcaaagtgca tacccgtttt atgcaggcac tgaccagcac cggtcgtctg 960
agcagcaccg atccgaatct gcagaatatt ccgattcgtc tggaagaagg tcgtaaaatt 1020
cgcaaagcct ttgtgccgag ccatgatggt tggctgctgt ttagcgcaga ttatagccag 1080
attgaactgc gtgttctggc acatatgagc aaagataaaa atctggtgga agcctttaac 1140
caaggcatgg atattcatac ccgtaccgca atggaagttt ttcatgttag ccaggatgat 1200
gtgaccagca atatgcgtcg tgcagcaaaa gcagttaatt tcggtattat ctatggcatt 1260
agcgcatatg gtctgagcca gaatctggat atttcacgta aagaagcagg cgaattcatc 1320
gagaaatact ttgaaagttt tccgggtgtg aaagaatata tggacaacat tgttcaagag 1380
gccaagctga aaggttatgt taccaccatt ctgaatcgtc gtcgttatct gccggatatt 1440
accagcaaaa atttcaatct gcgtagcttt gcagaacgta ccgccatgaa taccccgatt 1500
cagggtagcg cagccgatat catcaaaaaa gcaatgctgg atattgatgc ccgtctgaat 1560
agcgaaggtc tgcaggcaaa actgctgctg caggttcacg atgaactgat ttttgaagca 1620
ccgaaagaag agatcgagaa gctggaaaaa attgttccgg aagttatgga aagtgccatt 1680
ctgctggatg ttccgctgaa agttgatatt agctatggtg aaacctggta cgatgccaaa 1740
taa 1743
<210> 16
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<220>
<221> misc_feature
<222> (7)..(7)
<223> 用荧光团Dabcyl标记
<220>
<221> misc_feature
<222> (32)..(32)
<223> 用荧光团FAM标记
<400> 16
ggcccgtagg aggaaaggac atcttctagc atacgggccg tcaagttcat ggccagtcaa 60
gtcgtcagaa atttcgcacc ac 82
<210> 17
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 17
gtggtgcgaa atttctgac 19
<210> 18
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<400> 18
tatccaccaa tactaccct 19
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<220>
<221> misc_feature
<222> (20)..(20)
<223> 在3'末端用TAMRA荧光团标记
<400> 19
cgatactttg tccactcaat 20
<210> 20
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 在5'末端用黑洞淬灭剂2标记
<400> 20
attgagtgga caaagtatcg tagggtagta ttggtggata 40

Claims (26)

1.一种DNA聚合酶,其包括SEQ ID NO.1的序列或与所述SEQ ID NO.1的序列具有至少70%同一性的序列,但是其中所述SEQ ID NO.1的第18位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
2.根据权利要求1所述的DNA聚合酶,其中所述DNA聚合酶包括与所述SEQ ID NO.1具有至少88%同一性的氨基酸序列,但是其中所述SEQ ID NO.1的第18位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
3.根据权利要求1或权利要求2所述的DNA聚合酶,其中所述DNA聚合酶包含SEQ IDNO.6、7、8、9或10的氨基酸序列,但是其中每个序列的第18位处的天冬氨酸残基已被非负电荷的氨基酸残基置换。
4.一种DNA聚合酶,其包含SEQ ID NO.2的氨基酸序列或与所述SEQ ID NO.2具有至少60%同一性的氨基酸序列,但是其中所述SEQ ID NO.2的第422位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
5.根据前述权利要求中任一项所述的DNA聚合酶,其中所述DNA聚合酶包含所述SEQ IDNO.2的氨基酸序列或与所述SEQ ID NO.2具有至少90%同一性的氨基酸序列,但是其中所述SEQ ID NO.2的第422位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
6.根据前述权利要求中任一项所述的DNA聚合酶,其中所述DNA聚合酶包含与SEQ IDNO.4具有至少60%同一性的氨基酸序列,但是其中所述SEQ ID NO.4的第719位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
7.一种DNA聚合酶,其包含SEQ ID NO.11或12的氨基酸序列或与所述SEQ ID NO.11或12具有至少60%同一性的氨基酸序列,但是其中所述SEQ ID NO.11或12的第422位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
8.根据前述权利要求中任一项所述的DNA聚合酶,其中所述DNA聚合酶包含与SEQ IDNO.11或12具有至少90%同一性的氨基酸序列,但是其中所述SEQ ID NO.11或12的第422位处的天冬氨酸残基或其它序列中的等同的天冬氨酸残基已被非负电荷的氨基酸残基置换。
9.根据前述权利要求中任一项所述的DNA聚合酶,其中所述天冬氨酸残基已经被丙氨酸残基替代。
10.根据前述权利要求中任一项所述的DNA聚合酶,其中所述DNA聚合酶的链置换活性比具有完全相同序列但相对于SEQ ID NO:1或2分别在第18位或第422位或在其它序列的等同位置处具有天冬氨酸的DNA聚合酶高至少30%。
11.根据前述权利要求中任一项所述的DNA聚合酶,其中在20mM至200mM NaCl或KCl或其混合物的浓度范围内,所述DNA聚合酶表现出其最大聚合酶活性的至少40%。
12.一种组合物,其包含根据前述权利要求中任一项所述的DNA聚合酶和缓冲剂。
13.一种核酸分子,其包含编码根据权利要求1至11中任一项所述的DNA聚合酶的核苷酸序列。
14.根据权利要求13所述的核酸分子,其中,所述核苷酸序列与SEQ ID NO:13、14或15具有至少70%的序列同一性。
15.一种表达载体,其含有根据权利要求13或权利要求14所述的核酸分子和用于由所述核酸分子编码的蛋白质序列的转录和翻译所必需的调控序列。
16.一种宿主细胞或病毒,其包含一种或多种根据权利要求15所述的表达载体或一种或多种根据权利要求13或权利要求14所述的核酸分子。
17.一种制备根据权利要求1至11中任一项所述的DNA聚合酶的方法,其中,所述方法包括以下步骤:
(i)在适于表达编码的DNA聚合酶的条件下培养包含一种或多种根据权利要求15所述的重组表达载体或一种或多种根据权利要求13或权利要求14所述的核酸分子的宿主细胞;以及可选的
(ii)从所述宿主细胞或从生长培养基或上清液中分离或获得所述DNA聚合酶。
18.一种根据权利要求1至11中任一项所述的DNA聚合酶的用途,其用于核苷酸聚合。
19.一种根据权利要求1至11中任一项所述的DNA聚合酶的用途,其用于核酸扩增或测序反应中。
20.根据权利要求18或权利要求19所述的用途,其中所述DNA聚合酶在恒定温度下使用。
21.根据权利要求19或权利要求20所述的用途,其中所述反应是等温核酸扩增反应。
22.一种使用根据权利要求1至11中任一项所述的DNA聚合酶进行核苷酸聚合的方法,所述方法包含:
(i)提供反应混合物,其包含根据权利要求1至11中任一项所述的DNA聚合酶、模板核酸分子、能够退火至所述模板核酸分子的一部分的寡核苷酸引物和一种或多种核苷酸;以及
(ii)在所述寡核苷酸引物退火至所述模板核酸分子并且所述DNA聚合酶通过聚合一个或多个核苷酸来延伸所述寡核苷酸引物的条件下温育所述反应混合物。
23.一种使用根据权利要求1至11中任一项所述的DNA聚合酶扩增核酸的方法,所述方法包含:
(i)提供反应混合物,其包含根据权利要求1至11中任一项所述的DNA聚合酶、模板核酸分子、能够退火至所述模板核酸分子的一部分的寡核苷酸引物和核苷酸;以及
(ii)在所述寡核苷酸引物退火至所述模板核酸分子并且所述DNA聚合酶通过聚合一个或多个核苷酸以产生多核苷酸来延伸所述寡核苷酸引物的条件下温育所述反应混合物。
24.根据权利要求22或权利要求23所述的方法,其中所述方法在恒定温度下进行。
25.根据权利要求20所述的用途或根据权利要求24所述的方法,其中所述恒定温度选自0℃至42℃的范围内。
26.根据权利要求25所述的用途或根据权利要求25所述的方法,其中所述恒定温度选自10℃至25℃的范围内。
CN201880079055.2A 2017-12-15 2018-12-17 Dna聚合酶 Active CN111433373B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1721053.5 2017-12-15
GBGB1721053.5A GB201721053D0 (en) 2017-12-15 2017-12-15 DNA polymerases
PCT/EP2018/085342 WO2019115834A1 (en) 2017-12-15 2018-12-17 Dna polymerases

Publications (2)

Publication Number Publication Date
CN111433373A true CN111433373A (zh) 2020-07-17
CN111433373B CN111433373B (zh) 2024-01-12

Family

ID=61008786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880079055.2A Active CN111433373B (zh) 2017-12-15 2018-12-17 Dna聚合酶

Country Status (11)

Country Link
US (2) US11390857B2 (zh)
EP (1) EP3724349A1 (zh)
JP (1) JP7361694B2 (zh)
KR (1) KR102594174B1 (zh)
CN (1) CN111433373B (zh)
AU (1) AU2018382619B2 (zh)
BR (1) BR112020011605A2 (zh)
CA (1) CA3085558C (zh)
GB (1) GB201721053D0 (zh)
SG (1) SG11202004757RA (zh)
WO (1) WO2019115834A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024138419A1 (zh) * 2022-12-28 2024-07-04 深圳华大生命科学研究院 具有dna聚合酶活性的多肽及其应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240150735A1 (en) * 2021-06-21 2024-05-09 Amazon Technologies, Inc. Polymerases for isothermal nucleic acid amplification

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6479267B1 (en) * 1998-06-17 2002-11-12 Amersham Pharmacia Biotech, Inc. FY7 polymerase
US20150094211A1 (en) * 2013-09-30 2015-04-02 Life Technologies Corporation Polymerase compositions, methods of making and using same
CN107109383A (zh) * 2014-08-19 2017-08-29 阿克蒂克塞姆股份有限公司 不耐热性核酸外切酶

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6818431B1 (en) 1995-10-18 2004-11-16 Shanghai Mendel Dna Center Co. Ltd. DNA polymerase having ability to reduce innate selective discrimination against fluorescent dye-labeled dideoxynucleotides
US6165765A (en) 1995-10-18 2000-12-26 Shanghai Institute Of Biochemistry, Chinese Academy Of Sciences DNA polymerase having ability to reduce innate selective discrimination against fluorescent dye-labeled dideoxynucleotides
KR100269979B1 (ko) * 1998-04-15 2000-11-01 박한오 써무스 필리포미스로부터 분리된 내열성 dna 중합효소의 유전자 및 그로부터 유추되는 아미노산 서열
JP2003507072A (ja) 1999-08-21 2003-02-25 アマシャム・バイオサイエンス・コーポレイション 耐塩性を改善した、E681にアミノ酸置換を有するTaqDNAポリメラーゼおよびその同族体
US20080311626A1 (en) 2004-09-17 2008-12-18 Arkea Hf Dna Polymerases Having Strand Displacement Activity
WO2006030455A1 (en) 2004-09-17 2006-03-23 Prokaria Ehf. Dna polymerases having strand displacement activity
WO2007044671A2 (en) 2005-10-06 2007-04-19 Lucigen Corporation Thermostable viral polymerases and methods of use
US20100047862A1 (en) * 2005-10-20 2010-02-25 Yoshihide Hayashizaki Novel DNA Polymerase
CN107326079B (zh) * 2011-08-10 2021-04-20 生命技术公司 聚合酶组合物、制备和使用所述聚合酶组合物的方法
US8993298B1 (en) 2012-08-31 2015-03-31 New England Biolabs, Inc. DNA polymerases
US10344325B2 (en) * 2014-11-11 2019-07-09 Life Technologies Corporation Thiolated nucleotide analogues for nucleic acid synthesis
US11091745B2 (en) 2015-05-12 2021-08-17 Dna Polymerase Technology, Inc. Mutant polymerases and uses thereof
EP3356557B1 (en) * 2015-10-01 2022-07-20 Life Technologies Corporation Polymerase compositions and kits, and methods of using and making the same
JP6963238B2 (ja) 2015-11-27 2021-11-05 国立大学法人九州大学 Dnaポリメラーゼ変異体
ES2882646T3 (es) 2016-02-29 2021-12-02 Genia Tech Inc Polimerasas carentes de actividad exonucleasa
GB201604876D0 (en) 2016-03-22 2016-05-04 Uni I Tromsø Norges Arktiske Uni Marine DNA polymerases

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6479267B1 (en) * 1998-06-17 2002-11-12 Amersham Pharmacia Biotech, Inc. FY7 polymerase
US20150094211A1 (en) * 2013-09-30 2015-04-02 Life Technologies Corporation Polymerase compositions, methods of making and using same
CN107109383A (zh) * 2014-08-19 2017-08-29 阿克蒂克塞姆股份有限公司 不耐热性核酸外切酶

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAN BEI, ET AL.: "Preliminary characterization of a thermostable DNA polymerase I from a mesophilic Bacillus sphaericus strain C3-41", 《ARCHIVES OF MICROBIOLOGY》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024138419A1 (zh) * 2022-12-28 2024-07-04 深圳华大生命科学研究院 具有dna聚合酶活性的多肽及其应用

Also Published As

Publication number Publication date
AU2018382619A1 (en) 2020-06-11
BR112020011605A2 (pt) 2020-12-08
CN111433373B (zh) 2024-01-12
KR102594174B1 (ko) 2023-10-25
CA3085558A1 (en) 2019-06-20
JP2021507694A (ja) 2021-02-25
US20200325459A1 (en) 2020-10-15
EP3724349A1 (en) 2020-10-21
SG11202004757RA (en) 2020-07-29
US11390857B2 (en) 2022-07-19
JP7361694B2 (ja) 2023-10-16
WO2019115834A1 (en) 2019-06-20
AU2018382619B2 (en) 2022-03-31
US20230034466A1 (en) 2023-02-02
CA3085558C (en) 2023-01-10
KR20200108283A (ko) 2020-09-17
GB201721053D0 (en) 2018-01-31

Similar Documents

Publication Publication Date Title
CN109072202B (zh) 海洋dna聚合物
US6699981B2 (en) Method and compositions for improved polynucleotide synthesis
WO2019241305A1 (en) Improved reverse transcriptase for nucleic acid sequencing
US20100003723A1 (en) Rna-dependent dna polymerase from geobacillus stearothermophilus
US20230034466A1 (en) Dna polymerases
CN112899253B (zh) 具有dna聚合酶活性的多肽、重组载体及其制备方法与应用
CN108070577A (zh) 一种抗血清干扰Taq DNA聚合酶及其制备和应用
US20110020896A1 (en) Mutant dna polymerases and their genes
JP4714848B2 (ja) Dnaポリメラーゼ変異体
US20230220449A1 (en) Marine dna polymerase i
US9994886B2 (en) Modified Epstein-Barr virus DNA polymerase and methods for isothermal DNA amplification
US20230332118A1 (en) Dna polymerase and dna polymerase derived 3&#39;-5&#39;exonuclease
EP4041877A1 (en) Dna polymerase and dna polymerase derived 3&#39;-5&#39;exonuclease
JPH07327684A (ja) Dnaポリメラーゼ遺伝子
JP2010183842A (ja) 新規耐熱性dnaポリメラーゼ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant