CN115210380A - 耐热的错配核酸内切酶变体 - Google Patents

耐热的错配核酸内切酶变体 Download PDF

Info

Publication number
CN115210380A
CN115210380A CN202180021831.5A CN202180021831A CN115210380A CN 115210380 A CN115210380 A CN 115210380A CN 202180021831 A CN202180021831 A CN 202180021831A CN 115210380 A CN115210380 A CN 115210380A
Authority
CN
China
Prior art keywords
amino acid
glu
nucleic acid
lys
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180021831.5A
Other languages
English (en)
Inventor
松本裕之
上森隆司
白井刚
石野良纯
石野园子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kansai University Of Arts And Sciences
Kyushu University NUC
Takara Bio Inc
Original Assignee
Kansai University Of Arts And Sciences
Kyushu University NUC
Takara Bio Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kansai University Of Arts And Sciences, Kyushu University NUC, Takara Bio Inc filed Critical Kansai University Of Arts And Sciences
Publication of CN115210380A publication Critical patent/CN115210380A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了GG‑特异性错配核酸内切酶变体、TT‑特异性错配核酸内切酶变体,和GT/TG‑特异性错配核酸内切酶变体。本发明还提供了使用所述变体的错配特异性切割反应、使用错配核酸酶去除核酸扩增反应中的错误的方法、在核酸扩增反应期间抑制具有特定碱基序列的核酸扩增的方法,以及使用所述抑制方法检测具有单碱基多态性突变的核酸的方法。

Description

耐热的错配核酸内切酶变体
技术领域
本发明涉及识别并切割双链核酸中的错配碱基对(以下也简称为错配)的耐热错配核酸内切酶突变体、包含所述错配核酸内切酶突变体的组合物,以及使用所述错配核酸内切酶突变体的方法。
背景技术
近年来,生物技术已取得显著的发展。特别地,由于大规模基因组分析,伴随基因组分析技术的进步,已积累了大量的基因组序列信息。此外,基于上述信息与各种生理功能分析的组合,已发现许多功能性基因突变。这些突变的分析已用于人类的基因诊断,以及农作物的改良和有用微生物的分离或制造,并且因此对一般生活做出了巨大贡献。
通过对基因组序列的直接分析或通过使用识别错配碱基对的酶来进行突变分析。突变分析方法包括使用能够特异性结合由突变型DNA与野生型DNA的配对而形成的错配碱基对的因子的检测。突变分析方法的代表性实例包括使用来自大肠杆菌的MutS、MutT和MutL复合物的突变位点检测(专利文献1)。
包括使用特异性切割错配位点的错配核酸内切酶的突变分析方法,也是已知的。在这种方法中,使用错配核酸内切酶在错配碱基对附近切割DNA,并分析由此获得的DNA片段以检测是否存在突变以及突变的位置。作为代表性实例,已知使用来自芹菜的细胞基因产物的方法(专利文献2),并且所述方法实际上用于碱基突变的分析。然而,所述酶不是耐热的,并且因此不能用于涉及高温反应过程的技术,例如PCR。因此,为了检测碱基突变,所述方法需要扩增、错配形成、错配切割和检测的四个步骤。
错配核酸内切酶的其他实例包括来自激烈热球菌(Pyrococcus furiosus)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、Thermococcus barophylusThermococcus kodakarensis的错配核酸内切酶(专利文献3和4)。然而,这些错配核酸内切酶识别并切割多个错配,并且因此具有错配识别(底物特异性)的问题。
在某些情况下,错配核酸内切酶的底物特异性不适用于待检测的基因突变,并且因此无法分析所述基因突变。在这种情况下,除了将适当设计的核酸(所谓抑制性寡核苷酸)添加到反应系统中以特异性检测基因突变之外,别无选择(专利文献5)。
除了突变分析之外,具有很大影响的生物技术技术的实例包括核酸扩增技术。核酸扩增技术的代表性实例是聚合酶链式反应(PCR)。PCR是用于容易地在体外扩增所需核酸片段的技术。PCR是一种实验技术,其在包括生物学、医学和农业的领域中以及关于基因的研究的广泛领域中都是必不可少的。PCR也被应用于突变基因的检测和DNA甲基化的分析。等温核酸扩增方法,诸如LAMP方法和ICAN方法,不需要特殊的设备,并且因此被用作更廉价的核酸检测方法。对于近年来进行的全基因组结构分析,全基因组扩增方法是一项重要的技术,特别是对于稀有样本的分析。
在这些核酸扩增方法中,错误碱基的并入以恒定的概率发生。通过聚合酶等的改进降低了所述概率。然而,错误碱基的并入仍然对精确分析造成干扰。
核酸扩增技术不仅用于扩增具有特定核苷酸序列的DNA,而且还用于扩增在两端具有共同核苷酸序列区域的DNA混合物。这种核酸扩增技术的具体实例包括基因组文库或cDNA文库的构建。然而,在此类文库的构建中,含量较高的DNA分子被优先扩增,这可能干扰各种DNA的分析或筛选。
为了解决上述问题,通过利用自杂交的归一化来降低含量较高的DNA的比例(非专利文献1)。也使用组合了PCR和自杂交的SSH-PCR (非专利文献2)。然而,使用这些方法,与含量较高的DNA同源的DNA也被去除。
在通过核酸扩增方法的DNA检测中,靶DNA和非靶DNA可能竞争扩增。换言之,在扩增靶DNA的同时扩增非靶DNA时,难以检测靶DNA。可以通过使用实时PCR来解决上述问题,其中使用诸如循环探针或TaqMan探针的探针,以仅检测靶DNA。然而,在非靶DNA相对于靶DNA过度大量存在的情况下,由于与非靶DNA的假阳性反应而难以检测靶DNA。
此类问题可能发生在例如,在存在正常等位基因的情况下检测少量突变等位基因(例如,检测循环肿瘤基因),通过表观遗传分析检测少量甲基化或非甲基化等位基因,检测在母亲血液中循环的少量胎儿DNA序列等。
为了解决上述问题,已开发了称为富集PCR或限制性核酸内切酶-介导的选择性聚合酶链式反应(REMS PCR)的方法(非专利文献3)。这种方法涉及使用耐热的限制性酶。在这种方法中,使用引物选择性地检测具有突变核苷酸序列的DNA,所述引物例如经过设计,使得限制性酶的切割仅在模板具有正常核苷酸序列时发生。然而,取决于待检测的靶DNA,可能不存在具有适合于通过REMS PCR检测的识别序列的耐热的限制性酶。
引用列表
专利文献
专利文献1:US 5922539 B
专利文献2:WO 01/062974
专利文献3:WO 2014/142261
专利文献4:WO 2016/039377
专利文献5:WO 2016/152812
非专利文献
非专利文献1:"Nucleic Acids Research", 2004年2月,第32卷,3号,e37
非专利文献2:"Methods in Molecular Biology", 2009年,第496卷,2号,p.223-243
非专利文献3:"American Journal of Pathology", 1998年8月,第153卷,2号,p.373-379。
发明内容
技术问题
本发明的目的包括提供与常规错配核酸内切酶相比,具有改进的错配特异性的耐热错配核酸内切酶突变体、包含所述错配核酸内切酶突变体的组合物,以及使用所述错配核酸内切酶突变体的方法。
解决问题的方案
在上述情况下,通过深入的努力,本发明人成功地制造出能够特异性地切割G-G错配的错配核酸内切酶突变体和能够特异性地切割T-T错配的错配核酸内切酶突变体。此外,虽然错配核酸内切酶原本是同二聚体,但本发明人成功地将分别来自上述两个突变体的两个单体用接头连接,从而产生了能够特异性切割G-T/T-G错配的错配核酸内切酶突变体。由此完成了本发明。
具体地,本发明的第一方面提供:
[1] 由以下(A)或(B)表示的多肽:
(A) 一种多肽,其选自由以下(1)至(4)组成的组并且具有切割核酸链的活性,所述核酸链具有在双链核酸中形成错配碱基对的鸟嘌呤(G):
(1) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第47位的丝氨酸的取代和由酸性氨基酸残基对第76位的天冬酰胺的取代;
(2) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在(1)中所述的取代氨基酸序列中的另外的1至10个氨基酸残基的突变,其中所述突变是取代、缺失、插入和/或添加,并且(1)中所述的取代氨基酸序列中的氨基酸取代得到保留;
(3) 包含如下氨基酸序列的多肽,所述氨基酸序列与(1)或(2)中所述的取代或突变的氨基酸序列具有50%或更高的同源性,其中(1)或(2)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;和
(4) 包含如下氨基酸序列的多肽,所述氨基酸序列与(1)或(2)中所述的取代或突变的氨基酸序列具有50%或更高的同一性,其中(1)或(2)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;或者
(B) 一种多肽,其选自由以下(5)至(8)组成的组并且具有切割核酸链的活性,所述核酸链具有在双链核酸中形成错配碱基对的胸腺嘧啶(T):
(5) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第78位的谷氨酰胺的取代和由中性(极性,不带电)氨基酸残基或含硫氨基酸残基对第123位的亮氨酸的取代,或由疏水性氨基酸残基或含硫氨基酸残基对第125位的亮氨酸的取代;
(6) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在(5)中所述的取代氨基酸序列中的另外的1至10个氨基酸残基的突变,其中所述突变是取代、缺失、插入和/或添加,并且(5)中所述的取代氨基酸序列中的氨基酸取代得到保留;
(7) 包含如下氨基酸序列的多肽,所述氨基酸序列与(5)或(6)中所述的取代或突变的氨基酸序列具有50%或更高的同源性,其中(5)或(6)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;和
(8) 包含如下氨基酸序列的多肽,所述氨基酸序列与(5)或(6)中所述的取代或突变的氨基酸序列具有50%或更高的同一性,其中(5)或(6)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;
[2] 根据[1]所述的多肽,其中:
所述碱性氨基酸残基是赖氨酸、精氨酸或组氨酸,
所述酸性氨基酸残基是天冬氨酸或谷氨酸,
所述中性(极性、不带电)氨基酸是苏氨酸、丝氨酸、天冬酰胺、谷氨酰胺、酪氨酸或半胱氨酸,
所述含硫氨基酸是半胱氨酸或甲硫氨酸,以及
所述疏水(非极性)氨基酸是丙氨酸、甘氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、色氨酸、苯丙氨酸或甲硫氨酸;
[3] 根据[1]或[2]所述的多肽,其包含选自SEQ ID NO: 6至15的氨基酸序列;
[4] 一种核酸,其编码根据[1]-[3]中任一项所述的多肽;
[5] 根据[4]所述的核酸,其包含选自SEQ ID NO: 21至30的核苷酸序列;
[6] 一种表达载体,其包含根据[4]或[5]所述的核酸和表达调控序列;
[7] 一种细胞,其由根据[6]所述的表达载体转化,表达具有错配核酸内切酶活性的多肽;
[8] 一种用于切割具有错配的双链核酸的方法,所述方法包括使用根据[1]-[3]中任一项所述的多肽处理所述双链核酸的步骤;
[9] 一种组合物,其包含以下(a)至(d):
(a) 根据[1]-[3]中任一项所述的多肽;
(b) 一种寡核苷酸,其在与非靶核酸杂交时形成包含至少一个错配的双链核酸,其中所述双链核酸被(a)的多肽切割,并且在与靶核酸杂交时形成不被(a)的多肽切割的双链核酸;
(c) 至少一对寡核苷酸引物;和
(d) 具有DNA聚合酶活性的多肽;
[10] 一种用于扩增核酸的方法,所述方法包括以下步骤(1)和(2):
(1) 制备组合物的步骤,所述组合物包含作为模板的核酸分子和以下(a)至(d):
(a) 根据[1]-[3]中任一项所述的多肽;
(b) 一种寡核苷酸,其在与非靶核酸杂交时形成包含至少一个错配的双链核酸,其中所述双链核酸被(a)的多肽切割,并且在与靶核酸杂交时形成不被(a)的多肽切割的双链核酸;
(c) 至少一对寡核苷酸引物;和
(d) 具有DNA聚合酶活性的多肽;和
(2) 使步骤(1)中获得的组合物在适当的条件下反应以进行核酸扩增的步骤;
[11] 根据[10]所述的方法,其中所述核酸扩增通过聚合酶链式反应(PCR)方法、等温核酸扩增方法或多重置换扩增(MDA)方法进行;
[12] 一种用于抑制包含特定核苷酸序列的核酸扩增的方法,所述方法包括在以下(a)至(d)的存在下进行核酸扩增反应的步骤:
(a) 一种寡脱氧核苷酸,其经设计以在与包含特定核苷酸序列或其互补链的核酸杂交时产生一个或几个错配;
(b) DNA聚合酶;
(c) 至少一对寡核苷酸引物;和
(d) 根据[1]-[3]中任一项所述的多肽;
[13] 根据[12]所述的方法,其中所述核酸扩增反应为聚合酶链式反应(PCR)或等温核酸扩增;
[14] 一种用于优先扩增靶DNA的方法,所述方法包括通过根据[12]或[13]所述的方法抑制具有与靶DNA相差一个或几个核苷酸的核苷酸序列的DNA的扩增;
[15] 根据[14]所述的方法,其用于扩增具有野生型核苷酸序列的DNA和通过彼此不同的单核苷酸多态性突变而不同于野生型DNA的DNA中的一个;
[16] 根据[15]所述的方法,其中所述单核苷酸多态性突变是与癌变或癌症治疗剂的治疗效果相关的单核苷酸多态性突变;和
[17] 二聚体形式的多肽,其选自:
(1) 同二聚体,其具有作为亚基的根据权利要求1 (A)所述的多肽,
(2) 同二聚体,其具有作为亚基的根据权利要求1 (B)所述的多肽,和
(3) 异二聚体,其具有作为亚基的根据[1] (A)所述的多肽和根据[1] (B)所述的多肽。
本发明的效果
根据本发明,提供了一种在生物技术中具有很大实用性的耐热的错配核酸内切酶突变体、包含所述错配核酸内切酶突变体的组合物,以及使用所述错配核酸内切酶突变体的方法。
实施方案的描述
如本文所用,术语“错配”是指不同于存在于双链核酸中的Watson-Crick碱基对的碱基配对,换言之,不同于G (鸟嘌呤碱基)-C (胞嘧啶碱基),和A (腺嘌呤碱基)-T (胸腺嘧啶碱基)或U (尿嘧啶碱基)的碱基配对的组合的碱基配对。
如本文所用,术语“GG-特异性”是指对GG错配具有特异性,术语“TT-特异性”是指对TT错配具有特异性,并且术语“GT/TG-特异性”是指对G-T或T-G错配具有特异性。换言之,这些术语意味着基本上仅识别所指出的错配。
如本文所用,术语“具有错配核酸内切酶活性的多肽(有时简称为错配核酸内切酶)”是指具有切割存在于双链核酸中的错配位点的活性的核酸酶。错配核酸内切酶活性包括在形成错配碱基对的核苷酸附近切割磷酸二酯键的活性,以及在位于与错配碱基对相距1-5个碱基对、优选1-3个碱基对的核苷酸附近切割磷酸二酯键的活性。在本发明中,错配核酸内切酶优选是具有特异性识别双链核酸中的特定错配碱基对以切割双链核酸的活性的核酸酶。如本文所用,耐热的错配核酸内切酶是指具有在50℃或更高的温度下切割存在于双链核酸中的错配位点的活性的核酸酶。在本发明中,优选使用耐热的错配核酸内切酶。
本发明中的错配核酸内切酶是形成二聚体而发挥活性的酶。已知当蛋白质的单体(也称为“亚基”,意指二聚体的组分)在诸如大肠杆菌等宿主中表达时,单体自然地结合形成二聚体(同二聚体)。如本文所用,“具有切割核酸链的活性的多肽,所述核酸链具有在双链核酸中形成错配碱基对的鸟嘌呤(G)”和“具有切割核酸链的活性的多肽,所述核酸链具有在双链核酸中形成错配碱基对的胸腺嘧啶(T)”是指单体。
氨基酸根据其化学性质分为亲水(极性)氨基酸和疏水(非极性)氨基酸。
亲水(极性)氨基酸包括酸性氨基酸、碱性氨基酸、中性(极性、不带电)氨基酸、含芳环氨基酸中的酪氨酸和含硫氨基酸中的半胱氨酸。
疏水(非极性)氨基酸包括具有脂肪族侧链的氨基酸、含芳环氨基酸中的色氨酸和苯丙氨酸以及含硫氨基酸中的甲硫氨酸。
酸性氨基酸包括天冬氨酸(Asp,D)和谷氨酸(Glu,E)。
碱性氨基酸包括赖氨酸(Lys,K)、精氨酸(Arg,R)和组氨酸(His,H)。
中性(极性、不带电)氨基酸包括苏氨酸(Thr,T)、丝氨酸(Ser,S)、天冬酰胺(Asn,N)、谷氨酰胺(Gln,Q)、酪氨酸(Tyr,Y)和半胱氨酸(Cys)。
含芳环的氨基酸包括酪氨酸(Tyr,Y)、色氨酸(Trp,W)和苯丙氨酸(Phe,F)。
含硫氨基酸包括半胱氨酸(Cys,C)和甲硫氨酸(Met,M)。
具有脂肪族侧链的氨基酸包括丙氨酸(Ala,A)、甘氨酸(Gly,G)、缬氨酸(Val,V)、亮氨酸(Leu,L)、异亮氨酸(Ile,I)和脯氨酸(Pro,P)。脯氨酸是具有环化侧链的亚氨基酸。
如本文所用,“相似的氨基酸”是指基于上述化学性质分类为同一组的氨基酸。例如,赖氨酸、精氨酸和组氨酸被分类为碱性氨基酸,并且因此是彼此相似的氨基酸。
如本文所用,“氨基酸序列的同源性”是指在考虑上述相似氨基酸的情况下,多肽序列之间的同源性或相似性。如上所述,基于氨基酸的化学性质分类为同一组的氨基酸被认为是“同源的”。
如本文所用,“氨基酸序列的同一性”是指在不考虑上述相似氨基酸的情况下,多肽序列之间的同一性。如本文所用,“核苷酸序列的同一性”是指多核苷酸序列之间的同一性。
可使用已知程序来计算氨基酸序列同源性、氨基酸序列同一性和核苷酸序列同一性的评分。所述程序的实例包括但不限于BLAST、BLAT、FASTA、SSEARCH和MPsrch。
如本文所用,氨基酸编号(也称为氨基酸位置)是基于SEQ ID NO: 1的氨基酸序列。因此,在从源自其他生物体的同源蛋白或SEQ ID NO: 1的多肽的变体蛋白中的N-末端计数时,通过如本文所用的氨基酸编号指示的氨基酸位置,可能不同于通过相同氨基酸编号指示的氨基酸位置。换言之,如本文所用的“对应于野生型错配核酸内切酶的氨基酸序列中的第47位的位置”是指当野生型氨基酸序列与突变氨基酸序列或源自其他生物体的错配核酸内切酶的氨基酸序列进行比较和比对时,被认为处于与野生型氨基酸序列(SEQ IDNO: 1)中的第47位相同的位置的氨基酸残基。
如本文所用,“靶核酸”或“靶DNA”是不被本发明的错配核酸内切酶突变体切割的核酸。换言之,靶核酸或靶DNA是将通过本发明的扩增方法扩增的核酸(作为模板)。另一方面,“非靶核酸”或“非靶DNA”是被本发明的错配核酸内切酶突变体切割的核酸。换言之,非靶核酸或非靶DNA是通过本发明的切割方法切割并因此不通过本发明的扩增方法扩增的核酸。“靶核酸”或“靶DNA”和“非靶核酸”或“非靶DNA”没有特别限制,并且可以是希望彼此区分的任何核酸。
在下文中,将详细描述本发明。
1. 本发明的错配核酸内切酶突变体
本发明的第一方面涉及错配核酸内切酶突变体,即具有改变的底物特异性的错配核酸内切酶突变体。错配核酸内切酶突变体的特征在于在来自激烈热球菌的野生型错配核酸内切酶(也称为PfuNucS)或其同源物或具有PfuNucS的错配核酸内切酶活性的突变体中,促成底物识别和/或切割的位点的氨基酸序列的变化。
本发明的错配核酸内切酶突变体可以例如通过将氨基酸取代引入来自激烈热球菌的多肽PF_RS00065 (RefSeq ID:WP_11011124.1,SEQ ID NO: 1,原名:PF0012,原RefSeqID: NP_577741)中来制备,其中所述氨基酸取代是(i) 由碱性氨基酸对第47位的丝氨酸的氨基酸取代,和由酸性氨基酸对第76位的天冬酰胺的氨基酸取代,或(ii) 由碱性氨基酸对第78位的谷氨酰胺的氨基酸取代,和由中性(极性,不带电)氨基酸或含硫氨基酸对第123位的亮氨酸的氨基酸取代,或由疏水性氨基酸或含硫氨基酸对第125位的亮氨酸的氨基酸取代。
此外,本发明的错配核酸内切酶突变体还可以通过将对应于上述氨基酸取代(i)或(ii)的突变引入如下而制备:多肽W77F (SEQ ID NO: 2),其中PF_RS00065中第77位的色氨酸被替换为苯丙氨酸;来自詹氏甲烷球菌的多肽MJ RS01180 (Ref Seq ID:NP_247194,SEQ ID NO: 3,原名:MJ_0225),其是PF_RS00065的同源物;来自Thermococcus barophilus的多肽TERMP_01877 (Ref Seq ID:YP_004072075,SEQ ID NO: 4),其是PF_RS00065的同源物;或来自Thermococcus kodakarensis菌株KOD1 (JCM 12380T)的多肽(SEQ ID NO: 5),其是PF_RS00065的同源物。
本发明的错配核酸内切酶突变体优选为热稳定的酶。例如,在本发明的方法中优选使用即使在热循环(诸如PCR)中也稳定地保持活性的多肽。在本发明的方法中,可以使用即使在50℃或更高,优选60℃或更高,进一步优选70℃或更高,并且更优选70℃或更高,也不失活的多肽。
例如,本发明的错配核酸内切酶突变体包含如下所述的(A)和/或(B)中所示的多肽。本发明的错配核酸内切酶突变体的优选实例包括由如下所述的(A)和/或(B)中所示的多肽组成的错配核酸内切酶突变体。
(A) 一种多肽,其选自由以下(1)至(4)组成的组并且具有切割核酸链的活性,所述核酸链具有在双链核酸中形成错配碱基对的鸟嘌呤(G):
(1) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第47位的丝氨酸的取代和由酸性氨基酸残基对第76位的天冬酰胺的取代;
(2) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在(1)中所述的取代氨基酸序列中的另外的1至10个氨基酸残基的突变,其中所述突变是取代、缺失、插入和/或添加,并且(1)中所述的取代氨基酸序列中的氨基酸取代得到保留;
(3) 包含如下氨基酸序列的多肽,所述氨基酸序列与(1)或(2)中所述的取代或突变的氨基酸序列具有50%或更高的同源性,其中(1)或(2)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;和
(4) 包含如下氨基酸序列的多肽,所述氨基酸序列与(1)或(2)中所述的取代或突变的氨基酸序列具有50%或更高的同一性,其中(1)或(2)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留。
(B) 一种多肽,其选自由以下(5)至(8)组成的组并且具有切割核酸链的活性,所述核酸链具有在双链核酸中形成错配碱基对的胸腺嘧啶(T):
(5) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第78位的谷氨酰胺的取代和由中性(极性,不带电)氨基酸残基或含硫氨基酸残基对第123位的亮氨酸的取代,或由疏水性氨基酸残基或含硫氨基酸残基对第125位的亮氨酸的取代;
(6) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在(5)中所述的取代氨基酸序列中的另外的1至10个氨基酸残基的突变,其中所述突变是取代、缺失、插入和/或添加,并且(5)中所述的取代氨基酸序列中的氨基酸取代得到保留;
(7) 包含如下氨基酸序列的多肽,所述氨基酸序列与(5)或(6)中所述的取代或突变的氨基酸序列具有50%或更高的同源性,其中(5)或(6)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;和
(8) 包含如下氨基酸序列的多肽,所述氨基酸序列与(5)或(6)中所述的取代或突变的氨基酸序列具有50%或更高的同一性,其中(5)或(6)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留。
本发明提供了具有GG-特异性错配核酸内切酶活性的多肽。具有GG-特异性错配核酸内切酶活性的多肽的实例包括但不限于如上所述的(A)中所示的多肽。具有GG-特异性错配核酸内切酶活性的多肽的优选实例包括但不限于包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第47位的丝氨酸的取代和由酸性氨基酸残基对第76位的天冬酰胺的取代,如上文(A)(1)中所述。具有GG-特异性错配核酸内切酶活性的多肽的进一步实例包括包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中,由具有脂肪族侧链的氨基酸对第123位的亮氨酸的取代,以及上述在第47位和第76位的氨基酸取代。具有GG-特异性错配核酸内切酶活性的多肽的进一步优选实例包括包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1的氨基酸序列中,由赖氨酸、精氨酸或组氨酸对第47位的丝氨酸的取代和由天冬氨酸或谷氨酸对第76位的天冬酰胺的取代。具有GG-特异性错配核酸内切酶活性的多肽的进一步优选实例还包括包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中,由丙氨酸、甘氨酸、缬氨酸、亮氨酸、异亮氨酸或脯氨酸对第123位的亮氨酸的取代,以及上述在第47位和第76位的氨基酸取代。
进一步地,本发明提供了具有TT-特异性错配核酸内切酶活性的多肽。具有TT-特异性错配核酸内切酶活性的多肽的实例包括但不限于如上所述的(B)中所示的多肽。具有TT-特异性错配核酸内切酶活性的多肽的优选实例包括但不限于包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第78位的谷氨酰胺的取代,和由中性(极性,不带电)氨基酸残基或含硫氨基酸残基对第123位的亮氨酸的取代,或由疏水性氨基酸残基或含硫氨基酸残基对第125位的亮氨酸的取代,如上文(B)(5)中所述。具有TT-特异性错配核酸内切酶活性的多肽的进一步优选实例包括包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1的氨基酸序列中,由赖氨酸、精氨酸或组氨酸对第78位的谷氨酰胺的取代,和由苏氨酸、丝氨酸、天冬酰胺、谷氨酰胺、酪氨酸、半胱氨酸或甲硫氨酸对第123位的亮氨酸的取代,或由丙氨酸、甘氨酸、缬氨酸、异亮氨酸、脯氨酸、色氨酸、苯丙氨酸、半胱氨酸或甲硫氨酸对第125位的亮氨酸的取代。在具有TT-特异性错配核酸内切酶活性的多肽的更优选的实例中,第125位的亮氨酸可以被替换成除亮氨酸以外的具有脂肪族侧链的氨基酸。
具有GG-特异性错配核酸内切酶活性的多肽和具有TT-特异性错配核酸内切酶活性的多肽可以呈同二聚体的形式。当具有GG-特异性错配核酸内切酶活性的多肽作为单体在宿主(诸如大肠杆菌等)中表达时,所述单体自然地结合形成二聚体(同二聚体)并因此表现出活性。这同样适用于具有TT-特异性错配核酸内切酶活性的多肽。
此外,本发明还提供了具有GT/TG-特异性错配核酸内切酶活性的多肽。具有GT/TG-特异性错配核酸内切酶活性的多肽的实例包括但不限于包含上述(A)中所示的多肽和上述(B)中所示的多肽的异二聚体蛋白。具有GT/TG-特异性错配核酸内切酶活性的多肽的优选实例包括但不限于包含具有GG-特异性错配核酸内切酶活性的多肽和具有TT-特异性错配核酸内切酶活性的多肽的异二聚体蛋白。异二聚体蛋白可以通过在宿主(诸如大肠杆菌等)中表达具有GG-特异性错配核酸内切酶活性的多肽和具有TT-特异性错配核酸内切酶活性的多肽,从而形成二聚体(异二聚体)来产生。然而,用于产生异二聚体蛋白的方法没有限制。在单独表达具有GG-特异性错配核酸内切酶活性的多肽和具有TT-特异性错配核酸内切酶活性的多肽,且随后通过任何方法解离成单体后,可以将两种多肽的单体混合以允许重新结合。在产生异二聚体蛋白的优选方法中,具有GG-特异性错配核酸内切酶活性的多肽和具有TT-特异性错配核酸内切酶活性的多肽经由接头作为单个多肽表达。具有GG-特异性错配核酸内切酶活性的多肽和具有TT-特异性错配核酸内切酶活性的多肽在单个多肽内的排列没有限制。它们可以按如下顺序排列:[具有GG-特异性错配核酸内切酶活性的多肽]-[接头]-[具有TT-特异性错配核酸内切酶活性的多肽],或[具有TT特异性错配核酸内切酶活性的多肽]-[接头的顺序排列]-[具有GG-特异性错配核酸内切酶活性的多肽]。所述接头优选是肽接头。肽接头的氨基酸序列和残基数量(长度)没有限制,只要接头不抑制异二聚化以及双链核酸的切割。此外,在具有错配核酸内切酶活性的多肽和接头之间可以存在用于切割融合多肽的蛋白酶的识别序列,例如因子Xa、PreScission蛋白酶、凝血酶、肠激酶、TEV蛋白酶(烟草蚀纹病毒蛋白酶)等。
除了(A)(1)和(B)(5)中所述的上述氨基酸取代之外,本发明的错配核酸内切酶突变体可以包含在其他氨基酸位置的突变,只要所述错配核酸内切酶突变体不丧失底物特异性(对GG、TT或GT/TG错配的特异性)。在其他氨基酸位置的突变的实例包括但不限于增加耐热性的突变、增加对抑制剂的抗性的突变和改善错配核酸内切酶性质的突变,只要本发明的错配核酸内切酶突变体的底物特异性得到保持。如本文所用,“突变”可以是氨基酸的任何取代、插入、缺失或添加。
例如,包括在其他氨基酸位置的突变的本发明的错配核酸内切酶突变体可以包含如下的氨基酸序列,所述氨基酸序列除了(A)(1)和(B)(5)中的上述氨基酸取代之外,包含另外的1至10个氨基酸残基的突变。
此外,例如,在其他氨基酸位置包含突变的本发明的错配核酸内切酶突变体可以包含如下的氨基酸序列,所述氨基酸序列与包含(A)(1)和(B)(5)中的上述氨基酸取代的SEQ ID NO: 1的氨基酸序列或与包含(A)(1)和(B)(5)中的上述氨基酸取代和另外的1至10个氨基酸残基的突变SEQ ID NO: 1的氨基酸序列具有50%或更高的同源性。所述50%或更高的同源性包括例如50%或更高、55%或更高、60%或更高、65%或更高、70%或更高,或75%或更高,优选80%或更高,更优选85%或更高,进一步更优选90%或更高,并且甚至更优选95%或更高、96%或更高、97%或更高、98%或更高,或99%或更高的氨基酸序列同源性。
此外,例如,在其他氨基酸位置包含突变的本发明的错配核酸内切酶突变体可以包含如下的氨基酸序列,所述氨基酸序列与包含(A)(1)和(B)(5)中的上述氨基酸取代的SEQ ID NO: 1的氨基酸序列或与包含(A)(1)和(B)(5)中的上述氨基酸取代和另外的1至10个氨基酸残基的突变SEQ ID NO: 1的氨基酸序列具有50%或更高的同一性。所述50%或更高的同一性包括例如50%或更高、55%或更高、60%或更高、65%或更高、70%或更高,或75%或更高,优选80%或更高,更优选85%或更高,进一步优选90%或更高,并且甚至更优选95%或更高、96%或更高、97%或更高、98%或更高,或99%或更高的氨基酸序列同一性。
此外,本发明包括错配核酸内切酶突变体,所述错配核酸内切酶突变体包含添加到N-末端或C-末端的亲和标签,以用于促进纯化的目的。所述亲和标签可以是已知的亲和标签,并且它的实例包括由4至8个连续的His残基组成的组氨酸(His)标签、Flag标签、HA标签、c-myc标签、谷胱甘肽S-转移酶(GST)标签、麦芽糖结合蛋白(MBP)标签和由8个氨基酸残基(Trp-Ser-His-Pro-Gln-Phe-Glu-Lys)组成的Strep (II)标签。所述标签可以任选地经由包含1至15个氨基酸的接头连接至本发明的突变体。此外,在具有错配核酸内切酶活性的多肽和接头之间可以存在用于融合多肽切割的蛋白酶的识别序列。所述蛋白酶的实例包括因子Xa、PreScission蛋白酶、凝血酶、肠激酶和TEV蛋白酶(烟草蚀纹病毒蛋白酶)。因此,包含亲和标签、接头和/或用于融合多肽切割的蛋白酶的识别序列的此类多肽也是本发明的包含在其他氨基酸位置的突变的错配核酸内切酶突变体的实例。例如,在如上所述的1至10个的突变氨基酸残基数量、氨基酸同源性或氨基酸同一性的范围内,本发明的包含在其他氨基酸位置的突变的错配核酸内切酶突变体可以包含亲和标签、接头和/或用于融合多肽切割的蛋白酶的识别序列。
本发明的错配核酸内切酶突变体可以包含人造氨基酸(也称为非天然氨基酸)。人造氨基酸的实例包括卤代(氯代、溴代、碘代)酪氨酸、酪氨酸硫酸酯、叠氮基酪氨酸、乙酰基赖氨酸、叠氮基苯丙氨酸和氟代苯丙氨酸。用人造氨基酸替换天然氨基酸的方法没有特别限定,并且可以使用公知的方法。
本发明的错配核酸内切酶突变体的实例包括但不限于由SEQ ID NO: 6-15中所示的任何氨基酸序列组成的突变体。
本发明的此类错配核酸内切酶突变体适用于下文所述的各种用途,例如,用于排除包含特定DNA序列的DNA、并且扩增和检测其他DNA的方法中。
错配核酸内切酶的活性可以使用含有错配的双链核酸作为底物来测量。具体地,通过使错配核酸内切酶与过量的含有错配的双链核酸反应,且然后测量每单位时间切割的核酸的量来测量活性。可以通过电泳等,分别地定量切割的双链核酸与未经切割的核酸。双链核酸可以用荧光物质和猝灭剂进行双重标记,使得只有在被切割时才检测到荧光强度的增加。通过使用双重标记的双链核酸,以适当的时间间隔确定反应溶液中的荧光强度来促进活性测量。也可以通过改变作为底物的双链核酸中的错配碱基对,来研究靶向特定错配的切割活性。
2. 编码本发明的错配核酸内切酶突变体的核酸
本发明提供了编码错配核酸内切酶突变体的核酸。具体地,提供了编码本发明的上述错配核酸内切酶突变体的核酸。
编码本发明的错配核酸内切酶突变体的核酸的实例包括但不限于包含编码SEQID NO: 6-15中所示氨基酸序列的核苷酸序列的核酸。编码本发明的错配核酸内切酶突变体的核酸的优选实例包括包含编码SEQ ID NO: 21-30所示氨基酸序列的核苷酸序列的核酸。
作为本发明的错配核酸内切酶突变体的实例,在表1中显示了实施例中制备的多肽的氨基酸序列及其编码核酸序列,但本发明不限于此。
[表1]
突变体名称 氨基酸SEQ No. 核苷酸序SEQ No.
S47K + N76D SEQ ID NO: 6 SEQ ID NO: 21
S47R + N76D + L123A SEQ ID NO: 7 SEQ ID NO: 22
S47R + N76D + L123G SEQ ID NO: 8 SEQ ID NO: 23
Q78R + L123S SEQ ID NO: 9 SEQ ID NO: 24
Q78R + L123T SEQ ID NO: 10 SEQ ID NO: 25
Q78R + L123M SEQ ID NO: 11 SEQ ID NO: 26
Q78R + L123C SEQ ID NO: 12 SEQ ID NO: 27
Q78R + L125V SEQ ID NO: 13 SEQ ID NO: 28
Q78R + L125A SEQ ID NO: 14 SEQ ID NO: 29
GT/TG特异性异二聚体 SEQ ID NO: 15 SEQ ID NO: 30
编码本发明的错配核酸内切酶突变体的核酸没有特别限制,只要其由编码可以在所使用的宿主中表达并且具有逆转录酶活性的蛋白质的密码子构成。可以对核酸进行密码子优化,以允许在宿主中表达或增加表达水平。密码子优化优选通过本领域常用的方法进行。
3. 含有编码本发明的错配核酸内切酶突变体的核酸的表达载体
本发明的表达载体含有编码本发明的错配核酸内切酶突变体的核酸,以及与所述核酸可操作连接的表达调控序列。
本发明中使用的表达载体可以是本领域常用的表达载体,并且没有特别限制。可以使用能够在宿主细胞中自主复制的载体,或能够整合到宿主染色体中的载体。可以使用与宿主相容的载体。
插入编码本发明的错配核酸内切酶突变体的核酸的表达载体的实例包括质粒载体、噬菌体载体和病毒载体。质粒载体可以是适合于待使用的宿主的质粒,并且此类质粒的实例包括源自大肠杆菌的质粒、源自属于芽孢杆菌属的细菌的质粒,以及源自酵母的质粒。此类质粒载体是本领域技术人员所熟知的,并且存在许多市售的质粒载体。这些已知的质粒及其改变的质粒可用于本发明中。噬菌体载体可以是例如λ噬菌体等。病毒载体可以是例如动物病毒,如逆转录病毒或牛痘病毒,或昆虫病毒,如杆状病毒。此外,已经构建了使用酵母、昆虫细胞和哺乳动物细胞作为宿主的许多异源蛋白质表达系统,并且已经可以商购获得。这样的表达系统可以用于产生本发明的错配核酸内切酶突变体。
可以根据宿主选择将包含在本发明的表达载体中的启动子。例如,对于大肠杆菌,可以使用源自大肠杆菌或噬菌体的启动子或其改变的启动子,包括但不限于trp启动子、lac启动子、PL启动子和PR启动子。进一步地,可以使用含有组合的源自噬菌体的启动子和源自噬菌体的RNA聚合酶基因的表达系统(例如pET表达系统等)。
为了便于纯化表达的多肽,本发明的表达载体可以进一步包含编码亲和标签的核酸。将编码亲和标签的核酸插入载体中,由此可以表达本发明的错配核酸内切酶突变体和亲和标签的融合蛋白。亲和标签的实例包括但不限于组氨酸(His)标签、谷胱甘肽S-转移酶(GST)标签、麦芽糖结合蛋白(MBP)标签和由8个氨基酸残基(Trp-Ser-His-Pro-Gln-Phe-Glu-Lys)组成的Strep (II)标签。标签可以添加到编码本发明的错配核酸内切酶突变体的核酸的5'端侧和/或3'端侧。标签可以适当地添加到不干扰表达和标签功能的位置。标签优选地是可以在所表达多肽的纯化期间或之后被切割的标签。这种可被切割的标签的实例包括但不限于包含编码用于切割融合多肽的蛋白酶的识别序列的核酸的标签,所述蛋白酶例如Xa因子、PreScission蛋白酶、凝血酶、肠激酶和TEV蛋白酶(烟草蚀纹病毒蛋白酶)。
本发明的表达载体还含有一种或多种表达调控序列。表达调控序列的实例包括但不限于启动子、参与调控启动子的基因、核糖体结合序列、多聚腺苷酸化信号、转录终止序列(转录终止子)和增强子。本发明的表达载体可以进一步包含编码复制起点或用于选择转化体的标记(抗药性基因、荧光标记或发光标记)的基因,以及用于增强翻译效率的核苷酸序列。
4. 用本发明的表达载体转化的细胞
将使用表达本发明的错配核酸内切酶突变体的表达载体转化的细胞(宿主)可以是本领域常用的宿主,并且没有特别限制。它的实例包括细菌(大肠杆菌、枯草芽孢杆菌等)、酵母、丝状真菌、昆虫细胞、真核细胞和动物细胞(哺乳动物细胞,包括人细胞等)。
在使用原核细胞作为宿主细胞时,所述宿主细胞的实例包括细菌,其属于埃希氏杆菌属,诸如大肠杆菌;芽孢杆菌属,诸如枯草芽孢杆菌;假单胞菌属,诸如恶臭假单胞菌(Pseudomonas putida),以及根瘤菌属,诸如苜蓿根瘤菌(Rhizobium meliloti)。可用于生产异源蛋白的大肠杆菌是本领域技术人员所熟知的,并且存在很多市售的大肠杆菌菌株(例如,大肠杆菌BL21T1R、大肠杆菌BL21、大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌JM109、大肠杆菌HB101等)。进一步地,已知属于芽孢杆菌属的枯草芽孢杆菌MI114、枯草芽孢杆菌207-21等,属于短芽孢杆菌属的桥石短芽孢杆菌(Brevibacillus choshinensis)等,作为生产异源蛋白的宿主。上述宿主细胞和合适的表达载体可以组合用于生产本发明的错配核酸内切酶突变体。优选地,可以使用大肠杆菌BL21T1R或BL21DE3,其为大肠杆菌的菌株BL21。
将表达载体引入宿主的方法没有特别限制,只要它可以将核酸引入宿主。所述方法的实例包括使用钙离子的方法、电穿孔法、原生质球法和乙酸锂法。将表达载体引入昆虫细胞的方法没有特别限制,只要它可以将DNA引入昆虫细胞,并且其实例包括磷酸钙法、脂质体转染法和电穿孔法。当使用噬菌体载体或病毒载体时,可以通过适合载体的方法感染宿主细胞,并且可以由此获得表达本发明的错配核酸内切酶突变体的转化体。
培养转化体。可以从转化体的培养物收集本发明的错配核酸内切酶突变体。培养条件没有特别限制,只要其适合于所使用的表达载体、所使用的宿主等。例如,使用pET载体转化大肠杆菌BL21DE3,并且将转化体接种到LB培养基中,并且在37℃振荡培养。当培养物的OD值达到0.2-0.8时,向培养基添加IPTG,且然后继续振荡培养以诱导所需蛋白的表达,例如在15-30℃持续2-5小时,优选在25℃持续4-5个小时。然后,将培养物离心,并洗涤由此获得的细菌细胞,且然后进行超声波处理或用溶菌酶裂解,以获得含有本发明的突变体的总细胞提取物。由于提取物含有大量杂质,本发明的突变体优选通过适当组合本领域中使用的纯化方法进行纯化,例如硫酸铵沉淀、阴离子交换柱、阳离子交换柱、凝胶过滤柱、亲和层析柱、透析等。通过使用适合于亲和标签特性的亲和载体,可以容易地纯化带有亲和标签的突变体。进一步地,除了IPTG以外,可以根据所使用的宿主类型或表达载体,在适当的时机添加其他必要的诱导剂,诸如L-阿拉伯糖。
5. 生产编码本发明的错配核酸内切酶突变体的核酸的方法
生产本发明的核酸的方法包括,例如,在编码错配核酸内切酶的核酸中,将编码位于对应于SEQ ID NO: 1的氨基酸序列中第47位的位置处的丝氨酸的密码子替换成编码碱性氨基酸的密码子的步骤,所述错配核酸内切酶多肽PF_RS00065或其突变多肽W77F,或RS_00065的同源物。丝氨酸的密码子优选替换成精氨酸或赖氨酸的密码子,更优选替换成精氨酸的密码子。类似地,也可以替换在其他位置的氨基酸残基的密码子。
如上文第1部分所述,本发明的错配核酸内切酶突变体可包含在其他氨基酸位置的突变。即使在这种情况下,也可以类似地替换密码子。
包含上述密码子替换的编码错配核酸内切酶突变体的核酸的优选实例包括SEQID NO: 16-30的核酸。
密码子替换可以通过已知的方法进行,包括但不限于通过已知方法引入突变,例如使用用于引入突变的引物的位点特异性诱变,以及人工合成具有突变序列(或序列的一部分)的核酸。进一步地,为了允许在所使用的宿主中表达或增加表达水平的目的,可以进行密码子优化。密码子优化可以通过本领域常用的方法进行。
生产本发明的核酸的方法可以进一步包括替换编码错配核酸内切酶突变体的核酸中的密码子,以用于稳定和增加宿主中的蛋白生产的目的。
对于生产本发明的核酸的方法,可以应用上文第2部分中详述的核酸。
6. 本发明的双链核酸的切割方法
本发明的双链核酸的切割方法通过在含有二价金属离子(例如镁离子)的适当缓冲液中,使用上文第1部分所述的本发明的错配核酸内切酶突变体处理具有错配的双链核酸而进行。根据本发明的方法,可以切割含有G-G错配、T-T错配、G-T错配或T-G错配的双链核酸。
对于本发明的双链核酸的切割方法,具有错配的双链核酸可以是在内部(在正常配对的两个碱基对之间)含有错配的双链核酸。具有错配的双链核酸不仅可以是含有一个错配的双链核酸,还可以是含有间隔的两个或更多个错配的双链核酸,或含有两个或更多个连续错配的双链核酸。对于本发明的双链核酸的切割方法中,错配的实例包括优选存在于双链核酸中的1-8个连续错配,更优选1-4个连续错配,进一步优选2个连续错配,以及1个错配。在本发明的双链核酸的切割方法中,在双链核酸中存在两个或更多个错配时,所述两个或更多个错配可以是相同种类的错配,或者可以是不同种类的错配。
此外,可以使用如WO2014/142261等中公开的寡脱氧核苷酸。如本文所用,所述寡脱氧核苷酸是经设计以在与具有特定核苷酸序列(例如,具有感兴趣的基因突变)的核酸杂交时产生一个或几个错配的寡脱氧核苷酸。对于作为用于突变检测的探针的用途,寡脱氧核苷酸可以在两端用荧光物质和猝灭物质进行标记。可以适当地确定寡脱氧核苷酸的长度,使得寡脱氧核苷酸可以在待进行的反应条件下与具有特定核苷酸序列的核酸杂交。当寡脱氧核苷酸与具有特定核苷酸序列的核酸杂交时,错配优选在距寡脱氧核苷酸的5'端和3'端二者至少3个核苷酸的位置产生。
此外,当由于待检测的基因突变与错配核酸内切酶的底物特异性不匹配而无法分析基因突变时,可以使用如WO2016/152812等中公开的抑制性寡核苷酸。如本文所用,抑制性寡核苷酸是在寡核苷酸与非靶核酸杂交时形成至少一个错配的寡核苷酸,并且当寡核苷酸与靶核酸杂交时形成比寡核苷酸与非靶核酸杂交时更多的错配。当抑制性寡核苷酸与非靶核酸杂交时形成的至少一个错配的数量没有特别限制,只要发生非靶核酸的选择性切割,并且取决于抑制性寡核苷酸的长度,它的实例包括1-7、1-5或1-3个错配。当至少一个错配的数量表示为占抑制性寡核苷酸的长度的百分比时,例如,至少一个错配占抑制性寡核苷酸的长度的1-20%、3-15%或4-8%。作为这一方面的实例,阐述了其核苷酸序列仅相差一个碱基的靶核酸和非靶核酸的组合。当抑制性寡核苷酸与靶核酸杂交时,在抑制性寡核苷酸与靶核酸/非靶核酸之间不同的碱基之间形成错配(下文有时称为第一错配),同时形成另一个错配(以下有时称为第二错配)。
第一错配的碱基对涉及靶核酸和非靶核酸之间不同的碱基,而无论错配碱基对是否被具有错配核酸内切酶活性的共存多肽识别并切割。
第二错配是被具有错配核酸内切酶活性的共存多肽识别并切割的错配碱基对。例如,当使用具有错配核酸内切酶活性的多肽以识别并切割鸟嘌呤碱基-鸟嘌呤碱基、鸟嘌呤碱基-胸腺嘧啶碱基,或胸腺嘧啶碱基-胸腺嘧啶碱基时,抑制性寡核苷酸被设计为形成选自上述错配碱基对的错配。
当抑制性寡核苷酸与非靶核酸杂交时,形成第二错配,而没有形成第一错配。
设计和使用具有上述特性的抑制性寡核苷酸,使得能够通过具有错配核酸内切酶活性的多肽选择性切割非靶核酸。本发明不限于使用能够形成如上所述的一个或两个错配的抑制性寡核苷酸。可以设计和使用能够形成3个或更多个错配的抑制性寡核苷酸,只要发生所需核酸的选择性切割。在这种情况下,在靶核酸和非靶核酸中形成的至少一个错配可以是第二错配,而其他错配可以或可不被具有错配核酸内切酶活性的多肽识别并切割。所述3个或更多个错配优选地被具有错配核酸内切酶活性的多肽识别并切割。
WO2014/142261等中公开的寡脱氧核苷酸和WO2016/152812等中公开的抑制性寡核苷酸由DNA构成,或者可以部分地包含核苷酸类似物或RNA。换言之,寡脱氧核苷酸和抑制性寡核苷酸没有特别限定,只要它们具有如下的结构,所述结构在与非靶核酸杂交时形成具有至少一个错配的双链核酸,并且所述错配被具有错配核酸内切酶活性的共存多肽识别并切割。
具有通过本发明的方法切割的错配的双链核酸的实例包括PCR产物、源自生物样品的核酸,诸如如基因组DNA或其片段,以及合成核酸。具有错配的双链核酸可以是来自生物样品的核酸的混合物,或者来自生物样品的核酸和合成核酸的解链-再退火混合物。例如,当包含突变的核酸和野生型核酸混合、解链和再退火时,形成错配并且在错配的位置发生错配核酸内切酶的切割。可以观察由此在通过错配核酸内切酶切割后获得的核酸片段的大小,以评估突变的存在或不存在和突变的位置。使用本发明的错配核酸内切酶,允许通过简单地将这种错配核酸内切酶添加用于核酸扩增(诸如PCR)的反应溶液的突变分析。对于PCR,已知当循环数增加到高于一定数量时,没有发现扩增效果的增加。这主要是因为添加的引物或底物dNTP耗尽或引物与反应产物之间竞争退火。此时,反应产物之间发生退火。如果存在具有突变的模板和野生型模板二者,则通过从突变模板扩增的反应产物与从野生型模板扩增的反应产物之间的退火,在突变位置形成错配。因此,通过简单地在本发明的错配核酸内切酶的存在下进行比通常更多的循环数的PCR,使突变分析成为可能。换言之,本发明提供了一种分析突变的方法,所述方法包括用上文第1部分所述的错配核酸内切酶处理双链核酸。
本发明的双链核酸的切割方法可以在酸性高分子物质的存在下进行。已经发现酸性高分子物质具有通过酸性高分子物质的共存来控制多肽的错配识别和切割活性的效果。酸性高分子物质在含有少量核酸的样品中发挥更大的作用。酸性高分子物质的优选实例包括聚阴离子。酸性高分子物质的优选实例还包括具有糖骨架的酸性多糖和具有线性碳链的酸性多糖。作为酸性高分子物质,可以使用选自以下的一种或多种物质:含硫酸岩藻糖的多糖、硫酸葡聚糖、角叉菜胶、肝素、硫酸鼠李聚糖、硫酸皮肤素(硫酸软骨素B)、硫酸乙酰肝素、透明质酸、海藻酸、果胶、聚谷氨酸、聚丙烯酸、聚乙烯基硫酸酯、聚苯乙烯硫酸酯,及其盐,以及与靶核酸和非靶核酸不同的核酸。
本发明的双链核酸的切割方法还可以与增殖细胞核抗原(PCNA)的使用组合进行。
7. 本发明的双链核酸的扩增方法
本发明的双链核酸的切割方法甚至可以在核酸扩增反应的过程中进行。通过向用于核酸扩增的反应混合物添加错配核酸内切酶,来切割具有错配的双链核酸,所述错配通过在扩增过程中并入错误的核苷酸而形成。由此,抑制在反应开始前具有不同于模板核酸的序列的核酸的扩增。因此,使得具有降低错误率的核酸扩增成为可能。
也即,本发明提供了一种核酸扩增方法,其包括通过使用上文第1部分所述的本发明的错配核酸内切酶突变体切割具有错配的双链核酸的步骤。切割具有错配的双链核酸的步骤可以与核酸扩增步骤同时进行。此外,作为本发明的一个方面,提供了一种组合物,其包含(a) DNA聚合酶,(b) 至少一对寡核苷酸引物,和(c) 上文第1部分所述的错配核酸内切酶。
类似地,作为本发明的一个方面,还提供了一种核酸扩增方法,其包括制备如下组合物的步骤,所述组合物包含上述用于核酸扩增反应的组合物和作为模板的核酸分子;和通过使所获得的组合物在适当的条件下反应以进行核酸扩增的步骤。
上述组合物可以进一步包含选自如下的至少一种:反应缓冲液、二价金属离子、脱氧核糖核苷酸、寡核苷酸探针和嵌入染料。当所述组合物用于核酸扩增反应时,所述组合物可以进一步包含作为核酸扩增反应的模板的核酸。在所述组合物中,脱氧核糖核苷酸可以含有核苷酸类似物。反应缓冲剂是指具有缓和反应溶液中氢离子浓度(pH)变化的能力的化合物或混合物。由于弱酸及其盐,或弱碱及其盐的混合溶液通常具有强的缓冲作用,所述混合溶液广泛用作反应缓冲液,以用于控制pH的目的。用于本发明中的反应缓冲液的实例包括Good's缓冲液,诸如Tris-HCl和HEPES-KOH,以及磷酸盐缓冲液,诸如磷酸钠缓冲液。二价金属离子的实例包括镁离子、锰离子、锌离子和钴离子。二价金属离子可以作为盐的形式提供,例如氯化物、硫酸盐或乙酸盐。
本发明的双链核酸的扩增方法的实例是扩增DNA的方法,但本发明不特别限于此。扩增DNA的方法的实例包括聚合酶链式反应(PCR)、MDA (多重置换扩增)和等温核酸扩增例如ICAN和LAMP。
用于核酸扩增反应的上述组合物中的具有错配核酸内切酶活性的多肽的浓度可以通过视情况,在每个反应系统中测定不抑制DNA扩增反应的浓度,或对具有错配的双链核酸的切割有效的浓度来确定。
作为用于核酸扩增反应的上述组合物的至少一对引物,选择适合用于各核酸扩增方法的两种或更多的引物。引物可以是DNA引物、RNA引物或其中DNA分子的一部分被RNA替换的嵌合引物,只要获得期望的扩增即可。引物也可以是含有已知核酸类似物的引物,以及标记的引物,例如具有用于检测目的的荧光染料。
此外,作为本发明的组合物的另一方面,所述组合物可以包含用于防止残留污染(carryover)的组分。这种组分的实例包括dUTP和尿嘧啶N-糖苷酶。
本发明的双链核酸的扩增方法可以在上述酸性高分子物质的存在下进行。酸性高分子物质在含有少量核酸的样品中发挥更大的作用。酸性高分子物质的优选实例如用于选择性切割本发明的非靶核酸的方法的上文所述。本发明的方法可以进一步与上述增殖细胞核抗原(PCNA)或其突变体组合进行。
8. 本发明的扩增核酸抑制的方法
本发明的扩增核酸抑制的方法包括利用上文第1部分所述的本发明的错配核酸内切酶突变体和适当设计的寡脱氧核苷酸或抑制性寡核苷酸来抑制具有特定核苷酸序列的核酸在核酸扩增反应中的扩增。
因此,本发明的一个方面提供了一种用于抑制具有特定核苷酸序列的核酸在核酸扩增反应中的扩增的方法,所述方法包括在如下的存在下进行核酸扩增反应的步骤:(a)一种经设计以在与包含特定核苷酸序列的核酸杂交时产生一个或几个错配的寡脱氧核苷酸或抑制性寡核苷酸;(b) DNA聚合酶;(c) 至少一对寡核苷酸引物;和(d) 具有错配核酸内切酶活性的多肽。本发明的进一步方面提供了一种用于优先扩增靶核酸的方法,所述方法包括通过使用上述方法抑制具有特定核苷酸序列的核酸的扩增,所述特定核苷酸序列含有与靶核酸的核苷酸序列不同的一个或几个核酸。
(a)的寡脱氧核苷酸或抑制性寡核苷酸没有特别限制,只要它是具有如下核苷酸序列的单链DNA,所述核苷酸序列经设计以在与包含特定核苷酸序列的核酸杂交时形成一个或几个错配。寡脱氧核苷酸或抑制性寡核苷酸可以是所谓的嵌合寡脱氧核苷酸,其中DNA分子的一部分被RNA替换。可以对寡脱氧核苷酸或抑制性寡核苷酸的3'-末端进行修饰,以抑制DNA聚合酶对单链DNA的延伸反应,但本发明不特别限于此。修饰的实例包括胺化。可以通过硫代磷酸化或其他修饰保护寡脱氧核苷酸或抑制性寡核苷酸免于脱氧核糖核酸酶的切割,只要与寡脱氧核苷酸或抑制性寡核苷酸结合的核酸经受具有错配核酸内切酶活性的多肽的切割。可以用荧光染料、猝灭剂等标记寡脱氧核苷酸或抑制性寡核苷酸,用于检测的目的。
可以适当地确定寡脱氧核苷酸或抑制性寡核苷酸的长度,使得寡脱氧核苷酸或抑制性寡核苷酸可以在进行的反应条件下与具有特定核苷酸序列的核酸杂交。当寡脱氧核苷酸或抑制性寡核苷酸与具有特定核苷酸序列的核酸杂交时产生的错配的位置优选距寡脱氧核苷酸或抑制性寡核苷酸的5'端和3'端二者至少3个核苷酸。
例如,在进行本发明的方法,以通过包括在高温下的反应(诸如PCR)的方法抑制具有特定碱基序列的核酸的扩增时,优选使用耐热的错配核酸内切酶。上文第1部分所述的错配核酸内切酶包括在PCR中不失活的热稳定酶,并且此类酶适用于上述用途。
因此,本发明还提供一种用于核酸扩增反应的组合物,包括以下(a)至(d):
(a) 一种经设计以在与包含特定核苷酸序列的核酸杂交时产生一个或几个错配的寡脱氧核苷酸,或抑制性寡核苷酸或其互补链;
(b) DNA聚合酶;
(c) 至少一对寡核苷酸引物;和
(d) 上文第1部分所述的本发明的错配核酸内切酶突变体。
上述组合物可以进一步包含选自如下的至少一种:反应缓冲液、二价金属离子、脱氧核糖核苷酸、寡核苷酸探针和嵌入染料。上述组合物可以进一步包含作为核酸扩增反应的模板的核酸。上述组合物可以进一步包含dUTP或尿嘧啶N-糖苷酶。
本发明的用于抑制具有特定核苷酸序列的核酸在核酸扩增反应中的扩增的方法可以通过任何核酸扩增方法进行。此类核酸扩增方法的优选实例是但不限于,扩增DNA的方法。扩增DNA的方法的实例包括PCR、MDA和等温核酸扩增,例如ICAN和LAMP。
本发明的用于抑制具有特定核苷酸序列的核酸在核酸扩增反应中的扩增的方法可以应用于任何核酸。当该方法应用于DNA扩增时,这样的DNA可以是存在于人工制备的DNA混合物、源自环境的样品、生物样品或由上述样品制备的DNA混合物中的DNA。生物样品的实例包括但不限于源自哺乳动物(诸如人)的样品。DNA混合物的实例包括但不限于基因组DNA的片段的混合物、通过逆转录反应从mRNA产生的cDNA的混合物、以及多个PCR产物的混合物。抑制其扩增的具有特定核苷酸序列的DNA的实例包括仍未分离的来自rRNA的逆转录产物,以及通过引物配对产生的小分子DNA。在扩增基因文库随后进行功能筛选的情况下,可以通过抑制具有阳性已知基因序列的DNA的扩增,来产生能够更有效地检索未知基因的文库。
在本发明的方法中,具有错配核酸内切酶活性的多肽的浓度可以通过视情况,在每个反应系统中测定不抑制DNA扩增反应的浓度,或对具有错配的双链核酸的切割有效的浓度来确定。寡核苷酸或抑制性寡脱氧核苷酸的浓度可以通过考虑模板量和靶DNA的扩增效率而优化所使用的浓度来确定。例如,寡脱氧核苷酸或抑制性寡核苷酸的浓度可以是用于扩增反应的引物浓度的0.1至10倍。
如上所述,本发明提供了一种用于优先扩增靶核酸的方法。所述方法可以进一步包括检测扩增的靶DNA的步骤。在下文中,可将本发明的这一方面称为“本发明的用于检测核酸的方法”。例如,根据本发明的检测方法,其中DNA用作待检测的靶标,即使当不是待检测靶标的DNA (具有特定核苷酸序列的DNA)相对于作为待检测靶标的DNA (靶标DNA)而言过度大量存在时,凭借本发明的用于抑制具有特定核苷酸序列的核酸在核酸扩增反应中的扩增的方法中的寡核苷酸或抑制性寡核苷酸以及具有错配核酸内切酶活性的多肽,抑制具有非靶标DNA作为模板的扩增,并且由此可以检测所述待检测的靶DNA。
本发明的抑制核酸扩增的方法可以在上述酸性高分子物质的存在下进行。酸性高分子物质在含有少量核酸的样品中发挥更大的作用。酸性高分子物质的优选实例如用于选择性切割本发明的非靶核酸的方法的上文所述。本发明的方法可以进一步与上述增殖细胞核抗原(PCNA)或其突变体组合进行。
9. 本发明的用于检测核酸的方法
本发明的用于检测核酸的方法包括通过上述第8部分所述的本发明的抑制核酸扩增方法抑制非靶核酸的扩增,并由此优选扩增靶核酸的步骤,以及检测扩增的靶核酸的步骤。本发明的用于检测核酸的方法能够区别地检测例如与已知基因中存在突变的基因对应的核酸的野生型和突变型。当使用包含野生型核苷酸序列的DNA作为具有特定核苷酸序列的核酸(非靶核酸)进行本发明的检测方法时,可以在存在的过度大量正常等位基因(即,具有野生型核苷酸序列的DNA)的情况下,检测少量的突变等位基因。例如,本发明的方法可用于检测循环肿瘤DNA,或检测母体血液中含有的少量胎儿DNA序列。突变的实例包括微缺失和点突变。由点突变产生的多态性称为单核苷酸多态性(SNP)。如本文所用,在SNP中具有突变核苷酸序列的DNA有时被称为具有单核苷酸多态性突变的DNA。
少量的突变等位基因的优选实例包括但不限于含有至少一种单核苷酸多态性的核酸,所述单核苷酸多态性选自用作肿瘤标志物的单核苷酸多态性突变、与用于癌症治疗的药剂的治疗效果相关的单核苷酸多态性突变,以及已知与细胞癌变相关的单核苷酸多态性突变。SNP的实例包括经常在肿瘤细胞中发现的那些,以及已知与用于治疗癌症的药剂的治疗效果或致癌作用相关的那些。此类SNP的实例包括K-ras基因、B-raf基因和表皮生长因子受体(EGFR)基因的SNP。K-ras基因中的体细胞突变常见于结直肠癌、肺腺癌、甲状腺癌等。B-raf基因中的体细胞突变常见于结直肠癌、恶性黑色素瘤、乳头状甲状腺癌、非小细胞肺癌、肺腺癌等。EGFR基因中的体细胞突变常见于各种实体瘤。已知当癌组织中的EGFR基因具有特定的单核苷酸多态性突变时,使用EGFR抑制剂,诸如吉非替尼或厄洛替尼,治疗癌症很可能是有效的。相反,已知当癌组织中的K-ras基因具有单核苷酸多态性突变时,癌症可能对EGFR抑制剂是抗性的。
本发明的检测方法可以使用在以亚硫酸氢盐处理如下的组合物后获得的DNA作为原料进行,所述组合物含有从来自生物体的样品提取的甲基化DNA。根据本发明的检测方法,可以在存在过度大量的非甲基化等位基因的情况下进行少量的甲基化等位基因的检测,或在存在过度大量的甲基化等位基因的情况下进行少量的非甲基化等位基因的检测。
作为使用亚硫酸氢盐的处理,可以使用已知的用于检测甲基化DNA的亚硫酸氢盐法。通过处理,非甲基化胞嘧啶变为尿嘧啶,而甲基化胞嘧啶没有变化。当用亚硫酸氢盐处理的反应溶液进行PCR扩增时,尿嘧啶变为胸腺嘧啶,并且甲基化胞嘧啶变为胞嘧啶。换言之,在特定位点存在过度大量的非甲基化等位基因的情况下检测少量的甲基化等位基因,以及在存在过度大量的甲基化等位基因的情况下检测少量的非甲基化等位基因,分别对应于在存在过度大量的胸腺嘧啶的情况下检查胞嘧啶的存在,以及在存在过度大量的胞嘧啶的情况下检查胸腺嘧啶的存在。当过度大量的含有胸腺嘧啶或胞嘧啶的DNA的扩增被抑制时,容易检查少量的甲基化等位基因或非甲基化等位基因的存在。
对于本发明的检测方法中的检测靶核酸的步骤,可以使用电泳、核苷酸序列分析或使用探针(如循环探针或TaqMan探针)的实时PCR。对于这些检测方法,可以直接使用常规技术。具体地,高分辨率解链(HRM)分析方法的应用允许通过一个步骤扩增和检测感兴趣的DNA,并且由此实现对感兴趣的DNA的快速且简单的检查。
本发明的用于检测核酸的方法可以在上述酸性高分子物质的存在下进行。酸性高分子物质在含有少量核酸的样品中发挥更大的作用。酸性高分子物质的优选实例如用于选择性切割本发明的非靶核酸的方法的上文所述。本发明的方法可以进一步与上述增殖细胞核抗原(PCNA)或其突变体组合进行。
实施例
在下文中,将参考实施例具体描述本发明,但本发明的范围不限于这些实施例。
实验方法1:
(1-1) 错配核酸内切酶突变体的制备
编码来自激烈热球菌的多肽PF_R00065的基因的核苷酸序列(RefSeq ID: WP_11011124.1,SEQ ID NO: 1)显示在SEQ ID NO: 16中。基于上述核苷酸序列,通过常规方法,将突变引入特定位置以制备人工基因。使用In-Fusion (注册商标) HD克隆试剂盒(由Takara Bio USA制造),将由此获得的人工基因引入质粒pET6xHN-C (由Takara Bio USA制造)。由此获得的质粒具有编码错配核酸内切酶突变体的核苷酸序列,和添加至C末端侧的组氨酸标签。
然后,使用所述质粒转化大肠杆菌BL21 DE3菌株(由Takara Bio Inc.制造),并在含有100μg/ml氨苄青霉素的1.5%琼脂糖LB平板上于37℃培养过夜。从平板选出3个单菌落,接种于含有100μg/ml氨苄青霉素的LB培养基(以下称为LB-AP培养基)中,并在37℃振荡培养过夜。然后,将300 μl培养物接种到6 ml LB-AP培养基中,并在37℃振荡培养过夜。当OD600值达到0.6时,将IPTG以1 mM的终浓度添加到培养物中,然后,在25℃进一步孵育4小时以诱导靶基因的表达。然后,当OD600值达到4时,收集细菌细胞。
将由此获得的细菌细胞悬浮在400 μl含有50 mM Tris-HCl (pH 7.5)、300 mMNaCl、5%甘油和0.15% Triton X-100的溶液(以下称为缓冲液S)中,并使用超声波仪(由Sonic & Materials制造)在4℃进行三次30秒超声波处理。由此,悬浮液变得透明。超声波处理后,将悬浮液在4℃以11000 X g离心10分钟,并收集上清液。将由此获得的粗提取物进行Ni树脂纯化。
Ni树脂的纯化如下进行。具体而言,将50 μl Ni-NTA琼脂糖(由Qiagen制造)置于1.5 ml管中,用250 μl无菌蒸馏水洗涤两次,且然后用250 μl的缓冲液A (50 mM Tris-HClpH 7.5、300 mM NaCl、5%甘油和5 mM咪唑)平衡两次。将平衡的Ni-NTA琼脂糖悬浮在400 μl粗提物中,且允许其静置30分钟。然后,将悬浮液在4℃下以12000 rpm离心10分钟。除去上清液后,将Ni-NTA琼脂糖用100 μl缓冲液A洗涤3次。然后,用100 μl缓冲液B (50 mM Tris-HCl pH 7.5,300 mM NaCl、5%甘油和300 mM咪唑),从Ni-NTA琼脂糖上洗脱吸附物。将由此获得的洗脱液作为错配核酸内切酶突变体溶液用于如下的实验中。
(1-2) 异二聚体型错配核酸内切酶突变体的制备
基于编码(1-1)中制备的突变体的基因,制备编码异二聚体型错配核酸内切酶突变体的基因。以与(1-1)相同的方式,通过将编码GG特异性错配核酸内切酶突变体的基因与编码TT特异性错配核酸内切酶突变体的基因经由接头(SEQ ID NO: 35)串联连接,来制备人工基因。
(2) 错配核酸内切酶突变体的底物特异性评价
(2-1) 核酸
通过已知方法化学合成NucS-模板-T (SEQ ID NO: 31)、NucS-模板-G (SEQ IDNO: 32)、NucS-探针-T (SEQ ID NO: 33),和NucS-探针-G (SEQ ID NO: 34),作为核酸形成底物的双链DNA。使用由模板和探针的组合构成的双链DNA作为底物。分别向两个探针的5'端和3'端加入FAM和Eclipse (注册商标)暗猝灭剂。
(2-2) 切割特异性
通过混合2.5 μl的10x缓冲液、1 μl的25 μM模板、1.5 μl的5 μM探针、5 μl的错配核酸内切酶突变体溶液和15 μl的无菌水,制备总共25 μl的混合物。使用热循环仪,将55℃60秒的一个循环重复60个循环。或者,使用热循环仪,将55℃ 15秒的一个循环重复60个循环。所述10x缓冲液的组成为500 mM Tris-HCl (pH 9.2)、140 mM (NH4)2SO4、100 mM KCl、25 mM MgCl2和0.1% BSA。用于酶稀释的缓冲液的组成为25 mM Tris-HCl (pH 8.0)、50 mMKCl、0.1 mM DTT、0.01%明胶、0.5% Nonidet P-40、0.5% 吐温-20和0.09% BSA。
实施例1:错配核酸内切酶突变体的制备
(1) 错配核酸内切酶突变体S47K + N76D
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第47位的丝氨酸和第76位的天冬酰胺分别被替换为赖氨酸和天冬氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 6和SEQ ID NO: 21中。
(2) 错配核酸内切酶突变体S47R + N76D + L123A
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第47位的丝氨酸、第76位的天冬酰胺和第123位的亮氨酸分别被替换为精氨酸、天冬氨酸和丙氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ ID NO: 7和SEQ ID NO: 22中。
(3) 错配核酸内切酶突变体S47R+N76D+L123G
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第47位的丝氨酸、第76位的天冬酰胺和第123位的亮氨酸分别被替换为精氨酸、天冬氨酸和甘氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ ID NO: 8和SEQ ID NO: 23中。
(4) 错配核酸内切酶突变体Q78R+L123S
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第78位的谷氨酰胺和第123位的亮氨酸分别被替换为精氨酸和丝氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 9和SEQ ID NO: 24中。
(5) 错配核酸内切酶突变体Q78R+L123T
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第78位的谷氨酰胺和第123位的亮氨酸分别被替换为精氨酸和苏氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 10和SEQ ID NO: 25中。
(6) 错配核酸内切酶突变体Q78R+L123M
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第78位的谷氨酰胺和第123位的亮氨酸分别被替换为精氨酸和甲硫氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 11和SEQ ID NO: 26中。
(7) 错配核酸内切酶突变体Q78R+L123C
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第78位的谷氨酰胺和第123位的亮氨酸分别被替换为精氨酸和半胱氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 12和SEQ ID NO: 27中。
(8) 错配核酸内切酶突变体Q78R+L125V
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第78位的谷氨酰胺和第125位的亮氨酸分别被替换为精氨酸和缬氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 13和SEQ ID NO: 28中。
(9) 错配核酸内切酶突变体Q78R+L125A
根据实验方法1(1-1),制备编码突变蛋白的人工基因,其中来自激烈热球菌的多肽PF_RS00065的第78位的谷氨酰胺和第125位的亮氨酸分别被替换为精氨酸和丙氨酸,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ IDNO: 14和SEQ ID NO: 29中。
(10) 异二聚体型错配核酸内切酶突变体
根据实验方法1(1-2),制备能够经由接头(SEQ ID NO: 35)表达作为单一多肽的突变体1 (S47R+N76D+L123A;SEQ ID NO: 7)和突变体2 (Q78R+L123M;SEQ ID NO: 11)的人工基因,以制备错配核酸内切酶突变体溶液。突变蛋白的氨基酸序列和核酸序列分别显示在SEQ ID NO: 15和SEQ ID NO: 30中。
实施例2:错配核酸内切酶突变体的底物特异性评估
使用实施例1(1)-(9)中制备的错配核酸内切酶突变体,和野生型错配核酸内切酶(PfuNucS)及其突变体W77F,根据实验方法1(2)进行底物特异性评价。结果显示在表2中。
[表2]
突变体名称 底物特异性 GG-特异性/TT-特异性
无突变(野生型) TT, GG, TG -
W77F GG <u>&gt;</u> TG&gt;&gt;TT -
S47K+N76D GG GG-特异性
S47R+N76D+L123A GG GG-特异性
S47R+N76D+L123G GG GG-特异性
Q78R+L123S TT TT-特异性
Q78R+L123T TT TT-特异性
Q78R+L123M TT TT-特异性
Q78R+L123C TT TT-特异性
Q78R+L125V TT TT-特异性
Q78R+L125A TT TT-特异性
如表2中所示,获得了底物特异性与野生型错配核酸内切酶不同的GG特异性错配核酸内切酶突变体和TT特异性错配核酸内切酶突变体。
实施例3:异二聚体型错配核酸内切酶突变体的底物特异性评价
使用实施例1(10)中制备的异二聚体型错配核酸内切酶突变体,根据实验方法1(2)进行底物特异性评价。
结果,所述异二聚体型错配核酸内切酶突变体显示出GT/TG错配特异性底物特异性,所述底物特异性不同于野生型错配核酸内切酶的底物特异性,并且不同于实施例1(1)至(9)中制备的错配核酸内切酶突变体的底物特异性。
工业适用性
本发明可用于包括遗传技术、生物学、医学和农业领域在内的广泛领域。
序列表自由文本
SEQ ID NO: 1:来自激烈热球菌的错配核酸内切酶PF0012的氨基酸序列
SEQ ID NO: 2:错配核酸内切酶PF0012 W77F变体的氨基酸序列
SEQ ID NO: 3:来自Thermococcus barophilus的错配核酸内切酶TERMP_01877的氨基酸序列
SEQ ID NO: 4:来自詹氏甲烷球菌的错配核酸内切酶MJ_0225的氨基酸序列
SEQ ID NO: 5:来自Thermococcus kodakarensis的错配核酸内切酶TKO NucS的氨基酸序列
SEQ ID NO: 6:来自PF0012的错配核酸内切酶变体S47K+N76D的氨基酸序列
SEQ ID NO: 7:来自PF0012的错配核酸内切酶变体S47R+N76D+L123A的氨基酸序列
SEQ ID NO: 8:来自PF0012的错配核酸内切酶变体S47R+N76D+L123G的氨基酸序列
SEQ ID NO: 9:来自PF0012的错配核酸内切酶变体Q78R+L123S的氨基酸序列
SEQ ID NO: 10:来自PF0012的错配核酸内切酶变体Q78R+L123T的氨基酸序列
SEQ ID NO: 11:来自PF0012的错配核酸内切酶变体Q78R+L123M的氨基酸序列
SEQ ID NO: 12:来自PF0012的错配核酸内切酶变体Q78R+L123C的氨基酸序列
SEQ ID NO: 13:来自PF0012的错配核酸内切酶变体Q78R+L125V的氨基酸序列
SEQ ID NO: 14:来自PF0012的错配核酸内切酶变体Q78R+L125A的氨基酸序列
SEQ ID NO: 15:来自变体S47R+N76D+L123A和变体Q78R+L123M的错配核酸内切酶变体异二聚体的氨基酸序列
SEQ ID NO: 16:编码来自激烈热球菌的错配核酸内切酶PF0012的基因的核酸序列
SEQ ID NO: 17:编码错配核酸内切酶PF0012 W77F变体的基因的核酸序列
SEQ ID NO: 18:编码来自Thermococcus barophilus的错配核酸内切酶TERMP_01877的基因的核酸序列
SEQ ID NO: 19:编码来自詹氏甲烷球菌的错配核酸内切酶MJ_0225的基因的核酸序列
SEQ ID NO: 20:编码来自Thermococcus kodakarensis的错配核酸内切酶TKONucS的基因的核酸序列
SEQ ID NO: 21:编码来自PF0012的错配核酸内切酶变体S47K+N76D的基因的核酸序列
SEQ ID NO: 22:编码来自PF0012的错配核酸内切酶变体S47R+N76D+L123A的基因的核酸序列
SEQ ID NO: 23:编码来自PF0012的错配核酸内切酶变体S47R+N76D+L123G的基因的核酸序列
SEQ ID NO: 24:编码来自PF0012的错配核酸内切酶变体Q78R+L123S的基因的核酸序列
SEQ ID NO: 25:编码来自PF0012的错配核酸内切酶变体Q78R+L123T的基因的核酸序列
SEQ ID NO: 26:编码来自PF0012的错配核酸内切酶变体Q78R+L123M的基因的核酸序列
SEQ ID NO: 27:编码来自PF0012的错配核酸内切酶变体Q78R+L123C的基因的核酸序列
SEQ ID NO: 28:编码来自PF0012的错配核酸内切酶变体Q78R+L125V的基因的核酸序列
SEQ ID NO: 29:编码来自PF0012的错配核酸内切酶变体Q78R+L125A的基因的核酸序列
SEQ ID NO: 30:编码来自变体S47R+N76D+L123A和变体Q78R+L123M的错配核酸内切酶变体异二聚体的基因的核酸序列
SEQ ID NO: 31:合成的寡核苷酸“NucS-模板-T”
SEQ ID NO: 32:合成的寡核苷酸“NucS-模板-G”
SEQ ID NO: 33:合成的寡核苷酸“NucS-探针-T”。5'端用FAM标记且3'端用Eclipse标记。
SEQ ID NO: 34:合成的寡核苷酸“NucS-探针-G”。5'端用FAM标记且3'端用Eclipse标记。
SEQ ID NO: 35:接头的氨基酸序列
SEQ ID NO: 36:编码接头的核酸序列。
序列表
<110> TAKARA BIO INC.
EDUCATIONAL CORPORATION KANSAI BUNRI SOUGOUGAKUEN
KYUSHU UNIVERSITY, NATIONAL UNIVERSITY CORPORATION
<120> 耐热性错配核酸内切酶变体
<130> 676086
<150> 2020-048795
<151> 2020-03-19
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 267
<212> PRT
<213> 激烈热球菌
<400> 1
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Gln Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Leu Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 2
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 错配核酸内切酶PF0012 W77F变体的氨基酸序列
<400> 2
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Phe Gln Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Leu Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 3
<211> 251
<212> PRT
<213> Thermococcus barophilus
<400> 3
Met Glu Ala Lys Val Glu Pro Ser His Glu Glu Ile Ile Glu Ile Leu
1 5 10 15
Asp Lys Ala Leu Ser Val Glu Ala Ile Ile Thr Leu Phe Ala Tyr Cys
20 25 30
Arg Val Phe Tyr Glu Gly Arg Ala Lys Ser Glu Leu Gly Pro Gly Asp
35 40 45
Arg Val Ile Ile Ile Lys Pro Asp Gly Ser Phe Leu Ile His Gln Lys
50 55 60
Asn Lys Arg Glu Pro Val Asn Trp Gln Pro Pro Gly Ser Val Val Ser
65 70 75 80
Ile Val Leu Glu Asp Gly Arg Ile Met Leu Arg Ser Val Arg Arg Lys
85 90 95
Pro Lys Glu Thr Leu Glu Val Glu Leu Ile Lys Thr Tyr Leu Val Ser
100 105 110
Tyr Phe Gln Ala Glu Asp Tyr Glu Glu Leu Thr Leu Thr Gly Ser Glu
115 120 125
Ala Glu Met Ala Asp Leu Ile Phe Glu Asn Pro Ser Leu Ile Glu Glu
130 135 140
Gly Phe Lys Pro Leu Phe Lys Glu Lys Pro Ile Lys His Gly Ile Val
145 150 155 160
Asp Val Leu Gly Lys Asp Lys His Gly Asn Leu Val Val Leu Glu Leu
165 170 175
Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg Tyr
180 185 190
Val Asp Ser Leu Arg Glu Glu His Lys Asn Val Arg Gly Ile Leu Val
195 200 205
Ala Pro Ser Leu Thr Ala Gly Ala Lys Lys Leu Leu Glu Lys Glu Gly
210 215 220
Leu Glu Phe Lys Lys Leu Asn Pro Pro Lys Arg Glu Lys Arg Lys Lys
225 230 235 240
Gly Lys Gln Lys Thr Leu Asp Phe Leu Ser Pro
245 250
<210> 4
<211> 263
<212> PRT
<213> 詹氏甲烷球菌
<400> 4
Met Met Arg Leu Glu Lys Val Phe Tyr Leu Thr Asn Pro Thr Thr Lys
1 5 10 15
Asp Leu Glu Asn Phe Ile Asp Met Tyr Val Phe Lys Tyr Ile Leu Ile
20 25 30
Leu Leu Ala Arg Cys Lys Val Phe Tyr Glu Gly Arg Ala Lys Ser Gln
35 40 45
Leu Glu Glu Gly Asp Arg Val Ile Ile Ile Lys Pro Asp Gly Ala Phe
50 55 60
Leu Ile His Lys Asp Lys Lys Arg Glu Pro Val Asn Trp Gln Pro Ser
65 70 75 80
Gly Ser Ser Ile Ile Trp Glu Val Glu Asp Asn Phe Phe Ile Leu Lys
85 90 95
Ser Ile Arg Arg Lys Pro Lys Glu Glu Leu Lys Val Val Ile Ser Glu
100 105 110
Val Tyr His Ala Cys Ala Phe Asn Cys Glu Asp Tyr Glu Glu Ile Asn
115 120 125
Leu Arg Gly Ser Glu Ser Glu Met Ala Glu Met Ile Phe Arg Asn Pro
130 135 140
Asp Leu Ile Glu Glu Gly Phe Lys Pro Ile Ser Arg Glu Tyr Gln Ile
145 150 155 160
Pro Thr Gly Ile Val Asp Ile Leu Gly Lys Asp Lys Glu Asn Lys Trp
165 170 175
Val Ile Leu Glu Leu Lys Arg Arg Arg Ala Asp Leu Gln Ala Val Ser
180 185 190
Gln Leu Lys Arg Tyr Val Glu Tyr Phe Lys Asn Lys Tyr Gly Glu Asp
195 200 205
Lys Val Arg Gly Ile Leu Val Ser Pro Ser Leu Thr Thr Gly Ala Glu
210 215 220
Lys Leu Leu Lys Glu Glu Asn Leu Glu Phe Lys Arg Leu Asn Pro Pro
225 230 235 240
Lys Gly Ser Lys Arg Asp Leu Lys His Asn Ile Lys Thr Lys Lys Thr
245 250 255
Thr Val Leu Asp Glu Trp Leu
260
<210> 5
<211> 252
<212> PRT
<213> Thermococcus kodakarensis
<400> 5
Met Ser Lys Asp Lys Val Thr Val Ile Thr Ser Pro Ser Thr Glu Glu
1 5 10 15
Leu Val Ser Leu Val Asn Ser Ala Leu Leu Glu Glu Ala Met Leu Thr
20 25 30
Ile Phe Ala Arg Cys Lys Val His Tyr Asp Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Ser Gly Asp Arg Val Ile Ile Val Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Ser Lys Lys Arg Glu Pro Val Asn Trp Gln Pro Pro
65 70 75 80
Gly Ser Arg Val Arg Leu Glu Leu Arg Glu Asn Pro Val Leu Val Ser
85 90 95
Ile Arg Arg Lys Pro Arg Glu Thr Leu Glu Val Glu Leu Glu Glu Val
100 105 110
Tyr Met Val Ser Val Phe Arg Ala Glu Asp Tyr Glu Glu Leu Ala Leu
115 120 125
Thr Gly Ser Glu Ala Glu Met Ala Glu Leu Ile Phe Glu Asn Pro Glu
130 135 140
Val Ile Glu Pro Gly Phe Lys Pro Leu Phe Arg Glu Lys Ala Ile Gly
145 150 155 160
Thr Gly Ile Val Asp Val Leu Gly Arg Asp Ser Asp Gly Asn Ile Val
165 170 175
Val Leu Glu Leu Lys Arg Arg Arg Ala Glu Leu His Ala Val Arg Gln
180 185 190
Leu Lys Ser Tyr Val Glu Ile Leu Arg Glu Glu Tyr Gly Asp Lys Val
195 200 205
Arg Gly Ile Leu Val Ala Pro Ser Leu Thr Ser Gly Ala Lys Arg Leu
210 215 220
Leu Glu Lys Glu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Arg
225 230 235 240
Asp Ser Lys Lys Lys Gly Arg Gln Lys Thr Leu Phe
245 250
<210> 6
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 S47K+N76D
的氨基酸序列
<400> 6
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Lys Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asp Trp Gln Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Leu Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 7
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体S47R+N76D+L123A
的氨基酸序列
<400> 7
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Arg Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asp Trp Gln Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Ala Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 8
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 S47R+N76D+L123G
的氨基酸序列
<400> 8
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Arg Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asp Trp Gln Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Gly Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 9
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 Q78R+L123S
的氨基酸序列
<400> 9
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Arg Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Ser Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 10
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012错配核酸内切酶变体 Q78R+L123T
的氨基酸序列
<400> 10
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Arg Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Thr Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 11
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 Q78R+L123M
的氨基酸序列
<400> 11
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Arg Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Met Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 12
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 Q78R+L123C
的氨基酸序列
<400> 12
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Arg Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Cys Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 13
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 Q78R+L125V
的氨基酸序列
<400> 13
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Arg Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Leu Thr Val Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 14
<211> 267
<212> PRT
<213> 人工序列
<220>
<223> 来自PF0012的错配核酸内切酶变体 Q78R+L125A
的氨基酸序列
<400> 14
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Ser Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp Arg Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Leu Thr Ala Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
260 265
<210> 15
<211> 542
<212> PRT
<213> 人工序列
<220>
<223> 来自变体 S47R+N76D+L123A 和变体 Q78R+L123M的
错配核酸内切酶变体异二聚体的氨基酸序列
<400> 15
Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg Ile Glu Glu
1 5 10 15
Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly Leu Leu Thr
20 25 30
Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala Lys Arg Glu
35 40 45
Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp Gly Ser Phe
50 55 60
Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asp Trp Gln Pro Pro
65 70 75 80
Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser Ile Arg Arg
85 90 95
Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala Tyr Ala Ala
100 105 110
Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Ala Thr Leu Thr Gly Ser
115 120 125
Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn Val Ile Glu
130 135 140
Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys His Gly Ile
145 150 155 160
Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val Val Leu Glu
165 170 175
Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln Leu Lys Arg
180 185 190
Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val Arg Gly Ile
195 200 205
Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu Leu Glu Lys
210 215 220
Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys Gly Lys Lys
225 230 235 240
Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp Thr Val Arg
245 250 255
Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln Leu Glu Val Leu Phe
260 265 270
Gln Gly Pro Met Glu Met Thr Lys Ala Ile Val Lys Glu Asn Pro Arg
275 280 285
Ile Glu Glu Ile Lys Glu Leu Leu Glu Val Ala Glu Ser Arg Glu Gly
290 295 300
Leu Leu Thr Ile Phe Ala Arg Cys Thr Val Tyr Tyr Glu Gly Arg Ala
305 310 315 320
Lys Ser Glu Leu Gly Glu Gly Asp Arg Ile Ile Ile Ile Lys Pro Asp
325 330 335
Gly Ser Phe Leu Ile His Gln Lys Lys Lys Arg Glu Pro Val Asn Trp
340 345 350
Arg Pro Pro Gly Ser Lys Val Lys Met Glu Gly Asn Ser Leu Ile Ser
355 360 365
Ile Arg Arg Asn Pro Lys Glu Thr Leu Lys Val Asp Ile Ile Glu Ala
370 375 380
Tyr Ala Ala Val Leu Phe Met Ala Glu Asp Tyr Glu Glu Met Thr Leu
385 390 395 400
Thr Gly Ser Glu Ala Glu Met Ala Glu Leu Ile Phe Gln Asn Pro Asn
405 410 415
Val Ile Glu Glu Gly Phe Lys Pro Met Phe Arg Glu Lys Pro Ile Lys
420 425 430
His Gly Ile Val Asp Val Leu Gly Val Asp Arg Glu Gly Asn Ile Val
435 440 445
Val Leu Glu Leu Lys Arg Arg Arg Ala Asp Leu His Ala Val Ser Gln
450 455 460
Leu Lys Arg Tyr Val Asp Ala Leu Lys Glu Glu His Gly Asn Lys Val
465 470 475 480
Arg Gly Ile Leu Val Ala Pro Ser Leu Thr Glu Gly Ala Lys Lys Leu
485 490 495
Leu Glu Lys Leu Gly Leu Glu Phe Arg Lys Leu Glu Pro Pro Lys Lys
500 505 510
Gly Lys Lys Lys Ser Ser Lys Gln Lys Thr Leu Asp Phe Leu Asn Asp
515 520 525
Thr Val Arg Ile Thr Gly Ala Ser Pro Pro Glu Ala Ile Gln
530 535 540
<210> 16
<211> 804
<212> DNA
<213> 激烈热球菌
<400> 16
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcagccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaactga ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 17
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码错配核酸内切酶PF0012 W77F变体的基因的核酸序列
<400> 17
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactt tcagccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaactga ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 18
<211> 756
<212> DNA
<213> Thermococcus barophilus
<400> 18
atggaagcta aggttgaacc ctctcacgaa gaaataattg aaattttgga taaagccctc 60
tctgttgagg ctatcataac tctttttgct tattgtaggg tattctatga ggggagagcc 120
aagagtgagc ttggccccgg agatagggtc attataatca agccagatgg ctctttttta 180
attcaccaga agaacaaaag agaacctgtt aactggcagc cgccggggag tgttgtcagc 240
atcgttcttg aggatgggag aataatgctg agaagtgtta ggagaaaacc gaaagaaacc 300
cttgaagttg agctcattaa aacttatctt gtgagttatt tccaagcaga ggattatgag 360
gagctgacat taactggaag tgaagcagag atggctgatt tgatctttga gaatccctca 420
ttaattgagg aaggatttaa accgctcttt aaggaaaagc caattaaaca tggaatagtt 480
gatgtgcttg gaaaagacaa acatggcaat ttggttgtcc ttgagcttaa gcgcaggaga 540
gcagatctgc atgcggtcag tcaacttaaa agatatgttg attctctgag ggaggagcat 600
aaaaatgttc gtgggatttt ggttgcccct tctcttacgg ctggggctaa aaaattactt 660
gaaaaagaag ggctggaatt taaaaagctg aatccaccaa agcgtgaaaa gaggaaaaaa 720
ggcaagcaga aaacccttga ttttctcagc ccatag 756
<210> 19
<211> 792
<212> DNA
<213> 詹氏甲烷球菌
<400> 19
atgatgagat tggagaaagt tttctatcta accaatccta ctaccaaaga tttagaaaat 60
tttattgata tgtatgtgtt taaatatata ttaatattat tagctcgatg taaagttttt 120
tatgaaggca gagctaaaag tcagttagaa gagggagata gagtcattat aataaaacca 180
gatggagcct ttttaattca taaagataaa aaaagagaac ctgtaaattg gcaaccttct 240
ggaagtagta taatatggga agttgaagat aactttttca ttttaaaaag cattagaaga 300
aagccaaaag aagagttaaa ggttgttatt tcagaagttt atcatgcatg tgcttttaac 360
tgtgaagatt atgaagagat aaatctaagg ggtagtgaat cagagatggc agagatgatt 420
tttagaaatc cagatttgat tgaagaagga tttaagccca tatcaagaga gtatcagatt 480
cccactggaa tcgttgatat tttaggaaaa gataaagaga ataaatgggt tatcttagag 540
ctaaagagaa ggagagctga tttacaggca gtttctcaac taaaaaggta tgtggaatat 600
tttaaaaaca aatatggtga ggataaagtt agaggaattt tggtttctcc ctctttaact 660
actggggcgg aaaaattgct gaaagaggag aacttagaat ttaaaagact taatccacca 720
aaaggaagta aaagagattt aaaacataac ataaaaacta aaaaaacaac agttttagat 780
gaatggctat aa 792
<210> 20
<211> 759
<212> DNA
<213> Thermococcus kodakarensis
<400> 20
atgtccaagg ataaggtaac ggtcatcacg tcgccatcaa ccgaagaact cgtttcgcta 60
gtcaattcag ctctcttaga agaggccatg ctgacgattt ttgcccgctg taaggtccac 120
tacgatggaa gggcaaagag cgagctcggc tccggcgata gggtcatcat agtcaagccc 180
gacggctctt ttctcatcca ccagagcaag aagcgcgagc ccgtgaactg gcagccaccg 240
ggtagcagag tgaggctgga gctgagggag aacccagttc tcgtctcgat aaggagaaag 300
ccgagggaga cccttgaggt cgagctcgaa gaggtctaca tggtctccgt cttccgagct 360
gaggactacg aggagctcgc ccttacgggg agcgaggccg agatggcgga gcttatcttt 420
gaaaatccag aggtcataga gcctggcttc aagccgctgt tcagggagaa ggcgatagga 480
actggaatcg ttgatgtcct tggaagggac agtgatggga atatagttgt ccttgagctt 540
aagcgcagga gggcggaact ccatgccgtt agacagctca agagctacgt cgagattctg 600
agagaggagt acggcgataa agtccgtgga attctcgttg ctccctcgct cacttctggg 660
gcaaaaagac tcctggaaaa ggagggcctc gagttcagga agctcgaacc gcctaaaaga 720
gactccaaaa agaagggcag acagaagaca ctgttttag 759
<210> 21
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体的基因的核酸序列
<400> 21
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaaa agaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtggattg gcagccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaactga ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 22
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体 S47R+N76D+L123A
的基因的核酸序列
<400> 22
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaacg cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtggattg gcagccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaagcga ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 23
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自的PF0012的错配核酸内切酶变体 S47R+N76D+L123G
的基因的核酸序列
<400> 23
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaacg cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtggattg gcagccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaaggca ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 24
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体 Q78R+L123S
的基因的核酸序列
<400> 24
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcgcccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaaagca ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 25
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体 Q78R+L123T
的基因的核酸序列
<400> 25
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcgcccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaaacca ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 26
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体 Q78R+L123M
的基因的核酸序列
<400> 26
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcgcccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaaatga ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 27
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体 Q78R+L123C
的基因的核酸序列
<400> 27
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcgcccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaatgca ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 28
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体 Q78R+L125V
的基因的核酸序列
<400> 28
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcgcccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaactga ccgttaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 29
<211> 804
<212> DNA
<213> 人工序列
<220>
<223> 编码来自PF0012的错配核酸内切酶变体Q78R+L125A
的基因的核酸序列
<400> 29
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaaag cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtgaactg gcgcccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaactga ccgcgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gtaa 804
<210> 30
<211> 1629
<212> DNA
<213> 人工序列
<220>
<223> 编码来自变体 S47R+N76D+L123A和变体Q78R+L123M的
错配核酸内切酶变体异二聚体的基因的核酸序列
<400> 30
atggaaatga ccaaagcgat tgtgaaagaa aacccgcgca ttgaagaaat taaagaactg 60
ctggaagtgg cggaaagccg cgaaggcctg ctgaccattt ttgcgcgctg caccgtgtat 120
tatgaaggcc gcgcgaaacg cgaactgggc gaaggcgatc gcattattat tattaaaccg 180
gatggcagct ttctgattca tcagaaaaag aaacgcgaac cggtggattg gcagccgccg 240
ggcagcaaag tgaaaatgga aggcaacagc ctgattagca ttcgccgcaa cccgaaagaa 300
accctgaaag tggatattat tgaagcgtat gcggcggtgc tgtttatggc ggaagattat 360
gaagaagcga ccctgaccgg cagcgaagcg gaaatggcgg aactgatttt tcagaacccg 420
aacgtgattg aagaaggctt taaaccgatg tttcgcgaaa aaccgattaa acatggcatt 480
gtggatgtgc tgggcgtgga tcgcgaaggc aacattgtgg tgctggaact gaaacgccgc 540
cgcgcggatc tgcatgcggt gagccagctg aaacgctatg tggatgcgct gaaagaagaa 600
catggcaaca aagtgcgcgg cattctggtg gcgccgagcc tgaccgaagg cgcgaaaaaa 660
ctgctggaaa aactgggcct ggaatttcgc aaactggaac cgccgaaaaa aggcaaaaag 720
aaaagcagca aacagaaaac cctggatttt ctgaacgata ccgtgcgcat taccggcgcg 780
agcccgccgg aagcgattca gctggaagtt ctgttccagg ggcccatgga aatgaccaaa 840
gcgattgtga aagaaaaccc gcgcattgaa gaaattaaag aactgctgga agtggcggaa 900
agccgcgaag gcctgctgac catttttgcg cgctgcaccg tgtattatga aggccgcgcg 960
aaaagcgaac tgggcgaagg cgatcgcatt attattatta aaccggatgg cagctttctg 1020
attcatcaga aaaagaaacg cgaaccggtg aactggcgcc cgccgggcag caaagtgaaa 1080
atggaaggca acagcctgat tagcattcgc cgcaacccga aagaaaccct gaaagtggat 1140
attattgaag cgtatgcggc ggtgctgttt atggcggaag attatgaaga aatgaccctg 1200
accggcagcg aagcggaaat ggcggaactg atttttcaga acccgaacgt gattgaagaa 1260
ggctttaaac cgatgtttcg cgaaaaaccg attaaacatg gcattgtgga tgtgctgggc 1320
gtggatcgcg aaggcaacat tgtggtgctg gaactgaaac gccgccgcgc ggatctgcat 1380
gcggtgagcc agctgaaacg ctatgtggat gcgctgaaag aagaacatgg caacaaagtg 1440
cgcggcattc tggtggcgcc gagcctgacc gaaggcgcga aaaaactgct ggaaaaactg 1500
ggcctggaat ttcgcaaact ggaaccgccg aaaaaaggca aaaagaaaag cagcaaacag 1560
aaaaccctgg attttctgaa cgataccgtg cgcattaccg gcgcgagccc gccggaagcg 1620
attcagtaa 1629
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸"NucS-模板-T"
<400> 31
aatatccgtt aggcattgaa gca 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸"NucS-模板-G"
<400> 32
aatatccggt aggcattgaa gca 23
<210> 33
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸"NucS-探针-T"。
5'-端由FAM标记且3'-端由Eclipse标记。
<400> 33
atgcctatcg gatat 15
<210> 34
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的寡核苷酸"NucS-探针-G"。
5'-端由FAM标记且3'-端由Eclipse标记。
<400> 34
atgcctagcg gatat 15
<210> 35
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 接头的氨基酸序列
<400> 35
Leu Glu Val Leu Phe Gln Gly Pro
1 5
<210> 36
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 编码接头的核酸序列
<400> 36
ctggaagttc tgttccaggg gccc 24

Claims (17)

1.由以下(A)或(B)表示的多肽:
(A) 一种多肽,其选自由以下(1)至(4)组成的组并且具有切割核酸链的活性,所述核酸链具有在双链核酸中形成错配碱基对的鸟嘌呤(G):
(1) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第47位的丝氨酸的取代和由酸性氨基酸残基对第76位的天冬酰胺的取代;
(2) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在(1)中所述的取代氨基酸序列中的另外的1至10个氨基酸残基的突变,其中所述突变是取代、缺失、插入和/或添加,并且(1)中所述的取代氨基酸序列中的氨基酸取代得到保留;
(3) 包含如下氨基酸序列的多肽,所述氨基酸序列与(1)或(2)中所述的取代或突变的氨基酸序列具有50%或更高的同源性,其中(1)或(2)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;和
(4) 包含如下氨基酸序列的多肽,所述氨基酸序列与(1)或(2)中所述的取代或突变的氨基酸序列具有50%或更高的同一性,其中(1)或(2)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;或者
(B) 一种多肽,其选自由以下(5)至(8)组成的组并且具有切割核酸链的活性,所述核酸链具有在双链核酸中形成错配碱基对的胸腺嘧啶(T):
(5) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在SEQ ID NO: 1中所示的氨基酸序列中,由碱性氨基酸残基对第78位的谷氨酰胺的取代和由中性(极性,不带电)氨基酸残基或含硫氨基酸残基对第123位的亮氨酸的取代,或由疏水性氨基酸残基或含硫氨基酸残基对第125位的亮氨酸的取代;
(6) 包含如下氨基酸序列的多肽,所述氨基酸序列包含在(5)中所述的取代氨基酸序列中的另外的1至10个氨基酸残基的突变,其中所述突变是取代、缺失、插入和/或添加,并且(5)中所述的取代氨基酸序列中的氨基酸取代得到保留;
(7) 包含如下氨基酸序列的多肽,所述氨基酸序列与(5)或(6)中所述的取代或突变的氨基酸序列具有50%或更高的同源性,其中(5)或(6)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留;和
(8) 包含如下氨基酸序列的多肽,所述氨基酸序列与(5)或(6)中所述的取代或突变的氨基酸序列具有50%或更高的同一性,其中(5)或(6)中所述的取代或突变的氨基酸序列中的氨基酸取代或突变得到保留。
2.根据权利要求1所述的多肽,其中:
所述碱性氨基酸残基是赖氨酸、精氨酸或组氨酸,
所述酸性氨基酸残基是天冬氨酸或谷氨酸,
所述中性(极性、不带电)氨基酸是苏氨酸、丝氨酸、天冬酰胺、谷氨酰胺、酪氨酸或半胱氨酸,
所述含硫氨基酸是半胱氨酸或甲硫氨酸,以及
所述疏水(非极性)氨基酸是丙氨酸、甘氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、色氨酸、苯丙氨酸或甲硫氨酸。
3.根据权利要求1或2所述的多肽,其包含选自SEQ ID NO: 6至15的氨基酸序列。
4.一种核酸,其编码根据权利要求1-3中任一项所述的多肽。
5.根据权利要求4所述的核酸,其包含选自SEQ ID NO: 21至30的核苷酸序列。
6.一种表达载体,其包含根据权利要求4或5所述的核酸和表达调控序列。
7.一种细胞,其由根据权利要求6所述的表达载体转化,表达具有错配核酸内切酶活性的多肽。
8.一种用于切割具有错配的双链核酸的方法,所述方法包括使用根据权利要求1-3中任一项所述的多肽处理所述双链核酸的步骤。
9.一种组合物,其包含以下(a)至(d):
(a) 根据权利要求1-3中任一项所述的多肽;
(b) 一种寡核苷酸,其在与非靶核酸杂交时形成包含至少一个错配的双链核酸,其中所述双链核酸被(a)的多肽切割,并且在与靶核酸杂交时形成不被(a)的多肽切割的双链核酸;
(c) 至少一对寡核苷酸引物;和
(d) 具有DNA聚合酶活性的多肽。
10.一种用于扩增核酸的方法,所述方法包括以下步骤(1)和(2):
(1) 制备组合物的步骤,所述组合物包含作为模板的核酸分子和以下(a)至(d):
(a) 根据权利要求1-3中任一项所述的多肽;
(b) 一种寡核苷酸,其在与非靶核酸杂交时形成包含至少一个错配的双链核酸,其中所述双链核酸被(a)的多肽切割,并且在与靶核酸杂交时形成不被(a)的多肽切割的双链核酸;
(c) 至少一对寡核苷酸引物;和
(d) 具有DNA聚合酶活性的多肽;和
(2) 使步骤(1)中获得的组合物在适当的条件下反应以进行核酸扩增的步骤。
11.根据权利要求10所述的方法,其中所述核酸扩增通过聚合酶链式反应(PCR)方法、等温核酸扩增方法或多重置换扩增(MDA)方法进行。
12.一种用于抑制包含特定核苷酸序列的核酸扩增的方法,所述方法包括在以下(a)至(d)的存在下进行核酸扩增反应的步骤:
(a) 一种寡脱氧核苷酸,其经设计以在与包含特定核苷酸序列或其互补链的核酸杂交时产生一个或几个错配;
(b) DNA聚合酶;
(c) 至少一对寡核苷酸引物;和
(d) 根据权利要求1-3中任一项所述的多肽。
13.根据权利要求12所述的方法,其中所述核酸扩增反应为聚合酶链式反应(PCR)或等温核酸扩增。
14.一种用于优先扩增靶DNA的方法,所述方法包括通过根据权利要求12或13所述的方法抑制具有与靶DNA相差一个或几个核苷酸的核苷酸序列的DNA的扩增。
15.根据权利要求14所述的方法,其用于扩增具有野生型核苷酸序列的DNA和通过彼此不同的单核苷酸多态性突变而不同于野生型DNA的DNA中的一个。
16.根据权利要求15所述的方法,其中所述单核苷酸多态性突变是与癌变或癌症治疗剂的治疗效果相关的单核苷酸多态性突变。
17.二聚体形式的多肽,其选自:
(1) 同二聚体,其具有作为亚基的根据权利要求1 (A)所述的多肽,
(2) 同二聚体,其具有作为亚基的根据权利要求1 (B)所述的多肽,和
(3) 异二聚体,其具有作为亚基的根据权利要求1 (A)所述的多肽和根据权利要求1(B)所述的多肽。
CN202180021831.5A 2020-03-19 2021-03-18 耐热的错配核酸内切酶变体 Pending CN115210380A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020048795 2020-03-19
JP2020-048795 2020-03-19
PCT/JP2021/011033 WO2021187554A1 (ja) 2020-03-19 2021-03-18 耐熱性ミスマッチエンドヌクレアーゼ変異体

Publications (1)

Publication Number Publication Date
CN115210380A true CN115210380A (zh) 2022-10-18

Family

ID=77771024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180021831.5A Pending CN115210380A (zh) 2020-03-19 2021-03-18 耐热的错配核酸内切酶变体

Country Status (5)

Country Link
US (1) US20230133071A1 (zh)
EP (1) EP4123025A4 (zh)
JP (1) JPWO2021187554A1 (zh)
CN (1) CN115210380A (zh)
WO (1) WO2021187554A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105189746A (zh) * 2013-03-14 2015-12-23 宝生物工程株式会社 用于使用耐热的错配内切核酸酶的方法
CN107002067A (zh) * 2014-09-11 2017-08-01 宝生物工程株式会社 利用热稳定性错配内切核酸酶的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0870060B1 (en) 1995-12-15 2003-04-02 Duke University Methods using mismatch repair systems for the detection and removal of mutant sequences that arise during enzymatic amplification
JP4986358B2 (ja) 2000-02-22 2012-07-25 フォックス・チェイス・キャンサー・センター ミスマッチエンドヌクレアーゼをコードする核酸分子およびその使用方法
CN107614681A (zh) 2015-03-20 2018-01-19 宝生物工程株式会社 用于检测靶核酸的高灵敏度方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105189746A (zh) * 2013-03-14 2015-12-23 宝生物工程株式会社 用于使用耐热的错配内切核酸酶的方法
CN107002067A (zh) * 2014-09-11 2017-08-01 宝生物工程株式会社 利用热稳定性错配内切核酸酶的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢娟娟;王风平;刘喜朋;: "火球菌Pyrococcus furious瓣状核酸内切酶1的表达纯化及酶学特征", 微生物学报, vol. 57, no. 09, pages 1352 - 1361 *

Also Published As

Publication number Publication date
JPWO2021187554A1 (zh) 2021-09-23
EP4123025A1 (en) 2023-01-25
WO2021187554A1 (ja) 2021-09-23
EP4123025A4 (en) 2024-04-10
US20230133071A1 (en) 2023-05-04

Similar Documents

Publication Publication Date Title
KR102084186B1 (ko) Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
CN102796728B (zh) 用于通过转座酶的dna片段化和标记的方法和组合物
US10280412B2 (en) Method for using heat-resistant mismatch endonuclease
EP3423574B1 (en) Polymerase-template complexes for nanopore sequencing
US5869245A (en) Mismatch endonuclease and its use in identifying mutations in targeted polynucleotide strands
US8003346B2 (en) Mutant PCNA
JP6550649B2 (ja) 耐熱性のミスマッチエンドヌクレアーゼの利用方法
JP2003505071A (ja) 核酸検出のための耐熱性ヌクレオシド二リン酸キナーゼ
CN112513262A (zh) 适合于从rna进行核酸扩增的dna聚合酶突变体
EP0964929A1 (en) Mismatch endonucleases and uses thereof in identifying mutations in targeted polynucleotide strands
CN115210380A (zh) 耐热的错配核酸内切酶变体
CN110438103B (zh) 一种新型高效的常温ii型限制性内切酶
CN110452894B (zh) 靶向agct位点的耐高温ii型限制性内切酶及其应用
CN110438212B (zh) 用于特定基因片段富集检测的酶切pcr试剂盒和方法
KR100689795B1 (ko) 복합체 형성 방법
CN116024192A (zh) 一种基于TbAgo的核酸切割体系及靶标核酸分子的检测方法和试剂盒
CN116024193A (zh) 一种基于TthAgo的核酸切割体系及靶标核酸分子的检测方法和试剂盒
February Mismatch endonuclease and its use in identifying mutations in targeted polynucleotide strands

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination