CN116249782A - 使用热稳定性酶从头开始的不依赖于模板的核酸合成 - Google Patents

使用热稳定性酶从头开始的不依赖于模板的核酸合成 Download PDF

Info

Publication number
CN116249782A
CN116249782A CN202180055846.3A CN202180055846A CN116249782A CN 116249782 A CN116249782 A CN 116249782A CN 202180055846 A CN202180055846 A CN 202180055846A CN 116249782 A CN116249782 A CN 116249782A
Authority
CN
China
Prior art keywords
glu
lys
leu
ile
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180055846.3A
Other languages
English (en)
Inventor
I·兰德里安贾托沃-巴鲁
A·塞德
R·拉希尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xin Xikesi
Original Assignee
Xin Xikesi
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xin Xikesi filed Critical Xin Xikesi
Publication of CN116249782A publication Critical patent/CN116249782A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明涉及核酸合成或测序领域,更具体地说,涉及从头开始的核酸合成方法,该方法包括在存在古细菌DNA引物酶或其功能活性片段和/或变体的情况下,使具有游离3’‑羟基的核苷酸与至少一种核苷三磷酸或核苷三磷酸的组合接触,从而使所述核苷三磷酸共价结合到所述核苷酸的游离3’‑羟基。本发明还涉及古细菌DNA引物酶的分离的功能活性片段,这些功能活性片段具有能够从头开始的单链核酸合成活性和不依赖于模板的末端核苷酸转移酶活性二者。

Description

使用热稳定性酶从头开始的不依赖于模板的核酸合成
技术领域
本发明涉及核酸合成或测序领域,更具体地说,涉及从头开始的核酸合成方法,该方法包括在存在古细菌DNA引物酶或其功能活性片段和/或变体的情况下,使具有游离3’-羟基的核苷酸与至少一种核苷三磷酸或核苷三磷酸的组合接触,从而使所述核苷三磷酸共价结合到所述核苷酸的游离3’-羟基。
本发明还涉及古细菌DNA引物酶的分离的功能活性片段,这些功能活性片段具有能够从头开始(ab-initio)的单链核酸合成活性和不依赖于模板的末端核苷酸转移酶活性二者。
发明背景
核酸的模板非依赖性合成是一个重大的行业挑战。
许多生产者都能够通过化学方法合成DNA或RNA链,然而他们很快就遭遇了这些生产方法的局限性。今天,核酸化学合成的黄金方法是亚磷酰胺法,它开发于20世纪80年代,后来通过固相支持和自动化得到加强((Beaucage&Caruthers,1981.Tetrahedron Lett.22(20):1859-62;McBride&Caruthers,1983.Tetrahedron Lett.24(3):245-8;Beaucage&Iyer,1992.Tetrahedron.48(12):2223-2311)。
然而,这种方法有很大的局限性:首先,只能合成不超过大约250个核苷酸的核酸;其次,亚磷酰胺法需要使用的有机溶剂可能是致癌物、生殖危害物和神经毒素,而合成的副产品可能还是有毒和污染性的。
为了克服这些问题,近来开发了一种新的,通过酶促方式进行的,不依赖于模板的,序列受控的核酸合成方法。它基于使用具有末端转移酶活性的酶的使用,例如X家族DNA聚合酶(包括末端脱氧核苷酸转移酶[TdT]或DNA聚合酶μ)和A家族DNA聚合酶(包括DNA聚合酶θ)(Kent et al.,2016.Elife.5:e13740)。
然而,上述所有酶的一个共同特征是它们需要至少4个核苷酸长的单链DNA引物来启动核酸合成。这种情况意味着额外的合成起始序列需要添加到反应介质中,并且需要在合成后去除。因此,使用上述酶的核酸合成需要额外的成本和时间去使用化学、生化和/或物理方法来合成和去除起始序列。
此外,为了控制此类过程,通常使用在其3’-OH末端带有阻断基团的修饰的核苷三磷酸(称为“终止核苷三磷酸”、“3’-受阻断的核苷三磷酸”或“3’-受保护的核苷三磷酸”)(
Figure BDA0004113289200000021
et al.,2017.Molecules.22(4):672;WO2017216472;WO2018102554)。这种核苷三磷酸被称为“可逆终止”,因为在酶促活性下通过添加这种核苷三磷酸形成的寡核苷酸不能进一步延伸,直到3’-OH阻断基团被去除。以这种方式,只有一个核苷酸暂时引入到正在增长的核酸链中,即使在均聚区域中。在市售的带有3’-OH阻断基团的可逆终止核苷三磷酸中,由Benner及其同事开发的肟阻断的(3’-ONH2)核苷三磷酸(Hutter et al.,2010.Nucleosides Nucleotides Nucleic Acids.29(11):879-895),Ju及其同事生产的3’-烯丙基核苷三磷酸(Guo et al.,2010.Acc Chem Res.43(4):551-563)或3’-叠氮甲基核苷三磷酸(Guo et al.,2008.Proc NatlAcad Sci USA.105(27):9145-9150)通常用于控制寡核苷酸的酶促合成。
自下一代核酸合成技术出现以来,可逆终止核苷三磷酸领域也蓬勃发展。多项专利和研究涉及这些可逆终止类似物的制备(WO2018102554,US8,034,923),尽管核苷三磷酸的纯化方法随着时间的推移有了很大的发展,但要在反应预混物中获得100%的具有3’-OH阻断基团的核苷三磷酸极其复杂(如果不是不可能的话)。
作为案例研究,功能性寡核苷酸(例如,DNA或RNA适体、核酶或DNAzyme、核糖开关等)的合成需要具有最高保真度的精确核苷酸序列。单个核苷酸的一次不受控添加会对功能性寡核苷酸的二级结构产生破坏性影响,从而改变其生物学功能。假设反应预混物中x%的核苷三磷酸缺少3’-OH阻断基团,则将人为引入每个循环中x%的引入错误核苷酸的合成寡核苷酸的偏差。这将随要执行的循环数呈指数增长。例如,Benner小组所面临的未受保护的核苷三磷酸的引入在样品中的含量约为3%(Hutter et al.,2010.NucleosidesNucleotides NucleicAcids.29(11):879-895;Supplementary material S34)。
在此基础上,发明人在此涉及开发核苷三磷酸净化方法的重要性,该方法将允许获得纯度高达100%的终止核苷三磷酸库。
本领域已经描述了几种方法,并且通常用于净化终止核苷三磷酸库中未受保护的核苷三磷酸。
最简单和经典的方法是使用锚定在固体支持物上的核酸模板进行PCR,从而很容易将PCR产物与终止核苷三磷酸分离。实际上,在PCR期间,DNA聚合酶只会负责那些具有游离3’-OH末端的核苷三磷酸(即未受保护的核苷三磷酸)。因此,在反应结束时,剩余的终止核苷三磷酸库(在PCR期间不能使用)将得到富集。这个方法虽然有效但相当昂贵,因为它需要为每个核苷酸购买核酸模板和引物以进行聚合酶方法。此外,用于PCR反应的传统TaqDNA聚合酶只能引入四种天然脱氧核苷酸(dATP、dTTP、dGTP、dCTP)。因此,PCR净化不能保证消除其他核苷三磷酸(如核糖核苷酸或人工核苷三磷酸)、中间体类似物(如丙酮肟等)或反应的副产物。
另一种技术依赖于使用末端转移酶样酶(TdT),这种酶能够在没有复制用模板链的情况下将核苷酸添加至核酸引物。事实上,这样的酶能够结合单链DNA并引入几个未受保护的核苷三磷酸。核酸引物还可以连接到固体支持物上,以促进游离终止核苷三磷酸的纯化。我们实验室进行的实验表明,市售的TdT可以添加约400个核苷酸至单链DNA引物。因此,这种酶可用于进行核苷三磷酸的净化方法,但主要缺点仍然存在,因为(1)仍然需要添加较大量的单链DNA引物以耗尽未受保护的核苷三磷酸的总量;(2)使用TdT的最佳温度范围(37-45℃)使得纯化某些核苷三磷酸(尤其是dGTP)变得困难(如果不是无效的话)。事实上,一些G-四倍体结构可以形成并可能导致使用那些未受保护的dGTP的多聚G核酸合成在早期终止。
因此,有必要找到克服这些问题的替代的核苷三磷酸净化手段和方法。几年前,Forterre及其同事描述了一种名为“PolpTN2”的古细菌DNA引物酶的生化特性,该引物酶是从鹦鹉螺热球菌(Thermococcus nautili)(以前报道为鹦鹉热球菌(Thermococcusnautilus))质粒pTN2中分离出来的(Gill et al.,2014.Nucleic Acids Res.42(6):3707-3719)。天然的全长酶已显示出一些严格依赖dNTP的DNA引物酶、DNA聚合酶活性,而截短形式(本文称为PolpTN2Δ311-923)已显示出末端核苷酸转移酶活性。
此外,Béguin等人已证明全长PolpTN2引物酶和PolB DNA聚合酶的组合在三磷酸脱氧核苷酸存在下导致长双链DNA片段的从头开始的合成(即,没有模板DNA也没有寡核苷酸引物)。然而,这种现象需要两种酶的存在,并且当仅PolpTN2与dNTP混合物反应时没有观察到这种现象(Béguin et al.,2015.Extremophiles.19(1):69-76)。
在本文中,发明人令人惊讶证明,PolpTN2Δ311-923具备能够从头开始的单链核酸合成活性,这是一种令人惊讶的活性,此前在古-真核生物引物酶(AEP)超家族的任何成员中均未描述过。
基于这些发现,本发明提供了克服了上述问题的核酸的从头开始的合成和功能化以及核苷三磷酸净化的有效手段和方法。
发明内容
本发明涉及一种从头开始的单链核酸合成方法,该方法包括在存在属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域或其功能活性变体的情况下,使核苷酸的游离3’-羟基与至少一种核苷三磷酸或核苷三磷酸的组合接触,从而使所述核苷三磷酸共价结合到所述核苷酸的游离3’-羟基,所述功能活性变体具有能够从头开始的单链核酸合成活性和不依赖于模板的末端核苷酸转移酶活性二者。
在一个实施方案中,所述古细菌DNA引物酶或其功能活性变体来自热球菌(Thermococcus)属的古细菌。
在一个实施方案中,所述属于引物酶-聚合酶家族的古细菌DNA引物酶或其功能活性变体选自鹦鹉螺热球菌种(Thermococcus nautili sp.)30-1DNA引物酶、热球菌属种(Thermococcus sp.)CIR10 DNA引物酶、嗜胨热球菌(Thermococcus peptonophilus)DNA引物酶和芹菜热球菌(Thermococcus celericrescens)DNA引物酶。
在一个实施方案中,所述属于引物酶-聚合酶家族的古细菌DNA引物酶或其功能活性变体是:
-鹦鹉螺热球菌种30-1DNA引物酶,其具有SEQ ID NO:1的氨基酸序列;
-热球菌属种CIR10 DNA引物酶,其具有SEQ ID NO:14的氨基酸序列;
-嗜胨热球菌DNA引物酶,其具有SEQ ID NO:17的氨基酸序列;或
-芹菜热球菌DNA引物酶,其具有SEQ ID NO:19的氨基酸序列。
在一个实施方案中,所述属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域是:
-鹦鹉螺热球菌种30-1DNA引物酶的引物酶结构域,其具有SEQ ID NO:2至13中任一个氨基酸序列;
-热球菌属种CIR10 DNA引物酶的引物酶结构域,其具有SEQ ID NO:15或16任一个氨基酸序列;
-嗜胨热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:18的氨基酸序列;或
-芹菜热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:20的氨基酸序列;
或其功能活性片段和/或变体,所述功能活性片段和/或变体:
-与SEQ ID NO:2至13、15、16、18或20中任一个氨基酸序列具有至少70%的序列同一性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性;并且
-具有能够从头开始的单链核酸合成活性。
在一个实施方案中,所述属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域是:
-鹦鹉螺热球菌种30-1DNA引物酶的引物酶结构域,其具有SEQ ID NO:2至5中任一个氨基酸序列;
-热球菌属种CIR10 DNA引物酶的引物酶结构域,其具有SEQ ID NO:15的氨基酸序列;
-嗜胨热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:18的氨基酸序列;或
-芹菜热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:20的氨基酸序列;
或其功能活性片段和/或变体,所述功能活性片段和/或变体:
-与所述氨基酸序列具有至少70%的序列同一性;并且
-具有能够从头开始的单链核酸合成活性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性。
在一个实施方案中,核苷酸被固定到支持物上。
在一个实施方案中,从头开始的单链核酸合成在约60℃至约95℃的温度范围内进行。
在一个实施方案中,所述方法用于从头开始合成具有随机核苷酸序列的核酸,并且所述至少一种核苷三磷酸不包括终止核苷三磷酸(terminating nucleosidetriphosphate)。
在一个实施方案中,所述方法用于从头开始的序列受控的核酸合成,并且所述至少一种核苷三磷酸是包含可逆3’-阻断基团(reversible3’-blocking group)的终止核苷三磷酸。
在一个实施方案中,所述方法包括以下步骤:
a)提供具有游离3’-羟基的核苷酸;
b)在属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域或其功能活性片段和/或变体存在下,使所述核苷酸与终止核苷三磷酸接触,从而使所述终止核苷三磷酸共价结合至所述核苷酸的游离3’-羟基;
c)使用洗涤溶液去除所有试剂,尤其是去除未结合的终止核苷三磷酸;
d)在裂解剂存在下,裂解共价结合的终止核苷三磷酸的可逆3’-阻断基团,从而得到具有游离3’-羟基的核苷酸;
e)任选地,使用洗涤溶液去除所有试剂,特别是去除裂解剂;
f)任选地,多次反复步骤b)至e)以合成核酸,直至所需长度和核苷酸序列。
在一个实施方案中,所述方法用于净化在终止核苷三磷酸库中的包含游离3’-羟基的污染核苷三磷酸。
本发明还涉及古细菌DNA引物酶的分离的功能活性片段,由SEQ ID NO:3至13、15、16、18或20中任一个氨基酸序列或其功能活性片段和/或变体组成,所述功能活性片段和/或变体:
-与所述氨基酸序列具有至少70%的序列同一性;并且
-具有能够从头开始的单链核酸合成活性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性。
在一个实施方案中,古细菌DNA引物酶或其变体的分离的功能活性片段由SEQ IDNO:3至13、15、16、18或20中任一个氨基酸序列组成。
在一个实施方案中,古细菌DNA引物酶或其变体的分离的功能活性片段由SEQ IDNO:3至5、15、18或20中任一个氨基酸序列或其功能活性片段和/或变体组成,所述功能活性片段和/或变体:
-与所述氨基酸序列具有至少70%的序列同一性;并且
-具有能够从头开始的单链核酸合成活性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性。
在一个实施方案中,古细菌DNA引物酶或其变体的分离的功能活性片段由SEQ IDNO:3至5、15、18或20中任一个氨基酸序列组成。
本发明还涉及编码本发明的古细菌DNA引物酶的功能活性片段的核酸。
本发明还涉及包含本发明的核酸的表达载体,所述核酸其可操作地连接至调节元件,优选连接至启动子。
本发明还涉及包含本发明的表达载体的宿主细胞。
本发明还涉及一种产生本发明的古细菌DNA引物酶的功能活性片段的方法,所述方法包括:
(a)在适合表达古细菌DNA引物酶或其变体的所述功能活性片段的条件下,培养本发明的宿主细胞;和
(b)从所述宿主细胞中分离所述古细菌DNA引物酶或其变体的所述功能活性片段。
本发明还涉及一种试剂盒,包括:
-具有游离3’-羟基的核苷酸,其任选地固定在支持物上;
-至少一种核苷三磷酸,任选地,其中所述至少一种核苷三磷酸是包含可逆3’-阻断基团的终止核苷三磷酸;和
-本发明的古细菌DNA引物酶的分离的功能活性片段。
详细描述
在第一个方面,本发明涉及古细菌DNA引物酶或其变体的分离的功能活性片段;编码所述片段的核酸;包含所述核酸的表达载体;包含所述表达载体的宿主细胞;以及生产古细菌DNA引物酶或其变体的所述分离的功能活性片段的方法。
“DNA引物酶”是指参与DNA复制的酶,属于RNA聚合酶类。它们在单链DNA模板的存在下,催化称为引物的通常长度为4到15个核苷酸的短RNA分子由核糖核苷三磷酸从头开始合成。在复制叉上需要DNA引物酶的活性来启动DNA聚合酶的DNA合成(Frick&Richardson,2001.Annu Rev Biochem.70:39-80)。
当提及古细菌DNA引物酶或其功能活性片段时,“分离的”及其任何词尾变型以及“纯化的”及其任何词尾变型可互换使用,并且表示所述古细菌DNA引物酶或其功能活性片段基本上不含在通常发现所述古细菌DNA引物酶或其功能活性片段的自然环境中所发现的其他组分(即,污染物)。优选地,分离或纯化的古细菌DNA引物酶或其功能活性片段基本上不含在细胞中与之结合的其他蛋白或核酸。“基本上不含”是指所述分离或纯化的古细菌DNA引物酶或其功能活性片段占异质组合物的50%以上(即至少50%纯),优选60%以上、70%以上、80%以上、90%以上、95%以上,并且更优选98%或99%以上。纯度可以通过本领域技术人员已知的各种方法评估,包括但不限于层析、凝胶电泳、免疫测定、成分分析、生物测定等。
当提及古细菌DNA引物酶时,“功能活性片段”是指古细菌DNA引物酶的片段或结构域,其具有能够从头开始的单链核酸合成活性,并且优选还具有不依赖于模板的末端核苷酸转移酶活性。本领域技术人员熟知评估古细菌DNA引物酶的片段或结构域的活性的手段和方法。这些包括本公开的实施例部分中描述的测定,以及其他测定,例如Guilliam&Doherty(2017.Methods Enzymol.591:327-353)描述的那些。
当提及古细菌DNA引物酶的引物酶结构域时,“功能活性变体”是指蛋白与古细菌DNA引物酶的参考引物酶结构域不具有100%序列同一性但具有至少70%,优选至少75%、80%、85%、90%、95%、96%、97%、98%、99%或更多序列同一性,优选局部序列同一性,同时保持其能够从头开始的单链核酸合成活性,优选还有不依赖于模板的末端核苷酸转移酶活性。本领域技术人员熟知评估古细菌DNA引物酶的引物酶结构域的变体的活性的手段和方法。这些包括本公开的实施例部分中描述的测定,以及其他测定,例如Guilliam&Doherty(2017.Methods Enzymol.591:327-353)所述。
在一个实施方案中,古细菌DNA引物酶或其变体的功能活性片段具有能够从头开始的单链核酸合成活性。在一个实施方案中,古细菌DNA引物酶或其变体的功能活性片段具有能够不依赖于模板的末端核苷酸转移酶活性。在一个实施方案中,古细菌DNA引物酶或其变体的功能活性片段具有能够从头开始的单链核酸合成活性和不依赖于模板的末端核苷酸转移酶活性二者。
“从头开始的单链核酸合成活性”或“不依赖于模板的引物酶活性”是指在不存在互补核酸模板和起始序列(initiator sequence)的情况下合成单链核酸分子,即从单个核苷酸开始来合成单链核酸分子。
“不依赖于模板的末端核苷酸转移酶活性”是指在不存在互补核酸模板的情况下,将核苷三磷酸添加到核酸分子的3’-末端。
在一个实施方案中,古细菌DNA引物酶属于古-真核生物引物酶(AEP)超家族。在一个实施方案中,古细菌DNA引物酶属于引物酶-聚合酶(prim-pol)家族。
在一个实施方案中,古细菌DNA引物酶是来自热球菌(Thermococcus)属的古细菌。热球菌属包括但不限于以下几个种:嗜酸热球菌(Thermococcus acidaminovorans)、Thermococcus aegaeus、聚集性热球菌(Thermococcus aggregans)、嗜碱型热球菌(Thermococcus alcaliphilus)、大西洋热球菌(Thermococcus atlanticus)、嗜压热球菌(Thermococcus barophilus)、巴罗西热球菌(Thermococcus barossii)、速生热球菌(Thermococcus celer)、芹菜热球菌(Thermococcus celericrescens)、Thermococcuschitonophagus、Thermococcus cleftensis、Thermococcus coalescens、Thermococcuseurythermalis、富米科兰热球菌(Thermococcusfumicolans)、Thermococcusgammatolerans、蛇发女怪热球菌(thermococcus gorgonarius)、危地马拉热球菌(Thermococcus guaymasensis)、热水管热球菌(Thermococcus hydrothermalis)、Thermococcus indicus、小宝岛热球菌(Thermococcus kodakarensis)、海滨热球菌(Thermococcus litoralis)、Thermococcus marinus、Thermococcus mexicalis、鹦鹉螺热球菌(Thermococcus nautili)、Thermococcus onnurineus、太平洋热球菌(Thermococcuspacificus)、Thermococcus paralvinellae、嗜胨热球菌(Thermococcus peptonophilus)、Thermococcus piezophilus、Thermococcus prieurii、深渊热球菌(Thermococcusprofundus)、Thermococcus radiotolerans、西伯利亚热球菌(Thermococcus sibiricus)、西库利热球菌(Thermococcus siculi)、斯氏热球菌(Thermococcus stetteri)、Thermococcus thioreducens、Thermococcus waimanguensis、Thermococcuswaiotapuensis和齐利吉热球菌(Thermococcus zilligii)。热球菌属还包括但不限于以下几个未分类的菌株:热球菌属种AEPII 1a、热球菌属种101C5、热球菌属种11N.A5、热球菌属种12-4、热球菌属种13-2、热球菌属种13-3、热球菌属种1519、热球菌属种175、热球菌属种17S1、热球菌属种17S2、热球菌属种17S3、热球菌属种17S4、热球菌属种17S5、热球菌属种17S6、热球菌属种17S8、热球菌属种18S1、热球菌属种18S2、热球菌属种18S3、热球菌属种18S4、热球菌属种18S5、热球菌属种21-1、热球菌属种21S1、热球菌属种21S2、热球菌属种21S3、热球菌属种21S4、热球菌属种21S5、热球菌属种21S6、热球菌属种21S7、热球菌属种21S8、热球菌属种21S9、热球菌属种23-1、热球菌属种23-2、热球菌属种2319x1、热球菌属种26-2、热球菌属种26-3、热球菌属种26/2、热球菌属种28-1、热球菌属种29-1、热球菌属种300-Tc、热球菌属种31-1、热球菌属种31-3、热球菌属种40_45、热球菌属种4557、热球菌属种5-1、热球菌属种5-4、热球菌属种70-4-2、热球菌属种7324、热球菌属种83-5-2、热球菌属种9N2、热球菌属种9N2.20、热球菌属种9N2.21、热球菌属种9N3、热球菌属种9oN-7、热球菌属种A4、热球菌属种AF1T14.13、热球菌属种AF1T1423、热球菌属种AF1T20.11、热球菌属种AF1T6.10、热球菌属种AF1T6.12、热球菌属种AF1T6.63、热球菌属种AF2T511、热球菌属种Ag85-vw、热球菌属种AM4、热球菌属种AMT11、热球菌属种AMT7、热球菌属种Anhete70-I78、热球菌属种Anhete70-SCI、热球菌属种Anhete85-I78、热球菌属种Anhete85-SCI、热球菌属种AT1273、热球菌属种AV1、热球菌属种AV2、热球菌属种AV3、热球菌属种AV6、热球菌属种AV7、热球菌属种AV9、热球菌属种AV10、热球菌属种AV11、热球菌属种AV13、热球菌属种AV14、热球菌属种AV15、热球菌属种AV16、热球菌属种AV17、热球菌属种AV18、热球菌属种AV20、热球菌属种AV21、热球菌属种AV22、热球菌属种Ax00-17、热球菌属种Ax00-27、热球菌属种Ax00-39、热球菌属种Ax00-45、热球菌属种Ax01-2、热球菌属种Ax01-3、热球菌属种Ax01-37、热球菌属种Ax01-39、热球菌属种Ax01-61、热球菌属种Ax01-62、热球菌属种Ax01-65、热球菌属种Ax98-43、热球菌属种Ax98-46、热球菌属种Ax98-48、热球菌属种Ax99-47、热球菌属种Ax99-57、热球菌属种Ax99-67、热球菌属种AXTV6、热球菌属种B1、热球菌属种B1001、热球菌属种B4、热球菌属种BHI60a21、热球菌属种BHI80a28、热球菌属种BHI80a40、热球菌属种Bubb.Bath、热球菌属种BX13、热球菌属种CAR-80、热球菌属种Champagne、热球菌属种CIR10、热球菌属种CKU-1、热球菌属种CKU-199、热球菌属种CL2、热球菌属种CMI、热球菌属种CNR-5、热球菌属种CX1、热球菌属种CX2、热球菌属种CX3、热球菌属种CX4、热球菌属种CYA、热球菌属种Dex80a71、热球菌属种Dex80a75、热球菌属种DS-1、热球菌属种DS1、热球菌属种DT4、热球菌属种ENR5、热球菌属种EP1、热球菌属种ES5、热球菌属种ES6、热球菌属种ES7、热球菌属种ES8、热球菌属种ES9、热球菌属种ES10、热球菌属种ES11、热球菌属种ES12、热球菌属种ES13、热球菌属种EXT12c、热球菌属种EXT9、热球菌属种Fe85_1_2、热球菌属种GB18、热球菌属种GB20、热球菌属种GE8、热球菌属种Gorda2、热球菌属种Gorda3、热球菌属种Gorda4、热球菌属种Gorda5、热球菌属种Gorda6、热球菌属种GR2、热球菌属种GR4、热球菌属种GR5、热球菌属种GR6、热球菌属种GR7、热球菌属种GT、热球菌属种GU5L5、热球菌属种HJ21、热球菌属种IRI33、热球菌属种IRI35c、热球菌属种IRI48、热球菌属种JCM 11816、热球菌属种JDF-3、热球菌属种JdF3、热球菌属种JdFR-02、热球菌属种KBA1、热球菌属种KI、热球菌属种KS-8、热球菌属种LMO-A1、热球菌属种LMO-A2、热球菌属种LMO-A3、热球菌属种LMO-A4、热球菌属种LMO-A5、热球菌属种LMO-A6、热球菌属种LMO-A7、热球菌属种LMO-A8、热球菌属种LMO-A9、热球菌属种LS1、热球菌属种LS2、热球菌属种M36、热球菌属种M39、热球菌属种MA2.27、热球菌属种MA2.28、热球菌属种MA2.29、热球菌属种MA2.33、热球菌属种MAR1、热球菌属种MAR2、热球菌属种MCR132、热球菌属种MCR133、热球菌属种MCR134、热球菌属种MCR135、热球菌属种MCR175、热球菌属种MV1、热球菌属种MV2、热球菌属种MV3、热球菌属种MV5、热球菌属种MV10、热球菌属种MV11、热球菌属种MV12、热球菌属种MV13、热球菌属种MV1031、热球菌属种MV1049、热球菌属种MV1083、热球菌属种MV1092、热球菌属种MV1099、热球菌属种MZ1、热球菌属种MZ2、热球菌属种MZ3、热球菌属种MZ5、热球菌属种MZ6、热球菌属种MZ7、热球菌属种MZ8、热球菌属种MZ9、热球菌属种MZ10、热球菌属种MZ11、热球菌属种MZ12、热球菌属种MZ13、热球菌属种NS85-T、热球菌属种P6、热球菌属种Pd70、热球菌属种Pd85、热球菌属种PK、热球菌属种PK(2011)、热球菌属种Rt3、热球菌属种SB611、热球菌属种SN531、热球菌属种SRB55_1、热球菌属种SRB70_1、热球菌属种SRB70_10、热球菌属种SY113、热球菌属种Tc-1-70、热球菌属种Tc-1-85、热球菌属种Tc-1-95、热球菌属种Tc-2-85、热球菌属种Tc-2-95、热球菌属种Tc-365-70、热球菌属种Tc-365-85、热球菌属种Tc-365-95、热球菌属种Tc-4-70、热球菌属种Tc-4-85、热球菌属种Tc-I-70、热球菌属种Tc-I-85、热球菌属种Tc-S-70、热球菌属种Tc-S-85、热球菌属种Tc55_1、热球菌属种Tc55_12、热球菌属种Tc70-4C-I、热球菌属种Tc70-4C-S、热球菌属种Tc70-7C-I、热球菌属种Tc70-7C-S、热球菌属种Tc70-CRC-I、热球菌属种Tc70-CRC-S、热球菌属种Tc70-MC-S、热球菌属种Tc70-SC-I、热球菌属种Tc70-SC-S、热球菌属种Tc70-vw、热球菌属种Tc70_1、热球菌属种Tc70_10、热球菌属种Tc70_11、热球菌属种Tc70_12、热球菌属种Tc70_20、热球菌属种Tc70_6、热球菌属种Tc70_9、热球菌属种Tc85-0 age SC、热球菌属种Tc85-4C-I、热球菌属种Tc85-4C-S、热球菌属种Tc85-7C-S、热球菌属种Tc85-CRC-I、热球菌属种Tc85-CRC-S、热球菌属种Tc85-MC-I、热球菌属种Tc85-MC-S、热球菌属种Tc85-SC-I、热球菌属种Tc85-SC-ISCS、热球菌属种Tc85-SC-S、热球菌属种Tc85_1、热球菌属种Tc85_10、热球菌属种Tc85_11、热球菌属种Tc85_12、热球菌属种Tc85_13、热球菌属种Tc85_19、热球菌属种Tc85_2、热球菌属种Tc85_20、热球菌属种Tc85_9、热球菌属种Tc95-CRC-I、热球菌属种Tc95-CRC-S、热球菌属种Tc95-MC-I、热球菌属种Tc95-MC-S、热球菌属种Tc95-SC-S、热球菌属种TK1、热球菌属种TKM 55-W7-A、热球菌属种TM1、热球菌属种TP-33、热球菌属种TP-37、热球菌属种TS3、热球菌属种TVG2和热球菌属种vp197。
在一个实施方案中,古细菌DNA引物酶选自鹦鹉螺热球菌种30-1DNA引物酶、热球菌属种CIR10 DNA引物酶、嗜胨热球菌DNA引物酶以及芹菜热球菌DNA引物酶,或其功能活性片段和/或变体。
在一个实施方案中,古细菌DNA引物酶为鹦鹉螺热球菌种30-1DNA引物酶,或其功能活性片段和/或变体。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的氨基酸序列包含或由SEQID NO:1组成,其代表来自鹦鹉螺热球菌种30-1的蛋白“tn2-12p”的氨基酸序列,NCBI参考序列是2019-05-01的WP_013087990版本1。
Figure BDA0004113289200000141
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ311-923”)的氨基酸序列如SEQ ID NO:2所示。
Figure BDA0004113289200000142
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ311-923”)的氨基酸序列如SEQ ID NO:3所示。
Figure BDA0004113289200000151
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ205-211Δ311-923”)的氨基酸序列如SEQ ID NO:4所示。
Figure BDA0004113289200000152
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:5所示。
Figure BDA0004113289200000153
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:6所示。
Figure BDA0004113289200000161
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ205-211Δ311-923””)的氨基酸序列如SEQ ID NO:7所示。
Figure BDA0004113289200000162
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:8所示。
Figure BDA0004113289200000163
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:9所示。
Figure BDA0004113289200000171
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ205-211Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:10所示。
Figure BDA0004113289200000172
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ205-211Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:11所示。
Figure BDA0004113289200000173
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ205-211Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:12所示。
Figure BDA0004113289200000181
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ205-211Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:13所示。
Figure BDA0004113289200000182
在一个实施方案中,热球菌属种CIR10 DNA引物酶的功能活性片段的氨基酸序列包含或由SEQ ID NO:14组成,其代表来自热球菌属种CIR10的蛋白“引物酶/聚合酶”的氨基酸序列,NCBI参考序列是2016-06-18的WP_015243587版本1。
Figure BDA0004113289200000191
在一个实施方案中,热球菌属种CIR10 DNA引物酶的功能活性片段(本文称为“PolpCIR10Δ303-928”)的氨基酸序列如SEQ ID NO:15所示。
Figure BDA0004113289200000192
在一个实施方案中,热球菌属种CIR10 DNA引物酶的功能活性片段(本文称为“PolpCIR10Δ93-98Δ303-928”)的氨基酸序列如SEQ ID NO:16所示。
Figure BDA0004113289200000201
在一个实施方案中,嗜胨热球菌DNA引物酶的氨基酸序列包含或由SEQ ID NO:17组成,其代表来自嗜胨热球菌的“假设蛋白”的氨基酸序列,NCBI参考序列是2016-03-28的WP_062389070版本1。
Figure BDA0004113289200000202
在一个实施方案中,嗜胨热球菌DNA引物酶的功能活性片段(本文称为“PolpTpepΔ295-914”)的氨基酸序列如SEQ ID NO:18所示。
Figure BDA0004113289200000211
在一个实施方案中,芹菜热球菌DNA引物酶的氨基酸序列包含或由SEQ ID NO:19组成,其代表来自芹菜热球菌的“假设蛋白”的氨基酸序列,NCBI参考序列是2016-01-06的WP_058937716版本1。
Figure BDA0004113289200000212
在一个实施方案中,芹菜热球菌DNA引物酶(本文称为“PolpTceleΔ295-913”)的功能活性片段的氨基酸序列如SEQ ID NO:20所示。
Figure BDA0004113289200000221
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含选自包括以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:18和SEQ ID NO:20,或其片段和/或变体;或由其组成。在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段不由选自包括以下的组或由以下组成的组中的氨基酸序列组成:SEQ ID NO:1、SEQ ID NO:14、SEQ ID NO:17和SEQ ID NO:19。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含选自包括以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:18和SEQ ID NO:20,或其片段和/或变体;或由其组成。在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段不由选自包括以下的组或由以下组成的组中的氨基酸序列组成:SEQ ID NO:1、SEQ ID NO:14、SEQ ID NO:17和SEQ ID NO:19。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含选自包括以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:16、SEQ ID NO:18和SEQ ID NO:20,或其片段和/或变体;或由其组成。在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段不由选自包括以下的组或由以下组成的组中的氨基酸序列组成:SEQID NO:1、SEQ ID NO:14、SEQ ID NO:17和SEQ ID NO:19。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含选自包括以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12和SEQ ID NO:13,或其片段和/或变体;或由其组成。在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段不由SEQ ID NO:1的氨基酸序列组成。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含选自包括以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5,或其片段和/或变体;或由其组成。在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段不由SEQ ID NO:1的氨基酸序列组成。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含选自包括以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:15、SEQ ID NO:18和SEQ ID NO:20,或其片段和/或变体;或由其组成。在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段不由选自包括以下的组或由以下组成的组中的氨基酸序列组成:SEQ ID NO:14、SEQ ID NO:17和SEQ ID NO:19。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段包含古细菌DNA引物酶或其变体的所述分离的功能活性片段的至少50%的连续氨基酸残基或由其组成,优选古细菌DNA引物酶或其变体的所述分离的功能活性片段的至少60%、70%、80%、90%、95%或更多的连续氨基酸残基。
在一个实施方案中,本发明的古细菌DNA引物酶或其变体的分离的功能活性片段的片段仍然能够具有从头开始的单链核酸酸合成活性,以及优选具有不依赖于模板的末端核苷酸转移酶活性。
在一个实施方案中,本发明的古细菌DNA引物酶或其片段的分离的功能活性片段的变体与古细菌DNA引物酶或其片段的所述分离的功能活性片段具有至少70%,优选至少75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,优选局部序列同一性。
序列同一性是指在测试序列和参考序列的比较中相同或相似氨基酸的数量。序列同一性可以通过蛋白序列的序列比对以识别相似或相同的区域来确定。出于本文的目的,序列同一性通常通过比对以识别相同的残基来确定。比对可以是局部的或全局的。可以识别所比较序列之间的匹配、错配和缺口。缺口是插入比对序列残基之间的空位氨基酸,以便对齐相同或相似的字符。通常,可能存在内部和终端缺口。当使用缺口惩罚时,可不对末端缺口进行惩罚而确定序列同一性(例如,对末端缺口不惩罚)。或者,可以在不考虑缺口的情况下确定序列同一性,如下所示:
(相同位置的数量/总的比对序列的长度)*100。
全局比对是从头到尾比对两个序列的一种比对,其中每个序列中的每个字母仅比对一次。产生比对,而不管序列之间是否存在相似性或同一性。例如,基于全局比对的50%序列同一性表示,在两个比较序列的完整序列的比对中,每个序列的长度为100个核苷酸,50%的残基是相同的。应当理解,即使当比对序列的长度不同时,也可以使用全局比对来确定序列同一性。在确定序列同一性时将考虑序列末端的差异,除非选择“对末端缺口不惩罚”。通常,全局比对用于在其大部分长度上具有显著相似性的序列。用于执行全局比对的示例性算法包括Needleman-Wunsch算法(Needleman&Wunsch,1970.JMol Biol.48(3):443-53)。用于执行全局比对的示例性程序和软件是公开可用的,包括国家生物技术信息中心(NCBI)网站(http://ncbi.nlm.nih.gov)上可用的全局序列比对工具,以及deepc2.psi.iastate.edu/aat/align/align.html上可用的程序。
局部比对是比对两个序列但仅比对具有相似性或同一性的那些序列部分的一种比对。因此,一个序列的子片段存在于另一个序列中,则决定局部比对。如果没有相似性,则不会返回比对。局部比对算法包括BLAST或Smith-Waterman算法(Smith&Waterman,1981.Adv Appl Math.2(4):482-9)。例如,基于局部比对的50%序列同一性表示,在两个任意长度的比较序列的完整序列的比对中,长度为100个核苷酸的相似性或同一性区域有50%的残基在该相似性或同一性区域中是相同的。
出于本文的目的,序列同一性可以通过每个供应商确定的默认缺口惩罚利用标准比对算法程序来确定。GAP程序的默认参数可以包括:
(1)一元比较矩阵(包括相同时数值为1,不相同时数值为0)和Gribskov&Burgess(1986.Nucleic Acids Res.14(16):6745-63)的加权比较矩阵,如Schwartz&Dayhoff所述(1979.Matrices for detecting distant relationships.In Dayhoff(Ed.),Atlasofprotein sequences.5:353-358.Washington,DC:National Biomedical ResearchFoundation);
(2)每个缺口惩罚3.0,每个缺口中的每个符号加罚0.10;和
(3)不对末端缺口进行惩罚。
古细菌DNA引物酶或其片段的功能活性片段的任何序列,以及该序列的变体,是否具有至少70%、优选至少75%、80%、85%、90%、95%、96%、97%、98%、99%或更高“同一”或陈述同一性百分数的其他类似变体,可以使用基于局部或全局比对的已知计算机算法来确定(参见,例如,https://en.wikipedia.org/wiki/List_of_sequence_alignment_software,提供数十个已知且公开可用的比对数据库和程序的链接)。
通常,出于本文的目的,使用基于全局比对的计算机算法确定序列同一性,例如可从NCBI/BLAST(http://blast.ncbi.nlm.nih.gov/Blast.cgi)获得的Needleman-WunschGlobal Sequence Alignment工具;或LAlign(William Pearson实现了Huang和Miller算法[Huang&Miller,1991.Adv Appl Math.12(3):337-57)。
通常,在全局比对中,每个比较的古细菌DNA引物酶或其片段的功能活性片段的全长序列跨每个序列的全长进行比对。当比较的序列长度基本相同时,也可以使用局部比对。
因此,术语同一性表示测试(变体)和参考序列(古细菌DNA引物酶或其片段的功能活性片段)之间的比较或比对。在一个示例性实施方案中,“至少70%的序列同一性”是指相对于参考序列从70%到100%的百分比同一性。70%或更高水平的同一性表明这样一个事实,假设为了示例目的,比较长度为100个氨基酸的测试序列和参考序列,测试序列的100个氨基酸中有不超过30个不同于参考序列。这种差异可以表示为随机分布在整个氨基酸序列长度上的点突变,或者它们可以聚集在一个或多个最高至最大允许值的不同长度的位置,例如30/100氨基酸差异(大约70%同一性)。差异也可能是由于氨基酸残基的缺失或截短。差异定义为氨基酸的取代、插入或缺失。根据比较序列的长度,在约85-90%以上的同源性或同一性水平上,结果可以独立于程序和缺口参数集;如此高水平的同一性可以很容易地评估,通常无需依赖软件。
本文还包括与持续性因子(processivity factor)融合的本发明的古细菌DNA引物酶或其变体的分离的功能活性片段。
“持续性因子”是指赋予序列非依赖性的核酸相互作用的多肽结构域或亚结构域,并通过共价或非共价相互作用与本发明的古细菌DNA引物酶或其片段的分离的功能活性片段相结合。持续性因子可能赋予古细菌DNA引物酶和核酸底物之间较低的解离常数,从而允许在古细菌DNA引物酶从底物或起始序列解离之前平均而言引入更多的核苷酸。
持续性因子通过多个序列非依赖性的核酸结合机制发挥作用:主要机制是核酸磷酸主链与持续性因子之间的静电相互作用;第二个机制是持续性因子与核酸双链体的小沟结构之间的空间相互作用;第三个机制是拓扑约束,其中通过完全包围与之结合的核酸的钳蛋白(clamp protein)而促进与核酸的相互作用。
示例性的不依赖于序列的核酸结合结构域是本领域已知的,并且传统上根据优选的核酸底物例如DNA或RNA和链型(例如单链或双链)来分类。
有多种多肽结构域已被鉴定为核酸结合物。这些多肽结构域包括四种已知结合单链DNA的一般结构性拓扑结构:寡核苷酸结合(OB)折叠、K同源(KH)结构域、RNA识别基序(RRM)和旋转结构域,如Dickey等人所述,Dickey etal.,2013.Structure.21(7):1074-1084。
寡核苷酸结合结构域(OBD)是在多个DNA加工蛋白中结构保守的示例性DNA结合域。OBD与单链DNA配体结合,每个OB折叠3到11个核苷酸,解离常数范围从低的皮摩尔到高的微摩尔水平。亲和力与结合的单链DNA的长度大致相关。一些OBD可能会赋予序列特定结合,而另一些则是非序列特异性的。包含OBD的示例性DNA结合蛋白特异性结合单链DNA,被称为“单链DNA结合蛋白”或“SSB”。SSB结构域是本领域技术人员众所周知的,如以下所述:Keck(Ed.),2016.Single-stranded DNA binding proteins(Vol.922,Methods inMolecular Biology).Totowa,NJ:Humana Press;和Shereda et al.,2008.Crit RevBiochem Mol Biol.43(5):289-318。SSB描述了单链DNA的进化分子伴侣家族。
本领域技术人员已知,有几个示例性的原核SSB已被表征。这些SSB包括但不限于;大肠杆菌(Escherichia coli)SSB(参见例如Raghunathan et al.,2000.Nat StructBiol.7(8):648-652),耐辐射奇球菌(Deinococcus radiodurans)SSB(参见例如Lockhart&DeVeaux,2013.PLoS One.8(8):e71651),硫矿硫化叶菌(Sulfolobus solfataricus)SSB(参见例如Paytubi et al.,2012.Proc NatlAcad Sci USA.109(7):E398-E405),嗜热栖热菌(Thermus thermophillus)SSB和水生嗜热杆菌(Thermus aquaticus)SSB(参见例如Witte et al.,2008.Biophys J.94(6):2269-2279),和Deinococcus radiopugnans SSB(参见例如Filipkowski et al.,2006.Extremophiles.10(6):607-614)。
在非真细菌系统中,原核SSB蛋白家族的功能性真核同源物是本领域技术人员已知的。复制蛋白A(RPA)是用于真核生物DNA复制、重组和DNA修复的示例性同源物。RPA异源三聚体由RPA70、RPA32、RPA14亚基组成,如Iftode等人所述:Iftode et al.,1999.CritRev Biochem Mol Biol.34(3):141-180。
本发明还涉及编码上述古细菌DNA引物酶或其变体的分离的功能活性片段的核酸。
本发明还涉及一种表达载体,其包含编码上述古细菌DNA引物酶或其变体的分离的功能活性片段的核酸。
术语“表达载体”是指含有所需编码核酸序列和在特定宿主生物体中表达可操作连接的编码序列所必需的适当核酸序列的重组DNA分子。在原核生物中表达所必需的核酸序列通常包括启动子、操纵子(任选)和核糖体结合位点,通常还包括其他序列。已知真核细胞利用启动子、增强子以及终止和聚腺苷酸化信号。
本发明还涉及包含表达载体的宿主细胞,所述表达载体包含编码上述古细菌DNA引物酶或其变体的分离的功能活性片段的核酸。
本发明还涉及一种产生和纯化上述古细菌DNA引物酶或其变体的分离的功能活性片段的方法。
在一个实施方案中,所述方法包括:
-在适合表达古细菌DNA引物酶或其变体的功能活性片段的条件下,培养包含表达载体的宿主细胞,所述表达载体包含编码上述古细菌DNA引物酶或其变体的所述分离的功能活性片段的核酸,和
-从所述宿主细胞中分离所述古细菌DNA引物酶或其变体的所述功能活性片段。
该重组过程可用于大规模生产古细菌DNA引物酶或其变体的功能活性片段。
在一个实施方案中,进一步纯化所表达的古细菌DNA引物酶或其变体的功能活性片段。
在第二个方面,本发明涉及一种从头开始的单链核酸的合成方法,该方法包括在存在古细菌DNA引物酶或其功能活性片段和/或变体的情况下,使核苷酸的3’-羟基与至少一种核苷三磷酸(或核苷三磷酸的组合)接触,从而使所述核苷三磷酸共价结合到所述核苷酸的3’-羟基。
在一个实施方案中,本发明的方法是一种从头开始合成具有随机核苷酸序列的单链核酸的方法。在一个实施方案中,本发明的方法是一种核酸的从头开始的、序列受控的单链核酸合成方法。
提及“核酸”合成方法时包括合成一定长度的DNA(脱氧核糖核酸)、RNA(核糖核酸)或其混合物的方法,其中第一核苷酸(n)与至少一个进一步的核苷酸(n+1)偶联,从而获得核苷酸的至少一个二聚体。术语“核酸”还包括核酸类似物,例如但不限于异种核酸(XNA),它们是具有不同于天然DNA和RNA的糖主链和/或外向基序(outgoing motif)的合成核酸类似物。因此,术语“核酸”还涵盖混合的XNA/DNA、混合的XNA/RNA和混合的XNA/DNA/RNA。XNA的示例包括Schmidt,2010.Bioessays.32(4):322-331和Nie et al.,2020.Molecules.25(15):E3483中描述的那些,其内容通过引用并入本文。一些实例包括但不限于1,5-脱水己糖醇核酸(HNA)、环己烯核酸(CeNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、锁核酸(LNA)、肽核酸(PNA)和氟阿拉伯糖核酸(FANA)(Schmidt,2008.Syst Synth Biol.2(1-2):1-6;Ran etal.,2009.Nat Nanotechnol.4(10):6;Kershner et al.,2009.Nat Nanotechnol.4(9):557-61;Marliere,2009.Syst Synth Biol.3(1-4):77-84;Torres et al.,2003.Microbiology.149(Pt12):3595-601;Vastmans et al.,2001.Nucleic AcidsRes.29(15):3154-63;Ichida et al.,2005.Nucleic Acids Res.33(16):5219-25;Kempeneers et al.,2005.Nucleic Acids Res.33(12):3828-36;Loakes et al.,2009.JAm Chem Soc.131(41):14827-37)。
提及“序列受控”的核酸合成方法时,说明了那些允许将至少一个核苷酸(n+1)特异性添加到第一核苷酸(n)的核酸合成方法,即,合成的核酸具有与随机相比而言限定的核苷酸序列。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体属于古-真核引物酶(AEP)超家族。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体来自热球菌目(Thermococcales)的古细菌。
在一个实施方案中,古细菌DNA引物酶是来自热球菌属(Thermococcus)的古细菌。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体属于引物酶-聚合酶(prim-pol)家族(也被Kazlauskas等人称为“PolpTN2-样家族”,Kazlauskas etal.,2018.JMol Biol.430(5):737-750)。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含属于引物酶-聚合酶(prim-pol)家族(可见于Kazlauskas et al.,2018.JMol Biol.430(5):737-750,图6)的古细菌DNA引物酶的引物酶结构域,或由其组成。
在一个实施方案中,古细菌DNA引物酶选自鹦鹉螺热球菌种30-1DNA引物酶、热球菌属种CIR10 DNA引物酶、嗜胨热球菌DNA引物酶和芹菜热球菌DNA引物酶,或其功能活性片段和/或变体,如上所述。
在一个实施方案中,古细菌DNA引物酶是鹦鹉螺热球菌种30-1DNA引物酶,或其功能活性片段和/或变体,如上所述。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的氨基酸序列包含SEQ IDNO:1,或由其组成,如上文所述。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段的氨基酸序列选自包含以下的组或由以下组成的组:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段的氨基酸序列选自包含以下的组或由以下组成的组:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4和SEQID NO:5。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ311-923”)的氨基酸序列如SEQ ID NO:2所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ311-923”)的氨基酸序列如SEQ ID NO:3所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ205-211Δ311-923”)的氨基酸序列如SEQ ID NO:4所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:5所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:6所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ205-211Δ311-923”)的氨基酸序列如SEQ ID NO:7所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:8所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:9所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ205-211Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:10所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ205-211Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:11所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ205-211Δ248-254Δ311-923”)的氨基酸序列如SEQ ID NO:12所示。
在一个实施方案中,鹦鹉螺热球菌种30-1DNA引物酶的功能活性片段(本文称为“PolpTN2Δ90-96Δ205-211Δ243-254Δ311-923”)的氨基酸序列如SEQ ID NO:13所示。
在一个实施方案中,热球菌属种CIR10 DNA引物酶的氨基酸序列包含或由SEQ IDNO:14组成,如上所述。
在一个实施方案中,热球菌属种CIR10 DNA引物酶的功能活性片段(本文称为“PolpCIR10Δ303-928”)的氨基酸序列如SEQ ID NO:15所示。
在一个实施方案中,热球菌属种CIR10 DNA引物酶的功能活性片段(本文称为“PolpCIR10Δ93-98Δ303-928”)的氨基酸序列如SEQ ID NO:16所示。
在一个实施方案中,嗜胨热球菌DNA引物酶的氨基酸序列包含或由SEQ ID NO:17组成,如上所述。
在一个实施方案中,嗜胨热球菌DNA引物酶的功能活性片段(本文称为“PolpTpepΔ295-914”)的氨基酸序列如SEQ ID NO:18所示。
在一个实施方案中,芹菜热球菌DNA引物酶的氨基酸序列包含或由SEQ ID NO:19组成,如上所述。
在一个实施方案中,芹菜热球菌DNA引物酶的功能活性片段(本文称为“PolpTceleΔ295-913”)的氨基酸序列如SEQ ID NO:20所示。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含选自包含以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:1、SEQ ID NO:14、SEQ ID NO:17和SEQ ID NO:19,或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含选自包含以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:18和SEQ ID NO:20,或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含选自包含以下的组或由以下组成的组中的氨基酸序列:SEQ ID NO:2、SEQ ID NO:15、SEQ ID NO:18和SEQ ID NO:20,或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:2所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:3所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:4所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:5所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:6所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:7所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:8所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:9所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:10所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:11所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:12所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:1所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:13所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:14所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:15所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:14所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:16所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:17所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:18所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ IDNO:19所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体包含SEQ ID NO:20所示的氨基酸序列或其功能活性片段和/或变体;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体的片段包含所述古细菌DNA引物酶或其功能活性片段和/或变体的至少50%的连续氨基酸残基,优选所述古细菌DNA引物酶或其功能活性片段和/或变体的至少60%、70%、80%、90%、95%或更多的连续氨基酸残基;或由其组成。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体的片段仍然能够具有从头开始的单链核酸合成活性和不依赖于模板的末端核苷酸转移酶活性二者。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体与持续性因子融合。
持续性因子已在上文中描述,该描述经必要修改后适用于古细菌DNA引物酶或其功能活性片段和/或变体。
在一个实施方案中,核苷酸是单核苷酸。换句话说,该核苷酸不是起始序列的3’-末端核苷酸。
在一个实施方案中,从头开始的单链核酸合成方法不包括使起始序列的3’-羟基与至少一种核苷三磷酸(或核苷三磷酸的组合)接触。
“起始序列”或“引物”是指核苷三磷酸可共价结合到其上的具有游离3’-末端的短的寡核苷酸,即核酸将从起始序列的3’-末端合成。
本领域技术人员将容易理解,本发明的方法允许从单个核苷酸开始合成单链核酸分子。这严格适用于第一轮的从头开始的单链核酸合成,产生包含2个核苷酸的核酸分子。然而,本文所述的方法可以进一步重复以允许向所合成的核酸分子添加更多的核苷三磷酸(即,通过古细菌DNA引物酶或其功能活性片段和/或变体的不依赖于模板的末端核苷酸转移酶活性)。
在一个实施方案中,核苷酸可以固定在支持物上。具体而言,支持物的使用允许容易地过滤、洗涤和/或洗脱试剂和副产物,而不会洗掉合成的核酸。
支持物的合适实例包括但不限于珠子、载玻片、芯片、颗粒、链、凝胶、片状物、管状物、球体、容器、毛细管、垫、切片、薄膜、培养皿、微量滴定板等。可用于此类支持物的示例性材料包括但不限于丙烯酸树脂、碳(例如,石墨、碳纤维)、纤维素(例如,醋酸纤维素)、陶瓷、可控孔玻璃、交联多糖(例如,琼脂糖、SEPHAROSETM或藻酸盐)、凝胶、玻璃(例如,改性或功能化玻璃)、金(例如,原子级光滑的Au(111))、石墨、无机玻璃、无机聚合物、乳胶、金属氧化物(例如,SiO2、TiO2、不锈钢)、准金属、金属(例如,原子级光滑的Au(111))、云母、硫化钼、纳米材料(例如,高定向裂解石墨(HOPG)纳米片)、硝化纤维、NYLONTM、光纤束、有机聚合物、纸张、塑料、聚丙烯酰吗啉、聚(4-甲基丁烯)、聚对苯二甲酸乙二醇酯、聚(丁酸乙烯酯)、聚丁烯、聚二甲基硅氧烷(PDMS)、聚乙烯、聚甲醛、聚甲基丙烯酸酯、聚丙烯、多糖、聚苯乙烯、聚氨酯、聚偏二氟乙烯(PVDF)、石英、人造丝、树脂、橡胶、半导体材料、二氧化硅、硅(例如表面氧化的硅)、硫化物和TEFLONTM;或其混合物。
在一个实施方案中,核苷酸通过可逆相互作用部分固定在支持物上,例如化学可裂解接头、酶促裂解接头或任何其他合适的方式。
因此可以想象,合成的核酸最终从支持物上裂解下来,并且例如,使用一对合适的与合成的核酸互补的正向和反向引物序列进行扩增。
此外,或备选地,固定的核苷酸可以是尿苷。
因此,可以想象,使用(1)尿嘧啶-DNA糖基化酶(UDG)产生脱碱基位点,和(2)脱嘌呤/脱嘧啶(AP)位点核酸内切酶来在脱碱基位点裂解合成的核酸,合成的核酸会最终从支持物裂解。
“核苷三磷酸”或“NTP”在本文中指的是含有与5-碳糖(通常是核糖或脱氧核糖)结合的含氮碱基的分子,在糖的第5位结合有三个磷酸基团。术语“核苷三磷酸”还包括核苷三磷酸类似物,例如具有与天然NTP不同的糖和/或不同的含氮碱基的核苷三磷酸,以及具有修饰的2’-OH、3’-OH和/或5’-三磷酸位的核苷三磷酸。特别地,核苷三磷酸类似物包括可用于合成如上文所定义的异种核酸(XNA)的那些。此类合成的核苷三磷酸类似物的非限制性实例见于Chakravarthy et al.,2017(Theranostics.7(16):3933-3947)的图4,该图的内容通过引用并入本文。US 2009-0286696的[0250]至[0280]段中给出了此类合成的核苷三磷酸类似物的其他非限制性实例,其段落的内容通过引用并入本文。
含有脱氧核糖的核苷三磷酸通常称为脱氧核苷三磷酸并缩写为dNTP。一致地,含有核糖的核苷三磷酸通常被称为核糖核苷三磷酸并缩写为rNTP。
脱氧核苷三磷酸的实例包括但不限于脱氧腺苷三磷酸(dATP)、脱氧鸟苷三磷酸(dGTP)、脱氧胞苷三磷酸(dCTP)和脱氧胸苷三磷酸(dTTP)。脱氧核苷三磷酸的其他实例包括脱氧尿苷三磷酸(dUTP)、脱氧肌苷三磷酸(dITP)和脱氧黄苷三磷酸(dXTP)。
核糖核苷三磷酸的实例包括但不限于腺苷三磷酸(ATP)、鸟苷三磷酸(GTP)、胞苷三磷酸(CTP)和尿苷三磷酸(UTP)。核苷三磷酸的其他实例包括N6-甲基腺苷三磷酸(m6ATP)、5-甲基尿苷三磷酸(m5UTP)、5-甲基胞苷三磷酸(m5CTP)、假尿苷三磷酸(ψUTP)、肌苷三磷酸(ITP)、黄苷三磷酸(XTP)和怀丁苷三磷酸盐(yWTP)。
其他类型的核苷可以与三磷酸结合形成核苷三磷酸,例如天然存在的修饰核苷和人工核苷。
在一个实施方案中,所述至少一种核苷三磷酸是选择的核苷三磷酸。在一个实施方案中,所述至少一种核苷三磷酸是(任选地,所选择的)核苷三磷酸的组合。
就核苷三磷酸而言,“选择”是指从各种可能的核苷三磷酸中有目的地选择一种核苷三磷酸或核苷三磷酸的组合,包括但不限于上述那些,其目的是合成(1)具有随机序列的核酸;或(2)具有确定核苷酸序列的核酸。
“核苷三磷酸的组合”是指至少两种不同的核苷三磷酸的混合物。
在一个实施方案中,本发明的方法是一种具有随机核苷酸序列的单链核酸的从头开始的合成方法,该方法包括在存在古细菌DNA引物酶或其功能活性片段和/或变体的情况下,使核苷酸的游离3’-羟基与(任选地,所选择的)核苷三磷酸的组合接触,从而使所述(任选地,所选择的)核苷三磷酸的组合共价且随机结合到所述核苷酸的游离3’-羟基。
在这个实施方案中,(任选地,所选择的)核苷三磷酸的组合不包含终止核苷三磷酸。
在一个实施方案中,本发明的方法是一种从头开始的,单链的,序列受控的核酸的合成方法,其包括使核苷酸的3’-羟基与选择的核苷三磷酸在存在古细菌DNA引物酶或其功能活性片段和/或变体的情况下接触,从而使所述选择的核苷三磷酸共价结合到所述核苷酸的3’-羟基。
在后一个序列受控的核酸合成的实施方案中,核苷酸的3’-羟基与选择的终止核苷三磷酸接触。
“终止核苷三磷酸”,有时也称为“3’-受阻断的核苷三磷酸”或“3’-受保护的核苷三磷酸”,是指在其3’-末端(即在其5-碳糖的第3位)具有额外基团(以下称为“3’-阻断基团”或“3’-保护基团”)的核苷三磷酸,目的是在将所选核苷酸(n+1)特定添加至核苷酸(n)后防止进一步添加不需要的核苷三磷酸。
在一个实施方案中,3’-阻断基团可以是可逆的(可以从核苷三磷酸中去除)或不可逆的(不能从核苷三磷酸中去除),即,终止核苷三磷酸可以是可逆的终止核苷三磷酸或不可逆的终止核苷三磷酸。
在一个实施方案中,3’-阻断基团是可逆的,从核苷三磷酸中去除3’-阻断基团(例如,使用裂解剂)允许向合成的核酸添加进一步的核苷三磷酸。
可逆的3’-阻断基团的实例包括但不限于甲基、甲氧基、肟、2-硝基苄基、2-氰乙基、烯丙基、胺、氨氧基、叠氮甲基、叔丁氧基乙氧基(TBE)、炔丙基、乙酰基、醌、香豆素、氨基苯酚衍生物、缩酮、N-甲基-邻氨基苯甲酰等。
在本发明的上下文中,术语“裂解剂”是指能够从可逆的终止核苷三磷酸去除(或裂解)可逆的3’-阻断基团的任何化学、生物或物理试剂。
在一个实施方案中,裂解剂是化学裂解剂。在一个实施方案中,裂解剂是酶促裂解剂。在一个实施方案中,裂解剂是物理裂解剂。
本领域技术人员将理解,裂解剂的选择取决于所使用的3’-阻断基团的类型。例如,三(2-羧乙基)膦(TCEP)可用于裂解3’-O-叠氮甲基,钯络合物可用于裂解3’-O-烯丙基,亚硝酸钠可用于裂解3’-氨氧基,UV光可用于裂解3’-O-硝基苄基。
在一个实施方案中,裂解剂可以与包含变性剂(例如尿素、氯化胍、甲酰胺或甜菜碱)的裂解溶液结合使用。特别地,添加变性剂提供了破坏合成核酸中任何不需要的二级结构的优点。裂解溶液还可包含一种或多种缓冲液,这将取决于所使用的确切的裂解化学和裂解剂。
在一个实施方案中,3’-阻断基团是不可逆的,并且向合成的核酸添加不可逆的终止核苷三磷酸终止了合成。这种不可逆的3’-阻断基团可能是有用的,例如,作为荧光团、标签、标记物等。
不可逆的3’-阻断基团的实例包括但不限于荧光团,例如甲氧基香豆素、丹酰基、芘、Alexa Fluor 350、AMCA、Marina Blue染料、dapoxyl染料、二烷基氨基香豆素、二胺(bimane)、羟基香豆素、Cascade Blue染料、Pacific Orange染料、Alexa Fluor 405、Cascade Yellow染料、Pacific Blue染料、PyMPO、Alexa Fluor 430、NBD、QSY 35、荧光素、Alexa Fluor488、Oregon Green 488、BODIPY 493/503、罗丹明绿染料、BODIPY FL、2',7'-二氯荧光素、Oregon Green 514、Alexa Fluor 514、4',5'-二氯-2',7'-二甲氧基荧光素(JOE)、曙红、罗丹明6G、BODIPY R6G、Alexa Fluor 532、BODIPY 530/550、BODIPY TMR、Alexa Fluor 555、四甲基罗丹明(TMR)、Alexa Fluor 546、BODIPY 558/568、QSY 7、QSY 9、BODIPY 564/570、丽丝胺罗丹明B、罗丹明红染料、BODIPY 576/589、Alexa Fluor 568、X-罗丹明、BODIPY 581/591、BODIPY TR、Alexa Fluor 594、德克萨斯红染料、萘基荧光素、AlexaFluor 610、BODIPY 630/650、孔雀石绿、Alexa Fluor 633、Alexa Fluor 635、BODIPY 650/665、Alexa Fluor 647、QSY 21、Alexa Fluor660、Alexa Fluor 680、Alexa Fluor 700、Alexa Fluor 750、Alexa Fluor 790等。
不可逆的3’-阻断基团的其他例子包括但不限于生物素或脱硫生物素基团。
在上述任一实施方案中,核苷三磷酸为2’-受保护的核苷三磷酸。
“2’-受保护的核苷三磷酸”是指在其2’-末端(即其5-碳糖的第2位)具有额外基团(以下简称“2’-保护基团”)的核苷三磷酸。这种2’-保护基团的一个特殊目的(尽管不是唯一目的)是在核糖核苷酸三磷酸的特定情况下保护反应性2’-羟基。
上述任何3’-阻断基团,无论是可逆的还是不可逆的,都适合作为2’-保护基团。
此外,上述任何3’-阻断基团,无论是可逆的还是不可逆的,都可以进一步加成到核苷三磷酸的任何位置,无论是在它们的5-碳糖部分和/或在它们的含氮碱基上。
在一个实施方案中,核酸的从头开始的合成方法包括以下步骤:
a)提供具有游离3’-羟基的核苷酸;
b)在古细菌DNA引物酶或其功能活性片段和/或变体存在下,使所述核苷酸与(任选地,所选择的)核苷三磷酸(或(任选地,所选择的)核苷三磷酸的组合接触,从而使所述(任选地,所选择的)核苷三磷酸共价结合到所述核苷酸的游离3’-羟基。
在一个实施方案中,本发明的方法用于从头开始合成具有随机序列的核酸,其包括以下步骤:
a)提供具有游离3’-羟基的核苷酸;
b)在古细菌DNA引物酶或其功能活性片段和/或变体存在的情况下,使所述核苷酸与(任选地,所选择的)核苷三磷酸的组合接触,从而使所述(任选地,所选择的)核苷三磷酸的组合随机共价结合到所述核苷酸的游离3’-羟基。
在一个实施方案中,本发明的方法用于从头开始的、序列受控的核酸合成,并且它包括以下步骤:
a)提供具有游离3’-羟基的核苷酸;
b)在古细菌DNA引物酶或其功能活性片段和/或变体存在下,使所述核苷酸与选择的可逆的终止核苷三磷酸接触,从而使所述选择的可逆的终止核苷三磷酸共价结合至所述核苷酸的游离3’-羟基;
c)使用洗涤溶液去除所有试剂,特别是去除未结合的可逆的终止核苷三磷酸;
d)在裂解剂存在下,裂解共价结合的终止核苷三磷酸的可逆的3’-阻断基团,从而得到具有游离3'-羟基的核苷酸;
e)任选地,使用洗涤溶液去除所有试剂,尤其是去除裂解剂;
f)任选地,多次反复步骤b)至e),以合成具有所需长度和核苷酸序列的核酸。
在一个实施方案中,通过多次反复步骤b)到e),将超过1个核苷三磷酸添加至具有游离3’-羟基的核苷酸,例如将超过2、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1250、1500、1750、2000、2250、2500、2750、3000、4000、5000、6000、7000、8000、9000、10000或甚至更多个核苷三磷酸添加到具有游离3’-羟基的核苷酸。
在一个实施方案中,本发明的从头开始的核酸合成方法在一种或多种缓冲液(例如,Tris或二甲胂酸盐)和/或一种或多种盐(例如,Na+、K+、Mg2+、Mn2+、Cu2+、Zn2+、Co2+等,均带有适当的抗衡离子,如Cl-)的存在下进行。
在一个实施方案中,本发明的从头开始的核酸合成方法是在一种或多种二价阳离子(例如,Mg2+、Mn2+、Co2+等,均具有合适的抗衡离子,例如Cl-)的存在下进行,优选在Mn2+的存在下进行。
在一个实施方案中,本发明的从头开始的核酸合成方法在约60℃至约95℃的温度范围内进行。在一个实施方案中,本发明的从头开始的核酸合成方法在约60℃、65℃、70℃、75℃、80℃、85℃、90℃或95℃的温度下进行。
在一个实施方案中,本发明的从头开始的核酸合成方法在不存在真核酶,特别是不存在真核聚合酶(包括DNA聚合酶α和DNA聚合酶β)的情况下进行。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体可用在本发明的从头开始的单链核酸合成方法中,用于净化终止核苷三磷酸库中的包含游离的3’-羟基污染核苷三磷酸。事实上,市售的终止核苷三磷酸库通常包含百分之几的“非终止”核苷三磷酸(即包含游离的3’-羟基),这会在核酸合成过程中造成有害影响。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体可用于本发明的从头开始的核酸合成方法,以产生合成性均聚物和杂聚物。本领域技术人员熟悉用于生产合成性均聚物和杂聚物的手段和方法,例如描述于Bollum,1974(In Boyer[Ed.],Theenzymes[3rd ed.,Vol.10,pp.145-171].New York,NY:Academic Press),其内容通过引用并入本文。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体可用于本发明的从头开始的核酸合成方法,用于任何类型的3’-OH末端的均聚物加尾。本领域技术人员熟悉用于均聚物加尾的手段和方法,描述于例如Deng&Wu,1983(Methods Enzymol.100:96-116)and Eschenfeldt et al.,1987(Methods Enzymol.152:337-342),其内容通过引用并入本文。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体可用于本发明的从头开始的核酸合成方法,以用于寡核苷酸、DNA和RNA的标记。本领域技术人员熟悉用于标记的手段和方法,描述于例如Deng&Wu,1983(Methods Enzymol.100:96-116),Tu&Cohen,1980(Gene.10(2):177-183),Vincent et al.,1982(NucleicAcids Res.10(21):6787-6796),Kumar et al.,1988(Anal Biochem.169(2):376-382),Gaastra&Klemm,1984(InWalker et al.[Eds.],Nucleic acids[Vol.2,Methods in molecular biology,pp.269-271].Clifton,NJ:Humana Press),Igloi&Schiefermayr,1993(Biotechniques.15(3):486-497)和Winz et al.,2015(NucleicAcids Res.43(17):e110),其内容通过引用并入本文。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体可用于本发明的从头开始的核酸合成方法,以用于5'-RACE(cDNA末端快速扩增)。本领域技术人员熟悉用于5'-RACE的手段和方法,描述于例如Scotto-Lavino et al.,2006(Nat Protoc.1(6):2555-62),其内容在此并入本文作为参考。
在一个实施方案中,古细菌DNA引物酶或其功能活性片段和/或变体可用于本发明的从头开始的核酸合成方法,以用于原位定位细胞凋亡,例如TUNEL(末端脱氧核苷酸转移酶dUTP切刻末端标记)测定。本领域技术人员熟悉用于原位定位细胞凋亡的手段和方法,例如TUNEL测定,描述于例如Gorczyca et al.,1993(Cancer Res.53(8):1945-1951)和Lebonet al.,2015(Anal Biochem.480:37-41),其内容通过引用并入本文。
在第三方面,本发明涉及一种从头开始的核酸合成系统,包括:
-具有游离3’-羟基的核苷酸,任选地,其中所述核苷酸被固定到支持物上;
-核苷三磷酸;和
-古细菌DNA引物酶或其功能活性片段和/或变体。
在一个实施方案中,所述系统适用于具有随机序列的核酸的不依赖于模板的合成,并且它包括:
-具有游离3’-羟基的核苷酸,任选地,其中所述核苷酸固定在支持物上;
-(任选地,所选择的)核苷三磷酸的组合,其中所述(任选地,所选择的)核苷三磷酸不是终止核苷三磷酸;和
-古细菌DNA引物酶或其功能活性片段和/或变体。
在一个实施方案中,所述系统适用于不依赖于模板的、序列受控的核酸合成,并且它包括:
-具有游离3’-羟基的核苷酸,任选地,其中所述核苷酸固定在支持物上;
-可逆地终止所选择的核苷三磷酸,其中不同的核苷三磷酸不在同一小瓶中组合在一起;
-裂解剂;和
-古细菌DNA引物酶或其功能活性片段和/或变体。
在第四方面,本发明涉及一种试剂盒,其包含:
-具有游离3’-羟基的核苷酸,任选地,其中所述核苷酸固定在支持物上;
-核苷三磷酸;和
-古细菌DNA引物酶或其功能活性片段和/或变体。
在一个实施方案中,所述试剂盒包括:
-具有游离3’-羟基的核苷酸,任选地,其中所述核苷酸固定在支持物上;
-(任选地,所选择的)核苷三磷酸的组合,其中所述(任选地,所选择的)核苷三磷酸不是终止核苷三磷酸;和
-古细菌DNA引物酶或其功能活性片段和/或变体。
在一个实施方案中,所述试剂盒包括:
-具有游离3’-羟基的核苷酸,任选地,其中所述核苷酸固定在支持物上;
-可逆地终止所选择的核苷三磷酸,其中不同的核苷三磷酸不在同一小瓶中组合在一起;
-裂解剂;和
-古细菌DNA引物酶或其功能活性片段和/或变体。
附图简要说明
图1是电泳凝胶(SDS-PAGE)的照片,分别显示了PolpP12Δ297-898、PolpTN2Δ311-923、PolpTCIR10Δ303-928、PolpTpepΔ295-914和PolpTceleΔ295-913的纯化。MW阶梯:分子量阶梯(左侧道)。
图2是15%尿素-PAGE的照片,显示在60℃、70℃或80℃下使用PolpTN2Δ311-923、[PolpTN2Δ]或PolpP12Δ297-898[PolpP12Δ]进行的不依赖于模板的核酸合成测定。[a]:只有起始序列,没有酶,没有dNTP;[b]:起始序列+酶,没有dNTP;[c]:起始序列+酶+dNTP混合物(未保护)。
图3A-C是1.5%琼脂糖凝胶电泳的一组三张照片,显示了使用PolpP12Δ297-898或PolpTN2Δ311-923在70℃、80℃、90℃和100℃下进行的不依赖于模板的核酸合成测定,其与在70℃下不含酶[无酶]的阴性对照进行比较。dsDNA LF阶梯:SmartLadder 200至10000bp(Eurogentec)。
图3A:红色通道,675nm处的Cy5荧光;
图3B:绿色通道,520nm处的Sybr绿色II荧光;
图3C:红色和绿色通道的合并。
图4A-C是1.5%琼脂糖凝胶电泳的一组三张照片,显示了使用PolpP12Δ297-898或PolpTN2Δ311-923并在存在或不存在dNTP和/或起始序列(在5'带有Cy5荧光团)的情况下进行的不依赖于模板的核酸合成测定。反应在80℃下在存在或不存在每种底物(道1至8)的情况下进行。道9显示了一个两步反应,其中dNTP首先与PolpP12Δ297-898或PolpTN2Δ311-923一起孵育15分钟,然后添加起始序列。左侧道显示MW阶梯(SmartLadder 200至10000bp(Eurogentec))。
图4A:红色和绿色通道的合并;
图4B:绿色通道,520nm处的Sybr green II荧光;
图4C:红色通道,675nm处的Cy5荧光。
图5A-B是1%琼脂糖凝胶电泳的一组六张照片,显示了使用PolpTCIR10Δ303-928、PolpTpepΔ295-914或PolpTceleΔ295-913在70℃下在存在或不存在dNTP混合物或dG/dC混合物以及在存在或不存在起始序列(在5'带有Cy5荧光团)的情况下进行的不依赖于模板的核酸合成测定。MW阶梯(SmartLadder 200至10000bp(Eurogentec))。
图5A:使用PolpTCIR10Δ303-928或PolpTpepΔ295-914进行的不依赖于模板的核酸合成测定;
图5B:使用PolpTceleΔ295-913进行的不依赖于模板的核酸合成测定。
图6是电泳凝胶(SDS-PAGE)的照片,显示了PolpTN2Δ311-923、PolpTN2Δ90-96Δ311-923、PolpTN2Δ205-211Δ311-923和PolpTN2Δ248-254Δ311-923的纯化。PolpTN2Δ90-96Δ311-923和PolpTN2Δ205-211Δ311-923一式两份。MW阶梯:分子量阶梯。
图7A-C是1.5%琼脂糖凝胶电泳的一组三张照片,显示了使用PolpTN2Δ311-923、PolpTN2Δ90-96Δ311-923、PolpTN2Δ205-211Δ311-923或PolpTN2Δ248-254Δ311-923在存在或不存在dNTP和/或起始序列(在5'带有Cy5荧光团)的情况下进行的不依赖于模板的核酸合成测定。反应在在70℃下在存在或不存在每种底物的情况下进行。MW阶梯是SmartLadder 200至10000bp(Eurogentec)。
图7A:红色和绿色通道的合并;
图7B:红色通道,675nm处的Cy5荧光;
图7C:绿色通道,520nm处的MidoriGreen直接荧光。
图8是15%尿素-PAGE的照片,显示在60℃下使用PolpP12Δ297-898引入的受保护的核苷三磷酸(3’-O-氨基-dATP和3’-O-叠氮甲基-dATP)。
图9A-C是一组三张照片,显示了在80℃下通过PolpP12Δ297-898引入具有可逆终止氨基烷氧基的标记的核苷三磷酸。
图9A:15%尿素-PAGE显示在80℃下引入3’-O-氨基dATP或3’-O-氨基dTTP;
图9B:80℃下引入3’-O-氨基dATP的分析报告。Rf:相对迁移距离;
图9C:80℃下引入3’-O-氨基dTTP的分析报告。Rf:相对迁移距离。
图10A-C是一组三张照片,显示了在80℃下通过PolpP12Δ297-898引入用3’-O-叠氮亚甲基标记的核苷三磷酸。
图10A:15%尿素-PAGE显示在80℃下引入3’-O-叠氮甲基dATP或3’-O-叠氮甲基dTTP;
图10B:在80℃下引入3’-O-叠氮甲基dATP的分析报告。Rf:相对迁移距离;
图10C:在80℃下引入3’-O-叠氮甲基dTTP的分析报告。Rf:相对迁移距离。
图11A-C是一组三个方案,显示了在存在包含游离3’-羟基的污染核苷三磷酸的情况下,终止核苷三磷酸的净化程序。
图11A:在本文所述的DNA引物酶存在下并使用包含游离3’-羟基的核苷三磷酸的污染原料进行的从头开始的核酸合成的第一步;
图11B:在本文所述的DNA引物酶存在下并使用包含游离3’-羟基的核苷三磷酸的污染原料进行的从头开始的核酸合成的备选第一步。添加过量的外源双脱氧核苷三磷酸(ddNTP)以避免将终止核苷三磷酸引入至新生核酸链。ddNTP可以被功能化(例如,使用生物素);
图11C:该方法的第二步,包括(1)将第一步后获得的样品填充到离心过滤柱;和(2)旋转离心过滤柱,将合成的单链核酸片段和DNA引物酶与终止核苷三磷酸(3’-阻断的核苷三磷酸)和缓冲液分离。
实施例
本发明通过以下实施例进一步说明。
实施例1
PolpTN2Δ311-923、PolpTCIR10Δ303-928、PolpTpepΔ295-914和PolpTceleΔ295-913具有从头开始的单链核酸合成活性
按照改编自WO2011098588和Gill等人(Gill et al.,2014(Nucleic AcidsRes.42(6):3707-3719))的方法,表达和纯化了来自火球菌属种(Pyrococcus sp.)12-1(PolpP12Δ297-898,具有氨基酸序列SEQ ID NO:21)、鹦鹉螺热球菌种30-1(PolpTN2Δ311-923,具有氨基酸序列SEQ ID NO:2)、热球菌属种CIR10(PolpTCIR10Δ303-928,具有氨基酸序列SEQID NO:15)、嗜胨热球菌(PolpTpepΔ295-914,具有氨基酸序列SEQ ID NO:18)和芹菜热球菌(PolpTceleΔ295-913,具有氨基酸序列SEQ ID NO:20)的DNA引物酶的N末端结构域(图1)。
Figure BDA0004113289200000471
使用PolpTN2Δ311-923或PolpP12Δ297-898在60℃、70℃和80℃下使用单链核酸引物作为起始序列(在5’带有Cy5荧光团),进行了不依赖于模板的核酸合成测定。
测试了三种不同的条件:
-a:仅起始序列;无酶,无dNTP;
-b:起始序列+酶;无dNTP;
-c:起始序列+酶+dNTP混合物(未保护)。
如图2所示,当使用所有四种dNTP的混合物作为底物时,PolpTN2Δ311-923和PolpP12Δ297-898在每个测试温度下都表现出非模板化的末端核苷酸转移酶活性。然而,值得注意的是,在70℃和80℃时,大多数新合成的核酸有数百个碱基长,因此无法在15%尿素-PAGE凝胶上分离而保留在孔中。
因此,为了分析高温对PolpTN2Δ311-923和PolpP12Δ297-898活性的影响,如前所述,在70℃、80℃、90℃或100℃下进行了不依赖于模板的核酸合成测定,并通过琼脂糖凝胶电泳分离(图3)。通过在荧光引物聚合(在5’带有Cy5荧光团)后在675nm记录(红色通道),特异性地评估末端转移酶活性。使用Sybr Green II对总核酸合成和分子量标记物进行染色,并在520nm处记录(绿色通道)。
如图3A和3C所示,两种酶都表现出很强的不依赖于模板的末端核苷酸转移酶活性,这通过Cy5标记的起始序列的聚合得到证实(图3A)。这些活性在70℃时达到聚合最大值,并随着温度升高逐渐降低,最高可达100℃。然而,与PolpP12Δ297-898相比,当用SybrGreen II染色时,PolpTN2Δ311-923在70℃、80℃和90℃下表现出弥漫性迁移图(图3B),它并不与Cy5标记的起始序列共定位(参见图3A和3C)。尽管这个有趣的结果可能来自迁移问题,但另一种解释是存在意想不到的竞争活性,例如从头开始的单链核酸合成活性。
有趣的是,Béguin等人已经证明,在存在脱氧核苷酸三磷酸的情况下,全长PolpTN2引物酶和PolBDNA聚合酶的组合导致从头合成长双链DNA片段(即,既没有模板DNA也没有寡核苷酸引物)。然而,这种现象需要两种酶的存在,并且当仅PolpTN2与dNTP混合物反应时没有观察到(Béguin et al.,2015.Extremophiles.19(1):69-76)。与之相比,我们的结果表明,仅PolpTN2Δ311-923可能能够从新(de novo)合成长片段的单链核酸,即对应于从头开始的活性。
为了进一步研究这一现象,对PolpTN2Δ311-923和PolpP12Δ297-898进行了不依赖于模板的核酸合成测定(图4),这在存在或不存在dNTP和/或起始序列(在5’带有Cy5荧光团)的情况下进行。通过在荧光引物聚合后在675nm记录(红色通道),特异性地评估了末端转移酶活性。使用Sybr Green II对总核酸合成和分子量标记物进行染色,并在520nm处记录(绿色通道)。
测试了九种不同的条件:
-1:无酶,无起始序列,无dNTP;
-2:仅dNTP;无酶,无起始序列;
-3:仅起始序列;无酶,无dNTP;
-4:起始序列+dNTP混合物;无酶;
-5:仅酶,无起始序列,无dNTP;
-6:酶+dNTP混合物;无起始序列;
-7:酶+起始序列;无dNTP;
-8:酶+dNTP混合物+起始序列;
-9:酶+dNTP混合物+起始序列(孵育15分钟后添加);
如图4所示,在没有dNTP的情况下,PolpP12Δ297-898和PolpTN2Δ311-923都不能合成核酸(图4;道1、3、5和7),而结合dNTP与起始引物导致长核酸片段的合成(图4A;道8和9)。
有趣的是,在没有起始序列的情况下(图4;道1、2、5和6),在添加dNTP后,PolpTN2Δ311-923很容易表现出强的聚合酶活性(图4A和4B;道6)。各个通道分析表明,如不存在Cy5荧光所证明的那样(图4C;道6),这种活性不依赖于起始序列,从而证实了PolpTN2Δ311-923的从头开始的单链核酸合成活性。
相反,在相同的实验条件下,如两个通道中完全没有荧光所证明的那样(图4A、4B和4C;道6),PolpP12Δ297-898不合成核酸,表明该酶不具备从头开始的单链核酸合成活性。
为了进一步研究这种从头开始的单链核酸合成活性对PolpTN2Δ311-923和PolpP12Δ297-898延伸单链核酸片段能力的影响,通过分离两个反应进行了竞争测定(图4,道9)。为实现此实验,首先将两种酶与dNTP一起孵育15分钟,以进行不依赖于模板的引物酶反应,然后添加起始序列再孵育15分钟,以进行不依赖于模板的引物延伸反应。正如预期的那样,在Sybr Green II染色后,可以观察到PolpTN2Δ311-923的强烈弥散迁移图(图4B,道9),同时发现起始序列向上迁移至染料前沿(图4C,道9),类似于阴性对照(图4C,道3)。与之相比,发现PolpP12Δ297-898延伸起始序列(图4C,道9),如上所述,这表明与dNTP混合物的预孵育不影响其末端核苷酸转移酶活性。因此,该结果表明,PolpTN2Δ311-923不能在这些实验条件下延伸起始序列。
我们随后研究了PolpTCIR10Δ303-928、PolpTpepΔ295-914和PolpTceleΔ295-913在存在或不存在起始序列(在5'带有Cy5荧光团)的情况下执行不依赖于模板的DNA合成反应的能力。为此,PolpTCIR10Δ303-928和PolpTpepΔ295-914(图5A)以及PolpTceleΔ295-913(图5B)在有或没有起始序列的情况下在70℃下孵育,并通过荧光引物的聚合和在675nm(红色通道)记录来评估它们的末端转移酶活性,同时通过Sybr Green II染色并在520nm(绿色通道)记录来评估它们的从头开始的单链核酸合成活性。
如图5A和5B所示,PolpTCIR10Δ303-928和PolpTpepΔ295-914以及PolpTceleΔ295-913都展示了从头开始合成核酸和延伸单链DNA片段的能力,类似于PolpTN2Δ311-923。此外,这些活性因PolpTceleΔ295-913在dC/dG混合物存在下催化末端核苷酸转移酶反应和从头开始的单链核酸合成反应二者的能力而得到加强(图5B),表明这些酶的使用与需要从头开始的单链核酸合成活性或末端核苷酸转移酶活性的方法相关。
实施例2
具有内部缺失的PolpTN2Δ311-923变体仍然具有功能性
尽管PolpTN2Δ311-923、PolpTCIR10Δ303-928、PolpTpepΔ295-914和PolpTceleΔ295-913具有相似的活性,但值得注意的是,这些酶在序列同一性和长度方面都存在差异。事实上,这些酶的蛋白序列比对显示存在多个环,我们怀疑这些环对于PolpTN2Δ311-923中的末端核苷酸转移酶活性和从头开始的活性可能是可有可无的。这些环位于PolpTN2Δ311-923的氨基酸残基90至96、205至211和248至254之间(参考SEQ ID NO:2编号)。在PolpTCIR10Δ303-928(参考SEQ ID NO:15编号)的氨基酸残基93至98之间也发现了一个类似的环。
这项研究的驱动力是需要提供一种适用于工业应用并适用于上游和下游方法的酶。在这方面,这些环的去除一方面可以提高蛋白稳定性和蛋白表达产量,因为它使结构化区域的存在最大。另一方面,环缺失导致蛋白尺寸减小,最终有助于在下游纯化过程中通过超滤去除酶和其他试剂。
为了研究环缺失和尺寸减少对末端核苷酸转移酶活性和从头开始的活性的影响,我们生成了PolpTN2Δ311-923的变体,它具有310个氨基酸残基的最大尺寸,而PolpTpepΔ295-914和PolpTceleΔ295-913有295个氨基酸残基。这导致四种变体,即PolpTN2Δ90-96Δ311-923(具有SEQID NO:3)、PolpTN2Δ205-211Δ311-923(具有SEQ ID NO:4)、PolpTN2Δ248-254Δ311-923(具有SEQ IDNO:5)和PolpTN2Δ243-254Δ311-923(具有SEQ ID NO:6)。前三个的表达和纯化如前所述,以一式一份或一式两份进行(图6)。
我们随后研究了这三种变体在存在或不存在起始序列(在5’带有Cy5荧光团)的情况下执行不依赖于模板的DNA合成反应的能力。
为此,将PolpTN2Δ90-96Δ311-923、PolpTN2Δ205-211Δ311-923和PolpTN2Δ248-254Δ311-923以及作为对照的PolpTN2Δ311-923(图7)在70℃下在具有或不具有起始序列的情况下孵育,并通过荧光引物的聚合和在675nm(红色通道)下记录来评估它们的末端转移酶活性(图7B),同时通过MidoriGreen直接染色评估它们的从头开始的单链核酸合成活性,并在520nm(绿色通道)下记录(图7C)。
如图7A至7C所示,所有测试的变体都表现出从头开始合成核酸和延伸单链DNA片段的能力,类似于PolpTN2Δ311-923和先前证明的PolpTCIR10Δ303-928、PolpTpepΔ295-914和PolpTceleΔ295-913
因此,这些结果证明了塑造这些酶以将它们最佳地整合到需要下游步骤(例如超滤)的工业方法中的可能性。
此外,单独来看,由于三个环的每一个的缺失都不会损害酶的活性,因此可以预期:
-相同PolpTN2Δ311-923结构中两个或甚至三个环缺失的组合还将产生功能性酶(SEQ ID NO:7至13);和
-PolpTCIR10Δ303-928中相应环的缺失还会产生功能性酶(SEQ ID NO:16)。
实施例3
市售的受保护的核苷三磷酸库并非没有杂质
使用3’-O-氨基dATP或3’-O-叠氮甲基dATP和单链核酸引物作为起始序列(在5’带有Cy5荧光团),在60℃(图8)下用PolpP12Δ297-898进行末端转移酶活性测定。
测试了四种不同的条件:
-a:仅起始序列;无酶,无dNTP,60℃;
-b:起始序列+酶;无dNTP,60℃;
-c:起始序列+酶+3'-O-氨基dATP,60℃;
-d:起始序列+酶+3'-O-叠氮甲基dATP,60℃;
因此,与阴性对照相比,发现PolpP12Δ297-898在60℃下自然引入3’-可逆终止核苷酸,起始引物的更高迁移图证明了这一点(图8)。
为了进一步研究较高温度对PolpP12Δ297-898引入3’-可逆终止核苷酸的能力的影响,在80℃下使用3’-O-氨基dNTP(图9)或3’-O-叠氮甲基dATP(图10)和单链核酸引物作为起始序列(在5’带有Cy5荧光团)进行了末端转移酶活性测定。
在每种情况下测试了三种不同的条件:
-起始序列+酶;无dNTP,80℃;
-起始序列+酶+3'-O-氨基-dATP或3’-O-叠氮甲基dATP,80℃;
-起始序列+酶+3'-O-氨基dTTP或3’-O-叠氮甲基dTTP,80℃。
如前所示,与阴性对照相比,发现PolpP12Δ297-898在80℃下有效地引入3’-可逆终止核苷酸,起始引物的更高迁移图证明了这一点(图9A和10A)。
此外,还发现引入了嘌呤型和嘧啶型核碱基,3'-O-氨基dATP和3’-O-氨基dTTP的产率分别为76.6%和80.1%(图9B和C),而3’-O-叠氮甲基dATP和3’-O-叠氮甲基dTTP的引入分别导致66.5%和82.9%的产率(图10B和C)。
尽管有这些表现,图8、9A和10A证明2至3个核苷三磷酸的加聚似乎以不同水平发生。
此外,肟阻断的核苷三磷酸的制造商提供的质量控制报告显示,纯度约为90%。这似乎与我们的各种观察是一致的。
这种小百分比的杂质对核酸的受控合成具有极其不利的影响。
实施例4
终止核苷酸在用于核酸合成之前的净化程序
本文所述的手段和方法可用于终止核苷三磷酸库中的包含游离3’-羟基的污染核苷三磷酸的净化。使用这些手段和方法,整个净化过程的成本大大降低,因为不需要模板、引物或固体支持物;而且,可纯化的核苷三磷酸的范围很广:脱氧核糖核苷、核糖核苷酸、化学合成的中间体等。
从头开始合成的核酸合成
将浓度范围为200μM至5mM的3’-阻断的核苷三磷酸的每个库在缓冲液中孵育,该缓冲液包含50mM Tris-HCl(pH 8.0),5mM氯化锰(MnCl2),以及浓度范围为5μM至50μM的来自鹦鹉螺热球菌种30-1(具有SEQ ID NO:2)、热球菌属种CIR10(具有SEQ ID NO:15)、嗜胨热球菌(具有SEQ ID NO:18)或芹菜热球菌(具有SEQ ID NO:20)的DNA引物酶的功能活性片段。
计算核苷三磷酸初始库的目标浓度,以至少获得最终浓度为10X的纯化的3’-阻断的核苷三磷酸,从而准备用于不同的应用,例如序列受控的不依赖于模板的DNA合成。
将混合物在70℃下孵育1小时。然后通过添加12.5mM EDTA终止酶促反应(图11A)。
任选地,可以过量添加外源性双脱氧核苷三磷酸,以避免将终止核苷三磷酸引入至新生核酸链(图11B)。此类外源双脱氧核苷三磷酸可以例如被功能化以进一步亲和纯化。
分离3’-阻断的核苷三磷酸
在含有游离3’-羟基的污染核苷三磷酸存在的情况下,酶促反应产生长的单链核酸片段,长度从约15到数百个核苷酸不等。
可以使用离心过滤柱进行3’-阻断的核苷三磷酸的纯化,例如
Figure BDA0004113289200000531
Ultra0.5(Merck Millipore),其截断分子量为3至30kD。这种装置为合成的核酸和酶保留和3’-阻断核苷三磷酸释放提供了回收和旋转时间之间的最佳平衡(图11C)。
因此,在该过滤步骤结束时,不仅保留了合成的核酸和酶,而且最重要的是,3’-阻断的核苷三磷酸以正确的浓度(10X)直接回收到滤液中,并且回收到合适活性缓冲液中以用于下一步骤。
或者,使用具有例如阴离子交换介质(例如Cytiva的MiniQTM,前身为GEHealthcare)或亲和介质(取决于过量添加的外源双脱氧核苷三磷酸所带的官能团)的HPLC系统可以获得相同的结果。
序列表
<110> 辛希克斯(SYNHELIX)
I·兰德里安贾托沃-巴鲁(RANDRIANJATOVO-GBALOU Irina)
A·塞德(SAID Ahmed)
R·拉希尔(RAHIER Renaud)
<120> 使用热稳定酶从头开始的不依赖于模板的核酸合成
<130> IBIO-1628/PCT
<150> US63/038,168
<151> 2020-06-12
<150> EP20305904.3
<151> 2020-08-06
<160> 21
<170> BiSSAP 1.3.6
<210> 1
<211> 923
<212> PRT
<213> 鹦鹉螺热球菌(Thermococcus nautili)
<220>
<223> 鹦鹉螺热球菌种30-1DNA引物酶
<400> 1
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Val Asn
195 200 205
Gly Val Lys Gly Leu Leu Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe
210 215 220
Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe Asn His Lys Tyr
225 230 235 240
Arg Thr Ile Ile Lys Asp Glu Asp Gly Thr Glu Arg Val Val Pro Thr
245 250 255
Gln Val Lys Gly Arg Val Ile Glu Phe Asn Asp Val Arg Ile Ser Leu
260 265 270
Thr Glu Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile
275 280 285
Pro Leu Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys
290 295 300
Arg Tyr Glu Val Thr Ser Ser Asn Phe Glu Ala Leu Ala Glu Arg Leu
305 310 315 320
Phe Thr Glu Leu Arg Pro Trp Trp Glu Ile Ala Lys Glu Lys Gly Trp
325 330 335
Ser Arg His His Leu Thr Met Gly Ile Ala Thr Tyr Ile Leu Arg Asn
340 345 350
Thr Asn Leu Thr Pro Glu Gln Leu Ile Gly Ser Glu Asn Ser Pro Gly
355 360 365
Leu Trp Glu Leu Val Phe Ala Lys Leu Val Glu Ala Gly Leu Glu Asp
370 375 380
Pro Asp Asp Trp Lys Asn Arg Ala Ser Thr Ile Arg Asp Ala Tyr Lys
385 390 395 400
Lys Ile Glu Ser Gly Lys Lys Val Ala Thr Lys Ala Tyr Leu Arg Lys
405 410 415
Tyr Ile Glu Gly Leu Ser Glu Glu Asp Ala Val Gln Ile Leu Leu Ser
420 425 430
Val Lys Arg Ala Leu Leu Pro Tyr Leu Lys Ala Val Asp Val Lys Arg
435 440 445
Ile Ser Lys Tyr Ser Ala Arg Pro Tyr Glu Ile Thr Glu Glu Ile Pro
450 455 460
Lys Ser Trp Glu Asp Ile Asp Glu Asn Arg Lys Lys Ala Thr Gly Val
465 470 475 480
Trp Tyr Ile Asp Phe Leu Ala Leu Glu Thr Ala Asn Asp Ile Tyr Phe
485 490 495
Glu Asp Leu Pro Lys Pro Pro Val Phe Tyr Ile Arg Phe Val Glu Lys
500 505 510
Asn Lys Glu Lys Phe Lys Leu Asn Glu Thr Leu Tyr His Ser Phe Leu
515 520 525
Thr Trp Leu Gly Ile Thr Glu Gly Glu Pro Leu Asp Arg Thr Glu Leu
530 535 540
Ile Asp Leu Leu Val Glu Lys Phe Gly Phe Thr Val Glu Asp Leu Lys
545 550 555 560
Ala Ile Tyr Tyr Arg Lys Ile Leu Thr Leu Leu Lys Pro Glu Gly Met
565 570 575
Arg Thr Pro Lys Cys Ile Gln Glu Phe Leu Phe Glu Leu Ala Thr Glu
580 585 590
Gly Asn Leu Pro Glu Asp Lys Ile Arg His Leu Ala His Trp Val Lys
595 600 605
Phe Tyr Ala Arg Pro Leu Arg His Ser Thr Thr Ser Val Leu Leu Lys
610 615 620
Gly Arg Gly Lys Pro Val Asp Met Arg Leu Ala Ile Trp Ala Lys Val
625 630 635 640
Val Glu Phe Phe Ala Glu Asp Asp Glu Val Ala Glu Glu Leu Ile Thr
645 650 655
Thr Phe Lys Lys Ala Tyr Met Gly Ala Glu Pro Pro Phe Pro Cys Ile
660 665 670
Gly Ala Glu Ser Cys Pro Phe Tyr Pro Asp His Arg Ala Cys Pro Phe
675 680 685
Ile Val Pro Lys Arg Lys Glu Val Leu Pro Val Ser Ile Val Asp Val
690 695 700
Gln Leu His Gly Ser Asp Gly Ile Val Val Leu Val Gly Gly Pro Thr
705 710 715 720
Glu Val Thr Ala Phe Thr Leu Glu Gly Lys Val Glu Trp Ile Lys Thr
725 730 735
Thr Lys Lys Thr Val Lys Tyr Pro Ile Ala Glu Trp Phe Leu Asp Arg
740 745 750
Phe Ala Lys Glu Tyr Leu Ser Leu Pro Glu Ala Pro Ser Trp Trp Lys
755 760 765
Leu Glu Glu Val Thr Glu Ile Leu Lys Ser Arg Ala Arg Val Val Lys
770 775 780
Ser Gln Phe Asp Lys Phe Glu Asp Tyr Leu Glu Gln Phe Ile Glu Trp
785 790 795 800
Leu Gln Lys Glu Asn Ser Arg Arg Gly Ile Leu Pro Tyr Glu Lys Ala
805 810 815
Asp Glu Asn His Leu Phe Ile Lys Gly Glu Trp Val Gly Ile Pro Pro
820 825 830
Gly Phe Ala Arg Glu Phe Tyr Ser Gly Glu Leu Leu Ile Gly Gly Pro
835 840 845
Thr Phe Arg Arg Met Leu Glu Gln Lys Leu Gly Lys Asp Tyr Arg Lys
850 855 860
Met Ser Ala Lys Ile His Leu Asn Thr Gly Leu Lys Asp Lys Arg Asn
865 870 875 880
Cys Tyr Phe Val Ser Val Glu Trp Phe Arg Lys His Val Gly Glu Pro
885 890 895
Asn Ile Gln Glu Ile Thr Ser Glu Gly Asp Val Ser Phe Asp Gly Leu
900 905 910
Ser Tyr Asp Asp Glu Glu Glu Gly Val Val Gly
915 920
<210> 2
<211> 310
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ311-923
<400> 2
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Val Asn
195 200 205
Gly Val Lys Gly Leu Leu Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe
210 215 220
Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe Asn His Lys Tyr
225 230 235 240
Arg Thr Ile Ile Lys Asp Glu Asp Gly Thr Glu Arg Val Val Pro Thr
245 250 255
Gln Val Lys Gly Arg Val Ile Glu Phe Asn Asp Val Arg Ile Ser Leu
260 265 270
Thr Glu Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile
275 280 285
Pro Leu Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys
290 295 300
Arg Tyr Glu Val Thr Ser
305 310
<210> 3
<211> 304
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ90-96Δ311-923
<400> 3
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Thr Glu Gly Glu Arg Arg
85 90 95
Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln Gly Asp Ser Glu Thr Thr
100 105 110
Ser Gly Phe Thr Leu Ala Leu Val Val Asp Ile Asp Asn Thr Lys Ile
115 120 125
His Asp Thr Arg Ile Ile Glu Asn Glu Glu Glu Ala Phe Glu Ala Ser
130 135 140
Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys Leu Gln Glu Leu Gly Phe
145 150 155 160
Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly Gly Leu Gln Leu Trp Phe
165 170 175
Val Ser Asp Lys Leu Glu Pro Ile Ser Val Ile Asp Arg Ala Ser Glu
180 185 190
Ile Ile Pro Asn Ile Met Asn Gly Val Asn Gly Val Lys Gly Leu Leu
195 200 205
Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe Asp Pro Ala Arg Ile Val
210 215 220
Arg Ala Pro Leu Thr Phe Asn His Lys Tyr Arg Thr Ile Ile Lys Asp
225 230 235 240
Glu Asp Gly Thr Glu Arg Val Val Pro Thr Gln Val Lys Gly Arg Val
245 250 255
Ile Glu Phe Asn Asp Val Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg
260 265 270
Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr
275 280 285
Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295 300
<210> 4
<211> 304
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ205-211Δ311-923
<400> 4
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Leu Leu
195 200 205
Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe Asp Pro Ala Arg Ile Val
210 215 220
Arg Ala Pro Leu Thr Phe Asn His Lys Tyr Arg Thr Ile Ile Lys Asp
225 230 235 240
Glu Asp Gly Thr Glu Arg Val Val Pro Thr Gln Val Lys Gly Arg Val
245 250 255
Ile Glu Phe Asn Asp Val Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg
260 265 270
Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr
275 280 285
Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295 300
<210> 5
<211> 304
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ248-254Δ311-923
<400> 5
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Val Asn
195 200 205
Gly Val Lys Gly Leu Leu Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe
210 215 220
Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe Asn His Lys Tyr
225 230 235 240
Arg Thr Ile Ile Lys Asp Glu Asp Pro Thr Gln Val Lys Gly Arg Val
245 250 255
Ile Glu Phe Asn Asp Val Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg
260 265 270
Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr
275 280 285
Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295 300
<210> 6
<211> 298
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ243-254Δ311-923
<400> 6
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Val Asn
195 200 205
Gly Val Lys Gly Leu Leu Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe
210 215 220
Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe Asn His Lys Tyr
225 230 235 240
Arg Thr Pro Thr Gln Val Lys Gly Arg Val Ile Glu Phe Asn Asp Val
245 250 255
Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys
260 265 270
Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu
275 280 285
Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295
<210> 7
<211> 298
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ90-96Δ205-211Δ311-923
<400> 7
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Thr Glu Gly Glu Arg Arg
85 90 95
Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln Gly Asp Ser Glu Thr Thr
100 105 110
Ser Gly Phe Thr Leu Ala Leu Val Val Asp Ile Asp Asn Thr Lys Ile
115 120 125
His Asp Thr Arg Ile Ile Glu Asn Glu Glu Glu Ala Phe Glu Ala Ser
130 135 140
Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys Leu Gln Glu Leu Gly Phe
145 150 155 160
Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly Gly Leu Gln Leu Trp Phe
165 170 175
Val Ser Asp Lys Leu Glu Pro Ile Ser Val Ile Asp Arg Ala Ser Glu
180 185 190
Ile Ile Pro Asn Ile Met Asn Gly Leu Leu Ser Glu Gly Phe Lys Ala
195 200 205
Asp Asn Ile Phe Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe
210 215 220
Asn His Lys Tyr Arg Thr Ile Ile Lys Asp Glu Asp Gly Thr Glu Arg
225 230 235 240
Val Val Pro Thr Gln Val Lys Gly Arg Val Ile Glu Phe Asn Asp Val
245 250 255
Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys
260 265 270
Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu
275 280 285
Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295
<210> 8
<211> 298
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ90-96Δ248-254Δ311-923
<400> 8
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Thr Glu Gly Glu Arg Arg
85 90 95
Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln Gly Asp Ser Glu Thr Thr
100 105 110
Ser Gly Phe Thr Leu Ala Leu Val Val Asp Ile Asp Asn Thr Lys Ile
115 120 125
His Asp Thr Arg Ile Ile Glu Asn Glu Glu Glu Ala Phe Glu Ala Ser
130 135 140
Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys Leu Gln Glu Leu Gly Phe
145 150 155 160
Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly Gly Leu Gln Leu Trp Phe
165 170 175
Val Ser Asp Lys Leu Glu Pro Ile Ser Val Ile Asp Arg Ala Ser Glu
180 185 190
Ile Ile Pro Asn Ile Met Asn Gly Val Asn Gly Val Lys Gly Leu Leu
195 200 205
Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe Asp Pro Ala Arg Ile Val
210 215 220
Arg Ala Pro Leu Thr Phe Asn His Lys Tyr Arg Thr Ile Ile Lys Asp
225 230 235 240
Glu Asp Pro Thr Gln Val Lys Gly Arg Val Ile Glu Phe Asn Asp Val
245 250 255
Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys
260 265 270
Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu
275 280 285
Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295
<210> 9
<211> 292
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ90-96Δ243-254Δ311-923
<400> 9
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Thr Glu Gly Glu Arg Arg
85 90 95
Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln Gly Asp Ser Glu Thr Thr
100 105 110
Ser Gly Phe Thr Leu Ala Leu Val Val Asp Ile Asp Asn Thr Lys Ile
115 120 125
His Asp Thr Arg Ile Ile Glu Asn Glu Glu Glu Ala Phe Glu Ala Ser
130 135 140
Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys Leu Gln Glu Leu Gly Phe
145 150 155 160
Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly Gly Leu Gln Leu Trp Phe
165 170 175
Val Ser Asp Lys Leu Glu Pro Ile Ser Val Ile Asp Arg Ala Ser Glu
180 185 190
Ile Ile Pro Asn Ile Met Asn Gly Val Asn Gly Val Lys Gly Leu Leu
195 200 205
Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe Asp Pro Ala Arg Ile Val
210 215 220
Arg Ala Pro Leu Thr Phe Asn His Lys Tyr Arg Thr Pro Thr Gln Val
225 230 235 240
Lys Gly Arg Val Ile Glu Phe Asn Asp Val Arg Ile Ser Leu Thr Glu
245 250 255
Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu
260 265 270
Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr
275 280 285
Glu Val Thr Ser
290
<210> 10
<211> 298
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ205-211Δ248-254Δ311-923
<400> 10
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Leu Leu
195 200 205
Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe Asp Pro Ala Arg Ile Val
210 215 220
Arg Ala Pro Leu Thr Phe Asn His Lys Tyr Arg Thr Ile Ile Lys Asp
225 230 235 240
Glu Asp Pro Thr Gln Val Lys Gly Arg Val Ile Glu Phe Asn Asp Val
245 250 255
Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys
260 265 270
Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu
275 280 285
Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
290 295
<210> 11
<211> 292
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ205-211Δ243-254Δ311-923
<400> 11
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Glu Glu Asn Lys Lys Ala
85 90 95
Thr Glu Gly Glu Arg Arg Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln
100 105 110
Gly Asp Ser Glu Thr Thr Ser Gly Phe Thr Leu Ala Leu Val Val Asp
115 120 125
Ile Asp Asn Thr Lys Ile His Asp Thr Arg Ile Ile Glu Asn Glu Glu
130 135 140
Glu Ala Phe Glu Ala Ser Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys
145 150 155 160
Leu Gln Glu Leu Gly Phe Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly
165 170 175
Gly Leu Gln Leu Trp Phe Val Ser Asp Lys Leu Glu Pro Ile Ser Val
180 185 190
Ile Asp Arg Ala Ser Glu Ile Ile Pro Asn Ile Met Asn Gly Leu Leu
195 200 205
Ser Glu Gly Phe Lys Ala Asp Asn Ile Phe Asp Pro Ala Arg Ile Val
210 215 220
Arg Ala Pro Leu Thr Phe Asn His Lys Tyr Arg Thr Pro Thr Gln Val
225 230 235 240
Lys Gly Arg Val Ile Glu Phe Asn Asp Val Arg Ile Ser Leu Thr Glu
245 250 255
Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu
260 265 270
Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr
275 280 285
Glu Val Thr Ser
290
<210> 12
<211> 292
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ90-96Δ205-211Δ248-254Δ311-923
<400> 12
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Thr Glu Gly Glu Arg Arg
85 90 95
Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln Gly Asp Ser Glu Thr Thr
100 105 110
Ser Gly Phe Thr Leu Ala Leu Val Val Asp Ile Asp Asn Thr Lys Ile
115 120 125
His Asp Thr Arg Ile Ile Glu Asn Glu Glu Glu Ala Phe Glu Ala Ser
130 135 140
Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys Leu Gln Glu Leu Gly Phe
145 150 155 160
Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly Gly Leu Gln Leu Trp Phe
165 170 175
Val Ser Asp Lys Leu Glu Pro Ile Ser Val Ile Asp Arg Ala Ser Glu
180 185 190
Ile Ile Pro Asn Ile Met Asn Gly Leu Leu Ser Glu Gly Phe Lys Ala
195 200 205
Asp Asn Ile Phe Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe
210 215 220
Asn His Lys Tyr Arg Thr Ile Ile Lys Asp Glu Asp Pro Thr Gln Val
225 230 235 240
Lys Gly Arg Val Ile Glu Phe Asn Asp Val Arg Ile Ser Leu Thr Glu
245 250 255
Phe Leu Asp Arg Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu
260 265 270
Glu Lys Pro Thr Lys Arg Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr
275 280 285
Glu Val Thr Ser
290
<210> 13
<211> 286
<212> PRT
<213> 人工序列
<220>
<223> PolpTN2Δ90-96Δ205-211Δ243-254Δ311-923
<400> 13
Met Ser Ser Leu Arg Pro Ser Ser Ile Ile Ile Asp Ile Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Asp Ser Ser Arg Trp Ala Ile Glu Leu Arg Phe
20 25 30
Leu Pro Lys Pro Ile Ser Ser Glu Trp Ile Phe Ile Thr Asp Ile Glu
35 40 45
Glu Arg Ala Ser Glu Ile Asp Lys Val Leu Thr Lys Tyr Asn Ile Met
50 55 60
Lys Lys Lys Asp Ala Tyr Val Ser Met Ala Ile His Asp Phe Glu Lys
65 70 75 80
Val Thr Ala Lys Leu Lys Arg Val Gln Glu Thr Glu Gly Glu Arg Arg
85 90 95
Leu Arg Arg Ile Thr Leu Asp Lys Ile Gln Gly Asp Ser Glu Thr Thr
100 105 110
Ser Gly Phe Thr Leu Ala Leu Val Val Asp Ile Asp Asn Thr Lys Ile
115 120 125
His Asp Thr Arg Ile Ile Glu Asn Glu Glu Glu Ala Phe Glu Ala Ser
130 135 140
Lys Arg Glu Trp Glu Ala Leu Lys Pro Lys Leu Gln Glu Leu Gly Phe
145 150 155 160
Leu Pro Arg Trp Ile Leu Tyr Thr Gly Gly Gly Leu Gln Leu Trp Phe
165 170 175
Val Ser Asp Lys Leu Glu Pro Ile Ser Val Ile Asp Arg Ala Ser Glu
180 185 190
Ile Ile Pro Asn Ile Met Asn Gly Leu Leu Ser Glu Gly Phe Lys Ala
195 200 205
Asp Asn Ile Phe Asp Pro Ala Arg Ile Val Arg Ala Pro Leu Thr Phe
210 215 220
Asn His Lys Tyr Arg Thr Pro Thr Gln Val Lys Gly Arg Val Ile Glu
225 230 235 240
Phe Asn Asp Val Arg Ile Ser Leu Thr Glu Phe Leu Asp Arg Leu Glu
245 250 255
Ala Tyr Ala Lys Glu Lys Gly Ile Pro Leu Glu Lys Pro Thr Lys Arg
260 265 270
Lys Phe Leu Glu Leu Ala Ser Lys Arg Tyr Glu Val Thr Ser
275 280 285
<210> 14
<211> 928
<212> PRT
<213> 热球菌属种CIR10
<220>
<223> 热球菌属种CIR10DNA引物酶
<400> 14
Met Ser Gly Arg Glu Phe Lys Arg Pro Ser Asp Val Ile Ile Asp Ile
1 5 10 15
Tyr Lys Val Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu
20 25 30
Phe Arg Phe Tyr Pro Tyr Pro Thr Ser Glu Trp Ile Leu Leu Asn Asp
35 40 45
Ile Glu Asp Lys Ala Arg Glu Ile Asp Lys Val Leu Phe Lys Asn Asn
50 55 60
Ile Leu Gly Lys Lys Glu Ala Tyr Ile Ser Met Ala Ile His Asp Phe
65 70 75 80
Asp Glu Val Thr Lys Lys Leu Glu Lys Leu Gln Glu Leu Glu His Glu
85 90 95
Lys Ala Gln Lys Glu Gly Arg Gln Pro Lys Glu Ile Thr Leu Arg His
100 105 110
Val Gln Gly Glu Ala Thr Gly Lys Ile His Thr Thr Val Ser Ser Tyr
115 120 125
Thr Leu Thr Leu Val Val Asp Ile Asp Val Asn Glu Ile His Asp Ser
130 135 140
Lys Ala Val Glu Ser Glu Glu Lys Ala Leu Glu Val Ser Lys Arg Ala
145 150 155 160
Trp Glu Val Leu Lys Pro Asn Leu Glu Glu Leu Gly Ile Lys Pro Arg
165 170 175
Tyr Val Phe Phe Thr Gly Gly Gly Ile Gln Leu Trp Phe Val Ala Pro
180 185 190
Glu Pro Glu Asn Ile Ser Val Ile Asp Lys Ala Ala Glu Ile Ile Pro
195 200 205
Pro Val Leu Asn Thr Leu Leu Pro Glu Gly Tyr Ser Val Asp Asn Ile
210 215 220
Phe Asp Arg Ala Arg Ile Val Arg Val Pro Phe Thr Val Asn Tyr Lys
225 230 235 240
Tyr Lys Thr Pro Asp Gly Lys Pro Leu Glu Leu Arg Gly Arg Leu Leu
245 250 255
Glu Phe Asn Asp Val Arg Thr Pro Leu Gly Asp Ile Leu Glu Lys Leu
260 265 270
Glu Ala Tyr Ala Lys Gly His Lys Ile Ser Leu Gly Ser Thr Ser Arg
275 280 285
Ser Gly Lys Phe Arg Gly Val Ala Gly Arg Tyr Glu Val Lys Lys Glu
290 295 300
Asn Phe Glu Glu Leu Ala Lys Arg Leu Val Glu Glu Leu Ala Pro Trp
305 310 315 320
Phe Lys Lys Ile Lys Glu Arg Gly Gly Ser Arg His His Leu Val Asn
325 330 335
Ala Ile Ala Ala Tyr Ile Ala Arg Asn Thr Asn Leu Thr Glu Glu Asp
340 345 350
Leu Leu Gly Lys Asp Gln Glu Asp Gly Thr His Val Val Gly Leu Trp
355 360 365
Glu Leu Val His Ser Lys Leu Val Glu Leu Gly Leu Glu Asp Pro Gly
370 375 380
Asp Trp Ser Asn Arg Tyr His Thr Ile Lys Asp Val Tyr Glu Lys Leu
385 390 395 400
Tyr Ala Gly Thr Thr Leu Gly Thr Arg Ala Tyr Met Met Lys Tyr Leu
405 410 415
Asn Val Ser Glu Glu Glu Ala Ile Glu Ile Leu Arg Ser Val Lys Arg
420 425 430
Ala Leu Phe Pro Tyr Leu His Pro Val Asn Val Gln Val Ile Ser Lys
435 440 445
Phe Glu Ala Lys Pro Tyr Ser Lys Glu Glu Ala Pro Thr Glu Trp Glu
450 455 460
Ala Val Asp Glu Asp Arg Lys Lys Ala Val Gly Ile Trp Tyr Ile Glu
465 470 475 480
Val Leu Ala Leu Glu Thr Ala Asn Tyr Val Tyr Ile Glu Asp Leu Ser
485 490 495
Lys Pro Gly Val Phe Tyr Ile Val Glu Lys Val Lys Arg Thr Val Lys
500 505 510
Val Gly Lys Lys Glu Lys Gly Val Glu Val Asp Glu Tyr His Phe Asn
515 520 525
Pro Ala Leu Trp Gln Ser Phe Leu Asn Trp Leu Gly Ile Lys Glu Gly
530 535 540
Glu Pro Ile Glu Arg Glu Glu Leu Trp Asn Leu Leu Leu Glu Lys Phe
545 550 555 560
Asp Ile Lys Asp Tyr Glu Leu Arg Ala Ile Tyr Phe Arg Lys Ile Leu
565 570 575
His Leu Leu Ser Pro Glu Gly Met Arg Arg Pro Arg Cys Val Glu Glu
580 585 590
Phe Leu Arg Glu Leu Ala Asp Glu Gly Phe Leu Ser Glu Asp Lys Val
595 600 605
Arg His Leu Ala His Trp Ile Lys Phe Tyr Ala Lys Pro Leu Arg His
610 615 620
Ser Thr Thr Ser Ile Met Leu Arg Ala Lys Gly Lys Pro Val Asp Met
625 630 635 640
Arg Met Ala Val Trp Ala Lys Val Val Glu Phe Phe Ala Glu Asp Glu
645 650 655
Glu Thr Ala Gln Gly Leu Ile Glu Thr Phe Arg Glu Ala Tyr Glu Gln
660 665 670
Ala Glu Pro Pro Phe Pro Cys Phe Gly Ala Arg Glu Cys Pro Phe Phe
675 680 685
Gln Glu His Arg Gly Cys Pro Phe Ile Ala Pro Lys Arg Asp Glu Ile
690 695 700
Leu Ala Val Ser Leu Val Asp Val Gln Leu His Gly Ser Asp Gly Ile
705 710 715 720
Val Ile Ile Val Gly Ser Glu Glu Gly Thr Lys Lys Phe Val His Lys
725 730 735
Gly Lys Val Glu Trp Gln Lys Gln Gly Lys Ser Lys Ile Lys Tyr Pro
740 745 750
Val Ala Glu Trp Phe Leu Asp Val Tyr Ala Lys Glu Phe Leu Ser Leu
755 760 765
Pro Glu Ala Pro Ser Trp Ser His Glu Glu Val Thr Glu Ile Leu Lys
770 775 780
Ser Arg Ala Arg Val Val Arg Ser Gln Leu Asn Glu Phe Asp Glu Tyr
785 790 795 800
Phe Asp Asn Phe Ile Asp Trp Leu Arg Ser Glu Asn Ala Arg Gly Ile
805 810 815
Tyr Pro Tyr Glu Lys Ala Asp Ser Ser His Ile Phe Ile Lys Gly Asn
820 825 830
Met Ile Gly Ile Pro Pro Arg Leu Ala Glu Asp Phe Tyr Arg Asn Glu
835 840 845
Leu Gly Ile Ser Gly Arg Lys Phe Lys Glu Met Leu Ile Arg Glu Leu
850 855 860
Gly Ser Tyr Tyr Leu Gly Lys Lys Ala Ala Trp Ile Lys Leu Ser Ser
865 870 875 880
Gly Gln His Asn Gly Val Asn Cys Tyr Phe Ile Ser Leu Asp Trp Phe
885 890 895
Lys Lys Ile Val Gly Glu Pro Asn Ile Lys Asp Ile Glu Ala Glu Gly
900 905 910
Asp Ile Gly Ser Gly Gly Phe Asn Tyr Glu Glu Glu Glu Gly Glu Ala
915 920 925
<210> 15
<211> 303
<212> PRT
<213> 人工序列
<220>
<223> PolpCIR10Δ303-928
<400> 15
Met Ser Gly Arg Glu Phe Lys Arg Pro Ser Asp Val Ile Ile Asp Ile
1 5 10 15
Tyr Lys Val Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu
20 25 30
Phe Arg Phe Tyr Pro Tyr Pro Thr Ser Glu Trp Ile Leu Leu Asn Asp
35 40 45
Ile Glu Asp Lys Ala Arg Glu Ile Asp Lys Val Leu Phe Lys Asn Asn
50 55 60
Ile Leu Gly Lys Lys Glu Ala Tyr Ile Ser Met Ala Ile His Asp Phe
65 70 75 80
Asp Glu Val Thr Lys Lys Leu Glu Lys Leu Gln Glu Leu Glu His Glu
85 90 95
Lys Ala Gln Lys Glu Gly Arg Gln Pro Lys Glu Ile Thr Leu Arg His
100 105 110
Val Gln Gly Glu Ala Thr Gly Lys Ile His Thr Thr Val Ser Ser Tyr
115 120 125
Thr Leu Thr Leu Val Val Asp Ile Asp Val Asn Glu Ile His Asp Ser
130 135 140
Lys Ala Val Glu Ser Glu Glu Lys Ala Leu Glu Val Ser Lys Arg Ala
145 150 155 160
Trp Glu Val Leu Lys Pro Asn Leu Glu Glu Leu Gly Ile Lys Pro Arg
165 170 175
Tyr Val Phe Phe Thr Gly Gly Gly Ile Gln Leu Trp Phe Val Ala Pro
180 185 190
Glu Pro Glu Asn Ile Ser Val Ile Asp Lys Ala Ala Glu Ile Ile Pro
195 200 205
Pro Val Leu Asn Thr Leu Leu Pro Glu Gly Tyr Ser Val Asp Asn Ile
210 215 220
Phe Asp Arg Ala Arg Ile Val Arg Val Pro Phe Thr Val Asn Tyr Lys
225 230 235 240
Tyr Lys Thr Pro Asp Gly Lys Pro Leu Glu Leu Arg Gly Arg Leu Leu
245 250 255
Glu Phe Asn Asp Val Arg Thr Pro Leu Gly Asp Ile Leu Glu Lys Leu
260 265 270
Glu Ala Tyr Ala Lys Gly His Lys Ile Ser Leu Gly Ser Thr Ser Arg
275 280 285
Ser Gly Lys Phe Arg Gly Val Ala Gly Arg Tyr Glu Val Lys Lys
290 295 300
<210> 16
<211> 297
<212> PRT
<213> 人工序列
<220>
<223> PolpCIR10Δ93-98Δ303-928
<400> 16
Met Ser Gly Arg Glu Phe Lys Arg Pro Ser Asp Val Ile Ile Asp Ile
1 5 10 15
Tyr Lys Val Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu
20 25 30
Phe Arg Phe Tyr Pro Tyr Pro Thr Ser Glu Trp Ile Leu Leu Asn Asp
35 40 45
Ile Glu Asp Lys Ala Arg Glu Ile Asp Lys Val Leu Phe Lys Asn Asn
50 55 60
Ile Leu Gly Lys Lys Glu Ala Tyr Ile Ser Met Ala Ile His Asp Phe
65 70 75 80
Asp Glu Val Thr Lys Lys Leu Glu Lys Leu Gln Glu Gln Lys Glu Gly
85 90 95
Arg Gln Pro Lys Glu Ile Thr Leu Arg His Val Gln Gly Glu Ala Thr
100 105 110
Gly Lys Ile His Thr Thr Val Ser Ser Tyr Thr Leu Thr Leu Val Val
115 120 125
Asp Ile Asp Val Asn Glu Ile His Asp Ser Lys Ala Val Glu Ser Glu
130 135 140
Glu Lys Ala Leu Glu Val Ser Lys Arg Ala Trp Glu Val Leu Lys Pro
145 150 155 160
Asn Leu Glu Glu Leu Gly Ile Lys Pro Arg Tyr Val Phe Phe Thr Gly
165 170 175
Gly Gly Ile Gln Leu Trp Phe Val Ala Pro Glu Pro Glu Asn Ile Ser
180 185 190
Val Ile Asp Lys Ala Ala Glu Ile Ile Pro Pro Val Leu Asn Thr Leu
195 200 205
Leu Pro Glu Gly Tyr Ser Val Asp Asn Ile Phe Asp Arg Ala Arg Ile
210 215 220
Val Arg Val Pro Phe Thr Val Asn Tyr Lys Tyr Lys Thr Pro Asp Gly
225 230 235 240
Lys Pro Leu Glu Leu Arg Gly Arg Leu Leu Glu Phe Asn Asp Val Arg
245 250 255
Thr Pro Leu Gly Asp Ile Leu Glu Lys Leu Glu Ala Tyr Ala Lys Gly
260 265 270
His Lys Ile Ser Leu Gly Ser Thr Ser Arg Ser Gly Lys Phe Arg Gly
275 280 285
Val Ala Gly Arg Tyr Glu Val Lys Lys
290 295
<210> 17
<211> 914
<212> PRT
<213> 嗜胨热球菌(Thermococcus peptonophilus)
<220>
<223> 嗜胨热球菌DNA引物酶
<400> 17
Met Ser Glu Leu Thr Pro Gly Lys Val Leu Ala Asp Val Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu Leu Arg Phe
20 25 30
Tyr Pro Val Ile Lys Ser Glu Trp Val Leu Leu Asn Asp Ile Glu Asp
35 40 45
Lys Ala Arg Asp Ile Asp Lys Val Leu Ala Lys Gln Asn Leu Ile Lys
50 55 60
Gly Lys Glu Ala Tyr Val Ser Met Ala Ile His Gly Phe Glu Ala Val
65 70 75 80
Lys Lys Lys Leu Glu Lys Leu Arg Glu Ser Val Glu Glu Gly Lys Val
85 90 95
Arg Lys Leu Gly Leu Glu Asn Val Gln Gly Glu Ala Lys Gly Lys Val
100 105 110
His Pro Thr Val Ser Asn Tyr Thr Leu Thr Leu Val Val Asp Val Asp
115 120 125
Ile Glu Ala Val His Lys Leu Lys Val Val Glu Asp Val Asp Lys Val
130 135 140
Phe Glu Lys Ala Lys Glu Gly Trp Leu Ala Leu Lys Pro Val Phe Glu
145 150 155 160
Glu Leu Gly Val Leu Pro Arg Tyr Val Phe Phe Thr Gly Gly Gly Leu
165 170 175
Gln Leu Trp Phe Val Ala Pro Lys Leu Glu Asp Ile Ala Val Ile Asp
180 185 190
Arg Ala Ser Gly Ile Val Pro Asn Val Leu Asn Ala Leu Leu Pro Glu
195 200 205
Gly Phe Val Val Asp Asn Ile Phe Asp Arg Ala Arg Ile Val Arg Ala
210 215 220
Pro Leu Thr Val Asn His Lys Tyr Lys Ala Pro Asn Gly Ala Arg Val
225 230 235 240
Gly Val Lys Gly Arg Leu Ile Glu Phe Asn Asp Val Arg Val Ser Leu
245 250 255
Ser Glu Val Leu Asp Lys Leu Glu Val Tyr Ala Lys Glu Arg Gly Ile
260 265 270
Gln Leu Gly Gly Gln Glu Lys Val Arg Gly Gly Arg Gly Phe Val Asn
275 280 285
Val Arg Tyr Val Val Lys Lys Glu Glu Leu Glu Thr Leu Ala Leu Asn
290 295 300
Leu Ala Asp Glu Leu Ile Pro Trp Phe Lys Lys Val Lys Glu Arg Gly
305 310 315 320
Gly Ser Trp His His Leu Val Asn Ala Ile Gly Ala Tyr Val Val Arg
325 330 335
Asn Thr Asn Leu Ser Leu Glu Asp Leu Ile Gly Lys Asp Asn Pro Asp
340 345 350
Gly Thr His Val Val Gly Leu Trp Glu Ile Val Phe Gln Arg Leu Val
355 360 365
Glu Lys Ser Ala Glu Asp Pro Gly Asp Trp Val Asn Arg Arg Asn Thr
370 375 380
Ile Lys Asp Val Tyr Glu Lys His Ile Ala Gly Lys Pro Leu Gly Thr
385 390 395 400
Arg Ala Tyr Leu Lys Lys Tyr Leu Pro Val Ser Asp Glu Glu Val Val
405 410 415
Glu Ile Leu Met Ala Val Arg Arg Ala Leu Leu Pro Phe Leu Lys Glu
420 425 430
Val Lys Lys Val Asp Ser Ser Gly Phe Gly Val Ala Pro Tyr Lys Lys
435 440 445
Thr Ala Pro Arg Ser Trp Asp Glu Val Asp Glu Asp Arg Lys Arg Ala
450 455 460
Thr Gly Arg Trp Tyr Val Trp Lys Leu Ala Phe Asn Thr Ala Glu Tyr
465 470 475 480
Leu Phe Thr Asp Glu Leu Pro Lys Ala Gly Thr Phe Tyr Ile Asp Val
485 490 495
Trp Met Lys Glu Gly Lys Arg Glu Trp Met Lys Arg Phe Phe Asn Glu
500 505 510
Ala Leu Phe Arg Ser Phe Ile Glu Asp Gly Leu Gly Tyr Lys Tyr Gly
515 520 525
Ala Pro Val Glu Arg Glu Glu Leu Phe Glu Arg Leu Val Glu Val Phe
530 535 540
Asn Ile Thr Asp Glu Glu Val Arg Gly Ile Tyr Ile Asp Ala Ala Leu
545 550 555 560
Ser Leu Leu Ser Pro Val Gly Met Arg Thr Pro Pro Cys Ile Glu Glu
565 570 575
Phe Ile Met Glu Phe Ala Ala Asn Gly Ser Leu Ser Glu Asp Lys Val
580 585 590
Arg His Leu Ala Arg Trp Ile Lys Leu Tyr Ala Lys Pro Leu Lys His
595 600 605
Ser Thr Thr Thr Thr Lys Leu Val Gly Ala Gly Tyr Lys Val Asp Met
610 615 620
Arg Met Ala Val Trp Ala Lys Leu Val Glu Phe Phe Ala Glu Asp Asp
625 630 635 640
Glu Val Ala Arg Glu Leu Val Arg Val Phe Lys Glu Glu Tyr Gly Ala
645 650 655
Ala Glu Pro Pro Phe Thr Cys Ile Gly Thr Lys Thr Cys Gln Phe Tyr
660 665 670
Leu Asn Glu Lys Met Cys Pro Phe Ile Ile Pro Lys Glu Lys Glu Ile
675 680 685
Leu Ala Val Ser Leu Ile Asp Val Gln Arg His Glu Ser Asp Gly Leu
690 695 700
Val Val Ile Val Gly Gly Asp Lys Glu Val Arg Thr Phe Val Lys Lys
705 710 715 720
Gly Asn Val Glu Trp Val Lys Lys Thr Glu Arg Arg Glu Lys Tyr Pro
725 730 735
Val Ala Glu Trp Phe Ile Asp Val Phe Ala Thr Glu Tyr Leu Ser Val
740 745 750
Ser Pro Asp Asp Leu Asp Val Asp Leu Glu Glu Val Thr Asp Ile Leu
755 760 765
Lys Ser Arg Ala Arg Val Val Lys Ser Arg Leu Asn Glu Leu Glu Asp
770 775 780
Met Tyr Glu Lys Phe Val Glu Trp Leu Lys Arg Glu Asn Ala Val Arg
785 790 795 800
Gly Val Leu Pro Tyr Glu Lys Ala Asp Phe Asn His Leu Phe Ile Lys
805 810 815
Gly Asn Met Ile Gly Ile Pro Pro Ala Leu Ala Glu Glu Phe Tyr Arg
820 825 830
Phe Glu Leu Asn Ile Lys Gly Ser Glu Phe Arg Glu Met Leu Glu Lys
835 840 845
Lys Leu Gly Phe His Tyr Thr Lys Lys Ala Val Lys Leu Ser Val Gly
850 855 860
Glu Lys Lys Asp Val Arg Arg Cys Tyr Leu Val Ser Leu Glu Trp Phe
865 870 875 880
Arg Lys Val Val Gly Glu Pro Asn Val Lys Asp Val Val Met Ala Gly
885 890 895
Asp Ile Ala Leu Ser Gly Leu Val Tyr Tyr Glu Ser Gly Glu Glu Val
900 905 910
Val Glu
<210> 18
<211> 295
<212> PRT
<213> 人工序列
<220>
<223> PolpTpepΔ295-914
<400> 18
Met Ser Glu Leu Thr Pro Gly Lys Val Leu Ala Asp Val Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu Leu Arg Phe
20 25 30
Tyr Pro Val Ile Lys Ser Glu Trp Val Leu Leu Asn Asp Ile Glu Asp
35 40 45
Lys Ala Arg Asp Ile Asp Lys Val Leu Ala Lys Gln Asn Leu Ile Lys
50 55 60
Gly Lys Glu Ala Tyr Val Ser Met Ala Ile His Gly Phe Glu Ala Val
65 70 75 80
Lys Lys Lys Leu Glu Lys Leu Arg Glu Ser Val Glu Glu Gly Lys Val
85 90 95
Arg Lys Leu Gly Leu Glu Asn Val Gln Gly Glu Ala Lys Gly Lys Val
100 105 110
His Pro Thr Val Ser Asn Tyr Thr Leu Thr Leu Val Val Asp Val Asp
115 120 125
Ile Glu Ala Val His Lys Leu Lys Val Val Glu Asp Val Asp Lys Val
130 135 140
Phe Glu Lys Ala Lys Glu Gly Trp Leu Ala Leu Lys Pro Val Phe Glu
145 150 155 160
Glu Leu Gly Val Leu Pro Arg Tyr Val Phe Phe Thr Gly Gly Gly Leu
165 170 175
Gln Leu Trp Phe Val Ala Pro Lys Leu Glu Asp Ile Ala Val Ile Asp
180 185 190
Arg Ala Ser Gly Ile Val Pro Asn Val Leu Asn Ala Leu Leu Pro Glu
195 200 205
Gly Phe Val Val Asp Asn Ile Phe Asp Arg Ala Arg Ile Val Arg Ala
210 215 220
Pro Leu Thr Val Asn His Lys Tyr Lys Ala Pro Asn Gly Ala Arg Val
225 230 235 240
Gly Val Lys Gly Arg Leu Ile Glu Phe Asn Asp Val Arg Val Ser Leu
245 250 255
Ser Glu Val Leu Asp Lys Leu Glu Val Tyr Ala Lys Glu Arg Gly Ile
260 265 270
Gln Leu Gly Gly Gln Glu Lys Val Arg Gly Gly Arg Gly Phe Val Asn
275 280 285
Val Arg Tyr Val Val Lys Lys
290 295
<210> 19
<211> 913
<212> PRT
<213> 芹菜热球菌(Thermococcus celericrescens)
<220>
<223> 芹菜热球菌DNA引物酶
<400> 19
Met Ser Glu Leu Thr Pro Gly Lys Val Leu Ala Asp Val Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu Leu Arg Phe
20 25 30
Tyr Pro Val Ile Lys Ser Glu Trp Val Leu Leu Asn Asp Ile Glu Asp
35 40 45
Lys Ala Arg Asp Ile Asp Lys Val Leu Ala Lys Lys Asn Ile Ile Asn
50 55 60
Gly Lys Glu Ala Tyr Val Ser Met Ala Ile His Asp Phe Gly Ala Val
65 70 75 80
Lys Lys Lys Leu Glu Lys Leu Arg Glu Lys Ala Glu Gly Glu Arg Ala
85 90 95
Arg Arg Ile Gly Leu Glu Asn Val Gln Gly Glu Ala Lys Gly Lys Val
100 105 110
His Pro Thr Val Ser Asn Tyr Thr Leu Ala Leu Val Val Asp Ile Asp
115 120 125
Ile Glu Glu Val His Lys Ser Arg Val Val Glu Asp Val Glu Ala Val
130 135 140
Phe Glu Arg Ala Lys Lys Gly Trp Leu Ala Leu Arg Pro Val Phe Glu
145 150 155 160
Glu Leu Gly Val Leu Pro Arg Tyr Val Phe Phe Thr Gly Gly Gly Leu
165 170 175
Gln Ile Trp Phe Val Ala Pro Glu Leu Glu Asp Ile Ala Val Ile Asp
180 185 190
Arg Ala Ser Gly Ile Val Pro Gly Val Leu Asn Ala Leu Leu Pro Glu
195 200 205
Gly Phe Val Val Asp Asn Ile Phe Asp Arg Ala Arg Ile Val Arg Ala
210 215 220
Pro Leu Thr Val Asn His Lys Tyr Lys Ala Pro Asn Gly Ala Gly Leu
225 230 235 240
Gly Val Lys Gly Arg Leu Ile Glu Phe Asn Asp Val Arg Val Ser Leu
245 250 255
Ser Glu Val Leu Asp Lys Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile
260 265 270
Gln Leu Gly Gly Gln Glu Arg Ala Ser Gly Val Arg Val Phe Gly Lys
275 280 285
Val Arg Tyr Glu Val Lys Lys Glu Arg Leu Glu Thr Leu Ala Leu Asn
290 295 300
Leu Ala Asp Glu Leu Ala Pro Trp Phe Lys Lys Val Lys Glu Arg Gly
305 310 315 320
Gly Ser Trp His His Leu Val Asn Ala Ile Gly Ala Tyr Ile Val Arg
325 330 335
Asn Thr Asn Leu Ser Leu Glu Asp Leu Ile Gly Lys Asp Asn Pro Asp
340 345 350
Gly Thr His Val Val Gly Leu Trp Glu Leu Val Phe Gln Arg Leu Val
355 360 365
Glu Lys Gly Ala Glu Asp Pro Ser Asp Trp Leu Asn Arg Arg Asn Thr
370 375 380
Ile Lys Asp Val Tyr Glu Lys His Ile Ala Gly Lys Pro Leu Gly Thr
385 390 395 400
Arg Ala Tyr Leu Lys Lys Tyr Leu Pro Val Ser Asp Glu Glu Val Val
405 410 415
Glu Ile Leu Met Ala Ala Arg Arg Ala Leu Leu Pro Phe Leu Lys Gly
420 425 430
Val Lys Arg Ala Gly Ser Ser Gly Phe Gly Val Phe Pro Tyr Lys Asp
435 440 445
Thr Ala Pro Arg Ser Trp Asn Glu Val Glu Ala Glu Arg Lys Arg Ala
450 455 460
Thr Gly Leu Trp Tyr Val Trp Ser Leu Ala Phe Ser Thr Ala Glu Tyr
465 470 475 480
Ile Phe Thr Asp Glu Leu Ser Lys Ala Gly Thr Phe Phe Ile Leu Val
485 490 495
Lys Glu Gly Lys Ser Ile Lys Ser Val Phe Asn Glu Thr Leu Phe Arg
500 505 510
Ser Phe Ile Glu Glu Gly Leu Gly Tyr Lys Tyr Gly Met Pro Val Arg
515 520 525
Arg Asp Glu Leu Phe Glu Arg Leu Val Glu Val Phe Asn Ile Thr Asp
530 535 540
Glu Glu Val Arg Gly Val Tyr Ile Asp Ala Ala Leu Ser Leu Leu Ser
545 550 555 560
Pro Val Gly Met Arg Thr Pro Pro Cys Ile Glu Glu Phe Ile Met Glu
565 570 575
Phe Ala Ala Asn Gly Asn Leu Pro Glu Asp Lys Val Arg His Leu Ala
580 585 590
Arg Trp Ile Lys Leu Tyr Ala Lys Pro Leu Lys His Ser Thr Thr Thr
595 600 605
Thr Lys Leu Val Gly Ala Gly Tyr Asn Val Asp Met Arg Met Ala Val
610 615 620
Trp Ala Lys Leu Val Glu Phe Phe Ala Glu Asp Asp Glu Val Ala Gly
625 630 635 640
Glu Leu Val Arg Ile Phe Lys Glu Glu Tyr Lys Glu Ala Glu Pro Pro
645 650 655
Phe Thr Cys Ile Gly Ala Arg Thr Cys Pro Phe Tyr Leu Lys Asp Asp
660 665 670
Val Ala Lys Met Cys Pro Phe Ile Phe Pro Lys Glu Lys Glu Ile Leu
675 680 685
Ala Val Ser Leu Ile Asp Val Gln Arg His Glu Ser Asp Gly Ile Val
690 695 700
Ile Leu Val Gly Gly Ala Arg Glu Val Arg Thr Phe Ile Lys Lys Gly
705 710 715 720
Lys Val Glu Trp Val Lys Arg Thr Lys Lys Thr Glu Lys Tyr Pro Ile
725 730 735
Ala Glu Trp Phe Ile Asp Val Phe Ala Thr Glu Tyr Leu Gly Val Pro
740 745 750
Pro Asp Asn Leu Asp Phe Asp Leu Lys Asp Val Thr Gly Ile Leu Lys
755 760 765
Ser Arg Glu Arg Val Val Pro Ser Gln Leu Asn Glu Val Glu Asp Trp
770 775 780
Tyr Glu Lys Phe Val Glu Trp Leu Lys Arg Glu Asn Glu Val Arg Gly
785 790 795 800
Val Leu Pro Tyr Lys Lys Ala Asp Val His His Leu Phe Ile Lys Asp
805 810 815
Asn Met Ile Gly Ile Pro Pro Ala Leu Ala Glu Glu Phe Tyr Arg Tyr
820 825 830
Glu Ala Asn Ile Lys Pro Ser Glu Phe Arg Glu Met Leu Glu Val Lys
835 840 845
Leu Ser Ile His Tyr Lys Lys Lys Ala Val Lys Leu Ser Val Gly Glu
850 855 860
Lys Lys Asp Val Arg Arg Cys Tyr Leu Val Ser Leu Glu Trp Phe Arg
865 870 875 880
Lys Val Val Gly Glu Pro Asn Val Lys Asp Val Val Met Ala Gly Asp
885 890 895
Ile Ala Leu Ser Gly Leu Val Tyr Tyr Glu Ser Gly Glu Glu Val Val
900 905 910
Glu
<210> 20
<211> 295
<212> PRT
<213> 人工序列
<220>
<223> PolpTceleΔ295-913
<400> 20
Met Ser Glu Leu Thr Pro Gly Lys Val Leu Ala Asp Val Tyr Lys Val
1 5 10 15
Ile Gln Asp His Pro Glu Ala Gly Arg Leu Ala Ile Glu Leu Arg Phe
20 25 30
Tyr Pro Val Ile Lys Ser Glu Trp Val Leu Leu Asn Asp Ile Glu Asp
35 40 45
Lys Ala Arg Asp Ile Asp Lys Val Leu Ala Lys Lys Asn Ile Ile Asn
50 55 60
Gly Lys Glu Ala Tyr Val Ser Met Ala Ile His Asp Phe Gly Ala Val
65 70 75 80
Lys Lys Lys Leu Glu Lys Leu Arg Glu Lys Ala Glu Gly Glu Arg Ala
85 90 95
Arg Arg Ile Gly Leu Glu Asn Val Gln Gly Glu Ala Lys Gly Lys Val
100 105 110
His Pro Thr Val Ser Asn Tyr Thr Leu Ala Leu Val Val Asp Ile Asp
115 120 125
Ile Glu Glu Val His Lys Ser Arg Val Val Glu Asp Val Glu Ala Val
130 135 140
Phe Glu Arg Ala Lys Lys Gly Trp Leu Ala Leu Arg Pro Val Phe Glu
145 150 155 160
Glu Leu Gly Val Leu Pro Arg Tyr Val Phe Phe Thr Gly Gly Gly Leu
165 170 175
Gln Ile Trp Phe Val Ala Pro Glu Leu Glu Asp Ile Ala Val Ile Asp
180 185 190
Arg Ala Ser Gly Ile Val Pro Gly Val Leu Asn Ala Leu Leu Pro Glu
195 200 205
Gly Phe Val Val Asp Asn Ile Phe Asp Arg Ala Arg Ile Val Arg Ala
210 215 220
Pro Leu Thr Val Asn His Lys Tyr Lys Ala Pro Asn Gly Ala Gly Leu
225 230 235 240
Gly Val Lys Gly Arg Leu Ile Glu Phe Asn Asp Val Arg Val Ser Leu
245 250 255
Ser Glu Val Leu Asp Lys Leu Glu Ala Tyr Ala Lys Glu Lys Gly Ile
260 265 270
Gln Leu Gly Gly Gln Glu Arg Ala Ser Gly Val Arg Val Phe Gly Lys
275 280 285
Val Arg Tyr Glu Val Lys Lys
290 295
<210> 21
<211> 296
<212> PRT
<213> 人工序列
<220>
<223> PolpP12Δ297-898
<400> 21
Met Arg Pro Ser Asp Ile Ile Ile Asp Val Tyr Lys Ala Ile Gln Asp
1 5 10 15
His Pro Gly Ala Gly Lys Leu Ala Ile Glu Leu Arg Phe Tyr Pro Arg
20 25 30
Pro Thr Ser Glu Trp Ile Ile Val Ala Asp Ile Glu Asp Lys Ala Glu
35 40 45
Glu Leu His Lys Val Leu Phe Lys Asn Asn Val Leu Gly Lys Lys Glu
50 55 60
Ala Tyr Ile Ser Met Ala Leu His Asp Phe Glu Glu Val Gly Lys Lys
65 70 75 80
Leu Glu Lys Leu Arg Glu Leu Glu Glu Glu Arg Ala Gln Lys Glu Gly
85 90 95
Arg Lys Pro Arg Glu Val Thr Leu Arg Asn Val Gln Gly Glu Ala Thr
100 105 110
Gly Lys Val His Lys Thr Val Ser Lys Tyr Thr Leu Thr Leu Val Val
115 120 125
Asp Ile Asp Val Glu Glu Ile His Lys Ser Lys Val Val Glu Ser Glu
130 135 140
Glu Lys Ala Phe Glu Leu Ala Lys Arg Ala Trp Asp Glu Leu Lys Pro
145 150 155 160
Lys Leu Glu Gly Ile Gly Val Lys Pro Arg Tyr Val Phe Phe Thr Gly
165 170 175
Gly Gly Val Gln Leu Trp Phe Val Ala Pro Gly Leu Glu Pro Ile Glu
180 185 190
Val Ile Asp Arg Ala Ser Arg Val Ile Pro Pro Val Leu Asn Ala Met
195 200 205
Leu Pro Glu Gly Tyr Ser Val Asp Asn Ile Phe Asp Arg Ala Arg Ile
210 215 220
Val Arg Val Pro Leu Thr Ile Asn Tyr Lys Tyr Lys Thr Pro Asp Glu
225 230 235 240
Arg Pro Leu Glu Ile Arg Gly Arg Leu Ile Glu Phe Asn Asp Val Arg
245 250 255
Thr Pro Leu Gly Glu Val Leu Asp Lys Leu Glu Ala Tyr Ala Lys Glu
260 265 270
His Gly Ile Ser Leu Val Thr Pro Ser Gln Ala Arg Phe Ile Gly Thr
275 280 285
Val Gly Arg Tyr Glu Val Asp Lys
290 295

Claims (21)

1.一种从头开始的单链核酸的合成方法,所述方法包括在存在属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域或其功能活性变体的情况下,使核苷酸的游离3’-羟基与至少一种核苷三磷酸或核苷三磷酸的组合接触,从而使所述核苷三磷酸共价结合到所述核苷酸的游离3’-羟基;所述功能活性变体具有能够从头开始的单链核酸合成活性和不依赖于模板的末端核苷酸转移酶活性二者。
2.根据权利要求1所述的方法,其中所述古细菌DNA引物酶或其功能活性变体来自热球菌(Thermococcus)属的古细菌。
3.根据权利要求1或2所述的方法,其中所述属于引物酶-聚合酶家族的古细菌DNA引物酶或其功能活性变体选自鹦鹉螺热球菌种(Thermococcusnautilisp.)30-1DNA引物酶、热球菌属种(Thermococcussp.)CIR10DNA引物酶、嗜胨热球菌(Thermococcuspeptonophilus)DNA引物酶以及芹菜热球菌(Thermococcuscelericrescens)DNA引物酶。
4.根据权利要求1至3中任一项所述的方法,其中所述属于引物酶-聚合酶家族的古细菌DNA引物酶或其功能活性变体是:
-鹦鹉螺热球菌种30-1DNA引物酶,其具有SEQ ID NO:1的氨基酸序列;
-热球菌属种CIR10DNA引物酶,其具有SEQ ID NO:14的氨基酸序列;
-嗜胨热球菌DNA引物酶,其具有SEQ ID NO:17的氨基酸序列;或
-芹菜热球菌DNA引物酶,其具有SEQ ID NO:19的氨基酸序列。
5.根据权利要求1至4中任一项所述的方法,其中所述属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域是:
-鹦鹉螺热球菌种30-1DNA引物酶的引物酶结构域,其具有SEQ IDNO:2至13中的任意一个氨基酸序列;或
-热球菌属种CIR10DNA引物酶的引物酶结构域,其具有SEQ ID NO:15或16的氨基酸序列;或
-嗜胨热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:18的氨基酸序列;或
-芹菜热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:20的氨基酸序列;
或其功能活性片段和/或变体,所述功能活性片段和/或变体
-与SEQ ID NO:2至13、15、16、18或20中任一个氨基酸序列具有至少70%的序列同一性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性;并且
-具有能够从头开始的单链核酸合成活性。
6.根据权利要求1至5中任一项所述的方法,其中所述属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域是:
-鹦鹉螺热球菌种30-1DNA引物酶的引物酶结构域,其具有SEQ IDNO:2至5中任一个氨基酸序列;或
-热球菌属种CIR10DNA引物酶的引物酶结构域,其具有SEQ ID NO:15的氨基酸序列;或
-嗜胨热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:18的氨基酸序列;或
-芹菜热球菌DNA引物酶的引物酶结构域,其具有SEQ ID NO:20的氨基酸序列;
或其功能活性片段和/或变体,所述功能活性片段和/或变体
-与所述氨基酸序列具有至少70%的序列同一性;并且
-具有能够从头开始的单链核酸合成活性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性。
7.根据权利要求1至6中任一项所述的方法,其中所述核苷酸被固定在支持物上。
8.根据权利要求1至7中任一项所述的方法,其中所述从头开始的单链核酸合成在约60℃至约95℃的温度范围内进行。
9.根据权利要求1至8中任一项所述的方法,其中所述方法用于从头合成具有随机核苷酸序列的核酸,并且所述至少一种核苷三磷酸不包括终止核苷三磷酸。
10.根据权利要求1至8中任一项所述的方法,其中所述方法用于从头开始的序列受控的核酸合成,所述至少一种核苷三磷酸为包含可逆3'-阻断基团的终止核苷三磷酸。
11.根据权利要求10所述的方法,所述方法包括以下步骤:
a)提供具有游离3’-羟基的核苷酸;
b)在属于引物酶-聚合酶家族的古细菌DNA引物酶的引物酶结构域或其功能活性片段和/或变体存在下,使所述核苷酸与终止核苷三磷酸接触,从而使所述终止核苷三磷酸共价结合至所述核苷酸的游离3’-羟基;
c)使用洗涤溶液去除所有试剂,尤其是去除未结合的终止核苷三磷酸;
d)在裂解剂存在下,裂解共价结合的终止核苷三磷酸的可逆3’-阻断基团,从而得到具有游离3’-羟基的核苷酸;
e)任选地,使用洗涤溶液去除所有试剂,特别是去除裂解剂;
f)任选地,多次反复步骤b)至e)以合成所述核酸,直至所需长度和核苷酸序列。
12.根据权利要求1至11中任一项所述的方法,其中所述方法用于净化终止核苷三磷酸库中的包含游离3’-羟基的污染核苷三磷酸。
13.一种古细菌DNA引物酶的分离的功能活性片段,由SEQ ID NO:3至13、15、16、18或20中任一个氨基酸序列或其功能活性片段和/或变体组成,所述功能活性片段和/或变体:
-与所述氨基酸序列具有至少70%的序列同一性;并且
-具有能够从头开始的单链核酸合成活性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性。
14.根据权利要求13所述的古细菌DNA引物酶或其变体的分离的功能活性片段,其由SEQ ID NO:3至13、15、16、18或20中任一个氨基酸序列组成。
15.根据权利要求13所述的古细菌DNA引物酶或其变体的分离的功能活性片段,其由SEQ ID NO:3至5、15、18或20中任一个氨基酸序列或其功能活性片段和/或变体组成,所述功能活性片段和/或变体:
-与所述氨基酸序列具有至少70%的序列同一性;并且
-具有能够从头开始的单链核酸合成活性;并且
-具有能够不依赖于模板的末端核苷酸转移酶活性。
16.根据权利要求13或15所述的古细菌DNA引物酶或其变体的分离的功能活性片段,其由SEQ ID NO:3至13、15、16、18或20中任一个氨基酸序列组成。
17.一种核酸,其编码权利要求13至16中任一项所述的古细菌DNA引物酶的功能活性片段。
18.一种表达载体,其包含权利要求17所述的核酸,所述核酸可操作地连接至调节元件,优选连接至启动子。
19.一种宿主细胞,其包含权利要求18所述的表达载体。
20.一种产生权利要求13至16中任一项所述的古细菌DNA引物酶的功能活性片段的方法,所述方法包括:
(a)在适合表达古细菌DNA引物酶或其变体的所述功能活性片段的条件下,培养权利要求19所述的宿主细胞;
(b)从所述宿主细胞中分离所述古细菌DNA引物酶或其变体的所述功能活性片段。
21.一种试剂盒,包括:
-具有游离3’-羟基的核苷酸,其任选地固定在支持物上;
-至少一种核苷三磷酸,任选地,其中所述至少一种核苷三磷酸是包含可逆3’-阻断基团的终止核苷三磷酸;
-权利要求13至16中任一项所述的古细菌DNA引物酶的分离的功能活性片段。
CN202180055846.3A 2020-06-12 2021-06-11 使用热稳定性酶从头开始的不依赖于模板的核酸合成 Pending CN116249782A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063038168P 2020-06-12 2020-06-12
US63/038,168 2020-06-12
EP20305904.3 2020-08-06
EP20305904 2020-08-06
PCT/EP2021/065859 WO2021250265A2 (en) 2020-06-12 2021-06-11 Ab-initio, template-independent synthesis of nucleic acids using thermostable enzymes

Publications (1)

Publication Number Publication Date
CN116249782A true CN116249782A (zh) 2023-06-09

Family

ID=76355522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180055846.3A Pending CN116249782A (zh) 2020-06-12 2021-06-11 使用热稳定性酶从头开始的不依赖于模板的核酸合成

Country Status (5)

Country Link
US (1) US20230235372A1 (zh)
EP (1) EP4165175A2 (zh)
KR (1) KR20230078992A (zh)
CN (1) CN116249782A (zh)
WO (1) WO2021250265A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023111180A1 (en) 2021-12-15 2023-06-22 Quantoom Biosciences France Sas Variants of thermostable dna primases and uses thereof

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006081623A1 (en) 2005-02-04 2006-08-10 The Australian National University Double-stranded oligonucleotides and uses therefor
US8034923B1 (en) 2009-03-27 2011-10-11 Steven Albert Benner Reagents for reversibly terminating primer extension
EP2357225A1 (en) 2010-02-11 2011-08-17 Institut Pasteur Thermostable primase/DNA polymerase of the Thermococcus nautilus 30/1 plasmid pTN2 and its applications
FR3052462A1 (fr) 2016-06-14 2017-12-15 Dna Script Variants d'une adn polymerase de la famille polx
WO2018102554A1 (en) 2016-12-01 2018-06-07 President And Fellows Of Harvard College Cleavable nucleotide analogs and uses thereof
WO2018102818A1 (en) * 2016-12-02 2018-06-07 President And Fellows Of Harvard College Processive template independent dna polymerase variants
US20190323050A1 (en) * 2016-12-21 2019-10-24 President And Fellows Of Harvard College Modulation of Enzymatic Polynucleotide Synthesis Using Chelated Divalent Cations
WO2019051250A1 (en) * 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION

Also Published As

Publication number Publication date
WO2021250265A3 (en) 2022-03-17
US20230235372A1 (en) 2023-07-27
EP4165175A2 (en) 2023-04-19
WO2021250265A2 (en) 2021-12-16
KR20230078992A (ko) 2023-06-05

Similar Documents

Publication Publication Date Title
EP3036359B1 (en) Next-generation sequencing libraries
CN108018270B (zh) 用以提升核苷酸类似物并入的重组dna聚合酶
EP2396426B1 (en) Method of amplification of gc-rich dna templates
JP2021118748A (ja) ポリメラーゼ酵素
JP2024028959A (ja) 不連続な複数の鋳型から相補的DNA(cDNA)を順序だてて連続的に合成するための組成物およびその方法
CN116249782A (zh) 使用热稳定性酶从头开始的不依赖于模板的核酸合成
JP2011507549A (ja) 迅速超長鎖pcrのための単一酵素系
CN116249783A (zh) 使用热稳定酶的受控且不依赖于模板的核酸合成
EP1624059A2 (en) Method of producing nucleic acid molecules with reduced secondary structure
CN110446791B (zh) 多核苷酸衔接子及其使用方法
CN115427559A (zh) 末端脱氧核苷酸转移酶变体及其用途
US9428737B1 (en) Taq polymerase sequences useful for incorporating analogs of nucleoside triphosphates
WO2023111180A1 (en) Variants of thermostable dna primases and uses thereof
US12031179B2 (en) Methods and compositions for reducing nucleotide impurities
US11773380B1 (en) Polymerase mutants and use with 3′-OH unblocked reversible terminators
US20220136048A1 (en) Methods and compositions for reducing nucleotide impurities
Olejnik et al. Polymerase enzyme from 9 N
KR20240082374A (ko) 주형 독립적 효소성 핵산 합성을 위한 중합효소 변이체 및 이를 포함하는 키트
WO2024059719A2 (en) Compositions for preventing repetitive addition of switching oligonucleotides and nonspecific primer extension during cdna synthesis and methods of use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination