CN117881790A - 用于酶促核酸合成的用途和方法 - Google Patents

用于酶促核酸合成的用途和方法 Download PDF

Info

Publication number
CN117881790A
CN117881790A CN202280047599.7A CN202280047599A CN117881790A CN 117881790 A CN117881790 A CN 117881790A CN 202280047599 A CN202280047599 A CN 202280047599A CN 117881790 A CN117881790 A CN 117881790A
Authority
CN
China
Prior art keywords
leu
lys
glu
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280047599.7A
Other languages
English (en)
Inventor
丹尼尔·奥尔森
东昕·卡伦·徐
萨布里纳·巴弗特
赫尔格·齐勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primrose Biotech
Original Assignee
Primrose Biotech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primrose Biotech filed Critical Primrose Biotech
Publication of CN117881790A publication Critical patent/CN117881790A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)

Abstract

本公开描述了可用于核酸的不依赖模板的酶促合成的组合物和方法。

Description

用于酶促核酸合成的用途和方法
政府许可权
本发明在由美国国立卫生研究院授予的授予编号1R43HG010995-01A1和唯一联邦授予识别号(FAIN)R43HG010995的政府支持下完成。政府对本发明享有一定的权利。
并入序列表
电子提交的大小为约173KB的ASCII文本文件(PG0020序列表修订版10-28-21_ST25.txt)中的序列表的内容创建于2021年10月28日,并且于2022年6月13日通过ePCT电子提交。
背景技术
化学寡核苷酸合成(COS)是目前产生合成DNA和RNA的方法,已有近40年的历史,并且在领域诸如功能基因组学、合成生物学、基于DNA的数据存储和依赖快速且低成本DNA合成的医学应用的新发现已受到限制。在过去的二十五年里,COS的成本仅改善了20x(参见,例如,生物经济资本网站上生物经济主页显示的数据),并且尚未跟上对合成DNA不断增长的需求。此外,COS受限于具有高达或约200个核苷酸的核酸链,并且需要采用复杂设备和生产工艺的大型集中设施。对合成核酸的快速增长的需求需要能够递送长核酸分子的新型快速且低成本的合成路线。由于自然界中有丰富的DNA和RNA聚合酶,所以酶促核酸合成路线受到广泛关注。
酶促寡核苷酸合成(EOS)已被各种商业团体追求了数年(Efcavitch 2016,Hiatt1995,Hiatt 1995a),最近获得令人兴奋的发现和进展(Palluk 2018,Perkel 2019,Hoff2020,Lee 2020)。此类策略可以旨在制备RNA或DNA寡核苷酸,或RNA-DNA嵌合体。
大多数EOS策略使用末端脱氧核苷酸转移酶(TdT),其是能够在体外将核苷酸添加至单链DNA的3'末端的不依赖模板的DNA聚合酶(TIDP)(Deibel 1980,Fowler 2006,Motea2010,Jensen 2018,Loc'h 2018,Deshpande 2019,Sarac 2019)。已知的TdT将通过酶的高加工性或高开关速率(Gouge 2013)聚合数百个核苷酸长度的DNA(DDeibel 1980,Delarue2002,Fowler 2006,Motea 2010,Jensen 2018,Loc'h 2018,Sarac 2019)。其他DNA聚合酶,特别是参与DNA修复过程的DNA聚合酶,也已被证明在体外具有不依赖模板的DNA聚合酶(TIDP)活性(Clark 1988,Domínguez 2000,Ruiz2001,2006,Moon 2007,Moon2007a,Hogg 2012,Moon 2014,Kent2016,Frank 2017,Yang 2018,Chang 2019),尽管非TdT酶的TIDP活性尚未得到广泛研究。
为了产生确定长度和序列的多核苷酸,目前的EOS过程使用3'-封闭的核苷酸,在每个添加循环后去除封闭基团(图1A)。3'封闭基团防止每个添加循环添加多个核苷酸。
然而,3'-封闭的核苷酸具有限制该领域进展的许多缺点。首先,大多数天然DNA聚合酶非常低效地掺入具有3'修饰的核苷酸,并且还显示出明显的碱基偏好和序列特异性。其次,3'封闭基团的化学性质至关重要,因为它需要同时足够稳定以避免在添加步骤过程中自发或酶催化去除,并且完全可去除以为下一个添加步骤做准备。这种平衡很难达到,并且已将该领域限制为具有期望质量的少量封闭基团化学。第三,酶需要适应3'封闭基团,这产生核苷酸化学和酶优化的相互关联的挑战。第四,该策略的去封闭步骤相对于其他酶促合成过程增加了化学反应步骤,这增加了过程复杂性,并且可能涉及使用昂贵且有毒性的化学品。
已描述使用天然或未封闭的核苷三磷酸的寡核苷酸合成的可选方法(Schott1984)。由于通过不依赖模板的核酸聚合酶进行多个核苷酸的进行性添加,该方法要求在每个添加循环后,将接受单个核苷酸添加的寡核苷酸分子与接受0、2或更多个核苷酸的寡核苷酸分离。每次添加循环后要求进行寡核苷酸纯化限制了该方法的效用。
为了简化酶促寡核苷酸合成的问题,并创建差异化方法用于有效酶促寡核苷酸合成过程,我们开发了图1B中所示的策略,其仅使用天然核苷酸。有效添加核苷酸,然后不能移位并保持与DNA模板缔合的TIDP,在每个合成循环中将可靠地仅添加单个核苷酸。因此,该酶可以防止向寡核苷酸底物的3'末端添加多于一个核苷酸,并且不需要修饰的核苷酸。在开始新循环之前,通过洗涤、加热和/或用离液盐去除核苷酸并解离酶。适用于该过程的TIDP的发展被大大简化,并且DNA合成成本将大幅降低。Primordial Genetics的成本模型显示,在小(fmol)和中等(nmol-μmol)合成规模下,这种EOS过程将比COS具有10x-100x成本优势。
本公开证明了这种独特的DNA合成方法的可行性,该方法使用一组第一代DNA合成酶,该酶具有将单个核苷酸掺入至单链寡核苷酸末端的能力。
随着合成DNA应用的快速增长,该领域的商业机会是巨大的。2018年,全球寡核苷酸合成市场规模为$4.3B,并且预期将以10-12.5%的复合年均增长率(CAGR)增长,至2025年将达到>$80亿(2018年全球寡核苷酸合成市场规模)。合成DNA的主要应用包括分子和合成生物学R&D、基因组学(靶标富集)、治疗学、诊断学(DNA微阵列、PCR和FISH)、CRISPR/Cas9系统、纳米技术和新兴技术,诸如基于DNA的数据存储和DNA计算(2018年全球寡核苷酸合成市场规模,Lee 2018,Jensen 2018,Lee 2019)。
本公开描述了新型酶促寡核苷酸合成路线,其使用具有自由或未封闭的3'羟基基团的核苷三磷酸作为底物,下文称为“未封闭的核苷三磷酸”。迄今为止,已经描述的具有TIDP活性的DNA聚合酶在体外与三磷酸盐一起反应时,通常显示核苷酸进行性添加至单链寡核苷酸或多核苷酸末端。本公开描述了当与未封闭的核苷三磷酸一起使用时,具有将单个核苷酸添加至寡核苷酸的3'末端能力的DNA聚合酶。
本公开确定地根源于已知的DNA聚合酶机制。简言之,已知所有DNA聚合酶均经历六个关键机制步骤(BBerdis 2009,Beard 2014,Berdis 2014):1)聚合酶与DNA底物结合;2)与核苷三磷酸形成初始三元络合物;3)构象变化导致产生三元底物络合物;4)催化作用导致化学后产物三元络合物;5)构象变化导致产物(PPi)释放,和6)聚合酶易位以为下一轮核苷酸添加或聚合酶从DNA底物解离做准备。这些机制步骤中的各种步骤由聚合酶的不同结构域介导(Kaminsky 2020)。
已知聚合酶易位与特定DNA聚合酶序列和结构域有关(Samkurashvili1996,Rechkoblit 2006,Golosov 2010,Dahl 2014,Ren 2016,Yang 2018,Hoitsma 2020),并且已报道具有与其底物的解离速率差异很大的聚合酶(Andrade 2009,Zahn 2011)。已经在影响易位速率的DNA和RNA聚合酶中识别突变(Samkurashvili 1996,Dahl 2014,Ren 2016),并且聚合酶易位与在DNA和RNA聚合酶中发现的特定结构域和序列基序有关(Samkurashvili1996,Rechkoblit 2006,Golosov 2010,Dahl 2014,Hoitsma 2020)。因此,能够开发添加单个未封闭的核苷酸但由于无法易位而不能添加其他核苷酸的核酸聚合酶。
核酸聚合酶分为不同类别,一个类别中的聚合酶表现出特定序列或特性,将其与另一个类别的聚合酶区分。例如,DNA聚合酶被分类为家族A、B、C、D、X、Y和RT(Bebenek2002,Ramadan 2004,Jarosz 2007,Guo 2009,Uchiyama 2009,Yamtich 2010,Berdis2014,Maxwell 2014,Moon 2014,Trakselis 2014,Yang 2014,Vaisman 2017,Yang 2018,Hoitsma 2020,Kazlauskas 2020)。不同家族中的聚合酶在核酸复制、修复和重组方面具有不同生物学功能。来自不同家族的纯化的聚合酶通常在体外具有一系列不同的活性,如以上所列参考文献中所举例说明的。
还已知核酸聚合酶在使核酸聚合中表现出强序列特异性或对特定序列的偏好。在使核酸聚合时,核酸聚合酶还已表现出碱基特异性(Fiala 2007,Hoitsma 2020)。
基于DNA聚合酶的已知性质,有各种潜在的方式可以实现将单个核苷酸添加至单链核酸分子的3'末端,而没有进行性添加多个核苷酸的风险,包括但不限于:1)使用对经修饰的核酸分子的3'末端序列具有高序列特异性的聚合酶;根据聚合酶掺入特定类型核苷酸(即A、C、G、T、U或I)的偏好,该末端序列特异性可以与碱基特异性偶联,或可以不与碱基特性偶联;2)使用在核苷酸添加(上述步骤6)后不能易位并且在核苷酸添加后保持与核酸分子的3'末端缔合的的DNA聚合酶;3)其组合;和4)使TIDP非进行性地作用于核酸底物并且仅以不依赖模板的方式添加单个未封闭的核苷酸的其他机制。
发明内容
本公开描述了酶促从头合成核酸的新方法,其涉及通过不依赖模板的核酸聚合酶(TINAP)将单个核苷酸添加至核酸底物,而不使用核苷三磷酸单体上的3'封闭基团。本公开还描述了能够以不依赖模板的方式将单个核苷酸添加至核酸的3'末端的酶。该出乎意料的发现与已知和认为DNA聚合酶起作用的渐进方式相矛盾。因此,发现这种酶或其修饰的衍生物在EOS过程的开发中具有效用,该EOS过程需要将核苷酸受控添加至核酸的3'末端,一次一个核苷酸。本公开描述了这种酶在用于合成用于工业、医学、诊断、农业和/或R&D用途的核酸的方法中的用途。
附图说明
图1A.通过将3'-封闭的核苷酸循环添加至寡核苷酸中的酶促寡核苷酸合成的示意图(参见Jensen 2018)。将与珠粒偶联的寡核苷酸(左上)与3'-封闭的核苷三磷酸(上)和催化核苷酸添加至珠粒的酶(右上)组合。在去除酶和过量的核苷三磷酸(未示出)后,将3'保护基团切割下来(下),留下自由3'末端,其是另一添加的底物。当合成完成时,可以从珠粒上将脱保护的寡核苷酸切割下来(左下)。该图显示了将C残基添加至DNA寡核苷酸,但同样适用于添加至任何RNA或DNA寡核苷酸或其修饰形式或嵌合体的任何核苷酸。
图1B.通过将核苷酸循环添加至寡核苷酸中的酶促寡核苷酸合成的示意图,显示了保护基团的消除如何简化核酸合成循环。
图1C.通过将未封闭的核苷酸循环添加至寡核苷酸中的酶促寡核苷酸合成的示意图。将与珠粒偶联的寡核苷酸(左上)与具有自由3'末端的核苷三磷酸(上)和催化单个核苷酸添加至珠粒的酶(右上)组合。在去除酶(左下)和过量的核苷三磷酸(未示出)后,可以重复该循环。当合成完成时,可以从珠粒上将寡核苷酸切割下来(左下)。该图显示了将C残基添加至DNA寡核苷酸,但同样适用于添加至任何RNA或DNA寡核苷酸或其修饰形式或嵌合体的任何核苷酸。
图1D.通过将未封闭的核苷酸循环添加至寡核苷酸中的酶促寡核苷酸合成的示意图,显示了每个添加循环添加单个核苷酸的一种可能机制。将与珠粒偶联的寡核苷酸(左上)与具有自由3'末端的核苷三磷酸(上)和催化单个核苷酸添加至珠粒的酶(右上)组合。核苷酸添加后,酶保持与寡核苷酸的3'末端结合,进一步阻止核酸聚合。在去除酶(左下)和过量的核苷三磷酸(未示出)后,可以重复该循环。当合成完成时,可以从珠粒上将寡核苷酸切割下来(左下)。该图显示了将C残基添加至DNA寡核苷酸,但同样适用于添加至任何RNA或DNA寡核苷酸或其修饰形式或嵌合体的任何核苷酸。
图2:涉及寡核苷酸底物(SEQ ID NO:42-45)与混合的核苷三磷酸(dATP、dCTP、dGTP和dTTP的等摩尔混合物)的混合的核苷酸添加反应的结果。在“M”泳道中显示单链DNA梯状条带,包含凝胶图像左侧标签所示的分子大小。凝胶图像下方显示测试的酶的EDS数,其是用于本公开中列出的所有酶的标识符(详见表1)。测试的酶显示将不同长度的序列添加至底物。
图3:将单个核苷酸受控添加至以不同碱基为末端的寡核苷酸底物的结果。A.将单个核苷酸添加至不同寡核苷酸底物,在反应后通过凝胶进行测定。在最左侧泳道中显示单链DNA梯状条带,包含凝胶图像左侧标签所示的分子大小。B.将两个核苷酸顺序添加至寡核苷酸底物,并在第一次添加步骤后纯化寡核苷酸。单链DNA梯状条带显示在泳道1的左侧和泳道6的左侧,包含凝胶图像左侧标签所示的分子大小。下表中标记“3'末端碱基”的列列出每个泳道中存在的主要寡核苷酸的3'末端碱基。
图4:在Oligo Pro II毛细管电泳仪(Agilent Technologies,Santa Clara,CA)上进行的酶促核苷酸添加之前和之后寡核苷酸的代表性毛细管电泳分离色谱图。色谱图中显示的所有反应均使用dTTP和寡核苷酸:PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。为了明确分配每个样品中存在的寡核苷酸的长度,对含有和不含寡核苷酸标准品的样品进行重复分析。使用的寡核苷酸标准品为PG1350(GCGTCACGCTACCAACCA,SEQ ID NO:41);PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45);PG5870(GTCCTCAATCGCACTGGAAACATCAAGGTC,SEQID NO:51);和PG5871(GTCCTCAATCGCACTGGAAACATCAAGGTCATACGGAACG,SEQ ID NO:52)。A:未反应的(即无酶)寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。B:与寡核苷酸标准品组合的未反应的(即无酶)寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。C:与dTTP和酶EDS082反应的寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。D:与寡核苷酸标准品反应后组合的与dTTP和酶EDS082反应的寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。E:与dTTP和酶EDS054反应的寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。F:与寡核苷酸标准品反应后组合的与dTTP和酶EDS054反应的寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。G:与dTTP和酶EDS066反应的寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。H:与寡核苷酸标准品反应后组合的与dTTP和酶EDS066反应的寡核苷酸PG5861(GTCCTCAATCGCACTGGAAT,SEQID NO:45)。
图5:核苷酸添加反应的结果显示将不同长度的序列添加至底物。A:含有ATP、CTP、GTP和UTP以及酶EDS015、EDS017、EDS029、EDS048、EDS053、EDS054或EDS066的等摩尔混合物的寡核苷酸底物(SEQ ID NO:42-45)。在“M”泳道中显示单链DNA梯状条带,包含凝胶图像左侧标签所示的分子大小。B:含有ATP、CTP、GTP和UTP以及酶EDS017、EDS024、EDS029、EDS030、EDS053、EDS054、EDS066或EDS082的等摩尔混合物的单个寡核苷酸底物(SEQ ID NO 45)。在“M”泳道中显示单链DNA梯状条带,包含凝胶图像左侧标签所示的分子大小。
具体实施方式
以下缩写和定义将用于说明书和权利要求的解释。
如本文所用,术语“包括(comprises)”、“包括(comprising)”、“包括(includes)”、“具有(has)”、“具有(having)”、“包含(contains)”或“包含(containing)”或其任何其他变体旨在涵盖非排他性包括。例如,包括要素列表的组合物、混合物、过程、方法、物品或装置不一定仅限于那些要素,而且可以包括未明确列出的或这种组合物、混合物、过程、方法、物品或装置固有的其他要素。此外,除非明确相反说明,否则“或”是指包括性的“或”,而不是排他性的“或。”例如,以下中的任一项满足条件A或B:A为真(或存在)且B为假(或不存在),A为假(或不存在)且B为真(或存在),并且A和B均为真(或存在)。
添加循环:如本文所用,该短语是指在涉及两轮或超过两轮如此添加的核酸合成过程中的一轮核苷酸添加。在每个添加循环中,将正在合成的单链核酸与核苷三磷酸和核酸聚合酶组合,并在核酸聚合酶具有活性的反应条件下孵育,导致核苷酸添加至单链核酸。
核酸聚合酶的碱基特异性:该短语是指与不同碱基相比,核酸聚合酶偏好添加包含特定碱基的核苷酸。例如,与包含其他碱基(诸如A、C或G)的核苷酸相比,偏好dTTP的DNA聚合酶将更有效地将dTMP(一磷酸脱氧胸苷)残基添加至核酸的3'末端。在另一种实例中,在包含等摩尔量的核苷三磷酸dATP、dCTP、dGTP和dTTP的混合反应中,与包含其他三个碱基A、C或G的核苷酸相比,偏好dTTP的DNA聚合酶将更多数量的dTMP残基添加至核酸的3'末端。
嵌合核酸:如本文所用,嵌合核酸是指包含核糖核苷酸和脱氧核糖核苷酸残基的混合物的核酸分子。混合物意指任何数量的核糖核苷酸残基与任何数量的脱氧核苷酸残基一起存在于同一核酸链中。
互补核苷酸序列:如本文所用,互补核苷酸序列是多核苷酸序列,其中所有碱基均能够与另一个具有相反5'至3'极性的多核苷酸序列形成碱基对,使得每个多核苷酸链中的所有碱基与其对应物配对,形成碱基对。
控制元件:术语“控制元件”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列,并且其影响相关编码序列的转录、RNA加工或稳定性、或翻译。调控序列包括但不限于启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应结合位点和茎-环结构。
简并序列:在本申请中,简并序列被定义为在群体中不同分子或克隆之间特定序列位置具有差异的序列群体。序列差异可以是任何数量的单个核苷酸或多个核苷酸,例如2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个核苷酸,或它们之间的任何数量。简并序列中的序列差异可以涉及在序列、分子或克隆的群体内的该位置中存在2、3或4个不同核苷酸。在序列的特定位置中的简并核苷酸的实例为:A或C;A或G;A或T;C或G;C或T;G或T;A、C或G;A、C或T;A、G或T;C、G或T;A、C、G或T。
DNA:DNA是核酸,其是脱氧核糖核苷酸的聚合物。DNA以单链或双链形式存在。如本文所用,DNA包含核苷酸残基,其各自具有CH2形式的2'碳。
酶促寡核苷酸合成(EOS):如本文所用,其是合成核酸的受控酶促过程,使用将单个核苷酸逐步酶促添加至核酸末端,从而一次一个核苷酸产生新核酸。
表达:如本文所用,术语“表达”是指源自所公开的核酸的有义(mRNA)或反义RNA的转录和稳定蓄积,以及作为mRNA翻译产物的多肽的蓄积。
自由核苷酸:如本文所用,其意指通常在溶液中的单体核苷酸。
全长开放阅读框:如本文所用,全长开放阅读框是指编码全长蛋白的开放阅读框,其从其天然起始密码子延伸至其天然最终氨基酸编码密码子,如在细胞或生物体中表达的。在特定开放阅读框序列产生在细胞或生物体内表达的多个不同的全长蛋白的情况下,该序列中的每个开放阅读框编码多个不同蛋白中的一个,被认为是全长的。全长开放阅读框可以是连续的或被内含子中断。
全长蛋白:如本文所用,全长蛋白是从其天然第一氨基酸延伸至其天然最终氨基酸的多肽,如在细胞或生物体的基因组中编码的并在细胞或机体中表达的。
基因:术语“基因”是指能够被表达为特定蛋白的核酸片段,任选地包括在编码序列之前(5'非编码序列)和之后(3'非编码顺序)的调控序列。“原始基因”是指在自然界中发现的在其天然宿主生物体中的基因。“天然基因”是指完整具有其天然控制序列(诸如启动子和终止子)的基因。“嵌合基因”是指包括调控序列和编码序列的任何基因,而这些序列在自然界中并不同时存在。因此,嵌合基因可以包括源自不同来源的调控序列和编码序列,或源自相同来源但以不同于自然界中发现的方式排列的调控序列或编码序列。类似地,“外来”基因是指通常在宿主生物中未发现,但通过基因转移引入至宿主生物体中的基因。外来基因包括插入至非原始生物体的原始基因或嵌合基因。“转基因”是已通过转化程序引入至基因组中的基因。
框内:在本申请中,术语“框内”,特别是在短语“框内融合多核苷酸”中,是指上游或5'多核苷酸中密码子的阅读框,或是与多核苷酸中密码子的阅读框相同的阅读框的ORF,或位于上游多核苷酸的下游或3'的ORF,或与上游或5'多核苷酸或ORF融合的ORF。这种框内融合多核苷酸编码由5'多核苷酸和3'多核苷酸编码的融合蛋白或融合肽。
体外转录反应:如本文所用,“体外转录反应”是旨在通过在体外转录DNA模板来产生RNA的反应。体外转录反应包含一种或多种编码待转录的RNA的DNA模板分子、一种或多种完全或部分纯化的单亚基RNA聚合酶、作为一种或多种单亚基RNA聚合酶底物的至少四种核苷三磷酸、缓冲液、二价阳离子和反应所需的盐。
迭代/迭代的:在本申请中,迭代表示将方法或程序重复应用于材料或样品。通常,从每轮加工、改变或修饰中产生的经加工、改变或修饰的材料或样品随后被用作下一轮加工、改变或修饰的起始材料。迭代选择是指使用一轮选择的残存物作为后续轮的起始材料,对选择进行两次或更多次迭代或重复的选择过程。
文库:基因或多核苷酸序列的文库是彼此不同的序列的集合,并且其被克隆到载体中用于序列的繁殖。在不同文库中,序列因序列内容、来源、来源生物体、长度、结构、与其他序列缔合和/或多核苷酸序列的任何其他性质而不同。例如,通过以下生成氨基酸重复序列融合基因文库:将包含由大肠杆菌(E.coli)基因组编码的多种不同ORF的起始ORF集合克隆至细菌克隆和表达载体中,其包含启动子、编码氨基酸重复序列的序列(以该序列将与ORF直接和框内连接的方式定向)、终止子、质粒主链和抗生素抗性基因。起始ORF集合可以包含数量为5或更大的任何数量的ORF,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000或更大,或其间的任何数量。在本公开的特定方面中,用于生成文库的ORF集合包含足够数量的ORF,以提供编码大肠杆菌的特定期望性质的高可能性,例如由大肠杆菌基因组编码的50%或更多的ORF,或2074个或更多个ORF,当使用由威斯康星大学麦迪逊分校(University of Wisconsin,Madison)制备的大肠杆菌菌株MG1655基因组注释时,其列出了总共4148个ORF。
接头序列:该短语是指在融合多核苷酸或融合多肽中分离两个多核苷酸或多肽的多核苷酸序列或多肽序列。例如,融合多核苷酸包含由接头序列分离的两个或更多个ORF,该接头序列编码分离由融合多核苷酸的表达和翻译产生的多肽的两个部分的肽。接头还可以将表位标签与蛋白或酶分离。接头序列可以具有不同的长度和/或序列组成。
非同源:在本申请中,术语“非同源”被定义为在核苷酸水平上具有小于50%的序列同一性。
核酸:术语核酸是指生物聚合物,由通过磷酸二酯键、硫代磷酸酯键或其他键相互连接的核苷酸组成。“核酸”或“核酸分子”可以与多核苷酸互换使用。如本文所用,术语核酸是指单链的核酸。核酸可以由脱氧核糖核苷酸残基(在这种情况下其是DNA),或核糖核苷酸残基(在这种情况下其是RNA)组成,或其可以包含脱氧核糖核苷酸残基和核糖核苷酸残基,在这种情况下其是嵌合核酸。
核酸底物或底物核酸分子:这是存在于酶促核苷酸添加反应或酶促核酸合成反应中的核酸分子,其在由核酸聚合酶催化并使用核苷三磷酸作为核苷酸源的反应期间充当核苷酸受体。例如,在酶和一种或多种脱氧核苷三磷酸的存在下反应的单链DNA寡核苷酸是该反应中的底物核酸分子。
核酸聚合酶”:这是使用核苷三磷酸和未封闭的核酸作为底物催化核酸聚合,并将单个核苷酸顺序添加至未封闭核酸的3'末端的酶。科学文献中描述的核酸聚合酶通常分类为DNA聚合酶和RNA聚合酶,其中DNA聚合酶能够聚合DNA,以及RNA聚合酶能够聚合RNA。然而,特定的酶可以具有催化DNA和RNA合成的双重能力。例如,DNA聚合酶可以具有将核糖核苷酸添加至DNA或RNA分子的3'末端的能力,并且RNA聚合酶可以具有将脱氧核糖核苷酸添加至DNA或RNA分子的3'末端的能力。
核酸合成:这是在自然界中或由人产生核酸的过程,最低限度地需要核酸聚合酶、作为单体构建嵌段的一种或多种核苷三磷酸和核酸底物。
从头核酸合成:这用于指人工DNA的合成,涉及将特定核苷酸受控添加至核酸底物,以产生特定的核酸序列和结构。
核苷酸:这些是核酸的单体构建嵌段,由三种组分构成:5-碳糖、磷酸基团和含氮碱基。核苷酸的两个主要类别是脱氧核糖核苷酸(DNA的构建嵌段)和核糖核苷酸(RNA的构建嵌段)。如果糖是核糖,则核酸是RNA;如果糖是核糖衍生物脱氧核糖,则核酸是DNA。如本文所用,脱氧核糖核苷酸具有基团CH2作为核糖糖中的2'碳。2'碳的所有其他结构均归入术语核糖核苷酸。如本文所用,核苷酸可以意指存在于核酸、核苷一磷酸、核苷二磷酸、核苷三磷酸或其任何衍生物或修饰物内的核苷酸残基。
核苷三磷酸:在本申请中,“核苷三磷酸”被定义为RNA合成中使用的任何三磷酸核糖核苷ATP、CTP、GTP、ITP、UTP和XTP等,或DNA合成中使用的任何三磷酸脱氧核糖核苷dATP、dCTP、dGTP、dITP、dTTP和dXTP等,或其任何修饰的类似物、衍生物或变体,包括包含硫代磷酸键的衍生物。DNA合成中使用的四种典型核苷三磷酸(dATP、dCTP、dGTP和dTTP)的混合物用缩写“dNTP”表示,并且RNA合成中使用的四种典型核苷酸三磷酸(ATP、CTP、GTP和UTP)的混合物用缩写词“NTP”表示。
寡核苷酸:术语寡核苷酸是指由两个或更多个核苷酸组成的单链核酸。
开放阅读框(ORF):ORF被定义为将蛋白或肽编码为特定阅读框中的密码子串的核酸中的任何核苷酸序列。在该特定阅读框内,ORF可以包含任何指定氨基酸的密码子,但不包含终止密码子。起始集合中的ORF不需要以任何特定的氨基酸起始或终止。ORF是连续的或被一个或多个内含子中断。
可操作地连接:术语“可操作地连接”是指单个核酸片段上核酸序列的缔合,从而使一个的功能受另一个影响。例如,当启动子能够影响编码序列的表达时(即,编码序列处于启动子的转录控制下),启动子与编码序列可操作地连接。编码序列可以在有义或反义方向上与调控序列可操作地连接。
肽键:“肽键”是第一氨基酸和第二氨基酸之间的共价键,其中第一氨基酸的α-氨基基团与第二氨基酸的α-羧基基团结合。
序列同一性百分比:术语“序列同一性百分比”是指任何给定查询序列(例如SEQID NO:10)与主题序列之间的同一性程度。主题序列的长度通常为查询序列的长度的约80%至200%,例如查询序列长度的80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、93%、95%、97%、99%、100%、105%、110%、115%、120%、130%、140%、150%、160%、170%、180%、190%或200%。如下确定任何主题核酸或多肽相对于查询核酸或多肽的同一性百分比。使用计算机程序ClustalW(1.83版,默认参数),将查询序列(例如核酸或氨基酸序列)与一个或多个主题核酸或氨基酸序列比对,其允许在核酸或蛋白序列的其整个长度上进行核酸或蛋白序列的比对(全局比对,Chenna 2003)。
为了确定主题或核酸或氨基酸序列与查询序列的同一性百分比,使用Clustal W对序列进行比对,将比对中相同匹配的数量除以查询长度,并将结果乘以100。值得注意的是,同一性百分比值可以四舍五入到最接近的十分之一。例如,78.11、78.12、78.13和78.14向下舍入为78.1,而78.15、78.16、78.17、78.18和78.19向上舍入为78.2。
ClustalW计算查询序列与一个或多个主题序列之间的最佳匹配,并将它们进行比对,以便可以确定同一性、相似性和差异性。可以将一个或多个残基的空位插入至查询序列、主题序列或两者中,以最大化序列比对。对于核酸序列的快速成对比对,使用以下默认参数:字长:2;窗口大小:4;评分方法:百分比;顶部对角线数:4;和空位罚分:5。对于核酸序列的多重比对,使用以下参数:空位开放罚分(gap opening penalty):10.0;空位延伸罚分(gap extension penalty):5.0;和权重转换:是。对于蛋白序列的快速成对比对,使用以下参数:字长:1;窗口大小:5;评分方法:百分比;顶部对角线数:5;空位罚分:3。对于蛋白序列的多重比对,使用以下参数:权重矩阵:blosum;空位开放罚分:10.0;空位延伸罚分:0.05;亲水性空位:打开;亲水性残基:Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg和Lys;残基特异性空位罚分:打开。ClustalW输出是反映序列之间关系的序列比对。ClustalW可以,例如,在贝勒医学院(Baylor College of Medicine)搜索平台(Search Launcher)网站和万维网上的欧洲生物信息学研究所网站上运行。
质粒和载体:术语“质粒”和“载体”是指用于携带细胞或生物体的非天然部分基因的基因元件。质粒通常作为自主附加体基因元件在染色体外复制,而载体可以整合至基因组中或可以作为线性或环状DNA片段在染色体外维持。质粒和载体可以是线性的或环状的,并且可以由源自任何来源的单链和/或双链DNA或RNA组成。质粒和载体通常包含许多来自不同来源的核苷酸序列,这些核苷酸序列已连接或重组成独特的结构,其可以用于将多核苷酸序列引入细胞或生物体中并在生物体内表达基因。存在于质粒上或载体上的序列包括但不限于:自主复制序列;着丝粒序列;基因组整合序列;复制起始点;控制序列,诸如启动子和/或终止子;开放阅读框;选择性标志物基因,诸如抗生素抗性基因;可见标志物基因,诸如编码荧光蛋白的基因;限制性内切核酸酶识别位点;重组位点;和/或不具有明显或已知功能的序列。
多肽或蛋白:术语“多肽”或“蛋白”表示由通过肽键连接的多个氨基酸单体组成的聚合物。该聚合物包括10种或更多种单体,包括10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000种或其间的任何数量。
启动子:术语“启动子”是指能够控制编码序列或功能性RNA表达的DNA序列。通常,编码序列位于启动子序列的3'处。启动子可以全部源自天然基因,和/或可以由源自自然界中发现的不同启动子的不同元件组成,甚至包括合成DNA区段。本领域技术人员应当理解,不同启动子在不同组织或细胞类型中,或在不同发育阶段,或响应不同环境或生理条件来指导基因的表达。导致基因在大多数时间在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。人们进一步认识到,由于在大多数情况下尚未完全确定调控序列的确切边界,因此不同长度的DNA片段可以具有相同的启动子活性。
随机/随机化:如本文所用,意指在没有方法或有意识的决定的情况下制定的或选择的。
RNA:“RNA”是核酸,其是核糖核苷酸的聚合物。RNA以单链或双链形式存在。如本文所用,RNA包含核苷酸残基,其各自具有非CH2形式的2'碳。
序列:如本领域受过训练的人所知,当在生物学环境中使用时,“序列”可以表示核酸中的核苷酸序列或蛋白中的氨基酸序列。如本文所用,术语“序列”的含义取决于该术语使用的背景。例如,当在表明核酸(诸如基因组序列、基因序列或ORF)的背景下使用时,则序列是指核苷酸序列。在表明蛋白或多肽(诸如蛋白质组、蛋白或酶)的背景下,序列是指氨基酸序列。
序列特异性核苷酸添加”:如本文所用,这是核酸聚合酶的特征,其活性表现出序列特异性。例如,不依赖模板的DNA聚合酶可以具有序列特异性,仅允许其将核苷酸添加至以dT残基终止的核酸的3'末端,而不添加至以其他核苷酸终止的3'末端。核酸聚合酶的这种序列特异性可以是部分的或完全的。如果是部分的,则上述实例中的DNA聚合酶将更有效地将核苷酸添加至以3'dT残基终止的核酸中,但还将修饰以3'dA、dC或dG残基终止的核酸,尽管效率较低。如果是完全的,则上述实例中的DNA聚合酶将仅将核苷酸添加至以3'dT残基终止的核酸,并且将不能修饰以3'dA、dC或dG残基终止的核酸。
不依赖模板的核酸聚合酶:“不依赖模板的核酸聚合酶”是在不存在与正在合成的链碱基配对并用作正在合成链的模板的另一条核酸链的情况下,催化在核酸的3'-羟基末端处掺入核苷酸,伴随释放无机磷酸盐的酶。特别地,不依赖模板的DNA聚合酶在不使用模板的情况下催化DNA链聚合,而不依赖模版的RNA聚合酶在不使用模版的情况下催化剂RNA链聚合。
不依赖模板的核酸合成:这是在不使用与正在合成的核酸碱基配对并用作正在合成的链的模板的模板链的情况下,核酸聚合酶催化核酸聚合的过程。
转化的:术语“转化的”意指通过引入多核苷酸序列进行的基因修饰。
转化:如本文所用,术语“转化”是指将核酸片段转移至宿主生物体中,产生基因稳定的遗传。包含转化的核酸片段的宿主生物体被称为“转基因的”或“重组的”或“转化的”生物体。
转化的生物体:转化的生物体是已通过将多核苷酸序列引入至生物体的基因组中进行基因改变的生物体。
易位:核酸聚合酶的“易位”是指在将核苷酸添加至核酸底物之后,酶沿着核酸模板以核酸聚合的方向(5'至3')移动。在将核苷酸添加至底物后,核酸聚合酶沿着模板或核酸底物易位。
不利条件:如本文所用,该短语表示生长条件(物理的或化学的)的任何部分,其导致比在正常生长条件下更慢的生长,或与正常生长条件相比降低细胞的生存力。
未封闭的核酸:该短语是指具有自由3'羟基基团的核酸。
未封闭的核苷酸或未封闭的核苷三磷酸或未封闭的dNTP或未封闭的NTP:这些短语可以互换使用,并且是指具有自由3'羟基基团的核苷酸或核苷三磷酸。
在本公开中,术语“框内”,特别是在短语“框内融合多核苷酸”中,是指上游或5'多核苷酸中密码子的阅读框,或是与多核苷酸中密码子的阅读框相同的基因或ORF,或位于多核苷酸的下游或上游的3'的基因或ORF,或与上游或5'多核苷酸、基因或ORF融合的ORF。这种框内融合多核苷酸的集合可以在包含相对于彼此处于框内的上游和下游多核苷酸的融合多核苷酸百分比方面变化。在总集合中的百分比为至少10%,并且可以是数字10%、11%、12%、13%、14%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、100%或其间的任何数字。
XTP或dXTP:术语“XTP”或“dXTP”是指用于合成RNA或RNA的修饰形式的任何三磷酸核糖核苷或天然存在的三磷酸核糖核苷的任何修饰形式,或用于合成DNA或DNA的修饰形式的任何三磷酸脱氧核糖核苷或天然存在的三磷酸脱氧核糖核苷的任何修饰形式。
本公开提供了用于以不依赖模板的方式合成核酸的组合物和方法。在没有引导添加的模板或待添加的核苷酸的类型的情况下,某些核酸聚合酶具有将核苷酸添加至核酸的自由3'末端的能力。在本公开中,这种聚合酶被称为具有不依赖模板的核酸聚合酶(TINAP)活性。
具有TINAP活性的聚合酶具有用于体外产生人工核酸的效用。例如,在允许核酸合成的实验条件下(例如,在生理pH下和在缓冲剂和二价阳离子辅因子的存在下,以及在允许核酸聚合的温度下孵育),具有TINAP活性的核酸聚合酶可以与一种或多种核苷三磷酸和一种或多种包含自由3'羟基基团的底物核酸组合。聚合酶以单个添加循环的方式催化核苷酸添加至3'末端,底物核酸的3'末端延伸一个核苷酸。然后,将核酸分子与酶和/或与核苷三磷酸分离,并重复该循环。以这种方式,任何特定核酸序列均可以以循环的方式合成,一次一个核苷酸。
在上述策略中合成特定核酸序列的能力取决于具有TINAP活性的核酸聚合酶在每个添加循环中将底物核酸延伸单个核苷酸的能力。核酸聚合酶的一小部分具有这种能力。
迄今为止,开发能够一次一个核苷酸来合成核酸的EOS策略的其他努力需要使用3'-封闭的核苷酸,其包含与添加至核酸中的核苷酸的3'羟基共价连接的化学基团。修饰3'羟基的化学封闭基团防止多个核苷酸添加至底物核酸分子的自由3'羟基基团。在一轮添加后,将核酸底物分子与酶和核苷三磷酸分离,并通过使底物核酸分子的其余部分保持不变的处理去除化学封闭基团。在这个去封闭步骤期间暴露3'羟基,使底物核酸分子备用于另一个添加循环。该策略如图1A中所示。
本公开中描述的EOS策略与上述使用3'-封闭的核苷酸的策略的差异在于使用具有未封闭的或自由的3'羟基的天然核苷酸。在本公开中,每个添加循环添加单个核苷酸取决于具有TINAP活性的核酸聚合酶的特定性质,其允许其在每个添加循环中用单个核苷酸延伸底物核酸分子。本公开中描述的EOS策略如图1C中所示。
基于本公开中描述的策略的核酸合成方法最低限度地涉及将底物核酸分子、核酸聚合酶(TINAP)和一种或多种核苷三磷酸在适合聚合酶活性的反应混合物(最低限度地包含处于或接近生理pH的缓冲剂和二价阳离子)中组合,允许反应进行使反应完成的足够时间,然后从核酸聚合酶和未掺入的核苷三磷酸中分离通过添加单个核苷酸修饰的底物核酸分子,并重复该循环。
本公开包括任何未封闭的核苷三磷酸用于合成核酸的用途。核苷三磷酸可以是用于合成RNA或RNA的修饰形式的三磷酸核糖核苷,诸如ATP、CTP、GTP、ITP、UTP或XTP或其任何修饰形式。核苷三磷酸可以是用于合成DNA或DNA的修饰形式的三磷酸脱氧核糖核苷,诸如dATP、dCTP、dGTP、dITP、dUTP或dXTP或其任何修饰形式。
核苷酸的修饰形式包括但不限于通过共价添加甲基基团、O-甲基基团、羟基基团、氨基基团、磷酸盐、氯或氟原子、单糖、二糖或多糖、染料、荧光基团、硫代磷酸基团(用硫原子取代磷酸二酯酶键上的氧原子)、结合基团(诸如生物素或地高辛)、反应性基团(诸如叠氮化物、醛、酮、硫醇、二硫化物或胺)或包含上述的一种或多种的分子进行修饰的核苷酸。可以将修饰基团添加至核苷酸的含氮碱基或核糖糖的2'或5'碳(例如2'-氟或2'-O-甲基取代),但可以修饰核苷酸中发现的任何碳、氮或氧原子,除了3'-羟基基团。可以将多个修饰基团添加至单个核苷酸分子。修饰添加至核苷酸的基团的目的是为了允许特异性检测、纯化、靶向(生物体中的组织或细胞类型)或稳定已共价添加的修饰的核苷酸的分子,或其组合。
本公开可以用于合成任何序列的任何核酸分子。合成的核酸分子可以是DNA或RNA或其修饰形式,或包含核糖核苷酸和脱氧核糖核苷酸的嵌合核酸或其修饰形式。合成的序列可以包含典型核糖或脱氧核糖主链或其修饰形式,对核糖糖进行多种修饰中的任何一种,包括但不限于2'-氟或2'-O-甲基取代。合成的序列可以包含在DNA和RNA中发现的任何典型碱基(腺嘌呤、胞苷、鸟嘌呤、胸腺嘧啶、尿嘧啶)或不常见碱基(例如次黄嘌呤、黄嘌呤)或任何此类碱基的修饰形式,或天然的或修饰的碱基的任何混合物。含氮碱基的修饰形式包括但不限于通过共价添加甲基基团、O-甲基基团、羟基基团、氨基基团、磷酸盐、氯或氟原子、单糖、二糖或多糖、染料、荧光基团、硫代磷酸酯基团(取代磷酸酯)、结合基团(诸如生物素或地高辛)、反应性基团(诸如叠氮化物、醛、酮、巯基、二硫化物或胺)或包含上述的一种或多种的分子进行修饰的碱基。
在酶促核酸合成反应中用作核苷酸受体的底物核酸分子可以是任何长度或序列。例如,底物核酸分子的长度可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000或100000个核苷酸,或更长,或其间的任何长度。
在酶促核酸合成反应中用作核苷酸受体的底物核酸分子可以是在溶液中自由的或固定化在固体载体诸如琼脂糖珠、聚苯乙烯珠或磁珠上。底物核酸分子的固定化可以通过与固体载体的共价键或通过与固体载体的非共价缔合发生。
在酶促核酸合成反应中用作核苷酸受体的底物核酸分子可以是单链的或部分单链的。作为核苷酸受体的底物核酸分子的3'末端将是单链的,表示它将不是与同源核苷酸碱基配对的碱基,但底物核酸分子中位于5'或3'末端的任何核苷酸可以是单链的或双链的。
在酶促核酸合成反应中用作核苷酸受体的底物核酸分子可以是任何长度,包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000或100000个核苷酸,或更长,或其间的任何长度。
在酶促核酸合成反应中用作核苷酸受体的底物核酸分子可以包含脱氧核糖核苷酸残基或核糖核苷酸残基,或脱氧核糖核苷酸残基和核糖核苷酸的混合物。底物核酸分子中的核苷酸残基可以包含任何修饰,包括对核糖糖的修饰、对碱基的修饰或对主链的修饰。
在酶促核酸合成反应中用作核苷酸受体的底物核酸分子可以是特定序列和结构的纯分子,或可以是不同序列或结构的混合群体。
使用本公开中描述的组合物和方法合成的核酸序列可以包含在合成类型的核酸中常见的所有碱基(即,在DNA的情况下为A、C、G和T)或这些碱基的子集。合成的序列可以是复合的或非重复的,或可以是重复的,其中一个或多个特定序列重复出现。合成的序列可以是同源聚合物(仅包含单个核苷酸),或可以包含每个重复长度为2个或更多个核苷酸的简单重复,或长度为5个或更多个核苷酸的复合重复。
使用本公开中描述的组合物和方法合成的核酸分子可以是任何长度,2个核苷酸或更长,包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000.、70000、80000、90000或100000个核苷酸或更长,或其间的任何长度。
当使用本公开中描述的组合物和方法合成核酸时,核苷酸添加的效率可以在1%至100%的范围内。这表示在单个添加循环期间,仅一部分核酸底物分子可以通过核酸聚合酶通过另外的核苷酸进行延伸。例如,任何特定核苷酸向任何特定核酸底物分子的添加效率可以是1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、115、12%、13%、14%、15%、16%、17%、18%、19%、20%、30%、40%、50%、60%、70%、80%、90%或100%,或其间的任何百分比。
核酸聚合酶添加核苷酸的效率可以受到反应中许多因素或变量的影响,包括但不限于添加反应中存在的其各自核苷三磷酸的浓度、酶浓度和影响酶活性的反应条件。例如,提高特定核苷三磷酸的浓度可以提高该核苷三磷酸的掺入效率。类似地,增加催化特定核苷三磷酸掺入的酶的浓度可以增加核苷三磷酸的掺入频率。这可以通过改变反应混合物和反应条件来实现,例如通过改变以下的存在:缓冲剂(例如Tris、磷酸钠或磷酸钾、乙酸钠或乙酸钾或二甲胂酸钠或二甲胂酸钾)、盐、二价阳离子和反应添加剂或稳定剂,包括但不限于聚乙二醇、聚乙烯吡咯烷酮、甘油、多胺、去污剂、表面活性剂、牛血清白蛋白、DNA结合蛋白、甲酰胺或影响或修饰核酸聚合酶活性的分子,诸如肽或小分子;或通过改变以下的一种或多种浓度:缓冲剂、盐、二价阳离子、核苷三磷酸和其他反应组分,包括但不限于聚乙二醇、聚乙烯吡咯烷酮、甘油、多胺、去污剂、表面活性剂、牛血清白蛋白、DNA结合蛋白、甲酰胺或影响或修饰核酸聚合酶活性的分子,诸如肽或小分子。
核酸合成过程的反应pH可以在生理pH周围变化几个pH单位,例如pH 4.0、5.0、6.0、7.0、8.0、9.0或10.0或其间的任何pH。
基于核酸聚合酶添加核苷酸的已知机制,存在多种可能的机制,通过这些机制,TINAP可以催化单个核苷酸添加至未封闭的核酸的3'末端,而不需要进行多个核苷酸的进行性添加。这些包括但不限于以下。1)核酸聚合酶可以对特定核酸序列具有特异性,包括核酸底物上的末端碱基,并且仅将核苷酸添加至包含该特定序列的底物分子。一旦已添加核苷酸,末端序列则不同,并且聚合酶可能无法将另一个核苷酸添加至底物。2)核酸聚合酶在其核苷酸添加机制的易位步骤中可能存在缺陷,这将使酶在核苷酸添加和焦磷酸盐释放的催化步骤后停滞,从而允许聚合酶仅添加单个核苷酸。3)核酸聚合酶可以以共价或非共价方式与核酸分子的末端保持紧密缔合,防止聚合酶在核苷酸添加后解离,并防止聚合酶的另一分子进入核酸的3'末端。4)核酸聚合酶在添加单个核苷酸后可能失去催化活性,从而使其不能添加另外的核苷酸。这些机制和酶性质可以单独存在或组合存在于特定核酸聚合酶中。
在将核苷酸添加至核酸的3'末端时表现出序列特异性的核酸聚合酶(以上列出的单个核苷酸添加的第一种机制)可以识别位于核酸不同部分的不同数量的核苷酸并对其具有特异性。例如,核酸聚合酶可以对核酸3'末端的序列或不包括3'末端存在的核苷酸的内部序列具有特异性。聚合酶可以对核酸的3'末端或内部存在的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个核苷酸具有特异性。当识别核酸内部特异性序列时,距核酸的3'末端的距离可以是不同的长度,例如距核酸的3'末端1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个核苷酸。管控核酸聚合酶的序列特异性的识别序列还可以存在于核酸内多于一个的非连续序列中。
在核酸的3'末端添加单个核苷酸后丧失催化活性的核酸聚合酶可以以可逆或不可逆的方式丧失催化活性。如果是可逆的,则有一些处理,诸如pH变化;盐、二价阳离子、焦磷酸盐、核苷一磷酸、核苷二磷酸、核苷三磷酸、还原剂或任何前述的组合的浓度变化;聚合酶浓度的变化;用离液剂诸如胍、尿素或醇处理;部分或完全去折叠,随后再折叠或本领域技术人员已知的恢复聚合酶活性的任何其他处理。如果聚合酶活性的丧失是不可逆的,这些处理将无法恢复聚合酶活性。
在工业核酸合成过程中使用的核酸聚合酶可以使用一次,然后丢弃,或可以在核苷酸添加循环之间循环使用,以供继续使用。核酸聚合酶可以用于任何数量的核苷酸添加循环,例如用于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100个循环或其间的任何数量。在循环之间,核酸聚合酶可以通过多种蛋白纯化方法(包括但不限于亲和层析、阴离子交换层析、阳离子交换层析、凝胶过滤层析、反相层析或超滤)中的任何一种脱盐、浓缩或与其他反应组分分离,以将其制备用于下一个核苷酸添加循环。
在核苷酸添加循环之间,在工业核酸合成过程中使用的核酸聚合酶可以部分或完全去折叠或变性(表示将蛋白从其特征性三维结构部分或完全转变成无规螺旋),并再折叠成其天然三维结构,以将其制备用于下一个核苷酸添加循环。
单个核苷酸添加反应可以采用底物与酶的不同化学计量,分为三类:1)摩尔过量的酶;2)等摩尔量的酶和底物末端和3)摩尔过量的核酸底物3'末端。在摩尔过量的酶的情况下,酶可以以表示与核酸底物3'末端的浓度相比过量倍数的浓度存在,例如,1.01x、1.1x、1.2x、1.3x、1.4x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20、30x、40x、50x、60x、70x、80x、90x、100x,或其间的任何数量/倍数过量。在摩尔过量的核酸底物3'末端的情况下,核酸底物或底物的3'末端(例如在共价固定化的底物的情况下)可以以表示与酶的浓度相比过量倍数的浓度存在,例如,1.01x、1.1x、1.2x、1.3x、1.4x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20、30x、40x、50x、60x、70x、80x、90x、100x、200x、300x、400x、500x、600x、700x、800x、900x、1000x,或其间的任何数量/倍数。
通过受制添加单个核苷酸合成核酸的能力可以用于创建核酸合成的工业方法。这种工业方法通常包括与正在合成的核酸缔合的材料的特定组合物,在溶液中或在固体载体、进行合成的专用容器或器皿(例如流动柱)上,用于添加和去除酶和核苷三磷酸的特定技术(例如涉及专用递送系统或微流体)、用于在每个核苷酸添加步骤后去除过量的酶和核苷三磷酸腺苷的特定技术,以及在合成后从反应器皿中去除酶并将其与合成过程中存在的材料诸如固体载体、缓冲剂、盐和其他溶质分离的特定方法。
核酸合成的工业方法可以在不同的反应温度下开发,例如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110或120摄氏度或其间的任何温度。反应温度可以是恒定的或可以在反应过程中以任何方式变化,例如通过从起始温度线性或非线性增加,或从起始温度线性或非线性降低,或通过循环温度变化,或其任何组合。
工业核酸合成过程可以针对每个核苷酸添加循环使用不同反应时间,例如每个循环1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50或60秒或其间的任何时间,或每个循环1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50或60分钟或其间的任何时间,或每个循环1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24小时,或其间的任何时间。
核酸合成的工业方法可以在各种规模下建立,以允许有效合成不同量的核酸。规模可以从合成的核酸的fmol量变化到摩尔量或更高。例如,特定方法可以被设计用于合成1×10-16、2×10-16、3×10-16、4×10-16、5×10-16、6×10-16、7×10-16、8×10-16、9×10-16、1×10-15、2×10-15、3×10-15、4×10-15、5×10-15、6×10-15、7×10-15、8×10-15、9×10-15、1×10-14、2×10-14、3×10-14、4×10-14、5×10-14、6×10-14、7×10-14、8×10-14、9×10-14、1×10-13、2×10-13、3×10-13、4×10-13、5×10-13、6×10-13、7×10-13、8×10-13、9×10-13、1×10-12、2×10-12、3×10-12、4×10-12、5×10-12、6×10-12、7×10-12、8×10-12、9×10-12、1×10-11、2×10-11、3×10-11、4×10-11、5×10-11、6×10-11、7×10-11、8×10-11、9×10-11、1×10-10、2×10-10、3×10-10、4×10-10、5×10-10、6×10-10、7×10-10、8×10-10、9×10-10、1×10-9、2×10-9、3×10-9、4×10-9、5×10-9、6×10-9、7×10-9、8×10-9、9×10-9、1×10-8、2×10-8、3×10-8、4×10-8、5×10-8、6×10-8、7×10-8、8×10-8、9×10-8、1×10-7、2×10-7、3×10-7、4×10-7、5×10-7、6×10-7、7×10-7、8×10-7、9×10-7、1×10-6、2×10-6、3×10-6、4×10-6、5×10-6、6×10-6、7×10-6、8×10-6、9×10-6、1×10-5、2×10-5、3×10-5、4×10-5、5×10-5、6×10-5、7×10-5、8×10-5、9×10-5、1×10-4、2×10-4、3×10-4、4×10-4、5×10-4、6×10-4、7×10-4、8×10-4、9×10-4、1×10-3、2×10-3、3×10-3、4×10-3、5×10-3、6×10-3、7×10-3、8×10-3、9×10-3、1×10-2、2×10-2、3×10-2、4×10-2、5×10-2、6×10-2、7×10-2、8×10-2、9×10-2、1×10-1、2×10-1、3×10-1、4×10-1、5×10-1、6×10-1、7×10-1、8×10-1、9×10-1、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100摩尔核酸,或其间的任何规模。
核酸合成的工业方法可以依赖于具有将具有任何结构的任何核苷酸添加至任何核酸的3'末端期望的所有活性的单一酶,或该方法可以依赖于专用酶催化将特定核苷酸添加至特定核酸。例如,用于添加核糖核苷酸的核酸聚合酶可以不同于用于添加脱氧核糖核苷酸的核苷酸聚合酶。不同的核酸聚合酶可以用于添加包含不同碱基或不同修饰的核苷酸。可以使用不同核酸聚合酶将核苷酸添加至与存在于核酸3'末端处的序列或存在于核酸内部的序列不同的核酸中。不同核酸聚合酶可以用于添加具有不同连接的核苷酸,例如与硫代磷酸酯连接相比的典型磷酸二酯连接。工业方法可以使用1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000种不同核酸聚合酶,或其间的任何数量,以允许合成不同核酸序列和/或结构。
对于核酸合成中的每个循环,将添加核酸聚合酶以催化该循环期望的特定添加反应。核酸聚合酶可以是单一酶或2种或更多种酶的混合物。
酶促寡核苷酸合成可以允许在寡核苷酸的特定位置掺入简并或混合核苷酸。这涉及针对特定添加循环将多种核苷三磷酸添加至酶促加成反应中。根据待掺入至混合位置中的核苷酸的结构,添加一种或多种核酸聚合酶以催化掺入反应。
当在特定位置合成具有简并或混合核苷酸的核酸时,可以添加多种酶以允许在特定添加循环中将多个核苷酸添加至核酸中的单个位置。
在简并位置掺入的核苷酸的比例可以受到添加反应中存在的其各自核苷三磷酸的浓度、酶浓度和影响不同酶的相对速率的反应条件的影响。例如,提高两种或更多种核苷三磷酸混合物中特定核苷三磷酸的浓度通常提高该核苷三磷酸的掺入效率。类似地,增加催化混合物中特定核苷三磷酸掺入的酶的浓度将增加该核苷三磷酸的掺入频率。这可以通过改变反应条件(缓冲剂、盐、二价阳离子和反应添加剂或稳定剂(包括但不限于聚乙二醇、聚乙烯吡咯烷酮、甘油、多胺、去污剂、牛血清白蛋白、DNA结合蛋白或甲酰胺)的存在;缓冲剂、盐、二价阳离子、核苷三磷酸和其他反应组分(包括但不仅限于适用于聚乙二醇、聚乙烯吡咯烷酮、甘油、多胺、洗涤剂、牛血清白蛋白、DNA结合蛋白或甲酰胺)的浓度;pH;温度)来实现,以优化核酸聚合酶的活性,或相对于混合物中存在的其他核酸聚合酶有利于一种核酸聚合酶的活性。
酶促合成的寡核苷酸可以包含任何数量的简并核苷酸,包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000.、70000、80000、90000或100000个或更多个简并核酸,最多直至寡核苷酸的总长度。寡核苷酸中的简并位置可以由以下组成:所有四种典型核苷酸A、C、G和T的混合物,或碱基的子集(例如A+C、A+G、A+T、C+G、C+T、G+T、A+C+G、A+C+T、A+G+T、C+G+T),或典型核苷酸与任何种类的非天然或修饰的核苷酸的任何混合物。
在酶促核酸合成过程中,被合成的核酸可以在溶液中或偶联至固体载体,或其组合。当使用固体载体时,核酸可以共价附接至固体载体或非共价附接。
不同固体载体可以用于在合成过程中固定化核酸,并且是本领域受过训练的人员已知的。这些包括但不限于受制的孔玻璃(CPG)珠、琼脂糖珠或树脂、聚苯乙烯珠或树脂、PEG珠或树脂、硅胶珠以及开发用于固定化化学基团、酶或核酸的许多其他专用材料。固体载体可以具有范围从0.01-1000微米的各种珠粒尺寸和范围从0.01-1000微米的孔径。
用于酶促核酸合成反应的核酸聚合酶可以是在溶液中自由的或固定化在固体载体(包括但不限于琼脂糖珠、聚苯乙烯珠或磁珠)上。核酸聚合酶的固定化可以通过与固体载体的共价键或通过与固体载体的非共价缔合发生。用于固定化核酸聚合酶的固体载体可以是用于固定化核酸底物的相同固体载体,或可以是不同载体。
用于酶促核酸合成反应的核酸聚合酶可以是基于其天然功能的DNA聚合酶或RNA聚合酶。在DNA聚合酶的情况下,聚合酶可以属于任何不同的已知DNA聚合酶家族,包括但不限于家族A、B、C、D、X、Y和RT。
酶促核酸合成反应中使用的核酸聚合酶可以是天然酶或工程酶,这表示其序列或结构已经被人为改变,以增加其在从头核酸合成中的效用。
本公开描述了七种能够将单个核苷酸添加至核酸分子的3'末端的新的核酸聚合酶。这些酶的SEQ ID NO在下表1中给出,并且它们的活性在实施例1中描述。
其中A列中的SEQ ID NO是天然序列(氨基酸)
B列中的SEQ ID NO是克隆的基因序列(核酸)
C列中的SEQ ID NO是表达的蛋白序列(氨基酸)
D列中的SEQ ID NO是表达质粒序列(核酸)
如上所述,核酸聚合酶可以具有将单个核苷酸添加至核酸底物的3'末端的部分能力,这表示在反应过程中单个核苷酸向核酸底物的添加效率可能低于100%。为了提高这种效率,核酸聚合酶可以经工程化以更有效。这表示产生的原始酶的变体在反应中具有比亲本酶更高的添加效率。核酸聚合酶还可以经工程化以改变其底物特异性。例如,将核苷酸有效添加至以T终止的核酸的3'末端的核酸聚合酶可以经工程化以将核酸有效添加至以任何核苷酸终止的核酸。作为另一种实例,将A有效添加至核酸的3'末端的核酸聚合酶可以经工程化用于更广泛的底物特异性,使得变体酶能够将任何核苷酸有效添加至核酸分子的3'末端。在另一个实例中,在反应中以进行性方式将多个核苷酸添加至核酸的3'末端的核酸聚合酶可以经工程化以在反应过程中仅将单个核苷酸添加至3'末端。在另一种实例中,将脱氧核糖核苷酸有效添加至核酸的3'末端的核酸聚合酶可以经工程化以有效添加核糖核苷酸。在另一种实例中,将脱氧核糖核苷酸有效添加至DNA分子的3'末端的核酸聚合酶可以经工程化以将脱氧核糖核苷酸有效添加至RNA分子。在最后的实例中,将核糖核苷酸有效添加至DNA分子的3'末端的核酸聚合酶可以经工程化以将核苷酸有效添加至RNA分子的3'末端。这些实例不是详尽的,并且在实践中可能通过工程化缺乏这种活性或以低效率表现出这种活性的起始酶来工程化任何特定的期望核酸聚合酶活性。
文献中已描述许多蛋白工程化的方式和方法,包括但不限于以下综述文章中列出的那些:Leatherbarrow 1986,Zoller 1991,Lutz 2000,Leisola 2007,Eisenbeis 2010,2011,Foo 2012,Zawaira 2012,Marcheschi 2013,Woodley 2013,Johnson2014,Packer 2015,Shin 2015,Chen 2016,Kaushik2016,Swint-Kruse 2016,Wrenbeck2017,Bornscheuer 2018,Lutz 2018,Singh2018,Sinha 2019,Wilding 2019,Yang 2019。
通常,蛋白工程化使用一种或多种方法来使编码目的酶的基因序列多样化,随后使用一种或多种选择或筛选方法来选择编码在一种或多种目的品质上改进的变体酶的基因。目的品质包括但不限于:在特定反应条件下或修饰特定底物时的核苷酸添加效率;与核酸底物相关的底物特异性;对抑制剂的抗性;与核苷三磷酸相关的底物特异性;暴露于高温时的稳定性;在可能使亲代酶失活的条件下的稳定性,诸如在盐、焦磷酸盐或其他反应产物或任何其他化学物质或化合物的反应中的存在;在任何上述物质的反应中的高浓度;或可以提高其对酶促核酸合成过程的适用性的酶的任何其他品质。
使编码目的核酸聚合酶的基因多样化的方法包括但不限于:诱变,即引入点突变;在酶编码序列内引入不同长度的插入和缺失;在编码序列的5'末端处或3'末端处与其他序列融合;与相关编码序列的同源序列交换导致多态性的重组;以及创建序列多样性的任何其他方式。
不依赖模板的核酸聚合酶的子集包含BRCT结构域,其对核酸聚合酶活性不是必需的,并且可以介导与参与DNA合成或修复的其他蛋白的相互作用(Callebaut 1997,Repasky2004)。已报道截短蛋白以去除BRCT结构域刺激末端脱氧核苷酸转移酶中的DNA聚合酶活性(Mueller 2009)。去除BRCT结构域的类似靶向截短可以用于改变其他TINAP的活性。
用于选择编码改善一种或多种目的品质的酶的基因的方法和方式包括在微滴或乳液中使用体外区室化的方法,该方法允许在小体积中高效处理大量酶变体。这些方式已在文献中以一般方式和在核酸加工酶的具体应用中进行描述(Tawfik 1998,Ghadessy2001,Diehl 2006,Griffiths 2006,Miller2006,Ghadessy 2007,Tay 2010,Takeuchi2014)。
实施例
实施例1:溶液中单个核苷酸添加至寡核苷酸
DNA聚合酶、酶表达和纯化:
编码表1中列出的DNA聚合酶的基因,在其N-末端(SEQ ID NO:21-30)各自具有六组氨酸标签,被设计为核酸序列(SEQ ID NO:11-20),由商业基因合成供应商合成,并克隆至细菌表达质粒中,该质粒具有在大肠杆菌中赋予高拷贝数的MB1质粒复制子。质粒上DNA聚合酶基因的插入位点的侧翼是阿拉伯糖诱导型启动子和λT1终止子,允许每个聚合酶的阿拉伯糖诱导表达。克隆后对表达构建体进行序列验证。本公开涵盖的DNA聚合酶的表达构建体的完整序列在SEQ ID NO:31-40中给出。
通过截短编码EDS030的序列获得编码EDS082的基因的编码序列。如关于其他聚合酶(Mueller 2009)所述,去除存在于EDS030的N-末端的编码BRCT结构域的序列,并在缩短的编码序列的起始处插入甲硫氨酸密码子。
将表达质粒转化到大肠杆菌菌株BL21中,并挑取单个菌落进行培养和蛋白表达。细菌细胞在37℃下在LB培养基中生长至对数期培养,并通过添加L-阿拉伯糖诱导。在15℃下孵育18小时后,通过离心收获培养物,并裂解收集的大肠杆菌细胞。将DNA聚合酶按照生产商的说明用镍亲和层析纯化。将DNA聚合酶用咪唑溶液洗脱,用Millipore(Darmstadt,Germany)出售的超离心过滤器浓缩,并更换为由50mM KPO4,pH7.3,100mMNaCl,1.43mMβ巯基乙醇、0.05%Triton-X100和50%甘油组成的储存缓冲液。
寡核苷酸和dNTP池的体外核苷酸添加测定
通过在由50mM乙酸钾和20mM乙酸Tris组成的缓冲液中在pH 7.5下进行反应来测定酶活性。用10mM乙酸镁和250μM氯化钴补充反应缓冲液。使反应在500μM dNTP、10μM的单链DNA寡核苷酸和1μg的酶/10μl反应的存在下进行。使用从15℃开始并以1℃/min的速率升温至50℃的温度梯度孵育反应。反应以10μl体积进行,并在冰上设置。
对于活性筛选,使用单链DNA寡核苷酸的等摩尔混合物:PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45);PG5859(GTCCTCAATCGCACTGGAAG,SEQ ID NO:43);PG5860(GTCCTCAATCGCACTGGAAC,SEQ ID NO:44);PG5858(GTCCTCAATCGCACTGGAAA,SEQID NO:42)。将单链寡核苷酸的混合物与dATP、dTTP、dGTP和dCTP的等摩尔混合物组合。寡核苷酸由Eurofins Genomics(Louisville,KY)合成,并且dNTP购自New England Biolabs(Beverly,MA)。
通过添加等体积的2x NOVEXTM TBE-尿素样品缓冲液(ThermoFisher,Waltham,MA)终止反应,并在70℃下加热3分钟。将样品冷却,并将15μl添加至NOVEXTM TBE-尿素聚丙烯酰胺凝胶(15%,ThermoFisher,Waltham,MA)中,在150V下电泳,用亚甲基蓝染色,用去离子水脱色,并使用AZURETM 200凝胶成像工作站(Azure Biosystems,Dublin,CA)用白光成像。
评价10种DNA聚合酶活性的实例如图2中所示。各种酶显示出将一个或数个核苷酸添加至单链寡核苷酸的趋势,这可能表明适用于酶促核酸合成过程。
通过凝胶电泳测定单个核苷酸添加
通过在由50mM乙酸钾和20mM乙酸tris组成的缓冲液中在pH 7.5下进行反应来测定使用单个dNTP的酶活性。用10mM乙酸镁和250μM氯化钴补充反应缓冲液。使反应在500μMdNTP、10μM的单链DNA寡核苷酸和1μg的酶/10μl反应的存在下进行。反应在30℃下孵育15分钟。反应以10μl体积进行,并在冰上设置。
以下单独的dNTP和DNA寡核苷酸对用于每个反应:dTTP+PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45);dGTP+PG5864(GTCCTCAATCGCACTGGAATT,SEQ IDNO:46);dATP+PG5865(GTCCTCAATCGCACTGGAATTG,SEQ ID NO:47);dCTP+PG5866(GTCCTCAATCGCACTGGAATTGA,SEQ ID NO:48)。标准寡核苷酸还用于分析:PG5867(GTCCTCAATCGCACTGGAATTGAC,SEQ ID NO:54)。
通过添加等体积的2x NOVEXTM TBE-尿素样品缓冲液(ThermoFisher,Waltham,MA)终止反应,并在70℃下加热3分钟。将样品冷却,并将15μl添加至NOVEXTM TBE-尿素聚丙烯酰胺凝胶(15%,ThermoFisher,Waltham,MA)中,在150V下电泳,用亚甲基蓝染色,用去离子水脱色,并使用AZURETM 200凝胶成像工作站(Azure Biosystems,Dublin,CA)用白光成像。
图3A显示了将单个核苷酸有效添加至上述四种不同的寡核苷酸底物中。
顺序核苷酸添加的测定
在由50mM乙酸钾和20mM乙酸Tis组成的缓冲液中在pH 7.5下进行顺序核苷酸添加反应。用10mM乙酸镁和250μM氯化钴补充反应缓冲液。使反应在500μM dNTP、10μM的单链DNA寡核苷酸和1μg的酶/10μl反应的存在下进行。反应在30℃下孵育15分钟。当进行用于添加多种dNTP的顺序反应时,反应体积被放大至高达100ul。使用具有以下序列PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)和dTTP作为核苷三磷酸的单链DNA寡核苷酸进行初始反应。
通过在100℃下煮沸3分钟来终止反应,并使用来自Zymo Research(Irvine,CA)的Oligonucleotide Clean and Concentrator试剂盒根据生产商的说明在硅胶柱上从反应组分中纯化寡核苷酸,并在蒸馏水中洗脱。使用来自Thermo Scientific(Waltham,MA)的NANODROPTM One分光光度计和留出用于凝胶电泳的等分试样测量纯化的寡核苷酸的浓度。然后,在与起始寡核苷酸相同的过程中使用dGTP将剩余的纯化寡核苷酸用于另外的反应中。
通过添加至样品并进行重复分析,将以下寡核苷酸用作标准品(见图4B、D、F和H):PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45);PG5864(GTCCTCAATCGCACTGGAATT,SEQ IDNO:46);PG5865(GTCCTCAATCGCACTGGAATTG,SEQ ID NO:47);PG5866(GTCCTCAATCGCACTGGAATTGA,SEQ ID NO:48);和PG5867(GTCCTCAATCGCACTGGAATTGAC,SEQID NO:54)。
为了通过凝胶电泳进行分析,通过添加等体积的2x NOVEXTM TBE-尿素样品缓冲液(ThermoFisher,Waltham,MA)稀释样品,并在70℃下加热3分钟。将样品冷却,并将15μl添加至NOVEXTM TBE-尿素聚丙烯酰胺凝胶(15%,ThermoFisher,Waltham,MA)中,在150V下电泳,用亚甲基蓝染色,用去离子水脱色,并使用AZURETM 200凝胶成像工作站(AzureBiosystems,Dublin,CA)用白光成像。
图3B显示了使用SEQ ID NO:45中给出的序列将两个核苷酸有效地连续添加至寡核苷酸底物中。
通过毛细管电泳测定单个核苷酸添加
通过在由50mM乙酸钾和20mM乙酸tris组成的缓冲液中在pH 7.5下进行反应来测定使用单个dNTP寡核苷酸对的酶活性。用10mM乙酸镁和250μM氯化钴补充反应缓冲液。使反应在500μM dNTP、10μM的单链DNA寡核苷酸和1μg的酶/10μl反应的存在下进行。反应在30℃下孵育15分钟。反应以10μl体积进行,并在冰上设置。
使用的寡核苷酸:PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45);PG5864(GTCCTCAATCGCACTGGAATT,SEQ ID NO:46);PG5872(GTCCTCAATCGCACTGGAATG,SEQ ID NO:53);PG5859(GTCCTCAATCGCACTGGAAG,SEQ ID NO:43);PG5868(GTCCTCAATCGCACTGGAAGT,SEQ ID NO:49);PG5869(GTCCTCAATCGCACTGGAAGC,SEQ ID NO:50);PG5858(GTCCTCAATCGCACTGGAAA,SEQ ID NO:42)。
在单独的反应中,用dATP、dTTP、dGTP和dCTP分别评估向每种寡核苷酸的酶促添加。通过在100℃下煮沸3分钟来终止反应,并使用来自Zymo Research(Irvine,CA)的Oligonucleotide Clean and Concentrator试剂盒根据生产商的说明在硅胶柱上从反应组分中纯化寡核苷酸,并在蒸馏水中洗脱。然后,在Agilent Technologies(Santa Clara,CA)的Agilent Oligo Pro II毛细管电泳系统上使用24毛细管阵列分析纯化的寡核苷酸。将在水中的纯化寡核苷酸稀释至~0.5-2μM,以使用9-12kV范围内的进样方法进行分析10秒,随后在15kV下分离70分钟。使用Agilent Oligo Pro II数据分析软件2.0.0.3(AgilentTechnologies,Santa Clara,CA)对数据进行分析。通过对每个样品进行两次独立的运行来进行反应分析。一次运行仅包含Agilent Oligo Pro II上的纯样品,以评估起始寡核苷酸的纯度和转化率百分比(图4A、4C、4E和4G)。在进行反应后,将标准品加标至每个样品中进行第二次运行,以准确测定纯化的寡核苷酸的大小(图4B、4D、4F和4H)。
以下寡核苷酸标准品以~1μM最终浓度加标:PG1350(GCGTCACGCTACCAACCA,SEQID NO:41);PG5870(GTCCTCAATCGCACTGGAAACATCAAGGTC,SEQ ID NO:51);PG5871(GTCCTCAATCGCACTGGAAACATCAAGGTCATACGGAACG,SEQ ID NO:52)。每个特定反应中使用的寡核苷酸也以~1μM与标准品一起加标。
Agilent Oligo Pro II仪器上代表性毛细管电泳运行的图谱如图4A-H所示。图4A和4B显示了在酶促反应中未处理的对照寡核苷酸的毛细管电泳运行。图4C和4D显示了寡核苷酸PG5861(SEQ ID NO:45)与dTTP和酶EDS082反应后,将单个核苷酸的部分添加至单链寡核苷酸中(见表1)。图4E和4F显示了寡核苷酸PG5861(SEQ ID NO:45)与dTTP和酶EDS054反应后,将单个核苷酸有效添加至单链寡核苷酸中(见表1)。图4G和4H显示了寡核苷酸PG5861(SEQ ID NO:45)与dTTP和酶EDS066反应后,将1、2、3、4和5个核苷酸添加至单链寡核苷酸中(见表1)。
显示单个核苷酸添加的50个代表性反应的结果总结在下表2中。
N表示在这些反应中用作底物的寡核苷酸的核苷酸长度。
<N%表示短于N的产物(例如寡核苷酸底物的降解产物)的百分比。
N%表示长度为N的产物(例如未反应的寡核苷酸底物)的百分比。
N+1%表示比N长一个核苷酸的产物(例如期望的延伸产物)的百分比。
N+>1%表示比N长2个或更多个核苷酸的产物(例如接收两个或更多个添加核苷酸的寡核苷酸底物的延伸产物)的百分比。
该表清楚地显示了每个实施例中期望的N+1延伸产物的产率,其中单个核苷酸添加效率在36%至100%范围内。
/>
/>
用于核糖核苷酸添加的测定
通过在由50mM乙酸钾和20mM乙酸tris组成的缓冲液中在pH 7.5下进行反应来测定使用四种NTP的等摩尔混合物的酶活性。用10mM乙酸镁和250μM氯化钴补充反应缓冲液。反应在500μM d=NTP、10μM的单链DNA寡核苷酸和1μg的酶/10μl反应的存在下进行。反应在一系列温度下孵育,从15℃开始并以1℃/分钟的速率升温至37℃。反应以10μl体积进行,并在冰上设置。
对于初始活性筛选(图5A),使用单链DNA寡核苷酸的等摩尔混合物:PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45);PG5859(GTCCTCAATCGCACTGGAAG,SEQ ID NO:43);PG5860(GTCCTCAATCGCACTGGAAC,SEQ ID NO:44);PG5858(GTCCTCAATCGCACTGGAAA,SEQID NO:42)。为了测定NTP向单链DNA寡核苷酸的添加(图5B),在每个反应中使用PG5861(GTCCTCAATCGCACTGGAAT,SEQ ID NO:45)。
通过添加等体积的2x NOVEXTM TBE-尿素样品缓冲液(ThermoFisher,Waltham,MA)终止反应,并加热至70℃持续3分钟。将样品冷却,并将15μl添加至NOVEXTM TBE-尿素聚丙烯酰胺凝胶(15%,ThermoFisher,Waltham,MA)中,在150V下电泳,用亚甲基蓝染色,用水脱色,并使用AZURETM200凝胶成像工作站用白光成像。
将核糖核苷酸添加至DNA寡核苷酸的结果实例如图5中所示。酶EDS017、EDS024、EDS029、EDS030、EDS066、EDS082、EDS048和EDS015全部显示出掺入核糖核苷酸的能力。在大多数情况下,这种掺入仅限于1-3个核苷酸。
不同酶将核糖核苷酸添加至DNA寡核苷酸末端的能力总结于表3中。
参考文献
Andrade P,Martín MJ,Juárez R,López de Saro F,Blanco L(2009).Limitedterminal transferase in human DNA polymerase mu defines the required balancebetween accuracy and efficiency in NHEJ.Proc Natl Acad Sci U S A106(38):16203-16208.
Beard WA,Wilson SH(2014).Structure and mechanism of DNApolymerasebeta.Biochemistry 53(17):2768-2780.
Bebenek K,Kunkel TA(2002)Family growth:the eukaryotic DNApolymeraserevolution.Cell Mol Life Sci.59(1):54-57.
Berdis AJ(2009).Mechanisms of DNA polymerases.Chem Rev.109(7):2862-2879.
Berdis AJ(2014).DNA polymerases that perform template-independentDNAsynthesis.Nucl.Acids Mol.Biol.30:109-137.
Bornscheuer UT,M,Eds.(2018).Protein Engineering:MethodsandProtocols.Methods Mol Biol.1685.Humana Press,New York,NY.
Callebaut I,Mornon JP(1997).From BRCA1 to RAP1:a widespreadBRCTmodule closely associated with DNA repair.FEBS Lett.400(1):25-30.
Chang YK,Huang YP,Liu XX,Ko TP,Bessho Y,Kawano Y,Maestre-Reyna M,WuWJ,Tsai MD(2019).Human DNA Polymerase mu CanUse a Noncanonical Mechanism forMultiple Mn(2+)-Mediated Functions.J AmChem Soc.141(21):8489-8502.
Chen Z,Zeng AP(2016).Protein engineering approaches tochemicalbiotechnology.Curr Opin Biotechnol.42:198-205.
Clark JM(1988).Novel non-templated nucleotide additionreactionscatalyzed by procaryotic and eucaryotic DNA polymerases.Nucl AcidsRes16(20):9677–9686.
Dahl JM,Wang H,Lázaro JM,Salas M,Lieberman KR(2014).Dynamicsoftranslocation and substrate binding in individual complexes formed withactivesite mutants of{phi}29 DNA polymerase.J Biol Chem.289(10):6350-6361.
Deibel MR Jr,Coleman MS(1980).Biochemical properties of purifiedhumanterminal deoxynucleotidyltransferase.J Biol Chem.255(9):4206-4212.
Delarue M,BouléJB,Lescar J,N,Jourdan N,SukumarN,Rougeon F,Papanicolaou C(2002).Crystal structures of atemplate-independentDNA polymerase:murine terminaldeoxynucleotidyltransferase.EMBO J.21(3):427-439.
Deshpande S,Yang Y,Chilkoti A,Zauscher S(2019).Enzymatic synthesisandmodification of high molecular weight DNA using terminaldeoxynucleotidyltransferase.Methods Enzymol.627:163-188.
Diehl F,Li M,He Y,Kinzler KW,Vogelstein B,Dressman D(2006).BEAMing:single-molecule PCR on microparticles in water-in-oil emulsions.Nat Methods 3(7):551-559.
Domínguez O,Ruiz JF,Laín de Lera T,García-Díaz M,González MA,Kirchhoff T,Martínez-A C,Bernad A,Blanco L(2000).DNA polymerase mu(Pol mu),homologous to TdT,could act as a DNA mutator in eukaryotic cells.EMBO J.19(7):1731-1742.
Efcavitch,WJ,Sylvester JE(2016).Modified template-independentenzymesfor deoxynucleotide synthesis.World Intellectual PropertyOrganization patentapplication WO 2016/064880 Al.
Eisenbeis S,B(2010).Evolutionary mechanism as a templateforprotein engineering.J Pept Sci.16(10):538-544.
Fiala KA,Brown JA,Ling H,Kshetry AK,Zhang J,Taylor JS,Yang W,Suo Z(2007).Mechanism of template-independent nucleotide incorporationcatalyzed bya template-dependent DNA polymerase.J Mol Biol.365(3):590-602.
Foo JL,Ching CB,Chang MW,Leong SS(2012).The imminent role ofproteinengineering in synthetic biology.Biotechnol Adv.30(3):541-549.
Fowler JD,Suo Z(2006).Biochemical,structural,andphysiologicalcharacterization of terminal deoxynucleotidyl transferase.ChemRev.106(6):2092-2110.
Frank EG,McLenigan MP,McDonald JP,Huston D,Mead S,Woodgate R(2017).DNA polymerase iota:The long and the short of it!DNA Repair(Amst).58:47-51.
Ghadessy FJ,Ong JL,Holliger P(2001).Directed evolution ofpolymerasefunction by compartmentalized self-replication.Proc Natl Acad Sci US A98(8):4552-4557.
Ghadessy FJ,Holliger P(2007).Compartmentalized self-replication:anovel method for the directed evolution of polymerases and otherenzymes.Methods Mol Biol.352:237-248.
Global Oligonucleotide Synthesis Market Size,Industry Report,2025.Grand View Research,San Francisco,CA,Oct 2018.
Golosov AA,Warren JJ,Beese LS,Karplus M(2010).The mechanism ofthetranslocation step in DNA replication by DNA polymerase I:acomputersimulation analysis.Structure 18(1):83-93.
Gouge J,Rosario S,Romain F,Beguin P,Delarue M(2013).Structuresofintermediates along the catalytic cycle of terminaldeoxynucleotidyltransferase:dynamical aspects of the two-metal ionmechanism.J Mol Biol.425(22):4334-4352.
Griffiths AD,Tawfik DS(2006).Miniaturising the laboratory inemulsiondroplets.Trends Biotechnol.24(9):395-402.
Guo C,Kosarek-Stancel JN,Tang TS,Friedberg EC(2009).Y-familyDNApolymerases in mammalian cells.Cell Mol Life Sci.66(14):2363-2381.
Hiatt AC,Rose F(1995).3'protected nucleotides for enzymecatalyzedtemplate-independent creation of phosphodiester bonds.US patent 5,763,594and related patents.
Hiatt AC,Rose F(1995).Compositions for enzyme catalyzedtemplate-independent creation of phosphodiester bonds using protectednucleotides.USpatent 5,808,045 and related patents.
Hoff K,Halpain M,Garbagnati G,Edwards JS,Zhou W(2020).EnzymaticSynthesis of Designer DNA Using Cyclic Reversible Termination andaUniversal Template.ACS Synth Biol.9(2):283-293.
Hogg M,Sauer-Eriksson AE,Johansson E(2012).Promiscuous DNAsynthesisby human DNA polymerase teta.Nucleic Acids Res.40(6):2611-22.
Hoitsma NM,Whitaker AM,Schaich MA,Smith MR,Fairlamb MS,Freudenthal BD(2020).Structure and function relationships in mammalianDNA polymerases.CellMol Life Sci.77(1):35-59.
Jarosz DF,Beuning PJ,Cohen SE,Walker GC(2007).Y-family DNApolymerasesin Escherichia coli.Trends Microbiol.15(2):70-77.
Jensen MA,Davis RW(2018).Template-IndependentEnzymaticOligonucleotide Synthesis(TiEOS):Its History,Prospects,andChallenges.Biochemistry 57(12):1821-1832.
Jensen MA,Griffin P,Davis RW(2018a).Free-runningenzymaticoligonucleotide synthesis for data storage applications.bioRxiv June2018.https://doi.org/10.1101/355719.
Johnson LB,Huber TR,Snow CD(2014).Methods for library-scalecomputational protein design.Methods Mol Biol.1216:129-59.
Juárez R,Ruiz JF,Nick McElhinny SA,Ramsden D,Blanco L(2006).Aspecificloop in human DNA polymerase mu allows switching between creativeand DNA-instructed synthesis.Nucleic Acids Res.34(16):4572-4582.
Kaminski AM,Bebenek K,Pedersen LC,Kunkel TA(2020).DNApolymerase mu:Aninflexible scaffold for substrate flexibility.DNA Repair(Amst).93:102932.
Kaushik M,Sinha P,Jaiswal P,Mahendru S,Roy K,Kukreti S(2016).Proteinengineering and de novo designing of a biocatalyst.J Mol Recognit.29(10):499-503.
Kazlauskas D,Krupovic M,Guglielmini J,Forterre P,Venclovas(2020).Diversity and evolution of B-family DNA polymerases.Nucleic Acids Res.48(18):10142-10156.
Kent T,Mateos-Gomez PA,Sfeir A,Pomerantz RT(2016).Polymerase tetais arobust terminal transferase that oscillates between three differentmechanismsduring end-joining.Elife 5:e13740.
Leatherbarrow RJ,Fersht AR(1986).Protein engineering.Protein Eng.1(1):7-16.
Lee H,Wiegand DJ,Griswold K,Punthambaker S,Chun H,Kohman RE,Church GM(2020).Photon-directed multiplexed enzymatic DNA synthesis formoleculardigital data storage.Nat Commun.11(1):5246.
Leisola M,Turunen O(2007).Protein engineering:opportunitiesandchallenges.Appl Microbiol Biotechnol.75(6):1225-1232.
Loc'h J,Delarue M(2018).Terminal deoxynucleotidyltransferase:thestoryof an untemplated DNA polymerase capable of DNA bridging andtemplatedsynthesis across strands.Curr Opin Struct Biol.53:22-31.
Lutz S,Benkovic SJ(2000).Homology-independent proteinengineering.Curr Opin Biotechnol.11(4):319-324.
Lutz S,Iamurri SM(2018).Protein Engineering:Past,Present,andFuture.Methods Mol Biol.1685:1-12.
Lee HH,Kalhor R,Goela N,Bolot J,Church GM(2018).EnzymaticDNAsynthesis for digital information storage.bioRxiv June 2018.
Lee HH,Kalhor R,Goela N,Bolot J,Church GM(2019).Terminator-freetemplate-independent enzymatic DNA synthesis for digital informationstorage.Nat Commun.10(1):2383.
Marcheschi RJ,Gronenberg LS,Liao JC(2013).Protein engineeringformetabolic engineering:current and next-generation tools.Biotechnol J.8(5):545-55.
Maxwell BA,Suo Z(2014).Recent insight into the kinetic mechanismsandconformational dynamics of Y-Family DNA polymerases.Biochemistry3(17):2804-2814.
Miller OJ,Bernath K,Agresti JJ,Amitai G,Kelly BT,Mastrobattista E,Taly V,Magdassi S,Tawfik DS,Griffiths AD(2006).Directed evolution by invitrocompartmentalization.Nat Methods 3(7):561-570.
Moon,AF,Garcia-Diaz,M,Bebenek,K,Davis,BJ,Zhong,X,Ramsden,DA,KunkelTA,Pedersen,LC(2007).Structural insight into the substratespecificity of DNAPolymerase mu.Nat.Struct.Mol.Biol.2007,14(1),45-53.
Moon AF,Garcia-Diaz M,Batra VK,Beard WA,Bebenek K,Kunkel TA,WilsonSH,Pedersen LC(2007a).The X family portrait:structural insights intobiological functions of X family polymerases.DNA Repair(Amst).6(12):1709-1725.
Moon AF,Pryor JM,Ramsden DA,Kunkel TA,Bebenek K,Pedersen LC(2014).Sustained active site rigidity during synthesis by human DNA polymerasemu.Nat Struct Mol Biol.21(3):253-260.
Motea EA,Berdis AJ(2010).Terminal deoxynucleotidyl transferase:thestory of a misguided DNA polymerase.Biochim Biophys Acta1804(5):1151-1166.
Mueller R,Pajatsch M,Curdt I,Sobek H,Schmidt M,Suppmann B,Sonn K,Schneidinger B(2009).Recombinant terminal deoxynucleotidyl transferase withimproved functionality.United States Patent 7,494,797.
Oligonucleotide Synthesis Market.MarketsandMarketsTMResearch PrivateLtd.,Pune,India,April 2019.
O'Fágáin C.Engineering protein stability(2011).Methods Mol Biol.681:103-36.
Packer MS,Liu DR(2015).Methods for the directed evolution ofproteins.Nat Rev Genet.16(7):379-394.
Palluk S,Arlow DH,de Rond T,Barthel S,Kang JS,Bector R,BaghdassarianHM,Truong AN,Kim PW,Singh AK,Hillson NJ,Keasling JD(2018).De novo DNAsynthesis using polymerase-nucleotide conjugates.Nat Biotechnol.36(7):645-650.
Perkel JM(2019).The race for enzymatic DNA synthesis heatsup.Nature566(7745):565.
Ramadan K,Shevelev I,Hübscher U(2004).The DNA-polymerase-X family:controllers of DNA quality?Nat Rev Mol Cell Biol.5(12):1038-1043.
Rechkoblit O,Malinina L,Cheng Y,Kuryavyi V,Broyde S,Geacintov NE,Patel DJ(2006).Stepwise translocation of Dpo4 polymerase during error-freebypass of an oxoG lesion.PLoS Biol.4(1):e11.
Ren Z(2016).Molecular events during translocation andproofreadingextracted from 200 static structures of DNA polymerase.NucleicAcids Res.44(15):7457-7474.
Repasky JA,Corbett E,Boboila C,Schatz DG(2004).Mutational analysisofterminal deoxynucleotidyltransferase-mediated N-nucleotide addition inV(D)Jrecombination.J Immunol.172(9):5478-5488.
Ruiz JF,Domínguez O,Laín de Lera T,Garcia-Díaz M,Bernad A,BlancoL(2001).DNA polymerase mu,a candidate hypermutase?Philos Trans R SocLond BBiol Sci.356(1405):99-109.
Samkurashvili I,Luse DS(1996).Translocation and transcriptionalarrestduring transcript elongation by RNA polymerase II.J Biol Chem.1996Sep20;271(38):23495-23505.
Sarac I,Hollenstein M(2019).Terminal Deoxynucleotidyl Transferaseinthe Synthesis and Modification of Nucleic Acids.Chembiochem 20(7):860-871.
Schott H,Schrade H(1984).Single-step elongationofoligodeoxynucleotides using terminal deoxynucleotidyl transferase.EurJBiochem.143(3):613-620.
Shin H,Cho BK(2015).Rational Protein Engineering Guided byDeepMutational Scanning.Int J Mol Sci.16(9):23094-23110.
Singh RK,Lee JK,Selvaraj C,Singh R,Li J,Kim SY,Kalia VC(2018).ProteinEngineering Approaches in the Post-Genomic Era.Curr Protein Pept Sci.19(1):5-15.
Sinha R,Shukla P(2019).Current Trends in Protein Engineering:Updatesand Progress.Curr Protein Pept Sci.20(5):398-407.
Swint-Kruse L(2016).Using Evolution to Guide Protein Engineering:TheDevil IS in the Details.Biophys J.111(1):10-18.
Takeuchi R,Choi M,Stoddard BL(2014).Redesign of extensiveprotein-DNAinterfaces of meganucleases using iterative cycles of invitrocompartmentalization.Proc Natl Acad Sci U S A.111(11):4061-4066.
Tawfik DS,Griffiths AD(1998).Man-made cell-like compartmentsformolecular evolution.Nature Biotechnol.16(7):652-656.
Tay Y,Ho C,Droge P,Ghadessy FJ(2010).Selection of bacteriophagelambdaintegrases with altered recombination specificity by in vitrocompartmentalization.Nucleic Acids Res.38(4):e25.
Trakselis MA,Murakami KS(2014).Introduction to NucleicAcidPolymerases:Families,Themes,and Mechanisms.Nucl.Acids Mol.Biol.30:1-15.
Uchiyama Y,Takeuchi R,Kodera H,Sakaguchi K(2009).Distributionandroles of X-family DNA polymerases in eukaryotes.Biochimie 91(2):165-170.
Vaisman A,Woodgate R(2017).Translesion DNA polymerases ineukaryotes:what makes them tick?Crit Rev Biochem Mol Biol.2017Jun;52(3):274-303.
Wilding M,Hong N,Spence M,Buckle AM,Jackson CJ(2019).Proteinengineering:the potential of remote mutations.Biochem Soc Trans.47(2):701-711.
Woodley JM(2013).Protein engineering of enzymes forprocessapplications.Curr Opin Chem Biol.17(2):310-316.
Wrenbeck EE,Faber MS,Whitehead TA(2017).Deep sequencing methodsforprotein engineering and design.Curr Opin Struct Biol.45:36-44.
Yamtich J,Sweasy JB(2010).DNA polymerase family X:function,structure,and cellular roles.Biochim Biophys Acta 1804(5):1136-1150.
Yang W(2014).An overview of Y-Family DNA polymerases and a casestudyof human DNA polymerase eta.Biochemistry 53(17):2793-2803.
Yang W,Gao Y(2018).Translesion and Repair DNA Polymerases:DiverseStructure and Mechanism.Annu Rev Biochem.87:239-261.
Yang KK,Wu Z,Arnold FH(2019).Machine-learning-guideddirectedevolution for protein engineering.Nat Methods 16(8):687-694.
Zahn KE,Wallace SS,DoubliéS(2011).DNA polymerases provide acanon ofstrategies for translesion synthesis past oxidatively generated lesions.CurrOpin Struct Biol.21(3):358-369.
Zawaira A,Pooran A,Barichievy S,Chopera D(2012).A discussion ofmolecular biology methods for protein engineering.Mol Biotechnol.51(1):67-102.
Zoller MJ(1991).New molecular biology methods for proteinengineering.Curr Opin Biotechnol.2(4):526-531。
本说明书中引用的所有出版物、数据库、GenBank序列、专利和专利申请均通过引用并入本文,如同其各自被明确地且单独地指示通过引用并入本文一样。
序列表
<110> 普里姆罗斯生物公司(PRIMROSE BIO, INC.)
<120> 用于酶促核酸合成的用途和方法
<130> PPI23172549US
<150> US 63/210,429
<151> 2021-06-14
<160> 54
<170> PatentIn 3.5版
<210> 1
<211> 632
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 1
Met Ser Lys Phe Thr Trp Lys Glu Leu Ile Gln Leu Gly Ser Pro Ser
1 5 10 15
Lys Ala Tyr Glu Ser Ser Leu Ala Cys Ile Ala His Ile Asp Met Asn
20 25 30
Ala Phe Phe Ala Gln Val Glu Gln Met Arg Cys Gly Leu Ser Lys Glu
35 40 45
Asp Pro Val Val Cys Val Gln Trp Asn Ser Ile Ile Ala Val Ser Tyr
50 55 60
Ala Ala Arg Lys Tyr Gly Ile Ser Arg Met Asp Thr Ile Gln Glu Ala
65 70 75 80
Leu Lys Lys Cys Ser Asn Leu Ile Pro Ile His Thr Ala Val Phe Lys
85 90 95
Lys Gly Glu Asp Phe Trp Gln Tyr His Asp Gly Cys Gly Ser Trp Val
100 105 110
Gln Asp Pro Ala Lys Gln Ile Ser Val Glu Asp His Lys Val Ser Leu
115 120 125
Glu Pro Tyr Arg Arg Glu Ser Arg Lys Ala Leu Lys Ile Phe Lys Ser
130 135 140
Ala Cys Asp Leu Val Glu Arg Ala Ser Ile Asp Glu Val Phe Leu Asp
145 150 155 160
Leu Gly Arg Ile Cys Phe Asn Met Leu Met Phe Asp Asn Glu Tyr Glu
165 170 175
Leu Thr Gly Asp Leu Lys Leu Lys Asp Ala Leu Ser Asn Ile Arg Glu
180 185 190
Ala Phe Ile Gly Gly Asn Tyr Asp Ile Asn Ser His Leu Pro Leu Ile
195 200 205
Pro Glu Lys Ile Lys Ser Leu Lys Phe Glu Gly Asp Val Phe Asn Pro
210 215 220
Glu Gly Arg Asp Leu Ile Thr Asp Trp Asp Asp Val Ile Leu Ala Leu
225 230 235 240
Gly Ser Gln Val Cys Lys Gly Ile Arg Asp Ser Ile Lys Asp Ile Leu
245 250 255
Gly Tyr Thr Thr Ser Cys Gly Leu Ser Ser Thr Lys Asn Val Cys Lys
260 265 270
Leu Ala Ser Asn Tyr Lys Lys Pro Asp Ala Gln Thr Ile Val Lys Asn
275 280 285
Asp Cys Leu Leu Asp Phe Leu Asp Cys Gly Lys Phe Glu Ile Thr Ser
290 295 300
Phe Trp Thr Leu Gly Gly Val Leu Gly Lys Glu Leu Ile Asp Val Leu
305 310 315 320
Asp Leu Pro His Glu Asn Ser Ile Lys His Ile Arg Glu Thr Trp Pro
325 330 335
Asp Asn Ala Gly Gln Leu Lys Glu Phe Leu Asp Ala Lys Val Lys Gln
340 345 350
Ser Asp Tyr Asp Arg Ser Thr Ser Asn Ile Asp Pro Leu Lys Thr Ala
355 360 365
Asp Leu Ala Glu Lys Leu Phe Lys Leu Ser Arg Gly Arg Tyr Gly Leu
370 375 380
Pro Leu Ser Ser Arg Pro Val Val Lys Ser Met Met Ser Asn Lys Asn
385 390 395 400
Leu Arg Gly Lys Ser Cys Asn Ser Ile Val Asp Cys Ile Ser Trp Leu
405 410 415
Glu Val Phe Cys Ala Glu Leu Thr Ser Arg Ile Gln Asp Leu Glu Gln
420 425 430
Glu Tyr Asn Lys Ile Val Ile Pro Arg Thr Val Ser Ile Ser Leu Lys
435 440 445
Thr Lys Ser Tyr Glu Val Tyr Arg Lys Ser Gly Pro Val Ala Tyr Lys
450 455 460
Gly Ile Asn Phe Gln Ser His Glu Leu Leu Lys Val Gly Ile Lys Phe
465 470 475 480
Val Thr Asp Leu Asp Ile Lys Gly Lys Asn Lys Ser Tyr Tyr Pro Leu
485 490 495
Thr Lys Leu Ser Met Thr Ile Thr Asn Phe Asp Ile Ile Asp Leu Gln
500 505 510
Lys Thr Val Val Asp Met Phe Gly Asn Gln Val His Thr Phe Lys Ser
515 520 525
Ser Ala Gly Lys Glu Asp Glu Glu Lys Thr Thr Ser Ser Lys Ala Asp
530 535 540
Glu Lys Thr Pro Lys Leu Glu Cys Cys Lys Tyr Gln Val Thr Phe Thr
545 550 555 560
Asp Gln Lys Ala Leu Gln Glu His Ala Asp Tyr His Leu Ala Leu Lys
565 570 575
Leu Ser Glu Gly Leu Asn Gly Ala Glu Glu Ser Ser Lys Asn Leu Ser
580 585 590
Phe Gly Glu Lys Arg Leu Leu Phe Ser Arg Lys Arg Pro Asn Ser Gln
595 600 605
His Thr Ala Thr Pro Gln Lys Lys Gln Val Thr Ser Ser Lys Asn Ile
610 615 620
Leu Ser Phe Phe Thr Arg Lys Lys
625 630
<210> 2
<211> 498
<212> PRT
<213> 红鳍东方鲀( Takifugu rubripes)
<400> 2
Met Phe His Ala Thr Ala Leu Pro Arg Met Arg Lys Arg Pro Arg Pro
1 5 10 15
Glu Glu Val Ala Cys Pro Gly Arg Glu Asp Val Lys Phe Arg Asp Val
20 25 30
Arg Leu Tyr Leu Val Glu Met Lys Met Gly Arg Ser Arg Arg Ser Phe
35 40 45
Leu Thr Gln Leu Ala Arg Ser Lys Gly Phe Met Val Glu Glu Val Leu
50 55 60
Ser Asn Arg Val Thr His Val Val Ser Glu Ser Ser Gln Ala Pro Val
65 70 75 80
Leu Trp Ala Trp Leu Lys Glu Arg Ala Pro Gln Asp Leu Pro Asn Met
85 90 95
His Val Val Asn Ile Thr Trp Phe Thr Asp Ser Met Arg Glu Ser Arg
100 105 110
Pro Val Ala Val Glu Thr Arg His Leu Ile Gln Asp Thr Leu Pro Ala
115 120 125
Ile Pro Glu Gly Gly Ala Pro Ala Ala Glu Val Ser Gln Tyr Ala Cys
130 135 140
Gln Arg Arg Thr Thr Thr Asp Asn Tyr Asn Val Val Phe Thr Asp Ala
145 150 155 160
Phe Glu Val Leu Ala Glu Cys Tyr Glu Phe Asn Gln Met Asp Gly Arg
165 170 175
Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Arg
180 185 190
Gly Leu Ser Ser Leu Glu Glu Thr His Ser Leu Pro Cys Leu Gly Gly
195 200 205
His Ala Lys Ala Ile Ile Gly Glu Ile Leu Gln His Gly Arg Ala Phe
210 215 220
Asp Val Glu Lys Val Leu Ser Asp Glu Arg Tyr Gln Thr Leu Lys Leu
225 230 235 240
Phe Thr Ser Val Tyr Gly Val Gly Pro Lys Thr Ala Glu Lys Trp Tyr
245 250 255
Arg Ser Gly Leu Arg Ser Leu Asp His Ile Leu Ala Asp Gln Ser Ile
260 265 270
Gln Leu Asn His Met Gln Gln Asn Gly Phe Leu His Tyr Gly Asp Ile
275 280 285
Ser Arg Ala Val Ser Lys Ala Glu Ala Arg Ala Leu Thr Lys Ala Ile
290 295 300
Gly Glu Thr Val Gln Ala Ile Thr Pro Asp Ala Leu Leu Ala Leu Thr
305 310 315 320
Gly Gly Phe Arg Arg Gly Lys Glu Phe Gly His Asp Val Asp Ile Ile
325 330 335
Phe Thr Thr Leu Glu Leu Gly Met Glu Glu Asn Leu Leu Leu Ala Val
340 345 350
Ile Lys Ser Leu Glu Lys Gln Gly Ile Leu Leu Tyr Cys Asp Tyr Gln
355 360 365
Ala Ser Thr Phe Asp Leu Thr Lys Leu Pro Thr His Ser Phe Glu Ala
370 375 380
Met Asp His Phe Ala Lys Cys Phe Leu Ile Leu Arg Leu Glu Ala Ser
385 390 395 400
Gln Val Glu Glu Gly Leu Asn Ser Pro Val Glu Asp Ile Arg Gly Trp
405 410 415
Arg Ala Val Arg Val Asp Leu Val Ser Pro Pro Val Asp Arg Tyr Ala
420 425 430
Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu
435 440 445
Arg Arg Phe Ala Arg Lys Glu Arg Arg Met Leu Leu Asp Asn His Gly
450 455 460
Leu Tyr Asp Lys Thr Lys Glu Glu Phe Leu Ala Ala Gly Thr Glu Lys
465 470 475 480
Asp Ile Phe Asp His Leu Gly Leu Glu Tyr Met Glu Pro Trp Gln Arg
485 490 495
Asn Ala
<210> 3
<211> 568
<212> PRT
<213> 光滑念珠菌(Candida glabrata)
<400> 3
Met Gly Ile Leu Ser Gly Lys Lys Phe Leu Ile Leu Pro Asn Ser His
1 5 10 15
Thr Gly Ser Val Asn Ile Leu Ala Gly Ile Val Lys Glu Gln Gly Gly
20 25 30
Phe Leu Val Ser Ser Ala Asp Arg Leu Ser Asn Asp Val Val Val Leu
35 40 45
Val Asn Asp Ser Phe Val Asp Lys Thr Asn Lys Ile Val Asn Arg Gly
50 55 60
Leu Phe Leu Lys Glu Phe Glu Leu Asp Ala Ser Val Val Trp Thr Tyr
65 70 75 80
Val Leu Glu Asn Glu Leu Val Cys Leu Arg Val Ser Leu Val Pro Ser
85 90 95
Trp Val Glu Asn Gly Thr Phe His Phe Ser Asp Ser Glu Arg Ile Ile
100 105 110
Leu Leu Asp Ser Glu Ser Gln Glu Arg Asp Thr Lys Asn Val Gln Phe
115 120 125
His Ser Ala Gly Asn Glu Glu Ala Gly Ser Asp Asp Glu Thr Asp Val
130 135 140
Glu Gly Asn Lys Glu Ser Thr Gly Asp Ile Thr Asp Val Ser Asp Thr
145 150 155 160
Ala Thr Pro Gln Leu Gln Ser Ser Pro Leu Ser Lys Tyr Ile Lys Gln
165 170 175
Glu Glu Asp Ile Asp Asn Gln Val Leu Ile Lys Ala Leu Gly Arg Leu
180 185 190
Val Lys Lys Tyr Glu Val Lys Gly Asp Gln Tyr Arg Ser Arg Ser Tyr
195 200 205
Arg Leu Ala Lys Gln Ala Val Glu Lys Tyr Pro His Lys Ile Thr Ser
210 215 220
Gly Ser Gln Ala Gln Arg Gln Leu Ser Asn Ile Gly Ser Ser Ile Ala
225 230 235 240
Lys Lys Ile Gln Leu Leu Leu Asp Thr Gly Thr Leu Pro Gly Leu Glu
245 250 255
Asp Pro Ala Thr Asp Glu Tyr Glu Ser Ser Leu Gly Tyr Phe Ser Glu
260 265 270
Cys Tyr Gly Ile Gly Val Pro Met Ala Lys Lys Trp Ile Thr Leu Asn
275 280 285
Ile Ser Thr Phe Tyr Arg Ala Ala Arg Leu His Pro Lys Leu Phe Ile
290 295 300
Ser Asp Trp Pro Ile Leu Tyr Gly Trp Thr Tyr Tyr Glu Asp Trp Ser
305 310 315 320
Lys Arg Ile Pro Arg Asp Glu Val Thr Ala His Phe Glu Leu Val Lys
325 330 335
Glu Glu Val Arg Arg Val Gly Asn Gly Cys Ser Val Glu Met Gln Gly
340 345 350
Ser Tyr Val Arg Gly Ala Arg Asp Thr Gly Asp Val Asp Leu Met Phe
355 360 365
Tyr Lys Glu Asn Cys Asp Asp Leu Glu Glu Val Thr Ile Gly Met Glu
370 375 380
Asn Val Ala Ala Ser Leu Tyr Gln Lys Gly Tyr Ile Lys Cys Phe Leu
385 390 395 400
Leu Leu Thr Asp Lys Leu Glu Arg Met Phe Arg Pro Asp Ile Leu Ser
405 410 415
Arg Leu Gln Lys Cys Gly Ile Ala Glu Ile Ser Asn Glu His Thr Phe
420 425 430
Arg Asn Ser Asp Arg Gly Lys Lys Leu Phe Phe Gly Val Glu Leu Pro
435 440 445
Gly Asp Tyr Pro Ile Tyr Pro Phe Asp Asp Lys Asp Ile Leu Gln Leu
450 455 460
Lys Pro Gln Asp Lys Phe Met Ser Lys Ser Lys Asp Ala Gly His Phe
465 470 475 480
Cys Arg Arg Leu Asp Phe Phe Cys Cys Lys Trp Ser Glu Leu Gly Ala
485 490 495
Ala Arg Ile His Tyr Thr Gly Asn Thr Asp Tyr Asn Arg Trp Leu Arg
500 505 510
Val Arg Ala Met Asp Met Gly Tyr Lys Leu Thr Gln His Gly Ile Phe
515 520 525
Lys Asp Asp Val Leu Leu Glu Ser Phe Asp Glu Arg Lys Ile Phe Glu
530 535 540
Tyr Leu His Val Pro Tyr Leu Asn Pro Val Asp Arg Asn Lys Thr Asp
545 550 555 560
Trp Val Asn Ile Pro Ile Pro Lys
565
<210> 4
<211> 530
<212> PRT
<213> 威克汉姆西弗酵母(Wickerhamomyces ciferrii)
<400> 4
Met Asn Arg Ser Gly Gln Val Leu Ser Lys Met Ser Lys Thr Tyr Leu
1 5 10 15
Phe Asp Gly Leu Glu Phe Leu Phe Ile Pro Asn Ile Asn Ser Ser Lys
20 25 30
Val Thr Phe Thr Arg Lys Asn Leu Ala Arg Asn Gly Gly Ala Ser Val
35 40 45
Ala Lys Lys Phe Asp Gln Asp Thr Thr Thr His Val Leu Val Asp Thr
50 55 60
Lys Val Tyr Leu Thr Lys Asp Lys Ile Ser Ala Gly Leu Lys Asn Ala
65 70 75 80
Lys Val Pro Lys Thr Phe Gln Pro Gly Lys Ile Leu Asn Gln Thr Trp
85 90 95
Leu Val Asp Ser Ile Glu Gln Gln Lys Leu Leu Asp Thr Lys Glu Tyr
100 105 110
Ile Ile Lys Leu Asp Glu Leu Lys Pro Glu Thr Arg Lys Glu Ser Pro
115 120 125
Ala Ser Lys Gln His Ile Glu Asn Leu Gln Lys Gln Glu Thr Lys Glu
130 135 140
Lys Leu Ile Ala Glu Ser Ser Thr Gly Asn Pro Asn Glu Arg Thr Ile
145 150 155 160
Phe Leu Leu Asn Gln Met Ala Glu Glu Arg Leu Leu Gln Gly Glu His
165 170 175
Phe Lys Ala Lys Ala Tyr Lys Asn Ala Ile Asn Ala Leu Asn Asn Thr
180 185 190
Gly Asp Phe Ile Ser Asp Ala Asn Glu Ala Leu Arg Leu Lys Gly Ile
195 200 205
Gly Val Ser Val Ala Gln Lys Ile Glu Glu Ile Val Lys Thr Asn Thr
210 215 220
Leu Ser Ser Leu Asn Glu Ile Lys Ser Asp Lys Glu His Gln Val Ser
225 230 235 240
Lys Leu Phe Met Gly Ile His Gly Val Gly Pro Val Ser Ala Lys Lys
245 250 255
Trp Tyr Asn Asp Gly Leu Arg Thr Leu Glu Asp Val Ser Gln Lys Pro
260 265 270
Asp Leu Thr Ser Asn Gln Thr Leu Gly Leu Lys Tyr Tyr Asp Glu Trp
275 280 285
Leu Glu Arg Ile Pro Arg Asp Glu Cys Thr Leu His Asn Glu Phe Met
290 295 300
Ser Asp Leu Val Ser Gln Ile Asp Pro Leu Val Gln Phe Thr Ile Gly
305 310 315 320
Gly Ser Tyr Arg Arg Gly Ser Pro Thr Cys Gly Asp Val Asp Phe Ile
325 330 335
Ile Thr Lys Pro Asn Ala Asp Asn Glu Glu Met Lys Glu Ile Leu Glu
340 345 350
Lys Ile Leu Val Lys Ile Glu Gln Val Gly Tyr Leu Lys Cys Ser Leu
355 360 365
Gln Lys Lys His Ser Thr Lys Phe Leu Ser Gly Cys Ala Leu Pro Pro
370 375 380
Asn Tyr Ala Ser Arg Leu Pro Glu Tyr Ser Glu Gly Lys Trp Gly Lys
385 390 395 400
Cys Arg Arg Ile Asp Phe Leu Met Val Pro Trp Lys Glu Arg Gly Ala
405 410 415
Ala Phe Ile Tyr Phe Thr Gly Asn Asp Tyr Phe Asn Arg Leu Ile Arg
420 425 430
Leu Lys Ala Val Lys Asn Gly Leu Val Leu Asn Glu Ser Gly Leu Phe
435 440 445
Lys Arg Ile Lys Tyr Val Gln Gly Lys Asn Val Glu Asp Lys Thr Met
450 455 460
Leu Ile Glu Ser Phe Ser Glu Lys Lys Ile Phe Lys Leu Leu Gly Phe
465 470 475 480
Lys Tyr Val Pro Pro Glu Gln Arg Asn Phe Gly Ala Asn Asn Pro Pro
485 490 495
Ser Lys Leu Gly Lys His Leu Asp Gln Phe Arg Ile Asp His Lys Tyr
500 505 510
Phe Asp Lys Val Val Lys Glu Glu Ile Ile Asp Asp Asp Val Ile Glu
515 520 525
Val Asp
530
<210> 5
<211> 349
<212> PRT
<213> 铜绿假单胞菌(Pseudomonas aeruginosa)
<400> 5
Met Arg Lys Ile Ile His Ile Asp Cys Asp Cys Phe Tyr Ala Ala Leu
1 5 10 15
Glu Met Arg Asp Asp Pro Ser Leu Arg Gly Lys Ala Leu Ala Val Gly
20 25 30
Gly Ser Pro Asp Lys Arg Gly Val Val Ala Thr Cys Ser Tyr Glu Ala
35 40 45
Arg Ala Tyr Gly Val Arg Ser Ala Met Ala Met Arg Thr Ala Leu Lys
50 55 60
Leu Cys Pro Asp Leu Leu Val Val Arg Pro Arg Phe Asp Val Tyr Arg
65 70 75 80
Ala Val Ser Lys Gln Ile His Ala Ile Phe Arg Asp Tyr Thr Asp Leu
85 90 95
Ile Glu Pro Leu Ser Leu Asp Glu Ala Tyr Leu Asp Val Ser Ala Ser
100 105 110
Pro His Phe Ala Gly Ser Ala Thr Arg Ile Ala Gln Asp Ile Arg Arg
115 120 125
Arg Val Ala Glu Glu Leu Arg Ile Thr Val Ser Ala Gly Val Ala Pro
130 135 140
Asn Lys Phe Leu Ala Lys Ile Ala Ser Asp Trp Arg Lys Pro Asp Gly
145 150 155 160
Leu Phe Val Ile Thr Pro Glu Gln Val Asp Gly Phe Val Ala Glu Leu
165 170 175
Pro Val Ala Lys Leu His Gly Val Gly Lys Val Thr Ala Glu Arg Leu
180 185 190
Ala Arg Met Gly Ile Arg Thr Cys Ala Asp Leu Arg Gln Gly Ser Lys
195 200 205
Leu Ser Leu Val Arg Glu Phe Gly Ser Phe Gly Glu Arg Leu Trp Gly
210 215 220
Leu Ala His Gly Ile Asp Glu Arg Pro Val Glu Val Asp Ser Arg Arg
225 230 235 240
Gln Ser Val Ser Val Glu Cys Thr Phe Asp Arg Asp Leu Pro Asp Leu
245 250 255
Ala Ala Cys Leu Glu Glu Leu Pro Thr Leu Leu Glu Glu Leu Asp Gly
260 265 270
Arg Leu Gln Arg Leu Asp Gly Ser Tyr Arg Pro Asp Lys Pro Phe Val
275 280 285
Lys Leu Lys Phe His Asp Phe Thr Gln Thr Thr Val Glu Gln Ser Gly
290 295 300
Ala Gly Arg Asp Leu Glu Ser Tyr Arg Gln Leu Leu Gly Gln Ala Phe
305 310 315 320
Ala Arg Gly Asn Arg Pro Val Arg Leu Ile Gly Val Gly Val Arg Leu
325 330 335
Leu Asp Leu Gln Gly Ala His Glu Gln Leu Arg Leu Phe
340 345
<210> 6
<211> 358
<212> PRT
<213> 噬染料菌属( Pigmentiphaga sp. )H8
<400> 6
Met Arg Lys Ile Ile His Cys Asp Cys Asp Cys Phe Tyr Ala Ser Ile
1 5 10 15
Glu Met Arg Asp Asp Pro Ser Leu Arg Gly Arg Pro Leu Ala Val Gly
20 25 30
Gly Arg Pro Glu Thr Arg Gly Val Val Ala Thr Cys Asn Tyr Glu Ala
35 40 45
Arg Lys Tyr Gly Val His Ser Ala Met Ser Ser Ala Arg Ala Val Arg
50 55 60
Leu Cys Pro Asp Leu Leu Ile Ile Pro Pro Arg Met Glu Met Tyr Arg
65 70 75 80
Val Ala Ser Ala Gln Ile Met Asp Ile Tyr Arg Asp Tyr Thr Glu Leu
85 90 95
Val Glu Pro Leu Ser Leu Asp Glu Ala Tyr Leu Asp Val Thr Gly Ser
100 105 110
Asp Arg Leu Gln Gly Ser Ala Thr Arg Ile Ala Ser Glu Ile Arg Gln
115 120 125
Arg Val Ala Gln Ala Val Gly Ile Thr Val Ser Ala Gly Val Ala Pro
130 135 140
Ser Lys Phe Val Ala Lys Ile Ala Ser Asp Trp Asn Lys Pro Asp Gly
145 150 155 160
Leu Phe Val Val Arg Pro Gln Asp Val Asp Thr Phe Val Ala Ala Leu
165 170 175
Pro Val Ala Lys Leu His Gly Val Gly Lys Val Thr Gly Ala Arg Leu
180 185 190
Lys Ala Leu Gly Val Glu Thr Cys Ala Asp Leu Arg Glu Trp Glu His
195 200 205
Asp Arg Leu Arg Asp Glu Phe Gly Ala Phe Gly Glu Arg Leu His Asp
210 215 220
Leu Cys Arg Gly Ile Asp Leu Arg Glu Val Ser Pro Thr Arg Glu Arg
225 230 235 240
Lys Ser Val Ser Val Glu Gln Thr Phe Val Thr Asp Leu His Thr Leu
245 250 255
Glu Ala Cys Gln Ala Leu Leu Arg Glu Met Leu Asp Gln Leu Asp Ala
260 265 270
Arg Val Arg Arg Ala Asp Ala Gln Asn His Ile Gln Lys Leu Phe Val
275 280 285
Lys Leu Arg Phe Ser Asp Phe Asn Arg Thr Thr Ala Glu Gly Val Gly
290 295 300
Ala Ala Leu Asp Glu Glu Gln Phe Arg Ile Leu Leu Ala Thr Ala Phe
305 310 315 320
Arg Arg Asn Pro Arg Ala Val Arg Leu Met Gly Leu Gly Val Arg Leu
325 330 335
Gly Ala Pro Gly Gly Gln Leu Ala Leu Phe Gly Asp Gln Pro Thr Val
340 345 350
Ser Glu Pro Asp Thr Val
355
<210> 7
<211> 502
<212> PRT
<213> 热带爪蟾( Xenopus tropicalis)
<400> 7
Met Ser Phe Ile Pro Leu Lys Arg Arg Arg Ala Gly Pro Val Ser Glu
1 5 10 15
Glu Pro Leu Asp Ser Leu Gln Ser Leu Phe Pro Asp Val Cys Leu Phe
20 25 30
Leu Val Glu Arg Arg Met Gly Ser Ala Arg Arg Lys Phe Leu Thr Gly
35 40 45
Leu Ala Gln Lys Lys Gly Phe Cys Val Thr Pro Gln Phe Ser Asp Gln
50 55 60
Val Thr His Val Val Ser Glu Gln Asn Ser Cys Ser Glu Val Leu Leu
65 70 75 80
Trp Ile Glu Arg Gln Ser Gly Gln Lys Val Gln Pro Gly Gly Ala Glu
85 90 95
Met Thr Pro His Ile Leu Asp Ile Thr Trp Phe Thr Glu Ser Met Ser
100 105 110
Leu Gly Lys Pro Val Lys Val Glu Pro Arg His Cys Leu Gly Val Ser
115 120 125
Asp Ser Ser Val Ser Arg Asp Lys Ala Thr Gln Glu Ile Pro Ala Tyr
130 135 140
Gly Cys Gln Arg Arg Thr Pro Leu His His His Asn Lys Glu Ile Thr
145 150 155 160
Asp Ala Leu Glu Ile Leu Ala Leu Ser Ala Ser Phe Gln Gly Ser Glu
165 170 175
Ala Arg Phe Leu Gly Phe Thr Arg Ala Ser Ser Val Leu Lys Ser Leu
180 185 190
Pro Phe Arg Leu Gln Ser Val Glu Glu Val Lys Asp Leu Pro Trp Cys
195 200 205
Gly Gly His Ser Gln Thr Val Ile Gln Glu Ile Leu Glu Asp Gly Val
210 215 220
Cys Arg Glu Val Glu Thr Val Lys Asn Ser Glu His Phe Gln Ser Met
225 230 235 240
Lys Ala Leu Thr Ser Ile Phe Gly Val Gly Ile Arg Thr Ala Asp Lys
245 250 255
Trp Tyr Arg Asp Gly Val Arg Ser Leu Ser Asp Leu Asn Asn Leu Gly
260 265 270
Gly Lys Leu Thr Ala Glu Gln Lys Ala Gly Leu Leu His Tyr Thr Asp
275 280 285
Leu Gln Gln Ser Val Thr Arg Glu Glu Ala Gly Thr Val Glu Gln Leu
290 295 300
Ile Lys Gly Ala Leu Gln Ser Phe Val Pro Asp Val Arg Val Thr Met
305 310 315 320
Thr Gly Gly Phe Arg Arg Gly Lys Gln Glu Gly His Asp Val Asp Phe
325 330 335
Leu Ile Thr His Pro Asp Glu Glu Ala Leu Asn Gly Leu Leu Arg Lys
340 345 350
Ala Val Ala Trp Leu Asp Gly Lys Gly Ser Val Leu Tyr Tyr His Val
355 360 365
Arg Ala Arg Ser Gln Asn Phe Ser Gly Ser Asn Thr Met Asp Gly His
370 375 380
Glu Thr Cys Tyr Ser Ile Ile Ala Leu Pro Asn Val Cys Pro Glu Lys
385 390 395 400
Pro Ser Pro Asp Ala Glu Lys Ile Glu Pro Asp Leu Asp Lys Asn Ser
405 410 415
Leu Arg Asn Trp Lys Ala Val Arg Val Asp Leu Val Val Cys Pro Tyr
420 425 430
Ser Glu Tyr Phe Tyr Ala Leu Leu Gly Trp Thr Gly Ser Lys His Phe
435 440 445
Glu Arg Glu Leu Arg Arg Phe Ser Leu His Val Lys Lys Met Ser Leu
450 455 460
Asn Ser His Gly Leu Phe Asp Ile Gln Lys Lys Cys His His Pro Ala
465 470 475 480
Thr Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Pro Tyr Val Pro
485 490 495
Pro Ser Glu Arg Asn Ala
500
<210> 8
<211> 530
<212> PRT
<213> 威克汉姆西弗酵母(Wickerhamomyces ciferrii)
<400> 8
Met Asn Arg Ser Gly Gln Val Leu Ser Lys Met Ser Lys Thr Tyr Leu
1 5 10 15
Phe Asp Gly Leu Glu Phe Leu Phe Ile Pro Asn Ile Asn Ser Ser Lys
20 25 30
Val Thr Phe Thr Arg Lys Asn Leu Ala Arg Asn Gly Gly Ala Ser Val
35 40 45
Ala Lys Lys Phe Asp Gln Asp Thr Thr Thr His Val Leu Val Asp Thr
50 55 60
Lys Val Tyr Leu Thr Lys Asp Lys Ile Ser Ala Gly Leu Lys Asn Ala
65 70 75 80
Lys Val Pro Lys Thr Phe Gln Pro Gly Lys Ile Leu Asn Gln Thr Trp
85 90 95
Leu Val Asp Ser Ile Glu Gln Gln Lys Leu Leu Asp Thr Lys Glu Tyr
100 105 110
Ile Ile Lys Leu Asp Glu Leu Lys Pro Glu Thr Arg Lys Glu Ser Pro
115 120 125
Ala Ser Lys Gln His Ile Glu Asn Leu Gln Lys Gln Glu Thr Lys Glu
130 135 140
Lys Leu Ile Ala Glu Ser Ser Thr Gly Asn Pro Asn Glu Arg Thr Ile
145 150 155 160
Phe Leu Leu Asn Gln Met Ala Glu Glu Arg Leu Leu Gln Gly Glu His
165 170 175
Phe Lys Ala Lys Ala Tyr Lys Asn Ala Ile Asn Ala Leu Asn Asn Thr
180 185 190
Gly Asp Phe Ile Ser Asp Ala Asn Glu Ala Leu Arg Leu Lys Gly Ile
195 200 205
Gly Val Ser Val Ala Gln Lys Ile Glu Glu Ile Val Lys Thr Asn Thr
210 215 220
Leu Ser Ser Leu Asn Glu Ile Lys Ser Asp Lys Glu His Gln Val Ser
225 230 235 240
Lys Leu Phe Met Gly Ile His Gly Val Gly Pro Val Ser Ala Lys Lys
245 250 255
Trp Tyr Asn Asp Gly Leu Arg Thr Leu Glu Asp Val Ser Gln Lys Pro
260 265 270
Asp Leu Thr Ser Asn Gln Thr Leu Gly Leu Lys Tyr Tyr Asp Glu Trp
275 280 285
Leu Glu Arg Ile Pro Arg Asp Glu Cys Thr Leu His Asn Glu Phe Met
290 295 300
Ser Asp Leu Val Ser Gln Ile Asp Pro Leu Val Gln Phe Thr Ile Gly
305 310 315 320
Gly Ser Tyr Arg Arg Gly Ser Pro Thr Cys Gly Asp Val Asp Phe Ile
325 330 335
Ile Thr Lys Pro Asn Ala Asp Asn Glu Glu Met Lys Glu Ile Leu Glu
340 345 350
Lys Ile Leu Val Lys Ile Glu Gln Val Gly Tyr Leu Lys Cys Ser Leu
355 360 365
Gln Lys Lys His Ser Thr Lys Phe Leu Ser Gly Cys Ala Leu Pro Pro
370 375 380
Asn Tyr Ala Ser Arg Leu Pro Glu Tyr Ser Glu Gly Lys Trp Gly Lys
385 390 395 400
Cys Arg Arg Ile Asp Phe Leu Met Val Pro Trp Lys Glu Arg Gly Ala
405 410 415
Ala Phe Ile Tyr Phe Thr Gly Asn Asp Tyr Phe Asn Arg Leu Ile Arg
420 425 430
Leu Lys Ala Val Lys Asn Gly Leu Val Leu Asn Glu Ser Gly Leu Phe
435 440 445
Lys Arg Ile Lys Tyr Val Gln Gly Lys Asn Val Glu Asp Lys Thr Met
450 455 460
Leu Ile Glu Ser Phe Ser Glu Lys Lys Ile Phe Lys Leu Leu Gly Phe
465 470 475 480
Lys Tyr Val Pro Pro Glu Gln Arg Asn Phe Gly Ala Asn Asn Pro Pro
485 490 495
Ser Lys Leu Gly Lys His Leu Asp Gln Phe Arg Ile Asp His Lys Tyr
500 505 510
Phe Asp Lys Val Val Lys Glu Glu Ile Ile Asp Asp Asp Val Ile Glu
515 520 525
Val Asp
530
<210> 9
<211> 520
<212> PRT
<213> 家牛( Bos taurus)
<400> 9
Met Ala Gln Gln Arg Gln His Gln Arg Leu Pro Met Asp Pro Leu Cys
1 5 10 15
Thr Ala Ser Ser Gly Pro Arg Lys Lys Arg Pro Arg Gln Val Gly Ala
20 25 30
Ser Met Ala Ser Pro Pro His Asp Ile Lys Phe Gln Asn Leu Val Leu
35 40 45
Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg Arg Asn Phe Leu Met
50 55 60
Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu Asn Glu Leu Ser Asp
65 70 75 80
Ser Val Thr His Ile Val Ala Glu Asn Asn Ser Gly Ser Glu Val Leu
85 90 95
Glu Trp Leu Gln Val Gln Asn Ile Arg Ala Ser Ser Gln Leu Glu Leu
100 105 110
Leu Asp Val Ser Trp Leu Ile Glu Ser Met Gly Ala Gly Lys Pro Val
115 120 125
Glu Ile Thr Gly Lys His Gln Leu Val Val Arg Thr Asp Tyr Ser Ala
130 135 140
Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys
145 150 155 160
Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn
165 170 175
His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Glu Phe
180 185 190
Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val
195 200 205
Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly
210 215 220
Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile
225 230 235 240
Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg
245 250 255
Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys
260 265 270
Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Lys Ile
275 280 285
Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln Lys Ala Gly Phe
290 295 300
Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu
305 310 315 320
Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp
325 330 335
Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly
340 345 350
His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu
355 360 365
Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu
370 375 380
Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu
385 390 395 400
Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu
405 410 415
Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln
420 425 430
Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys
435 440 445
Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg
450 455 460
Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met
465 470 475 480
Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu
485 490 495
Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
500 505 510
Ile Glu Pro Trp Glu Arg Asn Ala
515 520
<210> 10
<211> 510
<212> PRT
<213> 小家鼠( Mus musculus)
<400> 10
Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro
1 5 10 15
Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe
20 25 30
Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg
35 40 45
Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu
50 55 60
Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser
65 70 75 80
Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser
85 90 95
Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly
100 105 110
Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn
115 120 125
Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala
130 135 140
Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
145 150 155 160
Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala
165 170 175
Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met
180 185 190
Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met
195 200 205
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile
210 215 220
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val
225 230 235 240
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
245 250 255
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
260 265 270
Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met
275 280 285
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
290 295 300
Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
305 310 315 320
Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
325 330 335
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
340 345 350
Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe
355 360 365
Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr
370 375 380
Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His
385 390 395 400
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His
405 410 415
Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg
420 425 430
Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu
435 440 445
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
450 455 460
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg
465 470 475 480
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
485 490 495
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
500 505 510
<210> 11
<211> 1923
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS017序列
<400> 11
atgcatcatc atcaccatca cggcagcagc aagtttacct ggaaagaact gattcagctg 60
ggtagcccga gcaaagcata tgaaagcagc ctggcatgta ttgcccatat tgatatgaat 120
gcatttttcg cacaggttga gcagatgcgt tgtggtctga gcaaagaaga tccggttgtt 180
tgcgttcagt ggaatagcat tattgcagtt agctatgcag cccgtaaata tggtattagc 240
cgtatggata ccattcaaga ggcactgaaa aaatgcagca atctgattcc gattcatacc 300
gcagttttca aaaaaggcga agatttttgg cagtatcatg atggttgtgg tagctgggtt 360
caagatccgg caaaacaaat ttcagtcgaa gatcataaag ttagcctgga accgtatcgt 420
cgtgaaagcc gtaaagccct gaaaatcttt aaaagcgcat gtgatctggt tgaacgtgca 480
agcattgatg aagtttttct ggatctgggt cgcatttgtt ttaacatgct gatgttcgat 540
aacgagtatg aactgaccgg tgatctgaaa ctgaaagatg cactgagcaa tattcgcgaa 600
gcatttattg gtggcaacta tgatattaac agccatctgc cgctgattcc ggaaaaaatc 660
aaaagcctga aattcgaagg cgacgtgttt aatccggaag gtcgtgatct gattacagat 720
tgggatgatg ttattctggc actgggtagt caggtttgta aaggtattcg tgatagcatc 780
aaagatatcc tgggttatac cacctcatgt ggtctgtcaa gcaccaaaaa tgtttgtaaa 840
ctggccagca actacaaaaa accggatgca cagaccattg tgaaaaatga ttgtctgctg 900
gatttcctgg attgcggcaa atttgaaatt accagctttt ggaccttagg tggtgttctg 960
ggtaaagaat taattgatgt gctggatctg ccgcatgaaa acagcattaa acatattcgt 1020
gaaacctggc ctgataatgc aggtcagctg aaagaatttc tggatgccaa agttaaacag 1080
agcgattatg atcgtagcac cagcaatatt gatccgctga aaaccgcaga tctggccgaa 1140
aaactgttta aactgagccg tggtcgttat ggcctgccgc tgtcaagccg tccggttgtg 1200
aaaagcatga tgagcaataa aaacctgcgt ggcaaaagct gcaatagcat tgttgattgt 1260
attagctggc tggaagtttt ttgtgcagaa ctgaccagcc gtattcagga tctggaacaa 1320
gaatataaca agatcgttat tccgcgtacc gttagcatta gcctgaaaac caaaagctat 1380
gaggtgtatc gtaaaagcgg tccggtggca tataaaggta tcaattttca gagccacgaa 1440
ctgctgaaag tgggtatcaa atttgtgacc gatctggata tcaaaggcaa gaacaaaagt 1500
tattacccgc tgaccaaact gagcatgacc attaccaatt tcgatatcat cgatctgcag 1560
aaaaccgtgg ttgatatgtt tggtaatcag gtgcatacgt ttaaaagcag cgcaggtaaa 1620
gaagatgaag aaaaaaccac cagtagcaaa gccgatgaaa aaaccccgaa actggaatgt 1680
tgtaaatatc aggttacctt caccgatcag aaagcactgc aagaacatgc agattatcat 1740
ctggccctga aactgtctga aggtctgaat ggtgcagaag aaagcagcaa aaatctgagc 1800
tttggtgaaa aacgtctgct gtttagccgt aaacgtccga atagccagca taccgcaaca 1860
ccgcagaaaa aacaggttac cagcagtaaa aacatcctga gcttttttac ccgcaaaaaa 1920
tga 1923
<210> 12
<211> 1521
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS024序列
<400> 12
atgcatcatc atcaccatca cggcagcttt catgcaaccg cactgcctcg tatgcgtaaa 60
cgtccgcgtc cggaagaagt tgcctgtccg ggtcgtgaag atgttaaatt tcgtgatgtt 120
cgtctgtacc tggtggaaat gaaaatgggt cgtagccgtc gtagctttct gacccagctg 180
gcacgtagca aaggttttat ggttgaagag gttctgagca atcgtgttac ccatgttgtt 240
agcgaaagca gccaggcacc ggttctgtgg gcatggctga aagaacgtgc accgcaggat 300
ctgccgaata tgcatgttgt gaatattacc tggtttaccg atagcatgcg tgaaagccgt 360
ccggttgcag ttgaaacccg tcatctgatt caggataccc tgcctgcaat tccggaaggt 420
ggtgcaccgg cagccgaagt tagccagtat gcatgtcagc gtcgtaccac caccgataac 480
tataatgttg tttttaccga tgcctttgaa gttctggccg aatgctatga atttaatcag 540
atggatggtc gttgtctggc atttcgtcgt gcagcaagcg ttctgaaaag cctgcctcgt 600
ggtctgagca gcctggaaga aacccatagc ctgccgtgtt taggtggtca tgcaaaagca 660
attattggcg aaattctgca gcatggtcgt gcatttgatg ttgaaaaagt tctgagtgat 720
gaacgctatc agaccctgaa actgtttacc agcgtttatg gtgttggtcc gaaaaccgca 780
gaaaaatggt atcgtagcgg tctgcgtagc ctggatcata ttctggcgga tcagagcatc 840
cagctgaatc atatgcagca gaatggtttt ctgcattatg gtgatattag ccgtgcagtt 900
agcaaagccg aagcacgtgc actgaccaaa gcaattggtg aaaccgttca ggcaattaca 960
ccggatgcac tgctggcact gaccggtggt tttcgtcgcg gtaaagaatt tggtcatgat 1020
gtggatatta tctttaccac gctggaatta ggcatggaag aaaatctgct gctggcagtg 1080
attaaaagtc tggaaaaaca gggtattctg ctgtattgtg attatcaggc aagcaccttt 1140
gatctgacca aactgccgac acatagcttt gaagcaatgg atcattttgc caagtgcttt 1200
ctgattctgc gtctggaagc aagccaggtt gaagaaggcc tgaatagtcc ggttgaagat 1260
attcgtggtt ggcgtgcagt tcgtgttgat ctggttagcc ctccggttga tcgttatgca 1320
tttgcactgt taggttggac cggtagccgt cagtttgaac gtgatctgcg tcgttttgca 1380
cgtaaagaac gtcgtatgct gctggataat catggcctgt atgataaaac caaagaagaa 1440
tttctggcag ccggtacgga aaaagatatt tttgatcatc tgggccttga gtatatggaa 1500
ccgtggcagc gtaatgcata a 1521
<210> 13
<211> 1731
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS029序列
<400> 13
atgcatcatc atcaccatca cggcagcggt attctgagcg gcaaaaaatt cctgattctg 60
ccgaatagcc ataccggtag cgttaatatt ctggcaggta ttgttaaaga acaaggtggt 120
tttctggtta gcagcgcaga tcgtctgagc aatgatgttg ttgttctggt gaatgatagc 180
ttcgtggaca aaaccaacaa aattgttaat cgcggtctgt ttctgaaaga atttgaactg 240
gatgcaagcg ttgtttggac ctatgttctg gaaaatgaac tggtttgtct gcgtgttagc 300
ctggttccga gctgggttga aaatggcacc tttcatttta gcgatagcga acgtattatt 360
ctgctggata gcgaaagcca agaacgcgat accaaaaatg ttcagtttca tagcgcaggt 420
aatgaagagg caggtagtga tgatgaaacc gatgttgaag gtaataaaga aagcaccggt 480
gatattaccg atgttagcga taccgcaaca ccgcagctgc agagcagtcc gctgagcaaa 540
tatatcaaac aagaagagga tatcgacaac caggttctga ttaaagcact gggtcgtctg 600
gtgaaaaaat acgaagttaa aggtgatcag tatcgcagcc gtagctatcg tctggcaaaa 660
caggcagttg aaaaatatcc gcataaaatc accagcggta gccaggcaca gcgtcagctg 720
agcaatattg gtagcagcat tgccaaaaaa atccagctgc tgctggacac cggtacactg 780
cctggtctgg aagatccggc aaccgatgaa tatgaaagca gcctgggtta tttcagcgaa 840
tgttatggta ttggtgttcc gatggccaaa aaatggatta ccctgaatat cagcaccttt 900
tatcgtgcag cacgtctgca tccgaaactg tttattagcg attggccgat tctgtatggc 960
tggacctatt atgaagattg gagcaaacgt attccgcgtg atgaagttac cgcacatttt 1020
gagctggtta aagaagaagt tcgtcgcgtt ggtaatggtt gtagcgttga aatgcagggt 1080
agctatgttc gtggtgcacg tgataccggt gatgttgatc tgatgttcta caaagaaaat 1140
tgcgacgatc tggaagaggt taccattggt atggaaaatg ttgcagcaag cctgtatcag 1200
aaaggctata tcaaatgttt tctgctgctg accgataaac tggaacgcat gtttcgtccg 1260
gatattctga gtcgtctgca gaaatgtggt attgccgaaa tcagcaatga acataccttt 1320
cgtaatagcg accgtggcaa aaaactgttt ttcggtgttg aactgccagg cgattatccg 1380
atttatccgt ttgatgataa agacatcctg cagctgaaac cgcaggataa attcatgagc 1440
aaaagcaaag atgccggtca tttttgtcgt cgtctggatt tcttctgttg caaatggtca 1500
gaactgggtg cagcccgtat tcattatacc ggtaataccg attataaccg ttggctgcgt 1560
gttcgtgcaa tggatatggg ttataaactg acccagcatg gcatcttcaa agatgatgta 1620
ctgctggaaa gctttgatga gcgcaaaatc tttgaatatc tgcatgtgcc gtatctgaat 1680
ccggttgatc gtaataaaac cgattgggtg aatatcccga ttccgaaata a 1731
<210> 14
<211> 1617
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS030序列
<400> 14
atgcatcatc atcaccatca cggcagcaat cgtagcggtc aggttctgag caaaatgagt 60
aaaacctacc tgtttgatgg cctggaattt ctgtttattc cgaacattaa tagcagcaag 120
gtgaccttta cacgcaaaaa tctggcacgt aatggtggtg caagcgttgc caaaaaattc 180
gatcaggata ccaccacaca tgttctggtt gataccaaag tttatctgac caaagacaaa 240
attagcgcag gtctgaaaaa tgccaaagtg ccgaaaacct ttcagcctgg taaaattctg 300
aatcagacct ggctggttga ttctattgaa cagcagaaac tgctggacac caaagagtat 360
attatcaaac tggatgagct gaaaccggaa acgcgtaaag aaagtccggc aagcaaacag 420
catattgaaa atctgcagaa acaagaaacc aaagagaaac tgattgcaga aagcagcacc 480
ggtaatccga atgaacgtac catttttctg ctgaaccaga tggcagaaga acgtctgctg 540
cagggtgaac attttaaagc aaaagcctat aagaacgcca ttaacgccct gaataatacc 600
ggtgatttta tctcagatgc aaatgaagca ctgcgcctga aaggtattgg tgttagcgtg 660
gcacagaaaa ttgaagaaat tgtgaaaacc aatacgctga gcagcctgaa tgaaatcaaa 720
agcgataaag aacaccaggt gagcaaactg tttatgggta ttcatggtgt tggtccggtt 780
agcgcaaaaa agtggtataa tgatggtctg cgtaccctgg aagatgttag ccagaaaccg 840
gatctgacca gcaatcagac cctgggcctg aaatattacg atgaatggct ggaacgtatt 900
ccgcgtgatg aatgtaccct gcataatgaa tttatgagcg atctggtgag ccagattgat 960
ccgctggttc agtttaccat tggtggtagc tatcgtcgtg gtagcccgac ctgtggtgat 1020
gtggatttta tcattaccaa accgaatgcc gataacgaag agatgaaaga gattctggaa 1080
aagatcctgg tgaaaatcga acaggttggt tatctgaaat gtagcctgca gaaaaaacac 1140
agcaccaaat ttctgagcgg ttgtgcactg cctccgaatt atgcaagccg tctgccggaa 1200
tacagcgaag gtaaatgggg taaatgtcgt cgtattgatt ttctgatggt tccgtggaaa 1260
gaacgtggtg cagcatttat ctattttacc ggcaacgatt atttcaaccg tctgattcgt 1320
ctgaaagccg ttaaaaatgg tctggtgctg aatgaatcag gtctgtttaa acgcatcaaa 1380
tacgtgcagg gtaaaaacgt ggaagataaa accatgctga tcgaaagctt tagcgagaaa 1440
aaaatcttta agctgctggg cttcaaatat gttccgcctg aacagcgtaa ttttggtgca 1500
aataatccgc ctagcaaact gggtaaacat ctggatcagt ttcgcatcga tcacaaatat 1560
ttcgacaaag tggtgaaaga agagatcatt gacgacgatg ttatcgaggt ggattaa 1617
<210> 15
<211> 1074
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS053序列
<400> 15
atgcatcatc atcaccatca cggcagccgc aaaatcatcc atattgattg cgattgcttt 60
tacgcagcac tggaaatgcg tgatgatccg agcctgcgtg gtaaagcact ggcagttggt 120
ggtagtccgg ataaacgtgg tgttgttgca acctgtagct atgaagcacg tgcatatggt 180
gttcgtagcg caatggcaat gcgtaccgca ctgaaactgt gtccggatct gctggttgtt 240
cgtccgcgtt ttgatgttta tcgtgcagtt agcaaacaaa tccatgccat ctttcgtgat 300
tataccgatc tgattgaacc gctgagcctg gatgaagcat atctggatgt tagcgcaagt 360
ccgcattttg caggtagcgc aacccgtatt gcacaggata ttcgtcgtcg tgttgcagaa 420
gaactgcgta ttaccgttag tgccggtgtt gcaccgaaca aatttctggc aaaaattgca 480
agcgattggc gtaaaccgga tggtctgttt gttattacac cggaacaggt tgatggtttt 540
gttgccgaac tgccggttgc aaaactgcat ggtgttggta aagttaccgc agaacgtctg 600
gcacgtatgg gtattcgtac ctgtgccgat ctgcgtcagg gtagcaaact gagtctggtt 660
cgtgaatttg gtagctttgg tgaacgtctg tggggtttag cacatggtat tgatgaacgt 720
ccggttgaag ttgatagccg tcgtcagagc gttagcgttg aatgtacctt tgatcgtgat 780
ctgccggatc tggcagcatg tctggaagaa ttaccgacac tgctggaaga actggatggt 840
cgtctgcagc gtctggatgg tagctatcgt cctgataaac cgtttgtgaa actgaaattc 900
cacgatttta cccagaccac cgttgaacag agcggtgcag gtcgcgatct ggaaagttat 960
cgtcagctgc tgggtcaagc atttgcacgt ggtaatcgtc cggttcgtct gattggtgtg 1020
ggtgttcgtc tgctggatct gcagggtgca catgaacagc tgcgtctgtt ttaa 1074
<210> 16
<211> 1101
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS054序列
<400> 16
atgcatcatc atcaccatca cggcagccgc aaaatcattc attgtgattg cgattgcttt 60
tacgccagca ttgaaatgcg tgatgatccg agcctgcgtg gtcgtccgct ggcagttggt 120
ggccgtccgg aaacacgtgg tgttgttgca acctgtaatt atgaagcacg taaatatggt 180
gttcatagcg caatgagcag cgcacgtgca gttcgtctgt gtccggatct gctgattatt 240
ccgcctcgta tggaaatgta tcgtgttgca agcgcacaga tcatggatat ttatcgtgat 300
tataccgaac tggttgaacc gctgagcctg gatgaagcat atctggatgt taccggtagc 360
gatcgtctgc agggtagcgc aacccgtatt gcaagcgaaa ttcgtcagcg tgttgcacag 420
gccgttggta ttaccgttag tgccggtgtt gcaccgagca aatttgttgc caaaattgcc 480
agcgattgga ataaaccgga tggtctgttt gttgttcgtc cgcaggatgt tgataccttt 540
gttgcagcac tgccggttgc aaaactgcat ggtgttggta aagttaccgg tgcacgtctg 600
aaagcactgg gtgttgaaac ctgtgccgat ctgcgtgaat gggaacatga tcgtttacgt 660
gatgaatttg gtgcatttgg tgaacgtctg cacgatctgt gtcgtggtat tgatctgcgc 720
gaagttagcc cgacacgtga acgtaaaagc gttagcgttg aacagacctt tgttaccgat 780
ctgcataccc tggaagcatg tcaggcactg ctgcgtgaaa tgctggatca gctggatgca 840
cgtgttcgtc gtgcagatgc acagaaccat attcagaaac tgtttgtgaa actgcgcttc 900
agcgatttta atcgtaccac agccgaaggt gttggtgccg cactggatga ggaacagttt 960
cgtattctgc tggcaaccgc atttcgtcgt aatccgcgtg ccgtgcgtct gatgggtctg 1020
ggtgttcgtc tgggtgcacc tggtggtcag ctggcactgt ttggtgatca gccgaccgtt 1080
agcgaaccgg ataccgttta a 1101
<210> 17
<211> 1533
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS066序列
<400> 17
atgcatcatc atcaccatca cggcagcagc tttattccgc tgaaacgtcg tcgtgcaggt 60
ccggttagcg aagaaccgct ggatagcctg cagagcctgt ttccggatgt ttgtctgttt 120
ctggttgaac gtcgtatggg tagcgcacgt cgtaaatttc tgaccggtct ggcacagaaa 180
aaaggttttt gtgttacacc gcagtttagc gatcaggtta cccatgttgt tagcgaacag 240
aatagctgta gcgaagttct gctgtggatt gaacgtcaga gtggtcagaa agttcagcct 300
ggtggtgcag aaatgacacc gcatattctg gatattacct ggtttaccga aagcatgagc 360
ctgggtaaac cggttaaagt tgaaccgcgt cattgtctgg gtgttagcga tagcagcgtt 420
agccgtgata aagcaaccca agaaattccg gcatatggtt gtcagcgtcg tacaccgctg 480
catcatcata ataaagaaat taccgatgcg ctggaaattc tggcactgag cgcaagcttt 540
cagggtagcg aagcacgttt tctgggtttt acccgtgcaa gcagcgttct gaaaagcctg 600
ccgtttcgtc tgcagagcgt tgaagaggtt aaagatctgc cgtggtgtgg tggtcatagc 660
cagaccgtta ttcaagaaat cctggaagat ggtgtttgcc gtgaagttga aaccgtgaaa 720
aatagcgaac atttccagag catgaaagca ctgaccagca tttttggtgt tggtattcgt 780
accgcagata aatggtatcg tgatggtgtt cgtagcctga gcgatctgaa taatcttggt 840
ggtaaactga ccgcagaaca gaaagcaggt ctgctgcatt acaccgatct gcagcagagc 900
gtgacccgtg aagaagcagg caccgttgaa cagctgatta aaggtgcact gcagagcttt 960
gtgccggatg tgcgtgttac catgaccggt ggttttcgtc gtggtaaaca agagggtcat 1020
gatgtggatt ttctgattac ccatcctgat gaagaagccc tgaacggcct gctgcgtaaa 1080
gcagttgcat ggctggatgg taaaggtagc gttctgtatt atcatgttcg tgcacgtagt 1140
cagaatttta gcggtagcaa taccatggat ggtcatgaaa cctgttatag cattattgca 1200
ctgccgaatg tttgtccgga aaaaccgagt ccggatgcag aaaaaattga accggatctg 1260
gataaaaaca gcctgcgtaa ttggaaagca gttcgtgttg atctggttgt ttgcccgtat 1320
agcgaatact tttatgcact gttaggttgg accggcagca aacattttga acgtgaactg 1380
cgtcgtttta gcctgcatgt gaaaaaaatg agcctgaata gccatggcct gtttgacatt 1440
cagaaaaagt gtcatcatcc ggcaaccagc gaagaagaaa tttttgcaca tctgggtctg 1500
ccgtatgttc cgcctagcga acgtaatgca taa 1533
<210> 18
<211> 1317
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS082序列
<400> 18
atgcatcatc atcaccatca cggcagcgaa cagcagaaac tgctggacac caaagagtat 60
attatcaaac tggatgagct gaaaccggaa acgcgtaaag aaagtccggc aagcaaacag 120
catattgaaa atctgcagaa acaagaaacc aaagagaaac tgattgcaga aagcagcacc 180
ggtaatccga atgaacgtac catttttctg ctgaaccaga tggcagaaga acgtctgctg 240
cagggtgaac attttaaagc aaaagcctat aagaacgcca ttaacgccct gaataatacc 300
ggtgatttta tctcagatgc aaatgaagca ctgcgcctga aaggtattgg tgttagcgtg 360
gcacagaaaa ttgaagaaat tgtgaaaacc aatacgctga gcagcctgaa tgaaatcaaa 420
agcgataaag aacaccaggt gagcaaactg tttatgggta ttcatggtgt tggtccggtt 480
agcgcaaaaa agtggtataa tgatggtctg cgtaccctgg aagatgttag ccagaaaccg 540
gatctgacca gcaatcagac cctgggcctg aaatattacg atgaatggct ggaacgtatt 600
ccgcgtgatg aatgtaccct gcataatgaa tttatgagcg atctggtgag ccagattgat 660
ccgctggttc agtttaccat tggtggtagc tatcgtcgtg gtagcccgac ctgtggtgat 720
gtggatttta tcattaccaa accgaatgcc gataacgaag agatgaaaga gattctggaa 780
aagatcctgg tgaaaatcga acaggttggt tatctgaaat gtagcctgca gaaaaaacac 840
agcaccaaat ttctgagcgg ttgtgcactg cctccgaatt atgcaagccg tctgccggaa 900
tacagcgaag gtaaatgggg taaatgtcgt cgtattgatt ttctgatggt tccgtggaaa 960
gaacgtggtg cagcatttat ctattttacc ggcaacgatt atttcaaccg tctgattcgt 1020
ctgaaagccg ttaaaaatgg tctggtgctg aatgaatcag gtctgtttaa acgcatcaaa 1080
tacgtgcagg gtaaaaacgt ggaagataaa accatgctga tcgaaagctt tagcgagaaa 1140
aaaatcttta agctgctggg cttcaaatat gttccgcctg aacagcgtaa ttttggtgca 1200
aataatccgc ctagcaaact gggtaaacat ctggatcagt ttcgcatcga tcacaaatat 1260
ttcgacaaag tggtgaaaga agagatcatt gacgacgatg ttatcgaggt ggattaa 1317
<210> 19
<211> 1176
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS048序列
<400> 19
atgcatcatc atcaccatca cggcagccgt accgattata gcgcaacccc gaatccgggt 60
tttcagaaaa caccgcctct ggcagtgaaa aaaatcagcc agtatgcatg tcagcgtaaa 120
accacactga ataactataa ccacatcttc accgatgcct ttgaaattct ggcagaaaac 180
agcgaattca aagaaaacga agttagctac gtgaccttta tgcgtgcagc aagcgttctg 240
aaaagcctgc cgtttaccat tattagcatg aaagataccg aaggtattcc gtgtctgggt 300
gataaagtga aatgcatcat tgaagagatc atcgaagatg gtgaaagcag cgaagttaaa 360
gcagttctga atgatgaacg ttaccagagc ttcaaactgt ttaccagcgt ttttggtgtt 420
ggcctgaaaa ccagcgaaaa atggtttcgt atgggttttc gtagcctgag caaaatcatg 480
agcgataaaa ccctgaaatt caccaaaatg cagaaagccg gtttcctgta ttatgaagat 540
ctggtgagct gtgttacccg tgccgaagcc gaagcagttg gtgttctggt taaagaagca 600
gtttgggcat ttctgccgga tgcatttgtt accatgaccg gtggttttcg tcgtggcaaa 660
aaaatcggtc atgatgtgga ttttctgatt accagtccgg gtagcgcaga agatgaagaa 720
cagctgctgc cgaaagttat taatctgtgg gaaaaaaaag gcctgctgct gtattacgat 780
ctggttgaaa gcaccttcga gaaattcaaa ctgccgagcc gtcaggttga taccctggat 840
cactttcaga aatgttttct tatcctgaag ctgcatcatc agcgtgttga tagcagcaaa 900
agcaatcagc aagaaggtaa aacctggaaa gcaattcgtg ttgatctggt tatgtgcccg 960
tatgaaaatc gtgcatttgc actgttaggt tggaccggta gtcgtcagtt tgaacgtgat 1020
attcgtcgtt atgcaaccca tgaacgtaaa atgatgctgg ataatcatgc cctgtacgat 1080
aaaacgaaac gcgtgttcct gaaagccgaa agcgaagaag aaatttttgc acatctgggc 1140
cttgattaca ttgaaccgtg ggaacgtaat gcctaa 1176
<210> 20
<211> 1554
<212> DNA
<213> 人工序列
<220>
<223> 带有His6标签的克隆的EDS015序列
<400> 20
atgcatcatc atcaccatca cggcagcgat ccgctgcagg cagttcatct gggtccgcgt 60
aaaaaacgtc cgcgtcagct gggtacaccg gttgcaagca ccccgtatga tattcgtttt 120
cgtgatctgg ttctgttcat cctggaaaaa aagatgggta caacccgtcg tgcatttctg 180
atggaactgg cacgtcgtaa aggttttcgt gttgaaaatg aactgagcga tagcgttacc 240
catattgttg cagaaaataa cagcggtagt gatgttctgg aatggctgca actgcagaac 300
attaaagcaa gcagcgaact ggaactgctg gatattagct ggctgattga atgtatgggt 360
gcaggtaaac cggttgaaat gatgggtcgt catcagctgg ttgttaatcg taatagcagc 420
ccgagtccgg ttccgggtag ccagaatgtt ccggcaccgg cagtgaaaaa aatcagtcag 480
tatgcatgtc agcgtcgtac cacactgaat aactataatc agctgtttac cgatgcactg 540
gatattctgg cagaaaatga tgagctgcgc gaaaatgaag gtagctgtct ggcatttatg 600
cgtgccagca gcgttctgaa aagcctgccg tttccgatta ccagcatgaa agataccgaa 660
ggtattccgt gtctgggtga taaagtgaaa agcattattg aaggcatcat cgaagatggc 720
gaaagcagtg aagcaaaagc agttctgaat gatgaacgct acaaaagctt caaactgttt 780
accagcgttt ttggtgttgg tctgaaaacc gcagaaaaat ggtttcgtat gggttttcgt 840
accctgagca aaattcagag cgataaaagt ctgcgtttta cccagatgca gaaagcaggt 900
tttctgtatt atgaagatct ggtgagctgc gttaatcgtc cggaagccga agcagttagc 960
atgctggtta aagaagcagt tgttaccttt ctgccggatg cgctggttac catgaccggt 1020
ggttttcgtc gcggaaaaat gacaggtcat gatgtggatt ttctgattac ctcaccggaa 1080
gcaaccgaag atgaagaaca gcaactgctg cataaagtta ccgatttttg gaaacagcag 1140
ggtctgctgc tgtattgtga tatcctggaa tcaaccttcg agaaattcaa acagccgagc 1200
cgtaaagttg atgccctgga tcattttcag aagtgttttc tgatcctgaa actggatcat 1260
ggtcgtgttc atagcgaaaa aagcggtcag caagaaggta aaggttggaa agcaattcgt 1320
gtggatctgg ttatgtgtcc gtatgatcgt cgtgcctttg cactgttagg ttggaccggt 1380
agccgtcagt ttgaacgtga tctgcgtcgt tatgcaaccc atgaacgtaa aatgatgctg 1440
gataatcatg cactgtatga tcgcaccaaa cgtgtttttc tggaagcaga aagcgaagaa 1500
gaaatctttg cacatctggg ccttgattac attgaaccgt gggaacgtaa tgca 1554
<210> 21
<211> 640
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS017的蛋白序列
<400> 21
Met His His His His His His Gly Ser Ser Lys Phe Thr Trp Lys Glu
1 5 10 15
Leu Ile Gln Leu Gly Ser Pro Ser Lys Ala Tyr Glu Ser Ser Leu Ala
20 25 30
Cys Ile Ala His Ile Asp Met Asn Ala Phe Phe Ala Gln Val Glu Gln
35 40 45
Met Arg Cys Gly Leu Ser Lys Glu Asp Pro Val Val Cys Val Gln Trp
50 55 60
Asn Ser Ile Ile Ala Val Ser Tyr Ala Ala Arg Lys Tyr Gly Ile Ser
65 70 75 80
Arg Met Asp Thr Ile Gln Glu Ala Leu Lys Lys Cys Ser Asn Leu Ile
85 90 95
Pro Ile His Thr Ala Val Phe Lys Lys Gly Glu Asp Phe Trp Gln Tyr
100 105 110
His Asp Gly Cys Gly Ser Trp Val Gln Asp Pro Ala Lys Gln Ile Ser
115 120 125
Val Glu Asp His Lys Val Ser Leu Glu Pro Tyr Arg Arg Glu Ser Arg
130 135 140
Lys Ala Leu Lys Ile Phe Lys Ser Ala Cys Asp Leu Val Glu Arg Ala
145 150 155 160
Ser Ile Asp Glu Val Phe Leu Asp Leu Gly Arg Ile Cys Phe Asn Met
165 170 175
Leu Met Phe Asp Asn Glu Tyr Glu Leu Thr Gly Asp Leu Lys Leu Lys
180 185 190
Asp Ala Leu Ser Asn Ile Arg Glu Ala Phe Ile Gly Gly Asn Tyr Asp
195 200 205
Ile Asn Ser His Leu Pro Leu Ile Pro Glu Lys Ile Lys Ser Leu Lys
210 215 220
Phe Glu Gly Asp Val Phe Asn Pro Glu Gly Arg Asp Leu Ile Thr Asp
225 230 235 240
Trp Asp Asp Val Ile Leu Ala Leu Gly Ser Gln Val Cys Lys Gly Ile
245 250 255
Arg Asp Ser Ile Lys Asp Ile Leu Gly Tyr Thr Thr Ser Cys Gly Leu
260 265 270
Ser Ser Thr Lys Asn Val Cys Lys Leu Ala Ser Asn Tyr Lys Lys Pro
275 280 285
Asp Ala Gln Thr Ile Val Lys Asn Asp Cys Leu Leu Asp Phe Leu Asp
290 295 300
Cys Gly Lys Phe Glu Ile Thr Ser Phe Trp Thr Leu Gly Gly Val Leu
305 310 315 320
Gly Lys Glu Leu Ile Asp Val Leu Asp Leu Pro His Glu Asn Ser Ile
325 330 335
Lys His Ile Arg Glu Thr Trp Pro Asp Asn Ala Gly Gln Leu Lys Glu
340 345 350
Phe Leu Asp Ala Lys Val Lys Gln Ser Asp Tyr Asp Arg Ser Thr Ser
355 360 365
Asn Ile Asp Pro Leu Lys Thr Ala Asp Leu Ala Glu Lys Leu Phe Lys
370 375 380
Leu Ser Arg Gly Arg Tyr Gly Leu Pro Leu Ser Ser Arg Pro Val Val
385 390 395 400
Lys Ser Met Met Ser Asn Lys Asn Leu Arg Gly Lys Ser Cys Asn Ser
405 410 415
Ile Val Asp Cys Ile Ser Trp Leu Glu Val Phe Cys Ala Glu Leu Thr
420 425 430
Ser Arg Ile Gln Asp Leu Glu Gln Glu Tyr Asn Lys Ile Val Ile Pro
435 440 445
Arg Thr Val Ser Ile Ser Leu Lys Thr Lys Ser Tyr Glu Val Tyr Arg
450 455 460
Lys Ser Gly Pro Val Ala Tyr Lys Gly Ile Asn Phe Gln Ser His Glu
465 470 475 480
Leu Leu Lys Val Gly Ile Lys Phe Val Thr Asp Leu Asp Ile Lys Gly
485 490 495
Lys Asn Lys Ser Tyr Tyr Pro Leu Thr Lys Leu Ser Met Thr Ile Thr
500 505 510
Asn Phe Asp Ile Ile Asp Leu Gln Lys Thr Val Val Asp Met Phe Gly
515 520 525
Asn Gln Val His Thr Phe Lys Ser Ser Ala Gly Lys Glu Asp Glu Glu
530 535 540
Lys Thr Thr Ser Ser Lys Ala Asp Glu Lys Thr Pro Lys Leu Glu Cys
545 550 555 560
Cys Lys Tyr Gln Val Thr Phe Thr Asp Gln Lys Ala Leu Gln Glu His
565 570 575
Ala Asp Tyr His Leu Ala Leu Lys Leu Ser Glu Gly Leu Asn Gly Ala
580 585 590
Glu Glu Ser Ser Lys Asn Leu Ser Phe Gly Glu Lys Arg Leu Leu Phe
595 600 605
Ser Arg Lys Arg Pro Asn Ser Gln His Thr Ala Thr Pro Gln Lys Lys
610 615 620
Gln Val Thr Ser Ser Lys Asn Ile Leu Ser Phe Phe Thr Arg Lys Lys
625 630 635 640
<210> 22
<211> 506
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS024的蛋白序列
<400> 22
Met His His His His His His Gly Ser Phe His Ala Thr Ala Leu Pro
1 5 10 15
Arg Met Arg Lys Arg Pro Arg Pro Glu Glu Val Ala Cys Pro Gly Arg
20 25 30
Glu Asp Val Lys Phe Arg Asp Val Arg Leu Tyr Leu Val Glu Met Lys
35 40 45
Met Gly Arg Ser Arg Arg Ser Phe Leu Thr Gln Leu Ala Arg Ser Lys
50 55 60
Gly Phe Met Val Glu Glu Val Leu Ser Asn Arg Val Thr His Val Val
65 70 75 80
Ser Glu Ser Ser Gln Ala Pro Val Leu Trp Ala Trp Leu Lys Glu Arg
85 90 95
Ala Pro Gln Asp Leu Pro Asn Met His Val Val Asn Ile Thr Trp Phe
100 105 110
Thr Asp Ser Met Arg Glu Ser Arg Pro Val Ala Val Glu Thr Arg His
115 120 125
Leu Ile Gln Asp Thr Leu Pro Ala Ile Pro Glu Gly Gly Ala Pro Ala
130 135 140
Ala Glu Val Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Thr Asp Asn
145 150 155 160
Tyr Asn Val Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu Cys Tyr
165 170 175
Glu Phe Asn Gln Met Asp Gly Arg Cys Leu Ala Phe Arg Arg Ala Ala
180 185 190
Ser Val Leu Lys Ser Leu Pro Arg Gly Leu Ser Ser Leu Glu Glu Thr
195 200 205
His Ser Leu Pro Cys Leu Gly Gly His Ala Lys Ala Ile Ile Gly Glu
210 215 220
Ile Leu Gln His Gly Arg Ala Phe Asp Val Glu Lys Val Leu Ser Asp
225 230 235 240
Glu Arg Tyr Gln Thr Leu Lys Leu Phe Thr Ser Val Tyr Gly Val Gly
245 250 255
Pro Lys Thr Ala Glu Lys Trp Tyr Arg Ser Gly Leu Arg Ser Leu Asp
260 265 270
His Ile Leu Ala Asp Gln Ser Ile Gln Leu Asn His Met Gln Gln Asn
275 280 285
Gly Phe Leu His Tyr Gly Asp Ile Ser Arg Ala Val Ser Lys Ala Glu
290 295 300
Ala Arg Ala Leu Thr Lys Ala Ile Gly Glu Thr Val Gln Ala Ile Thr
305 310 315 320
Pro Asp Ala Leu Leu Ala Leu Thr Gly Gly Phe Arg Arg Gly Lys Glu
325 330 335
Phe Gly His Asp Val Asp Ile Ile Phe Thr Thr Leu Glu Leu Gly Met
340 345 350
Glu Glu Asn Leu Leu Leu Ala Val Ile Lys Ser Leu Glu Lys Gln Gly
355 360 365
Ile Leu Leu Tyr Cys Asp Tyr Gln Ala Ser Thr Phe Asp Leu Thr Lys
370 375 380
Leu Pro Thr His Ser Phe Glu Ala Met Asp His Phe Ala Lys Cys Phe
385 390 395 400
Leu Ile Leu Arg Leu Glu Ala Ser Gln Val Glu Glu Gly Leu Asn Ser
405 410 415
Pro Val Glu Asp Ile Arg Gly Trp Arg Ala Val Arg Val Asp Leu Val
420 425 430
Ser Pro Pro Val Asp Arg Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly
435 440 445
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Phe Ala Arg Lys Glu Arg
450 455 460
Arg Met Leu Leu Asp Asn His Gly Leu Tyr Asp Lys Thr Lys Glu Glu
465 470 475 480
Phe Leu Ala Ala Gly Thr Glu Lys Asp Ile Phe Asp His Leu Gly Leu
485 490 495
Glu Tyr Met Glu Pro Trp Gln Arg Asn Ala
500 505
<210> 23
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS029的蛋白序列
<400> 23
Met His His His His His His Gly Ser Gly Ile Leu Ser Gly Lys Lys
1 5 10 15
Phe Leu Ile Leu Pro Asn Ser His Thr Gly Ser Val Asn Ile Leu Ala
20 25 30
Gly Ile Val Lys Glu Gln Gly Gly Phe Leu Val Ser Ser Ala Asp Arg
35 40 45
Leu Ser Asn Asp Val Val Val Leu Val Asn Asp Ser Phe Val Asp Lys
50 55 60
Thr Asn Lys Ile Val Asn Arg Gly Leu Phe Leu Lys Glu Phe Glu Leu
65 70 75 80
Asp Ala Ser Val Val Trp Thr Tyr Val Leu Glu Asn Glu Leu Val Cys
85 90 95
Leu Arg Val Ser Leu Val Pro Ser Trp Val Glu Asn Gly Thr Phe His
100 105 110
Phe Ser Asp Ser Glu Arg Ile Ile Leu Leu Asp Ser Glu Ser Gln Glu
115 120 125
Arg Asp Thr Lys Asn Val Gln Phe His Ser Ala Gly Asn Glu Glu Ala
130 135 140
Gly Ser Asp Asp Glu Thr Asp Val Glu Gly Asn Lys Glu Ser Thr Gly
145 150 155 160
Asp Ile Thr Asp Val Ser Asp Thr Ala Thr Pro Gln Leu Gln Ser Ser
165 170 175
Pro Leu Ser Lys Tyr Ile Lys Gln Glu Glu Asp Ile Asp Asn Gln Val
180 185 190
Leu Ile Lys Ala Leu Gly Arg Leu Val Lys Lys Tyr Glu Val Lys Gly
195 200 205
Asp Gln Tyr Arg Ser Arg Ser Tyr Arg Leu Ala Lys Gln Ala Val Glu
210 215 220
Lys Tyr Pro His Lys Ile Thr Ser Gly Ser Gln Ala Gln Arg Gln Leu
225 230 235 240
Ser Asn Ile Gly Ser Ser Ile Ala Lys Lys Ile Gln Leu Leu Leu Asp
245 250 255
Thr Gly Thr Leu Pro Gly Leu Glu Asp Pro Ala Thr Asp Glu Tyr Glu
260 265 270
Ser Ser Leu Gly Tyr Phe Ser Glu Cys Tyr Gly Ile Gly Val Pro Met
275 280 285
Ala Lys Lys Trp Ile Thr Leu Asn Ile Ser Thr Phe Tyr Arg Ala Ala
290 295 300
Arg Leu His Pro Lys Leu Phe Ile Ser Asp Trp Pro Ile Leu Tyr Gly
305 310 315 320
Trp Thr Tyr Tyr Glu Asp Trp Ser Lys Arg Ile Pro Arg Asp Glu Val
325 330 335
Thr Ala His Phe Glu Leu Val Lys Glu Glu Val Arg Arg Val Gly Asn
340 345 350
Gly Cys Ser Val Glu Met Gln Gly Ser Tyr Val Arg Gly Ala Arg Asp
355 360 365
Thr Gly Asp Val Asp Leu Met Phe Tyr Lys Glu Asn Cys Asp Asp Leu
370 375 380
Glu Glu Val Thr Ile Gly Met Glu Asn Val Ala Ala Ser Leu Tyr Gln
385 390 395 400
Lys Gly Tyr Ile Lys Cys Phe Leu Leu Leu Thr Asp Lys Leu Glu Arg
405 410 415
Met Phe Arg Pro Asp Ile Leu Ser Arg Leu Gln Lys Cys Gly Ile Ala
420 425 430
Glu Ile Ser Asn Glu His Thr Phe Arg Asn Ser Asp Arg Gly Lys Lys
435 440 445
Leu Phe Phe Gly Val Glu Leu Pro Gly Asp Tyr Pro Ile Tyr Pro Phe
450 455 460
Asp Asp Lys Asp Ile Leu Gln Leu Lys Pro Gln Asp Lys Phe Met Ser
465 470 475 480
Lys Ser Lys Asp Ala Gly His Phe Cys Arg Arg Leu Asp Phe Phe Cys
485 490 495
Cys Lys Trp Ser Glu Leu Gly Ala Ala Arg Ile His Tyr Thr Gly Asn
500 505 510
Thr Asp Tyr Asn Arg Trp Leu Arg Val Arg Ala Met Asp Met Gly Tyr
515 520 525
Lys Leu Thr Gln His Gly Ile Phe Lys Asp Asp Val Leu Leu Glu Ser
530 535 540
Phe Asp Glu Arg Lys Ile Phe Glu Tyr Leu His Val Pro Tyr Leu Asn
545 550 555 560
Pro Val Asp Arg Asn Lys Thr Asp Trp Val Asn Ile Pro Ile Pro Lys
565 570 575
<210> 24
<211> 538
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS030的蛋白序列
<400> 24
Met His His His His His His Gly Ser Asn Arg Ser Gly Gln Val Leu
1 5 10 15
Ser Lys Met Ser Lys Thr Tyr Leu Phe Asp Gly Leu Glu Phe Leu Phe
20 25 30
Ile Pro Asn Ile Asn Ser Ser Lys Val Thr Phe Thr Arg Lys Asn Leu
35 40 45
Ala Arg Asn Gly Gly Ala Ser Val Ala Lys Lys Phe Asp Gln Asp Thr
50 55 60
Thr Thr His Val Leu Val Asp Thr Lys Val Tyr Leu Thr Lys Asp Lys
65 70 75 80
Ile Ser Ala Gly Leu Lys Asn Ala Lys Val Pro Lys Thr Phe Gln Pro
85 90 95
Gly Lys Ile Leu Asn Gln Thr Trp Leu Val Asp Ser Ile Glu Gln Gln
100 105 110
Lys Leu Leu Asp Thr Lys Glu Tyr Ile Ile Lys Leu Asp Glu Leu Lys
115 120 125
Pro Glu Thr Arg Lys Glu Ser Pro Ala Ser Lys Gln His Ile Glu Asn
130 135 140
Leu Gln Lys Gln Glu Thr Lys Glu Lys Leu Ile Ala Glu Ser Ser Thr
145 150 155 160
Gly Asn Pro Asn Glu Arg Thr Ile Phe Leu Leu Asn Gln Met Ala Glu
165 170 175
Glu Arg Leu Leu Gln Gly Glu His Phe Lys Ala Lys Ala Tyr Lys Asn
180 185 190
Ala Ile Asn Ala Leu Asn Asn Thr Gly Asp Phe Ile Ser Asp Ala Asn
195 200 205
Glu Ala Leu Arg Leu Lys Gly Ile Gly Val Ser Val Ala Gln Lys Ile
210 215 220
Glu Glu Ile Val Lys Thr Asn Thr Leu Ser Ser Leu Asn Glu Ile Lys
225 230 235 240
Ser Asp Lys Glu His Gln Val Ser Lys Leu Phe Met Gly Ile His Gly
245 250 255
Val Gly Pro Val Ser Ala Lys Lys Trp Tyr Asn Asp Gly Leu Arg Thr
260 265 270
Leu Glu Asp Val Ser Gln Lys Pro Asp Leu Thr Ser Asn Gln Thr Leu
275 280 285
Gly Leu Lys Tyr Tyr Asp Glu Trp Leu Glu Arg Ile Pro Arg Asp Glu
290 295 300
Cys Thr Leu His Asn Glu Phe Met Ser Asp Leu Val Ser Gln Ile Asp
305 310 315 320
Pro Leu Val Gln Phe Thr Ile Gly Gly Ser Tyr Arg Arg Gly Ser Pro
325 330 335
Thr Cys Gly Asp Val Asp Phe Ile Ile Thr Lys Pro Asn Ala Asp Asn
340 345 350
Glu Glu Met Lys Glu Ile Leu Glu Lys Ile Leu Val Lys Ile Glu Gln
355 360 365
Val Gly Tyr Leu Lys Cys Ser Leu Gln Lys Lys His Ser Thr Lys Phe
370 375 380
Leu Ser Gly Cys Ala Leu Pro Pro Asn Tyr Ala Ser Arg Leu Pro Glu
385 390 395 400
Tyr Ser Glu Gly Lys Trp Gly Lys Cys Arg Arg Ile Asp Phe Leu Met
405 410 415
Val Pro Trp Lys Glu Arg Gly Ala Ala Phe Ile Tyr Phe Thr Gly Asn
420 425 430
Asp Tyr Phe Asn Arg Leu Ile Arg Leu Lys Ala Val Lys Asn Gly Leu
435 440 445
Val Leu Asn Glu Ser Gly Leu Phe Lys Arg Ile Lys Tyr Val Gln Gly
450 455 460
Lys Asn Val Glu Asp Lys Thr Met Leu Ile Glu Ser Phe Ser Glu Lys
465 470 475 480
Lys Ile Phe Lys Leu Leu Gly Phe Lys Tyr Val Pro Pro Glu Gln Arg
485 490 495
Asn Phe Gly Ala Asn Asn Pro Pro Ser Lys Leu Gly Lys His Leu Asp
500 505 510
Gln Phe Arg Ile Asp His Lys Tyr Phe Asp Lys Val Val Lys Glu Glu
515 520 525
Ile Ile Asp Asp Asp Val Ile Glu Val Asp
530 535
<210> 25
<211> 357
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS053的蛋白序列
<400> 25
Met His His His His His His Gly Ser Arg Lys Ile Ile His Ile Asp
1 5 10 15
Cys Asp Cys Phe Tyr Ala Ala Leu Glu Met Arg Asp Asp Pro Ser Leu
20 25 30
Arg Gly Lys Ala Leu Ala Val Gly Gly Ser Pro Asp Lys Arg Gly Val
35 40 45
Val Ala Thr Cys Ser Tyr Glu Ala Arg Ala Tyr Gly Val Arg Ser Ala
50 55 60
Met Ala Met Arg Thr Ala Leu Lys Leu Cys Pro Asp Leu Leu Val Val
65 70 75 80
Arg Pro Arg Phe Asp Val Tyr Arg Ala Val Ser Lys Gln Ile His Ala
85 90 95
Ile Phe Arg Asp Tyr Thr Asp Leu Ile Glu Pro Leu Ser Leu Asp Glu
100 105 110
Ala Tyr Leu Asp Val Ser Ala Ser Pro His Phe Ala Gly Ser Ala Thr
115 120 125
Arg Ile Ala Gln Asp Ile Arg Arg Arg Val Ala Glu Glu Leu Arg Ile
130 135 140
Thr Val Ser Ala Gly Val Ala Pro Asn Lys Phe Leu Ala Lys Ile Ala
145 150 155 160
Ser Asp Trp Arg Lys Pro Asp Gly Leu Phe Val Ile Thr Pro Glu Gln
165 170 175
Val Asp Gly Phe Val Ala Glu Leu Pro Val Ala Lys Leu His Gly Val
180 185 190
Gly Lys Val Thr Ala Glu Arg Leu Ala Arg Met Gly Ile Arg Thr Cys
195 200 205
Ala Asp Leu Arg Gln Gly Ser Lys Leu Ser Leu Val Arg Glu Phe Gly
210 215 220
Ser Phe Gly Glu Arg Leu Trp Gly Leu Ala His Gly Ile Asp Glu Arg
225 230 235 240
Pro Val Glu Val Asp Ser Arg Arg Gln Ser Val Ser Val Glu Cys Thr
245 250 255
Phe Asp Arg Asp Leu Pro Asp Leu Ala Ala Cys Leu Glu Glu Leu Pro
260 265 270
Thr Leu Leu Glu Glu Leu Asp Gly Arg Leu Gln Arg Leu Asp Gly Ser
275 280 285
Tyr Arg Pro Asp Lys Pro Phe Val Lys Leu Lys Phe His Asp Phe Thr
290 295 300
Gln Thr Thr Val Glu Gln Ser Gly Ala Gly Arg Asp Leu Glu Ser Tyr
305 310 315 320
Arg Gln Leu Leu Gly Gln Ala Phe Ala Arg Gly Asn Arg Pro Val Arg
325 330 335
Leu Ile Gly Val Gly Val Arg Leu Leu Asp Leu Gln Gly Ala His Glu
340 345 350
Gln Leu Arg Leu Phe
355
<210> 26
<211> 366
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS054的蛋白序列
<400> 26
Met His His His His His His Gly Ser Arg Lys Ile Ile His Cys Asp
1 5 10 15
Cys Asp Cys Phe Tyr Ala Ser Ile Glu Met Arg Asp Asp Pro Ser Leu
20 25 30
Arg Gly Arg Pro Leu Ala Val Gly Gly Arg Pro Glu Thr Arg Gly Val
35 40 45
Val Ala Thr Cys Asn Tyr Glu Ala Arg Lys Tyr Gly Val His Ser Ala
50 55 60
Met Ser Ser Ala Arg Ala Val Arg Leu Cys Pro Asp Leu Leu Ile Ile
65 70 75 80
Pro Pro Arg Met Glu Met Tyr Arg Val Ala Ser Ala Gln Ile Met Asp
85 90 95
Ile Tyr Arg Asp Tyr Thr Glu Leu Val Glu Pro Leu Ser Leu Asp Glu
100 105 110
Ala Tyr Leu Asp Val Thr Gly Ser Asp Arg Leu Gln Gly Ser Ala Thr
115 120 125
Arg Ile Ala Ser Glu Ile Arg Gln Arg Val Ala Gln Ala Val Gly Ile
130 135 140
Thr Val Ser Ala Gly Val Ala Pro Ser Lys Phe Val Ala Lys Ile Ala
145 150 155 160
Ser Asp Trp Asn Lys Pro Asp Gly Leu Phe Val Val Arg Pro Gln Asp
165 170 175
Val Asp Thr Phe Val Ala Ala Leu Pro Val Ala Lys Leu His Gly Val
180 185 190
Gly Lys Val Thr Gly Ala Arg Leu Lys Ala Leu Gly Val Glu Thr Cys
195 200 205
Ala Asp Leu Arg Glu Trp Glu His Asp Arg Leu Arg Asp Glu Phe Gly
210 215 220
Ala Phe Gly Glu Arg Leu His Asp Leu Cys Arg Gly Ile Asp Leu Arg
225 230 235 240
Glu Val Ser Pro Thr Arg Glu Arg Lys Ser Val Ser Val Glu Gln Thr
245 250 255
Phe Val Thr Asp Leu His Thr Leu Glu Ala Cys Gln Ala Leu Leu Arg
260 265 270
Glu Met Leu Asp Gln Leu Asp Ala Arg Val Arg Arg Ala Asp Ala Gln
275 280 285
Asn His Ile Gln Lys Leu Phe Val Lys Leu Arg Phe Ser Asp Phe Asn
290 295 300
Arg Thr Thr Ala Glu Gly Val Gly Ala Ala Leu Asp Glu Glu Gln Phe
305 310 315 320
Arg Ile Leu Leu Ala Thr Ala Phe Arg Arg Asn Pro Arg Ala Val Arg
325 330 335
Leu Met Gly Leu Gly Val Arg Leu Gly Ala Pro Gly Gly Gln Leu Ala
340 345 350
Leu Phe Gly Asp Gln Pro Thr Val Ser Glu Pro Asp Thr Val
355 360 365
<210> 27
<211> 510
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS066的蛋白序列
<400> 27
Met His His His His His His Gly Ser Ser Phe Ile Pro Leu Lys Arg
1 5 10 15
Arg Arg Ala Gly Pro Val Ser Glu Glu Pro Leu Asp Ser Leu Gln Ser
20 25 30
Leu Phe Pro Asp Val Cys Leu Phe Leu Val Glu Arg Arg Met Gly Ser
35 40 45
Ala Arg Arg Lys Phe Leu Thr Gly Leu Ala Gln Lys Lys Gly Phe Cys
50 55 60
Val Thr Pro Gln Phe Ser Asp Gln Val Thr His Val Val Ser Glu Gln
65 70 75 80
Asn Ser Cys Ser Glu Val Leu Leu Trp Ile Glu Arg Gln Ser Gly Gln
85 90 95
Lys Val Gln Pro Gly Gly Ala Glu Met Thr Pro His Ile Leu Asp Ile
100 105 110
Thr Trp Phe Thr Glu Ser Met Ser Leu Gly Lys Pro Val Lys Val Glu
115 120 125
Pro Arg His Cys Leu Gly Val Ser Asp Ser Ser Val Ser Arg Asp Lys
130 135 140
Ala Thr Gln Glu Ile Pro Ala Tyr Gly Cys Gln Arg Arg Thr Pro Leu
145 150 155 160
His His His Asn Lys Glu Ile Thr Asp Ala Leu Glu Ile Leu Ala Leu
165 170 175
Ser Ala Ser Phe Gln Gly Ser Glu Ala Arg Phe Leu Gly Phe Thr Arg
180 185 190
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Arg Leu Gln Ser Val Glu
195 200 205
Glu Val Lys Asp Leu Pro Trp Cys Gly Gly His Ser Gln Thr Val Ile
210 215 220
Gln Glu Ile Leu Glu Asp Gly Val Cys Arg Glu Val Glu Thr Val Lys
225 230 235 240
Asn Ser Glu His Phe Gln Ser Met Lys Ala Leu Thr Ser Ile Phe Gly
245 250 255
Val Gly Ile Arg Thr Ala Asp Lys Trp Tyr Arg Asp Gly Val Arg Ser
260 265 270
Leu Ser Asp Leu Asn Asn Leu Gly Gly Lys Leu Thr Ala Glu Gln Lys
275 280 285
Ala Gly Leu Leu His Tyr Thr Asp Leu Gln Gln Ser Val Thr Arg Glu
290 295 300
Glu Ala Gly Thr Val Glu Gln Leu Ile Lys Gly Ala Leu Gln Ser Phe
305 310 315 320
Val Pro Asp Val Arg Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys
325 330 335
Gln Glu Gly His Asp Val Asp Phe Leu Ile Thr His Pro Asp Glu Glu
340 345 350
Ala Leu Asn Gly Leu Leu Arg Lys Ala Val Ala Trp Leu Asp Gly Lys
355 360 365
Gly Ser Val Leu Tyr Tyr His Val Arg Ala Arg Ser Gln Asn Phe Ser
370 375 380
Gly Ser Asn Thr Met Asp Gly His Glu Thr Cys Tyr Ser Ile Ile Ala
385 390 395 400
Leu Pro Asn Val Cys Pro Glu Lys Pro Ser Pro Asp Ala Glu Lys Ile
405 410 415
Glu Pro Asp Leu Asp Lys Asn Ser Leu Arg Asn Trp Lys Ala Val Arg
420 425 430
Val Asp Leu Val Val Cys Pro Tyr Ser Glu Tyr Phe Tyr Ala Leu Leu
435 440 445
Gly Trp Thr Gly Ser Lys His Phe Glu Arg Glu Leu Arg Arg Phe Ser
450 455 460
Leu His Val Lys Lys Met Ser Leu Asn Ser His Gly Leu Phe Asp Ile
465 470 475 480
Gln Lys Lys Cys His His Pro Ala Thr Ser Glu Glu Glu Ile Phe Ala
485 490 495
His Leu Gly Leu Pro Tyr Val Pro Pro Ser Glu Arg Asn Ala
500 505 510
<210> 28
<211> 438
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS082的蛋白序列
<400> 28
Met His His His His His His Gly Ser Glu Gln Gln Lys Leu Leu Asp
1 5 10 15
Thr Lys Glu Tyr Ile Ile Lys Leu Asp Glu Leu Lys Pro Glu Thr Arg
20 25 30
Lys Glu Ser Pro Ala Ser Lys Gln His Ile Glu Asn Leu Gln Lys Gln
35 40 45
Glu Thr Lys Glu Lys Leu Ile Ala Glu Ser Ser Thr Gly Asn Pro Asn
50 55 60
Glu Arg Thr Ile Phe Leu Leu Asn Gln Met Ala Glu Glu Arg Leu Leu
65 70 75 80
Gln Gly Glu His Phe Lys Ala Lys Ala Tyr Lys Asn Ala Ile Asn Ala
85 90 95
Leu Asn Asn Thr Gly Asp Phe Ile Ser Asp Ala Asn Glu Ala Leu Arg
100 105 110
Leu Lys Gly Ile Gly Val Ser Val Ala Gln Lys Ile Glu Glu Ile Val
115 120 125
Lys Thr Asn Thr Leu Ser Ser Leu Asn Glu Ile Lys Ser Asp Lys Glu
130 135 140
His Gln Val Ser Lys Leu Phe Met Gly Ile His Gly Val Gly Pro Val
145 150 155 160
Ser Ala Lys Lys Trp Tyr Asn Asp Gly Leu Arg Thr Leu Glu Asp Val
165 170 175
Ser Gln Lys Pro Asp Leu Thr Ser Asn Gln Thr Leu Gly Leu Lys Tyr
180 185 190
Tyr Asp Glu Trp Leu Glu Arg Ile Pro Arg Asp Glu Cys Thr Leu His
195 200 205
Asn Glu Phe Met Ser Asp Leu Val Ser Gln Ile Asp Pro Leu Val Gln
210 215 220
Phe Thr Ile Gly Gly Ser Tyr Arg Arg Gly Ser Pro Thr Cys Gly Asp
225 230 235 240
Val Asp Phe Ile Ile Thr Lys Pro Asn Ala Asp Asn Glu Glu Met Lys
245 250 255
Glu Ile Leu Glu Lys Ile Leu Val Lys Ile Glu Gln Val Gly Tyr Leu
260 265 270
Lys Cys Ser Leu Gln Lys Lys His Ser Thr Lys Phe Leu Ser Gly Cys
275 280 285
Ala Leu Pro Pro Asn Tyr Ala Ser Arg Leu Pro Glu Tyr Ser Glu Gly
290 295 300
Lys Trp Gly Lys Cys Arg Arg Ile Asp Phe Leu Met Val Pro Trp Lys
305 310 315 320
Glu Arg Gly Ala Ala Phe Ile Tyr Phe Thr Gly Asn Asp Tyr Phe Asn
325 330 335
Arg Leu Ile Arg Leu Lys Ala Val Lys Asn Gly Leu Val Leu Asn Glu
340 345 350
Ser Gly Leu Phe Lys Arg Ile Lys Tyr Val Gln Gly Lys Asn Val Glu
355 360 365
Asp Lys Thr Met Leu Ile Glu Ser Phe Ser Glu Lys Lys Ile Phe Lys
370 375 380
Leu Leu Gly Phe Lys Tyr Val Pro Pro Glu Gln Arg Asn Phe Gly Ala
385 390 395 400
Asn Asn Pro Pro Ser Lys Leu Gly Lys His Leu Asp Gln Phe Arg Ile
405 410 415
Asp His Lys Tyr Phe Asp Lys Val Val Lys Glu Glu Ile Ile Asp Asp
420 425 430
Asp Val Ile Glu Val Asp
435
<210> 29
<211> 391
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS048的蛋白序列
<400> 29
Met His His His His His His Gly Ser Arg Thr Asp Tyr Ser Ala Thr
1 5 10 15
Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu Ala Val Lys Lys Ile
20 25 30
Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu Asn Asn Tyr Asn His
35 40 45
Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Ser Glu Phe Lys
50 55 60
Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg Ala Ala Ser Val Leu
65 70 75 80
Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys Asp Thr Glu Gly Ile
85 90 95
Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile Glu Glu Ile Ile Glu
100 105 110
Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn Asp Glu Arg Tyr
115 120 125
Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys Thr
130 135 140
Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser Lys Ile Met
145 150 155 160
Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln Lys Ala Gly Phe Leu
165 170 175
Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala Glu Ala Glu Ala
180 185 190
Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe Leu Pro Asp Ala
195 200 205
Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His
210 215 220
Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser Ala Glu Asp Glu Glu
225 230 235 240
Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu
245 250 255
Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro
260 265 270
Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln Lys Cys Phe Leu Ile
275 280 285
Leu Lys Leu His His Gln Arg Val Asp Ser Ser Lys Ser Asn Gln Gln
290 295 300
Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro
305 310 315 320
Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg Gln
325 330 335
Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met
340 345 350
Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg Val Phe Leu Lys
355 360 365
Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile
370 375 380
Glu Pro Trp Glu Arg Asn Ala
385 390
<210> 30
<211> 518
<212> PRT
<213> 人工序列
<220>
<223> 带有His6标签的表达EDS015的蛋白序列
<400> 30
Met His His His His His His Gly Ser Asp Pro Leu Gln Ala Val His
1 5 10 15
Leu Gly Pro Arg Lys Lys Arg Pro Arg Gln Leu Gly Thr Pro Val Ala
20 25 30
Ser Thr Pro Tyr Asp Ile Arg Phe Arg Asp Leu Val Leu Phe Ile Leu
35 40 45
Glu Lys Lys Met Gly Thr Thr Arg Arg Ala Phe Leu Met Glu Leu Ala
50 55 60
Arg Arg Lys Gly Phe Arg Val Glu Asn Glu Leu Ser Asp Ser Val Thr
65 70 75 80
His Ile Val Ala Glu Asn Asn Ser Gly Ser Asp Val Leu Glu Trp Leu
85 90 95
Gln Leu Gln Asn Ile Lys Ala Ser Ser Glu Leu Glu Leu Leu Asp Ile
100 105 110
Ser Trp Leu Ile Glu Cys Met Gly Ala Gly Lys Pro Val Glu Met Met
115 120 125
Gly Arg His Gln Leu Val Val Asn Arg Asn Ser Ser Pro Ser Pro Val
130 135 140
Pro Gly Ser Gln Asn Val Pro Ala Pro Ala Val Lys Lys Ile Ser Gln
145 150 155 160
Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Gln Leu Phe
165 170 175
Thr Asp Ala Leu Asp Ile Leu Ala Glu Asn Asp Glu Leu Arg Glu Asn
180 185 190
Glu Gly Ser Cys Leu Ala Phe Met Arg Ala Ser Ser Val Leu Lys Ser
195 200 205
Leu Pro Phe Pro Ile Thr Ser Met Lys Asp Thr Glu Gly Ile Pro Cys
210 215 220
Leu Gly Asp Lys Val Lys Ser Ile Ile Glu Gly Ile Ile Glu Asp Gly
225 230 235 240
Glu Ser Ser Glu Ala Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ser
245 250 255
Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly Leu Lys Thr Ala Glu
260 265 270
Lys Trp Phe Arg Met Gly Phe Arg Thr Leu Ser Lys Ile Gln Ser Asp
275 280 285
Lys Ser Leu Arg Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr Tyr
290 295 300
Glu Asp Leu Val Ser Cys Val Asn Arg Pro Glu Ala Glu Ala Val Ser
305 310 315 320
Met Leu Val Lys Glu Ala Val Val Thr Phe Leu Pro Asp Ala Leu Val
325 330 335
Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Met Thr Gly His Asp Val
340 345 350
Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr Glu Asp Glu Glu Gln Gln
355 360 365
Leu Leu His Lys Val Thr Asp Phe Trp Lys Gln Gln Gly Leu Leu Leu
370 375 380
Tyr Cys Asp Ile Leu Glu Ser Thr Phe Glu Lys Phe Lys Gln Pro Ser
385 390 395 400
Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu
405 410 415
Lys Leu Asp His Gly Arg Val His Ser Glu Lys Ser Gly Gln Gln Glu
420 425 430
Gly Lys Gly Trp Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr
435 440 445
Asp Arg Arg Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe
450 455 460
Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu
465 470 475 480
Asp Asn His Ala Leu Tyr Asp Arg Thr Lys Arg Val Phe Leu Glu Ala
485 490 495
Glu Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu
500 505 510
Pro Trp Glu Arg Asn Ala
515
<210> 31
<211> 5515
<212> DNA
<213> 人工序列
<220>
<223> PP1077表达载体全序列
<400> 31
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcagc aagtttacct ggaaagaact 1560
gattcagctg ggtagcccga gcaaagcata tgaaagcagc ctggcatgta ttgcccatat 1620
tgatatgaat gcatttttcg cacaggttga gcagatgcgt tgtggtctga gcaaagaaga 1680
tccggttgtt tgcgttcagt ggaatagcat tattgcagtt agctatgcag cccgtaaata 1740
tggtattagc cgtatggata ccattcaaga ggcactgaaa aaatgcagca atctgattcc 1800
gattcatacc gcagttttca aaaaaggcga agatttttgg cagtatcatg atggttgtgg 1860
tagctgggtt caagatccgg caaaacaaat ttcagtcgaa gatcataaag ttagcctgga 1920
accgtatcgt cgtgaaagcc gtaaagccct gaaaatcttt aaaagcgcat gtgatctggt 1980
tgaacgtgca agcattgatg aagtttttct ggatctgggt cgcatttgtt ttaacatgct 2040
gatgttcgat aacgagtatg aactgaccgg tgatctgaaa ctgaaagatg cactgagcaa 2100
tattcgcgaa gcatttattg gtggcaacta tgatattaac agccatctgc cgctgattcc 2160
ggaaaaaatc aaaagcctga aattcgaagg cgacgtgttt aatccggaag gtcgtgatct 2220
gattacagat tgggatgatg ttattctggc actgggtagt caggtttgta aaggtattcg 2280
tgatagcatc aaagatatcc tgggttatac cacctcatgt ggtctgtcaa gcaccaaaaa 2340
tgtttgtaaa ctggccagca actacaaaaa accggatgca cagaccattg tgaaaaatga 2400
ttgtctgctg gatttcctgg attgcggcaa atttgaaatt accagctttt ggaccttagg 2460
tggtgttctg ggtaaagaat taattgatgt gctggatctg ccgcatgaaa acagcattaa 2520
acatattcgt gaaacctggc ctgataatgc aggtcagctg aaagaatttc tggatgccaa 2580
agttaaacag agcgattatg atcgtagcac cagcaatatt gatccgctga aaaccgcaga 2640
tctggccgaa aaactgttta aactgagccg tggtcgttat ggcctgccgc tgtcaagccg 2700
tccggttgtg aaaagcatga tgagcaataa aaacctgcgt ggcaaaagct gcaatagcat 2760
tgttgattgt attagctggc tggaagtttt ttgtgcagaa ctgaccagcc gtattcagga 2820
tctggaacaa gaatataaca agatcgttat tccgcgtacc gttagcatta gcctgaaaac 2880
caaaagctat gaggtgtatc gtaaaagcgg tccggtggca tataaaggta tcaattttca 2940
gagccacgaa ctgctgaaag tgggtatcaa atttgtgacc gatctggata tcaaaggcaa 3000
gaacaaaagt tattacccgc tgaccaaact gagcatgacc attaccaatt tcgatatcat 3060
cgatctgcag aaaaccgtgg ttgatatgtt tggtaatcag gtgcatacgt ttaaaagcag 3120
cgcaggtaaa gaagatgaag aaaaaaccac cagtagcaaa gccgatgaaa aaaccccgaa 3180
actggaatgt tgtaaatatc aggttacctt caccgatcag aaagcactgc aagaacatgc 3240
agattatcat ctggccctga aactgtctga aggtctgaat ggtgcagaag aaagcagcaa 3300
aaatctgagc tttggtgaaa aacgtctgct gtttagccgt aaacgtccga atagccagca 3360
taccgcaaca ccgcagaaaa aacaggttac cagcagtaaa aacatcctga gcttttttac 3420
ccgcaaaaaa tgatgcacgt gaggatccaa ctcgagaact tagatggtat tagtgacctg 3480
taacagagca ttagcgcaag gtgatttttg tcttcttgcg ctaatttttt gtcatcaaac 3540
ctgtcgctag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 3600
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 3660
tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 3720
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 3780
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 3840
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 3900
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 3960
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4020
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4080
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 4140
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4200
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 4260
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 4320
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 4380
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 4440
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 4500
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 4560
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 4620
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 4680
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 4740
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 4800
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 4860
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 4920
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 4980
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5040
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5100
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5160
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 5220
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 5280
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 5340
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 5400
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 5460
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaa 5515
<210> 32
<211> 5113
<212> DNA
<213> 人工序列
<220>
<223> PP1084表达载体全序列
<400> 32
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcttt catgcaaccg cactgcctcg 1560
tatgcgtaaa cgtccgcgtc cggaagaagt tgcctgtccg ggtcgtgaag atgttaaatt 1620
tcgtgatgtt cgtctgtacc tggtggaaat gaaaatgggt cgtagccgtc gtagctttct 1680
gacccagctg gcacgtagca aaggttttat ggttgaagag gttctgagca atcgtgttac 1740
ccatgttgtt agcgaaagca gccaggcacc ggttctgtgg gcatggctga aagaacgtgc 1800
accgcaggat ctgccgaata tgcatgttgt gaatattacc tggtttaccg atagcatgcg 1860
tgaaagccgt ccggttgcag ttgaaacccg tcatctgatt caggataccc tgcctgcaat 1920
tccggaaggt ggtgcaccgg cagccgaagt tagccagtat gcatgtcagc gtcgtaccac 1980
caccgataac tataatgttg tttttaccga tgcctttgaa gttctggccg aatgctatga 2040
atttaatcag atggatggtc gttgtctggc atttcgtcgt gcagcaagcg ttctgaaaag 2100
cctgcctcgt ggtctgagca gcctggaaga aacccatagc ctgccgtgtt taggtggtca 2160
tgcaaaagca attattggcg aaattctgca gcatggtcgt gcatttgatg ttgaaaaagt 2220
tctgagtgat gaacgctatc agaccctgaa actgtttacc agcgtttatg gtgttggtcc 2280
gaaaaccgca gaaaaatggt atcgtagcgg tctgcgtagc ctggatcata ttctggcgga 2340
tcagagcatc cagctgaatc atatgcagca gaatggtttt ctgcattatg gtgatattag 2400
ccgtgcagtt agcaaagccg aagcacgtgc actgaccaaa gcaattggtg aaaccgttca 2460
ggcaattaca ccggatgcac tgctggcact gaccggtggt tttcgtcgcg gtaaagaatt 2520
tggtcatgat gtggatatta tctttaccac gctggaatta ggcatggaag aaaatctgct 2580
gctggcagtg attaaaagtc tggaaaaaca gggtattctg ctgtattgtg attatcaggc 2640
aagcaccttt gatctgacca aactgccgac acatagcttt gaagcaatgg atcattttgc 2700
caagtgcttt ctgattctgc gtctggaagc aagccaggtt gaagaaggcc tgaatagtcc 2760
ggttgaagat attcgtggtt ggcgtgcagt tcgtgttgat ctggttagcc ctccggttga 2820
tcgttatgca tttgcactgt taggttggac cggtagccgt cagtttgaac gtgatctgcg 2880
tcgttttgca cgtaaagaac gtcgtatgct gctggataat catggcctgt atgataaaac 2940
caaagaagaa tttctggcag ccggtacgga aaaagatatt tttgatcatc tgggccttga 3000
gtatatggaa ccgtggcagc gtaatgcata atgcacgtga ggatccaact cgagaactta 3060
gatggtatta gtgacctgta acagagcatt agcgcaaggt gatttttgtc ttcttgcgct 3120
aattttttgt catcaaacct gtcgctagtt aagccagccc cgacacccgc caacacccgc 3180
tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt 3240
ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa 3300
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 3360
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 3420
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 3480
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 3540
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 3600
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 3660
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 3720
cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 3780
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 3840
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 3900
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3960
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 4020
tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 4080
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 4140
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 4200
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 4260
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 4320
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 4380
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 4440
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 4500
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 4560
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 4620
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt 4680
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 4740
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 4800
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 4860
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 4920
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4980
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 5040
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 5100
gagcctatgg aaa 5113
<210> 33
<211> 5323
<212> DNA
<213> 人工序列
<220>
<223> PP1089表达载体全序列
<400> 33
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcggt attctgagcg gcaaaaaatt 1560
cctgattctg ccgaatagcc ataccggtag cgttaatatt ctggcaggta ttgttaaaga 1620
acaaggtggt tttctggtta gcagcgcaga tcgtctgagc aatgatgttg ttgttctggt 1680
gaatgatagc ttcgtggaca aaaccaacaa aattgttaat cgcggtctgt ttctgaaaga 1740
atttgaactg gatgcaagcg ttgtttggac ctatgttctg gaaaatgaac tggtttgtct 1800
gcgtgttagc ctggttccga gctgggttga aaatggcacc tttcatttta gcgatagcga 1860
acgtattatt ctgctggata gcgaaagcca agaacgcgat accaaaaatg ttcagtttca 1920
tagcgcaggt aatgaagagg caggtagtga tgatgaaacc gatgttgaag gtaataaaga 1980
aagcaccggt gatattaccg atgttagcga taccgcaaca ccgcagctgc agagcagtcc 2040
gctgagcaaa tatatcaaac aagaagagga tatcgacaac caggttctga ttaaagcact 2100
gggtcgtctg gtgaaaaaat acgaagttaa aggtgatcag tatcgcagcc gtagctatcg 2160
tctggcaaaa caggcagttg aaaaatatcc gcataaaatc accagcggta gccaggcaca 2220
gcgtcagctg agcaatattg gtagcagcat tgccaaaaaa atccagctgc tgctggacac 2280
cggtacactg cctggtctgg aagatccggc aaccgatgaa tatgaaagca gcctgggtta 2340
tttcagcgaa tgttatggta ttggtgttcc gatggccaaa aaatggatta ccctgaatat 2400
cagcaccttt tatcgtgcag cacgtctgca tccgaaactg tttattagcg attggccgat 2460
tctgtatggc tggacctatt atgaagattg gagcaaacgt attccgcgtg atgaagttac 2520
cgcacatttt gagctggtta aagaagaagt tcgtcgcgtt ggtaatggtt gtagcgttga 2580
aatgcagggt agctatgttc gtggtgcacg tgataccggt gatgttgatc tgatgttcta 2640
caaagaaaat tgcgacgatc tggaagaggt taccattggt atggaaaatg ttgcagcaag 2700
cctgtatcag aaaggctata tcaaatgttt tctgctgctg accgataaac tggaacgcat 2760
gtttcgtccg gatattctga gtcgtctgca gaaatgtggt attgccgaaa tcagcaatga 2820
acataccttt cgtaatagcg accgtggcaa aaaactgttt ttcggtgttg aactgccagg 2880
cgattatccg atttatccgt ttgatgataa agacatcctg cagctgaaac cgcaggataa 2940
attcatgagc aaaagcaaag atgccggtca tttttgtcgt cgtctggatt tcttctgttg 3000
caaatggtca gaactgggtg cagcccgtat tcattatacc ggtaataccg attataaccg 3060
ttggctgcgt gttcgtgcaa tggatatggg ttataaactg acccagcatg gcatcttcaa 3120
agatgatgta ctgctggaaa gctttgatga gcgcaaaatc tttgaatatc tgcatgtgcc 3180
gtatctgaat ccggttgatc gtaataaaac cgattgggtg aatatcccga ttccgaaata 3240
atgcacgtga ggatccaact cgagaactta gatggtatta gtgacctgta acagagcatt 3300
agcgcaaggt gatttttgtc ttcttgcgct aattttttgt catcaaacct gtcgctagtt 3360
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 3420
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 3480
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 3540
taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg 3600
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 3660
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 3720
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 3780
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 3840
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 3900
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 3960
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4020
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4080
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 4140
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 4200
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 4260
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 4320
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 4380
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 4440
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 4500
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 4560
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 4620
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 4680
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 4740
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 4800
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 4860
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 4920
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 4980
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5040
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 5100
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 5160
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 5220
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 5280
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaa 5323
<210> 34
<211> 5209
<212> DNA
<213> 人工序列
<220>
<223> PP1090表达载体全序列
<400> 34
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcaat cgtagcggtc aggttctgag 1560
caaaatgagt aaaacctacc tgtttgatgg cctggaattt ctgtttattc cgaacattaa 1620
tagcagcaag gtgaccttta cacgcaaaaa tctggcacgt aatggtggtg caagcgttgc 1680
caaaaaattc gatcaggata ccaccacaca tgttctggtt gataccaaag tttatctgac 1740
caaagacaaa attagcgcag gtctgaaaaa tgccaaagtg ccgaaaacct ttcagcctgg 1800
taaaattctg aatcagacct ggctggttga ttctattgaa cagcagaaac tgctggacac 1860
caaagagtat attatcaaac tggatgagct gaaaccggaa acgcgtaaag aaagtccggc 1920
aagcaaacag catattgaaa atctgcagaa acaagaaacc aaagagaaac tgattgcaga 1980
aagcagcacc ggtaatccga atgaacgtac catttttctg ctgaaccaga tggcagaaga 2040
acgtctgctg cagggtgaac attttaaagc aaaagcctat aagaacgcca ttaacgccct 2100
gaataatacc ggtgatttta tctcagatgc aaatgaagca ctgcgcctga aaggtattgg 2160
tgttagcgtg gcacagaaaa ttgaagaaat tgtgaaaacc aatacgctga gcagcctgaa 2220
tgaaatcaaa agcgataaag aacaccaggt gagcaaactg tttatgggta ttcatggtgt 2280
tggtccggtt agcgcaaaaa agtggtataa tgatggtctg cgtaccctgg aagatgttag 2340
ccagaaaccg gatctgacca gcaatcagac cctgggcctg aaatattacg atgaatggct 2400
ggaacgtatt ccgcgtgatg aatgtaccct gcataatgaa tttatgagcg atctggtgag 2460
ccagattgat ccgctggttc agtttaccat tggtggtagc tatcgtcgtg gtagcccgac 2520
ctgtggtgat gtggatttta tcattaccaa accgaatgcc gataacgaag agatgaaaga 2580
gattctggaa aagatcctgg tgaaaatcga acaggttggt tatctgaaat gtagcctgca 2640
gaaaaaacac agcaccaaat ttctgagcgg ttgtgcactg cctccgaatt atgcaagccg 2700
tctgccggaa tacagcgaag gtaaatgggg taaatgtcgt cgtattgatt ttctgatggt 2760
tccgtggaaa gaacgtggtg cagcatttat ctattttacc ggcaacgatt atttcaaccg 2820
tctgattcgt ctgaaagccg ttaaaaatgg tctggtgctg aatgaatcag gtctgtttaa 2880
acgcatcaaa tacgtgcagg gtaaaaacgt ggaagataaa accatgctga tcgaaagctt 2940
tagcgagaaa aaaatcttta agctgctggg cttcaaatat gttccgcctg aacagcgtaa 3000
ttttggtgca aataatccgc ctagcaaact gggtaaacat ctggatcagt ttcgcatcga 3060
tcacaaatat ttcgacaaag tggtgaaaga agagatcatt gacgacgatg ttatcgaggt 3120
ggattaatgc acgtgaggat ccaactcgag aacttagatg gtattagtga cctgtaacag 3180
agcattagcg caaggtgatt tttgtcttct tgcgctaatt ttttgtcatc aaacctgtcg 3240
ctagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 3300
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 3360
gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt 3420
ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa 3480
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 3540
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 3600
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 3660
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 3720
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 3780
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 3840
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 3900
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 3960
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 4020
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 4080
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 4140
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 4200
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 4260
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 4320
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 4380
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 4440
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 4500
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 4560
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 4620
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 4680
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 4740
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 4800
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 4860
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 4920
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 4980
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 5040
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 5100
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 5160
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 5209
<210> 35
<211> 4666
<212> DNA
<213> 人工序列
<220>
<223> PP1113表达载体全序列
<400> 35
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagccgc aaaatcatcc atattgattg 1560
cgattgcttt tacgcagcac tggaaatgcg tgatgatccg agcctgcgtg gtaaagcact 1620
ggcagttggt ggtagtccgg ataaacgtgg tgttgttgca acctgtagct atgaagcacg 1680
tgcatatggt gttcgtagcg caatggcaat gcgtaccgca ctgaaactgt gtccggatct 1740
gctggttgtt cgtccgcgtt ttgatgttta tcgtgcagtt agcaaacaaa tccatgccat 1800
ctttcgtgat tataccgatc tgattgaacc gctgagcctg gatgaagcat atctggatgt 1860
tagcgcaagt ccgcattttg caggtagcgc aacccgtatt gcacaggata ttcgtcgtcg 1920
tgttgcagaa gaactgcgta ttaccgttag tgccggtgtt gcaccgaaca aatttctggc 1980
aaaaattgca agcgattggc gtaaaccgga tggtctgttt gttattacac cggaacaggt 2040
tgatggtttt gttgccgaac tgccggttgc aaaactgcat ggtgttggta aagttaccgc 2100
agaacgtctg gcacgtatgg gtattcgtac ctgtgccgat ctgcgtcagg gtagcaaact 2160
gagtctggtt cgtgaatttg gtagctttgg tgaacgtctg tggggtttag cacatggtat 2220
tgatgaacgt ccggttgaag ttgatagccg tcgtcagagc gttagcgttg aatgtacctt 2280
tgatcgtgat ctgccggatc tggcagcatg tctggaagaa ttaccgacac tgctggaaga 2340
actggatggt cgtctgcagc gtctggatgg tagctatcgt cctgataaac cgtttgtgaa 2400
actgaaattc cacgatttta cccagaccac cgttgaacag agcggtgcag gtcgcgatct 2460
ggaaagttat cgtcagctgc tgggtcaagc atttgcacgt ggtaatcgtc cggttcgtct 2520
gattggtgtg ggtgttcgtc tgctggatct gcagggtgca catgaacagc tgcgtctgtt 2580
ttaatgcacg tgaggatcca actcgagaac ttagatggta ttagtgacct gtaacagagc 2640
attagcgcaa ggtgattttt gtcttcttgc gctaattttt tgtcatcaaa cctgtcgcta 2700
gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 2760
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 2820
ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata 2880
ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt 2940
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 3000
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 3060
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 3120
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 3180
cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 3240
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg 3300
gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 3360
agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 3420
aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 3480
gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 3540
ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc 3600
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 3660
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 3720
tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc 3780
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 3840
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 3900
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 3960
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 4020
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 4080
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 4140
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 4200
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 4260
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 4320
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 4380
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 4440
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 4500
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 4560
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 4620
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaa 4666
<210> 36
<211> 4693
<212> DNA
<213> 人工序列
<220>
<223> PP1114表达载体全序列
<400> 36
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagccgc aaaatcattc attgtgattg 1560
cgattgcttt tacgccagca ttgaaatgcg tgatgatccg agcctgcgtg gtcgtccgct 1620
ggcagttggt ggccgtccgg aaacacgtgg tgttgttgca acctgtaatt atgaagcacg 1680
taaatatggt gttcatagcg caatgagcag cgcacgtgca gttcgtctgt gtccggatct 1740
gctgattatt ccgcctcgta tggaaatgta tcgtgttgca agcgcacaga tcatggatat 1800
ttatcgtgat tataccgaac tggttgaacc gctgagcctg gatgaagcat atctggatgt 1860
taccggtagc gatcgtctgc agggtagcgc aacccgtatt gcaagcgaaa ttcgtcagcg 1920
tgttgcacag gccgttggta ttaccgttag tgccggtgtt gcaccgagca aatttgttgc 1980
caaaattgcc agcgattgga ataaaccgga tggtctgttt gttgttcgtc cgcaggatgt 2040
tgataccttt gttgcagcac tgccggttgc aaaactgcat ggtgttggta aagttaccgg 2100
tgcacgtctg aaagcactgg gtgttgaaac ctgtgccgat ctgcgtgaat gggaacatga 2160
tcgtttacgt gatgaatttg gtgcatttgg tgaacgtctg cacgatctgt gtcgtggtat 2220
tgatctgcgc gaagttagcc cgacacgtga acgtaaaagc gttagcgttg aacagacctt 2280
tgttaccgat ctgcataccc tggaagcatg tcaggcactg ctgcgtgaaa tgctggatca 2340
gctggatgca cgtgttcgtc gtgcagatgc acagaaccat attcagaaac tgtttgtgaa 2400
actgcgcttc agcgatttta atcgtaccac agccgaaggt gttggtgccg cactggatga 2460
ggaacagttt cgtattctgc tggcaaccgc atttcgtcgt aatccgcgtg ccgtgcgtct 2520
gatgggtctg ggtgttcgtc tgggtgcacc tggtggtcag ctggcactgt ttggtgatca 2580
gccgaccgtt agcgaaccgg ataccgttta atgcacgtga ggatccaact cgagaactta 2640
gatggtatta gtgacctgta acagagcatt agcgcaaggt gatttttgtc ttcttgcgct 2700
aattttttgt catcaaacct gtcgctagtt aagccagccc cgacacccgc caacacccgc 2760
tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt 2820
ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa 2880
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2940
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 3000
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 3060
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 3120
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 3180
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 3240
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 3300
cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc 3360
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 3420
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 3480
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3540
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3600
tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3660
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3720
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3780
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3840
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3900
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3960
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 4020
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 4080
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 4140
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 4200
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt 4260
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 4320
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 4380
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 4440
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 4500
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4560
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4620
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4680
gagcctatgg aaa 4693
<210> 37
<211> 5125
<212> DNA
<213> 人工序列
<220>
<223> PP1126表达载体全序列
<400> 37
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcagc tttattccgc tgaaacgtcg 1560
tcgtgcaggt ccggttagcg aagaaccgct ggatagcctg cagagcctgt ttccggatgt 1620
ttgtctgttt ctggttgaac gtcgtatggg tagcgcacgt cgtaaatttc tgaccggtct 1680
ggcacagaaa aaaggttttt gtgttacacc gcagtttagc gatcaggtta cccatgttgt 1740
tagcgaacag aatagctgta gcgaagttct gctgtggatt gaacgtcaga gtggtcagaa 1800
agttcagcct ggtggtgcag aaatgacacc gcatattctg gatattacct ggtttaccga 1860
aagcatgagc ctgggtaaac cggttaaagt tgaaccgcgt cattgtctgg gtgttagcga 1920
tagcagcgtt agccgtgata aagcaaccca agaaattccg gcatatggtt gtcagcgtcg 1980
tacaccgctg catcatcata ataaagaaat taccgatgcg ctggaaattc tggcactgag 2040
cgcaagcttt cagggtagcg aagcacgttt tctgggtttt acccgtgcaa gcagcgttct 2100
gaaaagcctg ccgtttcgtc tgcagagcgt tgaagaggtt aaagatctgc cgtggtgtgg 2160
tggtcatagc cagaccgtta ttcaagaaat cctggaagat ggtgtttgcc gtgaagttga 2220
aaccgtgaaa aatagcgaac atttccagag catgaaagca ctgaccagca tttttggtgt 2280
tggtattcgt accgcagata aatggtatcg tgatggtgtt cgtagcctga gcgatctgaa 2340
taatcttggt ggtaaactga ccgcagaaca gaaagcaggt ctgctgcatt acaccgatct 2400
gcagcagagc gtgacccgtg aagaagcagg caccgttgaa cagctgatta aaggtgcact 2460
gcagagcttt gtgccggatg tgcgtgttac catgaccggt ggttttcgtc gtggtaaaca 2520
agagggtcat gatgtggatt ttctgattac ccatcctgat gaagaagccc tgaacggcct 2580
gctgcgtaaa gcagttgcat ggctggatgg taaaggtagc gttctgtatt atcatgttcg 2640
tgcacgtagt cagaatttta gcggtagcaa taccatggat ggtcatgaaa cctgttatag 2700
cattattgca ctgccgaatg tttgtccgga aaaaccgagt ccggatgcag aaaaaattga 2760
accggatctg gataaaaaca gcctgcgtaa ttggaaagca gttcgtgttg atctggttgt 2820
ttgcccgtat agcgaatact tttatgcact gttaggttgg accggcagca aacattttga 2880
acgtgaactg cgtcgtttta gcctgcatgt gaaaaaaatg agcctgaata gccatggcct 2940
gtttgacatt cagaaaaagt gtcatcatcc ggcaaccagc gaagaagaaa tttttgcaca 3000
tctgggtctg ccgtatgttc cgcctagcga acgtaatgca taatgcacgt gaggatccaa 3060
ctcgagaact tagatggtat tagtgacctg taacagagca ttagcgcaag gtgatttttg 3120
tcttcttgcg ctaatttttt gtcatcaaac ctgtcgctag ttaagccagc cccgacaccc 3180
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca 3240
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg 3300
cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat 3360
ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 3420
atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 3480
tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 3540
cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 3600
agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 3660
taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 3720
tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 3780
catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 3840
ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc 3900
ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa 3960
catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc 4020
aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt 4080
aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 4140
taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa 4200
atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa 4260
gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa 4320
tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt 4380
ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt 4440
gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 4500
agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 4560
aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 4620
agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 4680
tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 4740
atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 4800
taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 4860
gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 4920
gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 4980
aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 5040
tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 5100
gtcagggggg cggagcctat ggaaa 5125
<210> 38
<211> 4909
<212> DNA
<213> 人工序列
<220>
<223> PP1142表达载体全序列
<400> 38
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcgaa cagcagaaac tgctggacac 1560
caaagagtat attatcaaac tggatgagct gaaaccggaa acgcgtaaag aaagtccggc 1620
aagcaaacag catattgaaa atctgcagaa acaagaaacc aaagagaaac tgattgcaga 1680
aagcagcacc ggtaatccga atgaacgtac catttttctg ctgaaccaga tggcagaaga 1740
acgtctgctg cagggtgaac attttaaagc aaaagcctat aagaacgcca ttaacgccct 1800
gaataatacc ggtgatttta tctcagatgc aaatgaagca ctgcgcctga aaggtattgg 1860
tgttagcgtg gcacagaaaa ttgaagaaat tgtgaaaacc aatacgctga gcagcctgaa 1920
tgaaatcaaa agcgataaag aacaccaggt gagcaaactg tttatgggta ttcatggtgt 1980
tggtccggtt agcgcaaaaa agtggtataa tgatggtctg cgtaccctgg aagatgttag 2040
ccagaaaccg gatctgacca gcaatcagac cctgggcctg aaatattacg atgaatggct 2100
ggaacgtatt ccgcgtgatg aatgtaccct gcataatgaa tttatgagcg atctggtgag 2160
ccagattgat ccgctggttc agtttaccat tggtggtagc tatcgtcgtg gtagcccgac 2220
ctgtggtgat gtggatttta tcattaccaa accgaatgcc gataacgaag agatgaaaga 2280
gattctggaa aagatcctgg tgaaaatcga acaggttggt tatctgaaat gtagcctgca 2340
gaaaaaacac agcaccaaat ttctgagcgg ttgtgcactg cctccgaatt atgcaagccg 2400
tctgccggaa tacagcgaag gtaaatgggg taaatgtcgt cgtattgatt ttctgatggt 2460
tccgtggaaa gaacgtggtg cagcatttat ctattttacc ggcaacgatt atttcaaccg 2520
tctgattcgt ctgaaagccg ttaaaaatgg tctggtgctg aatgaatcag gtctgtttaa 2580
acgcatcaaa tacgtgcagg gtaaaaacgt ggaagataaa accatgctga tcgaaagctt 2640
tagcgagaaa aaaatcttta agctgctggg cttcaaatat gttccgcctg aacagcgtaa 2700
ttttggtgca aataatccgc ctagcaaact gggtaaacat ctggatcagt ttcgcatcga 2760
tcacaaatat ttcgacaaag tggtgaaaga agagatcatt gacgacgatg ttatcgaggt 2820
ggattaatgc acgtgaggat ccaactcgag aacttagatg gtattagtga cctgtaacag 2880
agcattagcg caaggtgatt tttgtcttct tgcgctaatt ttttgtcatc aaacctgtcg 2940
ctagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 3000
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 3060
gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt 3120
ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa 3180
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 3240
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 3300
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 3360
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 3420
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 3480
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 3540
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 3600
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 3660
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 3720
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 3780
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 3840
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 3900
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 3960
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 4020
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 4080
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 4140
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 4200
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 4260
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 4320
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 4380
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 4440
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 4500
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 4560
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 4620
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 4680
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 4740
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 4800
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 4860
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 4909
<210> 39
<211> 4768
<212> DNA
<213> 人工序列
<220>
<223> PP1108表达载体全序列
<400> 39
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagccgt accgattata gcgcaacccc 1560
gaatccgggt tttcagaaaa caccgcctct ggcagtgaaa aaaatcagcc agtatgcatg 1620
tcagcgtaaa accacactga ataactataa ccacatcttc accgatgcct ttgaaattct 1680
ggcagaaaac agcgaattca aagaaaacga agttagctac gtgaccttta tgcgtgcagc 1740
aagcgttctg aaaagcctgc cgtttaccat tattagcatg aaagataccg aaggtattcc 1800
gtgtctgggt gataaagtga aatgcatcat tgaagagatc atcgaagatg gtgaaagcag 1860
cgaagttaaa gcagttctga atgatgaacg ttaccagagc ttcaaactgt ttaccagcgt 1920
ttttggtgtt ggcctgaaaa ccagcgaaaa atggtttcgt atgggttttc gtagcctgag 1980
caaaatcatg agcgataaaa ccctgaaatt caccaaaatg cagaaagccg gtttcctgta 2040
ttatgaagat ctggtgagct gtgttacccg tgccgaagcc gaagcagttg gtgttctggt 2100
taaagaagca gtttgggcat ttctgccgga tgcatttgtt accatgaccg gtggttttcg 2160
tcgtggcaaa aaaatcggtc atgatgtgga ttttctgatt accagtccgg gtagcgcaga 2220
agatgaagaa cagctgctgc cgaaagttat taatctgtgg gaaaaaaaag gcctgctgct 2280
gtattacgat ctggttgaaa gcaccttcga gaaattcaaa ctgccgagcc gtcaggttga 2340
taccctggat cactttcaga aatgttttct tatcctgaag ctgcatcatc agcgtgttga 2400
tagcagcaaa agcaatcagc aagaaggtaa aacctggaaa gcaattcgtg ttgatctggt 2460
tatgtgcccg tatgaaaatc gtgcatttgc actgttaggt tggaccggta gtcgtcagtt 2520
tgaacgtgat attcgtcgtt atgcaaccca tgaacgtaaa atgatgctgg ataatcatgc 2580
cctgtacgat aaaacgaaac gcgtgttcct gaaagccgaa agcgaagaag aaatttttgc 2640
acatctgggc cttgattaca ttgaaccgtg ggaacgtaat gcctaatgca cgtgaggatc 2700
caactcgaga acttagatgg tattagtgac ctgtaacaga gcattagcgc aaggtgattt 2760
ttgtcttctt gcgctaattt tttgtcatca aacctgtcgc tagttaagcc agccccgaca 2820
cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag 2880
acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa 2940
acgcgcgaga cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat 3000
aatggtttct tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 3060
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 3120
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 3180
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 3240
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 3300
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 3360
agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 3420
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 3480
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 3540
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 3600
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 3660
accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 3720
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 3780
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 3840
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 3900
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 3960
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 4020
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 4080
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 4140
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 4200
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 4260
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 4320
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 4380
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 4440
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 4500
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 4560
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 4620
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 4680
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 4740
ctcgtcaggg gggcggagcc tatggaaa 4768
<210> 40
<211> 5149
<212> DNA
<213> 人工序列
<220>
<223> PP1075表达载体全序列
<400> 40
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 60
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 120
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 180
gaagatctcg atccgcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa 240
accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg 300
acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg 360
gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg 420
acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg 480
tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc 540
gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg 600
tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac 660
tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc 720
tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa 780
tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag 840
ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg 900
cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca 960
cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg 1020
agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg 1080
ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc 1140
aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc 1200
aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta 1260
accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg 1320
acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg 1380
cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc 1440
tgacgctttt tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga 1500
ggaattaacc atgcatcatc atcaccatca cggcagcgat ccgctgcagg cagttcatct 1560
gggtccgcgt aaaaaacgtc cgcgtcagct gggtacaccg gttgcaagca ccccgtatga 1620
tattcgtttt cgtgatctgg ttctgttcat cctggaaaaa aagatgggta caacccgtcg 1680
tgcatttctg atggaactgg cacgtcgtaa aggttttcgt gttgaaaatg aactgagcga 1740
tagcgttacc catattgttg cagaaaataa cagcggtagt gatgttctgg aatggctgca 1800
actgcagaac attaaagcaa gcagcgaact ggaactgctg gatattagct ggctgattga 1860
atgtatgggt gcaggtaaac cggttgaaat gatgggtcgt catcagctgg ttgttaatcg 1920
taatagcagc ccgagtccgg ttccgggtag ccagaatgtt ccggcaccgg cagtgaaaaa 1980
aatcagtcag tatgcatgtc agcgtcgtac cacactgaat aactataatc agctgtttac 2040
cgatgcactg gatattctgg cagaaaatga tgagctgcgc gaaaatgaag gtagctgtct 2100
ggcatttatg cgtgccagca gcgttctgaa aagcctgccg tttccgatta ccagcatgaa 2160
agataccgaa ggtattccgt gtctgggtga taaagtgaaa agcattattg aaggcatcat 2220
cgaagatggc gaaagcagtg aagcaaaagc agttctgaat gatgaacgct acaaaagctt 2280
caaactgttt accagcgttt ttggtgttgg tctgaaaacc gcagaaaaat ggtttcgtat 2340
gggttttcgt accctgagca aaattcagag cgataaaagt ctgcgtttta cccagatgca 2400
gaaagcaggt tttctgtatt atgaagatct ggtgagctgc gttaatcgtc cggaagccga 2460
agcagttagc atgctggtta aagaagcagt tgttaccttt ctgccggatg cgctggttac 2520
catgaccggt ggttttcgtc gcggaaaaat gacaggtcat gatgtggatt ttctgattac 2580
ctcaccggaa gcaaccgaag atgaagaaca gcaactgctg cataaagtta ccgatttttg 2640
gaaacagcag ggtctgctgc tgtattgtga tatcctggaa tcaaccttcg agaaattcaa 2700
acagccgagc cgtaaagttg atgccctgga tcattttcag aagtgttttc tgatcctgaa 2760
actggatcat ggtcgtgttc atagcgaaaa aagcggtcag caagaaggta aaggttggaa 2820
agcaattcgt gtggatctgg ttatgtgtcc gtatgatcgt cgtgcctttg cactgttagg 2880
ttggaccggt agccgtcagt ttgaacgtga tctgcgtcgt tatgcaaccc atgaacgtaa 2940
aatgatgctg gataatcatg cactgtatga tcgcaccaaa cgtgtttttc tggaagcaga 3000
aagcgaagaa gaaatctttg cacatctggg ccttgattac attgaaccgt gggaacgtaa 3060
tgcataatgc acgtgaggat ccaactcgag aacttagatg gtattagtga cctgtaacag 3120
agcattagcg caaggtgatt tttgtcttct tgcgctaatt ttttgtcatc aaacctgtcg 3180
ctagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 3240
gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 3300
gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt 3360
ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa 3420
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 3480
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 3540
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 3600
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 3660
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 3720
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 3780
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 3840
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 3900
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 3960
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 4020
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat 4080
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 4140
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 4200
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 4260
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 4320
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 4380
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 4440
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 4500
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 4560
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 4620
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 4680
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 4740
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 4800
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 4860
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 4920
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 4980
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 5040
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 5100
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 5149
<210> 41
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> PG1350寡核苷酸
<400> 41
gcgtcacgct accaacca 18
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PG5858寡核苷酸
<400> 42
gtcctcaatc gcactggaaa 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PG5859寡核苷酸
<400> 43
gtcctcaatc gcactggaag 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PG5860寡核苷酸
<400> 44
gtcctcaatc gcactggaac 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PG5861寡核苷酸
<400> 45
gtcctcaatc gcactggaat 20
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> PG5864寡核苷酸
<400> 46
gtcctcaatc gcactggaat t 21
<210> 47
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> PG5865寡核苷酸
<400> 47
gtcctcaatc gcactggaat tg 22
<210> 48
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> PG5866寡核苷酸
<400> 48
gtcctcaatc gcactggaat tga 23
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> PG5868寡核苷酸
<400> 49
gtcctcaatc gcactggaag t 21
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> PG5869寡核苷酸
<400> 50
gtcctcaatc gcactggaag c 21
<210> 51
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> PG5870寡核苷酸
<400> 51
gtcctcaatc gcactggaaa catcaaggtc 30
<210> 52
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> PG5871寡核苷酸
<400> 52
gtcctcaatc gcactggaaa catcaaggtc atacggaacg 40
<210> 53
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> PG5872寡核苷酸
<400> 53
gtcctcaatc gcactggaat g 21
<210> 54
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> PG5867寡核苷酸
<400> 54
gtcctcaatc gcactggaat tgac 24

Claims (22)

1.与SEQ ID NO:26、6、28、8、21-25、27、1-5和7中任一项具有至少85%同一性的至少一种核酸聚合酶用于不依赖模板的核酸合成的用途。
2.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:26或6。
3.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:1或21。
4.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:2或22。
5.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:3或23。
6.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:4或24。
7.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:5或25。
8.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:7或27。
9.根据权利要求1所述的用途,其中,所述至少一种核酸聚合酶是SEQ ID NO:8或28。
10.根据权利要求1-11中任一项所述的用途,其中,序列同一性为至少90%。
11.根据权利要求1-12中任一项所述的用途,其中,序列同一性为至少95%。
12.根据权利要求1-13中任一项所述的用途,其中,序列同一性为至少98%。
13.根据权利要求1-14中任一项所述的用途,其中,序列同一性为100%。
14.一种合成期望的核酸的方法,包括:
(a)在单个容器中将至少一种核酸底物、过量的自由未封闭的核苷三磷酸和至少一种不依赖模板的核酸聚合酶组合,所述不依赖模板的核酸聚合酶与SEQ ID NO:26、6、28、8、21-25、27、1-5和7中任一项具有至少85%同一性;
(b)在所述不依赖模板的核酸聚合酶具有活性并且仅将单个核苷酸添加至反应中存在的多种核酸底物分子中每一种的条件下使部分(a)中的混合物反应,以形成新核酸分子;
(c)将所述新核酸分子与自由核苷酸和所述不依赖模板的核酸聚合酶分离;和
(d)重复步骤(a)-(c)以获得期望的合成的核酸,
其中步骤(c)的新核酸分子用作步骤(a)的至少一种核酸底物,直至合成期望的核酸。
15.根据权利要求16所述的方法,其中,所述不依赖模板的核酸聚合酶的序列同一性为至少90%。
16.根据权利要求16或17所述的方法,其中,所述不依赖模板的核酸聚合酶的序列同一性为至少95%。
17.根据权利要求16-18中任一项所述的方法,其中,98%。
18.根据权利要求16-19中任一项所述的方法,其中,所述不依赖模板的核酸聚合酶的序列同一性为100%。
19.一种编码与SEQ ID NO:8具有至少85%同一性的多肽的核酸。
20.一种编码与SEQ ID NO:28具有至少85%同一性的多肽的核酸。
21.一种与SEQ ID NO:8具有至少85%同一性的多肽。
22.一种与SEQ ID NO:28具有至少85%同一性的多肽。
CN202280047599.7A 2021-06-14 2022-06-13 用于酶促核酸合成的用途和方法 Pending CN117881790A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163210429P 2021-06-14 2021-06-14
US63/210,429 2021-06-14
PCT/US2022/033313 WO2022266020A2 (en) 2021-06-14 2022-06-13 Compositions and methods for enzymatic nucleic acid synthesis

Publications (1)

Publication Number Publication Date
CN117881790A true CN117881790A (zh) 2024-04-12

Family

ID=82403619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280047599.7A Pending CN117881790A (zh) 2021-06-14 2022-06-13 用于酶促核酸合成的用途和方法

Country Status (6)

Country Link
EP (2) EP4355894A2 (zh)
KR (2) KR20240021866A (zh)
CN (1) CN117881790A (zh)
AU (1) AU2022293386A1 (zh)
IL (1) IL309044A (zh)
WO (2) WO2022266020A2 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
DE10215035A1 (de) 2002-04-05 2003-10-23 Roche Diagnostics Gmbh Rekombinante terminale Deoxynukleotidyltransferase mit verbesserter Funktionalität
WO2016064880A1 (en) 2014-10-20 2016-04-28 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide systhesis
WO2017011492A1 (en) * 2015-07-13 2017-01-19 President And Fellows Of Harvard College Methods for retrievable information storage using nucleic acids
US20200263152A1 (en) * 2017-05-22 2020-08-20 The Charles Stark Draper Laboratory, Inc. Modified template-independent dna polymerase

Also Published As

Publication number Publication date
KR20240022552A (ko) 2024-02-20
KR20240021866A (ko) 2024-02-19
WO2022266020A2 (en) 2022-12-22
WO2022266019A3 (en) 2023-02-02
EP4355894A2 (en) 2024-04-24
WO2022266019A2 (en) 2022-12-22
WO2022266020A3 (en) 2023-03-09
EP4355895A2 (en) 2024-04-24
AU2022293386A1 (en) 2023-12-21
IL309044A (en) 2024-02-01

Similar Documents

Publication Publication Date Title
AU2019204429B2 (en) Modified hematopoietic stem/progenitor and non-T effector cells, and uses thereof
KR102622910B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR20200032174A (ko) 강화된 키메라 항원 수용체 및 이의 용도
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
CN107406838A (zh) Rna引导的内切核酸酶向细胞中的肽介导的递送
CN107580503B (zh) 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合
AU2018235957B2 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
CN112912112A (zh) 肝特异性核酸调节元件以及其方法及用途
CN116083398B (zh) 分离的Cas13蛋白及其应用
US20040028695A1 (en) Recombinant immunogenic compositions and methods for protecting against lethal infections from Bacillus anthracis
KR102194740B1 (ko) 7-adca 제조를 위한 데아세트옥시세팔로스포린 c의 고농도 생산 재조합 아크레모니움 크리소제눔 균주의 제조방법 및 이 방법으로 제조된 균주
KR20220041214A (ko) Il-1 수퍼패밀리의 사이토카인의 시공적 제한 활성으로 무장된 면역반응성 세포
CN114292867B (zh) 芽孢杆菌表达载体及其构建方法和应用
CN107988259B (zh) SmartBac杆状病毒表达系统及其应用
CN114990157B (zh) 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用
CN117881790A (zh) 用于酶促核酸合成的用途和方法
CN118103519A (zh) 用于酶促核酸合成的方法
KR20220142502A (ko) 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도
CN111500629B (zh) 一种高表达层粘连蛋白-511变体的方法及其应用
CN110964681B (zh) 一种利用纤维素制备金合欢烯的工程菌株及方法
CN110964679B (zh) 一种利用纤维素制备金合欢烯的工程菌株及方法
CN110964680B (zh) 利用纤维素制备金合欢烯的工程菌株及方法
US20040224340A1 (en) Displacing a plasmid in a bacterial population
RU2781083C2 (ru) Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1
PL228024B1 (pl) Zestaw wektorów ekspresyjnych

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination