CN1789412A

CN1789412A - 利用片段互补技术重建5－烯醇丙酮酰莽草酸－3－磷酸合成酶活性

Info

Publication number: CN1789412A
Application number: CN200410102289.4A
Authority: CN
Inventors: 王忆平; 孙义成; 李燕
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2004-12-16
Filing date: 2004-12-16
Publication date: 2006-06-21
Anticipated expiration: 2024-12-16
Also published as: ATE486127T1; WO2006063533A1; EP1840210A4; US8936925B2; EP1840210B1; US20090155879A1; EP1840210A1; CN1789412B; DE602005024442D1

Abstract

本发明涉及5－烯醇式丙酮酰莽草酸－3－磷酸合酶(EPSPS)的蛋白片段，其选自EPSPS的蛋白片段对，组成所述片段对的两种片段可以连成全长EPSPS，并且这两种片段不借助任何连接结构可以通过互补而重建EPSPS活性。本发明还涉及编码所述蛋白片段的核酸分子，包含该核酸分子的表达载体和细胞。本发明还涉及利用本发明的片段或核酸分子或表达载体重建EPSPS活性的方法，以及拆分出本发明蛋白片段的方法。

Description

利用片段互补技术重建 5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性

技术领域

本发明涉及利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合酶(5-enolpyruvyl-shikimate-3-phosphate synthase，EPSPS)活性的方法。更具体地，本发明涉及大肠杆菌EPSPS及其突变后获得的草甘膦抗性EPSPS的重建，本发明还涉及恶臭假单胞菌草甘膦抗性EPSPS的重建。

背景技术

随着转基因植物的大规模种植，转基因植物的生物安全控制(biologicalconfinement)越来越受到关注。Wruad等.Proc Natl Acad Sci USA2004，101，(40)，14533-8观测到抗草甘膦的CP4EPSPS的编码基因可以从转基因植物中传播到20公里以外的作物中，甚至传播到杂草中，因此对转基因植物实行生物安全控制对于防止超级杂草等的产生十分必要。

转基因植物外源基因扩散的方式主要有以下几种：转基因植物花粉的传播，转基因植物作为野生亲缘种花粉的受体形成杂种，转基因植物的DNA可能造成的基因扩散。目前有了一些控制转基因植物外源基因扩散的方法，例如，(1)物理隔离，主要是距离隔离以便阻断外源基因通过花粉的扩散；(2)遗传控制，包括：(a)雄性不育(male sterility)；(b)基因组不相容性(Genomeincompatibility)，即将特定的外源基因整合到作物的与杂草不相容的基因组上；(c)母系遗传(maternal inheritance)，其将外源基因转入植物的叶绿体中，使这些基因进行母系遗传，因此不会通过花粉的传播而扩散入其它物种，该方法在烟草上已经取得了初步的成功(Daniell等，Nat Biotechnol 1998，16，(4)，345-8)；(d)种子不育(seed sterility)；(e)Transgenic mitigation(TM)，利用与目的基因紧密连锁、对于转基因植物有利或中性、而对于野草生存不利(如防止种子散落和降低种子二次休眠等)的TM基因防止超级杂草(superweed)的产生。

Ye，G.N.等.Plant J2001，25，(3)，261-70和Chin，H.G.等Proc Natl AcadSci USA2003，100，(8)，4510-5提出了一种新的控制抗草甘膦转基因的方法，其将EPSPS基因分成两段，使之分别与表达DnaE内含肽(intein)的基因串联并共表达，利用内含肽的自我拼接功能形成完整的EPSPS，从而使大肠杆菌或烟草获得对草甘膦的耐受性。但是内含肽编码基因本身作为外源基因被引入转基因植物也可能会引发其它的风险，例如成为被扩散的转基因等。

蛋白酶消化产生或者通过基因表达生成的蛋白质片段可以在体内或体外重建成具有完整蛋白功能的复合体，这被称之为蛋白质片段互补(proteinfragment complementation)或蛋白重建(protein reconstitution)技术(例如，Hakansson，M.等.Curr Protein Pept Sci2002，3，(6)，629-42；Braun，M.等.JBacteriol2003，185，(18)，5508-18.)。对氨酰tRNA合成酶等蛋白进行的片段互补研究表明，发生片段互补的蛋白片段分拆位点大多发生在非保守区域。蛋白能够重建意味着该蛋白内的非共价作用十分特异，从而使蛋白片段有利于形成的天然的结构(Shiba，K.等.Proc Natl Acad Sci USA1992，89，(5)，1880-4；Shiba，K.等.J Biol Chem1992，267，(32)，22703-6)。此外，蛋白能够发生片段互补表明，即使共价键断开，该蛋白仍能保持比较稳定的结构。两个发生片段互补的肽链之间存在的各种非共价作用(如氢键、盐桥及疏水作用)在保持蛋白结构稳定方面起着很大的作用(Nelson，K.E.等，Completegenome sequence and comparative analysis of the metabolically versatilePseudomonas putida KT2440.Environ Microbiol2002，4，(12)，799-808)。

我们利用这种蛋白重建技术在体内和体外重建了有活性的EPSPS，对草甘膦具有耐受性的EPSPS也可以通过这种方法重建。EPSPS的片段互补可用于转基因植物从而增加转基因植物安全性，降低超级杂草形成的可能性。

发明概述

本发明涉及5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段，其是选自EPSPS片段对的一种片段，组成所述片段对的两种片段可以连接成全长EPSPS，并且这两种片段不借助任何连接结构可以通过互补而重建EPSPS活性。优选，所述片段对的分割点位于EPSPS的选自下列的结构中：折叠单元之间的连接区中、α螺旋与β折叠之间的连接区中、两个β折叠之间、β折叠中、或α螺旋中，优选位于折叠单元之间的连接区中，例如，在折叠单元1和6，2和6，3和4，4和5，以及3和5之间的连接区中；更优选该分割点是在折叠单元1，2，3，4，或5的内部，例如，在折叠单元3的两个β折叠之间的连接区中，在折叠单元4的α螺旋中，在折叠单元2的β折叠中，在折叠单元1的α螺旋与β折叠之间，在折叠单元5的α螺旋和β折叠之间的连接区中，或者在折叠单元5的两个β折叠之间的连接区中，或者在折叠单元5的β折叠中。

在本发明的实施方案中，所述EPSPS是野生型EPSPS或其添加、缺失、和/或取代一或多个氨基酸残基所得的EPSPS活性变体，优选是大肠杆菌野生型EPSPS(其全长氨基酸序列和核苷酸序列是本领域已知的，可以参见序列表)或其草甘膦抗性EPSPS活性变体，或者优选是恶臭假单胞菌(Pseudomonas putida)草甘膦抗性EPSPS，例如恶臭假单胞菌CGMCC0739(参见中国专利申请02117991.3)的EPSPS(其全长氨基酸序列和核苷酸序列见SEQ ID NO：2)。

更具体地，本发明的蛋白片段优选是选自大肠杆菌EPSPS的以下片段对的一种片段：N67/C68，N85/C86，N104/C105，N154/C155，N182/C183，N184/C185，N218/C219，N224/C225，N227/C228，N259/C260，N298/C299，N371/C372，N376/C377，N383/C384(这里所述的N67/C68片段对，表示由N端片段N67和C端片段C68所组成的片段对，其中N67是指EPSPS序列中从N末端到第67位残基之间的N端片段，C68是指EPSPS序列中从第68位残基到C末端之间的C端片段。其它片段对表示法依此类推)，或优选是选自恶臭假单胞菌CGMCC0739的EPSPS的以下片段对的一种片段：N208/C209，N214/C215，N219/C220，N222/C223，N224/C225(这里所述的N208/C209片段对表示由N端片段N208和C端片段C209所组成的片段对，其中N208是指EPSPS序列中从N末端到第208位残基之间的片段，C209是指EPSPS序列中从第209位残基到C末端之间的片段，其它片段对表示法依此类推)。

本发明还涉及编码本发明所述蛋白片段的核酸分子，携带该核酸分子的表达载体，包含所述核酸分子或表达载体的细胞。优选所述细胞是植物细胞。本发明还涉及包含本发明所述核酸分子或表达载体的转基因植物或其种子。

本发明还涉及一种重建EPSPS的方法，该方法包括在无任何连接结构存在的条件下，利用本发明的蛋白片段或核酸分子或表达载体来重建EPSPS活性。

本发明还涉及一种拆分EPSPS或EPSPS核酸分子的方法，包括在无任何连接结构存在的条件下，拆分出本发明的蛋白片段，或核酸分子。该方法中所选择的拆分点优选位于EPSPS的下列结构中：折叠单元之间的连接区中、α螺旋与β折叠之间的连接区中、两个β折叠之间、β折叠中、或α螺旋中，优选位于折叠单元之间的连接区中，例如，在折叠单元1和6，2和6，3和4，4和5，以及3和5之间的连接区中。更优选在折叠单元1，2，3，4，或5的内部，例如，折叠单元3的两个β折叠之间的连接区中，折叠单元4的α螺旋中，折叠单元2的β折叠中，折叠单元1的α螺旋与β折叠之间，折叠单元5的α螺旋和β折叠之间的连接区中，或者折叠单元5的两个β折叠之间的连接区中，或者在折叠单元5的β折叠中。还更优选位于选自下列的位置之间：大肠杆菌EPSPS的67-68、85-86、104-105、154-155、182-183、184-185、218-219、N224-C225、N227-C228、259-260、298-299、371-372、376-377、或383-384位置之间，或恶臭假单胞菌CGMCC 0739的草甘膦抗性EPSPS的208-209、214-215、219-220、222-223、或224-225位置之间。

本发明还涉及本发明所述的EPSPS片段或重建EPSPS活性的方法或拆分EPSPS的方法在控制转基因植物安全性方面的应用。

发明内容

本发明人基于EPSPS的结构，在有可能不影响EPSPS酶活性的结构区域中设计了分拆位点。本发明人还构建了表达EPSPS拆分片段的表达载体，并证明EPSPS片段在大肠杆菌体内可以互补EPSPS活性。因此，本发明的EPSPS片段以及重建EPSPS的方法可以应用于生物安全控制领域。

EPSPS及其结构

5-烯醇丙酮酰莽草酸-3-磷酸合成酶(EPSPS)是芳香族氨基酸合成-莽草酸合成途径中的关键酶，存在于藻类、高等植物、细菌、真菌及寄生虫的apicomplexan中，它催化一分子的莽草酸-3-磷酸(S3P)和磷酸烯醇式丙酮酸(PEP)生成5-烯醇式丙酮酸莽草酸-3-磷酸(EPSP)。

如图2所示，EPSPS由两个结构域组成，其中一个结构域包括标示为1，2和6的三个对称的蛋白折叠单元，另一个结构域包括标示为3，4和5的三个对称的蛋白折叠单元。每个单元由两个平行的α螺旋和四个β折叠组成。参见Stallings，W.C.等.Proc Natl Acad Sci USA1991，88，(11)，5046-50。

已知EPSP合酶在无酶底物时，形成“开放”(open)构象，而与S3P、草甘膦+S3P形成复合物晶体结构时，“开放”构象转换成“闭合”(close)构象(Schonbrunn，E.等.Proc Nat Acad Sci USA2001，98，(4)，1376-80)。Mcdowell等(J Biomol NMR2004，28，(1)，11-29，2004)利用rotational-echodouble-resonace NMR技术，结合EPSP合酶与S3P和草甘膦复合体的晶体结构，对其进行调整，得到符合液体NMR结果的三维结构。

通过化学修饰、基因突变、结构分析等各种方法，EPSP合酶中底物的结合位点和催化位点的研究现在已经比较深入(Schonbrunn，E.等，出处同上；Mcdowell等，出处同上；Anderson，K.S.等.J Biol Chem 1990，265，(10)，5567-72；Huynh，Q.K.等J Biol Chem 1988，263，(24)，11636-9；Huynh，Q.K.等JBiol Chem 1988，263，(2)，735-9；Padgette，S.R.等JBiol Chem 1988，263，(4)，1798-802；Padgette，S.R.等Arch Biochem Biophys1988，266，(1)，254-62；Eschenburg，S.等J Biol Chem2003，278，(49)，49215-22；Mizyed，S.等Biochemistry 2003，42，(23)，6986-95；Shuttleworth，W.A.等Biochemistry 1994，33，(23)，7062-8；Shuttleworth，W.A.等Arch Biochem Biophys1996，334，(1)，37-42；Shuttleworth，W.A.等Biochemistry1999，38，(1)，296-302；Stauffer，M.E.等Biochemistry 2001，40，(13)，3951-7；Stauffer，M.E.等FEBS Lett 2001，499，(1-2)，182-6；McDowell，L.M.等Biochemistry 2004，43，(21)，6606-11)。

此外，Schonbrunn等提出Lys-22，Arg-124，Asp-313，Arg-344，Arg-386和Lys-411参与PEP结合，Arg-27等参与S3P结合，Arg-100，Asp-242和Asp-384在酶结合底物由开放构象转换成闭合构象时起着重要作用(Proteins2000，40，(2)，290-8；Biochemistry2000，39，(9)，2164-73；Proc Natl Acad Sci USA2000，97，(12)，6345-9)。

拆分位点的选择

本发明人基于EPSPS的结构，在有可能不影响EPSPS酶活性的结构区域中设计了分拆位点。

当分拆位点位于蛋白折叠单元之间时，共价键的断裂和甲硫氨酸的插入一般不会影响蛋白质天然结构的形成。分拆的蛋白片段依靠蛋白内的非共价作用及两个肽链之间存在各种非共价作用如氢键、盐桥及疏水作用等形成天然的蛋白结构，从而可以重建蛋白功能。分拆位点位于折叠单元之间，互补片段二级结构的形成一般不会被影响，因此更容易发生片段互补。在实施方案中，大肠杆菌EPSPS有7个分拆位点位于折叠单元之间的连接区域中，分拆产生的蛋白片段有6对可以互补形成EPSPS活性，而且它们的互补活性都比较好。恶臭假单胞菌有3个分拆位点在折叠单元之间的连接区域中，所形成的3对片段都可以互补EPSPS活性。

当分拆位点位于α螺旋与/或β折叠之间的连接区域时，共价键的断裂一般不会影响到α螺旋或β折叠的形成，而甲硫氨酸的插入对天然结构的形成的影响一般也没有那么明显，因而此时片段互补容易发生。在实施方案中，大肠杆菌EPSPS有6个分拆位点位于α螺旋与β折叠之间的连接区域中，其中有5对片段可以互补EPSPS活性；另有1个分拆位点位于β折叠之间的连接区域中，相应片段也可以互补EPSPS活性。恶臭假单胞菌有1个分拆位点在β折叠中，所形成的片段可以互补EPSPS活性。

当分拆位点位于α螺旋或β折叠中时，只要α螺旋或β折叠可以忍受共价键的断裂和甲硫氨酸的插入，或者此处的α螺旋或β折叠对蛋白的整体功能并不是十分重要，则EPSPS的片段也可以通过片段互补来重建蛋白活性。在实施方案中，大肠杆菌EPSPS有7个分拆位点位于α螺旋或β折叠中，其中有3对片段可以互补EPSPS活性。恶臭假单胞菌有1个分拆位点在β折叠中，所形成的片段可以互补EPSPS活性。

当EPSPS在两个结构域中间分拆时，大肠杆菌EPSPS的N端肽链N240和C端肽链C241可以形成复合体而被共纯化出来。但是该复合体酶活性很低，这可能是N240/C241复合体中只有一对疏水作用区域相互作用，因此蛋白结构不稳定。恶臭假单胞菌有在两个结构域之间测试了3个分拆位点，所形成的片段都基本不能互补EPSPS活性。因此，本发明人在EPSPS的结构域之间连接区中进行分拆，所得片段没有能够重建出EPSPS活性。

总之，本发明人在大肠杆菌EPSPS中成功实施了14个拆分点，其中6个在折叠单元之间的连接区中，3个在α螺旋与β折叠之间的连接区中，2个在β折叠之间的连接区中，2个在β折叠中，1个在α螺旋中。通过在这些拆分点进行拆分，大肠杆菌EPSPS的基因被分拆为N片段和C片段。将相互对应的N片段和C片段分别在两种相容的质粒上表达。如此得到的N片段和C片段单独都不表现EPSPS活性，但在体内，相应的N片段和C片段结合可以互补EPSPS活性。

类似地，在另外的实施方案中，本发明人在恶臭假单胞菌草甘膦抗性EPSPS中成功实施了5个拆分点，其中3个在折叠单元之间的连接区中，1个在α螺旋与β折叠之间的连接区中，1个在β折叠中。如此拆分所得到的片段同样可以互补EPSPS活性。

EPSPS的活性能够通过片段互补而重建，这意味着该蛋白内的非共价作用十分特异，从而使片段有利于形成天然的具有EPSPS功能的结构，而不会形成其它的结构。此外该蛋白能够发生片段互补，这表明，断开一些区域中的共价键时，该蛋白仍旧可以保持结构稳定性，两个肽链之间不必通过共价键，而仅通过各种非共价作用如氢键、盐桥及疏水作用等紧密结合在一起。在EPSPS的片段互补中，疏水作用可能起着更大的作用。EPSPS的两个片段之间存在很强的两对疏水作用区域，形成两个“钩子”将蛋白稳定在一起。

本发明共纯化得到了多个由相对应的拆分片段组成的复合体，但是纯化出的蛋白量却有很大的差异，这说明片段互补在体内都可以形成，但是复合体形成的难易程度是不同的。有些区域共价键的断裂对蛋白结构的稳定性影响比较大，有些区域共价键的断裂对蛋白结构的稳定性影响比较小。C端肽链引入一个甲硫氨酸(起始密码子所编码的氨基酸)也有可能影响蛋白结构的稳定性，从而导致蛋白片段互补不能发生。

大肠杆菌EPSPS的复合体N240/C241也可以被大量的共纯化出，但是它却不能互补大肠杆菌aroA基因突变菌株AB2829在限制性培养基上的生长，这是由于复合体N240/C241的EPSPS的活性远低于野生型全长EPSPS。其活性的丢失可能有以下两个原因：一是N240/C241的分拆位点与Asp242十分接近，Asp242在结合底物引发结构变构过程中起着非常重要的作用，在C241中引入一个甲硫氨酸可能会影响到Asp242的功能从而使其酶活性丧失；第二个原因可能是N240/C241的分拆位点位于两个结构域的中间，其形成的复合体中只有一对疏水作用区域，虽然它们之间的疏水作用足以使两个蛋白片段形成复合体，但由于缺少另外一对疏水区域，这个复合体的结构可能与野生蛋白的结构有所不同，从而使酶活性丧失。因此，对分拆位点的选择应基于结构变化对酶活性的影响来考虑。

EPSP合酶的在植物细胞中的定位

Bickel等(Phytochemistry17：119-124，1978)发现，植物的芳香族氨基酸在叶绿体内进行合成。Mousdale等随后证明，植物的EPSP合酶定位于叶绿体内膜上(Planta，1987，170：1～6；Plant Physiol.，1987，83：229～231；J Biol Chem1988 Oct 15；263(29)：15104-9；Mol Gen Genet 1994 Dec1；245(5)：616-22；MolGen Genet 1993 Jun；239(3)：416-24)。Della-Cioppa等(Bio/Technology 1987(5)：579～584)的实验表明矮牵牛前体EPSP合酶(precursor EPSPS)分子量为55kDa，前72氨基酸残基为前导肽，当前体EPSP合酶进入叶绿体后经加工剪切运输肽而成为成熟EPSP合酶(mature enzyme)，成熟EPSP合酶分子量为48kDa。前导肽对前体EPSP合酶进入叶绿体起着重要作用，微生物EPSP合酶因无前导肽，故用微生物EPSP合酶基因在转入植物细胞中时其基因前端需加上植物前导肽序列，否则其表达的EPSP合酶不能进入叶绿体。

应用

本发明的EPSPS片段互补技术可应用于转基因植物，以防止抗草甘膦基因的扩散带来的生态风险。例如，将EPSPS的N端片段在植物核染色体中表达，而将其C端片段在植物的叶绿体中表达。单独表达的一种EPSPS片段都不具有EPSPS的活性，因此其基因扩散没有选择优势。当两种片段的基因共同表达时，两个EPSPS片段可以在叶绿体中发生互补而重建EPSPS活性，从而使植物对草甘膦产生抗性。也可以将编码两个EPSPS片段的基因插入叶绿体基因组的不同位置，在这种情况中，两种基因共同转移到染色体上的概率大大降低，从而降低转基因扩散发生的概率。关于控制植物中细胞过程的方法可参见WO2004/046359和WO2004/046360。

附图说明

图1显示pKU2004的质粒图谱。

图2EPSPS的结构示意图及分拆位点的选择。图2A为EPSP合酶的拓扑结构，图2B为EPSP合酶的一个结构单元。

图3：质粒构建示意图。A.将EPSPS的C-末端片段亚克隆到pKU2100载体的Tet启动子之后。B.将EPSPS的N-末端亚克隆到pACYC184载体的Tet启动子之后。C.将EPSPS编码基因的N-末端部分亚克隆到衍生于pACYC184的质粒载体的T7启动子之后。D.将EPSPS的C-末端部分构建到pET28a载体中，并且在C-末端尾部带有6个His组成的标签。

图4：EPSPS片段的蛋白免疫印迹分析。将表达所示EPSPS的细胞溶于SDS样品缓冲液中，经SDS-PAGE和免疫印迹来分析等量蛋白(来自～0.8μg湿重的细胞)和纯化的蛋白。图中示出了以下纯化蛋白的量：N218/C219(来自～150ml湿重的细胞)，N227/C228(来自～20μg湿重的细胞)，N234/C235(来自～500μg湿重的细胞)，N240/C241(来自～40μg湿重的细胞)，N245/C246(来自～500μg湿重的细胞)和pACYC184/pBR322(来自～500μg湿重的细胞)。标准分子量的位置示于图左，单位为千道尔顿(kd)。

图5.EPSPS的圆二色性光谱分析。系列1为野生EPSPS，系列2为N227/C228复合体。

图6：表达有不同EPSPS的大肠杆菌aroA基因缺陷菌株AB2829，在限制性培养基(即添加了所示浓度的草甘膦的液体M63基本培养基)中的生长情况。

图7a大肠杆菌EPSPS的SDS-PAGE电泳图。1：N218；2：C219；3：EcEPSPS；4：共复性N218+c219；5：N218+c219(单独复性后一起)；6：分子量标准。

图7b大肠杆菌EPSPS的native-PAGE电泳Western印迹图。1：N218+C219(单独复性后一起)；2：空白对照；3：共复性N218/C219；4：空白对照；5：野生型EPSPS。

具体实施方式

实施例1大肠杆菌EPSPS的重建

1材料与方法

1.1菌株与质粒

用于本实验的菌株和质粒列在表1中。

表1.用于本研究中的细菌菌株和质粒

菌株/质粒	相关特点	来源/参考文献
菌株/质粒	相关特点	来源/参考文献	大肠杆菌菌株
DH5α	supE44ΔlacU169hsdR17recA1gyrA96thi-1re1A1	Hanahan D.，J Mol Biol1983；166：557-80	大肠杆菌菌株
DH5α	supE44ΔlacU169hsdR17recA1gyrA96thi-1re1A1	Hanahan D.，J Mol Biol1983；166：557-80	AB2829	aroA354	耶鲁大学
Bl21(DE3)		stragene	AB2829	aroA354	耶鲁大学
Bl21(DE3)		stragene	BA^-	BL21(DE3).aroA，Ap^R	本工作
质粒			BA^-	BL21(DE3).aroA，Ap^R	本工作
质粒			pUC18	ColE1，lacZ’，Ap^R	Norrander等，1983
pBluscript-SK	ColE1，lacZ’，Ap^R	Stratagene	pUC18	ColE1，lacZ’，Ap^R	Norrander等，1983

pET-28a	ColE1，表达质粒，Km^R	Novagen
pET-28a	ColE1，表达质粒，Km^R	Novagen	pACYC184	Cm^R	Chang，A.C.等1978.JBacteriol 134：1141-56
pBR322	ColE1，Ap^R	schaeffer，F.等，1982EMBO J.1.99-105	pACYC184	Cm^R	Chang，A.C.等1978.JBacteriol 134：1141-56
pBR322	ColE1，Ap^R	schaeffer，F.等，1982EMBO J.1.99-105	pKO3	Cm^R	Link，A.J.等1997.J.Bacteriology179：6228-6237
pKU2005	pUC18衍生质粒，带有aroA_E.coli，Ap^R	本工作	pKO3	Cm^R	Link，A.J.等1997.J.Bacteriology179：6228-6237
pKU2005	pUC18衍生质粒，带有aroA_E.coli，Ap^R	本工作	pKU2006	pACYC184衍生质粒，带有aroA_E.coli，Cm^R	本工作
pKU2007	pACYC184衍生质粒，带有aroA_E.coli-G96A，Cm^R	本工作	pKU2006	pACYC184衍生质粒，带有aroA_E.coli，Cm^R	本工作
pKU2007	pACYC184衍生质粒，带有aroA_E.coli-G96A，Cm^R	本工作	pKU2008	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作
pKU2009	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作	pKU2008	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作
pKU2009	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作	pKU2010	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作
pKU2011	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作	pKU2010	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作
pKU2011	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作	pKU2100	PBR322衍生质粒，带有aroA_E.coli，Ap^R	本工作
pKU2101	pACYC184衍生质粒，带有N218-aroA_E.coli，Cm^R	本工作	pKU2100	PBR322衍生质粒，带有aroA_E.coli，Ap^R	本工作
pKU2101	pACYC184衍生质粒，带有N218-aroA_E.coli，Cm^R	本工作	pKU2102	pBR322衍生质粒，带有C219-aroA_E.coli，Ap^R	本工作
pKU2107	pBR322衍生质粒，带有aroA_E.coli-G96A，Ap^R	本工作	pKU2102	pBR322衍生质粒，带有C219-aroA_E.coli，Ap^R	本工作
pKU2107	pBR322衍生质粒，带有aroA_E.coli-G96A，Ap^R	本工作	pKU2110	pACYC184衍生质粒，带有N245-aroA_E.coli，Cm^R	本工作
pKU2125	pBR322衍生质粒，带有C228-aroA_E.coli，Ap^R	本工作	pKU2110	pACYC184衍生质粒，带有N245-aroA_E.coli，Cm^R	本工作
pKU2125	pBR322衍生质粒，带有C228-aroA_E.coli，Ap^R	本工作	pKU2126	pBR322衍生质粒，带有C235-aroA_E.coli，Ap^R	本工作
pKU2127	pET-28a衍生质粒，带有N218-E.coli aroA，Km^R	本工作	pKU2126	pBR322衍生质粒，带有C235-aroA_E.coli，Ap^R	本工作
pKU2127	pET-28a衍生质粒，带有N218-E.coli aroA，Km^R	本工作	pKU2130	pBR322衍生质粒，带有C246-aroA_E.coli，Ap^R	本工作
pKU2137	pACYC184衍生质粒，带有N234-aroA_E.coli，Cm^R	本工作	pKU2130	pBR322衍生质粒，带有C246-aroA_E.coli，Ap^R	本工作
pKU2137	pACYC184衍生质粒，带有N234-aroA_E.coli，Cm^R	本工作	pKU2138	pACYC184衍生质粒，带有N227-aroA_E.coli，Cm^R	本工作
pKU2154	pBluscript-SK衍生质粒，带有aroA_E.coli，Ap^R	本工作	pKU2138	pACYC184衍生质粒，带有N227-aroA_E.coli，Cm^R	本工作
pKU2154	pBluscript-SK衍生质粒，带有aroA_E.coli，Ap^R	本工作	pKU2159	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作
pKU2195	pBluscript-SK衍生质粒，带有C219-aroA_E.coli，Ap^R	本工作	pKU2159	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作
pKU2195	pBluscript-SK衍生质粒，带有C219-aroA_E.coli，Ap^R	本工作	pKU2203	pET-28a衍生质粒，带有N218-E.coli aroA，Km^R	本工作
pKU2205	pET-28a衍生质粒，带有C218-E.coli aroA，Km^R	本工作	pKU2203	pET-28a衍生质粒，带有N218-E.coli aroA，Km^R	本工作
pKU2205	pET-28a衍生质粒，带有C218-E.coli aroA，Km^R	本工作	pKU2223	pBluscript-sK衍生质粒，带有aroA_E.coli上游部分序列	本工作
pKU2224	pBluscript-SK衍生质粒，带有bla基因	本工作	pKU2223	pBluscript-sK衍生质粒，带有aroA_E.coli上游部分序列	本工作
pKU2224	pBluscript-SK衍生质粒，带有bla基因	本工作	pKU2225	pBluscript-sK衍生质粒，带有aroA_E.coli下游序列	本工作
pKU2227	pBluscript-SK衍生质粒，带有aroA_E.coli上下游序列	本工作	pKU2225	pBluscript-sK衍生质粒，带有aroA_E.coli下游序列	本工作
pKU2227	pBluscript-SK衍生质粒，带有aroA_E.coli上下游序列	本工作	pKU2228	pBluscript-SK衍生质粒，带有aroA_E.coh上下游序列及bla基因	本工作
pKU2229	pKO3衍生质粒，带有aroA_E.coli上下游序列及bla基因	本工作	pKU2228	pBluscript-SK衍生质粒，带有aroA_E.coh上下游序列及bla基因	本工作
pKU2229	pKO3衍生质粒，带有aroA_E.coli上下游序列及bla基因	本工作	pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作
pKU2250	pET-28a衍生质粒，带有C246-E.coli aroA，Km^R	本工作	pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作
pKU2250	pET-28a衍生质粒，带有C246-E.coli aroA，Km^R	本工作	pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作
pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作	pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作
pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作	pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作
pKU2262	pACYC184衍生质粒，带有N240-aroA_E.coli，Cm^R	本工作	pKU2249	pET-28a衍生质粒，带有N245-E.coli aroA，Km^R	本工作

pKU2263	pBR322衍生质粒，带有C241-aroA_E.coli，Ap^R	本工作
pKU2263	pBR322衍生质粒，带有C241-aroA_E.coli，Ap^R	本工作	pKU2266	pET-28a衍生质粒，带有N240-E.coli aroA，Km^R	本工作
pKU2267	pACYC184衍生质粒，带有T7启动子及N218-aroA_E.coli，Cm^R	本工作	pKU2266	pET-28a衍生质粒，带有N240-E.coli aroA，Km^R	本工作
pKU2267	pACYC184衍生质粒，带有T7启动子及N218-aroA_E.coli，Cm^R	本工作	pKU2268	pACYC184衍生质粒，带有T7启动子及N240-aroA_E.coli，Cm^R	本工作
pKU2269	pET-28a衍生质粒，带有N227-E.coli aroA，Km^R	本工作	pKU2268	pACYC184衍生质粒，带有T7启动子及N240-aroA_E.coli，Cm^R	本工作
pKU2269	pET-28a衍生质粒，带有N227-E.coli aroA，Km^R	本工作	pKU2274	pACYC184衍生质粒，带有T7启动子及N227-aroA_E.coli，Cm^R	本工作
pKU2275	pACYC184衍生质粒，带有T7启动子及N234-aroA_E.coli，Cm^R	本工作	pKU2274	pACYC184衍生质粒，带有T7启动子及N227-aroA_E.coli，Cm^R	本工作
pKU2275	pACYC184衍生质粒，带有T7启动子及N234-aroA_E.coli，Cm^R	本工作	pKU2276	pET-28a衍生质粒，带有C228-E.colj aroA，Km^R	本工作
pKU2277	pET-28a衍生质粒，带有C235-E.coli aroA，Km^R	本工作	pKU2276	pET-28a衍生质粒，带有C228-E.colj aroA，Km^R	本工作
pKU2277	pET-28a衍生质粒，带有C235-E.coli aroA，Km^R	本工作	pKU2278	pET-28a衍生质粒，带有C241-E.coli aroA，Km^R	本工作
pKU2282	pET-28a衍生质粒，带有C246-E.coli aroA，Km^R	本工作	pKU2278	pET-28a衍生质粒，带有C241-E.coli aroA，Km^R	本工作
pKU2282	pET-28a衍生质粒，带有C246-E.coli aroA，Km^R	本工作	pKU2283	pET-28a衍生质粒，带有C219-E.coli aroA，Km^R	本工作
pKU2287	pACYC184衍生质粒，带有T7启动子及N240-aroA_E.coli，Cm^R	本工作	pKU2283	pET-28a衍生质粒，带有C219-E.coli aroA，Km^R	本工作
pKU2287	pACYC184衍生质粒，带有T7启动子及N240-aroA_E.coli，Cm^R	本工作	pKU2289	pACYC184衍生质粒，带有T7启动子及N245-aroA_E.coli，Cm^R	本工作

Ap，氨卞青霉素；Cm，氯霉素；Km，卡那霉素；^R，抗性；，删除；∷，融合；

1.2培养基

LB培养基：每升所含成分：

胰蛋白胨 10g

酵母提取物 5g

NaCl 10g

补足水并用2M的NaOH调至pH7.0～7.5左右，固体培养基加1.5％的琼脂粉。使用前15磅压力，121℃高温灭菌20min后备用。

筛选氨苄青霉素抗性菌株在培养基中加Ap至50μg/ml。

筛选卡那霉素抗性菌株在培养基中加Km至25μg/ml。

筛选氯霉素抗性菌株在培养基中加Cm至25μg/ml。

限制性M63培养基：13.6g/L KH₂PO₄，0.5mg/L FeSO₄-7H₂O，20mM(NH₄)₂SO₄，0.4％葡萄糖，1mM硫酸镁，0.5mg/L维生素B1。

1.3试剂

限制性内切酶，T₄DNA连接酶，TaqDNA聚合酶，DNA marker等购于Takara生物公司。考马斯亮蓝G250，烯醇式丙酮酸(sigma)，莽草酸-3-磷酸(Amrehin教授赠送)；HisTrap HP kit(Amersham Biosciences)，羊抗兔IgG(promega)；其余化学药品均为分析纯试剂。

1.4遗传学操作

质粒DNA的制备、限制性内切酶的消化、连接反应、Tris-硼酸-EDTA缓冲液水平琼脂糖电泳、聚丙烯酰胺凝胶电泳及western杂交等按照标准方法(Molecular Cloning：A Laboratory Manual，2nd edition.(Sambrook，Fritschand Maniatis，eds.)，Cold Spring Harbor Laboratory Press，1989)进行。

1.5质粒构建

a.pKU2008、pKU2009的构建

用引物11：5’-CGGGATCCAGGTCCGAAAAAAAACGCCGAC3’和引物12：5’-CGGGATCCATGGAATCCCTGACGTTACA3’以pKU2004为模板，对大肠杆菌的aroA基因进行扩增，连入pET28a载体得到pKU2008，该质粒编码的EPSPS为N端带有His标签的融合蛋白。将pKU2008用NcoI酶切，自我连接得到pKU2009，该质粒编码的蛋白为大肠杆菌野生型EPSPS。

b.pKU2100系列质粒(编码EPSPS的C端肽链)的构建

用引物13：5’-TGAGTGACTGACTTTAAGAAGGAGATATAC3’和引物14：5-CGGGATCCTCACTGATTTTCAATTTCAACAC3’以pKU2009为模板进行PCR扩增，扩增产物经BamHI酶切连入pBR322的EcoR V和BamHI位点，得到质粒pKU2100。以pKU2009为模板，分别以对应引物进行扩增得到编码大肠杆菌EPSPS的C端的基因，将扩增产物连接入pKU2100的NcoI和BamHI位点，分别得到质粒pKU2102、pKU2125、pKU2126、pKU2130和pKU2262，这些质粒分别编码大肠杆菌EPSPS的C端肽链(表1，图3)。

c.pACYC184系列质粒(编码EPSPS的N端肽链)的构建

以pKU2009为模板，分别以对应引物进行PCR扩增，得到编码大肠杆菌EPSPS的N端的基因，将扩增产物连接入pACYC184的EcoR V和BamHI位点，分别得到质粒pKU2101、pKU2125、pKU2126、pKU2130和pKU2263，这些质粒分别编码大肠杆菌EPSPS的N端氨基酸序列(表1，图3)。

d.pET28a系列表达质粒的构建

将上述b步骤中构建的pBR322系列质粒和c步骤中构建的pACYC184系列质粒分别用NcoI和BamHI酶切，回收合适片段连接入pET28a载体中，得到用于表达EPSPS的N端和C端的pET28a系列表达质粒(表1)。

e.pACYC-T7系列表达质粒的构建

将用于表达EPSPS的N端的pET28a质粒分别用BglII和SalI酶切，回收所需片段连接入pACYC184载体的BamHI和salI位点得到pACYC-T7系列表达质粒(表1，图3)。

f.pET28a系列表达质粒(用于表达C端His-taq融合蛋白)的构建

以pKU2009为模板，分别以对应引物进行扩增得到编码大肠杆菌EPSPS相应部分的基因，将扩增产物用XhoI和NcoI酶切后连接入pET28a载体中得到pET28a系列表达质粒，该系列质粒所编码的EPSPS的C端融合有6个组氨酸以便于利用镍柱纯化蛋白(图3)。

g.用于菌株突变的质粒pKU2229的构建

以大肠杆菌BL21(DE3)的染色体为模板，用引物进行PCR扩增反应，得到其aroA基因上游长约600bp的片段，将其连入pBlueScript(stratagene)的BamHI和HindIII位点得到质粒pKU2223。以质粒pBlueScript为模板，用引物进行PCR扩增反应，得到长约900bp的bla基因，将其连接入pBlueScript(stratagene)的HindIII和EcoRI位点得到质粒pKU2224。以大肠杆菌BL21(DE3)的染色体为模板，用引物进行PCR扩增反应，得到其aroA基因下游长约500bp的片段，将其连入pBlueScript(stratagene)的EcoRI和SalI位点得到质粒pKU2225。酶切回收pKU2225中的片段连接入pKU2223的EcoRI和SalI位点得到质粒pKU2227。酶切回收pKU2224中的片段连接入pKU2227的HindIII和EcoRI位点得到质粒pKU2228。酶切回收pKU2228中的BamHI和SalI间的片段连接入pKO3载体中得到质粒pKU2229。

以上所有构建质粒均测序保证其序列正确。

1.6突变菌株BA^-的构建

利用pKO3来源质粒pKU2229将BL21(DE3)的aroA基因替换为导致氨苄青霉素抗性的bla基因。具体步骤为：将pKU2229转化入BL21(DE3)中，挑取一个转化子稀释后涂布于带有Ap和Cm抗生素的LB固体平板上，43℃过夜培养，由于pKO3的复制子在43℃不能正常起始复制，因此pKU2229只有重组到染色体上，菌株才能在43℃含有Ap和Cm抗生素的平板上生长。挑取一个重组后的菌落，稀释后涂布到含有5％蔗糖的仅含有Ap抗生素的LB培养基上，过夜培养。由于pKO3带有Sac B基因，该基因编码的蛋白质分解蔗糖后对细菌产生毒性，导致带有Sac B基因的细菌不能在含有5％蔗糖的培养基上生长，因此在含有5％蔗糖及Ap抗生素的LB培养基上生长的菌落，又一次发生同源重组，使aroA基因和sac B基因丢失。挑取几个菌落，划线于Cm平板和M63平板，确定aroA基因确实被删除，提取其总DNA，进行PCR扩增反应以最终确定bla基因替换掉aroA基因。

1.7体内互补实验

将如上述构建的pKU2100质粒和相应的pACYC1184质粒分别转入或共转入大肠杆菌aroA基因缺陷的菌株AB2829中，然后将其划线于M63限制性固体培养培养基上，过夜培养检测其生长情况。

1.8生长曲线实验

将带有质粒pKU2004、pKU2006和pKU2007的大肠杆菌aroA基因突变菌株AB2829接种于LB液体培养基中过夜培养，取菌液4000rpm离心3分钟，用0.9％生理盐水悬浮，再次离心，弃去上清，并用生理盐水重新悬浮，接入含有0、50和100mM草甘膦的液体培养基中，初始接菌量为OD₆₀₀0.04，37℃过夜培养，并定时测光吸收(OD₆₀₀)。

1.9蛋白的表达与纯化

将带有目的质粒的BA^-菌接入含有相应抗生素的LB液体培养基中，在37℃摇床培养至OD₆₀₀ 0.75左右，加入终浓度为0.5mM的IPTG，15℃过夜培养。将菌液在4℃、5000rpm离心10分钟收集菌体，按体积比10∶1重悬至缓冲液A(50mM Tris-HCl(pH 7.8)，0.4mM DTT)中，超声波破碎菌体，4℃、8000rpm离心60分钟。

将离心后的上清液用HisTrap HP kit(Amersham Biosciences)按照使用说明进行蛋白纯化。纯化后的蛋白利用Millipore Biomax membrane(10kDa)浓缩于缓冲液A中，4℃保存。

1.10EPSPS多克隆抗体的制备

将带有质粒pKU2008的BL21(DE3)菌株按以上步骤进行表达纯化，最后将蛋白浓缩，重悬于PBS缓冲液中。以此蛋白为抗原，对兔子进行免疫反应，经过四次反应，一次加强反应后取血清(此过程由中科院遗传所完成)，用ELASA检测抗体效价后备用。

1.11聚丙烯酰胺凝胶电泳

SDS-聚丙烯酰胺凝胶电泳凝胶的上层浓缩胶浓度为5％，下层分离胶浓度一般为16％。Native-聚丙烯酰胺凝胶电泳凝胶的浓度为10％。凝胶、电泳缓冲液的配置及电泳方法参见Sambrook等，出处同上。

1.12圆二色性光谱(CD spectra)的测定

远紫外和近紫外CD光谱的测量在一台接有恒温水浴循环控制仪的Jobin Yvon CD6上进行。每条曲线是4次测量的平均。测量温度为8℃。进行近紫外圆二色性光谱测定时使用1-cm pathlength cylinder quartz cuvette，而远紫外圆二色性光谱测定时使用0.1-mm pathlength cylinder quartz cuvette。

1.13EPSPS片段的蛋白免疫印迹实验

转膜及免疫印迹反应方法参见Sambrook等，出处同上。简要步骤为：蛋白经过16％SDS-聚丙烯酰胺凝胶电泳后转移至硝酸纤维素膜上，将膜与1∶2000稀释的兔的多克隆抗体杂交，抗体抗原复合物进一步与结合有辣根过氧化物酶的第二抗体-羊抗兔IgG(promega)反应形成复合物。显色反应采用辣根过氧化物酶分解DAB(华美生物工程公司)的方法，具体操作见说明书。

1.14EPSPS活性测定

酶活性的测定

(1)取95μl底液(在反应体系中浓度为50mmol/L HEPE Sbuffer(pH7.5)，1mmol/L PEP，1mmol/L S3P)，于28℃的培养箱中预热5min。

(2)加5μl酶液，在28℃培养箱中放置1-20min(以酶量活性决定时间长短)，加800μl MG/AM/NP混合1min。

(3)加100μl的34％的柠檬酸钠溶液，混合后半小时于660nm的分光光度计上测定OD值。

1.15体外互补实验

将EPSPS的N端和C端分别在BA^-中表达，离心收集菌体后超声波破碎，电泳检测目的蛋白是否主要形成包涵体从而聚集在沉淀中。收集沉淀，先用缓冲液B(50mM Tris-HCl(pH7.8)，1mM EDTA，0.05％的Titon-100)洗三次，再用1M氯化钠溶液洗三次，再用缓冲液C(50mM Tris-HCl(pH7.8)，1mM EDTA，1M尿素)洗三次，最后用蒸馏水洗三次。将洗涤完毕后的沉淀加入还有8M尿素的缓冲液A中，充分溶解后离心取上清转入透析袋中。先用还有2M尿素的缓冲液D(50mM Tris-HCl(pH7.8)，1mM GSH，0.5mMGSSG)透析过夜，再用缓冲液D透析36小时，最后用PEG12000浓缩。复性产物通过电泳、免疫反应及酶活性检测加以分析。

2.大肠杆菌EPSPS的片段互补结果

2.1体内功能互补实验

为了检测EPSPS能否体内表达形成片段互补，分别将编码EPSPS的N端肽链的基因构建在pACYC184载体上，而将编码EPSPS的C端肽链的基因构建在pBR322载体上(具体构建过程见方法)。然后将这些质粒分别转入大肠杆菌的aroA基因突变菌株AB2829中，通过检测其是否能在M63限制性培养基上生长，来确定该基因编码的蛋白片段是否仍具有EPSPS活性。结果，仅带有编码N端或C端EPSPS编码基因的AB2829不能在M63培养基上生长。

由于pACYC184和pBR322质粒分别具有复制子p15A and ColE1，因此这两个质粒可以在同一个细菌中共表达。我们于是将编码EPSPS的N端肽链的pACYC184系列质粒，和在同一个位点分拆的编码EPSPS的C端肽链的pKU2100系列质粒，共转化入大肠杆菌的aroA基因突变菌株AB2829中，将其划线于M63限制性培养基平板上37℃培养。16小时后，分别带有编码EPSPS的N218/C219(pKU2101/pKU2102)和N227/C228(pKU2125/pKU2138)质粒的AB2829可以在限制性培养基上生长，而带有其它三对质粒pKU2126/pKU2137(N234/C235)、pKU2162/pKU2163(N240/C241)和pKU2110/pKU2130(N245/C246)的AB2829不能在M63培养基上生长。这说明，EPSPS片段(N218/C219和N227/C228)在体内分别表达时，可以互补形成EPSPS活性，其它三对EPSPS的片段在体内不能互补EPSPS活性。

2.2EPSPS片段复合体的纯化和检测

为了确定是否因为编码EPSPS片段的基因在体内发生重组而导致合成全长EPSPS并恢复EPSPS活性，将蛋白片段共纯化出来，体外检测酶活性及蛋白片段大小，以确定EPSPS活性恢复确实是因为片段互补的原因。为此，构建了用于表达EPSPS片段的质粒，其中N端构建于pACYC184载体上，而蛋白C端构建于pET28a载体上，都由T7启动子起始转录表达，其中EPSPS的C端肽链的C端融合有6个组氨酸(质粒构建见方法见上文)。如果EPSPS的两个蛋白片段能够体内重建，形成天然EPSPS的结构，那么分拆后的EPSPS的N端肽链，将与相应的EPSPS C端肽链结合，并且该复合体可以被镍柱所吸附而共纯化出来。为了消除细菌染色体上aroA基因编码的EPSPS的影响，将大肠杆菌BL21体内编码EPSPS的aroA基因，替换为编码β-内酰胺酶的bla基因，得到aroA基因删除菌株BA^-。将相应的两个系列的质粒，转化入BA^-菌株中共表达。首先将其划线于涂有IPTG的M63平板上，过夜培养检测其体内互补情况。结果与前面一致，带有N218/C219、N227/C228片段编码基因的BA^-，可以在M63限制性培养基上生长；带有其它三对片段编码基因的BA^-，不能在M63限制性培养基上生长。将EPSPS的N端肽链和C端肽链在BA^-中分别表达或共表达，SDS-PAGE检测，结果表明它们均能正常表达。用HisTrap HP kit对共表达的蛋白进行纯化，纯化后的蛋白SDS-聚丙烯酰胺凝胶电泳后，用制备好的EPSPS的抗体进行检测(具体步骤见方法)。结果如图4所示，纯化后的蛋白中不仅有EPSPS的C端肽链，而且也有其对应的N端肽链。这些蛋白片段都与预计的片段大小一致，这说明在体内表达的EPSPS的片段，可以互补形成复合体从而被共纯化出来。从图中也看出，共表达的蛋白无论是纯化前还是纯化后都没有全长的蛋白，这表明体内没有发生重组，因此没有形成全长EPSPS基因。活性试验也显示，纯化出的蛋白都具有EPSPS活性。以上的结果表明，EPSPS活性可以由在体内分别表达的肽链发生片段互补而形成。

EPSPS的N端肽链和C端肽链虽然在体内表达量可能有所差异，如N227的表达量远大于C228的表达量，但是纯化后N端和C端蛋白片段的含量几乎都是1∶1的关系。从图中也可以看出，纯化出的N234/C235、N245/C246量远远少于其它三个共纯化的EPSPS，这可能是其不能在体内互补EPSPS活性以使AB2829在限制性培养基上生长的原因。虽然N240/C241复合体纯化出的量甚至多于N218/C219，但是它却不能互补AB2829在限制性培养基上的生长，这是因为其EPSPS活性比较低的原因

2.3测定酶活性

为了对N218/C219、N227/C228这两个能重建酶活性的复合体进行进一步的研究，将上一步用HisTrap HP kit纯化后N218/C219、N227/C228及全长的EPSPS用Sephadex-G75柱进行进一步纯化，纯化结果表明N218/C219、N227/C228及全长的EPSPS具有同一个洗脱峰，表明其分子量及结构大致相同。随后测定了这三个蛋白的酶活性及对底物的Km值，结果如表2，从表中可以看出，片段互补后的EPSPS复合体N218/C219及N227/C228的酶的活力分别约为全长EPSPS的70％和64％，而对底物的亲和力并没有太大的改变，这表明重建的EPSPS结构比较稳定。

表2.EPSPS及重建后EPSPS的酶学性质

酶(μM)

比活力^b(μmol min^-1mg^-1)

K_m[PEP]^c(μM)

K_m[S3P]^d

EPSPS218/219227/228

44±231±328±4

14±318±319±3

45±149±349±6

^a以上结果为两次独立实验，每次实验至少有三个平行。

^b酶比活力测定PEP和S3P的浓度均为1.0mM。

^c测定K_m[PEP]时，S3P浓度不变为1mM，PEP浓度从50到200μM。

^d测定K_m[S3P]时，PEP浓度不变为1mM，S3P浓度从50到200μM。

2.4圆二色性光谱(CD spectra)的分析

为了确定，片段互补重建所得的EPSPS是否与野生型EPSPS结构一致，对EPSPS及复合体N227/C228进行了圆二色性光谱分析。EPSPS与N227/C228的远紫外CD光谱基本没有显著差异(图5)，这意味着它们的二级结构几乎是相同的。但近紫外CD光谱之间有所差异(图5)，表明重建的EPSPS与野生型EPSPS结构还是有所差异。

2.5大肠杆菌突变型EPSPS的体内互补

为了检测突变后的EPSPS片段是否可以在体内进行功能互补，分别构建了质粒pKU2105和pKU2333，它们分别编码大肠杆菌EPSPS的两个N端片段N218-G96A和N227-G96A。将它们与相应的编码C219和C228的质粒分别转入大肠杆菌aroA基因的突变菌株AB2829(aroA^-，来源于耶鲁大学))中，在带有不同浓度草甘膦的M63限制性培养基中检测其生长情况，结果如图6。从图中可以看到，在未加草甘膦的M63培养基中，带有不同质粒的AB2829均生长良好，没有明显的差异。在含有50mM草甘膦的M63培养基中，表达有突变的EPSPS全酶(EPSPS-G96A)或突变的互补片段(N227-G96A/C228和N218-G96A/C219)的菌株生长较好，而表达有野生型EPSPS或野生互补片段的菌株生长被阻遏。表达有EPSPS-G96A或N227-G96A/C228的菌株在含有100mM草甘膦的M63培养基中仍旧生长良好，而表达有N218-G96A/C219的菌株生长稍差，这可能是在体内N2227-G96A/C228复合体更容易形成的原因。

2.6体外EPSPS的重建

蛋白片段能在体内互补形成有活性的复合体，那么在体外同样有可能互补形成有活性的复合体。为此，分别表达了EPSPS的N端肽链N218和C端肽链C219。EPSPS片段的大量表达形成包涵体，对包涵体进行初步纯化后，将它们一起复性(操作步骤见方法)。复性结束后对其进行电泳分析，结果见图7。从图7a中我们可以看出，EPSPS的各个片段出现在预计的位置，并没有全长的EPSPS。当将其体外共复性之后，native-PAGE结果可以出现与野生EPSPS一致的条带，将单独复性后的N218和C219混合在一起时并没有此带，这说明体外EPSPS共复性后可以互补形成类似于野生EPSPS的结构。活性实验也表明，N218/C219共复性可以互补形成EPSPS活性，而单独复性后的N218和C219混合在一起并不能互补形成EPSPS活性。

3.EPSPS的片段互补与结构的关系

3.1所用的菌株和质粒见下表。

表3.用于本研究中的细菌菌株和质粒

菌株/质粒	相关特点	来源/参考文献
菌株/质粒	相关特点	来源/参考文献	大肠杆菌菌株
DH5α	supE44ΔlacU169hsdR17recA1gyrA96thi-1re1A1	Hanahan D.，J Mol Biol1983；166：557-80	大肠杆菌菌株
DH5α	supE44ΔlacU169hsdR17recA1gyrA96thi-1re1A1	Hanahan D.，J Mol Biol1983；166：557-80	AB2829	aroA354	耶鲁大学
质粒			AB2829	aroA354	耶鲁大学
质粒			pUC18	ColE1，lacZ’，Ap^R	Norrander等，1983
pBluscript-SK	ColE1，lacZ’，Ap^R	Stratagene	pUC18	ColE1，lacZ’，Ap^R	Norrander等，1983
pBluscript-SK	ColE1，lacZ’，Ap^R	Stratagene	pET-28a	ColE1，表达质粒，Km^R	Novagen
pACYC184	Cm^R	Chang，A.C.等1978.JBacteriol 134：1141-56	pET-28a	ColE1，表达质粒，Km^R	Novagen
pACYC184	Cm^R	Chang，A.C.等1978.JBacteriol 134：1141-56	pBR322	ColE1，Ap^R	Schaeffer，F.等，1982EMBOJ.1，99-105
pKU2005	pUC18衍生质粒，带有aroA_E.coli，Ap^R	本工作	pBR322	ColE1，Ap^R	Schaeffer，F.等，1982EMBOJ.1，99-105
pKU2005	pUC18衍生质粒，带有aroA_E.coli，Ap^R	本工作	pKU2006	pACYC184衍生质粒，带有aroA_E.coli，Cm^R	本工作
pKU2007	pACYC184衍生质粒，带有aroA_E.coli-G96A，Cm^R	本工作	pKU2006	pACYC184衍生质粒，带有aroA_E.coli，Cm^R	本工作
pKU2007	pACYC184衍生质粒，带有aroA_E.coli-G96A，Cm^R	本工作	pKU2008	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作
pKU2009	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作	pKU2008	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作
pKU2009	pET-28a衍生质粒，带有E.coli aroA，Km^R	本工作	pKU2010	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作
pKU2011	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作	pKU2010	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作
pKU2011	pET-28a衍生质粒，带有E.coli aroA-G96A，Km^R	本工作	pKU2100	PBR322衍生质粒，带有aroA_E.coli，Ap^R	本工作
pKU2101	pACYC184衍生质粒，带有N218-aroA_E.coli，Cm^R	本工作	pKU2100	PBR322衍生质粒，带有aroA_E.coli，Ap^R	本工作
pKU2101	pACYC184衍生质粒，带有N218-aroA_E.coli，Cm^R	本工作	pKU2102	pBR322衍生质粒，带有C219-aroA_E.coli，Ap^R	本工作
pKU2103	pACYC184衍生质粒，带有N238-aroA_E.coli，Cm^R	本工作	pKU2102	pBR322衍生质粒，带有C219-aroA_E.coli，Ap^R	本工作
pKU2103	pACYC184衍生质粒，带有N238-aroA_E.coli，Cm^R	本工作	pKU2104	pBR322衍生质粒，带有C239-aroA_E.coli Ap^R	本工作
pKU2110	pACYC184衍生质粒，带有N245-aroA_E.coli，Cm^R	本工作	pKU2104	pBR322衍生质粒，带有C239-aroA_E.coli Ap^R	本工作
pKU2110	pACYC184衍生质粒，带有N245-aroA_E.coli，Cm^R	本工作	pKU2111	pACYC184衍生质粒，带有N259-aroA_E.coli，Cm^R	本工作
pKU2124	pBR322衍生质粒，带有C225-aroA_E.coli，Ap^R	本工作	pKU2111	pACYC184衍生质粒，带有N259-aroA_E.coli，Cm^R	本工作
pKU2124	pBR322衍生质粒，带有C225-aroA_E.coli，Ap^R	本工作	pKU2125	pBR322衍生质粒，带有C228-aroA_E.coli，Ap^R	本工作
pKU2126	pBR322衍生质粒，带有C235-aroA_E.coli，Ap^R	本工作	pKU2125	pBR322衍生质粒，带有C228-aroA_E.coli，Ap^R	本工作

pKU2129	pACYC184衍生质粒，带有N31-aroA_E.coli，Cm^R	本工作
pKU2129	pACYC184衍生质粒，带有N31-aroA_E.coli，Cm^R	本工作	pKU2130	pBR322衍生质粒，带有C246-aroA_E.coli，Ap^R	本工作
pKU2131	pBR322衍生质粒，带有C260-aroA_E.coli，Ap^R	本工作	pKU2130	pBR322衍生质粒，带有C246-aroA_E.coli，Ap^R	本工作
pKU2131	pBR322衍生质粒，带有C260-aroA_E.coli，Ap^R	本工作	pKU2135	pBR322衍生质粒，带有C299-aroA_E.coli，Ap^R	本工作
pKU2136	pACYC184衍生质粒，带有N298-aroA_E.coli，Cm^R	本工作	pKU2135	pBR322衍生质粒，带有C299-aroA_E.coli，Ap^R	本工作
pKU2136	pACYC184衍生质粒，带有N298-aroA_E.coli，Cm^R	本工作	pKU2137	pACYC184衍生质粒，带有N234-aroA_E.coli，Cm^R	本工作
pKU2138	pACYC184衍生质粒，带有N227-aroA_E.coli，Cm^R	本工作	pKU2137	pACYC184衍生质粒，带有N234-aroA_E.coli，Cm^R	本工作
pKU2138	pACYC184衍生质粒，带有N227-aroA_E.coli，Cm^R	本工作	pKU2139	pACYC184衍生质粒，带有N224-aroA_E.coli，Cm^R	本工作
pKU2148	pACYC184衍生质粒，带有N165-aroA_E.coli，Cm^R	本工作	pKU2139	pACYC184衍生质粒，带有N224-aroA_E.coli，Cm^R	本工作
pKU2148	pACYC184衍生质粒，带有N165-aroA_E.coli，Cm^R	本工作	pKU2149	pBR322衍生质粒，带有C166-aroA_E.coli，Ap^R	本工作
pKU2150	pACYC184衍生质粒，带有N371-aroA_E.coli，Cm^R	本工作	pKU2149	pBR322衍生质粒，带有C166-aroA_E.coli，Ap^R	本工作
pKU2150	pACYC184衍生质粒，带有N371-aroA_E.coli，Cm^R	本工作	pKU2151	pBR322衍生质粒，带有C372-aroA_E.coli，Ap^R	本工作
pKU2290	pACYC 184衍生质粒，带有N67-aroA_E.coli，Cm^R	本工作	pKU2151	pBR322衍生质粒，带有C372-aroA_E.coli，Ap^R	本工作
pKU2290	pACYC 184衍生质粒，带有N67-aroA_E.coli，Cm^R	本工作	pKU2291	pACYC 184衍生质粒，带有N73-aroA_E.coli，Cm^R	本工作
pKU2292	pACYC184衍生质粒，带有N84-aroA_E.coli，Cm^R	本工作	pKU2291	pACYC 184衍生质粒，带有N73-aroA_E.coli，Cm^R	本工作
pKU2292	pACYC184衍生质粒，带有N84-aroA_E.coli，Cm^R	本工作	pKU2293	pACYC184衍生质粒，带有N104-aroA_E.coli，Cm^R	本工作
pKU2294	pACYC184衍生质粒，带有N154-aroA_E.coli，Cm^R	本工作	pKU2293	pACYC184衍生质粒，带有N104-aroA_E.coli，Cm^R	本工作
pKU2294	pACYC184衍生质粒，带有N154-aroA_E.coli，Cm^R	本工作	pKU2295	pACYC184衍生质粒，带有N182-aroA_E.coli，Cm^R	本工作
pKU2296	pACYC184衍生质粒，带有N184-aroA_E.coli，Cm^R	本工作	pKU2295	pACYC184衍生质粒，带有N182-aroA_E.coli，Cm^R	本工作
pKU2296	pACYC184衍生质粒，带有N184-aroA_E.coli，Cm^R	本工作	pKU2297	pACYC184衍生质粒，带有N376-aroA_E.coli，Cm^R	本工作
pKU2298	pACYC184衍生质粒，带有N383-aroA_E.coli，Cm^R	本工作	pKU2297	pACYC184衍生质粒，带有N376-aroA_E.coli，Cm^R	本工作
pKU2298	pACYC184衍生质粒，带有N383-aroA_E.coli，Cm^R	本工作	pKU2299	pBR322衍生质粒，带有C68-aroA_E.coli，Ap^R	本工作
pKU2300	pBR322衍生质粒，带有C74-aroA_E.coli，Ap^R	本工作	pKU2299	pBR322衍生质粒，带有C68-aroA_E.coli，Ap^R	本工作
pKU2300	pBR322衍生质粒，带有C74-aroA_E.coli，Ap^R	本工作	pKU2301	pBR322衍生质粒，带有C86-aroA_E.coli，Ap^R	本工作
pKU2302	pBR322衍生质粒，带有C105-aroA_E.coli，Ap^R	本工作	pKU2301	pBR322衍生质粒，带有C86-aroA_E.coli，Ap^R	本工作
pKU2302	pBR322衍生质粒，带有C105-aroA_E.coli，Ap^R	本工作	pKU2303	pBR322衍生质粒，带有C155-aroA_E.coli，Ap^R	本工作
pKU2304	pBR322衍生质粒，带有C183-aroA_E.coli，Ap^R	本工作	pKU2303	pBR322衍生质粒，带有C155-aroA_E.coli，Ap^R	本工作
pKU2304	pBR322衍生质粒，带有C183-aroA_E.coli，Ap^R	本工作	pKU2305	pBR322衍生质粒，带有C185-aroA_E,coli，Ap^R	本工作
pKU2306	pBR322衍生质粒，带有C377-aroA_E.coli，Ap^R	本工作	pKU2305	pBR322衍生质粒，带有C185-aroA_E,coli，Ap^R	本工作
pKU2306	pBR322衍生质粒，带有C377-aroA_E.coli，Ap^R	本工作	pKU2307	pBR322衍生质粒，带有C384-aroA_E.coli，Ap^R	本工作

Ap，氨卞青霉素；Cm，氯霉素；^R，抗性。

3.2培养基

参看本实施例1.2节。

3.3试剂

限制性内切酶，T₄DNA连接酶，DNA聚合酶，DNAmarker等购于Takara生物公司。其余化学药品均为分析纯试剂。

3.4遗传学操作

质粒DNA的制备、限制性内切酶的消化、连接反应、Tris-硼酸-EDTA缓冲液水平琼脂糖电泳、按照标准方法进行(Maniatis等，1982)。

3.5质粒构建

a.pBR322系列质粒(编码EPSP合酶C端肽链)的构建

以pKU2009(大肠杆菌aroA基因)为模板，分别以对应引物(进行扩增得到编码大肠杆菌EPSP合酶C端的基因，将扩增产物连接入pKU2100的NcoI和BamHI位点，得到编码EPSP合酶C端肽链系列质粒(表3)。

b.pACYC184系列质粒(编码EPSP合酶N端肽链)的构建

以pKU2009或pGMO为模板，分别以对应引物进行扩增得到编码大肠杆菌EPSP合酶N端的基因，将扩增产物连接入pACYC184的EcoR V和BamHI位点，分别得到编码EPSP合酶N端肽链系列质粒(表3)。

以上所有构建质粒均测序保证其序列正确。

3.6体内互补实验

将3.5a中构建的pBR322系列质粒和b中构建的pACYC1184系列质粒分别转入或相对应两个质粒共转入大肠杆菌aroA基因缺陷的菌株AB2829中，然后将其划线于M63限制性固体培养培养基上，过夜培养检测其生长情况。

3.7结果

基于大肠杆菌EPSPS的结构一共设计了21个分拆位点，进行了EPSPS片段互补研究。有三个分拆位点在α螺旋上，其中N31/C32和N245/C246都不能互补大肠杆菌aroA基因突变菌株AB2829在限制性培养基上的生长，而N105/C106互补情况较差；有三个拆分位点在β折叠上，其中N73/C74和N238/C239不能互补EPSP酶活性，而N224/C225可以互补AB2829在限制性培养基上的生长；有5个在β折叠或α螺旋之间的连接区域上，其中仅有N165/C166不能互补AB2829在M63培养基上的生长，而其它四对EPSPS的片段都可以互补EPSPS活性；分拆位点在两个折叠单元之间的有6个，其中仅有N234/C235不能互补EPSPS的活性，其它五对片段都能互补AB2829在M63培养基上的生长，而且互补情况较好。

表4大肠杆菌EPSPS片段互补

EPSPS片段		分拆位点所在区域	互补情况
EPSPS片段		分拆位点所在区域	互补情况			N端N31N67N73N85N104	C端C32C68C74C86C105	α螺旋两个β折叠之间β折叠折叠单元3和4之间α螺旋	N端-----	C端-----	N端+C端-+-++++/-

N154N165N182N184N218N224N227N234N238N240N245N259N298N371N376N383

C155C166C183C185C219C225C228C235C239C241C246C260C299C372C377C384

折叠单元4和5之间α螺旋与β折叠之间α螺旋与β折叠之间α螺旋与β折叠之间两个β折叠之间β折叠折叠单元3和5之间折叠单元3和5之间β折叠两个结构域之间α螺旋β折叠折叠单元2和6之间折叠单元1和6之间折叠单元1和6之间α螺旋与β折叠之间

----------------

+++-+++++++++----+++++++++++

-，不能生长；+，可以生长。

实施例2恶臭假单胞菌草甘膦抗性EPSPS的片段互补

利用恶臭假单胞菌CGMCC0739的草甘膦抗性EPSPS基因进行片段互补实验。所用的质粒，培养基，菌株，以及实验步骤都参见实施例1。通过在含有100mM草甘膦的培养基上生长来检测重建的酶活性。

表5恶臭假单胞菌草甘膦抗性EPSPS的片段互补

EPSPS片段	分拆位置	互补情况
EPSPS片段	分拆位置	互补情况	N208/C209N214/C215N219/C220N222/C223N224/C225N233/C234N234/C234N236/C237	α螺旋与β折叠之间β折叠中折叠单元之间折叠单元之间折叠单元之间两个结构域之间两个结构域之间两个结构域之间	+++++++---

所用引物如下：

N端正向引物：

ppN5’：5’-TGA GTG ACT GAA AGT GAA AGT AAC AAT ACA G-3’N端反向引物见下。

C端反向引物：

PPC3’(BamHI)：5’-CGG GAT CCC TTC TTC GGA CAA TGA CAG AC-3’C端正向引物见下。

N208/C209+

ppN2083’(BamHI)：5’-CGG GAT CCT CAG GGA GTC TTC AAA CCA AAC C-3’

ppC2095’(NcoI)：5’-CAT GCC ATG GAG AAT CGA AAC TAT GAA G-3’

N214/C215+

ppN2143’(BamHI)：5’-CGG GAT CCT CAT TCA TAG TTT CGA TTC TCG G-3’

ppC2155’(NcoI)：5’-CAT GCC ATG GAG TTT TAT TTC AAA GCC GG-3’

N219/C220++

ppN2193’(BamHI)：5’-CGG GAT CCT CAT TTG AAA TAA AAC TCT TCA TAG-3’

ppC2205’(NcoI)：5’-CAT GCC ATG GCC GGG AAT GTA TAT GAT GAA AC-3’

N222/C223+

ppN2223’(BamHI)：5’-CGG GAT CCT CAA TTC CCG GCT TTG AAA TAA AAC-3’

ppC2235’(NcoI)：5’-CAT GCC ATG GTA TAT GAT GAA ACG AAA ATG-3’

N224/C225++

ppN2243’(BamHI)：5’-CGG GAT CCT CAA TAT ACA TTC CCG GCT TTG-3’

ppC2255’(NcoI)：5’-CAT GCC ATG GAT GAA ACG AAA ATG CAA CG-3’

N233/C234

ppN2333’(BamHI)：5’-CGG GAT CCT CAG GTG TAT CGT TGC ATT TTC G-3’

ppC2345’(NcoI)：5’-CAT GCC ATG GTA GAA GGC GAC TGG AGC G-3’

N234/C235

ppN2343’(BamHI)：5’-CGG GAT CCT CAT ACG GTG TAT CGT TGC ATT TTC-3’

ppC2355’(NcoI)：5’-CAT GCC ATG GAA GGC GAC TGG AGC GGT GG-3’

N236/C237

ppN2363’(BamHI)：5’-CGG GAT CCT CAG CCT TCT ACG GTG TAT CGT TG-3’

ppC2375’(NcoI)：5’-CAT GCC ATG GAC TGG AGC GGT GGT GCT TT-3’

序列表

<110>北京大学

王忆平，孙义成，李燕

<120>利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性

<130>

<141>

<160>79

<170>PatentIn version3.1

<210>1

<211>1501

<212>DNA

<213>恶臭杆菌P.P4G-1(Pseudomonas putida P.P4G-1)

<400>1

agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 60

ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct 120

gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga 180

gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt 240

ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca 300

cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca 360

atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag 420

cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca 480

gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta 540

atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc 600

cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg 660

gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg 720

accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat 780

accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag 840

tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca 900

aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg 960

aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg 1020

gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa 1080

gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa 1140

ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt 1200

acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt 1260

ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga 1320

agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg 1380

tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc 1440

gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt 1500

a 1501

<210>2

<211>1914

<212>DNA

<213>恶臭杆菌P.P4G-1(Pseudomonas putida P.P4G-1)

<220>

<221>CDS

<222>(508)..(1800)

<223>

<400>2

gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa 60

tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca 120

gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa 180

ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc 240

ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca 300

aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga 360

tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa 420

ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt 480

agaaaaaatc attcaagcat taccaaa gtg aaa gta aca ata cag ccc gga gat 534

Met Lys Val Thr Ile Gln Pro Gly Asp

1 5

ctg act gga att atc cag tca ccc gct tca aaa agt tcg atg cag cga 582

Leu Thr Gly Ile Ile Gln Ser Pro Ala Ser Lys Ser Ser Met Gln Arg

10 15 20 25

gct tgt gct gct gca ctg gtt gca aaa gga ata agt gag atc att aat 630

Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Set Glu Ile Ile Asn

30 35 40

ccc ggt cat agc aat gat gat aaa gct gcc agg gat att gta agc cgg 678

Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg

45 50 55

ctt ggt gcc agg ctt gaa gat cag cct gat ggt tct ttg cag ata aca 726

Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr

60 65 70

agt gaa ggc gta aaa cct gtc gct cct ttt att gac tgc ggt gaa tct 774

Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser

75 80 85

ggt tta agt atc cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa 822

Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu

90 95 100 105

gag gtg acg atc aaa gga tct gga agc ctt gtt aca aga cca atg gat 870

Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp

110 115 120

ttc ttt gat gaa att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac 918

Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn

125 130 135

cag ggt aaa ttg cct ctc gtt ata cag ggg cca ttg aaa cca gca gac 966

Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp

140 145 150

gtt acg gtt gat ggg tcc tta agc tct cag ttc ctt aca ggt ttg ttg 1014

Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu

155 160 165

ctt gca tat gcg gcc gca gat gca agc gat gtt gcg ata aaa gta acg 1062

Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr

170 175 180 185

aat ctc aaa agc cgt ccg tat atc gat ctt aca ctg gat gtg atg aag 1110

Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys

190 195 200

cgg ttt ggt ttg aag act ccc gag aat cga aac tat gaa gag ttt tat 1158

Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr

205 210 215

ttc aaa gcc ggg aat gta tat gat gaa acg aaa atg caa cga tac acc 1206

Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr

220 225 230

gta gaa ggc gac tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct 1254

Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala

235 240 245

att gcc ggg ccg atc acg gta aga ggt ttg gat ata gct tcg acg cag 1302

Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln

250 255 260 265

gct gat aaa gcg atc gtt cag gct ttg atg agt gcg aac gca ggt att 1350

Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile

270 275 280

gcg att gat gca aaa gag atc aaa ctt cat cct gct gat ctc aat gca 1398

Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala

285 290 295

ttt gaa ttt gat gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt 1446

Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val

300 305 310

gct ttg gcg tct tat tgc aaa gga gaa aca aag atc aaa ggc gta agc 1494

Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser

315 320 325

agg ctg gcg cat aaa gaa agt gac aga gga ttg acg ctg cag gac gag 1542

Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu

330 335 340 345

ttc ggg aaa atg ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc 1590

Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg

350 355 360

gtg atc gga ggg aaa ggc gta aaa gga gct gaa gtt agt tca agg cac 1638

Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His

365 370 375

gat cat cgc att gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg 1686

Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val

380 385 390

ggt gaa aca acc atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg 1734

Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro

395 400 405

gat ttt tac agc gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac 1782

Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn

410 415 420 425

cat caa ttt aat ttc tca tgaatagctt cggccgcatc ttcagggtgc 1830

His Gln Phe Asn Phe Ser

430

atatttttgg cgaatcacat ggtgaatcag taggcatcgt tattgatggt tgtcctgctg 1890

gtctgtcatt gtccgaagaa gatc 1914

<210>3

<211>431

<212>PRT

<213>恶臭杆菌P.P4G-1(Pseudomonas putida P.P4G-1)

<400>3

Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Tle Ile Gln Ser

1 5 10 15

Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val

20 25 30

Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp

35 40 45

Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp

50 55 60

Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val

65 70 75 80

Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe

85 90 95

Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser

100 105 110

Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro

115 120 125

His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val

130 135 140

Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu

145 150 155 160

Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp

165 170 175

Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr

180 185 190

Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro

195 200 205

Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr

210 215 220

Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly

225 230 235 240

Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val

245 250 255

Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln

260 265 270

Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile

275 280 285

Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp

290 295 300

Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys

305 310 315 320

Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser

325 330 335

Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu

340 345 350

Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val

355 360 365

Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala

370 375 380

Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His

385 390 395 400

Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys

405 410 415

Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser

420 425 430

<210>4

<211>20

<212>DNA

<213>人工序列

<400>4

agagtttgat catggctcag 20

<210>5

<211>22

<212>DNA

<213>人工序列

<400>5

tacggttacc ttgttacgac tt 22

<210>6

<211>34

<212>DNA

<213>人工序列

<400>6

cgggatccta agtaagtgaa agtaacaata cagc 34

<210>7

<211>29

<212>DNA

<213>人工序列

<400>7

cgggatccct tcttcggaca atgacagac 29

<210>8

<211>33

<212>DNA

<213>人工序列

<400>8

cgggatccgt taatgccgaa attttgctta atc 33

<210>9

<211>30

<212>DNA

<213>人工序列

<400>9

cgggatccag gtccgaaaaa aaacgccgac 30

<210>10

<211>1436

<212>DNA

<213>大肠杆菌(Escherichia coli)

<400>10

gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg 60

tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact 120

attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca 180

cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat 240

gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt 300

atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc 360

ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg 420

accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg 480

ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc 540

ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca 600

ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg 660

gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt 720

gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt 780

acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc 840

aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc 900

tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc 960

tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg 1020

atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat 1080

aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc 1140

ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac 1200

tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg 1260

ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat 1320

tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata 1380

gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct 1436

<210>11

<211>30

<212>DNA

<213>人工序列

<220>

<223>大肠杆菌(E.coli)aroA上游引物

<400>11

cgggatccag gtccgaaaaa aaacgccgac 30

<210>12

<211>28

<212>DNA

<213>人工序列

<220>

<223>大肠杆菌(E.coli)aroA下游引物

<400>12

cgggatccat ggaatccctg acgttaca 28

<210>13

<211>29

<212>DNA

<213>人工序列

<220>

<223>pACYC(大肠杆菌(E.coli)aroA)系列上游引物

<400>13

tgagtgactg actttaagaa ggagatata 29

<210>14

<211>28

<212>DNA

<213>人工序列

<220>

<223>pBR322(大肠杆菌(E.coli)aroA)系列下游引物

<400>14

gccacgatgc gtccggcgta gaggatcc 28

<210>15

<211>31

<212>DNA

<213>人工序列

<220>

<223>N218(大肠杆菌(E.coli)aroA)下游引物

<400>15

cgggatcctc actgattttc aatttcaaca c 31

<210>16

<211>31

<212>DNA

<213>人工序列

<220>

<223>C219(大肠杆菌(E.coli)aroA)下游引物

<400>16

catgccatgg gtcaacaatt tgtcgtaaaa g 31

<210>17

<211>32

<212>DNA

<213>人工序列

<220>

<223>N227(大肠杆菌(E.coli)aroA)下游引物

<400>17

cgggatcctc agccttttac gacaaattgt tg 32

<210>18

<211>31

<212>DNA

<213>人工序列

<220>

<223>N234(大肠杆菌(E.coli)aroA)下游引物

<400>18

cgggatcctc agacaaattg ttgatagtgc t 31

<210>19

<211>31

<212>DNA

<213>人工序列

<220>

<223>N245(大肠杆菌(E.coli)aroA)下游引物

<400>19

cgggatcctc acagcaataa agcgcggtta g 31

<210>20

<211>29

<212>DNA

<213>人工序列

<220>

<223>C228(大肠杆菌(E.coli)aroA)上游引物

<400>20

catgccatgg ggcagtctta tcagtctcc 29

<210>21

<211>28

<212>DNA

<213>人工序列

<220>

<223>C235(大肠杆菌(E.coli)aroA)上游引物

<400>21

catgccatgg gtacttattt ggtcgaag 28

<210>22

<211>32

<212>DNA

<213>人工序列

<220>

<223>N245(大肠杆菌(E.coli)aroA)下游引物

<400>22

cgggatcctc acgaagatgc atcgccttcg ac 32

<210>23

<211>31

<212>DNA

<213>人工序列

<220>

<223>N240(大肠杆菌(E.coli)aroA)下游引物

<400>23

cgggatcctc attcgaccaa ataagtaccc g 31

<210>24

<211>29

<212>DNA

<213>人工序列

<220>

<223>C241(大肠杆菌(E.coli)aroA)上游引物

<400>24

catgccatgg gcgatgcatc ttcggcttc 29

<210>25

<211>31

<212>DNA

<213>人工序列

<220>

<223>pKU2159下游引物

<400>25

gttactcgag ggctgcctgg ctaatccgcg c 31

<210>26

<211>23

<212>DNA

<213>人工序列

<220>

<223>pKU2223下游引物

<400>26

ggaattccat gaactcaact ctc 23

<210>27

<211>25

<212>DNA

<213>人工序列

<220>

<223>pKU2223上游引物

<400>27

cgggatcctc aacgataacg gctcc 25

<210>28

<211>23

<212>DNA

<213>人工序列

<220>

<223>pKU2224上游引物

<400>28

ggaattcaaa tatgtatccg ctc 23

<210>29

<211>26

<212>DNA

<213>人工序列

<220>

<223>pKU2224下游引物

<400>29

cccaagcttg gtctgacagt taccaa 26

<210>30

<211>25

<212>DNA

<213>人工序列

<220>

<223>pKU2225上游引物

<400>30

cccaagcttg atcccaaatg cacgg 25

<210>31

<211>27

<212>DNA

<213>人工序列

<220>

<223>pKU2225下游引物

<400>31

acgaagtcga cgtggcccag ttcatgg 27

<210>32

<211>32

<212>DNA

<213>人工序列

<220>

<223>N67(大肠杆菌(E.coli)aroA)下游引物

<400>32

cttaggatcc tcatgaaagc gtatagctta cc 32

<210>33

<211>32

<212>DNA

<213>人工序列

<220>

<223>N73(大肠杆菌(E.coli)aroA)下游引物

<400>33

gtcaggatcc tcagcaacgc gtacgatcgg ct 32

<210>34

<211>32

<212>DNA

<213>人工序列

<220>

<223>N85(大肠杆菌(E.coli)aroA)下游引物

<400>34

gtcaggatcc tcattctgcg tgtaatggac cg 32

<210>35

<211>33

<212>DNA

<213>人工序列

<220>

<223>N104(大肠杆菌(E.coli)aroA)下游引物

<400>35

cttaggatcc tcatgccgcc agcggacgca ttg 33

<210>36

<211>33

<212>DNA

<213>人工序列

<220>

<223>N154(大肠杆菌(E.coli)aroA)下游引物

<400>36

cgcaggatcc tcactgtaaa cgcaacggcg gat 33

<210>37

<211>31

<212>DNA

<213>人工序列

<220>

<223>N165(大肠杆菌(E.coli)aroA)下游引物

<400>37

cgggatcctc aatcaacgtc aacgttgccg c 31

<210>38

<211>35

<212>DNA

<213>人工序列

<220>

<223>N182(大肠杆菌(E.coli)aroA)下游引物

<400>38

ggcaggatcc tcaaagaggc gcagtcatta acagt 35

<210>39

<211>32

<212>DNA

<213>人工序列

<220>

<223>N184(大肠杆菌(E.coli)aroA)下游引物

<400>39

tccaggatcc tcacggcgca agaggcgcag tc 32

<210>40

<211>32

<212>DNA

<213>人工序列

<220>

<223>N224(大肠杆菌(E.coli)aroA)下游引物

<400>40

cgggatcctc agacaaattg ttgatagtgc tg 32

<210>41

<211>31

<212>DNA

<213>人工序列

<220>

<223>N238(大肠杆菌(E.coli)aroA)下游引物

<400>41

cgggatcctc aagtacccgg agactgataa g 31

<210>42

<211>31

<212>DNA

<213>人工序列

<220>

<223>N259(大肠杆菌(E.coli)aroA)下游引物

<400>42

cgggatcctc aagtgccgcc tttgattgct g 31

<210>43

<211>32

<212>DNA

<213>人工序列

<220>

<223>N298(大肠杆菌(E.coli)aroA)下游引物

<400>43

cgggatcctc aacgcgtgca ggaaatataa tc 32

<210>44

<211>31

<212>DNA

<213>人工序列

<220>

<223>N371(大肠杆菌(E.coli)aroA)下游引物

<400>44

cgggatcctc acggaggagt gatacgaatg t 31

<210>45

<211>35

<212>DNA

<213>人工序列

<220>

<223>N376(大肠杆菌(E.coli)aroA)下游引物

<400>45

ccgtggatcc tcaaaagttc agtttttccg gagga 35

<210>46

<211>27

<212>DNA

<213>人工序列

<220>

<223>C31(大肠杆菌(E.coli)aroA)上游引物

<400>46

catgccatgg cggcattagc acacggc 27

<210>47

<211>29

<212>DNA

<213>人工序列

<220>

<223>C68(大肠杆菌(E.coli)aroA)上游引物

<400>47

tatgccatgg ccgatcgtac gcgttgcga 29

<210>48

<211>31

<212>DNA

<213>人工序列

<220>

<223>C74(大肠杆菌(E.coli)aroA)上游引物

<400>48

tgcaccatgg aaattatcgg taacggcggt c 31

<210>49

<211>31

<212>DNA

<213>人工序列

<220>

<223>C86(大肠杆菌(E.coli)aroA)上游引物

<400>49

tattccatgg gtgccctgga gttgttcctc g 31

<210>50

<211>28

<212>DNA

<213>人工序列

<220>

<223>C105(大肠杆菌(E.coli)aroA)上游引物

<400>50

cggaccatgg ctctttgtct gggtagca 28

<210>51

<211>31

<212>DNA

<213>人工序列

<220>

<223>C155(大肠杆菌(E.coli)aroA)上游引物

<400>51

ttatccatgg gcggctttac tggcggcaac g 31

<210>52

<211>30

<212>DNA

<213>人工序列

<220>

<223>C166(大肠杆菌(E.coli)aroA)上游引物

<400>52

catgccatgg gctccgtttc cagccaattc 30

<210>53

<211>29

<212>DNA

<213>人工序列

<220>

<223>C183(大肠杆菌(E.coli)aroA)上游引物

<400>53

tgagccatgg cgccggaaga tacggtgat 29

<210>54

<211>30

<212>DNA

<213>人工序列

<220>

<223>C185(大肠杆菌(E.coli)aroA)上游引物

<400>54

gcgtccatgg aagatacggt gattcgtatt 30

<210>55

<211>29

<212>DNA

<213>人工序列

<220>

<223>C225(大肠杆菌(E.coli)aroA)上游引物

<400>55

catgccatgg taaaaggcgg gcagtctta 29

<210>56

<211>26

<212>DNA

<213>人工序列

<220>

<223>C239(大肠杆菌(E.coli)aroA)上游引物

<400>56

catgccatgg tcgaaggcga tgcatc 26

<210>57

<211>28

<212>DNA

<213>人工序列

<220>

<223>C246(大肠杆菌(E.coli)aroA)上游引物

<400>57

catgccatgg cttcttactt tctggcag 28

<210>58

<211>29

<212>DNA

<213>人工序列

<220>

<223>C260(大肠杆菌(E.coli)aroA)上游引物

<400>58

catgccatgg taaaagtgac cggtattgg 29

<210>59

<211>29

<212>DNA

<213>人工序列

<220>

<223>C299(大肠杆菌(E.coli)aroA)上游引物

<400>59

catgccatgg gtgaactgaa cgctattga 29

<210>60

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>60

tgagtgactg aaagtgaaag taacaataca g 31

<210>61

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>61

cgggatccct tcttcggaca atgacagac 29

<210>62

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物ppN2083′(BamHI)N208.C209+

<400>62

cgggatcctc agggagtctt caaaccaaac c 31

<210>63

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物ppC2095′(NcoI)N208/C209+

<400>63

catgccatgg agaatcgaaa ctatgaag 28

<210>64

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物ppN2143′(BamHI)N214/C215+

<400>64

cgggatcctc attcatagtt tcgattctcg g 31

<210>65

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物ppC2155′(NcoI)N214/C215+

<400>65

catgccatgg agttttattt caaagccgg 29

<210>66

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物ppN2193′(BamHI)N219/C220++

<400>66

cgggatcctc atttgaaata aaactcttca tag 33

<210>67

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物ppC2205′(NcoI)N219/C220++

<400>67

catgccatgg ccgggaatgt atatgatgaa ac 32

<210>68

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物ppN2223′(BamHI)N222/C223+

<400>68

cgggatcctc aattcccggc tttgaaataa aac 33

<210>69

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物ppC2235′(NcoI)N222/C223+

<400>69

catgccatgg tatatgatga aacgaaaatg 30

<210>70

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物ppN2243′(BamHI)N224/C225++

<400>70

cgggatcctc aatatacatt cccggctttg 30

<210>71

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物ppC2255′(NcoI)N224/C225++

<400>71

catgccatgg atgaaacgaa aatgcaacg 29

<210>72

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物ppN2333′(BamHI)N233/C234

<400>72

cgggatcctc aggtgtatcg ttgcattttc g 31

<210>73

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物ppC2345′(NcoI)N233/C234

<400>73

catgccatgg tagaaggcga ctggagcg 28

<210>74

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物ppN2343′(BamHI)N234/C235

<400>74

cgggatcctc atacggtgta tcgttgcatt ttc 33

<210>75

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物ppC2355′(NcoI)N234/C235

<400>75

catgccatgg aaggcgactg gagcggtgg 29

<210>76

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物ppN2363′(BamHI)N236/C237

<400>76

cgggatcctc agccttctac ggtgtatcgt tg 32

<210>77

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物ppc2375′(NcoI)N236/C237

<400>77

catgccatgg actggagcgg tggtgcttt 29

<210>78

<211>1284

<212>DNA

<213>大肠杆菌(Escherichia coli)

<220>

<221>CDS

<222>(1)..(1284)

<223>

<400>78

atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att 48

Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile

1 5 10 15

aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg 96

Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala

20 25 30

gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat 144

Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp

35 40 45

gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat 192

Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr

50 55 60

acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt 240

Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly

65 70 75 80

cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga 288

Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

85 90 95

acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat 336

Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

100 105 110

att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat 384

Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His

115 120 125

ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa 432

Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu

130 135 140

caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc 480

Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly

145 150 155 160

aac gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg 528

Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu

165 170 175

tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa 576

Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys

180 185 190

ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg 624

Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met

195 200 205

aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc 672

Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val

210 215 220

gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa 720

Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu

225 230 235 240

ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa 768

Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys

245 250 255

ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt 816

Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly

260 265 270

gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc 864

Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys

275 280 285

tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att 912

Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile

290 295 300

gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg 960

Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr

305 310 315 320

gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac 1008

Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn

325 330 335

tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg 1056

Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

340 345 350

cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc 1104

Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile

355 360 365

act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat 1152

Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp

370 375 380

cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca 1200

His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro

385 390 395 400

gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ecg gat tat 1248

Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

405 410 415

ttc gag cag ctg gcg cgg att agc cag gca gcc tga 1284

Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

420 425

<210>79

<211>427

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>79

Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile

1 5 10 15

Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala

20 25 30

Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp

35 40 45

Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr

50 55 60

Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly

65 70 75 80

Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

85 90 95

Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

100 105 110

Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His

115 120 125

Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu

130 135 140

Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly

145 150 155 160

Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu

165 170 175

Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys

180 185 190

Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met

195 200 205

Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val

210 215 220

Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu

225 230 235 240

Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys

245 250 255

Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly

260 265 270

Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys

275 280 285

Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile

290 295 300

Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr

305 310 315 320

Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn

325 330 335

Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

340 345 350

Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile

355 360 365

Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp

370 375 380

His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro

385 390 395 400

Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

405 410 415

Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

420 425

Claims

1.5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段，其是选自EPSPS的蛋白片段对的一种片段，组成所述片段对的两种片段可以连接成全长EPSPS，并且这两种片段不借助任何连接结构可以通过互补而重建EPSPS活性。

2.权利要求1的片段，其中所述片段对的分割点位于EPSPS的选自下列的结构中：折叠单元之间的连接区中、α螺旋与β折叠之间的连接区中、两个β折叠之间、β折叠中、或α螺旋中，优选位于折叠单元之间的连接区中。

3.权利要求1或2的片段，其中所述EPSPS是野生型EPSPS或其添加、缺失、和/或取代一或多个氨基酸残基所得的EPSPS活性变体，优选是大肠杆菌野生型EPSPS或其草甘膦抗性EPSPS活性变体，或者优选是恶臭假单胞菌草甘膦抗性EPSPS。

4.权利要求1的片段，其是选自大肠杆菌EPSPS的以下片段对的一种片段：N67/C68，N85/C86，N104/C105，N154/C155，N182/C183，N184/C185，N218/C219，N224/C225，N227/C228，N259/C260，N298/C299，N371/C372，N376/C377，N383/C384，或是选自恶臭假单胞菌CGMCC 0739 EPSPS的以下片段对的一种片段：N208/C209，N214/C215，N219/C220，N222/C223，N224/C225。

5.一种核酸分子，其编码权利要求1-4之一的蛋白片段。

6.一种表达载体，其携带权利要求5所述核酸分子。

7.一种细胞，其包含权利要求5所述核酸分子，或者权利要求6所述表达载体。

8.一种重建EPSPS的方法，包括在无任何连接结构存在的条件下，利用权利要求1-4之一的蛋白片段，或权利要求5的核酸分子，或权利要求6的表达载体来重建EPSPS活性。

9.一种拆分EPSPS或EPSPS核酸分子的方法，包括在无任何连接结构存在的条件下，拆分出权利要求1-4之一所述的蛋白片段，或权利要求5所述的核酸分子。