CN1789412A - 利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性 - Google Patents

利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性 Download PDF

Info

Publication number
CN1789412A
CN1789412A CN200410102289.4A CN200410102289A CN1789412A CN 1789412 A CN1789412 A CN 1789412A CN 200410102289 A CN200410102289 A CN 200410102289A CN 1789412 A CN1789412 A CN 1789412A
Authority
CN
China
Prior art keywords
epsps
fragment
aroa
ala
plasmid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200410102289.4A
Other languages
English (en)
Other versions
CN1789412B (zh
Inventor
王忆平
孙义成
李燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN200410102289.4A priority Critical patent/CN1789412B/zh
Priority to AT05819606T priority patent/ATE486127T1/de
Priority to DE602005024442T priority patent/DE602005024442D1/de
Priority to EP05819606A priority patent/EP1840210B1/en
Priority to US11/721,856 priority patent/US8936925B2/en
Priority to PCT/CN2005/002219 priority patent/WO2006063533A1/zh
Publication of CN1789412A publication Critical patent/CN1789412A/zh
Application granted granted Critical
Publication of CN1789412B publication Critical patent/CN1789412B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • C12N9/10923-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段,其选自EPSPS的蛋白片段对,组成所述片段对的两种片段可以连成全长EPSPS,并且这两种片段不借助任何连接结构可以通过互补而重建EPSPS活性。本发明还涉及编码所述蛋白片段的核酸分子,包含该核酸分子的表达载体和细胞。本发明还涉及利用本发明的片段或核酸分子或表达载体重建EPSPS活性的方法,以及拆分出本发明蛋白片段的方法。

Description

利用片段互补技术重建 5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性
技术领域
本发明涉及利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合酶(5-enolpyruvyl-shikimate-3-phosphate synthase,EPSPS)活性的方法。更具体地,本发明涉及大肠杆菌EPSPS及其突变后获得的草甘膦抗性EPSPS的重建,本发明还涉及恶臭假单胞菌草甘膦抗性EPSPS的重建。
背景技术
随着转基因植物的大规模种植,转基因植物的生物安全控制(biologicalconfinement)越来越受到关注。Wruad等.Proc Natl Acad Sci USA2004,101,(40),14533-8观测到抗草甘膦的CP4EPSPS的编码基因可以从转基因植物中传播到20公里以外的作物中,甚至传播到杂草中,因此对转基因植物实行生物安全控制对于防止超级杂草等的产生十分必要。
转基因植物外源基因扩散的方式主要有以下几种:转基因植物花粉的传播,转基因植物作为野生亲缘种花粉的受体形成杂种,转基因植物的DNA可能造成的基因扩散。目前有了一些控制转基因植物外源基因扩散的方法,例如,(1)物理隔离,主要是距离隔离以便阻断外源基因通过花粉的扩散;(2)遗传控制,包括:(a)雄性不育(male sterility);(b)基因组不相容性(Genomeincompatibility),即将特定的外源基因整合到作物的与杂草不相容的基因组上;(c)母系遗传(maternal inheritance),其将外源基因转入植物的叶绿体中,使这些基因进行母系遗传,因此不会通过花粉的传播而扩散入其它物种,该方法在烟草上已经取得了初步的成功(Daniell等,Nat Biotechnol 1998,16,(4),345-8);(d)种子不育(seed sterility);(e)Transgenic mitigation(TM),利用与目的基因紧密连锁、对于转基因植物有利或中性、而对于野草生存不利(如防止种子散落和降低种子二次休眠等)的TM基因防止超级杂草(superweed)的产生。
Ye,G.N.等.Plant J2001,25,(3),261-70和Chin,H.G.等Proc Natl AcadSci USA2003,100,(8),4510-5提出了一种新的控制抗草甘膦转基因的方法,其将EPSPS基因分成两段,使之分别与表达DnaE内含肽(intein)的基因串联并共表达,利用内含肽的自我拼接功能形成完整的EPSPS,从而使大肠杆菌或烟草获得对草甘膦的耐受性。但是内含肽编码基因本身作为外源基因被引入转基因植物也可能会引发其它的风险,例如成为被扩散的转基因等。
蛋白酶消化产生或者通过基因表达生成的蛋白质片段可以在体内或体外重建成具有完整蛋白功能的复合体,这被称之为蛋白质片段互补(proteinfragment complementation)或蛋白重建(protein reconstitution)技术(例如,Hakansson,M.等.Curr Protein Pept Sci2002,3,(6),629-42;Braun,M.等.JBacteriol2003,185,(18),5508-18.)。对氨酰tRNA合成酶等蛋白进行的片段互补研究表明,发生片段互补的蛋白片段分拆位点大多发生在非保守区域。蛋白能够重建意味着该蛋白内的非共价作用十分特异,从而使蛋白片段有利于形成的天然的结构(Shiba,K.等.Proc Natl Acad Sci USA1992,89,(5),1880-4;Shiba,K.等.J Biol Chem1992,267,(32),22703-6)。此外,蛋白能够发生片段互补表明,即使共价键断开,该蛋白仍能保持比较稳定的结构。两个发生片段互补的肽链之间存在的各种非共价作用(如氢键、盐桥及疏水作用)在保持蛋白结构稳定方面起着很大的作用(Nelson,K.E.等,Completegenome sequence and comparative analysis of the metabolically versatilePseudomonas putida KT2440.Environ Microbiol2002,4,(12),799-808)。
我们利用这种蛋白重建技术在体内和体外重建了有活性的EPSPS,对草甘膦具有耐受性的EPSPS也可以通过这种方法重建。EPSPS的片段互补可用于转基因植物从而增加转基因植物安全性,降低超级杂草形成的可能性。
发明概述
本发明涉及5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段,其是选自EPSPS片段对的一种片段,组成所述片段对的两种片段可以连接成全长EPSPS,并且这两种片段不借助任何连接结构可以通过互补而重建EPSPS活性。优选,所述片段对的分割点位于EPSPS的选自下列的结构中:折叠单元之间的连接区中、α螺旋与β折叠之间的连接区中、两个β折叠之间、β折叠中、或α螺旋中,优选位于折叠单元之间的连接区中,例如,在折叠单元1和6,2和6,3和4,4和5,以及3和5之间的连接区中;更优选该分割点是在折叠单元1,2,3,4,或5的内部,例如,在折叠单元3的两个β折叠之间的连接区中,在折叠单元4的α螺旋中,在折叠单元2的β折叠中,在折叠单元1的α螺旋与β折叠之间,在折叠单元5的α螺旋和β折叠之间的连接区中,或者在折叠单元5的两个β折叠之间的连接区中,或者在折叠单元5的β折叠中。
在本发明的实施方案中,所述EPSPS是野生型EPSPS或其添加、缺失、和/或取代一或多个氨基酸残基所得的EPSPS活性变体,优选是大肠杆菌野生型EPSPS(其全长氨基酸序列和核苷酸序列是本领域已知的,可以参见序列表)或其草甘膦抗性EPSPS活性变体,或者优选是恶臭假单胞菌(Pseudomonas putida)草甘膦抗性EPSPS,例如恶臭假单胞菌CGMCC0739(参见中国专利申请02117991.3)的EPSPS(其全长氨基酸序列和核苷酸序列见SEQ ID NO:2)。
更具体地,本发明的蛋白片段优选是选自大肠杆菌EPSPS的以下片段对的一种片段:N67/C68,N85/C86,N104/C105,N154/C155,N182/C183,N184/C185,N218/C219,N224/C225,N227/C228,N259/C260,N298/C299,N371/C372,N376/C377,N383/C384(这里所述的N67/C68片段对,表示由N端片段N67和C端片段C68所组成的片段对,其中N67是指EPSPS序列中从N末端到第67位残基之间的N端片段,C68是指EPSPS序列中从第68位残基到C末端之间的C端片段。其它片段对表示法依此类推),或优选是选自恶臭假单胞菌CGMCC0739的EPSPS的以下片段对的一种片段:N208/C209,N214/C215,N219/C220,N222/C223,N224/C225(这里所述的N208/C209片段对表示由N端片段N208和C端片段C209所组成的片段对,其中N208是指EPSPS序列中从N末端到第208位残基之间的片段,C209是指EPSPS序列中从第209位残基到C末端之间的片段,其它片段对表示法依此类推)。
本发明还涉及编码本发明所述蛋白片段的核酸分子,携带该核酸分子的表达载体,包含所述核酸分子或表达载体的细胞。优选所述细胞是植物细胞。本发明还涉及包含本发明所述核酸分子或表达载体的转基因植物或其种子。
本发明还涉及一种重建EPSPS的方法,该方法包括在无任何连接结构存在的条件下,利用本发明的蛋白片段或核酸分子或表达载体来重建EPSPS活性。
本发明还涉及一种拆分EPSPS或EPSPS核酸分子的方法,包括在无任何连接结构存在的条件下,拆分出本发明的蛋白片段,或核酸分子。该方法中所选择的拆分点优选位于EPSPS的下列结构中:折叠单元之间的连接区中、α螺旋与β折叠之间的连接区中、两个β折叠之间、β折叠中、或α螺旋中,优选位于折叠单元之间的连接区中,例如,在折叠单元1和6,2和6,3和4,4和5,以及3和5之间的连接区中。更优选在折叠单元1,2,3,4,或5的内部,例如,折叠单元3的两个β折叠之间的连接区中,折叠单元4的α螺旋中,折叠单元2的β折叠中,折叠单元1的α螺旋与β折叠之间,折叠单元5的α螺旋和β折叠之间的连接区中,或者折叠单元5的两个β折叠之间的连接区中,或者在折叠单元5的β折叠中。还更优选位于选自下列的位置之间:大肠杆菌EPSPS的67-68、85-86、104-105、154-155、182-183、184-185、218-219、N224-C225、N227-C228、259-260、298-299、371-372、376-377、或383-384位置之间,或恶臭假单胞菌CGMCC 0739的草甘膦抗性EPSPS的208-209、214-215、219-220、222-223、或224-225位置之间。
本发明还涉及本发明所述的EPSPS片段或重建EPSPS活性的方法或拆分EPSPS的方法在控制转基因植物安全性方面的应用。
发明内容
本发明人基于EPSPS的结构,在有可能不影响EPSPS酶活性的结构区域中设计了分拆位点。本发明人还构建了表达EPSPS拆分片段的表达载体,并证明EPSPS片段在大肠杆菌体内可以互补EPSPS活性。因此,本发明的EPSPS片段以及重建EPSPS的方法可以应用于生物安全控制领域。
EPSPS及其结构
5-烯醇丙酮酰莽草酸-3-磷酸合成酶(EPSPS)是芳香族氨基酸合成-莽草酸合成途径中的关键酶,存在于藻类、高等植物、细菌、真菌及寄生虫的apicomplexan中,它催化一分子的莽草酸-3-磷酸(S3P)和磷酸烯醇式丙酮酸(PEP)生成5-烯醇式丙酮酸莽草酸-3-磷酸(EPSP)。
如图2所示,EPSPS由两个结构域组成,其中一个结构域包括标示为1,2和6的三个对称的蛋白折叠单元,另一个结构域包括标示为3,4和5的三个对称的蛋白折叠单元。每个单元由两个平行的α螺旋和四个β折叠组成。参见Stallings,W.C.等.Proc Natl Acad Sci USA1991,88,(11),5046-50。
已知EPSP合酶在无酶底物时,形成“开放”(open)构象,而与S3P、草甘膦+S3P形成复合物晶体结构时,“开放”构象转换成“闭合”(close)构象(Schonbrunn,E.等.Proc Nat Acad Sci USA2001,98,(4),1376-80)。Mcdowell等(J Biomol NMR2004,28,(1),11-29,2004)利用rotational-echodouble-resonace NMR技术,结合EPSP合酶与S3P和草甘膦复合体的晶体结构,对其进行调整,得到符合液体NMR结果的三维结构。
通过化学修饰、基因突变、结构分析等各种方法,EPSP合酶中底物的结合位点和催化位点的研究现在已经比较深入(Schonbrunn,E.等,出处同上;Mcdowell等,出处同上;Anderson,K.S.等.J Biol Chem 1990,265,(10),5567-72;Huynh,Q.K.等J Biol Chem 1988,263,(24),11636-9;Huynh,Q.K.等JBiol Chem 1988,263,(2),735-9;Padgette,S.R.等JBiol Chem 1988,263,(4),1798-802;Padgette,S.R.等Arch Biochem Biophys1988,266,(1),254-62;Eschenburg,S.等J Biol Chem2003,278,(49),49215-22;Mizyed,S.等Biochemistry 2003,42,(23),6986-95;Shuttleworth,W.A.等Biochemistry 1994,33,(23),7062-8;Shuttleworth,W.A.等Arch Biochem Biophys1996,334,(1),37-42;Shuttleworth,W.A.等Biochemistry1999,38,(1),296-302;Stauffer,M.E.等Biochemistry 2001,40,(13),3951-7;Stauffer,M.E.等FEBS Lett 2001,499,(1-2),182-6;McDowell,L.M.等Biochemistry 2004,43,(21),6606-11)。
此外,Schonbrunn等提出Lys-22,Arg-124,Asp-313,Arg-344,Arg-386和Lys-411参与PEP结合,Arg-27等参与S3P结合,Arg-100,Asp-242和Asp-384在酶结合底物由开放构象转换成闭合构象时起着重要作用(Proteins2000,40,(2),290-8;Biochemistry2000,39,(9),2164-73;Proc Natl Acad Sci USA2000,97,(12),6345-9)。
拆分位点的选择
本发明人基于EPSPS的结构,在有可能不影响EPSPS酶活性的结构区域中设计了分拆位点。
当分拆位点位于蛋白折叠单元之间时,共价键的断裂和甲硫氨酸的插入一般不会影响蛋白质天然结构的形成。分拆的蛋白片段依靠蛋白内的非共价作用及两个肽链之间存在各种非共价作用如氢键、盐桥及疏水作用等形成天然的蛋白结构,从而可以重建蛋白功能。分拆位点位于折叠单元之间,互补片段二级结构的形成一般不会被影响,因此更容易发生片段互补。在实施方案中,大肠杆菌EPSPS有7个分拆位点位于折叠单元之间的连接区域中,分拆产生的蛋白片段有6对可以互补形成EPSPS活性,而且它们的互补活性都比较好。恶臭假单胞菌有3个分拆位点在折叠单元之间的连接区域中,所形成的3对片段都可以互补EPSPS活性。
当分拆位点位于α螺旋与/或β折叠之间的连接区域时,共价键的断裂一般不会影响到α螺旋或β折叠的形成,而甲硫氨酸的插入对天然结构的形成的影响一般也没有那么明显,因而此时片段互补容易发生。在实施方案中,大肠杆菌EPSPS有6个分拆位点位于α螺旋与β折叠之间的连接区域中,其中有5对片段可以互补EPSPS活性;另有1个分拆位点位于β折叠之间的连接区域中,相应片段也可以互补EPSPS活性。恶臭假单胞菌有1个分拆位点在β折叠中,所形成的片段可以互补EPSPS活性。
当分拆位点位于α螺旋或β折叠中时,只要α螺旋或β折叠可以忍受共价键的断裂和甲硫氨酸的插入,或者此处的α螺旋或β折叠对蛋白的整体功能并不是十分重要,则EPSPS的片段也可以通过片段互补来重建蛋白活性。在实施方案中,大肠杆菌EPSPS有7个分拆位点位于α螺旋或β折叠中,其中有3对片段可以互补EPSPS活性。恶臭假单胞菌有1个分拆位点在β折叠中,所形成的片段可以互补EPSPS活性。
当EPSPS在两个结构域中间分拆时,大肠杆菌EPSPS的N端肽链N240和C端肽链C241可以形成复合体而被共纯化出来。但是该复合体酶活性很低,这可能是N240/C241复合体中只有一对疏水作用区域相互作用,因此蛋白结构不稳定。恶臭假单胞菌有在两个结构域之间测试了3个分拆位点,所形成的片段都基本不能互补EPSPS活性。因此,本发明人在EPSPS的结构域之间连接区中进行分拆,所得片段没有能够重建出EPSPS活性。
总之,本发明人在大肠杆菌EPSPS中成功实施了14个拆分点,其中6个在折叠单元之间的连接区中,3个在α螺旋与β折叠之间的连接区中,2个在β折叠之间的连接区中,2个在β折叠中,1个在α螺旋中。通过在这些拆分点进行拆分,大肠杆菌EPSPS的基因被分拆为N片段和C片段。将相互对应的N片段和C片段分别在两种相容的质粒上表达。如此得到的N片段和C片段单独都不表现EPSPS活性,但在体内,相应的N片段和C片段结合可以互补EPSPS活性。
类似地,在另外的实施方案中,本发明人在恶臭假单胞菌草甘膦抗性EPSPS中成功实施了5个拆分点,其中3个在折叠单元之间的连接区中,1个在α螺旋与β折叠之间的连接区中,1个在β折叠中。如此拆分所得到的片段同样可以互补EPSPS活性。
EPSPS的活性能够通过片段互补而重建,这意味着该蛋白内的非共价作用十分特异,从而使片段有利于形成天然的具有EPSPS功能的结构,而不会形成其它的结构。此外该蛋白能够发生片段互补,这表明,断开一些区域中的共价键时,该蛋白仍旧可以保持结构稳定性,两个肽链之间不必通过共价键,而仅通过各种非共价作用如氢键、盐桥及疏水作用等紧密结合在一起。在EPSPS的片段互补中,疏水作用可能起着更大的作用。EPSPS的两个片段之间存在很强的两对疏水作用区域,形成两个“钩子”将蛋白稳定在一起。
本发明共纯化得到了多个由相对应的拆分片段组成的复合体,但是纯化出的蛋白量却有很大的差异,这说明片段互补在体内都可以形成,但是复合体形成的难易程度是不同的。有些区域共价键的断裂对蛋白结构的稳定性影响比较大,有些区域共价键的断裂对蛋白结构的稳定性影响比较小。C端肽链引入一个甲硫氨酸(起始密码子所编码的氨基酸)也有可能影响蛋白结构的稳定性,从而导致蛋白片段互补不能发生。
大肠杆菌EPSPS的复合体N240/C241也可以被大量的共纯化出,但是它却不能互补大肠杆菌aroA基因突变菌株AB2829在限制性培养基上的生长,这是由于复合体N240/C241的EPSPS的活性远低于野生型全长EPSPS。其活性的丢失可能有以下两个原因:一是N240/C241的分拆位点与Asp242十分接近,Asp242在结合底物引发结构变构过程中起着非常重要的作用,在C241中引入一个甲硫氨酸可能会影响到Asp242的功能从而使其酶活性丧失;第二个原因可能是N240/C241的分拆位点位于两个结构域的中间,其形成的复合体中只有一对疏水作用区域,虽然它们之间的疏水作用足以使两个蛋白片段形成复合体,但由于缺少另外一对疏水区域,这个复合体的结构可能与野生蛋白的结构有所不同,从而使酶活性丧失。因此,对分拆位点的选择应基于结构变化对酶活性的影响来考虑。
EPSP合酶的在植物细胞中的定位
Bickel等(Phytochemistry17:119-124,1978)发现,植物的芳香族氨基酸在叶绿体内进行合成。Mousdale等随后证明,植物的EPSP合酶定位于叶绿体内膜上(Planta,1987,170:1~6;Plant Physiol.,1987,83:229~231;J Biol Chem1988 Oct 15;263(29):15104-9;Mol Gen Genet 1994 Dec1;245(5):616-22;MolGen Genet 1993 Jun;239(3):416-24)。Della-Cioppa等(Bio/Technology 1987(5):579~584)的实验表明矮牵牛前体EPSP合酶(precursor EPSPS)分子量为55kDa,前72氨基酸残基为前导肽,当前体EPSP合酶进入叶绿体后经加工剪切运输肽而成为成熟EPSP合酶(mature enzyme),成熟EPSP合酶分子量为48kDa。前导肽对前体EPSP合酶进入叶绿体起着重要作用,微生物EPSP合酶因无前导肽,故用微生物EPSP合酶基因在转入植物细胞中时其基因前端需加上植物前导肽序列,否则其表达的EPSP合酶不能进入叶绿体。
应用
本发明的EPSPS片段互补技术可应用于转基因植物,以防止抗草甘膦基因的扩散带来的生态风险。例如,将EPSPS的N端片段在植物核染色体中表达,而将其C端片段在植物的叶绿体中表达。单独表达的一种EPSPS片段都不具有EPSPS的活性,因此其基因扩散没有选择优势。当两种片段的基因共同表达时,两个EPSPS片段可以在叶绿体中发生互补而重建EPSPS活性,从而使植物对草甘膦产生抗性。也可以将编码两个EPSPS片段的基因插入叶绿体基因组的不同位置,在这种情况中,两种基因共同转移到染色体上的概率大大降低,从而降低转基因扩散发生的概率。关于控制植物中细胞过程的方法可参见WO2004/046359和WO2004/046360。
附图说明
图1显示pKU2004的质粒图谱。
图2EPSPS的结构示意图及分拆位点的选择。图2A为EPSP合酶的拓扑结构,图2B为EPSP合酶的一个结构单元。
图3:质粒构建示意图。A.将EPSPS的C-末端片段亚克隆到pKU2100载体的Tet启动子之后。B.将EPSPS的N-末端亚克隆到pACYC184载体的Tet启动子之后。C.将EPSPS编码基因的N-末端部分亚克隆到衍生于pACYC184的质粒载体的T7启动子之后。D.将EPSPS的C-末端部分构建到pET28a载体中,并且在C-末端尾部带有6个His组成的标签。
图4:EPSPS片段的蛋白免疫印迹分析。将表达所示EPSPS的细胞溶于SDS样品缓冲液中,经SDS-PAGE和免疫印迹来分析等量蛋白(来自~0.8μg湿重的细胞)和纯化的蛋白。图中示出了以下纯化蛋白的量:N218/C219(来自~150ml湿重的细胞),N227/C228(来自~20μg湿重的细胞),N234/C235(来自~500μg湿重的细胞),N240/C241(来自~40μg湿重的细胞),N245/C246(来自~500μg湿重的细胞)和pACYC184/pBR322(来自~500μg湿重的细胞)。标准分子量的位置示于图左,单位为千道尔顿(kd)。
图5.EPSPS的圆二色性光谱分析。系列1为野生EPSPS,系列2为N227/C228复合体。
图6:表达有不同EPSPS的大肠杆菌aroA基因缺陷菌株AB2829,在限制性培养基(即添加了所示浓度的草甘膦的液体M63基本培养基)中的生长情况。
图7a大肠杆菌EPSPS的SDS-PAGE电泳图。1:N218;2:C219;3:EcEPSPS;4:共复性N218+c219;5:N218+c219(单独复性后一起);6:分子量标准。
图7b大肠杆菌EPSPS的native-PAGE电泳Western印迹图。1:N218+C219(单独复性后一起);2:空白对照;3:共复性N218/C219;4:空白对照;5:野生型EPSPS。
具体实施方式
实施例1大肠杆菌EPSPS的重建
1材料与方法
1.1菌株与质粒
用于本实验的菌株和质粒列在表1中。
表1.用于本研究中的细菌菌株和质粒
  菌株/质粒   相关特点   来源/参考文献
  大肠杆菌菌株
  DH5α   supE44ΔlacU169hsdR17recA1gyrA96thi-1re1A1   Hanahan D.,J Mol Biol1983;166:557-80
  AB2829   aroA354   耶鲁大学
  Bl21(DE3)   stragene
  BA-   BL21(DE3).aroA,ApR   本工作
  质粒
  pUC18   ColE1,lacZ’,ApR   Norrander等,1983
  pBluscript-SK   ColE1,lacZ’,ApR   Stratagene
  pET-28a   ColE1,表达质粒,KmR   Novagen
  pACYC184   CmR   Chang,A.C.等1978.JBacteriol 134:1141-56
  pBR322   ColE1,ApR   schaeffer,F.等,1982EMBO J.1.99-105
  pKO3   CmR   Link,A.J.等1997.J.Bacteriology179:6228-6237
  pKU2005   pUC18衍生质粒,带有aroAE.coli,ApR   本工作
  pKU2006   pACYC184衍生质粒,带有aroAE.coli,CmR   本工作
  pKU2007   pACYC184衍生质粒,带有aroAE.coli-G96A,CmR   本工作
  pKU2008   pET-28a衍生质粒,带有E.coli aroA,KmR   本工作
  pKU2009   pET-28a衍生质粒,带有E.coli aroA,KmR   本工作
  pKU2010   pET-28a衍生质粒,带有E.coli aroA-G96A,KmR   本工作
  pKU2011   pET-28a衍生质粒,带有E.coli aroA-G96A,KmR   本工作
  pKU2100   PBR322衍生质粒,带有aroAE.coli,ApR   本工作
  pKU2101   pACYC184衍生质粒,带有N218-aroAE.coli,CmR   本工作
  pKU2102   pBR322衍生质粒,带有C219-aroAE.coli,ApR   本工作
  pKU2107   pBR322衍生质粒,带有aroAE.coli-G96A,ApR   本工作
  pKU2110   pACYC184衍生质粒,带有N245-aroAE.coli,CmR   本工作
  pKU2125   pBR322衍生质粒,带有C228-aroAE.coli,ApR   本工作
  pKU2126   pBR322衍生质粒,带有C235-aroAE.coli,ApR   本工作
  pKU2127   pET-28a衍生质粒,带有N218-E.coli aroA,KmR   本工作
  pKU2130   pBR322衍生质粒,带有C246-aroAE.coli,ApR   本工作
  pKU2137   pACYC184衍生质粒,带有N234-aroAE.coli,CmR   本工作
  pKU2138   pACYC184衍生质粒,带有N227-aroAE.coli,CmR   本工作
  pKU2154   pBluscript-SK衍生质粒,带有aroAE.coli,ApR   本工作
  pKU2159   pET-28a衍生质粒,带有E.coli aroA,KmR   本工作
  pKU2195   pBluscript-SK衍生质粒,带有C219-aroAE.coli,ApR   本工作
  pKU2203   pET-28a衍生质粒,带有N218-E.coli aroA,KmR   本工作
  pKU2205   pET-28a衍生质粒,带有C218-E.coli aroA,KmR   本工作
  pKU2223   pBluscript-sK衍生质粒,带有aroAE.coli上游部分序列   本工作
  pKU2224   pBluscript-SK衍生质粒,带有bla基因   本工作
  pKU2225   pBluscript-sK衍生质粒,带有aroAE.coli下游序列   本工作
  pKU2227   pBluscript-SK衍生质粒,带有aroAE.coli上下游序列   本工作
  pKU2228   pBluscript-SK衍生质粒,带有aroAE.coh上下游序列及bla基因   本工作
  pKU2229   pKO3衍生质粒,带有aroAE.coli上下游序列及bla基因   本工作
  pKU2249   pET-28a衍生质粒,带有N245-E.coli aroA,KmR   本工作
  pKU2250   pET-28a衍生质粒,带有C246-E.coli aroA,KmR   本工作
  pKU2249   pET-28a衍生质粒,带有N245-E.coli aroA,KmR   本工作
  pKU2249   pET-28a衍生质粒,带有N245-E.coli aroA,KmR   本工作
  pKU2249   pET-28a衍生质粒,带有N245-E.coli aroA,KmR   本工作
  pKU2262   pACYC184衍生质粒,带有N240-aroAE.coli,CmR   本工作
  pKU2263   pBR322衍生质粒,带有C241-aroAE.coli,ApR   本工作
  pKU2266   pET-28a衍生质粒,带有N240-E.coli aroA,KmR   本工作
  pKU2267   pACYC184衍生质粒,带有T7启动子及N218-aroAE.coli,CmR   本工作
  pKU2268   pACYC184衍生质粒,带有T7启动子及N240-aroAE.coli,CmR   本工作
  pKU2269   pET-28a衍生质粒,带有N227-E.coli aroA,KmR   本工作
  pKU2274   pACYC184衍生质粒,带有T7启动子及N227-aroAE.coli,CmR   本工作
  pKU2275   pACYC184衍生质粒,带有T7启动子及N234-aroAE.coli,CmR   本工作
  pKU2276   pET-28a衍生质粒,带有C228-E.colj aroA,KmR   本工作
  pKU2277   pET-28a衍生质粒,带有C235-E.coli aroA,KmR   本工作
  pKU2278   pET-28a衍生质粒,带有C241-E.coli aroA,KmR   本工作
  pKU2282   pET-28a衍生质粒,带有C246-E.coli aroA,KmR   本工作
  pKU2283   pET-28a衍生质粒,带有C219-E.coli aroA,KmR   本工作
  pKU2287   pACYC184衍生质粒,带有T7启动子及N240-aroAE.coli,CmR   本工作
  pKU2289   pACYC184衍生质粒,带有T7启动子及N245-aroAE.coli,CmR   本工作
Ap,氨卞青霉素;Cm,氯霉素;Km,卡那霉素;R,抗性;,删除;∷,融合;
1.2培养基
LB培养基:每升所含成分:
胰蛋白胨            10g
酵母提取物          5g
NaCl                10g
补足水并用2M的NaOH调至pH7.0~7.5左右,固体培养基加1.5%的琼脂粉。使用前15磅压力,121℃高温灭菌20min后备用。
筛选氨苄青霉素抗性菌株在培养基中加Ap至50μg/ml。
筛选卡那霉素抗性菌株在培养基中加Km至25μg/ml。
筛选氯霉素抗性菌株在培养基中加Cm至25μg/ml。
限制性M63培养基:13.6g/L  KH2PO4,0.5mg/L FeSO4-7H2O,20mM(NH4)2SO4,0.4%葡萄糖,1mM硫酸镁,0.5mg/L维生素B1。
1.3试剂
限制性内切酶,T4DNA连接酶,TaqDNA聚合酶,DNA marker等购于Takara生物公司。考马斯亮蓝G250,烯醇式丙酮酸(sigma),莽草酸-3-磷酸(Amrehin教授赠送);HisTrap HP kit(Amersham Biosciences),羊抗兔IgG(promega);其余化学药品均为分析纯试剂。
1.4遗传学操作
质粒DNA的制备、限制性内切酶的消化、连接反应、Tris-硼酸-EDTA缓冲液水平琼脂糖电泳、聚丙烯酰胺凝胶电泳及western杂交等按照标准方法(Molecular Cloning:A Laboratory Manual,2nd edition.(Sambrook,Fritschand Maniatis,eds.),Cold Spring Harbor Laboratory Press,1989)进行。
1.5质粒构建
a.pKU2008、pKU2009的构建
用引物11:5’-CGGGATCCAGGTCCGAAAAAAAACGCCGAC3’和引物12:5’-CGGGATCCATGGAATCCCTGACGTTACA3’以pKU2004为模板,对大肠杆菌的aroA基因进行扩增,连入pET28a载体得到pKU2008,该质粒编码的EPSPS为N端带有His标签的融合蛋白。将pKU2008用NcoI酶切,自我连接得到pKU2009,该质粒编码的蛋白为大肠杆菌野生型EPSPS。
b.pKU2100系列质粒(编码EPSPS的C端肽链)的构建
用引物13:5’-TGAGTGACTGACTTTAAGAAGGAGATATAC3’和引物14:5-CGGGATCCTCACTGATTTTCAATTTCAACAC3’以pKU2009为模板进行PCR扩增,扩增产物经BamHI酶切连入pBR322的EcoR V和BamHI位点,得到质粒pKU2100。以pKU2009为模板,分别以对应引物进行扩增得到编码大肠杆菌EPSPS的C端的基因,将扩增产物连接入pKU2100的NcoI和BamHI位点,分别得到质粒pKU2102、pKU2125、pKU2126、pKU2130和pKU2262,这些质粒分别编码大肠杆菌EPSPS的C端肽链(表1,图3)。
c.pACYC184系列质粒(编码EPSPS的N端肽链)的构建
以pKU2009为模板,分别以对应引物进行PCR扩增,得到编码大肠杆菌EPSPS的N端的基因,将扩增产物连接入pACYC184的EcoR V和BamHI位点,分别得到质粒pKU2101、pKU2125、pKU2126、pKU2130和pKU2263,这些质粒分别编码大肠杆菌EPSPS的N端氨基酸序列(表1,图3)。
d.pET28a系列表达质粒的构建
将上述b步骤中构建的pBR322系列质粒和c步骤中构建的pACYC184系列质粒分别用NcoI和BamHI酶切,回收合适片段连接入pET28a载体中,得到用于表达EPSPS的N端和C端的pET28a系列表达质粒(表1)。
e.pACYC-T7系列表达质粒的构建
将用于表达EPSPS的N端的pET28a质粒分别用BglII和SalI酶切,回收所需片段连接入pACYC184载体的BamHI和salI位点得到pACYC-T7系列表达质粒(表1,图3)。
f.pET28a系列表达质粒(用于表达C端His-taq融合蛋白)的构建
以pKU2009为模板,分别以对应引物进行扩增得到编码大肠杆菌EPSPS相应部分的基因,将扩增产物用XhoI和NcoI酶切后连接入pET28a载体中得到pET28a系列表达质粒,该系列质粒所编码的EPSPS的C端融合有6个组氨酸以便于利用镍柱纯化蛋白(图3)。
g.用于菌株突变的质粒pKU2229的构建
以大肠杆菌BL21(DE3)的染色体为模板,用引物进行PCR扩增反应,得到其aroA基因上游长约600bp的片段,将其连入pBlueScript(stratagene)的BamHI和HindIII位点得到质粒pKU2223。以质粒pBlueScript为模板,用引物进行PCR扩增反应,得到长约900bp的bla基因,将其连接入pBlueScript(stratagene)的HindIII和EcoRI位点得到质粒pKU2224。以大肠杆菌BL21(DE3)的染色体为模板,用引物进行PCR扩增反应,得到其aroA基因下游长约500bp的片段,将其连入pBlueScript(stratagene)的EcoRI和SalI位点得到质粒pKU2225。酶切回收pKU2225中的片段连接入pKU2223的EcoRI和SalI位点得到质粒pKU2227。酶切回收pKU2224中的片段连接入pKU2227的HindIII和EcoRI位点得到质粒pKU2228。酶切回收pKU2228中的BamHI和SalI间的片段连接入pKO3载体中得到质粒pKU2229。
以上所有构建质粒均测序保证其序列正确。
1.6突变菌株BA-的构建
利用pKO3来源质粒pKU2229将BL21(DE3)的aroA基因替换为导致氨苄青霉素抗性的bla基因。具体步骤为:将pKU2229转化入BL21(DE3)中,挑取一个转化子稀释后涂布于带有Ap和Cm抗生素的LB固体平板上,43℃过夜培养,由于pKO3的复制子在43℃不能正常起始复制,因此pKU2229只有重组到染色体上,菌株才能在43℃含有Ap和Cm抗生素的平板上生长。挑取一个重组后的菌落,稀释后涂布到含有5%蔗糖的仅含有Ap抗生素的LB培养基上,过夜培养。由于pKO3带有Sac B基因,该基因编码的蛋白质分解蔗糖后对细菌产生毒性,导致带有Sac B基因的细菌不能在含有5%蔗糖的培养基上生长,因此在含有5%蔗糖及Ap抗生素的LB培养基上生长的菌落,又一次发生同源重组,使aroA基因和sac B基因丢失。挑取几个菌落,划线于Cm平板和M63平板,确定aroA基因确实被删除,提取其总DNA,进行PCR扩增反应以最终确定bla基因替换掉aroA基因。
1.7体内互补实验
将如上述构建的pKU2100质粒和相应的pACYC1184质粒分别转入或共转入大肠杆菌aroA基因缺陷的菌株AB2829中,然后将其划线于M63限制性固体培养培养基上,过夜培养检测其生长情况。
1.8生长曲线实验
将带有质粒pKU2004、pKU2006和pKU2007的大肠杆菌aroA基因突变菌株AB2829接种于LB液体培养基中过夜培养,取菌液4000rpm离心3分钟,用0.9%生理盐水悬浮,再次离心,弃去上清,并用生理盐水重新悬浮,接入含有0、50和100mM草甘膦的液体培养基中,初始接菌量为OD6000.04,37℃过夜培养,并定时测光吸收(OD600)。
1.9蛋白的表达与纯化
将带有目的质粒的BA-菌接入含有相应抗生素的LB液体培养基中,在37℃摇床培养至OD600 0.75左右,加入终浓度为0.5mM的IPTG,15℃过夜培养。将菌液在4℃、5000rpm离心10分钟收集菌体,按体积比10∶1重悬至缓冲液A(50mM Tris-HCl(pH 7.8),0.4mM DTT)中,超声波破碎菌体,4℃、8000rpm离心60分钟。
将离心后的上清液用HisTrap HP kit(Amersham Biosciences)按照使用说明进行蛋白纯化。纯化后的蛋白利用Millipore Biomax membrane(10kDa)浓缩于缓冲液A中,4℃保存。
1.10EPSPS多克隆抗体的制备
将带有质粒pKU2008的BL21(DE3)菌株按以上步骤进行表达纯化,最后将蛋白浓缩,重悬于PBS缓冲液中。以此蛋白为抗原,对兔子进行免疫反应,经过四次反应,一次加强反应后取血清(此过程由中科院遗传所完成),用ELASA检测抗体效价后备用。
1.11聚丙烯酰胺凝胶电泳
SDS-聚丙烯酰胺凝胶电泳凝胶的上层浓缩胶浓度为5%,下层分离胶浓度一般为16%。Native-聚丙烯酰胺凝胶电泳凝胶的浓度为10%。凝胶、电泳缓冲液的配置及电泳方法参见Sambrook等,出处同上。
1.12圆二色性光谱(CD spectra)的测定
远紫外和近紫外CD光谱的测量在一台接有恒温水浴循环控制仪的Jobin Yvon CD6上进行。每条曲线是4次测量的平均。测量温度为8℃。进行近紫外圆二色性光谱测定时使用1-cm pathlength cylinder quartz cuvette,而远紫外圆二色性光谱测定时使用0.1-mm pathlength cylinder quartz cuvette。
1.13EPSPS片段的蛋白免疫印迹实验
转膜及免疫印迹反应方法参见Sambrook等,出处同上。简要步骤为:蛋白经过16%SDS-聚丙烯酰胺凝胶电泳后转移至硝酸纤维素膜上,将膜与1∶2000稀释的兔的多克隆抗体杂交,抗体抗原复合物进一步与结合有辣根过氧化物酶的第二抗体-羊抗兔IgG(promega)反应形成复合物。显色反应采用辣根过氧化物酶分解DAB(华美生物工程公司)的方法,具体操作见说明书。
1.14EPSPS活性测定
酶活性的测定
(1)取95μl底液(在反应体系中浓度为50mmol/L HEPE Sbuffer(pH7.5),1mmol/L PEP,1mmol/L S3P),于28℃的培养箱中预热5min。
(2)加5μl酶液,在28℃培养箱中放置1-20min(以酶量活性决定时间长短),加800μl MG/AM/NP混合1min。
(3)加100μl的34%的柠檬酸钠溶液,混合后半小时于660nm的分光光度计上测定OD值。
1.15体外互补实验
将EPSPS的N端和C端分别在BA-中表达,离心收集菌体后超声波破碎,电泳检测目的蛋白是否主要形成包涵体从而聚集在沉淀中。收集沉淀,先用缓冲液B(50mM Tris-HCl(pH7.8),1mM EDTA,0.05%的Titon-100)洗三次,再用1M氯化钠溶液洗三次,再用缓冲液C(50mM Tris-HCl(pH7.8),1mM EDTA,1M尿素)洗三次,最后用蒸馏水洗三次。将洗涤完毕后的沉淀加入还有8M尿素的缓冲液A中,充分溶解后离心取上清转入透析袋中。先用还有2M尿素的缓冲液D(50mM Tris-HCl(pH7.8),1mM GSH,0.5mMGSSG)透析过夜,再用缓冲液D透析36小时,最后用PEG12000浓缩。复性产物通过电泳、免疫反应及酶活性检测加以分析。
2.大肠杆菌EPSPS的片段互补结果
2.1体内功能互补实验
为了检测EPSPS能否体内表达形成片段互补,分别将编码EPSPS的N端肽链的基因构建在pACYC184载体上,而将编码EPSPS的C端肽链的基因构建在pBR322载体上(具体构建过程见方法)。然后将这些质粒分别转入大肠杆菌的aroA基因突变菌株AB2829中,通过检测其是否能在M63限制性培养基上生长,来确定该基因编码的蛋白片段是否仍具有EPSPS活性。结果,仅带有编码N端或C端EPSPS编码基因的AB2829不能在M63培养基上生长。
由于pACYC184和pBR322质粒分别具有复制子p15A and ColE1,因此这两个质粒可以在同一个细菌中共表达。我们于是将编码EPSPS的N端肽链的pACYC184系列质粒,和在同一个位点分拆的编码EPSPS的C端肽链的pKU2100系列质粒,共转化入大肠杆菌的aroA基因突变菌株AB2829中,将其划线于M63限制性培养基平板上37℃培养。16小时后,分别带有编码EPSPS的N218/C219(pKU2101/pKU2102)和N227/C228(pKU2125/pKU2138)质粒的AB2829可以在限制性培养基上生长,而带有其它三对质粒pKU2126/pKU2137(N234/C235)、pKU2162/pKU2163(N240/C241)和pKU2110/pKU2130(N245/C246)的AB2829不能在M63培养基上生长。这说明,EPSPS片段(N218/C219和N227/C228)在体内分别表达时,可以互补形成EPSPS活性,其它三对EPSPS的片段在体内不能互补EPSPS活性。
2.2EPSPS片段复合体的纯化和检测
为了确定是否因为编码EPSPS片段的基因在体内发生重组而导致合成全长EPSPS并恢复EPSPS活性,将蛋白片段共纯化出来,体外检测酶活性及蛋白片段大小,以确定EPSPS活性恢复确实是因为片段互补的原因。为此,构建了用于表达EPSPS片段的质粒,其中N端构建于pACYC184载体上,而蛋白C端构建于pET28a载体上,都由T7启动子起始转录表达,其中EPSPS的C端肽链的C端融合有6个组氨酸(质粒构建见方法见上文)。如果EPSPS的两个蛋白片段能够体内重建,形成天然EPSPS的结构,那么分拆后的EPSPS的N端肽链,将与相应的EPSPS C端肽链结合,并且该复合体可以被镍柱所吸附而共纯化出来。为了消除细菌染色体上aroA基因编码的EPSPS的影响,将大肠杆菌BL21体内编码EPSPS的aroA基因,替换为编码β-内酰胺酶的bla基因,得到aroA基因删除菌株BA-。将相应的两个系列的质粒,转化入BA-菌株中共表达。首先将其划线于涂有IPTG的M63平板上,过夜培养检测其体内互补情况。结果与前面一致,带有N218/C219、N227/C228片段编码基因的BA-,可以在M63限制性培养基上生长;带有其它三对片段编码基因的BA-,不能在M63限制性培养基上生长。将EPSPS的N端肽链和C端肽链在BA-中分别表达或共表达,SDS-PAGE检测,结果表明它们均能正常表达。用HisTrap HP kit对共表达的蛋白进行纯化,纯化后的蛋白SDS-聚丙烯酰胺凝胶电泳后,用制备好的EPSPS的抗体进行检测(具体步骤见方法)。结果如图4所示,纯化后的蛋白中不仅有EPSPS的C端肽链,而且也有其对应的N端肽链。这些蛋白片段都与预计的片段大小一致,这说明在体内表达的EPSPS的片段,可以互补形成复合体从而被共纯化出来。从图中也看出,共表达的蛋白无论是纯化前还是纯化后都没有全长的蛋白,这表明体内没有发生重组,因此没有形成全长EPSPS基因。活性试验也显示,纯化出的蛋白都具有EPSPS活性。以上的结果表明,EPSPS活性可以由在体内分别表达的肽链发生片段互补而形成。
EPSPS的N端肽链和C端肽链虽然在体内表达量可能有所差异,如N227的表达量远大于C228的表达量,但是纯化后N端和C端蛋白片段的含量几乎都是1∶1的关系。从图中也可以看出,纯化出的N234/C235、N245/C246量远远少于其它三个共纯化的EPSPS,这可能是其不能在体内互补EPSPS活性以使AB2829在限制性培养基上生长的原因。虽然N240/C241复合体纯化出的量甚至多于N218/C219,但是它却不能互补AB2829在限制性培养基上的生长,这是因为其EPSPS活性比较低的原因
2.3测定酶活性
为了对N218/C219、N227/C228这两个能重建酶活性的复合体进行进一步的研究,将上一步用HisTrap HP kit纯化后N218/C219、N227/C228及全长的EPSPS用Sephadex-G75柱进行进一步纯化,纯化结果表明N218/C219、N227/C228及全长的EPSPS具有同一个洗脱峰,表明其分子量及结构大致相同。随后测定了这三个蛋白的酶活性及对底物的Km值,结果如表2,从表中可以看出,片段互补后的EPSPS复合体N218/C219及N227/C228的酶的活力分别约为全长EPSPS的70%和64%,而对底物的亲和力并没有太大的改变,这表明重建的EPSPS结构比较稳定。
表2.EPSPS及重建后EPSPS的酶学性质
 酶(μM)   比活力b(μmol min-1mg-1)   Km[PEP]c(μM)   Km[S3P]d
 EPSPS218/219227/228   44±231±328±4   14±318±319±3   45±149±349±6
a以上结果为两次独立实验,每次实验至少有三个平行。
b酶比活力测定PEP和S3P的浓度均为1.0mM。
c测定Km[PEP]时,S3P浓度不变为1mM,PEP浓度从50到200μM。
d测定Km[S3P]时,PEP浓度不变为1mM,S3P浓度从50到200μM。
2.4圆二色性光谱(CD spectra)的分析
为了确定,片段互补重建所得的EPSPS是否与野生型EPSPS结构一致,对EPSPS及复合体N227/C228进行了圆二色性光谱分析。EPSPS与N227/C228的远紫外CD光谱基本没有显著差异(图5),这意味着它们的二级结构几乎是相同的。但近紫外CD光谱之间有所差异(图5),表明重建的EPSPS与野生型EPSPS结构还是有所差异。
2.5大肠杆菌突变型EPSPS的体内互补
为了检测突变后的EPSPS片段是否可以在体内进行功能互补,分别构建了质粒pKU2105和pKU2333,它们分别编码大肠杆菌EPSPS的两个N端片段N218-G96A和N227-G96A。将它们与相应的编码C219和C228的质粒分别转入大肠杆菌aroA基因的突变菌株AB2829(aroA-,来源于耶鲁大学))中,在带有不同浓度草甘膦的M63限制性培养基中检测其生长情况,结果如图6。从图中可以看到,在未加草甘膦的M63培养基中,带有不同质粒的AB2829均生长良好,没有明显的差异。在含有50mM草甘膦的M63培养基中,表达有突变的EPSPS全酶(EPSPS-G96A)或突变的互补片段(N227-G96A/C228和N218-G96A/C219)的菌株生长较好,而表达有野生型EPSPS或野生互补片段的菌株生长被阻遏。表达有EPSPS-G96A或N227-G96A/C228的菌株在含有100mM草甘膦的M63培养基中仍旧生长良好,而表达有N218-G96A/C219的菌株生长稍差,这可能是在体内N2227-G96A/C228复合体更容易形成的原因。
2.6体外EPSPS的重建
蛋白片段能在体内互补形成有活性的复合体,那么在体外同样有可能互补形成有活性的复合体。为此,分别表达了EPSPS的N端肽链N218和C端肽链C219。EPSPS片段的大量表达形成包涵体,对包涵体进行初步纯化后,将它们一起复性(操作步骤见方法)。复性结束后对其进行电泳分析,结果见图7。从图7a中我们可以看出,EPSPS的各个片段出现在预计的位置,并没有全长的EPSPS。当将其体外共复性之后,native-PAGE结果可以出现与野生EPSPS一致的条带,将单独复性后的N218和C219混合在一起时并没有此带,这说明体外EPSPS共复性后可以互补形成类似于野生EPSPS的结构。活性实验也表明,N218/C219共复性可以互补形成EPSPS活性,而单独复性后的N218和C219混合在一起并不能互补形成EPSPS活性。
3.EPSPS的片段互补与结构的关系
3.1所用的菌株和质粒见下表。
表3.用于本研究中的细菌菌株和质粒
  菌株/质粒   相关特点   来源/参考文献
  大肠杆菌菌株
  DH5α   supE44ΔlacU169hsdR17recA1gyrA96thi-1re1A1   Hanahan D.,J Mol Biol1983;166:557-80
  AB2829   aroA354   耶鲁大学
  质粒
  pUC18   ColE1,lacZ’,ApR   Norrander等,1983
  pBluscript-SK   ColE1,lacZ’,ApR   Stratagene
  pET-28a   ColE1,表达质粒,KmR   Novagen
  pACYC184   CmR   Chang,A.C.等1978.JBacteriol 134:1141-56
  pBR322   ColE1,ApR   Schaeffer,F.等,1982EMBOJ.1,99-105
  pKU2005   pUC18衍生质粒,带有aroAE.coli,ApR   本工作
  pKU2006   pACYC184衍生质粒,带有aroAE.coli,CmR   本工作
  pKU2007   pACYC184衍生质粒,带有aroAE.coli-G96A,CmR   本工作
  pKU2008   pET-28a衍生质粒,带有E.coli aroA,KmR   本工作
  pKU2009   pET-28a衍生质粒,带有E.coli aroA,KmR   本工作
  pKU2010   pET-28a衍生质粒,带有E.coli aroA-G96A,KmR   本工作
  pKU2011   pET-28a衍生质粒,带有E.coli aroA-G96A,KmR   本工作
  pKU2100   PBR322衍生质粒,带有aroAE.coli,ApR   本工作
  pKU2101   pACYC184衍生质粒,带有N218-aroAE.coli,CmR   本工作
  pKU2102   pBR322衍生质粒,带有C219-aroAE.coli,ApR   本工作
  pKU2103   pACYC184衍生质粒,带有N238-aroAE.coli,CmR   本工作
  pKU2104   pBR322衍生质粒,带有C239-aroAE.coli ApR   本工作
  pKU2110   pACYC184衍生质粒,带有N245-aroAE.coli,CmR   本工作
  pKU2111   pACYC184衍生质粒,带有N259-aroAE.coli,CmR   本工作
  pKU2124   pBR322衍生质粒,带有C225-aroAE.coli,ApR   本工作
  pKU2125   pBR322衍生质粒,带有C228-aroAE.coli,ApR   本工作
  pKU2126   pBR322衍生质粒,带有C235-aroAE.coli,ApR   本工作
  pKU2129   pACYC184衍生质粒,带有N31-aroAE.coli,CmR   本工作
  pKU2130   pBR322衍生质粒,带有C246-aroAE.coli,ApR   本工作
  pKU2131   pBR322衍生质粒,带有C260-aroAE.coli,ApR   本工作
  pKU2135   pBR322衍生质粒,带有C299-aroAE.coli,ApR   本工作
  pKU2136   pACYC184衍生质粒,带有N298-aroAE.coli,CmR   本工作
  pKU2137   pACYC184衍生质粒,带有N234-aroAE.coli,CmR   本工作
  pKU2138   pACYC184衍生质粒,带有N227-aroAE.coli,CmR   本工作
  pKU2139   pACYC184衍生质粒,带有N224-aroAE.coli,CmR   本工作
  pKU2148   pACYC184衍生质粒,带有N165-aroAE.coli,CmR   本工作
  pKU2149   pBR322衍生质粒,带有C166-aroAE.coli,ApR   本工作
  pKU2150   pACYC184衍生质粒,带有N371-aroAE.coli,CmR   本工作
  pKU2151   pBR322衍生质粒,带有C372-aroAE.coli,ApR   本工作
  pKU2290   pACYC 184衍生质粒,带有N67-aroAE.coli,CmR   本工作
  pKU2291   pACYC 184衍生质粒,带有N73-aroAE.coli,CmR   本工作
  pKU2292   pACYC184衍生质粒,带有N84-aroAE.coli,CmR   本工作
  pKU2293   pACYC184衍生质粒,带有N104-aroAE.coli,CmR   本工作
  pKU2294   pACYC184衍生质粒,带有N154-aroAE.coli,CmR   本工作
  pKU2295   pACYC184衍生质粒,带有N182-aroAE.coli,CmR   本工作
  pKU2296   pACYC184衍生质粒,带有N184-aroAE.coli,CmR   本工作
  pKU2297   pACYC184衍生质粒,带有N376-aroAE.coli,CmR   本工作
  pKU2298   pACYC184衍生质粒,带有N383-aroAE.coli,CmR   本工作
  pKU2299   pBR322衍生质粒,带有C68-aroAE.coli,ApR   本工作
  pKU2300   pBR322衍生质粒,带有C74-aroAE.coli,ApR   本工作
  pKU2301   pBR322衍生质粒,带有C86-aroAE.coli,ApR   本工作
  pKU2302   pBR322衍生质粒,带有C105-aroAE.coli,ApR   本工作
  pKU2303   pBR322衍生质粒,带有C155-aroAE.coli,ApR   本工作
  pKU2304   pBR322衍生质粒,带有C183-aroAE.coli,ApR   本工作
  pKU2305   pBR322衍生质粒,带有C185-aroAE,coli,ApR   本工作
  pKU2306   pBR322衍生质粒,带有C377-aroAE.coli,ApR   本工作
  pKU2307   pBR322衍生质粒,带有C384-aroAE.coli,ApR   本工作
Ap,氨卞青霉素;Cm,氯霉素;R,抗性。
3.2培养基
参看本实施例1.2节。
3.3试剂
限制性内切酶,T4DNA连接酶,DNA聚合酶,DNAmarker等购于Takara生物公司。其余化学药品均为分析纯试剂。
3.4遗传学操作
质粒DNA的制备、限制性内切酶的消化、连接反应、Tris-硼酸-EDTA缓冲液水平琼脂糖电泳、按照标准方法进行(Maniatis等,1982)。
3.5质粒构建
a.pBR322系列质粒(编码EPSP合酶C端肽链)的构建
以pKU2009(大肠杆菌aroA基因)为模板,分别以对应引物(进行扩增得到编码大肠杆菌EPSP合酶C端的基因,将扩增产物连接入pKU2100的NcoI和BamHI位点,得到编码EPSP合酶C端肽链系列质粒(表3)。
b.pACYC184系列质粒(编码EPSP合酶N端肽链)的构建
以pKU2009或pGMO为模板,分别以对应引物进行扩增得到编码大肠杆菌EPSP合酶N端的基因,将扩增产物连接入pACYC184的EcoR V和BamHI位点,分别得到编码EPSP合酶N端肽链系列质粒(表3)。
以上所有构建质粒均测序保证其序列正确。
3.6体内互补实验
将3.5a中构建的pBR322系列质粒和b中构建的pACYC1184系列质粒分别转入或相对应两个质粒共转入大肠杆菌aroA基因缺陷的菌株AB2829中,然后将其划线于M63限制性固体培养培养基上,过夜培养检测其生长情况。
3.7结果
基于大肠杆菌EPSPS的结构一共设计了21个分拆位点,进行了EPSPS片段互补研究。有三个分拆位点在α螺旋上,其中N31/C32和N245/C246都不能互补大肠杆菌aroA基因突变菌株AB2829在限制性培养基上的生长,而N105/C106互补情况较差;有三个拆分位点在β折叠上,其中N73/C74和N238/C239不能互补EPSP酶活性,而N224/C225可以互补AB2829在限制性培养基上的生长;有5个在β折叠或α螺旋之间的连接区域上,其中仅有N165/C166不能互补AB2829在M63培养基上的生长,而其它四对EPSPS的片段都可以互补EPSPS活性;分拆位点在两个折叠单元之间的有6个,其中仅有N234/C235不能互补EPSPS的活性,其它五对片段都能互补AB2829在M63培养基上的生长,而且互补情况较好。
表4大肠杆菌EPSPS片段互补
  EPSPS片段   分拆位点所在区域   互补情况
  N端N31N67N73N85N104   C端C32C68C74C86C105 α螺旋两个β折叠之间β折叠折叠单元3和4之间α螺旋   N端-----   C端-----   N端+C端-+-++++/-
  N154N165N182N184N218N224N227N234N238N240N245N259N298N371N376N383   C155C166C183C185C219C225C228C235C239C241C246C260C299C372C377C384   折叠单元4和5之间α螺旋与β折叠之间α螺旋与β折叠之间α螺旋与β折叠之间两个β折叠之间β折叠折叠单元3和5之间折叠单元3和5之间β折叠两个结构域之间α螺旋β折叠折叠单元2和6之间折叠单元1和6之间折叠单元1和6之间α螺旋与β折叠之间 ---------------- ----------------   +++-+++++++++----+++++++++++
-,不能生长;+,可以生长。
实施例2恶臭假单胞菌草甘膦抗性EPSPS的片段互补
利用恶臭假单胞菌CGMCC0739的草甘膦抗性EPSPS基因进行片段互补实验。所用的质粒,培养基,菌株,以及实验步骤都参见实施例1。通过在含有100mM草甘膦的培养基上生长来检测重建的酶活性。
表5恶臭假单胞菌草甘膦抗性EPSPS的片段互补
  EPSPS片段   分拆位置   互补情况
  N208/C209N214/C215N219/C220N222/C223N224/C225N233/C234N234/C234N236/C237   α螺旋与β折叠之间β折叠中折叠单元之间折叠单元之间折叠单元之间两个结构域之间两个结构域之间两个结构域之间   +++++++---
所用引物如下:
N端正向引物:
ppN5’:5’-TGA GTG ACT GAA AGT GAA AGT AAC AAT ACA G-3’N端反向引物见下。
C端反向引物:
PPC3’(BamHI):5’-CGG GAT CCC TTC TTC GGA CAA TGA CAG AC-3’C端正向引物见下。
N208/C209+
ppN2083’(BamHI):5’-CGG GAT CCT CAG GGA GTC TTC AAA CCA AAC C-3’
ppC2095’(NcoI):5’-CAT GCC ATG GAG AAT CGA AAC TAT GAA G-3’
N214/C215+
ppN2143’(BamHI):5’-CGG GAT CCT CAT TCA TAG TTT CGA TTC TCG G-3’
ppC2155’(NcoI):5’-CAT GCC ATG GAG TTT TAT TTC AAA GCC GG-3’
N219/C220++
ppN2193’(BamHI):5’-CGG GAT CCT CAT TTG AAA TAA AAC TCT TCA TAG-3’
ppC2205’(NcoI):5’-CAT GCC ATG GCC GGG AAT GTA TAT GAT GAA AC-3’
N222/C223+
ppN2223’(BamHI):5’-CGG GAT CCT CAA TTC CCG GCT TTG AAA TAA AAC-3’
ppC2235’(NcoI):5’-CAT GCC ATG GTA TAT GAT GAA ACG AAA ATG-3’
N224/C225++
ppN2243’(BamHI):5’-CGG GAT CCT CAA TAT ACA TTC CCG GCT TTG-3’
ppC2255’(NcoI):5’-CAT GCC ATG GAT GAA ACG AAA ATG CAA CG-3’
N233/C234
ppN2333’(BamHI):5’-CGG GAT CCT CAG GTG TAT CGT TGC ATT TTC G-3’
ppC2345’(NcoI):5’-CAT GCC ATG GTA GAA GGC GAC TGG AGC G-3’
N234/C235
ppN2343’(BamHI):5’-CGG GAT CCT CAT ACG GTG TAT CGT TGC ATT TTC-3’
ppC2355’(NcoI):5’-CAT GCC ATG GAA GGC GAC TGG AGC GGT GG-3’
N236/C237
ppN2363’(BamHI):5’-CGG GAT CCT CAG CCT TCT ACG GTG TAT CGT TG-3’
ppC2375’(NcoI):5’-CAT GCC ATG GAC TGG AGC GGT GGT GCT TT-3’
序列表
<110>北京大学
     王忆平,孙义成,李燕
<120>利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性
<130>
<141>
<160>79
<170>PatentIn version3.1
<210>1
<211>1501
<212>DNA
<213>恶臭杆菌P.P4G-1(Pseudomonas putida P.P4G-1)
<400>1
agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc     60
ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct     120
gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga     180
gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt     240
ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca     300
cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca     360
atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag     420
cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca     480
gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta     540
atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc     600
cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg     660
gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg     720
accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat     780
accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag     840
tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca     900
aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg     960
aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg     1020
gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa   1080
gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa   1140
ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt   1200
acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt   1260
ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga   1320
agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg   1380
tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc   1440
gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt   1500
a                                                                   1501
<210>2
<211>1914
<212>DNA
<213>恶臭杆菌P.P4G-1(Pseudomonas putida P.P4G-1)
<220>
<221>CDS
<222>(508)..(1800)
<223>
<400>2
gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa     60
tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca     120
gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa     180
ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc     240
ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca     300
aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga     360
tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa     420
ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt     480
agaaaaaatc attcaagcat taccaaa gtg aaa gta aca ata cag ccc gga gat     534
                              Met Lys Val Thr Ile Gln Pro Gly Asp
                              1               5
ctg act gga att atc cag tca ccc gct tca aaa agt tcg atg cag cga       582
Leu Thr Gly Ile Ile Gln Ser Pro Ala Ser Lys Ser Ser Met Gln Arg
10                  15                  20                  25
gct tgt gct gct gca ctg gtt gca aaa gga ata agt gag atc att aat       630
Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Set Glu Ile Ile Asn
                30                  35                  40
ccc ggt cat agc aat gat gat aaa gct gcc agg gat att gta agc cgg      678
Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg
           45                   50                  55
ctt ggt gcc agg ctt gaa gat cag cct gat ggt tct ttg cag ata aca      726
Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr
        60                  65                  70
agt gaa ggc gta aaa cct gtc gct cct ttt att gac tgc ggt gaa tct      774
Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser
    75                  80                  85
ggt tta agt atc cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa      822
Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu
90                  95                  100                 105
gag gtg acg atc aaa gga tct gga agc ctt gtt aca aga cca atg gat      870
Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp
                110                 115                 120
ttc ttt gat gaa att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac      918
Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn
            125                 130                 135
cag ggt aaa ttg cct ctc gtt ata cag ggg cca ttg aaa cca gca gac      966
Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp
        140                 145                 150
gtt acg gtt gat ggg tcc tta agc tct cag ttc ctt aca ggt ttg ttg      1014
Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu
    155                 160                 165
ctt gca tat gcg gcc gca gat gca agc gat gtt gcg ata aaa gta acg      1062
Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr
170                 175                 180                 185
aat ctc aaa agc cgt ccg tat atc gat ctt aca ctg gat gtg atg aag      1110
Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys
                190                 195                 200
cgg ttt ggt ttg aag act ccc gag aat cga aac tat gaa gag ttt tat      1158
Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr
            205                 210                 215
ttc aaa gcc ggg aat gta tat gat gaa acg aaa atg caa cga tac acc      1206
Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr
        220                 225                 230
gta gaa ggc gac tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct      1254
Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala
    235                 240                 245
att gcc ggg ccg atc acg gta aga ggt ttg gat ata gct tcg acg cag      1302
Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln
250                 255                 260                 265
gct gat aaa gcg atc gtt cag gct ttg atg agt gcg aac gca ggt att      1350
Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile
                270                 275                 280
gcg att gat gca aaa gag atc aaa ctt cat cct gct gat ctc aat gca     1398
Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala
            285                 290                 295
ttt gaa ttt gat gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt     1446
Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val
        300                 305                 310
gct ttg gcg tct tat tgc aaa gga gaa aca aag atc aaa ggc gta agc     1494
Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser
    315                 320                 325
agg ctg gcg cat aaa gaa agt gac aga gga ttg acg ctg cag gac gag     1542
Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu
330                 335                 340                 345
ttc ggg aaa atg ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc     1590
Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg
                350                 355                 360
gtg atc gga ggg aaa ggc gta aaa gga gct gaa gtt agt tca agg cac     1638
Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His
            365                 370                 375
gat cat cgc att gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg     1686
Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val
        380                 385                 390
ggt gaa aca acc atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg     1734
Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro
    395                 400                 405
gat ttt tac agc gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac     1782
Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn
410                 415                 420                 425
cat caa ttt aat ttc tca tgaatagctt cggccgcatc ttcagggtgc            1830
His Gln Phe Asn Phe Ser
                430
atatttttgg cgaatcacat ggtgaatcag taggcatcgt tattgatggt tgtcctgctg   1890
gtctgtcatt gtccgaagaa gatc                                          1914
<210>3
<211>431
<212>PRT
<213>恶臭杆菌P.P4G-1(Pseudomonas putida P.P4G-1)
<400>3
Met Lys Val Thr Ile Gln Pro Gly Asp Leu Thr Gly Tle Ile Gln Ser
1               5                    10                 15
Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Val
            20                  25                  30
Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser Asn Asp Asp
        35                  40                  45
Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg Leu Glu Asp
    50                  55                  60
Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val Lys Pro Val
65                  70                  75                  80
Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile Arg Met Phe
                85                  90                  95
Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile Lys Gly Ser
            100                 105                 110
Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu Ile Leu Pro
        115                 120                 125
His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu Pro Leu Val
    130                 135                 140
Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp Gly Ser Leu
145                 150                 155                 160
Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp
                165                 170                 175
Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr
            180                 185                 190
Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu Lys Thr Pro
        195                 200                 205
Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr
    210                 215                 220
Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly
225                 230                 235                 240
Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro Ile Thr Val
                245                 250                 255
Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala Ile Val Gln
            260                 265                 270
Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile
        275                 280                 285
Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp
    290                 295                 300
Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys
305                 310                 315                 320
Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His Lys Glu Ser
                325                 330                 335
Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Val Glu
            340                 345                 350
Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly Lys Gly Val
        355                 360                 365
Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile Ala Met Ala
    370                 375                 380
Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr Ile Glu His
385                 390                 395                 400
Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys
                405                 410                 415
Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn Phe Ser
            420                 425                 430
<210>4
<211>20
<212>DNA
<213>人工序列
<400>4
agagtttgat catggctcag                                               20
<210>5
<211>22
<212>DNA
<213>人工序列
<400>5
tacggttacc ttgttacgac tt                                              22
<210>6
<211>34
<212>DNA
<213>人工序列
<400>6
cgggatccta agtaagtgaa agtaacaata cagc                                 34
<210>7
<211>29
<212>DNA
<213>人工序列
<400>7
cgggatccct tcttcggaca atgacagac                                       29
<210>8
<211>33
<212>DNA
<213>人工序列
<400>8
cgggatccgt taatgccgaa attttgctta atc                                  33
<210>9
<211>30
<212>DNA
<213>人工序列
<400>9
cgggatccag gtccgaaaaa aaacgccgac                                      30
<210>10
<211>1436
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>10
gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg     60
tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact     120
attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca     180
cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat     240
gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt     300
atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc    360
ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg    420
accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg    480
ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc    540
ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca    600
ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg    660
gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt    720
gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt    780
acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc    840
aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc    900
tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc    960
tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg    1020
atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat    1080
aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc    1140
ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac    1200
tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg    1260
ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat    1320
tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata    1380
gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct        1436
<210>11
<211>30
<212>DNA
<213>人工序列
<220>
<223>大肠杆菌(E.coli)aroA上游引物
<400>11
cgggatccag gtccgaaaaa aaacgccgac                                     30
<210>12
<211>28
<212>DNA
<213>人工序列
<220>
<223>大肠杆菌(E.coli)aroA下游引物
<400>12
cgggatccat ggaatccctg acgttaca                                      28
<210>13
<211>29
<212>DNA
<213>人工序列
<220>
<223>pACYC(大肠杆菌(E.coli)aroA)系列上游引物
<400>13
tgagtgactg actttaagaa ggagatata                                     29
<210>14
<211>28
<212>DNA
<213>人工序列
<220>
<223>pBR322(大肠杆菌(E.coli)aroA)系列下游引物
<400>14
gccacgatgc gtccggcgta gaggatcc                                      28
<210>15
<211>31
<212>DNA
<213>人工序列
<220>
<223>N218(大肠杆菌(E.coli)aroA)下游引物
<400>15
 cgggatcctc actgattttc aatttcaaca c                                 31
<210>16
<211>31
<212>DNA
<213>人工序列
<220>
<223>C219(大肠杆菌(E.coli)aroA)下游引物
<400>16
catgccatgg gtcaacaatt tgtcgtaaaa g                                  31
<210>17
<211>32
<212>DNA
<213>人工序列
<220>
<223>N227(大肠杆菌(E.coli)aroA)下游引物
<400>17
cgggatcctc agccttttac gacaaattgt tg                                 32
<210>18
<211>31
<212>DNA
<213>人工序列
<220>
<223>N234(大肠杆菌(E.coli)aroA)下游引物
<400>18
cgggatcctc agacaaattg ttgatagtgc t                                 31
<210>19
<211>31
<212>DNA
<213>人工序列
<220>
<223>N245(大肠杆菌(E.coli)aroA)下游引物
<400>19
cgggatcctc acagcaataa agcgcggtta g                                 31
<210>20
<211>29
<212>DNA
<213>人工序列
<220>
<223>C228(大肠杆菌(E.coli)aroA)上游引物
<400>20
catgccatgg ggcagtctta tcagtctcc                                    29
<210>21
<211>28
<212>DNA
<213>人工序列
<220>
<223>C235(大肠杆菌(E.coli)aroA)上游引物
<400>21
catgccatgg gtacttattt ggtcgaag                                     28
<210>22
<211>32
<212>DNA
<213>人工序列
<220>
<223>N245(大肠杆菌(E.coli)aroA)下游引物
<400>22
cgggatcctc acgaagatgc atcgccttcg ac                                32
<210>23
<211>31
<212>DNA
<213>人工序列
<220>
<223>N240(大肠杆菌(E.coli)aroA)下游引物
<400>23
cgggatcctc attcgaccaa ataagtaccc g                                   31
<210>24
<211>29
<212>DNA
<213>人工序列
<220>
<223>C241(大肠杆菌(E.coli)aroA)上游引物
<400>24
catgccatgg gcgatgcatc ttcggcttc                                      29
<210>25
<211>31
<212>DNA
<213>人工序列
<220>
<223>pKU2159下游引物
<400>25
gttactcgag ggctgcctgg ctaatccgcg c                                   31
<210>26
<211>23
<212>DNA
<213>人工序列
<220>
<223>pKU2223下游引物
<400>26
 ggaattccat gaactcaact ctc                                           23
<210>27
<211>25
<212>DNA
<213>人工序列
<220>
<223>pKU2223上游引物
<400>27
cgggatcctc aacgataacg gctcc                                          25
<210>28
<211>23
<212>DNA
<213>人工序列
<220>
<223>pKU2224上游引物
<400>28
ggaattcaaa tatgtatccg ctc                                            23
<210>29
<211>26
<212>DNA
<213>人工序列
<220>
<223>pKU2224下游引物
<400>29
cccaagcttg gtctgacagt taccaa                                         26
<210>30
<211>25
<212>DNA
<213>人工序列
<220>
<223>pKU2225上游引物
<400>30
cccaagcttg atcccaaatg cacgg                                          25
<210>31
<211>27
<212>DNA
<213>人工序列
<220>
<223>pKU2225下游引物
<400>31
acgaagtcga cgtggcccag ttcatgg                                        27
<210>32
<211>32
<212>DNA
<213>人工序列
<220>
<223>N67(大肠杆菌(E.coli)aroA)下游引物
<400>32
cttaggatcc tcatgaaagc gtatagctta cc                                  32
<210>33
<211>32
<212>DNA
<213>人工序列
<220>
<223>N73(大肠杆菌(E.coli)aroA)下游引物
<400>33
gtcaggatcc tcagcaacgc gtacgatcgg ct                                  32
<210>34
<211>32
<212>DNA
<213>人工序列
<220>
<223>N85(大肠杆菌(E.coli)aroA)下游引物
<400>34
gtcaggatcc tcattctgcg tgtaatggac cg                                  32
<210>35
<211>33
<212>DNA
<213>人工序列
<220>
<223>N104(大肠杆菌(E.coli)aroA)下游引物
<400>35
cttaggatcc tcatgccgcc agcggacgca ttg                                 33
<210>36
<211>33
<212>DNA
<213>人工序列
<220>
<223>N154(大肠杆菌(E.coli)aroA)下游引物
<400>36
cgcaggatcc tcactgtaaa cgcaacggcg gat                                 33
<210>37
<211>31
<212>DNA
<213>人工序列
<220>
<223>N165(大肠杆菌(E.coli)aroA)下游引物
<400>37
cgggatcctc aatcaacgtc aacgttgccg c                                   31
<210>38
<211>35
<212>DNA
<213>人工序列
<220>
<223>N182(大肠杆菌(E.coli)aroA)下游引物
<400>38
ggcaggatcc tcaaagaggc gcagtcatta acagt                               35
<210>39
<211>32
<212>DNA
<213>人工序列
<220>
<223>N184(大肠杆菌(E.coli)aroA)下游引物
<400>39
tccaggatcc tcacggcgca agaggcgcag tc                                  32
<210>40
<211>32
<212>DNA
<213>人工序列
<220>
<223>N224(大肠杆菌(E.coli)aroA)下游引物
<400>40
cgggatcctc agacaaattg ttgatagtgc tg                                  32
<210>41
<211>31
<212>DNA
<213>人工序列
<220>
<223>N238(大肠杆菌(E.coli)aroA)下游引物
<400>41
cgggatcctc aagtacccgg agactgataa g                                   31
<210>42
<211>31
<212>DNA
<213>人工序列
<220>
<223>N259(大肠杆菌(E.coli)aroA)下游引物
<400>42
cgggatcctc aagtgccgcc tttgattgct g                                   31
<210>43
<211>32
<212>DNA
<213>人工序列
<220>
<223>N298(大肠杆菌(E.coli)aroA)下游引物
<400>43
cgggatcctc aacgcgtgca ggaaatataa tc                                  32
<210>44
<211>31
<212>DNA
<213>人工序列
<220>
<223>N371(大肠杆菌(E.coli)aroA)下游引物
<400>44
cgggatcctc acggaggagt gatacgaatg t                                   31
<210>45
<211>35
<212>DNA
<213>人工序列
<220>
<223>N376(大肠杆菌(E.coli)aroA)下游引物
<400>45
ccgtggatcc tcaaaagttc agtttttccg gagga                               35
<210>46
<211>27
<212>DNA
<213>人工序列
<220>
<223>C31(大肠杆菌(E.coli)aroA)上游引物
<400>46
catgccatgg cggcattagc acacggc                                        27
<210>47
<211>29
<212>DNA
<213>人工序列
<220>
<223>C68(大肠杆菌(E.coli)aroA)上游引物
<400>47
tatgccatgg ccgatcgtac gcgttgcga                                      29
<210>48
<211>31
<212>DNA
<213>人工序列
<220>
<223>C74(大肠杆菌(E.coli)aroA)上游引物
<400>48
tgcaccatgg aaattatcgg taacggcggt c                                   31
<210>49
<211>31
<212>DNA
<213>人工序列
<220>
<223>C86(大肠杆菌(E.coli)aroA)上游引物
<400>49
tattccatgg gtgccctgga gttgttcctc g                                  31
<210>50
<211>28
<212>DNA
<213>人工序列
<220>
<223>C105(大肠杆菌(E.coli)aroA)上游引物
<400>50
cggaccatgg ctctttgtct gggtagca                                      28
<210>51
<211>31
<212>DNA
<213>人工序列
<220>
<223>C155(大肠杆菌(E.coli)aroA)上游引物
<400>51
ttatccatgg gcggctttac tggcggcaac g                                  31
<210>52
<211>30
<212>DNA
<213>人工序列
<220>
<223>C166(大肠杆菌(E.coli)aroA)上游引物
<400>52
catgccatgg gctccgtttc cagccaattc                                    30
<210>53
<211>29
<212>DNA
<213>人工序列
<220>
<223>C183(大肠杆菌(E.coli)aroA)上游引物
<400>53
tgagccatgg cgccggaaga tacggtgat                                     29
<210>54
<211>30
<212>DNA
<213>人工序列
<220>
<223>C185(大肠杆菌(E.coli)aroA)上游引物
<400>54
gcgtccatgg aagatacggt gattcgtatt                                    30
<210>55
<211>29
<212>DNA
<213>人工序列
<220>
<223>C225(大肠杆菌(E.coli)aroA)上游引物
<400>55
catgccatgg taaaaggcgg gcagtctta                                     29
<210>56
<211>26
<212>DNA
<213>人工序列
<220>
<223>C239(大肠杆菌(E.coli)aroA)上游引物
<400>56
catgccatgg tcgaaggcga tgcatc                                        26
<210>57
<211>28
<212>DNA
<213>人工序列
<220>
<223>C246(大肠杆菌(E.coli)aroA)上游引物
<400>57
catgccatgg cttcttactt tctggcag                                      28
<210>58
<211>29
<212>DNA
<213>人工序列
<220>
<223>C260(大肠杆菌(E.coli)aroA)上游引物
<400>58
catgccatgg taaaagtgac cggtattgg                                     29
<210>59
<211>29
<212>DNA
<213>人工序列
<220>
<223>C299(大肠杆菌(E.coli)aroA)上游引物
<400>59
catgccatgg gtgaactgaa cgctattga                                     29
<210>60
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>60
tgagtgactg aaagtgaaag taacaataca g                                   31
<210>61
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>61
cgggatccct tcttcggaca atgacagac                                      29
<210>62
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物ppN2083′(BamHI)N208.C209+
<400>62
cgggatcctc agggagtctt caaaccaaac c                                   31
<210>63
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物ppC2095′(NcoI)N208/C209+
<400>63
catgccatgg agaatcgaaa ctatgaag                                       28
<210>64
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物ppN2143′(BamHI)N214/C215+
<400>64
cgggatcctc attcatagtt tcgattctcg g                                   31
<210>65
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物ppC2155′(NcoI)N214/C215+
<400>65
catgccatgg agttttattt caaagccgg                                     29
<210>66
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物ppN2193′(BamHI)N219/C220++
<400>66
cgggatcctc atttgaaata aaactcttca tag                                33
<210>67
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物ppC2205′(NcoI)N219/C220++
<400>67
catgccatgg ccgggaatgt atatgatgaa ac                                 32
<210>68
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物ppN2223′(BamHI)N222/C223+
<400>68
cgggatcctc aattcccggc tttgaaataa aac                                33
<210>69
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物ppC2235′(NcoI)N222/C223+
<400>69
catgccatgg tatatgatga aacgaaaatg                                    30
<210>70
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物ppN2243′(BamHI)N224/C225++
<400>70
cgggatcctc aatatacatt cccggctttg                                     30
<210>71
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物ppC2255′(NcoI)N224/C225++
<400>71
catgccatgg atgaaacgaa aatgcaacg                                      29
<210>72
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物ppN2333′(BamHI)N233/C234
<400>72
cgggatcctc aggtgtatcg ttgcattttc g                                   31
<210>73
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物ppC2345′(NcoI)N233/C234
<400>73
catgccatgg tagaaggcga ctggagcg                                       28
<210>74
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物ppN2343′(BamHI)N234/C235
<400>74
cgggatcctc atacggtgta tcgttgcatt ttc                                 33
<210>75
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物ppC2355′(NcoI)N234/C235
<400>75
catgccatgg aaggcgactg gagcggtgg                                      29
<210>76
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物ppN2363′(BamHI)N236/C237
<400>76
cgggatcctc agccttctac ggtgtatcgt tg                                  32
<210>77
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物ppc2375′(NcoI)N236/C237
<400>77
catgccatgg actggagcgg tggtgcttt                                      29
<210>78
<211>1284
<212>DNA
<213>大肠杆菌(Escherichia coli)
<220>
<221>CDS
<222>(1)..(1284)
<223>
<400>78
atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att      48
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1               5                   10                  15
aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg      96
Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala
            20                  25                  30
gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat      144
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
        35                  40                  45
gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat      192
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
    50                  55                  60
acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt      240
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65                  70                  75                  80
cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga      288
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
            85                  90                  95
acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat      336
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
        100                 105                 110
att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat      384
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
    115                 120                 125
ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa      432
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
130                 135                 140
caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc      480
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145                 150             155                     160
aac gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg      528
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
                165             170                     175
tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa      576
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
            180             185                     190
ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg      624
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
        195             200                     205
aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc      672
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
    210             215                     220
gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa      720
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225             230                     235                 240
ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa      768
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
            245                     250                 255
ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt      816
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
        260                     265                 270
gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc      864
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
    275                     280                 285
tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att      912
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
290                     295                 300
gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg      960
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305                 310                 315                 320
gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac     1008
Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn
                325                 330                 335
tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg     1056
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
            340                 345                 350
cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc     1104
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
        355                 360                 365
act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat     1152
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
    370                 375                 380
cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca     1200
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385                 390                 395                 400
gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ecg gat tat     1248
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
                405                 410                 415
ttc gag cag ctg gcg cgg att agc cag gca gcc tga                     1284
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala
            420                 425
<210>79
<211>427
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>79
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1               5                   10                  15
Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala
            20                  25                  30
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
        35                  40                  45
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
    50                  55                  60
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65                  70                  75                  80
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
                85                  90                  95
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
            100                 105                 110
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
        115                 120                 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
    130                 135                 140
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145                 150                 155                 160
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
                165                 170                 175
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
            180                 185                 190
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
        195                 200                 205
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
    210                 215                 220
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225                 230                 235                 240
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
                245                 250                 255
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
             260                 265                 270
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
       275                 280                 285
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
    290                 295                 300
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305                 310                 315                 320
Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn
                325                 330                 335
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
            340                 345                 350
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
        355                 360                 365
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
    370                 375                 380
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385                 390                 395                 400
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
                405                 410                 415
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala
            420                 425

Claims (9)

1.5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的蛋白片段,其是选自EPSPS的蛋白片段对的一种片段,组成所述片段对的两种片段可以连接成全长EPSPS,并且这两种片段不借助任何连接结构可以通过互补而重建EPSPS活性。
2.权利要求1的片段,其中所述片段对的分割点位于EPSPS的选自下列的结构中:折叠单元之间的连接区中、α螺旋与β折叠之间的连接区中、两个β折叠之间、β折叠中、或α螺旋中,优选位于折叠单元之间的连接区中。
3.权利要求1或2的片段,其中所述EPSPS是野生型EPSPS或其添加、缺失、和/或取代一或多个氨基酸残基所得的EPSPS活性变体,优选是大肠杆菌野生型EPSPS或其草甘膦抗性EPSPS活性变体,或者优选是恶臭假单胞菌草甘膦抗性EPSPS。
4.权利要求1的片段,其是选自大肠杆菌EPSPS的以下片段对的一种片段:N67/C68,N85/C86,N104/C105,N154/C155,N182/C183,N184/C185,N218/C219,N224/C225,N227/C228,N259/C260,N298/C299,N371/C372,N376/C377,N383/C384,或是选自恶臭假单胞菌CGMCC 0739 EPSPS的以下片段对的一种片段:N208/C209,N214/C215,N219/C220,N222/C223,N224/C225。
5.一种核酸分子,其编码权利要求1-4之一的蛋白片段。
6.一种表达载体,其携带权利要求5所述核酸分子。
7.一种细胞,其包含权利要求5所述核酸分子,或者权利要求6所述表达载体。
8.一种重建EPSPS的方法,包括在无任何连接结构存在的条件下,利用权利要求1-4之一的蛋白片段,或权利要求5的核酸分子,或权利要求6的表达载体来重建EPSPS活性。
9.一种拆分EPSPS或EPSPS核酸分子的方法,包括在无任何连接结构存在的条件下,拆分出权利要求1-4之一所述的蛋白片段,或权利要求5所述的核酸分子。
CN200410102289.4A 2004-12-16 2004-12-16 利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性 Expired - Fee Related CN1789412B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN200410102289.4A CN1789412B (zh) 2004-12-16 2004-12-16 利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性
AT05819606T ATE486127T1 (de) 2004-12-16 2005-12-16 Wiederherstellung der aktivität von 5- enolpyruvylshikimat-3-phosphat-synthase durch fragmentkomplementierung
DE602005024442T DE602005024442D1 (de) 2004-12-16 2005-12-16 Wiederherstellung der aktivität von 5-enolpyruvylshikimat-3-phosphat-synthase durch fragmentkomplementierung
EP05819606A EP1840210B1 (en) 2004-12-16 2005-12-16 Reconstitution of 5-enolpyruvylshikimate-3-phosphate synthase activity by fragment complementation
US11/721,856 US8936925B2 (en) 2004-12-16 2005-12-16 Reconstitution of 5-enolpyruvylshikimate-3-phosphate synthase activity by fragment complementation
PCT/CN2005/002219 WO2006063533A1 (fr) 2004-12-16 2005-12-16 Reconstitution de l’activite de la 5-enolpyruvylshikimate-3-phosphate synthase par complementation de fragments

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200410102289.4A CN1789412B (zh) 2004-12-16 2004-12-16 利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性

Publications (2)

Publication Number Publication Date
CN1789412A true CN1789412A (zh) 2006-06-21
CN1789412B CN1789412B (zh) 2011-04-20

Family

ID=36587548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200410102289.4A Expired - Fee Related CN1789412B (zh) 2004-12-16 2004-12-16 利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性

Country Status (6)

Country Link
US (1) US8936925B2 (zh)
EP (1) EP1840210B1 (zh)
CN (1) CN1789412B (zh)
AT (1) ATE486127T1 (zh)
DE (1) DE602005024442D1 (zh)
WO (1) WO2006063533A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104630245A (zh) * 2013-11-08 2015-05-20 北京大学 5-烯醇式丙酮酰-莽草酸-3-磷酸合酶的环式重排变体和互补片段对
CN106517702A (zh) * 2015-07-26 2017-03-22 李娜 一种去除含镉污水污染物的方法
CN107119060A (zh) * 2012-02-01 2017-09-01 陶氏益农公司 草甘膦抗性植物和相关方法
CN117821344A (zh) * 2024-03-06 2024-04-05 江苏古道农业科技有限公司 一种草甘膦降解菌及其应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013027635A2 (pt) * 2011-04-29 2019-09-24 Keygene Nv sequência de nucleotídeos, enzima, vetor, hospedeiro, planta ou planta transgênica ou parte da mesma, semente, métodos para fornecer uma planta (célula) com resistência a glifosato, para acentuar resistência a glifosato de uma planta (célula), e para gerar um produto de planta, produto de planta, usos de uma sequência de nucleotídeos e de uma mutação
PL222067B1 (pl) * 2011-08-11 2016-06-30 Inst Biotechnologii I Antybiotyków Kaseta ekspresyjna, zastosowanie kasety ekspresyjnej, wektor ekspresyjny, komórka prokariotycznego gospodarza zawierająca wektor ekspresyjny, szczep bakteryjny oraz sposób wytwarzania polipeptydu

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2117991U (zh) 1992-03-20 1992-10-07 兰溪市金笔厂 一种弹簧复合书写笔
CN1268572A (zh) * 1999-03-31 2000-10-04 中国农业科学院生物技术研究中心 一种5-烯醇丙酮酰-莽草酸-3-磷酸合成酶基因的合成方法
EP1183346B1 (en) * 1999-05-24 2007-10-31 New England Biolabs, Inc. Method for generating split, non-transferable genes that are able to express an active protein product
DE10254167A1 (de) 2002-11-20 2004-06-09 Icon Genetics Ag Verfahren zur Kontrolle von zellulären Prozessen in Pflanzen
DE10254166A1 (de) 2002-11-20 2004-06-03 Icon Genetics Ag Verfahren zur Kontrolle eines zellulären Prozesses in Pflanzen

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107119060A (zh) * 2012-02-01 2017-09-01 陶氏益农公司 草甘膦抗性植物和相关方法
CN104630245A (zh) * 2013-11-08 2015-05-20 北京大学 5-烯醇式丙酮酰-莽草酸-3-磷酸合酶的环式重排变体和互补片段对
CN106517702A (zh) * 2015-07-26 2017-03-22 李娜 一种去除含镉污水污染物的方法
CN106517702B (zh) * 2015-07-26 2021-03-12 通化鑫鸿新材料有限公司 一种去除含镉污水污染物的方法
CN117821344A (zh) * 2024-03-06 2024-04-05 江苏古道农业科技有限公司 一种草甘膦降解菌及其应用

Also Published As

Publication number Publication date
ATE486127T1 (de) 2010-11-15
WO2006063533A1 (fr) 2006-06-22
EP1840210A4 (en) 2008-11-05
US8936925B2 (en) 2015-01-20
EP1840210B1 (en) 2010-10-27
US20090155879A1 (en) 2009-06-18
EP1840210A1 (en) 2007-10-03
CN1789412B (zh) 2011-04-20
DE602005024442D1 (de) 2010-12-09

Similar Documents

Publication Publication Date Title
CN1154734C (zh) 突变的5-烯醇丙酮酰莽草酸-3-磷酸合酶以及编码此蛋白的基因
CN1154741C (zh) 含有几个除草剂耐受性基因的嵌合基因、对几种除草剂具耐受性的植物细胞及植物
CN1024021C (zh) 含谷胱甘肽s-转移酶基因的除莠剂耐性植物
CN100347291C (zh) 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法
CN1285875A (zh) 突变的羟基苯丙酮酸双氧化酶、基dna序列和含该基因且耐除草剂的植物的分离
CN1656224A (zh) 编码乙酰乳酸合酶的基因
CN1531594A (zh) 新的草甘膦n-乙酰转移酶(gat)基因
CN1745173A (zh) 能赋予除草剂抗性的基因
CN1610749A (zh) 谷氨酸衍生物的制备方法
CN1151252C (zh) 生产微生物转谷氨酰胺酶的方法
CN1487998A (zh) 编码乙酰乳酸合酶基因的基因
CN101040047A (zh) 编码新型的具有d-丝氨酸合成活性的酶的dna、该酶的制备方法、及利用该酶的d-丝氨酸制备方法
CN1594571A (zh) 百草枯抗性基因及维管束和毛状体特异性启动子
CN1719971A (zh) 转基因高色氨酸植物
CN1502689A (zh) 生产l-谷氨酰胺的方法和生产l-谷氨酰胺的细菌
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1298853C (zh) 耐缺铁性稻类的构建
CN1789412A (zh) 利用片段互补技术重建5-烯醇丙酮酰莽草酸-3-磷酸合成酶活性
CN1262651C (zh) 使植物产生杂草防治化合物耐受性的方法
CN1842592A (zh) 赋予植物再分化能力的基因及其应用
CN1572878A (zh) L-氨基酸的生产方法
CN1250728C (zh) 在原核细胞内产生活性异二聚体amv-rt的方法
CN1894404A (zh) 有机酸存在下的启动子及其用途
CN1777673A (zh) IgA1沉积疾病的治疗
CN1543506A (zh) 除草剂的新靶标和对所述的除草剂有抗性的转基因植物

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110420

Termination date: 20141216

EXPY Termination of patent right or utility model