CN1223688A

CN1223688A - 对羟基苯丙酮酸双加氧酶的植物基因

Info

Publication number: CN1223688A
Application number: CN 97195920
Authority: CN
Inventors: C·A·马克斯维尔; P·A·斯克尔尼克; V·A·维藤巴赫; S·古特里德格
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 1996-06-27
Filing date: 1997-06-26
Publication date: 1999-07-21

Abstract

本发明涉及编码来自植物中的对羟基苯丙酮酸双加氧酶的核酸的分离和修饰。这些核酸序列用来建立抑制该酶活性的新除草剂化合物的鉴定方法,及制备能耐受这种酶的抑制剂的除草作用的新作物。包括含有编码对羟基苯丙酮酸双加氧酶的核酸序列的全部或部分的核酸片段的嵌合基因可用在微生物中生产活性植物对羟基苯丙酮酸双加氧酶,还引起在植物中该酶修饰形式的产生,使得这种植物耐受该酶的抑制剂。

Description

对羟基苯丙酮酸双加氧酶的植物基因

发明领域

本发明涉及编码来自植物中的对羟基苯丙酮酸双加氧酶的核酸的分离和修饰。这些核酸序列用来建立抑制该酶活性的新除草剂化合物的鉴定方法，及制备能耐受这种酶的抑制剂的除草作用的新作物。包括含有编码对羟基苯丙酮酸双加氧酶的核酸序列的全部或部分的核酸片段的嵌合基因可用在微生物中生产活性植物对羟基苯丙酮酸双加氧酶，还引起在植物中该酶修饰形式的产生，使得这种植物耐受该酶的抑制剂。

发明背景

脱色除草剂靠减少植物叶绿体中的叶绿素和类胡萝卜素含量影响叶绿体。已知几种脱色除草剂抑制八氢番茄红素脱氢酶，导致八氢番茄红素在处理过的植物中累积，然而苯甲酰环己烷-1,3-二酮引起八氢番茄红素在植物中积累，但在体外不抑制八氢番茄红素脱氢酶(Sandmann.G．等(1990)Pestic.Sci.30:353-355)。随后的工作揭示了这些化合物是对羟基苯丙酮酸双加氧酶的有效抑制剂(对羟基苯丙酮酸：氧氧化还原酶EC1.13.11.27)。该酶是质体醌和生育酚生物合成中的关键酶(Schulz.A．等(1993)FEBSLett.318:162-166)。根据观察，八氢番茄红素脱氢酶要求一个醌作为电子受体，这些作者推测靠抑制对羟基苯丙酮酸双加氧酶，这些除草剂阻断醌的生物合成而间接作用于八氢番茄红素脱氢酶。

类胡萝卜素生物合成需要对羟基苯丙酮酸双加氧酶的观点，已得到模式植物系统拟南芥(Arabidopsis thaliana)中的遗传研究的支持。在Pds1和Pds2遗传位点的突变导致在突变体植物中积累八氢番茄红素。但是这些突变基因的遗传图谱指出它们没有相应编码八氢番茄红素脱氢酶的基因。Pdsl突变能被对羟基苯丙酮酸双加氧酶的底物尿黑酸补救，因此这种突变相当于对羟基苯丙酮酸双加氧酶活性上的缺陷。(Norris.S.R.等(1995)Plant Cell7:2139-2149)。

根据这些公开内容，对羟基苯丙酮酸双加氧酶是新除草剂化合物大有前途的新作用目标。编码这种酶的植物基因的分离和在转基因生物中这种基因的功能表达，对以发现基于这种作用模式的新除草剂为目标的研究将是非常有利的。例如，在重组的微生物中生产的活性酶能用来建立筛选方法，用作新的活性化合物的鉴定，和获得结构及机制信息，用来指导进一步的化学合成。而且这种基因的分离将有利于以产生突变的耐受除草剂的酶形式为目标的研究，这种酶形式使转基因植物具有除草剂抗性。

已鉴定了与相应编码哺乳动物对羟基苯丙酮酸双加氧酶的序列同源的拟南芥cDNA的部分序列(GenBank登录号T20952)。但这种截短序列不足以鉴定活性的植物对羟基苯丙酮酸双加氧酶。WO96/38576A2提出了对羟基苯丙酮酸双加氧酶基因DNA序列的实用性，但与公开序列相关的功能还没有生化证据。

发明概述

本发明涉及编码植物对羟基苯丙酮酸双加氧酶的核酸片段的分离和表征，更具体而言，本发明涉及从拟南芥和玉米(Zea mays)中分离编码对羟基苯丙酮酸双加氧酶的核酸片段。

本发明也涉及在大肠杆菌(E.coli)中产生活性对羟基苯丙酮酸双加氧酶。在一个实施方案中，要求保护含有编码具有对羟基苯丙酮酸双加氧酶活性的多肽的核酸片段的嵌合基因，其操纵连接于指导基因在大肠杆菌中表达的调节序列。在另一个实施方案中，公开了包含嵌合基因的一个质粒载体，在另一个实施方案中，公开了转化的大肠杆菌，它包含一个编码具有对羟基苯丙酮酸双加氧酶活性的多肽的核酸片段组成的嵌合基因。

本发明也涉及抑制对羟基苯丙酮酸双加氧酶反应速率的物质的鉴定方法。在一个实施方案中，本发明涉及对羟基苯丙酮酸双加氧酶抑制剂的检测，其中来自于转化大肠杆菌，显示对羟基苯丙酮酸双加氧酶活性的多肽在测试物存在时温育，温育后测试对羟基苯丙酮酸双加氧酶的酶活性，其中酶活性的减少是测试物抑制能力的指示。酶活性能用任何适当的手段测试，包括但不限于氧的利用，二氧化碳释放，尿黑酸的产生和对羟基苯丙酮酸的减少。结果可用放射，比色或层析手段定量。

在另一个实施方案中，本发明涉及基本上能耐受至少一种抑制对羟基苯丙酮酸双加氧酶反应速率的化合物施用的植物，植物耐受性的获得可通过以下途径：野生型对羟基苯丙酮酸双加氧酶的过量表达，该酶的天然抗性变体的表达，或对羟基苯丙酮酸双加氧酶的改构形式的表达，这种改构形式的酶能抗抑制野生型酶的化合物的作用。

本发明的另一个实施方案中是分离的包含选自以下的成员的核酸片段：

(a)在SEQ ID NO:16中列出的分离的核酸片段；

(b)基本上类似于在SEQ ID NO:16中列出的分离核酸片段的分离核酸片段；

(c)与(a)或(b)互补的分离核酸片段。

附图简述和序列描述

从下列详述和附图中以及序列描述中能更充分地理解本发明，它们形成该申请的一部分。

图1给出了已表达序列标志(EST,GenBank登录号T92052)的部分核酸序列，其获自拟南芥cDNA文库。这个序列包含在基因文库中的克隆91B13T7中。

图2给出了编码全长拟南芥对羟基苯丙酮酸双加氧酶的克隆cDNA核酸序列，它是原始测定的(SEQ ID NO:2)，转录起始和终止密码子下画线标明，也标出了选择性的限制位点。

图3给出了从拟南芥(SEQ ID NO:15)和玉米(SEQ ID NO:11)中获得的全长对羟基苯丙酮酸双加氧酶和来源于人(SEQ ID NO:6,GenBank登录号U29895)，猪(SEQ ID NO:7,GenBank登录号D13390)，小鼠(SEQ ID NO:8,GenBank登录号D29987)和大鼠(SEQ ID NO:9,GenBank登录号M18405)的对羟基苯丙酮酸双加氧酶的氨基酸序列比较，星号表示在所有六个物种中保守的氨基酸残基，该图是用GCG堆积(Pileup)程序产生的(Program Manual for the WisconsinPackage,Version9.0-OpenVMS,December 1996,GeneticsComputer Group,575 Scince Drive,Madison,WI,USA53711)。

图4是一个描绘了中间载体pT7B1ueR+PD01．的构建图。

图5是一个描绘了大肠杆菌表达载体pE24CP1的构建图。

申请人在专利申请中提供的序列表与“专利申请中核苷酸和氨基酸的标准代码规则(EPO局长决定附录Ⅰ和Ⅱ,OJEPO,12/1992增刊No.2)和37C.F.R.1.821-1.825及附录A、B一致(含核苷酸和/或氨基酸序列的申请公开的要求)。

SEQ ID NO:1给出了GenBank登录号T92052的已表达序列标志(EST)的部分核苷酸序列，其获自拟南芥cDNA基因文库。该序列包含在基因文库的克隆91B13T7中。

SEQ ID NO:2给出了原始测定的核酸序列和编码全长形式的对羟基苯丙酮酸双加氧酶的cDNA的推断氨基酸序列。该序列包含在质粒pGBPD2中。

SEQ ID NO:3给出了根据拟南芥对羟基苯丙酮酸双加氧酶cDNA原始推断的氨基酸序列。

SEQ ID NO:4和5给出了一对互补寡核苷酸的核苷酸序列(分别为CAM32和CAM33)，其用来帮助编码没有叶绿体转运序列的对羟基苯丙酮酸双加氧酶基因的表达和亚克隆。

SEQ ID NO:6给出了来自人(GenBank登录号U29895)的对羟基苯丙酮酸双加氧酶的氨基酸序列。

SEQ ID NO:7给出了来源于猪的(GenBank登录号D13390)对羟基苯丙酮酸双加氧酶的氨基酸序列。

SEQID NO:8给出了来源于小鼠的(GenBank登录号D29987)对羟基苯丙酮酸双加氧酶的氨基酸序列。

SEQ ID NO:9给出了来源于大鼠的(GenBank登录号M18405)对羟基苯丙酮酸双加氧酶的氨基酸序列。

SEQ ID NO:10给出了编码玉米对羟基苯丙酮酸双加氧酶的克隆cDNA的核酸序列和推断氨基酸序列，它包含在质粒pMPDO中。

SEQ ID NO:11给出了编码玉米对羟基苯丙酮酸双加氧酶的克隆cDNA的推断氨基酸序列，它包含在质粒pMPDO中。

SEQ ID NO:12给出了拟南芥的对羟基苯丙酮酸双加氧酶的截短形式的核酸序列和推断氨基酸序列，包含在pE24CP1中。

SEQ ID NO:13给出了包含在pE24CP1中的拟南芥对羟基苯丙酮酸双加氧酶的截短形式的氨基酸序列。

SEQ ID NO:14给出了编码全长的拟南芥对羟基苯丙酮酸双加氧酶的克隆cDNA的校正核酸序列和推断氨基酸序列，它包含在质粒pGPPD2中。

SEQ ID NO:15给出了从编码全长的拟南芥对羟基苯丙酮酸双加氧酶的cDNA中推断的校正氨基酸序列。

SEQ ID NO:16给出了包含在克隆vsl.pk0015.b2。中来自Vernonia galamenesis cDNA一部分的测定核酸序列。

发明详述

生物保藏

以下生物材料按布达佩斯条约保藏于美国典型培养物保藏中心(ATCC),12301 Parklawn Drive,Rockville,MD20852，登录号如下：

保藏者标识国际保藏宿主菌株质粒登录号保藏日期大肠杆菌BL21(DE3) pE24CP1 ATCC98083 1996.6.25

N/A pGBPPD2 ATCC97622 1996.6.25

N/A pMPD0 ATCC209120 1997.6.12

定义

在公开内容的上下文中运用了许多术语。用在这里的术语“核酸”指由单体(核苷酸)组成进而形成单链或双链的大分子，单体含有一个糖，磷酸，和嘌呤或嘧啶。一段“核酸片段”是已知的核酸分子的一部分。用在此处的“DNA”(脱氧核糖核酸)是遗传物质，而“RNA”(核糖核酸)参与DNA编码的信息传递到蛋白质或多肽。“基因组”是在一种生物的每个细胞中的遗传物质的全体。术语“核苷酸序列”指单链或双链的DNA或RNA的聚合物，任选含能掺进DNA或RNA聚合物的合成，非天然或改构的核苷酸碱基。

用在这里的“基本上类似”指DNA序列可能涉及碱基变化，但不引起编码的氨基酸变化，或涉及的碱基变化可能改变一个或多个氨基酸，但不影响DNA序列编码的蛋白质的功能特性。因此，可以理解本发明不仅包括特定的示例序列，也包括对序列的修饰例如序列中的缺失，插入，或替换产生的“沉默变化”(即基本不影响所得蛋白分子功能特性的变化)。例如也包括在基因序列中反映遗传密码的简并或导致在给定位点产生化学性质相当的氨基酸的变化。因此丙氨酸，一种疏水性氨基酸，其密码子能被另一个疏水性较弱的氨基酸的密码子替换，例如甘氨酸，或被疏水更强的残基例如，缬氨酸，亮氨酸或异亮氨酸替换。与此类似，由一个负电荷残基替换另一个负电荷残基，例如天冬氨酸替换谷氨酸，或一个正电荷残基替换另一个正电荷残基，例如赖氨酸替换精氨酸导致的变化，预期也会产生生物等价产物。导致蛋白质分子N末端和C末端变化的核苷酸变化预期也不改变蛋白质的活性。在某些情况下，为了研究变化对蛋白质生物活性的影响，事实上需要作一些序列突变。提出的每种修饰在本领域是常规的技术，测定编码产物的生物活性保留也是常规技术。并且，本领域技术人员理解，本发明包括的基本相似序列也用在严紧条件下(0.1×SSC,0.1％SDS,65℃)与这里的示例序列杂交的能力来限定。

“基因”是编码一个特定蛋白的核酸片段，包括编码区上游(5’非编码区)和下游(3’非编码区)的调节序列。“天然”基因指在自然条件下发现、有其调节序列的基因。“嵌合”基因指包含异源调节序列和编码序列的基因。“内源”基因指正常情况下见于基因组的天然位点的天然基因。“外源”基因指正常情况下在宿主生物中不存在，而由基因转移引入的基因。

“编码”序列是编码特定蛋白的一段DNA序列，不包括非编码序列。

“起始密码子”和“终止密码子”指三联体核苷酸单位，在编码序列中分别指示蛋白质合成(mRNA)的起始和终止。“可读框”指在编码序列的翻译起始和终止密码子之间编码氨基酸的序列。

“RNA转录物”指由RNA聚合酶催化DNA序列转录的产物。当RNA转录是DNA序列的完全互补拷贝时，它是指初级转录物或可以是来源于初级转录物的转录后加工的RNA序列。“信使RNA”(mRNA)指能被细胞翻译成蛋白质的RNA。“cDNA”指双链DNA，其中一条链通过反转录来源于mRNA并与其互补。“有义RNA”指包括mRNA的RNA转录物。

这里用的“调节序列”是指控制编码序列的转录或表达的核酸序列，位于编码序列的上游(5’)、内部或(3’)下游，其与细胞的蛋白生物合成装置共同起作用，包括启动子，翻译先导序列，转录终止序列和聚腺苷酸化序列。

“启动子”指基因中的一段DNA序列，通常在编码序列的上游(5’)，它通过提供RNA聚合酶和正确转录所需的其它因子的识别控制编码序列的表达。一个启动子也可能含有参与蛋白质因子结合的DNA序列，蛋白质因子对生理或发育条件发生应答，控制转录的起始效率。在真核生物中，启动子可能含有增强子元件。

“增强子元件”是能刺激启动子活性的DNA序列。它可能是启动子内部的自身元件或插入的增强启动子活性水平和组织特异性的异源元件。“组成型启动子”指在所有组织和所有时间指导基因表达的增强子元件。“器官特异性”或“发育特异性”启动子指几乎仅在特殊器官例如叶或种子，或特殊发育阶段，例如在胚胎发育的早期或晚期指导基因表达的序列。

术语“操纵连接”指在单一核酸分子上相连的核酸序列，连接结果是一个的功能能被另一个的功能影响，例如启动子与一个结构基因操纵连接(即编码对羟基苯丙酮酸双加氧酶的基因，这里已公开)，则它能影响结构基因的表达(即结构基因在启动子的转录控制之下)。

术语“表达”用在这里意味着一个基因编码的蛋白质产物的产生。更具体而言，“表达”指来源于本发明的核酸片段的有义RNA(mRNA)的转录和稳定积累，连带着细胞的蛋白合成装置的积累，导致蛋白质产物水平的改变。“过量表达”指在转基因生物中基因产物的生产超过了正常或非转化生物的生产水平。“改变水平”指在转基因生物中基因产物的产生在量或比例上不同于正常或非转化生物。“促进表达”指培养含目的基因的宿主细胞的步骤和条件能生产出增加的酶产量。例如加入与基因操纵连接的特定启动子特异性的化学诱导物会促进其编码酶的表达。该测试相对于来处理基因的生产水平。

“3’端非编码序列”指基因的DNA序列部分，含有聚腺苷酸化信号和能影响mRNA加工或基因表达的其它调节信号，聚腺苷酸化信号特点是通常影响聚腺苷酸片段加到mRNA前体的3’末端。

“翻译先导序列”指在基因的启动子和编码序列之间的DNA序列部分，它能转录成RNA和出现在完全加工的mRNA翻译起始密码的上游(5’)，翻译先导序列可影响初级转录物到mRNA的加工，mRNA的稳定性或翻译效率。

“转化”这里指外源基因转移进宿主生物的基因组中及其稳定遗传。细菌的转化可通过本领域中众所周知的几种方法的任一种进行，包括氯化钙介导的转化和电穿孔。植物转化方法的实例包括农杆菌(Agrobacterium)介导的转化和粒子加速或“基因枪”转化技术(美国专利4,945,050)。

“宿主细胞”指用引入的遗传物质转化的细胞。

“质粒载体”指双链闭环的染色体外DNA分子。

“耐受”或“耐性”指如下的情况，即一种细胞或生物能抵抗一种化合物或组合物以某种浓度或速率施用的影响，而上述施用引起非耐受细胞或生物的明确的效果。例如，能耐受除草剂化合物或组合物施用的植物生长或生存受到的影响较不能耐受此除草剂化合物或组合物施用的植物为小。

编码对羟基苯丙酮酸双加氧酶的植物基因的克隆

来自植物的对羟基苯丙酮酸双加氧酶是作为新除草剂化合物的一类新的有前途的作用靶，为了能详细研究这种酶，并适量提供该酶用于抑制剂筛选，鉴定了编码对羟基苯丙酮酸双加氧酶的cDNA克隆，这些核酸片段可用于它们编码的酶的表达，也用于从编码其它对羟基苯丙酮酸双加氧酶的其它植物来源的克隆的分离和理解这些酶的生化和结构特性。

现已从植物拟南芥中分离到核酸片段，该片段包括编码对羟基苯丙酮酸双加氧酶的不同形式的核苷酸序列，随后这些核苷酸序列在大肠杆菌细胞中表达，显示出能指导对羟基苯丙酮酸双加氧酶的合成。

在拟南芥属(Arabidopsis)cDNA文库数据库中进行核苷酸序列自动检索，检索与其它已知的非植物对羟基苯丙酮酸双加氧酶基因同源的序列，结果为质粒cDNA克隆91B13T7，这个cDNA是从俄亥俄州立大学拟南芥属(Arabidopsis)种子贮藏中心(the ArabidopsisSeed Stock Center at Ohio State University)获得的。制备了适合于核苷酸序列测定的质粒DNA并测定了质粒插入的核苷酸序列。最终结果序列不可判读，意味着可能有外源核酸污染。用限制性酶消化质粒DNA和琼脂糖凝胶电泳分离消化后的核酸片段，证实了这种假设。该分析显示存在不可能来自于带有推断的对羟基苯丙酮酸双加氧酶片段的质粒的核酸片段。此外，对向公众开放的核酸序列数据库的检索显示报道的cDNA克隆91B13T7中拟南芥序列与截短的cDNA相当(图1)。根据向公众开放的对羟基苯丙酮酸双加氧酶的哺乳动物cDNA序列信息，预计编码完整对羟基苯丙酮酸双加氧酶的最小长度是1kb(表1)

表1

预计编码对羟基苯丙酮酸双加氧酶的序列的cDNA长度

生物体氨基酸残基最小cDNA(kb)

人 392 1.176

猪 392 1.176

假单胞杆菌 357 1.071

因此根据能编码一个有功能的对羟基苯丙酮酸双加氧酶的cDNA的预计长度，从公开数据库中获得的拟南芥序列不足以编码一个全长有活性的对羟基苯丙酮酸双加氧酶，因此克隆了一个能编码拟南芥全长酶的cDNA，如本文所述。用限制性酶消化质粒91B13T7，其中插入的一段400bp片段释放出来，用于筛选从norflurazon处理的拟南芥幼苗中制备的cDNA文库(Scolnik.P.A．和Bartley.G.E.(1994)植物生理104:1469-1470)。对与这种探针显示阳性杂交的几个克隆测序，从这个结果获得的最长cDNA克隆序列的原始测定显示在图2和SEQ ID NO:2中，对该克隆接着工作时，证实该序列的特征就变得必要了，这个cDNA修正序列在SEQ.ID.NO:12中给出。

报道在图2中的序列表示该cDNA能编码一个分子量48,841的蛋白，如图3所示，它与来源于其它真核生物的对羟基苯丙酮酸双加氧酶有很高同源性。

从玉米中获得了编码全长对羟基苯丙酮酸双加氧酶的cDNA，使用拟南芥属cDNA中的大约900bp作为探针，在玉米cDNA文库中鉴定了包含在质粒pMPDO中的该cDNA，预计的玉米cDNA编码的氨基酸序列与来自其它真核生物的对羟基苯丙酮酸双加氧酶在图3中作了比较。

制备了从Vernonia galamenensis发育种子中分离的信使RNA的cDNA文库，对文库克隆的随机测序鉴定了一个可能为这种植物的对羟基苯丙酮酸双加氧酶的克隆，命名为vsl.ok0015.b2.。该513bp的已表达序列标志(EST)在SEQ.ID.NO:16中给出。编码时羟基苯丙酮酸双加氧酶的拟南芥cDNA在大肠杆菌中的表达

本发明编码植物对羟基苯丙酮酸双加氧酶的核酸片段能操纵连接合适的调节序列，从而产生用来指导酶在转基因植物中表达的嵌合基因。这些转基因生物包括但不限于：植物(Plant Mo1.Biol.,Croy,R.R.D.,Ed；Bios Scienrific Publisher；1993)；微生物，包括大肠杆菌(Gold,L.(1990)酶学方法185:11),枯草芽胞杆菌(Bacillus subtilis)(Henner D.J.(1990)酶学方法185:199)，酵母(Gellissen,G.，等(1992)Antonie Leeuwenhoek62:79)和真菌，包括曲霉属(Aspergillus)的一些成员(Devchand,M.和Gqtnne.D.I.(1991)生物技术杂志，17:3)；和含重组杆状病毒的昆虫细胞(Lukow,V.A.和Summers.M.D.(1988)Bio/Technology6:47)。

本领域的技术人员可通过利用或产生限制性酶位点来分离来自本发明片段的编码序列，例见Sambrook,J.，等((1989)《分子克隆实验手册》第二版，冷泉港实验室出版，以下称为“Maniatis”)。或者利用聚合酶链反应(PCR)技术来分离和/或修饰本发明的片段(Newton,C.R.和Graham.A(1994)PCR；Bios ScientificPublishers)。

在一株表达T7 RNA聚合酶的T7启动子控制下，在大肠杆菌中表达拟南芥对羟基苯丙酮酸双加氧酶(Studier,F.W.等(1990)酶学方法185:60)。除T7外的启动子一般用在表达载体中，能替换使用在大肠杆菌中的蛋白表达。可替换的启动子实例包括但不限于trp(Yansura.D.G.和Henner.D.J.(1990)酶学方法185:54),PL(Remaut.E.等(1981)基因15:81),tac(Amann.E.等(1983)基因25:167)trc(Amann.E.等(1988)基因69:301)和lacUV5,lpp,PR等启动子以及特别构建结合特殊性质以增加强度或调节能力的杂合和串联启动子(Balbas.P.和Bolivar.F.(1990)酶学方法185:14)。

酶功能的生化证据

对羟基苯丙酮酸双加氧酶催化对羟基苯丙酮酸与分子氧的反应，产生尿黑酸和二氧化碳。酶的测定方法如下：测量氧的利用(Hager,S.E.等(1957)J.Biol.Chem.225:935-947)，测定从放射性标记的对羟基苯丙酮酸来源的二氧化碳和尿黑酸的生成(Lindbkad,B,(1971)Clin.Chem.Acta 34:113-121)，对羟基苯丙酮酸的减少(Lin.E.C.C.等(1958)J.Biol.Chem.,233:668-673)或在HPLC或类似的层析分离技术后用比色法(Fellman.J.H.等(1972)生物化学与生物物理学报，284:90-100)或用紫外检测尿黑酸的生成。对羟基苯丙酮酸双加氧酶活性也可通过偶联试验测定，其中起始产物尿黑酸在尿黑酸加氧酶作用下，形成马来酰乙酰乙酸，在330nm测量吸收值可测定其量(Fernandez-Canon,J.M.和Penalva,M.A.(1997)分析生物化学，245:218-221)。

对羟基苯丙酮酸双加氧酶的动力学测定的两种可选择的方法是终点测定或固定时间测定。其方法是根据未转化的底物对羟基苯丙酮酸在硼酸盐离子存在下，靠异构酶转化成烯二醇异构体，测定该异构体的308nm的特征峰(Lin.E.C.C.等(1958)J.Biol.Chem.233:668-673)。测试方法包括在200μl测试缓冲液中加入足够的对羟基苯丙酮酸双加氧酶，一个多小时后消耗该有机物底物的80％，这种情况下的缓冲液是50mM Tris,pH7.4,0.10mM对羟基苯丙酮酸，1.75mM抗坏血酸和1.25mM EDTA。反应1小时后加入100μl0.8M硼酸盐，pH7.3终止反应，其中含1000ppb的对羟基苯丙酮酸双加氧酶抑制剂和0.25μl 6.1mg/ml的异构酶，温育30分钟后，在308nm测定吸收值，此后稳定2小时。这种测试动力学方法的优点是对羟基苯丙酮酸双加氧酶无需在存在高浓度硼酸盐时氧化底物，该条件可能干扰抑制剂的作用模式。此外，该测试方法基本是对羟基苯丙酮酸双加氧酶抑制的稳定等分显示，也非常适合于要求高流通量的样品及试验。

由核酸片段编码在大肠杆菌中过量表达的酶，通过一些用来抽提可溶性植物酶的常规缓冲液可抽提出来。虽然，大量的过量表达蛋白经常不溶解，但可溶酶的量可达到整个可溶蛋白的50％，可溶的过量表达蛋白有很高的对羟基苯丙酮酸双加氧酶活性并容易抽提。同样地，在合适条件下，可能将不溶性过量表达蛋白重新溶解成活性形式，因为加入肌氨酰(十二烷基肌氨酸钠)到抽提缓冲液中，似乎提高过量表达蛋白的抽提量，为获得最佳活性，应存在还原试剂，例如抗坏血酸或还原性的谷胱甘肽，以及亚铁离子。

过量表达的酶能用以上描述的测定对羟基苯丙酮酸双加氧酶活性的各种技术测试，而只有用标记对羟基苯丙酮酸的技术能用来测定原始的植物抽提液的活性。因此，过量表达酶的获得可大大促进鉴定酶抑制剂的高效筛选。潜在抑制剂通过以下方式评价：它们减少酶反应速率的能力，导致减少氧的吸收和二氧化碳的释放，降低尿黑酸的形成速率及对羟基苯丙酮酸的减少。申请人已证实本发明的核苷酸片段中至少有一种在大肠杆菌细胞中能过量表达，导致能催化对羟基苯丙酮酸转化成尿黑酸并伴随二氧化碳释放的蛋白质的产生。而且，还显示已知抑制对羟基苯丙酮酸双加氧酶的商业除草剂能抑制这种活性。最后，过量表达的酶能用在鉴定抑制对羟基苯丙酮酸双加氧酶活性的化合物的高效试验中，该化合物可用作除草剂。

耐受对羟基苯丙酮酸双加氧酶抑制剂的植物的制备

本发明包括能抗或至少能耐受除草剂的植物，该除草剂以对羟基苯丙酮酸双加氧酶为靶，正常情况下能抑制天然产生的对羟基苯丙酮酸双加氧酶。该改构的对羟基苯丙酮酸双加氧酶活性是通过以下方法获得的(1)野生型对羟基苯丙酮酸双加氧酶的过量表达，或(2)编码耐受除草剂的酶的DNA分子的表达。该酶是自然条件下在真核生物或原核生物中产生的对羟基苯丙酮酸双加氧酶的修饰形式，或自然条件下产生在植物中的对羟基苯丙酮酸双加氧酶的修饰形式，或在自然条件下在原核生物中产生的耐受除草剂的酶(Duke等，HerbicideResistant Crops；hewis；Boca Raton:1994)。使植物组织细胞基本能耐受除草剂的基因表达的有效量，取决于基因是编码未改构的对羟基苯丙酮酸双加氧酶的基因还是编码对除草剂不敏感的酶的突变或改构形式的基因。一个未改构的植物对羟基苯丙酮酸双加氧酶基因表达的有效量，是使除草剂耐受增加2至10倍的量。本发明的植物基因包括单子叶植物和双子叶植物基因，优选为抑制对羟基苯丙酮酸双加氧酶的抑制剂潜在作用靶的植物，特别是农艺上重要的作物，例如玉米和其它谷类作物。

对羟基苯丙酮酸双加氧酶活性表达水平较天然表达量增加2倍到10倍或更多倍，将足以克服由除草剂引起的生长抑制。含有改构的对羟基苯丙酮酸双加氧酶活性的植物可通过在植物中直接选择而获得，这种方法在本领域中是已知的。例见美国专利5,162,602，美国专利4,761,373及其中所引参考文献。

对羟基苯丙酮酸双加氧酶的过量表达，也能用嵌合基因DNA分子稳定转化宿主植物细胞而完成，该嵌合基因包括一个在植物细胞中能驱动连接编码序列表达的启动子，其操纵连接一个同源或异源的编码对羟基苯丙酮酸双加氧酶的编码序列，“同源”对羟基苯丙酮酸双加氧酶基因是从分类上与靶植物细胞相同的生物中分离的，而“异源”对羟基苯丙酮酸双加氧酶基因是从分类上与靶植物细胞不同的生物中分离的。

植物中外源基因的表达已很成熟(De Blaere等(1987)酶学方法143:277-291)。用来驱动基因在转基因植物或植物细胞中表达的启动子(即那些能驱动连接的编码序列例如对羟基苯丙酮酸双加氧酶编码序列在植物细胞中表达的启动子)，包括那些在花椰菜花叶病毒中指导19S和35S转录物表达的启动子(Odell等(1985)Nature,313:810-812；Hull等(1987)病毒学，86:482-493),1,5二磷酸核酮糖羧化酶小亚单位(Morelli等(1985)Nature,315:200-204,Broglie等(1984)Science224:838-843；Hererra-Estrella等(1984)Nature,310:115-120；Coruzzi等(1984)EMBO J,3:1671-1679；Faciotti等(1985)Bio/Technology,3:241)和叶绿素a/b结合蛋白(Lamppa等(1986)Nature,316:750-752)；胭脂碱合酶启动子(Depicker等(1982)J.Mol.App.Genet.1:561-573；An等(1990)Plant Cell,2:225-233)。本发明的嵌合DNA构建体可含有多拷贝启动子或多拷贝对羟基苯丙酮酸双加氧酶的编码序列。此外，该构建体可包括选择性标记的编码序列和其它肽例如信号或转运肽的编码序列。这种构建体的制备在本领域技术人员的能力之内。植物类胡萝卜素生物合成途径的抑制剂抗性已通过表达CaMV启动子驱动的编码八氢番茄红素脱氢酶的细菌基因获得，该生物合成途径也是对羟基苯丙酮酸双加氧酶抑制剂的作用靶。(Misawa等(1994)植物杂志4:481-490)。

转运肽可与本发明嵌合基因DNA构建体中对羟基苯丙酮酸双加氧酶的编码序列融合，指导表达的对羟基苯丙酮酸双加氧酶运输到希望的作用位点。转运肽的实例包括叶绿体转运肽，例见Von Heijne等(1991)Plant Mol.Biol.Rep,9:104-126；Mazur等，(1987)PlantPhysiol,85:1110；Vorst等(1988)Gene,65:59，和线粒体转运肽，例见Boutry等，(1987)Nature,328:340-342。

可以想象增强子或增强子类似元件引入启动子构建体也将使初始转录物的水平增加，从而完成本发明。这些包括病毒增强子，例如见于35S启动子中的增强子(Odell等(1988)Plant Mol.Biol.,10:263-272)，来自冠瘿碱基因的增强子(Fromm等(1989)Plant Cell1:977-984)，或来自其它来源置于操纵连接本发明核酸片段的启动子中时导致转录增加的增强子。

从玉米Adh-1和Bz-1基因分离的内含子(Callis等，(1987)GeneDev.,1:1183-1200)和玉米Shrunken-1(sh-1)基因的内含子1和外显子1(Maas等，(1991)Plant Mol.Biol.,16:199-207)也可用来提高引入的基因的表达。玉米的醇脱氢酶基因的第一个内含子(Adh-1)的结果表明，当该元件置于一个外源基因的转录单位中，mRNA的水平比正常水平提高了6.7倍。用玉米肌动蛋白基因的内含子3观察到了类似水平的内含子增强(Luehrsen.K.R.和Qalbot.V.(1991)Mol.Gen.Genet.225:81-93)。也注意到了基因表达为Adh1内含子6所增强(Oard等，(1989)Plant Cell Rep 8:156-160)。在玉米悬浮培养中，玉米sh-1基因的外显子1和内含子1显示各自能增加的报道基因表达量分别为10倍和100倍。当联合使用时，这些元件显示能使报道基因表达量增加1000倍(Maas等(1991)Plant Mol.Biol.,16:199-207)。

任何能提供聚腺苷酸化信号和其它正确表达所需的调节序列的3’非编码区能用来完成本发明。这包括贮藏蛋白的3’末端，例如10kd,15kd,27kd和α玉米醇溶蛋白基因的3’末端，菜豆蛋白基因的3’末端，大豆β-conglycinin基因的3’末端，病毒基因的3’末端，如花椰菜花叶病毒35S或19S转录物3’末端，来自冠瘿碱合成基因的末端，1,5二磷酸核酮糖羧化酶或叶绿素a/b结合蛋白的3’末端，或任何来源的3’末端，使得所用的序列在其核酸序列内部提供必要的调节信息，导致与其操纵连接的启动子/编码区的正确表达。在本领域中有许多实例给出了不同3’非编码区用途的教导(例见Ingelbrecht等，(1989)Plant Cell,1:671-680)。

本领域技术人员熟知各种引入DNA序列到高等植物真核细胞(即转化)的方法(见EPO出版物0295959A2和0138341A1)。这种方法包括用核酸构建体包被的金属粒子高速弹道式轰击(见Klein等(1987)Nature，(伦敦)327:70-73和美国专利4,945,050)，以及利用基于农杆菌Ti和Ri质粒的转化载体的方法，特别是这些载体的穿梭载体。Ti衍生载体转化宽范围的各种高等植物，包括单子叶植物和双子叶植物，例如大豆，棉花和欧洲油菜(Pacciotti等(1985)Bio/Technology,3:241；Byme等(1987)Plant Cell,Tissueand Organ Culture,8:3；Sukhapinda等(1987)Plant Mol.Biol.,8:209-216；Lorz等(1985)Mol.Gen.Genet.,199:178-182；Potrykus等，(1985)Mol.Gen.Genet.,199:183-188)。

本领域技术人员也可利用其它转化方法，例如直接摄入外源DNA构建体(见EPO出版物0295959A2)和电穿孔技术(见Fromm等(1986)Nature，(伦敦)319:791-793)。细胞一旦转化，本领域的技术人员就能再生它。最近介绍了一些将核酸片段引入商业上重要的作物的有关方法，例如引入油菜(见De Block等(1989)Plant Physiol,91:694-701)，向日葵(Everett等(1987),Bio/Technology,5:1201-1204)，大豆(McCabe等(1988)Bio/Technology,6:923-926；Hinchee等，(1988)Bio/Technology,6:915-922；Chee等(1989)Plant Physiol,91:1212-1218；Christou等，(1989)Proc.Nat1.Acad.Sci.USA,86:7500-7504,EPO出版物0301749A2)，和玉米(Gordon-Kamm等(1990)Plant Cell,2:603-618；和Formm等(1990)Bio/Technology,8:833-839)。

改构的对羟基苯丙酮酸双加氧酶活性也可通过分离的真核对羟基苯丙酮酸双加氧酶编码序列的修饰形式的产生或鉴定而得到，该编码序列至少含有一个氨基酸替换，增加或缺失，它编码一个改构的对羟基苯丙酮酸双加氧酶，能抗抑制未改构的天然产生酶的除草剂。编码这种酶的基因能通过本领域已知的许多策略获得。第一种策略涉及在微生物(例如，大肠杆菌，酿酒酵母(Miller,(1972)分子遗传实验，冷泉港实验室，冷泉港，纽约；Davis等，(1980)高级细菌遗传，冷泉港实验室，冷泉港纽约；Sherman等(1983)酵母遗传学方法，冷泉港实验室，冷泉港，纽约，和美国专利4,975,374)和蓝细菌(Bryant，蓝细菌的分子生物学；Kluwer Academic Publishers，波士顿，1995。)中直接或间接诱变的方法。第二获得真核对羟基苯丙酮酸双加氧酶的突变抗除草剂等位基因的方法涉及在植物中直接选择，例如，抑制剂对植物例如拟南芥，大豆，玉米生长的影响，可通过该领域已知的方法在平皿上种植无菌种子来测定，平皿中含浓度增加的抑制剂的简单中性盐培养基。可重复检测的显著生长抑制的最低剂量用于随后的实验。在选定群体中，植物材料的诱变可用来增加抗性等位基因的频率。诱变的种子材料可从各种途径得到，包括化学或物理诱变种子，或化学或物理诱变花粉(Neuffer玉米的生物学研究，Sheridan,ed,Univ.Press.Grand Forks.ND.pp.61-64(1982))，然后将其用来使植物受精，收集所得的M1代突变种子，一般，对拟南芥而言，M2代种子(由化学手段如甲基磺酸乙酯或物理手段如γ射线或快中子诱变的种子长成的植株的种子)在含合适浓度抑制剂的简单中性盐培养基中的密度达到10000粒/平皿(10cm直径)。在平皿中处理后，能继续生长并能保持绿色7-21天的幼苗移植到土壤中，长到成熟，获得种子。测试这些种子的后代对除草剂的抗性，如果抗性性状是显性，种子分离比为3∶1(抗性：敏感)的植物被认为在M2代中为抗性杂合体。全部产生抗性种子的植物被认为在M2代中为抗性纯合体。这种对未处理种子的诱变及筛选其M2代子代也可在其它植物种类中例如大豆(见例如美国专利5,084,082)中进行。耐受除草剂的突变种子也可通过与物理或化学手段诱变的花粉受精后筛选获得。

实施例1

拟南芥对羟基苯丙酮酸双加氧酶cDNA的克隆

含有拟南芥9lBl3T7已表达序列标志的质粒(Newman等(1994)Plant Physiol,106:1241-1255)用限制性酶BamHⅠ和EcoRⅠ消化，得到的400bp的片段按照以下方法用来筛选拟南芥幼苗的λ噬菌体cDNA文库(Scolnik.P.A．和Bartley,G.E.(1994)PlantPhysiol,104:1469-1470)。

大肠杆菌KW251细胞在含0.2％麦芽糖和10mM MgSO₄的LuriaBroth(LB)中过夜生长。离心使细胞沉淀，重悬浮在10mM MgSO₄中至OD₆₀₀为0.5。在45℃时一等份(0.8毫升)细胞与0.1毫升稀释的噬菌体样品和7毫升上层琼脂糖(在含10mM MgSO₄的LB中含0.7％的琼脂糖)混合，涂布接种在含LB琼脂的培养皿中，在5-7小时内，噬菌斑变得可见，此时将平皿放在4℃。

噬菌斑按标准操作技术转移到硝酸纤维素滤膜上，滤膜与按Feinberg和Vogelstein((1983)Anal.Biochem.132:6-13)的方法制备的³²P标记探针杂交，使用Berlyn等((1989)Proc.Natl.Acad.Sci.86:4604-4608.)的杂交条件。X光胶片上曝光48小时后，洗出12个阳性斑，在同样条件下涂布接种和杂交。在第二轮杂交仍然保持阳性信号的9个噬斑，用Exassist/SOLR^TM系统按厂商说明进行体内切割(Stratagene Cloning Systems.LaJolla,CA)。制备体内切割为阳性的噬斑的质粒DNA，使用WizardPlus^TM试剂盒测序(Promeg Madixon.WI.)。8个测序的克隆显示与现有的对羟基苯丙酮酸双加氧酶有强烈的保守性，而另一个克隆与对羟基苯丙酮酸双加氧酶不对应。与已知的对羟基苯丙酮酸双加氧酶序列对比也揭示2个克隆与转录物3’末端的0.3kbp片段对应，而另两个克隆与转录物5’末端的1.2kbp片段对应。每种一个克隆通过在NheⅠ限制位点连接用来组装一个1.5kbp的cDNA(图1)。所得cDNA克隆的DNA序列(SEQ ID NO:2)的原始测定显示在图2中，该DNA片段随后的工作需要确证其序列的某些特征。发现列出的大约10个核苷酸残基是错误的。该DNA的修正序列在SEQ ID NO:14中列出，其推断的氨基酸序列给出在SEQ ID NO:15中。校正的序列为本文报道用于分析和比较的碱基。

实施例2

在大肠杆菌中拟南芥属cDNA的过量表达

拟南芥属对羟基苯丙酮酸双加氧酶的推断氨基酸序列与来自小鼠，猪和Streptomyces avermitilis的对羟基苯丙酮酸双加氧酶的氨基酸序列用GCG堆积程序进行序列对比(Program Manual for theWisconsin Package,Version 8,September 1994,GeneticsComputer Group,575 Science Drive,Madison,WI USA 53711)。这种分析表明，在拟南芥属序列(图3和SEQ ID NO:31-29位)的氨基末端有额外的29个氨基酸突出，这种氨基末端突出被认为是一个叶绿体转运肽，该转运肽在成熟酶中是缺失的。因此，叶绿体转运肽编码序列的去除与对羟基苯丙酮酸双加氧酶编码序列从克隆载体转移进表达载体相符合。

通过中间克隆载体pT7BlueR(Novagen)，将拟芥属对羟基苯丙酮酸双加氧酶cDNA从Bluesript SK-克隆载体(Stratagene,LaJolla,CA)转移到pET24c(+)表达载体中(Novagen,Madison,WI)，质粒pGBPPD2由拟南芥属对羟基苯丙酮酸双加氧酶cDNA和pBluescript SK-克隆载体(Stratagene)组成。质粒pE24CP1由没有推断的叶绿体转运肽DNA序列的拟南芥属对羟基苯丙酮酸双加氧酶cDNA和pEt24c(+)表达载体(Novagen)组成。

质粒pGBPPD2和pT7BlueR(每个5μg)各自用20单位的XbaⅠ(New England Biolabs,NEB,Beverly,MA)和20单位的HindⅢ(Gibco BRL,Gaithersburg,MD)在补加了100μg/mL牛血清白蛋白的NEB限制酶缓冲液2中，37℃时消化1.75小时，用限制酶XbaⅠ和HindⅢ消化pGBPPD2分别从pBluescript SK-多接头释放出对羟基苯丙酮酸双加氧酶cDNA的5’末端和3’末端。用TRIS/乙酸/EDTA(TAE)缓冲液在1％琼脂糖凝胶中电泳分离消化产物并用溴化乙锭染色显示(Maniatis)。pGBPPD2用两种限制性内切酶消化产生2922bp的载体带和1499bp的对羟基苯丙酮酸双加氧酶cDNA带。用两种酶消化pT7BlueR后只有一条2863bp的带是明显的，但也形成24bp片段。1499bp的对羟基苯丙酮酸双加氧酶带和2863bp的T7BlueR带从胶上切下，用QIAquick Gel Extraction Kit(Qiagen,Chatsworth,CA)按厂商说明从琼脂糖中将DNA纯化。纯化的DNA样品加入乙酸钠(pH5.2)至0.3M,10μg tRNA(加入作为载体)和2倍体积的-20℃乙醇，在-20℃下过夜温育沉淀。离心收集核酸沉淀，用70％乙醇洗涤，在空气中干燥。两种沉淀都溶解在10μL TRIS/EDTA(TE)缓冲液，pH8(Maniatis)中。每个样品取1μL加样在1％琼脂糖TAE胶分离槽中，相邻的槽含有4μL分子量梯度(Gibco BRL)，所有的样品上样前用水调到10μL。溴化乙锭着色并紫外照射，通过比较每个样品带的强度与分子量梯度带的强度对DNA定量。

大约300ng对羟基苯丙酮酸双加氧酶插入片段与300ng双酶切的pT7BlueR载体在7μL总体积中混合，接着加热至45℃ 5分钟，紧接着在冰上冷却。T4 DNA连接酶缓冲液(Gibco BRL)和1单位的T4 DNA连接酶(Gibco BRL)加入到冷却的DNA中至总体积为10μL，连接混合物在室温下温育4小时，然后按照标准方法(Maniatis)转化进大肠杆菌MAX有效DH5α感受态细胞(Gibco BRL)中，转化的细菌涂布到补加了100μg/mL羧苄青霉素的LB琼脂平板中，在37℃下温育过夜。选择17个菌落用于随后的分析，每个菌落中的一部分接种到单独的17×100mm聚丙烯培养管中(Falcon,Lincoln Park,NJ)，其中含2mL液体LB培养基，200μg/mL的羧苄青霉素。液体的细菌培养物在37℃下振荡(250rpm)温育过夜。质粒DNA用QIAprep Spin Plasmid Miniprep Kit(Qiagen)按制造厂商的说明分离。每种质粒制备物的一部分(50μL中取出5μL)用10单位HindⅢ和10单位的EcoRⅤ(Gibco BRL)在总体积为15μL的反应2缓冲液(Gibco BRL)中消化1小时(注意：在制备pGBPPD2时破坏了pBluescript多接头中的EcoRⅤ位点，所以只有在pT7BlueR多接头中的EcoRⅤ位点可被限制酶消化)。样品在1％琼脂糖和TRIS/硼酸盐/EDTA(TBE)缓冲液(Maniatis)中电泳分离，用溴化乙锭着色显示带。17个样品中7个含2条带(2837和1525bp)，其中包含对羟基苯丙酮酸双加氧酶插入片段，命名为pT7BlueR+PDO1(见图4)。

为了去掉推断的叶绿体转运序列，pT7BlueR+PDO1每种制备物其余45μL合并成单一样品，DNA含量在A₂₆₀用分光光度法测定(Maniatis)。部分pT7BlueR+PDO1(5μg)用16单位Eco47Ⅲ(MBIFermentas)在含缓冲液0(MBIFermentas)的100μL总体积中，37℃时消化2小时，消化的质粒DNA用乙酸钠和乙醇按以上描述沉淀，最终干燥的沉淀溶解在60μL含20单位NdeⅠ(Gibco BRL)的反应2(Gibco BRL)缓冲液中，在37℃温育2小时。双酶消化的样品上样在TAE中的1％琼脂糖凝胶中，较大的4166bp Nde I-Eco47Ⅲ片段与196bp片段电泳分离，大片段从胶中切下，按以上描述从琼脂糖中纯化和沉淀出来。

在9.9μL的总体积中，制备由寡聚物CAM32和CAM33(分别为SEQID NOS:4和5)每种100pmol组成的寡核苷酸混合物。两种寡聚物彼此互补形成一个3’平末端，相应于Eco47Ⅲ限制位点的5’端一半，还形成一个5’端交错末端，相应于NdeⅠ限制位点的3’端一半。

CAM32:(SEQ ID NO:4)

5’-TATGTCCAAGTTCGTAAGAAAGAATCCAAAGTCTGATAAATTCAAGGTTAAGC-3’

CAM33:(SEQ ID NO:5)

5’-GCTTAACCTTGAATTTATCAGACTTTGGATTCTTTCTTACGAACTTGGACA-3’

寡聚混合物加热到90℃1.5分钟，然后冷却到室温超过20分钟，从4166bp NdeⅠ-Eco47Ⅲ片段的纯化获得的干燥核酸沉淀溶解在7μL冷却的寡聚混合物中，随后加热至45℃5分钟，接着在冰上冷却，寡聚物与NdeⅠ-Eco47Ⅲ片段连接后，接着按以上描述转化进DH5α，转化的细菌细胞涂布到LB/羧苄青霉素平板上，37℃下温育过夜，选择17个菌落按以上方法分离质粒DNA。每个质粒的一部分(50μL中5μL)用NdeⅠ和HindⅢ每种10单位双酶消化，片段在TBE中于1％琼脂糖凝胶上电泳分离。检测到一个相应插入片段(1373或1518bp)和载体(2844bp)的两条带。质粒的另一5μL部分用XbaⅠ和HindⅢ每种10单位再次双酶消化。当用NdeⅠ和HindⅢ消化时，质粒中均不包括含有XbaⅠ位点的小插入片段。如果两个寡聚物替换原来存在于pT7BlueR+PDO1的196片段，XbaⅠ位点将会消除。具有修饰的对羟基苯丙酮酸双加氧酶插入片段的7个质粒样品合并，命名为pT7BlueR+PDO2。

pT7BlueR+PDO2质粒DNA用分光光度法定量(如上述)，5μg用NdeⅠ和HindⅢ每种20单位在37℃下于62μL反应2缓冲液中消化2小时。消化样品上样于TAE中的1％琼脂糖，电泳分离。分离到1373bp片段，按以上方法沉淀。质粒pET24c(+)(5μg)用NdeⅠ和HindⅢ每种20单位在37℃下于反应2缓冲液中双酶消化2小时，然后5245bp片段在TAE中的1％琼脂糖上纯化，然后按以上方法从琼脂糖中分离和沉淀。干燥的pET24c(+)沉淀溶解在10μL TE中，然后取8μL用水，脱磷酸化缓冲液(Gibco BRL)和1单位牛小肠碱性磷酸酶(GibcoBRL)调节到总体积20μL。样品在37℃下温育30分钟，然后按以上方法从琼脂糖中纯化分离和沉淀。干燥脱磷酸化的pET24c(+)载体沉淀和修饰的对羟基苯丙酮酸双加氧酶插入片段沉淀分别溶解在10μL TE中，各取1μL在1％琼脂糖的TBE胶中电泳，用4μL分子量梯度按以上方法定量DNA。100ng修饰的对羟基苯丙酮酸双加氧酶插入片段与120ng脱磷酸化的pET24c(+)载体混合，总体积为7μL。混合物加热至45℃5分钟，然后冰上冷却。向混合物中加入T4 DNA连接酶缓冲液和1单位T4DNA连接酶，总体积为10μL，在室温下温育4小时，连接混合物然后转化DH5α，涂布在补加了30μg/mL卡那霉素的LB琼脂上，在37℃下温育过夜。对11个菌落按以上描述进行质粒的制备。用NdeⅠ和HindⅢ双酶消化质粒，电泳分离片段，所有的质粒有预期的1373bp和5245bp片段，选择一个细菌菌落用来接种补加了30μg/mL卡那霉素的100mL液体LB，然后在37℃下温育振荡过夜。用Qiagen Plasmid Midi Kit按厂商说明从所得的细菌培养物中分离质粒DNA，质粒(pE24CPl)DNA的一部分用Sequence Version 2.0DNA测序试剂盒(United States Biochemical,Cleveland,OH)按厂商说明进行非放射性手动测序，使用T7启动子生物素化测序引物(United States BioChemical)。DNA从测序胶在毛细作用下转移到Hybond-N+尼龙转移膜(Amersham,Arlington Heights,IL)上。转移和随后DNA片段的化学发光检测的所有步骤，按厂商说明用SEQ-Light-化学发光测序试剂盒(Tropix,Bedford,MA)进行。DNA测序证实质粒含有预期的修饰对羟基苯丙酮酸双加氧酶插入片段的5’序列，该插入片段1-95(图2)核苷酸用ATG转录起始位点代替。这相当于从拟南芥属对羟基苯丙酮酸双加氧酶氨基酸序列的N-末端切除的2-29个氨基酸(图3)。

质粒pE24CP1按以上描述转化进BL21(DE3)大肠杆菌感受态细胞(Novagen)。转化细胞涂布在LB/卡那霉素平板上和在37℃下温育过夜。选择7个菌落制备质粒。质粒DNA用NdeⅠ和HindⅢ双酶消化，证实所有质粒有预期带型。选择一个菌落，在LB/卡那霉素平板上划线分离，一个分离良好的菌落用来接种补加了30μg/mL卡那霉素的液体LB，培养物在37℃下振荡(250rpm)直到在A600时吸收值为0.6，按Novagen操作制备8％甘油冷冻储备液，贮藏在-80℃，所有的随后表达研究使用新长成的细菌细胞，该细菌细胞是从甘油冻存液划线于LB/卡那霉素平板上后分离的。

从甘油冻存液中来的含有pE24CP1或pET24c(+)(阴性对照)的BL21(DE3)细胞划线到LB/卡那霉素平板上，在37℃下温育过夜。选择一个分离的菌落接种17×100mm Falcom试管中的2mL含30μg/mL卡那霉素的LB，在37℃下，振荡(250rpm)温育过夜。过夜培养物接着用来接种100mL含30μg/mL卡那霉素的新鲜LB中。新的培养物在37℃下振荡温育，直到A600为0.4到0.6个吸收单位。pE24CP1和pET24c(+)培养物的一半放在新培养瓶中，加入IPTG(异丙基硫代-β-D-半乳糖苷，Gibco BRL)到新瓶中至终浓度1mM，在37℃下，培养瓶再振荡温育3小时，然后收获细胞。

收获的细胞离心，所得细胞沉淀用2mL抽提缓冲液(50mM(第一次试验20mM，表2)磷酸钾缓冲液，pH7.2，含0.14M KCl,0.32mM还原谷胱苷肽，1％聚乙烯吡咯烷酮，0.1％Triton-X 100(只在第一次试验中使用0.01％溶菌酶))超声抽提(3×10秒)，裂解物17000g离心10分钟后，为粗抽提酶。在第一次试验(表2)也测定了20％至60％硫酸铵沉淀的酶部分。固体硫酸铵慢慢加入搅动的2mL溶菌产物中，至浓度为20％(w/v)，在冰上温育大约15分钟后，溶液17000g离心10分钟，收集上清液，加入固体硫酸铵至浓度60％(w/v)，离心后，所得沉淀重悬浮在1mL的抽提缓冲液中。

从细菌中表达的拟南芥属对羟基苯丙酮酸双加氧酶得到的不溶性蛋白的一部分用来作N-末端序列分析。用60μL抽提缓冲液悬浮蛋白(大约180μg)，然后用5倍体积样品缓冲液(62.5mM Tris,pH6.8,6M尿素，160mM二硫苏糖醇，0.01％溴酚蓝)稀释，在室温下间歇性旋涡振荡1小时，按制造商的说明书，为Mini-ProteinⅡ双重板电泳室(Bio-Rad,Hercules,CA)制备1.5mm厚，12％聚丙烯酰胺分离胶，让聚丙烯酰胺聚合3小时，用制备性的梳子制备浓缩胶，电极缓冲液按厂商说明制备，并加入0.1mM的巯基乙酸钠。可溶性的蛋白样品按厂商说明电泳分离。当溴酚蓝染料达到了胶的前面，取出胶，在印迹溶液(10mN CAPS,pH11,10％甲醇，平衡水)中平衡5分钟，胶按厂商说明放在Mini Trans-电印迹转移室(Bio-Rad)中，ProBlottPVDF膜(Applied Biosystem Foster city CA)按厂商说明处理，电印迹在印迹缓冲液存在时在50伏特电压下于冰浴中进行45分钟，膜用水洗，按ProBlott方法用考马斯亮蓝染色，主要蛋白带从膜上切下，在Beckman(Fullerton.CA)LF3000蛋白测序仪上进行N-末端氨基酸测序，第一次11个循环，分别鉴定为S-K-F-V-R-K-N-P-K-S-D(见SEQ ID NO:3氨基酸30-40)，这种预期的修饰拟南芥属对羟基苯丙酮酸双加氧酶的N-末端去掉了起始甲硫氨酸(氨基酸30-40，图3)。

实施例3

在大肠杆菌中表达的植物蛋白的对羟基苯丙酮酸双加氧酶活性

按以上描述抽提具有不同质粒构建体的细胞培养物，通过测定从[1-¹⁴C]-对羟基苯丙酮酸形成¹⁴CO₂或从[U-¹⁴C]对羟基苯丙酮酸形成¹⁴CO₂和¹⁴C-尿黑酸(Lindblad,B.(1971)Clin.Chim.Acta34:113-121；及Lindstedt,S．和0delhog,B(1987)酶学方法，142:143-148)进行分析。标记底物从[1-¹⁴C]-L-酪氨酸(55mCi/mmol；American Radiolabeled Chemicals.Inc.,St.Louis,MO)或[U-¹⁴C]-L-酪氨酸(498mCi/mmol；DuPont NEN.Boston.MA)制备。标记的酪氨酸贮藏液取50-100μL(5-10μCi)转移到4mL玻璃瓶中，在45℃下氮气流吹干，瓶中加入175μL 0.1M的磷酸缓冲液，pH6.5,5μL触酶(28700单位C-100,Sigma Chemical Co.,St.Louis,MO),和20μL L-氨基酸氧化酶(Sigma A-9253,6.5单位/mL)，瓶放在30℃水浴摇床中，60转/分钟，0.5-1小时。反应混合物通过一个含400μL Dowex AG 50W X8阳离子交换树脂的小柱，柱用1.5mL水洗，收集含标记对羟基苯丙酮酸的洗脱液，标记底物立即使用或在-80℃贮藏在制备后一星期内使用。

测试在用血清瓶塞盖着的14mL培养管中进行，该瓶塞悬垂的聚丙烯槽中含有200μL 1N KOH。反应混合物含5740单位的触酶，100μL新鲜配制的150mM还原谷胱苷肽和3mM二氯酚啶酚的1∶1(V∶V)混合物，5mM抗坏血酸，0.1mM硫酸亚铁(抗坏血酸和硫酸亚铁在第一次试验的缓冲液中不存在，表2),50μM未标记的对羟基苯丙酮酸，1-25μL酶抽提物和50μM磷酸钾缓冲液，最终体积980μL。在50mM磷酸钾缓冲液中制造新鲜的当日用的未标记底物，在室温下至少平衡2小时以确保95％以上是酮式。加入20μL(0.04μCi)¹⁴C对羟基苯丙酮酸以前试管在30℃振荡的水浴中温育10分钟。60分钟后，通过血清瓶塞注入1N 500μL硫酸终止反应，瓶留在摇床上30分钟，以确保完全俘获释放的¹⁴CO₂，取下血清瓶塞，切下槽，放入8mL闪烁瓶中，加入6mL Formula-989闪烁液(Packard Insrurments,Meriden,CT)到瓶中，¹⁴C放射性用闪烁计数器测定，表2总结了这个试验的结果。

表2

含有不同质粒构建体的大肠杆菌抽提物的对羟基苯丙酮酸双加氧酶活性

质粒	诱导物1mM IPTG	裂解物		硫酸铵沉淀
		裂解物		硫酸铵沉淀		dpm^*/mg	nmol/min×mg	dpm^*/mg	nmol/min×mg
		pET24c(+)	-	12,318	0.09	dpm^*/mg	nmol/min×mg	dpm^*/mg	nmol/min×mg	0	0.00
pET24c(+)	+	pET24c(+)	-	12,318	0.09	35,115	0.25	3,393	0.03	0	0.00
pET24c(+)	+	pE24CP1	-	24,607	0.17	35,115	0.25	3,393	0.03	126,761	0.89
pE24CP1	+	pE24CP1	-	24,607	0.17	243,801	1.71	1,371,823	9.64	126,761	0.89

*¹⁴C:¹²C=1:50；¹⁴C-对羟基苯丙酮酸双加氧酶比活性=55mCi/mmol

结果表明，在不含编码对羟基苯丙酮酸双加氧酶的核酸片段的质粒(pET24(+))和基因表达诱导物(IPTG)的任何细胞培养物中，很少或没有对羟基苯丙酮酸双加氧酶的活性，基因和诱导物共同导致了明显的活性增加。

在使用[U-¹⁴C]对羟基苯丙酮酸(HPPA)的试验中，测定了¹⁴CO₂和¹⁴C-尿黑酸，反应通过加入50μL标记底物(0.3μCi)起始，用10％磷酸100μL终止。释放的¹⁴CO₂闪烁计数测定，尿黑酸的量在有一个放射检测计的Zorbax RX-C8柱(4.6×250mm)的HPLC上测定。从离心后的反应混合物中取出1.7至15μL的量，注入前稀释成柱平衡缓冲液，在室温下用1mL/分钟的流速进行分离。接着用水和甲醇作溶剂A和B的梯度，每种均使用1％磷酸：0-2分钟，95％A,5％B等梯度洗脱，2-17分钟线性梯度洗脱，A从95到75％,B从5到25％,17-19分钟线性梯度，A从75到5％,B从25到95％,19-22分钟等梯度为5％A和95％B,22-24分钟线性梯度，A从5％到95％,B从95％到5％。在该系统中尿黑酸在10.8分钟时洗出，该试验结果显示在表3

表3

根据从[U-¹⁴C]对羟基苯丙酮酸释放的

CO₂和尿黑酸的生成测定细胞抽提物的对羟基苯丙酮酸双加氧酶活性

质粒	诱导物1mM IPTG	nmol/min×mg^*
		nmol/min×mg^*		¹⁴CO₂	尿黑酸
		pET24c(+)	-	¹⁴CO₂	尿黑酸	0.00	0.00
pET24c(+)	+	pET24c(+)	-	0.19	0.00	0.00	0.00
pET24c(+)	+	pE24CP1	-	0.19	0.00	4.68	4.76
pE24CP1	+	pE24CP1	-	29.12	29.82	4.68	4.76

*¹⁴C:¹²C=1:87.7；¹⁴C[U]-p-HPPA比活性=498mCi/mmol

在反应中的两种反应产物测定结果之间紧密相关，结果证实不含编码对羟基苯丙酮酸双加氧酶的核酸片段的细胞培养物没有明显的对羟基苯丙酮酸双加氧酶活性。在缺乏诱导物时，有可测的酶活性，但当诱导物加入时，活性比未诱导的培养物增加了6倍。这些结果和表2中的结果清楚地显示，分离并在大肠杆菌细胞中过量表达的核酸片段编码催化对羟基苯丙酮酸转化成尿黑酸并释放CO₂的蛋白质。

过量表达的蛋白质也在室温下用烯醇硼酸异构酶进行了分光光度测定(Lin.E.C.C.等(1958)J.Biol.Chem.,233:668-673)。每10mL测试缓冲液含0.4M硼酸(用0.2M硼酸钠调节至pH7.2),4mM抗坏血酸，2.5mM EDTA,40μM对羟基苯丙酮酸和0.5单位的异构酶(Sigma,T6004)。当底物的异构化作用完成时(当在308nm吸收稳定时)，使用反应混合物。加入40μL细胞抽提物到960μL测试缓冲液中起始测试，通过测定308nm吸收的减少观测反应进行。表4总结了表3所示的四种细胞培养物抽提物的结果。

表4

细胞抽提物对羟基苯丙酮酸双加氧酶活性的分光光度测定

质粒	诱导物(1mM IPTG)	nmol p-HP减少/分钟×毫克*
质粒	诱导物(1mM IPTG)	nmol p-HP减少/分钟×毫克*	pET24c(+)	-	1.58
pET24c(+)	+	2.73	pET24c(+)	-	1.58
pET24c(+)	+	2.73	pE24CP1	-	4.91
pE24CP1	+	22.32	pE24CP1	-	4.91

*对羟基苯丙酮酸减少，以平衡混合物的摩尔消光系数为9850，如Lin等(1958)J.Biol.Chem.,233:668-673)

实施例4

商业性除草剂对对羟基苯丙酮酸双加氧酶的抑制

两种已知抑制植物对羟基苯丙酮酸双加氧酶的除草剂：Sulcotrione(2-(2-氯-4-甲磺酸苯酰氧基)-1,3-环己烷二酮)和Isoxaflutole(5-环丙基异噁唑-4-基2-甲磺酰基-4-三氟甲基苯基酮)抑制过量表达的蛋白的酶活性。这两种化合物对过量表达的蛋白的作用用¹⁴CO₂和连续分光光度烯醇硼酸异构酶试验测定。在10μL丙酮或二甲亚砜中的两种化合物加入到测试缓冲液中，根据观察抑制剂几种浓度的抑制百分数计算I₅₀值(抑制酶50％的浓度)。测试结果在表5中示出。

表5

植物对羟基苯丙酮酸双加氧酶抑制剂的I₅₀值

化合物	I₅₀值
	I₅₀值		¹⁴CO₂试验	分光光度试验
	sulcotrione	43	¹⁴CO₂试验	分光光度试验	44
isoxaflutole	sulcotrione	43	409	1042	44

这些结果清楚地显示所示商业性除草剂抑制过量表达的蛋白的对羟基苯丙酮酸双加氧酶活性，这种除草剂的作用模式是抑制该酶。然而，连续分光光度试验给出类似于用¹⁴CO₂试验获得的I₅₀值。将分光光度试验改为微量滴定板试验，结合308nm或接近308nm的平板读数器，适用于高效筛选对羟基苯丙酮酸双加氧酶抑制剂。并且，对尿黑酸或对羟基苯丙酮酸的比色或荧光测定也很容易改为筛选这种酶的抑制剂的高效方法。分离的过量表达的酶有足够的活性，可直接用于分光光度试验，或进一步纯化以提高试验敏感度。

实施例5

用于在细菌中生产活性稳定酶的全长对羟基苯丙酮酸双加氧酶基因的重建

在实施例2中描述的及含有全长对羟基苯丙酮酸双加氧酶基因的质粒pT7BlueR+PD02证实在EcoRⅠ位点有不正确的序列，重新测定这个序列，以便能用常用的环出诱变，设计一段含NdeⅠ位点的寡核苷酸序列置换EcoRⅠ位点。设计的这段寡核苷酸序列，使得上述过程在对羟基苯丙酮酸双加氧酶基因的5’末端也引进ATG起始密码子，其后紧接着全长对羟基苯丙酮酸双加氧酶序列。诱变后，克隆在大肠杆菌中扩增，纯化质粒。接着用NdeⅠ和NheⅠ消化获得的全长基因“PDO-B”，一个约820bp的片段用来替换在pE24CP1(实施例1)“PDO-A”中截短的对羟基苯丙酮酸双加氧酶基因的NdeⅠ和NheⅠ部分。通过酶活性测定和N-末端序列分析，获得的质粒pE24PDO-B能在细菌中表达，产生全长拟南芥属对羟基苯丙酮酸双加氧酶。

实施例6

全长构建体比截短的构建体增加了稳定性

拟南芥对羟基苯丙酮酸双加氧酶的两种不同的构建体，一种含如实施例5的全长序列PDO-B，从质粒pE24PDO-B产生，一种含缺乏推断的叶绿体先导序列的截短序列PDO-A，从质粒pE24CP1中产生，两种都用Pharmacia苯基Sepharose疏水相互作用柱纯化，接着通过Phamacia Sephacryl 300凝胶过滤层析。用含5mM抗坏血酸，1mM还原谷胱苷肽和0.1mM硫酸铵亚铁的20mM bis Tris-propane缓冲液，pH7.2稀释两种蛋白至1mg/mL,贮存在4℃冰箱中至10天。在不同时间内取样，通过异构酶偶联分光光度法测定活性。在这种条件下，全长酶活性的半衰期是4天，而截短酶制剂半衰期为9至10小时。此外，全长酶的活性可通过与铁和还原性试剂还原谷胱苷肽或抗坏血酸温育，或对含铁和还原性试剂的缓冲液透析恢复。相形之下，截短酶的活性不能通过与含铁和还原性试剂的缓冲液温育恢复。全长酶在分光光度试验中也更为稳定，有用线性区较截短酶长2至3倍。两种酶制品用除草剂活性抑制剂显示类似的I₅₀值。

由于在贮存条件下，在分光光度测试中和在存在铁和还原性试剂的活性可逆重建中稳定性更高，这些结果清楚地显示全长PDO-B构建体较截短的酶有决定性的优势。尽管两种酶的构建体能用作抑制剂的筛选，但本申请中优选PDO-B酶，其在机制和结构研究中更具优势。

实施例7

玉米对羟基苯丙酮酸双加氧酶基因的克隆

在中等严紧条件下，用异源探针滤膜杂交筛选Stratagene玉米Uni-Zap cDNA文库(来自幼小植物)的大约600,000个噬菌斑，探针用PCR制备，是一条916bp的DNA片段，由SEQ ID NO:14的263至1178位突出区域限定。在初步筛选中，鉴定了24个阳性噬菌体克隆，在第二次筛选获得了11个噬菌体克隆。7个阳性克隆进行测序，与拟南芥对羟基苯丙酮酸双加氧酶比较，其中4个显示在氨基酸水平上非常保守，4个中最长的含988bp的插入片段，与拟南芥属蛋白的同一性为70％，类似性为78％，但是缺少相应于蛋白氨基末端的大约550bp。

试图获得玉米对羟基苯丙酮酸双加氧酶基因的全长cDNA的努力未成功，可能是因为RNA的二级结构有效地抑制了这个转录物的逆转录。筛选另两个cDNA文库，对足够含有全长cDNA的克隆测序，这些克隆都显示为嵌合体。因此筛选一个基因组文库以获得基因的5’端三分之一。用含截短的玉米对羟基苯丙酮酸双加氧酶cDNA(cloneH101C)5’端的415bp EcoRⅠ-BssHⅡ片段，筛选来自噬菌体载体EMBL3中的Clontech玉米文库(整个幼苗，2叶期)的大约100万个克隆。8个初级筛选阳性的噬菌体克隆涂平板并筛选，挑出4个次级阳性的克隆。用Qiagen Lambda midi-kit从每个克隆中制备DNA。SalⅠ或EcoRⅠ消化表明两个克隆是一样的，来自剩余三个克隆(11.1.3,13.1.1，和21.2.1)的DNA样品用SalⅠ,EcoRⅠ或SalⅠ和EcoRⅠ消化，用于Southern分析和用作制备全长拟南芥属对羟基苯丙酮酸双加氧酶基因的探针。克隆中有两个(11.1.3和13.1.1)显示了序列保守，亚克隆这些同源性片段并测序，两个克隆似乎含有全长基因，每个含有基因3’端附近的一个内含子。然而两个克隆的序列之间有差异，表明它们可能是两种不同的基因或一个可能是假基因。克隆11.1.3的序列与cDNA序列吻合，这个克隆用来构建一个全长对羟基苯丙酮酸双加氧酶的编码区。

该基因包含两个相邻片段，一个3.5kb EcoRⅠ-SalⅠ片段和一个2kb SalⅠ片段。将二者亚克隆进pBluescript SKⅡ+，产生质粒pESlll3和pSalllll3。用SpeⅠ消化pESlll3释放出大约2.7kb的上游序列，然后再连接，产生一个有747个碱基对插入片段的质粒(pSPE1)。pSPE1用SalⅠ消化成线性质粒，与来自pSallll3的2kbSalⅠ片段连接，该片段用SalⅠ消化释放，凝胶纯化。用SpelⅠ和Bpul 102Ⅰ消化证实了其方向，正确的质粒命名为plll3。为了去掉基因组克隆3’末端的内含子，质粒用Bpull02Ⅰ和XhoⅠ消化，含有载体和基因5’部分的3.9kb片段用凝胶纯化。相应的来自pHl011c(cDNA)的882bp Bpull02Ⅰ-XhoⅠ片段凝胶纯化，与3.9kb片段连接，产生克隆pMPD0(ATCC 209120)，其含有1782bp插入片段。推断的ATG上游有260个碱基，在终止密码的下游有189个碱基。通过对插入片段测序证实是全长序列，该玉米对羟基苯丙酮酸双加氧酶的核酸序列和推断的蛋白序列分别在SEQ ID N0:10和11给出。从玉米和拟南芥属获得的对羟基苯丙酮酸双加氧酶序列，用GCG的Gap程序(Program Manual for the Wisconsin Package,Vetsion9.0-OpenVMS,December,1996,Genetics Computer Group,575Science Drive,Madison,WI,USA53711)比较，这些比较的结果表明，在核苷酸水平上它们大约有67％一致，在氨基酸水平上，它们有69％类似和62％一致。玉米的对羟基苯丙酮酸双加氧酶的预计氨基酸序列与拟南芥属和其它真核生物的比较见图3。

实施例8

cDNA文库的组成，cDNA克隆的分离和测序

制备代表来自刚开始产生斑鸠菊酸的Vernonia galamenensis发育种子的mRNA的cDNA文库。按厂商的方法(Stratagene CloningSystems La Jolla,CA)用一个Uni-ZAP^TMXR载体制备文库。按Stratagene提供的方法将Uni-ZAPTMXR载体转变成质粒文库。转变之后，cDNA插入片段包含在质粒载体pBluescript中。来自随机挑取的含有重组pBluescript的细菌克隆的cDNA插入片段，用插入cDNA序列的两侧载体序列作专一引物，通过聚合酶链反应扩增。扩增的插入DNA用染料引物测序反应产生部分cDNA序列(已表达序列标志或ESTs，见Adams,M.D．等(1991)Science,252:1651)。得到的ESTs用Perkin Elmer 377型荧光测序仪分析。

实施例9

cDNA克隆的鉴定和表征

通过BLAST(Basic Local Alignment Search Tool:Altschul,S.F.等(1993)分子生物学杂志，215:403-410；也见www.ncbi.nlm.nih.gov/BLAST/)检索可鉴定编码Vernoniagalamenensis酶的ESTs与BLASTnr数据库中(比较所有非冗余GenBank CDS翻译本，来自Brookhaven蛋白数据库3维结构的序列，SWISS-PROT蛋白序列数据库、EMBL和DDBJ数据库的最新重要公布)序列的相似性。用国家生物技术信息中心(NCBI)提供的BLASTN算法，分析了实施例9中获得的cDNA序列与所有包含在nr数据库中对公众开放的DNA序列的相似性。翻译DNA序列的所有可读框，用NCBI提供的BLASTX算法(Gish.W和States,D.J.(1993)自然遗传，3:266-272)比较与包含在nr数据库中所有对公众开放的蛋白序列的相似性。为了方便，观察到cDNA序列与仅仅偶然通过BLAST计算包括在检索数据库中的序列匹配的P值(概率)在这里作为pLog值，它代表报道的P值的负对数。据此，pLog值越大，cDNA序列相似性就越大，BLAST选中代表同源蛋白。

使用克隆vsl.pk0015.b2的BLASTX检索，揭示了由cDNA编码的蛋白与来源于其它植物的多种对羟基苯丙酮酸双加氧酶的相似性。三种最相似的对羟基苯丙酮酸双加氧酶是链霉菌对羟基苯丙酮酸双加氧酶(GenBank登录号U11864,pLog=8.34)，大鼠对羟基苯丙酮酸双加氧酶(GenBank登录号M18405,pLog=7.66),人的对羟基苯丙酮酸双加氧酶(GenBank登录号U29895,pLog=7.60)。SEQ ID NO:16显示了在克隆vsl.pk0015.b2中的Vernonia galamenensis cDNA的部分核苷酸序列。序列对比和BLAST值及概率表明该核酸片段编码Vernonia galamenensis对羟基苯丙酮酸双加氧酶的一部分。

序列表(1)一般信息：(ⅰ)申请人：

(A)姓名：E.I.DUPONT DE NEMOURS AND COMPANY

(B)街道：1007 MARKET STREET

(C)城市：WILMINGTON

(D)州：DELAWARE

(E)国家：美国

(F)邮编(ZIF):19898

(G)电话：302-892-8112

(H)传真：302-773-0164

(I)电传：6717325(ⅱ)发明名称：对羟基苯丙酮酸双加氧酶的植物基因(ⅲ)序列数目：16(ⅳ)计算机可读形式：

(A)介质类型：磁盘，3.5英寸

(B)计算机：IBM PC兼容机

(C)操作系统：用于WINDOWS 95的微软WORD

(D)软件：微软WORD 7.0版(ⅴ)当前申请数据：

(A)申请号：

(B)申请日：

(C)分类：(ⅵ)在先申请数据：

(A)申请号：60/021,364

(B)申请日：1996年6月27(ⅶ)律师/代理人信息：

(A)姓名：FLOYD,LINDA AXAMETHY

(B)注册号：33,692

(C)参考/案卷号：BA-9120

(2)SEQ ID N0:1的信息

(ⅰ)序列性质：

(A)长度：233碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ⅱ)分子类型：cDNA

(ⅹⅰ)序列描述：SEQ ID N0:1CAAGAAACGN GTCGNCGACG TGCTCAGCGA TGATCAGATC AAGGAGTGTG AGGAATTAGG 60GATTCTTNTA GACAGAGATG ATCAAGGGAC GTTNCTTCAA ATCTNCACAA AACCACTAGG 120TGACAGGCCG ACGNTATTTA TAGAGATAAT CCAGAGNGTA GGATGCATGA TGAAAGATGT 180GGAAGGGANG GCTTACCAGA GTGGAGNATN TNGTGGTTTT GGCAAAGGCA ATT 233(2)SEQ ID NO:2的信息

(ⅰ)序列性质：

(A)长度：1448碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性

(ⅱ)分子类型：cDNA

(ⅲ)特征：

(A)名称/关键词：CDS

(B)位置：9..1343(ⅹⅰ)序列描述：SEQ ID NO:2TGAAATCA ATG GGC CAC CAA AAC GCC GCC GTT TCA GAG AAT CAA AAC CAT 50

Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln Asn His

1 5 10GAT GAC GGC GCT GCG TCG TCG CCG GGA TTC AAG CTC GTC GGA TTT TCC 98Asp Asp Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser15 20 25 30AAG TTC GTA AGA AAG AAT CCA AAG TCT GAT AAA TTC AAG GTT AAG CGC 146Lys Phe Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arg

35 40 45TTC CAT CAC ATC GAG TTC TGG TGC GGG GAC GCA ACC AAC GTC GCT CGT 194Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg

50 55 60CGC TTC TCC TGG GGT CTG GGG ATG AGA TTC TCC GCC AAA TCC GAT CTT 242Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu

65 70 75TCC ACC GGA AAC ATG GTT CAC GCC TCT TAC CTA CTC ACC TCC GGT GAA 290Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Glu

80 85 90CTC CGA TTC CTT TTC ACT GCT CCT TAC TCT CCG TCT CTC TCC GGC GGA 338Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Gly Gly95 100 105 110GAG ATT AAA CCG ACA ACC ACA GGT TCT ATC CCA AGT TTC GAT CAC GGG 386Glu Ile Lys Pro Thr Thr Thr Gly Ser Ile Pro Ser Phe Asp His Gly

115 120 125TCT TGT CGG TCC TTC TTC TCT TCA CAT GGT CTC GGT GTT AGA CCC GTT 434Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Pro Val

130 135 140GCG ATT GAA GTA GAA GAC GCG GAG TCA GCT TTC TCC ATC AGT GTA GCT 482Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala

145 150 155AAT GGC GCT ATT CCT TCG TCG CCT CCT ATC GTC CTC AAT GAA GCA GTT 530Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu Ala Val

160 165 170ACG ATC GCT GAG GTT AAA CTA TAC GGC GAT GTT GTT CTC CGA TAT GTT 578Thr Ile Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val175 180 185 190AGT TAC AAA GCA GAA GAT ACC GAA AAA TCC GAA TTC TTG CCA GGG TTC 626Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe

195 200 205GAG CGT GTA GAG GAT GCG TCG TCG TTC CCA TTG GAT TAT GGT ATC CGG 674Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg

210 215 220CGG CTT GAC CAC GCC GTG GGA AAC GTT CCT GAG CTT GGT CCG GCT TTA 722Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro Ala Leu

225 230 235ACT TAT GTA GCG GGG TTC ACT GGT TTT CAC CAA TTC GCA GAG TTC ACA 770Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu Phe Thr

240 245 250GCA GAC GAC GTT GGA ACC GCC GAG AGC GGT TTA AAT TCA GCG GTC CTG 818Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu255 260 265 270GCT AGC AAT GAT GAA ATG GTT CTT CTA CCG ATT AAC GAG CCA GTG CAC 866Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His

275 280 285GGA ACA AAG AGG AAG AGT CAG ATT CAG ACG TAT TTG GAA CAT AAC GAA 914Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu

290 295 300GGC GCA GGG CTA CAA CAT CTG GCT CTG ATG AGT GAA GAC ATA TTC AGG 962Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile Phe Arg

305 310 315ACC CTG AGA GAGATG AGG AAG AGG AGC AGT ATT GGA GGA TTC GAC TTC 1010Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe

320 325 330ATG CCT TCT CCT CCG CCT ACT TAC TAC CAG AAT CTC AAG AAA CGG GTC 1058Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val335 340 345 350GGC GAC GTG CTC AGC GAT GAT CAG ATC AAG GAG TGT GAG GAA TTA GGG 1106Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly

355 360 365ATT CTT GTA GAC AGA GAT GAT CAA GGG ACG TTG CTT CAA ATC TTC ACA 1154Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr

370 375 380AAA CCA CTA GGT GAC AGG CCG ACG ATA TTT ATA GAG ATA ATC CAG AGA 1202Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile Gln Arg

385 390 395GTA GGA TGC ATG ATG AAA GAT GAG GAA GGG AAG GCT TAC CAG AGT GGA 1250Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln Ser Gly

400 405 410GGA TGT GGT GGT TTT GCC AAA GGC AAT TTC TCT GAG CTC TTC AAG TCC 1298Gly Cys Gly Gly Phe Ala Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser415 420 425 430ATT GAA GAA TAC GAA AAG ACT CTT GAA GCC AAA CAG TTA GTG GGA 1343Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly

435 440 445TGAACAAGAA GAAGAACCAA CTAAAGGATT GTGTAATTAA TGTAAAACTG TTTTATCTTA 1403TCAAAACAAT GTATACAACA TCTCATTTAA AAACGAGATC AATCC 1448(2)SEQ ID NO:3的信息(ⅰ)序列性质：

(A)长度：445个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:3Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln ASn His Asp Asp1 5 10 15Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser Lys Phe

20 25 30Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arp PHe His

35 40 45His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg Arg Phe

50 55 60Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu Ser Thr65 70 75 80Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Glu Leu Arg

85 90 95Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Gly Gly Glu Ile

100 105 110Lys Pro Thr Thr Thr Gly Ser Ile Pro Ser Phe Asp His Gly Ser Cys

115 120 125Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Pro Val Ala Ile

130 135 140Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala Asn Gly145 150 155 160Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu Ala Val Thr Ile

165 170 175Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val Ser Tyr

180 185 190Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe Glu Arg

195 200 205Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg Arg Leu

210 215 220Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro Ala Leu Thr Tyr225 230 235 240Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu Phe Thr Ala Asp

245 250 255Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu Ala Ser

260 265 270Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His Gly Thr

275 280 285Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu Gly Ala

290 295 300Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile Phe Arg Thr Leu305 310 315 320Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe Met Pro

325 330 335Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val Gly Asp

340 345 350Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly Ile Leu

355 360 365Val Aap Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr Lys Prc

370 375 380Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile Gln Arg Val Gly385 390 395 400Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln Ser Gly Gly Cys

405 410 415Gly Gly Phe Ala Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser Ile Glu

420 425 430Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly

435 440 445(2)SEQ ID NO:4的信息(ⅰ)序列性质：

(A)长度：53碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：DNA(基因组)(ⅹⅰ)序列描述：SEQ ID NO:4TATGTCCAAG TTCGTAAGAA AGAATCCAAA GTCTGATAAA TTCAAGGTTA AGC 53(2)SEQ ID NO:5的信息(ⅰ)序列性质：

(A)长度：51碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：DNA(基因组)(ⅹⅰ)序列描述：SEQ ID NO:5GCTTAACCTT GAATTTATCA GACTTTGGAT TCTTTCTTAC GAACTTGGAC A 5l(2)SEQ ID NO:6的信息(ⅰ)序列性质：

(A)长度：392个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:6Thr Ser Tyr Ser Asp Lys Gly Glu Lys Pro Glu Arg Gly Arg Phe Leu1 5 10 15His Phe His Ser Val Thr Phe Trp Val Gly Asn Ala Lys Gln Ala Ala

20 25 30Ser Tyr Tyr Cys Ser Lys lle Gly Phe Glu Pro Leu Ala Tyr Lys Gly

35 40 45Leu Glu Thr Gly Ser Arg Glu Val Val Ser His Val Val Lys Gln Asp

50 55 60Lys Ile Val Phe Val Phe Ser Ser Ala Leu Asn Prc Trp Asn Lys Glu65 70 75 80Met Gly Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala

85 90 95Phe Glu Val Glu Asp Cys Asp Tyr Ile Val Gln Lys Ala Arg Glu Arg

100 105 110Gly Ala Ile Ile Val Arg Glu Glu Val Cys Cys Ala Ala Asp Val Arg

115 120 125Gly His His Thr Pro Leu Asp Arg Ala Arg Gln Val Trp Glu Gly Thr

130 135 140Leu Val Glu Lys Met Thr Phe Cys Leu Asp Ser Arg Pro Gln Pro Ser145 150 155 160Gln Thr Leu Leu His Arg Leu Leu Leu Ser Lys Leu Pro Lys Cys Gly

165 170 175Leu Glu Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met

180 185 190Glu Ser Ala Ser Gln Trp Tyr Met Arg Asn Leu Gln Phe His Arg Phe

195 200 205Trp Ser Val Asp Asp Thr Gln Ile His Thr Glu Tyr Ser Ala Leu Arg

210 215 220Ser Val Val Met Ala Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn225 230 235 240Glu Pro Ala Pro Gly Lys Lys Lys Ser Gln Ile Gln Glu Tyr Val Asp

245 250 255Tyr Asn Gly Gly Ala Gly Val Gln His Ile Ala Leu Lys Thr Glu Asp

260 265 270Ile Ile Thr Ala Ile Arg Ser Leu Arg Glu Arg Gly Val Glu Phe Leu

275 280 285Ala Val Pro Phe Thr Tyr Tyr Lys Gln Leu Gln Glu Lys Leu Lys Ser

290 295 300Ala Lys Ile Arg Val Lys Glu Ser lle Asp Val Leu Glu Glu Leu Lys305 310 315 320Ile Leu Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr

325 330 335Lys Pro Met Gln Asp Arg Pro Thr Val Phe Leu Glu Val Ile Gln Arg

340 345 350Asn Asn His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys

355 360 365Ala Phe Glu Glu Glu Gln Glu Leu Arg Gly Asn Leu Thr Asp Thr Asp

370 375 380Pro Asn Gly Val Pro Phe Arg Leu385 390(2)SEQ ID NO:7的信息(ⅰ)序列性质：

(A)长度：392个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:7Thr Ser Tyr Ser Asp Lys Gly Glu Lys Pro Glu Arg Gly Arg Phe Leu1 5 10 15His Phe His Ser Val Thr Phe Trp Val Gly Asn Ala Lys Gln Ala Ala

20 25 30Ser Tyr Tyr Cys Ser Lys Ile Gly Phe Glu Pro Leu Ala Tyr Lys Gly

35 40 45Leu Glu Thr Gly Ser Arg Glu Val Val Ser His Val Val Lys Gln Asp

50 55 60Lys Ile Val Phe Val Phe Ser Ser Ala Leu Asn Pro Trp Asn Lys Glu65 70 75 80Met Gly Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala

85 90 95Phe Glu Val Glu Asp Cys Asp Tyr Ile Val Gln Lys Ala Arg Glu Arg

100 105 110Gly Ala Ile Ile Val Arg Glu Glu Val Cys Cys Ala Ala Asp Val Arg

115 120 125Gly His His Thr Pro Leu Asp Arg Ala Arg Gln Val Trp Glu Gly Thr

165 170 175Leu Glu Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met

180 185 190Glu Ser Ala Ser Gln Trp Tyr Met Arg Asn Leu Gln Phe His Arg Phe

195 200 205Trp Ser Val Asp Asp Thr Gln Ile His Thr Glu Tyr Ser Ala Leu Arg

210 215 220Ser Val Val Met Ala Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn225 230 235 240Glu Pro Ala Pro Gly Lys Lys Lys Ser Gln lle Gln Glu Tyr Val Asp

245 250 255Tyr Asn Gly Gly Ala Gly Val Gln His Ile Ala Leu Lys Thr Glu Asp

260 265 270Ile Ile Thr Ala Ile Arg Ser Leu Arg Glu Arg Gly Val Glu Phe Leu

275 280 285Ala Val Pro Phe Thr Tyr Tyr Lys Gln Leu Gln Glu Lys Leu Lys Ser

290 295 300Ala Lys Ile Arg Val Lys Glu Ser Ile Asp Val Leu Glu Glu Leu Lys305 310 215 320Ile Leu Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr

325 330 335Lys Pro Met Gln Asp Arg Pro Thr Val Phe Leu Glu Val Ile Gln Arg

340 345 350Asn Asn His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys

355 360 365Ala Phe Glu Glu Glu Gln Glu Leu Arg Gly Asn Leu Thr Asp Thr Asp

370 375 380Pro Asn Gly Val Pro Phe Arg Leu385 390(2)SEQ ID NO:8的信息(ⅰ)序列性质：

(A)长度：392个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:8Thr Thr Tyr Asn Asn Lys Gly Pro Lys Pro Glu Arg Gly Arg Phe Leu1 5 10 15His Phe His Ser Val Thr Phe Trp Val Gly Asn Ala Lys Gln Ala Ala

20 25 30Ser Phe Tyr Cys Asn Lys Met Gly Phe Glu Pro Leu Ala Tyr Arg Gly

35 40 45Leu Glu Thr Gly Ser Arg Glu Val Val Ser His Val Ile Lys Arg Gly

50 55 60Lys Ile Val Phe Val Leu Cys Ser Ala Leu Asn Pro Trp Asn Lys Glu65 70 75 80Met Gly Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala

85 90 95Phe Glu Val Glu Asp Cys Asp His Ile Val Gln Lys Ala Arg Glu Arg

100 105 110Gly Ala Lys Ile Val Arg Glu Pro Trp Val Glu Gln Asp Lys Phe Gly

115 120 125Lys Val Lys Phe Ala Val Leu Gln Thr Tyr Gly Asp Thr Thr His Thr

130 135 140Leu Val Glu Lys Ile Asn Tyr Thr Gly Arg Phe Leu Pro Gly Phe Glu145 150 155 160Ala Pro Thr Tyr Lys Asp Thr Leu Leu Pro Lys Leu Pro Arg Cys Asn

165 170 175Leu Glu Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met

180 185 190Gln Ser Ala Ser Glu Trp Tyr Leu Lys Asn Leu Gln Phe His Arg Phe

195 200 205Trp Ser Val Asp Asp Thr Gln Val His Thr Glu Tyr Ser Ser Leu Arg

210 215 220Ser Ile Val Val Thr Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn225 230 235 240Glu Pro Ala Pro Gly Arg Lys Lys Ser Gln lle Gln Glu Tyr Val Asp

245 250 255Tyr Asn Gly Gly Ala Gly Val Gln His Ile Ala Leu Lys Thr Glu Asp

260 265 270Ile Ile Thr Ala Ile Arg His Leu Arg Glu Arg Gly Thr Glu Phe Leu

275 280 285Ala Ala Pro Ser Ser Tyr Tyr Lys Leu Leu Arg Glu Asn Leu Lys Ser

290 295 300Ala Lys Ile Gln Val Lys Glu Ser Met Asp Val Leu Glu Glu Leu His305 310 315 320Ile Leu Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr

325 330 335Lys Pro Met Gln Asp Arg Pro Thr Leu Phe Leu Glu Val Ile Gln Arg

340 345 350His Asn His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys

355 360 365Ala Phe Glu Glu Glu Gln Ala Leu Arg Gly Asn Leu Thr Asp Leu Glu

370 375 380Pro ASn Gly Val Arg Ser Gly Met385 390(2)SEQ ID NO:9的信息(ⅰ)序列性质：

(A)长度：376个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:9Tyr Trp Asp Lys Gly Pro Lys Pro Glu Arg Gly Arg Phe Leu His Phe1 5 10 15His Ser Val Tnr Pne Trp Val Gly Ash Ala Lys Gln Ala Ala Ser Phe

20 25 30Tyr Cys Asn Lys Met Gly Phe Glu Pro Leu Ala Tyr Lys Gly Leu Glu

35 40 45Thr Gly Ser Arg Glu Val Val Ser His Val Ile Lys Gln Gly Lys Ile

50 55 60Val Phe Val Leu Cys Ser Ala Leu Asn Pro Trp Asn Lys Glu Met Gly65 70 75 80Asp His Leu Val Lys His Gly Asp Gly Val Lys Asp Ile Ala Phe Glu

85 90 95Val Glu Asp Cys Glu His Ile Val Gln Lys Ala Arg Glu Arg Gly Ala

100 105 110Lys Ile Val Arg Glu Pro Trp Val Glu Glu Asp Lys Phe Gly Lys Val

115 120 125Lys Phe Ala Val Leu Gln Thr Tyr Gly Asp Thr Thr His Thr Leu Val

130 135 140Glu Lys Ile Asn Tyr Thr Gly Arg Phe Leu Pro Gly Phe Glu Ala Pro145 150 155 160Thr Tyr Lys Asp Thr Leu Leu Pro Lys Leu Pro Ser Cys Ash Leu Glu

165 170 175Ile Ile Asp His Ile Val Gly Asn Gln Pro Asp Gln Glu Met Glu Ser

180 185 190Ala Ser Glu Trp Tyr Leu Lys Asn Leu Gln Phe His Arg Phe Trp Ser

195 200 205Val Asp Asp Thr Gln Val His Thr Glu Tyr Ser Ser Leu Arg Ser Ile

210 215 220Val Val Ala Asn Tyr Glu Glu Ser Ile Lys Met Pro Ile Asn Glu Pro225 230 235 240Ala Pro Gly Arg Lys Lys Ser Gln Ile Gln Glu Tyr Val Asp Tyr Asn

245 250 255Gly Gly Ala Gly Val Gln His Ile Ala Leu Arg Thr Glu Asp Ile Ile

260 265 270Thr Thr Ile Arg His Leu Arg Glu Arg Gly Met Glu Phe Leu Ala Val

275 280 285Pro Ser Ser Tyr Tyr Arg Leu Leu Arg Glu Asn Leu Lys Thr Ser Lys

290 295 300Ile Gln Val Lys Glu Asn Met Asp Val Leu Glu Glu Leu Lys Ile Leu305 310 315 320Val Asp Tyr Asp Glu Lys Gly Tyr Leu Leu Gln Ile Phe Thr Lys Pro

325 330 335Met Gln Asp Arg Pro Thr Leu Phe Leu Glu Val Ile Gln Arg His Asn

340 345 350His Gln Gly Phe Gly Ala Gly Asn Phe Asn Ser Leu Phe Lys Ala Phe

355 360 365Glu Glu Glu Gln Ala Leu Arg Gly

370 375(2)SEQ ID NO:10的信息(ⅰ)序列性质：

(A)长度：1766碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ⅱ)分子类型：cDNA到mRNA(ⅲ)假设：非(ⅳ)反义：非(ⅴ)最初来源：

(A)生物体：玉米(ⅸ)特征

(A)名称/关键词：CDS

(B)位置：261..1595 (ⅹⅰ)序列描述：SEQ ID NO:10ACTAGTTGTG AGAGCCTTCT GCGTTGGCAA TTGGCAGTAC AAGACAAATC ACATCCGCAA 60CCGCAACCAC AGAATCGTCC GTCCACGTGG CCCCCATCAC TTCCCTTTAT TTACCAGTCG 120TCCCCCATCC CCAGGGCCAC CCACCAACAA GTGCAGTCAC CCGAGCCGCA AACTGCAGCT 180CTGCAAGCTA CAGAGGCCAC CACGAGTCCA CGACGCCACG CCCTCCGAGA GAAAGAGAAA 240GAGAAAACCA AAGCACGATA ATG CCC CCG ACC CCC ACA GCC GCC GCA GCC 290

Met Pro Pro Thr Pro Thr Ala Ala Ala Ala

1 5 10GGC GCC GCC GTG GCG GCG GCA TCA GCA GCG GAG CAA GCG GCG TTC CGC 338Gly Ala Ala Val Ala Ala Ala Ser Ala Ala Glu Gln Ala Ala Phe Arg

15 20 25CTC GTG GGC CAC CGC AAC TTC GTC CGC TTC AAC CCG CGC TCC GAC CGC 386Leu Val Gly His Arg Asn Phe Val Arg Phe Asn Pro Arg Ser Asp Arg

30 35 40TTC CAC ACG CTC GCG TTC CAC CAC GTG GAG CTC TGG TGC GCC GAC GCG 434Phe His Thr Leu Ala Phe His His Val Glu Leu Trp Cys Ala Asp Ala

45 50 55GCC TCC GCC GCG GGC CGC TTC TCC TTC GGC CTG GGC GCG CCG CTC GCC 482Ala Ser Ala Ala Gly Arg Phe Ser Phe Gly Leu Gly Ala Pro Leu Ala

60 65 70GCA CGC TCC GAC CTC TCC ACG GGC AAC TCC GCG CAC GCG TCC CTG CTG 530Ala Arg Ser Asp Leu Ser Thr Gly Asn Ser Ala His Ala Ser Leu Leu75 80 85 90CTC CGC TCC GGC TCC CTC TCC TTC CTC TTC ACG GCG CCC TAC GCG CAC 578Leu Arg Ser Gly Ser Leu Ser Phe Leu Phe Thr Ala Pro Tyr Ala His

95 100 105GGC GCC GAC GCT GCC ACC GCC GCG CTG CCC TCC TTC TCC GCC GCC GCC 626Gly Ala Asp Ala Ala Thr Ala Ala Leu Pro Ser Phe Ser Ala Ala Ala

110 115 120GCG CGG CGC TTC GCA GCC GAC CAC GGC CTC GCG GTG CGC GCC GTC GCG 674Ala Arg Arg Phe Ala Ala Asp His Gly Leu Ala Val Arg Ala Val Ala

125 130 135CTC CGC GTC GCC GAC GCC GAG GAC GCC TTC CGC GCC AGC GTC GCG GCC 722Leu Arg Val Ala Asp Ala Glu Asp Ala Phe Arg Ala Ser Val Ala Ala

140 145 150GGG GCG CGC CCG GCG TTC GGC CCC GTC GAC CTC GGC CGC GGC TTC CGC 770Gly Ala Arg Pro Ala Phe Gly Pro Val Asp Leu Gly Arg Gly Phe Arg155 160 165 170CTC GCC GAG GTC GAG CTC TAC GGC GAC GTC GTG CTC CGG TAC GTG AGC 818Leu Ala Glu Val Glu Leu Tyr Gly Asp Val Val Leu Arg Tyr Val Ser

175 180 185TAC CCG GAC GGC GCC GCG GGC GAG CCC TTC CTG CCG GGG TTC GAG GGC 866Tyr Pro Asp Gly Ala Ala Gly Glu Pro Phe Leu Pro Gly Phe Glu Gly

190 195 200GTG GCC AGC CCC GGG GCG GCC GAC TAC GGG CTG AGC AGG TTC GAC CAC 914Val Ala Ser Pro Gly Ala Ala Asp Tyr Gly Leu Ser Arg Phe Asp His

205 210 215ATC GTC GGC AAC GTG CCG GAG CTG GCG CCC GCC GCC GCC TAC TTC GCC 962Ile Val Gly Asn Val Pro Glu Leu Ala Pro Ala Ala Ala Tyr Phe Ala

220 225 230GGC TTC ACG GGG TTC CAC GAG TTC GCC GAG TTC ACG ACG GAG GAC GTG 1010Gly Phe Thr Gly Phe His Glu Phe Ala Glu Phe Thr Thr Glu Asp Val235 240 245 250GGC ACC GCG GAG AGC GGC CTC AAC TCC ATG GTG CTC GCC AAC AAC TCG 1058Gly Thr Ala Glu Ser Gly Leu Asn Ser Met Val Leu Ala Asn Asn Ser

255 260 265GAG AAC GTG CTG CTC CCG CTC AAC GAG CCG GTG CAC GGC ACC AAG CGC 1106Glu Asn Val Leu Leu Pro Leu Asn Glu Pro Val His Gly Thr Lys Arg

270 275 280CGC AGC CAG ATA CAA ACG TTC CTG GAC CAC CAC GGC GGC CCC GGC GTG 1154Arg Ser Gln Ile Gln Thr Phe Leu Asp His His Gly Gly Pro Gly Val

285 290 295CAG CAC ATG GCG CTG GCC AGC GAC GAC GTG CTC AGG ACG CTG AGG GAG 1202Gln His Met Ala Leu Ala Ser Asp Asp Val Leu Arg Thr Leu Arg Glu

300 305 310ATG CAG GCG CGC TCG GCC ATG GGC GGC TTC GAG TTC ATG GCG CCT CCC 1250Met Gln Ala Arg Ser Ala Met Gly Gly Phe Glu Phe Met Ala Pro Pro315 320 325 330ACA TCC GAC TAC TAT GAC GGC GTG AGG CGG CGC GCC GGG GAC GTG CTC 1298Thr Ser Asp Tyr Tyr Asp Gly Val Arg Arg Arg Ala Gly Asp Val Leu

335 340 345ACG GAA GCA CAG ATT AAG GAG TGC CAG GAG CTA GGG GTG CTG GTG GAC 1346Thr Glu Ala Gln Ile Lys Glu Cys Gln Glu Leu Gly Val Leu Val Asp

350 355 360AGG GAT GAC CAG GGC GTG CTG CTC CAA ATC TTC ACC AAG CCA GTG GGG 1394Arg Asp Asp Gln Gly Val Leu Leu Gln Ile Phe Thr Lys Pro Val Gly

365 370 375GAC AGG CCA ACG CTG TTC TTG GAA ATC ATC CAA AGG ATC GGG TGC ATG 1442Asp Arg Pro Thr Leu Phe Leu Glu Ile Ile Gln Arg Ile Gly Cys Met

380 385 390GAG AAG GAT GAG AAG GGG CAA GAA TAC CAA AAG GGT GGC TGC GGC GGG 1490Glu Lys Asp Glu Lys Gly Gln Glu Tyr Gln Lys Gly Gly Cys Gly Gly395 400 405 410TTC GGC AAG GGA AAC TTC TCG CAG CTG TTC AAG TCC ATC GAG GAT TAT 1538Phe Gly Lys Gly Asn Phe Ser Gln Leu Phe Lys Ser Ile Glu Asp Tyr

415 420 425GAG AAG TCC CTT GAA GCC AAG CAA GCT GCT GCA GCA GCT GCA GCT CAG 1586Glu Lys Ser Leu Glu Ala Lys Gln Ala Ala Ala Ala Ala Ala Ala Gln

430 435 440GGA TCC TAG GACAGTGCTT GGAGACGAGC AACTGCTGTG GCACTTTGTA 1635Gly SerTCATGGAACA GAAATAATGA AGCGTGTTCT TTGTGACACT TGACATGCAA ATGTTTGTGT 1695TCTGTAACCG TTGAATATAT GGGACGATGC TATGATGGTG TAATAGATGG TAGAGAGGGT 1755ACAACCCTGA T 1766(2)SEQ ID NO:11的信息(ⅰ)序列性质：

(A)长度：445个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:11Met Pro Pro Thr Pro Thr Ala Ala Ala Ala Gly Ala Ala Val Ala Ala1 5 10 15Ala Ser Ala Ala Glu Gln Ala Ala Phe Arg Leu Val Gly His Arg Asn

20 25 30Phe Val Arg Phe Asn Pro Arg Ser Asp Arg Phe His Thr Leu Ala Phe

35 40 45His His Val Glu Leu Trp Cys Ala Asp Ala Ala Ser Ala Ala Gly Arg

50 55 60Phe Ser Phe Gly Leu Gly Ala Pro Leu Ala Ala Arg Ser Asp Leu Ser65 70 75 80Thr Gly Asn Ser Ala His Ala Ser Leu Leu Leu Arg Ser Gly Ser Leu

85 90 95Ser Phe Leu Phe Thr Ala Pro Tyr Ala His Gly Ala Asp Ala Ala Thr

100 105 110Ala Ala Leu Pro Ser Phe Ser Ala Ala Ala Ala Arg Arg Phe Ala Ala

115 120 l25Asp His Gly Leu Ala Val Arg Ala Val Ala Leu Arg Val Ala Asp Ala

130 135 140Glu Asp Ala Phe Arg Ala Ser Val Ala Ala Gly Ala Arg Pro Ala Phe145 150 155 160Gly Pro Val Asp Leu Gly Arg Gly Phe Arg Leu Ala Glu Val Glu Leu

165 170 175Tyr Gly Asp Val Val Leu Arg Tyr Val Ser Tyr Pro Asp Gly Ala Ala

180 185 190Gly Glu Pro Phe Leu Pro Gly Phe Glu Gly Val Ala Ser Pro Gly Ala

195 200 205Ala Asp Tyr Gly Leu Ser Arg Phe Asp His Ile Val Gly Asn Val Pro

210 215 220Glu Leu Ala Pro Ala Ala Ala Tyr Phe Ala Gly Phe Thr Gly Phe His225 230 235 240Glu Phe Ala Glu Phe Thr Thr Glu Asp Val Gly Thr Ala Glu Ser Gly

245 250 255Leu Asn Ser Met Val Leu Ala Asn Asn Ser Glu Asn Val Leu Leu Pro

260 265 270Leu Asn Glu Pro Val His Gly Thr Lys Arg Arg Ser Gln Ile Gln Thr

275 280 285Phe Leu Asp His His Gly Gly Pro Gly Val Gln His Met Ala Leu Ala

290 295 300Ser Asp Asp Val Leu Arg Thr Leu Arg Glu Met Gln Ala Arg Ser Ala305 310 315 320Met Gly Gly Phe Glu Phe Met Ala Pro Pro Thr Ser Asp Tyr Tyr Asp

325 330 335Gly Val Arg Arg Arg Ala Gly Asp Val Leu Thr Glu Ala Gln Ile Lys

340 345 350Glu Cys Gln Glu Leu Gly Val Leu Val Asp Arg Asp Asp Gln Gly Val

355 360 365Leu Leu Gln Ile Phe Thr Lys Pro Val Gly Asp Arg Pro Thr Leu Phe

370 375 380Leu Glu Ile Ile Gln Arg Ile Gly Cys Met Glu Lys Asp Glu Lys Gly385 390 395 400Gln Glu Tyr Gln Lys Gly Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe

405 410 415Ser Gln Leu Phe Lys Ser Ile Glu Asp Tyr Glu Lys Ser Leu Glu Ala

420 425 430Lys Gln Ala Ala Ala Ala Ala Ala Ala Gln Gly Ser

435 440(2)SEQ ID NO:12的信息(ⅰ)序列性质：

(A)长度：1356对碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：线性(ⅱ)分子类型：cDNA到mRNA(ⅲ)假设：非(ⅳ)最初来源：

(A)生物体：拟南芥 (ⅸ)特征

(A)名称/关键词：CDS

(B)位置：1..1254(ⅸ)特征

(A)名称/关键词：misc-feature

(B)位置：1..3

(C)其它信息：/标准名称=

翻译起始密码子(ⅸ)特征

(A)名称/关键词：misc-feature

(B)位置：1252..1254

(C)其它信息：/标准名称=

翻译终止密码子(ⅹⅰ)序列描述：SEQ ID NO:12ATG TCC AAG TTC GTA AGA AAG AAT CCA AAG TCT GAT AAA TTC AAG GTT 48Met Ser Lys Phe Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val1 5 10 15AAG CGC TTC CAT CAC ATC GAG TTC TGG TGC GGC GAC GCA ACC AAC GTC 96Lys Arg Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val

20 25 30GCT CGT CGC TTC TCC TGG GGT CTG GGG ATG AGA TTC TCC GCC AAA TCC 144Ala Arg Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser

35 40 45GAT CTT TCC ACC GGA AAC ATG GTT CAC GCC TCT TAC CTA CTC ACC TCC 192Asp Leu Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser

50 55 60GGT GAC CTC CGA TTC CTT TTC ACT GCT CCT TAC TCT CCG TCT CTC TCC 240Gly Asp Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser65 70 75 80GCC GGA GAG ATT AAA CCG ACA ACC ACA GCT TCT ATC CCA AGT TTC GAT 288Ala Gly Glu Ile Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp

85 90 95CAC GGC TCT TGT CGT TCC TTC TTC TCT TCA CAT GGT CTC GGT GTT AGA 336His Gly Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg

100 105 110GCC GTT GCG ATT GAA GTA GAA GAC GCA GAG TCA GCT TTC TCC ATC AGT 384Ala Val Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser

115 120 125GTA GCT AAT GGC GCT ATT CCT TCG TCG CCT CCT ATC GTC CTC AAT GAA 432Val Ala Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu

130 135 140GCA GTT ACG ATC GCT GAG GTT AAA CTA TAC GGC GAT GTT GTT CTC CGA 480Ala Val Thr Ile Ala Glu val Lys Leu Tyr Gly Asp Val Val Leu Arg145 150 155 160TAT GTT AGT TAC AAA GCA GAA GAT ACC GAA AAA TCC GAA TTC TTG CCA 528Tyr Val Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro

165 170 175GGG TTC GAG CGT GTA GAG GAT GCG TCG TCG TTC CCA TTG GAT TAT GGT 576Gly Phe Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly

180 185 190ATC CGG CGG CTT GAC CAC GCC GTG GGA AAC GTT CCT GAG CTT GGT CCG 624Ile Arg Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro

195 200 205GCT TTA ACT TAT GTA GCG GGG TTC ACT GGT TTT CAC CAA TTC GCA GAG 672Ala Leu Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu

210 215 220TTC ACA GCA GAC GAC GTT GGA ACC GCC GAG AGC GGT TTA AAT TCA GCG 720Phe Thr Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala225 230 235 240GTC CTG GCT AGC AAT GAT GAA ATG GTT CTT CTA CCG ATT AAC GAG CCA 768Val Leu Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro

245 250 255GTG CAC GGA ACA AAG AGG AAG AGT CAG ATT CAG ACG TAT TTG GAA CAT 816Val His Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His

260 265 270AAC GAA GGC GCA GGG CTA CAA CAT CTG GCT CTG ATG AGT GAA GAC ATA 864Asn Glu Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile

275 280 285TTC AGG ACC CTG AGA GAG ATG AGG AAG AGG AGC AGT ATT GGA GGA TTC 912Phe Arg Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe

290 295 300GAC TTC ATG CCT TCT CCT CCG CCT ACT TAC TAC CAG AAT CTC AAG AAA 960Asp Phe Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys305 310 315 320CGG GTC GGC GAC GTG CTC AGC GAT GAT CAG ATC AAG GAG TGT GAG GAA 1008Arg Val Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu

325 330 335TTA GGG ATT CTT GTA GAC AGA GAT GAT CAA GGG ACG TTG CTT CAA ATC 1056Leu Gly Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile

340 345 350TTC ACA AAA CCA CTA GGT GAC AGG CCG ACG ATA TTT ATA GAG ATA ATC 1104Phe Thr Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile

355 360 365CAG AGA GTA GGA TGC ATG ATG AAA GAT GAG GAA GGG AAG GCT TAC CAG 1152Gln Arg Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln

370 375 380AGT GGA GGA TGT GGT GGT TTT GGC AAA GGC AAT TTC TCT GAG CTC TTC 1200Ser Gly Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe Ser Glu Leu Phe385 390 395 400AAG TCC ATT GAA GAA TAC GAA AAG ACT CTT GAA GCC AAA CAG TTA GTG 1248Lys Ser Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val

405 410 415GGA TGA ACAAGAAGAA GAACCAACTA AAGGATTGTC TAATTAATGT AAAACTGTTT 1304Gly *TATCTTATCA AAACAATGTA TACAACATCT CATTTAAAAA CGAGATCAAT CC 1356(2)SEQ ID NO:13的信息(ⅰ)序列性质：

(A)长度：418个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:13Met Ser Lys Phe Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val1 5 10 15Lys Arg Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val

20 25 30Ala Arg Arg Phe Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser

35 40 45Asp Leu Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser

50 55 60Gly Asp Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser65 70 75 80Ala Gly Glu Ile Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp

85 90 95His Gly Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg

100 105 110Ala Val Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser

115 120 125Val Ala Asn Gly Ala Ile Pro Ser Ser Pro Pro Ile Val Leu Asn Glu

130 135 140Ala Val Thr Ile Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg145 150 155 160Tyr Val Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro

165 170 175Gly Phe Glu Arg Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly

180 185 190Ile Arg Arg Leu Asp His Ala Val Gly Asn Val Pro Glu Leu Gly Pro

195 200 205Ala Leu Thr Tyr Val Ala Gly Phe Thr Gly Phe His Gln Phe Ala Glu

210 215 220Phe Thr Ala Asp Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala225 230 235 240Val Leu Ala Ser Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro

245 250 255Val His Gly Thr Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His

260 265 270Asn Glu Gly Ala Gly Leu Gln His Leu Ala Leu Met Ser Glu Asp Ile

275 280 285Phe Arg Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe

290 295 300Asp Phe Met Pro Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys305 310 315 320Arg Val Gly Asp Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu

325 330 335Leu Gly Ile Leu Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile

340 345 350Phe Thr Lys Pro Leu Gly Asp Arg Pro Thr Ile Phe Ile Glu Ile Ile

355 360 365Gln Arg Val Gly Cys Met Met Lys Asp Glu Glu Gly Lys Ala Tyr Gln

370 375 380Ser Gly Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe Ser Glu Leu Phe385 390 395 400Lys Ser Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val

405 410 415Gly *(2)SEQ ID NO:14的信息(ⅰ)序列性质：

(A)长度：1448碱基对

(B)类型：核酸

(C)链型：双链

(A)生物体：拟南芥 (ⅸ)特征

(A)名称/关键词：CDS

(B)位置：9..1346(ⅸ)特征

(A)名称/关键词：misc-feature

(B)位置：9..11

(C)其它信息：/标准名称=

翻译起始密码子(ⅸ)特征

(A)名称/关键词：misc-feature

(B)位置：1344..1346

(C)其它信息：/标准名称=

翻译终止密码子(ⅹⅰ)序列描述：SEQ ID NO:14TGAAATCA ATG GGC CAC CAA AAC GCC GCC GTT TCA GAG AAT CAA AAC CAT 50

Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln Asn His

l 5 10GAT GAC GGC GCT GCG TCG TCG CCG GGA TTC AAG CTC GTC GGA TTT TCC 98Asp Asp Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser15 20 25 30AAG TTC GTA AGA AAG AAT CCA AAG TCT GAT AAA TTC AAG GTT AAG CGC 146Lys Pne Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arg

35 40 45TTC CAT CAC ATC GAG TTC TGG TGC GGC GAC GCA ACC AAC GTC GCT CGT 194Phe His His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg

65 70 75TCC ACC GGA AAC ATG GTT CAC GCC TCT TAC CTA CTC ACC TCC GGT GAC 290Ser Thr Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Asp

80 85 90CTC CGA TTC CTT TTC ACT GCT CCT TAC TCT CCG TCT CTC TCC GCC GGA 338Leu Arg Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Ala Gly95 100 105 110GAG ATT AAA CCG ACA ACC ACA GCT TCT ATC CCA AGT TTC GAT CAC GGC 386Glu Ile Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp His Gly

115 120 125TCT TGT CGT TCC TTC TTC TCT TCA CAT GGT CTC GGT GTT AGA GCC GTT 434Ser Cys Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Ala Val

130 135 140GCG ATT GAA GTA GAA GAC GCA GAG TCA GCT TTC TCC ATC AGT GTA GCT 482Ala Ile Glu Val Glu Asp Ala Glu Ser Ala Phe Ser Ile Ser Val Ala

160 165 170ACG ATC GCT GAG GTT AAA CTA TAC GGC GAT GTT GTT CTC CGA TAT GTT 578Thr Ils Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val175 180 185 190AGT TAC AAA GCA GAA GAT ACC GAA AAA TCC GAA TTC TTG CCA GGG TTC 626Ser Tyr Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe

305 310 315ACC CTG AGA GAG ATG AGG AAG AGG AGC AGT ATT GGA GGA TTC GAC TTC 1010Thr Leu Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe

400 405 410GGA TGT GGT GGT TTT GGC AAA GGC AAT TTC TCT GAG CTC TTC AAG TCC 1298Gly Cys Gly Gly Phe Gly Lys Gly Asn Phe Set Glu Leu Phe Lys Ser415 420 425 430ATT GAA GAA TAC GAA AAG ACT CTT GAA GCC AAA CAG TTA GTG GGA TGA 1346Ile Glu Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly *

435 440 445ACAAGAAGAA GAACCAACTA AAGGATTGTG TAATTAATGT AAAACTGTTT TATCTTATCA 1406AAACAATGTA TACAACATCT CATTTAAAAA CGAGATCAAT CC 1448(2)SEQ ID NO:15的信息(ⅰ)序列性质：

(A)长度：446个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ⅱ)分子类型：蛋白质(ⅹⅰ)序列描述：SEQ ID NO:15Met Gly His Gln Asn Ala Ala Val Ser Glu Asn Gln Asn His Asp Asp1 5 10 15Gly Ala Ala Ser Ser Pro Gly Phe Lys Leu Val Gly Phe Ser Lys Phe

20 25 30Val Arg Lys Asn Pro Lys Ser Asp Lys Phe Lys Val Lys Arg Phe His

35 40 45His Ile Glu Phe Trp Cys Gly Asp Ala Thr Asn Val Ala Arg Arg Phe

50 55 60Ser Trp Gly Leu Gly Met Arg Phe Ser Ala Lys Ser Asp Leu Ser Thr65 70 75 80Gly Asn Met Val His Ala Ser Tyr Leu Leu Thr Ser Gly Asp Leu Arg

85 90 95Phe Leu Phe Thr Ala Pro Tyr Ser Pro Ser Leu Ser Ala Gly Glu Ile

100 105 110Lys Pro Thr Thr Thr Ala Ser Ile Pro Ser Phe Asp His Gly Ser Cys

115 120 125Arg Ser Phe Phe Ser Ser His Gly Leu Gly Val Arg Ala Val Ala Ile

165 170 175Ala Glu Val Lys Leu Tyr Gly Asp Val Val Leu Arg Tyr Val Ser Tyr

180 185 190Lys Ala Glu Asp Thr Glu Lys Ser Glu Phe Leu Pro Gly Phe Glu Arg

195 200 205Val Glu Asp Ala Ser Ser Phe Pro Leu Asp Tyr Gly Ile Arg Arg Leu

245 250 255Asp Val Gly Thr Ala Glu Ser Gly Leu Asn Ser Ala Val Leu Ala Ser

260 265 270Asn Asp Glu Met Val Leu Leu Pro Ile Asn Glu Pro Val His Gly Thr

275 280 285Lys Arg Lys Ser Gln Ile Gln Thr Tyr Leu Glu His Asn Glu Gly Ala

290 295 300Gly Leu Gln His Leu Ala Leu Mer Ser Glu Asp Ile Phe Arg Thr Leu305 310 315 320Arg Glu Met Arg Lys Arg Ser Ser Ile Gly Gly Phe Asp Phe Met Pro

325 330 335Ser Pro Pro Pro Thr Tyr Tyr Gln Asn Leu Lys Lys Arg Val Gly Asp

340 345 350Val Leu Ser Asp Asp Gln Ile Lys Glu Cys Glu Glu Leu Gly Ile Leu

355 360 365Val Asp Arg Asp Asp Gln Gly Thr Leu Leu Gln Ile Phe Thr Lys Pro

405 410 415Gly Gly Phe Gly Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser Ile Glu

420 425 430Glu Tyr Glu Lys Thr Leu Glu Ala Lys Gln Leu Val Gly

435 440 445(2)SEQ ID NO:16的信息

(ⅰ)序列性质：

(A)长度：513碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑学：线性

(ⅱ)分子类型：cDNA到mRNA

(ⅲ)假设：非

(ⅵ)最初来源：

(A)生物体：Vernonia galamenensis

(ⅶ)中间来源

(B)克隆：vsl.pkOO15.b2

(ⅹⅰ)序列描述：SEQ ID NO:16CCACACCGAT TGCCGGAACT TCACCGCCTC TCACGGCCTT GCAGTCCGAG CAATCGCCAT 60TGAAGTCGAT GACGCCGAAT TAGCTTTCTC CGTCAGCGTC TCTCACGGCG CTAAACCCTC 120CGCTGCTCCT GTAACCCTTG GAAACAACGA CGTCGTATTG TCTGAAGTTA AGCTTTACGG 180CGATGTCGCT TTCCGGTACA TAAGTTACAA AAATCCGAAC TATACATCTT CCTTTTTGCC 240CGGGTTCGAG CCCGTTGAAA AGACGTCGTC GTTTTATGAC CTTGACTACG GTATCCGCCG 300TTTGGACCAC GCCGTAGGNA ACGTCCCTGA GCTTGCTTCG GCAGTGGACT ACGTGAAATC 360ATTCACCGGA TTCCATGAGT TCGCCGAATT CACCGCGGAG GACGTCGGGA CGAGCGAGAG 420GGAACTGAAT TCGGTCGTTT TAGCTTGCAA CAGTGAGATG GTCTTGATTC CGATGAACGA 480GCCGGTGTAC GGAANAAAAG GAAGNAGCCA GAT 513

Claims

1 编码植物对羟基苯丙酮酸双加氧酶的分离核酸片段，该片段包括选自以下的核苷酸序列：

编码包括描述在SEQ ID NO:3,SEQ ID NO:11,SEQ ID NO:13和SEQ ID NO:15中的一条多肽的核苷酸序列和

与SEQ ID NO:2,SEQ ID NO:10,SEQ ID NO:12和SEQ ID NO:14的核苷酸序列基本类似的修饰核苷酸序列，在序列中含有不影响编码蛋白功能特性的缺失、插入或替换。

2 编码植物对羟基苯丙酮酸双加氧酶的分离核酸片段，该片段含有描述在SEQ ID NO:14的核苷酸序列。

3 含有操纵连接于至少一种合适的调节序列的权利要求1或权利要求2的核酸片段的嵌合基因。

4 权利要求3的嵌合基因，其中至少一个合适的调节序列指导基因在微生物中表达。

5 权利要求3的嵌合基因，其中至少一个合适的调节序列指导基因在植物中表达。

6 包含操纵连接至少一种合适调节序列的权利要求1或权利要求2的核酸片段的质粒载体。

7 包含宿主细胞和权利要求6的质粒载体的转化宿主细胞。

8 权利要求7的转化宿主细胞，其中宿主细胞来自植物或为微生物。

9 权利要求8的转化宿主细胞，其中微生物是大肠杆菌。

10 能耐受与至少一种在非转化植物中抑制对羟基苯丙酮酸双加氧酶反应速率的化合物接触的转化植物，该转化植物含有权利要求3的嵌合基因和宿主植物。

11 权利要求10的转化植物，其中宿主植物是谷类作物。

12 鉴定能抑制对羟基苯丙酮酸双加氧酶反应速率的化合物的方法，包括：

(a)用权利要求6的质粒载体转化宿主细胞；

(b)促进编码植物对羟基苯丙酮酸双加氧酶的核酸片段的表达；

(c)用一测试化合物接触来自步骤(b)的表达酶；

(d)评估测试化合物抑制对羟基苯丙酮酸双加氧酶反应速率的能力。

13 权利要求12的方法，其中通过测定氧的利用，二氧化碳的释放，尿黑酸的产生，对羟基苯丙酮酸的减少或马来酰乙酰乙酸的产生，来评估测试化合物抑制对羟基苯丙酮酸双加氧酶反应速率的能力。

14 权利要求12的方法，其中转化的宿主细胞是含编码植物对羟基苯丙酮酸双加氧酶的嵌合基因的大肠杆菌。

15 抑制植物对羟基苯丙酮酸双加氧酶活性的化合物，该化合物用权利要求14的方法鉴定。

16 使植物耐受至少一种抑制对羟基苯丙酮酸双加氧酶反应速率的化合物的方法，包括：

(a)用包含编码植物对羟基苯丙酮酸双加氧酶的核酸片段的嵌合基因转化宿主植物细胞，和

(b)表达嵌合基因，其量可以使转化植物基本上耐受至少一种抑制对羟基苯丙酮酸双加氧酶反应速率的化合物。

17 微生物生产活生植物对羟基苯丙酮酸双加氧酶的方法，包括：

(a)用权利要求4的编码植物对羟基苯丙酮酸双加氧酶的嵌合基因稳定转化微生物；

(b)促进嵌合基因在合适的时期表达；

(c)回收活性植物对羟基苯丙酮酸双加氧酶。

18 在植物中过量表达对羟基苯丙酮酸双加氧酶的方法，包括：

(a)用一种嵌合DNA分子稳定转化宿主植物细胞，该嵌合DNA分子包含至少一个拷贝在植物细胞中驱动相连的编码序列表达的合适启动子，该启动子与至少一个拷贝的同源或异源对羟基苯丙酮酸双加氧酶编码序列操纵连接；和

(b)使步骤(a)的转化宿主植物细胞生长。

19 权利要求18的方法，其中嵌合DNA分子是权利要求5的嵌合基因。

20 一种分离的核酸片段，包括选自以下的成员：

(a)一种描述在SEQ ID NO:16中的分离核酸片段；

(b)一种基本上类似于描述在SEQ ID NO:16中的分离核酸片段的分离核酸片段；和

(c)一种与(a)或(b)互补的分离核酸片段。