CN1719971B

CN1719971B - 转基因高色氨酸植物细胞

Info

Publication number: CN1719971B
Application number: CN028135067A
Authority: CN
Inventors: L·M·韦弗; J·梁; R·陈; S·S·郑; T·米特斯基; S·斯拉特尔; W·拉普
Original assignee: Renessen LLC; Monsanto Co
Current assignee: Renessen LLC; Monsanto Co
Priority date: 2001-05-04
Filing date: 2002-05-03
Publication date: 2011-04-13
Anticipated expiration: 2022-05-03
Also published as: AU2002257246A1; CA2446258C; WO2002090497A3; EP1542527A4; CA2709843A1; ATE544859T1; WO2002090497A2; US20030097677A1; US7217865B2; EP1542527B1; CA2709843C; CA2446258A1; BRPI0209437B1; CN1719971A; EP1542527A2; AR035965A1; BR0209437A

Abstract

本发明提供通过在植物细胞中导入并表达编码邻氨基苯甲酸酯合成酶的分离的DNA片段而带给植物对色氨酸的氨基酸类似物的抗性和/或改变植物的色氨酸含量的方法。还提供了编码邻氨基苯甲酸酯合成酶的分离的DNA片段转化的转基因植物，以及来自这些植物的人类或动物食物，种子和后代。

Description

转基因高色氨酸植物细胞

发明背景

很多重要作物包括大豆和玉米的种子不含有足量的使营养完全的几种氨基酸。这些氨基酸包括但不限于：色氨酸，异亮氨酸，缬氨酸，精氨酸，赖氨酸，蛋氨酸和苏氨酸。因此，这些氨基酸的生物合成途径，和/或进入那些途径的代谢产物的生物合成途径，是为了提高这些植物的氨基酸含量而操作的有潜力的目标。

邻氨基苯甲酸酯合成酶(AS，EC 4.1.3.27)催化从芳香氨基酸途径分支到植物，真菌和细菌中色氨酸的生物合成的第一反应。

邻氨基苯甲酸酯合成酶(例如，玉米邻氨基苯甲酸酯合成酶)的最常见的形式是由两个亚基，α或TrpE亚基和β或TrpG亚基，构成的异四聚体酶。两个α亚基和两个β亚基装配形成异四聚体邻氨基苯甲酸酯合成酶。还发现过″单体″形式的AS，它包括具有TrpE和TrpG两种亚基活性的单多肽链(例如苜蓿根瘤菌(Rhizobium meliloti))。邻氨基苯甲酸酯合成酶单体只包括一种类型的多肽，而邻氨基苯甲酸酯合成酶单体的酶活性形式一般是由这样两个多肽单体组成的同型二聚体。异型四聚体和单体邻氨基苯甲酸酯合成酶催化使用谷酰胺和分支酸酯的反应中邻氨基苯甲酸酯的合成。α亚基上发现的结构域(这里称作″α结构域″)结合分支酸酯并且消除烯醇丙酮酸侧链，β亚基上发现的结构域(这里称作″β结构域″)将谷酰胺上的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯苯基环上。

色氨酸合成中的下一个反应是将磷酸核糖焦磷酸酯的磷酸核糖部分转移给邻氨基苯甲酸酯。经两个步骤形成吲哚环，包括将核糖基团转移给核酮糖的异构化作用，接着进行环化反应得到吲哚甘油磷酸。该途径中最后的反应是包含一个或两个亚基的单一的酶催化的。反应实现吲哚甘油醛-3-磷酸的裂解和吲哚基团与丝氨酸的缩合(Umbarger，Ann.Rev.Biochem，47，555(1978))。

高级植物和微生物色氨酸途径中的代谢物流显然受通过色氨酸对邻氨基苯甲酸酯合成酶反馈抑制的调节。色氨酸可以阻断构象重排，而激活β-结构域并且产生氨向α-结构域的活性位点通过的通道需要构象重排。相信色氨酸的这样的反馈抑制作用压制通过邻氨基苯甲酸酯合成酶的色氨酸制备。参见Li J.& Last，R.L.鼠耳芥trp5突变体有反馈抗性邻氨基苯甲酸酯合成酶和提高的可溶性色氨酸.PlantPhysiol.110，51-59(1996)。

已经鉴定出来自鼠伤寒沙门氏菌(Salmonella typhimurium)的邻氨基苯甲酸酯合成酶的反馈调节中涉及几个氨基酸残基。该信息提供了氨基末端调节位点的证据。J.Biol.Chem.266，8328-8335(1991)。Niyogi等应用分子途径进一步表征了来自某些植物的邻氨基苯甲酸酯合成酶。参见Niyogi和Fink(Plant Cell，4，721(1992))和Niyogi等(Plant Cell，5，1011(1993))。他们发现差异调节的两个紧密相关的非等位基因编码鼠耳芥属邻氨基苯甲酸酯合成酶的α-亚基。这些α-亚基基因中的一个，ASA1，由伤害和细菌病原体渗透诱导，推断其在防御响应中涉及，而另一个α-亚基，ASA2，以组成型基础水平被表达。两者都预示蛋白质都有与细菌和真菌邻氨基苯甲酸酯合成酶蛋白质同源的区，并且在证明在细菌的色氨酸反馈抑制作用涉及的位点包含保守的氨基酸残基(Caligiuri等，J.Biol. Chem.，266，8328(1991))。

色氨酸生物合成途径中色氨酸的氨基酸类似物和中间体的类似物(例如，5-甲基色氨酸，4-甲基色氨酸，5-氟代色氨酸，5-羟基色氨酸，7-氮杂色氨酸，3β-吲哚丙烯酸，3-甲基邻氨基苯甲酸)，已经被证明抑制原核生物和真核生物的生长。能选择对这些氨基酸类似物抗性的植物细胞培养物。例如，因为改变的邻氨基苯甲酸酯合成酶，已经通过5-甲基色氨酸(5-MT)，一种色氨酸的氨基酸类似物，选择了培养的烟草，胡萝卜，马铃薯，玉米和毛曼陀螺细胞系。

Ranch等(Plant Physio.，71，136(1983))对毛曼陀螺，一种双子叶杂草的细胞培养物筛选5-MT抗性，并且报道该抗性细胞培养物含有提高的色氨酸水平(比野生型水平高8至30倍)并且邻氨基苯甲酸酯合成酶对色氨酸反馈抑制作用具有较小敏感性。再生植物也对5-MT有抗性，含有改变的邻氨基苯甲酸酯合成酶，并且比对照植物的叶子具有更高的游离色氨酸浓度(4-44倍)。与使用烟草的研究相反，其中从抗性细胞系再生的植物不表达改变的酶，这些结果表明氨基酸超量生产表型应该在细胞水平上选择，并且在毛曼陀螺中选择的细胞再生的整个植株中表达。

Hibberd等(美国专利No.4,581,847，1986年4月15日公开)描述了5-MT抗性玉米细胞系，它含有比野生型邻氨基苯甲酸酯合成酶对反馈抑制敏感性更小的邻氨基苯甲酸酯合成酶。一种5-MT抗性细胞系积累的游离色氨酸水平几乎比没有转化的细胞系大20倍。

P.C.Anderson等(美国专利No.6,118,047)公开了来自C28玉米的邻氨基苯甲酸酯合成酶的色氨酸不敏感α-结构域在转基因制备种子中具有高水平游离色氨酸的转基因玉米植物(玉米)的用途。

尽管有可能在某些细胞培养物和植物中筛选5-MT抗性，这种特征不必然地与整个植株中游离色氨酸的超量生产相关联。另外，从5-MT抗性系再生的植株常常不表达改变形式的酶。不可预言这种特征在一段时期内稳定并且作为可遗传性状传代。

从高级植物细胞培养物的粗提取物中也已经部分纯化出邻氨基苯甲酸酯合成酶(Hankins等，PlantPhysiol.，57，101(1976)；Widholm，Biochim.Biophys.Acta，320，217(1973))。但是，发现它是非常不稳定的。因此，需要提供具有能提高植物色氨酸含量的邻氨基苯甲酸酯合成酶来源的植物。

发明概述

本发明提供用来产生转基因植物的编码邻氨基苯甲酸酯合成酶(AS)的核酸。当在转基因植物中表达这样的邻氨基苯甲酸酯合成酶核酸时，植物细胞中能达到提高水平的色氨酸。在一个实施方案中，本发明涉及编码单体邻氨基苯甲酸酯合成酶的DNA分子，其中这样的单体邻氨基苯甲酸酯合成酶是天然的或基因工程的邻氨基苯甲酸酯合成酶的α-和β-结构域的嵌合融合体。来自几种物种(例如，一些细菌和其它微生物)的邻氨基苯甲酸酯合成酶基因天然给出构成单多肽链的单体邻氨基苯甲酸酯合成酶。但是，大多数物种具有由分开亚基上发现的两个α-和两个β-结构域组成的杂四聚体邻氨基苯甲酸酯合成酶。本发明还涉及包括与任何β-结构域连接的任何邻氨基苯甲酸酯合成酶α-结构域的嵌合邻氨基苯甲酸酯合成酶融合蛋白的形成。

一般情况下，天然存在的单体邻氨基苯甲酸酯合成酶与大多数植物邻氨基苯甲酸酯合成酶的序列同一性十分低。但是，根据本发明，这样的单体邻氨基苯甲酸酯合成酶当在植物中表达时能提供高水平色氨酸，尽管与植物的内源邻氨基苯甲酸酯合成酶的序列同一性低。因此，本发明提供具有趋异序列并且在植株宿主中能有效提供高水平色氨酸的单体邻氨基苯甲酸酯合成酶。例如，含有单体根癌土壤杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸酯合成酶的转基因大豆植物在种子中能产生最多大约10,000至大约12,000ppm色氨酸，平均trp水平范围大约7,000至大约8,000ppm。相反，非转基因大豆植物种子中一般只有至多大约100至大约200ppm色氨酸。

因此，本发明提供编码单体邻氨基苯甲酸酯合成酶的分离的DNA序列，其中单体邻氨基苯甲酸酯合成酶具有邻氨基苯甲酸酯α-结构域和邻氨基苯甲酸酯β-结构域，并且其中在植株中表达单体邻氨基苯甲酸酯合成酶。这样的表达能提高植物中L-色氨酸的水平。

单体邻氨基苯甲酸酯合成酶可以是天然单体。可以从中分离天然单体邻氨基苯甲酸酯合成酶核酸的生物体的例子包括但不限于下面的生物体，例如根癌土壤杆菌，苜蓿根瘤菌(Rhizobium meliloti)(例如，Genbank登记号No.GI 95177)，Mesorhizobium loti(例如， Genbank登记号No.GI 13472468)，马尔他布鲁氏菌(Brucellamelitensis)(例如，Genbank登记号No.GI 17982357)，念珠蓝细菌(Nostoc sp.)PCC7120(例如，Genbank登记号Nos.GI 17227910或者GI 17230725)，巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号No.GI 1174156)和鱼腥蓝细菌(AnabaenaM22983)(例如，Genbank登记号No.GI 152445)。在一些实施方案中，分离的DNA编码具有例如具有SEQ ID NO：4氨基酸序列的或者具有SEQ ID NO：1或75任一个核苷酸序列的根癌土壤杆菌邻氨基苯甲酸酯合成酶。

或者，单体邻氨基苯甲酸酯合成酶可以是任何可获得的邻氨基苯甲酸酯合成酶α-和β-结构域的融合体。这样的α-和β-结构域可以从下面的生物得到：玉米，芸香，硫磺矿硫化叶菌(Sulfolobussolfataricus)，鼠伤寒沙门氏菌(Salmonella typhimurium)，粘质沙雷氏菌(Serratia marcescens)，大肠杆菌(Escherichia coli)，根癌土壤杆菌(Agrobacterium tumefaciens)，鼠耳芥，苜蓿根瘤菌(Rhizobium meliloti)(例如，Genbank登记号No.GI95177)，Mesorhizobium loti(例如，Genbank登记号No.GI 13472468)，马尔他布鲁氏菌(Brucella melitensis)(例如，Genbank登记号No.GI 17982357)，念珠蓝细菌(Nostoc sp.)PCC7120(例如，Genbank登记号Nos.GI 17227910或者GI 17230725)，巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号No.GI 1174156)和鱼腥蓝细菌(Anabaena)M22983(例如，Genbank登记号No.GI152445)，大豆，稻，棉花，小麦，烟草或编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。例如，编码这样的α-或β-结构域的核酸能通过使用SEQ ID NO：1-70，75-103中任一个的序列信息来获得。

在另一个实施方案中，本发明提供编码来自玉米的包括SEQ ID NO：5，或SEQ ID NO：66的邻氨基苯甲酸酯合成酶的α-结构域的分离的DNA。这样的分离的DNA可以具有SEQ ID NO：2，67或68的核苷酸序列。分离的DNA能与启动子可操作性连接，并且当在植株中表达时能在植株中提供高水平L-色氨酸。

分离的DNA也能编码突变体邻氨基苯甲酸酯合成酶，或者突变体邻氨基苯甲酸酯合成酶结构域。这样的突变体邻氨基苯甲酸酯合成酶，或者其结构域，能有一处或多处突变。正如本领域技术人员公知的，突变可以是沉默的，能给出具有类似于野生型酶活性的基因产物变体，或者能给出具有改变的酶活性的基因产物衍生物。本发明包括所有的这样的突变体。

突变的分离的DNA能体外或体内从野生型邻氨基苯甲酸酯合成酶核酸产生，并且能编码，例如，一个或多个氨基酸取代，缺失或插入。产生具有提高的活性，更高的稳定性，或者对色氨酸或色氨酸类似物反馈抑制敏感较小的邻氨基苯甲酸酯合成酶突变体的突变的分离的DNAs是人们期望的。在一个实施方案中，邻氨基苯甲酸酯合成酶，或者其结构域，对内源L-色氨酸或色氨酸类似物赋予的抑制作用有抗性。例如，邻氨基苯甲酸酯合成酶在色氨酸结合袋处或者降低邻氨基苯甲酸酯合成酶或者其结构域对色氨酸抑制作用的敏感性的别处有一个或多个突变。氨基酸残基中涉及突变的是例如大约48，51，52，293和298位置处的残基。例如，突变可以是：

a)在大约48位，Phe置换Val；

b)在大约48位，Tyr置换Val；

c)在大约51位，Phe置换Ser；

d)在大约51位，Cys置换Ser；

e)在大约52位，Phe置换Asn；

f)在大约293位，Ala置换Pro；

g)在大约293位，Gly置换Pro；或

h)在大约298位，Trp置换Phe；

其中通过将选择的邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列比对确定突变位置。具有这样的突变的邻氨基苯甲酸酯合成酶的例子包括具有SEQ ID NO：58-65，69，70，84-94的那些。

分离的DNA能编码其它元件和功能。包括本领域技术人员想到的任何元件或功能。例如，分离的DNA还可以包括在植物细胞中有功能的启动子，它与编码邻氨基苯甲酸酯合成酶的DNA可操作性连接。分离的DNA还能编码质体转运肽。分离的DNA还能编码选择标记或报道基因。这样的选择标记基因能给所述植物的细胞赋予除草剂抗性，高蛋白质含量，高油含量，高赖氨酸含量，高异亮氨酸含量，高生育酚含量等。所述DNA序列还可以包括编码来自苏云金芽孢杆菌(Bacillusthuringiensis)的杀虫蛋白的一种或几种的序列。

本发明进一步提供包括本发明的分离的DNA的载体。这样的载体可以被用来在原核细胞和真核细胞中表达邻氨基苯甲酸酯合成酶多肽，来转化植物细胞和来产生转基因植物。

本发明还提供包括本发明的分离的DNA的转基因植物。这些分离的DNA在转基因植物中表达能导致转基因植物中，例如植物的种子或者其它部分，L-色氨酸优选游离的L-色氨酸含量提高。该含量高于因不存在此DNA而与转基因大豆植物细胞例如相应的没有转化的细胞或带有相同的遗传背景的没有转化的植物不同的植物的细胞中L-色氨酸的含量。所述DNA优选是可遗传的，其优选通过可繁殖植物到其后代和再到进一步传代完整正常有性周期而传递。

能具有这样的分离的DNA的转基因植物包括双子叶植物，例如，大豆或canola。或者，转基因植物可以是单子叶植物，例如，玉米，稻，小麦，大麦或高梁。

本发明还提供包含本发明的分离的DNA，邻氨基苯甲酸酯合成酶多肽，转基因或载体的转基因植物的种子。

本发明进一步提供含有具有本发明的分离的DNA的植物的至少一部分的动物饲料或人食物。动物饲料或人食物中可以包括的植物的部分包括，例如，种子，叶，茎干，根，块茎，或果实。期望的植物的部分具有本发明的分离的DNA编码的邻氨基苯甲酸酯合成酶的表达提供的提高水平的色氨酸。

本发明进一步提供通过将本发明的分离的DNA导入植物的可再生细胞中而改变优选提高植物(双子叶或单子叶)的色氨酸含量的方法。所述DNA序列优选与植物细胞中可操作的一个启动子可操作性连接。鉴定或筛选转化的细胞，然后再生，得到包括表达功能邻氨基苯甲酸酯合成酶多肽的细胞的植株。在一些实施方案中，编码邻氨基苯甲酸酯合成酶或者其结构域的DNA，是突变体DNA。导入的DNA优选是可遗传的，并且植物优选是可繁殖植物。例如，导入的DNA优选能通过产生后代植株的完全有性循环而传代，并且能给后代的下一代赋予高色氨酸表型。

邻氨基苯甲酸酯合成酶-编码DNAs，优选被插入载体中或转基因中，其中还可以包括编码转运肽的DNA序列，例如质体转运肽，和选择标记或报道基因，它们与在靶植物细胞中有功能的一个或多个启动子可操作性连接。启动子可以是，例如，诱导型启动子，组织特异性启动子，强启动子或弱启动子。其它转录或翻译调节元件，例如，增强子或中止子，也可以被功能连接于邻氨基苯甲酸酯合成酶-编码DNA片段。

通过各种各样的转化技术，例如，通过微粒轰击，电穿孔和根癌土壤杆菌介导的转化，和其它本领域能获得的方法，能转化悬浮培养物中的或者作为胚胎，完整组织或器官的细胞。

因此，转化植物的细胞包括天然邻氨基苯甲酸酯合成酶基因和编码外源邻氨基苯甲酸酯合成酶的转基因或其它DNA片段。外源邻氨基苯甲酸酯合成酶在植物细胞中的表达能导致色氨酸及其次级代谢物水平的提高。在一些实施方案中，这样的表达赋予对一定量内源L-色氨酸类似物的耐受性，例如，这样与具有野生型或色氨酸敏感型邻氨基苯甲酸酯合成酶的植物细胞相比，存在至少大约10％以上邻氨基苯甲酸酯合成酶活性。

本发明还提供改变植物中色氨酸含量的方法，包括：(a)向植物可再生细胞中导入包括编码邻氨基苯甲酸酯合成酶结构域和质体转运肽的分离的DNA的转基因，其可操作性连接于在植物细胞中有功能的启动子，得到转化细胞；和(b)从所述转化植物细胞再生转化植株，其中所述植物细胞以相对于相同遗传背景的没有转化的植物中色氨酸含量来说在所述植物中有效提高色氨酸含量的量表达分离的DNA编码的邻氨基苯甲酸酯合成酶结构域。所述结构域可以是邻氨基苯甲酸酯合成酶α-结构域。邻氨基苯甲酸酯合成酶结构域可以有一个或多个突变，例如，降低结构域对色氨酸抑制作用的敏感性的突变。这样的突变可以在例如色氨酸结合袋中。这样的结构域可以是例如来自下面的微生物的邻氨基苯甲酸酯合成酶结构域：根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983，鼠耳芥，巴西固氮螺菌(Azospirillum brasilense)，马尔他布鲁氏菌(Brucella melitensis)，大肠杆菌(Escherichia coli)，Euglenagracilis，Mesorhizobium loti，念珠蓝细菌(Nostoc sp.)PCC7120，苜蓿根瘤菌(Rhizobium meliloti)，芸香，血色红假单孢菌(Rhodopseudomonas palustris)，鼠伤寒沙门氏菌(Salmonellatyphimurium)，粘质沙雷氏菌(Serratia marcescens)，硫磺矿硫化叶菌(Sulfolobus solfataricus)，大豆，稻，棉花或玉米。芸香具有其本身的叶绿体转运序列，它可以与邻氨基苯甲酸酯合成酶转基因使用。因此，本领域技术人员当使用芸香DNA时不需要加质体转运序列。

本发明还提供包括编码单体邻氨基苯甲酸酯合成酶或者其结构域的DNA的新的分离的和纯化的DNA分子。这样的邻氨基苯甲酸酯合成酶DNA当在植株中表达时能提供高水平色氨酸。在一些实施方案中，邻氨基苯甲酸酯合成酶基本上对游离L-色氨酸或者其类似物的抑制作用有抗性。本发明涉及的新的DNA序列的例子包括但不限于从下面微生物分离的DNA分子：根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983，鼠耳芥，巴西固氮螺菌(Azospirillumbrasilense)，马尔他布鲁氏菌(Brucella melitensis)，大肠杆菌(Escherichiacoli)，Euglena gracilis，Mesorhizobium loti，念珠蓝细菌(Nostoc sp.)PCC7120，苜蓿根瘤菌(Rhizobiummeliloti)，芸香，血色红假单孢菌(Rhodopseudomonas palustris)，鼠伤寒沙门氏菌(Salmonella typhimurium)，粘质沙雷氏菌(Serratiamarcescens)，硫磺矿硫化叶菌(Sulfolobus solfataricus)，或玉米。

这些DNA序列包括具有与多肽单链上至少一种其它邻氨基苯甲酸酯合成酶结构域连接的邻氨基苯甲酸酯合成酶的α-结构域的合成的或天然存在的单体形式的邻氨基苯甲酸酯合成酶。单体邻氨基苯甲酸酯合成酶可以是例如邻氨基苯甲酸酯合成酶α-或β-结构域的融合体。这样的邻氨基苯甲酸酯合成酶α-或β-结构域可以来自根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983，鼠耳芥，巴西固氮螺菌(Azospirillum brasilense)，马尔他布鲁氏菌(Brucella melitensis)，大肠杆菌(Escherichiacoli)，Euglena gracilis，Mesorhizobium loti，念珠蓝细菌(Nostocsp.)PCC7120，苜蓿根瘤菌(Rhizobium meliloti)，芸香，血色红假单孢菌(Rhodopseudomonas palustris)，鼠伤寒沙门氏菌 (Salmonella typhimurium)，粘质沙雷氏菌(Serratia marcescens)，硫磺矿硫化叶菌(Sulfolobus solfataricus)，大豆，稻，棉花，小麦，烟草或玉米(Zea mays)，或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。从下面来源分离的邻氨基苯甲酸酯合成酶核酸也在这里举例说明了这样的邻氨基苯甲酸酯合成酶及其结构域：根癌土壤杆菌，(SEQ ID NO：1，75，84-94)，玉米，(SEQ ID NO：2，67，68，96)，芸香(SEQ ID NO：3)，鱼腥蓝细菌M22983，鼠耳芥(SEQID NO：45)，巴西固氮螺菌(SEQ ID NO：78)，马尔他布鲁氏菌(SEQID NO：79)，Mesorhizobium loti(SEQ ID NO：77)，念珠蓝细菌PCC7120(SEQ ID NO：80或81)，苜蓿根瘤菌(SEQ ID NO：7)，血色红假单孢菌(SEQ ID NO：57)，硫磺矿硫化叶菌(SEQ ID NO：8)，稻(SEQ ID NO：94或95)，小麦(SEQ ID NO：97)，或烟草(SEQ ID NO：98)。这些核苷酸序列编码来自下面来源的邻氨基苯甲酸酯合成酶或者其α-结构域：根癌土壤杆菌(SEQ ID NO：4，58-65，69，70，)；玉米(SEQ ID NO：5，66或101)和芸香(SEQ ID NO：6)，鱼腥蓝细菌M22983，巴西固氮螺菌(SEQ ID NO：78)，马尔他布鲁氏菌(SEQ IDNO：79)，Mesorhizobium loti(SEQ ID NO：77)，念珠蓝细菌PCC7120(SEQ ID NO：80或81)，苜蓿根瘤菌(SEQ ID NO：7或43)，血色红假单孢菌(SEQ ID NO：57或82)，硫磺矿硫化叶菌(SEQ ID NO：8或44)，稻(SEQ ID NO：99或100)，小麦(SEQ ID NO：102)，或烟草(SEQ ID NO：103)。

本发明还提供包括编码根癌土壤杆菌邻氨基苯甲酸酯合成酶或者其具有酶促活性的结构域的DNA序列的分离的DNA分子。这样的DNA分子能编码具有SEQ ID NO：4，58-65，69或70的邻氨基苯甲酸酯合成酶，具有邻氨基苯甲酸酯合成酶活性的其结构域或变体。所述DNA分子还可以具有包括SEQ ID NO：1，75，84-94的序列，或者其结构域或变体。也能针对在选择的生物体例如选择的植物或微生物中的表达优化这里提供的任何DNA分子的编码区。对于选择的植物具有优化密码子使用的DNA分子的例子是具有SEQ ID NO：75的根癌土壤杆菌邻氨基苯甲酸酯合成酶DNA分子。

本发明还提供了包括编码玉米邻氨基苯甲酸酯合成酶结构域的DNA序列的分离的和纯化的DNA分子。这样的DNA分子能编码具有SEQ ID NO：5，66的邻氨基苯甲酸酯合成酶结构域或者具有邻氨基苯甲酸酯合成酶活性的其变体或衍生物。所述DNA分子也可以具有包括SEQID NO：2，67或68的序列，或者其结构域或变体。

本发明进一步提供在严谨条件下与包括SEQ ID NO：1，75或84-94任一个的DNA分子的互补序列杂交的至少8个核苷酸的分离的DNA分子。这样的DNA分子可以是探针或引物，例如，具有SEQ ID NO：9-42或47-56任一个的核酸。或者，所述DNA能包括至多针对选择的邻氨基苯甲酸酯合成酶或者其结构域的整个编码区。这样的DNA还可以包括编码在植物细胞中可操作的启动子的DNA序列和/或编码质体传递肽的DNA序列。本发明进一步涉及用于这些类型的DNA分子在植物和/或微生物中转化和表达的载体。

本发明范围内也包括表现出与这里清楚描述的DNA序列和氨基酸序列序列同一性50％，优选60％，更优选70％，更优选80％，最优选90％，例如，95％至99％的功能邻氨基苯甲酸酯合成酶DNA序列和功能邻氨基苯甲酸酯合成酶多肽。例如，85％同一性意思是当两个序列最大匹配比对时85％的氨基酸是相同的。最大匹配中有空位(两个序列中的一个是匹配的)；空位长度是5或更小是优选的，2或更小是更优选的。

或者并且优选地，根据这里使用的该术语，如果应用带有突变数据矩阵并且空位默认值是6或更大的ALIGN程序，它们具有大于5的比对分值，则这两个多肽序列是同源的。参见Dayhoff，M.O.，Atlas ofProtein Sequence and Structure，1972，第5卷，NationalBiomedical Research Foundation，pp.101-110，和该卷的增刊2，pp.1-10。当利用ALIGN程序最优比对时，如果它们的氨基酸同一性大于或等于50％，则这两个序列或者其部分更优选是同源的。

本发明进一步提供产生具有高种子水平色氨酸的转基因植物的表达载体，包含与在植物细胞中有功能的启动子可操作性连接的编码包括与邻氨基苯甲酸酯合成酶β-结构域和质体转运肽连接的邻氨基苯甲酸酯合成酶α-结构域的单体邻氨基苯甲酸酯合成酶的分离的DNA序列。这样的单体邻氨基苯甲酸酯合成酶可以是，例如，根癌土壤杆菌，苜蓿根瘤菌，Mesorhizobium loti，马尔他布鲁氏菌，

念珠蓝细菌PCC7120，巴西固氮螺菌或鱼腥蓝细菌M22983邻氨基苯甲酸酯合成酶。单体邻氨基苯甲酸酯合成酶还可以是邻氨基苯甲酸酯合成酶α-或β-结构域的融合体，这样的邻氨基苯甲酸酯合成酶α-或β-结构域来自根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983，鼠耳芥，巴西固氮螺菌(Azospirillumbrasilense)，马尔他布鲁氏菌(Brucella melitensis)，Mesorhizobiumloti，念珠蓝细菌(Nostoc sp.)PCC7120，苜蓿根瘤菌(Rhizobiummeliloti)，芸香，血色红假单孢菌(Rhodopseudomonas palustris)，硫磺矿硫化叶菌(Sulfolobus solfataricus)，鼠伤寒沙门氏菌(Salmonella typhimurium)，粘质沙雷氏菌(Serratia marcescens)，大豆，稻，棉花，小麦，烟草或玉米，或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。

可以以分子水平评价提供提高的色氨酸水平的分离的和纯化的邻氨基苯甲酸酯合成酶DNA的传递，例如，Southern或Northern印迹分析，PCR-为基础的方法，邻氨基苯甲酸酯合成酶的生物化学或免疫检测，或者通过表型分析，即，转化的后代的细胞是否能够在一定量的抑制没有转化的植物细胞生长的色氨酸的氨基酸类似物的存在下生长。

本发明还提供在优选能以商业规模培养的原核或真核宿主细胞例如酵母，昆虫细胞，或细菌中产生邻氨基苯甲酸酯合成酶的方法。该方法包括将包括编码邻氨基苯甲酸酯合成酶或者其结构域，例如单体邻氨基苯甲酸酯合成酶，至少包括α和β邻氨基苯甲酸酯合成酶结构域或者其功能变体，的DNA片段的转基因导入宿主细胞，并且在宿主细胞中表达邻氨基苯甲酸酯合成酶以得到功能邻氨基苯甲酸酯合成酶或者其结构域的步骤。转基因一般包括转录和翻译调节元件，例如，在真核或原核源的宿主细胞中有功能的启动子。优选地，转基因被导入原核细胞，例如大肠杆菌，或者真核细胞，例如酵母或昆虫细胞，已知它们用于产生重组蛋白质。培养转化细胞能导致色氨酸及其衍生物生产的增强，色氨酸及其衍生物能从细胞或者培养基中回收。色氨酸的积累还可以导致微生物和植物中次级代谢物产生的增加，例如植物中含有吲哚的代谢物，例如简单的吲哚，吲哚偶联物，吲哚生物碱，吲哚植物抗毒素和吲哚glucosinalates。

对色氨酸不敏感的邻氨基苯甲酸酯合成酶具有增加分支酸变位酶衍生的代谢物的种类的可能性，包括由于通过分支酸变位酶的色氨酸对苯丙氨酸合成的刺激而从苯丙氨酸衍生的那些。参见Siehl，D.，从分支酸生物合成色氨酸，酪氨酸和苯丙氨酸(The biosynthesis oftryptophan，tyrosine，and phenylalanine from chorismate)，PlantAmino Acids：Biochemistry and Biotechnology，BK Singh编著，pp171-204。当存在反馈不敏感邻氨基苯甲酸酯合成酶是可以增加的其它分支酸代谢物包括苯基propanoids，类黄酮，和类异黄酮，以及从邻氨基苯甲酸酯衍生的那些，例如吲哚，吲哚生物碱，和吲哚glucosinolates。这些化合物中很多是重要的植物激素，植物防御化合物，各种健康状态的化学预防药物，和/或药物活性化合物。其合成可能因邻氨基苯甲酸酯合成酶的表达而增加的这些化合物的范围取决于其中表达邻氨基苯甲酸酯合成酶的生物体。本发明涉及在各种原核和真核细胞和生物体中合成色氨酸和其它有用的化合物，包括植物细胞，微生物，真菌，酵母，细菌，昆虫细胞和哺乳动物细胞。

因此，本发明提供制备色氨酸的方法：在足以表达分离的DNA编码的单体邻氨基苯甲酸酯合成酶的条件下培养包括分离的DNA的原核或真核宿主细胞，其中单体邻氨基苯甲酸酯合成酶包括邻氨基苯甲酸酯合成酶α结构域和邻氨基苯甲酸酯合成酶β结构域，并且其中足以表达单体邻氨基苯甲酸酯合成酶的条件包括对于宿主细胞利用单体邻氨基苯甲酸酯合成酶合成色氨酸来说足够的营养和前体。

在各种宿主细胞和/或生物体中表达时可以产生的有用的化合物的例子包括吲哚乙酸和其它植物激素，大豆中发现的对心血管健康重要的异类黄酮化合物，作为对玉米草食性昆虫天敌的信号起作用的挥发性吲哚化合物，十字花科植物家族中发现的抗癌药物，例如吲哚glucosinolates(吲哚-3-甲醇)，以及一些真菌物种产生的吲哚生物碱，例如麦角化合物(Barnes等，Adv Exp Med Biol，401，87(1996)；Frey等，Proc Natl Acad Sci，97，14801(2000)；Muller等，BiolChem，381，679(2000)；Mantegani等，Farmaco，54，288(1999)；Zeligs，J Med Food，1，67(1998)；Mash等，Ann NY Acad Sci，844，274(1998)；Melanson等，Proc Natl Acad Sci，94，13345(1997)；Broadbent等，Curr Med Chem，5，469(1998))。

本发明还提供在中等，优选高严谨条件下，与邻氨基苯甲酸酯合成酶编码DNA分子的互补序列杂交的至少7个核苷酸碱基的分离的和纯化的DNA分子。这样的分离的和纯化的DNA分子包括编码邻氨基苯甲酸酯合成酶或者其结构域或突变体的新的DNA片段。突变体DNA能编码基本上对游离L-色氨酸或者色氨酸的氨基酸类似物赋予的抑制作用有抗性的邻氨基苯甲酸酯合成酶。这样的邻氨基苯甲酸酯合成酶DNA分子能例如与根癌土壤杆菌，血色红假单孢菌或芸香邻氨基苯甲酸酯合成酶或者其α-结构域，包括其功能突变体杂交。当这些DNA分子编码功能邻氨基苯甲酸酯合成酶或邻氨基苯甲酸酯合成酶结构域时，它们被称作编码邻氨基苯甲酸酯合成酶，邻氨基苯甲酸酯合成酶结构域或者其突变体的一级DNA分子的″变体″。较短DNA分子或寡核苷酸可以被用作用于通过PCR扩增靶DNA序列的引物，或者用作全长基因合成的中间体。

还提供了包括可检测标记的或者能与可检测标记物结合的至少7个核苷酸碱基的新的分离的和纯化的DNA片段的杂交探针，其中所述DNA片段在中等或者优选高严谨条件下与包括编码邻氨基苯甲酸酯合成酶，例如单体邻氨基苯甲酸酯合成酶，或者其结构域，例如α-结构域，包括其基本上对色氨酸的氨基酸类似物赋予的抑制作用有抗性的功能突变体的DNA片段的DNA分子的非编码链杂交。中等和严谨杂交条件对于本领域是公知的，参见，例如Sambrook等，分子克隆：实验手册(Molecular Cloning：A Laboratory Manual)0.47-9.51章节，第二版(1989)；也可参见，Sambrook和Russell，分子克隆：实验手册(Molecular Cloning：A Laboratory Manual)，第三版(2001年1月15日)。例如，严谨条件是那些：(1)使用低离子强度和高温的条件洗涤，例如，0.015M NaCl/0.0015M柠檬酸钠(SSC)；50℃下0.1％十二烷基硫酸钠(SDS)，或者(2)在杂交过程中使用变性剂，例如甲酰胺，例如，42℃下，有750mM NaCl，75mM柠檬酸钠的50％甲酰胺和0.1％牛血清白蛋白/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/50mM磷酸钠缓冲液，pH 6.5。另一个例子是42℃下，使用50％甲酰胺，5xSSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH 6.8)，0.1％焦磷酸钠，5x Denhardt′s溶液，超声处理过的鲑精DNA(50微克/毫升)，0.1％十二烷酰基硫酸钠(SDS)，和10％硫酸葡聚糖，42℃下，用0.2xSSC和0.1％SDS洗涤。

附图简述

图1是pMON61600限制性酶切图。

图2描述根癌土壤杆菌(Agrobacterium tumefaciens)邻氨基苯甲酸酯合成酶DNA序列的翻译序列(上面的序列)(SEQ ID NO：4)和来自苜蓿根瘤菌(Rhizobium meliloti)的邻氨基苯甲酸酯合成酶DNA序列的翻译序列(下面的序列)(SEQ ID NO：7)。

图3是pMON 34692限制性酶切图。

图4是pMON 34697限制性酶切图。

图5是pMON 34705限制性酶切图。

图6(A-B)描述比较根癌土壤杆菌α-结构域序列(SEQ ID NO：4)和硫磺矿硫化叶菌α-结构域序列(SEQ ID NO：8)的邻氨基苯甲酸酯合成酶氨基酸序列比对。

图7(A-B)描述用于诱变SEQ ID NO：1的34个引物的序列(SEQ IDNOs 9-42)。下划线是突变的密码子，下面这种情况是变化的碱基。

图8描述质粒pMON13773的限制性酶切图。

图9描述质粒pMON58044的限制性酶切图。

图10描述质粒pMON53084的限制性酶切图。

图11描述质粒pMON58045的限制性酶切图。

图12描述质粒pMON58046的限制性酶切图。

图13描述质粒pMON38207的限制性酶切图。

图14描述质粒pMON58030的限制性酶切图。

图15描述质粒pMON58006的限制性酶切图。

图16描述质粒pMON58041的限制性酶切图。

图17描述质粒pMON58028的限制性酶切图。

图18描述质粒pMON58042的限制性酶切图。

图19描述质粒pMON58029的限制性酶切图。

图20描述质粒pMON58043的限制性酶切图。

图21(A-D)描述具有SEQ ID NO：4和43(分别来自根癌土壤杆菌和苜蓿根瘤菌)的单体″TrpEG″邻氨基苯甲酸酯合成酶与来自硫磺矿硫化叶菌(SEQ ID NO：44)和鼠耳芥(SEQ ID NO：45)的异四聚体邻氨基苯甲酸酯合成酶的TrpE(α)和TrpG(β)结构域的多序列比对。下划线是接头区。

图22是质粒pMON52214的限制性酶切图。

图23是质粒pMON53901的限制性酶切图。

图24是质粒pMON39324的限制性酶切图。

图25是质粒pMON39322的限制性酶切图。

图26是质粒pMON39325的限制性酶切图。

图27是描述pMON39325转化的大豆种子中游离色氨酸水平的图。每个事件观察5次。

NT代表未转基因的大豆种子。

图28是质粒pMON25997的限制性酶切图。

图29是质粒pMON62000的限制性酶切图。

图30描述截短的大肠杆菌EMG2(K-12wt F+)的trpE基因的序列(K-12wt F+)(SEQ ID NO：46)。该t rpE核酸的前30bp和后150bp通过EcoR1限制性酶切位点连接。trpG基因开头接着trpE终止密码子。

图31图示说明大肠杆菌trpE基因框内缺失的构建。

图32(A-C)描述从根癌土壤杆菌分离的邻氨基苯甲酸酯合成酶基因的α-结构域的DNA序列(SEQ ID NO：1)和氨基酸序列(SEQ ID NO：4)。

图33(A-C)描述从玉米分离的邻氨基苯甲酸酯合成酶基因的α-结构域的DNA序列(SEQ ID NO：2)。图33(D)描述从玉米分离的邻氨基苯甲酸酯合成酶基因的α-结构域的氨基酸序列(SEQ ID NO：5)。

图34是质粒pMON58120的限制性酶切图。

图35(A-E)提供了来自根癌土壤杆菌(AgrTu_15889565)(SEQ IDNO：4)，苜蓿根瘤菌(RhiMe_136328)(SEQ ID NO：7)，Mesorhizobiumloti(MesLo_13472468)(SEQ ID NO：77)，巴西固氮螺菌(AzoBr_1717765)(SEQ ID NO：78)，马尔他布鲁氏菌(BruMe_17986732)(SEQ ID NO：79)，念珠蓝细菌(Nostoc_17227910)(SEQ ID NO：80)，念珠蓝细菌(Nostoc_17230725)(SEQ ID NO：81)，和血色红假单孢菌(RhoPa_TrpEG)(SEQ ID NO：82)的邻氨基苯甲酸酯合成酶氨基酸序列的序列比较。

图36(A-B)提供对于根癌土壤杆菌邻氨基苯甲酸酯合成酶优化的核苷酸序列(SEQ ID NO：75)。

图37(A-C)提供野生型(上链)和优化的(下链)根癌土壤杆菌邻氨基苯甲酸酯合成酶核苷酸序列(SEQ ID NO：1和75)的比对。这两个序列94％相同。

发明详述

本发明提供分离的DNAs，载体，宿主细胞和转基因植物，其中包括当在植物中表达时能提供高水平色氨酸的邻氨基苯甲酸酯合成酶的分离的编码核酸。在一个实施方案中，分离的核酸编码单体邻氨基苯甲酸酯合成酶(AS)。在另一个实施方案中，分离的核酸编码邻氨基苯甲酸酯合成酶，或者其基本上对游离L-色氨酸或色氨酸的氨基酸类似物赋予的抑制作用有抗性的结构域。邻氨基苯甲酸酯合成酶或者其结构域的表达提高种子中色氨酸例如游离色氨酸的水平，使其水平高于没有这种表达的植物中存在的水平。

还提供了制备具有与提高的邻氨基苯甲酸酯合成酶活性相关的核酸的产生高水平色氨酸的转基因植物，制备培养的细胞，植物组织，植物，植物部分和种子的方法。这样的转基因植物优选能将产生高水平色氨酸的能力有性传递给它们的后代。还描述了产生分离的编码突变体邻氨基苯甲酸酯合成酶的DNAs的方法，以及选择超量生产色氨酸和/或对色氨酸类似物有抗性的新的表型的细胞培养筛选技术。例如，为了产生能产生高水平色氨酸的大豆品系，制备并表征包含至少一种本发明的分离的DNAs的转基因大豆细胞，然后再生成植物。一些分离的DNAs对色氨酸类似物赋予的生长抑制作用有抗性。本发明中提供的方法还可以被用来在双子叶植物中，例如其它豆类，以及单子叶植物，例如谷物，产生高水平的色氨酸。

定义

如这里定义的，被转化植物，植物组织，植物部分或植物细胞中色氨酸的″改变的″水平是比相应的没有转化的植物，植物组织，植物部分或植物细胞中发现的水平更高或更低。

如这里使用的，″α-结构域″是结合分支酸并且去除烯醇丙酮酸侧链的酶或酶复合体的一部分。这样的α-结构域可以由TrpE基因编码。在一些情况下，α-结构域是单链多肽，其功能只是结合分支酸并且从分支酸去除烯醇丙酮酸侧链。在另一些情况下，α-结构域是除了结合分支酸并且从分支酸去除烯醇丙酮酸侧链之外还有其它酶功能的较大多肽的一部分。

术语″β-结构域″指将谷酰胺的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯环上的位置的酶或酶复合体的一部分。这样的β-结构域由TrpG基因编码。在一些情况下，β-结构域是单链多肽，其功能只是将谷酰胺的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯环上的位置。在另一些情况下，β-结构域是除了将谷酰胺的氨基转移到位于羧酸酯和烯醇丙酮酸酯部分之间的分支酸酯环上之外还有其它酶功能的较大多肽的一部分。

如这里使用的，″色氨酸的氨基酸类似物″是结构与色氨酸相关并且能结合野生型邻氨基苯甲酸酯合成酶中色氨酸结合位点的氨基酸。这些类似物包括但不限于，6-甲基邻氨基苯甲酸酯，5-甲基色氨酸，4-甲基色氨酸，5-氟色氨酸，5-羟基色氨酸，7-氮杂色氨酸，3β-吲哚丙烯酸，3-甲基邻氨基苯甲酸，等等。

这里关于本发明的DNA分子，序列或片段而使用的术语″基本上由...构成″定义为指DNA分子的主要部分，序列或片段编码邻氨基苯甲酸酯合成酶。除非另有说明，DNA分子，序列或片段一般不编码除邻氨基苯甲酸酯合成酶之外的额蛋白质。

术语″与...互补″在这里用来指能与参照多核苷酸序列的全部或部分杂交的核酸链序列。为了详细说明，核苷酸序列″TATAC″对参照序列5′-TATAC-3′来说同一性100％，但是与参照序列5′-GTATA-3′100％互补。

如这里使用的，″外源″邻氨基苯甲酸酯合成酶是被导入宿主细胞的，优选与其天然的没有转化的细胞中存在的任何DNA序列不相同的，分离的DNA编码的邻氨基苯甲酸酯合成酶。″内源″或″天然″邻氨基苯甲酸酯合成酶是在宿主细胞或生物体中天然存在的邻氨基苯甲酸酯合成酶。

如这里使用的，植物细胞，植物组织，植物部分或植物中游离L-色氨酸的″提高的″或″增加的″水平为是没有转化的植物细胞，植物组织，植物部分或植物中发现的水平的大约2至200倍，优选大约5至150 倍，更优选大约10至100倍的水平，即，外源邻氨基苯甲酸酯合成酶核酸或者其结构域的存在没有改变基因组的水平。例如，转化的植物种子中游离L-色氨酸的水平可与没有转化的植物种子(起始材料)中的水平相比较。

编码邻氨基苯甲酸酯合成酶的DNA分子，和编码传递肽的DNA分子或标记物/报道基因是″分离的″，因为它们被从它们的天然来源分离出来并且不再在它们天然存在的细胞中。这样的分离的DNA分子在体外已经至少部分制备出来或者利用，例如，从它们天然被发现的细胞中分离，纯化，并扩增。这样的分离的DNA分子也可以是″重组的″，在于它们已经与外源DNA分子结合。例如，重组DNA可以是与外源启动子或者与宿主细胞内源的启动子可操作性连接的分离的DNA。

如这里使用的，关于邻氨基苯甲酸酯合成酶，术语″单体″意思是两个或多个邻氨基苯甲酸酯合成酶结构域以功能方式插入到单一多肽链中。单体邻氨基苯甲酸酯合成酶可以体内组装成二聚体形式。

能从各种各样的生物体分离单体邻氨基苯甲酸酯合成酶核酸和多肽，例如根癌土壤杆菌，鱼腥蓝细菌M22983，巴西固氮螺菌，马尔他布鲁氏菌，Euglena gracilis，Mesorhizobium loti，念珠蓝细菌PCC7120，苜蓿根瘤菌。或者，从选自任何常规单体或多聚体邻氨基苯甲酸酯合成酶基因的结构域的组合能构建单体邻氨基苯甲酸酯合成酶核酸和多肽。这样的微生物包括，例如，根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983，鼠耳芥，巴西固氮螺菌(Azospirillum brasilense)，马尔他布鲁氏菌(Brucella melitensis)，Mesorhizobium loti，念珠蓝细菌(Nostocsp.)PCC7120，苜蓿根瘤菌(Rhizobium meliloti)，血色红假单孢菌(Rhodopseudomonas palustris)，芸香，鼠伤寒沙门氏菌(Salmonella typhimurium)，粘质沙雷氏菌(Serratia marcescens)，硫磺矿硫化叶菌(Sulfolobus solfataricus)，大豆，稻，棉花或玉米，或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。编码选择的结构域的核酸可以重组连接。例如，编码α-结构域的C-末端的核酸通过形成磷酸二酯键而与编码β-结构域的N-末端的核酸连接，反之亦然。或者，这样的单链结构域多肽能被化学连接。例如，α-结构域通过其C-末端通过肽键与β-结构域的N-末端连接，反之亦然。

如这里使用的，″天然″基因意指体外没有改变的基因，即，体外没有突变的″野生型″基因。

术语″质体″指植物细胞细胞器种类，包括淀粉形成体，叶绿体，有色体，成油体，eoplasts，白色体，白色粒，和前质体。这些细胞器是自身复制的，并且包含通常称作″叶绿体基因组″的，一种大小大约120至大约217kb的环状DNA分子，取决于植物物种，并且其通常包含倒置的复制区。

如这里使用的，″多肽″指通过肽键全部连接在一起的氨基酸连续链，除了分别具有氨基和羧基并且不以肽键连接的N-末端和C-末端氨基酸。多肽可以是任何长度，并且可以是翻译后修饰，例如，通过糖基化或磷酸化。

如这里使用的，“对色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受的”植物细胞，植物组织或植物是与相应的野生型邻氨基苯甲酸酯合成酶相比L-色氨酸类似物的存在下保留至少大约10％以上的邻氨基苯甲酸酯合成酶活性的植物细胞，植物组织，或植物。一般情况下，“对色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受的”植物细胞，植物组织或植物根据本领域公知的方法测定在一定量的一般抑制没有转化的植物细胞，植物组织，或者植物的色氨酸的氨基酸类似物中能生长。例如，纯合回交转化的编码邻氨基苯甲酸酯合成酶的DNA分子转化的近交植物，所述植物基本上对色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受，该植物在一定量的抑制相应的，即基本上等基因的再生近交植物生长的色氨酸的氨基酸类似物中能生长。

如这里使用的，“对色氨酸或色氨酸的氨基酸类似物引起的抑制作用有抗性或耐受的”邻氨基苯甲酸酯合成酶是当耐受/抗性和野生型邻氨基苯甲酸酯合成酶暴露于等量色氨酸或色氨酸的氨基酸类似物时保留比相应的“野生型”或天然易感邻氨基苯甲酸酯合成酶高大约10％以上活性的邻氨基苯甲酸酯合成酶。优选地，抗性或耐受邻氨基苯甲酸酯合成酶保留比相应的“野生型”或天然易感邻氨基苯甲酸酯合成酶高大约20％以上活性。

关于邻氨基苯甲酸酯合成酶，这里使用的术语″其结构域″包括全长邻氨基苯甲酸酯合成酶的结构或功能片段。结构域包括邻氨基苯甲酸酯合成酶中可鉴定的结构。结构域的例子包括α螺旋，β折叠，活性位点，底物或抑制剂结合位点等。功能域包括实现可鉴定功能，例如色氨酸结合袋，活性位点或底物或抑制剂结合位点的邻氨基苯甲酸酯合成酶的片段。邻氨基苯甲酸酯合成酶的功能域包括能催化色氨酸生物合成途径中的一个步骤的邻氨基苯甲酸酯合成酶的那些部分。例如，α-结构域是trpE编码的并且能将NH₃转移给分支酸酯并且形成邻氨基苯甲酸酯的结构域。TrpG能编码β-结构域并且能从谷酰胺去除氨基形成氨。因此，功能域包括酶活性片段和邻氨基苯甲酸酯合成酶的结构域。

还涉及邻氨基苯甲酸酯合成酶的突变体结构域。用来制备突变体结构域的野生型邻氨基苯甲酸酯合成酶核酸包括，例如，编码根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983，鼠耳芥，巴西固氮螺菌(Azospirillum brasilense)，马尔他布鲁氏菌(Brucella melitensis)，Mesorhizobium loti，念珠蓝细菌(Nostoc sp.)PCC7120，苜蓿根瘤菌(Rhizobiummeliloti)，血色红假单孢菌(Rhodopseudomonas palustris)，芸香，硫磺矿硫化叶菌(Sulfolobus solfataricus)，鼠伤寒沙门氏菌(Salmonella typhimurium)，粘质沙雷氏菌(Serratia marcescens)，大豆，稻，棉花，小麦，烟草或玉米(Zea mays)的结构域的任何基因，或者编码在其编码区包括至少一个氨基酸取代的邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。被诱变或连接形成具有提高的色氨酸生物合成活性，更大的稳定性，减小的对色氨酸或者其类似物的敏感性等的单体邻氨基苯甲酸酯合成酶的结构域是特别令人感兴趣的。

一般概念

本发明涉及获得产生提高水平的游离L-色氨酸的植物的新的核酸和方法。编码邻氨基苯甲酸酯合成酶或者其结构域的核酸的导入和表达导致超量生产。这样的邻氨基苯甲酸酯合成酶核酸包括野生型或突变体α-结构域，或者单体形式的邻氨基苯甲酸酯合成酶。单体形式的邻氨基苯甲酸酯合成酶在单多肽链例如与β-结构域连接的α- 结构域中包括至少两个邻氨基苯甲酸酯合成酶结构域。

天然植物邻氨基苯甲酸酯合成酶一般对L-色氨酸和它的类似物赋予的反馈抑制作用十分敏感。这样的抑制作用构成调节色氨酸合成途径的关键机理。因此，高度活性，更有效或者通过色氨酸或者其类似物抑制至较小程度的邻氨基苯甲酸酯合成酶或者其结构域可能产生提高水平的色氨酸。根据本发明，根癌土壤杆菌邻氨基苯甲酸酯合成酶特别用于产生高水平色氨酸。

为了在植物或者在选择的宿主细胞中产生高水平色氨酸，分离选择的邻氨基苯甲酸酯合成酶核酸，并且可以体外操作使包括在植物细胞或者其他细胞类型中基因表达所需要的调节信号。因为据报道质体中存在在植物中的色氨酸生物合成途径，外源邻氨基苯甲酸酯合成酶核酸或者被导入质体中或者通过加上编码氨基末端质体传递肽的核酸片段而修饰。这样的质体传递肽能将邻氨基苯甲酸酯合成酶基因产物导入质体。在一些情况下，邻氨基苯甲酸酯合成酶可能已经含有了质体转运序列，在这种情况下没有必要加上一个。

为了改变色氨酸的生物合成，必须将编码邻氨基苯甲酸酯合成酶活性的核酸导入植物细胞或者其他宿主细胞中，并且直接或间接地鉴定这些转化细胞。可以使用整个邻氨基苯甲酸酯合成酶或者其有用部分或结构域。

邻氨基苯甲酸酯合成酶被稳定地插入到植物细胞基因组中。控制邻氨基苯甲酸酯合成酶表达的转录信号必须被植物细胞或者其他宿主细胞识别并且在植物细胞或者其他宿主细胞中有功能。也就是，邻氨基苯甲酸酯合成酶必须转录成信使RNA，该在植物细胞核中必须是稳定的并且被完整转运到细胞质中翻译。邻氨基苯甲酸酯合成酶必须具有被植物细胞核糖体识别并合适地翻译的适当的翻译信号。多肽基因产物必须本质上避免在细胞质中受到蛋白水解作用，并且被转运到正确的细区室(例如质体)并且能呈现赋予酶活性的三维构象。邻氨基苯甲酸酯合成酶必须能进一步在色氨酸及其衍生物的生物合成中发挥功能；也就是，为了获得要求的底物并且传递合适的产物，它必须位于催化生物合成中的侧翼步骤的天然植物酶附近(可能在质体中)。

即使符合所有的这些条件，成功超量生产色氨酸也不是可预期的事件。一些转基因的表达可能受到附近染色体元件的负面影响。如果通过诱变减小反馈抑制作用实现高水平色氨酸，可能有另外的控制机理补偿邻氨基苯甲酸酯合成酶步骤降低的调节作用。可能有提高积累的氨基酸的分解速率的机理。色氨酸和相关的氨基酸也必须以对植物没有毒性的水平超量生产。最后，为了允许商业化生产和使用，导入特性必须是稳定的和可遗传的。

编码邻氨基苯甲酸酯合成酶的DNA的分离和鉴定

能通过标准方法鉴定和分离编码邻氨基苯甲酸酯合成酶的核酸，例如，根据Sambrook等，Molecular Cloning：A Laboratory Manual，第二版(1989)；Sambrook and Russell，Molecular Cloning：ALaboratory Manual，第三版(2001年1月15日)。例如，通过从来自特殊细胞类型，细胞系，原代细胞，或组织的核酸产生的DNA或cDNA文库进行筛选，能鉴定编码邻氨基苯甲酸酯合成酶或其结构域的DNA序列。用于鉴定和分离邻氨基苯甲酸酯合成酶的文库的例子包括但不限于来自下面生物的cDNA文库：根癌土壤杆菌(Agrobacteriumtumefaciens)菌株A348，玉米近交系B73(Stratagene，La Jolla，加利福尼亚，Cat.#937005，Clontech，Palo Alto，加利福尼亚，Cat.#FL1032a，#FL1032b，和FL1032n)，来自玉米近交系Mo17的基因组文库(Stratagene，Cat.#946102)，来自玉米近交系B73的基因组文库(Clontech，Cat.#FL1032d)，来自鱼腥蓝细菌(Anabaena)M22983(例如，Genbank登记号No.GI 152445)的，来自鼠耳芥，巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号No.GI1174156)，马尔他布鲁氏菌(Brucella melitensis)(GI 17982357)，大肠杆菌(Escherichia coli)，Euglena gracilis，Mesorhizobiumloti(例如，Genbank登记号No.GI 13472468)，念珠蓝细菌(Nostocsp.)PCC7120(例如，Genbank登记号Nos.GI 17227910或者GI17230725)，苜蓿根瘤菌(Rhizobium meliloti)(例如，Genbank登记号No.GI 95177)，芸香，沼泽红假单胞菌(Rhodopseudomonaspalustris)，鼠伤寒沙门氏菌(Salmonella typhimurium)，粘质沙雷氏菌(Serratia marcescens)，硫磺矿硫化叶菌(Sulfolobussolfataricus)，大豆，稻，棉花，小麦，烟草，玉米或者其它物种的基因组DNA。此外，通过使用从任何这些物种分离的基因组DNA， mRNA或cDNA的核酸扩增方法能分离邻氨基苯甲酸酯合成酶核酸。

通过从用于杂交于来自其他生物体的邻氨基苯甲酸酯合成酶基因探针的基因组或cDNA筛选噬斑或者通过从用于与特异性识别邻氨基苯甲酸酯合成酶的抗体结合的cDNA表达文库筛选噬斑能实现对编码邻氨基苯甲酸酯合成酶的序列的全部或部分的DNA片段的筛选。与来自携带与抗邻氨基苯甲酸酯合成酶抗体免疫反应的DNA片段的其他生物体和/或噬斑的邻氨基苯甲酸酯合成酶杂交的DNA片段能被亚克隆到载体中，测序和/或被用作鉴定编码期望的邻氨基苯甲酸酯合成酶基因的全部或部分的其他cDNA或基因组序列的探针。能从质粒克隆pDPG600或pDPG602获得用于筛选玉米或植物文库的cDNA探针。

例如通过随即寡聚物引导或者寡聚物dT引导，能制备cDNA文库。使用对邻氨基苯甲酸酯合成酶特异性的探针或抗体能筛选包含DNA片段的噬斑。编码邻氨基苯甲酸酯合成酶基因一部分的DNA片段能被亚克隆，测序和用作鉴定基因组邻氨基苯甲酸酯合成酶基因的探针。通过测定与其他已知的邻氨基苯甲酸酯合成酶的序列同源性或者通过与邻氨基苯甲酸酯合成酶特异性信使RNA的杂交，能证实编码细菌或植物邻氨基苯甲酸酯合成酶的一部分的DNA片段。一旦获得编码邻氨基苯甲酸酯合成酶的5′端，中间和3′端部分的cDNA片段，它们能被用作鉴定和克隆来自基因组文库的邻氨基苯甲酸酯合成酶基因的完全基因组拷贝的探针。

通过标准方法能对邻氨基苯甲酸酯合成酶基因的基因组拷贝部分测序并鉴定基因的5′端，包括通过与其他邻氨基苯甲酸酯合成酶基因同源的DNA序列或者通过RNA酶保护分析，例如，如Sambrook等，Molecular Cloning：A Laboratory Manual，第二版(1989)；Sambrook和Russell，Molecular Cloning：A Laboratory Manual，第三版(2001年1月15日)所描述的。利用已知的AS编码区通过序列数据库的计算机检索也能确定靶基因的3′端和5′端。一旦鉴定基因的5′端部分，通过标准方法能获得邻氨基苯甲酸酯合成酶基因的完全拷贝，包括克隆或者使用与基因的5′端的DNA序列互补的寡核苷酸引物的聚合酶链式反应(PCR)。通过杂交，部分序列分析，或者通过玉米邻氨基苯甲酸酯合成酶的表达，能证实邻氨基苯甲酸酯合成酶基因的分离的全长拷贝的存在。

例举的本发明的分离的DNAs包括具有下面核苷酸序列鉴定号的DNAs：

SEQ ID NO：1--根癌土壤杆菌(Agrobacterium tumefaciens)(野生型)

SEQ ID NO：2--玉米(野生型)

SEQ ID NO：3--芸香

SEQ ID NO：46-大肠杆菌EMG2的截短的TrpE基因(K-12wt F+)

SEQ ID NO：67--玉米(C28突变体)

SEQ ID NO：68--玉米(C28+终止子)

SEQ ID NO：71-叶绿体导向肽(g)

SEQ ID NO：73--叶绿体导向肽(a)

SEQ ID NO：75--根癌土壤杆菌(Agrobacterium tumefaciens)(优化的)

SEQ ID NO：76--血色红假单孢菌(Rhodopseudomonas palustris)

SEQ ID NO：83--血色红假单孢菌(Rhodopseudomonas palustris)(RhoPa_TrpEG)

SEQ ID NO：84--根癌土壤杆菌V48F突变体

SEQ ID NO：85--根癌土壤杆菌V48Y突变体

SEQ ID NO：86--根癌土壤杆菌S51F突变体

SEQ ID NO：87--根癌土壤杆菌S51C突变体

SEQ ID NO：88--根癌土壤杆菌N52F突变体

SEQ ID NO：89--根癌土壤杆菌P293A突变体

SEQ ID NO：90--根癌土壤杆菌P293G突变体

SEQ ID NO：91--根癌土壤杆菌F298W突变体

SEQ ID NO：92--根癌土壤杆菌S50K突变体

SEQ ID NO：93--根癌土壤杆菌F298A突变体

SEQ ID NO：94-稻

SEQ ID NO：95-稻同工酶

SEQ ID NO：96-玉米(Anderson的美国专利6,118,047)

SEQ ID NO：97-小麦

SEQ ID NO：98-烟草

一些引物对于实施本发明是有用的，例如具有SEQ ID NO：9- 42，47-56的引物。

本发明还涉及编码具有下面氨基酸序列的任何一个的邻氨基苯甲酸酯合成酶的所有的分离的核酸。

SEQ ID NO：4--根癌土壤杆菌(Agrobacterium tumefaciens)(野生型)

SEQ ID NO：5--玉米(野生型)

SEQ ID NO：6--芸香

SEQ ID NO：7-苜蓿根瘤菌(Rhizobium meliloti)

SEQ ID NO：8--硫磺矿硫化叶菌(Sulfolobus solfataricus)

SEQ ID NO：43--苜蓿根瘤菌(Rhizobium meliloti)

SEQ ID NO：44-硫磺矿硫化叶菌(Sulfolobus solfataricus)

SEQ ID NO：45-鼠耳芥

SEQ ID NO：57-血色红假单孢菌(Rhodopseudomonas palustris)

SEQ ID NO：58--根癌土壤杆菌V48F突变体

SEQ ID NO：59--根癌土壤杆菌V48Y突变体

SEQ ID NO：60--根癌土壤杆菌S51F突变体

SEQ ID NO：61--根癌土壤杆菌S51C突变体

SEQ ID NO：62--根癌土壤杆菌N52F突变体

SEQ ID NO：63--根癌土壤杆菌P293A突变体

SEQ ID NO：64--根癌土壤杆菌P293G突变体

SEQ ID NO：65--根癌土壤杆菌F298W突变体

SEQ ID NO：66-玉米C28突变体

SEQ ID NO：69--根癌土壤杆菌S50K突变体

SEQ ID NO：70--根癌土壤杆菌F298A突变体

SEQ ID NO：74-叶绿体导向肽(a)

SEQ ID NO：72--叶绿体导向肽(g)

SEQ ID NO：77--Mesorhizobium loti(MesLo_13472468)

SEQ ID NO：78--巴西固氮螺菌(AzoBr_1717765)

SEQ ID NO：79--马尔他布鲁氏菌(BruMe_17986732)

SEQ ID NO：80-念珠蓝细菌(Nostoc_17227910)

SEQ ID NO：81-念珠蓝细菌(Nostoc_17230725)

SEQ ID NO：82-血色红假单孢菌RhoPa_TrpEG

SEQ ID NO：99-稻

SEQ ID NO：100-稻同工酶

SEQ ID NO：101-玉米(Anderson的美国专利6,118,047)

SEQ ID NO：102-小麦

SEQ ID NO：103-烟草

在实施本发明中可以使用这些核酸和多肽的任何一种，以及其任何突变体，变异体或衍生物。

单体邻氨基苯甲酸酯合成酶

根据本发明，来自植物和非植物物种的单体邻氨基苯甲酸酯合成酶在植物中有功能并且能提供高水平色氨酸。令人惊奇地，来自非植物物种的单体邻氨基苯甲酸酯合成酶在植物中功能非常好，虽然这些单体邻氨基苯甲酸酯合成酶的序列与大多数植物邻氨基苯甲酸酯合成酶具有低同源性。例如，能成功地使用来自不同的象细菌，原生生物和微生物的物种的单体邻氨基苯甲酸酯合成酶。特别地，来自细菌物种例如根癌土壤杆菌，苜蓿根瘤菌，Mesorhizobium loti，马尔他布鲁氏菌，念珠蓝细菌PCC7120，巴西固氮螺菌和鱼腥蓝细菌M2298的单体邻氨基苯甲酸酯合成酶在植物中有功能并且能提供高水平色氨酸，尽管这些单体邻氨基苯甲酸酯合成酶的序列与大多数植物邻氨基苯甲酸酯合成酶具有十分低的序列同一性。

含有例如野生型单体根癌土壤杆菌邻氨基苯甲酸酯合成酶的转基因植物在种子中能产生最多大约10,000至大约12,000ppm色氨酸，平均trp水平范围最多大约7,000至大约8,000ppm。非转基因大豆植物种子中一般最多只有大约100至大约200ppm色氨酸。通过比较，含有加入的突变体玉米α结构域的转基因植物产生多少低一些水平的色氨酸(例如，平均最多大约3000至大约4000ppm)。

单体酶与多聚体酶相比有一些优势。例如，虽然本发明不局限于特定机理，但是单体酶可以提供更大稳定性，协调表达等等。当体内合成异四聚体邻氨基苯甲酸酯合成酶的结构域或亚基时，那些结构域/亚基一定在酶变活性之前合适地组装成异四聚体形式。通过转基因方法对植物加一个邻氨基苯甲酸酯合成酶的结构域可能不提供整个异四聚体酶的超量生产，因为可能没有足够内源量的非转基因结构域来基本上提高功能四聚体的水平。因此，能有利地使用编码单体邻氨基苯甲酸酯合成酶的核酸，载体和酶来超量产生所有的邻氨基苯甲酸酯合成酶的酶学功能。

根据本发明，来自天然生产异四聚体邻氨基苯甲酸酯合成酶的物种的邻氨基苯甲酸酯合成酶结构域可以是融合的或者连接以使当在植物细胞，植物组织或种子中表达时提供能产生高色氨酸水平的单体邻氨基苯甲酸酯合成酶。例如，通过融合或连接邻氨基苯甲酸酯合成酶的α和β结构域使得α-β融合体的序列一般与天然单体邻氨基苯甲酸酯合成酶比对，能制备单体邻氨基苯甲酸酯合成酶。单体和异四聚体邻氨基苯甲酸酯合成酶序列比对的例子如图21和35所示。应用这样的序列比对，可以调节或修饰邻氨基苯甲酸酯合成酶结构域的空间和取向来产生从最适当与天然单体邻氨基苯甲酸酯合成酶最优比对的异四聚体结构域构建的单体邻氨基苯甲酸酯合成酶。这样的融合蛋白能被用来提高植物组织中的色氨酸水平。

异四聚体邻氨基苯甲酸酯合成酶，例如硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶(例如，Genbank登记号No.GI1004323)，与来自其他植物和微生物物种的异四聚体邻氨基苯甲酸酯合成酶有大约30％至大约87％的序列同源性。单体邻氨基苯甲酸酯合成酶，例如根癌土壤杆菌邻氨基苯甲酸酯合成酶与其他单体酶例如苜蓿根瘤菌(Genbank登记号No.GI 15966140)和巴西固氮螺菌(Genbank登记号No.1717765)邻氨基苯甲酸酯合成酶分别有大约83％和大约52％同一性。Bae等，苜蓿根瘤菌邻氨基苯甲酸酯合成酶基因：克隆，测序，和在大肠杆菌中表达，J.Bacteriol.171，3471-3478(1989)；De Troch等，编码邻氨基苯甲酸酯合成酶的巴西固氮螺菌trpE(G)基因的分离和表征，Curr.Microbiol.34，27-32(1997)。

然而，天然单体和天然四聚体邻氨基苯甲酸酯合成酶之间总的序列同一性小于30％。因此，目测比对而不是计算机产生的比对，需要优化比对单体和四聚体邻氨基苯甲酸酯合成酶。邻氨基苯甲酸酯合成酶内划界结构和序列能有利于序列比对。例如，基序″LLES″是形成邻氨基苯甲酸酯合成酶的色氨酸结合袋的β-夹层的β-折叠的部分。这样的划界序列能被用来更可靠地比对散开的邻氨基苯甲酸酯合成酶序列，特别用于确定色氨酸结合中涉及的关键残基。

为了实现邻氨基苯甲酸酯合成酶结构域的融合或连接，选择的TrpE或α-结构域的C-末端与TrpG结构域或β-结构域的N-末端连接。在某些情况下，在结构域之间可以使用接头肽来提供合适的空间和/或柔性。通过单体和异四聚体邻氨基苯甲酸酯合成酶的序列比对能鉴定合适的接头序列。

例如通过杂交，PCR扩增或者如Anderson等，美国专利No.6,118,047所述，能克隆选择的β-结构域。利用标准方法也可以使质体转运肽连接邻氨基苯甲酸酯合成酶编码区。例如，鼠耳芥属小亚基(SSU)叶绿体导向肽(CTP，SEQ ID NO：71-74)可以用于该目的。也参见，Stark等(1992)Science 258：287。融合基因然后如这里所述被插入合适的载体中用于植物转化。

邻氨基苯甲酸酯合成酶突变体

本发明涉及的邻氨基苯甲酸酯合成酶突变体可以具有任何类型的突变，包括，例如，氨基酸取代，缺失，插入和/或重排。这样的突变体可以是这里具体鉴定的邻氨基苯甲酸酯合成酶核酸和多肽的衍生物或变体。或者，可以从任何可获得的物种，包括这里没有详述鉴定的那些，获得邻氨基苯甲酸酯合成酶突变体。所述突变体，衍生物和变体可以与SEQ ID NO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约30％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。在优选的实施方案中，多肽衍生物和变体与SEQ IDNO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约50％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。在更优选的实施方案中，多肽衍生物和变体与SEQ ID NO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约60％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。在更优选的实施方案中，多肽衍生物和变体与SEQ ID NO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约70％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。在甚至更加优选的实施方案中，多肽衍生物和变体与SEQ ID NO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约80％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。在甚至更加优选的实施方案中，多肽衍生物和变体与SEQ ID NO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约90％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。在甚至更加优选的实施方案中，多肽衍生物和变体与SEQ IDNO：4-8，43-45，57-66，69-70，77-82，99-103中任一个的氨基酸位置至少有大约95％的同一性，并且具有邻氨基苯甲酸酯合成酶活性。

在一个实施方案中，通过在中等，或者，优选地，在高度严谨条件下，SEQ ID NO：1-3，942，46，47-56，67-68，75-76，83-98中任一个，或者其片段或引物，与选择的核酸源杂交，能鉴定邻氨基苯甲酸酯合成酶突变体，变体和衍生物。中等和严谨杂交条件是本领域公知的，参见，例如Sambrook等，分子克隆：实验手册(Molecular Cloning：A Laboratory Manual)0.47-9.51章节，第二版(1989)；也可参见，Sambrook和Russell，分子克隆：实验手册(Molecular Cloning：ALaboratory Manual)，第三版(2001年1月15日)。例如，严谨条件是那些：(1)洗涤使用低离子强度和高温的条件，例如，0.015MNaCl/0.0015M柠檬酸钠(SSC)；50℃下0.1％十二烷基硫酸钠(SDS)，或者(2)在杂交过程中使用变性剂，例如甲酰胺，例如，42℃下，有750mM NaCl，75mM柠檬酸钠的50％甲酰胺和0.1％牛血清白蛋白/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/50mM磷酸钠缓冲液，pH 6.5。另一个例子是42℃下，使用50％甲酰胺，5xSSC(0.75M NaCl，0.075M柠檬酸钠)，50mM磷酸钠(pH 6.8)，0.1％焦磷酸钠，5x Denhardt′s溶液，超声处理过的鲑精DNA(50微克/毫升)，0.1％十二烷酰基硫酸钠(SDS)，和10％硫酸葡聚糖，42℃下，用0.2x SSC和0.1％SDS洗涤。

本发明进一步提供包括能可检测标记或者与可检测标记结合的至少7个核苷酸碱基的新的分离的和纯化的DNA片段的杂交探针和引物。这样的杂交探针或引物能在中等或高度严谨条件下与编码邻氨基苯甲酸酯合成酶的DNA分子的任意一条链杂交。这样的杂交探针和引物的例子包括SEQ ID NO：9-42，47-56中的任一个。

所述邻氨基苯甲酸酯合成酶可以是任何邻氨基苯甲酸酯合成酶，或者其突变体或结构域，例如α-结构域。邻氨基苯甲酸酯合成酶可以是单体邻氨基苯甲酸酯合成酶。功能突变体是优选的，特别是在植物中产生高水平色氨酸的那些，例如，对色氨酸的氨基酸类似物赋予的抑制作用基本上有抗性的那些突变体。

编码邻氨基苯甲酸酯合成酶突变体的核酸也可以自任何适当物种产生，例如，来自编码下面的任何结构域的核酸：根癌土壤杆菌(Agrobacterium tumefaciens)，鱼腥蓝细菌(Anabaena)M22983(例如Genbank登记号No.GI 152445)，鼠耳芥，巴西固氮螺菌(Azospirillum brasilense)(例如，Genbank登记号No.GI1174156)，马尔他布鲁氏菌(Brucella melitensis)(例如，Genbank登记号No.GI 17982357)，大肠杆菌(Escherichia coli)，Euglenagracilis，Mesorhizobium loti(例如，Genbank登记号No.GI13472468)，念珠蓝细菌(Nostoc sp.)PCC7120(例如，Genbank登记号No.GI 17227910或GI 17230725)，苜蓿根瘤菌(Rhizobiummeliloti)(例如，Genbank登记号No.GI 95177)，芸香，血色红假单孢菌(Rhodopseudomonas palustris)，鼠伤寒沙门氏菌(Salmonellatyphimurium)，粘质沙雷氏菌(Serratia marcescens)，硫磺矿硫化叶菌(Sulfolobus solfataricus)，大豆，稻，棉花小麦，烟草，玉米(Zea mays)或者编码邻氨基苯甲酸酯合成酶的亚基或结构域的任何基因。

期望具有提高的邻氨基苯甲酸酯合成酶活性，对色氨酸或色氨酸类似物反馈抑制敏感较小，和/或能在植物中产生增加量色氨酸的能力的邻氨基苯甲酸酯合成酶突变体。这样的突变体在他们表现出的活性水平或类型上确实有功能改变，有时称作这里提供的邻氨基苯甲酸酯合成酶核酸和多肽的″衍生物″。

然而，本发明还涉及带有″沉默″突变的邻氨基苯甲酸酯合成酶变体以及邻氨基苯甲酸酯合成酶核酸。如这里使用的，沉默突变是改变邻氨基苯甲酸酯合成酶的核苷酸序列但是不改变编码的邻氨基苯甲酸酯合成酶的氨基酸序列的突变。核酸突变体编码邻氨基苯甲酸酯合成酶突变体，变体具有当与相应的野生型邻氨基苯甲酸酯合成酶相比较时基本上不改变它的活性的一个或几个氨基酸改变。本发明涉及带有沉默突变的所有的这样的衍生物，变体和邻氨基苯甲酸酯合成酶核酸。

通过几种方法能获得对L-色氨酸或色氨酸的氨基酸类似物有抗性和/或耐受性的突变邻氨基苯甲酸酯合成酶的编码DNA。所述方法包括但不限于：

1.自发变异和在培养物中直接突变体筛选；

2.对任何细胞类型或组织，种子或植物的组织培养物的直接或间接诱变方法；

3.通过例如化学诱变；点特异性或定点诱变(Sambrook等，上文引述)，转座子介导诱变(Berg等，Biotechnology，1，417(1983))，和缺失诱变(Mitra等，Molec.Gen.Genetic.，215，294(1989))的克隆的邻氨基苯甲酸酯合成酶基因的诱变；

4.关键残基突变的合理设计；和

5.DNA混排以便将感兴趣的突变插入到各种邻氨基苯甲酸酯合成酶核酸中。

例如，可以使用来自可获得的邻氨基苯甲酸酯合成酶蛋白质的蛋白质结构信息来合理设计具有提高的活性或者降低的对色氨酸或色氨酸类似物的敏感性的高度可能性的邻氨基苯甲酸酯合成酶突变体。例如，对于硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶，这样的蛋白质结构信息是可得的(Knochel等，Proc.Natl.Acad.Sci.USA，96，9479-9484(1999))。通过将选择的邻氨基苯甲酸酯合成酶氨基酸序列与来自已知结构的邻氨基苯甲酸酯合成酶例如硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶的邻氨基苯甲酸酯合成酶氨基酸序列比对能完成突变的合理设计。参见图6，21和35。通过结合结构信息知识和序列同源性能设计邻氨基苯甲酸酯合成酶的预测的色氨酸结合和催化区。例如，色氨酸结合袋中的残基可以被鉴定为改变酶对色氨酸的反馈抑制作用的抗性的突变的潜在的候选。利用这样的结构信息，几种根癌土壤杆菌邻氨基苯甲酸酯合成酶突变体在色氨酸结合中涉及的位点或结构域中合理设计。

利用这样的序列和结构分析，在单体根癌土壤杆菌邻氨基苯甲酸酯合成酶中鉴定了与单体根癌土壤杆菌邻氨基苯甲酸酯合成酶大约位置25-60或200-225或290-300或370-375类似的区，这些对于产生对色氨酸反馈抑制作用较小敏感的活性邻氨基苯甲酸酯合成酶的突变是潜在的有用的残基。更具体地说，与单体根癌土壤杆菌邻氨基苯甲酸酯合成酶中P29，E30，S31，I32，S42，V43，V48，S50，S51，N52，N204，P205，M209，F210，G221，N292，P293，F298和A373类似的氨基酸残基是对于产生对色氨酸反馈抑制作用较小敏感的活性邻氨基苯甲酸酯合成酶的突变潜在的有用的残基。本发明涉及这些位点的任何位点的任何氨基酸取代或插入。或者，可以缺失这些位点的任何位点的氨基酸。

可以利用定点诱变在各位点产生氨基酸取代，缺失和插入。根癌土壤杆菌邻氨基苯甲酸酯合成酶编码区中进行的特异突变的例子包括下面的：

在大约48位，Phe置换Val(参见例如，SEQ ID NO：58)；

在大约48位，Tyr置换Val(参见例如，SEQ ID NO：59)；

在大约51位，Phe置换Ser(参见例如，SEQ ID NO：60)；

在大约51位，Cys置换Ser(参见例如，SEQ ID NO：61)；

在大约52位，Phe置换Asn(参见例如，SEQ ID NO：62)；

在大约293位，Ala置换Pro(参见例如，SEQ ID NO：63)；

在大约293位，Gly置换Pro(参见例如，SEQ ID NO：64)；

在大约298位，Trp置换Phe(参见例如，SEQ ID NO：65)；

通过将要诱变的邻氨基苯甲酸酯合成酶的氨基酸序列与根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列比对，在任何邻氨基苯甲酸酯合成酶的类似位点能进行类似突变。可以用于比对的根癌土壤杆菌邻氨基苯甲酸酯合成酶氨基酸序列的一个例子是SEQ ID NO：4。

通过传统诱变和基因筛选也能鉴定有用的突变体。通过将酶暴露给游离L-色氨酸或色氨酸的类似物，或者通过利用限制性酶切图谱或者DNA序列分析测定DNA分子中的改变，能检测基因编码的酶的活性的功能变化。

例如，从5-甲基色氨酸耐受细胞系能分离基本上对5-甲基色氨酸耐受的邻氨基苯甲酸酯合成酶编码基因。参见美国专利No.4,581,847，1986年4月15日公开，该专利文献公开内容在此引作参考。简要地说，连续暴露与低水平5-甲基色氨酸，培养部分分化的植物细胞并传代。在正常毒素5-甲基色氨酸水平存在下，细胞或组织生长在5-甲基色氨酸存在下重复传代培养并且表征。培养的细胞的5-甲基色氨酸耐受特性的稳定性可以通过不存在5-甲基色氨酸下将选择的细胞系培养不同时间后分析组织接触5-甲基色氨酸之后的生长来评价。由于具有改变的邻氨基苯甲酸酯合成酶而耐受的细胞系可以通过鉴定正常毒性，即，生长抑制剂水平的5-甲基色氨酸存在下具有酶活性的细胞系来筛选。

根据1986年4月15日公开的美国专利No.4,581,847描述的，通过标准方法能对从5-MT-或6-MA-抗性细胞系克隆的邻氨基苯甲酸酯合成酶基因对5-MT，6-MA，或者色氨酸的其他氨基酸类似物的耐受性，该专利文献在此引作参考。

对5-甲基色氨酸抑制作用有降低的敏感性的具有邻氨基苯甲酸酯合成酶的细胞系可以被用来分离5-甲基色氨酸-抗性邻氨基苯甲酸酯合成酶。能产生对5-甲基色氨酸有抗性的细胞系的DNA文库，并且通过与编码邻氨基苯甲酸酯合成酶基因的一部分的cDNA探针杂交，能鉴定编码邻氨基苯甲酸酯合成酶基因的全部或部分的DNA片段。通过克隆和连接或者通过使用合适的引物的PCR合成，能获得改变的基因的完全拷贝。通过测定当暴露给正常毒性水平的5-甲基色氨酸时表达的邻氨基苯甲酸酯合成酶是否保留酶活性，能证实转化的植物细胞中编码邻氨基苯甲酸酯合成酶的改变的基因的分离。参见，Anderson等美国专利No.6,118,047。

对于在选择的生物体，例如，选择的植物或者其他宿主细胞类型中表达，还可以优化这里提供的任何DNA分子的编码区。对于选择的植物有优化的密码子使用的DNA分子的例子是具有SEQ ID NO：75的根癌土壤杆菌邻氨基苯甲酸酯合成酶DNA分子。这种优化的根癌土壤杆菌邻氨基苯甲酸酯合成酶DNA(SEQ ID NO：75)与SEQ ID NO：1具有94％同一性。

转基因和载体

一旦获得和扩增编码邻氨基苯甲酸酯合成酶或者其结构域的核酸，它与启动子可操作性连接，和，任选地，与其他元件可操作性连接，形成转基因。

已知是启动子并且调节基表达的大多数基因具有DNA序列区。一般在原核和真核细胞中编码序列的侧翼DNA序列上游中发现启动子区。启动子序列提供下游基因序列的转录的调节并且一般包括大约50 至大约2,000核苷酸碱基对。启动子序列还含有能影响基因表达水平的调控序列，例如增强子序列。一些分离的启动子序列能提供异源基因的基因表达，即，与天然或同源基因不同的基因。还知道启动子序列是强的或弱的或可诱导的。强启动子提供高水平基因表达，而弱启动子提供非常低水平的基因表达。诱导型启动子是响应外部加的物质或者环境或者启发性刺激提供基因表达的开和关的启动子。启动子还能提供组织特异性或发育性调节。对于异源基因是强启动子的分离的启动子序列是有利的，因为它提供足够水平的基因表达，使得容易检测和筛选转化细胞并且在期望时提供高水平基因表达。

本发明转基因中的启动子能提供编码邻氨基苯甲酸酯合成酶的DNA序列表达邻氨基苯甲酸酯合成酶。优选地，表达编码序列，使得在植物组织中，例如在植物的种子中，得到色氨酸水平的提高。在另一个实施方案中，表达编码序列，使得导致提高的植物细胞对反馈抑制作用的耐受性或者对色氨酸的氨基酸类似物的生长抑制作用的耐受性，或者使得导致细胞总的色氨酸含量的增加。启动子还可以是诱导型的，使得外部加的物质引起的基因表达开或关。例如，细菌启动子，例如Piac启动子，可以被诱导至基因表达的不同水平，取决于对转化的细菌细胞所加的异硫丙基半乳糖苷的水平。优选的是使基因结合能在植物中提供组织特异性表达或启动性调节基因表达的启动子。实施本发明中有用的很多启动子对于本领域技术人员是可获得的。

优选的启动子一般包括但不限于在细菌，噬菌体，质体或植物细胞中有功能的启动子。有用的启动子包括CaMV 35S启动子(Odell等，Nature，313，810(1985))，the CaMV 19S(Lawton等，Plant Mol.Biol.，9，31F(1987))，nos(Ebert等，PNAS USA，84，5745(1987))，Adh(Walker等，PNAS USA，84，6624(1987))，蔗糖合酶(Yang等，PNASUSA，87，4144(1990))，α-微管蛋白，napin，肌动蛋白(Wang等，Mol.Cell.Biol.，12，3399(1992))，cab(Sullivan等，Mol.Gen.Genet.，215，431(1989))，PEPCase启动子(Hudspeth等，Plant Mol.Biol.，12，579(1989))，7S-α′-conglycinin启动子(Beachy等，EMBO J，4，3047(1985))或者与R基因复合体相关的那些启动子(Chandler等，The Plant Cell，1，1175(1989))。其他有用的启动子包括噬菌体SP6，T3，和T7启动子。

也能使用质体启动子。大多数质体基因含有用于多亚基质体-编码RNA聚合酶(PEP)和单亚基核-编码RNA聚合酶。Hajdukiewicz等，1997，EMBO J.Vol.16pp.4041-4048中能找到核-编码聚合酶(NEP)启动子的共有序列和用于几种天然质体基因的特异启动子序列表，该文献在此引作参考。

能使用的质体启动子的例子包括玉米质体RRN(ZMRRN)启动子。当存在鼠耳芥质体RNA聚合酶时，ZMRRN启动子能启动基因表达。能在本发明中使用的类似的启动子是甘氨酸最大质体RRN(SOYRRN)和烟草质体RRN(NTRRN)启动子。鼠耳芥质体RNA聚合酶能识别所有的三种启动子。Hajdukiewicz等和美国专利6,218,145描述了RRN启动子的共性。

此外，能使用转录增强子或增强子副本来提高使用特定启动子的表达。这样的启动子的例子包括但不限于，来自CaMV 35S启动子和章鱼氨酸合酶基因的元件(Last等，美国专利No.5,290,924，1994年3月1日)。例如，涉及构建根据本发明使用的载体，使包括ocs增强子元件。该元件第一次被鉴定是来自土壤杆菌章鱼氨酸合酶(ocs)基因的16bp回文增强子(Ellis等，EMBO J.，6，3203(1987))，并且在至少10个其他启动子中存在(Bouchez等，EMBO J.，8，4197(1989)。提出使用增强子元件，例如ocs元件和特别地该元件的多个拷贝，当在单子叶植物转化背景中使用时，能起作用提高从相邻启动子转录的水平。还包括组织特异性启动子，包括但不限于，根-细胞启动子(Conkling等，Plant Physio.，93，1203(1990))，和组织特异性启动子(Fromm等，The Plant Cell，1，977(1989))，是特别有用的，它们是诱导型启动子，例如ABA-和充盈-诱导型启动子等等。

因为转录起始位点和编码序列起始位点之间的DNA序列，即，没有翻译的前导序列，能影响基因表达，人们还希望使用特定的前导序列。可以使用本领域技术人员可获得的任何前导序列。优选的前导序列指导相关的基因表达的最优化水平，例如，通过提高或保持mRNA稳定性和/或通过防止翻译的不适当的起始(Joshi，Nucl.Acid Res.，15，6643(1987))。这样的序列的选择是本领域技术人员考虑的。涉及来自在双子叶植物中，特别是在大豆中高度表达的基因的序列。

在某些情况下，不需要邻氨基苯甲酸酯合成酶或者其结构域的极端高表达。例如，应用本发明的方法，能产生这样高水平的邻氨基苯甲酸酯合成酶，即底物而不是酶的可获得性，可以限制产生的色氨酸的水平。在这样的情况下，本领域技术人员能选择更高调制或调节水平的表达。这样的本领域技术人员容易调制或调节表达水平，例如，通过使用较弱的启动子或者通过使用发育调节或组织特异性启动子。

感兴趣的编码邻氨基苯甲酸酯合成酶的核酸还包括有利于邻氨基苯甲酸酯合成酶多肽转运到质体中例如叶绿体中的质体转运肽(例如SEQ ID NO：72或74)。编码选择的质体转运肽的核酸(例如SEQ ID NO：71或73)一般框内与邻氨基苯甲酸酯合成酶的编码序列连接。然而，质体转运肽可以置于邻氨基苯甲酸酯合成酶的N-末端或C-末端。

构建体还包括感兴趣的核酸(例如编码邻氨基苯甲酸酯合成酶的DNA)以及作为转录终止信号起作用并且允许得到的mRNA聚腺苷酸化的核酸序列。这样的转录终止信号置于感兴趣的编码区的3′端或下游。涉及的优选的转录终止信号包括来自根癌土壤杆菌的胭脂碱合酶基因的转录终止信号(Bevan等，Nucl.Acid Res.，11，369(1983))，来自根癌土壤杆菌的章鱼合酶基因的终止子，和编码来自马铃薯或番茄的蛋白酶抑制剂I或I I的基因的3′端，但是也包括本领域技术人员公知的其他转录终止信号。期望的情况下，还可以进一步包括调节元件，例如Adh内含子1(Callis等，Genes Develop.，1，1183(1987))，蔗糖合酶内含子(Vasil等，Plant Physio.，91，5175(1989))或者TMVω元件(Gallie等，The Plant Cell，1，301(1989))。根据An，Methods in Enzymology，153，292(1987)所述能获得这些3′非翻译调节序列或者在从商业来源例如Clontech，Palo Alto，加利福尼亚获得的质粒中已经存在。3′非翻译调节序列通过标准方法能与邻氨基苯甲酸酯合成酶基因的3′端可操作性连接。用于实施本发明的其他这样的调节元件对于本领域技术人员是公知的。

可选择标记基因或者报道基因在本发明中也是有用的。这样的基因能给表达标记基因的细胞赋予不同的表型，这样使得这样的转化的细胞区别于没有标记的细胞。可选择标记基因赋予一个特性，人们可以通过化学方法，即通过使用选择试剂(例如除草剂，抗生素，或者类似的)来选择。报道基因或者可筛选基因赋予一个特性，通过观察或试验，即，通过′筛选′能加以鉴定(例如，R-位点特性)。当然，合适的标记基因的很多例子是本领域公知的并且可以在实施本发明中使用。

与本发明相关使用的可能的可选择标记物包括但不限于neo基因(Potrykus等，Mol.Gen.Genet.，199，183(1985))，它编码新霉素抗性并且对于使用卡那霉素，G418，等，能被选择；编码bialaphos抗性的bar基因；编码改变的EPSP合酶蛋白(Hinchee等，Biotech.，6，915(1988))从而赋予草甘膦抗性的基因；腈水解酶基因，例如来自臭鼻粘液杆菌(Klebsiella ozaenae)的赋予对溴草腈抗性的bxn(Stalker等，Science，242，419(1988))；赋予对咪唑啉酮，磺酰基脲或者其他ALS-抑制化学品的抗性的突变体乙酰乳酸合酶基因(ALS)(欧洲专利申请154,204，1985)；甲氨喋呤-抗性DHFR基因(Thillet等，J.Biol.Chem.，263，12500(1988))；赋予对除草剂茅草枯抗性的茅草枯脱卤作用酶基因；或者赋予对5-甲基色氨酸的抗性的突变的邻氨基苯甲酸酯合成酶基因。使用突变体EPSP合酶基因时，通过掺入合适的质体转运肽(CTP)可以实现另外的利益。

能在系统中使用选择转化体的可选择标记基因的详细描述的实施方案是编码膦丝菌素乙酰基转移酶的基因，例如来自吸水链霉菌(Streptomyces hygroscopicus)的bar基因或者来自产绿色链霉菌(Streptomyces viridochromogenes)的pat基因(美国专利No.5,550,318，在此引作参考)。膦丝菌素乙酰基转移酶(PAT)将除草剂bialaphos，膦丝菌素(PPT)中的活性成分灭活。PPT抑制谷酰胺合酶(Murakami等，Mol.Gen.Genet.，205，42(1986)；Twell等，PlantPhysio.，91，1270(1989))，引起氨的快速积累和细胞凋亡。

可以使用的可筛选标记物包括但不限于β-葡糖醛酸糖苷酶或uidA基因(GUS)，其编码一种酶，这种酶的各种产色底物是已知的；R-位基因，它编码调节植物组织中花色素苷色素(红色)的生产的产物(Dellaporta等，Chromosome Structure and Function，pp.263282(1988))；β-内酰胺酶基因(Sutcliffe，PNAS USA，75，3737(1978))，它编码一种酶，这种酶的各种产色底物是已知的(例如，PADAC，产色头孢菌素)；xy1E基因(Zukowsky等，PNASUSA，80，1101(1983))，它编码能转换产色儿茶酚的儿茶酚双加氧酶；α-淀粉酶基因(Ikuta等，Biotech.，8，241(1990))；酪氨酸酶基因(Katz等，J.Gen. Microbiol.，129，2703(1983))，它编码一种酶，这种酶能将酪氨酸氧化为DOPA和dopaquinone，它们接着缩合形成容易检测的化合物黑色素；β-半乳糖苷酶基因，它编码一种酶，这种酶有很多产色底物；荧光素酶(lux)基因(Ow等，ScienGe，234，856(1986))，可用于生物发光检测；抑或是水母发光蛋白基因(Prasher等，Biochem.Biophys.Res.Comm.，126，1259(1985))，它可以在钙-敏感生物发光检测中使用，或者绿色荧光蛋白质基因(Niedz等，Plant CellReports，14，403(1995))。应用，例如X-射线照相，闪烁计数，荧光分光光度法，暗光影视照相法，光学计数照相法，或多孔发光计，可以检测转化细胞中lux基因的存在。也想到可以开发该系统用于生物荧光种群筛选，例如对组织培养板，甚至对整个植株筛选。

另外，可以构建转基因并且用来提供使基因产物导向植物细胞中的胞内隔室或者将蛋白质定向于胞外环境。这一般通过将编码传递或信号肽序列的DNA序列与特定基因编码序列连接能实现。得到的传递，或信号肽将蛋白质分别转运到特定胞内，或胞外目的地，然后可以翻译后去除。转运或信号肽作用有利于蛋白质通过胞内膜转运，例如，液泡，囊，质体和线粒体膜，而信号肽指示蛋白质通过胞外膜。通过帮助蛋白质转运到隔室内或细胞外，这些序列可以增加基因产物的积累。

这样一种用途的特定例子涉及指示邻氨基苯甲酸酯合成酶到特定细胞器，例如质体，而不是胞质。这通过使用使蛋白质质体特异性定向的鼠耳芥属SSU1A转运肽来解释。或者，转基因能包括质体转运肽-编码DNA序列或者编码rbcS(RuBISCO)转运肽的DNA序列，该序列在启动子和编码邻氨基苯甲酸酯合成酶的DNA序列之间可操作性连接(有关质体定向肽的综述，参见Heijne等，Eur.J.Biochem.，180，535(1989)；Keegstra等，Ann.Rev.Plant Physio.Plant Mol.Biol.，40，471(1989))。如果转基因被导入植物细胞，转基因还可以包含植物转录终止和聚腺苷酸化信号和与植物邻氨基苯甲酸酯合成酶基因的3′端连接的翻译信号。

可以使用在天然植物邻氨基苯甲酸酯合成酶基因中不编码的外源质体转运肽。质体转运肽一般长度40-70个氨基酸并且翻译后发挥功能指示蛋白质到质体。转运到质体期间或者之后，转运肽裂解，产生成熟蛋白质。编码植物邻氨基苯甲酸酯合成酶的基因的完全拷贝可以包含质体转运肽序列。在那种情况下，不需要将外源获得的质体转运肽序列结合到转基因中。

外源质体转运肽编码序列能从各种各样的植物核基因获得，只要基因产物表达为包括氨基末端转运肽的前蛋白质并且被转运到质体中。已知包括这样的转运肽序列的植物基因产物的例子包括但不限于，核酮糖二磷酸羧化酶的小亚基，叶绿素a/b结合蛋白，核基因编码的质体核糖体蛋白质，一些热激蛋白，氨基酸生物合成酶，例如乙酰乳酸合酶，3-烯醇丙酮酸磷酸莽草酸合酶，二氢吡啶二羧酸合酶，邻氨基苯甲酸酯合成酶等等。在一些情况下，质体转运蛋白质已经在感兴趣的邻氨基苯甲酸酯合成酶基因中编码，在这种情况下不需要加这样的质体转运序列。或者，编码转运肽的DNA片段可以从已知的转运肽的序列例如上面列出的那些的全部或部分化学合成。

不管编码传递肽的DNA片段的来源，它应该包括翻译起始密码子，例如，ATG密码子，并且表达成宿主植物质体中被识别并且适当发挥功能的氨基酸序列。还应该注意传递肽和邻氨基苯甲酸酯合成酶之间连接处的氨基酸序列，在此它被裂解得到成熟酶。一些保守氨基酸序列已经被鉴定并且可以作为指导。传递肽编码序列与邻氨基苯甲酸酯合成酶编码序列的正确融合可能要求导入例如一个适当的限制性酶切位点的一个或两个DNA序列的操作。通过包括定点诱变，化学合成的寡核苷酸接头的插入等方法可以实现这个操作。

编码质体转运蛋白质的核酸的正确融合不一定是必需的，只要质体转运蛋白质的编码序列是邻氨基苯甲酸酯合成酶框内的。例如，经常可以包括另外的肽基或氨基酸而不会不利地影响感兴趣的蛋白质的表达或定位。

一旦获得，应用标准方法，质体转运肽序列能适当地连接启动子和转基因中的邻氨基苯甲酸酯合成酶编码区。包含在植物细胞中有功能的启动子并且具有多个克隆位点下游的质粒可以被构建或者从商业来源获得。利用限制性酶可以从启动子下游插入质体转运肽序列。然后，邻氨基苯甲酸酯合成酶编码区从质体转运肽序列的3′末端下游和框内立即翻译融合或插入。因此，质体转运肽优选与邻氨基苯甲酸酯合成酶的氨基末端连接。一旦形成，转基因可以被亚克隆到其它质粒或载体中。

除了核植物转化之外，本发明还涉及植物质体基因组的定向转化。因此，通过基因向胞内隔室的定向运送也可以实现基因产物导向于植物细胞中胞内隔室。质体基因组的定向转化可以对核转化提供另外的好处。例如，邻氨基苯甲酸酯合成酶的定向质体转化排除了质体定向肽和翻译后转运和处理从相应的核转化体得到的前蛋白质的要求。P.Maliga.Current Opinion in Plant Biology 5，164-172(2002)，P.B.Heifetz.Biochimie vol.82，655-666(2000)，R.Bock.J.Mol.Biol.312，425438(2001)，和H.Daniell等，Trends in Plant Science7，84-91(2002)描述了植物的质体转化，这里引作参考。

构建了包含邻氨基苯甲酸酯合成酶基因的转基因之后，可以将这个盒导入植物细胞中。根据植物细胞的类型，基因表达水平，和该基因编码的酶的活性，编码邻氨基苯甲酸酯合成酶的DNA导入植物细胞中能导致色氨酸的超量生产，赋予对色氨酸的氨基酸类似物，例如5-甲基色氨酸或6-甲基邻氨基苯甲酸酯，的耐受性，和/或另外改变植物细胞的色氨酸含量。

宿主细胞的转化

包括邻氨基苯甲酸酯合成酶基因的转基因可以被亚克隆到已知的表达载体中，AS表达能被检测和/或定量测定。该筛选方法用于鉴定提供邻氨基苯甲酸酯合成酶基因表达的转基因，和转化的植物细胞中质体中邻氨基苯甲酸酯合成酶的表达。

质粒载体包括为容易选择，扩增和转基因在原核和真核细胞中转化而提供的另外的DNA序列，例如，pUC-来源载体，pSK-来源载体，pGEM-来源载体，pSP-来源载体，或pBS-来源载体。附加的DNA序列包括为载体自主复制提供的复制起点，可选择标记基因，优选编码抗生素或除草剂抗性，为将多个位点插入DNA序列提供的独特多克隆位点或者转基因中编码的基因，和增强原核和真核细胞转化的序列。

用于在植物和原核细胞中表达的另一种载体是二元Ti质粒(如1990年7月10日公开的Schilperoort等，美国专利No.4,940,838所述)，举例描述的是载体pGA582。这种二元Ti质粒载体先前由An在上文引述的文献中表征过。这种二元Ti载体在原核细菌例如大肠杆菌和土壤杆菌中能被复制。土壤杆菌质粒载体也可以被用来将转基因转移给植物细胞。这种二元Ti载体优选包括胭脂碱T DNA右和左缘，以提供有效植物细胞转化，可选择标记基因，T边缘区中独特的多个克隆位点，colEl复制起点和宽的宿主范围复制子。携带本发明的转基因的二元Ti载体能被用来转化原核和真核细胞，但是优选用来转化植物细胞。参见，例如，Glassman等，美国专利No.5,258,300。

然后通过现有方法将表达载体导入原核或真核细胞中。对于单子叶植物和双子叶植物特别有效的转化方法包括但不限于，根据W.J.Gordon-Kamm等(Plant Cell，2，603(1990))，M.E.Fromm等(Bio/Technology，8，833(1990))和D.A.Walters等(PlantMolecular Biology，18，189(1992))所述的对未成熟胚胎或者II型胚胎发生胼胝体细胞的微注射轰击(美国专利No.5,990,390)，或者通过D′Halluin等(The Plant Cell，4，1495(1992))，或者Krzyzek(美国专利No.5,384,253，1995年1月24日公开的)描述的对I型胚胎发生胼胝体细胞的电穿孔。也可以通过应用DNA-包被的钨须转化植物细胞(Coffee等，美国专利No.5,302,523，1994年4月12日公开)和通过细胞暴露于包含DNA的脂质体而转化。

选择的邻氨基苯甲酸酯合成酶构建体转化到宿主细胞中之后，宿主细胞可以用于转基因邻氨基苯甲酸酯合成酶与宿主细胞酶促机构结合产生有用的产物。培养转化细胞能导致色氨酸和其它有用化合物的增强的生产，能从细胞或培养基回收这些产物。在各种宿主细胞和/或生物体中表达时可以产生的有用化合物的例子包括色氨酸，吲哚乙酸和其它植物激素，在大豆中发现的对心血管健康重要的类异黄酮化合物，作为对玉米中食草昆虫天敌的信号的挥发性吲哚化合物，抗癌药物例如十字花科植物科中发现的吲哚芥子油苷(吲哚-3-甲醇)，以及某吲哚生物碱例如些种的真菌产生的麦角化合物(Barnes等，Adv ExpMed Biol，401，87(1996)；Frey等，Proc Natl Acad Sci，97，14801(2000)；Muller等，Biol Chem，381，679(2000)；Mantegani等，Farmaco，54，288(1999)；Zeligs，J Med Food，1，67(1998)；Mash等，Ann NY Acad Sci，844，274(1998)；Melanson等，Proc Natl AcadSci，94，13345(1997)；Broadbent等，Curr Med Chem，5，469(1998))。

色氨酸的积累还可以导致微生物和植物中次级代谢产物的增加的产生，例如，含有吲哚的代谢产物，例如简单的吲哚，吲哚偶联物，吲哚生物碱，吲哚植物抗毒素和植物中的吲哚芥子油苷。

对色氨酸不灵敏的邻氨基苯甲酸酯合成酶具有增加各种分支酸衍生的代谢产物的潜力，包括由于通过分支酸变位酶由于苯丙氨酸合成刺激而从苯丙氨酸衍生的那些。参见Siehl，D.，The biosynthesis oftryptophan，tyrosine，and phenylalanine from chorismate in PlantAmino Acids：Biochemistry and Biotechnology，BK Singh编著，pp171-204。当存在反馈不灵敏邻氨基苯甲酸酯合成酶时，其它可能增加的分支酸衍生的代谢产物包括苯基propanoids，类黄酮，和异类黄酮，以及从邻氨基苯甲酸酯衍生的那些，例如吲哚，吲哚生物碱和吲哚芥子油苷。这些化合物中很多是重要的植物激素，植物防御化合物，各种健康状况的化学预防剂，和/或药学活性化合物。

其合成可能由于邻氨基苯甲酸酯合成酶的表达而增加的这些化合物的范围取决于表达邻氨基苯甲酸酯合成酶的生物体。本领域技术人员容易确定为了产生期望的化合物使用和/或试验哪种生物体和宿主细胞。本发明涉及在各种生物体中合成色氨酸和其它有用化合物，包括植物，微生物，真菌，酵母，细菌，昆虫细胞，和哺乳动物细胞。

选择色氨酸超量生产细胞系的策略

应用组织培养技术有效选择期望的色氨酸类似物抗性，色氨酸超量生产变异体要求仔细确定选择条件。优化这些条件使色氨酸类似物抗性，色氨酸超量生产细胞在培养物中生长和积累，同时抑制大量细胞种群的生长。种群中个体细胞的活力高度取决于相邻细胞的活力这一事实使得情况复杂化。

通过表征化合物与组织的相互作用确定细胞培养物暴露给色氨酸类似物的条件。应该考虑象毒性程度和抑制率这样的因素。需要考虑培养物中细胞中化合物的积累，培养基和细胞中化合物的持久性和稳定性，还有期望的细胞隔室的吸收和传输。另外，确定加入色氨酸是否容易逆反化合物的作用这一点是重要的。

谨慎评价类似物对培养物活性和形态学的影响。尤其重要的是选择对培养物的植物再生能力没有影响的类似物暴露条件。类似物是否杀死细胞或者只是抑制细胞分裂也影响类似物暴露条件的选择。

选择方案的选择取决于上述考虑。在选择程序中能使用下面简要描述的方案。例如，为了选择对色氨酸类似物引起的生长抑制的抗性的细胞，可以使液体悬浮培养物中最后分裂的细胞接触高色氨酸类似物水平短暂时间。然后回收并积累存活细胞，之后再接触更长时间。或者，培养组织部分分化的细胞培养物，并且继续暴露于低水平的色氨酸类似物再培养。几次次代培养间隔中逐渐提高浓度。虽然在选择步骤中能使用这些方案，但是本发明不局限于这些操作。

用于植物修饰的基因

如上所述，作为可选择标记基因和报道基因发挥功能的基因在本发明的转基因，载体和植物中能操作结合编码邻氨基苯甲酸酯合成酶或其结构域的DNA序列。另外，对本发明的转基因，载体和植物可以加其它农学性状。这样的性状包括但不限于，昆虫抗性或耐受性；疾病抗性或耐受性(病毒，细菌，真菌，线虫)；应激抗性或耐受性，举例来说对干旱，热，寒冷，冰冻，过分潮湿，盐胁迫，氧化胁迫的抗性或耐受性；提高的产率；食物含量和组成；物质外观；雄性不育；干燥；忍受能力；生产力；淀粉性能；油量和油质；等等。人们可以将赋予这样的性状的一个或几个基因插入本发明的植物。

昆虫抗性或耐受性

苏云金芽孢杆菌(Bacillus thuringiensis)(或″Bt″)细菌几乎包括20种细菌亚种，各种各样的昆虫物种消化时，它们产生毒性内毒素多肽。内毒素蛋白质(Bt蛋白质)和相应的基因(Bt基因)的生物学和分子生物学的有关综述参见H.R.Whitely等，Ann.Rev.Microbiol.，40，549(1986)和H.Hofte等，Microbiol.Rev.，53，242(1989)。编码各种Bt蛋白质的基因已经被克隆和测序。Bt多肽的一个片段对于对各种鳞翅目害虫的毒性是必要的，并且包含在Bt多肽分子的大约头50％中。结果，截短的Bt基因编码的截短的Bt多肽在很多情况下保留它对很多鳞翅目昆虫害虫的毒性。例如，已经证明HD73和HD1 Bt多肽对美国植物重要的鳞翅目昆虫害虫例如欧洲玉米钻孔虫，切根虫和螟蛉的幼虫有毒性。M.Geiser等，Gene，48，109 (1986)和M.J.Adang等，Gene，36，289(1985)分别克隆和测序了编码HD1和HD73Bt多肽的基因，并且利用标准方法，能从得自培养物收集中心(例如Bacillus Genetic Stock Center，Columbus，Ohioor USDA Bt stock collection Peoria，111.)的HD1和HD73株克隆。例如美国专利号6,329,574，6,303,364，6,320,100和6,331,655中描述了Bt基因和多肽的例子。

利用先前用来克隆Bt基因的方法从宿主芽孢杆菌微生物可以克隆编码新的先前没有表征的Bt毒素的DNA，还可以产生Bt毒素新的合成形式。

本发明中有用的Bt基因可以包含包括使得植物中下游定位的Bt序列的转录和翻译起始的DNA序列的5′DNA序列。Bt基因还可以包含包括从能在感兴趣的植物中表达的基因的3′非编码区衍生的序列的3′DNA序列。Bt基因还包括编码苏云金芽胞杆菌产生的毒性Bt多肽或者其毒性部分或者与其具有相当的氨基酸序列同源性的DNA序列。Bt编码序列可以包括：(i)对抗感兴趣的植物的昆虫害虫有活性的与Bt内毒素基本上同源的杀虫蛋白质，例如，HD73或HD1 Bt序列，的编码DNA序列；(ii)Bt内毒素多肽的杀虫活性片段，例如从羧基和/或氨基末端截短的杀虫活性HD73或HD1多肽，的编码序列；和/或(iii)与编码提供例如下面的一些附加好处的多肽的序列框内融合的截短的Bt序列：(a)可选择的基因，例如，赋予对抗生素或除草剂抗性的基因，(b)其产物容易检测或分析的报道基因，例如，荧光素酶或β-葡糖醛酸糖苷酶；(c)编码在稳定Bt蛋白质抗分解或者增强Bt蛋白质抗昆虫效力中有一些附加用途的多肽序列的DNA序列，例如，蛋白酶抑制剂和(d)帮助Bt蛋白质定向于植物细胞内或外的特定隔室的序列，例如，信号序列。

为了获得Bt蛋白质在植物中的最佳合成，将Bt基因的DNA序列调节至更相似的在感兴趣的植物中有效表达的基因也是适当的。因为Bt基因的密码子利用可以与在感兴趣的植物中表达的基因所利用的不相似，可以通过用在植物中更有效表达的那些，例如在感兴趣的植物中经常使用的那些密码子(参见E.Murray等，Nucl.Acids Res.，17，477(1989))来置换这些密码子可以提高Bt基因在植物细胞中的表达。这样的密码子置换要求取代碱基而不改变得到的Bt多肽的氨基酸序列。Bt多肽序列可以与细菌基因或者其片段相同。含有比原细菌基因更高比例优选密码子的完全Bt编码序列，或者其片段，可以利用标准化学合成方法来合成，或者利用标准方法导入或组装成Bt基因，例如定点诱变或DNA聚合和连接等等。

蛋白酶抑制剂还可以提供昆虫抗性。例如，使用来自番茄或马铃薯的蛋白酶抑制剂II基因，pinII，可能是有用的。利用pinII基因和Bt毒素基因的结合也是有利的。编码昆虫消化系统抑制剂的其它基因，或者编码有利于产生抑制剂的酶或辅助因子的那些，也是有用的。该组包括oryzacystatin和淀粉酶抑制剂例如来自小麦和大麦的那些。

编码凝集素的基因可以赋予另外的或其它的杀虫性能(Murdock等，Phytochemistry，2985(1990)；Czapla & Lang，J.Econ.Entomol.，83，2480(1990))。有用的凝集素基因包括，例如，大麦和小麦胚芽凝集素(WGA)和稻凝集素。(Gatehouse等，J Sci Food Agric，35，373(1984))。

当导入昆虫害虫中时控制有抗昆虫活性的大的或小的多肽的产生的基因，所述多肽例如溶菌肽，肽激素和毒素和毒物，也可能是有用的。例如，幼年激素酯酶的表达，定向特异昆虫害虫，也可以产生杀虫活性，或者可能引起蜕变停止(Hammock等，Nature，344，458(1990))。

表达编码影响昆虫角质层的完整性的酶的基因的转基因植物也是有用的。这样的基因包括编码例如壳多糖酶，蛋白酶，脂酶的那些基因和产生nikkomycin的基因。影响昆虫蜕皮活性编码基因，例如影响蜕皮激素UDP-葡糖基转移酶的产生的那些，也是有用的。

有利于降低植物对昆虫害虫的营养品质的化合物的产生的酶的编码基因也是有用的。例如，通过改变它的甾醇组成有可能赋予植物杀虫活性。本发明的其它实施方案涉及具有提高的脂肪氧合酶活性的转基因植物。

本发明还提供用于改变植物次级代谢物的方法和组合物。一个实施例涉及改变植物产生DIMBOA，想到，会赋予对欧洲玉米钻孔虫，切根虫和几种其它昆虫害虫的抗性。参见，例如，美国专利6,331,880。DIMBOA从吲哚相关的化合物衍生。本发明提供提高植物细胞和组织中吲哚相关化合物象色氨酸含量的方法。因此，根据本发明，这里提供的方法还可以提高DIMBOA水平，从而提高植物对昆虫的抗性。

在有利于对螟蛉和切根虫的抗性中分别涉及使用能调节玉米面球蛋白的基因和高梁中蜀黍苷产生中涉及的基因的导入。

也可以使用表征具有潜在杀虫活性的蛋白质的其他编码基因。这样的基因包括，例如，可以用作切根虫制止物的豇豆胰蛋白酶抑制剂(CpTI；Hilder等，Nature，330，160(1987))；证明用作玉米切根虫制止剂的除虫菌素编码基因(除虫菌素和阿巴美丁，Campbell，W.C.，编著，1989；Ikeda等，J Bacteriol，169，56151987)；核糖体灭活蛋白质基因；和调节植物结构的基因。还涉及包括抗昆虫抗体基因和编码酶的基因的转基因植物，所述酶能将植物外施用的没有毒性的杀虫剂(杀虫剂原)转化为植物内杀虫剂。

环境或胁迫抗性或耐受性

基因表达能影响植物耐受各种环境胁迫的能力的改进。例如，通过导入“防冻”蛋白质，例如Winter Flounder(Cutler等，J PlantPhysio，135，3511989)蛋白质或其合成基因衍生物，可以赋予对冷冻温度提高的抗性。通过增强质体中甘油-3-磷酸乙酰基转移酶的表达也可以赋予改进的寒冷耐受性(Wolter等，The EMBO J.，11，4685(1992))。通过过氧化物歧化酶的表达能赋予对氧化胁迫的抗性(Gupta等，Proc.Natl.Acad.Sci USA，90，1629(1993))，并且能通过谷胱甘肽还原酶能加以改进(Bowler等，Ann Rev.Plant Physio，43，83(1992))。

考虑有利地影响植物水含量，总的水势，渗透势和充盈的基因的表达能增强植物耐受干旱的能力，因此是有用的。提出，例如，渗透活性溶质的生物合成的编码基因的表达可以赋予抗干旱的保护作用。这一类是编码甘露糖醇脱氢酶(Lee和Saier，J.Bacteriol.，258，10761(1982))和海藻糖-6-磷酸合酶(Kaasen等，J.Bacteriology，174，889(1992))的基因。

类似地，其他代谢物可以保护酶功能或膜完整性(Loomis等，J.Expt.Zoology，252，9(1989))，因此这些化合物生物合成的编码基因的表达以类似于甘露糖醇的方式可以赋予干旱抗性。在干旱和/ 或干燥期间有渗透活性和/或提供一些直接的保护作用的天然存在的代谢产物的其他例子包括果糖，赤癣醇，山梨糖醇，半乳糖醇，葡萄糖基甘油，蔗糖，水苏糖，面子糖，脯氨酸，甘氨酸，甜菜碱，ononitol和蒎里醇。参见，例如，美国专利6,281,411。

以结构相似性为基础已经分出三类晚胚胎发生蛋白质(参见Dure等，Plant Molecular Biology，12，475(1989))。所有三组LEA结构基因的表达可以赋予干旱耐受性。水胁迫中诱导的其他类型的可以是有用的蛋白质包括硫醇蛋白酶，醛缩酶和跨膜转运蛋白，它可以在干燥胁迫中赋予各种保护和/或修复型功能。参见，例如，PCT/CA99/00219(Na⁺/H⁺交换剂多肽基因)。影响脂质生物合成的基因在赋予干旱抗性中也可能是有用的。

与使从干燥土壤提取增加量的水的特定形态性状相关的基因表达也可能是有用的。胁迫期间提高复制适应性的基因表达也可以是有用的。还提出胁迫期间将内核中止最小化的基因表达会增加要收获的谷粒的量，因此是有价值的。

使植物更有效地使用水，通过基因的导入和表达，可以改善总的性能，甚至当土壤水可利用性是有限的时候。通过导入提高植物将克服与水可利用性相关的全范围胁迫的水利用最大化的能力的基因，可以实现产率性能的稳定和持久。

病害抗性和耐受性

通过基因的表达可以产生对病毒的抗性。例如，定向重要病毒功能的反义基因的表达或编码病毒外被蛋白基因的表达可以赋予对病毒的抗性。

通过导入基因可以赋予对细菌和真菌引起的病害的抗性。例如，所谓″肽抗生素″，发病机理相关(PR)蛋白质，毒素抗性，和影响宿主病原体相互作用例如形态特征的蛋白质的编码基因可能是有用的。

霉菌毒素减少/排除

与植物相关的真菌产生霉菌毒素，包括黄曲霉毒素和fumonisin是使谷粒无用的一个重要的因素。这些真菌生长抑制作用可以减少这些毒性物质的合成，因此减少由于霉菌毒素污染的谷粒损失。可以将基因导入植物，这样抑制霉菌毒素的合成而不干扰真菌生长。此外，为了实现谷粒的减少的霉菌毒素污染，编码能使得霉菌毒素无毒的酶的新基因的表达是有用的。

植物组成或品质

通过各种途径，包括提高天然蛋白质的表达，降低有不好的组成的那些蛋白质的表达，改变天然蛋白质的组成，或者导入编码具有优势组成的整个新的蛋白质的基因，可以改变植物组成，例如，以改善氨基酸平衡。参见，例如，美国专利No.6,160,208(种子储存蛋白质表达的改变)。改变植物油含量的基因导入是有价值的。参见，例如美国专利Nos.6,069,289和6,268,550(ACC酶基因)。例如通过提高分支程度可以导入提高植物的淀粉成分的营养价值的基因，通过延迟其新陈代谢而提高母牛中淀粉利用。

植物农学特征

决定植物在哪里能生长的因素中的两个是生长季节平均日温和霜冻之间的时间长短。植物发育调节中涉及的基因的表达是有用的，例如，玉米中已经鉴定的无叶片和粗造叶鞘基因。

可以向玉米导入改善植物群丛能力和其他植物生长特征的基因。可以赋予更强的茎，改善的根系，或者防止或减少穗掉落的基因的表达对于农民是有价值的。

营养物利用

利用有效营养物的能力可能是植物生长中的限制因素。通过导入基因，可以改变营养物摄入，耐受pH极限，在植物中的调动，贮存积累，和对代谢活性的有效性。这些修饰使得植物更有效利用可利用的营养物。例如，植物中一般存在的和在营养物利用中涉及的酶的活性的提高可以提高营养物的有效性。这样的酶的例子是肌醇六磷酸酶。

雄性不育

雄性不育在杂交种子的生产中是有用的，雄性不育可以通过基因表达产生。通过转化通过导入TURF-13，可以使雄性不育与病害敏感性分开。参见Levings，Science，250：942-947，1990。因为为了饲料目的和为了谷粒生产需要恢复雄性不育，也可以导入编码雄性不育恢复的基因。

抗性细胞系的选择和表征

进行选择，直到回收细胞或组织，发现这些细胞或组织在正常抑制水平色氨酸类似物的存在下生长良好。这些细胞″系″在色氨酸类似物的存在下传代几代，去除没有抗性的细胞后表征。通过将这些细胞系的生长与在各种浓度的各种色氨酸类似物存在下没有选择的细胞或组织的生长相比较，确定获得的抗性的量。通过简单地使选择的细胞系在没有色氨酸的存在下生长不同时间之后分析再次使组织暴露给类似物的生长，可以评价培养的细胞的抗性性状稳定性。利用体外化学研究证实将类似物作用位点改变成对色氨酸类似物的抑制作用敏感性较小的形式，也可以评价抗性细胞系。

可以检测和定量分析转化的细胞中邻氨基苯甲酸酯合成酶基因的瞬时表达。通过RT PCR分析，使用对克隆的邻氨基苯甲酸酯合成酶特异性的抗体的定量蛋白质印迹，或者通过检测色氨酸或色氨酸的氨基酸类似物存在下酶活性，能定量分析基因表达。通过使用对克隆的邻氨基苯甲酸酯合成酶或亚细胞级分特异性的抗体的免疫化学染色方法，接着进行生物化学和/或免疫化学分析，能测定克隆的邻氨基苯甲酸酯合成酶的组织和亚细胞定位。也能评价克隆的邻氨基苯甲酸酯合成酶对试剂的敏感性。然后可以使用提供邻氨基苯甲酸酯合成酶或者对色氨酸的氨基酸类似物或游离L-色氨酸的抑制作用有耐受性的邻氨基苯甲酸酯合成酶表达的基因来转化单子叶植物和/或双子叶植物组织细胞并且再生转化植株和种子。通过检测可选择标记基因或报道基因的存在，例如通过检测可选择除草剂抗性基因，能选择转化细胞。利用对克隆的邻氨基苯甲酸酯合成酶特异性的抗体或者通过RT-PCR分析能检测转基因胚胎发生胼胝体中邻氨基苯甲酸酯合成酶的瞬时表达。

植物再生和种子产生

然后可以使用转化的胚胎发生胼胝体，分生组织，胚芽，叶片等来产生表现出邻氨基苯甲酸酯合成酶基因稳定遗传的转基因植物。通过本领域公知的方法(例如，参见美国专利Nos.5,990,390，5,489,520；和Laursen等，Plant Mol.Biol.，24，51(1994))，使表现出令人满意水平的对色氨酸的氨基酸类似物的耐受性的植物细胞系进行植物再生程序，获得表达耐受性性状的成熟植株和种子。植物再生程序使得躯干胚芽发育并且接着长出根和芽。为了确定耐受性性状在植物分化器官中表达，而不是只在未分化细胞培养物中表达，对再生植物评测植物各部分中相对于再生的没有转化的植株存在的色氨酸水平。应用标准方法，从色氨酸含量和对色氨酸类似物的抗性有变化的转化细胞和组织能产生转基因植物和种子。尤其优选的是叶子或种子的色氨酸含量增加。通过根据Widholm，Biochimica et Biophysica Acta，279，48(1972)所述，通过测定转化细胞中的酶活性，能检测抑制量的色氨酸或者其类似物存在下酶的比活性变化。通过如Jones等，Analyst，106，968(1981)所述标准方法也能测定总的色氨酸含量的变化。

然后从已知表达该性状的细胞系获得成熟植株。如果可能，再生的植株能自花授粉。另外，从再生植株获得的花粉与农业重要的近交系种子长成的植株杂交。在某些情况下，这些近交系植株的花粉被用来对再生植株授粉。通过评价第一代和后代中该性状的独立性来遗传学表征该性状。如果这些性状在商业上特别有用，则在组织培养物中选择的性状在植物中的遗传学和表达是特别重要的。

如果很多不同的杂交组合可以商售的话，则色氨酸超量生产大豆，谷类和其它植物的商业甲酯是最大的。根据例如成熟期，忍受能力或者其它农业性状这样的差异为基础，农民一般播种一种以上的杂种。另外，因为象成熟期，病害和昆虫抗性这样的性状的差异，适合那个地区的杂种并不适合其它地区。因为这样，需要对大量亲本近交系导入色氨酸超量生产作用，使得能产生很多杂交组合。

通过使原始超量生产品系与正常精华品系杂交并且使后代与正常亲本回交，进行逆反过程(回交)。这种杂交产生的后代被隔离，使得一些植株带有负责超量生产的基因，而另一些则不带有这样的基因。带有这样的基因的植株再次与正常亲本杂交，产生超量生产和正常生产再一次隔离的后代。反复如此，直到原始正常亲本转化成超量生产品系，还具有和在正常亲本中最初发现的所有的其它重要属性。对于要转化成色氨酸超量生产品系的每一个精华品系实施分开的额回交程序。

回交之后，对产生好的商业杂种的新的超量生产品系和品系的适当组合评价超量生产以及重要的农学性状组合。产生超量生产品系和杂种，它们确实代表原始正常品系和杂种。这要求评价在各种环境下这些品系或杂种一般是否商业化生长。对于高色氨酸大豆生产，需要杂种的两个亲本对于高色氨酸特征是纯合的。性状令人满意的杂种的亲本系增加并且用于应用标准杂种生产实施的杂种生产。

预期这里产生的转基因植物对于各种商业和研究目的是有用的。能创建转基因植物用于传统农业，是具有有利于从植株收获的谷粒的消费者的性状(例如，人类食物或动物饲料中提高的营养含量)。在这样的应用中，一般为了人类或动物食物中的谷物应用而种植植物。但是，植物的其他部分，包括茎，皮，营养部分等等，也具有用途，包括用作动物青贮饲料，发酵饲料，生物催化，或者用于观赏目的的部分。

在蛋白质或其他分子的商业制备中也发现转基因植物的用途，在这种情况下，从植物部分，种子等提取或纯化感兴趣的分子。植物细胞或组织也可以被培养，体外生长，或者发酵，制备这样的分子。

也可以在商业饲养项目中使用转基因植物，或者可以与相关农作物植株杂交或育种。例如通过原生质体融合，重组DNA编码的改善可以例如从大豆细胞转移给其他物种细胞。

在一个实施方案中，利用微粒轰击，从对5-MT耐受的玉米细胞系分离的并且与35S CaMV启动子连接的玉米邻氨基苯甲酸酯合成酶α-结构域组成的转基因被导入5-MT敏感单子叶或双子叶组织。选择转化的胚芽或分生组织，并且用于产生转基因植株。对转化的胼祗体和转基因植株评价对5-MT或6-MA的耐受性和耐受性状的稳定遗传性。

下面的实施例进一步详细描述本发明并且本发明不受它的限制。

实施例1：从根癌土壤杆菌分离邻氨基苯甲酸酯合成酶和在大肠杆菌中表达。

该实施例描述了从根癌土壤杆菌分离邻氨基苯甲酸酯合成酶和它在大肠杆菌中的表达。

根癌土壤杆菌As的克隆

利用来自苜蓿根瘤菌(Rhizobium meliloti)(GenBank登记号：P15395)的邻氨基苯甲酸酯合成酶编码区的核苷酸和氨基酸序列来检索根癌土壤杆菌C58基因组序列数据库(Goodner等，Science294，2323-2328(2001))。检索由使用blosum62矩阵的tblastn构成(Altschul等，Nucleic Acid Res.，25，33893402(1997))。

使用来自根癌土壤杆菌C58(ATCC No.33970)的基因组DNA作为模板通过PCR克隆在根癌土壤杆菌C58基因组序列数据库中鉴定的AS同源物克隆。使用下面的引物进行第一轮PCR反应：

5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO：47)和

5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO：48)。

基因扩增参数如下：(a)95℃变性30秒，(b)50℃退火30秒和(c)72℃延伸2分钟，利用Expand高保真PCR(Roche Biochemicals)，根据生产商指导。

使用上一步得到的扩增模板和下面嵌套引物进行另一轮PCR扩增，得到长度大约2.3Kb的产物：

5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO：49)

5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO：50)。

纯化的PCR产物连接至pGEM-T easy(Promega Biotech)，得到质粒pMON61600(图1)。利用标准测序方法对pMON61600测序。通过与苜蓿根瘤菌邻氨基苯甲酸酯合成酶序列比较证实得到正确序列(图2)。从分离的克隆翻译的氨基酸序列(SEQ ID NO：4)与苜蓿根瘤菌酶有88％同一性(SEQ ID NO：7)(图2)。

缩写″AgroAS″或A.tumefaciens AS在这里同时用来指根癌土壤杆菌邻氨基苯甲酸酯合成酶。

根癌土壤杆菌AS的大肠杆菌表达

构建有利于将癌土壤杆菌AS基因亚克隆到合适的表达载体中的下面的载体。

使用作为模板的pMON61600和下面的引物制备2215碱基对PCR片段：

5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′(SEQ ID NO：51)

5′-AAAAGAA TTCTTATCACGCGGCCTTGGTCTTCGCC-3′(SEQ ID NO：52)。

用限制酶NcoI和RsrII消化质粒pMON61600。另外，一个409bp片段(通过用NcoI和RsrII消化2215碱基对PCR产物而衍生)之后被连接到消化的pMON61600质粒中，从而置换NcoI/RsrII片段，产生框内NcoI位点和根癌土壤杆菌AS翻译起始密码子(ATG)，得到质粒pMON34692(图3)。

通过使用SphI和BamHI限制消化pET30a(Novogen，Inc)产生碱基T7大肠杆菌表达质粒，pMON34697(图4)。纯化得到的4,969bp片段并且与来自pET11d(Novogen，Inc)的338bp SphI和BamHI片段亚克隆。

通过用NcoI和SacI限制消化pMON34697制备质粒pMON34705(图5)。然后纯化得到的5,263bp片段并且用来自包含根癌土壤杆菌AS的pMON34692的2,256bp NcoI和Sad片段消化。

根据生产商说明(Novogen，Inc)，质粒pMON34705转化到大肠杆菌BL21(DE3)(F-ompTHsdSb(r_B ^-m_B ^-)gal dcm(DE3))中。DE3是包含异丙基-1-硫-D-吡喃半乳糖苷(IPTG)可诱导lacUV5控制下的T7RNA聚合酶的染色体拷贝的λDE3的宿主溶素原。

对在37℃下温育过夜(10小时)的卡那霉素板选择转化的细胞。将单一菌落转移给2毫升LB(Luria培养液；每升，10克胰蛋白胨，5克酵母提取物，10克NaCl，和1克葡萄糖(任选的))或2X-YT肉汤(每升，16克胰蛋白胨，10克酵母提取物，5克NaCl)，然后放在37℃保温箱中以225rpm摇动3小时。取出细胞并且向培养物加入4微升100mM IPTG，再回到37℃保温箱中另外培养2-3小时。取出1mL等份细胞并且在超声处理缓冲液(50mM磷酸钾(pH 7.3)，10％甘油，10mM 2-巯基乙醇和10mM MgCl₂)中超声处理。得到的溶解的细胞提取物是下面描述的标准AS测试的原材料。结果证明以质粒pMON34705为基础的表达系统能产生可溶的酶活性根癌土壤杆菌AS蛋白质，其占总的可溶提取蛋白质的大约50％。

实施例2：通过用野生型根癌土壤杆菌邻氨基苯甲酸酯合成酶转化植物来实现高Trp种子水平

表达载体pMON58120

载体pMON58120(图34)编码264碱基对鼠耳芥属小亚基(SSU)叶绿体定向肽(CTP，SEQ ID NO：71)和2187碱基对野生型根癌土壤杆菌邻氨基苯甲酸酯合成酶(AgroAS)开放读框之间的融合体(SEQ ID NO：1)。参见，Stark等，(1992)Science 258：287。该开放读框的表达由大豆7Sα引物(7Sα′)启动子启动。

在胞质核糖体上翻译之后，融合体(未成熟蛋白质)被导入其中去除了叶绿体定向序列的叶绿体中。CTP1中有两个切割位点。第一个位点是CDS起点(C/M)30碱基对下游，另一个是在初始的甲硫氨酸(C/M)。第二个切割位点看起来没有被有效处理。预计切割得到酶活性数据和trp有效数据证明的具有AS活性的大约70Kd的成熟蛋白质。

用赋予草甘膦抗性的合成CP4基因转化的AS基因，但是和AS基因分开处理CP4基因。FMV启动子启动CP4基因的表达，FMV启动子是来自Figwort Mosaic病毒的35S启动子。草甘膦使选择转化植物。

AS蛋白质的Western分析

对35个pMON58120转化事件分析AgroAS蛋白质序列。用兔产生的抗纯His-标记AgroAS的多克隆抗体检测AgroAS蛋白质。His-标记的全长Agro-AS多肽被CoCalico Biological，INC.用作兔产生多克隆抗体种群的抗原。重组His-标记Agro-AS DNA被插入pMON 34701(pet30a-agroAS)表达载体中。在大肠杆菌BL21(DE3)中表达His-AgroAS融合蛋白，并且通过Ni-NTA树脂系统(Qiagen protocol)纯化。对于蛋白质分析，以1∶5,000稀释度使用兔抗-AgroAS一抗。以1∶5,000稀释度使用山羊抗-兔碱磷酸酶-偶联二抗。在携带7Sα′Agro AS基因的转基因系中，蛋白质分析始终如一揭示与抗-AgroAS抗体特异性交叉反应的单一泳带的存在。在非转基因对照系中没有检测到该泳带。

大豆和鼠耳芥属种子的游离氨基酸分析

氨基酸提取：大约50mg粉碎的大豆种子(5mg的鼠耳芥属)材料放在各离心管中。向各样品(对于鼠耳芥属是100微升)中加入1毫升5％三氯乙酸。让样品涡旋，静置，在室温下搅拌15分钟。然后它们以14000rpm位离心15分钟。然后取出一些上清液，放置在HPLC 小瓶中并密封。样品在分析对列中保持在4℃。

氨基酸分析：用于氨基酸分析的试剂包括硼酸缓冲液中的OPA试剂(邻-苯二醛和3-巯基丙酸(Hewlett-Packard，PN 5061-3335))，其中硼酸缓冲液是0.4N水溶液，pH 10.2)。根据Agilent TechnicalPublication，″使用Zorbax Eclipse-AAA柱和Agilent 1100 HPLC的氨基酸分析″，2000年3月17日描述的，使用Agilent 1100系列HPLC系统进行分析。首先，0.5微升的样品与2.5微升的OPA试剂在1O微升硼酸缓冲液中反应。其次，将衍生物注入Eclipse XDB-C18 5微米，4.6x150mm柱，使用1.2毫升/分钟的流速。利用荧光测定氨基酸浓度：340nm激发，450nm发射。根据表A使用梯度HPLC缓冲液A和B洗脱，其中HPLC缓冲液A是40mM Na₂HPO₄，pH＝7.8，HPLC缓冲液B是9∶9∶2：：甲醇∶乙腈∶水。

表A：氨基酸洗脱

时间	0	20	21	26	27
						％缓冲液B	5	65	100	100	100

使用感兴趣的所有的氨基酸从干燥化学品制备氨基酸标准物。脯氨酸分析要求使用9-芴基甲基-氯甲酸酯(FMOC)的另外的衍生化步骤。有时也购买0-100微克/毫升浓度范围的氨基酸标准物。以微克/克种子粉报道样品。使用MS Excel电子表格进行计算，MynabirdTMBROW＞Public＞Calculators＞External Standard.Xls。

野生型土壤杆菌邻氨基苯甲酸酯合成酶在鼠耳芥属中的表达

通过激发性荧光的真空渗透将载体pMON 58120转化到鼠耳芥属植物中，使植物生成转基因种子。收集种子并且筛选可选择标记物(草甘膦抗性)的存在。草甘膦抗性植物生长至成熟并且各植株生成种子，这指定一个转化事件，分析色氨酸含量(表B)。也对选择的转化事件通过如表B所示蛋白质印迹分析来分析成熟种子中表达的土壤杆菌邻氨基苯甲酸酯合成酶蛋白质的存在。

表B：转化体分析

转化事件	Trp(ppm)	存在的蛋白质
			7317	2547	+
7315	2960	+
			7319	3628	+
7313	3979	+

野生型土壤杆菌邻氨基苯甲酸酯合成酶在大豆中的表达(甘氨酸最大值)

分析的35个大豆转化事件中有33个其种子中trp水平提高，例如，从高于500ppm至最多12,000ppm。在非转基因大豆种子中，trp水平低于200ppm。蛋白质印迹证明含有高含量t rp的所有的种子表达邻氨基苯甲酸酯合成酶。表C给出具有高trp水平并且蛋白质印迹分析还对邻氨基苯甲酸酯合成酶邻氨基苯甲酸酯合成酶蛋白质呈阳性的19个大豆结果的数据。

表C：19个携带pMON58120的大豆转基因事件中Agro AS蛋白质的存在与色氨酸水平之间的关系

Agro AS酶测试

对携带pMON58120构建体的11个转化事件测定邻氨基苯甲酸酯合成酶的比活性。以C.Paulsen(J.Chromatogr.547，1991，155-160) 所述方法为基础使用以HPLC为基础的终点测试来分析各未成熟大豆种子。简要地说，在研磨缓冲液(100mM Tris pH7.5，10％甘油，1mM EDTA，1mM DTT)中从各种种子获得脱盐提取液，并且用反应缓冲液(100mMtris pH 7.5，1mM分支酸酯，20mM谷酰胺，和10mM MgCl₂)温育30分钟。存在或不存在25mM trp下测定Agro AS活性。用磷酸终止反应，并且使用340nm/激发和410nm/发射设置的荧光检测器通过HPLC定量测定形成的邻氨基苯甲酸酯的量。

与非转基因种子相比，未成熟分离转基因种子中AS的比活性范围提高1.5-倍至70-倍，达到6,000pmoles/mg/min这样高。如表D的最后一栏所示，转基因植物中邻氨基苯甲酸酯合成酶活性对色氨酸抑制作用有抗性(参见表D)。

表D：转基因事件20576中的Agro AS酶活性

实施例3：包含玉米邻氨基苯甲酸酯合成酶α-亚基基因的载体对大豆的转化

通过用Xba I消化结合部分NcoI消化(参见Anderson等，美国专利6,118,047)，从pMON52214(图22)分离玉米邻氨基苯甲酸酯合成酶α-亚基的编码序列。得到的代表邻氨基苯甲酸酯合成酶编码区的1952bp DNA片段进行凝胶纯化，并且把末端变成平端。用BglII和EcoRI消化质粒pMON53901(图23)，得到6.8Kb片段。分离之后，将6.8Kb片段的末端变成平端并且去磷酸化。然后使包含ASα基因的1952Kb片段连接平端6.8kb pMON53901片段，产生pMON39324，一种玉米7SP-ASα-NOS表达载体(图24)。

接着用BamHI消化这种pMON39324，玉米7SP-ASα-NOS盒，得到包含7S启动子和玉米ASα编码序列的2.84Kb DNA片段。用BamHI消化质粒pMON39322(图25)，得到5.88kb DNA片段。然后将这两个片段连接在一起得到pMON39325(图26)，一种亚克隆到pMON39322中的包含7S启动子-玉米ASα-NOS终止子盒的转化载体。

使用类似方法，从USP启动子下游克隆编码玉米邻氨基苯甲酸酯合成酶α-亚基的序列，产生pMON58130表达载体，从Arc5启动子下游克隆，得到pMON69662表达载体，从Lea9启动子下游克隆，得到pMON69650表达载体，从Per1启动子下游克隆，得到pMON69651表达载体。表E给出这些表达载体列表。

表E：C28-玉米邻氨基苯甲酸酯合成酶构建体

种子世代	表达盒	载体名称
			R4	7Sa’-玉米-ASα	PMON39325
R2	Napin-玉米-ASα	PMON58023
			R1	USP.玉米-ASα	PMON58130
R1	Arc5-玉米-ASα	PMON69662
			R1	Lea9-玉米-ASα	PMON69650
R1	Perl-玉米-ASα	PMON69651

这些载体用于植物转化和繁殖实验。使用这里描述的微粒轰击技术，用包含AS的玉米载体转化大豆植物。对于每种类型载体建立几种转基因大豆品系，并且几次传代繁殖，如表E所示。

例如，建立三个携带来自pMON39325的7Sα′-玉米-AS转基因的纯合品系。在两个不同的地点随机化区段设计种植这三个系。得到成熟种子并且分析游离氨基酸含量。对照确定基准trp水平，即三个相应的负等值线和非转基因对照。

表F提供对于pMON39325转化体和对照系R4种子色氨酸，以ppm表示，证明平均非转基因大豆含有大约100-200微克色氨酸/克种子粉，而pMON39325转化体基本上含有更多Trp。也参见图27。

表F：用C28玉米突变体(pMON39325)转化的大豆植物种子中的Trp水平

在五种不同的启动子(表E)的控制下表达C28玉米邻氨基苯甲酸酯合成酶的五种其他构建体转化到大豆中，得到转基因植物。每一种构建体产生高trp的结果。表G和H给出详细说明的Perl-C28玉米邻氨基苯甲酸酯合成酶产生的结果的实施例。

表G：C28玉米AS蛋白质表达与携带Perl-C28玉米AS(pMON69651)

的三个转基因事件中提高的Trp水平的关系

系谱	Trp平均值(ppm)	是否存在蛋白质
			对照	96	否
22689	2375	是
			22787	1707	是
22631	1116	是

表H详细描述用pMON69651表达载体转化的大豆植株的R1种子中C28玉米AS的酶活性。

表H：pMON69651转化体的R1种子中C28玉米AS的比活性。

这些结果表明当用C28玉米AS基因转化大豆植物组织时色氨酸大大增加。表G所示高trp水平与AS蛋白质的存在以及与对于转基因酶的提高的比活性(比非转基因对照高2.5倍)有关(表H)。如表H所示-以及如C28玉米AS酶的生化性质预计的-转基因事件的比活性是色氨酸抗性的。

实施例4：根癌土壤杆菌邻氨基苯甲酸酯合成酶色氨酸反馈不敏感突变体的合理设计。

该实施例描述包含具有不同程度的对色氨酸或色氨酸类似物反馈抑制作用敏感或不敏感的突变体根癌土壤杆菌邻氨基苯甲酸酯合成酶的载体。

根癌土壤杆菌突变体邻氨基苯甲酸酯合成酶基因的产生。

利用来自硫磺矿硫化叶菌(Sulfolobus solfataricus)邻氨基苯甲酸酯合成酶的蛋白质结构信息作为指导(Knochel等，Proc.Natl.Acad.Sci.USA，96，9479-9484(1999))，利用有把握设计色氨酸结合中涉及的几种残基的蛋白质信息，合理设计几种根癌土壤杆菌邻氨基苯甲酸酯合成酶突变体。通过使根癌土壤杆菌邻氨基苯甲酸酯合成酶基因与来自硫磺矿硫化叶菌的邻氨基苯甲酸酯合成酶氨基酸序列比对(图6)来实现。通过结合结构信息和序列同源性知识推导根癌土壤杆菌的色氨酸结合和催化区。结合袋中的残基被鉴定为改变以提供对色氨酸的反馈抑制作用的抗性的可能的候选者。

以硫磺矿硫化叶菌邻氨基苯甲酸酯合成酶的结构分析为基础，提出色氨酸结合中涉及氨基酸E30，S31，I32，S42，V43，N204，P205，M209，F210，G221，和A373。以对对比对为基础，硫磺矿硫化叶菌的N204， P205，和F210在单体邻氨基苯甲酸酯合成酶中分别作为残基N292，P293，和F298也是保守的。

但是，由于多处插入和缺失，硫磺矿硫化叶菌和根癌土壤杆菌酶的N-末端区高度趋异。因为这个原因，需要人工设计色氨酸调节中涉及的根癌土壤杆菌邻氨基苯甲酸酯合成酶的N-末端区的残基(图6)。结构分析表明色氨酸结合袋中基序″LLES″形成β-折叠。表明该结构在异四聚体酶中高度保守。然后使用″LLES″基序作为界标，将已知的单体酶与硫磺矿硫化叶菌序列手工比对(图21)。以这种蛋白质信息分析为基础，色氨酸结合中也同样涉及根癌土壤杆菌AS中的氨基酸残基V48，S50，S51，和N52。

使用根癌土壤杆菌单体酶中比对的推导的色氨酸结合残基，对于减小酶对色氨酸抑制作用的敏感性，几种不同的策略是合理的。这些取代包括，例如，扩大色氨酸-结合袋(F298A)，缩窄结合袋(V48F，V48Y，S51F，S51C，N52F，F298W)，提高结合袋极性(S50K)，或通过改变蛋白质主链构象而改变结合袋性状(P293A，P29G)。

根癌土壤杆菌AS定点诱变

利用定点诱变产生10个单氨基酸取代6个位点。利用Quik ChangeTM定点诱变试剂盒(Stratagene)，将突变导入根癌土壤杆菌ASpMON34705中。用于定点诱变的引物是SEQ ID NO：9-42(图7；F＝正向，R＝反向)。各个引物序列对于序列中特定位置处核酸的改变是特异性的，因此改变编码新的氨基酸的编码密码子。例如，S51 C指根癌土壤杆菌AS肽序列中氨基酸位置51处丝氨酸变为半胱氨酸。

诱变之后，再次确认整个基因的序列，并且如下文对于野生型酶所述从大肠杆菌表达变体并纯化。使用实施例1所述的T7表达系统，将包含突变体根癌土壤杆菌AS的得到的质粒适当克隆到超量生产蛋白质的质粒中。

根癌土壤杆菌AS蛋白质表达和纯化

根据实施例1所述在大肠杆菌中表达根癌土壤杆菌AS野生型和突变体酶。所有的根癌土壤杆菌AS酶，包括野生型及其突变体的纯化在4℃下进行。细胞(湿重大约1克)悬浮于20ml纯化缓冲液(50mM磷酸钾，pH 7.3，10mM MgCl₂，10mM 2-巯基乙醇，10％甘油)中，并且超声处理溶解(Branson sonifier Cell Disruptor，W185)。匀桨以20,000xg离心15分钟之后收集上清液。对上清液进行硫酸铵分级分离法(30至65％饱和)。以20,000xg离心15分钟之后收集沉淀并且溶解于3ml纯化缓冲液中，之后，全部加载到Econo-Pac 1 ODE脱盐柱子上，柱子用相同的缓冲液预先平衡过。通过显影分析检测含有酶的级分并且合并。合并的酶(4.3毫升)加载给用相同的缓冲液平衡过的10ml DEAE Sephacel(Pharmacia Biotech)柱子(1.5x7.5cm)。用30ml纯化缓冲液冲洗柱子，并且用相同缓冲液中30ml的50mM NaCl洗脱酶。合并含有高AS活性的级分并且用65％饱和的硫酸铵沉淀并且分离，并且如上所述脱盐。合并含有酶的级分并且在-80℃下保存。

邻氨基苯甲酸酯合成酶测定和动力学分析

在25℃下，在含有100mM磷酸钾，pH 7.0，10mM MgCl₂，1mM二硫苏糖醇，200μM分支酸酯和10mM L-谷酰胺的测试缓冲液中对根癌土壤杆菌AS进行标准分析。通过向反应混合物中加入30微升的酶并且混合开始反应。通过320nm吸收度增加直接监测邻氨基苯甲酸酯的形成3分钟。以吸收度变化对反应时间的斜率为基础计算反应初始速度，以每秒吸收度提高为单位。在总容积是1ml的含有100mM磷酸钾，pH7.0，10mM MgCl₂，1mM二硫苏糖醇，和10mM L-谷酰胺和2.5-100pM分支酸酯之间不同浓度的分支酸酯的测试缓冲液中测定分支酸酯的K_m(K_m ^Cho)。在总容积是1ml的含有100mM磷酸钾，pH 7.0，10mM MgCl₂，1mM二硫苏糖醇，200μM分支酸酯和0.1-2mM L-谷酰胺之间的不同浓度的L-谷酰胺的测试缓冲液中测定谷酰胺的K_m (K_m ^Gln)。在总容积是1ml的含有100mM磷酸钾，pH 7.0，10mM MgCl₂，1mM二硫苏糖醇，10mM L-谷酰胺，200μM分支酸酯和0.1-10mM L-色氨酸之间的不同浓度的L-色氨酸的测试缓冲液中测定色氨酸的IC₅₀(IC₅₀ ^Trp)。数据与非线性回归程序拟合之后计算AS的动力学参数和IC₅₀(GraFit)。

几种突变体证明对色氨酸抑制作用的减小的敏感性，同时仍然保留比得上野生型酶的酶活性(表I)。这些结果证明对色氨酸抑制作用敏感性程度能被降低，例如，通过诱变邻氨基苯甲酸酯合成酶的色氨酸结合袋中的氨基酸和通过优化证明反馈不敏感性的突变。

表I：邻氨基苯甲酸酯合成酶活性和色氨酸对根癌土壤杆菌AS突变体的作用

实施例5：产生色氨酸反馈不敏感突变体的根癌土壤杆菌AS的随机诱变

除了实施例4描述的合理设计方案，产生邻氨基苯甲酸酯合成酶的反馈不敏感性突变体的其他策略包括但不限于随即诱变。例如，通过化学诱变(分离的DNA或者整个生物体)，易错PCR，和DNA改组，能实现根癌土壤杆菌AS的随机诱变。该实施例描述了化学诱变的利用，接着基因筛选。基因筛选方法对于从其他诱变技术得到的期望的突变体的选择也是有用的。

含有根癌土壤杆菌AS的大肠杆菌表达质粒的制备

使用正向引物5′端上包含Nco 1位点和反向引物3′端上的Xba1位点的引物通过PCR扩增来自根癌土壤杆菌AS克隆pMON61600的可读框(实施例1描述的SEQ ID NO：1)：

5′-CATCCCATGGATGGTAACGATCATT CAGGAT-3′(SEQ ID NO：55)；和5′-GATGTCTAGAGACAC TATAGAATACTCAAGC-3′(SEQ ID NO：56).

得到的PCR产物连接到pMON25997中(图28)，其有通过用BspH1 和Xba1消化去除的bktB可读框(Slater等，J.Bact.180，p1979-1987(1998))，产生质粒pMON62000(图29)。pMON62000是基础质粒，用于色氨酸营养缺陷型诱变和补充(EMG2ΔtrpE)。

大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的制备

使用自杀载体pK03从大肠杆菌菌株EMG2(K-12wt F+)(E.coliGenetic Stock Center)的染色体trpE基因缺失1,383碱基对来构建大肠杆菌菌株(EMG2ΔtrpE)。PCR扩增大肠杆菌基因组DNA的两个扩增子。第一个扩增子大约是1.5kb并且3′端包含trpE ORF的前30bp。在扩增子在5′端包含一个BamHl s位点，在3′端包含一个EcoR1位点。第二扩增子大约是1kb并且在5′端包含trpE ORF的后150bp。该扩增子在5′端包含一个EcoR1位点，在3′端包含一个Sal1位点。用合适的酶消化两个扩增子并且在EcoR1位点连接在一起，产生trpE的框内缺失。图30给出得到的截短基因的序列(SEQ ID NO：46)。TrpE缺失扩增子在BamH1和Sal1位点连接到pKO3中。根据A.J.Link等，J.Bacteriol.，179，6228(1997)所述进行基因切割。

pMON62000对大肠杆菌色氨酸营养缺陷型EMG2ΔtrpE的补充

用pMON62000转化大肠杆菌菌株Ec-8(EMG2ΔtrpE)并且在M9基本培养基上平板培养，确定加pMON62000是否补充缺失。质粒对照(缺根癌土壤杆菌AS插入物)和对照株Ec-8也在M9基本培养基上平板培养和在有40微克/毫升色氨酸的M9基本培养基上平板培养。

在没有色氨酸的M9上发现pMON62000转化的菌株Ec-8生长，对对照没有发现生长，表明pMON62000补偿了Ec-8菌株的trpE缺失。

pMON62000的羟胺诱变和突变体的遗传筛选

为了制备邻氨基苯甲酸酯合成酶的突变体，用化学诱变剂羟胺诱变pMON62000。在微量离心管中混合下面的成分：20微克pMON62000质粒DNA和40微升2.5M羟胺，pH 6.0。用0.1M NaH₂PO₄，pH6.0+5mM EDTA，pH 6.0使容积达到200微升。试管在70℃下温育。1.5小时之后，在大约500ml H₂O上漂浮的硝基纤维素过滤器上透析100微升反应混合物。15分钟之后，使用Qiagen PCR纯化试剂盒浓缩DNA。3小时之后，用相同的方法取出并纯化剩余的100微升反应混合物。

然后通过电穿孔用使用羟胺已经诱变1.5或3小时的100ng的pMON62000转化大肠杆菌株Ec-8。每一个时间点进行这两个转化程序。在SOC培养基(20g/L Bacto-胰蛋白胨，5g/L Bacto酵母提取物，10ml/L 1M NaCl，2.5ml/L 1M KCl，18g葡萄糖)中回收转化细胞4或6小时。

制备含有M9基本培养基，加2％琼脂，和50微克/毫升5-甲基-DL-色氨酸(5-MT)的两个245mm正方形生物测试板。其余100微升加到M9对照板上。对含有3.0小时诱变质粒的转化混合物实施相同的程序。

然后将板在37℃下温育大约2.5天。从5-MT板分离抗性菌落并且划线接种到LB-卡那霉素(50微克/毫升)板，证基本粒的存在。所有的选择的菌落在这些板上生长。准备双份各抗性克隆的各菌落，分离质粒。进行限制性消化和PCR并且证明所有的克隆含有期望的根癌土壤杆菌AS插入物。

获救质粒然后转化回菌株Ec-8中。通过划线到新的LB-卡那霉素板上纯化每次转化的一个菌落。为了证明对5-MT的抗性，各纯化的菌落划线到含有M9加50微克/毫升5-MT和2％琼脂的板上，然后在37℃下培养3天。大多数克隆有抗性。为了确定在甚至更高的5-MT浓度下抗性突变体是否保持抗性，它们在M9加300微克/毫升5-MT和2％琼脂的板上平板培养。在该高浓度下大多数克隆也证实有抗性。

从所有的抗性克隆分离质粒并且对两个链测序。表J中图表表示了这项实验的一些突变。

表J：5-MT抗性克隆中根癌土壤杆菌trpEG序列变化

如表J中的数据所示，几种突变体对突变体酶的K_m和IC₅₀几乎没有影响，表明这些突变可能不是对色氨酸反馈抑制作用的抗性的来源。例如，35位核苷酸从C突变为T，它将12位氨基酸从苏氨酸变为异亮氨酸(Thr12Ile)，K_m ^Cho和IC₅₀ ^trp值变化很小。类似地，2068位核苷酸从C突变为T，它将脯氨酸变为丝氨酸，K_m ^Cho和IC₅₀ ^trp值变化很小。因此这些突变可能是″沉默″突变，得到具有和野生型那些一样的酶学性质的变体基因产物。

实施例6：高色氨酸转基因大豆植物

该实施例描述由于用来自根癌土壤杆菌的邻氨基苯甲酸酯合成酶的色氨酸反馈不灵敏突变体转化而具有提高的色氨酸水平的转基因大豆植物的制备。

载体构建

用限制酶NotI消化质粒pMON34711，该质粒携带实施例4描述的含有F298W突变的根癌土壤杆菌的邻氨基苯甲酸酯合成酶克隆。将得到的片段的末端变成平端后用NcoI消化。然后用限制酶EcoRI消化质粒pMON13773(图8)，末端平端后用NcoI消化。连接得到的片段，得到质粒pMON58044，它包含7S启动子和NOS3′终止子控制下的AS基因(图9)。

然后用限制酶Bg1II和NcoI酶切质粒pMON58044，并且与用Bg1II和NcoI消化pMON53084(图10)产生的片段连接。得到的片段命名为pMON58045(图11)，并且包含鼠耳芥属SSU1A转运肽的序列。

最后，通过将用限制酶NotI消化pMON58045(图11)和pMON38207(图13)产生的片段连接来构建质粒pMON58046(图12)。得到pMON58046载体(图12)，其用于大豆转化。

通过微粒轰击转化大豆

关于微粒轰击转化方法，商购大豆种子(即，Asgrow A3244，A4922)发芽过夜大约18-24小时，切除分生组织分离块。去除初生叶暴露分生组织并且将分离块置于目标培养基中，分生组织位于微粒送递方向的垂直方向。

用CaCl2和精脒将上述pMON58046转化载体沉淀极微小的金粒上，接着重新悬浮于乙醇。将悬浮液包被到Mylar薄片上，该薄片然后被放到放电装置上。通过以大约60％电容放电使微粒加速进入植物组织。

轰击之后，组织培养分离块放在选择培养基(WPM+0.075mM草甘膦)(WPM＝木质植物培养基(McCown & Lloyd，Proc.International Plant Propagation Soc.，30：421，1981)减去BAP))中培养5-7周，选择并且使转基因芽生长。轰击之后大约5-7周收获表型呈阳性的芽，并且放在选择性生根培养基(BRM+0.025mM草甘膦)(参见下文对于BRM的配方)中2-3周。将生根的芽转移到温室中种在土壤中。选择时保持健康的但是没有生根的芽被转移给非选择性生根培养基(没有草甘膦的BRM)中另外生长两周。在转移到温室中种在土壤中之前，对脱离选择生根的从任何芽生的根分析植物可选择标记物的表达。植株保留在标准温室条件下直到收获R1种子。

下面给出用于豆子生根培养基(BRM)的配方。

化合物对于4L的量

MS盐*** 8.6g

Myo-肌醇(细胞培养级) 0.40g

SBRM维生素原液** 8.0ml

L-半胱氨酸(10mg/ml) 40.0ml

蔗糖(超级醇) 120g

调节pH至 5.8

洗涤过的琼脂 32g

高压灭菌之后加入：

SBRM/TSG激素原液* 20.0ml

*SBRM/TSG激素原液(每1L BRM)：3.0ml IAA(0.033mg/ml)，2.0ml灭菌蒸馏水。4℃下避光贮存原液。

**SBRM维生素原液(每1L原液)：甘氨酸(1.0g)，烟酸(0.25g)，盐酸维生素B-6(0.25g)，盐酸维生素B1(0.25g)。

***3X MInor MS盐(每1L原液)：H₂BO₃(1.86g)，MnSO₄(5.07g)，ZnSO₄-H₂O(2.58g)，KI(0.249g)，7.5微升NaMoO-2H₂O(1.0mg/ml)，7.5微升CoSO₄-5H₂O(1.0mg/ml)，7.5微升CoCl₂-6H₂O(1.0mg/ml)。

一次加入一种成分并且溶解，加灭菌蒸馏水使容积达到一升，溶液贮存于冷藏箱中箔片覆盖的瓶子中不超过一个月。

使用根癌土壤杆菌转化大豆

对于土壤杆菌转化方法，商购大豆种子(Asgrow A3244，A4922)发芽过夜(大约10-12小时)并且切除分生组织分离块。初生叶可以被去除也可以不被去除，使分生组织和分离块放在创伤容器中。

含有感兴趣的质粒的土壤杆菌株ABI生长至对数期。离心收获细胞并且重新悬浮于含有诱导剂的接种培养基中。大豆组织培养分离块和诱导的土壤杆菌培养物混合，不超过自种子发芽起14个小时，并且利用超声创伤。

创伤之后，组织培养分离块在土壤杆菌中生长大约1小时。接种步骤之后，吸移土壤杆菌，并且将组织培养分离块放在共培养物中2-4天。此时，将它们转移给选择培养基(WPM+0.075mM草甘膦+控制土壤杆菌过量生长的抗生素)5-7周，选择并且使转基因芽生长。

轰击之后大约5-7周收获表型呈阳性的芽，并且放在选择性生根培养基(BRM+0.025mM草甘膦)中2-3周。将生根的芽转移到温室中种在土壤中。选择时保持健康的但是没有生根的芽被转移给非选择性生根培养基(没有草甘膦的BRM)中另外生长两周。在转移到温室中种在土壤中之前，对脱离选择生根的从任何芽生的根分析植物可选择标记物的表达。植株保留在标准温室条件下直到收获R1种子。

R1种子的氨基酸含量分析

制备成熟R1种子并且应用Agilent Technologies TechnicalBulletin REV14中描述的荧光检测分析游离氨基酸含量。每一个结果的每一个种子分析选择5粒种子。表达AgroAS F298W或AgroAS S51F突变体蛋白质的大豆种子产生非常高含量的色氨酸。表K和L给出结果。

表K：用pMON58046转化的种子中的蛋白质表达

谱系	Trp平均值	是否存在蛋白质
			对照	96	否
22817	9922	是
			22891	12955	是
23026	7968	是

表L：AS蛋白质表达与pMON58123转化体的关系

谱系	Trp平均值	是否存在蛋白质
			对照	96	否
23562	88	否
			23590	8795	是
23911	388	是

Agro AS转化的R1种子中AS酶活性

制备成熟R1种子并且分析邻氨基苯甲酸酯合成酶活性。测定携带Agro AS F298W(SEQ ID NO：65或91)或Agro AS S51F(SEQ ID NO：60或86)突变体等位基因的R1大豆种子中邻氨基苯甲酸酯合成酶酶活性。发现非常高水平的色氨酸抗性邻氨基苯甲酸酯合成酶活性，与这些种子产生的高含量色氨酸一致。表M和N给出结果。

表M：用pMON58046转化的R1种子中AS的比活性

表N：用pMON58123转化的R1种子中AS的比活性

实施例7：包含芸香邻氨基苯甲酸酯合成酶α-亚基的转化载体的制备

来自芸香邻氨基苯甲酸酯合成酶的α基因(Genbank登记号No.GI960291)提供本发明中有用的另一个邻氨基苯甲酸酯合成酶结构域(Bohlmann，J等，Plant Phys111507-514(1996))。芸香基因组中存在的邻氨基苯甲酸酯合成酶的一种同功酶证明对L-色氨酸反馈抑制作用的较小易感性。这个等位基因可以在本发明中用来提高转基因植物中游离L-色氨酸水平。载体pMON58030(图14)包含芸香邻氨基苯甲酸酯合成酶的α-亚基，其对色氨酸抑制作用敏感性较小。从pMON58030PCR扩增芸香邻氨基苯甲酸酯合成酶的α基因，通过使用包含这两个限制酶位点的PCR引物在芸香邻氨基苯甲酸酯合成酶的α基因片段的5’端引入BamHI位点和在3’端引入Bg1II位点：

5’-CAAAAGCTGGATCCCCACC-3’(SEQ ID NO：53)和

5’-CCTATCCGAGATCTCTCAACTCC-3’(SEQ ID NO：54)。

纯化该PCR片段，并且用相应限制酶消化，得到pMON58041，其包含芸香ASα与napin启动子的转录融合体。制备包含napin启动子，芸香AS，NOS终止子，草甘膦抗性(CP4)，可选择标记物和适合所述盒适当染色体整合的缘的土壤杆菌介导的植物转化质粒，pMON58043。利用实施例2，3和6中所述标准植物转化技术，用得到的植物转化载体转化植物。

实施例8：将多个多肽邻氨基苯甲酸酯合成酶转化到单体单一多肽邻氨基苯甲酸酯合成酶中

期望通过选择的多亚基酶的融合产生的单体邻氨基苯甲酸酯合成酶，例如达到催化效率最大化，稳定该酶，实现例如具有TrpE和TrpG活性的亚基的同步表达，和两个亚基之间的有效转染。在某些情况下，通过标准诱变技术或者通过前面实施例例如实施例4所述的合理设计，有用地使用来自植物或微生物来源的TrpE或α亚基，所述来源反馈抑制方面不受调节。在其他情况下，使用来自植物或微生物来源的野生型TrpE或α亚基。

选择的TrpE或α亚基的C-末端与TrpG或β亚基的N-末端连接，优选使用肽接头。能合理设计接头，为两个亚基适当比对提供合适的空间将柔顺性。或者，通过单体和异四聚体邻氨基苯甲酸酯合成酶的序列比对能鉴定接头。图21和35给出形成的单体和异四聚体邻氨基苯甲酸酯合成酶的序列比对的例子。还发现为了将利益最大化，需要产生包括异源亚基的单体邻氨基苯甲酸酯合成酶。例如，从细菌源，例如大肠杆菌，可以获得α亚基，并且与来自植物例如鼠耳芥属来源的β亚基融合。

例如，根据实施例2，3或6所述，能将产生的新的蛋白质导入植物。本发明不局限于所给出的和所描述的具体细节。要明白在权利要求书定义的精神和范围内可以进行很多改变和修饰。

实施例9：来自基因组序列数据库的邻氨基苯甲酸酯合成酶的鉴定

通过例如使用BLAST(www.ncbi.nlm.nih.gov/blast/)检索GenBank和/或swissprot数据库，通过生物信息学分析，能鉴定本发明中有用的单体邻氨基苯甲酸酯合成酶以及α和β结构域。用于鉴定单体邻氨基苯甲酸酯合成酶的查询序列包括，例如，来自硫磺矿硫化叶菌(Sulfolobus solfataricus)的邻氨基苯甲酸酯合成酶结构域，例如α结构域(GI1004323)或β结构域(GI1004324)，或者单体邻氨基苯甲酸酯合成酶，例如根癌土壤杆菌AS(GI15889565)。推导的单体邻氨基苯甲酸酯合成酶与查询序列的同源性在50％和100％之间，并且应该最少含有700个氨基酸。如果使用AS-α结构域查询基因组数据库，除了鉴定推导的邻氨基苯甲酸酯合成酶基因外，还可能鉴定PABA合成例如4-氨基-4-去氧分支酸酯(ADC)合成酶合成中涉及的基因。以ADC合成酶的酰胺转移酶结构域(β结构域)在蛋白质的N-末端而AS的酰胺转移酶结构域(β结构域)在C-末端这样的观察为基础，能容易地将单体ADC合成酶基因与推导的单体AS基因区别开来。通过生物信息学分析鉴定的本发明中使用的单体邻氨基苯甲酸酯合成酶包括但不限于，例如苜蓿根瘤菌(Rhizobium meliloti)(GI95177)，Mesorhizobium loti(GI 13472468)，马尔他布鲁氏菌(Brucella melitensis)(GI 17982357)，念珠蓝细菌(Nostoc sp.)PCC7120(GI 17227910，GI 17230725)，巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156)，血色红假单孢菌(Rhodopseudomonaspalustris)，鱼腥蓝细菌(Anabaena)M22983(GI 152445)。图21是本发明中有用的两个单体邻氨基苯甲酸酯合成酶(根癌土壤杆菌和苜蓿根瘤菌)与两个异四聚体邻氨基苯甲酸酯合成酶(硫磺矿硫化叶菌和鼠耳芥)的序列比对的例子。图35是几种单体邻氨基苯甲酸酯合成酶与血色红假单孢菌异四聚体邻氨基苯甲酸酯合成酶的序列比对的例子。

实施例10：优化的密码子使用

该实施例描述通过密码子使用的优化使邻氨基苯甲酸酯合成酶基因在种子中改善的表达。

对来野生型根癌土壤杆菌的邻氨基苯甲酸酯合成酶(AS)基因的核苷酸序列(SEQ ID NO：1)检查没有充分表达的密码子的存在。为了鉴定没有充分表达的密码子，对来自玉米和大豆的高表达种子蛋白质的序列检查相对密码子频率。表O给出相对密码子使用频率，以预期值形式代表。预期值形式可以举例如下：假设编码一个给定氨基酸有四个密码子，并且假设它们同样好地被使用，则预期各密码子对那个氨基酸的频率占25％(0.25)。但是，由于冗余性，将0.25标准化为1.0，与编码那个氨基酸的其他密码子相比给出每一个密码子的相对评分。对于该项分析，如果一个密码子比对于给定氨基酸的其他选择更普遍，则接受大于1.0的数。相应地，如果一个密码子不普遍，它接受小于1.0的数。对于该项研究，如果相对密码子使用频率低于0.5，则认为特定密码子未被充分表达。

应用表O的结果，对野生型土壤杆菌AS序列的严谨检查表明，认为玉米和大豆中密码子125未被充分表达(低于0.5阈值)(表P)。用上面定义的更普遍密码子置换这些未被充分表达的密码子。修饰的核苷酸序列如图36所示。利用生物信息学工具，组装得到序列，并且分析翻译的整合性，并且将核苷酸和蛋白质序列与相应的野生型AS序列比对。同时，蛋白质序列没有变化，优化的序列的核苷酸序列与野生型土壤杆菌AS序列有94％同一性(图37)。分别利用LasergeneEditSeq(DNASTAR，Inc.，Madison，WI)和Grai12(Oak Ridge NationalLaboratory，Oak Ridge，TN)对优化核苷酸序列分析不存在隐藏聚腺苷酸化信号(AATAAA，AATAAT)和隐藏内含子。没有发现隐藏信号。

应用本领域公知的技术合成修饰的核苷酸序列或者由供应商提供，例如Egea Biosciencesces，Inc.(San Diego，CA)。将得到的核苷酸克隆到合适的表达载体中，并且利用本说明书前面实施例中描述的方法测定在玉米，大豆和鼠耳芥属中的效率。

表O：玉米和大豆种子表达基因中相对密码子使用频率¹

密码子 AA 玉米种子大豆种子密码子 AA 玉米种子大豆种子

TTT F 0.4211 0.7348 ATC I 1.7143 1.0563

TTC F 1.5789 1.2652 ATA I 0.3673 0.6654

TTA L 0.4557 0.3875 ATG M 1.0000 1.0000

TTG L 0.9494 1.2060 ACT T 0.6153 1.0008

TCT S 0.9624 1.4851 ACC T 1.2213 2.1020

TCC S 1.3707 1.1249 ACA T 0.8372 0.7146

TCA S 0.9107 1.0044 ACG T 1.3262 0.1826

TCG S 0.7851 0.3266 AAT N 0.2885 0.5409

TAT Y 0.2455 0.6861 AAC N 1.7115 1.4591

TAC Y 1.7545 1.3139 AAA K 0.5333 0.9030

TGT C 0.2778 0.7572 AAG K 1.4667 1.0970

TGC C 1.7222 1.2428 AGT S 0.2679 0.9714

TGG W 1.0000 1.0000 AGC S 1.7032 1.0876

CTT L 0.7975 1.6298 AGA R 0.3913 1.9459

CTC L 1.0610 1.6301 AGG R 2.9185 1.3087

CTA L 0.8544 0.5905 GTT V 0.5714 1.2381

CTG L 1.8820 0.5562 GTC V 1.0119 0.6864

CCT P 0.6500 1.5822 GTA V 0.3810 0.3472

CCC P 0.8520 0.7694 GTG V 2.0357 1.7284

CCA P 1.2240 1.5838 GCT A 0.9876 1.3583

CCG P 1.2740 0.0645 GCC A 1.1618 1.1283

CAT H 0.8438 0.6066 GCA A 0.8011 1.2898

CAC H 1.1563 1.3934 GCG A 1.0495 0.2235

CAA Q 0.8639 1.2162 GAT D 0.8500 0.9523

CAG Q 1.1361 0.7838 GAC D 1.1500 1.0477

CGT R 0.2582 0.5903 GAA E 0.6818 1.0463

CGC R 1.0082 1.1159 GAG E 1.3182 0.9537

CGA R 0.1957 0.6700 GGT G 1.1268 1.1431

CGG R 1.2283 0.3692 GGC G 1.8758 0.6577

ATT I 0.9184 1.2783 GGA G 0.3085 1.2759

ATC I 1.7143 1.0563 GGG G 0.6889 0.9233

¹以预期值形式表示相对密码子频率。这意味着，如果编码一个给定氨基酸有四个密码子，如果它们同样好地被使用，则预期各密码子占25％(0.25)。由于冗余性，0.25被标准化成1，与编码该氨基酸的所有密码子相比，给出每一个密码子的相对评分。在现实生活中，如果一个密码子比对于给定氨基酸的其他选择更普遍，则它是大于1的数。如果一个密码子与这个氨基酸的其他密码子相比不优选，则它是小于1的数。

所有的出版物和专利文献在此引作参考，分别引入作为参考。本发明不局限于所给出的和所描述的具体细节。应该理解，在权利要求书定义的精神和范围内可以进行很多改变和修饰。