改进的芽孢杆菌RNA酶抑制剂基因
本发明涉及改进的芽孢杆菌RNA酶抑制剂基因和改进的芽孢杆菌RNA酶抑制剂蛋白质,所述蛋白质能够用于中和真核细胞,特别是植物细胞中芽孢杆菌RNA酶的活性。因此可以将改进的芽孢杆菌RNA酶抑制剂基因用于生产可育的恢复系植物,所述植物能够使雄性不育系植物恢复繁殖力,所述雄性不育植物在其细胞的核基因组中含有包括雄蕊选择性启动子和编码芽孢杆菌RNA酶的DNA的嵌合基因。本发明还涉及在其细胞的核基因组中含有改进的芽孢杆菌RNA酶抑制剂基因的恢复系植物。
发明背景
在许多植物中,如果不是大多数植物,开发杂种栽培品种是非常令人满意的,因为通常由于杂种优势,杂种栽培品种的生产能力增强:与其亲本相比杂种个体具有优势性能(参见例如Fehr,1987,栽培品种研制的原理,第一卷:理论和技术,MacMillan出版公司,纽约;Allard,1960,植物育种原理,John Wiley and Sons,Inc.)。
各个植物种类的杂种栽培品种的研制取决于亲本之间获得几乎完全的交叉授粉的能力。达到这一目的最简单的方法是通过去除花药以手工的方式,或通过利用在一个亲本的细胞质或核基因中阻止花药和/或花粉发育(植物雄性不育的综述,参见例如Kaul,1988,‘高等植物的雄性不育’,Springer Verlag)而从遗传上使亲本品系之一雄性不育(即使它们处于没有花粉或花粉没有功能的状态下)。
对于其种子是收获的产品(例如玉米,油菜)的杂种植物,大多数情况下,确保完全恢复杂种植物的繁殖力也是必要的。在雄性不育处于遗传控制下的系统,需要存在和应用能够恢复雄性不育的基因。杂种栽培品种的研制主要取决于是否可获得合适的和有效的不育和恢复基因。
对于大多数可能含有影响雄性不育的基因型的植物品系,内源性核基因座是已知的,并且通常,对于特定的隐性等位基因这样的基因座必须是纯合的,以便产生雄性不育表现型。在这样的基因座显性“雄性能育”等位基因的存在导致产生雄性可育。
近来,已经证明通过给植物基因组提供包括编码例如细胞毒性产物(例如RNA酶)的DNA序列(或雄性不育DNA)并且处于启动子控制下的嵌合雄性不育基因能够在植物中诱导雄性不育,其中启动子在选定的雄性可再生器官的细胞中具有优势的活性。关于这一点,已经证明雄蕊选择性启动子,例如烟草的TA29基因的启动子特别适用于此目的(Mariani等人,1990,自然学347:737,欧洲专利公开(EP 0,344,029)。通过给植物的核基因组提供这样的雄性不育基因,制备了人工的雄性不育基因座,它含有导致产生雄性不育植物的人工的雄性不育基因型。
另外,已经证明用包括另一个DNA序列的嵌合的能育性-恢复基因(或能育性-恢复DNA)能够恢复雄性可育,所述能育性-恢复基因编码例如在植物细胞中抑制细胞毒性产物的活性的蛋白质或阻止细胞毒性产物的活化的蛋白质(欧洲专利公开(EP 0,412,911)。例如解淀粉芽孢杆菌的芽孢杆菌RNA酶基因编码RNA酶,芽孢杆菌RNA酶,该酶受蛋白质,芽孢杆菌RNA酶抑制剂的抑制,它是由解淀粉芽孢杆菌的芽孢杆菌RNA酶抑制剂基因编码的。芽孢杆菌RNA酶基因可用于构建一个不育的基因,而芽孢杆菌RNA酶抑制剂基因可用于构建可育-恢复基因。在不同的植物品系,例如油菜中进行的试验已经证明嵌合的芽孢杆菌RNA酶抑制剂基因完全能够恢复雄性不育系的雄性繁殖力,其中雄性不育系的雄性不育是由于存在嵌合的芽孢杆菌RNA酶抑制剂基因(EP 0,412,911,Mariani等人,1991,CCIRC油菜会议的会议录,1991年,7月9-11日,Saskatoon,Saskatchewan,加拿大;Mariani等人,1992,自然学357:384)。通过偶合一个标记基因,例如显性的除草剂抗性基因(例如编码膦苏菌素乙酰转移酶(PAT)的bar基因,所述PAT将除草剂膦苏菌素转化为非毒性的化合物[De Block等人,1987,EMBO J.6:2513]),利用嵌合的雄性不育和/或可育-恢复基因,可以给育种系统提供选择雄性不育植物的均一的群体的方法(EP 0,344,029;EP 0,412,911)。
任何植物种类的特定的栽培品种的杂种种子的生产要求:1)保持少量的各个自交系亲本的纯种子,和2)制备大量的各个自交系亲本的种子。通常通过几个(通常是两个)种子繁殖循环,从少量的纯种子(“基本种子”)开始,并且在各个繁殖循环中产生大量的自交系亲本的纯种子,最后产生自交系亲本的母本种子(“亲本种子”或“基本种子”),能够获得这样大量的种子,所述母本种子的量足以在种植以后产生所需量的杂种种子。当然,在各个种子繁殖循环中需要较大的种植面积(大田)。
芽孢杆菌RNA酶是一种由解淀粉芽孢杆菌分泌的核糖核酸酶,芽孢杆菌RNA酶抑制剂是由该相同的微生物产生的芽孢杆菌RNA酶的抑制剂(Hartley,1988,分子生物学杂志202:913-915)。已经有人描述了几种突变的芽孢杆菌RNA酶和芽孢杆菌RNA酶抑制剂蛋白质(Hartley,1993,生物化学32:5978-5984;Schreiber and Fersht,1993,生物化学32:5145-5150;Guillet等人,1993,现代生物学1:165-177;Hartley,1989,TIBS 14:450-454;Axe等人,1996,PNAS 93:5590-5594;Serrano,1993,分子生物学杂志233:305-312)。已证明其中某些突变体基本上保留了由解淀粉芽孢杆菌产生的芽孢杆菌RNA酶和芽孢杆菌RNA酶抑制剂的生物学活性。但是,至少已经描述了两种突变的芽孢杆菌RNA酶抑制剂,它们没有可检测的芽孢杆菌RNA酶抑制剂活性(Hartley,1993,生物化学32:5978-5984;Guillet等人,1993,现代生物学1:165-177)。
还已知其他相关的微生物能够产生与芽孢杆菌RNA酶抑制剂和芽孢杆菌RNA酶高度类似的蛋白质。因此,Bacillus tntermedius产生binase和binstar(Schulga等人,1992,NAR 20:2375;Guillet等人,1993,见上文)。
发明概述
本发明涉及改进的芽孢杆菌RNA酶抑制剂DNA,它编码具有以Met-Xaa开头的氨基酸序列的芽孢杆菌RNA酶抑制剂,其中Xaa是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。优选的是芽孢杆菌RNA酶抑制剂DNA编码具有下列氨基酸序列的芽孢杆菌RNA酶抑制剂,所述氨基酸序列是1)SEQ ID No 2的氨基酸序列,其中第二个氨基酸不是赖氨酸,而是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸;2)SEQ ID No 4的氨基酸序列;或SEQ ID No 4的氨基酸序列,其中第二个氨基酸不是丙氨酸,而是缬氨酸,甘氨酸,天冬氨酸或谷氨酸。
本发明还提供了改进的合成芽孢杆菌RNA酶抑制剂DNA,它含有低于40%的A和T核苷酸和/或具有对油菜籽,棉花,玉米,水稻和小麦,优选的是油菜籽,玉米,水稻最佳的惯用密码子。优选的是合成的芽孢杆菌RNA酶抑制剂DNA含有不高于7%CG双核苷酸和/或不高于9.5%的CNG三核苷酸。优选的合成的芽孢杆菌RNA酶抑制剂DNA编码具有SEQID No 4的氨基酸序列的芽孢杆菌RNA酶抑制剂。特别优选的合成的芽孢杆菌RNA酶抑制剂DNA具有SEQ ID No 3的核苷酸序列。
本发明还提供了:嵌合基因,其中改进的芽孢杆菌RNA酶抑制剂DNA可操作连接到植物可表达启动子上,优选的是选择性地在雄蕊细胞中指导表达和至少在毡绒层细胞中指导表达的启动子;含有这些嵌合基因的植物细胞和植物。
本发明进一步提供了改进的芽孢杆菌RNA酶抑制剂DNA和改进的芽孢杆菌RNA酶抑制剂蛋白质在中和植物细胞中芽孢杆菌RNA酶中的应用,特别是关于雄性可育恢复为雄性不育系的应用。
本发明还提供了具有以Met-Xaa开头的氨基酸序列的改进的芽孢杆菌RNA酶抑制剂,其中Xaa是丙氨酸,缬氨酸,甘氨酸,天冬氨酸或谷氨酸。
发明详述
本文使用的雄性不育(“ms”)植物是给定的植物种类的植物,它是由于一种整合到所述植物的核DNA的嵌合的雄性不育基因(S)的表达而导致的雄性不育植物,其中所述的嵌合基因包括下列可操作连接的DNA片段:
1)“不育性启动子”,它选择性地在雄蕊细胞,优选的是至少在毡绒层细胞中指导表达,和
2)“雄性不育DNA”,它编码芽孢杆菌RNA酶(“芽孢杆菌RNA酶DNA”)。
所述雄性不育基因的一个例子是包括处于来自于烟草的TA29基因的启动子,例如包含于质粒pVE108(WO92/29696)中的启动子的控制下的芽孢杆菌RNA酶DNA的基因。
本文描述的恢复系植物是相同植物种类的雄性可育植物,它含有整合到其细胞的核DNA中的一个可育的恢复基因(R),包括
1)“恢复启动子”,它指导至少那些雄蕊细胞中的表达,其中不育性启动子指导ms植物的芽孢杆菌RNA酶DNA的表达,和,
2)编码芽孢杆菌RNA酶抑制剂的“恢复DNA”(“芽孢杆菌RNA酶抑制剂DNA”)。
对于本发明的恢复系植物,芽孢杆菌RNA酶抑制剂DNA是改进的芽孢杆菌RNA酶抑制剂DNA,如下文所述。
在含有雄性不育基因的雄性不育植物的那些子代植物中存在的可育性的恢复基因使那些子代植物恢复雄性繁殖力。当然子代植物是从雄性不育植物和恢复系植物之间的杂交获得的。
本文使用的恢复系植物是指雄性可育的并且其基因组内含有雄性不育基因和可育性-恢复基因,特别是包括本发明的改进的芽孢杆菌RNA酶抑制剂DNA的可育性恢复基因的植物(其与雄性不育植物和恢复系植物是相同的植物种类)。
品系是指给定的单个植物的子代。给定的品系的植物其一个或多个特定的遗传和/或表现型特性是互相类似的。如本文所述,雄性不育(ms)系是一组属于一个植物种类,特别是一个植物品种的植物,由于在相同的遗传基因座存在特定的雄性不育基因,它们都是雄性不育的。类似地,恢复系是指一组在相同的遗传基因座都含有特定的可育性恢复基因的植物种类的植物。优选的是所有的ms品系的植物(各自的恢复系)就雄性不育基因座(各自的可育性恢复基因座)而言具有相同的基因型。
通过在ms品系导入可育性恢复基因,例如通过将ms品系的植物与恢复系植物杂交以便至少某些子代植物是恢复的植物,可以使雄性不育系恢复为雄性可育。
一个品种的品系的遗传背景命名为存在于该品种中的基因的总数,所述基因总数决定该品种的特定的表现型特性。因此,可以将通过遗传工程手段导入而产生一个品种的特定的品系的外源基因例如雄性不育基因或恢复基因导入到不同的品种(或甚至不同的种类)中,各个品种具有不同的遗传背景。
为了生产杂种种子,也将雄性不育系称作为雌性或第一亲系,还将雄性可育(恢复)系称作为雄性或第二亲系。
本文所述的基因通常被理解为包括至少一个编码RNA,蛋白质或多肽的编码区,该编码区可操作连接到合适的启动子和3’调控序列上。
为了本发明的目的,基因的表达例如嵌合基因的表达是指基因的启动子指导DNA转录为具有生物学活性的RNA,即所述RNA能够与另一个RNA或蛋白质互相作用,或能够被转译为生物学活性的多肽或蛋白质。
表现型是基因型即一个基因或一组基因的表达(或表达不足)的外部形态(例如雄性不育,在特定的植物组织存在蛋白质或RNA等等)。
本文使用的芽孢杆菌RNA酶是能够降解单链RNA的任何蛋白质,并且它包括由解淀粉芽孢杆菌分泌的芽孢杆菌RNA酶(分泌的芽孢杆菌RNA酶)的氨基酸序列(Hartley,1988,分子生物学杂志202:913)或包括与该序列至少具有80%,优选的是至少85%的序列等同性的氨基酸序列。本文使用的芽孢杆菌RNA酶能够通过一个反应降解RNA,所述反应涉及将一个核苷酸的5’核糖和结合到邻近的3’核苷酸上的磷酸基团之间的磷酸二酯键进行初始的裂解。该反应的初始产物是2’,3’-环状的磷酸中间体,随后该中间体被水解为相应的3’核苷磷酸。芽孢杆菌RNA酶也能够将聚乙烯醇腺苷磷酸以产生高荧光团的核苷酸类似物1,N-乙烯醇腺苷(Fitzgerald和Hartley,1993,生化分析214:544-547)并且按照标准条件的测定,具有10%,优选的是至少50%,特别是至少75%的分泌的芽孢杆菌RNA酶的活性(Fitzgerald和Hartley,1993,生化分析214:544-547;Hartley,1993,生物化学32:5978-5984)。芽孢杆菌RNA酶进一步能够特异性地结合到野生型芽孢杆菌RNA酶抑制剂(参见下文),其离解常数为10-12M或更低,优选的是离解常数为10-13M-10-14M的范围内(Schreiber和Fersht,1993,生物化学32:5145-5150;Hartley,1993,生物化学32:5978-5984)。Binase是由Bacillus intermedius分泌的胞外核糖核酸酶(Schulga等人,1992,NAR20:2375)并且还被认为是用于本发明的芽孢杆菌RNA酶。
为了方便起见,用于说明书或下文的实施例中的芽孢杆菌RNA酶命名为具有由pVE108编码的芽孢杆菌RNA酶的氨基酸序列(WO92/09696)。
芽孢杆菌RNA酶抑制剂是能够与分泌的芽孢杆菌RNA酶特异性结合的任何蛋白质,其解离常数为10-12M或更低,优选的是离解常数为10-13M-10-14M的范围内(Schreiber和Fersht,1993,生物化学32:5145-5150;Hartley,1993,生物化学32:5978-5984)。在标准条件以及等摩尔量的芽孢杆菌RNA酶抑制剂和分泌的芽孢杆菌RNA酶的混合物时,芽孢杆菌RNA酶抑制剂能够抑制至少50%,特别是至少75%,更特别是至少90%的分泌的芽孢杆菌RNA酶的活性(Hartley,1993,生物化学32:5978-5984)。芽孢杆菌RNA酶抑制剂是包括SEQ ID No 2的氨基酸序列或与具有该序列至少80%,优选的是至少85%的序列等同性。野生型的芽孢杆菌RNA酶抑制剂是由解淀粉芽孢杆菌产生的芽孢杆菌RNA酶抑制剂并且具有SEQ ID No 2的氨基酸序列(也参见Hartley,1988,分子生物学杂志202:913)。不用置疑本文使用的芽孢杆菌RNA酶抑制剂包括例如由Hartley描述的生物学活性芽孢杆菌RNA酶抑制剂突变体(1993,生物化学32:5978-5984)。
本文使用的芽孢杆菌RNA酶DNA(或芽孢杆菌RNA酶编码序列)是具有编码芽孢杆菌RNA酶的核苷酸序列的任何DNA片段。特别优选的芽孢杆菌RNA酶DNA是存在于pVE108的芽孢杆菌RNA酶DNA(WO92/09696)。芽孢杆菌RNA酶基因是植物可表达的嵌合基因,它包括可操作连接到合适的5’和3’调节区和包括植物聚腺苷酸化位点的3’区域的芽孢杆菌RNA酶DNA,所述调节区即包括由植物细胞的聚合酶识别的启动子的启动子区域。
本文使用的芽孢杆菌RNA酶抑制剂DNA(或芽孢杆菌RNA酶抑制剂编码序列)是具有编码芽孢杆菌RNA酶抑制剂的核苷酸序列的任何DNA片段。野生型芽孢杆菌RNA酶抑制剂DNA是编码野生型芽孢杆菌RNA酶抑制剂的DNA,它具有SEQ ID No 1的核苷酸序列(Hartley,1988,分子生物学杂志202:913)。芽孢杆菌RNA酶抑制剂基因是植物可表达的嵌合基因,它包括可操作连接到合适的5’和3’调节区和包括植物聚腺苷酸化位点的3’区域的芽孢杆菌RNA酶抑制剂DNA,所述调节区即包括由植物细胞的聚合酶识别的启动子的启动子区域。
如本文使用的,遗传基因座是在植物的核基因组,即在特定的染色体中的给定的基因的位置。两个基因座可以是在不同的染色体上,并且将独立分离。两个基因座可以位于相同的染色体上,那么通常被认为联锁(除非它们之间两个出现足够的重组)。
内源性基因座是天然存在于植物中的基因座。外源性基因座是由于借助于遗传转化导入外源DNA而在植物中形成的基因座。
在二倍体植物中,如在任何其它二倍体生物体中,两个拷贝的基因存在于任何常染色体的基因座。任何基因可以以几个变异状态存在于核基因组称作为等位基因。如果两个相同的等位基因存在于一个基因座,该基因座被称作为纯合子,如果存在不同的等位基因,该基因座称作为杂合子。一个基因座,或一套基因座的等位基因的组成是基因型。通常在一个基因座的任何等位基因以独立的标记表示(例如R和-,S和-,-代表没有基因)。通常外源基因座的特征在于存在和/或没有外源DNA。通常显性等位基因的特征为以大写字母表示,通常与生物学活性基因产物(例如蛋白质)和可观察到的表现型效果(例如R表示活性芽孢杆菌RNA酶抑制剂蛋白质的产生)的存在相关。
通过鉴别至少一个遗传基因座的等位基因状态能够对植物的遗传状态进行定性。
由存在于该基因座的两个等位基因的标记(例如R/R或S/-)命名任何给定的基因座的基因型。两个不连接的基因座的基因型能够表示为各个基因座的基因型的序列(例如S/-,R/-)
本文使用的术语雄性不育植物包含外源的“雄性不育基因座”,它含有雄性不育基因S,当该基因在植物细胞中表达时,使植物雄性不育,基本上不影响植物的生长和发育。
优选的是雄性不育基因座在相同的遗传基因座还包括至少一个第一标记基因,所述基因至少包括:
1)编码第一标记RNA,蛋白质或多肽的第一标记DNA,当至少存在于植物的特定的组织或特定的细胞中时,使植物易于与其它植物分离,所述其它植物至少在特定的组织或特定的细胞中不含有由第一标记DNA编码的第一标记RNA,蛋白质或多肽,和
2)能够指导第一标记DNA至少在特定的组织或特定的细胞中表达的第一标记启动子;第一标记DNA是相同于第一标记启动子和受其控制的转录单位。
所述雄性不育基因在这样的外源雄性不育基因座总是显性等位基因。隐性等位基因对应于在植物的核基因组中没有存在雄性不育基因。
以前已经描述了在本发明的第一亲代品系的雄性不育基因中可以使用的不育启动子(EP 0,344,029和EP0,412,911)。不育启动子可以是任何启动子,但是它至少应该在雄蕊细胞中是有活性的,特别是在毡绒层细胞中。特别有用的不育启动子是在雄蕊细胞中有选择性活性的,例如烟草的TA29基因的特异于毡绒层的启动子(EP0,344,029),该启动子可以用于烟草,油菜,莴苣,菊苣,棉花,水稻,小麦和其它植物种类;来自于水稻的PT72,PT42和PE1启动子,它可以用于水稻,玉米,小麦和其它植物种类(WO92/13956);来自于玉米的PCA55启动子,它可以用于玉米,水稻,小麦和其它植物种类(WO92/13957);和鼠耳芥的特异于毡绒层的基因的A9启动子(Wyatt等人,1992,植物分子生物学,19:611-922)。
本发明是基于发现:“恢复系能力”(恢复系有效地使各种各样的ms品系恢复雄性可育的能力和效力)与在恢复系植物的雄蕊中,特别是在毡绒层细胞中产生的芽孢杆菌RNA酶抑制剂的量直接相关(并且由于包含于被恢复的植物的雄蕊,特别是毡绒层细胞)。
恢复系的能力是重要的,因为有效的恢复系能够用于使各种各样的雄性不育系恢复雄性可育,其含量不同于在雄蕊中,特别是在毡绒层细胞中产生的芽孢杆菌RNA酶的量(由于雄性不育基因的表达)。在不同的ms品系中产生各种各样的芽孢杆菌RNA酶的一个来源是由于位置的影响,即由于在不同的转化体的核基因组中不同的插入位置ms基因的表达的变异。在不同的ms品系(在相同的遗传基因座含有ms基因)中产生的芽孢杆菌RNA酶的变异的另一个来源是不同的ms品系的不同的遗传背景。因此,当通过回交将来自于植物种类的一个品种的一个雄性不育品系的ms基因导入到相同(或密切相关)的植物种类的其它品种,以产生那些品种的ms品系时,ms基因被导入到不同的遗传背景,这会影响表达ms基因的水平。当考虑不同的恢复系植物中的恢复基因的表达的变异时-(所述变异可起源于如上文指出的相同来源,即在不同的恢复系品系中的可育性恢复系基因的位置影响和/或不同的恢复系品系的不同的遗传背景),进一步增加了所观察到的芽孢杆菌RNA酶产生的变异,和与此相关的可育性的恢复的问题。因此,为了获得具有良好的恢复系能力的恢复系品系,具有植物可表达嵌合芽孢杆菌RNA酶抑制剂基因是令人满意的,所述基因以高水平表达,以在植物的雄蕊细胞,特别是在花药细胞,尤其是在毡绒层细胞中产生大量的芽孢杆菌RNA酶抑制剂。
因此本发明提供了改进的芽孢杆菌RNA酶抑制剂DNA,在其它各点都相同的情况下,该DNA更有效地在植物细胞中表达-从而在那些细胞中它比野生型芽孢杆菌RNA酶抑制剂DNA产生更高水平的活性芽孢杆菌RNA酶抑制剂蛋白质,特别是改进的芽孢杆菌RNA酶抑制剂蛋白质。因此,在至少一个植物种类的植物中(和优选的是在几个植物种类,特别是几个单子叶植物种类的植物中)以平均高于用类似的包括野生型芽孢杆菌RNA酶抑制剂DNA的恢复系基因观察到的水平表达改进的可育性恢复系基因。平均的较高水平的表达是指在不同的遗传基因座和/或在不同的遗传背景含有本发明的可育恢复基因的不同的恢复系品系的特定的器官(例如花药)中产生的芽孢杆菌RNA酶抑制剂的量显著地高于在不同的遗传基因座和不同的遗传背景含有包括野生型芽孢杆菌RNA酶抑制剂DNA的类似的可育性恢复系基因不同的恢复系品系的雄蕊中产生的芽孢杆菌RNA酶抑制剂的量。
通常本发明提供“改进的”芽孢杆菌RNA酶抑制剂编码区,该编码区具有含有作为第二密码子的一个密码子的核苷酸序列,所述的密码子编码选自于下列组缬氨酸(Val),丙氨酸(Ala),天冬氨酸(Asp),谷氨酸(Glu)和甘氨酸(Gly)的一个氨基酸。特别优选的是该第二密码子编码丙氨酸。这些密码子以G起始,在位置+4(即芽孢杆菌RNA酶抑制剂编码序列的第二密码子的第一核苷酸)提供了最佳的转译起始位置。因此由改进的芽孢杆菌RNA酶抑制剂DNA编码的芽孢杆菌RNA酶抑制剂的N-末端由Met-Xaa组成,其中Xaa是Ala,Val,Gly,Glu或Asp,并且优选的是Ala(更优选的是由GCC密码子编码的Ala)。优选的是,改进的芽孢杆菌RNA酶抑制剂DNA编码在包括SEQ ID No.2的氨基酸残基3和90之间的氨基酸序列(对应于SEQ ID No.1的核苷酸7至270)的芽孢杆菌RNA酶抑制剂。改进的芽孢杆菌RNA酶抑制到DNA的例子是1)编码具有SEQ ID No.2的序列的芽孢杆菌RNA酶抑制剂的芽孢杆菌RNA酶抑制剂DNA,其中氨基酸序列的第二氨基酸(Lys)被上文定义的Xaa所替代,和2)编码具有SEQ ID No 4的氨基酸序列的芽孢杆菌RNA酶抑制剂的芽孢杆菌RNA酶抑制剂DNA。发现以非保守的方式修饰芽孢杆菌RNA酶抑制剂蛋白质的N-末端对芽孢杆菌RNA酶抑制剂的特定的生物学活性没有产生负面影响。事实上当在植物中表达时,特别是在单子叶植物(例如玉米,水稻和小麦)中表达时,这些改进的芽孢杆菌RNA酶抑制剂DNA通常产生更多的芽孢杆菌RNA酶抑制剂蛋白质,如通过雄蕊组织的Western印迹分析评估看到的。毡绒层细胞中产生的芽孢杆菌RNA酶抑制剂的提高是由于芽孢杆菌RNA酶抑制剂蛋白质的转译得到改进,而且其稳定性提高。
还发现对芽孢杆菌RNA酶抑制剂编码序列进行修饰以使该序列的%AT降低到低于40%导致产生改进的芽孢杆菌RNA酶抑制剂DNA,这样可以在植物细胞中,特别是在毡绒层细胞中大大提高产生的具有芽孢杆菌RNA酶抑制剂活性的蛋白质的水平。本文中所述的改进的芽孢杆菌RNA酶抑制剂编码序列通常被命名为“合成”的芽孢杆菌RNA酶抑制剂编码序列。
优选的是合成的芽孢杆菌RNA酶抑制剂DNA具有在大多数的植物种类中为优选的惯用的密码子,其中例如可以在恢复系品系中使用。对于大多数N植物种类X1,X2,.....XN优选的芽孢杆菌RNA酶抑制剂DNA的惯用的密码子是指对于存在一个密码子以上的各个氨基酸,在合成的芽孢杆菌RNA酶抑制剂DNA中编码该氨基酸的频率最高的密码子(该氨基酸的“芽孢杆菌RNA酶抑制剂密码子”),优选的是编码该氨基酸的每个密码子是在各个N/2以上的植物种类中,该密码子具有综合的频率为1)至少是最少使用的密码子的综合频率的两倍和/或2)大于最多使用的密码子的综合频率的一半。
还优选的是对于存在多个密码子的19个氨基酸的至少17,优选的是至少18,在合成的芽孢杆菌RNA酶抑制剂DNA中使用频率最高的密码子,优选的是每个密码子是在各个N植物种类中,该密码子的综合频率为1)至少是最少使用的密码子的综合频率的两倍和/或2)大于最多使用的密码子的综合频率的一半。实施例2描述了对于五个植物种类(N=5)即油菜,棉花,玉米,小麦和水稻,用最佳化的惯用密码子设计的特定的合成的芽孢杆菌RNA酶抑制剂DNA。
为了本发明的目的,使用了由Ikemura公开的对于各个植物种类的综合的密码子频率(Ikemura,1993,在“植物分子生物学Labfax”,Croy,ed.,Bios Scientific Publishers Ltd.,第37-48页)。
其中例如在恢复系中使用本发明的合成的芽孢杆菌RNA酶抑制剂DNA的优选的植物种类是油菜,棉花,玉米,水稻和小麦,特别是油菜,玉米和水稻,尤其是油菜和玉米。
合成的芽孢杆菌RNA酶抑制剂DNA优选的是其进一步特征在于具有低频率的CG二核苷酸和CNG三核苷酸,它们是在植物细胞中甲基化的靶。因此本发明的合成的芽孢杆菌RNA酶抑制剂DNA的特征为:
具有不超过7%的CG二核苷酸,优选的是具有不超过6%的CG二核苷酸,特别是具有5.5和6%之间的CG二核苷酸(在270-273碱基对的编码序列中,它是约15或16的CG核苷酸),和/或,
不超过9.5%的CNG三核苷酸(其中N是任何核苷酸),优选的是具有不超过9%的CNG三核苷酸,特别是具有8.5%和9%之间的CNG三核苷酸(在270-273碱基对的编码序列中,它是约23-25的CNG三核苷酸)。
优选的本发明的合成的芽孢杆菌RNA酶抑制剂DNA进一步的特征在于具有不超过7,优选的是不超过5,特别是不超过3个的由仅一个种类的核苷酸组成的四核苷酸(即AAAA,CCCC,GGGG,TTTT)和具有不超过2,优选的是不超过1个的由仅一个种类的核苷酸组成的五核苷酸(即AAAAA,CCCCC,GGGGG,TTTTT)。
本发明的合成的芽孢杆菌RNA酶抑制剂DNA包括编码野生型芽孢杆菌RNA酶抑制剂(SEQ ID No 2)的那些序列,例如具有由ATG引导的SEQ IDNo 3的位置7和273之间的核苷酸序列的芽孢杆菌RNA酶抑制剂DNA。但是,本发明的优选的合成的芽孢杆菌RNA酶抑制剂DNA是合成的芽孢杆菌RNA酶抑制剂编码序列,该序列编码具有以Met-Xaa起始的氨基酸序列的芽孢杆菌RNA酶抑制剂,其中Xaa是缬氨酸,丙氨酸,天冬氨酸,谷氨酸或甘氨酸,并且优选的是其中Xaa是丙氨酸。优选的合成的芽孢杆菌RNA酶抑制剂DNA是由ATGGNN引导,优选的是由ATGGCN引导(其中N是任何核苷酸)的SEQ ID No 3的位置7和273之间的核苷酸序列的DNA。特别优选的合成的芽孢杆菌RNA酶抑制剂DNA是具有SEQ ID No3的核苷酸序列的DNA。
优选的是,合成的芽孢杆菌RNA酶抑制剂编码序列和野生型芽孢杆菌RNA酶抑制剂编码序列编码具有至少80%序列等同性的芽孢杆菌RNA酶抑制剂蛋白质。
为了本发明的目的,两个相关的核苷酸序列(例如两个芽孢杆菌RNA酶抑制剂DNA)或氨基酸序列(即两个芽孢杆菌RNA酶抑制剂)的%序列等同性是指在两个最佳化校正序列中具有相同残基(×100)的位置的数量除以所比较的位置的数量。存在于一个序列但是不存在于另一个序列中的残基的排列中的位置,即空缺被认为具有非相同残基的位置。
包括本发明的合成的芽孢杆菌RNA酶抑制剂DNA的恢复系基因可以用于在不同的植物种类中产生恢复系,但是特别适用于在谷类,尤其是在玉米,水稻和小麦中产生恢复系。
因此本发明还提供了N-末端由Met-Xaa(其中Xaa如上文定义)组成的改进的芽孢杆菌RNA酶抑制剂蛋白质。特别优选的改进的本发明的芽孢杆菌RNA酶抑制剂包括SEQ ID No.2的残基3和90之间的序列(对应于SEQID No.1的核苷酸7至270),并且是例如:1)具有SEQ ID No.4的氨基酸序列的芽孢杆菌RNA酶抑制剂,和2)具有SEQ ID No.2的氨基酸序列的芽孢杆菌RNA酶抑制剂,其中第二氨基酸(Lys)被如上定义的Xaa所替代。
此外,不用说,可以对对应于SEQ ID No.2的残基3和90之间的序列(对应于SEQ ID No.1的核苷酸7至270)的这些优选的改进的芽孢杆菌RNA酶抑制剂区域进行修饰,只要总的氨基酸序列与SEQ ID No.2至少具有80%,优选的是至少具有85%,特别是至少具有90%的序列相似性,并且只要在标准条件下改进的芽孢杆菌RNA酶抑制剂能够抑制至少50%,优选的是至少75%,特别是至少90%的分泌的芽孢杆菌RNA酶的活性。
如上说明的,在芽孢杆菌RNA酶抑制剂蛋白质的N-末端的修饰(即导入由Met-Xaa组成的N-末端)是非保守的修饰,但是当在植物细胞中生产它们时它对本发明的改进的芽孢杆菌RNA酶抑制剂的特定的生物学活性没有负面的影响。这由实施例6的SEQ ID No.4的改进的芽孢杆菌RNA酶抑制剂所举证。
因此本发明还提供了可育性恢复基因,其特征在于它们含有本发明的改进的和/或合成的芽孢杆菌RNA酶抑制剂DNA,并且可以用于生产植物种类的改进的转基因恢复系植物,即具有良好的恢复能力的恢复系植物。不用说,可育性恢复基因的芽孢杆菌RNA酶抑制剂DNA与其它编码序列融合在一起转译,以便作为融合蛋白的一部分进行表达。
原则上,在本发明的恢复系植物中可以使用任何启动子作为可育性恢复基因的恢复系启动子。唯一的前提是含有可育性,恢复系基因的这样的恢复系植物能够恢复雄性不育品系的可育性即能够产生恢复的植物(包括雄性不育基因和可育性恢复基因),所述植物的表现型是正常的并且雄性可育。这要求可育性恢复基因中的恢复启动子应该至少是在植物的雄蕊细胞中具有活性的,所述植物中相应的雄性不育基因的不育启动子能够指导芽孢杆菌RNA酶DNA的表达。关于这一点,优选的是不育性启动子和恢复启动子是相同的(例如两个TA29启动子或两个CA55启动子)。但是,不育性启动子可以是仅在毡绒层细胞中有活性的,而恢复启动子在其它细胞中也是有活性的。例如,不育性启动子可以是雄蕊选择性的(例如TA29启动子或CA55启动子),而恢复启动子是组成型启动子例如35S-tap启动子,它是被修饰后在毡绒层细胞中有活性的35S启动子(van der Meer等人,1992,植物细胞4:253-262)。
当然,本发明的改进的恢复系DNA除了用于恢复植物的雄性可育,还可以用于其它目的。关于这一点,本发明的改进和/或合成的芽孢杆菌RNA酶抑制剂DNA可以在任何情况下使用,可以用于中和植物细胞的芽孢杆菌RNA酶活性,例如在EP 0412911,WO93/19188,WO92/21757,WO93/25695和WO95/02157中描述的。为了上述应用,可以将芽孢杆菌RNA酶抑制剂DNA置于更适合的其它启动子的转录控制下,可以使用类似于35S启动子和农杆菌T-DNA的烟脂碱合成酶基因的启动子。还可以使用基本的启动子(即基本上仅含有TATA盒没有其它调节增强子元件的植物启动子),甚至可以使用本发明的芽孢杆菌RNA酶抑制剂DNA,完全没有启动子(例如当计划在转化植物细胞中在内源性启动子控制下转录芽孢杆菌RNA酶抑制剂DNA时)。
用于恢复系植物中的可育性恢复基因R优选的是还包括至少第二标记基因,它至少包括:
1)编码第二标记RNA,蛋白质或多肽的第二标记DNA,当至少存在于植物的特定的组织或特定的细胞中时,使植物易于与其它植物分离,所述其它植物至少在特定的组织或特定的细胞中不含有由第二标记DNA编码的第二标记RNA,蛋白质或多肽,和
2)能够指导第二标记DNA至少在特定的组织或特定的细胞中表达的第二标记启动子;第二标记DNA是相同于第二标记启动子和受其控制的转录单位。
因此本发明的恢复系植物含有外源的“恢复系基因座”,它含有包括本发明的改进的恢复系DNA的恢复系基因R。
优选的恢复系基因座在相同的遗传基因座还包括至少一个第二标记基因。
优选的本发明的恢复系植物是单子叶恢复系植物,优选的是玉米,水稻或小麦植物,它们从其离体的花朵(例如水稻和小麦的圆锥花序,玉米的穗状花序-参见实施例4)提取的每毫克总蛋白平均产生至少10纳克,优选的是至少20纳克,特别是至少40纳克(且至多100至200纳克)的芽孢杆菌RNA酶抑制剂。
尤其优选的本发明的恢复系植物将产生本发明的改进的芽孢杆菌RNA酶抑制剂,特别是具有SEQ ID No 4的氨基酸序列的芽孢杆菌RNA酶抑制剂。
可以用于本发明的第一和第二标记基因的第一和第二标记DNA和第一和第二标记启动子也是熟知的(EP0344029;EP0412911)。关于这一点,优选的是第一和第二标记DNA是不同的,尽管第一和第二标记启动子可以是相同的。
优选的是提供的外源DNA例如可育性恢复系基因,雄性不育基因,或第一或第二标记基因在它们的编码序列的下游(即3’)具有合适的3’转录调节序列和聚腺苷酸化信号,即分别是可育性恢复系DNA,雄性不育DNA,或第一或第二标记DNA。关于这一点,可以使用适用于获得嵌合基因的表达的外源转录3’末端的形成和聚腺苷酸化信号。例如,可以使用基因例如基因7(Velten和Schell(1985)核酸研究13:6998),章鱼碱合成酶基因(De Greve等人,1982,J.Mol.Appl.Genet.1:499;Gielen等人(1983)EMBO J.3:835;Ingelbrecht等人,1989,植物细胞1:671)和根癌农杆菌Ti质粒的T-DNA区域的烟脂碱合成酶基因(DePicker等人,1982,J.Mol.Appl.Genet.1:561),或苯基苯乙烯酮合成酶基因(Sommer和Saedler,1986,Mol.Gen.Genet.202:429-434),或CaMV19S/35S转录单位(Mogen等人,1990,植物细胞2:1261-1272)的外源的3’未转译末端。
可育性恢复系基因,雄性不育基因,或本发明的第一或第二标记基因通常是外源DNA,优选的是外源嵌合DNA。关于这一点对于这样的DNA的“外源”和“嵌合”具有相同于EP 0344029和EP0412911描述的含义。
利用去臂的并且由农杆菌携带的Ti质粒可以转化植物细胞,特别是能够被农杆菌感染的植物例如大多数双子叶植物(例如欧洲油菜)和一些单子叶植物,所述载体含有雄性不育基因或可育性恢复系基因。利用在EP0116718和EP0270822中描述的程序可以实施这样的转化。优选的Ti质粒载体含有Ti质粒的T-DNA的边界序列之间的外源DNA,或至少定位于右边界序列的左边的外源DNA。当然,利用例如直接的基因转移(例如如EP0233247描述的),花粉介导的转化(例如在EP0270356,PCT专利公开“WO”85/01856,和美国专利4684611中描述的),植物RNA病毒介导的转化(例如在EP0067553和美国专利4407956中描述的)和脂质体介导的转化(例如在美国专利4536475中描述的),可以使用其它类型的载体以转化植物细胞。利用由此获得的能够形成坚实的成胚愈伤组织(例如玉米的未成熟的胚)或成胚愈伤组织(例如玉米的I型愈伤组织)的受伤的或酶降解的完整组织,可以转化(例如通过电穿孔)单子叶植物的细胞例如大多数谷类包括玉米,水稻,小麦,燕麦和大麦,例如在WO92/09696中描述的。如果待转化的植物是玉米,还可以使用其它近年来研制的方法,例如由Fromm等人,1990,生物/技术8:833;Gordon-Kamm等人,1990,生物/技术2:603和Gould等人,1991,植物生理学95:426描述的对于某些玉米的品系的方法。如果待转化的植物是水稻,还可以使用其它近年来研制的方法,例如由Shimamoto等人,1989,自然学338:274;Datta等人,1990,生物/技术8:736和Hayashimoto等人,1990,植物生理学93:857描述的对于某些水稻品系的方法。
将待转化的细胞再生为成熟的植物,可以将获得的转化植物用于常规的育种计划以产生多种具有相同特征的转化植物或在相同的相关的植物种类的其它品种中导入雄性不育基因,或可育性恢复系基因。从转化的植物获得的种子含有作为稳定的基因组插入物的本发明嵌合基因。因此,当导入到植物种类的特定的品系或品种时,通过回交总是可以将本发明的雄性不育基因或可育性恢复系基因导入到任何其它品系或品种。
当然当使该编码DNA的惯常密码子对于一系列的植物种类最佳化时,如用于制备本发明的合成的芽孢杆菌RNA酶抑制剂DNA,上面描述的用于降低编码DNA的AT含量的方法也可以应用到在许多植物种类中需要其最佳表达的任何编码序列。关于这一点,例如该方法可用于编码杀虫蛋白的苏云金芽孢杆菌的基因,例如全长的和截断的Crylab和Cry9C基因(EP0193259;EP 0654075)。
除非另有说明,通过在Sambrook等人,1989,“分子克隆:实验手册”,冷泉港实验室,和Ausubel等人,1994,“当前的分子生物学方案”,John Wiley&Sons描述的标准的程序实施操作重组DNA的所有实验程序。
将聚合酶链反应(“PCR”)用于克隆和/或扩增DNA片段。使用具有重叠延伸的PCR以构建嵌合基因(Horton等人,1989,基因77:61-68;Ho等人,1989,基因77:51-59)。
使用的PCR反应都是在常规条件下,利用VentTM聚合酶完成的(Cat.No.254L-Biolabs New England,Beverley,MA 01915,美国),所述聚合酶是从Thermococcus litoralis分离到的(Neuner等人,1990,Arch.Microbiol.153:205-207)。根据已知的由Kramer和Fritz概括的规则设计寡核苷酸(1987,酶学方法154:350),在Applied Biosystems 380ADNA合成仪(Applied Biosystems B.V.,Maarssen,Netherlands)上采用phosphoramidite方法(Beaucage和Caruthers,1981,Tetrahedron Letters22:1859)合成。
在说明书和下面的实施例中,参照下面的序列表和附图:
序列表
SEQ ID No 1:野生型芽孢杆菌RNA酶抑制剂DNA
SEQ ID No 2:野生型芽孢杆菌RNA酶抑制剂
SEQ ID No 3:合成的芽孢杆菌RNA酶抑制剂DNA
SEQ ID No 4:改进的芽孢杆菌RNA酶抑制剂
SEQ ID No 5:质粒pMV71
SEQ ID No 6:质粒pLH43的相关部分
SEQ ID No 7:质粒pTTS24的T-DNA
SEQ ID No 8:寡核苷酸CASOLX1
SEQ ID No 9:寡核苷酸CASOLX2
SEQ ID No 10:质粒pLH48
在参照这些核苷酸和氨基酸序列时,应该注意到位置X和Y之间的序列(或另一种可选的方法从位置X到位置Y的序列)是包括在位置X和Y的残基的序列。
利用在序列表中使用的缩写命名功能性DNA元件。
实施例
实施例1:改进的芽孢杆菌RNA酶抑制剂DNA的制备
通过位点特异性诱变在野生型芽孢杆菌RNA酶抑制剂的第一密码子(ATG)和第二密码子(AAA)之间插入丙氨酸密码子GCC而制备改进的芽孢杆菌RNA酶抑制剂DNA。因此改进的芽孢杆菌RNA酶抑制剂DNA编码改进的芽孢杆菌RNA酶抑制剂,当与野生型芽孢杆菌RNA酶抑制剂比较时,改进的芽孢杆菌RNA酶抑制剂具有改变的N-末端,它由Met-Ala-Lys组成(而不是野生型芽孢杆菌RNA酶抑制剂中的Met-Lys)。N-末端的非保守修饰不会影响植物细胞中改进的芽孢杆菌RNA酶抑制剂的生物学活性(参见实施例6)。
实施例2:合成的芽孢杆菌RNA酶抑制剂DNA的合成和制备
根据下列标准设计编码实施例1的改进的芽孢杆菌RNA酶抑制剂的合成的芽孢杆菌RNA酶抑制剂DNA:
-在合成的芽孢杆菌RNA酶抑制剂中A和T核苷酸的百分数应该低于40%(野生型芽孢杆菌RNA酶抑制剂DNA具有51.6的%AT)。AT丰富的基因具有包括聚腺苷酸化信号和内含子识别序列的较高的可能性,它能阻止或降低特别是长编码序列(例如Bt编码序列)在植物细胞中的表达。
-尽管C和G核苷酸的增加,CG二核苷酸和CNG三核苷酸的量应该尽可能低。这是因为CG二核苷酸和CNG三核苷酸是甲基化的靶,它可以在植物细胞中使基因失活。
-惯用密码子应该尽可能地在许多种类的植物中最佳化,特别是在油菜,棉花,玉米,水稻和小麦中。因此,对于各个氨基酸,选择在芽孢杆菌RNA酶抑制剂DNA中优选使用的一个密码子(或几个密码子),在大多数植物种类中,所述密码子具有的频率至少是最少使用的密码子的频率的两倍以上和/或至少是最多使用的密码子的频率的一半以上。因此,对于各个植物种类和对于各个氨基酸,制作一个密码子表,其中具有的频率至少是在所述植物种类中最少使用的密码子的频率的两倍以上和/或至少是在所述植物种类中最多使用的密码子的频率的一半以上(将符合该标准的密码子命名为所述植物种类的最佳密码子)。在大多数植物种类中是最佳密码子的密码子称作为在合成的芽孢杆菌RNA酶抑制剂DNA中所述氨基酸的优势密码子,优选的是唯一的密码子。
方便的是,在该分析中使用的密码子的频率是所列出的那些(上文)。
-避免大于4个相同核苷酸以上的延伸。
因此获得了具有SEQ ID No.3的核苷酸序列的合成的芽孢杆菌RNA酶抑制剂DNA。这种合成的芽孢杆菌RNA酶抑制剂DNA具有38.4的%AT,不过仅含有16CG二核苷酸和24CNG三核苷酸。合成的芽孢杆菌RNA酶抑制剂DNA不含有潜在的植物聚腺苷酸化信号或内含子拼接位点。合成的芽孢杆菌RNA酶抑制剂DNA的惯用密码子似乎适合于在至少油菜,棉花,玉米,水稻和小麦中表达(表1)。对于其中存在多个密码子的18个氨基酸,在合成的芽孢杆菌RNA酶抑制剂DNA中17个氨基酸优选地被在这五个植物种类的各个中是最佳密码子的一个密码子所编码。事实上,在这五个植物种类的至少三个中,所有的存在多个密码子的氨基酸在合成的芽孢杆菌RNA酶抑制剂DNA中优选地被一个最佳密码子所编码。
合成芽孢杆菌RNA酶抑制剂DNA只含有1CCCCC和1GGGG延伸。
为了克隆的目的,SEQ ID No.3的合成的芽孢杆菌RNA酶抑制剂使用下面的唯一的限制性位点:NcoI,BspE1和Kasl。
实施例3:改进的芽孢杆菌RNA酶抑制剂DNA在玉米细胞中的表达
用包被了质粒pLH43或质粒pMV71的微弹(金颗粒),用Bio-Rad PDS-1000/HE颗粒枪(Bio-Rad实验室,Hercules,加里福尼亚,美国)轰击培养的Black Mexican Sweet(BMS)玉米细胞,如下所述。
将BMS悬浮细胞置于合适的滤膜,并且用常规程序进行轰击(Kirihara,1994,“玉米手册”,Freeling和Walbot,Springer Verlag,第690-694页),所述程序进行了包括渗透压预处理的修饰(Russel等人,1992,体外28:97-105)。利用由供应商手册描述的程序,用含有5∶1比例的芽孢杆菌RNA酶抑制剂DNA和质粒pAct1-D的合适的质粒DNA的混合物包被金颗粒(McElroy等人,1990,植物细胞2:163-171)。pAct1-D是含有gus基因(编码β-葡糖苷酸酶)的质粒,所述基因处于水稻肌动蛋白基因的启动子的控制下,所述基因基本上具有描述于SEQ ID No.5的位置1999到3400之间的序列。
对于各个质粒,轰击2-3个滤膜。轰击以后24小时,收集来自于各个滤膜的细胞,通过在液氮中研磨捕获。将各个滤膜的捕获的细胞分为二等份,一份用于芽孢杆菌RNA酶抑制剂检测,另一份用于GUS检测。
来自于各个轰击的滤膜的被捕获细胞的一半,在提取缓冲液(50mMTris/HCl pH 7.5,5%甘油,100mM KCl,1mM benzamidin.HCl,5mM e-氨基-n-己酸,10mM EDTA,10mM EGTA,1微克/毫升抗蛋白酶,1微克/毫升亮抑蛋白酶肽,14mM β-巯基乙醇,1.5%聚乙烯基聚吡咯烷酮,1mM PMSF)中提取总可溶性细胞蛋白质。采用Bio-RadBradford检测试验测定蛋白质的浓度。每个样品的50微克的蛋白质装载于18%SDS-聚丙烯酰胺凝胶并且通过电泳进行分离。将0.1,0.5,2.5,和5纳克的纯化的芽孢杆菌RNA酶抑制剂装载于凝胶上作为阳性对照。
然后利用TGM-缓冲液(25mM Tris pH8.3,192mM甘氨酸,20%v/v甲醇),以60V进行2小时,将蛋白质电吸印到Hybond C。然后将滤膜在0.5%PBS-吐温20中首先保温2小时,然后在一级抗体的溶液(在PBS-0.5%吐温20中1/1000稀释的多克隆兔IgG抗-芽孢杆菌RNA酶抑制剂抗体)中保温过夜。然后将滤膜在PBS中洗涤4次,每次5分钟,然后在驴抗兔IgG,辣根过氧化物酶连接(Amersham,Buckinghamshire,英国)的在PBS-0.5%吐温20中1/1000稀释的溶液中保温1小时。然后再将滤膜在PBS中洗涤4次,每次5分钟,然后利用ECL检测系统(Amersham)检测蛋白质。通过放射自显影的密度计扫描测定芽孢杆菌RNA酶抑制剂的量。
平行试验,采用荧光团检测方法,检测在从各个轰击的滤膜获得的另-半捕获细胞提取的蛋白质中β-葡糖苷酸酶的活性(Jefferson,1987,植物分子生物学报道5:387-405)。
通过比较每(任意的)单位GUS活性中芽孢杆菌RNA酶抑制剂的量确定特定的质粒产生的芽孢杆菌RNA酶抑制剂。
pMV71是具有SEQ ID No.5的核苷酸序列的质粒,并且含有实施例1的改进的芽孢杆菌RNA酶抑制剂DNA。将该变异体芽孢杆菌RNA酶抑制剂DNA可操作连接到水稻肌动蛋白启动子和农杆菌T-DNA的胭脂碱合成酶3’未转译末端。
pLH43是具有SEQ ID No.5的核苷酸序列的质粒,其中核苷酸3399和4021之间的序列被SEQ ID No.6的核苷酸序列替代。pLH43含有可操作连接到水稻肌动蛋白启动子和农杆菌T-DNA的胭脂碱合成酶3’未转译末端的实施例2的合成的芽孢杆菌RNA酶抑制剂DNA(SEQ ID No.3)。
pTS410是具有SEQ ID No.5的核苷酸序列的质粒,其中核苷酸3404到3406(即pMV71的芽孢杆菌RNA酶抑制剂DNA的第二密码子)已被缺失。
上面实验的结果列于表2,其中显示来自于各个轰击试验的测定结果。当与在pTS410的野生型芽孢杆菌RNA酶抑制剂DNA导入后产生的(野生型)芽孢杆菌RNA酶抑制剂蛋白质相比,易于看到pMV71和pLH43的改进的芽孢杆菌RNA酶抑制剂DNA的导入平均导致显著高地产生(改进的)芽孢杆菌RNA酶抑制剂蛋白质。另外,可以看到,当与在pMV71的改进的芽孢杆菌RNA酶抑制剂DNA导入后产生的(也改进的)芽孢杆菌RNA酶抑制剂蛋白质相比,在玉米细胞中导入pLH43的改进的合成芽孢杆菌RNA酶抑制剂DNA导致在那些细胞中显著高地产生(改进的)芽孢杆菌RNA酶抑制剂蛋白质。
实施例4:改进的芽孢杆菌RNA酶抑制剂DNA在水稻植物中的表达
利用质粒pTS172,基本上如WO 92/13956描述的,获得了四个转基因的雄性不育水稻的栽培品种Kochihibiki品系。质粒pTS172含有下面的嵌合基因:P35S-bar-3’g7和PE1-芽孢杆菌RNA酶-3’nos并且可以通过将用BstEII和MscI消化的pTS173的大片段连接到pJVR2-E1的小BstEII-MscI片段上从pTS173(见下)获得。这些品系被命名为K104,K107,K109和K111。
基本上按照WO 92/13956描述的方法,利用质粒pTS173获得7个转基因的雄性可育的恢复系水稻植物Chiyonishiki栽培品种。所述质粒含有下面的嵌合基因:P35S-bar-3’g7和PE1-野生型芽孢杆菌RNA酶抑制剂-3’nos。通过用35S启动子和pTTS24的嵌合bar基因的3’未转译末端替代35S启动子和pJVR3-E1的嵌合bar基因的3’未转译末端,可从pJVR3-E1衍生pTS173(WO 92/13956)。从质粒pTTS24的T-DNA插入物(SEQ ID No.7),利用寡核苷酸引物CASOLX1(SEQ IDNo.8),它重叠bar基因的KpnI位点,和CASOLX2(SEQ ID No.9),采用PCR扩增含有T-DNA基因7的3’末端的DNA片段。用AatII和KpnI切割PCR产物,并且连接到用AatII和KpnI切割的质粒pJVR3-E1的大片段上。从该获得的质粒,通过由来自于pTTS24(SEQ ID No.7的位置880到2281)的相应的NcoI-NotI片段替代较小的NcoI+NotI片段(含有P35S),导致产生pTS173。
获得的品系命名为C111,C113,C117,C118,C120,C121和C125。因此所有这些植物含有处于E1启动子控制下的SEQ ID No.1的野生型芽孢杆菌RNA酶抑制剂DNA(WO 92/13956)。
利用农杆菌介导的受伤的坚实的成胚愈伤组织(从水稻栽培品种Kochihibiki未成熟的胚获得的)的转化获得32个另外的恢复系植物(WO92/09696)。用于转化的农杆菌菌株是从其野生型Ti-质粒恢复的并且含有质粒pGV4000和pTTS24的Ach5菌株(Genetello等人,1977,自然学265:561-563)。pTTS24是中间体克隆载体,它在其必要的特性上类似pGSC1700(Cornelissen和Vandewiele,1989,NAR 17:19-29),但是由于缺失β-内酰胺酶基因和含有具有SEQ ID No.7的核苷酸序列的T-DNA,其主要部分不同于pGSC1700。pGV4000是去臂的Ti-质粒,它来自于pMP90(Koncz和Schell,1986,Mol.Gen.Genet.204:383-396)并且含有允许与pTTS24的相应的区域同源重组的区域。
将所有含有实施例2的处于E1启动子的控制下的合成的芽孢杆菌RNA酶抑制剂DNA(SEQ ID No.3)的这些植物命名为“OSC”数,如在表3中使用的。
在所有恢复系品系中测定芽孢杆菌RNA酶抑制剂蛋白质的量。每个品系在液氮中研碎单个植物的1-2个未成熟的圆锥花序(即圆锥花序,其中大多数的小穗约为3.5-4.5毫米长)。如实施例3描述的方法提取和检测蛋白质。
结果概括于表3。可以看到含有SEQ ID No.3的芽孢杆菌RNA酶抑制剂DNA的恢复系品系产生的芽孢杆菌RNA酶抑制剂明显高于含有SEQID No.1的芽孢杆菌RNA酶抑制剂DNA的那些品系。
芽孢杆菌RNA酶抑制剂mRNA的量直接与圆锥花序中芽孢杆菌RNA酶抑制剂蛋白质的量相关得到证实(数据没有显示)。进一步证实芽孢杆菌RNA酶抑制剂蛋白质的产生有效地限制到圆锥花序的花(数据没有显示)。
选定的恢复系品系与四个雄性不育品系杂交。观察到恢复系品系的恢复能力与所述花中产生的芽孢杆菌RNA酶抑制剂蛋白质的量相关。观察到每毫克提取的蛋白质产生4和10纳克芽孢杆菌RNA酶抑制剂之间的品系能够部分恢复微孢子的发育为雄性不育品系,在这种意义上,“恢复系植物”产生非存活的花粉(雄性不育植物完全不产生花粉)。对于所有检测的雄性不育品系观察到每毫克提取的蛋白质产生50纳克或更多的芽孢杆菌RNA酶抑制剂的恢复系品系能够完全恢复可育性,即在自我授粉后,所有恢复的子代植物产生完全存活的和有功能的花粉,和正常的种子。
选定的恢复系品系也是自我授粉的并且从转基因子代植物收集到未成熟的圆锥花序。如由所产生的芽孢杆菌RNA酶抑制剂的量测定的表达水平至少等于,和在许多植物中大于在初级转化中测定的量。通常,这些观察结果证实芽孢杆菌RNA酶抑制剂表达水平稳定地转移到子代植物。
实施例5:改进的芽孢杆菌RNA酶抑制剂DNA在玉米植物中的表达
基本上按照WO 92/13956描述的方法,利用质粒pVE108获得命名为MS3的转基因雄性不育玉米品系。
基本上按照WO95/34634描述的方法获得含有处于TA29启动子(EP344,029)或CA55启动子(WO92/13957)控制下的SEQ ID No 1的野生型芽孢杆菌RNA酶抑制剂DNA的几个转基因雄性可育恢复系玉米植物。特别是,通过用质粒pCOL100和pDE110(WO 92/34634)转化玉米获得七个恢复系品系,pDE110含有可操作连接到如SEQ ID No 1描述的芽孢杆菌RNA酶抑制剂DNA上的TA29启动子。当与MS2植物杂交时,恢复是不完全的,因为最多75%的花药产生存活的花粉(这证明MS3品系特别难于恢复,因为用其它雄性不育品系获得了良好的恢复程度-数据未显示)。
类似地,通过用质粒pLH48(与选自于pCOL9S或PLH52或p35S-Bperu或pCOL11(WO92/34634)的质粒一起)转化玉米获得了六个转基因恢复系玉米品系。这些恢复品系都至少含有处于TA29启动子控制下的实施例2的合成的芽孢杆菌RNA酶抑制剂DNA(SEQ ID No 3)。六个恢复品系与MS3植物杂交,对于四个恢复品系观察到完全恢复。将这四个恢复系品系之一命名为RZM583-0101。
由转基因品系RZM583-0101给转基因品系MS3授粉,通过PCR筛选识别含有嵌合芽孢杆菌RNA酶基因和嵌合芽孢杆菌RNA酶抑制剂基因的子代植物。将那些可育性恢复的子代植物用于给MS3植物授粉。在该最后的杂交的90个子代植物中,识别出15个植物(通过定量的Southern印迹分析)为MS3的嵌合芽孢杆菌RNA酶基因的纯合子。在这些中,不含有RZM583-0101的嵌合的芽孢杆菌RNA酶抑制剂基因的植物是雄性不育的,而含有RZM583-0101的嵌合的芽孢杆菌RNA酶抑制剂基因的那些植物是完全雄性可育的。这证实了由包括改进的合成的芽孢杆菌RNA酶抑制剂DNA的嵌合的芽孢杆菌RNA酶抑制剂基因可以完全恢复在纯合条件下含有嵌合的芽孢杆菌RNA酶基因的植物的可育性。
因此,可以总结出,含有改进的合成的芽孢杆菌RNA酶抑制剂DNA的恢复品系具有显著好的恢复能力。
基本上按照实施例3描述的方法测定子代恢复系植物的未成熟穗状雄花(包括单核阶段的微孢子)的芽孢杆菌RNA酶抑制剂的量。观察到在含有改进的合成芽孢杆菌RNA酶抑制剂DNA的恢复系植物的穗状雄花中芽孢杆菌RNA酶抑制剂蛋白质的量显著地高于含有野生型芽孢杆菌RNA酶抑制剂DNA的恢复系植物的穗状雄花中芽孢杆菌RNA酶抑制剂蛋白质的量。例如在含有野生型芽孢杆菌RNA酶抑制剂DNA的植物中,测定芽孢杆菌RNA酶抑制剂蛋白质的量低于20纳克芽孢杆菌RNA酶抑制剂/毫克总蛋白。相反,在含有改进的合成芽孢杆菌RNA酶抑制剂DNA的两个品系中,测定未成熟的穗状雄花的芽孢杆菌RNA酶抑制剂蛋白质的量分别是210和100纳克芽孢杆菌RNA酶抑制剂/毫克总蛋白。
实施例6:在油菜的雄蕊细胞中生产时野生型芽孢杆菌RNA酶抑制剂和改进的芽孢杆菌RNA酶抑制剂的活性
利用农杆菌介导的转化,用质拉pTHW118或pTTS139转化油菜植物(栽培品种Drakkar)。质粒pTHW118含有处于TA29启动子控制下的野生型芽孢杆菌RNA酶抑制剂DNA(SEQ ID No 1)。质粒pTTS139含有包括野生型的芽孢杆菌RNA酶抑制剂DNA的第一和第二密码子之间的附加的GCC丙氨酸密码子的改进的芽孢杆菌RNA酶抑制剂DNA。因此,pTTS139中的芽孢杆菌RNA酶抑制剂DNA编码SEQ ID No 4的改进的芽孢杆菌RNA酶抑制剂蛋白质。
用pTHW118转化的两个油菜品系,分别命名为DBN 366-0011和DBN 366-0029,用pTTS139转化的两个油菜品系分别命名为DBN 342-1010和DNB 367-0035,选择上述品系进行定量分析。
从所述植物分离长度约为3-4毫米的油菜花芽,并且在液氮中研碎。提取蛋白质,基本上按照实施例3描述的方法,测定提取的总蛋白质的量,以及采用Western印迹可检测的芽孢杆菌RNA酶抑制剂的量。表4显示了在各个品系中存在可提取的总蛋白质的量(栏4)和芽孢杆菌RNA酶抑制剂的量(栏2)。
基本上按照Fitzgerald和Hartley描述的方法(1993,见上文)测定芽孢杆菌RNA酶抑制剂的活性。向600微升的TE缓冲液(10mM Tris/HClpH8.0;1mM EDTA)中加入
-20微升的含有10微克/毫升牛血清白蛋白和0.1微克/毫升的芽孢杆菌RNA酶的0.02M乙酸铵pH8.0溶液,
-“ X”微升的5倍稀释的从花芽提取的蛋白质(“X”分别是0,4,8,12,16,20)。
在混合和等待约1分钟之后,加入6微升的10倍稀释的含有溶于TE缓冲液中的0.4微克/毫升的聚乙烯醇腺苷磷酸的原液。
将最后的溶液混合并且立即转移到透明小容器,记录1-2分钟内荧光的增加。
以起始时荧光的增加值/分钟相对于“X”(含有芽孢杆菌RNA酶抑制剂溶液的体积)作图。在各种情况下,如预期的获得了线性关系。计算X-轴的隐性品系的截距(表4,栏3):这代表“X”的体积,它含有足够的芽孢杆菌RNA酶抑制剂以完全中和2纳克的芽孢杆菌RNA酶(即含有芽孢杆菌RNA酶抑制剂的摩尔量的体积,它相当于2纳克的芽孢杆菌RNA酶)。由此可以测定花芽中“活性”芽孢杆菌RNA酶抑制剂的量(表4,栏5),以及“活性”芽孢杆菌RNA酶抑制剂与由Western印迹测定的总芽孢杆菌RNA酶抑制剂蛋白质的比例(表4,栏6)。
根据这些比例,能够推导出改进的芽孢杆菌RNA酶抑制剂的活性至少相当于野生型芽孢杆菌RNA酶抑制剂的量。但是,在用pTHW118转化的品系(表达野生型芽孢杆菌RNA酶抑制剂)中,平均比例是0.27(标准偏差0.08),而在用pTTS139转化的品系中,平均比例是0.39(标准偏差0.08)。两个品系类型的平均比例之间的差异在统计学上是显著的(t=-26,p<0.005)。根据这一点,能够总结出当在油菜花芽中产生时,与野生型芽孢杆菌RNA酶抑制剂相比,改进的芽孢杆菌RNA酶抑制剂通常产生较高水平的活性芽孢杆菌RNA酶抑制剂。
本申请中引用的所有出版物均引入本文作为参考。
表1
氨基酸b) |
芽孢杆菌RNA酶抑制剂密码子c) | Nrd) |
植物a) |
油菜 |
棉花 |
玉米 |
水稻 |
小麦 |
Leu |
CTC |
9 |
+ |
+ |
+ |
+ |
+ |
CTT |
2 |
+ |
+ |
+ |
+ |
+ |
TTG |
1 |
+ |
+ |
+ |
+ |
+ |
Ser |
AGC |
4 |
+ |
+ |
+ |
+ |
+ |
TCC |
1 |
+ |
+ |
+ |
+ |
+ |
Arg |
AGG |
3 |
+ |
+ |
+ |
+ |
+ |
Thr |
ACC |
4 |
+ |
+ |
+ |
+ |
+ |
Pro |
CCC |
1 |
+ |
- |
+ |
+ |
- |
CCG |
1 |
+ |
- |
+ |
+ |
- |
Ala |
GCC |
6 |
+ |
+ |
+ |
+ |
+ |
GCT |
1 |
+ |
+ |
+ |
+ |
+ |
Gly |
GGC |
3 | |
+ |
+ |
+ |
+ |
GGT |
1 |
+ |
+ |
- |
- |
- |
GGG |
1 |
+ |
+ |
- |
- |
+ |
Val |
GTG |
4 |
+ |
+ |
+ |
+ |
+ |
GTC |
1 |
+ |
+ |
+ |
+ |
+ |
Lys |
AAG |
6 |
+ |
+ |
+ |
+ |
+ |
Asn |
AAC |
3 |
+ |
+ |
+ |
+ |
+ |
Gln |
CAG |
5 |
+ |
+ |
+ |
+ |
+ |
CAA |
1 |
+ |
+ |
+ |
+ |
+ |
His |
CAC |
1 |
+ |
+ |
+ |
+ |
+ |
Glu |
GAG |
11 |
+ |
+ |
+ |
+ |
+ |
Asp |
GAC |
4 |
+ |
+ |
+ |
+ |
+ |
Tyr |
TAC |
3 |
+ |
+ |
+ |
+ |
+ |
Cys | TGC | 2 | + | + | + | + | + |
Phe |
TTC |
2 |
+ |
+ |
+ |
+ |
+ |
Ile |
ATC |
6 |
+ |
+ |
+ |
+ |
+ |
a)+:表示在选定的植物中,密码子是该植物中的最佳密码子,即在所述植物中该密码子的频率至少为该植物中最低频率的密码子的频率的两倍和/或至少是该植物中最多使用的密码子的频率的50%。在该植物种类中密码子的频率是由Ikemura列出(千分之)的那些(见上文)
-:表示在选定的植物中,该密码子在如上定义的植物中不是最佳密码子
b)存在多个密码子的氨基酸(不是Trp,Met)
c)在合成的芽孢杆菌RNA酶抑制剂DNA中使用的编码该氨基酸的SEQID No.3的密码子
d)由这种SEQ ID No.3的密码子编码的氨基酸的数目
表2
质粒 | 滤膜编 |
芽孢杆菌RNA酶抑制剂蛋白a)纳克数 | Gus活性b) |
正确的芽孢杆菌RNA酶抑制剂c) | 平均 | SD |
pLH43 |
1 |
2.8 |
0.6 |
4.7 | 5.4 | 0.8 |
2 |
3.7 |
0.6 |
6.2 |
3 |
2.7 |
0.5 |
5.4 |
pMV71 |
1 |
2.4 |
0.8 |
3.0 | 2.7 | 0.4 |
2 |
3.6 |
1.3 |
2.8 |
3 |
1.1 |
0.5 |
2.2 |
pTS410 |
1 |
0.6 |
0.8 |
0.8 | 0.9 | 0.1 |
2 | 0.8 | 0.8 | 1.0 |
a)由Western印迹测定的50微克负载的蛋白质中芽孢杆菌RNA酶抑制剂的量
b)Gus活性以任意单位计
c)正确的芽孢杆菌RNA酶抑制剂:纳克芽孢杆菌RNA酶抑制剂/GUS活性单位。
表3
编号 | 质粒 | 品系 |
芽孢杆菌RNA酶抑制剂纳克数/总蛋白的毫克数 |
1 |
pTS173 |
C111 |
<2a) |
2 |
C113 |
4 |
3 |
C117 |
<2a) |
4 |
C118 |
2 |
5 |
C120 |
6 |
6 |
C121 |
2 |
7 |
C125 |
4 |
8 |
pTTS24 |
OSC1156 |
21 |
9 |
OSC1160 |
36 |
10 |
OSC1178 |
<12a) |
11 |
OSC1181 |
39 |
12 |
OSC1185 |
<12a) |
13 |
OSC1187 |
29 |
14 |
OSC1188 |
78 |
15 |
OSC1208 |
22 |
16 |
OSC1210 |
<12a) |
17 |
OSC1212 |
69 |
18 |
OSC1219 |
72 |
19 |
OSC1226 |
<12a) |
20 |
OSC1229 |
42 |
21 |
OSC1235 |
<12a) |
22 |
OSC1237 |
20 |
23 |
OSC1239 |
26 |
24 |
OSC1241 |
<12a) |
25 |
OSC1242 |
43 |
26 |
OSC1247 |
84 |
27 |
OSC1249 |
42 |
28 |
OSC1251 |
65 |
29 |
OSC1254 |
185 |
30 |
OSC1258 |
53 |
31 |
OSC1268 |
130 |
32 |
OSC1271 |
75 |
33 |
OSC1272 |
30 |
34 |
OSC1274 |
138 |
35 |
OSC1276 |
<12a) |
36 |
OSC1278 |
86 |
37 |
OSC1287 |
26 |
38 |
OSC1288 |
32 |
39 |
OSC1293 |
<12a) |
a:低于检测限制值
表4
样品 | 纳克b*/总蛋白毫克数1) |
X2) |
总蛋白 |
活性b*纳克数/n总蛋白4)毫克数 |
活性b*/总b*5) |
DBN366-0011 |
300 |
15.3 |
5.4 |
99 |
0.33 |
DBN366-0029 |
310 |
18.5 |
6.8 |
65 |
0.21 |
DBN342-1010 |
170 |
23.6 |
4.7 |
74 |
0.44 |
DBN367-0035 |
280 |
18.4 |
4.8 |
93 |
0.33 |
1)由Western印迹测定的。
2)X-截距
3)从花芽提取的蛋白质的总量(对于芽孢杆菌RNA酶抑制剂活性测定稀释了5倍)
4)评估的活性芽孢杆菌RNA酶抑制剂的量(约16.36纳克/毫升与20纳克/毫升芽孢杆菌RNA酶等摩尔)
5)活性芽孢杆菌RNA酶抑制剂(参见上述4)与总芽孢杆菌RNA酶抑制剂(参见上述1))的比例
序列表
(1)一般资料:
(i)申请人:
(A)名称:植物遗传系统N.V.
(B)街道:Plateaustraat 22
(C)城市:Ghent
(E)国家:比利时
(F)邮编(ZIP):B-9000
(G)电话:32 9 2358411
(H)传真:32 9 2231923
(ii)发明名称:恢复基因
(iii)序列数:10
(iv)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC相容
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.30(EPO)
(2)SEQ ID NO:1的资料:
(i)序列特征:
(A)长度:270个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“芽孢杆菌RNA酶抑制剂DNA”
(iii)推测:不是
(iv)反义:不是
(vi)原始来源:
(A)生物体:解淀粉芽孢杆菌
(ix)特征:
(A)名称/键:CDS
(B)位置:1..270
(D)其它资料:/功能=“芽孢杆菌RNA酶抑制剂”
/产物=“芽孢杆菌RNA酶抑制剂”
(xi)序列描述:SEQ ID NO:1:
ATG AAA AAA GCA GTC ATT AAC GGG GAA CAA ATC AGA AGT ATC AGC GAC 48
Met Lys Lys Ala Val Ile Asn Gly Glu Gln Ile Arg Ser Ile Ser Asp
1 5 10 15
CTC CAC CAG ACA TTG AAA AAG GAG CTT GCC CTT CCG GAA TAC TAC GGT 96
Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr Gly
20 25 30
GAA AAC CTG GAC GCT TTA TGG GAT TGT CTG ACC GGA TGG GTG GAG TAC 144
Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu Tyr
35 40 45
CCG CTC GTT TTG GAA TGG AGG CAG TTT GAA CAA AGC AAG CAG CTG ACT 192
Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu Thr
50 55 60
GAA AAT GGC GCC GAG AGT GTG CTT CAG GTT TTC CGT GAA GCG AAA GCG 240
Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys Ala
65 70 75 80
GAA GGC TGC GAC ATC ACC ATC ATA CTT TCT 270
Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
85 90
(2)SEQ ID NO:2的资料:
(i)序列特征:
(A)长度:90个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:2
Met Lys Lys Ala Val Ile Asn Gly Glu Gln Ile Arg Ser Ile Ser Asp
1 5 10 15
Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr Gly
20 25 30
Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu Tyr
35 40 45
Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu Thr
50 55 60
Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys Ala
65 70 75 80
Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
85 90
(2)SEQ ID NO:3的资料:
(i)序列特征:
(A)长度:273个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“改进的芽孢杆菌RNA酶抑制剂DNA”
(iii)推测:不是
(iV)反义:不是
(ix)特征:
(A)名称/键:CDS
(B)位置:1..273
(xi)序列描述:SEQ ID NO:3:
ATG GCC AAG AAG GCT GTC ATC AAC GGG GAG CAG ATC AGG AGC ATC AGC 48
Met Ala Lys Lys Ala Val Ile Asn Gly Glu Gln Ile Arg Ser Ile Ser
95 100 105
GAC CTC CAC CAG ACC CTC AAG AAG GAG CTT GCC CTT CCG GAG TAC TAC 96
Asp Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr
110 115 120
GGT GAG AAC CTC GAC GCC CTC TGG GAC TGC CTC ACC GGC TGG GTG GAG 144
Gly Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu
125 130 135
TAC CCC CTC GTG TTG GAG TGG AGG CAG TTC GAG CAG AGC AAG CAG CTC 192
Tyr Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu
140 145 150
ACC GAG AAC GGC GCC GAG AGC GTG CTC CAA GTG TTC AGG GAG GCC AAG 240
Thr Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys
155 160 165 170
GCC GAG GGC TGC GAC ATC ACC ATC ATC CTC TCC 273
Ala Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
175 180
(2)SEQ ID NO:4的资料:
(i)序列特征:
(A)长度:91个氨基酸
(B)类型:氨基酸
(D)几何结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:
Met Ala Lys Lys Ala Val Ile Ash Gly Glu Gln Ile Arg Ser Ile Ser
1 5 10 15
Asp Leu His Gln Thr Leu Lys Lys Glu Leu Ala Leu Pro Glu Tyr Tyr
20 25 30
Gly Glu Asn Leu Asp Ala Leu Trp Asp Cys Leu Thr Gly Trp Val Glu
35 40 45
Tyr Pro Leu Val Leu Glu Trp Arg Gln Phe Glu Gln Ser Lys Gln Leu
50 55 60
Thr Glu Asn Gly Ala Glu Ser Val Leu Gln Val Phe Arg Glu Ala Lys
65 70 75 80
Ala Glu Gly Cys Asp Ile Thr Ile Ile Leu Ser
85 90
(2)SEQ ID NO:5的资料:
(i)序列特征:
(A)长度:4032个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:环状
(ii)分子类型:其它核酸
(A)描述:/desc=“质粒pMV71”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:1999..3400
(D)其它资料:/标记=PRAC1
/注解=“水稻肌动蛋白基因的启动子区域-在引导序列中含
有内含子”
(ix)特征:
(A)名称/键:-
(B)位置:3401..3676
(D)其它资料:/标记=芽孢杆菌RNA酶抑制剂
/注解=“芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
(A)名称/键:-
(B)位置:3677..4003
(D)其它资料:/标记=3’nos
/注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3’
未转译末端的区域”
(ix)特征:
(A)名称/键:-
(B)位置:3399..3404
(D)其它资料:/标记=NcoI
/注解=“NcoI识别位点”
(ix)特征:
(A)名称/键:-
(B)位置:4016..4021
(D)其它资料:/标记=KpnI
/注解=“KpnI识别位点”
(xi)序列描述:SEQ ID NO:5:
CAAGCTTGAC GTCAGGTGGC ACTTTTCGGG GAAATGTGCG CGGAACCCCT ATTTGTTTAT 60
TTTTCTAAAT ACATTCAAAT ATGTATCCGC TCATGAGACA ATAACCCTGA TAAATGCTTC 120
AATAATATTG AAAAAGGAAG AGTATGAGTA TTCAACATTT CCGTGTCGCC CTTATTCCCT 180
TTTTTGCGGC ATTTTGCCTT CCTGTTTTTG CTCACCCAGA AACGCTGGTG AAAGTAAAAG 240
ATGCTGAAGA TCAGTTGGGT GCACGAGTGG GTTACATCGA ACTGGATCTC AACAGCGGTA 300
AGATCCTTGA GAGTTTTCGC CCCGAAGAAC GTTTTCCAAT GATGAGCACT TTTAAAGTTC 360
TGCTATGTGG CGCGGTATTA TCCCGTATTG ACGCCGGGCA AGAGCAACTC GGTCGCCGCA 420
TACACTATTC TCAGAATGAC TTGGTTGAGT ACTCACCAGT CACAGAAAAG CATCTTACGG 480
ATGGCATGAC AGTAAGAGAA TTATGCAGTG CTGCCATAAC CATGAGTGAT AACACTGCGG 540
CCAACTTACT TCTGACAACG ATCGGAGGAC CGAAGGAGCT AACCGCTTTT TTGCACAACA 600
TGGGGGATCA TGTAACTCGC CTTGATCGTT GGGAACCGGA GCTGAATGAA GCCATACCAA 660
ACGACGAGCG TGACACCACG ATGCCTGTAG CAATGGCAAC AACGTTGCGC AAACTATTAA 720
CTGGCGAACT ACTTACTCTA GCTTCCCGGC AACAATTAAT AGACTGGATG GAGGCGGATA 780
AAGTTGCAGG ACCACTTCTG CGCTCGGCCC TTCCGGCTGG CTGGTTTATT GCTGATAAAT 840
CTGGAGCCGG TGAGCGTGGG TCTCGCGGTA TCATTGCAGC ACTGGGGCCA GATGGTAAGC 900
CCTCCCGTAT CGTAGTTATC TACACGACGG GGAGTCAGGC AACTATGGAT GAACGAAATA 960
GACAGATCGC TGAGATAGGT GCCTCACTGA TTAAGCATTG GTAACTGTCA GACCAAGTTT 1020
ACTCATATAT ACTTTAGATT GATTTAAAAC TTCATTTTTA ATTTAAAAGG ATCTAGGTGA 1080
AGATCCTTTT TGGCTCGAGT CTCATGACCA AAATCCCTTA ACGTGAGTTT TCGTTCCACT 1140
GAGCGTCAGA CCCCGTAGAA AAGATCAAAG GATCTTCTTG AGATCCTTTT TTTCTGCGCG 1200
TAATCTGCTG CTTGCAAACA AAAAAACCAC CGCTACCAGC GGTGGTTTGT TTGCCGGATC 1260
AAGAGCTACC AACTCTTTTT CCGAAGGTAA CTGGCTTCAG CAGAGCGCAG ATACCAAATA 1320
CTGTCCTTCT AGTGTAGCCG TAGTTAGGCC ACCACTTCAA GAACTCTGTA GCACCGCCTA 1380
CATACCTCGC TCTGCTAATC CTGTTACCAG TGGCTGCTGC CAGTGGCGAT AAGTCGTGTC 1440
TTACCGGGTT GGACTCAAGA CGATAGTTAC CGGATAAGGC GCAGCGGTCG GGCTGAACGG 1500
GGGGTTCGTG CACACAGCCC AGCTTGGAGC GAACGACCTA CACCGAACTG AGATACCTAC 1560
AGCGTGAGCA TTGAGAAAGC GCCACGCTTC CCGAAGGGAG AAAGGCGGAC AGGTATCCGG 1620
TAAGCGGCAG GGTCGGAACA GGAGAGCGCA CGAGGGAGCT TCCAGGGGGA AACGCCTGGT 1680
ATCTTTATAG TCCTGTCGGG TTTCGCCACC TCTGACTTGA GCGTCGATTT TTGTGATGCT 1740
CGTCAGGGGG GCGGAGCCTA TGGAAAAACG CCAGCAACGC GGCCTTTTTA CGGTTCCTGG 1800
CCTTTTGCTG GCCTTTTGCT CACATGTTCT TTCCTGCGTT ATCCCCTGAT TCTGTGGATA 1860
ACCGTATTAC CGCCTTTGAG TGAGCTGATA CCGCTCGCCG CAGCCGAACG ACCGAGCGCA 1920
GCGAGTCAGT GAGCGAGGAA GCGGAAGAGC GCCCAATACG CAAACCGCCT CTCCCCGCGC 1980
GTTGGCCTGA TCAGAATTTC GAGGTCATTC ATATGCTTGA GAAGAGAGTC GGGATAGTCC 2040
AAAATAAAAC AAAGGTAAGA TTACCTGGTC AAAAGTGAAA ACATCAGTTA AAAGGTGGTA 2100
TAAAGTAAAA TATCGGTAAT AAAAGGTGGC CCAAAGTGAA ATTTACTCTT TTCTACTATT 2160
ATAAAAATTG AGGATGTTTT TGTCGGTACT TTGATACGTC ATTTTTGTAT GAATTGGTTT 2220
TTAAGTTTAT TCGCTTTTGG AAATGCATAT CTGTATTTGA GTCGGGTTTT AAGTTCGTTT 2280
GCTTTTGTAA ATACAGAGGG ATTTGTATAA GAAATATCTT TAAAAAAACC CATATGCTAA 2340
TTTGACATAA TTTTTGAGAA AAATATATAT TCAGGCGAAT TCTCACAATG AACAATAATA 2400
AGATTAAAAT AGCTTTCCCC CGTTGCAGCG CATGGGTATT TTTTCTAGTA AAAATAAAAG 2460
ATAAACTTAG ACTCAAAACA TTTACAAAAA CAACCCCTAA AGTTCCTAAA GCCCAAAGTG 2520
CTATCCACGA TCCATAGCAA GCCCAGCCCA ACCCAACCCA ACCCAACCCA CCCCAGTCCA 2580
GCCAACTGGA CAATAGTCTC CACACCCCCC CACTATCACC GTGAGTTGTC CGCACGCACC 2640
GCACGTCTCG CAGCCAAAAA AAAAAAAAGA AAGAAAAAAA AGAAAAAGAA AAAACAGCAG 2700
GTGGGTCCGG GTCGTGGGGG CCGGAAACGC GAGGAGGATC GCGAGCCAGC GACGAGGCCG 2760
GCCCTCCCTC CGCTTCCAAA GAAACGCCCC CCATCGCCAC TATATACATA CCCCCCCCTC 2820
TCCTCCCATC CCCCCAACCC TACCACCACC ACCACCACCA CCTCCACCTC CTCCCCCCTC 2880
GCTGCCGGAC GACGAGCTCC TCCCCCCTCC CCCTCCGCCG CCGCCGCGCC GGTAACCACC 2940
CCGCCCCTCT CCTCTTTCTT TCTCCGTTTT TTTTTTCCGT CTCGGTCTCG ATCTTTGGCC 3000
TTGGTAGTTT GGGTGGGCGA GAGGCGGCTT CGTGCGCGCC CAGATCGGTG CGCGGGAGGG 3060
GCGGGATCTC GCGGCTGGGG CTCTCGGCGG CGTGGATCCG GCCCGGATCT CGCGGGGAAT 3120
GGGGCTCTCG GATGTAGATC TGCGATCCGC CGTTGTTGGG GGAGATGATG GGGGGTTTAA 3180
AATTTCCGCC ATGCTAAACA AGATCAGGAA GAGGGGAAAA GGGCACTATG GTTTATATTT 3240
TTATATATTT CTGCTGCTTC GTCAGGCTTA GATGTGCTAG ATCTTTCTTT CTTCTTTTTG 3300
TGGGTAGAAT TTGAATCCCT CAGCATTGTT CATCGGTAGT TTTTCTTTTC ATGATTTGTG 3360
ACAAATGCAG CCTCGTGCGG AGCTTTTTTG TAGGTAGACC ATGGCCAAAA AAGCAGTCAT 3420
TAACGGGGAA CAAATCAGAA GTATCAGCGA CCTCCACCAG ACATTGAAAA AGGAGCTTGC 3480
CCTTCCGGAA TACTACGGTG AAAACCTGGA CGCTTTATGG GATTGTCTGA CCGGATGGGT 3540
GGAGTACCCG CTCGTTTTGG AATGGAGGCA GTTTGAACAA AGCAAGCAGC TGACTGAAAA 3600
TGGCGCCGAG AGTGTGCTTC AGGTTTTCCG TGAAGCGAAA GCGGAAGGCT GCGACATCAC 3660
CATCATACTT TCTTAATACG ATCAATGGGA GATGAACAAT ATGGAAACAC AAACCCGCAA 3720
GCTAGCTTGG CTCTAGAGGA TCCGAAGCAG ATCGTTCAAA CATTTGGCAA TAAAGTTTCT 3780
TAAGATTGAA TCCTGTTGCC GGTCTTGCGA TGATTATCAT ATAATTTCTG TTGAATTACG 3840
TTAAGCATGT AATAATTAAC ATGTAATGCA TGACGTTATT TATGAGATGG GTTTTTATGA 3900
TTAGAGTCCC GCAATTATAC ATTTAATACG CGATAGAAAA CAAAATATAG CGCGCAAACT 3960
AGGATAAATT ATCGCGCGCG GTGTCATCTA TGTTACTAGA TCGGGAAGAT CCCCGGGTAC 4020
CGAGCTCGAA TT 4032
(2)SEQ ID NO:6的资料:
(i)序列特征:
(A)长度:563个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“质粒pLH43的部分”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:1..6
(D)其它资料:/标记=NcoI
/注解=“NcoI识别位点”
(ix)特征:
(A)名称/键:-
(B)位置:3..278
(D)其它资料:/标记=synb*
/注解=“改进的芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
(A)名称/键:-
(B)位置:279..545
(D)其它资料:/标记=3’nos
/注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3,
未转译末端的区域”
(ix)特征:
(A)名称/键:-
(B)位置:558..563
(D)其它资料:/标记=KpnI
/注解=“KpnI识别位点”
(xi)序列描述:SEQ ID NO:6:
CCATGGCCAA GAAGGCTGTC ATCAACGGGG AGCAGATCAG GAGCATCAGC GACCTCCACC 60
AGACCCTCAA GAAGGAGCTT GCCCTTCCGG AGTACTACGG TGAGAACCTC GACGCCCTCT 120
GGGACTGCCT CACCGGCTGG GTGGAGTACC CCCTCGTGTT GGAGTGGAGG CAGTTCGAGC 180
AGAGCAAGCA GCTCACCGAG AACGGCGCCG AGAGCGTGCT CCAAGTGTTC AGGGAGGCCA 240
AGGCCGAGGG CTGCGACATC ACCATCATCC TCTCCTGATG GATCCGAAGC AGATCGTTCA 300
AACATTTGGC AATAAAGTTT CTTAAGATTG AATCCTGTTG CCGGTCTTGC GATGATTATC 360
ATATAATTTC TGTTGAATTA CGTTAAGCAT GTAATAATTA ACATGTAATG CATGACGTTA 420
TTTATGAGAT GGGTTTTTAT GATTAGAGTC CCGCAATTAT ACATTTAATA CGCGATAGAA 480
AACAAAATAT AGCGCGCAAA CTAGGATAAA TTATCGCGCG CGGTGTCATC TATGTTACTA 540
GATCGGGAAG ATCCCCGGGT ACC 563
(2)SEQ ID NO:7的资料:
(i)序列特征:
(A)长度:5349个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“质粒pTTS24的T-DNA”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:补体(1..25)
(D)其它资料:/标记=RB
/注解=“ T-DNA右边界”
(ix)特征:
(A)名称/键:-
(B)位置:补体(98..331)
(D)其它资料:/标记=3’g7
/注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3’
未转译末端的区域”
(ix)特征:
(A)名称/键:-
(B)位置:补体(332..883)
(D)其它资料:/标记=bar
/注解=“编码膦苏菌素乙酰基转移酶的区域”
(ix)特征:
(A)名称/键:-
(B)位置:补体(884..2258)
(D)其它资料:/标记=P35S
/注解=“花椰菜花叶病毒的35S启动子”
(ix)特征:
(A)名称/键:-
(B)位置:2281..3969
(D)其它资料:/标记=PE1
/注解=“水稻的E1基因的启动子(WO92/13956)”
(ix)特征:
(A)名称/键:-
(B)位置:3970..4245
(D)其它资料:/标记=synb*
/注解=“改进的芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
(A)名称/键:-
(B)位置: 4246..4577
(D)其它资料:/标记=3’chs
/注解=“含有苯基苯乙烯酮合成酶基因的3’未转译末端的
区域”
(ix)特征:
(A)名称/键:-
(B)位置:补体(5325..5349)
(D)其它资料:/标记=LB
/注解=“T-DNA左边界”
(xi)序列描述:SEQ ID NO:7
AATTACAACG GTATATATCC TGCCAGTACT CGGCCGTCGA ACTCGGCCGT CGAGTACATG 60
GTCGATAAGA AAAGGCAATT TGTAGATGTT AATTCCCATC TTGAAAGAAA TATAGTTTAA 120
ATATTTATTG ATAAAATAAC AAGTCAGGTA TTATAGTCCA AGCAAAAACA TAAATTTATT 180
GATGCAAGTT TAAATTCAGA AATATTTCAA TAACTGATTA TATCAGCTGG TACATTGCCG 240
TAGATGAAAG ACTGAGTGCG ATATTATGTG TAATACATAA ATTGATGATA TAGCTAGCTT 300
AGCTCATCGG GGGATCCTAG AACGCGTGAT CTCAGATCTC GGTGACGGGC AGGACCGGAC 360
GGGGCGGTAC CGGCAGGCTG AAGTCCAGCT GCCAGAAACC CACGTCATGC CAGTTCCCGT 420
GCTTGAAGCC GGCCGCCCGC AGCATGCCGC GGGGGGCATA TCCGAGCGCC TCGTGCATGC 480
GCACGCTCGG GTCGTTGGGC AGCCCGATGA CAGCGACCAC GCTCTTGAAG CCCTGTGCCT 540
CCAGGGACTT CAGCAGGTGG GTGTAGAGCG TGGAGCCCAG TCCCGTCCGC TGGTGGCGGG 600
GGGAGACGTA CACGGTCGAC TCGGCCGTCC AGTCGTAGGC GTTGCGTGCC TTCCAGGGGC 660
CCGCGTAGGC GATGCCGGCG ACCTCGCCGT CCACCTCGGC GACGAGCCAG GGATAGCGCT 720
CCCGCAGACG GACGAGGTCG TCCGTCCACT CCTGCGGTTC CTGCGGCTCG GTACGGAAGT 780
TGACCGTGCT TGTCTCGATG TAGTGGTTGA CGATGGTGCA GACCGCCGGC ATGTCCGCCT 840
CGGTGGCACG GCGGATGTCG GCCGGGCGTC GTTCTGGGTC CATGGTTATA GAGAGAGAGA 900
TAGATTTATA GAGAGAGACT GGTGATTTCA GCGTGTCCTC TCCAAATGAA ATGAACTTCC 960
TTATATAGAG GAAGGGTCTT GCGAAGGATA GTGGGATTGT GCGTCATCCC TTACGTCAGT 1020
GGAGATGTCA CATCAATCCA CTTGCTTTGA AGACGTGGTT GGAACGTCTT CTTTTTCCAC 1080
GATGCTCCTC GTGGGTGGGG GTCCATCTTT GGGACCACTG TCGGCAGAGG CATCTTGAAT 1140
GATAGCCTTT CCTTTATCGC AATGATGGCA TTTGTAGGAG CCACCTTCCT TTTCTACTGT 1200
CCTTTCGATG AAGTGACAGA TAGCTGGGCA ATGGAATCCG AGGAGGTTTC CCGAAATTAT 1260
CCTTTGTTGA AAAGTCTCAA TAGCCCTTTG GTCTTCTGAG ACTGTATCTT TGACATTTTT 1320
GGAGTAGACC AGAGTGTCGT GCTCCACCAT GTTGACGAAG ATTTTCTTCT TGTCATTGAG 1380
TCGTAAAAGA CTCTGTATGA ACTGTTCGCC AGTCTTCACG GCGAGTTCTG TTAGATCCTC 1440
GATTTGAATC TTAGACTCCA TGCATGGCCT TAGATTCAGT AGGAACTACC TTTTTAGAGA 1500
CTCCAATCTC TATTACTTGC CTTGGTTTAT GAAGCAAGCC TTGAATCGTC CATACTGGAA 1560
TAGTACTTCT GATCTTGAGA AATATGTCTT TCTCTGTGTT CTTGATGCAA TTAGTCCTGA 1620
ATCTTTTGAC TGCATCTTTA ACCTTCTTGG GAAGGTATTT GATCTCCTGG AGATTGTTAC 1680
TCGGGTAGAT CGTCTTGATG AGACCTGCTG CGTAGGCCTC TCTAACCATC TGTGGGTCAG 1740
CATTCTTTCT GAAATTGAAG AGGCTAACCT TCTCATTATC AGTGGTGAAC ATAGTGTCGT 1800
CACCTTCACC TTCGAACTTC CTTCCTAGAT CGTAAAGATA GAGGAAATCG TCCATTGTAA 1860
TCTCCGGGGC AAAGGAGATC TCTTTTGGGG CTGGATCACT GCTGGGCCTT TTGGTTCCTA 1920
GCGTGAGCCA GTGGGCTTTT TGCTTTGGTG GGCTTGTTAG GGCCTTAGCA AAGCTCTTGG 1980
GCTTGAGTTG AGCTTCTCCT TTGGGGATGA AGTTCAACCT GTCTGTTTGC TGACTTGTTG 2040
TGTACGCGTC AGCTGCTGCT CTTGCCTCTG TAATAGTGGC AAATTTCTTG TGTGCAACTC 2100
CGGGAACGCC GTTTGTTGCC GCCTTTGTAC AACCCCAGTC ATCGTATATA CCGGCATGTG 2160
GACCGTTATA CACAACGTAG TAGTTGATAT GAGGGTGTTG AATACCCGAT TCTGCTCTGA 2220
GAGGAGCAAC TGTGCTGTTA AGCTCAGATT TTTGTGGGCC CGGGCCTAGG CTAGCGGCCG 2280
CAGATCCTTC TGTGTGATTG TTTTATTAAA ATTTAATATT TATCTGGAAT ACCTACCAAT 2340
ATATAGTAGA CTTGTCAAGC TGCAAGAACT TCCAATCGCC GACAATACCA ATAGAGATCC 2400
AACCACCTTA ATATCATAAA CAATCTGATT GTTAGTCCAG AACTATATTG AGTAGTGAAC 2460
AACAATAGCA CATTAACATT ATGAGGATTA TTGGCTAACT CTGCAATTCA ATATTCTGAT 2520
GCGTCTAATC TGGTCAATTT TAGCGCTCCA GAAAGAATTG CACAATCCTT GGACA ATGTT 2580
GGCACTGGAA CTGTTGCATG TTTTTACATC TCTTATTAAC GTAGCAAAGG AGTAGATTAT 2640
TATGTACCAG GAGAAATCTC TTCAGATCCT TTCCACATGC AATGTCGTAA AGAACAGATA 2700
CAGTGTACGT TAGTTTGTAA TGGACGGTCA ATGCCATTTC TCTGAAGGCA TGTTCAGAGA 2760
TGATGATTTC TGGGATCCTT GGAGGGGCCC TGAAATTCGG AAACAGTTAG TTGAGTTTTA 2820
GTACCTAATG TCTTGCGTTA TACTACGTGA AATGCCATTT CTGTAAGCTG AGTTTTCTAC 2880
CATCTCCACA GGAAATAAAG CTAATACCTG TCCAAGAGTG GTGCGGCATT TGACCAAATG 2940
AAGATCACAA GCATGGCAAG AATGGCAATC TGGCAAAGGA GCGGAATTAT ATTGTATTCT 3000
ACTACATCGA ACAGGAACCA TATCAATGTT GCCCCAGCAA GGACCCCCGC AGATAAGTTC 3060
CTGTTCTTCC ACAGCAGAAT ATCCGCAACT GCATAGCTCC CAACAATGAA ATCCAAAACC 3120
ACATCGGCTC AGAGAGAAGT TATGATAAAA GGCACTAATT CTGAATAATT TCCTAGAAAG 3180
CGAATAATAA TAGCACACCT TGACCTCCAC CAAGAAGCTT GTGGATCGAC TTGTGCCCAT 3240
GAAATGGCAT TCTGACATTC TGGTCACTGT CAGAATCTCT CGGAAAATGA GGAGGCATAG 3300
CTTCGTGTGT GTATGTGTGT GGGATATTAC GCTGCTAAAA CTTTGTGTTT CTGATCGATC 3360
TGGTTAGAGA GCATCGTCTT TATAAGCACT TAAAAATGGT AGTATAATCT CTCAAGGAGC 3420
CTATACTGCC AAGGAAAGGA TAGCTTGGCC TGTGGGGATT GAGCCGTTGA AGGGAACAAA 3480
CGAATACAGT TACCTTACCA GATGTTTGCC ACGACATGGG CAACGTCATT GCTAGACCAA 3540
GAAGGCAAGA AGCAAAGTTT AGCTGTCAAA AAAGATATGC TAGAGGCTTT CCAGAATATG 3600
TTCTATCTCA GCCAGACCAA TGGGGGCAAA ATTTACTACT ATTTGCCATA CATTAACCAC 3660
GTAAAAGTCC TACACTCAAC CTAACTGTTG AACGGTCCTG TTCTGGCCAA CGGTGAGAAT 3720
GCACCTAATG GACGGGACAA CACTTCTTTC ACCGTGCTAC TGCTACATCC TGTAGACGGT 3780
GGACGCGTGA GGTGCTTTCG CCATGACCGT CCTTGGTTGT TGCAGTCACT TGCGCACGCT 3840
TGCACCGTGA CTCACCTGCC ACATTGCCCC CGCCGTCGCC GGCGCCTACA AAAGCCACAC 3900
ACGCACGCCG GCCACGATAA CCCATCCTAG CATCCCGGTG TCCAGCAAGA GATCCATCAA 3960
GCCGTCGCGA TGGCCAAGAA GGCTGTCATC AACGGGGAGC AGATCAGGAG CATCAGCGAC 4020
CTCCACCAGA CCCTCAAGAA GGAGCTTGCC CTTCCGGAGT ACTACGGTGA GAACCTCGAC 4080
GCCCTCTGGG ACTGCCTCAC CGGCTGGGTG GAGTACCCCC TCGTGTTGGA GTGGAGGCAG 4140
TTCGAGCAGA GCAAGCAGCT CACCGAGAAC GGCGCCGAGA GCGTGCTCCA AGTGTTCAGG 4200
GAGGCCAAGG CCGAGGGCTG CGACATCACC ATCATCCTCT CCTGATGGAT CTGGGGCCGC 4260
TCTAGAACTA GTGGATCCCC CGGGCTGCAG GTCGGGTTGG GTTATTTTCT TATTTCCGTA 4320
ATAAAAAAGT GGACATGGTT ACCTATTATT GTGATGTGTG CTGCATGTGA GCTATATTGG 4380
CGATTTCTCT CTTGTAACGC TTTGTACTTG TACCGTTTCG TTGTGATCAT TGAAATAAAG 4440
GCCTATATAA AAATAATTTA TGTTATTTGT TGGTTTATGT GTGTGTTTTT TTTTTTTTTT 4500
TTTAGTCAAA ATATTTAAGT ATTTCTATAT AAATCTTTTG CAAGTTTTTT AAGTCATGGA 4560
GGAGATGTTA TGAATTCTGT AATATAGTAA AAATATTACG TGAAAAACCA GAGGATCCGG 4620
GGAATTCCCA GATCCGCCTA CCTTTCACGA GTTGCGCAGT TTGTCTGCAA GACTCTATGA 4680
GAAGCAGATA AGCGATAAGT TTGCTCAACA TCTTCTCGGG CATAAGTCGG ACACCATGGC 4740
ATCACAGTAT CGTGATGACA GAGGCAGGGA GTGGGACAAA ATTGAAATCA AATAATGATT 4800
TTATTTTGAC TGATAGTGAC CTGTTCGTTG CAACAAATTG ATAAGCAATG CTTTTTTATA 4860
ATGCCAACTT AGTATAAAAA AGCAGGCTTC ATCCGGATTC TCTGAGCCCA CCGTGTTCAC 4920
CACCACCGTG GTGCTGTTAC GTCTGGCTTT CAGCTGAATG GTGCAGTTCT GTACCGGTTT 4980
TCCTGTGCCG TCTTTCAGGA CTCCTGAAAT CTTTACTGCC ATATTCACCC CACAAAAAAG 5040
CCCACCGGTT CCGGCGGGCT GTCATAACAC TGTGTTACCT GGCTAATCAG AATTTATAAC 5100
CGACCCCAAC GATGAATCCG TCAGTACGCC AGTCGCCACT GCCGGAGCCT TCATAAGCAA 5160
TATCAACAAC GACGGACGCT GCCGGATTAA TCTGTATACC TGCACTCCAC GCCACTGAGG 5220
TATGCCGCAT TGCACTTTCG TCCCTGGCAG TGGTCGTCTC TTTCATATAC CCGACTCTAG 5280
AGGATCCCCC GGGTACCGAG CTCTCCCCAG ATCTGCATGG AGCCATTTAC AATTGAATAT 5340
ATCCTGCCG 5349
(2)SEQ ID NO:8的资料:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“寡核苷酸CASOLX1”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:10..15
(D)其它资料:/标记=KpnI
/注解=“KpnI识别位点”
(xi)序列描述:SEQ ID NO:8的资料:
CAGCCTGCCG GTACCGCCCC GTCC 24
(2)SEQ ID NO:9的资料:
(i)序列特征:
(A)长度:50个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:其它核酸
(A)描述:/desc=“寡核苷酸CASOLX2”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:5..10
(D)其它资料:/标记=AatII
/注解=“AatII识别位点”
(ix)特征:
(A)名称/键:-
(B)位置:30..50
(D)其它资料:/标记=3’g7
/注解=“含有农杆菌T-DNA的3’未转译末端的部分”
(xi)序列描述:SEQ ID NO:9
CCCCGACGTC AAGCTTGAAT TCGCGATACG TACATGGTCG ATAAGAAAAG 50
(2)(2)SEQ ID NO:10的资料:
(i)序列特征:
(A)长度:5611个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:环状
(ii)分子类型:其它核酸
(A)描述:/desc=“质粒pLH48”
(iii)推测:不是
(iv)反义:不是
(ix)特征:
(A)名称/键:-
(B)位置:补体(39..317)
(D)其它资料:/标记=3’nos
/注解=“含有农杆菌T-DNA的胭脂碱合成酶基因的3’
未转译末端的区域”
(ix)特征:
(A)名称/键:-
(B)位置:补体(318..869)
(D)其它资料:/标记=bar
/注解=“编码膦苏菌素乙酰基转移酶的区域”
(ix)特征:
(A)名称/键:-
(B)位置:补体(870..1702)
(D)其它资料:/标记=P35S
/注解=“花椰菜花叶病毒的35S启动子”
(ix)特征:
(A)名称/键:-
(B)位置:1740..2284
(D)其它资料:/标记=PTA29
/注解=“烟草TA29基因的启动子”
(ix)特征:
(A)名称/键:-
(B)位置:2285..2560
(D)其它资料:/标记=synb*
/注解=“改进的芽孢杆菌RNA酶抑制剂DNA”
(ix)特征:
(A)名称/键:-
(B)位置:2561..2892
(D)其它资料:/标记=3’chs
/注解=“含有苯基苯乙烯酮合成酶基因的3’未转译末端的
区域”
(xi)序列描述:SEQ ID NO:10:
AGCTTGCATG CCTGCAGGTC GACTCTAGAG GATCTTCCCG ATCTAGTAAC ATAGATGACA 60
CCGCGCGCGA TAATTTATCC TAGTTTGCGC GCTATATTTT GTTTTCTATC GCGTATTAAA 120
TGTATAATTG CGGGACTCTA ATCATAAAAA CCCATCTCAT AAATAACGTC ATGCATTACA 180
TGTTAATTAT TACATGCTTA ACGTAATTCA ACAGAAATTA TATGATAATC ATCGCAAGAC 240
CGGCAACAGG ATTCAATCTT AAGAAACTTT ATTGCCAAAT GTTTGAACGA TCTGCTTCGG 300
ATCCTAGACG CGTGAGATCA GATCTCGGTG ACGGGCAGGA CCGGACGGGG CGGTACCGGC 360
AGGCTGAAGT CCAGCTGCCA GAAACCCACG TCATGCCAGT TCCCGTGCTT GAAGCCGGCC 420
GCCCGCAGCA TGCCGCGGGG GGCATATCCG AGCGCCTCGT GCATGCGCAC GCTCGGGTCG 480
TTGGGCAGCC CGATGACAGC GACCACGCTC TTGAAGCCCT GTGCCTCCAG GGACTTCAGC 540
AGGTGGGTGT AGAGCGTGGA GCCCAGTCCC GTCCGCTGGT GGCGGGGGGA GACGTACACG 600
GTCGACTCGG CCGTCCAGTC GTAGGCGTTG CGTGCCTTCC AGGGGCCCGC GTAGGCGATG 660
CCGGCGACCT CGCCGTCCAC CTCGGCGACG AGCCAGGGAT AGCGCTCCCG CAGACGGACG 720
AGGTCGTCCG TCCACTCCTG CGGTTCCTGC GGCTCGGTAC GGAAGTTGAC CGTGCTTGTC 780
TCGATGTAGT GGTTGACGAT GGTGCAGACC GCCGGCATGT CCGCCTCGGT GGCACGGCGG 840
ATGTCGGCCG GGCGTCGTTC TGGGTCCATG GTTATAGAGA GAGAGATAGA TTTATAGAGA 900
GAGACTGGTG ATTTCAGCGT GTCCTCTCCA AATGAAATGA ACTTCCTTAT ATAGAGGAAG 960
GGTCTTGCGA AGGATAGTGG GATTGTGCGT CATCCCTTAC GTCAGTGGAG ATGTCACATC 1020
AATCCACTTG CTTTGAAGAC GTGGTTGGAA CGTCTTCTTT TTCCACGATG CTCCTCGTGG 1080
GTGGGGGTCC ATCTTTGGGA CCACTGTCGG CAGAGGCATC TTGAATGATA GCCTTTCCTT 1140
TATCGCAATG ATGGCATTTG TAGGAGCCAC CTTCCTTTTC TACTGTCCTT TCGATGAAGT 1200
GACAGATAGC TGGGCAATGG AATCCGAGGA GGTTTCCCGA AATTATCCTT TGTTGAAAAG 1260
TCTCAATAGC CCTTTGGTCT TCTGAGACTG TATCTTTGAC ATTTTTGGAG TAGACCAGAG 1320
TGTCGTGCTC CACCATGTTG ACGAAGATTT TCTTCTTGTC ATTGAGTCGT AAAAGACTCT 1380
GTATGAACTG TTCGCCAGTC TTCACGGCGA GTTCTGTTAG ATCCTCGATT TGAATCTTAG 1440
ACTCCATGCA TGGCCTTAGA TTCAGTAGGA ACTACCTTTT TAGAGACTCC AATCTCTATT 1500
ACTTGCCTTG GTTTATGAAG CAAGCCTTGA ATCGTCCATA CTGGAATAGT ACTTCTGATC 1560
TTGAGAAATA TGTCTTTCTC TGTGTTCTTG ATGCAATTAG TCCTGAATCT TTTGACTGCA 1620
TCTTTAACCT TCTTGGGAAG GTATTTGATC TCCTGGAGAT TGTTACTCGG GTAGATCGTC 1680
TTGATGAGAC CTGCTGCGTA GGAGCTTGCA TGCCTGCAGG TCGACTCTAG AGGATCCCCA 1740
TCTAGCTAAG TATAACTGGA TAATTTGCAT TAACAGATTG AATATAGTGC CAAACAAGAA 1800
GGGACAATTG ACTTGTCACT TTATGAAAGA TGATTCAAAC ATGATTTTTT ATGTACTAAT 1860
ATATACATCC TACTCGAATT AAAGCGACAT AGGCTCGAAG TATGCACATT TAGCAATGTA 1920
AATTAAATCA GTTTTTGAAT CAAGCTAAAA GCAGACTTGC ATAAGGTGGG TGGCTGGACT 1980
AGAATAAACA TCTTCTCTAG CACAGCTTCA TAATGTAATT TCCATAACTG AAATCAGGGT 2040
GAGACAAAAT TTTGGTACTT TTTCCTCACA CTAAGTCCAT GTTTGCAACA AATTAATACA 2100
TGAAACCTTA ATGTTACCCT CAGATTAGCC TGCTACTCCC CATTTTCCTC GAAATGCTCC 2160
AACAAAAGTT AGTTTTGCAA GTTGTTGTGT ATGTCTTGTG CTCTATATAT GCCCTTGTGG 2220
TGCAAGTGTA ACAGTACAAC ATCATCACTC AAATCAAAGT TTTTACTTAA AGAAATTAGC 2280
TACCATGGCC AAGAAGGCTG TCATCAACGG GGAGCAGATC AGGAGCATCA GCGACCTCCA 2340
CCAGACCCTC AAGAAGGAGC TTGCCCTTCC GGAGTACTAC GGTGAGAACC TCGACGCCCT 2400
CTGGGACTGC CTCACCGGCT GGGTGGAGTA CCCCCTCGTG TTGGAGTGGA GGCAGTTCGA 2460
GCAGAGCAAG CAGCTCACCG AGAACGGCGC CGAGAGCGTG CTCCAAGTGT TCAGGGAGGC 2520
CAAGGCCGAG GGCTGCGACA TCACCATCAT CCTCTCCTGA TGGATCTGGG GCCGCTCTAG 2580
AACTAGTGGA TCCCCCGGGC TGCAGGTCGG GTTGGGTTAT TTTCTTATTT CCGTAATAAA 2640
AAAGTGGACA TGGTTACCTA TTATTGTGAT GTGTGCTGCA TGTGAGCTAT ATTGGCGATT 2700
TCTCTCTTGT AACGCTTTGT ACTTGTACCG TTTCGTTGTG ATCATTGAAA TAAAGGCCTA 2760
TATAAAAATA ATTTATGTTA TTTGTTGGTT TATGTGTGTG TTTTTTTTTT TTTTTTTTAG 2820
TCAAAATATT TAAGTATTTC TATATAAATC TTTTGCAAGT TTTTTAAGTC ATGGAGGAGA 2880
TGTTATGAAT TCTGTAATAT AGTAAAAATA TTACGTGAAA AACCAGAGGA TCCGGGGAAT 2940
TCCCAGATCC GCCTACCTTT CACGAGTTGC GCAGTTTGTC TGCAAGACTC TATGAGAAGC 3000
AGATAAGCGA TAAGTTTGCT CAACATCTTC TCGGGCATAA GTCGGACACC ATGGCATCAC 3060
AGTATCGTGA TGACAGAGGC AGGGAGTGGG ACAAAATTGA AATCAAATAA TGATTTTATT 3120
TTGACTGATA GTGACCTGTT CGTTGCAACA AATTGATAAG CAATGCTTTT TTATAATGCC 3180
AACTTAGTAT AAAAAAGCAG GCTTCATCCG GATTCTCTGA GCCCACCGTG TTCACCACCA 3240
CCGTGGTGCT GTTACGTCTG GCTTTCAGCT GAATGGTGCA GTTCTGTACC GGTTTTCCTG 3300
TGCCGTCTTT CAGGACTCCT GAAATCTTTA CTGCCATATT CACCCCACAA AAAAGCCCAC 3360
CGGTTCCGGC GGGCTGTCAT AACACTGTGT TACCTGGCTA ATCAGAATTT ATA ACCGACC 3420
CCAACGATGA ATCCGTCAGT ACGCCAGTCG CCACTGCCGG AGCCTTCATA AGCAATATCA 3480
ACAACGACGG ACGCTGCCGG ATTAATCTGT ATACCTGCAC TCCACGCCAC TGAGGTATGC 3540
CGCATTGCAC TTTCGTCCCT GGCAGTGGTC GTCTCTTTCA TATACCCGAC TCTAGAGGAT 3600
CCCCCGGGTA CCGAGCTCGA ATTCTGATCA GGCCAACGCG CGGGGAGAGG CGGTTTGCGT 3660
ATTGGGCGCT CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT TCGGCTGCGG 3720
CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC AGGGGATAAC 3780
GCAGGAAAGA ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA AAAGGCCGCG 3840
TTGCTGGCGT TTTTCCATAG GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA 3900
AGTCAGAGGT GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC 3960
TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC CGCCTTTCTC 4020
CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG TTCGGTGTAG 4080
GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA CCGCTGCGCC 4140
TTATCCGGTA ACTATCGTCT TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA 4200
GCAGCCACTG GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG 4260
AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG CGCTCTGCTG 4320
AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA AACCACCGCT 4380
GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA AGGATCTCAA 4440
GAAGATCCTT TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA 4500
GGGATTTTGG TCATGAGACT CGAGCCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 4560
AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA 4620
TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC 4680
TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT 4740
GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA 4800
GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 4860
AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT 4920
GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 4980
GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC 5040
TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT 5100
ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 5160
GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC 5220
CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 5280
GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG 5340
ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT 5400
GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 5460
TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT 5520
CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 5580
ACATTTCCCC GAAAAGTGCC ACCTGACGTC A 5611