Cry3B杀虫蛋白在植物中的提高表达
1.0发明背景
1.1发明领域
本发明公开了表达相当高水平的防治昆虫的苏云金芽孢杆菌(Bacillus thuringiensis)δ-内毒素的转基因植物。描述了获得这些植物和组合物的方法和使用这些植物和组合物的方法。也公开了含有优选蛋白编码序列的改进的核苷酸盒,它提供相当高水平的昆虫防治δ-内毒素。本发明的优选实施方案令人惊讶地提供了比用先有组合物获得的最高水平高10倍的昆虫防治蛋白。特别是,设计了一种蛋白以表现出对鞘翅目害虫提高的毒性,表达较高水平的这种蛋白的转基因玉米表现出优越的昆虫防治水平,并不太可能引起发展出抗所述杀虫活性蛋白的目标昆虫群体。
1.2相关技术的描述
几乎所有大田作物、植物和商品农作区均易受一种或多种害虫侵袭。特别成问题的是鞘翅目和鳞翅目害虫。因为有商业价值的作物通常是昆虫侵袭的目标,所以希望有控制或根除昆虫侵染的环境敏感方法。这对于农民、苗圃工作者、栽培者以及试图使用有利于生态的组合物防治昆虫群体的商业区和居住区特别适用。
在近些年开发的最广泛使用的环境敏感杀虫制剂由衍生自细菌苏云金芽孢杆菌的微生物蛋白灭虫剂组成,所述苏云金芽孢杆菌是一种产生对某些目和种的昆虫具有特异性毒性的晶体蛋白或包涵体的革兰氏阳性菌。已经鉴定了许多产生一种或多种杀虫晶体蛋白以及其它杀虫非晶体形成蛋白的不同的苏云金芽孢杆菌菌株。包括产生杀虫蛋白的苏云金芽孢杆菌菌株的组合物可由市场上购得,并已经用作环境许可的杀虫剂,因为它们对特定的目标害虫非常毒,但对植物和脊椎动物以及无脊椎动物无害。更重要的是,因为这些昆虫防治蛋白必须被敏感的目标害虫摄食,以便发挥其杀虫或毒性作用,所以审慎地应用这样的蛋白组合物限制或防止了也对所述组合物敏感的敏感目的非靶昆虫成员(例如在杀虫制剂中使用鳞翅目特异性的B.t.晶体蛋白情况下的非靶鳞翅目物种)显著暴露于所述蛋白中。另外已经表明,不同目的昆虫即使在大量摄食特定靶的杀虫蛋白时,也完全对其没有敏感性。
1.2.1δ-内毒素
δ-内毒素用来防治范围广泛的食植物的毛虫和甲虫以及蚊。这些蛋白也称为杀虫晶体蛋白、晶体蛋白和Bt毒素,代表一大类由苏云金芽孢杆菌产生的杀虫蛋白,这些蛋白当被敏感昆虫宿主摄入时是有毒的。在过去十年中,对苏云金芽孢杆菌毒素的结构和功能的研究已经覆盖了所有主要的毒素类别,尽管这些毒素在具体结构和功能方面不同,但推定在结构和功能方面具有一般的相似性。最近一篇综述描述了Bt毒素的遗传学、生物化学和分子生物学(Schnepf等,苏云金芽孢杆菌及其杀虫晶体蛋白,Microbiol.Mol.Biol.Rev.62:775-806,1998)。根据积累的对苏云金芽孢杆菌毒素的了解,已经创造了苏云金芽孢杆菌毒素的一般化作用模式,包括:由所述昆虫摄入;在昆虫中肠(组合胃和小肠)中溶解;抗消化酶,有时被肠特异性蛋白酶部分消化,该酶特异性催化于“活化”该毒素的前毒素结构中的肽位点切割;该毒素与中肠细胞的刷状缘结合;在昆虫中肠细胞中形成孔;并且破坏细胞稳态(English和Slatin,1992)。
1.2.2编码晶体蛋白的基因
许多δ-内毒素由于其氨基酸序列的相似性而不同程度的相关。从历史上讲,主要根据所述蛋白和编码它们的基因的杀虫活性谱,将其分类。Hofte和Whiteley(1989)的综述讨论了在1990年以前在苏云金芽孢杆菌中鉴定的基因和蛋白,并且提出传统上已经应用于苏云金芽孢杆菌基因和蛋白的命名法和分类方案。原始命名法利用下述发现:那时已知的少数Bt Cry蛋白一般属于有限数目的类别,其中每类代表对于特定目的昆虫具有特异性的蛋白。例如,cry1基因编码对鳞翅目昆虫有毒的Cry1蛋白。cry2基因编码普遍对鳞翅目昆虫和双翅目昆虫有毒的Cry2蛋白。cry3基因编码对鞘翅目昆虫有毒的Cry3蛋白,而cry4基因编码双翅目昆虫特异性毒性的Cry4蛋白。由于发现更远缘类别的杀虫Bt蛋白,在过去十年或更长时间所述命名法变得相当混乱。新近已经采用了一种简化的同一性的Bt蛋白命名法和对Bt蛋白分类的基础,这由Schnepf等(1998)进行了综述。Schnepf等(1998)也提供了Cry1晶体的结构溶液。本文将采用这种简化的命名法。在本文中还观察到以小写斜体字母鉴别Bt基因(例如cry1Ab1)以及以首字母大写鉴别Bt蛋白(例如Cry1Ab1)的惯例。
根据序列相似性的程度,已经将所述蛋白进一步分类为亚家族。为在每个家族中看来更为密切相关的蛋白指定标志分开的字母,例如Cry1A、Cry1B、Cry1C等。在每一分组(division)内甚至更为密切相关的蛋白以例如Cry1Ca、Cry1Cb等命名,在每一分组内进一步甚至更密切相关的蛋白以例如Cry1Bb1、Cry1Bb2等的名称命名。
现代命名法根据氨基酸序列,而不是根据昆虫靶的特异性,对Cry蛋白进行系统分类。对于许多已知毒素(但不包括各种蛋白内的等位基因变异)的分类方案概述于定期更新的表中,所述表可以得自英国苏塞克斯大学(Sussex University)生物学系的Neil Crickmore博士。
1.2.3生物杀虫多肽组合物
当报道了首次分离出对鞘翅目昆虫有毒的苏云金芽孢杆菌菌株(Krieg等,1983;1984)时,细胞晶体蛋白作为杀虫剂的应用就延伸至鳞翅目和双翅目幼虫以外。命名为苏云金芽孢杆菌粉虫变种(B.thuringiensis var.tenebrionis)的该菌株(描述于美国专利第4,766,203号,具体通过引用结合到本文中)据报道对鞘翅目昆虫赤杨紫跳虫(Agelastica alni)和马铃薯甲虫(Leptinotarsa decemlineata)的幼虫有毒性。
美国专利第5,024,837号也描述了杂种苏云金芽孢杆菌库尔斯塔克变种(B.thuringiensis var.kurstaki)对鳞翅目昆虫表现出活性的菌株。美国专利第4,797,279号(相应于EP 0221024)公开了一种杂种苏云金芽孢杆菌,其含有编码对鳞翅目有毒的晶体蛋白编码基因、得自苏云金芽孢杆菌库尔斯塔克变种的一种质粒和编码对鞘翅目有毒的晶体蛋白编码基因、得自苏云金芽孢杆菌粉虫变种的一种质粒。所述杂种苏云金芽孢杆菌菌株产生的晶体蛋白具有由苏云金芽孢杆菌库尔斯塔克变种和苏云金芽孢杆菌粉虫变种两者制备的晶体蛋白的特性。美国专利第4,910,016号(对应于EP 0303379)公开了鉴定为苏云金芽孢杆菌MT 104的苏云金芽孢杆菌分离株,其具有对鞘翅目和鳞翅目的杀虫活性。新近Osman等公开了一种天然苏云金芽孢杆菌分离株,它显示出对至少两个目的昆虫和对线虫的活性(WO 98/30700)。
二十多年来已经知道,包含Bt杀虫蛋白的组合物有效地为用这种组合物处理的植物提供保护抵抗虫害。新近分子遗传学技术已经使得能够由稳定插入植物基因组中的核苷酸序列表达Bt杀虫蛋白(Perlak等,Brown和Santino等)。然而,转基因在植物中的表达已经为提高昆虫对植物中产生的Bt的抗性提供了一个途径,因为植物尚未表现出产生高水平的杀虫蛋白。人们最初认为,植物和细菌系统之间基因结构和构筑的总体形态学差异或拓扑学差异是阻止Bt转基因在植物中超量表达的限制。根据Perlak等(美国专利第5,500,365号)和Brown等(美国专利第5,424,412号和第5,689,052号)公开的内容,这些差异看来似乎是被克服了,其中编码Bt杀虫蛋白、含有植物优选密码子的转基因表现出表达水平提高。另一方面,也认为将前毒素编码结构域截短至最短的仍编码杀虫蛋白的肽编码结构域,足以超越Bt编码转基因在植物中趋近于零的低表达水平的限制。在植物中来自转基因的Bt蛋白表达水平变化范围广,与用于表达的方法无关,而且累积的蛋白水平范围由最终不可测-2ppm至大约20-30ppm。然而,即使所有这些方法均在植物中提供提高水平的Bt蛋白累积,但没有一种方法所提供的表达水平可以确保在该转基因植物不必协同表达一个或多个其它杀虫毒素的情况下,或者在不协同局部应用另外补充的Bt或杀虫农药组合物的情况下,昆虫抗药性不会成为问题。
一段时间以来已经了解较高水平的Bt毒素累积对于防止昆虫对单种Bt毒素的抗药性的重要性。其中对数代昆虫应用针对Bt的选择的各种实验室研究已经证实了很少获得对Bt杀虫蛋白的抗性。应该强调的是,实验室条件代表相当低但恒定的选择压力条件使得已经经受杀虫压力并且产生随后世代昆虫的昆虫亚群能够存活。也将随后的世代保持在含低但恒定浓度的杀虫蛋白的培养基上。一般而言,用于选择压力的浓度范围为LC40至大约LC60,然而也已经测试了LC95浓度的抗药性产生。在大多数情况下,抗药性的获得是缓慢的,一般在适当的少数世代内产生,例如10-50代。然而,在使用相当高水平的毒素的情况下,或在提供多种毒素的情形下,没有观察到这种抗药性。
现在,表达商业有用水平的Bt杀虫蛋白的重组植物一般仅含有一个编码一类Bt的基因。预期这样的植物的使用持续时间非常有限有两种原因。第一,这些植物表达的杀虫蛋白水平不足,由于摄入的剂量毒素而导致不能确保所有所述植物组织接触并摄食所述植物组织的目标昆虫均死亡。第二,由于杀虫蛋白水平不足,因此不合理地增加了产生抗药性的潜力。这不是说这种转基因植物产生的毒素水平不够有效。这仅仅表示甚至当使用已经被修饰得符合植物优选序列的编码Btδ-内毒素的序列时,δ-内毒素在植物中的表达也受到限制。对于许多被修饰以在植物中表达的Bt δ-内毒素编码序列所观察到的一种限制是,已经不可能预测哪种Bt δ-内毒素会有效地在植物中表达。例如,Cry2Aa在棉花植株中的表达当定向至叶绿体时产生植物毒性,然而,密切相关的cry2Ab序列当定向至叶绿体时没有植物毒性。(Corbin等,美国专利申请序号09/186,002)。即使如此,在植物中产生的δ-内毒素蛋白水平仍不足以有效地抵抗所有所需的已知对特定类型和类别δ-内毒素敏感的目标昆虫种。
如上所述,产生对杀虫蛋白抗性的其它途径已经包括在植物中提高转基因表达水平的无效尝试。另一方面,可以将其它杀虫基因工程改造到植物中,以便协同表达多种毒素。这可能提供一种更为有效的方法,以延迟对任何一种Bt组合的抗药性产生,然而,这仍没有超越杀虫蛋白在重组植物中累积水平不足的限制。针对表达水平不足的另一替代方法是将编码Bt杀虫晶体蛋白的基因工程改造,这证明提高杀虫性能,或者具有更为广泛的宿主范围或者具有提高的生物活性,可以想象这将导致与天然形式的所述蛋白相比需要更少的重组蛋白以防治目标昆虫物种。
综合苏云金芽孢杆菌毒素的结构分析,再加上对这种结构、基序等的功能的研究,已经表明晶体蛋白内毒素的特定区域一般而言负责特定的功能。
已经发现例如得自Cry3Bb和Cry1Ac的结构域1负责离子通道活性,这是形成孔的第一步(Walters等,1993;Von Tersch等,1994)。已经发现结构域2和3负责受体结合和杀虫特异性(Aronson等,1995;Caramori,1991;Chen等,1993;de Maagd等,1996;Ge等,1991;Lee等,1992;Lee等,1995;Lu等,1994;Smedley和Ellar,1996;Smith和Ellar,1994;Rajamohan等,1995;Rajamohan等,1996;Wu和Dean,1996)。结构域2和3中的多个区域也可以影响某些毒素的离子通道活性(Chen等,1993,Wolfersberger等,1996;Von Tersch等,1994)。
令人遗憾的是,尽管许多研究人员已经尝试过,但几乎没有成功地制备出杀虫毒性提高的突变的晶体蛋白。在文献中的几乎所有遗传工程苏云金芽孢杆菌毒性的实例中,突变晶体蛋白的生物活性不如野生型蛋白,在许多情况下,该活性降低或完全被破坏(Almond和Dean,1993;Aronson等,1995;Chen等,1993,Chen等,1995;Ge等,1991;Kwak等,1995;Lu等,1994;Rajamohan等,1995;Rajamohan等,1996;Smedley和Ellar,1996;Smith和Ellar,1994;Wolfersberger等,1996;Wu和Aronson,1992)。然而,Van Rie等最近已经通过鉴定出一个杀虫活性提高的突变体完成了对鞘翅目杀虫活性提高的Cry3A δ-内毒素的改进。Van Rie等提出了一种鉴定杀虫活性提高的突变体的方法,该方法包括鉴定降低杀虫活性的氨基酸突变,通过定点诱变选择性地改变那些残基,以在这些位置加入一个或多个天然存在的20种氨基酸,并且用所得的各种形式的改变的蛋白饲喂玉米根叶甲或长角叶甲,以鉴定活性提高的形式(美国专利5,659,123)。尽管不能使用加上所述的方法鉴定所有的序列,但Van Rie成功地鉴定出活性提高的唯一一个序列,并且证明与天然序列相比突变形式的表达没有增加。
即使可以确定一段250-300个氨基酸的序列的通用功能,对于其活性毒素序列中有约650个氨基酸的晶体蛋白以及在该序列中每个位点的20种不同氨基酸的概率而言,任意产生成功的新结构的可能性是微小的。实际上,在晶体蛋白基因诱变方面的上述先有技术主要涉及了采用诱变以中断作用模式中的某些步骤,来研究所述晶体蛋白的结构和功能,而没有涉及基因工程改进的毒素。
总之,本领域中在研制杀虫活性提高的非天然产生的毒素方面有限的成功,已经抑制了该领域的进展,并且打击了对改进内毒素或晶体蛋白的探求计划。根据待改进的晶体蛋白和将导向的害虫,对改进晶体蛋白的成功的工程改造可以涉及不同的策略,而不是采用简单且可预测的标准。因此,本方法是高度以实验为根据的。
因此,显然对于提供改进的杀虫晶体蛋白而言,传统的重组DNA技术不是常规实验。在先有技术中缺乏的是产生遗传工程苏云金芽孢杆菌晶体蛋白的常规方法,其中所述遗传工程苏云金芽孢杆菌晶体蛋白的杀虫活性提高,特别是对范围广泛的鳞翅目、鞘翅目或双翅目害虫的毒性提高。在美国专利申请第08/993,170号(1997年12月18日;English等)和其它相关美国专利申请(08/993,722,1997年12月18日,English等;08/993,755,1997年12月18日,English等;和08/993,441,1997年12月18日,English等)和Van Rie等(美国专利5,659,123,1999年6月1日)中公开了涉及这些方面的方法和组合物。另外,重组改进的δ-内毒素当在植物中表达时仍然表达差和/或引起植物毒性效应,因此导致商业上有用的转基因事件的回收率更少。
2.0发明概述
本文描述了用于在转化植物中表达变异的Cry3苏云金芽孢杆菌δ-内毒素的新组合物和方法,所述内毒素对鞘翅目昆虫具有显著的抑制活性。这些组合物和方法有利地产生表达提高水平的苏云金芽孢杆菌Cry3 δ-内毒素的植物,该表达水平是先前在Cry δ-内毒素方面没有观察到的。Cry3 δ-内毒素表达水平的提高反映在在单个转基因插入事件中达到较高的最大表达水平。意外的是,本文公开的特定组合物导致转基因事件回收率的百分比提高,这表明表达水平远超出防治鞘翅目昆虫必需的表达阈水平,并且提供能够支持抗药性管理策略的足够的毒素水平。由于当在转基因植物中表达时,Cry3 δ-内毒素比通常用来防治鳞翅目或双翅目目标害虫的其它δ-内毒素的效力低,因此在分离表达Cry3 δ-内毒素、表现出商业有用水平的目标昆虫防治的转基因事件方面,达到Cry3 δ-内毒素的较高最大表达水平和回收更多的具有有效表达水平的转基因事件均是关键。
本发明解决的对先有技术的另一限制是产生对植物表达提供的δ-内毒素的昆虫抗药性。具体地说,本发明提供一种优越的策略,用于通过提高δ-内毒素在植物细胞中的累积,以使所述δ-内毒素在植物中保持在蛋白阈水平(通常以百万分率(ppm)计量)以上,来延迟或消除对Cry3 δ-内毒素抗性的产生。根据本领域先前已经观察到的,δ-内毒素表达的提高也用来指表达的增加,认为δ-内毒素表达的提高导致延迟昆虫抗药性的发生,并因此扩大了植物表达的δ-内毒素作为昆虫防治剂的应用范围。
在优选实施方案中,本发明提供分离和纯化的新Cry3B δ-内毒素蛋白,所述蛋白针对防治鞘翅目害虫物种表现出特别有效的杀虫活性。这类本发明的δ-内毒素蛋白通过由分离、纯化并改进或增强的DNA或多核苷酸序列表达而提供,所述DNA或多核苷酸序列每个都包含置于优选植物功能性基因表达元件(例如启动子、非翻译前导序列、内含子和转录终止和聚腺苷酸化序列)控制下的Cry3 δ-内毒素编码序列。也提供某些优选的DNA或多核苷酸序列用于质体或叶绿体导向蛋白序列。本发明优选的DNA构成物包括编码表现出鞘翅目抑制活性或鞘翅目防治活性的Cry 3δ-内毒素的构成物。在一个说明性实施方案中,将多核苷酸序列装配为表达盒用于引入植物基因组DNA中,其中所述表达盒包含Cyr3Bb δ-内毒素变异体编码序列,所述编码序列有效连接于包括启动子、非翻译前导序列、内含子和转录终止和聚腺苷酸化序列的序列。具体地说,转基因定位于植物有效的多核苷酸表达盒或包含表达盒的多核苷酸序列中,所述表达盒包含多种基因元件,所述基因元件在植物细胞中起作用以由操作性定位于所述表达盒中的核酸编码序列(所述转基因)表达所需蛋白。所述编码序列的上游连接于至少一个启动子序列、非翻译前导序列(UTL)、内含子序列,在某些指定实施方案中符合读框地连接于编码质体或叶绿体导向肽的序列。所述编码序列的下游也连接于至少一个在植物中起作用的转录终止和聚腺苷酸化序列。本文表明,包含这种表达盒的多核苷酸序列提高由该盒在内编码的所需蛋白的表达,提高利用所述多核苷酸序列在植物转化中获得的事件数,其中所述提高数量的事件包括位于所述表达盒中的所需转基因,并表现出一个或多个所需蛋白表达水平的提高。此外意外地观察到所述提高数量的事件以高于2-5ppm总细胞蛋白的水平表达所需蛋白,但一般低于200-500ppm总细胞蛋白。甚至更令人惊讶的是,特别是某些事件表达所需蛋白的水平远高于500ppm。所示的实施方案公开了包含分离和纯化的SEQ ID NO:9的编码变异Cry3Bb δ-内毒素的序列,为描述质粒pMON25096的图1所述序列从NcoI至EcoRI的序列。另外的实施方案公开了包含分离和纯化的SEQ ID NO:11的变异Cry3Bb δ-内毒素的编码序列,为描述质粒pMON33741的图2所述序列从NcoI至EcoRI的序列。然而,考虑到按照本发明的实施方案,可以采用表现出的实际鞘翅目抑制活性或鞘翅目防治活性高于或等于本文公开序列的任何Cry3 δ-内毒素,特别优选与Cry3Bb具有大致同源性的那些Cry3蛋白。
在一个优选实施方案中,本发明提供已经用本发明的DNA构成物或表达盒转化的转基因植物,所述DNA构成物或表达盒由所述植物以意想不到的高水平表达和翻译,导致出乎意外的高水平的δ-内毒素累积。可以按照本文公开的方法并用本文公开的DNA构成物转化单子叶植物。然而,也设想了本领域技术人员也可以用本文公开的DNA序列转化双子叶植物,以获得提供意想不到的有用水平的昆虫抗性、而没有产生对所述δ-内毒素的昆虫抗药性的风险的转基因植物。在再一优选的实施方案中,可以制备通过本发明转化的植物,制备方法包括获得包含于所述表达盒中的所述分离和纯化的DNA构成物,然后用所述构成物转化所述植物,以使所述植物表达所述构成物编码的蛋白。或者在再一优选实施方案中,可以制备通过本发明转化的植物,制备方法包括将所述分离和纯化的DNA构成物引入有转化能力的农杆菌菌株中,然后用含有所述构成物的农杆菌菌株转化所述植物,以使所述植物表达所述构成物编码的蛋白。在本文中可观察到,采用所公开的组合物和方法转化植物,意想不到地导致表现出转基因表达的转化体出现率的提高以及表达出意想不到高的绝对转基因表达水平的单个转基因事件回收率的提高。
设想了,在所公开的发明中观察到的表达水平的提高将便于减少产生对呈递给目标害虫的Bt δ-内毒素的昆虫抗药性。达到这一点,可以通过仅用优选的DNA构成物转化植物,以达到Cry3高表达率,或者同时通过将目标昆虫暴露于所公开的Cry3δ-内毒素与有效防治鞘翅目物种的其它组合物,其中例如Cry3B的变异体(English等,WO99/31248)、变异Cry3A或变异Cry3D(美国专利5,659,123)、CryET33和CryET34(Donovan等,WO 97/17600)、CryET70(美国申请序号09/184,748;Mettus等,1998年11月2日)、Cry6A、Cry6B、Cry8B(美国专利第5,227,905号)、CryET29(Rupar等,WO 97/21587)、杀虫酰基脂质水解酶、氨基酸氧化酶和tedanalactam合酶的组合(Romano等,美国申请序号09/063,733,于1998年4月21日申请)或杀虫蛋白,例如VIP1(Gay,WO 97/26339;Gourlet等,WO 98/02453)和VIP3(Estruch等,美国专利第5,877,012;1999)等。敏感的目标昆虫包括叶甲(Diabroticusspp.)、玉蜀黍(Zea mays)中的捻转血矛线虫(Wire Worm)和马铃薯(Solanum tuberosum)中的马铃薯甲虫(Leptinotarsa decemlineata)(Say)和棉属(Gossypium)物种(棉花)中的棉铃象甲。
因此设想了,本发明公开的组合物和方法将提供优于先有技术的许多优点,包括以上具体概述的那些优点。其它优点包括改进的敏感目标害虫的防治和达到全期抵抗昆虫病原体的保护。本发明的另一优点是为减少转基因事件的数目提供保证,所述转基因事件必须经筛选,以鉴定含有有益水平的一个或多个昆虫防治组合物的转基因事件。本发明也包括用本文公开的DNA构成物转化的细胞。此外,设想了转化载体例如质粒、杆粒、人工染色体、病毒载体等作为元件,用于将本发明的核苷酸组合物传递到设想的细胞中,以获得转化的宿主细胞(可以是原核细胞也可以是真核细胞),所述转化的宿主细胞表达本文公开的新DNA构成物编码的δ-内毒素蛋白。还设想了在某些情况下,通过稳定整合本文公开的编码鞘翅目抑制性或防治性苏云金芽孢杆菌δ-内毒素或其变异体的表达盒,增大本发明转基因植物的基因组。此外,将一个以上的编码杀虫组合物的转基因加入转化宿主植物细胞的核基因组中,或者加入转化宿主植物细胞的叶绿体或质体基因组中。设想了将一种以上的编码杀虫晶体蛋白的多核苷酸加入植物细胞的基因组中,应该最好在所述细胞包含的核苷酸序列中具有两个或甚至两个以上的编码杀虫蛋白或其它植物有益蛋白的序列。可以以前体、前毒素或通过柔性氨基酸接头序列连接的或由本领域熟知的蛋白酶特异性切割序列连接的有益蛋白的融合体表达这种重组衍生的蛋白。也设想了包含杀虫蛋白融合体的嵌合体。可以人工操作转基因植物宿主细胞的后代,以产生表现出杀虫特性改进的重组全株,并且本文表明所述重组核苷酸序列可遗传。所述元件的遗传性是本发明的优选方面,因此所述表达元件能够传递至原始转化宿主植物细胞的直系后代,首先产生其组成细胞表达所述所需转基因的稳定转化的植物,尽管一般可以通过选择用于给定表达盒中的植物有效启动子的选择,可以选择性地操作组织特异性表达,如上所述。转化的植物产生含可遗传表达盒的种子,所述种子因此以线性(lineal)方式产生含有所述表达盒的植物,所述方式一般为孟德尔方式,特别是当按照本领域众所周知的方法自交时。
3.0附图简述
图1图解说明质粒pMON25096。
图2图解说明质粒pMON33741。
图3图解说明质粒pMON25097。
图4图解说明质粒pMON33748。
图5说明SEQ ID NO:9中所示变异的Cry3Bb.11098杀虫蛋白的核苷酸和氨基酸序列翻译。
图6说明SEQ ID NO:11中所示变异的Cry3Bb.11231杀虫蛋白的核苷酸和氨基酸序列翻译。
4.0发明详述
提供以下本发明的详细描述,有助于本领域技术人员实施本发明。虽然如此,以下详述不应被解释为不当地限制本发明,因为本领域一般技术人员在不违背本发明的精神和范围的情况下,可以在本文讨论的实施方案中作出各种修改和变化。
4.1定义
以下词语具有下文陈述的含义。
生物功能性等同物:在本发明杀虫蛋白方面本文使用的这种等同物是这样的肽、多肽和蛋白,它们所含的序列或部分表现出与本发明的新肽(例如Cry3Bb.11231)有序列相似性,并且表现出与本文公开的多肽相同或相似的功能特性,包括杀虫活性。生物等同物也包括与针对Cry3Bb产生的抗体反应(即与其特异性结合)、并表现出相同或相似杀虫活性的肽、多肽和蛋白,所述抗体包括单克隆抗体和多克隆抗体。
在农业方面的对抗或防治昆虫损害是指以相对单位计的减少害虫侵害引起的对作物或植物部分的损害。更概括地讲,该短语是指由于在任何特定位置存在不希望有的昆虫所引起的副作用的减小。
事件是指得自以下之一的转基因植物:
1.外源DNA插入核基因组DNA中的一个或多个独特位点;
2.外源DNA插入质体、叶绿体或线粒体基因组中的一个或多个独特位点;
3.将稳定的可遗传的外遗传(epigenetic)载体引入质体、叶绿体或线粒体的胞质中;
4.任何一种上述方法的组合。
得自这些方法的事件含有表达本文所述的所需编码序列的表达盒。事件也称为ITE(独立转化事件)。
表达:由在植物细胞中起作用以达到产生所需产物的遗传序列控制的核酸编码序列经历的胞内过程的组合,所述胞内过程包括转录、翻译和其它胞内蛋白和RNA加工和稳定功能,所述核酸编码序列诸如编码RNA分子的结构基因、或用作反转录酶或酶复合物底物的RNA分子。
改进或增强的表达盒是指与所述杀虫蛋白编码序列连接的遗传因子的特定组合和顺序,当所述杀虫蛋白编码序列在植物细胞中表达时:
在植物、植物组织或植物细胞中产生令人惊讶的平均水平的所表达的蛋白;
产生意想不到的数目的表达令人惊讶的较高平均水平杀虫蛋白的转化事件;
产生表达意想不到的高水平杀虫蛋白的单个植物、植物组织或植物细胞;和
产生表达杀虫蛋白的植物,其杀虫蛋白表达水平是意想不到的,可有效防治或抵抗鞘翅目害虫并防止鞘翅目害虫产生对特定杀虫蛋白的抗性。
杀虫多肽是指具有杀虫特性的多肽,例如表现出抑制目标害虫生长、发育、生存力或生殖力的特性的多肽。
有效连接的:以线性方式顺序连接核酸序列或多核苷酸序列,以使其中一个序列的特性影响另一序列的表达特性。例如有效连接于其它多核苷酸序列(它可以包括操纵基因序列或增强子序列、非翻译或翻译的前导序列、内含子序列、结构基因编码序列、非结构基因、转录和翻译终止序列、以及聚腺苷酸化序列)的启动子影响编码序列或非编码序列的表达,无论所述产物是RNA、蛋白,还是其它产物。同样,内含子或非翻译前导序列可以影响与其有效连接的序列的表达和稳定性,结构基因序列或非结构基因序列可以受在其序列上游、序列中或下游中有效连接的元件的影响。
植物可表达的编码区:由于含有促进其表达的典型的植物调节元件而可在植物中表达的氨基酸编码区或可读框(ORF),在考虑到异源编码区的情况下,它们通常包括对所述编码序列的改变,以便利用植物优选的密码子来取代非优选的密码子。
质体转运肽:可用于将所连接的氨基酸(例如蛋白融合体)导向亚细胞区室或细胞器(例如质体或叶绿体)的任何氨基酸序列。
多核苷酸序列:具有4个或4个以上连续核苷酸或核糖核苷酸的任何DNA或RNA序列。一般而言,本文公开的多核苷酸序列包括至少50个或50个以上的多核苷酸或核糖核苷酸。
后代:“后代”包括转基因植物的任何苗种或后代,或含有有效形式的所述转基因的任何后来的植物。后代不限于一个世代,而是包括所述转化体的后代,只要它们含有或表达所述转基因。含有转基因胚的种子以及得自所述转基因植物、在孟德尔分离后继续含有所述转基因的种子和它们的苗种或后代,也是本发明的重要部分。
启动子:DNA序列或一组DNA序列上的识别位点,它为优选的多核苷酸序列提供表达控制元件,并且RNA聚合酶与其特异性结合并起动所述优选序列的RNA合成(转录)。
R0是得自培养的植物组织或细胞转化的原代再生植株。得自所述R0的后来的后代或世代称为R1(第一代)、R2(第二代)等。
再生:由植物细胞或一组植物细胞(例如植物原生质体、胚、愈伤组织或外植体)培育植株的过程。
结构编码序列是指编码肽、多肽或蛋白的DNA序列,所述肽、多肽或蛋白的DNA序列是由细胞在从所述结构编码序列转录出信使RNA(mRNA)、然后由mRNA翻译出所需肽、多肽或蛋白产物后而制备的。
结构基因:含有通过转录和翻译产生所需多肽而表达的所需多肽的编码序列的基因或多核苷酸序列。
合成基因:编码本发明的苏云金芽孢杆菌δ-内毒素的合成基因是其制备方式涉及改变天然存在的δ-内毒素基因的编码序列的任何种类基因分离或操作的那些合成基因。这包括从天然存在的状态分离所述基因,如通过密码子修饰(如本文所述)进行基因操作或定点诱变(如本文所述)、将所述基因截短或任何其它的操作或分离方法。合成基因也可以是已知不是天然存在的、但其编码有用的多肽或其它产物例如tRNA或反义多核苷酸的多核苷酸序列。即非天然存在的多核苷酸序列。
大致同源性:当本文使用该术语时,是指其同源性约为86%至约90%、至约95%、至约99%的核酸序列或多肽序列。更具体地讲,本发明人设想了与多肽的参比核酸序列的同源性约为86、87、88、89、90、91、92、93、94、95、96、97、98和99百分比的大致同源性。
终止子:在真核生物核基因表达过程方面,为有效的3’端转录终止和聚腺苷酸化序列。在原核生物基因表达方面,并且包括质体或叶绿体基因表达时,为可读框3’端的有效DNA序列,对于ORF表达蛋白产物而言,它为与所述ORF的编码序列符合读框的至少一个终止密码子,也可以在其后接一个编码转录终止信号的DNA序列,所述转录终止信号可以引起翻译的RNA或mRNA产物形成发夹结构或可能与或不与一种或多种可溶性结构蛋白一起作用引起转录中断的其它三维结构。
转化:将外源多核苷酸序列(例如载体,或重组或非重组DNA或RNA分子)引入细胞或原生质体中的方法,其中所述外源多核苷酸掺入可遗传的遗传因子中,或能够自主复制,并因此稳定地保持在该细胞或原生质体中以及保持在该细胞或原生质体的后代中。
转化的细胞:含有可遗传的、通过引入一种或多种外源DNA分子而改变的遗传因子的细胞。即转基因细胞。典型的转化细胞或转基因细胞包括衍生自转化的植物细胞和特定细胞的植物愈伤组织,所述特定细胞诸如叶片、根、茎的细胞,例如得自转基因植物的体细胞或生殖(胚)细胞。
转基因:包含希望在受体细胞、组织或生物中表达的ORF的基因构成物、表达盒或DNA区段或序列。这可以包括完整的质粒或其它载体,或可以仅仅包括转移的DNA序列的功能性编码序列、区域、结构域或区段。
转基因事件:得自制备或构建以含有一个或多个外源DNA分子的植物细胞或原生质体的植物或其后代,所述外源DNA分子插入所述植物细胞的细胞核基因组或其它基因组中、或引入并稳定保持在所述质体、叶绿体或线粒体胞质中,并且赋予所述植物或其后代某些物理上可检测的表型。
转基因植物:已经被遗传修饰以含有外源DNA序列并将其表达为或者蛋白或者核酸的植物或其后代。如本文具体例举的,遗传修饰转基因玉米植株,使其含有并表达有效连接于转录控制序列并在其调控之下的至少一种异源DNA序列,它们一起在植物细胞或组织中或在整株植株中起作用,以完成由编码杀虫δ-内毒素蛋白或其氨基酸序列变异体的核酸序列的表达。转基因植物也可以称为转化植物。转基因植物也是指原始转基因植物的后代,其中那些后代含有并表达在本文所述植物可表达转录控制序列的调节控制下的所述异源编码序列。
载体:能够在宿主细胞中复制和/或可以有效连接另一多核苷酸序列以导致所连接的序列复制的多核苷酸。质粒是一种典型的载体。
本发明公开了包含编码苏云金芽孢杆菌δ-内毒素的多核苷酸序列的新DNA构成物。构建合成的苏云金芽孢杆菌基因以及使其在植物表达的方法是本领域技术人员众所周知的,详述于美国专利5,500,365。本发明设想了应用Cry3B苏云金芽孢杆菌基因转化单子叶植物和双子叶植物。为了增强这些基因的表达,本发明提供了DNA构成物,所述DNA构成物包含编码质体导向肽的多核苷酸区段以及非翻译前导序列、植物功能性内含子序列和转录终止和聚腺苷酸化序列的各种组合,所述编码质体导向肽的多核苷酸区段位于编码所需苏云金芽孢杆菌δ-内毒素的多核苷酸序列的上游,并且符合其读框。
一方面,本发明提供的核苷酸序列信息可供用于制备有能力特异性地杂交于本文公开的选定多核苷酸的基因序列的相对短的DNA序列。在这些方面,根据关于编码鞘翅目抑制性Cry3B δ-内毒素多肽的选定多肽序列的考虑,制备合适长度的核酸探针,其中所述多肽序列例如示于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10和SEQ ID NO:12的多肽序列。也可以根据关于编码质体导向肽的选定多核苷酸序列诸如SEQ ID NO:26所示序列的考虑,制备这些核酸探针。这种核酸探针特异性地杂交于编码δ-内毒素多肽或质体导向肽序列的能力,为其在多个实施方案中提供了其特定的用途。最为重要的是,所述探针可以用于多种测定中,以检测给定样品中互补序列的存在。
在某些实施方案中,最好是使用寡核苷酸引物。用本发明的多核苷酸设计这种引物的序列,用于采用热扩增技术检测、扩增苏云金芽孢杆菌的晶体蛋白基因的限定区段或使所述区段突变。所述方法也可以用来检测、扩增编码质体导向肽的多核苷酸的限定区段或使所述区段突变。与编码本发明的δ-内毒素多肽和质体导向肽的多核苷酸相关的基因区段也可以采用这种引物和热扩增法来扩增。
为了提供按照本发明的某些优点,用于杂交研究或测定的优选核酸序列包括至少长约14-30个核苷酸左右、与编码晶体蛋白的核苷酸序列互补的多核苷酸序列;或至少长约14-30个核苷酸左右、与编码质体导向肽的核苷酸序列互补的多核苷酸序列。
大小至少长14个核苷酸有助于确保所述片段具有足够的大小以稳定且选择性地形成双链体分子。一般优选在长14个碱基以上的区段内具有互补序列的分子。为了提高所述杂交体的稳定性和选择性,并由此提高所获得的特定杂交分子的质量和程度,人们一般最好设计具有14-20个核苷酸、需要时甚至更长的基因互补序列的核酸分子。例如通过直接用化学方法合成这样的区段,通过应用核酸复制技术,例如美国专利4,683,195和4,683,202的PCRTM技术,或通过从含有合适插入片段和合适限制位点的重组质粒切下选定的DNA片段,可以容易地制备这样的区段。
本发明也设想了包含本发明多核苷酸的表达载体。因此,在一个实施方案中,表达载体是一种分离并纯化的DNA分子,其包含有效连接于编码本发明多肽的编码区的启动子,所述编码区有效连接于转录终止区,由此所述启动子驱动所述编码区的转录。所述编码区可以包括编码苏云金芽孢杆菌δ-内毒素的区段和编码质体导向肽的区段。包含所述表达载体的DNA分子也可以含有功能性内含子。本文所用的术语“操作性连接的”或“有效连接的”是指启动子与编码区连接,其连接方式使得该启动子控制并调节所述编码区的转录。操作性地连接启动子和编码区以调节上游和下游的方法是本领域众所周知的。
优选的植物转化载体包括衍生自根癌农杆菌(Agrobacteriumtumefaciens)Ti质粒的那些载体以及例如Herrera-Estrella(1983),Bevan(1983),Klee(1985)和欧洲专利申请第EO 0120516号公开的那些载体。
在细菌中有功能的启动子是本领域熟知的。用于苏云金芽孢杆菌晶体蛋白的典型和优选的启动子包括sigA、sigE和sigK基因的启动子。或者,可以使用衍生自苏云金芽孢杆菌δ-内毒素蛋白编码序列的天然的、诱变的、异源的或重组的启动子。
当将用本发明的表达载体转化植物时,选择能够在该特定植物种中驱动表达的启动子。在不同植物种中有功能的启动子也是本领域熟知的。可用于在植物中表达多肽编码序列的启动子是如描述的诱导型、合成的或组成型的那些启动子(Paszkowski等,1984;Odell等,1985)和/或时序调节、空间调节和时空调节的那些启动子(Chau等,1989)。优选的启动子包括增强的CaMV35S启动子和FMV35S启动子。其它启动子包括POX启动子、ScbDNA病毒早期启动子和黄色斑驳病毒(yellow mottle virus)启动子。
按照本发明,设计以特异性地增强所述多肽在转化植物中的表达的表达载体可以包括编码质体导向肽(PTP)的某些区域。这些区域便于涉及所编码蛋白转录、翻译和表达的细胞过程作好准备,所编码蛋白当与某些苏云金芽孢杆菌δ-内毒素结合时可完全被利用。这种质体导向肽以多种方式起作用,例如通过将所表达的蛋白转运至其最为有效操作的细胞结构,或通过将所表达的蛋白转运至表达所必需的细胞过程集中的细胞区域。
就Cry3B而言,在获得具有CRW控制的转基因玉米方面,提高的表达是关键,因为Cry3B对CRW的LC50显著高于目前用来防治害虫例如马铃薯中的马铃薯甲虫的苏云金芽孢杆菌毒素(Cry3A)和用来防治玉米中的欧洲玉米螟的苏云金芽孢杆菌毒素(Cry1Ab)的LC50。
提高的表达也尤其有价值,因为它通过高剂量策略提供针对产生抗药性的额外保护(McGaughey和Whalon,1993;Roush,1994)。高水平表达甚至是更为需要的,因为它在杀虫基因的表达由于环境条件而降低的情况下提供持续的昆虫防护。另外并且是意想不到的,用表达鞘翅目抑制性Cry3B或变异体蛋白的载体转化的玉米植株表现出正常的生长和发育。
质体或叶绿体导向肽(CTP)的一个实例是叶绿体导向肽。已经发现叶绿体导向肽在草甘膦抗性选择标记系统中特别有用。在该系统中,经转化表达赋予草甘膦抗性的蛋白的植物用将所述肽导向细胞的叶绿体的PTP转化。草甘膦抑制莽草酸途径,莽草酸途径导致包括氨基酸和维生素在内的芳族化合物的生物合成。具体地说,草甘膦通过抑制5-烯酰丙酮酰-3-磷酸莽草酸合酶(EPSP合酶或EPSPS),抑制磷酸烯醇丙酮酸和3-磷酸莽草酸转化为5-烯酰丙酮酰-3-磷酸莽草酸。通过插入编码该酶的转基因提供的补充的EPSPS,使得所述细胞可以抗草甘膦的效应。因此,由于除草剂草甘膦的作用是通过特别是在所述细胞的叶绿体中中断芳族氨基酸的生物合成而杀伤所述细胞,因此CTP通过将所述细胞表达的草甘膦抗性酶集中于叶绿体中,即集中于所述细胞的靶细胞器中,提供对该除草剂的增强抗性。典型的除草剂抗性酶包括上述的EPSPS、草甘膦氧化还原酶(GOX)和aro-A基因(美国专利第4,535,060号)。
CTP可以将蛋白导向叶绿体和其它质体。例如,所述靶细胞器可以是造粉体。本发明优选的CTP包括导向叶绿体以及其它质体的那些CTP。优选CTP的具体实例包括玉米RUBISCO SSU蛋白CTP和功能相关的肽。典型的CTP多肽示于SEQ ID NO:26中。编码该CTP多肽的多核苷酸序列示于SEQ ID NO:25中。
以双链DNA形式存在的基因的表达包括由RNA聚合酶从所述DNA的编码链转录出信使RNA(mRNA),随后在细胞核中加工mRNA初级转录物。由DNA转录为mRNA由通常称为“启动子”的DNA区调节。启动子区含有向RNA聚合酶发送信号以使其与所述DNA结合并用其中一条DNA链作为模板起动mRNA的转录,以产生相应的RNA链的碱基序列。所选择的具体启动子应该能够引起足够的所述酶编码序列的表达,以导致产生有效杀虫量的苏云金芽孢杆菌蛋白。
本发明的嵌合植物基因的3’非翻译区也含有一个聚腺苷酸化信号,该信号在植物中起作用,以使得腺苷酸核苷酸添加至所述RNA的3’端。优选的3’区的实例是(1)含有农杆菌肿瘤诱导(Ti)质粒基因例如胭脂碱合酶(NOS)基因的聚腺苷酸化信号的3’转录的非翻译区,和(2)植物基因例如豌豆ssRUBISCO E9基因的3’端(Fischhoff等,1987)。
根据启动子将所转化的植物细胞或转基因植物的转录活性导向编码区的能力来选择启动子,以确保所述酶编码序列的足够表达,以导致产生杀虫量的苏云金芽孢杆菌蛋白。可以由各种各样的启动子在植物组织中驱动结构基因的表达。启动子可以是近组成型(near-constitutive)(即它们在所有组织中均驱动转基因的转录),例如CaMV35S启动子;或影响双子叶植物或单子叶植物的组织特异性或发育特异性启动子。当启动子为近组成型启动子,例如为CaMV35S或FMV35S时,在许多转化植物组织和大多数植物器官(例如愈伤组织、叶片、种子和根)中发现多肽表达的增加。增强的或双份形式的CaMV35S和FMV35S启动子在本发明的实施中特别有用(Kay等,1987;Rogers,美国专利5,378,619)。已经证明串联重复的增强子序列具有特别的重要性,例如如Neuhaus等所述(在转基因烟草中来自启动子AS-1的组织特异性表达。Plant Cell 6:827-834;1994)。
本领域技术人员会认识到,有许多启动子在植物中有活性,并且已经在文献中进行了描述。这样的启动子可以得自植物或植物病毒,包括但不限于胭脂碱合酶(NOS)启动子和章鱼碱合酶(OCS)启动子(它们载于根癌农杆菌(A.tumefaciens)的肿瘤诱导质粒上)、花椰菜花叶病毒(CaMV)19S和35S启动子、来自核酮糖1,5-二磷酸羧化酶(ssRUBISCO,一种非常丰富的植物多肽)小亚基的光诱导型启动子、水稻Actl启动子、POX启动子、黄色斑驳病毒启动子、ScBV病毒早期启动子、玄参花叶病毒(FMV)35S启动子和AS4 35S启动子(如Neuhaus等所述的来自与多重串联的as-1序列连接的35S启动子的根增强表达)。所有这些启动子已经用来创造各种类型的DNA构成物,所述构成物已经在植物中表达(参见例如McElroy等,1990,美国专利5,463,175)。
另外,也可能最好采用含有组织特异性启动子的植物整合型载体,促使苏云金芽孢杆菌δ-内毒素在植物的特定组织中表达。具体的靶组织包括叶片、茎、根、块茎、种子、果实等,所选择的启动子应该具有所需的组织和发育特异性。因此,应该通过选择具有所需组织表达能力和接近的启动子强度的启动子,并选择在所述靶组织中产生所需杀虫活性的转化体,使启动子功能最佳化。在异源结构基因在植物中表达方面,这种来自转化体库(pool)的选择方法是常规使用的,因为在含有同一异源基因的转化体之间有由于在所述植物基因组中基因插入位点而引起的变异(通常称为“位点效应”)。除已知引起DNA在植物细胞中转录(组成型或组织特异性的)的启动子外,可以通过在植物cDNA文库中筛选选择性或优选在靶组织中表达的基因,鉴定其它启动子以用于本发明中,然后确定所述启动子区。
典型的组织特异性启动子是凝集素启动子,它是种子组织特异性的。大豆种子的凝集素蛋白由仅在种子成熟期间表达的单基因(Lel)编码,并且占总种子mRNA的约2-5%。已经全面表征了凝集素基因和种子特异性启动子,并用来指导转基因烟草植株中的种子特异性表达(Vodkin等,1983;Lindstrom等,1990)。可以将含有编码目的多肽的编码区的表达载体工程改造,以将其置于所述凝集素启动子控制之下,并且可以采用例如原生质体转化法(Dhir等,1991),将该载体引入植物中。所述多肽的表达则应特异性地导向转基因植物的种子。
由用组织特异性启动子转化的植物细胞产生的本发明转基因植物可以与由用不同的组织特异性启动子转化的植物细胞产生的第二转基因植物杂交,以产生在一个以上的特定组织中表现出转化效应的杂种转基因植物。
其它典型的组织特异性启动子是玉米蔗糖合成酶1(Yang等,1990)、玉米乙醇脱氢酶1(Vogel等,1989)、玉米集光复合体(Simpson,1986)、玉米热激蛋白(Odell等,1985)、豌豆小亚基RuBP羧化酶(Poulsen等,1986;Cashmore等,1983)、Ti质粒甘露碱合酶(McBride和Summerfelt,1990)、Ti质粒胭脂碱合酶(Langride等,1989)、矮牵牛查耳酮异构酶(Van Tunen等,1989)、大豆富甘氨酸蛋白1(Keller等,1989)、CaMV 35s转录物(Odell等,1985)和马铃薯patatin(Wenzler等,1989)。优选的启动子是花椰菜花叶病毒(CaMV 35S)启动子和S-E9小亚基RuBP羧化酶启动子。
如有需要,可以对用于本发明DNA构成物中的启动子进行修饰,以影响其控制特性。例如,可以将CaMV35S启动子连接于ssRUBISCO基因代表在缺乏光时表达ssRUBISCO的部分,以产生在叶片有活性而在根中无活性的启动子。所得的嵌合启动子可以如本文所述使用。为了这种描述,短语“CaMV35S”启动子因此包括CaMV35S启动子的变异,例如由于与操纵基因区连接、随机诱变或控制诱变等得到的启动子。此外,可以将所述启动子改变,以含有多个“增强子序列”,以有助于提高基因表达。这类增强子序列的实例已经由Kay等(1987)和Neuhaus等(1994)报道。
由本发明DNA构成物产生的RNA也含有5’非翻译前导序列。该序列可以得自选择用来表达所述基因的启动子,并且可以对其进行特异性地修饰,以增加所述mRNA的翻译。5’非翻译区也可以得自病毒RNA、合适的真核基因或合成的基因序列。本发明不限于其中非翻译区得自伴随所述启动子序列的5’非翻译序列的构成物。如下所示,可用于本发明的植物基因前导序列是矮牵牛热激蛋白70(hsp70)前导序列(Winter等,1988)、小麦CAB前导序列或小麦PER前导序列。
本发明的一个典型实施方案包括所述苏云金芽孢杆菌的质体导向序列。这类质体导向序列已经从许多核编码的植物基因中分离出来,并且已经显示引导胞质合成的蛋白输入质体(Keegstra和Olsen的综述,1989)。本领域熟知的各种各样的质体导向序列可以用于实施本发明,它们包括但不限于ADPGPP、EPSP合酶或ssBUBISCO。在可选择的优选实施方案中,用于单子叶作物的质体导向序列(肽和核酸)可以包含编码含内含子的序列的基因组片段以及所编码的质体导向序列中的重复(duplicated)蛋白酶切位点。
最优选的CTP编码核酸序列在此称为ZmSSU CTP(SEQ ID NO:25),它包含一个含内含子序列的基因组片段以及一个在编码的质体导向序列中的重复蛋白酶切位点,衍生自质体导向序列zmS1(Russell等,1993)。zmSSU CTP肽序列(SEQ ID NO:26)与所述序列氨基末端的直接翻译融合,已经表明可用于在转基因玉米中获得提高水平的所述多肽。可以通过将工程加入zmSSU CTP序列3’(C末端编码)末端的NcoI位点与工程加入cry3B编码序列或变异体编码序列N末端编码末端的5’NcoI位点连接,实现zmSSU CTP核酸序列(SEQ ID NO:25)与cry3b基因(SEQ ID NO:1)或基因变异体符合读框的融合。
用于双子叶作物的优选CTP序列包含一个含叶绿体导向肽序列的基因组编码片段,所述叶绿体导向肽序列得自拟南芥(Arabidopsisthaliana)的EPSP合酶基因,其中豌豆ssRUBISCO CTP的转运肽切割位点取代了所述天然EPSP合酶CTP的切割位点(Klee等,1987)。
如上所述,本发明的嵌合植物基因的3’非翻译区含有一个在植物中起作用的聚腺苷酸化信号,使得腺苷酸核苷酸添加至所述RNA的3’端。优选的3’区的实例是(1)3’转录的非翻译区,含有农杆菌肿瘤诱导(Ti)质粒基因如胭脂碱合酶(NOS)基因的聚腺苷酸化信号,和(2)植物基因,例如豌豆ssRUBISCO E9基因(Fischhoff等,1987)。
为了使在单子叶植物中的表达最佳化,在所述DNA表达构成物中也可以包含内含子。这种内含子通常置于非翻译序列中mRNA 5’端附近。这种内含子可以得自但不限于以下一组内含子:玉米热激蛋白(HSP)70内含子(美国专利5,424,412;1995)、水稻Actl内含子(McElroy等,1990)、Adh内含子1(Callis等,1987)或蔗糖合酶内含子(Vasil等,1989)。正如本文所示,玉米HSP70内含子(SEQ ID NO:33)和水稻肌动蛋白内含子(SEQ ID NO:32)在本发明中特别有用。
RNA聚合酶经由编码DNA序列转录至发生聚腺苷酸化的位点。通常,位于聚腺苷酸化位点下游数百个碱基对的DNA序列用来终止转录。那些DNA序列在此称为转录终止区。转录的信使RNA(mRNA)的有效聚腺苷酸化需要那些区。
构成物通常包括目的基因与用作终止转录的信号的3’端DNA序列,并使得产生的mRNA聚腺苷酸化。最优选的3’元件设想为得自根癌农杆菌胭脂碱合酶基因的那些3’元件(nos 3’端)(Bevan等,1983)、根癌农杆菌章鱼碱合酶基因T7转录物的终止子和马铃薯或番茄的蛋白酶抑制剂i或ii基因的3’端。如有需要,可以再包括调节元件例如TMVΩ元件(Gallie等,1989)。
可以调节基因表达的另一种类型的元件是转录起始位点和编码序列起点之间的DNA序列,称为非翻译前导序列。前导序列可以影响基因表达。可以进行前导序列的编译(compilation),以预测最适或亚适序列,并产生“共有序列”和优选的前导序列(Joshi,1987)。设想优选的前导序列包括包含预测指导所连接的结构基因最佳表达的序列的那些前导序列,即包括可以增加或保持mRNA稳定性并防止翻译不正确起始的优选共有前导序列。按照本说明书,这类序列的选择是本领域技术人员已知的。最优选由在植物、特别是在玉米中高表达的基因衍生的序列。一个特别优选的前导序列可以是小麦CAB前导序列(SEQID NO:31)。
转录增强子或增强子重复可以用来增加表达。这些增强子通常发现位于在真核细胞中起作用的启动子中的转录起始处,但可能通常被以正向或反向插入所述编码序列的5’或3’。增强子的实例包括得自CaMV 35S启动子、章鱼碱合酶基因(Ellis等,1987)、水稻肌动蛋白基因和非植物真核生物(例如酵母;Ma等,1988)启动子的元件。
选择哪种表达载体以及选择哪种与多肽编码区最终操作性连接的启动子直接取决于所需的功能特性,例如蛋白表达的位置和时间以及待转化的宿主细胞。本领域中对于构建重组DNA分子有固有的众所周知的限制。然而,可用于实施本发明的载体能够指导与其操作性连接的多肽编码区的表达。
可用于在高等植物中表达基因的典型的载体是本领域众所周知的,并且包括衍生自所述的根癌农杆菌的肿瘤诱导(Ti)质粒(Rogers等,1987)的载体。然而,已知几种其它植物整合型载体在植物中起作用,包括描述的pCaMVCN转移控制载体(Fromm等,1985)。pCaMVCN(可得自Pharmacia,Piscataway,NJ)包括CaMV35S启动子。
在优选实施方案中,用来表达所述多肽的载体包括在植物细胞中有效的选择标记,最好是抗药性选择标记。一个优选的抗药性标记是其表达导致卡那霉素抗性的基因,即已描述的含有胭脂碱合酶启动子、Tn5新霉素磷酸转移酶II(nptII)和胭脂碱合酶3’非翻译区的嵌合基因(Rogers等,1988)。
用于制备表达载体的方法是本领域众所周知的。用来转化植物的表达(转化)载体和制备那些载体的方法描述于美国专利4,971,908、4,940,835、4,769,061和4,757,011。可以修饰那些载体,以使其包括按照本发明的编码序列。
编码有能力赋予细胞杀虫活性的多肽的编码区最好是编码苏云金芽孢杆菌δ-内毒素的多核苷酸或这种多核苷酸的功能等同体。按照这种实施方案,也优选包含SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11的DNA序列的编码区。
特定的苏云金芽孢杆菌δ-内毒素多肽编码ORF包含在已经表明在转化植物中以高水平表达苏云金芽孢杆菌δ-内毒素的表达盒中。优选的表达盒包括包含于以下质粒中的表达盒:pMON33709、pMON33710、pMON33722、pMON33723、pMON25096、pMON25097、pMON33741和pMON33748。这些质粒中的所述表达盒分别由示于以下的序列表达:SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21和SEQ ID NO:23。更优选的是,可以用包含以下核苷酸序列的任何表达盒成功地转化植物:SEQ ID NO:36的核苷酸14-3431、SEQ ID NO:38的核苷酸14-3025、SEQ ID NO:17的核苷酸14-3431、SEQ ID NO:19的核苷酸14-3020、SEQ ID NO:21的核苷酸14-3020或SEQ ID NO:23的核苷酸25-3450(pMON33722、pMON33723、pMON25096、pMON25097、pMON33741和pMON33748)。最优选的是,可以用包含以下核苷酸序列的任何表达盒成功地转化植物:SEQ ID NO:17的核苷酸14-3431、SEQ ID NO:19的核苷酸14-3020、SEQ ID NO:21的核苷酸14-3020或SEQ ID NO:23的核苷酸25-3450(pMON25096、pMON25097、pMON33741和pMON33748)。
本文所述的研究已经鉴定出在植物中增强苏云金芽孢杆菌δ-内毒素表达的方法,所述内毒素当加入感病植物基因组中时赋予对昆虫病原体的抗性。美国专利5,500,365描述了用于合成植物基因以优化所合成基因编码的蛋白的表达水平的方法。该方法涉及对外源转基因结构基因序列的修饰,以使其更“象植物”,并因此更有可能被所述植物翻译和表达。用于在单子叶植物中增加转基因表达的相似方法描述于美国专利5,689,052。农学、园艺、观赏和其它经济上和商业上有用的植物可以按照本文所述的方法制备,使所述植物以足以赋予对昆虫病原体抗性的高水平表达苏云金芽孢杆菌δ-内毒素。
这类植物可以与其它以下物质一起共表达苏云金芽孢杆菌δ-内毒素多肽:抗真菌、抗细菌或抗病毒的致病相关肽、多肽或蛋白;杀虫蛋白、赋予除草剂抗性的蛋白;和涉及提高植物制品质量或植物农艺性能的蛋白。在植物中同时共表达多种蛋白是有利的,因为它利用一种以上的作用方式来防治植物病原体损害。这可以使产生抗性病原体菌株的概率减至最小、扩大抗性谱和潜在地导致协同杀虫效应,由此增强植物抗昆虫侵染的能力(WO 92/17591)。
最后,用于引入单子叶植物基因组中的最理想的DNA区段可以是编码所需性状(例如增产)的同源基因或基因家族,它们在新启动子或增强子等、或许甚至同源或组织特异性(例如根颈/根鞘、轮生体、茎、穗梗(earshank)、籽粒或叶片特异性)启动子或控制元件控制下被引入。事实上,设想了本发明的具体应用可以是产生包含被以组织特异性方式导向的转基因的转化体。例如,昆虫抗性基因可以特异性在轮生体和根颈/根鞘组织中表达,这些组织分别是ECB的第一批和第二批卵(broods)的目标。同样,理想的是对根虫(rootworm)具有特殊活性的蛋白的编码基因优先在根组织中表达。
用于在转基因植物中组织特异性地导向基因表达的载体通常包括组织特异性启动子,也可以包括其它组织特异性控制元件例如增强子序列。按照本说明书,特异性地指导或增强在某些植物组织中表达的启动子是本领域熟知的。
也设想了通过一起引入组成型表达的基因(在所有组织中)和仅在所述基因产物不需要的组织中表达的反义基因,可以功能性地实现组织特异性表达。例如,可以引入编码苏云金芽孢杆菌结晶毒素蛋白的基因,以使它采用花椰菜花叶病毒的35S启动子在所有组织中表达。或者,水稻肌动蛋白启动子或双子叶植物或单子叶植物物种的组蛋白启动子也可以用于组成型基因表达。此外,设想了结合得自一种以上启动子的元件的启动子可能是有用的。例如,美国专利5,491,288公开了将花椰菜花叶病毒启动子与组蛋白启动子结合。因此,采用例如玉米醇溶蛋白启动子在玉米籽粒中表达Btδ-内毒素基因反义转录物可能防止所述δ-内毒素在种子中累积。因此,由所引入的基因编码的蛋白就存在于除籽粒外的所有组织中。本发明人特别设想了相似的策略可以用于本发明,以指导可筛选标记或选择标记在种子组织中的表达。
另一方面,人们可能希望获得按照本发明使用的新组织特异性启动子序列。为此,人们可以首先从所关注的组织中分离cDNA克隆,并例如采用RNA印迹法鉴定在该组织中特异性表达的那些克隆。理想的是,人们有可能鉴定出不以高拷贝数存在的基因,但所述基因产物在特定组织中相对丰富。因此可以采用本领域技术人员已知的分子生物学技术,将相应的基因组克隆的启动子和控制元件定位。
设想了仅需要在特定条件下表达转基因植物中某些基因,例如,建议赋予对环境胁迫因素例如干旱的抗性的某些基因仅需要在真正的胁迫条件下表达。进一步设想了这类基因在植物的整个发育期间的表达可能具有有害效应。已知存在着大量对环境应答的基因。例如,由光通过植物光敏素介导调节某些基因例如编码核酮糖二磷酸羧化酶小亚基的rbcS的表达。其它基因由次级刺激物诱导。例如,脱落酸(ABA)的合成由某些环境因素诱导,包括但不限于水胁迫。已经表明许多基因由ABA诱导(Skriver和Mundy,1990)。也预期赋予抗昆虫掠食的基因的表达可能仅需要在实际昆虫侵袭的条件下表达。因此,对于某些所需性状,需要在转基因植物中诱导型表达基因。
在本发明的某些实施方案中,提出仅需要在植物发育的某些时期在转基因植物中表达基因。发育的定时通常与组织特异性基因表达相关。例如,在传粉后约15天在胚乳中启动玉米醇溶蛋白贮存蛋白的表达。
设想了本发明中所述方法可以用来获得多种新的如下文所述分离的苏云金芽孢杆菌内毒素的大大提高的表达。先前已经描述了对于编码具杀虫活性的结晶内毒素的新苏云金芽孢杆菌菌株的鉴定(Donovan等,1992)。分离出苏云金芽孢杆菌内毒素,然后进行氨基末端的氨基酸序列分析、反向翻译(back-translation)所述氨基酸序列,以设计寡核苷酸探针或应用相关的苏云金芽孢杆菌基因作为探针,然后通过杂交克隆编码所述内毒素的基因,这些是本领域技术人员熟悉的,并且已有描述(参见例如Donovan等,1992,美国专利5,264,364)。采用Engilsh等所述的方法(WO99/31248),可以得到鞘翅目抑制活性提高的Cry3Bb苏云金芽孢杆菌δ-内毒素。
也设想了用本发明表达载体转化的植物。也设想了衍生自这种转化或转基因细胞的转基因植物。本领域技术人员会认识到,可以用本领域熟知的方法,将含本发明结构编码序列的嵌合植物基因插入植物的基因组中。用DNA转化植物细胞的方法包括农杆菌介导的植物转化、应用脂质体、采用病毒或花粉的转化、电穿孔、原生质体转化、将基因转移到花粉中,注射或真空浸润(Bechtold等,Meth.Mo.Biol.,82:259-266;1998)到生殖器官、注射到未成熟胚和粒子轰击。这些方法中的每种都具有不同的优点和缺点。因此,将基因引入特定植物品系的一种特定方法对于另一种植物品系可能不一定是最有效的,但众所周知哪些方法可用于特定的植物品系。
将DNA引入细胞中的技术是本领域技术人员熟知的。已经描述了用于将基因传递至细胞中的4种常用方法:(1)化学方法(Graham和van der Eb,1973);(2)物理方法,例如微注射(Capecchi,1980)、电穿孔(Wong和Neumann,1982;Fromm等,1985)和基因枪(Johnston和Tang,1994;Fynan等,1993);(3)病毒载体(Clapp,1993;Lu等,1993;Eglitis和Anderson,1988a;1988b);和(4)受体介导的机制(Curiel等,1991;1992;Wagner等,1992)。
将转化DNA区段传递到植物细胞的一种有利方法是微弹轰击。在该方法中,可以用核酸包被粒子,通过推进力将其传递至细胞中。典型的粒子包括由钨、金、铂等构成的粒子。采用这些粒子,所述小金属粒子表面上的DNA穿过细胞壁被携带到胞质中(Klein等,1987;Klein等,1988)。金属粒子穿透数层细胞,因此使得可以转化组织外植体中的细胞。
微弹轰击除了是可再现地稳定转化植物细胞的有效方法外,其一个优点是既不需要分离原生质体(Cristou等,1988),又不需要对农杆菌感染敏感。用于通过加速将DNA传递至植物细胞中的方法的一个说明性实施方案是Biolistics粒子传递系统,它可以用来驱使包有DNA或细胞的粒子通过筛网,例如不锈钢或Nytex筛网,在滤膜表面上覆盖有悬浮液中的植物培养细胞。所述筛网分散所述粒子,使得它们不会以大聚集物传递至受体细胞。人们认为发射装置和待轰击的细胞之间的筛网干涉减小轰击粒子聚集物的大小,并且可能通过减小太大的轰击粒子对受体细胞施加的损害,而导致转化率较高。
关于所述轰击,最好就将悬浮液中的细胞在滤膜或固体培养基上浓缩。或者,可以在固体培养基上分配未成熟的胚或其它靶细胞。待轰击的细胞位于宏弹(macroprojectile)阻持板之下适当的距离处。如有需要,还有一个或多个筛网位于加速装置和待轰击细胞之间。通过利用本文叙述的技术,人们可以获得高达1000个或更多的瞬时表达标记基因的细胞转化灶。在轰击后48小时转化灶中表达所述外源基因的细胞数范围通常为1-10个,平均1-3个。
在轰击转化中,人们可以优化轰击前培养条件和轰击参数,以产生最大数目的稳定转化体。轰击的物理参数和生物学参数在该技术中均是重要的。物理因素是涉及操作所述DNA/微弹沉淀或影响宏弹或微弹射程和速度的因素。生物因素包括涉及在轰击之前以及紧随其后的细胞操作的所有步骤、有助于减轻与轰击相关创伤的靶细胞的渗透调节以及转化DNA的性质,例如线性化DNA或完整的超螺旋质粒。人们认为轰击前操作对于成功转化未成熟植物胚尤为重要。
因此,设想了人们可能需要在小规模研究中调节各种轰击参数,以全面优化所述条件。人们可能特别希望调节诸如间隙距离、飞行距离、组织距离和氦气压之类的物理参数。人们也可以通过修改影响受体细胞生理状态和可以因此影响转化和整合效率的条件,使创伤减少因素(TRF)最小化。例如,可以调节渗透状态、组织水合作用和受体细胞的传代培养阶段或细胞周期,以使转化最佳。根据本说明书,其它常规调节的实施是本领域技术人员已知的。
粒子介导的转化的方法是本领域技术人员众所周知的。美国专利5,015,580描述了采用这种技术转化大豆。
农杆菌介导的转移是将基因引入植物细胞中的广泛适用的系统,因为可以将所述DNA引入全株组织中,由此绕过由原生质体再生完整植株的需要。应用农杆菌介导的植物整合型载体将DNA引入植物细胞是本领域熟知的。参见例如描述的方法(Fraley等,1985;Rogers等,1987)。在美国专利5,004,863中描述了用农杆菌介导的转移对棉花植株进行基因工程;在美国专利5,349,124中描述了莴苣植物的相似转化;以及在美国专利5,416,011中描述了大豆的农杆菌介导的转化。此外,Ti-DNA的整合是一种相对精确的方法,几乎不导致重排。待转移的DNA区由边界(border)序列限定,通常将间插DNA插入植物基因组中,如已描述的(Spielmann等,1986;Jorgensen等,1987)。
现代农杆菌转化载体能够在大肠杆菌以及农杆菌中复制,提供方便的操作,如已描述的(Klee等,1985)。此外,近来在用于农杆菌介导的基因转移的载体方面的技术进展已经改进了所述载体中基因和限制位点的布置,以有助于构建能够表达各种多肽编码基因的载体。所述载体(Rogers等,1987)具有方便的多接头区,侧翼为用于指导所插入多肽编码基因表达的启动子和聚腺苷酸化位点,它们适用于本发明目的。另外,含有武装(armed)和解除武装的(disarmed)Ti基因的农杆菌可以用于转化。在农杆菌介导的转化有效的那些植物品种中,所述基因转移由于其易得和限定的特性而成为选择的方法。
农杆菌介导的叶圆盘或其它组织(例如子叶和下胚轴)的转化看来限于农杆菌天然感染的植物。农杆菌介导的转化在双子叶植物中是最有效的。几乎没有单子叶植物是农杆菌的天然宿主,尽管如所述用农杆菌载体已经在芦笋中产生了转基因植物(Bytebier等,1987)。最近也已经用农杆菌转化了其它单子叶植物。在该组中包括玉米(Ishida等)和水稻(Cheng等)。
用农杆菌转化法产生的转基因植物通常在一个染色体上仅含有单个基因。这种转基因植物由于所加入的基因可以称为杂合的。然而,因为使用“杂合的”通常暗示在一对染色体的第二个染色体的同一基因座上存在互补基因,而在含一个加入的基因的植物中没有这种基因,所以人们认为这种植物更准确的名称是独立分离子,因为所加入的外源基因在有丝分裂和减数分裂期间独立地分离。
当所述植物作为杂种商品化时,例如玉米,可能优选独立分离子。在这种情况下,使含有该基因的的独立分离子与另一植株杂交,以形成目的基因杂合的杂种植物。
对于转基因植物的另一种优选是所加入的结构基因纯合的植物,即含有两个加入的基因的转基因植物,一对染色体的每个染色体上的同一基因座都有一个基因。通过使含有单个所加入基因的独立分离转基因植株进行有性杂交(自交),将所产生的某些种子萌发,并分析所产生的植株的目的基因活性和孟德尔遗传性,表明相对于对照(天然的非转基因植物)或独立分离转基因植物为纯合性,可以获得纯合的转基因植物。
可以使两种不同的转基因植物交配,以产生含有两个独立分离的所加入的外源基因的后代。使合适的子代自交可以产生两个所加入的编码目的多肽的外源基因纯合的植物。也设想了与亲本植株回交和与非转基因植物异型杂交(out-crossing)。
采用基于磷酸钙沉淀法、聚乙二醇处理、电穿孔和这些处理的组合的方法,可以完成植物原生质体转化(参见例如Prtrykus等,1985;Lorz等,1985;Fromm等,1985;Uchimiya等,1986;Callis等,1987;Marcotte等,1988)。这些系统对不同植物种质的应用取决于由原生质体再生特定植物品种的能力。描述了用于由原生质体再生谷类作物的说明性方法(参见例如Toriyama等,1986;Yamada等,1986;Abdullah等,1986)。为了转化不能由原生质体成功再生的植物种质,可以利用将DNA引入完整细胞或组织的其它方法。例如,如已描述的,已经实现了由未成熟胚或外植体再生谷类作物(Vasil,1988)。如所述通过将DNA直接转移到花粉中,也可以将DNA引入植物中(Hess,1987)。通过将DNA注射到植物生殖器官中,可以获得多肽编码基因的表达,如已描述的(Pena等,1987)。也可以将DNA直接注射到未成熟胚的细胞中并将干燥的胚再水合,如已描述的(Neuhaus等,1987;Benbrook等,1986)。
未修饰的细菌基因通常在转基因植物细胞中表达差。几篇报道已经公开了改进重组基因在植物中表达的方法(Murray等,1989;Diehn等,1996;Iannacone等,1997;Rouwendal等,1997;Futterer等,1997;和Futterer和Hohn,1996)。这些报道公开了各种方法,以根据植物密码子频率表将编码序列工程化,以代表更有效翻译的序列;采用避免可疑的聚腺苷酸化或富A/T结构域或内含子剪接共有序列的重组序列改进密码子第三碱基位置偏倚。尽管用于合成基因构建的这些方法是值得注意的,但按照Brown等的方法(美国专利第5,689,052;1997)制备本发明的合成基因。因此,本发明提供制备在植物中以显著高于野生型基因的水平表达所需蛋白产物的合成植物基因的方法。简而言之,按照Brown等的方法,减小编码所需蛋白的多核苷酸序列中稀有和半稀有单子叶植物密码子的频率,并用更优选的单子叶植物密码子取代。在单子叶植物中由修饰的多核苷酸序列编码的所需多肽累积的增强是提高优选密码子频率的结果,所述优选密码子频率的提高是通过分析所述编码序列为连续6个核苷酸的片段,并基于所述六聚体出现的频率,按照单子叶植物中最稀少的284、484和664六聚体的出现频率,改变所述序列来实现。此外,Brown等公开了通过应用降低稀有密码子频率的方法增加重组基因表达,降低稀有密码子频率通过以下方法进行:在所述核苷酸序列中减少聚腺苷酸化信号和内含子剪接位点出现,除去所述核苷酸序列中自身互补的序列,并用非自身互补的核苷酸取代所述序列,同时维持编码所述多肽的结构基因,并降低所述核苷酸序列中5’-CG-3’二核苷酸对出现的频率。这些步骤顺序进行,并且有累积效应,产生对于所需多肽中存在的大多数氨基酸而言含有单子叶植物优先利用的更优选的单子叶植物密码子的核苷酸序列。
因此,可以采用诸如本文公开的转化方法,通过转化在植物中增加编码目的多肽(即细菌晶体蛋白或δ-内毒素多肽或与质体导向肽连接的这种δ-内毒素)的基因量。
在实现外源DNA传递至受体细胞后,获得转基因植物的下一步一般涉及鉴定转化细胞,用于进一步培养和植株再生。如本文所述,为了提高鉴定转化体的能力,最好使用选择标记基因或可筛选标记基因作为可表达的目的基因,或除可表达的目的基因外,可以使用所述标记基因。在这种情况下,人们通常则应该通过将所述细胞暴露于一种或多种选择剂来分析潜在转化的细胞群体,或人们应该筛选具有所需标记基因性状的细胞。
转化细胞鉴定方法的一个典型实施方案涉及将转化的培养物暴露于选择剂,例如代谢抑制剂、抗生素、除草剂等。已经被转化并稳定整合了赋予对所用的选择剂抗性的标记基因的细胞,将在培养物中生长并分裂。敏感细胞经不起进一步培养。优选标记基因的一个实例是编码抗草甘膦抑制的EPSPS合酶的基因。当将该基因用作选择标记时,推定的转化细胞培养物用草甘膦处理。处理后,将可得到转基因细胞用于进一步培养,而不能得到敏感的或非转化的细胞。该方法描述于美国专利5,569,834。优选选择标记系统的另一实例是nptII系统,该系统赋予对抗生素卡那霉素、新霉素和巴龙霉素或相关抗生素的抗性,如美国专利5,569,834中所述。另外,在用该系统转化后,当用卡那霉素或相关抗生素处理时,将可得到的含有植物可表达nptII基因的转化细胞用于进一步培养,而不能得到非转化细胞。该类型选择标记系统的应用描述于Brown等(美国专利第5,424,412号)。可以使用的另一可筛选标记是编码绿荧光蛋白的基因。所有设想的分析均是非破坏性的,转化细胞可以在鉴定后进一步培养。
还设想了可筛选和可选择标记的组合将可用于鉴定转化细胞。在某些细胞或组织类型中,例如草甘膦或卡那霉素的选择剂可能或者未提供足够的杀伤活性以清楚地识别转化细胞,或者可能引起对转化体以及同样对非转化体相当大的非选择性抑制,因此使得所述选择技术不很有效。建议用一种生长抑制化合物例如草甘膦在低于引起100%抑制的浓度的浓度下进行选择,然后根据可筛选标记基因例如卡那霉素的表达筛选生长中的组织,将使得人们可以从经不起单独选择的细胞或组织类型中回收转化体。我们提出选择和筛选的组合可能使得人们能够在更多细胞类型和组织类型中鉴定转化体。
由或者单个植物原生质体或者各种外植体发育或再生植株是本领域熟知的(Weissbach和Weissbach,1988)。这种再生和生长过程通常包括以下步骤:选择转化细胞、培养那些个体化细胞通过通常的胚胎发育阶段通过生根的小植株阶段。转基因胚和种子的再生是相似的。此后将所产生的转基因生根苗种植在合适的植物生长介质中,例如土壤。
得自叶片外植体、含有由农杆菌引入的编码目的多肽的外来、外源基因的植株的发育或再生,可以采用本领域熟知的方法完成,如已描述的(Horsh等,1985)。在该方法中,在选择剂存在下,并于诱导待转化的植物品系再生苗的培养基中培养转化体,如已描述的(Fraley等,1983)。特别是,美国专利5,349,124详细描述了创造基因转化的莴苣细胞和由其产生的表达杂种晶体蛋白的植株,其中所述杂种晶体蛋白赋予这种植株对鳞翅目幼虫的杀虫活性。该方法通常在2-4个月内产生苗,然后将这些苗转移至合适的含所述选择剂和防止细菌生长的抗生素的促进生根培养基。然后将在所述选择剂存在下生根形成小植株的苗移植至土壤或其它介质中,以允许产生根。这些步骤根据所用的具体植物品系而不同,这种变化是本领域众所周知的。
因此,在本发明转基因植物中,编码苏云金芽孢杆菌δ-内毒素多肽或其变异体或者可以编码连接于质体导向肽的这种δ-内毒素的编码区的量增加。优选的转基因植物是独立分离子,并且可以将该基因和其活性传递至其后代。更优选的转基因植物是该基因纯合的,并且当有性交配时将该基因传递至其所有后代。可以将得自转基因植物的种子种植在大田或温室中,使所得的性成熟转基因植物自花传粉,以产生纯育植株。这些植株的后代成为纯育系,评价其编码δ-内毒素的转基因表达的增加。
为了鉴定表达高水平目的δ-内毒素的转基因植物,根据杀虫活性和/或目的基因的表达筛选所述除草剂抗性或抗生素抗性的转基因、再生植株(R0)是必不可少的。可以采用本领域技术人员熟知的各种方法完成这一步骤,所述方法包括但不限于:1)从转基因R0植株中获得小组织样品,直接平行分析所述组织与得自非表达的阴性对照植株的组织对敏感昆虫的活性。例如,通过分析得自这种植株的叶片组织或根组织对CRW的活性,可以鉴定表达苏云金芽孢杆菌内毒素例如Cry3B的R0转基因玉米植株;2)通过对目的基因(Cry3B)特异性的酶联免疫测定(ELISA)分析蛋白提取物;或3)反转录酶热扩增,以鉴定表达目的基因的事件。
按照本发明的基因和δ-内毒素不仅包括本文公开的全长序列,而且也包括保留本文所具体例举序列的特征性杀虫活性的这些序列的片段或融合蛋白。
本领域技术人员应该明显看出,可以通过几种方法鉴定并获得杀虫δ-内毒素。特定的基因或其部分可以得自培养物保藏机构,或例如利用基因机合成构建。可以采用制备点突变的标准技术容易地构建这些基因的变异物。此外,采用市售的外切核酸酶或内切核酸酶,按照标准方法,可以制备这些基因的片段。例如,诸如Bal31的酶或定点诱变可以用来从这些基因的末端有规则地地切下核苷酸。此外,采用多种其它限制酶可以获得编码活性片段的基因。蛋白酶可以用来直接获得这些δ-内毒素的活性片段。
采用本文提供的技术,也可以从芽孢杆菌属菌株和/或DNA文库中分离出等同的δ-内毒素和/或编码这些δ-内毒素的基因。例如,本文公开和要求保护的抗δ-内毒素的抗体可以用来从蛋白混合物中鉴定并分离出其它δ-内毒素。具体地说,可以针对所述δ-内毒素最恒定并且与其它苏云金芽孢杆菌δ-内毒素最不同的部分产生抗体。这些抗体则可以用来通过免疫沉淀、酶联免疫测定(ELISA)或蛋白质印迹法特异性地鉴定出具有特征性杀虫活性的等同δ-内毒素。
用于鉴定本发明δ-内毒素和基因的另一方法是通过应用寡核苷酸探针。这些探针是具有可检测标记的核苷酸序列。正如本领域众所周知的,如果所述探针分子和核酸样品当在样品中一起时,通过在这两种分子之间形成氢键而杂交,则可以合理地假设所述探针和样品至少沿所述探针的长度上是基本相同或大致相似或同源的。所述探针的可检测标记提供了以已知方法确定杂交是否发生的手段。这种探针分析提供了本发明杀虫δ-内毒素基因的快速鉴定方法。
双链体的形成和稳定性取决于杂交体的两条链之间的大致互补,如上所述,可以容许一定程度的错配。因此,本发明的探针包括所需序列的突变(单突变和多突变)、缺失、插入以及它们的组合,其中所述突变、插入和缺点允许与所述目的靶多核苷酸形成稳定的杂交体。以许多方式,采用目前本领域一般技术人员已知的方法,也许通过可以在将来已知的其它方法,可以在给定的多核苷酸序列中产生突变、插入和缺失。
所列的所述探针的可能变异部分由于遗传密码的丰余性。由于遗传密码的丰余性,对于用来制备蛋白的大多数氨基酸而言,可以使用一种以上的编码核苷酸三联体(密码子)。因此,不同的核苷酸序列可以编码一种特定的氨基酸。因此,苏云金芽孢杆菌δ-内毒素和肽和质体导向肽的氨基酸序列以及编码它们的多核苷酸可以由编码所述蛋白或肽的同一氨基酸序列的等同核苷酸序列制备。
定点诱变是可用于通过对作为基础的DNA特异性诱变来制备单个肽或生物功能等同蛋白或肽的技术。所述技术还提供制备并测试序列变异体的现成可用的能力,其中所述变异体例如通过将一个或多个核苷酸序列变化引入所述DNA中而加入一个或多个上述考虑。
一般而言,定点诱变技术是本领域熟知的,如各种出版物例举的。正如人们将认识到的,该技术通常使用以单链或双链形式存在的噬菌体载体。可用于定点诱变的典型载体包括载体例如M13噬菌体或含M13复制起点的质粒。这些噬菌体容易从市场上获得,并且其用法是本领域技术人员众所周知的。
可以在本发明肽的结构和编码它们的DNA区段中制造修饰和变化,仍获得编码具有所需特性的蛋白或肽的功能分子。本文设想的生物功能等同肽、多肽和蛋白应该与基础的Cry3B氨基酸序列的序列或其中相应的部分具有约80%或更高的序列相似性,优选具有约85%或更高的序列相似性,最优选具有约90%或更高的序列相似性。
以下的讨论基于改变蛋白的氨基酸,以产生等同的或甚至改进的第二代分子。在本发明的特定实施方案中,设想突变的晶体蛋白可用于提高所述蛋白的杀虫活性,并因此在植物细胞中提高所述重组转基因的杀虫活性和/或表达。根据容易利用的氨基酸密码子表中给出的密码子,通过改变所述DNA序列的密码子,可以完成所述氨基酸改变。
例如,可以用其它氨基酸取代蛋白结构中的某些氨基酸,而不明显损失所述蛋白结构与例如抗体的抗原结合区或底物分子上的结合位点的结构的相互结合能力。由于正是蛋白的相互作用能力和特性限定该蛋白的生物学功能活性,因此在蛋白序列中,当然还有作为其基础的DNA编码序列中,可以进行某些氨基酸序列取代,依然获得具有相似特性的蛋白。因此本发明人考虑到,在所公开的组合物的肽序列或编码所述肽的相应的DNA序列中,可以进行各种改变,而不明显损失其生物利用性和生物活性。
在制备这种改变时,可以考虑氨基酸的亲水指数。亲水氨基酸指数在赋予蛋白相互作用性生物功能方面的重要性是本领域普通了解的(Kyte和Doolittle,1982,通过引用结合到本文中)。普遍认为,所述氨基酸的相对亲水特性有助于所产生的蛋白的二级结构,所述二级结构进而又限定了该蛋白与其它分子的相互作用,所述其它分子例如为酶、底物、受体、DNA、抗体、抗原等。
本领域已知某些氨基酸可以用具有相似亲水指数或计分的其它氨基酸取代,仍产生具有相似生物活性的蛋白,即仍获得生物功能等同的蛋白。本领域也知道,根据亲水性可以有效地进行相似的氨基酸的取代。美国专利4,554,101叙述了取决于其相邻氨基酸亲水性的蛋白的最大局部平均亲水性与所述蛋白的生物特性相关。人们理解,一种氨基酸可以被具有相似亲水性值的另一氨基酸取代,并且仍获得生物学等同的、特别是免疫学等同的蛋白。
如上概述的,因此氨基酸取代一般基于氨基酸侧链取代基的相对相似性,例如其疏水性、亲水性、电荷、大小等。考虑各种上述特征的典型取代基是本领域技术人员熟知的,并且包括:精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸。
本领域技术人员知道,编码得自苏云金芽孢杆菌的δ-内毒素的多核苷酸当加入转基因植物的核DNA中时表达差(Diehn等的综述,1996)。最好是,基本上如美国专利5,500,365和5,689,052中所述,设计编码目的δ-内毒素的核苷酸序列。可用于表达的核苷酸序列的实例包括但不限于cry3B(SEQ ID NO:5)、cry3Bb1(SEQ ID NO:1)、cry3Bb2(SEQ ID NO:3)、v11231(SEQ ID NO:7)、11231mv1(SEQ IDNO:9)和11231mv2(SEQ ID NO:11)。
与Cry3B生物功能等同的肽、多肽和蛋白包括在适于以下的基础序列中含有保守氨基酸改变的氨基酸序列:SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12(Cry3B1、Cry3Bb2、v11231、11231mv1、11231mv2、Cry3Bb.11231或Cry3Bb.11098等)。在这类氨基酸序列中,所述基础序列中的一个或多个氨基酸被另外的其电荷和极性类似于所述天然氨基酸的氨基酸取代(即保守氨基酸取代),导致沉默变化。
在所述基础多肽序列中的氨基酸取代可以选自所述天然存在的氨基酸所属类别的其它成员。可以将氨基酸分为4组:(1)酸性氨基酸;(2)碱性氨基酸;(3)中性极性氨基酸;和(4)中性非极性氨基酸。这些不同组中的代表性氨基酸包括但不限于:(1)酸性(带负电)氨基酸,例如天冬氨酸和谷氨酸;(2)碱性(带正电)氨基酸,例如精氨酸、组氨酸和赖氨酸;(3)中性极性氨基酸,例如甘氨酸、丝氨酸、苏氨酸、半胱氨酸、胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;(4)中性非极性(疏水性)氨基酸,例如丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。
通过用这些组中的一种氨基酸取代同一组中的另一种氨基酸,可以进行所述基础多肽序列中的保守氨基酸改变。Cry3B的生物功能等同物可以具有10个或更少的保守氨基酸改变,更优选为7个或更少的保守氨基酸改变,最优选具有5个或更少的保守氨基酸改变。所述编码核苷酸序列(基因、质粒DNA、cDNA、非天然存在的或合成DNA)因此将具有相应的碱基置换,使得它编码Cry3B的生物功能等同形式。
本发明提供在转基因植物中以意想不到的高水平表达鞘翅目抑制性Cry3B苏云金芽孢杆菌δ-内毒素或其氨基酸序列变异体的方法和组合物。所公开的方法和组合物可以采用本文所公开的任何DNA构成物以及本文公开的任何转化载体。设想的方法和组合物使得Cry3Bb δ-内毒素或其氨基酸序列变异体能够在植物中表达,而没有负面影响转基因植物的农艺品质的复原。本发明在此描述了也使得Cry3B δ-内毒素和变异体能够以达到比先前方法和组合物达到水平高500倍的水平表达。
本文描述的方法因此使得表达Cry3B或变异体的植物能够用作表达其它Cry蛋白的植物的替代物或补充物,所述其它Cry蛋白例如Cry3B变异体、Cry3A或Cry3D或变异体、CryET33和CryET34或其变异体、CryET70或变异体、CryET29或变异体、Cry6A或Cry6B或变异体、Cry8B或变异体、杀虫酰基脂质水解酶、氨基酸氧化酶和tedanalactam合酶的组合和其它杀虫蛋白,例如VIP1和VIP3以及分离自Heterorhabdus、Photorhabdus、Xenorhabdus属的物种的用于关键害虫的防治和抗性管理的各种组合,所述害虫包括:玉蜀黍中的秆野螟(Ostrina sp)、杆草螟(Diatraea sp)、Helicoverpa sp、贪夜蛾(Spodoptera sp);陆地棉(Gossypium hirsutum)中的烟芽夜蛾(Heliothisvirescens)、Helicoverpa sp、Pectinophora sp;和大豆(Glycine max)中的干煞夜蛾(Anticarsia sp)、Psedoplusia sp、叶小卷蛾(Epinotia sp)。也考虑到所述方法可以用来显著增加包括Cry3并与其相关的苏云金芽孢杆菌δ-内毒素的表达,因此增加其对目标害虫的效力,并降低进化出对这些蛋白抗性的可能性。在本发明的一个实施方案中,表达Cry3δ-内毒素。该蛋白的目的害虫及其通常的宿主示于表1。
表1
鞘翅目活性(抑制性)Cry3B δ-内毒素影响的目标害虫和这些害虫通常的植物宿主
各种Cry3编码序列表达的比较研究需要抗体,因此如下产生多克隆血清。从表达天然Cry3Bb的苏云金芽孢杆菌重组菌株11037的形成孢子的发酵中收集Cry3Bt晶体。将晶体溶于100mM pH 10.5碳酸钠缓冲液中,使其浓度为2.7mg蛋白/ml,浓度通过重辛可宁酸(bicinchoninic acid)比色分析(Smith等,1985)测定。将样品稀释至0.4mg/ml的浓度,并与等体积弗氏完全佐剂混合。1毫升该混合物的接种物用来给兔子进行第一次皮内注射。2周后第一次放血收集血液。通过将等体积0.2mg/ml蛋白与等体积的弗氏不完全佐剂混合,制备用来加强免疫效价的随后的Cry3Bb蛋白注射剂。以4周的间隔给予1毫升注射,每2周获得另外的放血的血液。由兔子#783,在按照生产商(Sigma Chemical Co.,St.Louis,Missouri)的说明经A蛋白SepharoseCL-4B亲和层析纯化后,制备适用于分析目的的免疫血清,将其浓缩至1mg IgG蛋白/ml并于4℃、黑暗中贮存。将该抗血清样品与碱性磷酸酶缀合,以随后用于定量ELISA测定。
从表达Cry3Bb变异体蛋白11231、11084、11098和11247的植株收集叶片和根样品。如下制备植物样品的提取物。收集根或叶片部分的植物组织,并以克的标度进行称量。将叶片组织与20份TBA缓冲液混合,定容。将根组织与10份TBA缓冲液混合,然后定容。用WheatonTM顶置研磨机(overhead grinder)将组织研磨成乳液并贮存于冰上或-20℃。将250微升在碳酸盐包被缓冲液(pH 9.6)中1∶1000稀释的兔抗Cry3Bb抗血清分配到96孔微量滴定板的各孔中并于4℃温育过夜。然后用PBST(3×5min)洗涤所述板。将组织提取物样品以不同的稀释度以平行样品上样,每孔20μl,以在用Cry3Bb变异体11231建立的标准曲线内获得一个数值。将板于4℃温育过夜,然后用PBST洗涤3次,每次5分钟。每孔加入50微升兔抗Cry3B碱性磷酸酶缀合的多克隆抗体,然后加入180μl含1%PVP-40(Sigma)的PBST。温育过夜后,用PBST(3×5min)洗涤板,并用碱性磷酸酶显色溶液显色,所述显色溶液在25ml二乙醇胺中含20mg对硝基苯磷酸,pH 9.8,200μl/孔。15-20分钟后,用拟合蛋白标准曲线的二次曲线将板于λ405下读数,其中最高标准的光密度约为1.00。
5.0实施例
包括以下实施例以证明本发明的优选实施方案。本领域技术人员应该认识到,以下实施例中公开的技术代表本发明人发现在实施本发明中操作良好的技术,并因此可以考虑用所述技术组成实施本发明的优选模式。然而,根据本说明书,本领域技术人员应该认识到在不偏离本发明的精神和范围的情况下,可以在所公开的具体实施方案中进行许多改变,并且仍可获得类似或相似的结果。
5.1实施例1-Cry3蛋白和基因的分离、表征和鉴定以及其氨基酸序列变异体的构建
鉴定和表征鞘翅目毒性蛋白基因产物的方法在本领域中已有大量文献记载,分离、表达和鉴定编码这类基因产物的基因的方法也是本领域众所周知的。另外,用于产生这类鞘翅目毒性δ-内毒素蛋白的氨基酸序列变异体的方法也是众所周知的。特别是,Van Rie等(美国专利第5,659,123;1997)鉴定出表达出鞘翅目抑制特性的Cry3A和D毒素,并且也叙述了用于鉴定可以构建的、其杀虫活性与野生型蛋白相比降低的突变体的方法。Van Rie等描述了可以如何对那些特定突变体进行进一步操作,以鉴定与野生型蛋白相比表现出杀虫活性提高的氨基酸序列变异体。English等(WO 99/31248)描述了其它方法和组合物,特别是用于Cry3B的方法和组合物,这使得能够鉴定出Cry3编码基因和基因产物,并且描述了可以用来构建并鉴定与野生型Cry3蛋白相比表现出杀虫活性提高的氨基酸序列变异体的方法。本文所用的几种编码序列衍生自English等所描述的序列,并且由这些编码序列产生的蛋白具体代表其中所述变异体11231或11098。
5.2
实施例2.Cry3Bb变异体的单子叶植物表达载体的构建
用于植物表达的cry3Bb变异体基因的设计
为了在转基因植物中有效地表达Cry3Bb变异体,编码该变异体的基因必须具有合适的序列组成(Diehn等,1996)。显示了这种序列的一个实例,即编码表现出叶甲属活性的Cry3Bb蛋白11231变异体(SEQID NO:8)的v11231基因(SEQ ID NO:7)。该基因通过对Cry3Bb合成基因(SEQ ID NO:5)诱变(Kunkel,1985)而衍生,所述合成基因编码与天然Cry3Bb基因(Gen Bank登录号m89794;SEQ ID NO:1)所编码蛋白基本同源的蛋白。以下寡核苷酸用于原始Cry3Bb合成基因(SEQ ID NO:5)的诱变,以产生v11231基因(SEQ ID NO:7)
寡核苷酸#1:TAGGCCTCCATCCATGGCAAACCCTAACAATC(SEQ ID NO:40)
寡核苷酸#2:TCCCATCTTCCTACTTACGACCCTGCAGAAATACGGTCCAAC(SEQ ID NO:41)
寡核苷酸#3:GACCTCACCTAGGAAACATTCGATCTTG(SEQ ID NO:42)
寡核苷酸#4:CGAGTTCTACCGTAGGCAGCTCAAG(SEQ ID NO:43)
cry3B单子叶植物表达载体的构建
为了将Cry3Bb变异体基因v11231置于适用于在单子叶植物中表达的载体中(即在增强的花椰菜花叶病毒35S启动子控制下,并通过接头连接至其后是胭脂碱合酶聚腺苷酸化位点的hsp 70内含子,如Brown和Santino的美国专利第5,424,412;1995所述),用NcoI和EcoRI消化载体pMON19469。在消化产物通过琼脂糖凝胶电泳后分离出约4.6kb的较大的载体条带,将其纯化并用T4DNA连接酶将其与含v11231基因(SEQ ID NO:7)的约2kb NcoI-EcoRI片段连接。将连接混合物转化到有用的大肠杆菌实验室菌株中,并回收羧苄青霉素抗性菌落。通过小量制备DNA法,从随后在含有抗生素的肉汤中选择的羧苄青霉素抗性菌落的过夜培养物中,回收质粒DNA。用例如NcoI和EcoRI、NotI、和PstI的酶对该DNA进行限制性内切核酸酶分析,以鉴定含与hsp70内含子融合、处于增强的CaMV35S启动子控制之下的v11231编码序列的克隆。如此鉴定的克隆命名为pMON33708。
为了将v11231基因置于适用于回收稳定转化且抗昆虫的植物的载体中,分离出得自pMON33708的含有与hsp70内含子融合、处于增强的CaMV35S启动子控制之下的赖氨酸氧化酶编码序列的3.75kbNotI限制片段,并在从琼脂糖凝胶中提取后纯化。将该片段与用NotI和牛小肠碱性磷酸酶处理的pMON30460连接。pMON30460含有所述CaMV35S启动子控制下的新霉素磷酸转移酶编码序列。通过将该连接混合物转化到大肠杆菌中,获得卡那霉素抗性菌落,通过限制性内切核酸酶消化,鉴定出含合适条带的菌落,并命名为pMON33710。用诸如NotI、EcoRV、HindIII、NcoI、EcoRI和BglII的限制酶,鉴定在pMON30460的NotI位点中含pMON33708的NotI片段(即pMON33710)的合适克隆,所述片段的方向使其两个基因串联(即v11231表达盒的3’端连接于nptII表达盒的5’端)。通过将pMON33710共价闭环质粒DNA电穿孔到原生质体中,然后进行蛋白质印迹和ELISA分析,证实pMON33710在玉米原生质体中表达v11231蛋白。可以基本上如Brown和Santino的美国专利第5,424,412中所述,通过粒子枪轰击,然后进行巴龙霉素选择,将该载体引入玉米胚的基因组DNA中,以获得表达v11231基因的玉米植株。在该实施例中,通过与赋予潮霉素抗性的质粒一起共轰击,将该载体引入玉米的未成熟胚盾片(IES),然后进行潮霉素选择并进行再生。通过ELISA分析对每种提取物样品中v11231蛋白的存在和存在量进行评价,鉴定表达v11231蛋白的玉米转基因系。使植物自交并让其结实。晒干后代种子,并将其种植以产生玉米幼苗植株,随后测试其抵抗叶甲属摄食的保护。
Cry3Bb变异体11231在植物中的性能
在幼苗和10英寸花盆测定中均用玉米根叶甲(WCR)幼虫攻击表达Cry3Bb变异体11231蛋白的转化玉米植株。转化的基因型是A634,其中评价A634R0杂交后代。观察包括对幼虫发育(重量)、根损害评级(RDR)和蛋白表达的影响。含所述Cry3Bb变异体基因的转化载体是pMON33710。处理包括每个事件的阳性和阴性同种群体(iso-population)和一个A634对照。
幼苗测定包括以下步骤:i.将单个种子置于含盆栽土壤的1盎司杯中;ii.在穗形成期(spiking),每个幼苗用4条新生幼虫侵染,和iii.侵染后,将幼苗于25℃、50%RH和14∶10(L∶D)光周期下培养7天。在培养期间于盆栽土壤中加入适量的水分,以保持幼苗的活力。
10英寸花盆测定包括以下步骤:i.将单个种子置于含盆栽土壤的10英寸花盆中;ii.在种植后14天,每个花盆用800个卵侵染,所述卵已经预孵育,以便在侵染后5-7天发生孵化;和iii.侵染后,将植株在与幼苗测定相同的环境条件下培养4周。每日对花盆进行浸润灌和顶部灌溉。
对于幼苗测定,在第7天给出植株的根部损害评级(表1)并对存活的幼虫称重。也在此时,通过ELISA测定根中Cry3Bb蛋白浓度。
表1.幼苗测定的根部损害评级标准
RDR 0=无可见的摄食
1=非常轻的摄食
2=轻度摄食
3=中度摄食
4=重度摄食
5=非常严重的摄食
幼苗测定的结果示于表2中。表达Cry3Bb蛋白的植株完全抵抗WCR摄食,其中在该处理中存活的幼虫没有生长。非表达处理的平均幼虫重量范围为2.03-2.73mg,而在表达Cry3Bb的处理上存活幼虫的平均重量为0.11mg。非表达和表达的同种群体的根部损害评级分别为3.86和0.33。阴性和对照处理的幼虫存活范围为75-85%,而在Cry3Bb处理上仅25%的幼虫存活。
表2.在幼苗测定中表达Cry3Bb的植株对WCR幼虫的影响
对于10英寸花盆测定,于侵染后4周,记录株高并给出根部损害评级(Iowa 1-6级;Hills,T.M.和D.C.Peters.1971;用于防治玉米根叶甲幼虫的种植后杀虫处理的评价方法。Journal of Economic Entomology64:764-765)。
10英寸花盆测定的结果示于表3中。与非表达的植株相比表达Cry3Bb蛋白的植株的摄食损害明显更低并且株高更高。两个表达事件中的较高的事件16提供几乎完全的防治。阴性处理的根部损害评级非常高,表明昆虫压力非常高。事件6和事件16的阳性平均根部损害评级分别为3.4和2.2。阴性处理的平均RDR为5.0和5.6。
表3.在10英寸花盆测定中玉米中表达的Cry3Bb在控制WCR幼虫摄食方面的效应
总之,正如在幼苗测定中观察到的,表达Cry3Bb蛋白的玉米植株对WCR幼虫发育有显著的生物学效应。当用非常高的侵染水平攻击时,表达Cry3Bb蛋白的植株受到保护抵抗WCR幼虫的摄食损害,如在10英寸花盆测定中描述的。
实施例3-在转基因玉米中Cry3Bb蛋白的增加表达
在用标准的或优选的Cry3Bb表达载体转化的玉米植株中,比较了Cry3Bb蛋白的表达。当与用标准Cry3Bb载体转化的植株相比,用改进的载体转化的植株一致地证明Cry3Bb的表达水平显著更高。标准Cry3Bb植物表达载体pMON33710含有如下组成的表达盒:一个增强的CaMV35S启动子序列(P-CaMV.35S,SEQ ID NO:29)、一个玉蜀黍Hsp70内含子序列(I-Zm.Hsp70,SEQ ID NO:33)、一个非天然存在的编码Cry3Bb变异体蛋白v11231的序列(Bt.cry3Bb.v11231,SEQ ID NO:7)和一个胭脂碱合酶转录终止和聚腺苷酸化序列(T-AGRtu.nos,SEQ IDNO:34)。另一个标准Cry3Bb植物表达载体pMON33709含有一个如下组成的表达盒:一个增强的CaMV35S启动子序列(P-CaMV.35S,SEQ ID NO:29)、一个玉蜀黍Hsp70内含子序列(I-Zm.Hsp70,SEQ IDNO:33)、一个玉蜀黍CTP编码序列(TS-Zm.rbcl,SEQ ID NO:25)、一个非天然存在的编码Cry3Bb变异体蛋白v11231的序列(Bt.cry3Bb.v11231,SEQ ID NO:7)和一个胭脂碱合酶转录终止和聚腺苷酸化序列(T-AGRtu.nos,SEQ ID NO:34)。根据植物中Cry3Bb表达水平判断,与pMON33710相比,植物表达载体pMON25907得到改进,它含有的一个表达盒包含:一个非天然存在的CaMV35S AS4启动子序列(P-CaMV.AS4,SEQ ID NO:30)、一个小麦叶绿素A/B结合蛋白非翻译前导序列(L-Ta.hcbl,SEQ ID NO:31)、一个水稻肌动蛋白内含子序列(I-Os.Actl,SEQ ID NO:32)和一个连接于小麦热激Hsp17转录终止和聚腺苷酸化序列(T-Ta.Hsp17,SEQ ID NO:35)的非天然存在的编码Cry3Bb变异体蛋白11231mv1(11098)的序列(Bt.cry3Bb.11231mv1,SEQ ID NO:9)。另一优选的载体是pMON25096,它含有的一个表达盒包含:一个非天然存在的CaMV35S AS4启动子序列(P-CaMV.AS4,SEQ ID NO:30)、一个小麦叶绿素A/B结合蛋白非翻译前导序列(L-Ta.hcb1,SEQ ID NO:31)、一个水稻肌动蛋白内含子序列(I-Os.Act1,SEQ ID NO:32)、一个玉蜀黍CTP编码序列(TS-Zm.rbc1,SEQ ID NO:25)和一个连接于小麦热激Hsp17转录终止和聚腺苷酸化序列(T-Ta.Hsp17,SEQ ID NO:35)的非天然存在的编码Cry3Bb变异体蛋白11231mv1的序列(Bt.cry3Bb.11231mv1,SEQ ID NO:9)。所有载体均含有一个连接于Cry3Bb表达盒的相同的盒,所述相同的盒赋予转化植物组织巴龙霉素抗性。该抗性盒由增强的CaMV35S启动子序列和一个连接于胭脂碱合酶转录终止和聚腺苷酸化序列的新霉素磷酸转移酶编码序列。标准载体和改进载体的概述示于表4中。抗巴龙霉素的转基因玉米植株基本上如美国专利5,424,412(1995)中所述得到。
表4
植物表达载体概述
按描述的方法(Sheen,Plant Cell 2:1027-1038,1990),用标准载体(pMON33709或pMON33710)或改进载体(pMON33722、pMON33723、pMON25096、pMON25097、pMON33741)电穿孔玉米叶原生质体,并且通过ELISA和蛋白质印迹分析法比较Cry3Bb变异体蛋白的瞬时表达。所述ELISA使用针对Vry3B 11231产生的兔抗Cry3B层析纯化的IgG捕获抗体,将该抗体与碱性磷酸酶缀合的样品作为第二检测抗体,而将纯化的Cry3Bb天然蛋白作为标准。通过ELISA比较Cry3Bb与新霉素磷酸转移酶(Npt II)表达水平之比,表明分别与标准载体pMON33710和pMON33709相比,用改进载体pMON33723和pMON33722获得的Cry3Bb变异体蛋白11231的标准化表达水平增加约2倍(实验1,表5)。Cry3Bb表达的差异直接归因于改进载体中的改进表达盒,而不是原生质体电穿孔效率的差异,因为将Cry3Bb蛋白的表达对在所有载体中存在的同样连接的nptII基因所产生的Npt II标准化。最优选的改进载体例如pMON25096、pMON25097和pMON33741表达的Cry3Bb和变异体Cry3Bb蛋白的标准化水平比优选的改进载体例如pMON33722或pMON33723高约10倍(表5,实验2、3)。最后,同样优选的pMON33741和pMON25097载体产生大致相同的标准化Cry3Bb表达(表5,实验4)。
表5
由于pMON25097中的改进表达盒编码Cry3Bb 11231mv1(11098)变异体毒素,而pMON33710中的标准表达盒编码因一个氨基酸而不同的Cry3B v11231变异体,因此比较ELISA测定中这两种蛋白的固有(intrinsic)免疫反应性。随后用在苏云金芽孢杆菌中产生并纯化的Cry3Bb v11231和11231mv1(11098)变异体蛋白进行的ELISA实验表明,这两种蛋白具有相似的免疫反应性水平。因此,观察到的由pMON25097中的表达盒产生的Cry3Bb 11231mv1(11098)蛋白水平的增加是由于增加的表达水平,而不是免疫反应性的差异。蛋白质印迹分析证实,在玉米原生质体中由pMON25097的改进Cry3Bb表达盒产生的交叉反应性物质的水平的增加,归因于与Cry3B抗血清有免疫反应性的约60,000Mr蛋白的累积增加,其中所述蛋白也与由pEG7174重组的cry-苏云金芽孢杆菌菌株中产生的Cry3Bb变异体11231蛋白一起共迁移。与用pMON33710中的标准盒观察到的表达相比,在pMON33741和pMON33748中的同样优选的、编码Cry3Bb.11231的改进Cry3Bb变异体蛋白表达盒,也表现出Cry3Bb表达水平提高。这些结果证实,表达的差异归因于本文公开的改进组合物,而不是所述不同变异体的固有免疫反应性的差异。
在用改进载体(pMON33723、25097)或用标准载体(pMON 33710)转化后独立获得的R0阶段转基因植株的根组织,通过定量ELISA测定定量分析Cry3Bb蛋白水平。在改进载体和标准载体转化的玉米植株中Cry3Bb或Cry3Bb蛋白变异体表达水平的比较表明,Cry3Bb.11231变异体的表达在标准pMON33710转基因植株中不超过50ppm,而在改进的pMON25097转基因植株中的Cry3Bb.11098(11231mv1)的表达通常高于50ppm(表6)。蛋白质印迹分析证明,由pMON25097(改进的)产生的交叉反应性物质水平的增加归因于与苏云金芽孢杆菌的Cry3Bb1标准一起迁移的约Mr 60,000蛋白的累积增加。在pMON33741和33748中发现的其它改进的Cry3Bb蛋白变异体表达盒也一致地产生Cry3Bb蛋白变异体水平高于100PPM的精选独立转化事件(ITE),而所述标准载体从未产生Cry3Bb蛋白变异体高于50PPM的ITE(表7)。高水平表达在H99和A634玉米基因型中是明显的,表明本文公开的组合物对于商品栽培玉米的许多品种具有广泛的应用范围。预期用本文所述载体获得的这种精选高表达Cry3蛋白变异体系在赋予抵抗昆虫摄食损害的高水平保护以及降低对Cry3杀虫蛋白的昆虫抗药性的发生率方面尤其有利。
表6
用标准的和改进的Cry3Bb蛋白变异体表达盒
转化的R0玉米中Cry3Bb表达的比较
表7
用改进的Cry3Bb蛋白变异体表达盒
转化的R0玉米中Cry3Bb表达
得自用标准表达盒(pMON33709和pMON33710)和优选表达盒(pMON25096、25097、33722、33723、33726、33741和33748)转化的玉米植株、表达10ppm或更高Cry3Bb蛋白的后代,在温室或生长室中,基于先前描述的生物测定(English等,WO 99/31248)进一步测试其对南瓜十二星叶甲(CRW)摄食损害的抗性。基本上由所有优选的载体均获得南瓜十二星叶甲抗性转基因玉米植株(表8)。例如,用改进的pMON25096载体产生89个独立转化事件(ITE),14个独立的pMON25096F1代系表达10ppm或更高Cry3Bb,而7个F1代系表现出显著的CRW抗性水平(RDR评级≥3.5,评级范围为0-6)。相反,由12个表达10PPM或更高Cry3Bb蛋白变异体的标准pMOB33710盒F1代系中,没有获得一个RDR评级≤3.5的事件。用标准载体(pMON33709或pMON33710)中的任一个都不能获得CRW抗性系不能归因于ITE的数目不足,因为这两种载体中的每一种都产生300个以上的ITE,并且筛选它们的CRW抗性F1代系。用优选载体例如pMON33722、pMON33723和pMN25096产生的ITE少得多,但所有的均最终产生CRW抗性F1代系。
表8
在本文提供的实施例中,实验证实基于本文公开的改进为大致等同的组合物与先前公开的标准相比产生性能的等同改进。具体地说,我们证实,与先前公开的编码Cry3Bb.11231的标准组合物相比,编码Cry3Bb.11098和Cry3Bb.11231变异体的改进组合物均产生同样的性能改进。因此归结出,本发明考虑了具有的特定生物活性高于或等于Cry3Bb.11098或Cry3Bb.11231的其它Cry3B变异体的应用,并且这属于本发明范围内。例如,采用基本上与构建pMON33740相同的方式,采用标准诱变程序,可以由pMON25095衍生出编码Cry3Bb变异体的改进载体组合物,包括11231、11084、11098、11247和English等的美国申请序号08/993,170、08/993,722、08/993,755和08/996,441(所述申请均于1997年12月18日中请)中提出的其它载体组合物。
5.4
实施例4-优选的表达盒在田间试验中赋予对CRW损害的抗性在田间评价经遗传修饰以表达衍生自优选载体pMON33722、pMON33723、pMON25096和pMON25097的Cry3Bb蛋白变异体的玉米植株对于玉米根叶甲(Diabrotica vergifera vergifera LeConte)(WCR)的防治。用所述标准载体转化的玉米植株中没有一个进行田间试验,因为在温室试验中没有一个表现出适当的玉米根叶甲的防治(实施例3,表8)。效力试验在Jerseyville,Illinois的孟山都研究农场和USDA ARS研究工作站(Brookings,South Dakota)的Northern GrainInsects Research Laboratory进行。这些试验用来评价优选表达盒在田间在严重的昆虫压力下的性能,并且将其性能与目前市场上的杀虫剂比较。
根据温室表现,选择17个独立的转化事件(ITE)用于田间评价。每个ITE可用于田间评价的种子量不同。在这17个事件中,仅将7个种植在Brookings研究工作站。用于Brookings农场的田间设计是随机化完全区组(RCB)与2个平行测定,其中每个试验区是含有最大30株的单行。在jerseyville农场种植所有17个ITE,其中所述设计为RCB与最大4个平行测定,各为1行的试验区,其中平行测定数取决于由每个ITE可得到的种子。因此,于Jerseyville的平行测定数范围为2-4。另外的处理包括未处理的对照(非转基因玉米)和商品杀虫剂,包括
和
。所述杀虫剂处理仅在jerseyville农场进行。所述杀虫剂在种植时采用建议的比率,以8英寸带条施用。
Jerseyville和Brookings的种植日期分别为5月28日和6月3日。如下进行研究:在种植时用CRW卵侵染试验区,每个行底部(foot ofrow)1,600个卵,约每株800个卵。在V1-V2植物生长阶段,用ELISA分析植株是否存在Cry3Bb蛋白变异体表达。从试验区中除去该基因阴性的植株。
在CRW幼虫摄食阶段结束时,当已经发生最大损害时,用Hills和Peters(1971)描述的1-6根部损害评级(RDR)标准,评级每个试验区中所有其余的植株的根部摄食损伤。所述RDR标准如下:
根部损害评级:
1.无摄食痕迹
2.肉眼可见的摄食痕迹,但无根被修剪至茎的4cm内
3.一节或多节根被修剪至茎的4cm内,但小于一个根节宽度
4.一个节宽的被修剪根
5.两个节宽的被修剪根
6.三个或三个以上节宽的被修剪根
在7月25日和8月3日,分别在Jerseyville和Brookings评级田间试验。所有处理的平均RDR描述于表9中。在评级的17个ITE中,16个ITE防治CRW摄食,≤3.0RDR。3个化学标准品中的2个标准品的RDR低于3.0。
的根部损害评级为3.2。除一个ITEWCR20外,所有处理均显著优于对照(p<.01),但相互之间没有显著差异。图1描述了转基因CRW抗性植株和未处理的对照之间幼虫摄食损害的差异。
即使所述ITE与所述化学标准品在根部损害评级方面没有显著差异,在杀虫剂处理的根部观察到的摄食损伤量也高于表达孟山都的专利基因的根。在根部损害评级之间没有差异是根部评级标准的人为现象,其中该标准基于“被修剪的”根。Hills和Peters将被修剪的根描述为由于CRW摄食产生的长度小于4cm的根。因此,没有“被修剪”根、但有肉眼可见摄食痕迹的根群给出评级为2。在杀虫剂处理保护区之外的根的摄食痕迹多得多,在大多数情况下,与所述ITE相比根尖被破坏。与杀虫剂处理不同,所述转基因植株在整个根群表达CRW抗性基因。但因为转基因植物的防治机制是经口介导的,所以需要最小量的摄食以控制由CRW幼虫进行的任何进一步的伤害。这种最小摄食需求量导致RDR为2。
总之,表达Cry3Bb蛋白变异体的玉米植株完全受保护以抵抗CRW幼虫摄食。这种水平的保护消除了对杀虫剂处理的需要。每年在超过16,000,000英亩玉米地上加入杀虫剂,包括有机磷酸酯、氨基甲酸酯和拟除虫菊酯,来防治CRW。CRW抗性技术有潜力显著降低目前这些杀虫剂暴露于环境中的水平。土壤杀虫剂变为转基因途径的益处是激动人心的,包括减小潜在的对人类健康和安全的风险,减小对非目标生物的直接影响,减少对表面水和地下水给水的污染,减少杀虫剂容器处理的问题以及与其它害虫管理和农学程序普通相容。
表9.
玉米根叶甲对于含有孟山都专利CRW抗性基因的玉米
独立转化事件的根部摄食损害(RDR)平均值
5.5
实施例5-用cry3B基因转化烟草叶绿体
可以产生其中仅改变了线粒体或叶绿体DNA以掺入本申请中所设计分子的重组植物。在叶绿体中起作用的启动子是本领域已知的(Hanley-Bowden等,Trends in Biochemical Science 12:67-70,1987)。获得含有已经插入异源DNA的叶绿体的细胞的方法和组合物已经由例如Daniell等(美国专利第5,693,507号;1997)和Maliga等(美国专利第5,451,513;1995)描述。可以构建含有一个能够产生Cry3B蛋白的表达盒的载体。一个表达盒可以含有驱动cry3B晶体蛋白基因表达的叶绿体有效的启动子序列,以与本文的其它多核苷酸大致相同的方式,采用热扩增法、限制性内切核酸酶消化和连接等,构建该表达盒。叶绿体可表达基因将提供来自异源基因或叶绿体基因例如psbA的一个启动子和一个5’非翻译区,这将保证编码Cry3B蛋白的DNA序列在叶绿体中转录和翻译;一个编码Cry3B蛋白的DNA序列;和一个转录和翻译终止区,例如叶绿体基因的3’反向重复区,它可以稳定表达的cry3B mRNA。来自叶绿体中的表达将增强cry3B基因产物的累积。含有叶绿体或质体的宿主细胞可以用所述表达盒转化,然后可以让含有所述转化叶绿体的细胞生长,以表达Cry3B蛋白。除cry3B基因外,表达盒也可以包括抗生素、除草剂耐性或其它选择标记基因。所述表达盒的侧翼可以是得自叶绿体DNA的、促进将表达盒稳定整合到(尤其是通过同源重组)叶绿体基因组中的DNA序列。或者,所述表达盒可以不整合,但通过包括得自叶绿体DNA的复制起点,将能够保证所述异源cry3B基因在叶绿体中复制。可以由含转化叶绿体的细胞产生植株,然后可以让其生长以产生种子,由所述种子可以产生另外的植株。这种转化方法优于核基因组转化,特别是在通过整合到叶绿体基因组中实现叶绿体转化的场合下,因为叶绿体基因一般是母性遗传的。这提供了环境“更安全的”转基因植物,真正消除了逃逸到环境中的可能性。此外,可以对叶绿体转化多次,以产生表达多种所需重组蛋白的功能性叶绿体基因组,而已经表明当需要多种基因时,核基因组转化相当受限制。因此采用叶绿体或质体转化避免了分离事件。与植物核基因组表达不同,叶绿体或质体中的表达可以由唯一一个启动子起始,并继续通过多顺反子区,以由单一的mRNA产生多种肽。
将以与构建其它植物转化载体大致相同的方式产生所述表达盒。可以将植物叶绿体的有效DNA序列插入细菌质粒,并且与表达所需基因产物例如Cry3B蛋白的DNA序列连接,以使Cry3B蛋白在叶绿体内产生,消除了核基因调节、加帽、剪接或核调节基因聚腺甘酸化的需要;或与叶绿体或质体导向序列连接。可以将包含cry3B基因的表达盒插入构建用于叶绿体或质体转化的载体的限制位点中,其中所述cry3B基因或者合成构建,或者是直接得自苏云金芽孢杆菌基因组或苏云金芽孢杆菌游离型元件的天然基因。所述表达盒的上游侧翼可以是叶绿体或质体功能性启动子,下游侧翼可以是叶绿体或质体功能性转录和翻译终止序列。采用众所周知的同源重组方法,可以将所产生的表达盒加入叶绿体或质体基因组中。
或者,通过采用自主复制型质粒或能在叶绿体或质体中繁殖的其它载体,可以获得叶绿体或质体转化。实行该方法的一个途径是利用叶绿体或质体复制起始需要的叶绿体或质体基因组的部分,作为在转化的叶绿体或质体中保持所述质粒或载体的手段。通过将叶绿体或质体基因组随机克隆到也含有叶绿体或质体选择标记基因的标准细菌载体中,然后转化叶绿体或质体,并在合适的选择培养基上选择转化细胞,可以容易地鉴定出能够稳定复制叶绿体或质体外遗传元件的序列。将本文所述表达盒引入叶绿体或质体可复制外遗传元件,因此提供了将Cry3B苏云金芽孢杆菌δ-内毒素定位至叶绿体或质体的有效手段。
5.6
实施例6:将Cry3Bb或变异体Cry3Bb蛋白导向质体
通过将重组杀虫蛋白导向叶绿体的改进表达,可以产生轻度暴露的并且因此积累成熟叶绿体的组织。在叶片组织中抑制对所述杀虫蛋白敏感的摄食叶片的害虫的改进表达,可能是有利的。为了测试这一点,构建了两种质粒pMON33709和pMON33710,它们除质体或叶绿体导向序列外在所有元件方面均是等基因的,所述质体或叶绿体导向序列在pMON33709中与杀虫Cry3Bb改进变异体符合读框地连接。回收R0玉米植株,并且通过ELISA表明其含有并表达所述转基因。回收了6个pMON33709系和16个pMON33710系,它们在根和叶片中均表达所述转基因。回收叶片和根组织,并分析Cry3Bb变异体蛋白的存在以及以ppm计的存在量。结果示于表10中。
在R0玉米转化事件中Cry3Bb变异体v11231非导向的和质体导向的叶片与根表达的比较
除一个pMON33709系(Ro53643)外,所有pMON33709系在叶片中产生的杀虫蛋白均比在根组织中产生的杀虫蛋白多3-15倍。在叶片中产生较少蛋白的一个系也在根中产生低于1ppm的蛋白,而其它系在叶片中产生几乎高达100ppm的杀虫蛋白。在得自pMON33710转化事件的非导向系中,Cry3Bb变异体蛋白的表达量甚至变化更大,所述非导向系经测定在叶片和根组织中均表达所述重组蛋白。尽管大多数这些系在叶片产生的蛋白多于在根中产生的蛋白,但某些系也在根中产生更多的蛋白,但在那些改进的根表达者的根中产生量之间的差异大大低于在单个pMON33709导向事件中的差异。此外,表达水平的变化在非导向事件中不很明显,只有一个例外。意外的是,一个系(Ro53904)在叶片中产生的蛋白比在任何其它导向或非导向系中观察到的明显多。该系预期是目标为抵抗摄食叶片组织的鞘翅目害虫的商品系的候选系。相反,例如Ro53923的系预期是保护玉米植株抵抗摄食根的害虫例如玉米根叶甲的最佳候选者。
概述的数据表明,将Bt Cry3B蛋白导向质体或叶绿体,提高了所述蛋白在叶片组织中的积累,而不在根组织中积累,并且与在用这样的构成物转化的植株根组织中观察到的表达水平相比,增加了所述蛋白在所述植株叶片中的总表达。
根据以上所述,人们将看出实现了本发明的几个优点,并且获得其它有利的结果。在不偏离本发明范围的情况下,可以在上述方法和组合物中进行各种改变,包含在上述描述和显示于附图中的所有内容应该解释为是说明性的,而不是限制性的。
另外,本申请中涉及的所有参考文献均通过引用全部结合到本文中。
参考书目
Abdullah et al.,1986,Bio/Technology 4:1087-1090
Almond and Dean,1993,Biochemistry,32:1040-1046
Aronson et al.,1995,J.Bacteriol.177:4059-4065
Bechtold et al.,1998,Meth.Mol.Biol.,82:259-266
Benbrook et al.,1986,In:Proceedings Bio Expo 1986,Butterworth,(eds.)Stoneharn,Mass.,pp.27-54
Bevan et al.,1983,Nature,304:184-187
Callis et al.,1987,Genes Dev.,1:1183-1200
Capecchi,1980,Cell,22:479-488
Caramori et al.,1991,Gene 98:37-44
Cashmore et al.,1983,in Genetic Engineering of Plants,An Agricultural Perspective,Basic LifeSciences,Plenum Press,26:29-38,Kosuga & Meredith,Eds.
Chau et al.,1989,Science,244:174-181
Chen et al.,1993,PNAS USA 90:9041-9045
Chen et al.,1995,J.Biol.Chem.270:6412-6419
Cheng et al.,1998,PNAS USA 95:2767-2772
Clapp,1993,Clin.Perinatol.,20:155-168
Cristou et al.,1988,Plant Physiol.,87:671-674
Curiel et al.,1992,Hum.Gen.Ther.,3:147-154
Curiel et al.,1991,Proc.Natl.Acad.Sci.USA,88:8850-8854
de Maagd et al.,1996,Appl.Environ.Microbiol.,62:1537-1543
Dhir et al.,1991,Plant Cell Rep.,10:106-10
Diehn et al.,1996,In:Genetic Engineering,Ed.J.K.Setlow,Plenum Press,New York,NY,18:83-99
Donovan et al.,1992,Appl.Environ.Microbiol.,58:3921-3927
Eglitis and Anderson,1988a,Biotechniques,6:608-614
Eglitis and Anderson,1988b,Adv.Exp.Med Biol.,241:19-27
Ellis et al.,1987,EMBO Journal 6:11-16
English and Slatin,1992,Insect Biochem.Mol.Biol.,22:1-7
Fischhoff et al.,1987,Bio/Technology,5:807-813
Fraley et al.,1983,in Advances in Gene Technology:Molecular Genetics of Plants and Animals,Miami Winter Symposia,Academic Press 20:211-221,Downey et al,Eds.
Fraley et al.,1985,Biotechnology 3:629-635
Fromm et al.,1985,PNAS USA 82:5824-5828
Futterer and Hohn,1996,Plant Mol.Biol.32:159-189
Futterer et al.,1997,J.Virol.71:7984-7989
Fynan et al.,1993,PNAS USA,90:11478-11482
Gallie,et al.,1989,PNAS USA 86:129-132
Ge er al.,1991,J.Biol.Chem.266:17954-17958
Graham and van der Eb,1973,Virology,54:536-539
Hanley-Bowden et al.,1987,Trends in Biochemical Sciences 12:67-70
Herrera-Estrella et al.,1983,Nature,303:209-213
Hess,1987,Intern.Rev.Cytol.,107:367-395
Hills,T.M.and D.C.Peters,1971,Journal of Economic Entomology 64:764-765.
Hofte and Whiteley,1989,Microbiol.Rev.,53(2):242-255
Horsch et al.,1985,Science,227:1229-1231
Iannacone et al.,1997;Plant Mol.Biol.34:485-496
Ishida et al,1996,Nature Biotechnology,14:745-750
Johnston and Tang,1994,Methods Cell.Biol.,43(A):353-365
Jorgensen et al.,1987,Mol.Gen.Genet.,207:471-477
Joshi,1987,Nucl、Acids Res.15:9627-9640
Kay et al.,1987,Science,236:1299-1302
Keegstra and Olsen,1989,Ann.Rev.Plant Physiol.Mol.Biol.,40:471-501
Keller et al.,1989,EMBO Journal8:1005-1012
Klee et al.,1985,Bio/Technology,3:637-642
Klee et al.,1987,Mol.Gen.Genet,210:437-442
Klein et al.,1987,Nature,327:70-73
Klein et al.,1988,PNAS USA 85:4305-4309
Krieg et al.,1983,Entomologie 96:500-508
Krieg et al,1984,Anzeiger für Schadlingskunde Pflanzenschultz Umweltschutz 57:145-150
Kunkel,1985,PNAS USA 82:488-492
Kwak et al.,1995,Mem.Inst.Oswaldo,90:75-79
Kyte and Doolittle,1982,J.Mol.Biol.,157:105-132
Langridge et al.,1989,PNAS USA 86:3219-3223
Lee et al.,1992,J.Bacteriol,174:2501-2510
Lee et al.,1995,Biochem.Biophys.Res.Commun.216:306-312
Lindstrom et al.,1990,Dev.Genet.,11:160-167
Lorz et al.,1985,Mol.Gen.Genet.,199:178-182
Lu et al.,1994,J.Bacteriol.,176:5554-5559
Lu et al.,1993,J.Exp.Med.,178:2089-2096
Ma et al.,1988,Nature 334:631-633
Marcotte et al.,1988,Nature,335:454-457
McBride and Summerfelt,1990,Plant Mol.Biol.14:269-276
McElroy et al.,1990,Plant Cell,2:163-171
McGaughey and Whalon,1993,Science,258:1451-1455
Murray et al.,1989,Nucl.Acids Res.17:477-498
Neuhaus et al.,1994,Plant Cell 6:827-834
Neuhaus et al.,1987,Theor.Appl.Genet.,75:30-36
Odell et al.,1985,Narure,313:810-812
Pena et al.,1987,Nature,325:274-276
Paszkowski et al.,1984,EMBO J.,3:2717-2722
Potrykus et al.,1985,Mol.Gen.Genet.199:183-188
Poulsen et al.,1986,Mol.Gen.Genet.205:193-200
Rajamohan et al.,1995,J.Bacteriol.,177:2276-2282
Rajamohan et al.,1996,J.Biol.Chem.,271:2390-2397
Rogers et al.,1987,Methods in Enzymology 153:253-277
Rogers et al.,1988,In:Methods For Plant Molecular Biology,A.Weissbach and H.Weissbach,eds.,Academic Press Inc.,San Diego,Calif.
Roush,1994,Biocontrol Sci.Technol.,4:501-516
Rouwendal et al.,1997,Plant Mol.Biol.33:989-999
Russell et al.,1993,Plant Cell Reports,13:24-27
Schnepf et al.,1998,Microbiol.Mol.Biol.Rev.62:775-806
Sheen,1990,Plant Cell 2:1027-1038
Simpson et al.,1986,Nature 323:551-554
Skriver and Mundy,1990,Plant Cell 2:503-512
Smedley and Ellar,1996,Microbiology,142:1617-1624
Smith and Ellar,1994,Biochem.J.,302:611-616
Smith et al.,1985,Biochemistry 32:1040-1046
Spielmann et al.,1986、Mol.Gen.Genet.,205:34-41
Toriyama et al.,1986,Theor.Appl.Genet.73:16-19
Uchimiya et al.,1986,Mol.Gen.Genet.204:204-207
Van Tunen et al.,1989,Plant Mol.Biol.12:539-551
Vasil et al.,1989,Plant Physiol.91:1575-1579
Vasil,1988,Plant Cell Reports 7:499-503
Vodkin et al.,1983,Cell 34:1023-1031
Vogel et al.,1989,J.Cell Biochem.Suppl.I3D:312
Von Tersch et al.,1994,Appl.Env.Microbiol.60:3711-3717
Wagner et al.,1992,PNAS USA 89:6099-6103
Walters et al.,1993,Biochem.Biophys.Res.Commun.196:921-926
Weissbach and Weissbach,1988,in Methods for Plant Molecular Biology,(eds.),AcademicPress,Inc.,San Diego,Calif.
Wenzler et al.,1989,Plant Mol.Biol.,12:41-50
Winter et al.,1988,Mol.Gen.Genet.,221:315-319
Wolfersberger et al.,1996,Appl.Environ.Microbiol.,62:279-282
Wong and Neumann,1982,Biochim.Biophys.Res.Commun.,107:584-587
Wu and Aronson,1992,J.Biol.Chem.,267:2311-2317
Wu and Dean,1996,J.Mol.Biol.,255:628-640
Yamada et al.,1986,Plant Cell Reports 5:85-88
Yang et al.,1990,PNAS USA,87:4144-4148
Zhou et al.,1988,Scientia Agricultura Sinica 21:1-6
序列表
<110>Romano,Charles P.
<120>Cr3Bb在玉米中的提高表达
<130>38-21(15304)Cry3Bb Improved Exp.Corn
<140>未知
<141>1999-08-19
<150>60/097,150
<151>1998-08-19
<160>43
<170>PatentIn Ver.2.0
<210>1
<211>1959
<212>DNA
<213>苏云金芽孢杆菌
<220>
<221>CDS
<222>(1)..(1956)
<220>
<223>人工序列的描述:天然存在的编码Cry3Bb1氨基酸序列的核苷酸序列
<400>1
atg aat cca aac aat cga agt gaa cat gat acg ata aag gtt aca cct 48
Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro
1 5 10 15
aac agt gaa ttg caa act aac cat aat caa tat cct tta gct gac aat 96
Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30
cca aat tca aca cta gaa gaa tta aat tat aaa gaa ttt tta aga atg 144
Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45
act gaa gac agt tct acg gaa gtg cta gac aac tct aca gta aaa gat 192
Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60
gca gtt ggg aca gga att tct gtt gta ggg cag att tta ggt gtt gta 240
Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Va1
65 70 75 80
gga gtt cca ttt gct ggg gca ctc act tca ttt tat caa tca ttt ctt 288
Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95
aac act ata tgg cca agt gat gct gac cca tgg aag gct ttt atg gca 336
Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110
caa gtt gaa gta ctg ata gat aag aaa ata gag gag tat gct aaa agt 384
Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125
aaa gct ctt gca gag tta cag ggt ctt caa aat aat ttc gaa gat tat 432
Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140
gtt aat gcg tta aat tcc tgg aag aaa aca cct tta agt ttg cga agt 480
Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser
145 150 155 160
aaa aga agc caa gat cga ata agg gaa ctt ttt tct caa gca gaa agt 528
Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175
cat ttt cgt aat tcc atg ccg tca ttt gca gtt tcc aaa ttc gaa gtg 576
His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190
ctg ttt cta cca aca tat gca caa gct gca aat aca cat tta ttg cta 624
Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205
tta aaa gat gct caa gtt ttt gga gaa gaa tgg gga tat tct tca gaa 672
Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220
gat gtt gct gaa ttt tat cat aga caa tta aaa ctt aca caa caa tac 720
Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr
225 230 235 240
act gac cat tgt gtt aat tgg tat aat gtt gga tta aat ggt tta aga 768
Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255
ggt tca act tat gat gca tgg gtc aaa ttt aac cgt ttt cgc aga gaa 816
Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270
atg act tta act gta tta gat cta att gta ctt ttc cca ttt tat gat 864
Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285
att cgg tta tac tca aaa ggg gtt aaa aca gaa cta aca aga gac att 912
Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300
ttt acg gat cca att ttt tca ctt aat act ctt cag gag tat gga cca 960
Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro
305 310 315 320
act ttt ttg agt ata gaa aac tct att cga aaa cct cat tta ttt gat 1008
Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335
tat tta cag ggg att gaa ttt cat acg cgt ctt caa cct ggt tac ttt 1056
Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350
ggg aaa gat tct ttc aat tat tgg tct ggt aat tat gta gaa act aga 1104
Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365
cct agt ata gga tct agt aag aca att act tcc cca ttt tat gga gat 1152
Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380
aaa tct act gaa cct gta caa aag cta agc ttt gat gga caa aaa gtt 1200
Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val
385 390 395 400
tat cga act ata gct aat aca gac gta gcg gct tgg ccg aat ggt aag 1248
Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415
gta tat tta ggt gtt acg aaa gtt gat ttt agt caa tat gat gat caa 1296
Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430
aaa aat gaa act agt aca caa aca tat gat tca aaa aga aac aat ggc 1344
Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445
cat gta agt gca cag gat tct att gac caa tta ccg cca gaa aca aca 1392
His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460
gat gaa cca ctt gaa aaa gca tat agt cat cag ctt aat tac gcg gaa 1440
Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu
465 470 475 480
tgt ttc tta atg cag gac cgt cgt gga aca att cca ttt ttt act tgg 1488
Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495
aca cat aga agt gta gac ttt ttt aat aca att gat gct gaa aag att 1536
Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510
act caa ctt cca gta gtg aaa gca tat gcc ttg tct tca ggt gct tcc 1584
Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525
att att gaa ggt cca gga ttc aca gga gga aat tta cta ttc cta aaa 1632
Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540
gaa tct agt aat tca att gct aaa ttt aaa gtt aca tta aat tca gca 1680
Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala
545 550 555 560
gcc ttg tta caa cga tat cgt gta aga ata cgc tat gct tct acc act 1728
Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575
aac tta cga ctt ttt gtg caa aat tca aac aat gat ttt ctt gtc atc 1776
Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590
tac att aat aaa act atg aat aaa gat gat gat tta aca tat caa aca 1824
Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605
ttt gat ctc gca act act aat tct aat atg ggg ttc tcg ggt gat aag 1872
Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620
aat gaa ctt ata ata gga gca gaa tct ttc gtt tct aat gaa aaa atc 1920
Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile
625 630 635 640
tat ata gat aag ata gaa ttt atc cca gta caa ttg taa 1959
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>2
<211>652
<212>PRT
<213>苏云金芽孢杆菌
<400>2
Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro
1 5 10 15
Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30
Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45
Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60
Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val
65 70 75 80
Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95
Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110
Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125
Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140
Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser
145 150 155 160
Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175
His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190
Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205
Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220
Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr
225 230 235 240
Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255
Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270
Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285
Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300
Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro
305 310 315 320
Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335
Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350
Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365
Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380
Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val
385 390 395 400
Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415
Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430
Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445
His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460
Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu
465 470 475 480
Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495
Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510
Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525
Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540
Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala
545 550 555 560
Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575
Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590
Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605
Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 611 620
Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile
625 630 635 640
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>3
<211>1959
<212>DNA
<213>苏云金芽孢杆菌
<220>
<221>CDS
<222>(1)..(1956)
<223>天然存在的编码Cry3Bb2氨基酸序列的核苷酸序列
<400>3
atg aat cca aac aat cga agt gaa cat gat acg ata aag gtt aca cct 48
Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro
1 5 10 15
aac agt gaa ttg cca act aac cat aat caa tat cct tta gct gac aat 96
Asn Ser Glu Leu Pro Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30
cca aat tcg aca cta gaa gaa tta aat tat aaa gaa ttt tta aga atg 144
Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45
act gaa gac agt tct acg gaa gtg cta gac aac tct aca gta aaa gat 192
Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60
gca gtt ggg aca gga att tct gtt gta ggg cag att tta ggt gtt gta 240
Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val
65 70 75 80
gga gtt cca ttt gct ggg gca ctc act tca ttt tat caa tca ttt ctt 288
Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95
gac act ata tgg cca agt gat gct gac cca tgg aag gct ttt atg gca 336
Asp Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110
caa gtt gaa gta ctg ata gat aag aaa ata gag gag tat gct aaa agt 384
Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125
aaa gct ctt gca gag tta cag ggt ctt caa aat aat ttc gaa gat tat 432
Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140
gtt aat gcg tta aat tcc tgg aag aaa aca cct tta agt ttg cga agt 480
Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser
145 150 155 160
aaa aga agc caa gat cga ata agg gaa ctt ttt tct caa gca gaa agt 528
Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175
cat ttt cgt aat tcc atg ccg tca ttt gca gtt tcc aaa ttc gaa gtg 576
His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190
ctg ttt cta cca aca tat gca caa gct gca aat aca cat tta ttg cta 624
Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205
tta aaa gat gct caa gtt ttt gga gaa gaa tgg gga tat tct tca gaa 672
Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220
gat gtt gct gaa ttt tat cat aga caa tta aaa ctt acg caa caa tac 720
Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr
225 230 235 240
act gac cat tgt gtc aat tgg tat aat gtt gga tta aat ggt tta aga 768
Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255
ggt tca act tat gat gca tgg gtc aaa ttt aac cgt ttt cgc aga gaa 816
Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270
atg act tta act gta tta gat cta att gta ctt ttc cca ttt tat gat 864
Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285
gtt cgg tta tac tca aaa ggt gtt aaa aca gaa cta aca aga gac att 912
Val Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300
ttt acg gat cca att ttt tca ctc aat act ctt cag gag tat gga cca 960
Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro
305 310 315 320
act ttt ttg agt ata gaa aac tct att cga aaa cct cat tta ttt gat 1008
Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335
tat tta cag ggt att gaa ttt cat acg cgt ctt caa cct ggt tac tct 1056
Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Ser
340 345 350
ggg aaa gat tct ttc aat tat tgg tct ggt aat tat gta gaa act aga 1104
Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365
cct agt ata gga tct agt aag aca att act tcc cca ttt tat gga gat 1152
Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380
aaa tct act gaa cct gta caa aag tta agc ttt gat gga caa aaa gtt 1200
Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val
385 390 395 400
tat cga act ata gct aat aca gac gta gcg gct tgg ccg aat ggc aag 1248
Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415
ata tat ttt ggt gtt acg aaa gtt gat ttt agt caa tat gat gat caa 1296
Ile Tyr Phe Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430
aaa aat gaa act agt aca caa aca tat gat tca aaa aga aac aat ggc 1344
Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445
cat gta ggt gca cag gat tct att gac caa tta cca cca gaa aca aca 1392
His Val Gly Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460
gat gaa cca ctt gaa aaa gca tat agt cat cag ctt aat tac gcg gaa 1440
Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu
465 470 475 480
tgt ttc tta atg cag gac cgt cgt gga aca att cca ttt ttt act tgg 1488
Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495
aca cat aga agt gta gac ttt ttt aat aca att gat gct gaa aag att 1536
Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510
act caa ctt cca gta gtg aaa gca tat gcc ttg tct tca ggt gct tcc 1584
Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525
att att gaa ggt cca gga ttc aca gga gga aat tta cta ttc cta aaa 1632
Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540
gaa tct agt aat tca att gct aaa ttt aaa gtt aca tta aat tca gca 1680
Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala
545 550 555 560
gcc ttg tta caa cga tat cgt gta aga ata cgc tat gct tct acc act 1728
Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575
aac tta cga ctt ttt gtg caa aat tca aac aat gat ttt att gtc atc 1776
Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Ile Val Ile
580 585 590
tac att aat aaa act atg aat ata gat gat gat tta aca tat caa aca 1824
Tyr Ile Asn Lys Thr Met Asn Ile Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605
ttt gat ctc gca act act aat tct aat atg ggg ttc tcg ggt gat acg 1872
Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Thr
610 615 620
aat gaa ctt ata ata gga gca gaa tct ttc gtt tct aat gaa aaa atc 1920
Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile
625 630 635 640
tat ata gat aag ata gaa ttt atc cca gta caa ttg taa 1959
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>4
<211>652
<212>PRT
<213>苏云金芽孢杆菌
<400>4
Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro
1 5 10 15
Asn Ser Glu Leu Pro Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30
Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45
Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60
Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val
65 70 75 80
Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95
Asp Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110
Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125
Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140
Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser
145 150 155 160
Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175
His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190
Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205
Leu Lys Asp Ala Gln Va1 Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220
Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr
225 230 235 240
Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255
Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270
Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285
Val Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300
Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro
305 310 315 320
Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335
Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Ser
340 345 350
Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365
Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380
Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val
385 390 395 400
Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415
Ile Tyr Phe Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430
Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445
His Val Gly Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460
Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu
465 470 475 480
Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495
Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510
Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525
Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540
Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala
545 550 555 560
Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575
Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Ile Val Ile
580 585 590
Tyr Ile Asn Lys Thr Met Asn Ile Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605
Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Thr
610 615 620
Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile
625 630 635 640
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>5
<211>1962
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的或非天然存在的编码Cry3Bb氨基酸序列的核苷酸序列
<220>
<221>CDS
<222>(1)..(1956)
<400>5
atg aac cct aac aat cgt tcc gaa cac gac acc atc aag gtt act cca 48
Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro
1 5 10 15
aac tct gag ttg caa act aat cac aac cag tac cca ttg gct gac aat 96
Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30
cct aac agt act ctt gag gaa ctt aac tac aag gag ttt ctc cgg atg 144
Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45
acc gaa gat agc tcc act gag gtt ctc gat aac tct aca gtg aag gac 192
Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60
gct gtt gga act ggc att agc gtt gtg gga cag att ctt gga gtg gtt 240
Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val
65 70 75 80
ggt gtt cca ttc gct gga gct ttg acc agc ttc tac cag tcc ttt ctc 288
Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95
aac acc atc tgg cct tca gat gct gat ccc tgg aag gct ttc atg gcc 336
Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110
caa gtg gaa gtc ttg atc gat aag aag atc gaa gag tat gcc aag tct 384
Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125
aaa gcc ttg gct gag ttg caa ggt ttg cag aac aac ttc gag gat tac 432
Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140
gtc aac gca ctc aac agc tgg aag aaa act ccc ttg agt ctc agg tct 480
Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser
145 150 155 160
aag cgt tcc cag gac cgt att cgt gaa ctt ttc agc caa gcc gaa tcc 528
Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175
cac ttc aga aac tcc atg cct agc ttt gcc gtt tct aag ttc gag gtg 576
His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190
ctc ttc ttg cca aca tac gca caa gct gcc aac act cat ctc ttg ctt 624
Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205
ctc aaa gac gct cag gtg ttt ggt gag gaa tgg ggt tac tcc agt gaa 672
Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220
gat gtt gcc gag ttc tac cat agg cag ctc aag ttg act caa cag tac 720
Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr
225 230 235 240
aca gac cac tgc gtc aac tgg tac aac gtt ggg ctc aat ggt ctt aga 768
Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255
gga tct acc tac gac gca tgg gtg aag ttc aac agg ttt cgt aga gag 816
Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270
atg acc ttg act gtg ctc gat ctt atc gtt ctc ttt cca ttc tac gac 864
Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285
att cgt ctt tac tcc aaa ggc gtt aag aca gag ctg acc aga gac atc 912
Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300
ttc acc gat ccc atc ttc tca ctt aac acc ctg cag gaa tac ggt cca 960
Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro
305 310 315 320
act ttt ctc tcc att gag aac agc atc agg aag cct cac ctc ttc gac 1008
Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335
tat ctg caa ggc att gag ttt cac acc agg ttg caa cct ggt tac ttc 1056
Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350
ggt aag gat tcc ttc aac tac tgg agc gga aac tac gtt gaa acc aga 1104
Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365
cca tcc atc gga tct agc aag acc atc act tct cca ttc tac ggt gac 1152
Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380
aag agc act gag cca gtg cag aag ttg agc ttc gat ggg cag aag gtg 1200
Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val
385 390 395 400
tat aga acc atc gcc aat acc gat gtt gca gct tgg cct aat ggc aag 1248
Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415
gtc tac ctt gga gtt act aaa gtg gac ttc tcc caa tac gac gat cag 1296
Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430
aag aac gag aca tct act caa acc tac gat agt aag agg aac aat ggc 1344
Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445
cat gtt tcc gca caa gac tcc att gac caa ctt cca cct gaa acc act 1392
His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460
gat gaa cca ttg gag aag gct tac agt cac caa ctt aac tac gcc gaa 1440
Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu
465 470 475 480
tgc ttt ctc atg caa gac agg cgt ggc acc att ccg ttc ttt aca tgg 1488
Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495
act cac agg tct gtc gac ttc ttt aac act atc gac gct gag aag att 1536
Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510
acc caa ctt ccc gtg gtc aag gct tat gcc ttg tcc agc gga gct tcc 1584
Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525
atc att gaa ggt cca ggc ttc acc ggt ggc aac ttg ctc ttc ctt aag 1632
Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540
gag tcc agc aac tcc atc gcc aag ttc aaa gtg aca ctt aac tca gca 1680
Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala
545 550 555 560
gcc ttg ctc caa cgt tac agg gtt cgt atc aga tac gca agc act acc 1728
Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575
aat ctt cgc ctc ttt gtc cag aac agc aac aat gat ttc ctt gtc atc 1776
Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590
tac ayc aac aag act atg aac aaa gac gat gac ctc acc tac aac aca 1824
Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Asn Thr
595 600 605
ttc gat ctt gcc act acc aat agt aac atg gga ttc tct ggt gac aag 1872
Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620
aac gag ctg atc ata ggt gct gag agc ttt gtc tct aat gag aag att 1920
Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile
625 630 635 640
tac ata gac aag atc gag ttc att cca gtt caa ctctaatag 1962
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>6
<211>652
<212>PRT
<213>人工序列
<400>6
Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro
1 5 10 15
Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30
Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45
Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60
Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val
65 70 75 80
Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95
Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110
Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125
Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140
Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser
145 150 155 160
Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175
His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190
Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205
Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220
Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr
225 230 235 240
Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255
Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270
Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285
Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300
Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro
305 310 315 320
Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335
Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350
Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365
Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380
Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val
385 390 395 400
Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415
Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430
Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445
His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460
Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu
465 470 475 480
Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495
Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510
Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525
Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540
Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala
545 550 555 560
Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575
Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590
Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Asn Thr
595 600 605
Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620
Asn Glu Leu Ile IleGly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile
625 630 635 640
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>7
<211>1989
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:非天然存在的编码变异的Cry3Bb氨基酸序列v11231的核苷酸序列
<220>
<221>CDS
<222>(3)..(1961)
<223>Cry3Bb变异体v11231氨基酸序列的编码序列
<400>7
cc atg gca aac cct aac aat cgt tcc gaa cac gac acc atc aag gtt 47
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val
1 5 10 15
act cca aac tct gag ttg caa act aat cac aac cag tac cca ttg gct 95
Thr Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala
20 25 30
gac aat cct aac agt act ctt gag gaa ctt aac tac aag gag ttt ctc 143
Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu
35 40 45
cgg atg acc gaa gat agc tcc act gag gtt ctc gat aac tct aca gtg 191
Arg Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val
50 55 60
aag gac gct gtt gga act ggc att agc gtt gtg gga cag att ctt gga 239
Lys Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly
65 70 75
gtg gtt ggt gtt cca ttc gct gga gct ttg acc agc ttc tac cag tcc 287
Val Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser
80 85 90 95
ttt ctc aac acc atc tgg cct tca gat gct gat ccc tgg aag gct ttc 335
Phe Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe
100 105 110
atg gcc caa gtg gaa gtc ttg atc gat aag aag atc gaa gag tat gcc 383
Met Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala
115 120 125
aag tct aaa gcc ttg gct gag ttg caa ggt ttg cag aac aac ttc gag 431
Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu
130 135 140
gat tac gtc aac gca ctc aac agc tgg aag aaa act ccc ttg agt ctc 479
Asp Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu
145 150 155
agg tct aag cgt tcc cag gac cgt att cgt gaa ctt ttc agc caa gcc 527
Arg Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala
160 165 170 175
gaa tcc cac ttc aga aac tcc atg cct agc ttt gcc gtt tct aag ttc 575
Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe
180 185 190
gag gtg ctc ttc ttg cca aca tac gca caa gct gcc aac act cat ctc 623
Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu
195 200 205
ttg ctt ctc aaa gac gct cag gtg ttt ggt gag gaa tgg ggt tac tcc 671
Leu Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser
210 215 220
agt gaa gat gtt gcc gag ttc tac cgt agg cag ctc aag ttg act caa 719
Ser Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln
225 230 235
cag tac aca gac cac tgc gtc aac tgg tac aac gtt ggg ctc aat ggt 767
Gln Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly
240 245 250 255
ctt aga gga tct acc tac gac gca tgg gtg aag ttc aac agg ttt cgt 815
Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg
260 265 270
aga gag atg acc ttg act gtg ctc gat ctt atc gtt ctc ttt cca ttc 863
Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe
275 280 285
tac gac att cgt ctt tac tcc aaa ggc gtt aag aca gag ctg acc aga 911
Tyr Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg
290 295 300
gac atc ttc acc gat ccc atc ttc cta ctt acg acc ctg cag aaa tac 959
Asp Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr
305 310 315
ggt cca act ttt ctc tcc att gag aac agc atc agg aag cct cac ctc 1007
Gly Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu
320 325 330 335
ttc gac tat ctg caa ggc att gag ttt cac acc agg ttg caa cct ggt 1055
Phe Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly
340 345 350
tac ttc ggt aag gat tcc ttc aac tac tgg agc gga aac tac gtt gaa 1103
Tyr Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu
355 360 365
acc aga cca tcc atc gga tct agc aag acc atc act tct cca ttc tac 1151
Thr Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr
370 375 380
ggt gac aag agc act gag cca gtg cag aag ttg agc ttc gat ggg cag 1199
Gly Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln
385 390 395
aag gtg tat aga acc atc gcc aat acc gat gtt gca gct tgg cct aat 1247
Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn
400 405 410 415
ggc aag gtc tac ctt gga gtt act aaa gtg gac ttc tcc caa tac gac 1295
Gly Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp
420 425 430
gat cag aag aac gag aca tct act caa acc tac gat agt aag agg aac 1343
Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn
435 440 445
aat ggc cat gtt tcc gca caa gac tcc att gac caa ctt cca cct gaa 1391
Asn Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu
450 455 460
acc act gat gaa cca ttg gag aag gct tac agt cac caa ctt aac tac 1439
Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr
465 470 475
gcc gaa tgc ttt ctc atg caa gac agg cgt ggc acc att ccg ttc ttt 1487
Ala Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe
480 485 490 495
aca tgg act cac agg tct gtc gac ttc ttt aac act atc gac gct gag 1535
Thr Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu
500 505 510
aag att acc caa ctt ccc gtg gtc aag gct tat gcc ttg tcc agc gga 1583
Lys Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly
515 520 525
gct tcc atc att gaa ggt cca ggc ttc acc ggt ggc aac ttg ctc ttc 1631
Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe
530 535 540
ctt aag gag tcc agc aac tcc atc gcc aag ttc aaa gtg aca ctt aac 1679
Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn
545 550 555
tca gca gcc ttg ctc caa cgt tac agg gtt cgt atc aga tac gca agc 1727
Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser
560 565 570 575
act acc aat ctt cgc ctc ttt gtc cag aac agc aac aat gat ttc ctt 1775
Thr Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu
580 585 590
gtc atc tac atc aac aag act atg aac aaa gac gat gac ctc acc tac 1823
Val Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr
595 600 605
caa aca ttc gat cct gcc act acc aat agt aac atg gga ttc tct ggt 1871
Gln Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly
610 615 620
gac aag aac gag ctg atc ata ggt gct gag agc ttt gtc tct aat gag 1919
Asp Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu
625 630 635
aag att tac ata gac aag atc gag ttc att cca gtt caa ctc 1961
Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
640 645 650
taatagatcc cccgggctgc aggaattc 1989
<210>8
<211>653
<212>PRT
<213>人工序列
<400>8
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Va1 Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile ProVal Gln Leu
645 650
<210>9
<211>1984
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:非天然存在的编码Cry3Bb变异体11231mv1氨基酸序列的核苷酸序列
<220>
<221>CDS
<222>(3)..(1961)
<223>Cry3Bb变异体11231mv1氨基酸序列的编码序列
<400>9
cc atg gcc aac ccc aac aat cgc tcc gag cac gac acg atc aag gtc 47
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val
1 5 10 l5
acc ccc aac tcc gag ctc cag acc aac cac aac cag tac ccg ctg gcc 95
Thr Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala
20 25 30
gac aac ccc aac tcc acc ctg gaa gag ctg aac tac aag gag ttc ctg 143
Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu
35 40 45
cgc atg acc gag gac tcc tcc acg gag gtc ctg gac aac tcc acc gtc 191
Arg Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val
50 55 60
aag gac gcc gtc ggg acc ggc atc tcc gtc gtt ggg cag atc ctg ggc 239
Lys Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly
65 70 75
gtc gtt ggc gtc ccc ttc gca ggt gct ctc acc tcc ttc tac cag tcc 287
Val Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser
80 85 90 95
ttc ctg aac acc atc tgg ccc tcc gac gcc gac ccc tgg aag gcc ttc 335
Phe Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe
100 105 110
atg gcc caa gtc gaa gtc ctg atc gac aag aag atc gag gag tac gcc 383
Met Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala
115 120 125
aag tcc aag gcc ctg gcc gag ctg caa ggc ctg caa aac aac ttc gag 431
Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu
130 135 140
gac tac gtc aac gcg ctg aac tcc tgg aag aag acg cct ctg tcc ctg 479
Asp Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu
145 150 155
cgc tcc aag cgc tcc cag ggc cgc atc cgc gag ctg ttc tcc cag gcc 527
Arg Ser Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala
160 165 170 175
gag tcc cac ttc cgc aac tcc atg ccg tcc ttc gcc gtc tcc aag ttc 575
Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe
180 185 190
gag gtc ctg ttc ctg ccc acc tac gcc cag gct gcc aac acc cac ctc 623
Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu
195 200 205
ctg ttg ctg aag gac gcc cag gtc ttc ggc gag gaa tgg ggc tac tcc 671
Leu Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser
210 215 220
tcg gag gac gtc gcc gag ttc tac cgt cgc cag ctg aag ctg acc caa 719
Ser Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln
225 230 235
cag tac acc gac cac tgc gtc aac tgg tac aac gtc ggc ctg aac ggc 767
Gln Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly
240 245 250 255
ctg agg ggc tcc acc tac gac gca tgg gtc aag ttc aac cgc ttc cgc 815
Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg
260 265 270
agg gag atg acc ctg acc gtc ctg gac ctg atc gtc ctg ttc ccc ttc 863
Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe
275 280 285
tac gac atc cgc ctg tac tcc aag ggc gtc aag acc gag ctg acc cgc 911
Tyr Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg
290 295 300
gac atc ttc acg gac ccc atc ttc ctg ctc acg acc ctc cag aag tac 959
Asp Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr
305 310 315
ggt ccc acc ttc ctg tcc atc gag aac tcc atc cgc aag ccc cac ctg 1007
Gly Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu
320 325 330 335
ttc gac tac ctc cag ggc atc gag ttc cac acg cgc ctg agg cca ggc 1055
Phe Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly
340 345 350
tac ttc ggc aag gac tcc ttc aac tac tgg tcc ggc aac tac gtc gag 1103
Tyr Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu
355 360 365
acc agg ccc tcc atc ggc tcc tcg aag acg atc acc tcc cct ttc tac 1151
Thr Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr
370 375 380
ggc gac aag tcc acc gag ccc gtc cag aag ctg tcc ttc gac ggc cag 1199
Gly Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln
385 390 395
aag gtc tac cgc acc atc gcc aac acc gac gtc gcg gct tgg ccg aac 1247
Lys Va1 Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn
400 405 410 415
ggc aag gtc tac ctg ggc gtc acg aag gtc gac ttc tcc cag tac gat 1295
Gly Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp
420 425 430
gac cag aag aat gaa acc tcc acc cag acc tac gac tcc aag cgc aac 1343
Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn
435 440 445
aat ggc cac gtc tcc gcc cag gac tcc atc gac cag ctg ccg cct gag 1391
Asn Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu
450 455 460
acc act gac gag ccc ctg gag aag gcc tac tcc cac cag ctg aac tac 1439
Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr
465 470 475
gcg gag tgc ttc ctg atg caa gac cgc agg ggc acc atc ccc ttc ttc 1487
Ala Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe
480 485 490 495
acc tgg acc cac cgc tcc gtc gac ttc ttc aac acc atc gac gcc gag 1535
Thr Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu
500 505 510
aag atc acc cag ctg ccc gtg gtc aag gcc tac gcc ctg tcc tcg ggt 1583
Lys Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly
515 520 525
gcc tcc atc att gag ggt cca ggc ttc acc ggt ggc aac ctg ctg ttc 1631
Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe
530 535 540
ctg aag gag tcc tcg aac tcc atc gcc aag ttc aag gtc acc ctg aac 1679
Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Va1 Thr Leu Asn
545 550 555
tcc gct gcc ttg ctg caa cgc tac cgc gtc cgc atc cgc tac gcc tcc 1727
Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser
560 565 570 575
acc acg aac ctg cgc ctg ttc gtc cag aac tcc aac aat gac ttc ctg 1775
Thr Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu
580 585 590
gtc atc tac atc aac aag acc atg aac aag gac gat gac ctg acc tac 1823
Val Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr
595 600 605
cag acc ttc gac ctc gcc acc acg aac tcc aac atg ggc ttc tcg ggc 1871
Gln Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly
610 615 620
gac aag aat gaa ctg atc att ggt gct gag tcc ttc gtc tcc aat gaa 1919
Asp Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu
625 630 635
aag atc tac atc gac aag atc gag ttc atc ccc gtc cag ctg 1961
Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
640 645 650
tgataggaac tctgattgaa ttc 1984
<210>10
<211>653
<212>PRT
<213>人工序列
<400>10
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>11
<211>1984
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:非天然存在的编码Cry3Bb变异体11231mv2氨基酸序列的核苷酸序列
<220>
<221>CDS
<222>(3)..(1961)
<223>Cry3Bb变异体11231mv2氨基酸序列的编码序列
<400>11
cc atg gcc aac ccc aac aat cgc tcc gag cac gac acg atc aag gtc 47
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val
1 5 10 15
acc ccc aac tcc gag ctc cag acc aac cac aac cag tac ccg ctg gcc 95
Thr Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala
20 25 30
gac aac ccc aac tcc acc ctg gaa gag ctg aac tac aag gag ttc ctg 143
Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu
35 40 45
cgc atg acc gag gac tcc tcc acg gag gtc ctg gac aac tcc acc gtc 191
Arg Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val
50 55 60
aag gac gcc gtc ggg acc ggc atc tcc gtc gtt ggg cag atc ctg ggc 239
Lys Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly
65 70 75
gtc gtt ggc gtc ccc ttc gca ggt gct ctc acc tcc ttc tac cag tcc 287
Val Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser
80 85 90 95
ttc ctg aac acc atc tgg ccc tcc gac gcc gac ccc tgg aag gcc ttc 335
Phe Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe
100 105 110
atg gcc caa gtc gaa gtc ctg atc gac aag aag atc gag gag tac gcc 383
Met Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala
115 120 125
aag tcc aag gcc ctg gcc gag ctg caa ggc ctg caa aac aac ttc gag 431
Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu
130 135 140
gac tac gtc aac gcg ctg aac tcc tgg aag aag acg cct ctg tcc ctg 479
Asp Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu
145 150 155
cgc tcc aag cgc tcc cag gac cgc atc cgc gag ctg ttc tcc cag gcc 527
Arg Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala
160 165 170 175
gag tcc cac ttc cgc aac tcc atg ccg tcc ttc gcc gtc tcc aag ttc 575
Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe
180 185 190
gag gtc ctg ttc ctg ccc acc tac gcc cag gct gcc aac acc cac ctc 623
Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu
195 200 205
ctg ttg ctg aag gac gcc cag gtc ttc ggc gag gaa tgg ggc tac tcc 671
Leu Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser
210 215 220
tcg gag gac gtc gcc gag ttc tac cgt cgc cag ctg aag ctg acc caa 719
Ser Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln
225 230 235
cag tac acc gac cac tgc gtc aac tgg tac aac gtc ggc ctg aac ggc 767
Gln Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly
240 245 250 255
ctg agg ggc tcc acc tac gac gca tgg gtc aag ttc aac cgc ttc cgc 815
Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg
260 265 270
agg gag atg acc ctg acc gtc ctg gac ctg atc gtc ctg ttc ccc ttc 863
Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe
275 280 285
tac gac atc cgc ctg tac tcc aag ggc gtc aag acc gag ctg acc cgc 911
Tyr Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg
290 295 300
gac atc ttc acg gac ccc atc ttc ctg ctc acg acc ctc cag aag tac 959
Asp Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr
305 310 315
ggt ccc acc ttc ctg tcc atc gag aac tcc atc cgc aag ccc cac ctg 1007
Gly Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu
320 325 330 335
ttc gac tac ctc cag ggc atc gag ttc cac acg cgc ctg agg cca ggc 1055
Phe Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly
340 345 350
tac ttc ggc aag gac tcc ttc aac tac tgg tcc ggc aac tac gtc gag 1103
Tyr Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu
355 360 365
acc agg ccc tcc atc ggc tcc tcg aag acg atc acc tcc cct ttc tac 1151
Thr Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr
370 375 380
ggc gac aag tcc acc gag ccc gtc cag aag ctg tcc ttc gac ggc cag 1199
Gly Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln
385 390 395
aag gtc tac cgc acc atc gcc aac acc gac gtc gcg gct tgg ccg aac 1247
Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn
400 405 410 415
ggc aag gtc tac ctg ggc gtc acg aag gtc gac ttc tcc cag tac gat 1295
Gly Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp
420 425 430
gac cag aag aat gaa acc tcc acc cag acc tac gac tcc aag cgc aac 1343
Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn
435 440 445
aat ggc cac gtc tcc gcc cag gac tcc atc gac cag ctg ccg cct gag 1391
Asn Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu
450 455 460
acc act gac gag ccc ctg gag aag gcc tac tcc cac cag ctg aac tac 1439
Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr
465 470 475
gcg gag tgc ttc ctg atg caa gac cgc agg ggc acc atc ccc ttc ttc 1487
Ala Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe
480 485 490 495
acc tgg acc cac cgc tcc gtc gac ttc ttc aac acc atc gac gcc gag 1535
Thr Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu
500 505 510
aag atc acc cag ctg ccc gtg gtc aag gcc tac gcc ctg tcc tcg ggt 1583
Lys Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly
515 520 525
gcc tcc atc att gag ggt cca ggc ttc acc ggt ggc aac ctg ctg ttc 1631
Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe
530 535 540
ctg aag gag tcc tcg aac tcc atc gcc aag ttc aag gtc acc ctg aac 1679
Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn
545 550 555
tcc gct gcc ttg ctg caa cgc tac cgc gtc cgc atc cgc tac gcc tcc 1727
Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser
560 565 570 575
acc acg aac ctg cgc ctg ttc gtc cag aac tcc aac aat gac ttc ctg 1775
Thr Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu
580 585 590
gtc atc tac atc aac aag acc atg aac aag gac gat gac ctg acc tac 1823
Val Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr
595 600 605
cag acc ttc gac ctc gcc acc acg aac tcc aac atg ggc ttc tcg ggc 1871
Gln Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly
610 615 620
gac aag aat gaa ctg atc att ggt gct gag tcc ttc gtc tcc aat gaa 1919
Asp Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu
625 630 635
aag atc tac atc gac aag atc gag ttc atc ccc gtc cag ctg 1961
Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
640 645 650
tgataggaac tctgattgaa ttc 1984
<210>12
<211>653
<212>PRT
<213>人工序列
<400>12
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>13
<211>4149
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(25)..(640)
<223>P-CaMV.35S
<220>
<221>内含子
<222>(669)..(1472)
<223>I-Zm.Hsp70
<220>
<221>转运肽
<222>(1489)..(1635)
<223>氨基末端TS-Zm.rbcs
<220>
<221>内含子
<222>(1636)..(1798)
<223>I-Zm.rbcs
<220>
<221>转运肽
<222>(1799)..(1885)
<223>羧基末端TS-Zm.rbcs
<220>
<221>CDS
<222>(1885)..(3843)
<223>Cry3B1变异体v11231
<220>
<221>终止子
<222>(3871)..(4127)
<223>T-AGRtun.os3’转录终止和聚腺苷酸化序列
<400>13
gcggccgcgt taacaagctt ctgcaggtcc gatgtgagac ttttcaacaa agggtaatat 60
ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg aagatagtgg 120
aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc atcgttgaag 180
atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 240
aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatggt ccgatgtgag 300
acttttcaac aaagggtaat atccggaaac ctcctcggat tccattgccc agctatctgt 360
cactttattg tgaagatagt gaaaaggaag gtggctccta caaatgccat cattgcgata 420
aaggaaaggc catcgttgaa gatgcctctg ccgacagtgg tcccaaagat ggacccccac 480
ccacgaggag catcgtggaa aaagaagacg ttccaaccac gtcttcaaag caagtggatt 540
gatgtgatat ctccactgac gtaagggatg acgcacaatc ccactatcct tcgcaagacc 600
cttcctctat ataaggaagt tcatttcatt tggagaggac acgctgacaa gctgactcta 660
gcagatctac cgtcttcggt acgcgctcac tccgccctct gcctttgtta ctgccacgtt 720
tctctgaatg ctctcttgtg tggtgattgc tgagagtggt ttagctggat ctagaattac 780
actctgaaat cgtgttctgc ctgtgctgat tacttgccgt cctttgtagc agcaaaatat 840
agggacatgg tagtacgaaa cgaagataga acctacacag caatacgaga aatgtgtaat 900
ttggtgctta gcggtattta tttaagcaca tgttggtgtt atagggcact tggattcaga 960
agtttgctgt taatttaggc acaggcttca tactacatgg gtcaatagta tagggattca 1020
tattataggc gatactataa taatttgttc gtctgcagag cttattattt gccaaaatta 1080
gatattccta ttctgttttt gtttgtgtgc tgttaaattg ttaacgcctg aaggaataaa 1140
tataaatgac gaaattttga tgtttatctc tgctccttta ttgtgaccat aagtcaagat 1200
cagatgcact tgttttaaat attgttgtct gaagaaataa gtactgacag tattttgatg 1260
cttgatctgc ttgtttgttg taacaaaatt taaaaataaa gagtttcctt tttgttgctc 1320
tccttacctc ctgatggtat ctagtatcta ccaactgaca ctatattgct tctctttaca 1380
tacgtatctt gctcgatgcc ttctccctag tgttgaccag tgttactcac atagtctttg 1440
ctcatttcat tgtaatgcag ataccaagcg gcctctagag gatcagcatg gcgcccaccg 1500
tgatgatggc ctcgtcggcc accgccgtcg ctccgttcct ggggctcaag tccaccgcca 1560
gcctccccgt cgcccgccgc tcctccagaa gcctcggcaa cgtcagcaac ggcggaagga 1620
tccggtgcat gcaggtaaca aatgcatcct agctagtagt tctttgcatt gcagcagctg 1680
cagctagcga gttagtaata ggaagggaac tgatgatcca tgcatggact gatgtgtgtt 1740
gcccatccca tcccatccca tttcccaaac gaaccgaaaa caccgtacta cgtgcaggtg 1800
tggccctacg gcaacaagaa gttcgagacg ctgtcgtacc tgccgccgct gtcgaccggc 1860
gggcgcatcc gctgcatgca ggcc atg gca aac cct aac aat cgt tcc gaa 1911
Met Ala Asn Pro Asn Asn Arg Ser Glu
1 5
cac gac acc atc aag gtt act cca aac tct gag ttg caa act aat cac 1959
His Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Gln Thr Asn His
10 15 20 25
aac cag tac cca ttg gct gac aat cct aac agt act ctt gag gaa ctt 2007
Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu
30 35 40
aac tac aag gag ttt ctc cgg atg acc gaa gat agc tcc act gag gtt 2055
Asn Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser Ser Thr Glu Val
45 50 55
ctc gat aac tct aca gtg aag gac gct gtt gga act ggc att agc gtt 2103
Leu Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser Val
60 65 70
gtg gga cag att ctt gga gtg gtt ggt gtt cca ttc gct gga gct ttg 2151
Val Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala Leu
75 80 85
acc agc ttc tac cag tcc ttt ctc aac acc atc tgg cct tca gat gct 2199
Thr Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp Pro Ser Asp Ala
90 95 100 105
gat ccc tgg aag gct ttc atg gcc caa gtg gaa gtc ttg atc gat aag 2247
Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp Lys
110 115 120
aag atc gaa gag tat gcc aag tct aaa gcc ttg gct gag ttg caa ggt 2295
Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly
125 130 135
ttg cag aac aac ttc gag gat tac gtc aac gca ctc aac agc tgg aag 2343
Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asn Ser Trp Lys
140 145 150
aaa act ccc ttg agt ctc agg tct aag cgt tcc cag gac cgt att cgt 2391
Lys Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln Asp Arg Ile Arg
155 160 165
gaa ctt ttc agc caa gcc gaa tcc cac ttc aga aac tcc atg cct agc 2439
Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser
170 175 180 185
ttt gcc gtt tct aag ttc gag gtg ctc ttc ttg cca aca tac gca caa 2487
Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln
190 195 200
gct gcc aac act cat ctc ttg ctt ctc aaa gac gct cag gtg ttt ggt 2535
Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe Gly
205 210 215
gag gaa tgg ggt tac tcc agt gaa gat gtt gcc gag ttc tac cgt agg 2583
Glu Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu Phe Tyr Arg Arg
220 225 230
cag ctc aag ttg act caa cag tac aca gac cac tgc gtc aac tgg tac 2631
Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp Tyr
235 240 245
aac gtt ggg ctc aat ggt ctt aga gga tct acc tac gac gca tgg gtg 2679
Asn Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val
250 255 260 265
aag ttc aac agg ttt cgt aga gag atg acc ttg act gtg ctc gat ctt 2727
Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu
270 275 280
atc gtt ctc ttt cca ttc tac gac att cgt ctt tac tcc aaa ggc gtt 2775
Ile Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr Ser Lys Gly Val
285 290 295
aag aca gag ctg acc aga gac atc ttc acc gat ccc atc ttc cta ctt 2823
Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Leu Leu
300 305 310
acg acc ctg cag aaa tac ggt cca act ttt ctc tcc att gag aac agc 2871
Thr Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser Ile Glu Asn Ser
315 320 325
atc agg aag cct cac ctc ttc gac tat ctg caa ggc att gag ttt cac 2919
Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly Ile Glu Phe His
330 335 340 345
acc agg ttg caa cct ggt tac ttc ggt aag gat tcc ttc aac tac tgg 2967
Thr Arg Leu Gln Pro Gly Tyr Phe Gly Lys Asp Ser Phe Asn Tyr Trp
350 355 360
agc gga aac tac gtt gaa acc aga cca tcc atc gga tct agc aag acc 3015
Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Ser Lys Thr
365 370 375
atc act tct cca ttc tac ggt gac aag agc act gag cca gtg cag aag 3063
Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu Pro Val Gln Lys
380 385 390
ttg agc ttc gat ggg cag aag gtg tat aga acc atc gcc aat acc gat 3111
Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp
395 400 405
gtt gca gct tgg cct aat ggc aag gtc tac ctt gga gtt act aaa gtg 3159
Val Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly Val Thr Lys Val
410 415 420 425
gac ttc tcc caa tac gac gat cag aag aac gag aca tct act caa acc 3207
Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr
430 435 440
tac gat agt aag agg aac aat ggc cat gtt tcc gca caa gac tcc att 3255
Tyr Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala Gln Asp Ser Ile
445 450 455
gac caa ctt cca cct gaa acc act gat gaa cca ttg gag aag gct tac 3303
Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr
460 465 470
agt cac caa ctt aac tac gcc gaa tgc ttt ctc atg caa gac agg cgt 3351
Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg Arg
475 480 485
ggc acc att ccg ttc ttt aca tgg act cac agg tct gtc gac ttc ttt 3399
Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe Phe
490 495 500 505
aac act atc gac gct gag aag att acc caa ctt ccc gtg gtc aag gct 3447
Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys Ala
510 515 520
tat gcc ttg tcc agc gga gct tcc atc att gaa ggt cca ggc ttc acc 3495
Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr
525 530 535
ggt ggc aac ttg ctc ttc ctt aag gag tcc agc aac tcc atc gcc aag 3543
Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys
540 545 550
ttc aaa gtg aca ctt aac tca gca gcc ttg ctc caa cgt tac agg gtt 3591
Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val
555 560 565
cgt atc aga tac gca agc act acc aat ctt cgc ctc ttt gtc cag aac 3639
Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln Asn
570 575 580 585
agc aac aat gat ttc ctt gtc atc tac atc aac aag act atg aac aaa 3687
Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn Lys
590 595 600
gac gat gac ctc acc tac caa aca ttc gat ctt gcc act acc aat agt 3735
Asp Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala Thr Thr Asn Ser
605 610 615
aac atg gga ttc tct ggt gac aag aac gag ctg atc ata ggt gct gag 3783
Asn Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile Ile Gly Ala Glu
620 625 630
agc ttt gtc tct aat gag aag att tac ata gac aag atc gag ttc att 3831
Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile
635 640 645
cca gtt caa ctc taatagatcc cccgggctgc aggaattccc gatcgttcaa 3883
Pro Val Gln Leu
650
acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg atgattatca 3943
tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc atgacgttat 4003
ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac gcgatagaaa 4063
acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct atgttactag 4123
atcggggata tccccggggc ggccgc 4149
<210>14
<211>653
<212>PRT
<213>人工序列
<400>14
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Va1 Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Aan Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>15
<211>3754
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(25)..(640)
<223>P-CaMV.35S
<220>
<221>内含子
<222>(669)..(1472)
<223>I-Zm.Hsp70
<220>
<221>CDS
<222>(1490)..(3448)
<223>Cry3B1变异体v11231
<220>
<221>终止子
<222>(3475)..(3730)
<223>根癌农杆菌nos 3’转录终止和聚腺苷酸化序列
<400>15
gcggccgcgt taacaagctt ctgcaggtcc gatgtgagac ttttcaacaa agggtaatat 60
ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg aagatagtgg 120
aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc atcgttgaag 180
atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 240
aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatggt ccgatgtgag 300
acttttcaac aaagggtaat atccggaaac ctcctcggat tccattgccc agctatctgt 360
cactttattg tgaagatagt ggaaaaggaa ggtggctcct acaaatgcca tcattgcgat 420
aaaggaaagg ccatcgttga agatgcctct gccgacagtg gtcccaaaga tggaccccca 480
cccacgagga gcatcgtgga aaaagaagac gttccaacca cgtcttcaaa gcaagtggat 540
tgatgtgata tctccactga cgtaagggat gacgcacaat cccactatcc ttcgcaagac 600
ccttcctcta tataaggaag ttcatttcat ttggagagga cacgctgaca agctgactct 660
agcagatcta ccgtcttcgg tacgcgctca ctccgccctc tgcctttgtt actgccacgt 720
ttctctgaat gctctcttgt gtggtgattg ctgagagtgg tttagctgga tctagaatta 780
cactctgaaa tcgtgttctg cctgtgctga ttacttgccg tcctttgtag cagcaaaata 840
tagggacatg gtagtacgaa acgaagatag aacctacaca gcaatacgag aaatgtgtaa 900
tttggtgctt agcggtattt atttaagcac atgttggtgt tatagggcac ttggattcag 960
aagtttgctg ttaatttagg cacaggcttc atactacatg ggtcaatagt atagggattc 1020
atattatagg cgatactata ataatttgtt cgtctgcaga gcttattatt tgccaaaatt 1080
agatattcct attctgtttt tgtttgtgtg ctgttaaatt gttaacgcct gaaggaataa 1140
atataaatga cgaaattttg atgtttatct ctgctccttt attgtgacca taagtcaaga 1200
tcagatgcac ttgttttaaa tattgttgtc tgaagaaata agtactgaca gtattttgat 1260
gcattgatct gcttgtttgt tgtaacaaaa tttaaaaata aagagtttcc tttttgttgc 1320
tctccttacc tcctgatggt atctagtatc taccaactga cactatattg cttctcttta 1380
catacgtatc ttgctcgatg ccttctccct agtgttgacc agtgttactc acatagtctt 1440
tgctcatttc attgtaatgc agataccaag cggcctctag aggatctcc atg gca aac 1498
Met Ala Asn
1
cct aac aat cgt tcc gaa cac gac acc atc aag gtt act cca aac tct 1546
Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro Asn Ser
5 10 15
gag ttg caa act aat cac aac cag tac cca ttg gct gac aat cct aac 1594
Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn
20 25 30 35
agt act ctt gag gaa ctt aac tac aag gag ttt ctc cgg atg acc gaa 1642
Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met Thr Glu
40 45 50
gat agc tcc act gag gtt ctc gat aac tct aca gtg aag gac gct gtt 1690
Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp Ala Val
55 60 65
gga act ggc att agc gtt gtg gga cag att ctt gga gtg gtt ggt gtt 1738
Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val Gly Val
70 75 80
cca ttc gct gga gct ttg acc agc ttc tac cag tcc ttt ctc aac acc 1786
Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu Asn Thr
85 90 95
atc tgg cct tca gat gct gat ccc tgg aag gct ttc atg gcc caa gtg 1834
Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala Gln Val
100 105 110 115
gaa gtc ttg atc gat aag aag atc gaa gag tat gcc aag tct aaa gcc 1882
Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala
120 125 130
ttg gct gag ttg caa ggt ttg cag aac aac ttc gag gat tac gtc aac 1930
Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn
135 140 145
gca ctc aac agc tgg aag aaa act ccc ttg agt ctc agg tct aag cgt 1978
Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys Arg
150 155 160
tcc cag gac cgt att cgt gaa ctt ttc agc caa gcc gaa tcc cac ttc 2026
Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe
165 170 175
aga aac tcc atg cct agc ttt gcc gtt tct aag ttc gag gtg ctc ttc 2074
Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu Phe
180 185 190 195
ttg cca aca tac gca caa gct gcc aac act cat ctc ttg ctt ctc aaa 2122
Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys
200 205 210
gac gct cag gtg ttt ggt gag gaa tgg ggt tac tcc agt gaa gat gtt 2170
Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp Val
215 220 225
gcc gag ttc tac cgt agg cag ctc aag ttg act caa cag tac aca gac 2218
Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp
230 235 240
cac tgc gtc aac tgg tac aac gtt ggg ctc aat ggt ctt aga gga tct 2266
His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly Ser
245 250 255
acc tac gac gca tgg gtg aag ttc aac agg ttt cgt aga gag atg acc 2314
Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met Thr
260 265 270 275
ttg act gtg ctc gat ctt atc gtt ctc ttt cca ttc tac gac att cgt 2362
Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile Arg
280 285 290
ctt tac tcc aaa ggc gtt aag aca gag ctg acc aga gac atc ttc acc 2410
Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr
295 300 305
gat ccc atc ttc cta ctt acg acc ctg cag aaa tac ggt cca act ttt 2458
Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro Thr Phe
310 315 320
ctc tcc att gag aac agc atc agg aag cct cac ctc ttc gac tat ctg 2506
Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr Leu
325 330 335
caa ggc att gag ttt cac acc agg ttg caa cct ggt tac ttc ggt aag 2554
Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly Lys
340 345 350 355
gat tcc ttc aac tac tgg agc gga aac tac gtt gaa acc aga cca tcc 2602
Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser
360 365 370
atc gga tct agc aag acc atc act tct cca ttc tac ggt gac aag agc 2650
Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser
375 380 385
act gag cca gtg cag aag ttg agc ttc gat ggg cag aag gtg tat aga 2698
Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg
390 395 400
acc atc gcc aat acc gat gtt gca gct tgg cct aat ggc aag gtc tac 2746
Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val Tyr
405 410 415
ctt gga gtt act aaa gtg gac ttc tcc caa tac gac gat cag aag aac 2794
Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn
420 425 430 435
gag aca tct act caa acc tac gat agt aag agg aac aat ggc cat gtt 2842
Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His Val
440 445 450
tcc gca caa gac tcc att gac caa ctt cca cct gaa acc act gat gaa 2890
Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu
455 460 465
cca ttg gag aag gct tac agt cac caa ctt aac tac gcc gaa tgc ttt 2938
Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys Phe
470 475 480
ctc atg caa gac agg cgt ggc acc att ccg ttc ttt aca tgg act cac 2986
Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr His
485 490 495
agg tct gtc gac ttc ttt aac act atc gac gct gag aag att acc caa 3034
Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln
500 505 510 515
ctt ccc gtg gtc aag gct tat gcc ttg tcc agc gga gct tcc atc att 3082
Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile
520 525 530
gaa ggt cca ggc ttc acc ggt ggc aac ttg ctc ttc ctt aag gag tcc 3130
Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser
535 540 545
agc aac tcc atc gcc aag ttc aaa gtg aca ctt aac tca gca gcc ttg 3178
Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala Leu
550 555 560
ctc caa cgt tac agg gtt cgt atc aga tac gca agc act acc aat ctt 3226
Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu
565 570 575
cgc ctc ttt gtc cag aac agc aac aat gat ttc ctt gtc atc tac atc 3274
Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile
580 585 590 595
aac aag act atg aac aaa gac gat gac ctc acc tac caa aca ttc gat 3322
Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe Asp
600 605 610
ctt gcc act acc aat agt aac atg gga ttc tct ggt gac aag aac gag 3370
Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn Glu
615 620 625
ctg atc ata ggt gct gag agc ttt gtc tct aat gag aag att tac ata 3418
Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile
630 635 640
gac aag atc gag ttc att cca gtt caa ctc taatagatcc cccgggctgc 3468
Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
aggaattccc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 3528
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 3588
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 3648
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 3708
ggtgtcatct atgttactag atcggggata tccccggggc ggccgc 3754
<210>16
<211>653
<212>PRT
<213>人工序列
<400>16
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Va1 Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>17
<211>3450
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(14)..(235)
<223>P-CaMV.AS4
<220>
<221>5’UTR
<222>(240)..(304)
<223>L-Ta.hcb1
<220>
<221>内含子
<222>(318)..(805)
<223>I-Os.Act1
<220>
<221>转运肽
<222>(825)..(971)
<223>氨基末端Ts-Zm.rbcs
<220>
<221>内含子
<222>(972)..(1134)
<223>I-Zm.rbcs
<220>
<221>转运肽
<222>(1135)..(1221)
<223>羧基末端Ts-Zm.rbcs
<220>
<221>CDS
<222>(1222)..(3180)
<223>Cry3Bb1变异体11231mv1
<220>
<221>终止子
<222>(3198)..(3431)
<223>T-Ta.hsp17
<400>17
gcggccgcgt taacaagctt ctgacgtaag ggatgacgca cctgacgtaa gggatgacgc 60
acctgacgta agggatgacg cacctgacgt aagggatgac gcactcgaga tccccatctc 120
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 180
aggaagttca tttcatttgg agaggacacg ctgacaagct agcttggctg caggtagatc 240
ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg gacaacacac 300
cataagatcc aagggaggcc tccgccgccg ccggtaacca ccccgcccct ctcctctttc 360
tttctccgtt tttttttccg tctcggtctc gatctttggc cttggtagtt tgggtgggcg 420
agaggcggct tcgtgcgcgc ccagatcggt gcgcgggagg ggcgggatct cgcggctggg 480
gctctcgccg gcgtggatcc ggcccggatc tcgcggggaa tggggctctc ggatgtagat 540
ctgcgatccg ccgttgttgg gggagatgat ggggggttta aaatttccgc cgtgctaaac 600
aagatcagga agaggggaaa agggcactat ggtttatatt tttatatatt tctgctgctt 660
cgtcaggctt agatgtgcta gatctttctt tcttcttttt gtgggtagaa tttgaatccc 720
tcagcattgt tcatcggtag tttttctttt catgatttgt gacaaatgca gcctcgtgcg 780
gagctttttt gtaggtagaa gtgatcaacc tctagaggat cagcatggcg cccaccgtga 840
tgatggcctc gtcggccacc gccgtcgctc cgttcctggg gctcaagtcc accgccagcc 900
tccccgtcgc ccgccgctcc tccagaagcc tcggcaacgt cagcaacggc ggaaggatcc 960
ggtgcatgca ggtaacaaat gcatcctagc tagtagttct ttgcattgca gcagctgcag 1020
ctagcgagtt agtaatagga agggaactga tgatccatgc atggactgat gtgtgttgcc 1080
catcccatcc catcccattt cccaaacgaa ccgaaaacac cgtactacgt gcaggtgtgg 1140
ccctacggca acaagaagtt cgagacgctg tcgtacctgc cgccgctgtc gaccggcggg 1200
cgcatccgct gcatgcaggc c atg gcc aac ccc aac aat cgc tcc gag cac 1251
Met Ala Asn Pro Asn Asn Arg Ser Glu His
1 5 10
gac acg atc aag gtc acc ccc aac tcc gag ctc cag acc aac cac aac 1299
Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Gln Thr Asn His Asn
15 20 25
cag tac ccg ctg gcc gac aac ccc aac tcc acc ctg gaa gag ctg aac 1347
Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn
30 35 40
tac aag gag ttc ctg cgc atg acc gag gac tcc tcc acg gag gtc ctg 1395
Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser Ser Thr Glu Val Leu
45 50 55
gac aac tcc acc gtc aag gac gcc gtc ggg acc ggc atc tcc gtc gtt 1443
Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser Val Val
60 65 70
ggg cag atc ctg ggc gtc gtt ggc gtc ccc ttc gca ggt gct ctc acc 1491
Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala Leu Thr
75 80 85 90
tcc ttc tac cag tcc ttc ctg aac acc atc tgg ccc tcc gac gcc gac 1539
Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp
95 100 105
ccc tgg aag gcc ttc atg gcc caa gtc gaa gtc ctg atc gac aag aag 1587
Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp Lys Lys
110 115 120
atc gag gag tac gcc aag tcc aag gcc ctg gcc gag ctg caa ggc ctg 1635
Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu
125 130 135
caa aac aac ttc gag gac tac gtc aac gcg ctg aac tcc tgg aag aag 1683
Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys
140 145 150
acg cct ctg tcc ctg cgc tcc aag cgc tcc cag ggc cgc atc cgc gag 1731
Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln Gly Arg Ile Arg Glu
155 160 165 170
ctg ttc tcc cag gcc gag tcc cac ttc cgc aac tcc atg ccg tcc ttc 1779
Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe
175 180 185
gcc gtc tcc aag ttc gag gtc ctg ttc ctg ccc acc tac gcc cag gct 1827
Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala
190 195 200
gcc aac acc cac ctc ctg ttg ctg aag gac gcc cag gtc ttc ggc gag 1875
Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe Gly Glu
205 210 215
gaa tgg ggc tac tcc tcg gag gac gtc gcc gag ttc tac cgt cgc cag 1923
Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln
220 225 230
ctg aag ctg acc caa cag tac acc gac cac tgc gtc aac tgg tac aac 1971
Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp Tyr Asn
235 240 245 250
gtc ggc ctg aac ggc ctg agg ggc tcc acc tac gac gca tgg gtc aag 2019
Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys
255 260 265
ttc aac cgc ttc cgc agg gag atg acc ctg acc gtc ctg gac ctg atc 2067
Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile
270 275 280
gtc ctg ttc ccc ttc tac gac atc cgc ctg tac tcc aag ggc gtc aag 2115
Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys
285 290 295
acc gag ctg acc cgc gac atc ttc acg gac ccc atc ttc ctg ctc acg 2163
Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr
300 305 310
acc ctc cag aag tac ggt ccc acc ttc ctg tcc atc gag aac tcc atc 2211
Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile
315 320 325 330
cgc aag ccc cac ctg ttc gac tac ctc cag ggc atc gag ttc cac acg 2259
Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly Ile Glu Phe His Thr
335 340 345
cgc ctg agg cca ggc tac ttc ggc aag gac tcc ttc aac tac tgg tcc 2307
Arg Leu Arg Pro Gly Tyr Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser
350 355 360
ggc aac tac gtc gag acc agg ccc tcc atc ggc tcc tcg aag acg atc 2355
Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile
365 370 375
acc tcc cct ttc tac ggc gac aag tcc acc gag ccc gtc cag aag ctg 2403
Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu Pro Val Gln Lys Leu
380 385 390
tcc ttc gac ggc cag aag gtc tac cgc acc atc gcc aac acc gac gtc 245l
Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp Val
395 400 405 410
gcg gct tgg ccg aac ggc aag gtc tac ctg ggc gtc acg aag gtc gac 2499
Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly Val Thr Lys Val Asp
415 420 425
ttc tcc cag tac gat gac cag aag aat gaa acc tcc acc cag acc tac 2547
Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr
430 435 440
gac tcc aag cgc aac aat ggc cac gtc tcc gcc cag gac tcc atc gac 2595
Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala Gln Asp Ser Ile Asp
445 450 455
cag ctg ccg cct gag acc act gac gag ccc ctg gag aag gcc tac tcc 2643
Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser
460 465 470
cac cag ctg aac tac gcg gag tgc ttc ctg atg caa gac cgc agg ggc 2691
His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg Arg Gly
475 480 485 490
acc atc ccc ttc ttc acc tgg acc cac cgc tcc gtc gac ttc ttc aac 2739
Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe Phe Asn
495 500 505
acc atc gac gcc gag aag atc acc cag ctg ccc gtg gtc aag gcc tac 2787
Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Va1 Lys Ala Tyr
510 515 520
gcc ctg tcc tcg ggt gcc tcc atc att gag ggt cca ggc ttc acc ggt 2835
Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly
525 530 535
ggc aac ctg ctg ttc ctg aag gag tcc tcg aac tcc atc gcc aag ttc 2883
Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe
540 545 550
aag gtc acc ctg aac tcc gct gcc ttg ctg caa cgc tac cgc gtc cgc 2931
Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg
555 560 565 570
atc cgc tac gcc tcc acc acg aac ctg cgc ctg ttc gtc cag aac tcc 2979
Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln Asn Ser
575 580 585
aac aat gac ttc ctg gtc atc tac atc aac aag acc atg aac aag gac 3027
Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp
590 595 600
gat gac ctg acc tac cag acc ttc gac ctc gcc acc acg aac tcc aac 3075
Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn
605 610 615
atg ggc ttc tcg ggc gac aag aat gaa ctg atc att ggt gct gag tcc 3123
Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser
620 625 630
ttc gtc tcc aat gaa aag atc tac atc gac aag atc gag ttc atc ccc 3171
Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro
635 640 645 650
gtc cag ctg tgataggaac tctgattgaattctgcatgc gtttggacgt 3220
Val Gln Leu
atgctcattc aggttggagc caatttggtt gatgtgtgtg cgagttcttg cgagtctgat 3280
gagacatctc tgtattgtgt ttctttcccc agtgttttct gtacttgtgt aatcggctaa 3340
tcgccaacag attcggcgat gaataaatga gaaataaatt gttctgattt tgagtgcaaa 3400
aaaaaaggaa ttagatctgt gtgtgttttt tggatccccg gggcggccgc 3450
<210>18
<211>653
<212>PRT
<213>人工序列
<400>18
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>19
<211>3039
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(14)..(235)
<223>P-CaMV.AS4
<220>
<221>5’UTR
<222>(240)..(304)
<223>L-Ta.hcb1
<220>
<221>内含子
<222>(318)..(805)
<223>I-Os.Act1
<220>
<221>CDS
<222>(811)..(2769)
<223>Cry3Bb1变异体11231mv1
<220>
<221>终止子
<222>(2787)..(3020)
<223>T-Ta.hsp17
<400>19
gcggccgcgt taacaagctt ctgacgtaag ggatgacgca cctgacgtaa gggatgacgc 60
acctgacgta agggatgacg cacctgacgt aagggatgac gcactcgaga tccccatctc 120
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 180
aggaagttca tttcatttgg agaggacacg ctgacaagct agcttggctg caggtagatc 240
ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg gacaacacac 300
cataagatcc aagggaggcc tccgccgccg ccggtaacca ccccgcccct ctcctctttc 360
tttctccgtt tttttttccg tctcggtctc gatctttggc cttggtagtt tgggtgggcg 420
agaggcggct tcgtgcgcgc ccagatcggt gcgcgggagg ggcgggatct cgcggctggg 480
gctctcgccg gcgtggatcc ggcccggatc tcgcggggaa tggggctctc ggatgtagat 540
ctgcgatccg ccgttgttgg gggagatgat ggggggttta aaatttccgc cgtgctaaac 600
aagatcagga agaggggaaa agggcactat ggtttatatt tttatatatt tctgctgctt 660
cgtcaggctt agatgtgcta gatctttctt tcttcttttt gtgggtagaa tttgaatccc 720
tcagcattgt tcatcggtag tttttctttt catgatttgt gacaaatgca gcctcgtgcg 780
gagctttttt gtaggtagaa gtgatcaacc atg gcc aac ccc aac aat cgc tcc 834
Met Ala Asn Pro Asn Asn Arg Ser
1 5
gag cac gac acg atc aag gtc acc ccc aac tcc gag ctc cag acc aac 882
Glu His Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Gln Thr Asn
10 15 20
cac aac cag tac ccg ctg gcc gac aac ccc aac tcc acc ctg gaa gag 930
His Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu
25 30 35 40
ctg aac tac aag gag ttc ctg cgc atg acc gag gac tcc tcc acg gag 978
Leu Asn Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser Ser Thr Glu
45 50 55
gtc ctg gac aac tcc acc gtc aag gac gcc gtc ggg acc ggc atc tcc 1026
Val Leu Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser
60 65 70
gtc gtt ggg cag atc ctg ggc gtc gtt ggc gtc ccc ttc gca ggt gct 1074
Val Val Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala
75 80 85
ctc acc tcc ttc tac cag tcc ttc ctg aac acc atc tgg ccc tcc gac 1122
Leu Thr Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp Pro Ser Asp
90 95 100
gcc gac ccc tgg aag gcc ttc atg gcc caa gtc gaa gtc ctg atc gac 1170
Ala Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp
105 110 115 120
aag aag atc gag gag tac gcc aag tcc aag gcc ctg gcc gag ctg caa 1218
Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln
125 130 135
ggc ctg caa aac aac ttc gag gac tac gtc aac gcg ctg aac tcc tgg 1266
Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asn Ser Trp
140 145 150
aag aag acg cct ctg tcc ctg cgc tcc aag cgc tcc cag ggc cgc atc 1314
Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln Gly Arg Ile
155 160 165
cgc gag ctg ttc tcc cag gcc gag tcc cac ttc cgc aac tcc atg ccg 1362
Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro
170 175 180
tcc ttc gcc gtc tcc aag ttc gag gtc ctg ttc ctg ccc acc tac gcc 1410
Ser Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala
185 190 195 200
cag gct gcc aac acc cac ctc ctg ttg ctg aag gac gcc cag gtc ttc 1458
Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe
205 210 215
ggc gag gaa tgg ggc tac tcc tcg gag gac gtc gcc gag ttc tac cgt 1506
Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu Phe Tyr Arg
220 225 230
cgc cag ctg aag ctg acc caa cag tac acc gac cac tgc gtc aac tgg 1554
Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp
235 240 245
tac aac gtc ggc ctg aac ggc ctg agg ggc tcc acc tac gac gca tgg 1602
Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr Asp Ala Trp
250 255 260
gtc aag ttc aac cgc ttc cgc agg gag atg acc ctg acc gtc ctg gac 1650
Val Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp
265 270 275 280
ctg atc gtc ctg ttc ccc ttc tac gac atc cgc ctg tac tcc aag ggc 1698
Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr Ser Lys Gly
285 290 295
gtc aag acc gag ctg acc cgc gac atc ttc acg gac ccc atc ttc ctg 1746
Val Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Leu
300 305 310
ctc acg acc ctc cag aag tac ggt ccc acc ttc ctg tcc atc gag aac 1794
Leu Thr Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser Ile Glu Asn
315 320 325
tcc atc cgc aag ccc cac ctg ttc gac tac ctc cag ggc atc gag ttc 1842
Ser Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly Ile Glu Phe
330 335 340
cac acg cgc ctg agg cca ggc tac ttc ggc aag gac tcc ttc aac tac 1890
His Thr Arg Leu Arg Pro Gly Tyr Phe Gly Lys Asp Ser Phe Asn Tyr
345 350 355 360
tgg tcc ggc aac tac gtc gag acc agg ccc tcc atc ggc tcc tcg aag 1938
Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Ser Lys
365 370 375
acg atc acc tcc cct ttc tac ggc gac aag tcc acc gag ccc gtc cag 1986
Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu Pro Val Gln
380 385 390
aag ctg tcc ttc gac ggc cag aag gtc tac cgc acc atc gcc aac acc 2034
Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr
395 400 405
gac gtc gcg gct tgg ccg aac ggc aag gtc tac ctg ggc gtc acg aag 2082
Asp Val Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly Val Thr Lys
410 415 420
gtc gac ttc tcc cag tac gat gac cag aag aat gaa acc tcc acc cag 2130
Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln
425 430 435 440
acc tac gac tcc aag cgc aac aat ggc cac gtc tcc gcc cag gac tcc 2178
Thr Tyr Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala Gln Asp Ser
445 450 455
atc gac cag ctg ccg cct gag acc act gac gag ccc ctg gag aag gcc 2226
Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala
460 465 470
tac tcc cac cag ctg aac tac gcg gag tgc ttc ctg atg caa gac cgc 2274
Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg
475 480 485
agg ggc acc atc ccc ttc ttc acc tgg acc cac cgc tcc gtc gac ttc 2322
Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe
490 495 500
ttc aac acc atc gac gcc gag aag atc acc cag ctg ccc gtg gtc aag 2370
Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys
505 510 515 520
gcc tac gcc ctg tcc tcg ggt gcc tcc atc att gag ggt cca ggc ttc 2418
Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe
525 530 535
acc ggt ggc aac ctg ctg ttc ctg aag gag tcc tcg aac tcc atc gcc 2466
Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala
540 545 550
aag ttc aag gtc acc ctg aac tcc gct gcc ttg ctg caa cgc tac cgc 2514
Lys Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg
555 560 565
gtc cgc atc cgc tac gcc tcc acc acg aac ctg cgc ctg ttc gtc cag 2562
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln
570 575 580
aac tcc aac aat gac ttc ctg gtc atc tac atc aac aag acc atg aac 2610
Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn
585 590 595 600
aag gac gat gac ctg acc tac cag acc ttc gac ctc gcc acc acg aac 2658
Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala Thr Thr Asn
605 610 615
tcc aac atg ggc ttc tcg ggc gac aag aat gaa ctg atc att ggt gct 2706
Ser Asn Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile Ile Gly Ala
620 625 630
gag tcc ttc gtc tcc aat gaa aag atc tac atc gac aag atc gag ttc 2754
Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe
635 640 645
atc ccc gtc cag ctg tgataggaac tctgattgaa ttctgcatgc gtttggacgt 2809
Ile Pro Va1 Gln Leu
650
atgctcattc aggttggagc caatttggtt gatgtgtgtg cgagttcttg cgagtctgat 2869
gagacatctc tgtattgtgt ttctttcccc agtgttttct gtacttgtgt aatcggctaa 2929
tcgccaacag attcggcgat gaataaatga gaaataaatt gttctgattt tgagtgcaaa 2989
aaaaaaggaa ttagatctgt gtgtgttttt tggacccccg gggcggccgc 3039
<210>20
<211>653
<212>PRT
<213>人工序列
<400>20
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>21
<211>3039
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(14)..(235)
<223>P-CaMV.AS4
<220>
<221>5’UTR
<222>(240)..(304)
<223>L-Ta.hcb1
<220>
<221>内含子
<222>(318)..(805)
<223>I-Os.Act1
<220>
<221>CDS
<222>(811)..(2769)
<223>Cry3Bb1变异体11231mv2
<220>
<221>终止子
<222>(2787)..(3020)
<223>T-Ta.hsp17
<400>21
gcggccgcgt taacaagctt ctgacgtaag ggatgacgca cctgacgtaa gggatgacgc 60
acctgacgta agggatgacg cacctgacgt aagggatgac gcactcgaga tccccatctc 120
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 180
aggaagttca tttcatttgg agaggacacg ctgacaagct agcttggctg caggtagatc 240
ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg gacaacacac 300
cataagatcc aagggaggcc tccgccgccg ccggtaacca ccccgcccct ctcctctttc 360
tttctccgtt tttttttccg tctcggtctc gatctttggc cttggtagtt tgggtgggcg 420
agaggcggct tcgtgcgcgc ccagatcggt gcgcgggagg ggcgggatct cgcggctggg 480
gctctcgccg gcgtggatcc ggcccggatc tcgcggggaa tggggctctc ggatgtagat 540
ctgcgatccg ccgttgttgg gggagatgat ggggggttta aaatttccgc cgtgctaaac 600
aagatcagga agaggggaaa agggcactat ggtttatatt tttatatatt tctgctgctt 660
cgtcaggctt agatgtgcta gatctttctt tcttcttttt gtgggtagaa tttgaatccc 720
tcagcattgt tcatcggtag tttttctttt catgatttgt gacaaatgca gcctcgtgcg 780
gagctttttt gtaggtagaa gtgatcaacc atg gcc aac ccc aac aat cgc tcc 834
Met Ala Asn Pro Asn Asn Arg Ser
1 5
gag cac gac acg atc aag gtc acc ccc aac tcc gag ctc cag acc aac 882
Glu His Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Gln Thr Asn
10 15 20
cac aac cag tac ccg ctg gcc gac aac ccc aac tcc acc ctg gaa gag 930
His Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu
25 30 35 40
ctg aac tac aag gag ttc ctg cgc atg acc gag gac tcc tcc acg gag 978
Leu Asn Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser Ser Thr Glu
45 50 55
gtc ctg gac aac tcc acc gtc aag gac gcc gtc ggg acc ggc atc tcc 1026
Val Leu Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser
60 65 70
gtc gtt ggg cag atc ctg ggc gtc gtt ggc gtc ccc ttc gca ggt gct 1074
Val Val Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala
75 80 85
ctc acc tcc ttc tac cag tcc ttc ctg aac acc atc tgg ccc ccc gac 1122
Leu Thr Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp Pro Ser Asp
90 95 100
gcc gac ccc tgg aag gcc ttc atg gcc caa gtc gaa gtc ctg atc gac 1170
Ala Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp
105 110 115 120
aag aag atc gag gag tac gcc aag tcc aag gcc ctg gcc gag ctg caa 1218
Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln
125 130 135
ggc ctg caa aac aac ttc gag gac tac gtc aac gcg ctg aac tcc tgg 1266
Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asn Ser Trp
140 145 150
aag aag acg cct ctg tcc ctg cgc tcc aag cgc tcc cag gac cgc atc 1314
Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln Asp Arg Ile
155 160 165
cgc gag ctg ttc tcc cag gcc gag tcc cac ttc cgc aac tcc atg ccg 1362
Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro
170 175 180
tcc ttc gcc gtc tcc aag ttc gag gtc ctg ttc ctg ccc acc tac gcc 1410
Ser Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala
185 190 195 200
cag gct gcc aac acc cac ctc ctg ttg ctg aag gac gcc cag gtc ttc 1458
Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe
205 210 215
ggc gag gaa tgg ggc tac tcc tcg gag gac gtc gcc gag ttc tac cgt 1506
Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu Phe Tyr Arg
220 225 230
cgc cag ctg aag ctg acc caa cag tac acc gac cac tgc gtc aac tgg 1554
Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp
235 240 245
tac aac gtc ggc ctg aac ggc ctg agg ggc tcc acc tac gac gca tgg 1602
Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr Asp Ala Trp
250 255 260
gtc aag ttc aac cgc ttc cgc agg gag atg acc ctg acc gtc ctg gac 1650
Val Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp
265 270 275 280
ctg atc gtc ctg ttc ccc ttc tac gac atc cgc ctg tac tcc aag ggc 1698
Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr Ser Lys Gly
285 290 295
gtc aag acc gag ctg acc cgc gac atc ttc acg gac ccc atc ttc ctg 1746
Val Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Leu
300 305 310
ctc acg acc ctc cag aag tac ggt ccc acc ttc ctg tcc atc gag aac 1794
Leu Thr Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser Ile Glu Asn
315 320 325
tcc atc cgc aag ccc cac ctg ttc gac tac ctc cag ggc atc gag ttc 1842
Ser Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly Ile Glu Phe
330 335 340
cac acg cgc ctg agg cca ggc tac ttc ggc aag gac tcc ttc aac tac 1890
His Thr Arg Leu Arg Pro Gly Tyr Phe Gly Lys Asp Ser Phe Asn Tyr
345 350 355 360
tgg tcc ggc aac tac gtc gag acc agg ccc tcc atc ggc tcc tcg aag 1938
Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Ser Lys
365 370 375
acg atc acc tcc cct ttc tac ggc gac aag tcc acc gag ccc gtc cag 1986
Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu Pro Val Gln
380 385 390
aag ctg tcc ttc gac ggc cag aag gtc tac cgc acc atc gcc aac acc 2034
Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr
395 400 405
gac gtc gcg gct tgg ccg aac ggc aag gtc tac ctg ggc gtc acg aag 2082
Asp Val Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly Val Thr Lys
410 415 420
gtc gac ttc tcc cag tac gat gac cag aag aat gaa acc tcc acc cag 2130
Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln
425 430 435 440
acc tac gac tcc aag cgc aac aat ggc cac gtc tcc gcc cag gac tcc 2178
Thr Tyr Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala Gln Asp Ser
445 450 455
atc gac cag ctg ccg cct gag acc act gac gag ccc ctg gag aag gcc 2226
Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala
460 465 470
tac tcc cac cag ctg aac tac gcg gag tgc ttc ctg atg caa gac cgc 2274
Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg
475 480 485
agg ggc acc atc ccc ttc ttc acc tgg acc cac cgc tcc gtc gac ttc 2322
Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe
490 495 500
ttc aac acc atc gac gcc gag aag atc acc cag ctg ccc gtg gtc aag 2370
Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys
505 510 515 520
gcc tac gcc ctg tcc tcg ggt gcc tcc atc att gag ggt cca ggc ttc 2418
Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe
525 530 535
acc ggt ggc aac ctg ctg ttc ctg aag gag tcc tcg aac tcc atc gcc 2466
Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala
540 545 550
aag ttc aag gtc acc ctg aac tcc gct gcc ttg ctg caa cgc tac cgc 2514
Lys Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg
555 560 565
gtc cgc atc cgc tac gcc tcc acc acg aac ctg cgc ctg ttc gtc cag 2562
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln
570 575 580
aac tcc aac aat gac ttc ctg gtc atc tac atc aac aag acc atg aac 2610
Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn
585 590 595 600
aag gac gat gac ctg acc tac cag acc ttc gac ctc gcc acc acg aac 2658
Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala Thr Thr Asn
605 610 615
tcc aac atg ggc ttc tcg ggc gac aag aat gaa ctg atc att ggt gct 2706
Ser Asn Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile Ile Gly Ala
620 625 630
gag tcc ttc gtc tcc aat gaa aag atc tac atc gac aag atc gag ttc 2754
Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe
635 640 645
atc ccc gtc cag ctgtgataggaac tctgattgaa ttctgcatgc gtttggacgt 2809
Ile Pro Val Gln Leu
650
atgctcattc aggttggagc caatttggtt gatgtgtgtg cgagttcttg cgagtctgat 2869
gagacatctc tgtattgtgt ttctttcccc agtgttttct gtacttgtgt aatcggctaa 2929
tcgccaacag attcggcgat gaataaatga gaaataaatt gttctgattt tgagtgcaaa 2989
aaaaaaggaa ttagatctgt gtgtgttttt tggatccccg gggcggccgc 3039
<210>22
<211>653
<212>PRT
<213>人工序列
<400>22
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>23
<211>3469
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(25)..(640)
<223>P-CaMV.35S
<220>
<221>5’UTR
<222>(664)..(734)
<223>L-Ta.hcb1
<220>
<221>内含子
<222>(748)..(1238)
<223>I-Os.Act1
<220>
<221>CDS
<222>(1241)..(3199)
<223>Cry3Bb1变异体11231mv2
<220>
<221>终止子
<222>(3217)..(3450)
<223>T-Ta.hsp17
<400>23
gcggccgcgt taacaagctt ctgcaggtcc gatgtgagac ttttcaacaa agggtaatat 60
ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg aagatagtgg 120
aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc atcgttgaag 180
atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 240
aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatggt ccgatgtgag 300
acttttcaac aaagggtaat atccggaaac ctcctcggat tccattgccc agctatctgt 360
cactttattg tgaagatagt ggaaaaggaa ggtggctcct acaaatgcca tcattgcgat 420
aaaggaaagg ccatcgttga agatgcctct gccgacagtg gtcccaaaga tggaccccca 480
cccacgagga gcatcgtgga aaaagaagac gttccaacca cgtcttcaaa gcaagtggat 540
tgatgtgata tctccactga cgtaagggat gacgcacaat cccactatcc ttcgcaagac 600
ccttcctcta tataaggaag ttcatttcat ttggagagga cacgctgaca agctgactct 660
agcagatcct ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg 720
gacaacacac cataagatcc aagggaggcc tccgccgccg ccggtaacca ccccgcccct 780
ctcctctttc tttctccgtt tttttttccg tctcggtctc gatctttggc cttggtagtt 840
tgggtgggcg agaggcggct tcgtgcgcgc ccagatcggt gcgcgggagg ggcgggatct 900
cgcggctggg gctctcgccg gcgtggatcc ggcccggatc tcgcggggaa tggggctctc 960
ggatgtagat ctgcgatccg ccgttgttgg gggagatgat ggggggttta aaatttccgc 1020
cgtgctaaac aagatcagga agaggggaaa agggcactat ggtttatatt tttatatatt 1080
tctgctgctt cgtcaggctt agatgtgcta gatctttctt tcttcttttt gtgggtagaa 1140
tttgaatccc tcagcattgt tcatcggtag tttttctttt catgatttgt gacaaatgca 1200
gcctcgtgcg gagctttttt gtaggtagaa gtgatcaacc atg gcc aac ccc aac 1255
Met Ala Asn Pro Asn
1 5
aat cgc tcc gag cac gac acg atc aag gtc acc ccc aac tcc gag ctc 1303
Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu
10 15 20
cag acc aac cac aac cag tac ccg ctg gcc gac aac ccc aac tcc acc 1351
Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr
25 30 35
ctg gaa gag ctg aac tac aag gag ttc ctg cgc atg acc gag gac tcc 1399
Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser
40 45 50
tcc acg gag gtc ctg gac aac tcc acc gtc aag gac gcc gtc ggg acc 1447
Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr
55 60 65
ggc atc tcc gtc gtt ggg cag atc ctg ggc gtc gtt ggc gtc ccc ttc 1495
Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Va1 Gly Val Pro Phe
70 75 80 85
gca ggt gct ctc acc tcc ttc tac cag tcc ttc ctg aac acc atc tgg 1543
Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp
90 95 100
ccc tcc gac gcc gac ccc tgg aag gcc ttc atg gcc caa gtc gaa gtc 1591
Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val
105 110 115
ctg atc gac aag aag atc gag gag tac gcc aag tcc aag gcc ctg gcc 1639
Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala
120 125 130
gag ctg caa ggc ctg caa aac aac ttc gag gac tac gtc aac gcg ctg 1687
Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu
135 140 145
aac tcc tgg aag aag acg cct ctg tcc ctg cgc tcc aag cgc tcc cag 1735
Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln
150 155 160 165
gac cgc atc cgc gag ctg ttc tcc cag gcc gag tcc cac ttc cgc aac 1783
Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn
170 175 180
tcc atg ccg tcc ttc gcc gtc tcc aag ttc gag gtc ctg ttc ctg ccc 1831
Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro
185 190 195
acc tac gcc cag gct gcc aac acc cac ctc ctg ttg ctg aag gac gcc 1879
Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala
200 205 210
cag gtc ttc ggc gag gaa tgg ggc tac tcc tcg gag gac gtc gcc gag 1927
Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu
215 220 225
ttc tac cgt cgc cag ctg aag ctg acc caa cag tac acc gac cac tgc 1975
Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys
230 235 240 245
gtc aac tgg tac aac gtc ggc ctg aac ggc ctg agg ggc tcc acc tac 2023
Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr
250 255 260
gac gca tgg gtc aag ttc aac cgc ttc cgc agg gag atg acc ctg acc 2071
Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr
265 270 275
gtc ctg gac ctg atc gtc ctg ttc ccc ttc tac gac atc cgc ctg tac 2119
Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr
280 285 290
tcc aag ggc gtc aag acc gag ctg acc cgc gac atc ttc acg gac ccc 2167
Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro
295 300 305
atc ttc ctg ctc acg acc ctc cag aag tac ggt ccc acc ttc ctg tcc 2215
Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser
310 315 320 325
atc gag aac tcc atc cgc aag ccc cac ctg ttc gac tac ctc cag ggc 2263
Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly
330 335 340
atc gag ttc cac acg cgc ctg agg cca ggc tac ttc ggc aag gac tcc 2311
Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe Gly Lys Asp Ser
345 350 355
ttc aac tac tgg tcc ggc aac tac gtc gag acc agg ccc tcc atc ggc 2359
Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly
360 365 370
tcc tcg aag acg atc acc tcc cct ttc tac ggc gac aag tcc acc gag 2407
Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu
375380385
ccc gtc cag aag ctg tcc ttc gac ggc cag aag gtc tac cgc acc atc 2455
Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile
390 395 400 405
gcc aac acc gac gtc gcg gct tgg ccg aac ggc aag gtc tac ctg ggc 2503
Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly
410 4l5 420
gtc acg aag gtc gac ttc tcc cag tac gat gac cag aag aat gaa acc 2551
Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr
425 430 435
tcc acc cag acc tac gac tcc aag cgc aac aat ggc cac gtc tcc gcc 2599
Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala
440 445 450
cag gac tcc atc gac cag ctg ccg cct gag acc act gac gag ccc ctg 2647
Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu
455 460 465
gag aag gcc tac tcc cac cag ctg aac tac gcg gag tgc ttc ctg atg 2695
Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met
470 475 480 485
caa gac cgc agg ggc acc atc ccc ttc ttc acc tgg acc cac cgc tcc 2743
Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser
490 495 500
gtc gac ttc ttc aac acc atc gac gcc gag aag atc acc cag ctg ccc 2791
Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro
505 510 515
gtg gtc aag gcc tac gcc ctg tcc tcg ggt gcc tcc atc att gag ggt 2839
Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly
520 525 530
cca ggc ttc acc ggt ggc aac ctg ctg ttc ctg aag gag tcc tcg aac 2887
Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn
535 540 545
tcc atc gcc aag ttc aag gtc acc ctg aac tcc gct gcc ttg ctg caa 2935
Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln
550 555 560 565
cgc tac cgc gtc cgc atc cgc tac gcc tcc acc acg aac ctg cgc ctg 2983
Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu
570 575 580
ttc gtc cag aac tcc aac aat gac ttc ctg gtc atc tac atc aac aag 3031
Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys
585 590 595
acc atg aac aag gac gat gac ctg acc tac cag acc ttc gac ctc gcc 3079
Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala
600 605 610
acc acg aac tcc aac atg ggc ttc tcg ggc gac aag aat gaa ctg atc 3127
Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile
615 620 625
att ggt gct gag tcc ttc gtc tcc aat gaa aag atc tac atc gac aag 3175
Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys
630 635 640 645
atc gag ttc atc ccc gtc cag ctg tgataggaac tctgattgaa ttctgcatgc 3229
Ile Glu Phe Ile Pro Val Gln Leu
650
gtttggacgt atgctcattc aggttggagc caatttggtt gatgtgtgtg cgagttcttg 3289
cgagtctgat gagacatctc tgtattgtgt ttctttcccc agtgttttct gtacttgtgt 3349
aatcggctaa tcgccaacag attcggcgat gaataaatga gaaataaatt gttctgattt 3409
tgagtgcaaa aaaaaaggaa ttagatctgt gtgtgttttt tggatccccg gggcggccgc 3469
<210>24
<211>653
<212>PRT
<213>人工序列
<400>24
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Va1 Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>25
<211>416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:非天然存在的编码玉蜀黍核酮糖二磷酸羧化酶叶绿体导向肽的核苷酸序列
<220>
<221>CDS
<222>(16)..(162)
<220>
<221>CDS
<222>(326)..(415)
<220>
<221>内含子
<222>(163)..(325)
<223>I-Zm.rbcs
<400>25
ttctagagga tcagc atg gcg ccc acc gtg atg atg gcc tcg tcg gcc acc 51
Met Ala Pro Thr Val Met Met Ala Ser Ser Ala Thr
1 5 10
gcc gtc gct ccg ttc ctg ggg ctc aag tcc acc gcc agc ctc ccc gtc 99
Ala Val Ala Pro Phe Leu Gly Leu Lys Ser Thr Ala Ser Leu Pro Val
15 20 25
gcc cgc cgc tcc tcc aga agc ctc ggc aac gtc agc aac ggc gga agg 147
Ala Arg Arg Ser Ser Arg Ser Leu Gly Asn Val Ser Asn Gly Gly Arg
30 35 40
atc cgg tgc atg cag gtaacaaatg catcctagct agtagttctt tgcattgcag 202
Ile Arg Cys Met Gln
45
cagctgcagc tagcgagtta gtaataggaa gggaactgat gatccatgca tggactgatg 262
tgtgttgccc atcccatccc atcccatttc ccaaacgaac cgaaaacacc gtactacgtg 322
cag gtg tgg ccc tac ggc aac aag aag ttc gag acg ctg tcg tac ctg 370
Val Trp Pro Tyr Gly Asn Lys Lys Phe Glu Thr Leu Ser Tyr Leu
50 55 60
ccg ccg ctg tcg acc ggc ggg cgc atc cgc tgc atg cag gcc atg g 416
Pro Pro Leu Ser Thr Gly Gly Arg Ile Arg Cys Met Gln Ala Met
65 70 75
<210>26
<211>79
<212>PRT
<213>人工序列
<400>26
Met Ala Pro Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro
1 5 10 15
Phe Leu Gly Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser
20 25 30
Ser Arg Ser Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Met
35 40 45
Gln Val Trp Pro Tyr Gly Asn Lys Lys Phe Glu Thr Leu Ser Tyr Leu
50 55 60
Pro Pro Leu Ser Thr Gly Gly Arg Ile Arg Cys Met Gln Ala Met
65 70 75
<210>27
<211>49
<212>PRT
<213>人工序列
<400>27
Met Ala Pro Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro
1 5 10 15
Phe Leu Gly Leu Lys Ser Thr Ala Ser Leu Pro Val Ala Arg Arg Ser
20 25 30
Ser Arg Ser Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Met
35 40 45
Gln
<210>28
<211>30
<212>PRT
<213>人工序列
<400>28
Val Trp Pro Tyr Gly Asn Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro
1 5 10 15
Pro Leu Ser Thr Gly Gly Arg Ile Arg Cys Met Gln Ala Met
20 25 30
<210>29
<211>202
<212>DNA
<213>花椰菜花叶病毒
<400>29
gacgcacctg acgtaaggga tgacgcacct gacgtaaggg atgacgcacc tgacgtaagg 60
gatgacgcac tcgagatccc catctccact gacgtaaggg atgacgcaca atcccactat 120
ccttcgcaag acccttcctc tatataagga agttcatttc atttggagag gacacgctga 180
caagctagct tggctgcagg ta 202
<210>30
<211>416
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:修饰的花椰菜花叶病毒启动子AS4
<400>30
ttctagagga tcagcatggc gcccaccgtg atgatggcct cgtcggccac cgccgtcgct 60
ccgttcctgg ggctcaagtc caccgccagc ctccccgtcg cccgccgctc ctccagaagc 120
ctcggcaacg tcagcaacgg cggaaggatc cggtgcatgc aggtaacaaa tgcatcctag 180
ctagtagttc tttgcattgc agcagctgca gctagcgagt tagtaatagg aagggaactg 240
atgatccatg catggactga tgtgtgttgc ccatcccatc ccatcccatt tcccaaacga 300
accgaaaaca ccgtactacg tgcaggtgtg gccctacggc aacaagaagt tcgagacgct 360
gtcgtacctg ccgccgctgt cgaccggcgg gcgcatccgc tgcatgcagg ccatgg 416
<210>31
<211>75
<212>DNA
<213>普通小麦
<400>31
ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg gacaacacac 60
cataagatcc aaggg 75
<210>32
<211>804
<212>DNA
<213>稻
<400>32
accgtcttcg gtacgcgctc actccgccct ctgcctttgt tactgccacg tttctctgaa 60
tgctctcttg tgtggtgatt gctgagagtg gtttagctgg atctagaatt acactctgaa 120
atcgtgttct gcctgtgctg attacttgcc gtcctttgta gcagcaaaat atagggacat 180
ggtagtacga aacgaagata gaacctacac agcaatacga gaaatgtgta atttggtgct 240
tagcggtatt tatttaagca catgttggtg ttatagggca cttggattca gaagtttgct 300
gttaatttag gcacaggctt catactacat gggtcaatag tatagggatt catattatag 360
gcgatactat aataatttgt tcgtctgcag agcttattat ttgccaaaat tagatattcc 420
tattctgttt ttgtttgtgt gctgttaaat tgttaacgcc tgaaggaata aatataaatg 480
acgaaatttt gatgtttatc tctgctcctt tattgtgacc ataagtcaag atcagatgca 540
cttgttttaa atattgttgt ctgaagaaat aagtactgac agtattttga tgcattgatc 600
tgcttgtttg ttgtaacaaa atttaaaaat aaagagtttc ctttttgttg ctctccttac 660
ctcctgatgg tatctagtat ctaccaactg acactatatt gcttctcttt acatacgtat 720
cttgctcgat gccttctccc tagtgttgac cagtgttact cacatagtct ttgctcattt 780
cattgtaatg cagataccaa gcgg 804
<210>33
<211>804
<212>DNA
<213>玉蜀黍
<400>33
accgtcttcg gtacgcgctc actccgccct ctgcctttgt tactgccacg tttctctgaa 60
tgctctcttg tgtggtgatt gctgagagtg gtttagctgg atctagaatt acactctgaa 120
atcgtgttct gcctgtgctg attacttgcc gtcctttgta gcagcaaaat atagggacat 180
ggtagtacga aacgaagata gaacctacac agcaatacga gaaatgtgta atttggtgct 240
tagcggtatt tatttaagca catgttggtg ttatagggca cttggattca gaagtttgct 300
gttaatttag gcacaggctt catactacat gggtcaatag tatagggatt catattatag 360
gcgatactat aataatttgt tcgtctgcag agcttattat ttgccaaaat tagatattcc 420
tattctgttt ttgtttgtgt gctgttaaat tgttaacgcc tgaaggaata aatataaatg 480
acgaaatttt gatgtttatc tctgctcctt tattgtgacc ataagtcaag atcagatgca 540
cttgttttaa atattgttgt ctgaagaaat aagtactgac agtattttga tgcattgatc 600
tgcttgtttg ttgtaacaaa atttaaaaat aaagagtttc ctttttgttg ctctccttac 660
ctcctgatgg tatctagtat ctaccaactg acactatatt gcttctcttt acatacgtat 720
cttgctcgat gccttctccc tagtgttgac cagtgttact cacatagtct ttgctcattt 780
cattgtaatg cagataccaa gcgg 804
<210>34
<211>257
<212>DNA
<213>根癌农杆菌
<400>34
tcccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct 60
tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta 120
atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta 180
atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc 240
atctatgtta ctagatc 257
<210>35
<211>234
<212>DNA
<213>普通小麦
<400>35
aattctgcat gcgtttggac gtatgctcat tcaggttgga gccaatttgg ttgatgtgtg 60
tgcgagttct tgcgagtctg atgagacatc tctgtattgt gtttctttcc ccagtgtttt 120
ctgtacttgt gtaatcggct aatcgccaac agattcggcg atgaataaat gagaaataaa 180
ttgttctgat tttgagtgca aaaaaaaagg aattagatct gtgtgtgttt tttg 234
<210>36
<211>3455
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(14)..(235)
<223>P-CaMV.AS4
<220>
<221>5’UTR
<222>(240)..(304)
<223>L-Ta.hcb1
<220>
<221>内含子
<222>(318)..(805)
<223>I-Os.Act1
<220>
<221>转运肽
<222>(825)..(971)
<223>Ts-Zm.rbcS玉蜀黍rbcS内含子上游的氨基末端编码序列
<220>
<221>内含子
<222>(972)..(1134)
<223>I-Zm.rbcs
<220>
<221>转运肽
<222>(1135)..(1221)
<223>Ts-Zm.rbcS玉蜀黍rbcS内含子下游的羧基末端编码序列
<220>
<221>CDS
<222>(1222)..(3180)
<223>编码v11231的变异的Cry3BB1编码序列
<220>
<221>终止子
<222>(3198)..(3431)
<223>T-Ta.hsp17
<400>36
gcggccgcgt taacaagctt ctgacgtaag ggatgacgca cctgacgtaa gggatgacgc 60
acctgacgta agggatgacg cacctgacgt aagggatgac gcactcgaga tccccatctc 120
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 180
aggaagttca tttcatttgg agaggacacg ctgacaagct agcttggctg caggtagatc 240
ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg gacaacacac 300
cataagatcc aagggaggcc tccgccgccg ccggtaacca ccccgcccct ctcctctttc 360
tttctccgtt tttttttccg tctcggtctc gatctttggc cttggtagtt tgggtgggcg 420
agaggcggct tcgtgcgcgc ccagatcggt gcgcgggagg ggcgggatct cgcggctggg 480
gctctcgccg gcgtggatcc ggcccggatc tcgcggggaa tggggctctc ggatgtagat 540
ctgcgatccg ccgttgttgg gggagatgat ggggggttta aaatttccgc cgtgctaaac 600
aagatcagga agaggggaaa agggcactat ggtttatatt tttatatatt tctgctgctt 660
cgtcaggctt agatgtgcta gatctttctt tcttcttttt gtgggtagaa tttgaatccc 720
tcagcattgt tcatcggtag tttttctttt catgatttgt gacaaatgca gcctcgtgcg 780
gagctttttt gtaggtagaa gtgatcaacc tctagaggat cagcatggcg cccaccgtga 840
tgatggcctc gtcggccacc gccgtcgctc cgttcctggg gctcaagtcc accgccagcc 900
tccccgtcgc ccgccgctcc tccagaagcc tcggcaacgt cagcaacggc ggaaggatcc 960
ggtgcatgca ggtaacaaat gcatcctagc tagtagttct ttgcattgca gcagctgcag 1020
ctagcgagtt agtaatagga agggaactga tgatccatgc atggactgat gtgtgttgcc 1080
catcccatcc catcccattt cccaaacgaa ccgaaaacac cgtactacgt gcaggtgtgg 1140
ccctacggca acaagaagtt cgagacgctg tcgtacctgc cgccgctgtc gaccggcggg 1200
cgcatccgct gcatgcaggc c atg gca aac cct aac aat cgt tcc gaa cac 1251
Met Ala Asn Pro Asn Asn Arg Ser Glu His
1 5 10
gac acc atc aag gtt act cca aac tct gag ttg caa act aat cac aac 1299
Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Gln Thr Asn His Asn
15 20 25
cag tac cca ttg gct gac aat cct aac agt act ctt gag gaa ctt aac 1347
Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn
30 35 40
tac aag gag ttt ctc cgg atg acc gaa gat agc tcc act gag gtt ctc 1395
Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser Ser Thr Glu Val Leu
45 50 55
gat aac tct aca gtg aag gac gct gtt gga act ggc att agc gtt gtg 1443
Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser Val Val
60 65 70
gga cag att ctt gga gtg gtt ggt gtt cca ttc gct gga gct ttg acc 1491
Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala Leu Thr
75 80 85 90
agc ttc tac cag tcc ttt ctc aac acc atc tgg cct tca gat gct gat 1539
Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp
95 100 105
ccc tgg aag gct ttc atg gcc caa gtg gaa gtc ttg atc gat aag aag 1587
Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp Lys Lys
110 115 120
atc gaa gag tat gcc aag tct aaa gcc ttg gct gag ttg caa ggt ttg 1635
Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu
125 130 135
cag aac aac ttc gag gat tac gtc aac gca ctc aac agc tgg aag aaa 1683
Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys
140 145 150
act ccc ttg agt ctc agg tct aag cgt tcc cag gac cgt att cgt gaa 1731
Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu
155 160 165 170
ctt ttc agc caa gcc gaa tcc cac ttc aga aac tcc atg cct agc ttt 1779
Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe
175 180 185
gcc gtt tct aag ttc gag gtg ctc ttc ttg cca aca tac gca caa gct 1827
Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala
190 195 200
gcc aac act cat ctc ttg ctt ctc aaa gac gct cag gtg ttt ggt gag 1875
Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe Gly Glu
205 210 215
gaa tgg ggt tac tcc agt gaa gat gtt gcc gag ttc tac cgt agg cag 1923
Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln
220 225 230
ctc aag ttg act caa cag tac aca gac cac tgc gtc aac tgg tac aac 1971
Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp Tyr Asn
235 240 245 250
gtt ggg ctc aat ggt ctt aga gga tct acc tac gac gca tgg gtg aag 2019
Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys
255 260 265
ttc aac agg ttt cgt aga gag atg acc ttg act gtg ctc gat ctt atc 2067
Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile
270 275 280
gtt ctc ttt cca ttc tac gac att cgt ctt tac tcc aaa ggc gtt aag 2115
Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys
285 290 295
aca gag ctg acc aga gac atc ttc acc gat ccc atc ttc cta ctt acg 2163
Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr
300 305 310
acc ctg cag aaa tac ggt cca act ttt ctc tcc att gag aac agc atc 2211
Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile
315 320 325 330
agg aag cct cac ctc ttc gac tat ctg caa ggc att gag ttt cac acc 2259
Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly Ile Glu Phe His Thr
335 340 345
agg ttg caa cct ggt tac ttc ggt aag gat tcc ttc aac tac tgg agc 2307
Arg Leu Gln Pro Gly Tyr Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser
350 355 360
gga aac tac gtt gaa acc aga cca tcc atc gga tct agc aag acc atc 2355
Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile
365 370 375
act tct cca ttc tac ggt gac aag agc act gag cca gtg cag aag ttg 2403
Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu Pro Val Gln Lys Leu
380 385 390
agc ttc gat ggg cag aag gtg tat aga acc atc gcc aat acc gat gtt 2451
Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp Val
395 400 405 410
gca gct tgg cct aat ggc aag gtc tac ctt gga gtt act aaa gtg gac 2499
Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly Val Thr Lys Val Asp
415 420 425
ttc tcc caa tac gac gat cag aag aac gag aca tct act caa acc tac 2547
Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr
430 435 440
gat agt aag agg aac aat ggc cat gtt tcc gca caa gac tcc att gac 2595
Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala Gln Asp Ser Ile Asp
445 450 455
caa ctt cca cct gaa acc act gat gaa cca ttg gag aag gct tac agt 2643
Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser
460 465 470
cac caa ctt aac tac gcc gaa tgc ttt ctc atg caa gac agg cgt ggc 2691
His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg Arg Gly
475 480 485 490
acc att ccg ttc ttt aca tgg act cac agg tct gtc gac ttc ttt aac 2739
Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe Phe Asn
495 500 505
act atc gac gct gag aag att acc caa ctt ccc gtg gtc aag gct tat 2787
Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys Ala Tyr
510 515 520
gcc ttg tcc agc gga gct tcc atc att gaa ggt cca ggc ttc acc ggt 2835
Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly
525 530 535
ggc aac ttg ctc ttc ctt aag gag tcc agc aac tcc atc gcc aag ttc 2883
Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe
540 545 550
aaa gtg aca ctt aac tca gca gcc ttg ctc caa cgt tac agg gtt cgt 2931
Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg
555 560 565 570
atc aga tac gca agc act acc aat ctt cgc ctc ttt gtc cag aac agc 2979
Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln Asn Ser
575 580 585
aac aat gat ttc ctt gtc atc tac atc aac aag act atg aac aaa gac 3027
Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp
590 595 600
gat gac ctc acc tac caa aca ttc gat ctt gcc act acc aat agt aac 3075
Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn
605 610 615
atg gga ttc tct ggt gac aag aac gag ctg atc ata ggt gct gag agc 3123
Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser
620 625 630
ttt gtc tct aat gag aag att tac ata gac aag atc gag ttc att cca 3171
Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro
635 640 645 650
gtt caa ctc taatagatcc cccgggctgc aggaattctg catgcgtttg 3220
Val Gln Leu
gacgtatgct cattcaggtt ggagccaatt tggttgatgt gtgtgcgagt tcttgcgagt 3280
ctgatgagac atctctgtat tgtgtttctt tccccagtgt tttctgtact tgtgtaatcg 3340
gctaatcgcc aacagattcg gcgatgaata aatgagaaat aaattgttct gattttgagt 3400
gcaaaaaaaa aggaattaga tctgtgtgtg ttttttggat ccccggggcg gccgc 3455
<210>37
<211>653
<212>PRT
<213>人工序列
<400>37
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>38
<211>3044
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:表达盒
<220>
<221>启动子
<222>(14)..(235)
<223>P-CaMV.AS4
<220>
<221>5’UTR
<222>(240)..(304)
<223>L-Ta.hcb1
<220>
<221>内含子
<222>(318)..(805)
<223>I-Os.Act1
<220>
<221>CDS
<222>(811)..(2769)
<223>编码v11231的变异的Cry3Bb1编码序列
<220>
<221>终止子
<222>(2792)..(3025)
<223>T-Ta.hsp17
<400>38
gcggccgcgt taacaagctt ctgacgtaag ggatgacgca cctgacgtaa gggatgacgc 60
acctgacgta agggatgacg cacctgacgt aagggatgac gcactcgaga tccccatctc 120
cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata 180
aggaagttca tttcatttgg agaggacacg ctgacaagct agcttggctg caggtagatc 240
ctagaaccat cttccacaca ctcaagccac actattggag aacacacagg gacaacacac 300
cataagatcc aagggaggcc tccgccgccg ccggtaacca ccccgcccct ctcctctttc 360
tttctccgtt tttttttccg tctcggtctc gatctttggc cttggtagtt tgggtgggcg 420
agaggcggct tcgtgcgcgc ccagatcggt gcgcgggagg ggcgggatct cgcggctggg 480
gctctcgccg gcgtggatcc ggcccggatc tcgcggggaa tggggctctc ggatgtagat 540
ctgcgatccg ccgttgttgg gggagatgat ggggggttta aaatttccgc cgtgctaaac 600
aagatcagga agaggggaaa agggcactat ggtttatatt tttatatatt tctgctgctt 660
cgtcaggctt agatgtgcta gatctttctt tcttcttttt gtgggtagaa tttgaatccc 720
tcagcattgt tcatcggtag tttttctttt catgatttgt gacaaatgca gcctcgtgcg 780
gagctttttt gtaggtagaa gtgatcaacc atg gca aac cct aac aat cgt tcc 834
Met Ala Asn Pro Asn Asn Arg Ser
1 5
gaa cac gac acc atc aag gtt act cca aac tct gag ttg caa act aat 882
Glu His Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Gln Thr Asn
10 15 20
cac aac cag tac cca ttg gct gac aat cct aac agt act ctt gag gaa 930
His Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu
25 30 35 40
ctt aac tac aag gag ttt ctc cgg atg acc gaa gat agc tcc act gag 978
Leu Asn Tyr Lys Glu Phe Leu Arg Met Thr Glu Asp Ser Ser Thr Glu
45 50 55
gtt ctc gat aac tct aca gtg aag gac gct gtt gga act ggc att agc 1026
Val Leu Asp Asn Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser
60 65 70
gtt gtg gga cag att ctt gga gtg gtt ggt gtt cca ttc gct gga gct 1074
Val Val Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala
75 80 85
ttg acc agc ttc tac cag tcc ttt ctc aac acc atc tgg cct tca gat 1122
Leu Thr Ser Phe Tyr Gln Ser Phe Leu Asn Thr Ile Trp Pro Ser Asp
90 95 100
gct gat ccc tgg aag gct ttc atg gcc caa gtg gaa gtc ttg atc gat 1170
Ala Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp
105 110 115 120
aag aag atc gaa gag tat gcc aag tct aaa gcc ttg gct gag ttg caa 1218
Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln
125 130 135
ggt ttg cag aac aac ttc gag gat tac gtc aac gca ctc aac agc tgg 1266
Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asn Ser Trp
140 145 150
aag aaa act ccc ttg agt ctc agg tct aag cgt tcc cag gac cgt att 1314
Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys Arg Ser Gln Asp Arg Ile
155 160 165
cgt gaa ctt ttc agc caa gcc gaa tcc cac ttc aga aac tcc atg cct 1362
Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro
170 175 180
agc ttt gcc gtt tct aag ttc gag gtg ctc ttc ttg cca aca tac gca 1410
Ser Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala
185 190 195 200
caa gct gcc aac act cat ctc ttg ctt ctc aaa gac gct cag gtg ttt 1458
Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe
205 210 215
ggt gag gaa tgg ggt tac tcc agt gaa gat gtt gcc gag ttc tac cgt 1506
Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp Val Ala Glu Phe Tyr Arg
220 225 230
agg cag ctc aag ttg act caa cag tac aca gac cac tgc gtc aac tgg 1554
Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp
235 240 245
tac aac gtt ggg ctc aat ggt ctt aga gga tct acc tac gac gca tgg 1602
Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly Ser Thr Tyr Asp Ala Trp
250 255 260
gtg aag ttc aac agg ttt cgt aga gag atg acc ttg act gtg ctc gat 1650
Val Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp
265 270 275 280
ctt atc gtt ctc ttt cca ttc tac gac att cgt ctt tac tcc aaa ggc 1698
Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile Arg Leu Tyr Ser Lys Gly
285 290 295
gtt aag aca gag ctg acc aga gac atc ttc acc gat ccc atc ttc cta 1746
Val Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Leu
300 305 310
ctt acg acc ctg cag aaa tac ggt cca act ttt ctc tcc att gag aac 1794
Leu Thr Thr Leu Gln Lys Tyr Gly Pro Thr Phe Leu Ser Ile Glu Asn
315 320 325
agc atc agg aag cct cac ctc ttc gac tat ctg caa ggc att gag ttt 1842
Ser Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Gln Gly Ile Glu Phe
330 335 340
cac acc agg ttg caa cct ggt tac ttc ggt aag gat tcc ttc aac tac 1890
His Thr Arg Leu Gln Pro Gly Tyr Phe Gly Lys Asp Ser Phe Asn Tyr
345 350 355 360
tgg agc gga aac tac gtt gaa acc aga cca tcc atc gga tct agc aag 1938
Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Ser Lys
365 370 375
acc atc act tct cca ttc tac ggt gac aag agc act gag cca gtg cag 1986
Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Thr Glu Pro Val Gln
380 385 390
aag ttg agc ttc gat ggg cag aag gtg tat aga acc atc gcc aat acc 2034
Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr
395 400 405
gat gtt gca gct tgg cct aat ggc aag gtc tac ctt gga gtt act aaa 2082
Asp Val Ala Ala Trp Pro Asn Gly Lys Val Tyr Leu Gly Val Thr Lys
410 415 420
gtg gac ttc tcc caa tac gac gat cag aag aac gag aca tct act caa 2130
Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln
425 430 435 440
acc tac gat agt aag agg aac aat ggc cat gtt tcc gca caa gac tcc 2178
Thr Tyr Asp Ser Lys Arg Asn Asn Gly His Val Ser Ala Gln Asp Ser
445 450 455
att gac caa ctt cca cct gaa acc act gat gaa cca ttg gag aag gct 2226
Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala
460 465 470
tac agt cac caa ctt aac tac gcc gaa tgc ttt ctc atg caa gac agg 2274
Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg
475 480 485
cgt ggc acc att ccg ttc ttt aca tgg act cac agg tct gtc gac ttc 2322
Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe
490 495 500
ttt aac act atc gac gct gag aag att acc caa ctt ccc gtg gtc aag 2370
Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys
505 510 515 520
gct tat gcc ttg tcc agc gga gct tcc atc att gaa ggt cca ggc ttc 2418
Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe
525 530 535
acc ggt ggc aac ttg ctc ttc ctt aag gag tcc agc aac tcc atc gcc 2466
Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala
540 545 550
aag ttc aaa gtg aca ctt aac tca gca gcc ttg ctc caa cgt tac agg 2514
Lys Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg
555 560 565
gtt cgt atc aga tac gca agc act acc aat ctt cgc ctc ttt gtc cag 2562
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln
570 575 580
aac agc aac aat gat ttc ctt gtc atc tac atc aac aag act atg aac 2610
Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn
585 590 595 600
aaa gac gat gac ctc acc tac caa aca ttc gat ctt gcc act acc aat 2658
Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe Asp Leu Ala Thr Thr Asn
605 610 615
agt aac atg gga ttc tct ggt gac aag aac gag ctg atc ata ggt gct 2706
Ser Asn Met Gly Phe Ser Gly Asp Lys Asn Glu Leu Ile Ile Gly Ala
620 625 630
gag agc ttt gtc tct aat gag aag att tac ata gac aag atc gag ttc 2754
Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe
635 640 645
att cca gtt caa ctc taatagatcc cccgggctgc aggaattctg catgcgtttg 2809
Ile Pro Val Gln Leu
650
gacgtatgct cattcaggtt ggagccaatt tggttgatgt gtgtgcgagt tcttgcgagt 2869
ctgatgagac atctctgtat tgtgtttctt tccccagtgt tttctgtact tgtgtaatcg 2929
gctaatcgcc aacagattcg gcgatgaata aatgagaaat aaattgttct gattttgagt 2989
gcaaaaaaaa aggaattaga tctgtgtgtg ttttttggat ccccggggcg gccgc 3044
<210>39
<211>653
<212>PRT
<213>人工序列
<400>39
Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr
1 5 10 15
Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30
Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45
Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60
Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val
65 70 75 80
Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95
Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110
Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125
Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140
Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg
145 150 155 160
Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175
Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190
Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205
Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220
Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln
225 230 235 240
Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255
Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270
Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285
Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300
Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly
305 310 315 320
Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335
Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
340 345 350
Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365
Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380
Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys
385 390 395 400
Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415
Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430
Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445
Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460
Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala
465 470 475 480
Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495
Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510
Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525
Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540
Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser
545 550 555 560
Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575
Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590
Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605
Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620
Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys
625 630 635 640
Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
<210>40
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成寡核苷酸
<400>40
taggcctcca tccatggcaa accctaacaa tc 32
<210>41
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成寡核苷酸
<400>41
tcccatcttc ctacttagca ccctgcagaa atacggtcca ac 42
<210>42
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成寡核苷酸
<400>42
gacctcacct accaaacatt cgatcttg 28
<210>43
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成寡核苷酸
<400>43
cgagttctac cgtaggcagc tcaag 25