CN107106634A

CN107106634A - 可用于控制昆虫害虫的修饰的Cry1Ca毒素

Info

Publication number: CN107106634A
Application number: CN201580071104.4A
Authority: CN
Inventors: J·J·希茨; K·纳尔瓦; T·米德; T·D·海伊; S·Y·坦; A·J·埃特尔; T·P·格兰西; J·M·阿姆斯特朗; T·E·克拉姆; K·M·马杜里; J·E·金; R·M·李; G·林; J·李
Original assignee: Dow AgroSciences LLC
Current assignee: Kedihua Agricultural Technology Co ltd
Priority date: 2014-12-30
Filing date: 2015-12-16
Publication date: 2017-08-29
Anticipated expiration: 2035-12-16
Also published as: KR20170099907A; JP2018501798A; US20200157154A1; ZA201704299B; AR103310A1; CL2017001707A1; AU2015372474A1; EP3240560B1; AU2015372474B2; NZ732360A; US10570182B2; US20230183300A1; TW201629091A; CO2017006326A2; WO2016109212A1; CN107106634B; CN114213511A; CA3192494A1; EP3240560A1; MX2022011850A

Abstract

本主题发明涉及苏云金芽孢杆菌修饰的Cry1Ca杀虫毒素以及编码这些毒素的多核苷酸序列。描述了在转基因植物中的应用，以及用于保护作物免受昆虫害虫损害的方法。

Description

可用于控制昆虫害虫的修饰的Cry1Ca毒素

公开领域

本主题发明涉及苏云金芽孢杆菌杀虫毒素的修饰，编码这些毒素的多核苷酸序列，以及产生这些毒素的转基因植物。

发明背景

昆虫和其它害虫在作物损失和控制这些害虫的费用方面每年导致农民花费数十亿美元。除了田间作物的损失外，昆虫害虫也对蔬菜和水果种植者，观赏花卉的生产者和家庭园艺师造成负担。在农业生产环境中由昆虫害虫引起的损失包括作物产率的降低，作物质量的降低和收获成本的增加。

昆虫害虫主要通过化学杀虫剂(pesticides)的密集应用来控制，所述化学杀虫剂通过抑制昆虫生长，防止昆虫进食或繁殖或导致死亡而发挥作用。因此，可以达到良好的昆虫控制，但是这些化学品有时也可以影响其它有益昆虫。源自广泛使用化学杀虫剂的另一个问题是昆虫抗性群体的出现。这已经通过各种抗性管理实践得到部分缓解，但是对替代的害虫控制剂的需求日益增加。生物害虫控制剂，诸如表达杀虫毒素如δ-内毒素的苏云金芽孢杆菌(Bacillus thuringiensis)(Bt)菌株也已经应用于作物植物产生了令人满意的结果，提供了对化学杀虫剂的备选或补充。已经分离了编码这些δ-内毒素中某一些的基因，并且已经显示它们在异源宿主中的表达提供了用于控制经济上重要的昆虫害虫的另一种工具。特别地，在转基因植物中杀虫毒素(诸如苏云金芽孢杆菌δ-内毒素)的表达已经提供了针对选定的昆虫害虫的有效保护，并且表达此类毒素的转基因植物已经产业化，为农民减少化学昆虫控制剂的应用创造了条件。

鳞翅目是一群重要的农业、园艺、和家庭害虫，其每年引起大量的损害。此昆虫目涵盖以叶和根为食的幼虫和成虫。鳞翅类昆虫害虫包括但不限于：小蜡螟(Achoroiagrisella)、西黑头长翅卷蛾(Acleris gloverana)、黑头长翅卷蛾(Acleris variana)、棉褐带卷蛾(Adoxophyes orana)、小地老虎(Agrotis ipsilon，black cutworm“BCW”)、棉叶波纹夜蛾(Alabama argillacea)、波林尺蠖(Alsophila pometaria)、脐橙螟(Amyeloistransitella)、地中海斑螟(Anagasta kuehniella)、桃条麦蛾(Anarsia lineatella)、橙纹犀额蛾(Anisota senatoria)、柞蚕(Antheraea pernyi)、大豆夜蛾(Anticarsiagemmatalis)(刺毛黧豆毛虫)、黄卷蛾属(Archips sp.)、带卷蛾属(Argyrotaenia sp.)、Athetis mindara、家蚕蛾(Bombyx mori)、棉潜蛾(Bucculatrix thurberiella)、干果斑螟(Cadra cautella)、色卷蛾属(Choristoneura sp.)、Cochylls hospes、苜蓿黄蝶(Coliaseurytheme)、米螟(Corcyra cephalonica)、Cydia latiferreanus、苹果皮小卷蛾(Cydiapomonella)、核桃配片舟蛾(Datana integerrima)、西伯利亚松毛虫(Dendrolimussibericus)、葡萄小卷叶野螟(Desmia feneralis)、甜瓜绢野螟(Diaphania hyalinata)、黄瓜绢野螟(Diaphania nitidalis)、玉米杆草螟(Diatraea grandiosella，南方玉米根虫(“SWCB”))、小蔗杆草螟(Diatraea saccharalis)、榆林黄尺蠖(Ennomos subsignaria)、蛀茎螟蛾(Eoreuma loftini)、烟草粉螟(Esphestia elutella)、菩提松尺蠖(Erannistilaria)、盐泽灯蛾(Estigmene acrea)、Eulia salubricola、Eupocoellia ambiguella、环针单纹卷蛾(Eupoecilia ambiguella)、黄毒蛾(Euproctis chrysorrhoea)、暗缘地老虎(Euxoa messoria)、蜡螟(Galleria mellonella)、梨小食心虫(Grapholita molesta)、葡萄叶烟翅斑蛾(Harrisina americana)、Helicoverpa subflexa、谷实夜蛾/玉米穗虫(Helicoverpa zea，corn earworm(“CEW”))、烟芽夜蛾(Heliothis virescens)(烟草夜蛾“TBW”)、行列半白大蚕蛾(Hemileuca oliviae)、向日葵酮斑螟(Homoeosoma electellum)、美国白蛾(Hyphantia cunea)、番茄茎麦蛾(Keiferia lycopersicella)、铁杉尺蠖(Lambdina fiscellaria fiscellaria)、西方铁杉尺蠖(Lambdina fiscellarialugubrosa)、雪毒蛾(Leucoma salicis)、葡萄花翅小卷蛾(Lobesia botrana)、网锥额野螟(Loxostege sticticalis)、舞毒蛾(Lymantria dispar)、Macalla thyrisalis、天幕毛虫属(Malacosoma sp.)、甘蓝夜蛾(Mamestra brassicae)、蓓带夜蛾(Mamestraconfigurata)、番茄天蛾(Manduca quinquemaculata)、烟草天蛾(Manduca sexta)、豆荚野螟(Maruca testulalis)、Melanchra picta、果园秋尺蠖(Operophtera brumata)、古毒蛾属(Orgyia sp.)、欧洲玉米螟(Ostrinia nubilalis，European corn borer“ECB”)、苹尺蠖(Paleacrita vernata)、蛀茎夜蛾(Papiapema nebris，常见茎蛀虫)、巨燕尾蝶(Papiliocresphontes)、红铃麦蛾(Pectinophora gossypiella)、加州栎石蛾(Phryganidiacalifornica)、斑幕潜叶蛾(Phyllonorycter blancardella)、暗脉菜粉蝶(Pieris napi)、菜粉蝶(Pieris rapae)、苜蓿綠夜蛾(Plathypena scabra)、Platynota flouendana、荷兰石竹小卷蛾(Platynota stultana)、洋薊羽蛾(Platyptilia carduidactyla)、印度谷斑螟(Plodia interpunctella)、小菜蛾/菱纹背蛾(Plutella xylostella，diamondback moth“DBM”)、美国纹白蝶(Pontia protodice)、白点粘虫(Pseudaletia unipuncta)、大豆尺夜蛾(Pseudoplasia includens)(大豆尺蠖“SBL”)、Sabulodes aegrotata、红山背舟蛾(Schizura concinna)、麦蛾(Sitotroga cerealella)、苹白小卷蛾(Spilonta ocellana)、南方灰翅夜蛾(Spodoptera eridania)(南方粘虫“SAW”)、草地贪夜蛾/秋粘虫(Spodopterafrugiperda，秋粘虫“FAW”)、甜菜夜蛾/贪夜蛾(Spodoptera exigua，甜菜粘虫“BAW”)、Thaurnstopoea pityocampa、Ensola bisselliella、粉纹夜蛾(Trichoplusia ni)(卷心菜尺蠖“CL”)、温室螟蛾(Udea rubigalis)、Xylomyges curiails、和苹果巢蛾(Yponomeutapadella)。上述的任何属(以及其他)，一般而言，也可以作为靶标构成本发明的一部分。这些属中的任何其他昆虫(作为靶标)也包括在本发明的范围之内。

苏云金芽孢杆菌(B.t.)是土壤传播的、革兰氏阳性的孢子形成细菌，其产生称为delta内毒素或Cry蛋白的杀虫结晶蛋白(在Schnepf等，1998的综述)。具有新的杀虫特性的新型结晶(Cry)蛋白质以不断增长的速度继续被发现，已经报道了超过440种Cry基因。目前，已有超过450种独特的Cry和细胞毒素(Cytotoxin，Cyt)蛋白被归类到57个同源性等级之中。Cry蛋白是基于序列同一性的程度命名的，其一级、二次和三级边界分别在约45％，78％和95％的同一性处；近缘的等位基因被赋予新的四级代号(Crickmore等，1998)。http://www.lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/intro.html维护有一个delta内毒素的大清单，并定期有更新。目前有73个主要的“Cry”毒素类群(Cry1-Cry73)，以及另外的Cyt毒素和植物杀虫蛋白(VIP)毒素等。这些数字表示的类群中许多都包含大写字母表示的亚群，而大写字母表示的亚群具有小写字母的子亚群。(Cry1有A-L，Cry1A有a-i)。

迄今为止，使用B.t.蛋白质产生的抗虫转基因植物已经得到成功地注册，去监管或者商业化。这些包括玉米中的Cry1Ab，Cry1Ac，Cry1F，Vip3A，Cry34Ab1/Cry35Ab1和Cry3Bb，棉花中的Cry1Ac、Vip3A和Cry2Ab，以及马铃薯中的Cry3A。B.t.毒素占生物杀虫剂市场的90％以上，而且已被开发用于提供对昆虫摄食的抗性的转基因作物的基因基本上全部来源于B.t.毒素。

Cry蛋白质是口服性毒物，通过作用于易感昆虫的中肠细胞发挥功能。许多Cry蛋白的活性形式包含三个不同的蛋白质结构域。研究最多的B.t.蛋白质是三结构域Cryδ-内毒素的成员。这些蛋白质的大小从大约70kDa到130kDa不等。原始蛋白质序列分析揭示了五个高度保守的序列区块，还揭示了保守区块三和区块五之间有高度序列变异性(Schnepf等，1998)。

已经为Cry1Aa1、Cry2Aa1、Cry3Aa1、Cry3Bb1、Cry4Aa、Cry4Ba和Cry8Ea1确定了三维晶体结构。这些结构非常相似，并且由具有以下特征的三个不同的结构域组成(参见deMaagd等人，2003)。结构域I是七个α螺旋的束，其中螺旋五被六个两亲螺旋包围。已有证据显示该结构域中肠膜插入和孔形成。它与其他造孔蛋白(包括溶血素和大肠杆菌素)享有同源性。结构域II由三个反平行β片组成，它们一起被包装在一个β棱镜(beta-prism)中。该域与某些碳水化合物结合蛋白(包括卵黄索(vitelline)和jacaline)享有同源性。该结构域的各环在结合昆虫中肠受体中起重要作用。在Cry1A蛋白中，结构域IIβ片的顶点处的表面暴露的环参与和鳞翅目钙粘蛋白受体的结合。结构域III是与另一受体相互作用的β夹心结构，此类受体的实例，就Cry1A蛋白质而言，有氨基肽酶和碱性磷酸酶(Piggot and Ellar，2007)。在结构上，该结构域与葡聚糖酶、半乳糖氧化酶、唾液酸酶等蛋白质的糖结合结构域有亲缘关系。该结构域结合某些类型的受体蛋白，并可能参与寡聚毒素前体的插入。保守的B.t.序列块2和3分别定位在结构域2的N末端和C末端附近。因此，这些保守序列块2和3是三个功能域之间的近似边界区域。这些具有DNA和蛋白质同源性的保守区域已被开发用于工程化重组B.t.毒素(美国专利号6,090,931，WO 91/01087，WO95/06730，WO 1998022595)。

提出的Cry蛋白作用模式模型之一是基于敏感昆虫中肠膜中的孔形成(Knowlesand Ellar，1987)。在该模型的当前版本(Bravo等人，2007)中，与鳞翅目中肠膜上的钙粘蛋白和氨基肽酶受体的结合对于Cry蛋白毒性都是必需的。根据孔隙形成模型，Cry蛋白中毒涉及几个步骤：1)可溶性Cry原毒素蛋白水解加工成活化的核心毒素；2)Cry蛋白与昆虫中肠上的钙粘蛋白受体结合；3)在核心毒素N末端进一步蛋白水解切割以除去α-螺旋区；4)Cry蛋白寡聚形成前孔；5)前孔结合第二位点膜受体(氨基肽酶和碱性磷酸酶)；6)前孔插入膜；和7)渗透性细胞溶解导致中肠破裂和昆虫死亡。

由于抗虫转基因植物技术的广泛应用，有人担忧害虫种群将会对这些植物产生的杀虫蛋白产生抗性。人们已经提出了几种策略来保护基于Bt的昆虫抗性性状的效用，包括与避难所组合部署高剂量的蛋白质，以及用不同毒素轮换或共同部署(McGaughey等(1998)，“Bt Resistance Management”，Nature Biotechnol.16：144-146)。

昆虫对B.t.蛋白的抗性可以通过几种机制发生(Heckel等，2007，Piggot andEllar，2007)。在昆虫中已经鉴定了多个Cry蛋白受体蛋白类别，而且每个受体类别有多个实例。对特定Cry蛋白的抗性可以通过例如受体蛋白质的钙粘着蛋白结构域的毒素结合部分内的突变而发生。另一种抗性方式可以通过原毒素加工蛋白酶介导。因此，鳞翅目物种中对Cry1A毒素的抗性具有复杂的遗传基础，至少有四个不同的主要抗性基因。对小菜蛾(Plutella xylostella)(Tabashnik，1994)，鳞翅目昆虫中的粉纹夜蛾(Trichoplusia ni)(Janmaat和Myers 2003,2005)，谷实夜蛾(Helicoverpa zea)(Tabashnik等，2008)和草地贪夜蛾(Spodoptera frugiperda)(Storer等人，2010)等已经在田间出现了对Cry蛋白的抗性。开发新的高效力的Cry蛋白质将为管理鳞翅目昆虫提供更多的工具。

本发明提供了B.t.杀虫蛋白，其可有效控制对Cry1Ac和Cry1F有抗性的昆虫。这些蛋白质毒素可以有利地用于保护农艺作物免受昆虫摄食损害。以一定方式表达这些昆虫毒素，使得感兴趣的作物中存在足够量的功能活性蛋白质的能力也是本发明的主题。

发明概述

包含SEQ ID NO:2的残基2至68的修饰的Cry1Ca毒素，其中氨基酸残基54选自Gly和Ala，氨基酸残基57选自Leu和Met，且氨基酸残基68选自Val、Phe和Ile。包含SEQ ID NO:210的残基2至628的修饰的Cry1Ca毒素，其中氨基酸残基54选自Gly和Ala，氨基酸残基57选自Leu和Met，氨基酸残基68选自Val、Phe和Ile，氨基酸残基73选自Trp、Ala和Met，氨基酸残基596选自Phe、Met和Ala，且氨基酸酸残基620选自Leu和Phe。上述修饰的Cry1Ca毒素还包含由SEQ ID NO:36的氨基酸残基629至1164组成的羧基末端延伸。上述修饰的Cry1Ca毒素还包含由SEQ ID NO:36的氨基酸残基629至1164组成的羧基末端延伸。上述修饰的Cry1Ca毒素还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。上述修饰的Cry1Ca毒素还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。上述修饰的Cry1Ca毒素还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。上述修饰的Cry1Ca毒素还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。

本发明中包括编码修饰的Cry1Ca毒素的DNA，产生修饰的Cry1Ca毒素的转基因植物和使用经修饰的Cry1Ca毒素控制害虫的方法。

本发明涉及用于控制对植物和农业有害的节肢动物害虫的新材料和方法。在优选的实施方案中，本发明提供了用于控制鳞翅目害虫的材料和方法。

根据本发明有用的具体的B.t.Cry蛋白质(内毒素，毒素)包括可从命名为MR-1206的B.t.分离株获得的毒素。本发明还包括示例的B.t.分离株和毒素的突变体的应用，这些突变体具有改善的鳞翅目活性性质，可抵抗蛋白酶加工，或者当基因被转化到异源表达系统中时以高水平表达。制备突变体的程序在微生物技术领域是众所周知的。紫外光和化学诱变剂如亚硝基胍广泛用于此目的。

可以“施用”或提供主题蛋白质毒素以通过各种方式与目标昆虫接触。例如，可以使用转基因植物(其中所述蛋白质由植物产生并存在于植物中)，转基因植物是本领域公知的。也可以在植物的特定组织例如根，叶等中选择性地表达毒素基因。这可以通过使用例如组织特异性启动子来实现。喷洒施用应用(spray-on application)是另一个实例，并且在本领域中也是已知的。主题蛋白质可以适当地配制用于期望的最终用途，然后在发现侵染之前，在发现侵染之后，发现目标昆虫之后，在之前和之后，等等，喷洒(或以其它方式施用)到待保护植物之上和/或植物周围和/或植物附近。主题蛋白质也可以适当地配制并以拌种剂(seed treatment)的形式施用于种子，这使得蛋白质可以与植物的根部区域接触以保护其免受啮根性昆虫之害。例如，诱饵颗粒也可以使用并且是本领域已知的。

本发明蛋白质可用于保护几乎任何类型的植物免受鳞翅目昆虫的损害。这些植物的实例包括玉米，向日葵，大豆，棉花，卡诺拉，稻，高粱，小麦，大麦，蔬菜，观赏植物，辣椒类(包括辣椒)，甜菜，水果和草坪草，仅举数例。特别优选的植物是玉米、大豆和棉花。一种最优选的植物是玉米。另一种最优选的植物是大豆。另一种最优选的植物是棉花。

在本发明的一个实施方案中，本发明的多核苷酸序列编码约68-71kDa的毒素。这些毒素用于控制鳞翅目害虫，特别是秋粘虫、小菜蛾、西南玉米螟，南方粘虫，玉米穗蛾、和欧洲玉米螟。在优选的实施方案中，本主题发明涉及这样的植物细胞，其被用本主题发明的至少一个多核苷酸序列转化，使得经转化的植物细胞在被目标害虫消耗的组织中产生并含有本发明的杀虫毒素。

或者，本发明的B.t.分离株、或表达编码本文所述的杀虫毒素蛋白质的基因的重组微生物，可用于防治昆虫害虫。在这方面，本发明包括处理基本上完整的B.t.细胞，和/或含有本发明毒素的重组细胞，这些细胞经过处理，使得当这些基本上完整的细胞被施用于目标害虫的环境时，杀虫活性延长。经处理的细胞充当杀虫毒素的保护性包层。一旦被目标昆虫摄入后，毒素就变成活性。

本发明的一个方面涉及包含编码杀虫蛋白和多肽或其生物活性部分的核苷酸序列的分离的核酸分子，以及足以用作杂交探针来鉴定编码所要求保护的毒素的核酸的核酸分子。如本文所用的，术语“核酸分子”旨在包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)，以及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链或双链的，但优选是双链DNA。

编码本发明的蛋白质的核苷酸序列包括SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39，及其互补物。“互补物”是指这样的核苷酸序列，其具有与给定核苷酸序列的充分的互补性，使得其可以与给定的核苷酸序列杂交从而形成稳定的双链体(双链)分子。由这些核苷酸序列编码的杀虫活性的修饰的Cry1Ca毒素的相应氨基酸序列列于SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40。

作为所要求保护的编码毒素的核苷酸序列的片段的核酸分子也包括在本发明中。“片段”是指编码所要求修饰的Cry1Ca毒素片段的核苷酸序列的一部分。核苷酸序列的片段可以编码所请求保护的毒素蛋白质的生物活性部分，或者可以是可以使用下文所公开的方法用作杂交探针或PCR引物的片段。

序列表简要说明

SEQ ID NO:1编码DIG-468的DNA序列

SEQ ID NO:2是DIG-468蛋白质序列

SEQ ID NO:3编码DIG-483的DNA序列

SEQ ID NO:4是DIG-483蛋白质序列

SEQ ID NO:5编码DIG-485的DNA序列

SEQ ID NO:6是DIG-485蛋白质序列

SEQ ID NO:7编码DIG-487的DNA序列

SEQ ID NO:8是DIG-487蛋白质序列

SEQ ID NO:9编码DIG-462的DNA序列

SEQ ID NO:10是DIG-462蛋白序列

SEQ ID NO:11编码DIG-463的DNA序列

SEQ ID NO:12是DIG-463蛋白序列

SEQ ID NO:13编码DIG-464的DNA序列

SEQ ID NO:14是DIG-464蛋白质序列

SEQ ID NO:15编码DIG-465的DNA序列

SEQ ID NO:16是DIG-465蛋白质序列

SEQ ID NO:17编码DIG-466的DNA序列

SEQ ID NO:18是DIG-466蛋白质序列

SEQ ID NO:19编码DIG-467的DNA序列

SEQ ID NO:20是DIG-467蛋白质序列

SEQ ID NO:21编码DIG-469的DNA序列

SEQ ID NO:22是DIG-469蛋白质序列

SEQ ID NO:23编码DIG-473的DNA序列

SEQ ID NO:24是DIG-473蛋白质序列

SEQ ID NO:25编码DIG-474的DNA序列

SEQ ID NO:26是DIG-474蛋白质序列

SEQ ID NO:27编码DIG-482的DNA序列

SEQ ID NO:28是DIG-482蛋白质序列

SEQ ID NO:29经玉米密码子优化的编码修饰的Cry1Ca的DNA序列(IRDIG544.11)

SEQ ID NO:30是修饰的Cry1Ca蛋白质蛋白毒素序列(IRDIG544.11)

SEQ ID NO:31编码经过高GC密码子优化的修饰的Cry1Ca，IRDIG544.12的DNA序列

SEQ ID NO:32IRDIG544.12的蛋白毒素序列

SEQ ID NO:33是针对双子叶植物优化的编码修饰的Cry1Ca：IRDIG544.9的DNA序列

SEQ ID NO:34修饰的Cry1Ca：IRDIG544.9的蛋白质序列

SEQ ID NO:35双子叶植物优化的编码修饰的Cry1Ca：IRDIG544.8的DNA序列

SEQ ID NO:36针对双子叶植物密码子优化的IRDIG544.8蛋白质

SEQ ID NO:37编码Cry1Ab原毒素区段与修饰的Cry1Ca毒素的融合物的DNA序列

SEQ ID NO:38是从SEQ ID NO:37的DNA产生的蛋白质毒素序列

SEQ ID NO:39高GC密码子优化的DNA序列，编码修饰的Cry1CaIRDIG544.12与Trap12的融合物

SEQ ID NO:40是修饰的Cry1Ca毒素IRDIG544.12与TraP12的融合物。

附图说明

图1显示了在通过叶冲孔取样的T₁玉米叶中构建体115752表达DIG-465的水平，和构建体115753表达DIG-473的水平。

图2是玉米中由FAW或Cry1Fa抗性FAW引起的叶损伤的量对DIG-465的表达水平的作图。

图3是玉米中由FAW或Cry1Fa抗性FAW引起的叶损伤的量对DIG-473的表达水平的作图。

发明详细说明

本文中的术语“遗传物质”意图包括所有基因、核酸、DNA和RNA。这些序列已经以一定方式被改变，以在当该基因被转化到植物，特别是玉米和双子叶植物中时，提高表达的蛋白质毒素的稳定性。本文讨论的蛋白质毒素通常被称为“杀虫剂”或“杀虫的”。杀虫剂”和“杀虫的”在本文中意指蛋白质毒素具有本文进一步定义的“功能活性”，并被用作昆虫控制剂。

“功能活性”在本文中是指蛋白质毒素可发挥昆虫控制剂功能，因为这些蛋白质具有口服活性，或具有毒性作用，或能够破坏或阻止进食，这可能或可能不引起昆虫死亡。当昆虫与通过转基因植物表达、经配制的蛋白质组合物、可喷雾蛋白质组合物、诱饵基质或其它递送系统递送的有效量的毒素接触时，结果通常是昆虫死亡，或这些昆虫不以给昆虫提供毒素的来源为食。

术语“寡核苷酸”，是指由RNA或DNA的核苷酸的短链组成的大分子。这样的长度可以是至少一个核苷酸，但通常在约10至约12个核苷酸的范围内。寡核苷酸的长度的确定在技术人员的技艺范围内，在本文中不应该构成限制。因此，寡核苷酸可以小于10个或大于12个。本主题发明不仅涉及编码这些类型的毒素的多核苷酸序列，而且涉及这些多核苷酸序列用于产生表达毒素的重组宿主的用途。

如本文所用的，术语“毒性”是指由苏云金芽孢杆菌产生的毒素具有如本文所定义的“功能活性”。

术语“修饰的Cry1Ca毒素”意在包括序列表的所有蛋白质序列和本文所述的它们的所有变体。

本文中使用的术语“遗传物质”意图包括所有基因、核酸、DNA和RNA。

对于多核苷酸、DNA、RNA、寡核苷酸和引物的核苷酸残基的命名以及蛋白质氨基酸残基的命名，在本文中使用标准IUPAC缩写。核酸序列以标准5'至3'方向呈现，蛋白质序列以标准的氨基(N)末端到羧基(C)末端方向呈现。

本发明的毒素和基因可以通过其氨基酸和核苷酸序列、以及全长DNA氨基序列中包含的独特片段的序列进一步限定。每个新类别之内的分子的序列可以用其与特定的示例序列的同源性、以及用其与某些示例的探针和引物杂交、或被某些示例的探针和引物扩增的能力来限定。本文提供的毒素类别也可以基于其与某些抗体的免疫反应性来鉴定。

毒素结构.本主题发明的毒素也可以根据结构和结构域组成来表征。由于蛋白质序列变异性与生物活性谱中的差异之间相关性，早先有假说认为，区块三和区块五之间的“高变区”区域是各种B.t.δ-内毒素之间昆虫特异性的差异的基础。

当编码天然全长Cry1Ca蛋白的基因被插入玉米细胞并在玉米细胞中表达时，观察到至少5种可检测的蛋白水解降解产物。确定这5种多肽具有以下氨基酸长度：1-1164、1-628、29-628、74-628和74-596。在检测到的五种Cry1Ca降解产物中，发现两个片段对要因性(key driver)昆虫害虫无活性。在大多数情况下，这两个无活性片段代表了在玉米细胞中检测到的Cry1Ca相关蛋白的主要部分。在玉米中表达Cry1Ca的天然全长基因导致植物对关键害虫如草地贪夜蛾的功能活性不足。

当表达截短的天然Cry1Ca蛋白(aa 1-628)的基因被插入玉米细胞中并在玉米细胞中表达时，发生蛋白水解加工较少。大多数保持未被加工且具有功能活性。因此，在玉米细胞中表达截短的Cry1Ca基因后，由于玉米细胞中蛋白水解减少，导致植物对主要昆虫害虫具有足够的功能活性。

改变Cry1Ca的原始氨基酸序列为实现针对针对关键害虫的连续生物活性提供了可能性，并且导致蛋白质的蛋白水解加工减少，如在体外使用胰凝乳蛋白酶作为蛋白酶测量的。由于改变的Cry1Ca蛋白质的蛋白水解加工较少，导致植物中积累的功能活性蛋白质的量更高，并导致对目标昆虫害虫的活性更大。

蛋白酶敏感变体.昆虫肠道蛋白酶通常发挥作用帮助昆虫从饵食蛋白质获得所需的氨基酸。了解最充分的昆虫消化蛋白酶是丝氨酸蛋白酶，其似乎是最常见的类型(Englemann和Geraerts，1980)，特别是在鳞翅目物种中。鞘翅目昆虫的肠道比鳞翅目的肠道更偏中性到酸性。大多数鞘翅目幼虫和成虫，例如科罗拉多马铃薯甲虫，具有微酸性的中肠，且由半胱氨酸蛋白酶提供主要的蛋白水解活性(Wolfson和Murdock，1990)。更准确地说，Thie和Houseman(1990)在科罗拉多马铃薯甲虫中鉴定和表征了半胱氨酸蛋白酶——组织蛋白酶B样蛋白酶和组织蛋白酶H样蛋白酶，以及天冬氨酰蛋白酶——组织蛋白酶D样蛋白酶。Gillikin等人(1992)表征了西方玉米根虫幼虫的肠道中的蛋白水解活性，发现主要是半胱氨酸蛋白酶。美国专利第7230167号公开了丝氨酸蛋白酶组织蛋白酶G存在于西方玉米根虫中。昆虫肠道蛋白酶的多样性和不同的活性水平可能影响昆虫对特定B.t.毒素的昆虫敏感性。

在一个实施方案中，毒素在其氨基酸序列中具有特定的改变，从而显著降低玉米植物中天然存在的蛋白酶对表达的蛋白质的蛋白酶加工水平。这些氨基酸的变化导致该蛋白质当在玉米中表达时的功能活性水平更高。可以通过化学基因合成或剪接重叠PCR在期望的位置引入蛋白酶切割位点(Horton等，1989)。例如，可以在Cry蛋白结构中的特定位点任选地插入丝氨酸蛋白酶识别序列以影响某些昆虫害虫中肠内的期望的缺失位点处的蛋白质加工。通过在期望的加工位点工程构建蛋白酶识别序列，可以利用鳞翅目中肠丝氨酸蛋白酶，如胰蛋白酶或胰蛋白酶样酶、胰凝乳蛋白酶、弹性蛋白酶等(Christler等，1992)来激活Cry蛋白。同样，可以类似地通过在期望的加工位点工程构建识别序列来利用鞘翅目丝氨酸蛋白酶，如胰蛋白酶、胰凝乳蛋白酶和组织蛋白酶G样蛋白酶。此外，通过在期望的加工位点工程构建识别序列，可以利用鞘翅目半胱氨酸蛋白酶，如组织蛋白酶(B样、L样、O样和K样蛋白酶)(Koiwa等，2000和Bown等，2004)，金属蛋白酶如ADAM10(Ochoa-Campuzano等人，2007)，天冬氨酸蛋白酶如组织蛋白酶D样和E样蛋白酶，胃蛋白酶，plasmepsin和凝乳酶。

本发明的范围包括变体Cry1Ca杀虫蛋白，这些变体Cry1Ca杀虫蛋白是通过操纵本发明的杀虫蛋白的编码序列，在适当位置引入或消除蛋白酶加工位点，以允许或消除昆虫、植物或微生物蛋白酶对较大变体蛋白质的蛋白水解切割而产生的。这种操作的最终结果是产生具有与完整(全长)天然毒素蛋白相同或更好的活性的毒素分子。

与II型限制性内切核酸酶的DNA底物识别和切割中的高度序列特异性不同，蛋白水解酶对包含切割识别位点的氨基序列的非特异性更高。与组织蛋白酶B，K，L和S(Bown等人，2004)相比，已经发现关于包含一些蛋白酶切割位点，特别是组织蛋白酶G的氨基酸结构的一些共性。在下文举例说明中的蛋白酶切割位点的命名法中，切割位点的上游(即朝向N末端)的氨基酸残基编号为P1，P2，P3，P4，P5等，残基P1紧邻于切割位点，而残基P5在N末端方向上相距切割位点第五远。切割位点的下游(即朝向C末端)的氨基酸残基编号为P1'，P2'，P3'，P4'，P5'等，残基P1'紧邻切割位点，残基P5'在C末端方向上相距切割位点第五远。已知组织蛋白酶G表现出在P1残基谷氨酰胺、赖氨酸、色氨酸或苯丙氨酸之后优先切割，其中残基P2、P3、P4、P5等，以及P1'、P2'、P3'、P4'、P5'等，可以是通常在天然蛋白质中发现的20种氨基酸的任何一种。组织蛋白酶B、K、L和S表现出少许增强的切割位点序列特异性，其中P2氨基酸的侧链适配到组织蛋白酶的底物结合位点S2中。这些组织蛋白酶的S2位点优先与具有大疏水侧链(例如在缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、色氨酸和酪氨酸中发现的)的P2氨基酸相互作用，且不利于与具有带电侧链的P2残基相互作用(例外的是组织蛋白酶B和L接受P2位置上的精氨酸的大亲水带电侧链)。P3位置的氨基酸的身份可见到一些特异性。例如，当苯丙氨酸或精氨酸占据P2位置时，组织蛋白酶L优先在P1位置的精氨酸之后切割。P3氨基酸可以是芳香型(例如苯丙氨酸、色氨酸、组氨酸或酪氨酸)或疏水型(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、色氨酸或酪氨酸)。位置P4、P5等和P1'、P2'、P3'、P4'、P5'等可以是通常在天然蛋白质中发现的20种氨基酸的任何一种。

蛋白水解切割还依赖于主题切割序列对各个蛋白酶而言的可用性；潜在切割位点被隔离在蛋白质的三维结构内可能使蛋白质对特定蛋白酶的切割具有抗性。有人认为，昆虫肠道蛋白酶的多样性和不同的活性水平可能影响昆虫对特定B.t.毒素的敏感性。生物化学和分子生物学领域的技术人员可以检测易感昆虫的肠道蛋白酶对较大蛋白质进行蛋白酶切割/激活而产生的杀虫蛋白片段的生物化学特征(包括但不限于确定构成该多肽的N末端和C末端的氨基酸的序列)的蛋白酶。也可以表征非敏感昆虫的肠道或宿主植物的蛋白酶体系，并且在B.t.杀虫蛋白的编码序列内的适当位置构造容易被非敏感昆虫的肠道中、或预期要在其中转基因产生该B.t.杀虫蛋白的宿主植物中的蛋白酶切割的序列。对主题B.t.杀虫蛋白的此类分析和操作应理解为落入本发明的范围内。

在另一个实施方案中，毒素在其氨基酸序列中具有特定的变化，这些变化显著提高该毒素在多种不同表达系统(包括植物和细菌)中表达时的蛋白质表达水平。蛋白质表达增加的结果是在该表达系统中的功能活性增加。其有利之处是向昆虫提供高剂量的毒素，可以防止由于接受亚致死剂量的蛋白质毒素的小昆虫群体的存活而导致昆虫对毒素产生抗性。

基因和毒素.本文实施方案的蛋白质分子包含与已知杀虫蛋白、特别是B.t.Cry蛋白，更特别是Cry1Ca蛋白(Genbank登录号：AAA22343)同源的氨基酸序列。由这些实施方案的核苷酸序列编码的预测的氨基酸序列公开为SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40。

本主题发明的毒素序列以SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40提供。在优选的实施方案中，本发明的毒素具有以下特征中的至少一种：

(a)所述毒素由在严格条件下与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39或其互补序列杂交的核苷酸序列所编码。

(b)所述毒素与针对来自苏云金芽孢杆菌分离株的约68-71kDa杀虫性毒素或其片段产生的抗体具有免疫反应性。

(c)所述毒素由这样的核苷酸序列编码，其中该核苷酸序列的一部分可以使用引物对PCR扩增而产生约25-40bp的片段，

(d)所述毒素包含SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40中所示的氨基酸序列的杀虫性部分。

(e)所述毒素包含与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的氨基酸序列的杀虫性部分具有至少约(90％)同源性的氨基酸序列，

(f)所述毒素由在严格条件下与选自编码SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的DNA的核苷酸序列的杀虫性部分杂交的核苷酸序列编码，

(g)所述毒素与针对来自苏云金芽孢杆菌分离株MR-1206的约68kDa或130kDa杀虫性毒素或其片段的抗体具有免疫反应性。

(h)所述毒素包含与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的氨基酸序列、以及SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的杀虫性部分具有至少约(90％)同源性的氨基酸序列。

本文例示的具体基因、这些基因的变体、和这些基因的片段也可以通过例如由几个商业供应商中的任何一个当前实施的方法进行合成构建来获得(参见例如美国专利号7482119)。这些基因或其部分或变体也可以合成地构建，例如通过使用基因合成仪和例如美国专利号5,380,831的方法。或者，可以使用制造点突变的标准分子生物学技术容易地构建合成或天然存在的基因的变体。这些基因的片段也可以根据标准规程使用市售的外切核酸酶或内切核酸酶制备。例如，可以使用Bal31之类的酶或通过定点诱变，系统地从这些基因的末端切断核苷酸。此外，可以使用多种限制酶获得编码活性毒素片段的基因片段。

作为所要求保护的编码毒素的核苷酸序列的片段的核酸分子，取决于预备的用途，包含至少约15,20,30,40,50,60,75,100,200,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1100,1200,1300,1400,1500,1600,1700,1800,1900,2000,2100,2200,2300,2400,2500,3000,3500个核苷酸，或者最多达本文公开且请求保护的编码杀虫毒素的核苷酸序列中存在的核苷酸数目(例如，对SEQ ID NO:1而言为1,878个核苷酸；对SEQ ID NO:37而言为3,495个核苷酸)。编码本发明要求保护的蛋白质的生物活性部分的核苷酸序列的片段将编码至少约15,25,30,40,50,75,100,125,150,175,200,250,300,350,400,450,500,550,600,650,700,800,900,1000,1100或1200个连续氨基酸，或最多达本发明的全长杀虫蛋白中存在的氨基酸总数(例如对SEQ ID NO:2而言为625个氨基酸，或对SEQ ID NO:38而言为1164个氨基酸)。

重组宿主.可以将本发明的毒素编码基因导入极其多种微生物或植物宿主。毒素基因的表达直接或间接导致杀虫蛋白的胞内生成和维持。凭借合适的微生物宿主，例如假单胞菌属(Pseudomonas)，可以将微生物应用于害虫的环境，在那里它们会繁殖并可能被摄取。结果是控制害虫。或者，可以在延长毒素活性和稳定细胞的条件下处理包含毒素基因的微生物。然后可以将经过处理的保留毒素活性的细胞应用于靶害虫的环境。

在经合适的载体将毒素基因导入微生物宿主中，并将所述宿主以活的状态应用于环境的情形中，必须使用某些宿主微生物。选择已知占据一种或多种感兴趣作物的“植物圈”(叶轴、叶圈、根圈、和/或根面)的微生物宿主。选择这些微生物从而能够在特定环境(作物和其它昆虫栖息地)中成功地与野生型本土微生物竞争，提供表达多肽杀虫剂的基因的稳定维持和表达，及期望地提供针对环境降解和灭活对杀虫剂改善的保护。

B.t.孢子或重组宿主细胞也可以在施用或者制剂化用于施用给植物之前加以处理。例如，可以对分离的B.t.孢子合伙毒素晶体进行化学处理以延长杀虫活性，从而包括经处理的本发明的多肽(美国专利号4,695,462和Gaertner et al.,1993)。

已知多种微生物栖息于极其多种重要作物的叶轴(植物叶的表面)和/或根圈(植物根周围的土壤)。这些微生物包括细菌、藻类、和真菌。特别感兴趣的是微生物，诸如细菌，例如假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯氏菌属(Klebsiella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、中华根瘤菌(Sinorhizobium)、红假单胞菌属(Rhodopseudomonas)、嗜甲基菌属(Methylophilius)、土壤杆菌属(Agrobacterium)、醋杆菌属(Acetobacter)、乳杆菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)、和产碱菌属(Alcaligenes)；以及真菌，特别是酵母，例如糖酵母属(Saccharomyces)、隐球酵母属(Cryptococcus)、克鲁维氏酵母属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)、和短柄霉属(Aureobasidium)。特别感兴趣的是植物圈细菌物种，诸如丁香假单胞菌(Pseudomonas syringae)、荧光假单胞菌(Pseudomonas fluorescens)、粘质沙雷氏菌(Serratia marcescens)、木醋杆菌(Acetobacter xylinum)、根癌土壤杆菌(Agrobacterium tumefaciens)、放射形土壤杆菌(Agrobacterium radiobacter)、类球红假单胞菌(Rhodopseudomonas spheroides)、野油菜黄单胞菌(Xanthomonas campestris)、苜蓿中华根瘤菌(Sinorhizobium meliloti)(以前的苜蓿根瘤菌(Rhizobium meliloti))、真养产碱菌(Alcaligenes eutrophus)、和维涅兰德固氮菌(Azotobacter vinelandii)；和植物圈酵母物种，诸如深红酵母(Rhodotorularubra)、胶粘红酵母(R.glutinis)、海滨红酵母(R.marina)、橙黄红酵母(R.aurantiaca)、浅白色隐球酵母(Cryptococcus albidus)、流散隐球酵母(C.diffluens)、罗仑氏隐球酵母(C.laurentii)、罗茜糖酵母(Saccharomyces rosei)、善地糖酵母(S.pretoriensis)、啤酒糖酵母/酿酒酵母(S.cerevisiae)、红色掷孢酵母(Sporobolomyces roseus)、香气掷孢酵母(S.odorus)、佛地克鲁维氏酵母(Kluyveromyces veronae)、和出芽短柄霉(Aureobasidium pollulans)。特别感兴趣的是有色微生物。

本发明的优选实施方案是用编码本发明的杀虫蛋白或其变体的基因转化植物。转化植物由于在转化植物的细胞中存在控制量的主题杀虫蛋白或其变体而可抵抗昆虫靶害虫的攻击。通过在被特定昆虫害虫所食的植物的基因组中掺入编码B.t.杀虫毒素的杀虫性质的遗传物质，成虫或幼虫在食用该食物植物后会死亡。单子叶和双子叶分类中的许多成员已经被转化。转基因农作物以及水果和蔬菜均具有商业意义。这些作物包括但不限于玉米，稻，大豆，卡诺拉，向日葵，苜蓿，高粱，小麦，棉花，花生，番茄，马铃薯等。有几种技术可将外来遗传物质引入单子叶植物或双子叶植物细胞中，以及获得稳定维持和表达引入的基因的可育植物。这些技术包括将包裹在微粒上的遗传物质直接加速打入细胞中(美国专利4945050和5141131)。植物可以用土壤杆菌技术转化，见美国专利5177010，美国专利5104310，欧洲专利申请0131624B1，欧洲专利申请120516，欧洲专利申请159418B，欧洲专利申请176112，美国专利5149645，美国专利5469976，美国专利5464763，美国专利4940838，美国专利4693976，欧洲专利申请116718，欧洲专利申请290799，欧洲专利申请320500，欧洲专利申请604662，欧洲专利申请627752，欧洲专利申请0267159，欧洲专利申请0292435，美国专利5231019，美国专利5463174，美国专利4762785，美国专利5004863，和美国专利5159135。其他转化技术包括WHISKERS^TM技术，见美国专利5302523和美国专利5464765。电穿孔技术也已被用于转化植物，见WO 87/06614，美国专利5472869，美国专利5384253，WO9209696，和WO9321335。将所有这些转化的专利和公布通过提述并入本文。除了许多用于转化植物的技术之外，与外来基因接触的组织的类型也可以变化。这样的组织将包括但不限于胚胎发生组织，I型和II型愈伤组织，下胚轴，分生组织等。几乎所有的植物组织可以在脱分化期间使用本领域技术人员能力范围内的适当技术进行转化。

可以使用本领域熟知的各种技术将编码修饰的Cry1Ca杀虫毒素和变体的基因插入植物细胞中。例如，多种含有允许选择转化的微生物细胞的标记物和在大肠杆菌中有功能的复制体系的克隆载体可用于制备和修饰用于插入高等植物的外源基因。这样的操作可以包括例如根据期望的用途插入突变、截短、添加、缺失或取代。载体包括例如pBR322、pUC系列、M13mp系列、pACYC184等。因此，编码Cry蛋白或变体的序列可以插入载体中的合适的限制性位点中。所得的质粒用于转化大肠杆菌，将其细胞在合适的营养培养基中培养，然后收获并裂解，从而回收可用量的质粒。通常进行序列分析、限制性片段分析、电泳和其他生化分子生物学方法作为分析方法。每次操作后，可以将所用的DNA序列切割并连接到下一个DNA序列。每个操纵的DNA序列可以克隆在相同或其他质粒中。

根据植物转化方法，辅助DNA序列可能是必需的。如果，例如，使用Ti或Ri质粒来转化植物细胞，则至少T-DNA右边界重复序列，但是通常Ti或Ri质粒的右边界重复序列和左边界重复序列将会被接合作为期望插入植物细胞的基因的侧翼区域。含T-DNA的载体用于植物细胞转化的用途已经得到深入研究，并在EP 120516中充分描述；Lee和Gelvin(2008)，Fraley等，(1986)和An等，(1985)，在该领域中已经确立。

一旦插入的DNA已被整合到植物基因组中，其在所有后续世代中是相对稳定的。用于转化植物细胞的载体通常含有选择标记基因，其编码赋予转化植物细胞对除草剂或抗生素(如双丙氨膦、卡那霉素、G418、博来霉素或潮霉素)的耐受性等等的蛋白质。因此，单独使用的选择标记基因应当相应地允许选择转化细胞，同时不含有插入的DNA的细胞的生长被选择化合物抑制。

有多种技术可用于将DNA插入宿主植物细胞中。这些技术包括用根癌土壤杆菌或发根土壤杆菌递送的T-DNA转化。此外，可以使用植物原生质体与含有要递送的DNA的脂质体的融合、DNA的直接注射、生物射弹转化(微粒轰击)或电穿孔，以及其它可能的方法。植物转化领域的技术人员将明了，有多种方法学可用于生产转化植物，并且它们可以修改和专用化，以适应各种宿主植物物种之间的生物学差异。

如果使用土壤杆菌菌株进行转化，则将要插入的DNA克隆到特殊的质粒中，即要么进入中间体(穿梭)载体，要么进入二元载体。中间载体可以借助Ti或Ri质粒与中间质粒之间同源的序列，通过同源重组整合入Ti或Ri质粒或其衍生物。Ti或Ri质粒还包含vir区，该区含有转移T-DNA所需的vir基因。中间载体不能在土壤杆菌中复制。可以借助辅助质粒(通过细菌接合)、通过电穿孔、通过直接DNA，通过化学介导的转化、或通过其他方法将中间载体转移到根癌土壤杆菌中。二元载体在大肠杆菌和土壤杆菌细胞二者中都能自主复制。它们包括由右和左T-DNA边界重复区框定的序列，这些序列可以包括用于选择转化的植物细胞的选择标记基因、克隆接头、克隆多接头或其它可充当用于植物细胞转化的基因的引入位点的序列。它们可以通过电穿孔直接转化到土壤杆菌细胞中(Holsters等人，(1978))，或通过直接DNA、化学介导的转化、或通过细菌接合或其他方法学引入。用作宿主细胞的土壤杆菌将会包含携带vir区的质粒。该vir区域是将T-DNA转移到植物细胞中所必需的。除了编码B.t.杀虫毒素蛋白或其变体的T-DNA区之外，土壤杆菌宿主细胞中可以存在另外的T-DNA区域。将如此转化的细菌细胞用于植物细胞的转化。可以有利地将植物外植体(例如，叶的碎片、茎的节段、根、以及原生质体或悬浮培养的细胞)与根癌土壤杆菌或发根土壤杆菌一起培养，以将DNA转移到植物细胞中。然后在植入合适的生长条件和培养基中后，可以从经感染的植物材料再生出整个植物，其中培养基可以含有用于选择经转化的植物细胞的抗生素或除草剂。然后可以测试如此获得的植物中是否存在插入DNA。

转化的细胞以常规方式在植物内部生长。它们可以形成生殖细胞并将转化的性状传递给后代植物。可以以正常方式栽培这样的植物，并将其与具有相同转化遗传因子或其他遗传因子的植物杂交。所得的杂交个体具有相应的表型性质，例如控制植物害虫摄食的能力。

在用于注射和电穿孔的那些情况下，质粒的构建没有特别的要求。可以使用普通质粒，例如包含所有期望转移到植物细胞中的基因的适当修饰的pUC衍生物。

插入到植物细胞中的重组多核苷酸的活性可以取决于与插入物相邻的内源植物DNA的影响。因此，另一个选择是利用已知是植物基因组中优良的插入位置的事件。参见例如WO 2005/103266 A1，涉及Cry1F和CrylAc棉花事件；主题B.t.杀虫毒素基因可以在那些基因组基因座中代替Cry1F或CrylAc插入物。根据本发明可以使用例如靶向同源重组。这种类型的技术是例如WO03/080809和相应公开的美国申请(USPA 20030232410)的主题，涉及使用锌指进行靶向重组。使用重组酶(例如cre-lox和flp-frt)也是本领域已知的。

在本发明的优选实施方案中，将用这样的基因转化植物，该基因中蛋白质编码区的密码子用法已针对植物被优化。参见例如美国专利号5,380,831，其通过引用并入本文。此外，有利地，将使用编码截短的毒素的植物。截短的毒素通常将编码全长毒素的约55％至约80％。创建用于植物的合成B.t.基因的方法是本领域已知的(Stewart 2007)。

另一个变量是选择标记的选择。对于具体标记的偏好属于本领域技术人员自由裁量，但是下述任何选择标记，连同本文未列出的任何其它可能用作选择标记的基因，均可以使用。这些选择标记包括但不限于：转座子Tn5(Aph II)的氨基糖苷磷酸转移酶基因，其编码对抗生素卡那霉素、新霉素和G418的抗性；以及编码对草甘膦耐受性的那些基因；潮霉素；甲氨蝶呤；膦丝菌素(双丙氨膦)；咪唑啉酮，磺酰脲类和三唑并嘧啶除草剂，如氯磺隆、溴苯腈、达拉邦等。这些基因的实例在Merlo(2002)中提供，其通过引用并入本文。

除了选择标记之外，可以使用报告基因。在某些情况下，可以使用报告基因而没有选择标记。报告基因是通常不向受体生物或组织提供生长优势的基因。报告基因通常编码可提供某些表型改变或酶性质的蛋白质。优选的报告基因是葡糖醛酸糖苷酶(GUS)基因。报告基因的其他例子在Merlo(2002)中提供。

不管使用何种转化技术，优选将该基因掺入基因转移载体，通过在基因转移载体中纳入植物启动子而使其适于在植物细胞中表达B.t杀虫毒素基因和变体。除了植物启动子之外，来自多种来源的启动子可以用于在植物细胞中高效地表达外源基因。例如，可以使用细菌来源的启动子，如章鱼碱合酶启动子，胭脂碱合酶启动子，甘露碱合酶启动子；病毒来源的启动子，如花椰菜花叶病毒的35S和19S启动子等。植物启动子包括但不限于核酮糖-1,6-二磷酸(RUBP)羧化酶小亚基(ssu)，β-伴大豆球蛋白启动子，菜豆蛋白启动子，ADH(醇脱氢酶)启动子，热休克启动子，ADF(肌动蛋白解聚因子)启动子和组织特异性启动子。启动子还可以含有可提高转录效率的某些增强子序列元件。典型的增强子包括但不限于ADH1-内含子1和ADH1-内含子6。可以使用组成型启动子。组成型启动子在几乎所有细胞类型和几乎所有时间中指导连续基因表达(例如肌动蛋白，泛素，CaMV 35S)。组织特异性启动子负责特定细胞或组织类型(例如叶或种子(例如玉米醇溶蛋白，油质蛋白，napin，ACP(酰基载体蛋白))中的基因表达，也可以使用这些启动子。还可以使用在植物发育的某一阶段中有活性的启动子，以及在特定植物组织和器官中有活性的启动子。这种启动子的实例包括但不限于根特异性、花粉特异性、胚胎特异性、玉米丝特异性、棉花纤维特异性、种子胚乳特异性、韧皮部特异性启动子等。

在某些情况下，可能需要使用诱导型启动子。诱导型启动子负责响应于特定信号的基因的表达，例如：物理刺激(例如热休克基因)；光(例如RUBP羧化酶)；激素(如糖皮质激素)；抗生素(如四环素)；代谢产物；和胁迫(例如干旱)。可以使用其它期望的在植物中起作用的转录和翻译元件，例如5'非翻译前导序列，RNA转录终止序列和多聚腺苷酸添加信号序列。许多植物特异性基因转移载体是本领域已知的。

本发明包括不全能(非全能)的植物细胞，不是繁殖材料(例如，在一些实施方案中，叶细胞，某些实施方案中排除种子细胞)、并且不能分化为全植物的植物细胞。本发明包括除了再生成整个植物以外的用途的植物细胞。例如，所述植物细胞可用于产生蛋白质(例如本发明的DIG-465蛋白质)。因此，本发明的植物细胞包括具有全能性以外的用途(即，某些本发明的细胞不可再生成整个植物)的植物细胞。然而，一些实施方案确实包括可以再生成整个植物的种子细胞和植物细胞。

另一种用于鉴定本主题发明的毒素和基因的方法是通过使用寡核苷酸探针。这些探针是可检测的核苷酸序列。可以借助适当的放射性标记使得这些序列可检测，或者可以如美国专利号6268132所述地那样使得这些序列固有地发生荧光。如本领域众所周知的，如果探针分子和核酸样品通过两个分子之间形成强碱基配对键而杂交，则可以合理地推定探针和样品具有相当大的序列同源性。优选地，杂交通过本领域熟知的技术在严格条件下进行，例如在Keller和Manak(1993)中所述。探针的检测提供了以已知方式确定杂交是否发生的手段。这种探针分析提供了用于鉴定本主题发明的毒素编码基因的快速方法。根据本发明用作探针的核苷酸区段可以使用DNA合成仪和标准程序合成。这些核苷酸序列也可以用作PCR引物来扩增本主题发明的基因。

如本文所用的，术语“严格条件”或“严格杂交条件”旨在表示这样的条件，在该条件下探针其靶序列杂交(退火)的程度可检测地大于与其他序列的杂交的程度(例如至少是背景的2倍以上)。严格条件是依赖于序列的，在不同的情况下会有所不同。通过控制杂交和/或洗涤条件的严格性，可以鉴定与探针100％互补的靶序列(同源探测)。或者，可以调整严格条件以允许序列中有一些错配，从而检测到较低程度的相似性(异源探测)。通常，探针长度小于约1000个核苷酸，优选长度小于500个核苷酸。

典型地，严格条件会是那些其中盐浓度不到约1.5M Na离子，通常约0.01至1.0MNa离子浓度(或其它盐)，处于pH 7.0至pH 8.3，且温度为用于短探针(例如10至50个核苷酸)的至少约30℃和用于长探针(例如大于50个核苷酸)的至少约60℃。也可以添加去稳定剂诸如甲酰胺实现严格条件。例示性低严格条件包括用30％至35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠)的缓冲溶液于37℃杂交并在1X至2X SSC(20x SSC＝3.0M NaCl/0.3M柠檬酸三钠)中于50℃至55℃清洗。例示性中等严格条件包括在40％至45％甲酰胺、1.0MNaCl、1％SDS中于37℃杂交并在0.5x至1x SSC中于55℃至60℃清洗。例示性高严格条件包括在50％甲酰胺、1M NaCl、1％SDS中于37℃杂交并在0.1x SSC中于60℃至65℃清洗。任选地，清洗缓冲液可包含约0.1％至约1％SDS。杂交持续时间一般小于约24小时，通常约4至约12小时。

特异性通常根据杂交后清洗而变化，关键因素是最终清洗溶液的离子强度和温度。对于DNA/DNA杂交体，热熔点(Tm)为50％的互补靶序列杂交至完全匹配的探针的温度(在限定的离子强度和pH下)。每有1％的错配，Tm降低约1℃；因此，可以调整Tm、杂交条件、和/或清洗条件以便于具有期望的同一性的序列退火。例如，如果寻找同一性>90％的序列的话，可以将Tm降低10℃。一般地，选择比特定序列和其互补物在限定离子强度和pH的Tm低约5℃的严格条件。然而，高严格条件可利用比Tm低1℃、2℃、3℃、或4℃的杂交和/或清洗；中等严格条件可利用比Tm低6℃、7℃、8℃、9℃、或10℃的杂交和/或清洗；而低严格条件可利用比Tm低11℃、12℃、13℃、14℃、15℃、或20℃的杂交和/或清洗。

Tm(以℃为单位)可以通过实验来测定，或者可以通过计算来估算。对于DNA-DNA杂交体，可以自Meinkoth和Wahl(1984)的方程来估算Tm：

Tm(℃)＝81.5℃+16.6(log M)+0.41(％GC)-0.61(％甲酰胺)-500/L；

其中M是单价阳离子的摩尔浓度，％GC是DNA中鸟苷和胞苷核苷酸的百分比，％甲酰胺是杂交溶液中甲酰胺的百分比，且L是杂交体以碱基对计的长度。

或者，Tm由下式(Beltz等，1983)记载。

Tm(℃)＝81.5℃+16.6(log[Na+])+0.41(％GC)-0.61(％甲酰胺)-600/L其中[Na+]是钠离子的摩尔浓度，％GC是DNA中鸟苷和胞苷核苷酸的百分比，％甲酰胺是杂交溶液中甲酰胺的百分比，且L是杂交体以碱基对计的长度。

使用该等方程、杂交和清洗组合物、及期望Tm，普通技术人员会理解，内在描述了杂交和/或清洗溶液的严格性的变化。如果期望错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液)的话，优选提高SSC浓度，使得可使用更高的温度。关于核酸杂交的广泛指导可见于Tijssen(1993)及Ausubel等(1995)。还可参见Sambrook等(1989)。

可以通过标准方法来实施Southern印迹上固定化DNA与放射性标记的基因特异性探针的杂交(Sambrook等，见上文)。用于标记多核苷酸探针的放射性同位素可以包括32P、33P、14C、或3H。可以通过分子生物学领域技术人员公知的数种方法任一来进行将放射性同位素掺入多核苷酸探针分子(参见例如Sambrook等，见上文)。一般地，可以在容许检测与要求保护的毒素编码基因具有同源性的靶序列的严格条件下进行杂交和后续清洗。对于双链DNA基因探针，杂交可以于比DNA组合物的Tm低20-25℃，在6X SSPE、5X Denhardt氏溶液、0.1％SDS、0.1mg/mL变性DNA中进行过夜[20X SSPE为3M NaCl、0.2M NaHPO4、和0.02M EDTA(乙二胺四乙酸钠盐)，100X Denhardt氏溶液为20gm/L聚乙烯吡咯烷酮、20gm/L Ficoll400型和20gm/L牛血清清蛋白(级分V)]。

通常可如下进行清洗：

(1)于室温在1X SSPE、0.1％SDS中进行15分钟两次(低严格清洗)。

(2)于Tm-20℃在0.2X SSPE、0.1％SDS中进行15分钟一次(中等严格清洗)。

对于寡核苷酸探针，杂交可以于比杂交体的Tm低10-20℃，在6X SSPE、5XDenhardt氏溶液、0.1％SDS、0.1mg/mL变性DNA中过夜。可以通过下式确定用于寡核苷酸探针的Tm(Suggs等，1981)。

Tm(℃)＝2(T/A碱基对的数目)+4(G/C碱基对的数目)

通常可如下进行清洗：

(1)于室温在1X SSPE、0.1％SDS中进行15分钟两次(低严格清洗)。

(2)于杂交温度在1X SSPE、0.1％SDS中进行15分钟一次(中等严格清洗)。

本领域技术人员会认识到，可以用过除放射性标记之外的手段使得用于杂交的探针分子以及探针和靶分子之间形成的杂交分子能够被检测到。

变体毒素.根据本发明有用的基因和毒素不仅包括所公开的截短序列，而且还包括保留本文具体示例的毒素的特征杀虫活性的全长序列、这些序列的片段、变体、突变体和融合蛋白。如本文所用的，术语基因的“变体”或“变化”是指编码相同毒素或编码具有杀虫活性的等效毒素的核苷酸序列。此外，如本文所使用的，术语“等效毒素”是指具有与所要求保护的毒素相同或基本上相同的针对目标害虫的生物活性的毒素。因此，要求保护的毒素的变体或变化形式将具有所要求保护的毒素的活性的至少约30％，优选至少约50％，更优选至少约70％，甚至更优选至少约80％。用于测量杀虫活性的方法是本领域公知的，并且在本文中举例说明。本文的“变体”旨在包括这样的蛋白质或多肽，其具有与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的氨基酸序列至少约60％，65％，优选约70％，75％，更优选约80％，85％，最优选约90％，91％，92％，93％，94％，95％，96％，97％，98％或99％相同的氨基酸序列。变体还包括由核酸分子编码的多肽，其在严格条件下与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37或39的核酸分子杂交。这样的变体通常将保留所要求的活性。变体包括由于诱变而在氨基酸序列上不同的多肽。本发明涵盖的变体蛋白质具有杀虫活性。

还可以设计变体蛋白质，其在一级氨基酸序列水平上不同，并且保留相同或相似的总体必需的三维结构、表面电荷分布等。参见例如美国专利号7,058,515；Larson等，(2002)；Crameri等，(1997)；Stemmer，W.P.C.(1994a)；Stemmer，W.P.C.(1994b)”Stemmer，W.P.C.(1995)；Crameri等人(1996a)；和Crameri等人(1996b)。

本发明的某些毒素已在本文中具体示例。由于这些毒素仅仅是本发明的毒素的示例，因此应当显见，本发明包括与所列举的毒素具有相同或相似的杀虫活性的变体或等效的毒素(和编码等效毒素的核苷酸序列)。等效毒素将与例示的毒素具有氨基酸同源性。氨基酸同一性通常大于60％，优选大于75％，更优选大于80％，更优选大于90％，并且可大于95％。氨基酸同源性在毒素的关键区域中是最高的，所述关键区域负责生物活性，或者参与决定三维构型，而三维构型最终负责生物学活性。在这方面，如果某些氨基酸取代发生在对活性不关键的区域中，或者为不影响分子的三维构型的保守氨基酸取代，则这些氨基酸取代是可接受的，并且可以预期。例如，氨基酸可以归入以下类别：非极性、不带电极性、碱性、和酸性。属于某一类别的氨基酸被属于相同类别的氨基酸替换的保守取代落入本发明的范围内，只要该取代不会实质上改变化合物的生物活性即可。表1提供了属于每一类别的氨基酸的实例列表

表1

氨基酸的类别和实例

氨基酸类别	氨基酸实例
		非极性侧链	Ala,Val,Leu,Ile,Pro,Met,Phe,Trp
非带电极性侧链	Gly,Ser,Thr,Cys,Tyr,Asn,Gln
		酸性侧链	Asp,Glu
碱性侧链	Lys,Arg,His
		β-分支侧链	Thr,Val,Ile
芳香侧链	Tyr,Phe,Trp,His

在一些情况下，也可以进行非保守取代。关键因素是这些取代不能显著降低毒素的生物活性。

本发明的优选的杀虫毒素蛋白质由与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37或39充分相同的核苷酸序列编码。“充分相同”是指氨基酸或核苷酸序列相比于利用标准参数由本文所述的比对程序之一分析过的参考序列具有至少约60％或65％的序列同一性，优选约70％或75％序列同一性，更优选约80％或85％序列同一性，最优选约90％，91％，92％，93％，94％，95％，96％，97％，98％或99％序列同一性。本领域技术人员将认识到，可以通过考虑密码子简并性、氨基酸相似性、阅读框定位等适当地调整这些值，来确定由两个核苷酸序列编码的蛋白质的相应同一性。

为了确定两个氨基酸序列或两个核酸序列的百分比同一性，为了最佳比较目的，对序列进行比对。两个序列之间的百分比同一性是这些序列享有的相同位置的数目的函数(即，百分比同一性＝相同位置的数量/位置总数(例如重叠位置)×100)。在一个实施方案中，两个序列具有相同的长度。两个序列之间的百分比同一性可以使用类似于以下描述的技术来确定，有或没有允许间隙。在计算百分比同一性，通常会计算精确匹配的数目。

可以使用数学算法来实现两种序列之间百分比同一性的确定。用于比较两条序列的数学算法的一个非限制性实例是Karlin和Altschul(1990)的算法，并根据Karlin和Altschul(1993)改良。这种算法被整合在Altschul et al.(1990)的BLASTN和BLASTX程序中。可以方便地使用BLAST搜索来鉴定核酸或蛋白质数据库中与检索序列同源(相似)的序列。可以使用BLASTN程序实施BLAST核苷酸检索(得分＝100，字长＝12)来鉴定与本发明要求保护的核酸分子具有同源性的核苷酸序列。可以使用BLASTX程序实施BLAST蛋白质检索(得分＝50，字长＝3)来鉴定与本发明要求保护的杀虫蛋白分子具有同源性的氨基酸序列。

为了获得带空位的比对用于比较目的，可以如Altschul et al.,(1997)中所述利用带空位的BLAST。或者，可以使用PSI-Blast来实施检测分子间远缘关系的迭代搜索(Altschul等，1997)。在利用BLAST、带空位的BLAST、和PSI-Blast程序时，可使用各程序(例如BLASTX和BLASTN)的缺省参数。参见www.ncbi.nlm.nih.gov。比对还可以通过检视而人工进行。

用于比较序列的数学算法的一个非限制性实例是ClustalW算法(Thompson等，1994)。ClustalW比较序列且比对整个氨基酸或DNA序列，如此能提供关于整个氨基酸序列或核苷酸序列的序列保守性的数据。ClustalW算法用于数种商品化DNA/氨基酸分析软件包，诸如Vector NTI程序套件(Invitrogen，Inc.，Carlsbad，CA)的ALIGNX模块。在用ALIGNX比对氨基酸序列时，可以方便地使用缺省设置，空位生成罚分10、空位延伸罚分0.1、和blosum63mt2比较矩阵。在用ALIGNX比对两条蛋白质序列之后，可以评估两条序列之间的百分比氨基酸相似性(一致性)或同一性。在用ALIGNX比对两条DNA序列时，可以方便地使用缺省设置，空位生成罚分15、空位延伸罚分6.6和swgapdnamt比较矩阵。在用ALIGNX比对两条DNA序列之后，可以评估两条序列之间的百分比同一性。

另一个可用于分析ClustalW比对的软件程序的非限制性实例是GeneDoc^TM(由KarlNicholas开发，http://iubio.bio.indiana.edu/soft/molbio/ibmpc/genedoc-readme.html)。GeneDoc^TM可以评估多种蛋白质之间的氨基酸(或DNA)相似性和同一性。

数学算法用于比较序列的另一个非限制性实例是Myers和Miller(1988)的算法。此类算法整合在wSTRETCHER程序中，该程序是wEMBOSS序列比对软件包(可在http://emboss.sourceforge.net/处访问)的一部分。STRETCHER使用利用线性空间的经典动力学编程算法的一种改良来计算两种序列的最佳全局比对。输入为标准比对文件。可以规定用于计算比对的替代矩阵、空位插入罚分和空位延伸罚分。在利用STRETCHER程序来比较核苷酸序列时，可以使用空位打开罚分16和空位延伸罚分4。用于比较DNA序列的评分矩阵文件为EDNAFULL。在用于比较氨基酸序列时，可以使用空位打开罚分12和空位延伸罚分2。用于比较蛋白质序列的评分矩阵文件为EBLOSUM62。

用于比较序列的数学算法的又一个非限制性实例是Needleman和Wunsch(1970)的算法，该算法整合在序列比对软件包GAP 10版和wNEEDLE(http://emboss.sourceforge.net/)中。可以使用下述参数使用GAP 10版来确定序列同一性或相似性：对于核苷酸序列，使用空位权重50和长度权重3，及nwsgapdna.cmp评分矩阵来求出％同一性和％相似性。对于氨基酸序列比较，使用GAP权重8和长度权重2，及BLOSUM62评分程序来确定％同一性或％相似性。wNEEDLE读取两个输入序列，沿着它们的整个长度找到最佳比对(包括空位)，并将它们的最佳全局序列比对写入文件。该算法使用动态编程方法，通过探索所有可能的比对并选择最佳者来保证比对是最佳的。读取评分矩阵，其含有用于每个可能的残基或核苷酸匹配的值。wNEEDLE找到具有最大可能得分的比对，其中比对的得分等于取自评分矩阵的匹配之和减去在比对序列中打开和延伸空位引起的罚分。替代矩阵及空位打开和延伸罚分由使用者规定。在比较氨基酸序列时，使用缺省空位打开罚分10、空位延伸罚分0.5、和EBLOSUM62比较矩阵。在使用wNEEDLE比较DNA序列时，使用空位打开罚分10、空位延伸罚分0.5、和EDNAFULL比较矩阵。

也可以使用等同的程序。“等同的程序”意指对于讨论的任何两种序列，与由ALIGNX、wNEEDLE、或wSTRETCHER生成的相应比对相比，生成具有相同核苷酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。％同一性为在报告的比对区(包括长度中的任何空位)上两种序列之间相同匹配的百分比，而％相似性为在报告的比对区(包括长度中的任何空位)上两种序列之间匹配的百分比。

毒素片段和等同物.保留示例毒素的杀虫活性的片段和等同物将落入本发明的范围内。此外，由于遗传密码的冗余，本文公开的氨基酸序列可以被各种不同的DNA序列编码。创建编码相同或基本相同的毒素的替代DNA序列完全在本领域技术人员能力范围之内。这些变体DNA序列落入本发明的范围内。如本文所用的，“基本上相同”的序列是指具有不会实质上影响杀虫活性的氨基酸取代，缺失，添加或插入的序列。保留杀虫活性的片段也包括在此定义中。

可以在本发明的杀虫蛋白和变体的氨基或羧基末端进行改变，导致保留生物活性的多肽。片段或生物活性部分包括这样的多肽片段，它们包含与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40中所示的氨基酸序列充分相同的氨基酸序列。δ内毒素蛋白的生物活性部分可以例如是这样的多肽，其长度为10、25、50、100或更多个氨基酸。这样的生物活性部分可以通过本领域熟知的重组蛋白质工程技术制备并评价杀虫活性。测定杀虫活性的方法是本领域熟知的。如本文所用，片段包含SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的至少8个连续氨基酸。然而，本发明涵盖其它片段，例如蛋白质中的任何大于约10、20、30、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100,1150或1200个氨基酸的片段，直到SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40的杀虫蛋白或变体蛋白的全长为止。

在本发明中还提供了具有改善的生物学活性或害虫谱、或能够控制抗性昆虫种群的片段。可以对Cry蛋白进行修饰以产生能更好地形成孔、因此具有更好的杀虫活性的片段。在三结构域Cry蛋白的情况下，结构域1由涉及在易感昆虫的中肠中形成孔的七个α-螺旋构成。具有改善活性的修饰的DIG蛋白可以设计为具有N-末端缺失，所述缺失发生在与结构域1的α螺旋1和α-螺旋2具有推测的同源性的区域中。

可利用蛋白酶直接获得这些毒素的活性片段。所要求的杀虫毒素的片段将包含至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、800、900、1000、1100或1200个连续氨基酸，或至多达到本发明全长杀虫毒素中存在的氨基酸的总数(例如对SEQ ID NO:2而言为625个氨基酸，或对SEQ ID NO:4而言为625个氨基酸)。

核心毒素和原毒素嵌合体.大部分苏云金芽孢杆菌δ-内毒素晶体蛋白分子由两个功能片段组成。蛋白酶抗性核心毒素是第一个区段，对应于蛋白质分子的大体上前半部分。该分子的大约C末端一半是第二个区段。为了本申请的目的，该第二个区段在本文中将被称为“原毒素区段”。原毒素区段被认为参与毒素晶体形成(Arvidson等，(1989))。完整的130kDa毒素分子被昆虫肠道中的蛋白酶快速加工成抗性核心区段。因此，通过减少毒素分子的蛋白酶加工(Haider等人，(1986))或通过降低毒素溶解度(Aronson et al.，(1991))，限制核心对昆虫的可及性，原毒素区段可以对毒素传递部分昆虫特异性。

已经报道了有利地连接在Cry1Fa和Cry1Ab的毒素结构域内的嵌合蛋白(美国专利号5,527,883)。文献报道了该领域中的其他成功案例。例如，在以下相关技术中报告了杂合δ-内毒素的构建。国际专利申请公布WO 95/30753公开了在用于荧光假单胞菌中生产的杂合苏云金芽孢杆菌δ-内毒素的构建，其中Cry1F的无毒性原毒素片段已经被美国专利5,128,130中所公开的Cry1Ac/Cry1Ab的无毒性原毒素片段替代。该专利还公开了用于在荧光假单胞菌中生产的杂合苏云金芽孢杆菌δ-内毒素的构建，其中CrylAc无毒性原毒素区段的一部分被相应的Cry1Ab的无毒性原毒素片段替代。美国专利号5,055,294公开了用于在荧光假单胞菌中生产的Cry1Ac(氨基酸残基1-466)和Cry1Ab(氨基酸残基466-1155)之间的特异性杂合δ-内毒素的构建。虽然上述专利公开了活性毒素片段内的杂合毒素的构建，但是没有关于杂合毒素的杀虫活性的具体细节。国际专利申请公开号WO 95/30752公开了用于在荧光假单胞菌中生产的杂合苏云金芽孢杆菌δ-内毒素的构建，其中Cry1C的无毒性原毒素区段被来自CrylAb的无毒性原毒素区段代替。上述应用进一步公开了杂合δ-内毒素的针对草地贪夜蛾的活性比亲本活性毒素Cry1C的活性提高。国际专利申请公开号WO 95/06730公开了一种杂合型苏云金芽孢杆菌δ-内毒素的构建，其组成为：Cry1E的结构域1和结构域2偶联于Cry1C的非毒性原毒素区段的结构域3。对烟草天蛾(对Cry1C和CrylE敏感)，草地贪夜蛾(对Cry1C敏感)和甘蓝夜蛾(对Cry1C敏感)进行的昆虫生物测定显示，该杂合Cry1E/Cry1C杂合毒素对烟草天蛾、草地贪夜蛾和甘蓝夜蛾有活性。生物测定结果表示为EC₅₀值(提供50％生长减少的毒素浓度)而不是LC₅₀值(提供50％死亡率的毒素浓度)。虽然用于生物测定的δ-内毒素是在苏云金芽孢杆菌中产生，但是仅使用了人工产生的δ-内毒素的活性区段，而不是苏云金芽孢杆菌市售制剂中存在的通常由苏云金芽孢杆菌产生的天然产生的晶体。生物测定结果表明，杂合CrylE/Cry1C晶体对草地贪夜蛾的LC₅₀值比天然Cry1C低1.5至1.7倍(即比后者活性更高)。该技术还公开了在Cry1Ab(结构域1和2)与Cry1C(结构域3和无毒性原毒素区段)之间的杂合苏云金芽孢杆菌δ-内毒素的构建，尽管没有给出关于该杂合毒素的活性或有用性的数据。

Lee等人(1995)报道了活性毒素区段内Cry1Ac和Cry1Aa之间的杂合苏云金芽孢杆菌δ-内毒素的构建。使用人工产生的杂合毒素的活性区段来检测敏感昆虫的刷状膜囊泡(BBMV)中的蛋白质相互作用。这些杂合毒素的生物活性未有报道。Honee等(1991)报道了CrylC(结构域1)和CrylAb(结构域2和3)之间的杂合δ-内毒素的构建以及反向的Cry1Ab(结构域1)和Cry1C(结构域2和3)之间的杂合体。这些杂合体没有显示对敏感昆虫的活性的显著增加。此外，发现Cry1C(结构域1)/Cry1Ab(结构域2和3)杂合毒素对蛋白酶降解高度敏感。Schnepf等人(1990)的报道公开了CrylAc杂合毒素的构建，其中结构域2的一小部分被相应的Cry1Aa区域代替，尽管没有观察到对敏感昆虫幼虫的活性的显著增加。

本主题发明的嵌合毒素包含B.t.毒素的全核心N-末端毒素部分，并且在毒素部分末端之外的某一点，该蛋白质过渡为异源原毒素序列。向异源原毒素区段的过渡可以大概在天然的毒素/原毒素接点处发生，或者可以保留天然原毒素的一部分(延伸超过毒素部分)，而向异源原毒素的过渡发生在其下游。例如，本主题发明的嵌合毒素可以具有修饰的Cry1Ca毒素的完整毒素部分，例如DIG-473或DIG-465的氨基酸1-628，以及异源原毒素区段(C末端的氨基酸629)。在优选的实施方案中，异源原毒素区段部分取自Cry1Ab。

本领域技术人员将理解，各种B.t.毒素，甚至在某一类别内的毒素，也将在长度上，以及从核心毒素部分向原毒素部分过渡的精确位置上有一定程度的差异。从核心毒素部分到原毒素部分的过渡通常发生在全长毒素的约50％至约60％处。本主题发明的嵌合毒素包括该核心N-末端毒素部分的全部范围，如IRDIG544.12杀虫毒素蛋白质的全长628个氨基酸。SEQ ID NO:15公开了编码DIG-465的DNA的1887个核苷酸的序列，其中5'末端的1887个核苷酸构成具有突变L57A(亮氨酸在氨基酸位置57代替丙氨酸)的Cry1Ca核心毒素区段的编码区，本发明的一个实施方案。SEQ ID NO:16公开了全长DIG-465多肽的628个氨基酸的序列，其中具有上述氨基酸取代的Cry1Ca的N末端核心部分。SEQ ID NO:23公开了编码DIG-473的DNA的1887个核苷酸的序列，其包含具有突变F596M(氨基酸位置596位上苯丙氨酸代替甲硫氨酸)的Cry1Ca的核心毒素区段的编码区，本发明的另一个主题。SEQ ID NO:24公开了全长DIG-473多肽的628个氨基酸的序列，其包含具有上述氨基酸取代的Cry1Ca的部分。

对于原毒素部分，天然Cry1Ab原毒素部分的全部范围自Cry1Ab全长蛋白质的毒素部分的末端起延伸至该分子的C末端止。注意该原毒素的最后约100至150个氨基酸，这是要包括在本发明的嵌合毒素中的最关键者。

因为Cry蛋白具有选择性杀虫活性，大多数Cry蛋白仅对有限范围的目标害虫有活性。因此，需要进一步改善Cry蛋白的生物活性属性。具有独特结合特征和作用模式的Cry蛋白质在用于扩大控制的昆虫害虫的范围或对付B.t.抗性的发生的策略中是有用的。

结构域III修饰.如本文所述，本发明的杀虫毒素是3结构域型毒素，包括结构域I、结构域II、和结构域III。结构域III结合某些类型的受体蛋白质，并且可能参与寡聚体毒素预孔的插入。已显示某些包含结构域III取代的杂合毒素对斜纹夜蛾(Spodoptera exigua)具有优异的毒性(de Maagd等，1996)，并且存在关于Cry毒素域互换的设计的指导(Knightet al.，2004)。

结构域I修饰.许多使用生物化学和分子方法的研究提供了关于Cry蛋白结合和插入昆虫中肠膜的决定因素的信息(综述见Piggot和Ellar，2007)。已经研究了来自Cry1A和Cry3A蛋白的结构域I在膜中插入和形成孔的能力。结构域I的α螺旋4和5在膜插入和孔形成中起关键作用(Walters等，1993，Gazit等人，1998；Nunez-Valdez等，2001)，有人提出其他螺旋像伞的肋条一样接触膜表面(Gazit等人，1998)。

α-螺旋3在某些情况下似乎是寡聚体预孔形成和毒性所必需的。一些α螺旋3突变体能够结合受体，但不形成寡聚体，对烟草天蛾无毒(参见Jimenez-Juarez等，2008)。然而，Cry3Aa1的蛋白水解活化形式缺乏α螺旋1、2和3(Carroll等，1997)。

α螺旋1在受体结合后被除去。Gomez等人(2002)发现，BBMV受体结合时形成的Cry1Ab寡聚体缺乏结构域I的α螺旋1部分。另外，Soberon等(2007)已经显示，Cry1Ab和Cry1Ac的N末端缺失突变体——它们在三维Cry结构上缺少包含α-螺旋1的约60个氨基酸，能够在没有钙粘蛋白结合的情况下将分子量约60kDa的单体组装到预孔中。据报道，这些N末端缺失突变体对抗性昆虫幼虫具有活性。此外，Diaz-Mendoza等(2007)描述了保留对地中海玉米螟(Sesamia nonagrioides)的活性的43kDa和46kDa的Cry1Ab片段。证实这些片段包括116至423的氨基酸残基；然而，确切的氨基酸序列未被阐明，并且这些蛋白水解片段的活性机制是未知的。Gomez等人(2002)，Soberon等人，2007和Diaz-Mendoza等(2007)的结果与Hofte等(1986)的结果相反，后者报道了从Cry1Ab的N末端缺失36个氨基酸导致杀虫活性的丧失。

抗毒素抗体.使用本文提供的教导，可以从苏云金芽孢杆菌分离株和/或DNA文库衍生等效毒素和/或编码这些等效毒素的基因。获得本发明的杀虫毒素的方法有许多。例如，对本文公开和要求保护的杀虫毒素有免疫反应性的抗体可用于从蛋白质混合物中鉴定和分离其它毒素。具体地说，可以针对毒素的最恒定部分和最不同于其它B.t毒素的部分生成抗体。然后可以使用这些抗体通过例如免疫沉淀、酶联免疫吸附测定(ELISA)或免疫印迹(western印迹)来特异性鉴定具有特征活性的等效毒素。针对本文公开的毒素或等效毒素或这些毒素的片段的抗体可以使用本领域的标准程序容易地制备。然后可以从产生毒素的微生物获得编码这些毒素的基因。

一旦已经分离了B.t.杀虫毒素，可以通过本领域公知的常规方法产生对毒素特异性的抗体。在几周或几个月时间内重复注射选定的宿主可引起免疫应答并导致显著的抗Bt毒素血清滴度。优选的宿主是哺乳动物物种，更优选的物种是兔、山羊、绵羊和小鼠。从这样经免疫的动物抽取的血液可以通过惯常的方法进行处理以获得与B.t.杀虫毒素具有反应性的抗血清(多克隆抗体)。然后可以根据本领域已知的技术，通过吸附至毒素对抗血清进行亲和纯化。经过亲和纯化的抗血清可以通过使用本领域已知的方法分离抗血清中的免疫球蛋白级分来进一步纯化。结果得到的材料将是与B.t.杀虫毒素有反应性的免疫球蛋白的异质群体。

抗-B.t.毒素抗体也可以通过制备半合成免疫原来产生，半合成免疫原由B.t.杀虫毒素的合成肽片段以及与之缀合的免疫原性载体构成。许多用于制备肽片段的方案和仪器是本领域公知的。许多合适的免疫原性载体如牛血清白蛋白(BSA)或匙孔血蓝蛋白也是本领域熟知的，偶联免疫原和载体蛋白的技术同样是本领域熟知的。一旦构建了半合成免疫原，制备针对B.t.杀虫毒素片段的特异性抗体的程序与用于制备与天然B.t.毒素反应的抗体相同。

使用纯化的B.t.杀虫毒素容易制备抗-B.t.毒素单克隆抗体(MAb)。生产MAb的方法已经实践了15年以上，是本领域普通技术人员所熟知的。用佐剂中的纯化B.t.杀虫毒素反复腹膜内或皮下注射在大多数动物中将会引起免疫应答。从动物中取出超免疫B淋巴细胞，并与能够无限培养的合适的融合伴侣细胞系融合。优选的其B淋巴细胞可能被超免疫并用于生产MAb的动物是哺乳动物。更优选的动物是大鼠和小鼠，最优选的是BALB/c小鼠株系。

许多哺乳动物细胞系是用于产生杂交瘤的合适的融合伴侣。许多这样的细胞系可从美国典型培养物保藏中心(ATCC，Manassas，VA)和商业供应商获得。优选的融合伙伴细胞系衍生自小鼠骨髓瘤，最优选 Friendly骨髓瘤-653细胞系(Ventrex，Portland，ME)。一旦融合，将所得的杂交瘤在选择性生长培养基中培养1至2周。有两种众所周知的选择体系可用于从混合的杂交瘤培养物中淘汰未融合的骨髓瘤细胞或骨髓瘤细胞间的融合物。选择体系的选择取决于被免疫的小鼠株系和使用的骨髓瘤融合伴侣。可以使用Taggart和Samloff(1983)描述的AAT选择体系；然而，由Littlefield(1964)描述的HAT(次黄嘌呤、氨基蝶呤、胸苷)选择体系是优选的，因为其与上述优选的小鼠株系和融合伴侣的相容性。然后对用过的培养基筛选免疫特异性MAb的分泌。酶联免疫吸附测定(ELISA)程序最适合此目的；但调适用于大量筛选的放射免疫测定也是可以接受的。可以实施多次筛选，这些筛选被设计为连续地减少可考虑的无关或不太理想的培养物的数目。对于分泌与Bt杀虫毒素反应的MAb的培养物，可以筛选与已知的B.t.杀虫毒素的交叉反应性。对于优先结合优选的B.t.杀虫毒素的MAb，可以使用市售的测定法确定其同种型。优选的MAb是IgG类，更优选的MAb是IgG1和IgG2a亚型。

分泌优选的MAb的杂交瘤培养物可以进行多次亚克隆以建立单克隆性和稳定性。用于亚克隆真核非贴壁细胞培养物的众所周知的方法包括有限稀释、软琼脂糖和荧光激活细胞分选技术。在每次亚克隆之后，优选对所得培养物重新测定抗体分泌和同种型，以确保已建立了稳定的优选的分泌MAb的培养物。

抗-Bt毒素抗体可用于各种检测本发明所要求保护的B.t.杀虫毒素及其变体或片段的方法。众所周知，用报告基团标记的抗体可用于鉴定多种环境中抗原的存在。数十年来，用放射性同位素标记的抗体已经在放射免疫测定中被用于以极高的精度和灵敏度鉴定各种生物液体中抗原的存在。更近时候，酶标记的抗体已经在ELISA测定中用来替代放射性标记的抗体。此外，可以将针对本发明的B.t.杀虫毒素的免疫反应性抗体结合到固定物质诸如聚苯乙烯孔或颗粒，并用于免疫测定中以确定B.t.毒素是否存在于测试样品中。

在一个优选实施方案中，杀虫蛋白或变体通过包含表达本发明的毒素的核酸序列的转基因植物口服递送。本发明提供了一种生产抗虫转基因植物的方法，包括将本发明的核酸分子引入植物中，其中毒素可以在转基因植物中以有效量表达以控制昆虫。在非限制性实例中，一种基本克隆策略可以是将全长或修饰的Cry编码序列(CDS)亚克隆到植物表达质粒中NcoI和SacI限制性位点处。使用例如技术或标准限制酶片段克隆程序将所得的含有处于植物表达元件(如植物可表达启动子、3'末端转录终止子和多聚腺苷酸添加决定簇等)控制下的适当Cry编码区的植物表达盒亚克隆到二元载体质粒中。如果使用技术，则可以用LR Clonase^TM(Invitrogen)将全长和修饰的基因植物表达盒重组到二元植物转化质粒中。当质粒存在于大肠杆菌和土壤杆菌细胞中时，使用具有赋予抗生素壮观霉素抗性的细菌基因的二元植物转化载体是方便的。使用含有在期望的宿主植物中有功能的植物可表达的选择标记基因的二元载体质粒也是方便的。植物可表达的选择标记基因的实例包括但不限于编码对抗生素卡那霉素、新霉素和G418的抗性的转座子Tn5(Aph II)的氨基糖苷磷酸转移酶基因，以及编码对草甘膦、潮霉素、甲氨蝶呤、膦丝菌素(双丙氨膦)、咪唑啉酮、磺酰脲类和三唑并嘧啶除草剂如氯磺隆，溴苯腈，达拉邦等的耐受性的那些基因。

或者，通过土壤杆菌操作领域技术人员熟知的标准分子生物学方法从候选土壤杆菌分离株制备质粒DNA，对其进行限制性消化指纹图谱作图，分析含有DIG-465，DIG-473，DIG-468，DIG-483，DIG-462，DIG-463，DIG-464，DIG-466，DIG-467，DIG-469，DIG-474，DIG-482，DIG-485，DIG-487，IRDIG544.8，IRDIG544.9，IRDIG544.11或IRDIG544.12基因插入物的二元植物转化载体的质粒结构。

通过土壤杆菌介导的转化方法获得转化植物的领域中的技术人员将理解，可以使用除Z707S之外的其他土壤杆菌菌株，并且菌株的选择可以取决于待转化的宿主植物物种的身份。

以下是举例说明实施本发明的规程的实施例。这些实施例不应被解释为限制性。除非另有说明，所有百分数均以重量计，所有溶剂混合物的比例均以体积计。本文提及或援引的所有专利，专利申请，临时申请和出版物通过提述整体并入本文，以其与本说明书的明确教导无矛盾为限。除非另有明确说明或暗示，本文所用术语“一”和“该”表示“至少一”。

实施例1

B.t.杀虫蛋白编码序列的植物优化版本的设计

设计并合成了具有植物密码子偏倚的DNA序列，用以在转基因单子叶植物和双子叶植物中产生杀虫蛋白。根据从GenBank存储的序列中获得的706个蛋白质编码序列(CDS)计算得到了玉米(Zea mays L.)的密码子使用表。从网站http://www.kazusa.or.jp/codon/的数据下载烟草(Nicotiana tabacum，1268CDS)、卡诺拉(Brassica napus，530CDS)，棉花(Gossypium hirsutum，197CDS)，和大豆(Glycine max；约1000CDS)的密码子使用表。，计算一个偏倚的密码子组，该组包含玉米数据组和双子叶植物数据组二者共有的被频繁使用的密码子，这些密码子具有合适的加权平均相对量，该密码子组是在省略掉任何使用率小于该氨基酸在任一植物类型中的总密码子使用率的约10％的冗余密码子之后计算的。为了得到编码杀虫蛋白质的植物优化序列，对杀虫蛋白DNA序列进行密码子取代，使得得到的DNA序列的总体密码子组成符合植物优化的密码子偏倚表。对序列进行进一步精修以消除不期望的限制酶识别位点、潜在的植物内含子剪接位点、长段的A/T或C/G残基，以及其它可能干扰编码区在植物细胞中的RNA稳定性、转录或翻译的基序。进行其他改变以引入所需的限制酶识别位点，并消除长的内部开放阅读框(+1以外的框)。这些变化都是在保留植物偏倚的密码子组成这一约束之下进行的。为了完成设计，在编码区的3'末端添加一个以全部6种开放阅读框编码翻译终止密码子的序列，并在序列的5'和3'末端添加适当的限制性识别位点。设计出的序列由商业供应商(DNA2.0，Menlo Park，CA)合成。有关合成基因生产的其他指导可以在例如WO 97/13402和美国专利5,380,831中找到。

编码本发明的DIG蛋白质的植物优化的DNA序列(SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38和40)作为SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37和39公开。包含SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37和39中公开的序列的DNA分子由商业实体(DNA2.0)合成性组装。

实施例2

编码杀虫毒素的表达质粒的构建和细菌宿主中的表达

使用标准克隆方法构建荧光假单胞菌(Pf)表达质粒，所述质粒被工程改造以产生由植物优化编码区编码的DIG-465(SEQ ID NO:16)、DIG-473(SEQ ID NO:24)、DIG-468(SEQID NO:2)、DIG-483(SEQ ID NO:4)、DIG-462(SEQ ID NO:10)、DIG-463(SEQ ID NO:12)、DIG-464(SEQ ID NO:14)、DIG-466(SEQ ID NO:18)、DIG-467(SEQ ID NO:20)、DIG-469(SEQID NO:22)、DIG-474(SEQ ID NO:26)、DIG-482(SEQ ID NO:28)、DIG-485(SEQ ID NO:6)和DIG-487(SEQ ID NO:8)蛋白。限制性内切核酸酶得自New England BioLabs(NEB；Ipswich，MA)，T4DNA连接酶(Invitrogen Corporation，Carlsbad，CA)用于DNA连接。

基本克隆策略包括将DIG-465，DIG-473，DIG-468，DIG-483，DIG-462，DIG-463，DIG-464，DIG-466，DIG-467，DIG-469，DIG-474，DIG-482，DIG-485或DIG-487毒素编码序列(CDS)亚克隆到pDOW1169的限制性位点如SpeI和XhoI处，由此将其置于来自质粒pKK223-3(PL Pharmacia，Milwaukee，WI)的Ptac启动子和rrnBT1T2终止子的表达控制下。pDOW1169是一种低拷贝质粒，具有RSF1010复制起点、pyrF基因、和核糖体结合位点，之后是限制酶识别位点，其中可以引入含有蛋白质编码区的DNA片段(美国专利申请US20080193974)。将该表达质粒通过电穿孔转化入DC454(一种具有突变ΔpyrF和lsc::lacIQI的近野生型荧光假单胞菌菌株)或其衍生物，在SOC-大豆水解产物培养基中回收，并且在选择性培养基(缺乏尿嘧啶的M9葡萄糖琼脂，Sambrook等人，同上)上铺板。微生物操作的细节可以在Squires，C.H.等人，(2004)，美国专利申请20060008877，美国专利申请20080193974，和美国专利申请20080058262中公开，其通过引用并入本文。通过限制性消化小提质粒DNA来验证菌株。

摇瓶中的生长和表达分析.通过摇瓶培养的携带表达构建体的荧光假单胞菌来生产DIG-465，DIG-473，DIG-468，DIG-483，DIG-462，DIG-463，DIG-464，DIG-466，DIG-467，DIG-469，DIG-474，DIG-482，DIG-485或DIG-487毒素，用于表征和昆虫生物测定。种子培养物在补充有1％葡萄糖和微量元素的M9培养基中生长，用种子培养物接种50mL含5％甘油的限定基本培养基(Teknova Cat.#3D7426，Hollister，CA)。30℃振荡初始温育24小时后，通过加入异丙基-β-D-1-硫代吡喃半乳糖苷(IPTG)，诱导Ptac启动子驱动的杀虫蛋白毒素基因表达。在诱导时和诱导后的不同时间对培养物进行取样。通过600nm处的光密度(OD₆₀₀)度量细胞密度。其它适用于荧光假单胞菌生长的培养基也可以使用，例如Huang等人，2007和美国专利申请20060008877中所述。

摇瓶样品的细胞分级和SDS-PAGE分析.在每个采样时间，将0.5mL等分试样以14000xg离心5分钟。将细胞沉淀物在-80℃冷冻。使用BugBuster MasterMix( Darmstadt,Germany)从冷冻摇瓶细胞沉淀样品产生可溶性和不溶性级分。将每个细胞沉淀重新悬浮于0.5mL BugBuster Master Mix^TM溶液中，并在室温下震荡温育30分钟。使用具有0.1mm玻璃珠的珠磨(beadbeater)将样品裂解3分钟。将裂解物以14,000rpm离心5分钟，并回收上清液作为可溶性级分。然后将沉淀(不溶性级分)重悬浮于等体积的提取缓冲液(8M尿素，0.5M NaCl，25mM NaPO 4，pH10.4)中。

将样品与含有二硫苏糖醇(DTT)的2X NuPAGE Tris甘氨酸SDS样品缓冲液(Invitrogen，Carlsbad，CA)1:1混合并煮沸5分钟，然后加载到Novex4-20％Tris甘氨酸SDS聚丙烯酰胺凝胶(Invitrogen，Carlsbad，CA)上。在推荐的Tris-甘氨酸缓冲液中进行电泳。根据制造商(Bio-Rad Inc.，Hercules，CA)的方案，用Bio-Safe考马斯染色剂染色凝胶，并使用GE Typhooon系列成像系统(Pittsburgh，PA)成像。

包涵体制备.从产生不溶性B.t.杀虫蛋白[如SDS-PAGE和MALDI-MS(基质辅助激光解吸/电离质谱)所证实]的荧光假单胞菌发酵物获得细胞，用这些细胞制备Cry蛋白包涵体(IB)。荧光假单胞菌发酵物离心沉淀在37℃水浴中解冻。将细胞在裂解缓冲液[50mM TrispH7.5，200mM NaCl，20mM EDTA二钠盐(二乙胺四乙酸)、1％Triton X-100和5mM二硫苏糖醇(DTT)，在使用前加入5mL/L的细菌蛋白酶抑制剂混合物(P8465Sigma-Aldrich，St.Louis，MO)]中再悬浮至25％w/v。使用手持式均化器在最低设置值(Tissue Tearor，BioSpecProducts，Inc Bartlesville，OK)将细胞悬浮。通过用金属药匙搅拌将溶菌酶(Sigma-Aldrich L7651 25mg，来自鸡卵白)加入到细胞悬浮液中，并将悬浮液在室温下温育1小时。将悬浮液在冰上冷却15分钟，然后使用Branson Sonifier250(两次1分钟，50％占空比，30％输出)进行超声处理。通过显微镜检查细胞裂解。如果需要，另加25mg溶菌酶，重复温育和超声处理。当通过显微镜确认了细胞裂解时，将裂解物以11,500×g离心25分钟(4℃)以形成IB沉淀，弃去上清液。将IB沉淀物用100ml裂解缓冲液悬浮，用手持式混合器匀浆并如上进行离心。IB沉淀通过反复的悬浮(在50mL裂解缓冲液中)、洗涤、匀浆、超声处理和离心，直到上清液变得无色，并且IB沉淀物变得坚实且呈灰白色。为了最终洗涤，将IB沉淀悬浮于含有2mM EDTA的无菌过滤(0.22μm)蒸馏水中，并离心。将最终的沉淀悬浮于含有2mMEDTA的无菌过滤蒸馏水中，并以1mL等分试样在-80℃下储存。

IB制备物中蛋白质的SDS-PAGE分析和定量如下进行：解冻1份1mL的IB沉淀，并用无菌过滤过的蒸馏水稀释1:20。然后将稀释的样品与4X还原性样品缓冲液[250mM Tris，pH6.8，40％甘油(v/v)，0.4％溴苯酚蓝(w/v)，8％SDS(w/v)和8％β-巯基乙醇(v/v)]，并加载到用1X Tris/甘氨酸/SDS缓冲液(BioRad)运行的4-20％Tris-甘氨酸、12+2孔凝胶(Invitrogen)上。在200伏下跑凝胶60分钟，然后用考马斯蓝(50％G-250/50％R-250，溶于45％甲醇，10％乙酸)染色，并用含7％乙酸，5％甲醇的蒸馏水脱色。通过将条带的光密度值与在相同凝胶上跑胶的牛血清白蛋白(BSA)样品进行比较来定量靶标条带，用以产生标准曲线。

包涵体的溶解。将来自Pf克隆的含有DIG-465、DIG-473、DIG-468、DIG-483、DIG-462、DIG-463、DIG-464、DIG-466、DIG-467、DIG-469、DIG-474、DIG-482、DIG-485或DIG-487蛋白的6mL包涵体悬液在Eppendorf5415C型离心机上以最高设置(约14,000x g)离心，以使包涵体沉淀。在50mL锥形管中，除去储液上清液，并用25mL 100mM碳酸钠缓冲液(pH 11)代替。使用移液器使悬浮液重新悬浮，并涡旋以混合完全。将管置于轻轻摇晃的平台上4℃过夜以提取靶蛋白。提取物在4℃下以30,000×g离心30分钟，所得上清液使用Amicon Ultra-15再生纤维素离心过滤装置(30,000分子量截留；Millipore)浓缩5倍。然后使用一次性PD-10柱(GE Healthcare，Piscataway，NJ)将样品缓冲液变为10mM CAPS[3-(环己氨基)1-丙磺酸]pH10。

凝胶电泳.将浓缩的提取物在含有5mM二硫苏糖醇作为还原剂的样品缓冲液(Invitrogen)中稀释1:50，并在95℃下加热4分钟，准备好用于电泳。将样品加载在4-12％凝胶的重复的泳道中，同时加入0.2至2μg/泳道的5个BSA标准品(用于生成标准曲线)。使用MOPS SDS运行缓冲液(Invitrogen)施加200V电压，直到跟踪染料到达凝胶底部。凝胶用含45％甲醇、10％乙酸的0.2％考马斯蓝G-250中染色，然后脱色，首先用45％甲醇，10％乙酸短暂脱色，然后用7％乙酸、5％甲醇直到背景清除。脱色后，用Biorad Fluor-S MultiImager扫描凝胶。使用该仪器的Quantity One v.4.5.2软件获得背景扣减的染色蛋白质条带体积，并产生BSA标准曲线，用于计算DIG-465，DIG-473，DIG-468，DIG-483，DIG-462，DIG-463，DIG-464，DIG-466，DIG-467，DIG-469，DIG-474，DIG-482，DIG-485或DIG-487蛋白在储液中的浓度。

将DIG-465，DIG-473，DIG-468，DIG-483，DIG-463，DIG-464，DIG-466，DIG-467，DIG-469，DIG-474，DIG-482，DIG-485和DIG-487的表达水平在荧光假单胞菌细菌细胞中表达时的表达水平与截短的Cry1Ca(DIG-462)的表达水平进行比较。截短的Cry1Ca(DIG-462)以约1g/l表达，而DIG-473以约0.5g/l表达。DIG-465的表达是截短的Cry1Ca的表达的约5倍，4.9g/l。这些体外结果表明，L57A突变导致截短的Cry1Ca蛋白的更大表达。

实施例3

在荧光假单胞菌中产生的DIG蛋白质的杀虫活性

B.t.杀虫毒素DIG-462，DIG-463，DIG-464，DIG-465，DIG-466，DIG-467，DIG-468，DIG-469，DIG-470，DIG-473和DIG-474被证明对鳞翅目物种，包括小菜蛾(DBM；Plutellaxylostella(Linnaeus))和秋粘虫(FAW，Spodopterafrugiperda(Smith))有活性。

样品制备和生物测定.将10mM CAPS pH10中的包涵体制备物在10mMCAPS，pH10中适当稀释，所有生物测定均包含由该缓冲液组成的对照处理，用作对死亡率或生长抑制的背景检查。

通过凝胶电泳估计生物测定缓冲液中的蛋白质浓度，使用BSA产生用于凝胶光密度测定的标准曲线，光密度使用BioRad成像系统(Fluor-SMultiImager，Quantity One软件版本4.5.2)测量。用基于考马斯蓝的染色剂染色凝胶基质中的蛋白质，并在阅读前脱色。

用人工昆虫饵食喂养的新生鳞翅目幼虫进行生物测定来测试纯化的蛋白质的杀虫活性。从由养虫饲养商(Benzon Research Inc.，Carlisle，PA)维持的群落获得的卵孵出DBM和FAQ幼虫。从来自专有群落(Dow AgroSciencesLLC，Indianapolis，IN)的卵孵化rFAW的幼虫。

这些生物测定在专门设计用于昆虫生物测定的128孔塑料托盘(C-DInternational，Pitman，NJ)中进行。每个孔含有1.0mL多物种鳞翅目饵食(SouthlandProducts，Lake Village，AR)。通过移液器将40μL等份的蛋白质样品施加到每个孔的1.5cm²的饵食表面(26.7μL/cm²)。Cry蛋白浓度计算为每平方厘米(cm²)孔中表面积的DIG蛋白的量(ng)。将经处理的托盘保持在通风橱中，直到饵食表面上的液体蒸发或被吸收到饵食中。

在破壳后几个小时内，用湿润的骆驼毛刷拾取个体幼虫，并将其放置在处理的饵食上，每孔一只幼虫。然后将染虫的孔用粘性透明塑料片密封，塑料片通有气孔以允许气体交换(C-D International，Pitman，NJ)。生物测定托盘在受控的环境条件(28℃，～60％相对湿度，16:8[光:暗])下保持5天，然后记录暴露于每个蛋白质样品的昆虫总数、死虫数、以及存活昆虫的重量。计算每次处理的百分比死亡率和生长抑制百分比。生长抑制(GI)计算如下：

GI＝[1-(TWIT/TNIT)/(TWIBC/TNIBC)]

其中TWIT是处理中昆虫的总重量，

TNIT是处理中昆虫的总数

TWIBC是背景检查(缓冲液对照)中的昆虫的总重量，和

TNIBC是背景检查中的昆虫总数(缓冲液对照)。

在DBM生物测定中，测试了10和300ng/cm²的DIG-462、DIG-463、DIG-464、DIG-465、DIG-466、DIG-467、DIG-468、DIG-469、DIG-470、DIG-471、DIG-472、DIG-473和DIG-474对该种昆虫的作用。以1X和5X稀释率的DIG-462，DIG-465，DIG-473的包涵体制剂测试FAW。比较死亡率百分比和生长抑制结果。

对于DIG-462，DIG-463，DIG-464，DIG-465，DIG-466，DIG-468，DIG-469，DIG-473和DIG-474处理，在300ng/cm²下的死亡率为100％(表2和表3)。对于DIG-465和DIG-473处理，生长抑制在10ng/cm²下为70-90％的生长抑制，在300ng/cm²下为100％的生长抑制(表2)。

表2

DIG-462，DIG-465和DIG-473蛋白质在DBM上的生物测定测试结果，测量死亡率和生长抑制

蛋白质	死亡率	生长抑制
			DIG-462	+++	++++
DIG-465	++	++++
			DIG-473	+++	++++

对于死亡率，++＝10ng/cm²下0-20％，300ng/cm²下100％；+++＝10ng/cm²下30-60％，300ng/cm²下100％。对于生长抑制，++++＝10ng/cm²下70-90％的生长抑制，且300ng/cm²下100％的生长抑制。

表3

蛋白质突变体的生物测定在10ng/cm²和300ng/cm²下对DBM测试

对于所有处理，Cry1Ca核心毒素(DIG-462)、DIG-465和DIG-473蛋白对FAW幼虫的生长抑制被确定为>40％(表4)。蛋白质以全强度测试，并用缓冲液(10mM CAPS，pH10)稀释5倍。

表4

DIG-462，DIG-465和DIG-473对FAW的百分比生长抑制

蛋白质	稀释度	％生长抑制
			DIG-462	1X	43
DIG-462	5X	47
			DIG-465	1X	81
DIG-465	5X	58
			DIG-473	1X	56
DIG-473	5X	48
			缓冲液	1X	0

评估纯化蛋白质的DBM活性和对胰凝乳蛋白酶消化的敏感性。一个预料之外的惊人发现是，DIG-473对胰凝乳蛋白酶切割具有抗性，同时具有与DIG-462相同的对DBM的效力。这与Cry1Ca核心(DIG-462)和DIG-465蛋白相反，此二者在体外均对胰凝乳蛋白酶切割敏感(表5)。

表5

具有针对DBM的活性的蛋白质(DIG-462为标准)和蛋白质对胰凝乳蛋白酶切割的抗性。

实施例4

欧洲玉米螟(ECB)、西南玉米螟(SWCB)、和南方粘虫(SAW)生物测定

生物测定在32孔测试盘中进行。向每个孔中加入约5mL的2％水琼脂溶液，使琼脂完全固化。

植物大约3周龄，并在T₁代进行测试。完成了T₁叶材料的三个重复。切下一片叶子(1”×0.5”长方形)，并放置在托盘的单个孔中。每个孔都侵染了ECB、Cry1Fa、rECB或SWCB的10只昆虫幼虫(通常少于24小时龄)。对于SAW，每孔侵染5只昆虫幼虫。来自B104近交系的基于种子的植物和黄色荧光蛋白(YFP)转化植物作为阴性对照。

然后将染虫的孔用粘性透明塑料片密封，塑料片通有气孔以允许气体交换(C-DInternational，Pitman，NJ)。将托盘放置在Conviron培养箱中，并保持在28℃(16:8h光照:黑暗，60％RH)3天，之后记录每片叶片的损伤总量(0％、5％、10％、15％、25％、50％、75％损伤，等等，直至100％)。

当ECB和Cry1Fa抗性ECB(rECB)昆虫幼虫暴露于含有截短的Cry1Ca修饰蛋白质的植物时，由该昆虫引起的摄食损伤减少。当在饵食生物测定中测试修饰的Cry1Ca时，其中纯化的全长Cry1Ca被放置在人造昆虫饵食之上，并且让个体昆虫进食含有毒素的饵食，发现修饰的Cry1Ca对ECB和rECB无活性。然而，当在玉米中表达浓度>120ng/cm²时，植物中Cry1Ca的表达针对由ECB，特别是rECB引起的进食损伤提供意想不到的保护。

表6

IRDIG544.12T₁玉米饲喂欧洲玉米螟(ECB)和Cry1Fa抗性ECB(rECB)时的生物测定结果

当西南玉米螟(SWCB)和南方粘虫(SAW)昆虫幼虫暴露于含有截短的Cry1Ca修饰蛋白[蛋白表达范围为140-340ng/cm²]的植物时，观察到由二者引起的摄食损伤减少(表7)。平均表达为210ng/cm²，标准偏差为35。

表7

IRDIG544.12T₁玉米植物饲喂给西南玉米螟(SWCB)和南方粘虫(SAW)时的生物测定

植物名	SWCB平均损伤	SAW平均损伤
			112726[1]-015.AJ001.047	2	3.0
112726[1]-015.AJ001.030	4	3.0
			112726[1]-015.AJ001.019	1	1.3
112726[1]-015.AJ001.034	2	2.0
			YFP阴性对照	98.3	94.3
YFP阴性对照	93.3	62.5
			YFP阴性对照	100	27.5
YFP阴性对照	92.7	67.5
			YFP阴性对照	97.7	30.0
YFP阴性对照	100	45.0
			B104	98.3	94.3
B104	100	91.7
			B104	100	97.0
B104	65	70.0
			B104	100	86.7

玉米螟的田间试验在两个地点进行：一个在美国印第安纳州(IN)，另一个在美国密西西比州(MS)。每种处理测试了多个构建体和事件。Cry1Ab和Cry1F作为ECB试验中的阳性对照。无效植物(null)作为阴性对照。

为了评估ECB功效，每个植物在V6-V7阶段植物的叶轮中接受了10只第二龄的ECB幼虫。在MS，也用西南玉米螟(SWCB)二龄幼虫人工侵染V9玉米的叶轮(每株植物22只幼虫)。所使用的ECB和SWCB均从Benzon实验室获得。在这两个ECB试验中，均在侵染后2周对植物进行叶面损伤评估(Guthrie 1-9量表)(Guthrie等，1960)，其中1为无明显损伤，9为大部分叶有长的损害(表8)。在MS SWCB试验中，在评估叶轮后4-5天评估植物的茎损伤和活昆虫数。收集的数据包括每条茎上孔道的数量，孔道的长度和活幼虫/蛹数。

表8

玉米螟评分标准(叶轮损伤)

分数	标准
		1	没有可见的叶损伤，或者在少数叶上有少量穿孔型损伤
2	少数叶上有少量穿孔型损伤
		3	若干叶上有普遍的穿孔损伤
4	若干叶上有穿孔和细长的损害
		5	若干叶上有细长的损害
6	若干叶上有细长的损害(约1英寸).
		7	在一半的叶上普遍有长的损害
8	在2/3的叶上普遍有长的损害
		9	大部分叶上有长的损害

ECB田间试验。测量ECB叶轮损伤以测试Cry1Ca活性，与无效植物相比显示出显著更好的叶轮保护作用。Cry1Ca事件活性在统计上不等效于Cry1Ab和Cry1F提供的叶轮保护。

在MS产生的数据进一步佐证了Cry1Ca的出人预料的高水平植物保护。在该研究中建立了较高的摄食压力。与无效植物上的叶和茎损伤相比，测得Cry1Ca产生了显著的控制。在Cry1Ca茎中发现的存活昆虫很少。当与无效植物相比时，测得Cry1Ab和Cry1F事件的产生了显著的叶轮和茎保护。

表9

ECB叶轮数据，IN(多个事件间的平均)

基因	事件	平均叶轮损伤评级(1-9评级)	均值的范围
				Cry1Ca	4	2.31B	2.00-2.65
Cry1Ab	8	1.00A	1.00
				Cry1F	12	1.03A	1.00-1.20
无效植物	1	4.65C

后随不同的字母的均值是显著不同的(P≤0.05)

表10

ECB叶轮和茎数据，MS(不同事件之间的平均)

对于所有数据列，所有基因事件都与无效植物的值有显著差异(P<0.05)。在每个列中，后随不同字母的均值是显著不同的(P≤0.05)。

在SWCB试验中，每种B.t.仅测试了2个事件。该研究中建立了较高的摄食压力。对Cry1Ab、Cry1F和Cry1Ca事件均测量到了统计学上等效的茎保护和每条茎的幼虫与蛹数。

表11

SWCB叶轮和茎数据，MS

在每个列中，后随不同字母的均值是显著不同的(P≤0.05)。

Cry1Ca的活性形式由氨基酸29-628组成。全长(1-1164)或经切割的形式(1-628和29-628)当被提供给昆虫时是有活性的，因为它们被加工成29-628的形式。

实施例5

玉米穗蛾田间试验

在Fowler，IN用多个构建体和事件(SEQ ID NO:31)进行了玉米穗蛾的田间试验。无效植物作为阴性对照。每株植物在玉米棒的绿色丝中接受五只第一龄幼虫。CEW获自Benzon Laboratory。每个事件每个地块评估10个玉米棒，以评估用CEW感染的玉米棒颗粒损伤程度。与无效植物相比，所有转基因事件提供了显著较低的颗粒损伤水平。对幼虫摄食Cry1Ca植物有显著抑制(表12)。

表12

CEW颗粒进食数据，IN

实施例6

土壤杆菌转化

使用标准克隆方法构建二元植物转化和表达质粒。使用技术(Invitrogen，Carlsbad，CA)工程化含有cry1Ca表达盒的土壤杆菌二元质粒，并用于土壤杆菌介导的植物转化。限制性内切核酸酶得自New England BioLabs(NEB；Ipswich，MA)，T4DNA连接酶(Invitrogen)用于DNA连接。使用 LR酶混合物(Invitrogen)进行Gateway反应。使用质粒制备试剂盒或AX Xtra Midi试剂盒(均来自Macherey-Nagel)，按照制造商的说明进行质粒制备。凝胶分离后，使用QIAquick PCR纯化试剂盒或QIAEX II凝胶提取试剂盒(均来自Qiagen)纯化DNA片段。

包含编码杀虫蛋白或其片段的核苷酸序列的DNA片段由商业供应商(例如DNA2.0，Menlo Park，CA)合成并以标准质粒载体中的克隆片段提供，或通过对其他含有适当核苷酸序列的构建体进行标准分子生物学操作而获得。鉴定每个基因内部的独特的限制性位点，并合成每个基因的片段，每个片段含有特定的缺失或插入。将修饰的Cry片段亚克隆到其他Cry片段中的适当的限制性位点，以获得编码所需全长蛋白质、融合蛋白质、或缺失的变体蛋白质的区域。

制备根癌土壤杆菌菌株Z707S(Z707的链霉素抗性衍生物；Hepburn等人，1985)的电感受态细胞，并使用电穿孔(Weigel和Glazebrook，2002)转化。电穿孔后，将1mL YEP肉汤(gm/L：酵母提取物，10；蛋白胨，10；NaCl，5)加入到电转杯中，将细胞YEP悬浮液转移到15mL培养管中，在28℃下水浴中持续搅拌下温育4小时。将细胞接种在含壮观霉素(200μg/mL)和链霉素(250μg/mL)的YEP+琼脂(25gm/L)上，并将板在28℃下温育2-4天。选择良好分离的单个菌落，并划线到新鲜的如前所述的含有壮观霉素和链霉素的YEP+琼脂平板上，并在28℃温育1-3天。

从选出的土壤杆菌菌落制备模板质粒DNA，使用载体特异性引物进行PCR分析，来检验杀虫蛋白基因插入物在二元植物转化载体中的存在。从在如前所述的含壮观霉素和链霉素的YEP中生长的15mL过夜培养物取4mL等份离心沉淀细胞，使用Qiagen Spin MiniPreps根据制造商的说明提取细胞。作为对照的质粒DNA来自土壤杆菌电穿孔转化所使用的二元载体。使用来自Invitrogen的Taq DNA聚合酶，按照制造商的说明书，以0.5x浓度完成PCR反应。PCR反应在编程为包括以下条件的MJ Research Peltier热循环仪中进行：步骤1)94℃3分钟；步骤2)94℃45秒；步骤3)55℃30秒；步骤4)72℃，每kb预期产物长度1分钟；步骤5)29次至步骤2；步骤6)72℃10分钟。反应在循环后保持在4℃。通过琼脂糖凝胶电泳(例如0.7％至1％琼脂糖，w/v)分析扩增产物，并通过溴化乙锭染色观察。选择一个其产物与质粒对照相同的菌落。

表13

用于在玉米中表达DIG-465和DIG-473的质粒的描述。

质粒	描述
		pDAB115752	ZmUbi1/DIG-465/ZmPer5::SCBV(MAM)v2/AAD-1v3/ZmLip
pDAB115753	ZmUbi1/DIG-473/ZmPer5::SCBV(MAM)v2/AAD-1v3/ZmLip
		pDAB112725	ZmUbi1/Cry1Ca(Zm)/ZmPer5::SCBV(MAM)/AAD-1v3/ZmLip
pDAB112726	ZmUbi1/Cry1Ca(HGC)/ZmPer5::SCBV(MAM)/AAD-1v3/ZmLip

实施例7

在单子叶植物中生产DIG-465和DIG-473B.t.的杀虫蛋白和变体

土壤杆菌介导的玉米转化.将来自High II F₁杂交种子(Armstrong等，1991)的种子种植在含有95％Metro-Mix 360无土栽培培养基(Sun GroHorticulture，Bellevue，WA)和5％粘土/壤土的5加仑盆中。植物在温室中使用高压钠和金属卤化物灯的组合在16:8小时的光:暗光周期下生长。为了获得用于转化的未成熟的F₂胚胎，进行受控同胞传粉。在授粉后8-10天，当胚胎大小为1.0至2.0mm时，分离未成熟的胚胎。

感染和共同培养.玉米棒如下表面消毒：用液皂搓洗，浸入70％乙醇中2分钟，然后浸入20％商业漂白剂(0.1％次氯酸钠)中30分钟，然后用无菌水冲洗。细菌在28℃下、在含有100mg/L壮观霉素、10mg/L四环素和250mg/L链霉素的YEP固体培养基上生长2-3日，将1-2环这样的细菌转移到5mL含有100μM乙酰丁香酮的液体感染培养基(LS Basal Medium(Linsmaier and Skoog，1965)，N6维生素(Chu等，1975)，1.5mg/L 2,4-二氯苯氧乙酸(2,4-D)，68.5gm/L蔗糖，36.0gm/L葡萄糖，6mM L-脯氨酸，pH5.2)中，制备含有超二元载体的土壤杆菌细胞悬液。将溶液涡旋直到达到均匀的悬液，并使用具有紫色滤镜的Klett-Summerson色度计将浓度调节至200Kylett的最终密度。将未成熟的胚直接分离到含有2mL感染培养基的微量离心管中。去除培养基，并用密度为200Klett单位的1mL土壤杆菌溶液代替，并将土壤杆菌和胚溶液在室温下一起温育5分钟，然后转移至共培养培养基(LS Basal Medium，N6维生素，1.5mg/L 2,4-D，30.0gm/L蔗糖，6mM L-脯氨酸，0.85mg/L AgNO₃，100μM乙酰丁香酮，3.0gm/L结冷胶(PhytoTechnology Laboratories，Lenexa，KS)pH 5.8)在25℃，黑暗条件下培养5天。

共培养后，将胚转移至选择培养基，之后在约8周的过程中获得转化的分离株。对于用含植物可表达的pat或bar选择标记基因的超二元质粒转化的玉米组织的选择，用基于LS的培养基(LS基础培养基，N6维生素，1.5mg/L2,4-D，0.5gm/L MES(2-(N-吗啉代)乙磺酸一水合物；PhytoTechnologies Labr.)，30.0gm/L蔗糖，6mM L-脯氨酸，1.0mg/L AgNO₃，250mg/L头孢噻肟，2.5gm/L结冷胶，pH 5.7)与双丙氨膦(Gold BioTechnology)一起使用。将胚胎转移到含有3mg/L双丙氨膦的选择培养基中，直至获得胚性分离物。通过每隔2周转移到新鲜选择培养基来扩大回收的分离物用于再生和进一步分析。

再生和种子生产.为了再生，将培养物转移到“28”诱导培养基(MS盐和维生素，30gm/L蔗糖，5mg/L苄氨基嘌呤，0.25mg/L 2，4-D，3mg/L Bialaphos，250mg/L头孢噻肟，2.5gm/L结冷胶，pH 5.7)在低光条件(14μEm-2s-1)下1周，然后在高光条件下(约89μEm-2s-1)1周。随后将组织转移到“36”再生培养基(与诱导培养基相同，但缺乏植物生长调节剂)。当小植物的长度长到3-5厘米时，转移到含有SHGA培养基(Schenk和Hildebrandt盐和维生素(1972)；PhytoTechnologies Labr.)，1.0gm/L肌醇，10gm/L蔗糖的玻璃培养管和2.0gm/L结冷胶，pH5.8)以允许枝条和根的进一步生长和发育。将植物移植到如前所述的相同的土壤混合物中，并在温室中生长至开花。进行种子生产的受控授粉。

构建体115752表达DIG-465的水平和构建体115753表达DIG-473的水平在图1中示出。二者以相似的水平表达各自的蛋白质，使用叶冲孔器获得组织样品，在叶中测得的水平约70-80ng/cm²。

从表达编码全长Cry1Ca蛋白(MR-1206)(mw 130kDa)的基因的玉米获得提取物，进行SDS-PAGE。使用针对Cry1Ca的多克隆抗体进行免疫印迹，检测出至少5种蛋白质产物。检测到由插入玉米的基因所编码的全长(130kDa)蛋白质。其他条带代表该蛋白质的蛋白水解产物。一条由代表核心毒素的氨基酸序列1-628组成的蛋白质片段的分子量为70kDa。68kDa带表示由氨基酸29-628组成的蛋白质，其中N末端的前28个氨基酸被缺失。前三个条带对草地贪夜蛾和其他鳞翅目昆虫具有功能活性。第四条带代表由氨基酸74-628(mw 62kDa)组成的经切割蛋白，第五条带表示进一步加工成氨基酸74-596(mw 59kDa)的Cry1Ca蛋白。62kDa和59kDa的条带对草地贪夜蛾和其他鳞翅目昆虫没有功能活性，但代表主要的蛋白质产物。

实施例8

转基因玉米的生物测定

通过本领域技术人员已知的方法(参见例如Huang等人，2006)证明了在植物细胞中产生的DIG-465和DIG-473蛋白质和变体的生物活性。功效可以通过在受控饲养环境中给靶昆虫喂食衍生自产生DIG-465或DIG-473蛋白或变体的植物的各种植物组织或组织片来证明。或者，可以产生DIG-465或DIG-473蛋白质或变体的植物获得各种植物组织，从中制备蛋白质提取物，并将蛋白质提取物掺入如前所述的人工饵食生物测定中。应当理解，这种摄食测定的结果将要与使用适当对照组织的类似进行的生物测定比较，所述对照组织来自不产生DIG-465或DIG-473蛋白或变体的宿主植物，或者要与其他对照样品比较。

测试了来自构建物115752(DIG-465)的玉米中产生的各种事件的生物活性，测试其是否可防止由FAW或Cry1Fa抗性FAW(rFAW)的摄食活动导致的叶损伤。结果表明，表达DIG-465蛋白的事件与不表达该蛋白质的植物相比表现出较少的摄食损伤，而且效果为剂量依赖性，DIG-465的表达水平越高，导致FAW或rFAW所致的摄食损伤越少，这种影响对rFAW的影响似乎更大(表14和图2)。

类似地，测试了来自构建物115753(DIG-473)的玉米中产生的各种事件防止由FAW或Cry1Fa抗性FAW(rFAW)的摄食活动引起的叶损伤的生物活性。结果表明，表达DIG-473蛋白的事件与不表达该蛋白质的植物相比表现出较少的摄食损伤，且效果为剂量依赖性，DIG-473表达越高，导致FAW或rFAW引起的摄食损伤越少，对于rFAW，影响似乎更大(表14和图3)。

表14

暴露于DIG-465，DIG-473或对照组时的FAW生物测定数据

实施例9

在双子叶植物中生产Bt杀虫蛋白和变体

拟南芥转化.使用浸花法(Weigel and Glazebrook，2002)转化拟南芥Col-01。使用选定的土壤杆菌菌落接种1mL至15mL含有选择用的适当抗生素的YEP肉汤培养基。将培养物在28℃220rpm的恒定搅拌下温育过夜。使用每种培养物接种两个500mL的含有适当的选择用抗生素的YEP肉汤培养基的培养物，并将新培养物在28℃恒温搅拌下温育过夜。将细胞在室温下以约8700×g离心10分钟，弃去所得上清液。将细胞沉淀轻轻重悬于500mL的渗透培养基中，所述渗透培养基含有：1/2x Murashige和Skoog盐(Sigma-Aldrich)/Gamborg'sB5维生素(Gold BioTechnology，St.Louis，MO)，10％(w/v)蔗糖，0.044μM苄氨基嘌呤(10μL/L的1mg/mLDMSO储液)和300μL/L Silwet L-77。将大约1个月大的植物浸入该培养基中15秒钟，小心地确保最新的花序被淹没。然后将植物放倒并覆盖(透明或不透明)24小时，用水洗涤并竖立。植物在22℃、16:8光:暗的光周期培育。浸渍约4周后，收获种子。

拟南芥生长和选择将新鲜收获的T₁种子在室温下在干燥剂存在下干燥至少7天。将种子悬浮于0.1％琼脂/水(Sigma-Aldrich)溶液中，然后在4℃下分层2天。为了准备种植，用细小的蛭石覆盖10.5英寸×21英寸萌发托盘(TO Plastics Inc.，Clearwater，MN)的Sunshine Mix LP5(Sun Gro Horticulture Inc.，Bellevue，WA))，用Hoagland氏溶液(Hoagland和Arnon，1950)底下灌溉直到湿润，然后排水24小时。将分层种子播种到蛭石上并盖上保湿盖(KORD Products，Bramalea，Ontario，Canada)，过7天。在长白昼条件下(16:8光:暗光周期)，以120-150μmol/m²秒的光强度，在Conviron(型号CMP4030或CMP3244；Controlled Environments Limited，Winnipeg，Manitoba，Canada)中在恒定温度(22℃)和湿度(40-50％)下使种子萌发。最初用Hoagland氏溶液浇灌植物，随后用去离子水浇灌以保持土壤湿润但不潮湿。

在播种后5-6天除去保湿盖，并用化学选择剂喷洒植物以杀死从未转化的种子发芽的植物。例如，如果由二元植物转化载体提供的植物可表达的选择性标记基因是pat或bar基因(Wehrmann等人，1996)，则可以通过喷洒1000X的Finale溶液(5.78％草铵膦，Farnam Companies Inc.，Phoenix，AZ.)来选择转化的植物。随后以5-7天的间隔进行两次喷洒。在最终喷洒7-10天之后确定存活者(活跃生长的植物)，并移植到准备有SunshineMix LP5的盆中。将移植的植物用保湿盖覆盖3-4天，并在上述生长条件下置于Conviron培养箱中。

双子叶植物转化领域的技术人员将理解，当使用其他植物可表达的选择标记基因(例如除草剂耐受基因)时，其它选择转化植物的方法是可用的。

实施例10

包含DIG蛋白的转基因大豆

如本领域所知的，包括例如通过土壤杆菌介导的转化，产生10-20株转基因T₀大豆植物，这些植物携带包含Cry1Ca蛋白核酸的表达载体。将成熟的大豆(Glycine max)栽培种种子用氯气过夜灭菌16个小时。用氯气灭菌之后，将种子置于开放容器中，放置在LAMINAR^TM层流罩内，以驱散氯气。接着，使用黑盒在24℃黑暗中用无菌H₂O使灭菌后的种子吸涨16小时。

分割的大豆种子的准备包含部分胚轴的分割的大豆种子的规程要求准备大豆种子材料，使用固定在手术刀上的#10刀片，沿着种子的种脐纵向切割大豆种子材料，以分离和除去种皮，并将种子分割成两个子叶部分。仔细地部分除去胚轴，其中大约1/2–1/3的胚轴保留附着于子叶的节端(nodal end)。

接种然后将含有胚轴的部分的分割的大豆种子浸没在含有包含DIG蛋白的双元质粒的根癌土壤杆菌菌株(例如EHA 101或EHA引物105)的溶液中约30分钟。在浸没包含胚轴的子叶之前，将根癌土壤杆菌溶液稀释到终浓度为λ＝0.6OD₆₅₀。

共培养接种后，在用滤纸片覆盖的培养皿中让分割的大豆种子与根癌土壤杆菌菌株在共培养培养基(Wang,Kan.Agrobacterium Protocols.2.1.New Jersey,HumanaPress,2006.Print.)上共培养5天。

芽诱导共培养5天后，将分割的大豆种子在液体芽诱导(SI)培养基中清洗，该培养基的组成为：B5盐、B5维生素、28mg/L亚铁(Ferrous)、38mg/LNa₂EDTA、30g/L蔗糖、0.6g/LMES、1.11mg/L BAP、100mg/L TIMENTIN^TM、200mg/L头孢噻肟和50mg/L万古霉素(pH 5.7)。然后，在芽诱导I(SI I)培养基上培养分割的大豆种子，该培养基的组成为：B5盐、B5维生素、7g/L Noble琼脂、28mg/L亚铁(Ferrous)、38mg/L Na₂EDTA、30g/L蔗糖、0.6g/L MES、1.11mg/L BAP、50mg/L TIMENTIN^TM、200mg/L头孢噻肟、50mg/L万古霉素(pH 5.7)，使子叶的平侧(flat side)朝上，子叶的节端浸没在培养基中。培养2周后，将自经转化的分割大豆种子产生的外植体转移到芽诱导II(SI II)培养基中，该培养基含有SI I培养基并补充6mg/L草铵膦

芽伸长在SI II培养基上培养2周后，从外植体除去子叶，并通过在子叶的基部进行切割，切出含有子叶的平齐芽垫。将来自子叶的分离芽垫转移到芽伸长(SE)培养基上。SE培养基的组成为：MS盐、28mg/L亚铁、38mg/L Na₂EDTA、30g/L蔗糖和0.6g/L MES、50mg/L天冬酰胺、100mg/L L-焦谷氨酸、0.1mg/L IAA、0.5mg/L GA3、1mg/L玉米素核糖苷、50mg/LTIMENTIN^TM、200mg/L头孢噻肟、50mg/L万古霉素、6mg/L草铵膦、7g/L Noble琼脂(pH 5.7)。每2周将培养物转移到新鲜SE培养基上。让培养物在24℃的CONVIRON^TM生长室内，18h光照、光强为80-90μmol/m²sec的条件下生长。

生根对于从子叶芽垫发出的伸长芽，通过在子叶芽垫基部切割伸长芽，并将伸长芽浸入1mg/L IBA(吲哚3-丁酸)中1-3分钟来促进生根。接着，将伸长芽转移到植物生长托盘(Phytatray)内的生根培养基中(MS盐、B5维生素、28mg/L亚铁、38mg/L Na₂EDTA、20g/L蔗糖和0.59g/L MES、50mg/L天冬酰胺、100mg/L L-焦谷氨酸、7g/L Noble琼脂，pH 5.6)。

培养在24℃、18h光周期的CONVIRON^TM生长室中培养1-2周后，将已发根的芽转移到有盖的圣代杯(sundae cup)中的土壤预混物中，并放置在CONVIRON^TM生长室中(型号CMP4030和CMP3244,Controlled Environments Limited,Winnipeg,Manitoba,Canada)的长白昼条件下(16小时光照/8小时黑暗)，光强为120-150μmol/m²sec，恒温(22℃)恒湿(40-50％)，以便使小植株适应环境。生了根的小植株在圣代杯中适应环境数周，之后转移到温室中进行进一步的环境适应并建立强壮的转基因大豆植物。

将转基因株系的发育和形态特征与非转化植物进行比较。比较了植物根、芽、叶和繁殖特征。转基因和非转化植物的根长度和生长模式没有可观察到的差异。植株特征如高度、叶数和大小、开花时间、花朵大小和外观相似。大体上，在体外培养和在温室中的土壤中，转基因株系和没有表达DIG蛋白质的株系之间没有可观察到的形态学差异。

实施例11

其他作物物种的转化

通过利用本领域技术人员已知的方法，例如，基本上与美国专利7,838,733的实施例9、或PCT国际专利公开号WO 2007/053482的实施例12的实施例12中描述的相同的技术，用B.t.蛋白质(带有或不带有叶绿体转运肽)转化棉花蛋白质以提供对鳞翅目昆虫的控制。

应当理解，本文所述的实施例和实施方案仅用于说明目的，并且本领域技术人员将能想到其各种修改或改变，并且这些修改或改变将被包括在本申请的精神和范围内和所附权利要求的范围中。根据本文提供的教导，本领域技术人员可以容易地产生和使用本文所述的各种毒素和多核苷酸序列。

序列表

<110> 美国陶氏益农公司

J·J·希茨

K·纳尔瓦

T·米德

T·D·海伊

S·Y·坦

A·J·埃特尔

T·P·格兰西

J·M·阿姆斯特朗

T·E·克拉姆

K·M·马杜里

J·E·金

R·M·李

G·林

J·李

<120> CRY1CA MUTANTS USEFUL FOR CONTROL OF INSECT PESTS

<130> 70951

<160> 40

<170> PatentIn version 3.5

<210> 1

<211> 1878

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 1

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240

atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300

ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360

ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420

gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480

gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540

cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600

gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660

caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720

gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780

actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840

cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900

atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960

ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020

ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080

acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140

ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200

agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260

gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320

ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380

gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440

agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500

gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560

ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620

ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680

aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740

aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800

ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860

tcggatcttg aaaggtga 1878

<210> 2

<211> 625

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 2

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu

65 70 75 80

Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn

85 90 95

Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys

100 105 110

Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile

115 120 125

Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser

130 135 140

Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln

145 150 155 160

Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly

165 170 175

Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg

180 185 190

Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr

195 200 205

Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile

210 215 220

Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile

225 230 235 240

Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro

245 250 255

Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe

260 265 270

Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met

275 280 285

Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn

290 295 300

Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp

305 310 315 320

Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr

325 330 335

Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe

340 345 350

Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg

355 360 365

Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val

370 375 380

Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly

385 390 395 400

Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser

405 410 415

Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe

420 425 430

Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser

435 440 445

Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg

450 455 460

Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr

465 470 475 480

Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg

485 490 495

Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro

500 505 510

Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp

515 520 525

Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly

530 535 540

Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu

545 550 555 560

Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe

565 570 575

Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu

580 585 590

Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile

595 600 605

Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu

610 615 620

Arg

625

<210> 3

<211> 1878

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 3

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240

atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300

ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360

ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420

gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480

gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540

cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600

gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660

caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720

gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780

actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840

cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900

atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960

ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020

ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080

acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140

ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200

agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260

gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320

ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380

gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440

agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500

gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560

ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620

ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680

aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740

aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800

ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860

tcggatcttg aaaggtga 1878

<210> 4

<211> 625

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 4

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu

65 70 75 80

Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn

85 90 95

Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys

100 105 110

Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile

115 120 125

Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser

130 135 140

Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln

145 150 155 160

Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly

165 170 175

Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg

180 185 190

Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr

195 200 205

Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile

210 215 220

Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile

225 230 235 240

Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro

245 250 255

Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe

260 265 270

Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met

275 280 285

Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn

290 295 300

Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp

305 310 315 320

Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr

325 330 335

Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe

340 345 350

Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg

355 360 365

Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val

370 375 380

Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly

385 390 395 400

Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser

405 410 415

Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe

420 425 430

Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser

435 440 445

Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg

450 455 460

Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr

465 470 475 480

Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg

485 490 495

Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro

500 505 510

Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp

515 520 525

Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly

530 535 540

Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu

545 550 555 560

Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe

565 570 575

Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu

580 585 590

Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile

595 600 605

Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu

610 615 620

Arg

625

<210> 5

<211> 1878

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 5

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcgc cgttggcctt 180

atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240

atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300

ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360

ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420

gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480

gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540

cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600

gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660

caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720

gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780

actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840

cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900

atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960

ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020

ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080

acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140

ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200

agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260

gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320

ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380

gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440

agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500

gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560

ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620

ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680

aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740

aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800

ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860

tcggatcttg aaaggtga 1878

<210> 6

<211> 625

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 6

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Ala Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu

65 70 75 80

Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn

85 90 95

Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys

100 105 110

Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile

115 120 125

Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser

130 135 140

Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln

145 150 155 160

Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly

165 170 175

Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg

180 185 190

Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr

195 200 205

Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile

210 215 220

Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile

225 230 235 240

Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro

245 250 255

Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe

260 265 270

Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met

275 280 285

Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn

290 295 300

Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp

305 310 315 320

Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr

325 330 335

Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe

340 345 350

Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg

355 360 365

Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val

370 375 380

Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly

385 390 395 400

Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser

405 410 415

Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe

420 425 430

Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser

435 440 445

Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg

450 455 460

Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr

465 470 475 480

Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg

485 490 495

Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro

500 505 510

Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp

515 520 525

Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly

530 535 540

Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu

545 550 555 560

Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe

565 570 575

Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu

580 585 590

Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile

595 600 605

Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu

610 615 620

Arg

625

<210> 7

<211> 1878

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 7

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcat ggttggcctt 180

atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240

atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300

ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360

ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420

gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480

gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540

cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600

gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660

caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720

gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780

actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840

cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900

atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960

ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020

ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080

acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140

ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200

agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260

gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320

ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380

gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440

agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500

gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560

ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620

ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680

aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740

aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800

ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860

tcggatcttg aaaggtga 1878

<210> 8

<211> 625

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 8

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Met Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu

65 70 75 80

Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn

85 90 95

Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys

100 105 110

Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile

115 120 125

Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser

130 135 140

Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln

145 150 155 160

Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly

165 170 175

Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg

180 185 190

Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr

195 200 205

Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile

210 215 220

Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile

225 230 235 240

Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro

245 250 255

Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe

260 265 270

Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met

275 280 285

Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn

290 295 300

Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp

305 310 315 320

Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr

325 330 335

Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe

340 345 350

Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg

355 360 365

Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val

370 375 380

Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly

385 390 395 400

Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser

405 410 415

Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe

420 425 430

Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser

435 440 445

Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg

450 455 460

Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr

465 470 475 480

Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg

485 490 495

Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro

500 505 510

Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp

515 520 525

Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly

530 535 540

Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu

545 550 555 560

Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe

565 570 575

Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu

580 585 590

Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile

595 600 605

Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu

610 615 620

Arg

625

<210> 9

<211> 1887

<212> DNA

<213> Bacillus thuringiensis

<400> 9

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 10

<211> 628

<212> PRT

<213> Bacillus thuringiensis

<400> 10

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 11

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 11

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 12

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 12

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 13

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 13

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcat ggttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 14

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 14

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Met Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 15

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 15

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcgc cgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 16

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 16

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Ala Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 17

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 17

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tttcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 18

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 18

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 19

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 19

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tatcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 20

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 20

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Ile Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 21

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 21

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccaggcgg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 22

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 22

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Ala Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 23

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 23

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgatggg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 24

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 24

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Met Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 25

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 25

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttggccgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 26

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 26

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Ala Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 27

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 27

atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180

atcgacttcg tctggggaat tgtcggaccc tcccagatgg atgcgtttct ggtgcagata 240

gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660

tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 28

<211> 628

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 28

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Met Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 29

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 29

atggataaca accccaacat taacgagtgc atcccctaca actgcctctc gaatccagaa 60

gaagtgctct tggatggcga gaggatttcg actggcaaca gctccataga catttccctc 120

tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggatta 180

atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240

gagcaattaa ttaatgaaag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300

gaagggcttg gcaacaactt caacatctac gtggaagcat ttaaggagtg ggaagaggac 360

cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420

ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480

tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540

cgctggggtc ttacgactat caacgtgaat gaaaactaca atcggttgat tcggcacata 600

gacgagtatg ccgaccactg tgctaacacc tacaataggg gattaaataa tctgccaaag 660

tcaacgtatc aagactggat aacatataat aggctcagac gggacctcac tctcaccgtg 720

ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780

ggtcagctca ctcgcgaggt ctacaccgat ccattaatta atttcaatcc ccagctgcaa 840

tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900

ctctttgaca tacttaataa tctcactatc ttcaccgatt ggttttcagt tggacgcaac 960

ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020

cctatctatg gaagggaggc caaccaggag ccaccaaggt ctttcacctt caacggtccg 1080

gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140

ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200

tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260

cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320

acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380

aatacaatcg acccagagag aattaatcaa atccctctgg tgaagggctt tcgcgtttgg 1440

ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500

acgtttggcg atttcgtgag ccttcaagtc aacattaatt ccccaatcac ccagagatat 1560

cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620

gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680

atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740

ttcagagcca atccggatat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800

atctcttcag gcgagctgta catcgataaa attgagatca ttctcgcaga tgcgactctc 1860

gaggctgaat cggatcttga aaggtga 1887

<210> 30

<211> 628

<212> PRT

<213> Bacillus thuringiensis

<400> 30

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 31

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 31

atggataaca acccgaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60

gaggtgctgc tggacggcga gaggatctca accggcaaca gcagcatcga catcagcctg 120

tccctggtgc agttcctggt gagcaacttc gtgccgggcg gcggcttcct ggtgggatta 180

atcgacttcg tgtggggcat cgtcggcccg tcccagtggg acgccttcct ggttcagatc 240

gagcaattaa ttaatgaaag gatagcagag ttcgcgagga acgcggccat cgccaacctg 300

gagggcctgg gcaacaactt caacatctac gtggaagcat ttaaggagtg ggaggaggac 360

cccaagaacc cggccacgag gacgagggtg atcgaccgct ttcgcatcct ggacggcctg 420

ctggagaggg acatcccgtc cttcagaatc agcggcttcg aggtcccgct gctgtccgtg 480

tacgcgcaag cggccaacct gcacctggcg atcctgaggg actccgtgat attcggcgag 540

aggtggggcc tgaccaccat caacgtgaat gaaaactaca accggctgat aaggcacatc 600

gacgagtacg ccgaccactg cgccaacacc tacaataggg gattaaataa tctgcccaag 660

agcacctacc aagactggat cacatataac cggctgagga gggacctgac cctgaccgtg 720

ctggacatcg ccgcgttctt cccgaactac gacaataggc gctacccgat ccagccggtg 780

ggccagctga cccgcgaggt gtacaccgac ccattaatta atttcaaccc gcagctccag 840

tccgtggccc agctgccgac cttcaacgtg atggagaaca gcgccatccg gaacccgcac 900

ctgttcgaca tcctgaataa tctgaccatc ttcaccgact ggttctcagt gggccggaac 960

ttctactggg gcggccatag ggtgatctcc agcctgatcg gcggcggcaa catcacctcc 1020

ccgatctacg ggagggaggc gaaccaggag ccgccgaggt ccttcacctt caacggcccg 1080

gtgtttagga ccctgtccaa cccgaccctg aggctgctcc agcagccgtg gccggcgccg 1140

ccgttcaacc tgaggggcgt ggagggcgtg gagttcagca ccccgaccaa cagcttcacc 1200

taccggggga ggggcaccgt ggactcactg accgagctgc cgccggagga caacagcgtg 1260

ccgccgaggg agggctacag ccataggctg tgccacgcca ccttcgtgca gaggagcggc 1320

accccgttct tgacgaccgg cgtggtgttc tcctggaccc accggagcgc gaccctgacc 1380

aatacaatcg acccggagag aattaatcaa atcccgctgg tgaagggctt ccgggtgtgg 1440

ggcggcacct ccgtgatcac cgggccgggc tttaccggcg gcgacatcct gaggaggaac 1500

acgttcggcg acttcgtgag cctccaagtg aacattaata gcccgatcac ccagcgctac 1560

cggctgaggt tccgctacgc gtcaagccgc gacgcgaggg tgatcgtgct gaccggcgcg 1620

gcctcaaccg gcgtgggcgg ccaagtgtcc gtgaacatgc cgctgcaaaa gacgatggag 1680

atcggcgaga acctgacctc aaggaccttc cgctacaccg acttcagcaa cccgttcagc 1740

tttagggcca acccggatat aatcggcatc agcgagcagc cgctgttcgg cgccggctcc 1800

atctcaagcg gcgagctgta catcgataaa atcgagatca tcctggcgga cgcgaccttg 1860

gaggccgagt ccgacctgga gaggtga 1887

<210> 32

<211> 628

<212> PRT

<213> Bacillus thuringiensis

<400> 32

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 33

<211> 1887

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 33

atggacaaca atcccaatat caatgagtgc atcccataca actgcctttc aaatcccgag 60

gaagtcttac tggatgggga aaggattagc actggcaatt ccagcattga catttccttg 120

agtctcgttc aattccttgt gagcaacttt gtgcctggcg gagggttctt ggttggtctc 180

atagactttg tttggggaat tgtaggacca tcacagtggg atgccttctt agtccagatt 240

gaacagctta tcaatgagag aatagctgag ttcgcaagaa atgctgcaat cgctaacttg 300

gagggactcg gcaacaactt caacatctac gtggaggctt tcaaagaatg ggaagaagat 360

cctaagaatc cagctactag gactagagtc atcgataggt ttaggattct tgatgggctg 420

ttggagcgtg acattccttc ctttaggatt agtggcttcg aggttcctct cctttctgtc 480

tatgctcaag cagccaatct ccatctcgcc attctccgtg attcagtaat cttcggagaa 540

agatggggtt tgacaacgat caatgtgaat gagaactaca acagattgat cagacacatt 600

gatgagtatg ctgatcattg tgctaacaca tacaacagag ggcttaacaa cctcccgaaa 660

tcaacatatc aagattggat aacctacaat agattgagga gggatctcac actgactgta 720

ctcgacattg ctgctttctt tcccaactac gataaccgta gatatcccat tcaacccgtc 780

ggacaactca ctcgtgaagt gtacacagat ccccttatca acttcaaccc acagttacaa 840

agtgttgcac agctgccaac cttcaatgtg atggaaaact ctgccattag gaatccacat 900

ctgtttgaca tacttaacaa cttgactatc tttacggatt ggtttagtgt ggggaggaac 960

ttctattggg gaggtcacag agtgattagc tctcttatcg gaggtgggaa cattacttca 1020

ccaatctatg gacgtgaagc aaatcaagaa ccaccacgtt cattcacctt caatggaccc 1080

gttttcagaa cactgtccaa tccgactctg agactgttgc agcaaccttg gccagcacct 1140

cctttcaact tgaggggtgt agagggagtc gagttttcca cacctactaa cagtttcacc 1200

tataggggtc gtggaactgt tgattctctt actgaacttc ctccagagga caattctgtt 1260

cctccgaggg aaggctattc acaccgtttg tgtcatgcaa cttttgttca gaggtctggc 1320

acacctttct taacaactgg cgtcgttttc agctggacac ataggagtgc aaccctcacg 1380

aatactatcg atccagagag aatcaatcag attcctcttg ttaagggctt tagggtgtgg 1440

ggtgggacct cagtgataac tggtcccggt ttcaccggag gagacatact tagaaggaac 1500

acctttgggg atttcgtttc tcttcaagta aacatcaatt ctcctatcac ccagagatac 1560

agacttaggt ttagatatgc tagtagccgt gacgccagag tcatagtgtt gactggtgct 1620

gcatcaactg gtgttggtgg gcaagtttca gtgaacatgc cacttcaaaa gacaatggag 1680

ataggtgaga acttgacgtc cagaaccttc agatacactg acttttctaa tcctttctct 1740

tttcgtgcta atccagacat cataggaatc agtgaacaac cgttgtttgg agctggttcc 1800

atttctagtg gagaattgta cattgacaag attgagatca tacttgccga tgccacgctc 1860

gaggctgaat ctgatctcga aaggtga 1887

<210> 34

<211> 628

<212> PRT

<213> Bacillus thuringiensis

<400> 34

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg

625

<210> 35

<211> 3495

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 35

atggacaaca atcccaatat caatgagtgc atcccataca actgcctttc aaatcccgag 60

gaagtcttac tggatgggga aaggattagc actggcaatt ccagcattga catttccttg 120

agtctcgttc aattccttgt gagcaacttt gtgcctggcg gagggttctt ggttggtctc 180

atagactttg tttggggaat tgtaggacca tcacagtggg atgccttctt agtccagatt 240

gaacagctta tcaatgagag aatagctgag ttcgcaagaa atgctgcaat cgctaacttg 300

gagggactcg gcaacaactt caacatctac gtggaggctt tcaaagaatg ggaagaagat 360

cctaagaatc cagctactag gactagagtc atcgataggt ttaggattct tgatgggctg 420

ttggagcgtg acattccttc ctttaggatt agtggcttcg aggttcctct cctttctgtc 480

tatgctcaag cagccaatct ccatctcgcc attctccgtg attcagtaat cttcggagaa 540

agatggggtt tgacaacgat caatgtgaat gagaactaca acagattgat cagacacatt 600

gatgagtatg ctgatcattg tgctaacaca tacaacagag ggcttaacaa cctcccgaaa 660

tcaacatatc aagattggat aacctacaat agattgagga gggatctcac actgactgta 720

ctcgacattg ctgctttctt tcccaactac gataaccgta gatatcccat tcaacccgtc 780

ggacaactca ctcgtgaagt gtacacagat ccccttatca acttcaaccc acagttacaa 840

agtgttgcac agctgccaac cttcaatgtg atggaaaact ctgccattag gaatccacat 900

ctgtttgaca tacttaacaa cttgactatc tttacggatt ggtttagtgt ggggaggaac 960

ttctattggg gaggtcacag agtgattagc tctcttatcg gaggtgggaa cattacttca 1020

ccaatctatg gacgtgaagc aaatcaagaa ccaccacgtt cattcacctt caatggaccc 1080

gttttcagaa cactgtccaa tccgactctg agactgttgc agcaaccttg gccagcacct 1140

cctttcaact tgaggggtgt agagggagtc gagttttcca cacctactaa cagtttcacc 1200

tataggggtc gtggaactgt tgattctctt actgaacttc ctccagagga caattctgtt 1260

cctccgaggg aaggctattc acaccgtttg tgtcatgcaa cttttgttca gaggtctggc 1320

acacctttct taacaactgg cgtcgttttc agctggacac ataggagtgc aaccctcacg 1380

aatactatcg atccagagag aatcaatcag attcctcttg ttaagggctt tagggtgtgg 1440

ggtgggacct cagtgataac tggtcccggt ttcaccggag gagacatact tagaaggaac 1500

acctttgggg atttcgtttc tcttcaagta aacatcaatt ctcctatcac ccagagatac 1560

agacttaggt ttagatatgc tagtagccgt gacgccagag tcatagtgtt gactggtgct 1620

gcatcaactg gtgttggtgg gcaagtttca gtgaacatgc cacttcaaaa gacaatggag 1680

ataggtgaga acttgacgtc cagaaccttc agatacactg acttttctaa tcctttctct 1740

tttcgtgcta atccagacat cataggaatc agtgaacaac cgttgtttgg agctggttcc 1800

atttctagtg gagaattgta cattgacaag attgagatca tacttgccga tgccacgctc 1860

gaggctgaat ctgatctcga aagggcacag aaagctgtaa acgcattgtt tacaagttct 1920

aatcaaatcg gactcaaaac cgatgttacg gactatcaca tagatagggt ttctaatctt 1980

gtggaatgtc tttcagatga gttttgttta gatgagaaga aagaactttc agaaaaggtc 2040

aagcacgcca aaagactgtc cgatgaaagg aatctccttc aagacccaaa ctttcgtgga 2100

atcaataggc agctcgacag aggttggaga gggagcacag atatcaccat tcaaggagga 2160

gatgacgttt tcaaagagaa ctatgtcacc ttgttaggca cctttgatga gtgctatcca 2220

acttatctgt atcagaagat tgatgaatcc aagctgaagg cttacacaag atatcagctc 2280

agaggataca tcgaggactc ccaagatttg gagatatact tgattcgtta caatgcaaaa 2340

catgagaccg tgaatgttcc tggtactgga agtctctggc cactgtctgc tccgtcacct 2400

attgggaaat gtgcccatca ctcccaccat ttctcattgg acatagacgt tggctgcaca 2460

gatttgaatg aagatttggg tgtttgggtc atcttcaaga tcaaaactca agacggacac 2520

gctcgtttag gaaacttaga gtttcttgaa gagaagccct tggttgggga ggcacttgcc 2580

agagtaaaga gagctgaaaa gaagtggaga gataagaggg agaaacttga gtgggagact 2640

aacattgtgt acaaggaagc caaagaaagc gtggatgctc ttttcgtgaa ctctcagtat 2700

gataggttac aagcagacac caacatagca atgatacatg cagctgacaa aagagtccat 2760

tctattcgtg aggcttactt gccagaactt agtgtgattc ccggtgtcaa cgctgccatt 2820

ttcgaggaat tggaaggaag aatctttacg gctttcagcc tctatgacgc taggaatgtt 2880

atcaagaatg gtgatttcaa caatggcctc tcatgttgga atgtgaaagg tcatgttgat 2940

gtagaggagc aaaacaatca ccgtagcgtg ctggttgtcc cagaatggga agccgaagta 3000

agccaagaag ttagagtttg ccctggaaga ggctacattc tgcgtgtcac cgcttacaaa 3060

gaaggatatg gcgaagggtg cgtgactatt catgagattg agaacaatac tgacgaactt 3120

aagttttcaa actgcgtcga ggaggaagtg tatcctaaca acacagtgac ttgtaatgac 3180

tatacagcaa cgcaagagga atacgagggg acatacacca gtcgtaatcg tggttatgat 3240

ggtgcttatg aaagcaattc atccgttcca gctgactatg ccagtgccta cgaagagaag 3300

gcttacacgg atggcagaag agataaccca tgtgagtcca acagaggtta tggtgattac 3360

actcctcttc cagctggtta cgtgactaaa gagttagagt actttccgga gactgataag 3420

gtttggattg aaatcggaga gacagaaggg acattcatag tagattcagt tgagcttctt 3480

ctcatggaag aatga 3495

<210> 36

<211> 1164

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 36

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser

625 630 635 640

Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg

645 650 655

Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu

660 665 670

Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp

675 680 685

Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln

690 695 700

Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly

705 710 715 720

Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp

725 730 735

Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu

740 745 750

Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln

755 760 765

Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val

770 775 780

Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro

785 790 795 800

Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp

805 810 815

Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe

820 825 830

Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe

835 840 845

Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg

850 855 860

Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr

865 870 875 880

Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val

885 890 895

Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile

900 905 910

His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro

915 920 925

Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu

930 935 940

Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val

945 950 955 960

Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys

965 970 975

Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val

980 985 990

Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro

995 1000 1005

Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr

1010 1015 1020

Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp

1025 1030 1035

Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn

1040 1045 1050

Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr

1055 1060 1065

Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr

1070 1075 1080

Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu

1085 1090 1095

Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser

1100 1105 1110

Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val

1115 1120 1125

Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile

1130 1135 1140

Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu

1145 1150 1155

Leu Leu Leu Met Glu Glu

1160

<210> 37

<211> 3495

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 37

atggataaca atccgaacat caatgaatgc atcccgtaca actgcctgag caacccggaa 60

gaagtgctgt tggatggaga acggatatca actggtaatt catcaattga tatttctctg 120

tcacttgttc agtttctggt atctaacttc gtcccaggcg gaggattcct ggttggatta 180

atagattttg tatggggaat agttggccct tctcaatggg atgcatttct agtacaaatt 240

gaacaattaa ttaatgaaag aatagctgaa tttgctagga atgctgctat tgctaattta 300

gaaggattag gaaacaattt caatatatat gtggaagcat ttaaagaatg ggaagaagat 360

cctaagaatc cagcaaccag gaccagagta attgatcgct ttcgtatact tgatgggcta 420

cttgaaaggg acattccttc gtttcgaatt tctggatttg aagtacccct tttatccgtt 480

tatgctcaag cggccaatct gcatctagct atattaagag attctgtaat ttttggagaa 540

agatggggat tgacaacgat aaatgtcaat gaaaactata atagactaat taggcatatt 600

gatgaatatg ctgatcactg tgcaaatacg tataatcggg gattaaataa tttaccgaaa 660

tctacgtatc aagattggat aacatataat cgattgcgga gagacttaac attgactgta 720

ttagatatcg ccgctttctt tccaaactat gacaatagga gatatccaat tcagccagtt 780

ggtcaactaa caagggaagt ttatacggac ccattaatta attttaatcc acagttacag 840

tctgtagctc aattacctac ttttaacgtt atggagaaca gcgcaattag aaatcctcat 900

ttatttgata tattgaataa tcttacaatc tttacggatt ggtttagtgt tggacgcaat 960

ttttattggg gaggacatcg agtaatatct agccttatag gaggtggtaa cataacatct 1020

cctatatatg gaagagaggc gaaccaggag cctccaagat cctttacttt taatggaccg 1080

gtatttagga ctttatcaaa tcctacttta cgattattac agcaaccttg gccagcgcca 1140

ccatttaatt tacgtggtgt tgaaggagta gaattttcta cacctacaaa tagctttacg 1200

tatcgaggaa gaggtacggt tgattcttta actgaattgc cgcctgagga taatagtgtg 1260

ccacctcgcg aaggatatag tcatcgttta tgtcatgcaa cttttgttca aagatctgga 1320

acaccttttt taacaactgg tgtagtattt tcttggacgc atcgtagtgc aactcttaca 1380

aatacaattg atccagagag aattaatcaa atacctttag tgaaaggatt tagagtttgg 1440

gggggcacct ctgtcattac aggaccagga tttacaggag gggatatcct tcgaagaaat 1500

acctttggtg attttgtatc tctacaagtc aatattaatt caccaattac ccaaagatac 1560

cgtttaagat ttcgttacgc ttccagtagg gatgcacgag ttatagtatt aacaggagcg 1620

gcatccacag gagtgggagg ccaagttagt gtaaatatgc ctcttcagaa aactatggaa 1680

ataggggaga acttaacatc tagaacattt agatataccg attttagtaa tcctttttca 1740

tttagagcta atccagatat aattgggata agtgaacaac ctctatttgg tgcaggttct 1800

attagtagcg gtgaacttta tatagataaa attgaaatta ttctagcaga tgcaacattt 1860

gaagcagaat ctgatttaga aagagcacaa aaggcggtga atgccctgtt tacttcttcc 1920

aatcaaatcg ggttaaaaac cgatgtgacg gactatcata tcgatcgagt atccaattta 1980

gttgagtgtt tatctgatga attttgtctg gatgaaaaaa aagaattgtc cgagaaagtc 2040

aaacatgcga agcgacttag tgatgagcgg aatttacttc aagatccaaa ctttagaggg 2100

atcaatagac aactagaccg tggctggaga ggaagtacgg atattaccat ccaaggaggc 2160

gatgacgtat ccaaagagaa ttacgttacg ctattgggta cctttgatga gtgctactta 2220

acgtatttat atcaaaaaat agatgagtcg aaattaaaag cctatacccg ttaccaatta 2280

agagggtata tcgaagatag tcaagactta gaaatctatt taattcgcta caatgccaaa 2340

cacgaaacag taaatgtgcc aggtacgggt tccttatggc cgctttcagc cccaagtcca 2400

atcggaaaat gtgcccatca ttcccatcat ttctccttgg acattgatgt tggatgtaca 2460

gacttaaatg aggacttagg tgtatgggtg atattcaaga ttaagacgca agatggccat 2520

gcaagactag gaaatctaga atttctcgaa gagaaaccat tagtaggaga agcactagct 2580

cgtgtgaaaa gagcggagaa aaaatggaga gacaaacgtg aaaaattgga atgggaaaca 2640

aatattgttt ataaagaggc aaaagaatct gtagatgctt tatttgtaaa ctctcaatat 2700

gatagattac aagcggatac caacatcgcg atgattcatg cggcagataa acgcgttcat 2760

agcattcgag aagcttatct gcctgagctg tctgtgattc cgggtgtcaa tgcggctatt 2820

tttgaagaat tagaagggcg tattttcact gcattctccc tatatgatgc gagaaatgtc 2880

attaaaaatg gtgattttaa taatggctta tcctgctgga acgtgaaagg gcatgtagat 2940

gtagaagaac aaaacaacca ccgttcggtc cttgttgttc cggaatggga agcagaagtg 3000

tcacaagaag ttcgtgtctg tccgggtcgt ggctatatcc ttcgtgtcac agcgtacaag 3060

gagggatatg gagaaggttg cgtaaccatt catgagatcg agaacaatac agacgaactg 3120

aagtttagca actgtgtaga agaggaagta tatccaaaca acacggtaac gtgtaatgat 3180

tatactgcga ctcaagaaga atatgagggt acgtacactt ctcgtaatcg aggatatgac 3240

ggagcctatg aaagcaattc ttctgtacca gctgattatg catcagccta tgaagaaaaa 3300

gcatatacag atggacgaag agacaatcct tgtgaatcta acagaggata tggggattac 3360

acaccactac cagctggcta tgtgacaaaa gaattagagt acttcccaga aaccgataag 3420

gtatggattg agatcggaga aacggaagga acattcatcg tggacagcgt ggaattactt 3480

cttatggagg aataa 3495

<210> 38

<211> 1164

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 38

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly

20 25 30

Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser

35 40 45

Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val

50 55 60

Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala

85 90 95

Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu

100 105 110

Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr

115 120 125

Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp

130 135 140

Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val

165 170 175

Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn

180 185 190

Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala

195 200 205

Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln

210 215 220

Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro

245 250 255

Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu

260 265 270

Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe

275 280 285

Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile

290 295 300

Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn

305 310 315 320

Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly

325 330 335

Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro

340 345 350

Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro

355 360 365

Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu

370 375 380

Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr

385 390 395 400

Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu

405 410 415

Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His

420 425 430

Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val

435 440 445

Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp

450 455 460

Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp

465 470 475 480

Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile

485 490 495

Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile

500 505 510

Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser

515 520 525

Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly

530 535 540

Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu

545 550 555 560

Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser

565 570 575

Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu

580 585 590

Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile

595 600 605

Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser

610 615 620

Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser

625 630 635 640

Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg

645 650 655

Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu

660 665 670

Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp

675 680 685

Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln

690 695 700

Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly

705 710 715 720

Asp Asp Val Ser Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp

725 730 735

Glu Cys Tyr Leu Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu

740 745 750

Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln

755 760 765

Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val

770 775 780

Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro

785 790 795 800

Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp

805 810 815

Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe

820 825 830

Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe

835 840 845

Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg

850 855 860

Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr

865 870 875 880

Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val

885 890 895

Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile

900 905 910

His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro

915 920 925

Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu

930 935 940

Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val

945 950 955 960

Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys

965 970 975

Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val

980 985 990

Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro

995 1000 1005

Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr

1010 1015 1020

Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp

1025 1030 1035

Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn

1040 1045 1050

Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr

1055 1060 1065

Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr

1070 1075 1080

Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu

1085 1090 1095

Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser

1100 1105 1110

Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val

1115 1120 1125

Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile

1130 1135 1140

Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu

1145 1150 1155

Leu Leu Leu Met Glu Glu

1160

<210> 39

<211> 2109

<212> DNA

<213> 人工序列

<220>

<223> 合成的编码区

<400> 39

atggcacaga gcagtaggat ctgccacggt gtgcagaacc cgtgcgtgat catctcgaac 60

ctgagcaagt ccaaccagaa caagtcaccg ttctccgtgt ccctcaagac ccaccagcac 120

ccgagagcct acccgatcag cagctcctgg ggactgaaga agagtggcat gaccctgatc 180

ggctccgagc tgagaccgct gaaggtgatg tccagcgtgt cagcggataa caacccgaac 240

atcaacgagt gcatccccta caactgcctg agcaaccccg aggaggtgct gctggacggc 300

gagaggatct caaccggcaa cagcagcatc gacatcagcc tgtccctggt gcagttcctg 360

gtgagcaact tcgtgccggg cggcggcttc ctggtgggat taatcgactt cgtgtggggc 420

atcgtcggcc cgtcccagtg ggacgccttc ctggttcaga tcgagcaatt aattaatgaa 480

aggatagcag agttcgcgag gaacgcggcc atcgccaacc tggagggcct gggcaacaac 540

ttcaacatct acgtggaagc atttaaggag tgggaggagg accccaagaa cccggccacg 600

aggacgaggg tgatcgaccg ctttcgcatc ctggacggcc tgctggagag ggacatcccg 660

tccttcagaa tcagcggctt cgaggtcccg ctgctgtccg tgtacgcgca agcggccaac 720

ctgcacctgg cgatcctgag ggactccgtg atattcggcg agaggtgggg cctgaccacc 780

atcaacgtga atgaaaacta caaccggctg ataaggcaca tcgacgagta cgccgaccac 840

tgcgccaaca cctacaatag gggattaaat aatctgccca agagcaccta ccaagactgg 900

atcacatata accggctgag gagggacctg accctgaccg tgctggacat cgccgcgttc 960

ttcccgaact acgacaatag gcgctacccg atccagccgg tgggccagct gacccgcgag 1020

gtgtacaccg acccattaat taatttcaac ccgcagctcc agtccgtggc ccagctgccg 1080

accttcaacg tgatggagaa cagcgccatc cggaacccgc acctgttcga catcctgaat 1140

aatctgacca tcttcaccga ctggttctca gtgggccgga acttctactg gggcggccat 1200

agggtgatct ccagcctgat cggcggcggc aacatcacct ccccgatcta cgggagggag 1260

gcgaaccagg agccgccgag gtccttcacc ttcaacggcc cggtgtttag gaccctgtcc 1320

aacccgaccc tgaggctgct ccagcagccg tggccggcgc cgccgttcaa cctgaggggc 1380

gtggagggcg tggagttcag caccccgacc aacagcttca cctaccgggg gaggggcacc 1440

gtggactcac tgaccgagct gccgccggag gacaacagcg tgccgccgag ggagggctac 1500

agccataggc tgtgccacgc caccttcgtg cagaggagcg gcaccccgtt cttgacgacc 1560

ggcgtggtgt tctcctggac ccaccggagc gcgaccctga ccaatacaat cgacccggag 1620

agaattaatc aaatcccgct ggtgaagggc ttccgggtgt ggggcggcac ctccgtgatc 1680

accgggccgg gctttaccgg cggcgacatc ctgaggagga acacgttcgg cgacttcgtg 1740

agcctccaag tgaacattaa tagcccgatc acccagcgct accggctgag gttccgctac 1800

gcgtcaagcc gcgacgcgag ggtgatcgtg ctgaccggcg cggcctcaac cggcgtgggc 1860

ggccaagtgt ccgtgaacat gccgctgcaa aagacgatgg agatcggcga gaacctgacc 1920

tcaaggacct tccgctacac cgacttcagc aacccgttca gctttagggc caacccggat 1980

ataatcggca tcagcgagca gccgctgttc ggcgccggct ccatctcaag cggcgagctg 2040

tacatcgata aaatcgagat catcctggcg gacgcgacct tggaggccga gtccgacctg 2100

gagaggtga 2109

<210> 40

<211> 702

<212> PRT

<213> 人工序列

<220>

<223> 自合成的编码区翻译的

<400> 40

Met Ala Gln Ser Ser Arg Ile Cys His Gly Val Gln Asn Pro Cys Val

1 5 10 15

Ile Ile Ser Asn Leu Ser Lys Ser Asn Gln Asn Lys Ser Pro Phe Ser

20 25 30

Val Ser Leu Lys Thr His Gln His Pro Arg Ala Tyr Pro Ile Ser Ser

35 40 45

Ser Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu

50 55 60

Arg Pro Leu Lys Val Met Ser Ser Val Ser Ala Asp Asn Asn Pro Asn

65 70 75 80

Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val

85 90 95

Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile

100 105 110

Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly

115 120 125

Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro

130 135 140

Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu

145 150 155 160

Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly

165 170 175

Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu

180 185 190

Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe

195 200 205

Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile

210 215 220

Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn

225 230 235 240

Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp

245 250 255

Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg

260 265 270

His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly

275 280 285

Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn

290 295 300

Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe

305 310 315 320

Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln

325 330 335

Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln

340 345 350

Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser

355 360 365

Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile

370 375 380

Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His

385 390 395 400

Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile

405 410 415

Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn

420 425 430

Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln

435 440 445

Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val

450 455 460

Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr

465 470 475 480

Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro

485 490 495

Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg

500 505 510

Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His

515 520 525

Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln

530 535 540

Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile

545 550 555 560

Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe

565 570 575

Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln

580 585 590

Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val

595 600 605

Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser

610 615 620

Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr

625 630 635 640

Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg

645 650 655

Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala

660 665 670

Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile

675 680 685

Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg

690 695 700

Claims

1.一种修饰的Cry1Ca毒素，其包含SEQ ID NO:2的残基2至68，其中SEQ ID NO:2的氨基酸残基54选自Gly和Ala，SEQ ID NO:2的氨基酸残基57选自Leu和Met，且SEQ ID NO:2的氨基酸残基68选自Val、Phe和Ile。

2.一种修饰的Cry1Ca毒素，其包含SEQ ID NO:10的残基2至628，其中SEQ ID NO:2的氨基酸残基54选自Gly和Ala，SEQ ID NO:2的氨基酸残基57选自Leu和Met，SEQ ID NO:2的氨基酸残基68选自Val、Phe和Ile，SEQ ID NO:2的氨基酸残基73选自Trp、Ala和Met，SEQ IDNO:2的氨基酸残基596选自Phe、Met和Ala，且SEQ ID NO:2的氨基酸残基620选自Leu和Phe。

3.权利要求1的修饰的Cry1Ca毒素，其还包含由SEQ ID NO:36的氨基酸残基629至1164组成的羧基末端延伸。

4.权利要求2的修饰的Cry1Ca毒素，其还包含由SEQ ID NO:36的氨基酸残基629至1164组成的羧基末端延伸。

5.权利要求1的修饰的Cry1Ca毒素，其还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。

6.权利要求2的修饰的Cry1Ca毒素，其还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。

7.权利要求3的修饰的Cry1Ca毒素，其还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。

8.权利要求4的修饰的Cry1Ca毒素，其还包含由SEQ ID NO:40的氨基酸残基1至74组成的氨基末端延伸。

9.一种修饰的Cry1Ca毒素，其选自下组：SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38和SEQ ID NO:40。

10.编码权利要求1的修饰的Cry1Ca毒素的核酸序列。

11.编码权利要求2的修饰的Cry1Ca毒素的核酸序列。

12.编码权利要求3的修饰的Cry1Ca毒素的核酸序列。

13.编码权利要求4的修饰的Cry1Ca毒素的核酸序列。

14.编码权利要求5的修饰的Cry1Ca毒素的核酸序列。

15.编码权利要求6的修饰的Cry1Ca毒素的核酸序列。

16.编码权利要求7的修饰的Cry1Ca毒素的核酸序列。

17.编码权利要求8的修饰的Cry1Ca毒素的核酸序列。

18.一种核酸序列，其选自下组：SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37和SEQ ID NO:39。

19.一种转基因植物、植物部分或种子，其能够产生一种或多种权利要求1至9的Cry1Ca毒素。

20.权利要求19的转基因植物，植物部分或种子，其选自下组：玉米、向日葵、大豆、棉花、卡诺拉、稻、高粱、小麦、大麦、蔬菜、观赏植物、辣椒类、甜菜、水果、和草坪草。

21.权利要求19的转基因植物、植物部分或种子，其选自玉米、大豆和棉花。

22.权利要求19的转基因植物、植物部分或种子，其是玉米。

23.权利要求19的转基因植物、植物部分或种子，其是大豆。

24.权利要求19的转基因植物、植物部分或种子，其是棉花。

25.一种控制植物昆虫害虫的方法，其包括种植表达一种或多种修饰的Cry1Ca毒素的转基因植物，并允许敏感害虫以所述转基因植物为食。

26.权利要求25的方法，其中所述一种或多种修饰的Cry1Ca毒素包括一种或多种权利要求1-9的修饰的Cry1Ca毒素。

27.一种控制已经对其它Cry毒素产生抗性的植物昆虫害虫的方法，其包括种植表达一种或多种修饰的Cry1Ca毒素的转基因植物，并允许敏感害虫以所述转基因植物为食。