CN111148837A - 用于控制植物有害生物的组合物和方法 - Google Patents

用于控制植物有害生物的组合物和方法 Download PDF

Info

Publication number
CN111148837A
CN111148837A CN201880024792.2A CN201880024792A CN111148837A CN 111148837 A CN111148837 A CN 111148837A CN 201880024792 A CN201880024792 A CN 201880024792A CN 111148837 A CN111148837 A CN 111148837A
Authority
CN
China
Prior art keywords
protein
plant
seq
cry
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880024792.2A
Other languages
English (en)
Other versions
CN111148837B (zh
Inventor
梅文倩
K·赛吉恩
M·布拉姆莱特
孙明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Huazhong Agricultural University
Syngenta Biotechnology China Co Ltd
Original Assignee
Syngenta Participations AG
Huazhong Agricultural University
Syngenta Biotechnology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG, Huazhong Agricultural University, Syngenta Biotechnology China Co Ltd filed Critical Syngenta Participations AG
Publication of CN111148837A publication Critical patent/CN111148837A/zh
Application granted granted Critical
Publication of CN111148837B publication Critical patent/CN111148837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Insects & Arthropods (AREA)
  • Pest Control & Pesticides (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本文披露了对鳞翅目有害生物有毒的新颖杀昆虫蛋白。编码所述杀昆虫蛋白的DNA可以用于转化原核和真核生物以表达所述杀昆虫蛋白。所述重组生物或含有所述重组生物或所述杀昆虫蛋白的组合物单独或与适当的农用载体组合可以用于控制不同环境中的鳞翅目有害生物。

Description

用于控制植物有害生物的组合物和方法
对电子提交的序列表的引用
该序列表的官方副本是以ASCII格式的序列表以2018年8月27日生成的名为“81292-CN-REG-ORG-P_SeqList_ST25.txt”的文件进行电子提交的,并且该序列表的大小为247千字节并且与本说明书同时提交。包含在该ASCII格式文件中的序列表是本说明书的一部分,并且通过引用以其全文结合在此。
技术领域
本发明涉及杀有害生物蛋白和编码它们的核酸分子,连同用于控制植物有害生物的组合物和方法。
背景技术
苏云金芽孢杆菌(Bacillus thuringiensis,Bt)是一种革兰氏阳性的孢子形成的土壤细菌,其特征在于它产生晶体包含体的能力,这些晶体包含体对于某些目以及种的植物有害生物(包括昆虫)是特异地有毒的,但是对于植物和其他非靶标生物是无害的。出于这个原因,包含苏云金芽孢杆菌菌株或它们的杀昆虫蛋白的组合物可以用作环境上可接受的杀昆虫剂以控制农业昆虫有害生物或多种人或动物疾病的昆虫载体。
来自苏云金芽孢杆菌的晶体(Cry)蛋白主要针对鳞翅目的、双翅目的、以及鞘翅目的有害生物昆虫具有有力的杀昆虫活性。这些蛋白质还已经显示针对以下目的有害生物的活性:膜翅目、同翅目、毛虱目、食毛目、以及壁虱目,连同其他的无脊椎动物目,如线虫动物门、扁形动物门、以及肉足鞭毛亚门(Feitelson,J.,1993,The Bacillus Thuringiensisfamily tree[苏云金芽孢杆菌家族树],在:Advanced Engineered Pesticides[前沿的工程化的杀有害生物剂],马塞尔德克尔公司(Marcel Dekker,Inc.),纽约,纽约州)。这些蛋白质最初主要基于它们的杀昆虫活性而被分类为CryI至CryVI。主要的类别是鳞翅目特异性(I)、鳞翅目和双翅目特异性(II)、鞘翅目特异性(III)、双翅目特异性(IV)、以及线虫特异性(V)和(VI)。这些蛋白质进一步被分类为子族;在各个家族内的更高相关的蛋白质指定了区分的字母,如CryIA、CryIB、CryIC等。在各个区分内的甚至更紧密相关的蛋白质被给定名称,例如CryIC(a)、CryIC(b)等。术语“Cry毒素”以及“δ-内毒素”与术语“Cry蛋白”已可互换地使用。对于Cry蛋白和基因的当前命名法基于氨基酸序列同源性而不是昆虫靶标特异性(Crickmore等人,(1998),Microbiol.Mol.Biol.Rev.[微生物分子生物学评论],62:807-813)。在这个更可接受的分类中,每种毒素被指定唯一的名称,所述名称合并了初级等级(阿拉伯数字)、二级等级(大写字母)、三级等级(小写字母)、以及四级等级(另一个阿拉伯数字)。在当前分类中,在初级等级中罗马数字已经换为阿拉伯数字。例如,在旧命名法下的“CryIA(a)”现在在当前命名法下是“Cry1Aa”。根据Ibrahim等人(2010,Bioeng.Bugs[生物工程学蝽象],1:31-50),Cry毒素仍然可以根据其昆虫宿主特异性被分为六个主要类别并且包括:组1—鳞翅目(例如Cry1、Cry9和Cry15);组2—鳞翅目和双翅目(例如Cry2);组3—鞘翅目(Cry3、Cry7和Cry8);组4—双翅目(Cry4、Cry10、Cry11、Cry16、Cry17、Cry19和Cry20);组5—鳞翅目和鞘翅目(Cry1I);以及组6—线虫(Cry6)。Cry1I、Cry2、Cry3、Cry10和Cry11毒素(73–82kDa)是独特的,因为它们似乎是更大Cry1和Cry4蛋白(130–140kDa)的天然截短。
Cry蛋白是在Bt的孢子形成阶段期间以结晶形式积聚为原毒素的球状蛋白质分子。在由有害生物摄取后,这些晶体典型地被溶解以释放原毒素,原毒素大小的范围可以为,例如,对于许多鳞翅目有活性的Cry蛋白如Cry1和Cry9为从130-140kDa,并且对于鞘翅目有活性的Cry3蛋白及鳞翅目/双翅目有活性的Cry2蛋白为60-80kDa。在这些晶体被易感昆虫溶解后,这些释放的原毒素被昆虫肠道中的蛋白酶例如胰蛋白酶和胰凝乳蛋白酶加工,以产生抗蛋白酶的核心Cry蛋白毒素。这种蛋白水解加工涉及从各种Cry原毒素的不同区域去除氨基酸。例如,为130-140kDa的Cry原毒素典型地通过蛋白水解去除25-30个氨基酸的N-末端肽以及C-末端的大约一半的剩余蛋白来激活,产生大约60-70kDa成熟Cry毒素。为60-80kDa的原毒素(例如Cry2和Cry3)也被加工但是其程度不与更大的原毒素相同。与更大的原毒素相比,较小的原毒素典型地从N-末端去除相等或更多个氨基酸,但较少氨基酸被从C-末端去除。例如,Cry2家族成员的蛋白水解激活典型地涉及去除大约40-50个N-末端氨基酸。许多Cry蛋白对特定的靶标昆虫是相当有毒的,但许多具有窄的活性谱。
Cry蛋白通常具有五个保守序列结构域、以及三个保守结构性结构域(参见例如,de Maagd等人,(2001)Trends Genetics[遗传学趋势],17:193-199)。第一保守结构性结构域(称作结构域I)典型地由七个α螺旋组成并且参与膜插入以及孔形成。结构域II典型地由三个布置为希腊钥匙构型的β片层组成,并且结构域III典型地由两个处于“果冻卷”(‘jelly-roll’)构造的反平行的β片层组成(de Maagd等人,2001,同上)。结构域II和III参与受体识别和结合,并且因此被认为是毒素特异性的决定物。
众多商业上有价值的植物(包括普通的农作物)易受植物有害生物(包括昆虫和线虫有害生物)的攻击的影响,导致作物产量和品质的实质性降低。例如,植物有害生物是在全世界重要农作物损失中的主要因素。由于昆虫有害生物和疾病,在中国每年收获的谷类损失约15%-20%。此外,由于无脊椎有害生物(包含昆虫)的侵染,仅在美国每年就损失约80亿美元。昆虫有害生物对于菜农和果农,对于观赏性花卉的生产商,以及对于家庭花匠也是负担。
昆虫有害生物主要是通过密集施用化学杀有害生物剂来控制,这些化学杀有害生物剂通过抑制昆虫成长、预防昆虫摄食或繁殖、或者导致死亡而有效。生物性有害生物控制剂,如表达杀有害生物毒素(如Cry蛋白)的苏云金芽孢杆菌菌株,也已经施用于作物植物中,产生了令人满意的结果,提供化学杀有害生物剂的替代物或补充物。已经分离了编码这些Cry蛋白中的一些的基因并且它们在异源宿主(如转基因植物)中的表达已经显示出提供了另一种用于控制经济上重要的昆虫有害生物的手段。
因此可以达到良好的昆虫控制,但是某些化学品有时也能影响非目标有益昆虫,并且某些生物制剂具有非常窄的活性谱。此外,某些化学和生物控制方法的继续使用增加了昆虫有害生物对此类控制措施产生抗性的机会。通过各种抗性管理实践已部分地缓和了这种状况,但仍需要开发新的并有效的有害生物控制剂,这些有害生物控制剂为农民提供经济利益并且是环境可接受的。特别需要的是可以靶向更广谱的经济上重要的昆虫有害生物并有效控制昆虫品系的控制剂,这些昆虫品系对现有的昆虫控制剂是有抗性的或可以变得有抗性。
发明内容
鉴于这些需求,本发明的目的是通过提供可以用来控制多种植物有害生物的新颖基因和杀有害生物蛋白来提供新的有害生物控制剂。
本发明提供了用于赋予细菌、植物、植物细胞、组织以及种子的杀有害生物活性的组合物以及方法。特别地,提供了包含衍生自组装的多核苷酸、编码Cry蛋白的新颖多核苷酸的嵌合基因以及基本上与其相同的序列,这些序列的表达产生具有对经济上重要的昆虫有害生物(特别是侵染植物的昆虫有害生物)的毒性的蛋白质。本发明进一步涉及由这些多核苷酸的表达产生的新颖Cry蛋白,并且涉及含有这些Cry蛋白的组合物以及配制品,它们通过抑制昆虫有害生物的生存、生长以及繁殖或者限制昆虫相关的对作物植物的损害或损失的能力对昆虫是有毒的。本发明的Cry蛋白包括衍生自组装的多核苷酸的Cry蛋白以及具有一个或多个氨基酸取代、添加或缺失的突变型或变体Cry蛋白。突变型Cry蛋白的实例包括但不限于被突变为具有比天然Cry蛋白对应物更宽的活性谱或更高的特异活性的那些,经突变以引入表位来产生从天然蛋白质中差异性地识别出经突变的蛋白质的抗体的那些,或经突变以调节在转基因生物中的表达的那些。本发明的新颖Cry蛋白对昆虫有害生物是高毒性的。例如,本发明的Cry蛋白可以用于控制一种或多种经济学上重要的昆虫有害生物,这些昆虫有害生物例如亚洲玉米蛀虫(Asian corn borer)(亚洲玉米螟(Ostriniafurnacalis))、黑色地老虎(black cutworm)(小地老虎(Agrotis ipsilon))、棉螟蛉(cotton bollworm)(棉铃虫(Helicoverpa armigera))、黄色桃螟虫(yellow peachborer)(桃蛀螟(Conogethes punctiferalis))、东方黏虫(Oriental armyworm)(东方粘虫(Mythimna sepatate))、欧洲玉米蛀虫(European corn borer)(欧洲玉米螟(Ostrinianubilalis))、秋黏虫(fall armyworm)(草地贪夜蛾(Spodoptera frugiperda))、玉米穗蛾(corn earworm)(玉米穗虫(Helicoverpa zea))、甘蔗螟(sugarcane borer)(小蔗螟(Diatraea saccharalis))、绒毛豆毛虫(velvetbean caterpillar)(黎豆夜蛾(Anticarsia gemmatalis))、大豆夜蛾(soybean looper)(大豆尺蠖(Chrysodeixisincludes))、西南玉米蛀虫(southwest corn borer)(西南玉米螟(Diatraeagrandiosella))、西部豆切根虫(western bean cutworm)(西部豆夜蛾(Richiaalbicosta))、烟夜蛾(tobacco budworm)(烟芽夜蛾(Heliothis virescens))、条纹蛀茎虫(striped stem borer)(二化螟(Chilo suppressalis))、粉蛀茎虫(pink stem borer)(非洲大螟(Sesamia calamistis))、水稻卷叶螟(rice leaffolder)(稻纵卷叶螟(Cnaphalocrocis medinalis))等。
本发明还提供了合成多核苷酸,其编码本发明的Cry蛋白,这些Cry蛋白已经进行一个或多个密码子优化用于在转基因生物如转基因细菌或转基因植物中表达。
本发明进一步涉及表达盒和重组载体,其包含编码本发明的Cry蛋白的多核苷酸。本发明还提供了包含嵌合基因、或表达盒或重组载体的经转化的细菌、植物、植物细胞、组织、以及种子,该嵌合基因或表达盒或重组载体在经转化的细菌、植物、植物细胞、组织以及种子中表达本发明的Cry蛋白方面是有用的。
本发明还涉及分离的苏云金芽孢杆菌(Bt)菌株,这些菌株产生本发明的Cry蛋白。
本发明还涉及使用这些本发明的多核苷酸的方法,例如在DNA构建体或嵌合基因或表达盒或重组载体中用于在生物(包括植物和微生物,如细菌)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(如植物或细菌)中表达的组装的、天然的或密码子优化的序列,或者制成杂合的、具有增强的杀有害生物活性的Cry毒素。本发明进一步涉及制备这些Cry蛋白的方法以及使用这些多核苷酸序列和Cry蛋白的方法,例如,在微生物中控制昆虫或者在转基因植物中赋予保护免受昆虫损害。
本发明的另一个方面包括杀昆虫组合物和配制品,这些组合物和配制品包含本发明的Cry蛋白或苏云金芽孢杆菌菌株;以及使用这些组合物或配制品来控制昆虫群体的方法,例如通过将这些组合物或配制品施用至昆虫侵袭的区域,或者施用至预防性处理易感染昆虫的区域或植物以赋予针对昆虫有害生物的保护。任选地,除本发明的Cry蛋白或Bt菌株之外,本发明的这些组合物或配制品还可以包含其他杀有害生物剂(如化学杀有害生物剂)以加强或增强组合物或配制品的昆虫控制能力。
本发明的这些组合物和方法可用于控制攻击植物、特别是作物植物的昆虫有害生物。本发明的这些组合物对于产生改变的或改进的具有杀有害生物活性的Cry蛋白、或对于检测商用产品或转基因生物中的Cry蛋白或核酸的存在也是有用的。
参考以下详细说明书和权利要求书,本发明的这些和其他特征、方面、以及优点将变得更好理解。
序列表中的序列简述
SEQ ID NO:1代表对BT264蛋白进行编码的核苷酸序列。
SEQ ID NO:2代表对BT288蛋白进行编码的核苷酸序列。
SEQ ID NO:3代表对BT302蛋白进行编码的核苷酸序列。
SEQ ID NO:4代表对BT454蛋白进行编码的核苷酸序列。
SEQ ID NO:5代表对BT485蛋白进行编码的核苷酸序列。
SEQ ID NO:6代表对BT264蛋白进行编码的密码子优化序列。
SEQ ID NO:7代表对BT288蛋白进行编码的密码子优化序列。
SEQ ID NO:8代表对BT302蛋白进行编码的密码子优化序列。
SEQ ID NO:9代表对BT454蛋白进行编码的密码子优化序列。
SEQ ID NO:10代表对BT485蛋白进行编码的密码子优化序列。
SEQ ID NO:11代表对突变型BT264蛋白进行编码的核苷酸序列。
SEQ ID NO:12代表对突变型BT288蛋白进行编码的核苷酸序列。
SEQ ID NO:13代表对突变型BT302蛋白进行编码的核苷酸序列。
SEQ ID NO:14代表对突变型BT454蛋白进行编码的核苷酸序列。
SEQ ID NO:15代表对突变型BT485蛋白进行编码的核苷酸序列。
SEQ ID NO:16代表BT264蛋白的氨基酸序列。
SEQ ID NO:17代表BT288蛋白的氨基酸序列。
SEQ ID NO:18代表BT302蛋白的氨基酸序列。
SEQ ID NO:19代表BT454蛋白的氨基酸序列。
SEQ ID NO:20代表BT485蛋白的氨基酸序列。
SEQ ID NO:21代表突变型BT264蛋白的氨基酸序列。
SEQ ID NO:22代表突变型BT288蛋白的氨基酸序列。
SEQ ID NO:23代表突变型BT302蛋白的氨基酸序列。
SEQ ID NO:24代表突变型BT454蛋白的氨基酸序列。
SEQ ID NO:25代表突变型BT485蛋白的氨基酸序列。
SEQ ID NO:26代表SEQ ID NO:17的N-末端。
SEQ ID NO:27代表SEQ ID NO:17的C-末端。
SEQ ID NO:28代表SEQ ID NO:18的N-末端。
SEQ ID NO:29代表SEQ ID NO:18的C-末端。
SEQ ID NO:30代表SEQ ID NO:20的N-末端。
SEQ ID NO:31代表SEQ ID NO:20的C-末端。
SEQ ID NO:32是Cry54Aa蛋白的氨基酸序列。
SEQ ID NO:33是Cry4Aa蛋白的氨基酸序列。
SEQ ID NO:34是Cry39Aa蛋白的氨基酸序列。
SEQ ID NO:35是Cry19Ca蛋白的氨基酸序列。
SEQ ID NO:36是Cry50Ba蛋白的氨基酸序列。
SEQ ID NO:37是Cry4Ba蛋白的氨基酸序列。
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明考虑了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。此外,鉴于本披露内容,在此建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,在此所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在此本发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。
定义
当在此和所附权利要求书中使用时,单数形式“一个/种(a/an)”和“该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等。
如在此使用的,词语“和/或”是指并且涵盖一个或多个相关联的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。
术语“约”在此用于意指大约、大致、约或在……左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐明的数值来限定这个范围。通常,术语“约”在此用于将数值限定至以20%的变化,优选地10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,精确值(即,无“约”)是优选的。
如在此使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。扩增系统包括聚合酶链式反应(PCR)系统、连接酶链式反应(LCR)系统、基于核酸序列的扩增(NASBA,安大略省密西索加的坎基尼公司(Cangene,Mississauga,Ontario))、Q-β复制酶系统、基于转录的扩增系统(TAS)、以及链置换扩增(SDA)。参见例如,Diagnostic Molecular Microbiology:Principles andApplications[诊断分子微生物学:原理与应用],PERSING等人编著,华盛顿美国微生物学会(American Society for Microbiology,Washington,D.C.),(1993)。扩增产物被称为“扩增子”。
根据本发明的“组装的序列”、“组装的多核苷酸”、“组装的核苷酸序列”等是通过比对多核苷酸或测序的多核苷酸的部分(即k-mer,通过DNA测序获得的读数的长度k的所有可能的子序列)的重叠序列制备的合成多核苷酸,其使用DNA测序技术从基因组DNA确定。组装的序列典型地含有碱基识别(base-calling)错误,与获得基因组DNA的基因组中包含的天然DNA序列相比,碱基识别错误可能是错误确定的碱基、插入和/或缺失。因此,例如,“组装的多核苷酸”可以编码蛋白质,并且根据本发明,该多核苷酸和该蛋白质二者都不是天然产物,而是仅通过人类行为而存在。
如在此使用的术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”(或类似术语)是指如下构建体或分子,该构建体或分子包含被组装进单个核酸分子中的不同来源的两个或更多个多核苷酸。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,该构建体或分子含有但不限于(1)多核苷酸(例如,DNA),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白质部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包含衍生自不同来源的调节多核苷酸和编码多核苷酸,或包含衍生自相同来源、但以与在自然界中所发现的不同的方式进行布置的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、特别地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。
“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。优选地,RNA进而在生物中被翻译以产生蛋白质。
如在此使用的,“密码子优化的”序列意指如下核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由待优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组DNA构建体的DNA序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014,通过引用结合在此。
“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
术语“包含(comprises或comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。
如在此使用的,过渡短语“基本上由...组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由...组成”并不旨在被解释为等同于“包含(comprising)”。
在本发明的上下文中,“对应于(corresponding to或corresponds to)”意指当变体或同系物Cry蛋白的氨基酸序列与彼此比对时,“对应于”在该变体或同系物蛋白中某些枚举的位置的氨基酸是与参考蛋白中的这些位置比对的那些,但在相对于本发明的特定参考氨基酸序列而言的这些精确的数字位置中是不必要的。例如,如果SEQ ID NO:20是参考序列并且与SEQ ID NO:27比对的话,SEQ ID NO:27的Gln151“对应于”SEQ ID NO:20的Gln144,或者例如,SEQ ID NO:27的Asn301“对应于”SEQ ID NO:20的Thr294。
如在此使用的,术语“Cry蛋白”意指可以在苏云金芽孢杆菌或相关细菌中以结晶形式存在的杀昆虫蛋白。术语“Cry蛋白”可以指原毒素形式或其任何杀昆虫片段或毒素。
“递送”组合物或毒性蛋白意指该组合物或毒性蛋白与昆虫接触,这促进该组合物或毒性蛋白的经口摄取,产生对昆虫的毒性作用和控制。可以按照许多公认的方式,包括但不限于转基因植物表达、一种或多种配制的蛋白质组合物、一种或多种可喷洒的蛋白质组合物、饵基(bait matrix)、或任何其他的领域公认的蛋白质递送系统来递送该组合物或毒性蛋白。
术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白质的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白质同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽组。
“有效的昆虫控制量”意指毒性蛋白的浓度,它通过毒性作用抑制昆虫存活、生长、摄食或繁殖的能力,或者限制昆虫相关的损害或作物植物损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“有效的昆虫控制量”可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
如在此使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种目的多核苷酸(例如编码本发明的Cry蛋白的多核苷酸)的表达的核酸序列,包括启动子,该启动子可操作地连接至目的多核苷酸,该多核苷酸可操作地连接至终止信号。“表达盒”还典型地包含正确翻译目的多核苷酸所需的另外的多核苷酸。该表达盒还可以包含在目的多核苷酸的直接表达中不是必需的但是由于用于从一个表达载体去除该表达盒的方便限制位点而存在的其他多核苷酸。包含一个或多个目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即在该表达盒中的目的多核苷酸不是天然存在于该宿主细胞中的,并且必须已经通过转化过程或育种过程引入到该宿主细胞或该宿主细胞的祖先中。该表达盒中的一个或多个目的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。
“基因”在此定义为包含一个或多个多核苷酸的遗传单位,该遗传单位占据染色体或质粒上特定位置并且含有用于生物中的特定特征或性状的遗传指令。
“肠蛋白酶”是在昆虫的消化道中天然发现的蛋白酶。这种蛋白酶通常参与被摄取的蛋白质的消化。肠蛋白质酶的实例包括胰蛋白酶,其典型地切割赖氨酸(K)或精氨酸(R)残基的C-末端侧上的肽;以及胰凝乳蛋白酶,其典型地切割苯丙氨酸(F)、色氨酸(W)或酪氨酸(Y)的C-末端侧上的肽。
当提及基因或多核苷酸或多肽使用时,术语“异源”是指基因或多核苷酸或多肽不是在其天然环境中或包含其非天然环境中存在的一部分(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的多核苷酸。异源基因还可以包括对生物来说是天然的多核苷酸,该多核苷酸已经以一些方式(例如,经突变;以多个拷贝添加;连接至一种非天然启动子或增强子多核苷酸等)被改变。异源基因可以进一步包含植物基因多核苷酸,其包含植物基因的cDNA形式;这些cDNA可以以正义方向(以产生mRNA)或反义方向(以产生一种反义RNA转录本,其与mRNA转录本是互补的)被表达。在本发明的一个方面,异源基因区别于内源性植物基因在于该异源基因多核苷酸被典型地连接至包含调节元件如启动子的多核苷酸上,未发现这些多核苷酸与由该异源基因编码的蛋白质的基因或与该染色体中的植物基因多核苷酸天然相关联,或者与在自然界中未发现的染色体的部分(例如,在基因座中表达的基因,其中该基因未正常表达)相关联。另外,“异源”多核苷酸是指不与将多核苷酸引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。
“同源重组”是在相同的多核苷酸的区域中成对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“交叉”)。“重组事件”在此被理解为意指减数分裂交叉。
当核酸序列编码了多肽(该多肽与由参考核酸序列所编码的多肽具有相同的氨基酸序列)时,该核酸序列与参考核酸序列“同类编码”。例如,SEQ ID NO:6与SEQ ID NO:1为同类编码,因为它们都编码由SEQ ID NO:16代表的氨基酸序列。
术语“分离的”核酸分子、多核苷酸或蛋白质是不再存在于其天然环境中的核酸分子、多核苷酸或蛋白质。本发明的分离的核酸分子、多核苷酸或蛋白质可以按照纯化的形式存在,或者可以存在于重组宿主中,例如转基因细菌或转基因植物中。因此,如在此所列举的对“分离的”核酸分子的要求涵盖当核酸分子包含在转基因植物基因组内时的核酸分子。
“核酸分子”是可以从任何来源中分离的或可以合成制备的单链或双链DNA或RNA。在本发明的上下文中,该核酸分子优选地是DNA区段。
“可操作地连接”是指在单一核酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能RNA的表达时(即,该编码多核苷酸或功能RNA处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能RNA是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。
如在此使用的“杀有害生物”、“杀昆虫”等是指本发明的Cry蛋白控制有害生物的能力或者可以控制如在此所定义的有害生物的Cry蛋白的量。因此,杀有害生物Cry蛋白可以杀死或抑制有害生物(例如,昆虫有害生物)存活、生长、摄食、或繁殖的能力。
“植物”是在发育的任何阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。
“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花蕾或胚。
如在此使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。
“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括DNA、RNA、经修饰的寡核苷酸(例如,包含对于生物RNA或DNA不典型的碱基的寡核苷酸,如2'-O-甲基化寡核苷酸)等。在一些实施例中,核酸或多核苷酸可以是单链的、双链的、多链的或其组合。除非另外指示,否则本发明的具体核酸或多核苷酸任选地包含或编码除明确指示的任何多核苷酸之外的互补多核苷酸。
“目的多核苷酸”是指任何多核苷酸,当其转移至生物(例如,植物)中时赋予该生物所希望的特征,如昆虫抗性、疾病抗性、除草剂耐受性、抗生素抗性、改进的营养价值、工业过程中改进的性能、商业上有价值的酶或代谢物的生产、或者改变的繁殖能力。
术语“启动子”是指多核苷酸,通常在它的编码多核苷酸的上游(5'),它通过提供对正确转录所需的RNA聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。
“原生质体”是分离的植物细胞,没有细胞壁或仅具有部分的细胞壁。
如在此使用的,术语“重组”是指核酸分子(例如,DNA或RNA)或蛋白质或生物的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如在此使用的,“重组核酸分子”是包括多核苷酸组合的核酸分子,这些多核苷酸不会天然地一起存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,或人工合成的(例如,使用组装的核苷酸序列合成的多核苷酸)并且包含偏离通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,或包含人工掺入至宿主细胞的基因组DNA中和该宿主细胞基因组相关侧翼DNA中的转基因的核酸分子。重组核酸分子的另一个实例是由将转基因插入至植物的基因组DNA中产生的DNA分子,其可以最终导致该生物中的重组RNA/或蛋白质分子的表达。如在此使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,该重组植物明显不同于相关的野生型植物。
“调节元件”是指参与控制核苷酸序列的表达的序列。调节元件包含可操作地连接至目的核苷酸序列的启动子以及终止信号。它们还典型地涵盖适当翻译该核苷酸序列所需的序列。
在两个核酸或氨基酸序列的上下文中,术语“同一性”或“相同的”或“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少60%、优选至少80%、更优选90%、甚至更优选95%、并且最优选至少99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,该基本的同一性存在于整个具有长度为至少约50个残基或碱基的序列的区域中,更优选地在整个至少约100个残基或碱基的区域中,并且最优选地这些序列在至少约150个残基或碱基上是基本上相同的。在尤其优选的实施方式中,在整个编码区域长度中的序列是基本上相同的。此外,基本上相同的核酸或氨基酸序列基本上执行相同的功能。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。
用于比较的序列的最佳比对可以按照以下方式进行,例如通过Smith和Waterman,Adv.Appl.Math.[应用数学进展]2:482(1981)的局部同源性算法、通过Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443(1970)的同源比对算法、通过Pearson和Lipman,Proc.Nat'l.Acad Sci.USA[美国国家科学院院刊]85:2444(1988)的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算机组(Genetics Computer Group),科学街575号(575ScienceDr.),麦迪逊,威斯康星州),或通过目测检查(总体上参见Ausubel等人,下文)。
适合于确定序列同一性百分比以及序列相似性的算法的一个实例是BLAST算法,其描述于以下文献中:Altschul等人,J.Mol.Biol.[分子生物学杂志]215:403-410(1990)。执行BLAST分析的软件是通过国家生物技术信息中心(the National Center forBiotechnology Information,美国国家医学图书馆(U.S.National Library ofMedicine),洛克维尔大道8600号(8600Rockville Pike),贝塞斯达,马里兰州20894美国)可供公众使用的。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈(Altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff和Henikoff,Proc.Natl.Acad Sci.USA[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分比之外,BLAST算法还进行两个序列之间相似性的统计分析(参见例如,Karlin和Altschul,Proc.Nat'l.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。
两个核酸序列基本上相同的另一个指示是这两种分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)DNA或RNA中时进行的。“基本上结合”是指在探针核酸与靶核酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格来容纳,以实现靶核酸序列的所希望的检测。
在核酸杂交实验(如DNA杂交和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列在较高的温度下特异性杂交。对核酸杂交的广泛指导见于以下文献中:Tijssen(1993)LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy of nucleic acidprobe assays[杂交原理和核酸探针测定策略综述]”Elsevier[爱思唯尔集团],纽约。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶子序列进行杂交,但不会与其他序列杂交。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的Tm。对于互补核酸(它们在DNA或RNA印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15M NaCl在72℃下持续约15分钟。严格洗涤条件的实例是0.2×SSC洗涤在65℃下持续15分钟(参见,Sambrook,下文,对于SSC缓冲剂的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的中等严格洗涤的实例是1×SSC在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6×SSC在40℃下持续15分钟。对于短探针(例如,约10-50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0-8.3下约0.01至1.0M的Na离子浓度(或其他盐类),并且该温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的核酸所编码的蛋白质是基本上相同的,则它们仍然是基本上相同的。例如,当使用遗传密码允许的最大程度的密码子简并而生成核酸的拷贝时,则发生这种情况。
以下是可以用来克隆同源核苷酸序列(这些序列与本发明的参考核苷酸序列基本上相同)的杂交/洗涤条件的设置的实例:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在2×SSC、0.1%SDS中在50℃洗涤;更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在1×SSC、0.1%SDS中在50℃洗涤;仍更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.5×SSC、0.1%SDS中在50℃洗涤;优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在50℃洗涤;更优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在65℃洗涤。
两个核酸序列或蛋白质基本上相同的另一个指示是由第一核酸编码的蛋白质与由第二核酸编码的蛋白质进行免疫性交联反应或与其特异性结合。因此,蛋白质典型地是与第二蛋白质基本上相同的,例如其中这两种蛋白质仅在保守性取代上不同。
如在此使用的,“合成多核苷酸”是指包含天然存在的多核苷酸中不存在的碱基或结构性特征的多核苷酸。例如,编码本发明的Cry蛋白的合成多核苷酸(其包含更类似于双子叶植物或单子叶植物基因的G+C含量和正常密码子分布的核苷酸序列)被表述为合成的。本发明的合成多核苷酸还可以例如包含本发明的组装的核苷酸序列。
如在此使用的,对昆虫有害生物是“有毒的”Cry蛋白意指该Cry蛋白充当口服活性的昆虫控制剂以杀死昆虫有害生物,或者该Cry蛋白能够破坏或阻止昆虫摄食、或引起对昆虫有害生物的生长抑制,其两者可以引起或可以不引起昆虫死亡。当本发明的Cry蛋白被递送至昆虫或昆虫与Cry蛋白进行经口接触时,结果典型地是该昆虫的死亡、或者该昆虫的生长减慢、或者该昆虫停止以使该有毒的Cry蛋白可供该昆虫利用的来源为食。
“转化”是用于将异源核酸引入到宿主细胞或生物的方法。特别地,“转化”意指DNA分子稳定地整合到目的生物的基因组中。
“转化的/转基因的/重组的”是指异源核酸分子已经引入其中的宿主生物如细菌或植物。核酸分子可以稳定地整合进入宿主基因组,或者,核酸分子也可以作为染色体外分于存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含该异源的核酸分子的野生型生物,例如细菌或植物。
在此的核苷酸通过以下标准缩写进行指示:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。氨基酸也由以下标准缩写进行指示:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;1)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。
本发明提供了用于控制有害的植物有害生物的组合物以及方法。特别地,本发明涉及由基因组DNA组装的核苷酸序列编码的Cry蛋白,其可以分离自细菌如苏云金芽孢杆菌,其对昆虫有害生物是有毒的;涉及包含编码这些Cry蛋白的核苷酸序列的组装的多核苷酸和相关多核苷酸;以及涉及制备和使用这些组装的多核苷酸和相关多核苷酸以及Cry蛋白来控制昆虫有害生物。
根据一些实施例,本发明提供核酸分子或任选地分离的核酸分子,该核酸分子包含以下、或基本上由以下组成、或由以下组成:编码处于其原毒素形式的Cry蛋白或其生物活性或毒素片段的核苷酸序列,其中该核苷酸序列(a)与SEQ ID NO:1-5中任一项或其毒素编码片段的组装的序列具有至少80%到至少99%序列同一性;或者(b)编码包含氨基酸序列的蛋白质,该氨基酸序列与SEQ ID NO:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性;或者(c)是(a)或(b)的组装的核苷酸序列;或者(d)是(a)、(b)或(c)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,该核苷酸序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:1-5中任一项的任何毒素编码片段。在其他实施例中,该合成核苷酸序列包含SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、或SEQ ID NO:6-15中任一项的任何毒素编码片段。
本发明还涵盖多核苷酸,其是Cry蛋白原毒素编码多核苷酸的片段。“片段”旨在编码Cry蛋白的核苷酸序列的一个部分。核苷酸序列的片段可以编码Cry蛋白的生物活性部分,即所谓的“毒性片段”,或它可以是如下片段,使用以下披露的方法该片段可以用作杂交探针或PCR引物。核酸分子是Cry蛋白编码核苷酸序列的片段,根据所期望的用途包括至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸,或高达存在于在此披露的全长Cry蛋白编码核苷酸序列中的核苷酸的数目(例如,针对SEQ ID NO:1是3519个核苷酸)。“连续的”核苷酸旨在彼此直接相邻的核苷酸残基。本发明的核苷酸序列的一些片段将编码保留Cry蛋白的生物活性、并且因此保留杀昆虫活性的毒性片段。“保留杀昆虫活性”旨在该片段将具有至少约30%、优选地至少约50%、更优选地至少约70%、甚至更优选地至少约80%的Cry蛋白的杀昆虫活性。用于测量杀昆虫活性的方法在本领域是已熟知的。参见例如,Czapla和Lang,(1990),J.Econ.Entomol.[经济昆虫学杂志]83:2480-2485;Andrews等人,(1988),Biochem.J.[生物化学杂志]252:199-206;Marrone等人,(1985),J.of Economic Entomology[经济昆虫学杂志]78:290-293;以及美国专利号5,743,477,将其全部通过引用以其全文结合在此。
本发明的Cry蛋白的毒素片段将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、和450个连续的氨基酸,或高达存在于本发明的全长Cry蛋白中的总数目的氨基酸(例如,针对SEQ ID NO:16是1173个氨基酸)。
在一些实施例中,本发明的核酸分子包含以下、或基本上由以下组成、或由以下组成:编码Cry蛋白的核苷酸序列,该Cry蛋白包含氨基酸序列,该氨基酸序列与SEQ ID NO:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性。在一些其他实施例中,该氨基酸序列包含以下、或基本由以下组成、或由以下组成:SEQ ID NO:16-20中任一项或其毒素片段。因此,在一些实施例中,借助于蛋白酶水解加工(例如通过从昆虫的肠中制备的蛋白酶)而已经被激活的Cry蛋白可以被表征并且经激活的毒素片段的N-末端或C-末端氨基酸被鉴定。在本发明的这个方面,技术人员可以确定:例如,SEQ ID NO:16的毒素片段可包含SEQ ID NO:16的约26-605或约26-617或约26-628的氨基酸,或者SEQ ID NO:17的毒素片段可包含SEQ ID NO:17的从约45、或从约53至约622或约624、或至约642或至约662的氨基酸,或者SEQ ID NO:18的毒素片段可包含SEQ ID NO:18的从约氨基酸11、或从约氨基酸13、或从约氨基酸35、或从约氨基酸47至约氨基酸628、或至约氨基酸662的氨基酸,或者SEQ ID NO:19的毒素片段可包含SEQ ID NO:19的从约氨基酸24、或从氨基酸35、或从氨基酸47、或从氨基酸49至约氨基酸660、或至氨基酸670的氨基酸,或者SEQ ID NO:20的毒素片段可包含SEQ ID NO:20的从约氨基酸17、或从约氨基酸18、或从约氨基酸32、或从约氨基酸37至约氨基酸610、或至约氨基酸636、或至约氨基酸652、或至约氨基酸657、或至约氨基酸660、或至约氨基酸671的氨基酸,或者通过在该编码序列的适当位置处引入或消除蛋白酶加工位点以允许或消除昆虫、植物或微生物蛋白酶对更大变体蛋白质的蛋白水解切割而产生的Cry蛋白变体的毒素片段也在本发明的范围内。此类操作的最终结果被理解为产生具有与完整Cry原毒素蛋白相同或更好活性的毒素片段分子。
在本发明的一些实施例中,提供了嵌合基因,该嵌合基因包含异源启动子,该启动子可操作地连接至多核苷酸,该多核苷酸包含以下、或基本上由以下组成、或由以下组成:编码对于鳞翅目有害生物有毒的Cry蛋白的核苷酸序列,其中该核苷酸序列(a)与SEQ IDNO:1-5中任一项或其毒素编码片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(b)编码包含如下氨基酸序列的蛋白质,该氨基酸序列与SEQ ID NO:16-20中任一项或其毒素片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
在其他实施例中,该异源启动子是植物可表达型启动子。例如但不限于,该植物可表达型启动子选自下组启动子,该组由以下组成:泛素、夜香树属黄病毒、玉米TrpA、OsMADS6、玉蜀黍H3组蛋白、噬菌体T3基因9 5'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基RuBP羧化酶、水稻肌动蛋白、水稻亲环蛋白、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白(potato patatin)、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
在另外的实施例中,由嵌合基因编码的蛋白质对一种或多种鳞翅目有害生物是有毒的,这些鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。
在另外的实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:1或其毒素编码片段具有至少85%到至少99%序列同一性,或者与SEQ ID NO:2或其毒素编码片段具有至少95%到至少99%序列同一性,或者与SEQ ID NO:3或其毒素编码片段具有至少90%到至少99%序列同一性,或者与SEQ IDNO:4或其毒素编码片段具有至少90%到至少99%序列同一性,或者与SEQ ID NO:5或其毒素编码片段具有至少95%到至少99%序列同一性。在其他实施例中,该多核苷酸包含以下、基本由以下组成、或由以下组成:SEQ ID NO:1-5中任一项或其毒素编码片段。
在其他实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白质的核苷酸序列,该蛋白质包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与SEQ ID NO:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:16或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在另外的实施例中,该氨基酸序列与SEQ ID NO:17或其毒素片段具有至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该氨基酸序列与SEQ ID NO:18或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:19或其毒素片段具有至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:20或其毒素片段具有至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列的合成序列,与SEQ ID NO:6-15中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白质的核苷酸序列的合成序列,该蛋白质包含如下氨基酸序列,该氨基酸序列与SEQ ID NO:16-25中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在另外的实施例中,该转基因生物是转基因细菌或转基因植物。
在一些实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列编码对于鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列与SEQ ID NO:6-15中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列编码对于鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列编码如下氨基酸序列,该氨基酸序列与SEQ ID NO:16-25中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
可以使用来自苏云金芽孢杆菌(Bt)菌株的基因组来组装本发明的Cry蛋白。Bt菌株可以通过标准技术分离并且测试对本发明的鳞翅目有害生物的毒性或用于分离基因组DNA而不测试Bt菌株对昆虫的毒性。通常,Bt菌株可以通过本领域中已知的方法分离自任何环境样品,包括土壤、植物、昆虫、谷物升降机粉尘、以及其他样品材料等。参见例如,Travers等人,(1987),Appl.Environ.Microbiol.[应用与环境微生物学]53:1263-1266;Saleh等人,(1969),Can J.Microbiol.[加拿大微生物学杂志]15:1101-1104;DeLucca等人,(1981),Can J.Microbiol.[加拿大微生物学杂志]27:865-870;以及Norris等人,(1981),“The genera Bacillus and Sporolactobacillus[芽孢杆菌属和芽孢乳杆菌属]”,于Starr等人,(编著),The Prokaryotes:A Handbook on Habitats,Isolation,andIdentification of Bacteria[原核生物:关于细菌的栖息地、分离和鉴定手册],第II卷,施普林格出版社(Springer-Verlog)柏林海德堡。分离之后,可以测试Bt菌株对于昆虫有害生物的毒性并且可以鉴定由本发明涵盖的Cry蛋白。因此,在一些实施例中,本发明提供了分离的苏云金芽孢杆菌(Bt)菌株,该菌株产生Cry蛋白或重组Cry蛋白,该Cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与SEQ ID NO:16-25中任一项具有至少80%到至少99%序列同一性。在仍另外的实施例中,该Cry蛋白或重组Cry蛋白包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:16-25中的任一项。
根据一些实施例,本发明提供Cry蛋白和任选地分离的Cry蛋白,其对于鳞翅目有害生物是有毒的,其中该Cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)氨基酸序列,该氨基酸序列与SEQ ID NO:16-25中任一项或其毒素片段具有至少80%序列同一性到至少99%序列同一性;或者(b)氨基酸序列,该氨基酸序列由核苷酸序列或组装的核苷酸序列编码,该核苷酸序列与由SEQ ID NO:6-15中任一项代表的核苷酸序列或其毒素编码片段具有至少80%序列同一性到至少99%序列同一性。
在其他实施例中,该Cry蛋白或分离的Cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与SEQ ID NO:16-25中任一项或其毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与SEQ ID NO:16或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:17或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在另外的实施例中,该氨基酸序列与SEQ ID NO:18或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该氨基酸序列与SEQ ID NO:19或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:20或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,该氨基酸序列包含以下、基本由以下组成、或由以下组成:SEQID NO:16-25中任一项或其毒素片段。在其他实施例中,该氨基酸序列是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:6-15中任一项或其毒素编码片段。
在其他实施例中,本发明的Cry蛋白对鳞翅目有害生物是有毒的,该鳞翅目有害昆虫选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。在其他实施例中,本发明的Cry蛋白对至少亚洲玉米蛀虫(亚洲玉米螟)是有毒的。
在一些实施例中,本发明涵盖重组Cry蛋白,其对于鳞翅目有害生物是有毒的,其中该重组Cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)氨基酸序列,该氨基酸序列与由SEQ ID NO:21-25中任一项代表的氨基酸序列或其毒素片段具有至少80%到至少99%序列同一性;或者(b)氨基酸序列,该氨基酸序列由如下核苷酸序列编码,该核苷酸序列与由SEQ ID NO:11-15中任一项代表的核苷酸序列或其毒素编码片段具有至少80%到至少99%序列同一性。
在其他实施例中,该重组Cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与SEQ ID NO:21-25中任一项或其毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与SEQ ID NO:21或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:22或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:23或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:24或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:25或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该重组Cry蛋白包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:21-25中任一项的氨基酸序列或其毒素片段。在其他实施例中,该重组Cry蛋白是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本由以下组成、或由以下组成:SEQ ID NO:11-15中任一项或其毒素编码片段。
本发明还涵盖响应于通过组装的或突变型BT-0264、BT-0288、BT-0302、BT-0454和BT-0485、或相关Cry蛋白(包括天然Cry蛋白)的免疫激发而产生的抗体。此类抗体可以使用生产多克隆抗血清的标准免疫学技术生产,并且如果需要的话,无限增殖免疫宿主的抗体产生细胞用于单克隆抗体生产源。用于生产针对任何感兴趣物质的抗体的技术是熟知的,例如,如在以下文献中:Harlow和Lane(1988,Antibodies a laboratory manual.[抗体:实验室手册],第726页,冷泉港实验室)以及如在Goding(Monoclonal Antibodies:Principles&practice[单克隆抗体:原理与实践]1986,学术出版社公司(Academic Press,Inc.),奥兰多,佛罗里达州)。本发明涵盖杀昆虫蛋白,其与抗体、特别是单克隆抗体交叉反应,产生了针对本发明的杀昆虫Cry蛋白中的一种或多种。
本发明中生产的这些抗体在用于确定生物样品中组装的或突变型BT-0264、BT-0288、BT-0302、BT-0454和BT-0485Cry蛋白、或相关Cry蛋白(包括天然Cry蛋白)的量或存在的免疫测定中也是有用的。此类测定在质量控制生产含有本发明的Cry蛋白中的一种或多种或相关毒性蛋白的组合物中也是有用的。此外,这些抗体可以用来评估本发明的Cry蛋白中的一种或多种或相关蛋白的重组生产的功效,连同针对编码本发明的Cry蛋白中的一种或多种的核苷酸序列或相关蛋白编码序列的存在而筛选表达文库的功效。抗体还作为亲和配体用于纯化或分离本发明的蛋白质中的任何一种或多种以及相关蛋白是有用的。本发明的Cry蛋白和含有相关抗原表位的蛋白质可以通过在优选的宿主细胞中过度表达编码全部或部分本发明的Cry蛋白或相关蛋白的序列的全长或部分长度来获得。
应当认识到,可以通过不同方法来改变编码本发明的Cry蛋白的组装的DNA序列,并且这些改变可以产生编码如下蛋白质的DNA序列,这些蛋白质具有不同于由本发明的组装的Cry蛋白所编码的氨基酸序列。所得的突变型Cry蛋白可以按照不同的方式进行改变,包括SEQ ID NO:16-20中任一项的一个或多个氨基酸的氨基酸取代、缺失、截短、以及插入,包括多达约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155个、或更多个氨基酸取代、缺失或插入。用于此类操作的方法在本领域中通常是已知的。例如,通过在编码该蛋白质的多核苷酸中的突变可以制备天然Cry蛋白的氨基酸序列变体。这还可以通过若干种诱变形式之一或在定向进化中来完成。在一些方面中,在该氨基酸序列中所编码的改变将实质上不影响该蛋白质的功能。此类变体将具有所希望的杀昆虫活性。在本发明的一些实施例中,由SEQ IDNO:1-5代表的核苷酸序列被改变,以在编码的蛋白质中引入氨基酸取代。在其他实施例中,所得的突变型蛋白是由合成的突变型多核苷酸编码的,该多核苷酸包含由SEQ ID NO:11-15中任一项代表的核苷酸序列。在其他实施例中,这些突变型Cry蛋白包含以下、基本上由以下组成、或由以下组成:由SEQ ID NO:21-25中任一项代表的氨基酸序列。
应当理解的是可以通过使用此类技术改进杀昆虫蛋白对本发明的这些组合物赋予杀昆虫活性的能力。例如,可以在以下宿主细胞中表达Cry蛋白,这些宿主细胞在DNA复制过程中展现高比率的碱基错误结合,如XL-1Red(斯特塔杰公司(Stratagene),拉荷亚(LaJolla),加利福尼亚州)。在此类菌株中繁殖之后,可以分离出该DNA(例如通过制备质粒DNA,或通过由PCR进行扩增并且将得到的PCR片段克隆到载体中),在非诱变菌株中培养这些Cry蛋白突变体,并且鉴定具有杀昆虫活性的经突变的基因,例如通过进行对杀昆虫活性进行测试的测定。通常,在摄食测定中混合并使用了该蛋白质。参见例如Marrone等人,(1985),J.of Economic Entomology[经济昆虫学杂志]78:290-293。此类测定可以包括使植物与一种或多种有害生物接触,并且确定该植物存活或引起这些有害生物死亡的能力。导致毒性提高的突变的实例见于Schnepf等人,(1998),Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:775-806中。
可替代地,可以在氨基或羧基的末端上对本发明的氨基酸序列进行改变,而实质上不影响活性。这可以包括通过现代分子方法所引入的插入、缺失、或改变,这些方法是如PCR,包括PCR扩增,这些PCR扩增借助于将编码氨基酸的序列包含到在PCR扩增中所使用的寡核苷酸之中而改变或延长该蛋白质编码序列。可替代地,所添加的蛋白质序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋白质的表达;(2)引入结合域、酶活性、或表位以促进蛋白质纯化、蛋白质检测、或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白质的糖基化。
本发明的Cry蛋白还可以被突变以引入表位来产生识别该经突变蛋白的抗体。因此,在一些实施例中,本发明提供了经突变的Cry蛋白,其中在天然Cry蛋白中的氨基酸取代产生了具有抗原区域的突变型Cry蛋白,该抗原区域允许该突变型Cry蛋白在蛋白质检测分析中区别于该天然Cry蛋白。
在一些实施例中,本发明提供了制备如下抗体的方法,该抗体从衍生出经突变的Cry蛋白的组装的或相关的天然Cry蛋白中差异性地识别出经突变的Cry蛋白,该方法包括以下步骤:在组装的或天然Cry蛋白的抗原环中取代氨基酸;并且产生特异性识别经突变Cry蛋白的经突变抗原环但不识别该组装的或天然Cry蛋白的抗体。在一个实施例中,该抗原环在组装的或天然Cry蛋白的结构域I外部的非保守区域中被鉴别出。在另一个实施例中,该抗原环不是参与Cry蛋白的昆虫肠受体识别或参与Cry蛋白的蛋白酶活化的环。
本发明的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如DNA改组)所衍生的序列。使用此类程序,可以将一个或多个不同的毒性蛋白编码区用来创造出具有所希望特性的新的毒性蛋白。以这种方式,从相关序列多核苷酸的群体产生重组多核苷酸文库,这些相关序列多核苷酸包含如下序列区域,这些序列区域具有实质性的序列同一性并且可以在体外或体内进行同源重组。例如,使用这种方法,可以将编码目的结构域的序列基序在本发明的杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码如下蛋白质的新基因,该蛋白质具有改进的目的特性,如增加的杀昆虫活性。用于此种DNA改组的策略在本领域中是已知的。参见例如,Stemmer,(1994),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:10747-10751;Stemmer,(1994),Nature[自然]370:389-391;Crameri等人,(1997),Nature Biotech.[自然生物技术]15:436-438;Moore等人,(1997),J.Mol.Biol.[分子生物学杂志]272:336-347;Zhang等人,(1997),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]94:4504-4509;Crameri等人,(1998),Nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。
结构域交换或改组是用于产生本发明的经改变的Cry蛋白的另一种机制。可以在Cry蛋白之间交换结构域,从而产生具有改进的杀有害生物活性或靶标谱的杂合或嵌合毒性蛋白。用于产生重组蛋白和测试它们的杀有害生物活性的方法在本领域是熟知的(参见例如,Naimov等人,(2001)Appl.Environ.Microbiol.[应用与环境微生物学]67:5328-5330];de Maagd等人,(1996)Appl.Environ.Microbiol.[应用与环境微生物学]62:1537-1543];Ge等人,(1991)J.Biol.Chem.[生物化学杂志]266:17954-17958;Schnepf等人,(1990)J.Biol.Chem.[生物化学杂志]265:20923-20930;Rang等人,(1999)Appl.Environ.Microbiol.[应用与环境微生物学]65:2918-2925])。
因此在一些实施例中,本发明涵盖杂合杀昆虫蛋白,所述杂合杀昆虫蛋白在N-末端至C-末端方向上包含:a)与Cry4A蛋白的C-末端区域融合的Cry54A蛋白的N-末端区域,其中所述Cry54A蛋白和所述Cry4A蛋白之间的交换位置位于Cry54A的结构域III和Cry4A的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与SEQ ID NO:17具有至少90%同一性;或者b)与Cry19C蛋白的C-末端区域融合的Cry39A蛋白的N-末端区域,其中所述Cry39A蛋白和所述Cry19蛋白之间的交换位置位于Cry39A的结构域III和Cry19C的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与SEQ ID NO:18具有至少90%同一性;或者c)与Cry4B蛋白的C-末端区域融合的Cry50B蛋白的N-末端区域,其中所述Cry50B蛋白和所述Cry4B蛋白之间的交换位置位于Cry50B的结构域III和Cry4B的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与SEQ ID NO:20具有至少90%同一性。在其他实施例中,所述杂合杀昆虫蛋白针对鳞翅目昆虫有害生物具有活性。在这个实施例的一个方面,所述鳞翅目昆虫有害生物是亚洲玉米蛀虫(ACB;亚洲玉米螟)。
在一些实施例中,本发明提供了如下重组载体,该重组载体包含本发明的多核苷酸、组装的多核苷酸、核酸分子、表达盒或嵌合基因。在其他实施例中,该载体被进一步限定为质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。用于在植物和其他生物的转化中使用的某些载体在本领域是已知的。
因此,本发明的一些实施例针对被设计成表达本发明的多核苷酸和核酸分子的表达盒。如在此使用的,“表达盒”意指如下核酸分子,该核酸分子具有至少一种可操作地连接至目的核苷酸序列(例如,编码本发明的Cry蛋白的本发明的核苷酸序列)上的控制序列。以这种方式,例如,可操作地连接至待表达的核苷酸序列的植物启动子可以在表达盒中提供,用于在植物、植物部分或植物细胞中的表达。
包含目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少另外一种是异源的。表达盒还可以是天然存在但已经是以适用于异源表达的重组形式获得的表达盒。然而,典型地,该表达盒相对于该宿主而言是异源的,即该表达盒的特定核酸序列不是天然存在于该宿主细胞中的,并且必须已经通过转化事件引入到该宿主细胞或该宿主细胞的祖先中。
除可操作地连接至本发明的核苷酸序列的启动子之外,本发明的表达盒还可以包括其他调节序列。如在此使用的,“调节序列”意指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于增强子、内含子、翻译前导序列、终止信号、以及多腺苷酸化信号序列。
在一些实施例中,本发明的表达盒还可以包括编码除本发明的Cry蛋白之外的其他所希望的性状的多核苷酸。此类包含叠加性状的表达盒可以用来产生具有所希望的具有叠加性状(即,分子叠加)的表型的植物、植物部分或植物细胞。植物中的此类叠加的组合还可以通过其他方法来产生,包括但不限于通过任何常规的方法学的杂交育种植物。如果是通过遗传转化这些植物来进行叠加的,目的核苷酸序列可以在任何时间并且以任何次序进行组合。例如,包含一种或多种所希望的性状的转基因植物可以用作通过后续转化而引入另外的性状的靶标。另外的核苷酸序列可以在共转化方案中与由表达盒的任何组合提供的本发明的核苷酸序列、核酸分子、核酸构建体、或组合物同时引入。例如,如果将引入两个核苷酸序列,则它们可以合并在分开的盒(反式)中或可以合并在相同的盒(顺式)上。多核苷酸的表达可以通过相同的启动子或通过不同的启动子驱动。进一步认识到多核苷酸可以使用位点特异性重组系统在所希望的基因组位置处叠加。参见例如,国际专利申请公开号WO99/25821;WO 99/25854;WO 99/25840;WO 99/25855;以及WO 99/25853。
表达盒还可以包括用于农艺性状的一种或多种目的多肽或双链RNA分子(dsRNA)的另外的编码序列,这些农艺性状的主要受益者是种子公司、栽培者或谷物加工者。目的多肽可以是由目的核苷酸序列编码的任何多肽。适合用于在植物中生产的目的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见,例如美国专利号5,569,823;5,304,730;5,495,071;6,329,504;和6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的性状)的多肽,或是允许对展现目的性状(例如,选择性标记、种皮颜色等)的植物进行鉴别的多肽。不同的目的多肽,连同用于将这些多肽引入植物中的方法描述于例如美国专利号4,761,373、4,769,061、4,810,648、4,940,835、4,975,374、5,013,659、5,162,602、5,276,268、5,304,730、5,495,071、5,554,798、5,561,236、5,569,823、5,767,366、5,879,903、5,928,937、6,084,155、6,329,504和6,337,431,连同美国专利公开号2001/0016956中。还参见,万维网上的lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/。
赋予对抑制生长点或分生组织的除草剂(如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于本发明的一些实施例中。对于突变型ALS和AHAS酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659针对抵抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下核酸的植物细胞和植物,该核酸编码突变型谷氨酰胺合成酶(GS),该突变型谷氨酰胺合成酶抵抗已知抑制GS的除草剂(例如,草胺膦和甲硫氨酸磺基肟(methioninesulfoximine))的抑制作用。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶A羧化酶(ACCase)赋予。
赋予对草甘膦抗性的、由核苷酸序列编码的多肽也适用于本发明。参见例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,该抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合成酶基因赋予。
编码对磷酰基化合物(如草铵膦或草丁膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见欧洲专利申请号0 242 246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他适合的多核苷酸包括编码对抑制光合作用的除草剂(如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的适合的多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物构造或发育中的改变(包括发育时间方面的变化)的多核苷酸。参见例如,美国专利公开号2001/0016956和美国专利号6,084,155。
另外的适合的多核苷酸包括对杀有害生物(例如杀昆虫)多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应当认识到在植物中对控制昆虫或其他有害生物必要的杀有害生物多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。有用于另外的昆虫或有害生物抗性的多核苷酸包括例如编码芽孢杆菌属(Bacillus)生物中鉴定到的毒素的那些。已经克隆了包含编码来自若干个亚种的苏云金芽孢杆菌(Bt)Cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和/或鞘翅目昆虫幼虫是有毒的。此类Bt杀昆虫蛋白的实例包括如下Cry蛋白,例如Cry1Aa、Cry1Ab、Cry1Ac、Cry1B、Cry1C、Cry1D、Cry1Ea、Cry1Fa、Cry3A、Cry9A、Cry9B、Cry9C等,连同营养期杀昆虫蛋白例如Vip1、Vip2、Vip3等。Bt来源的蛋白的完整清单可以在万维网在苏塞克斯大学(University of Sussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,Crickmore等人(1998)Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:807-813)。
适合在植物中生产的多肽进一步包括改进或通过其他方式有助于收获的植物或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量或分布、改进的发酵特性、增加的油含量、增加的蛋白质含量、改进的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些。目的多肽还包括,例如在收获的作物中导致或促成不需要的成分(例如植酸、或降解糖的酶类)的含量降低的那些。“导致(resulting in)”或“促成(contributingto)”是指这种目的多肽可以直接或间接地促成目的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。
在一些实施例中,多肽促成了食品或饲料的改进的可消化度。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。
来自真菌和细菌微生物的众多木聚糖酶已经得到鉴别和表征(参见例如,美国专利号5,437,992;Coughlin等人,(1993),“Proceedings of the Second TRICEL Symposiumon Trichoderma reesei Cellulases and Other Hydrolases”[“里氏木霉纤维素酶和其他水解酶的第二TRICEL研讨会论文集”],埃斯波(Espoo);Souminen和Reinikainen编著,(1993)生物技术和工业发酵研究基金会(Foundation for Biotechnical and IndustrialFermentation Research)8:125-135;美国专利公开号2005/0208178;以及PCT公开号WO03/16654)。特别地,在里氏木霉(T.reesei)中已经鉴别出三种特异性木聚糖酶(XYL-I、XYL-II、和XYL-III)(Tenkanen等人,(1992),Enzyme Microb.Technol.[酶与微生物技术]14:566;Torronen等人,(1992),Bio/Technology[生物/技术]10:1461;以及Xu等人,(1998),Appl.Microbiol.Biotechnol.[应用微生物与生物技术]49:718)。
在其他实施例中,对于本发明有用的多肽可以是多糖降解酶。产生这样一种酶的本发明的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。
多糖降解酶包括:淀粉降解酶如α-淀粉酶(EC 3.2.1.1)、葡糖醛酸糖苷酶(E.C.3.2.1.131);外切-1,4-α-D葡聚糖酶如淀粉葡糖苷酶和葡糖淀粉酶(EC 3.2.1.3)、β-淀粉酶(EC 3.2.1.2)、α-葡糖苷酶(EC 3.2.1.20)和其他外切淀粉酶;淀粉去分支酶,如a)异淀粉酶(EC 3.2.1.68)、支链淀粉酶(EC 3.2.1.41)等;b)纤维素酶如外切-1,4-3-纤维二糖水解酶(EC 3.2.1.91)、外切-1,3-β-D-葡聚糖酶(EC 3.2.1.39)、β-葡糖苷酶(EC3.2.1.21);c)L-阿拉伯糖酶(arabinase)、如内切-1,5-α-L-阿拉伯糖酶(EC 3.2.1.99)、α-阿拉伯糖苷酶(EC 3.2.1.55)等;d)半乳聚糖酶如内切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、内切-1,3-β-D-半乳聚糖酶(EC 3.2.1.90)、α-半乳糖苷酶(EC 3.2.1.22)、β-半乳糖苷酶(EC 3.2.1.23)等;e)甘露聚糖酶,如内切-1,4-β-D-甘露聚糖(EC 3.2.1.78)、β-甘露糖苷酶(EC 3.2.1.25)、α-甘露糖苷酶(EC 3.2.1.24)等;f)木聚糖酶,如内切-1,4-β-木聚糖酶(EC 3.2.1.8)、β-D-木糖苷酶(EC 3.2.1.37)、1,3-β-D-木聚糖酶等;和g)其他酶如α-L-岩藻糖苷酶(EC 3.2.1.51)、α-L-鼠李糖苷酶(EC 3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶(EC 3.2.1.7)等。在一个实施例中,α-淀粉酶是描述于美国专利号8,093,453中的合成α-淀粉酶Amy797E,将该专利通过引用以其全文结合在此。
可以与本发明一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(Aspergillus)、木霉属(Trichoderma)、毛霉属(Mucor)和根霉属(Rhizopus),如黑曲霉(A.niger)、泡盛曲霉(A.awamori)、米曲霉(A.oryzae)和米黑毛霉(M.miehei)获得的那些。在一些实施例中,本发明的多肽可以是纤维二糖水解酶(CBH)(EC3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是CBH1或CBH2。
与本发明一起使用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(EC 3.2.1.55);木质素酶;脂肪酶(例如,E.C.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1,6葡糖苷酶(例如,E.C.3.2.1.20);酯酶,如阿魏酸酯酶(EC3.1.1.73)和乙酰基木聚糖酯酶(EC 3.1.1.72);以及角质酶(例如E.C.3.1.1.74)。
与本发明一起使用的双链RNA分子包括但不限于抑制靶标昆虫基因的那些。如在此使用的词语“基因抑制”当一起考虑时旨在是指用于减少作为基因转录为mRNA和该mRNA的后续翻译的结果而产生的蛋白质的水平的任何熟知的方法。基因抑制还旨在意指减少从基因或编码序列表达蛋白质,包括转录后基因抑制和转录抑制。转录后基因抑制由从靶向抑制的基因或编码序列转录的mRNA的全部或其一部分与用于抑制的相应双链RNA之间的同源性介导,并且是指在细胞中可供被核糖体结合使用的可获得的mRNA的量的实质且可测量的减少。经转录的RNA可以处于正义方向而发挥作用,称为共抑制,处于反义方向而发挥作用,称为反义抑制,或在两个方向上产生dsRNA而发挥作用,称为RNA干扰(RNAi)。转录抑制由细胞中存在作为基因抑制剂的与启动子DNA序列或其补体展示出实质序列同一性而发挥作用的dsRNA介导,称为启动子反式抑制。针对与性状相关的天然植物基因,基因抑制可以是有效的,例如,以提供具有减少水平的由该天然基因编码的蛋白质或具有增强或减少水平的受影响代谢物的植物。针对植物有害生物中的靶基因,基因抑制也可以是有效的,这些有害生物可以摄取或接触含有基因抑制剂的植物材料,这些基因抑制剂专门设计用于阻抑或抑制一种或多种同源或互补序列在该有害生物的细胞中的表达。靶向抑制的此类基因可以编码必需蛋白质,其预测功能选自下组,该组由以下组成:肌肉形成、保幼激素形成、保幼激素调节、离子调节和转运、消化酶合成、细胞膜电势的维持、氨基酸生物合成、氨基酸降解、精子形成、外激素(pheromone)合成、外激素感测、触角形成、翼形成、腿形成、发育和分化、卵形成、幼虫成熟、消化酶形成、血淋巴合成、血淋巴维持、神经传递、细胞分裂、能量代谢、呼吸以及凋亡。
在一些实施例中,本发明提供了如下转基因非人类宿主细胞,该细胞包括本发明的多核苷酸、核酸分子、嵌合基因、表达盒或重组载体。转基因非人类宿主细胞可以包括但不限于植物细胞、酵母细胞、细菌细胞或昆虫细胞。因此,在一些实施例中,本发明提供了选自以下属的细菌细胞:芽孢杆菌属、短芽孢杆菌属(Brevibacillus)、梭菌属(Clostridium)、致病杆菌属(Xenorhabdus)、发光杆菌属(Photorhabdus)、巴斯德氏芽菌属(Pasteuria)、埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯菌属(Klebsiella)、沙门氏菌属(Salmonella)、巴氏杆菌属(Pasteurella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、嗜甲基菌属(Methylophilius)、农杆菌属(Agrobacterium)、醋杆菌属(Acetobacter)、乳杆菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)或产碱杆菌属(Alcaligenes)。因此,例如,作为生物昆虫控制剂,本发明的Cry蛋白可以通过在细菌细胞中表达编码本发明的Cry蛋白的嵌合基因而产生。例如,在一些实施例中,提供了包含本发明的嵌合基因的苏云金芽孢杆菌细胞。
在另外的实施例中,本发明提供了作为双子叶植物细胞或单子叶植物细胞的转基因植物细胞。在另外的实施例中,该双子叶植物细胞选自下组,该组由以下组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、甜菜细胞以及烟草细胞。在另外的实施例中,该单子叶植物细胞选自下组,该组由以下组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。在一些实施例中,本发明提供了多个双子叶植物细胞或单子叶植物细胞,这些细胞表达由本发明的嵌合基因编码的本发明的Cry蛋白。在其他实施例中,将该多个细胞并列以形成质外体并且使其在自然光照中生长。
在本发明的其他实施例中,在高等生物(例如,植物)中表达本发明的杀昆虫Cry蛋白。在这种情况下,表达有效量的杀昆虫蛋白的转基因植物保护自身免受植物有害生物如昆虫有害生物的伤害。当昆虫开始摄食这样一种转基因植物时,它摄取了所表达的杀昆虫Cry蛋白。这可以妨碍昆虫进一步咬食植物组织或者甚至可以伤害或杀死昆虫。本发明的多核苷酸被插入表达盒中,然后该表达盒被稳定地整合到植物的基因组中。在其他实施例中,该多核苷酸被包括在非致病性自我复制病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,并且包括但不限于玉米(玉蜀黍)、大豆、水稻、小麦、大麦、黑麦、燕麦、高粱、粟、向日葵、红花、甜菜、棉花、甘蔗、油菜、苜蓿、烟草、花生、蔬菜(包括甘薯、豆类、豌豆、菊苣、莴苣、甘蓝、花椰菜、西兰花、芜菁、胡萝卜、茄子、黄瓜、萝卜、菠菜、马铃薯、番茄、芦笋、洋葱、大蒜、瓜类、胡椒、芹菜、南瓜、西葫芦、绿皮西葫芦)、水果(包括苹果、梨、榅桲、李、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉)和特种植物如拟南芥以及木本植物如针叶树和落叶树。优选地,本发明的植物是作物植物,如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等。
一旦所希望的多核苷酸已经被转化进特定的植物物种中,便可以使用传统的育种技术将其在该物种中繁殖或将其转移到相同物种的其他品种中,特别是包括商业品种。
在转基因植物中表达本发明的多核苷酸,由此导致在这些转基因植物中对处于原毒素或毒素形式的编码的Cry蛋白的生物合成。以此方式,产生在存在昆虫压力下具有增强的产量保护的转基因植物。用于它们在转基因植物中的表达,本发明的核苷酸序列可能需要修饰和优化。尽管在许多情况下,来自微生物生物的基因能够在植物中高水平表达而无需修饰,但在转基因植物中的低表达可能是由于微生物核苷酸序列的缘故,这些序列具有在植物中并不优选的密码子。在本领域中已知,活生物具有特定的密码子使用偏好,而且在本发明中所描述的这些核苷酸序列的密码子可以被改变以符合植物偏好,同时维持由其编码的氨基酸。此外,在植物(例如玉米植物)中高表达最好是由如下编码序列实现的,这些编码序列具有至少约35%、或至少约45%、或至少约50%、或至少约60%的GC含量。具有低GC含量的微生物核苷酸序列在植物中也许表达欠佳,这是由于存在着可能使信息不稳定的ATTTA基序,以及可导致不恰当的多腺苷酸化的AATAAA基序。尽管某些基因序列可以在单子叶植物和双子叶植物物种两者中充分表达,但是可以对序列进行修饰以便迎合单子叶植物或双子叶植物的特定密码子偏好以及GC含量偏好,因为这些偏好已经被证明是不同的(Murray等人,Nucl.Acids Res.[核酸研究]17:477-498(1989))。此外,针对不正常剪接位点的存在来对这些核苷酸序列进行筛选,这些位点可能导致信息平截(messagetruncation)。使用描述于例如美国专利号5,625,136、5,500,365和6,013,523中的方法,使用熟知的定点诱变、PCR以及合成基因构建技术对在这些核苷酸序列之内所有需要做出的变化(如以上所描述的那些)进行改变。
在一些实施例中,本发明提供了根据披露于美国专利号5,625,136中的程序制备的合成编码序列或多核苷酸,将该专利通过引用结合在此。在这个程序中,使用了玉蜀黍优选的密码子,即最频繁地编码玉蜀黍中的氨基酸的单个密码子。针对特定的氨基酸的玉蜀黍偏好的密码子可衍生自例如来自玉蜀黍的已知基因序列。例如,针对来自玉蜀黍植物的28个基因的玉蜀黍密码子使用发现于以下文献中:Murray等人,Nucleic Acids Research[核酸研究]17:477-498(1989),将其披露内容通过引用结合在此。本发明的确切示例的用玉蜀黍优化密码子制备的合成序列由SEQ ID NO:6-15中的任一项代表。以这种方式,这些核苷酸序列可以进行优化用于在任何植物中表达。应当认识到,核苷酸序列的全部或任何部分可以是优化的或合成的。也就是说,多核苷酸可以包含作为部分天然序列和部分密码子优化序列的核苷酸序列。
为了有效的翻译起始,可能需要修饰与起始甲硫氨酸相邻的序列。例如,它们可以通过包含已知在植物中有效的序列而被修饰。Joshi已经提出了针对植物的适当的共有序列(NAR 15:6643-6653(1987))。这些共有序列适于与本发明的核苷酸序列一起使用。将这些序列掺入至包含核苷酸序列的构建体中,达到ATG并且包括ATG(同时保持不修饰第二氨基酸),或者可替代地达到ATG后的GTC并且包括ATG后的GTC(具有修饰该转基因的第二氨基酸的可能性)。
本发明的新颖Cry蛋白编码序列(作为它们的组装的序列、天然序列或作为如上所述的合成序列)可以可操作地融合至用于在植物中表达的多种启动子(包括组成型、诱导型、时序性调节的、发育调节的、化学调节的、组织优选的以及组织特异性启动子)以制备重组DNA分子(即,嵌合基因)。启动子的选择将根据表达的时间和空间需要而变化,并且还根据靶物种而变化。因此,本发明的核苷酸序列在叶、在柄(stalk)或茎(stem)、在穗、在花序(例如穗状花序、圆锥花序、穗轴等)、在根或籽苗中的表达是优选的。然而在许多情况下,寻求针对多于一种类型昆虫有害生物的保护,并且因此在多个组织中的表达是令人希望的。尽管已经显示来自双子叶植物的很多启动子在单子叶植物中是可操作的并且反之亦然,但理想的是选择双子叶植物启动子用于在双子叶植物中表达,并且选择单子叶植物启动子用于在单子叶植物中表达。不过,对于所选的启动子的起源没有限制;只要它们可有效驱动核苦酸序列在期望细胞中表达就足够了。
适合的组成型启动子包括例如CaMV 35S启动子(SEQ ID NO:1546;Odell等人,Nature[自然]313:810-812,1985);拟南芥At6669启动子(SEQ ID NO:1652;参见PCT公开号W0 04081173A2);玉蜀黍Ubi 1(Christensen等人,Plant Mol.Biol.[植物分子生物学]18:675-689,1992);水稻肌动蛋白(McElroy等人,Plant Cell[植物细胞]2:163-171,1990);pEMU(Last等人,Theor.Appl.Genet.[理论与应用遗传学]81:581-588,1991);CaMV 19S(Nilsson等人,Physiol.Plant[植物生理学]100:456-462,1997);GOS2(de Pater等人,Plant J[植物杂志]11月;2(6):837-44,1992);泛素(Christensen等人,Plant Mol.Biol.[植物分子生物学]18:675-689,1992);水稻亲环蛋白(Bucholz等人,Plant Mol.Biol.[植物分子生物学]25(5):837-43,1994);玉蜀黍H3组蛋白(Lepetit等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]231:276-285,1992);肌动蛋白2(An等人,Plant J.[植物杂志]10(1);107-121,1996)、组成型根尖CT2启动子(SEQ ID NO:1535;还参见PCT申请号IL/2005/000627))以及Synthetic Super MAS(Ni等人,The Plant Journal[植物杂志]7:661-76,1995)。其他组成型启动子包括美国专利号5,659,026、5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、以及5,608,142中的那些。
对于在植物(特别是玉蜀黍)中表达本发明的新颖cry蛋白编码序列有用的组织特异性或组织优先启动子是指导在根、髓、叶或花粉中的表达的那些。适合的组织特异性启动子包括但不限于叶特异性启动子[如例如由Yamamoto等人,Plant J.[植物杂志]12:255-265,1997;Kwon等人,Plant Physiol.[植物生理学]105:357-67,1994;Yamamoto等人,Plant Cell Physiol.[植物细胞生理学]35:773-778,1994;Gotor等人,Plant J.[植物杂志]3:509-18,1993;Orozco等人,Plant Mol.Biol.[植物分子生物学]23:1129-1138,1993;以及Matsuoka等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:9586-9590,1993所描述],种子优选启动子[例如来自种子特异性基因(Simon等人,Plant Mol.Biol.[植物分子生物学]5.191,1985;Scofield等人,J.Biol.Chem.[生物化学杂志]262:12202,1987;Baszczynski等人,Plant Mol.Biol.[植物分子生物学]14:633,1990)、巴西坚果白蛋白(Pearson等人,Plant Mol.Biol.[植物分子生物学]18:235-245,1992)、豆球蛋白(Ellis等人,Plant Mol.Biol.[植物分子生物学]10:203-214,1988)、谷蛋白(水稻)(Takaiwa等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]208:15-22,1986;Takaiwa等人,FEBS Letts.[欧洲生化学会联合会快报]221:43-47,1987)、玉米蛋白(Matzke等人,Plant Mol Biol[植物分子生物学],143).323-32 1990)、napA(Stalberg等人,Planta[植物]199:515-519,1996)、小麦SPA(Albanietal,Plant Cell[植物细胞],9:171-184,1997)、向日葵油体蛋白(oleosin)(Cummins等人,Plant Mol.Biol.[植物分子生物学]19:873-876,1992)],胚乳特异性启动子[例如,小麦LMW和HMW,麦谷蛋白-1(Mol Gen Genet[分子遗传学与普通遗传学]216:81-90,1989;NAR 17:461-2),小麦a、b和g麦醇溶蛋白(EMB03:1409-15,1984),大麦ltrl启动子,大麦B1、C、D大麦醇溶蛋白(Theor Appl Gen[理论与应用遗传学]98:1253-62,1999;Plant J[植物杂志]4:343-55,1993;Mol Gen Genet[分子遗传学与普通遗传学]250:750-60,1996),大麦DOF(Mena等人,The Plant Journal[植物杂志]116(1):53-62,1998),Biz2(EP 99106056.7),合成启动子(Vicente-Carbajosa等人,Plant J.[植物杂志]13:629-640,1998),水稻谷醇溶蛋白NRP33、水稻-球蛋白Glb-1(Wu等人,Plant CellPhysiology[植物细胞生理学]39(8)885-889,1998),水稻α-球蛋白REB/OHP-1(Nakase等人,Plant Mol.Biol.[植物分子生物学]33:513-S22,1997),水稻ADP-葡萄糖PP(Trans Res6:157-68,1997),玉蜀黍ESR基因家族(Plant J[植物杂志]12:235-46,1997),高粱γ-高粱醇溶蛋白(Plant Mol.Biol[植物分子生物学]32:1029-35,1996)],胚特异性启动子[例如,水稻OSH1(Sato等人,Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]93:8117-8122),KNOX(Postma-Haarsma等人,Plant Mol.Biol.[植物分子生物学]39:257-71,1999),水稻油体蛋白(Wu等人,J.Biochem.[生物化学杂志],123:386,1998)],花特异性启动子[例如,AtPRP4,查尔酮合酶(chalene synthase;chsA)(Van der Meer等人,Plant Mol.Biol.[植物分子生物学]15,95-109,1990),LAT52(Twell等人,Mol.Gen Genet.[分子遗传学与普通遗传学]217:240-245;1989),apetala-3,植物繁殖组织[例如,OsMADS启动子(美国专利申请2007/0006344)]。
本发明的核苷酸序列也可以在被化学调节的启动子的调节下进行表达。这使得本发明的Cry蛋白能够仅在用诱导化学品对作物植物进行处理时被合成。用于基因表达的化学诱导的此类技术的实例详述于公开申请EP 0 332 104和美国专利号5,614,395中。在一个实施例中,该化学调节的启动子是烟草PR-1a启动子。
另一类在本发明中有用的启动子是创伤可诱导的启动子。已经描述了数量众多的在创伤部位并且还在植物病原菌感染的部位表达的启动子。理想的是,这样的启动子在昆虫入侵的部位应该仅有局部活性,并且以此方式这些杀昆虫蛋白仅在需要合成这些杀昆虫蛋白的细胞中积聚以杀死入侵的昆虫有害生物。这类启动子的实例包括由以下文献所描述的那些:Stanford等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]215:200-208(1989);Xu等人,Plant Molec.Biol.[植物分子生物学]22:573-588(1993);Logemann等人,PlantCell[植物细胞]1:151-158(1989);Rohrmeier和Lehle,Plant Molec.Biol.[植物分子生物学]22:783-792(1993);Firek等人,Plant Molec.Biol.[植物分子生物学]22:129-142(1993)以及Warner等人,Plant J.[植物杂志]3:191-201(1993)。
导致在本发明中有用的组织特异性表达模式的启动子的非限制性实例包括绿色组织特异性的、根特异性的、茎特异性的或花特异性的。适用于在绿色组织中表达的启动子包括调节涉及光合作用的基因的许多启动子,并且这些中的许多已经从单子叶植物和双子叶植物两者中得以克隆。一种此类启动子是来自磷酸烯醇羧化酶基因的玉蜀黍PEPC启动子(Hudspeth和Grula,Plant Molec.Biol.[植物分子生物学]12:579-589(1989))。另一种用于根特异性表达的启动子是由de Framond(FEBS 290:103-106(1991)或美国专利号5,466,785)描述的启动子。另一种在本发明中有用的启动子是描述于美国专利号5,625,136中的茎特异性启动子,它天然地驱动玉蜀黍trpA基因的表达。
除了选择适合的启动子之外,用于在植物中表达杀昆虫毒素的构建体还需要适当的可操作地连接在异源核苷酸序列下游的转录终止子。一些此类的终止子是可获得的并且在本领域中是已知的(例如来自CaMV的tml,来自rbcS的E9)。任何已知在植物中发挥作用的可供使用的终止子均可以在本发明的上下文中使用。
可以将许多其他序列掺入本发明所描述的表达盒中。这些序列包括已经显示出增强表达的序列,如内含子序列(例如,来自Adhl和bronzel)以及病毒的前导序列(例如,来自TMV、MCMV、和AMV)。
本发明的核苷酸序列在植物中针对不同的细胞定位的靶向表达可能是更优选的。在一些情况下,在胞质溶胶中的定位可能是令人希望的,而在其他情况下,在某个亚细胞器中的定位可能是优选的。用于靶向例如植物中的基因产物的任何机构都可以用于实践本发明,并且已知此类机构存在于植物中并且已经相当详细地表征了控制这些机构的功能的序列。已经表征了导致将基因产物靶向其他细胞区室的序列。氨基末端序列可以负责将目的蛋白质靶向任何细胞区室,如植物的液泡、线粒体、过氧化物酶体、蛋白体、内质网、叶绿体、淀粉颗粒、淀粉体、质外体或细胞壁(例如Unger等人Plant Molec.Biol.[植物分子生物学]13:411-418(1989);Rogers等人(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82:6512-651;美国专利号7,102,057;WO 2005/096704,将其全部通过引用而特此结合)。任选地,信号序列可以是来自waxy的N-末端信号序列、来自γ-玉米蛋白的N-末端信号序列、淀粉结合结构域、C-末端淀粉结合结构域、将成熟蛋白引入叶绿体的叶绿体靶向序列(Comai等人,(1988)J.Biol.Chem.[生物化学杂志]263:15104-15109;van den Broeck等人,(1985)Nature[自然]313:358-363;美国专利号5,639,949)或来自糊粉细胞的分泌信号序列(Koehler和Ho,Plant Cell[植物细胞]2:769-783(1990))。另外,与羧基末端序列结合的氨基末端序列负责基因产物的液泡靶向(Shinshi等人(1990)Plant Molec.Biol.[植物分子生物学]14:357-368)。在一个实施例中,所选择的信号序列包括已知的切割位点,并且构建的融合体考虑了在一个或多个切割位点之后的需要切割的任何氨基酸。在一些情况下,这个要求可以通过在切割位点与转基因ATG之间添加小数目的氨基酸,或可替代地置换转基因序列内的一些氨基酸来满足。这些构建技术在本领域是熟知的并且同样适用于任何细胞区室。
应认识到,用于细胞靶向的上述机制不仅可以与其同源启动子结合使用,还可以与异源启动子结合使用,从而在启动子的转录调节下实现特定的细胞靶向目标,该启动子具有不同于自其衍生靶向信号的启动子的表达谱。
植物转化
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下项的转化:细菌介导的核酸递送(例如,经由农杆菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:Miki等人(“Procedures for Introducing Foreign DNAinto Plants”in Methods in Plant Molecular Biology and Biotechnology[植物分子生物学与生物技术方法中的“用于将外来DNA引入植物中的程序”],Glick,B.R.和Thompson,J.E.编辑,CRC出版公司(CRC Press,Inc.),波卡拉顿(Boca Raton),1993,第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞与分子生物学快报]7:849-858(2002))。
对于农杆菌介导的转化,二元载体或携带至少一个T-DNA边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且仅含有目的构建体的线性DNA可以是优选的。在直接基因转移的情况下,可以使用以单个DNA种类的转化或共转化(Schocher等人,Biotechnology[生物技术]4:1093-1096(1986))。对于直接基因转移以及农杆菌介导的转移二者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草丁膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带目的外来DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株或者在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人,(1993),Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶标农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将所述重组二元载体转移至农杆菌中(
Figure BDA0002230667180000531
和Willmitzer,(1988)Nucleic Acids Res.[核酸研究]16:9877)。
可以使用农杆菌转化双子叶植物以及单子叶植物。用于农杆菌介导的水稻转化方法包括熟知的水稻转化方法,如任何以下文献中描述的那些:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta[植物]199:612-617,1996);Chan等人(Plant Mol Biol[植物分子生物学]22(3):491-506,1993),Hiei等人(Plant J[植物杂志]6(2):271-282,1994),将这些披露通过引用结合在此,其引用程度如同完全阐明一样。在玉米转化的情况下,优选方法是如Ishida等人(Nat.Biotechnol[自然生物技术]14(6):745-50,1996)或Frame等人(Plant Physiol[植物生理学]129(1):13-22,2002)中所描述的,将这些披露通过引用结合在此,其引用程度如同完全阐明一样。所述方法例如在B.Jenes等人,Techniques for GeneTransfer[基因转移技术],在:Transgenic Plants[转基因植物],第1卷,Engineering andUtilization[工程化以及利用]中,S.D.Kung和R.Wu编著,学术出版社(1993)128-143以及在Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.[植物生理学年评和植物分子生物学]42(1991)205-225)中进一步描述。有待表达的核酸或构建体优选地克隆至适合于转化根癌农杆菌(Agrobacterium tumefaciens)的载体例如pBin19中(Bevan等人,Nucl.Acids Res.[核酸研究]12(1984)8711)。然后,能够以已知的方式使用由这种载体转化的农杆菌来转化植物,如用作模型的植物像拟南芥或作物植物如烟草植物,方法是例如通过将捣碎的叶或切碎的叶浸没于农杆菌溶液中,并且然后将其在适合的培养基中培养。例如,借助于根癌农杆菌来转化植物由Hagen和Willmitzer描述于Nucl.Acid Res.[核酸研究](1988)16,9877中或尤其自以下文献已知:F.F.White,Vectors for Gene Transfer inHigher Plants;in Transgenic Plants[用于高等植物中的基因转移的载体],第1卷,Engineering and Utilization[工程化以及利用],编辑S.D.Kung和R.Wu,学术出版社(Academic Press),1993,第15-38页。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的核酸)推进到植物组织中。
在其他实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单个启动子的控制下表达多个开放阅读框。在美国专利号5,451,513、5,545,817和5,545,818中,在PCT申请号WO 95/16783中,以及在McBride等人(1994)Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]91,7301-7305中广泛描述了质体转化技术。基本的叶绿体转化技术涉及例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或PEG介导的转化),将位于选择性标记侧翼的经克隆的质体DNA区连同目的基因一起引入合适的靶组织中。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16S rRNA和rps12基因(赋予针对大观霉素或链霉素的抗性)的点突变用作供转化用的选择性标记(Svab,Z.、Hajdukiewicz,P.和Maliga,P.,(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87,8526-8530);Staub,J.M.和Maliga,P.,(1992)Plant Cell[植物细胞]4,39-45)。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(Staub,J.M.和Maliga,P.,(1993)EMBO J.[欧洲分子生物学杂志]12,601-606)。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aadA基因)置换隐性的rRNA或r蛋白抗生素抗性基因而获得(Svab,Z.和Maliga,P.,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90,913-917)。先前,这种标记已经被成功地用于莱茵衣藻这种绿藻的质体基因组的高频率转化(Goldschmidt-Clermont,M.(1991)Nucl.Acids Res.[核酸研究]19:4083-4089)。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。
选择转化的转基因植物、植物细胞或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分或植物细胞。如在此使用的,“选择性标记”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码选择性或筛选性标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,R基因座性状)。当然,适合的选择性标记的许多实例在本领域是已知的并且可以用于在此描述的表达盒中。
选择性标记的实例包括但不限于编码neo或nptII的核苷酸序列,它赋予对卡那霉素、G418等的抗性(Potrykus等人(1985)Mol.Gen.Genet.[分子遗传学与普通遗传学]199:183-188);编码bar的核苷酸序列,它赋予对草丁膦的抗性;编码改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合酶的核苷酸序列,它赋予对草甘膦的抗性(Hinchee等人(1988)Biotech.[生物技术]6:915-922);编码腈水解酶(如来自臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn)的核苷酸序列,它赋予对溴草腈的抗性(Stalker等人(1988)Science[科学]242:419-423);编码改变的乙酰乳酸合酶(ALS)的核苷酸序列,它赋予对咪唑啉酮、磺酰脲或其他ALS-抑制化学品的抗性(欧洲专利申请号154204);编码甲氨蝶呤-抗性的二氢叶酸还原酶(DHFR)的核苷酸序列(Thillet等人(1988)J.Biol.Chem.[生物化学杂志]263:12500-12508);编码茅草枯脱卤素酶的核苷酸序列,它赋予对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(PMI))的核苷酸序列,它赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸盐合酶的核苷酸序列,它赋予对5-甲基色氨酸的抗性;或编码hph的核苷酸序列,它赋予对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
另外的选择性标记包括但不限于编码β-葡糖醛酸酶的核苷酸序列或编码对于多种显色底物已知的酶的uidA(GUS);编码在植物组织中对花色苷色素(红色)进行调节的产物的R基因座核苷酸序列(Dellaporta等人,Chromosome Structure and Function:Impactof New Concepts[染色体结构与功能:新概念的影响]中263-282页,“Molecular cloningof the maize R-nj allele by transposon-tagging with Ac[通过Ac转座子标签技术对玉蜀黍R-nj等位基因的分子克隆]”,第18届斯特德莱遗传学专题讨论会(18th StadlerGenetics Symposium)(Gustafson和Appels编辑,Plenum出版社,1988));编码β-内酰胺酶的核苷酸序列,对于β-内酰胺酶而言多种显色底物是已知的(例如,PADAC,显色头孢菌素)(Sutcliffe,(1978)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3737-3741);编码xylE的核苷酸序列,xylE编码儿茶酚双加氧酶(Zukowsky等人,(1983)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:1101-1105);编码酪氨酸酶的核苷酸序列,酪氨酸酶能够氧化酪氨酸成为DOPA和多巴醌,其进而缩合形成黑色素(Katz等人,(1983)J.Gen.Microbiol.[普通微生物学杂志]129:2703-2714);编码β-半乳糖苷酶的核苷酸序列,对于β-半乳糖苷酶而言存在显色底物;编码荧光素酶(lux)的核苷酸序列,荧光素酶允许生物发光检测(Ow等人,(1986)Science[科学]234:856-859);编码水母发光蛋白的核苷酸序列,水母发光蛋白可以在钙敏感的生物发光检测中采用(Prasher等人,(1985)Biochem.Biophys.Res.Comm.[生物化学与生物物理学研究通讯]126:1259-1268);或编码绿色荧光蛋白的核苷酸序列(Niedz等人,(1995)Plant Cell Reports[植物细胞报道]14:403-406)。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
此外,如本领域中所熟知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物或培养的原生质体再生而来。在以下文献中描述了从植物细胞、植物组织培养物或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,麦克米兰出版公司(MacMilan Publishing Co.),纽约(1983));以及Vasil I.R.(编辑)(Cell Culture andSomatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第I卷(1984)和第II卷(1986))。
另外,工程化进以上所述的本发明的转基因种子和植物、植物部分或植物细胞中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。
因此,可以按本领域熟知的任何数目的方法(如上所述的)将多核苷酸引入该植物、植物部分或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的特定方法,相反可以使用允许将该一种或多种多核苷酸稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单一核酸分子的一部分、或者作为分开的核酸分子而进行组装,并且可以位于相同的或不同的核酸分子上。因此,可以在单个转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入目的细胞中。
本发明的另外的实施例包括从本发明的转基因植物或其部分产生的收获产物以及从该收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中该种子或其他植物部分包含本发明的核酸分子/多核苷酸/核苷酸序列。
在其他实施例中,本发明提供了来自本发明的转基因种子或转基因植物的提取物,其中该提取物包含本发明的核酸分子、多核苷酸、核苷酸序列或毒性蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,de la Torre等人,Food,Agric.Environ.[食品农业与环境]2(1):84-89(2004);Guidet,Nucleic Acids Res.[核酸研究]22(9):1772-1773(1994);Lipton等人,Food Agric.Immun.[食品农业通讯]12:153-164(2000))。
杀昆虫组合物
在一些实施例中,本发明提供了杀昆虫组合物,该组合物包含农业上可接受的载体中的本发明的Cry蛋白。如在此使用的“农业上可接受的载体”可以包括与活性Cry蛋白组合以有助于它施用至或植物或其部分的天然或合成的有机或无机材料。农业上可接受的载体的实例包括但不限于粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。农业上可接受的载体进一步包括但不限于可用于农业配制品中的惰性组分、分散剂、表面活性剂、佐剂、增粘剂、粘着剂、粘合剂或其组合。此类组合物可以按使杀有害生物蛋白或其他有害生物控制剂与这些有害生物接触的任何方式施用。因此,可以将这些组合物施用于植物或植物部分的表面,包括种子、叶、花、茎、块茎、根等。在其他实施例中,在植物体内产生本发明的Cry蛋白的植物是被表达的Cry蛋白的农业载体。
在另外的实施例中,该杀昆虫组合物包含细菌细胞或本发明的转基因细菌细胞,其中该细菌细胞或转基因细菌细胞产生本发明的Cry蛋白。这样一种杀昆虫组合物可以通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩苏云金芽孢杆菌(Bt)的培养物而制备。此类Bt培养物可以是下文实例中描述的天然存在的Bt菌株YN171-1、GX078-2和GX435-1或转基因Bt培养物。在另外的实施例中,该组合物包含按重量计从约1%至约99%的本发明的Cry蛋白。
本发明的Cry蛋白可以与其他有害生物控制剂组合使用,以增加有害生物靶标范围或用于预防或管理昆虫抗性。因此,在一些实施例中,本发明提供了控制一种或多种植物有害生物的组合物,其中该组合物包含本发明的第一Cry蛋白和不同于该第一Cry蛋白的第二有害生物控制剂。在其他实施例中,该组合物是用于局部施用至植物的配制品。在仍其他实施例中,该组合物是转基因植物。在另外的实施例中,该组合物是局部施用至转基因植物的配制品的组合。在一些实施例中,当该转基因植物包含该第二有害生物控制剂时,该配制品包含本发明的该第一Cry蛋白。在其他实施例中,当该转基因植物包含本发明的该第一Cry蛋白时,该配制品包含该第二有害生物控制剂。
在一些实施例中,该第二有害生物控制剂可以是选自下组的试剂,该组由以下组成:化学杀有害生物剂(如杀昆虫剂)、苏云金芽孢杆菌(Bt)杀昆虫蛋白、致病杆菌属杀昆虫蛋白、发光杆菌属杀昆虫蛋白、侧孢短芽孢杆菌(Brevibacillus laterosporus)杀昆虫蛋白、球形芽孢杆菌(Bacillus sphaericus)杀昆虫蛋白、蛋白酶抑制剂(丝氨酸和半胱氨酸类型两者)、凝集素、α-淀粉酶、过氧化物酶、胆固醇氧化酶以及双链RNA(dsRNA)分子。
在其他实施例中,该第二有害生物控制剂是选自下组的化学杀有害生物剂,该组由以下组成:拟除虫菊酯、氨基甲酸酯、新烟碱、神经元钠通道阻断剂、杀昆虫大环内酯、γ-氨基丁酸(GABA)拮抗剂、杀昆虫脲以及保幼激素模拟物。在其他实施例中,该化学杀有害生物剂选自下组,该组由以下组成:阿巴美丁、乙酰甲胺磷、啶虫脒、磺胺螨酯(amidoflumet)(S-1955)、除虫菌素(avermectin)、印楝素、甲基谷硫磷、联苯菊酯、联苯肼酯(binfenazate)、噻嗪酮、克百威、溴虫腈、定虫隆、毒死蜱、甲基毒死蜱、环虫酰肼、噻虫胺、氟氯氰菊酯、β-氟氯氰菊酯、三氯氟氰菊酯、λ-三氯氟氰菊酯、氯氰菊酯、灭蝇胺、溴氰菊酯、杀螨隆、二嗪磷、除虫脲、乐果、苯虫醚、甲氨基阿维菌素、硫丹、高氰戊菊酯、乙虫腈、苯硫威(fenothicarb)、苯氧威、甲氰菊酯、唑螨酯、氰戊菊酯、氟虫腈、氟啶虫酰胺、氟氰戊菊酯、τ-氟胺氰菊酯、嘧虫胺(UR-50701)、氟虫脲、地虫硫磷、氯虫酰肼、氟铃脲、吡虫啉、茚虫威、异柳磷、虱螨脲、马拉硫磷、聚乙醛、甲胺磷、杀扑磷、灭多威、烯虫酯、甲氧氯、久效磷、甲氧虫酰肼、噻虫醛(nithiazin)、双苯氟脲、多氟脲(XDE-007)、杀线威、对硫磷、甲基对硫磷、氯菊酯、甲拌磷、伏杀磷、亚胺硫磷、磷胺、抗蚜威、丙溴磷、吡蚜酮、啶虫丙醚、蚊蝇醚、鱼藤酮、多杀菌素、螺甲螨酯(spiromesifin)(BSN 2060)、硫丙磷、虫酰肼、伏虫隆、七氟菊酯、特丁硫磷、杀虫畏、噻虫啉、噻虫嗪、硫双威、杀虫双(thiosultap-sodium)、四溴菊酯、敌百虫和杀铃脲、涕灭威、杀线威、苯线磷、双甲脒、灭螨猛、乙酯杀螨醇、三环锡、三氯杀螨醇、除螨灵、依杀螨、喹螨醚、苯丁锡、甲氰菊酯、唑螨酯、噻螨酮、克螨特、哒螨灵以及吡螨胺。在仍其他实施例中,该化学杀有害生物剂选自下组,该组由以下组成:氯氰菊酯、三氯氟氰菊酯、氟氯氰菊酯和β-氟氯氰菊酯、高氰戊菊酯、氰戊菊酯、四溴菊酯、苯硫威、灭多威、杀线威、硫双威、噻虫胺、吡虫啉、噻虫啉、茚虫威、多杀菌素、阿巴美丁、除虫菌素、甲氨基阿维菌素、硫丹、乙虫腈、氟虫腈、氟虫脲、杀铃脲、苯虫醚、蚊蝇醚、吡蚜酮以及双甲脒。
在另外的实施例中,该第二有害生物控制剂可以是任何数目的苏云金芽孢杆菌杀昆虫蛋白中的一种或多种,包括但不限于Cry蛋白、营养期杀昆虫蛋白(VIP)以及任何前述杀昆虫蛋白的杀昆虫嵌合体。在其他实施例中,该第二有害生物控制剂是选自下组的Cry蛋白,该组由以下组成:Cry1Aa、Cry1Ab、Cry1Ac、Cry1Ad、Cry1Ae、Cry1Af、Cry1Ag、Cry1Ah、Cry1Ai、Cry1Aj、Cry1Ba、Cry1Bb、Cry1Bc、Cry1Bd、Cry1Be、Cry1Bf、Cry1Bg、Cry1Bh、Cry1Bi、Cry1Ca、Cry1Cb、Cry1Da、Cry1Db、Cry1Dc、Cry1Dd、Cry1Ea、Cry1Eb、Cry1Fa、Cry1Fb、Cry1Ga、Cry1Gb、Cry1Gc、Cry1Ha、Cry1Hb、Cry1Hc、Cry1Ia、Cry1Ib、Cry1Ic、Cry1Id、Cry1Ie、Cry1If、Cry1Ig、Cry1Ja、Cry1Jb、Cry1Jc、Cry1Jd、Cry1Ka、Cry1La、Cry1Ma、Cry1Na、Cry1Nb、Cry2Aa、Cry2Ab、Cry2Ac、Cry2Ad、Cry2Ae、Cry2Af、Cry2Ag、Cry2Ah、Cry2Ai、Cry2Aj、Cry2Ak,Cry2Al、Cry2Ba、Cry3Aa、Cry3Ba、Cry3Bb、Cry3Ca、Cry4Aa、Cry4Ba、Cry4Ca、Cry4Cb、Cry4Cc、Cry5Aa、Cry5Ab、Cry5Ac、Cry5Ad、Cry5Ba、Cry5Ca、Cry5Da、Cry5Ea、Cry6Aa、Cry6Ba、Cry7Aa、Cry7Ab、Cry7Ac、Cry7Ba、Cry7Bb、Cry7Ca、Cry7Cb、Cry7Da、Cry7Ea、Cry7Fa、Cry7Fb、Cry7Ga、Cry7Gb、Cry7Gc、Cry7Gd、Cry7Ha、Cry7Ia、Cry7Ja、Cry7Ka、Cry7Kb、Cry7La、Cry8Aa、Cry8Ab、Cry8Ac、Cry8Ad、Cry8Ba、Cry8Bb、Cry8Bc、Cry8Ca、Cry8Da、Cry8Db、Cry8Ea、Cry8Fa、Cry8Ga、Cry8Ha、Cry8Ia、Cry8Ib、Cry8Ja、Cry8Ka、Cry8Kb、Cry8La、Cry8Ma、Cry8Na、Cry8Pa、Cry8Qa、Cry8Ra、Cry8Sa、Cry8Ta、Cry9Aa、Cry9Ba、Cry9Bb、Cry9Ca、Cry9Da、Cry9Db、Cry9Dc、Cry9Ea、Cry9Eb、Cry9Ec、Cry9Ed、Cry9Ee、Cry9Fa、Cry9Ga、Cry10Aa、Cry11Aa、Cry11Ba、Cry11Bb、Cry12Aa,Cry13Aa、Cry14Aa、Cry14Ab、Cry15Aa、Cry16Aa、Cry17Aa、Cry18Aa、Cry18Ba、Cry18Ca、Cry19Aa、Cry19Ba、Cry19Ca、Cry20Aa、Cry20Ba、Cry21Aa、Cry21Ba、Cry21Ca、Cry21Da、Cry21Ea、Cry21Fa、Cry21Ga、Cry21Ha、Cry22Aa、Cry22Ab、Cry22Ba、Cry22Bb、Cry23Aa、Cry24Aa、Cry24Ba、Cry24Ca、Cry25Aa、Cry26Aa、Cry27Aa、Cry28Aa、Cry29Aa、Cry29Ba、Cry30Aa、Cry30Ba、Cry30Ca、Cry30Da、Cry30Db、Cry30Ea、Cry30Fa、Cry30Ga,Cry31Aa、Cry31Ab、Cry31Ac、Cry31Ad、Cry32Aa、Cry32Ab、Cry32Ba、Cry32Ca、Cry32Cb、Cry32Da、Cry32Ea、Cry32Eb、Cry32Fa、Cry32Ga、Cry32Ha、Cry32Hb、Cry32Ia、Cry32Ja、Cry32Ka、Cry32La、Cry32Ma、Cry32Mb、Cry32Na、Cry32Oa、Cry32Pa、Cry32Qa、Cry32Ra、Cry32Sa、Cry32Ta、Cry32Ua、Cry33Aa、Cry34Aa、Cry34Ab、Cry34Ac、Cry34Ba、Cry35Aa、Cry35Ab、Cry35Ac、Cry35Ba、Cry36Aa、Cry37Aa、Cry38Aa、Cry39Aa、Cry40Aa、Cry40Ba、Cry40Ca、Cry40Da、Cry41Aa、Cry41Ab、Cry41Ba、Cry42Aa、Cry43Aa、Cry43Ba、Cry43Ca、Cry43Cb、Cry43Cc、Cry44Aa、Cry45Aa、Cry46Aa、Cry46Ab、Cry47Aa、Cry48Aa、Cry48Ab、Cry49Aa、Cry49Ab、Cry50Aa、Cry50Ba、Cry51Aa、Cry52Aa、Cry52Ba、Cry53Aa、Cry53Ab、Cry54Aa、Cry54Ab、Cry54Ba、Cry55Aa、Cry56Aa、Cry57Aa、Cry57Ab、Cry58Aa、Cry59Aa、Cry59Ba、Cry60Aa、Cry60Ba、Cry61Aa、Cry62Aa、Cry63Aa、Cry64Aa、Cry65Aa、Cry66Aa、Cry67Aa、Cry68Aa、Cry69Aa、Cry69Ab、Cry70Aa、Cry70Ba、Cry70Bb、Cry71Aa、Cry72Aa以及Cry73Aa。
在另外的实施例中,该第二有害生物控制试剂是选自下组的Vip3营养期杀昆虫蛋白,该组由以下组成:Vip3Aa1、Vip3Aa2、Vip3Aa3、Vip3Aa4、Vip3Aa5、Vip3Aa6、Vip3Aa7、Vip3Aa8、Vip3Aa9、Vip3Aa10、Vip3Aa11、Vip3Aa12、Vip3Aa13、Vip3Aa14、Vip3Aa15、Vip3Aa16、Vip3Aa17、Vip3Aa18、Vip3Aa19、Vip3Aa20、Vip3Aa21、Vip3Aa22、Vip3Aa2、Vip3Aa24、Vip3Aa25、Vip3Aa26、Vip3Aa27、Vip3Aa28、Vip3Aa29、Vip3Aa30、Vip3Aa31、Vip3Aa32、Vip3Aa33、Vip3Aa34、Vip3Aa35、Vip3Aa36、Vip3Aa37、Vip3Aa38、Vip3Aa39、Vip3Aa40、Vip3Aa41、Vip3Aa42、Vip3Aa43、Vip3Aa44、Vip3Ab1、Vip3Ab2、Vip3Ac1、Vip3Ad1、Vip3Ad2、Vip3Ae1、Vip3Af1、Vip3Af2、Vip3Af3、Vip3Ag1、Vip3Ag2、Vip3Ag3、HM117633、Vip3Ag4、Vip3Ag5、Vip3Ah1、Vip3Ba1、Vip3Ba2、Vip3Bb1、Vip3Bb2以及Vip3Bb3。
在仍另外的实施例中,在转基因植物中共表达本发明的第一Cry蛋白和该第二有害生物控制剂。可以通过将植物遗传工程化以含有并表达所有的必需基因来实现一种以上杀有害生物成分在同一个转基因植物中的共表达。可替代地,可以将植物(亲本1)遗传工程化,用于本发明的Cry蛋白的表达。可以将第二植物(亲本2)遗传工程化,用于第二有害生物控制剂的表达。通过将亲本1与亲本2杂交,获得了表达被引入至亲本1和亲本2中的所有基因的子代植物。
在其他实施例中,本发明提供了对植物有害生物侵染有抗性的叠加性转基因植物,该植物包含编码用于在靶标有害生物中抑制必需基因的dsRNA的DNA序列和编码针对该靶标有害生物展示出生物活性的本发明的Cry蛋白的DNA序列。已经报道,dsRNA对抗某些鳞翅目有害生物是无效的(Rajagopol等人,2002,J.Biol.Chem.[生物化学杂志]277:468-494),这可能是由于中肠中的高pH使得dsRNA不稳定。因此,在一些靶标有害生物是鳞翅目有害生物的实施例中,本发明的Cry蛋白起作用以瞬时降低中肠pH,这用于稳定共摄取的dsRNA,从而使得该dsRNA有效沉默靶基因。
除了提供组合物之外,本发明还提供了产生对鳞翅目有害生物有毒的Cry蛋白的方法。这样一种方法包括在转基因非人类宿主细胞产生对鳞翅目有害生物有毒的蛋白质的条件下培养该宿主细胞,该宿主细胞包含本发明的多核苷酸或嵌合基因或核酸分子或重组载体。在一些实施例中,该转基因非人类宿主细胞是植物细胞。在一些其他实施例中,该植物细胞是玉蜀黍细胞。在其他实施例中,该植物细胞或玉蜀黍细胞在其下生长的条件包括自然光照。在其他实施例中,该转基因非人类宿主细胞是细菌细胞。在仍其他实施例中,该转基因非人类宿主细胞是酵母细胞。
在该方法的其他实施例中,该鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在该方法的另外的实施例中,该嵌合基因包括SEQ ID NO:1-5中的任一项。在仍其他实施例中,所产生的蛋白质包含SEQ ID NO:16-25中任一项的氨基酸序列。
在该方法的一些实施例中,该嵌合基因包含针对在植物中表达进行了密码子优化的核苷酸序列。在其他实施例中,该嵌合基因包含SEQ ID NO:6-10中的任一项。在另外的实施例中,所产生的蛋白质包含SEQ ID NO:16-25中任一项的氨基酸序列。
在另外的实施例中,本发明提供了一种产生抗有害生物(例如,抗昆虫)转基因植物的方法,该方法包括向植物中引入包含编码本发明的Cry蛋白的核苷酸序列的本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子,其中该核苷酸序列被表达于该植物中,由此赋予该植物对鳞翅目有害生物的抗性,并且产生抗昆虫转基因植物。在一些实施例中,与缺乏本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子的对照植物相比,抗有害生物转基因植物对杆野螟属(Ostrinia)的鳞翅目有害生物有抗性。在其他实施例中,杆野螟属的该昆虫是亚洲玉米蛀虫(亚洲玉米螟)。在一些实施例中,通过转化植物实现引入。在其他实施例中,通过使包含本发明的嵌合基因、重组载体、表达盒或核酸分子的第一植物与不同的第二植物杂交来实现引入。
在一些实施例中,至少对亚洲玉米蛀虫(亚洲玉米螟)有抗性的本发明的转基因植物还对至少一种另外的鳞翅目有害生物有抗性,其中该另外的鳞翅目有害生物包括但不限于黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在另外的实施例中,提供了一种控制鳞翅目有害生物如亚洲玉米蛀虫(亚洲玉米螟)的方法,该方法包括向这些昆虫递送有效量的本发明的Cry蛋白。为了有效,该Cry蛋白首先被昆虫经口摄取。然而,该Cry蛋白可以按许多公认的方式被递送至该昆虫。用于将蛋白质经口递送至昆虫的方式包括但不限于将该蛋白质提供于(1)转基因植物中,其中该昆虫取食(摄取)该转基因植物的一个或多个部分,由此摄取在该转基因植物中表达的多肽;(2)一种或多种配制的蛋白质组合物中,它们可以被施用至或掺入例如昆虫生长介质中;(3)一种或多种蛋白质组合物中,它们可以被施用至表面,例如喷雾在植物部分的表面,然后当该昆虫取食喷雾的一个或多个植物部分时组合物被该昆虫摄取;(4)饵基;或(5)任何其他本领域公认的蛋白质递送系统。因此,可以使用经口递送至昆虫的任何方法来递送本发明的毒性Cry蛋白。在一些特定实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取转基因植物的一个或多个部分。
在其他实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取用包含本发明的Cry蛋白的组合物喷雾的植物的一个或多个部分。可以使用本领域技术人员已知的用于将化合物、组合物、配制品等施用于植物表面的任何方法将本发明的组合物递送至植物表面。递送至或接触植物或其部分的一些非限制性实例包括喷雾、撒粉、喷洒、分散、下雾、雾化、撒播、浸泡、土壤注入、土壤掺入、浸透(例如,根、土壤处理)、浸渍、灌注、涂覆、叶或茎浸润、侧施或种子处理等及其组合。用于使植物或其部分与一种或多种化合物、一种或多种组合物或一种或多种配制品接触的这些和其他程序是本领域技术人员熟知的。
在一些实施例中,本发明涵盖为农民提供控制鳞翅目有害生物的手段的方法,该方法包括向该农民供应或出售植物材料如种子,该植物材料包含能够在由该种子生长的植物中表达本发明的Cry蛋白的多核苷酸、嵌合基因、表达盒或重组载体,如上所述。
本发明的实施例可以通过参考以下实例而被更好地理解。前述的和以下的本发明的实施例以及各种实施例的描述不是旨在限制权利要求书,而是对其具有说明性。因此,应理解的是权利要求书不旨在受限于这些实例的具体细节。本领域技术人员应理解的是本发明的其他实施例可以在不偏离本披露的精神和范围的情况下进行实践,本披露的范围是由所附权利要求书限定的。
实例
实例1.用于基因组测序的Bt菌株的鉴别
从在中国收集的土壤样品中分离苏云金芽孢杆菌(Bt)菌株。将土壤样品悬浮于LB+2.5M乙酸钠液体培养基中,随后70℃热处理约20min。然后将一微升悬浮液涂布在T3+青霉素琼脂平板上并且在28℃下孵育,直到形成菌落。将具有芽孢杆菌属样形态学的菌落从这些平板中挑出并且在T3+青霉素琼脂平板上重新划线直到它们已经形成孢子,典型地持续大约三天。通过用考马斯蓝/乙酸将培养物染色并且用显微镜目测来鉴别Bt菌株。鉴别Bt菌株后,如下所述分离基因组DNA。
实例2.基因组组装与分析
使用全基因组测序方法,从如实例1中所述分离的Bt菌株的基因组组装本发明的Bt cry基因。简言之,使用Covaris S2超声波装置(Covaris公司,沃本,马萨诸塞州)剪切芽孢杆菌属DNA,其中将程序DNA_400bp设为工作循环:10%;强度:4;循环/脉冲:200。将DNA用
Figure BDA0002230667180000671
UltraTM End Repair/dA-加尾模块(新英格兰生物实验室公司(NewEngland Biolabs,Inc.),伊普斯维奇,马萨诸塞州)处理。如供应商(新英格兰生物实验室公司,伊普斯维奇,马萨诸塞州)所述的,使用NEB Quick LigationTM连接生物科技(Biooscience)有索引的1-57个适配子(1-27巴西,28-57美国、英国和瑞士)。如供应商(贝克曼库尔特公司(Beckman Coulter,Inc.),印第安纳波利斯,印第安纳州)所述的,使用Agencourt AMPure XP珠粒清理连接物。
将文库如下进行大小分级:将50uL样品与45ul 75%珠粒混合物(25%AMPure珠粒加75%NaCl/PEG溶液TekNova目录号P4136)混合。搅拌混合物并置于磁性支架上。将所得上清液转移至新孔中并且添加45ul 50%珠粒混合物(50%AMPure珠粒加50%NaCl/PEG溶液TekNova目录号P4136)。搅拌该混合物并置于磁性支架上。去除所得上清液并且用80%乙醇洗涤珠粒。添加25uL的洗脱缓冲液(EB)并且将混合物置于磁性支架上。去除所得最终上清液并置于1.5mL管中。这个方法产生了525个DNA碱基对(bp)(插入物加适配子)大小范围内的文库。
使用KAPA生物系统高保真热启动(KAPA Biosystem HiFi Hot Start)(KAPA生物系统公司(Kapa Biosystems,Inc.),威尔明顿,马萨诸塞州)使用以下循环条件扩增大小确定的DNA文库:[98℃,45s];12x[98℃,15s,60℃,30s,72℃,30s];[72℃,1min]。每个反应含有:5ul DNA文库、1uL生物科技通用引物(25uM)、18uL无菌水、1uL生物科技有索引的引物(25uM)、25ul 2X KAPA HiFi聚合酶。
使用高灵敏度芯片在Agilent 2100生物分析仪(安捷伦科技公司(AgilentTechnologies),圣克拉拉,加利福尼亚州)上跑文库,以确定文库大小范围和平均插入物大小。使用标准的制造商测序方案(亿明达公司(Illumina,Inc.),圣地亚哥,加利福尼亚州)在HiSeq 2500测序系统上针对配对末端(PE)测序(100个循环/读数;12-24个文库/泳道)处理所有文库。
使用被开发用于鉴别和表征可能的Cry样基因的芽孢杆菌属计算分析工具来优先化引导物,用于进一步实验室测试。
上述基因组组装与分析鉴别出五个Cry样基因,本文称为BT264、BT288、BT302、BT454和BT485,分别编码包含1173个氨基酸、1190个氨基酸、1192个氨基酸、1201个氨基酸和1146个氨基酸的并且分别具有132.1kD、135.8kD、135.6kD、134.1kD和129.3kD的分子量的蛋白质。技术人员将认识到,由于基因组测序和基因组装过程,组装的核苷酸序列和由其衍生的氨基酸序列不太可能是天然存在的,因为本领域已知序列的组装不是100%准确的并且可能引入不同于天然核苷酸序列的碱基。因此,这些核苷酸序列在此称为“组装的序列”,并且它们编码的Cry蛋白衍生自“组装的序列”。
对衍生自组装的核苷酸序列的全长和截短的Cry蛋白氨基酸序列进行序列同源性搜索。该截短的序列接近成熟毒素的大小,即大约67kD。使用万维网ncbi.nlm.nih.gov/BLAST上的NCBI蛋白质-蛋白质BLAST程序来确定同源性。与每种组装的Cry蛋白具有最高同源性的已知Cry蛋白表明了组装的Cry蛋白所属的最近的Cry家族。这些组装的Cry编码序列和蛋白质的鉴别特征示于表1中。
表1.苏云金芽孢杆菌菌株中鉴别的组装的Cry基因/蛋白质。
Figure BDA0002230667180000691
令人惊讶的是,根据是否对三种组装的Cry蛋白(BT288、BT302和BT485)的全长与截短的氨基酸序列进行搜索,鉴别出不同的最近的Cry家族成员。如表1所示,与全长BT288(SEQ ID NO:17)(其中它最近的Cry家族是Cry4Aa,Cry4Aa与其全长具有42%同一性)相比,对于截短的BT288 Cry蛋白(SEQ ID NO:26)鉴别出的最近的Cry家族是Cry54Aa。将BT288与Cry54A和Cry4Aa进行比对显示出BT288的N-末端(SEQ ID NO:26)与Cry54A蛋白具有51%同一性(参见表2),并且BT288的C-末端(SEQ ID NO:27)与Cry4A蛋白具有47%同一性(参见表3),这表明组装的BT288核苷酸序列是Cry50A和Cry4A蛋白之间的杂合体。
表2.BT288的N-末端(SEQ ID NO:26)与Cry54Aa(SEQ ID NO:32)的比对。
Figure BDA0002230667180000701
表3.BT0288的C-末端(SEQ ID NO:27)与Cry4Aa(SEQ ID NO:33)的比对。
Figure BDA0002230667180000702
Figure BDA0002230667180000711
与全长BT302(SEQ ID NO:18)(其中它最近的Cry家族是Cry19Ca,Cry19Ca与其全长具有47%同一性)相比,对于截短的BT302 Cry蛋白(SEQ ID NO:28)鉴别出的最近的Cry家族是Cry39Aa。将BT302与Cry39A和Cry19Ca进行比对显示出BT302的N-末端(SEQ ID NO:28)与Cry39A具有54%同一性(参见表4),并且BT302的C-末端(SEQ ID NO:29)与Cry19Ca具有53%同一性(参见表5),这表明组装的BT302核苷酸序列是Cry39A和Cry19C蛋白之间的杂合体。
表4.BT0302的N-末端(SEQ ID NO:28)与Cry39Aa(SEQ ID NO:34)的比对。
Figure BDA0002230667180000712
Figure BDA0002230667180000721
表5.BT0302的C-末端(SEQ ID NO:29)与Cry19Ca(SEQ ID NO:35)的比对。
Figure BDA0002230667180000722
与全长(SEQ ID NO:20)(其中它最近的Cry家族是Cry4Ba,Cry4Ba与其全长具有62%同一性)相比,对于截短的BT485 Cry蛋白(SEQ ID NO:30)(其与其全长形式具有62%同一性)鉴别出的最近的Cry家族是Cry50B。将BT485与Cry50B和Cry4B进行比对显示出BT485的N-末端(SEQ ID NO:30)与Cry50B具有70%同一性(参见表6),并且BT485的C-末端(SEQ ID NO:31)与Cry4B具有75%同一性(参见表7)。Cry50B和Cry4B与其全长仅具有51%同一性(参见表8)。因此,组装的BT485核苷酸序列似乎是Cry50和Cry4之间的杂合体。本领域已知Cry4B和Cry50对双翅目昆虫,特别是蚊子具有活性(Zhang等人2012.Characterization of a new highly mosquitocidal isolate of Bacillusthuringiensis--an alternative to Bti.[一种新的高度灭蚊的苏云金芽孢杆菌分离物的表征-Bti的替代品]J.Invertebr.Pathol.[无脊椎动物病理学杂志]109(2),217-222),并且没有明显的针对鳞翅目昆虫具有活性的报告。
表6.BT485的N-末端(SEQ ID NO:30)与Cry50Ba(SEQ ID NO:36)的比对。
Figure BDA0002230667180000731
Figure BDA0002230667180000741
表7.BT485的C-末端(SEQ ID NO:31)与Cry4Ba(SEQ ID NO:37)的比对。
Figure BDA0002230667180000742
表8.Cry4Ba(SEQ ID NO:37)与Cry50Ba(SEQ ID NO:36)的比对。
Figure BDA0002230667180000743
Figure BDA0002230667180000751
实例3.重组宿主细胞中的Bt蛋白表达
芽孢杆菌属表达。经由设计用于在大肠杆菌和Bt两者中表达的指定为pCIB5634`的穿梭载体,在没有可观察到的背景杀昆虫活性的无晶体(crystal minus)苏云金芽孢杆菌(Bt)菌株中表达实例2中描述的Cry蛋白。载体pCIB5634`包括驱动经克隆的Bt Cry基因的表达的Cry1Ac启动子和红霉素抗性标记。经由电穿孔将包括目的Cry编码序列的表达盒转化进宿主Bt菌株中并且在含有红霉素的琼脂平板上选择转基因Bt菌株。使所选择的转基因Bt菌株在T3培养基中于28℃下生长4-5天至孢子形成阶段。收获细胞沉淀并且在溶解于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中之前反复洗涤。
大肠杆菌表达。使用pET28a或pET29a载体(默克公司(Merck KGaA),达姆施塔特,德国)在大肠杆菌菌株中表达Cry蛋白。通过电穿孔转化构建体并且在含有卡那霉素的琼脂平板上选择转大肠杆菌克隆。使所选择的转基因大肠杆菌菌株生长并且使用IPTG诱导在28℃下诱导Cry蛋白表达。将细胞再悬浮于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中并且然后使用Microfluidics LV-1匀浆器打碎。
表达分析。然后经由离心澄清来自转基因Bt或大肠杆菌菌株的所得细胞裂解物并且使用BioRad Experion系统(伯乐公司(Biorad),赫拉克勒斯,加利福尼亚州)经由SDS-PAGE和电泳图分析样品的纯度。经由布雷福德(Bradford)或赛默(Thermo)660测定来确定总蛋白浓度。然后在以下描述的生物测定中测试经纯化的Cry蛋白。
实例4.Cry蛋白在生物测定中的活性
使用本领域公认的人工饲料生物测定方法针对以下鳞翅目有害生物物种中的一种或多种测试实例3中产生的Cry蛋白:亚洲玉米蛀虫(ACB;亚洲玉米螟)、棉螟蛉(CBW;棉铃虫)、黑色地老虎(BCW;小地老虎)、欧洲玉米蛀虫(ECB;欧洲玉米螟)、秋黏虫(FAW;草地贪夜蛾)、玉米穗蛾(CEW;玉米穗虫)、甘蔗螟(SCB;小蔗螟)、西南玉米蛀虫(SWCB;西南玉米螟)、大豆夜蛾(SBL;大豆尺蠖)、以及烟夜蛾(TBW;烟芽夜蛾)。
向24孔平板中的人工昆虫饲料(Bioserv公司,弗伦奇敦,新泽西州)的表面施用等量的溶液中的蛋白质。在饲料表面干燥之后,向每个孔中添加有待测试的昆虫物种的幼虫。将这些平板密封并且保持在就温度、光照以及相对湿度而言的环境实验室条件下。阳性对照组由暴露于非常具活性且广谱的野生型芽孢杆菌属菌株的幼虫组成。阴性对照组由暴露于仅用缓冲溶液处理的昆虫饲料的幼虫和未处理的昆虫饲料(即只有饲料)上的幼虫组成。约120小时之后评估死亡率并且相对于对照评分。
结果示于表9中,其中“-”意指与对照组相比无活性,“+/-”意指与对照组相比0-10%的活性(此类别还包括具有强烈幼虫生长抑制的0%死亡率),“+”意指与对照组相比10%-25%的活性,“++”意指与对照组相比25%-75%的活性,并且“+++”意指与对照组相比75%-100%的活性。表2中的名称“nt”意指没有针对该具体有害生物测试所指示的蛋白质。
表9.Cry蛋白的生物测定结果。
Figure BDA0002230667180000771
实例5.针对植物表达的基因定向
在植物中表达之前,在自动基因合成平台(例如,金斯瑞公司(Genscript,Inc.),皮斯卡塔韦,新泽西州)上合成编码Cry蛋白BT264(SEQ ID NO:16)、BT288(SEQ ID NO:17)、BT302(SEQ IDNO:18)、BT454(SEQ ID NO:19)或BT485(SEQ ID NO:20)或者突变型Cry蛋白mBT264(SEQ ID NO:21)、mBT288(SEQ ID NO:22)、mBT302(SEQ ID NO:23)、mBT454(SEQ IDNO:24)或mBT485(SEQ ID NO:25)的多核苷酸。用于这个实例,制备包含可操作地连接至Cry蛋白编码序列(该编码序列可操作地连接至终止子)的植物可表达型启动子的第一表达盒,并且制备包含可操作地连接至选择性标记(该选择性标记可操作地连接至终止子)的植物可表达型启动子的第二表达盒。选择性标记的表达允许在选择培养基上鉴别转基因植物。将两个表达盒克隆进适于农杆菌介导的水稻或玉蜀黍转化的载体中。
实例6.Cry蛋白在玉蜀黍植物中的表达与活性
未成熟的玉蜀黍胚的转化基本上如在以下文献中描述的来进行:Negrotto等人,2000,Plant Cell Reports[植物细胞报告]19:798 803。简言之,使包含描述于实例5中的表达载体的农杆菌菌株LBA4404(pSB1)在28℃下在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/l琼脂,pH 6.8)固体培养基上生长2-4天。将大约0.8X 109个农杆菌细胞悬浮于补充有100μM As的LS-inf培养基中。在这个培养基中对细菌预诱导大约30-60分钟。
将来自近交玉蜀黍系的未成熟胚从8-12天龄的穗中切除到液体LS-inf+100μM As中。用新鲜的感染培养基漂洗这些胚。然后添加农杆菌溶液,并且将这些胚涡旋30秒并且允许其与细菌一起沉降5分钟。然后将这些胚盾片向上地转移到LSA培养基中,并且在暗处培养两到三天。随后,将每皮氏板(petri plate)大约20与25个之间的胚转移至补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中,并且在大约28℃下在黑暗中培养10天。
将产生胚性愈伤组织的未成熟胚转移至LSD1M0.5S培养基中。在这种培养基上对培养物进行持续大约6周的选择,在约3周时进行传代培养步骤。将存活的愈伤组织转移至补充有甘露糖的Reg1培养基中。在光照中(16小时光照/8小时黑暗方案)培养之后,然后将绿色组织转移至没有生长调节剂的Reg2培养基中并且孵育约1-2周。将这些小植株转移至含有Reg3培养基的Magenta GA-7盒(马真塔公司(Magenta Corp),芝加哥,伊利诺伊州)中并使其在光照中生长。约2-3周之后,通过PCR测试植物的选择性标记基因和Bt cry基因的存在。将来自PCR测定的阳性植物转移至温室用于进一步评估。
在叶切除生物测定中,针对拷贝数(通过Taqman分析确定)、蛋白质表达水平(通过ELISA确定)和对抗目的昆虫种类的功效对转基因植物进行评估。确切地说,从单拷贝事件(V3-V4阶段)中切取植物组织(叶或花丝)并且用靶标有害生物的新生幼虫侵染,然后在室温下孵育5天。针对一种或多种鳞翅目有害生物如亚洲玉米蛀虫(亚洲玉米螟)测试来自表达BT264、BT288、BT302、BT454、BT485、mBT264、mBT288、mBT302、mBT454或mBT485的转基因植物的叶圆片。转基因植物组织生物测定的结果将证实当在转基因植物中表达时本发明的Cry蛋白对于目标鳞翅目有害生物中的一种或多种是有毒的。
序列表
<110> Syngenta Participations AG
Syngenta Biotechnology China Co., Ltd.
Huazhong Agricultural University
SUN, Ming
MEI, Wenqian
SEGUIN, Katherine
BRAMLETT, Matthew
<120> 用于控制植物有害生物的组合物和方法
<130> 81292-CN-REG-ORG-P
<160> 37
<170> PatentIn version 3.5
<210> 1
<211> 3522
<212> DNA
<213> 苏云金芽孢杆菌
<400> 1
atgggaggaa taaatatgag tccaaattat tcagatgact atgaaatcat aaatgctcca 60
tcgaatactt ctccaagata tcctttagta cacgatctaa ctccacaatt ccaagatatg 120
aattataaag attatttacg aatgacggag gggaataggg gtgtttccgc tacatcagta 180
agatcaggtg gtgaagcaat tgatgctgca ctctctataa ctgcaatttt gctaggtgtt 240
ttaggtcacc cagttggttc tgcggttgtt ggtactttta atgctctttt aggcttattg 300
tggccgaatg gtcaaacaat tgtatgggaa gatttattag caaaagcaga agattttgct 360
aataaagtca taacagcgga aataagaagt aatgcattct cagctttaaa tgtatcatac 420
gcaatggtat ctgagtatac aagcgcgtta aatgattgga tagaaaatcc aggagtacgt 480
atatctcaac aactaatgag agagatattt actaatacag tactccaatt agctagtcag 540
atgccatatt ttaatgtagc tggttatgaa acatcattgt taacaatgta tgcacaagct 600
gccaatttac atctatctgt attaaaagat atattcattt ttgggaaaga atggggattt 660
cctcaaactg acattgattt ttattattat gaggaattca tagatcatct tcctgtatat 720
gttgatcatt gcacgaaatg gtataatgaa gggttaaaca acttaccaaa gtcaaactct 780
tatgattggt ataactataa taaattccgt agagaaatga cattaatggt actagatatt 840
gttgctttat ttccaagtta tgatgcatat gtatatacat tggagacaac aacagagctt 900
acaagaatag tttatacaga tccacttggg attatgatac ctccacctcc aggatatgag 960
gaaatggttg gttatggtgg taatcttgat tggcgtaatt atggttttag cttctcatat 1020
ttagaaagtc aacttcgaca gcctgttctg tttagttggt taaattcaat aaaaatgtat 1080
acgagaaaaa taatatgtga ggctggtact ccccacagtc tttggtcagg gaatgagata 1140
aatctatctt atacatcaga tccttcaaat acttttacgc ttcagagtgg gtatagtact 1200
ggatatacac atacagattt cctagatatc aattcaaaag atatttatga agttgtttca 1260
aaaataggtt cagaggcagt tgttggtccg ggagacgatt cttatctcta tggattgtat 1320
caagcagctt ttcggatcat acctaaagat agttctgcat attcttatct ttatcctaca 1380
tatgacattg gcatgaatgg ttattctatg agctcactgg tagaattacc tccggaatcg 1440
tccgatccac ctcaaccgga tgaatatacg tatactcata gattatctta cgcgacactt 1500
cttagcgtgc acagttatac ttctgatttt tttaatgatg gagcgattcc tatatacggt 1560
tggacacata gaagtgtaaa tcgtgataat caaatttacc cagatagaat tacgcaaatt 1620
ccagctgtaa aaggaaaaca gttaatagag ggtgcgagtg ttcataaagg acctggatcg 1680
actggaggag atttagttag actttattta aatgatagag tttatctaaa tgttaacgta 1740
gactcagtat cacaaaaata tcgtgtaaga gttcgttgtg ctacttacaa tcctggttct 1800
atatatttgt atcgtgataa tactataatt agttctgcta cagctccaaa gactacggat 1860
acaacagata ctactcaaat taaatttaat gactttcaat atataacttt tagtgatatt 1920
tttacattta ctagtacttg gcaacaaata tctataggtg caggtacaac atatgcagaa 1980
gtgtatatcg acaaaatcga attcatccca gtgaatgaga catatgaagc ggaaagaaat 2040
ttagaaaatg cgaagaaggc agtgagcgca ttattcacag gtacgatgga tacattaaaa 2100
agagaagtga cagattatca aatcgatcgg gcttcgaatt taatagaatg tgtgtcagat 2160
gaaatgtatg gaaacgataa acgactgtta tttgaagcgg taaaaaccgc aaaacgattg 2220
agtcaatccc gtaatctact tcaagatcta aattttgaaa tgttaaatac cagcggtaac 2280
ggagaaaatg gctgggtcgg aagtacagga atacaagttg tagaaggaga tgcgctattt 2340
aaaaatcgtt ccctgcgttt accaggtgcg agacaatttg atacagaaac atatccaacg 2400
tatctgtatc aaaaaataga ggagtctaaa ttaaaaccat atacacgata taaagtgaga 2460
gggtttataa aaggtagtaa agatttagag gtagatgtga tgcgatatgg cgcgaaacag 2520
aaagtgttga acgttccaaa taatttaaat ccagatatca ttcctataaa tgcttgtgga 2580
gacgtggatc gatgcagaca acaacaagca gtcaatgcgc gtttacaacc agcaaccatt 2640
tcaccgtgtg aggggggaga taccaatact tccgcacatg cattttcatt ctcgattgat 2700
acaggtgcca tcgatacaag tgaaagacca ggaattggcg tggcgtttaa aattgcgaca 2760
ccagaaggtt acgcatcact aggaaatcta gaagtgatag aagaaggtcc actcacagga 2820
gaagcgttag cacatgtgaa acaacgagaa agacaatgga aagacaaaat aacaaaaaaa 2880
cgtgcagaaa cagaaaccat ttatacaaga gcgaaacaag caattaataa tttgttcgca 2940
gattatcaag atcgacaatt aaagcatgat gtagagattc caaatattat tgcggcagac 3000
cagattgtag agtctattcg tgatagatat aatgaatgga ttcctgcaat tccaggaatg 3060
aattatgaaa tctacacaga gctaaaaaat agaatccaac gagcatatgc tttatatgat 3120
gctcggaata tcatcaaaaa tggagacttc cgaaacggat tagcaaattg gaatgcgacg 3180
cctggtgcaa gagtacaaca aatgaacggg aatccagtac tagtcattcc aaattgggat 3240
acgcaagttt cccaaagtgt tcctgtagaa ccaaatcata gatatctgtt acgtgtaacg 3300
gcacaaaaat taggtgctgg aaacggatat gttacagtga cagatggtac aaatcataca 3360
gaaacattga catttgatag atgtgataat aatacaactg gatctaatcg atatgtaacg 3420
aaaacaattg aatttacccc acgtacaaat caattacaag ttgaaatagg tgaaacagaa 3480
ggaacattca acatagaaag tgtgaatttg ctcggttgtt aa 3522
<210> 2
<211> 3573
<212> DNA
<213> 苏云金芽孢杆菌
<400> 2
atgactcaaa ataacaatga atatgaaatt atagatcaaa atacttcacc ttattcttct 60
aacagaaaca ataataactc cagatatccc tttgcaaata atccaaatca agcattacaa 120
cagactaatt acaaagattg gatcaatatg tgtcaaaaaa atcaacaatg tggtgaaaat 180
cttgaaacgt ttgctagtgc tgatacaatt gccgcagtta gtgcaggtgt tattgtagta 240
ggcactatgt taggagcttt tggtgcccct gttacaactg gtcttattat atccttcgga 300
acactattgc cgattttttg gggaccaagt gaagatccta aaaaagtatg gaaagaattt 360
ttaacaatcg gaaatagacc ttttggttca gaagtagatc aaggtataat tgatttacta 420
tatactaaag taaatggctt aagatcgcaa tttgaagact ttcaaaggta ttttgatcta 480
tggaaaaata ataaaaatcc agtcaatgct gatgtagtaa gacaaaaatt tctttcattg 540
gattctgatg taataagaga attagaaaca ttaaaaggaa actattatat aacgttactt 600
cctggttata cacaagtagc taattggcat ttaaatctat tacgacaagc tgcatattat 660
tatgacgaat gggcaccttc atctaactta tcaatacaaa gtatatatcc tcaggattac 720
actaacgatc ttcagacttg cttagataat tgccctagcg aaagtggtaa taaggtatct 780
tctgcatact ataagtgcat attaaaatgt agaattaatg aatatattaa ttattgttca 840
aaaacatatc aagaaggctt aaataaactt aaaaattcaa gtgatataaa atggaatata 900
tataatgagt atcgtagaga aatgacttta actgtattag atcttattgc tgcttttcca 960
aattatgacc tagaaaaata tccaataggt actaaatgtg aacttactag agaagtttat 1020
acaaatgctt tgatggggtc tagttctatg tctatagcag aactagaaaa atcactaaca 1080
aaagatcctt ttttgattac ttggttaaat aaaatattgc tttatacaag aaattataag 1140
caacctacta ctgaggatgt ttttgttttt actggcaatc agcttcgtta ttcatttaca 1200
atggattcaa atttagggta tagtggattt tatggtgatg ttagttatac tgatgacaca 1260
gaacaaatac ttgaaatccc gggcaattca caaattgtta aggtagaagt tgaaaggcac 1320
agagactctc ctgatataat atggaaaatt gattttcatt taaataatgg agcagtatta 1380
aagtataatt caggttcaac ggcagatccg aattttagag taagggacgt tttaacgatt 1440
cctccagata gtaaaggcaa tgcaagtcat tttttatcct atatgaaaag tgcttatgtt 1500
acatcagatg ttaaacaatt aagaagagtt tcatttgctt ggacacataa tagtattaat 1560
tataacaatg agatttataa tgatataatt acacaaattg cagctgtaaa aggccattac 1620
ctcggcctcg aaggtttagc ttcccgagtc attcaaggtc ctggtcacac aggtggagat 1680
ttagttgatt taaaagatga cctacgcctt gcatgtcaac actctggtac tcaacaatct 1740
tattatatac gaatccgtta tgcttctgat ggagatacta gaatcgtcct tgtaatccca 1800
ttaatggaat cacaaaatat tccactcaaa tcaacttttt cgggtgtaaa tcatgatgaa 1860
ttaaaatata aagattttgg gtatgttcaa tttccagggg aaataacatt aaatcaacac 1920
tcaaagataa ctcttatttt tcgtcttcaa gatatatatt caaatataag tgtattcatt 1980
gataaaattg aatttatccc aatcactagt tctattcgag aaaacagaga aaaataccaa 2040
ttagaaaaag cgaaacgagc agtagatgat ttatttataa gtgctaaaaa acaaaatata 2100
aaaattgata tcacagatta tcagattgat caaactgcta acttagtaga ctccctatca 2160
gaagaaccat atccacaaga aaaaatgatg ttactaaatc aaatcaaata tgctaaacaa 2220
ctaagtcaat cacgaaattt acttagtaat ggagattttg aatctttaat tggctggaca 2280
acaagtagta gtattactgt ccaaactggt aatactattt ttaagggatt ttctctccat 2340
atgctaggag caagaacaac agaaattaac gctactgtat tcccaactta tgtatatcaa 2400
aaaattgatg aatcaaggtt aaaaccttat acacgttata tagttcgagg attcattgga 2460
agtagtaagg gtttaggaat atttgttaca agatataata atgtaccaga taaattagcc 2520
tatataagat ctacaaattc ttgtggagaa ttaaatcaat acgaatcgca aaattattct 2580
cttgtaagtg aaaataattc tacaatgagt ctacaaaaca taacagcatc aaatgatact 2640
tcatgtctat cggaaaattt acgttattgt gaaccaaatc agttatatcc gacatgtcat 2700
aacttacatg atttttcttt ttctatagac acaggagaat tagatttcaa tgaaaaccca 2760
ggtatctgga ttctattcaa aatctctaat ccggatgggt atgctacatt aggtaattta 2820
gaagtaattg aagaaaaaac attagttgga gaagaaataa ataatgttaa agaaaaagga 2880
aaaagatgga aaaaagaaat ggatactaaa caaacaaaaa cagaaactgc attttctcaa 2940
gcccaacaag cagttaatgg gttatttatg aatacacaat attcaatgtt aaaaatagaa 3000
acaactatgc aagatattgt tacagcagat aacctcataa atgagattcc atatgtttac 3060
gacgaactgt tacctaatga accagcaggt aggaattata acatgtttat agaattaaaa 3120
aatcaaatct cacaagtata ctctttatat aatgccagaa acatcattca aaatggtaac 3180
tttaacaacg gcttaaaaaa ttggcacaca tcaccggatg ccaaagtaca aaaaatagat 3240
aatacctctg tacttgtcat tccaaactgg agtacacaag tatctcaaca caccaactta 3300
caacaaaatc aacgatatct attacgtgtc acagcaaaaa aagaaggaat gggaaatgga 3360
tatgtaaaag tgagtgattg tgcaaataat gtagaaacac taacatttaa atccagtgat 3420
atcactaaca acaatatgtg gaatgaatct ataggctaca tgaccaaaac aatgtatatc 3480
actccacata ctagtcaagt acgcattgat ataggagaaa cggaagggaa ctttaaaatc 3540
aacagtatag aacttatttg tataaaaaac taa 3573
<210> 3
<211> 3579
<212> DNA
<213> 苏云金芽孢杆菌
<400> 3
atgagtagtg gaggaacgaa tatgaattca aatcgtaata aaaatgaata tgaaatacta 60
gatgcatcat caagtacatc taacatgacg aatcagtatt caagataccc tctggcaaat 120
aatccacagg cttttatgcg aaatacgaat tataaagatt ggttagctat gtgcgaaaga 180
aatgatactg gagttttaga aaatcccgaa gtattgagct taagaggtgc agttggtact 240
ggagtgagta tcgtcggcat gatttttagc ttaataggta ttccagttat tggggaggta 300
gttggaatac tagtatcatt aacaaacctt ctttggccag aatctgaagg aagtgcacaa 360
tacacttggc aagaacttat cactcatgta gaagagctta tggatcaacg aataggagag 420
acgcaaaaag ctaatgcact tgcaaaatta tcaggtttaa aagctcaagt agctgcatat 480
aatcgggctc ttgaggattg ggaaaaaaat ccgaattcaa gatctgcatc tgaagtaata 540
gctagattcc gaagtactaa caatgatttt gtaggatcta tgcctcaatt ttcgcctaat 600
ggttacgaaa tattattatt gtctgtatat gcacaagctg cgaatctgca tttactatta 660
atacgagatg ctactattta tggaagtcag tgggggctat ctcaaggtga cgtcaatcta 720
tattacaatg aacaactact gtatacaaaa caatacgtta atcattgtgt tacctggtat 780
aacaatggct tagctcaaca aaaagcattg ttcgctacat caccaaactg gaatcgattt 840
aatgcttatc gaagagacat gacaattaac gtattagatc tcattgcact attcccaatt 900
tatgacgctc gtttgtatcc gcaaccagta agggcagaac ttacaagaga aatctattca 960
aatatattga attcggatgt gtacggagta caatgggcag attttgaaaa aaatgaaagt 1020
acattcacac gcccaccaca tttatttacg tggttacgaa aatttgactt ttacacaaga 1080
actaagtatt acaaccaagg gctagggtgg ctatttttag gggggcatac aaactattat 1140
tcgtatacga atagtagtaa ccttaaatca ggatcttata ataatttttg gggttcagat 1200
atgcaaacaa gtacacttac tattccagat aacccttcta tttataggtt gtggacaaaa 1260
agttatacgc atatctatcc atatacagat ccggttaaca tcacgcaaat gcaattttat 1320
ttaacaaata atcaacagtt aacttatacg gctacggcta accctcggta tcctgtacgt 1380
gaaacgaatt ttgaattacc atctaccgat gagaatccgc taacttatca aaattatagt 1440
catattttat cttatatgat aagttcacaa catttcgggg ataaaagatc tggatataca 1500
tttgcttgga cacataatag cgtggaccct actaatactc ttgccccaaa taaaattaca 1560
caaatcccag ctgtgaaagc taatactctg gaaggtaata aatcttttgt tgtaaaaggt 1620
ccaaatcata caggagggga tttagtaatt cttgaggctg aaccaggtcc agtttatcct 1680
attgtgtacc gaggagtaat gggaattact tgtaaggtta cacaagctca gaattatcgt 1740
attcgtattc gttatgcttc aaatggtggt gctcaaatgg ctatcagttt aagaaatcgc 1800
ggaactggta cggtttttac tgtaagtaaa acttatacag gtaatagtat tgaaaactta 1860
cagtataatg attttcaata taaggatatg cctgttattt tggaagcaag tcaatatgaa 1920
cccaacaatt ccatatatgt atatttatat caggagagtc catatataca agtaattatc 1980
gacaaaatcg aatttattcc aattgataca acttctcaag aatatgaaga aaaacatcaa 2040
ctagaaaaag caaagaaagc ggtgggagtc ttgtttacca atgatgcaaa gaaggccctg 2100
aaaatagata caactgatta tgatgtggat caagcggcaa acttgataga atgtctgtca 2160
gatgaacaat acgcaaaaga aaaaatgatt ttattggatg aagtaaaata cgcaaaacaa 2220
ctgagccaat cacgaaattt gcttcaaaat ggagactttg aatcttctga aattggatgg 2280
gaaacaagta atactatcac aattcaagcg ggtaatctta tcttcaaagg taagtatctc 2340
aatatgtcag gtgcaagaaa tatagatggc gctatatttc caacctacgc attccaaaaa 2400
gtagatgagt caagattaaa accatataca cgttataagg tgagaggatt tgttggcagt 2460
agtaaagatg tagaagtggt agttacacgg tatggtgaag aagtagatac aataatgaat 2520
gtaccaaatg atttaacata tgatgtaggt tctgttaaat cttgtggaga atggaatcga 2580
tgtgaacaac agccatatca aaataggaac caagtgttaa acaattctat gataattgct 2640
aatacttcta atgcatcaaa ctcttgtgaa tatgtaccag agaaaaaacg tgtaatgtgc 2700
ccagaaccac atcaattttc tttccatgtt gatacaggag aaactaattt gaacgaaaat 2760
ttagggattt cggtcttatt taaaatttct tcaccagagg gttacgcaat attagataat 2820
attgaattaa tcgaagaggg ttcactggta ggagaatcgt tggcttatgt tcaaaatcga 2880
gaaaagagat ggaaaaataa aatgcaagca gaacgtatgg aaacacagca agcatataat 2940
atcgccaaac aagtagtcga tatcttattt actgatcctc aagatacagc attaaggttc 3000
gaaacgaata aatccaacat tatttcagca gatgagcttg tgcagtccat tccttatata 3060
tacaatgact ggttacgaga tgtaccaggt atgaattaca acatgtttac agaattaaaa 3120
ggccggatca cacaagcata ctatttatat gatgatcgaa atgtgcttca aaatggagac 3180
tttaataatg gactcacatc ttggtatgtt acaggaaatg cagaagtaca gcaaatagat 3240
ggtacatttg tattagtgct tcaaaattgg agtaccactg tttcacaaaa tgtttgttta 3300
caacacaatc gtgggtatgt tttacgggta accgcaagaa aagaaggcat gggaaatggg 3360
tacgtgacaa tgagtgattg tgcaaatcat atagaaaaga ttatatttac ttcttgtgat 3420
aataatatag ttgttacatc aactgactct gcagaatatg taacacgaac tgtctccttc 3480
ttcccagata cagaccacgt acgaattgaa attggagaaa ccgaaggtac ttttaaagta 3540
gaaagtgtgg aattgatttg tatggagggg aaggaataa 3579
<210> 4
<211> 3606
<212> DNA
<213> 苏云金芽孢杆菌
<400> 4
atgaatcaga atattgcagc agtgcgagag gcagtcaatg ctttgttttc aaatcatacg 60
ttacaattga aagtcacgga ttatcatgtg gatcaggtgg caaagttagt agagtgtata 120
tctgatcaga accattcaaa agaaaaaatg tgtttgttag atcaagtaaa attggcgaaa 180
cgattgagtc gagaacgtaa tttgttaaac tatggtgatt ttgaatcatc gaattgggct 240
ggcgcagatg gatggaacat cagtgctcat gtatacacga tagctgataa tctaatcttt 300
aaagatcatt atctcaatat gccaagtgta aataatccca tattaagtga taaaatattt 360
ccaacgtatg cctatcaaaa gatagaggaa tcaaagttaa agccgtatac ccgctatatg 420
gtacgagggt ttgtaggaag tagtaaagat ttagaaattc ttgttgcaag acatggtaaa 480
gaagtgcaca aaagaatgaa tgtaccgaat gatattatac caacaaatcc atgtacagga 540
gaacttgtat cgcaaccacc cccgtatcct gttatgccaa tccatacgat ggcccaaaac 600
atgtggtgta atccatgtga gaatggctat cagactgcag cagggatgat ggttcaagag 660
acaaatatgg tgtgtcaaga tccacatgaa tttaaattct ctattgatat aggtgagatc 720
gatagggagc gaaatttagg catttggatt ggttttaaag tgggaacaac agaggggatg 780
gcgacactag atagtataga agtagtagaa gtaggaccgt taacgggaga tgccttaaaa 840
cgtatgcaaa aacgtgaaca aaaatggaag aaaaaatggg cagagaaaca aatgaagatt 900
gaaagggctg tgcaaatagc acgaaatgcg attcaaacat tattcacaga tccaaatcaa 960
aacagactac aatccgctat tacactgaaa aatattgtag atgcagaaaa atgggtacaa 1020
aagattccat atgtatacaa tcaattcttg caaggggcta taccagaggt accaggtgaa 1080
caatacaacg tcttccaaca actttcccaa gcagtggtga cagcacgggg tctgtataat 1140
cagcgaaatg tgataaacaa tggagatttc tctgcgggat tgtcgaattg gaatggtacg 1200
aaaggtgcag atgtacaaca gattggaaag gaatctgtgc taatgatttc cgattggagt 1260
gcaaatattt cgcaacaggt gtgtgtggag ccagaacata gctatttatt acgtgtaacg 1320
gcaagaaaag aaggttctgg tgaaggatat gtgacaatta gcgatggaac gaaagacaat 1380
acagagacac tgaagtttat agtcggtgaa gagacgacag gtgcgacaat gtctactatt 1440
cgttcccata ttcgtgaacg ttataatgag cgcaatatgg tgacatcaga agtctatgac 1500
gcaagcgggt atgcgagcaa tcaaaatatg gtgaattact catcagaaaa ttatggaatg 1560
agtgcatatt caggaaataa caacaagaat tatcaatcag aaagctttgg atttactcca 1620
tatggtgatg aaaatagtat gatgaactat ccatcagaaa attatgggga aaatgcatat 1680
tcaggcaacg ataatatgaa ttatccatca aacaattacg aaatgaaccc atactctagc 1740
gatatgaata tgtcaatgaa tcaaggatcg gattgcagat gtggatgcag cacaaactca 1800
tatccaggtg gagatatgac gatgaataac tatccatcta gcatgtatga aacgaatgca 1860
tatccaagta gcacgaacat gaccgataat ctgggaatgg gctgtggatg ttattacagt 1920
acaaatgaac atccgatggt agaacaaagt acccttgacc tttctgatta tgtaatgaaa 1980
acagttgaaa tcttcccaga aacgaatcgt gtatgtattg aaattggcga aacagcggga 2040
atatttatga tagaaagtat tgaatttgtt ccggtaaatc cgattgaatc agtacccgag 2100
cctggtcctg gtatctatca gagtgttaca gctttaaata atagtagtgt agtagagatg 2160
gcgtcacaag gagcgaggaa tgtaatcaag gcacttccac aaaatgcgtc aaatatagag 2220
ttagagtatg ctcctgtgta tgactacgac acagacgggt gttatgcgac tgcagcaatt 2280
tctccagatg gcacgactaa ccctggacta ggtatgggcg atagcccgag cagtggctgt 2340
agaggtcctg cacaactaga aaattcaaac acttattctc gggccaaatc aaataatggt 2400
tggactgcaa ttatgtatgc gagttacttt gagaaagatc aaacatctct cggccctggt 2460
tcggctggac atcgacatga ctgggaacac acaatagttt gggttaaaga tggtcaggtt 2520
caatatgtaa cttattcagc acatggtaac tggtacacta atcctcgctc aaacgtcaga 2580
ttcagtggaa accatccgaa aattgtatac cataaggaca gcatctcgac acatgctttt 2640
cgcttggcta atagcaatga cgagccgcca gaaaactatt accaccagtg gcttcttcta 2700
ccaatagttg gttggtatgg ctatccaagc cgggctattc gagaaaaact aatgactacg 2760
aactttggat ctgcaacaat tgagatcaaa gatggaaatt ttgaaagggc ccttgagaaa 2820
gcaaagccac ccattaactt tgacccttac gcaccggaac tggaagatgg tggtgcttat 2880
caaatagttt ctactttaaa taatagaagt gttgtagata tggacccacc aagtaaaaat 2940
gttcacttat gggagaatgg taacgctaat aatcaaaaat ggaagctagt atatgattca 3000
attaaatcag cataccaaat gaaaaatata gcaaatgaaa atctagtatt aacttggaat 3060
gatcttaatg gttctattaa tgtaattgct acatctaatc aaaatcagga agagcaatat 3120
tggataccaa cagaagcagg aaatggatat tattatgtaa ggaataagaa ggacccaaac 3180
aaagtgttag atgtaagtgg ttatggtact gcaaatggaa caaatgttac agtatataat 3240
gtccatggtg gtaataatca aaaattcaaa ttgtctaatg taacaggaat tttaacaaga 3300
gaagtggagt cactctataa ggcacagcct ggtcaaagca gtagatcaag taataatttt 3360
tcacttgaac atcttgcggc aggtaccaaa gtacgagtta ttttagcagg agaaggtgct 3420
acctctttgt catttaacat ttcaagagat aaatcaggta cagactctag catttggtca 3480
aatgttagag atagttctgt tctaacgatc ccttcaggag atgatagaaa gaatttgtat 3540
atctcaggtc ctcctagcgg atacacttct aatggtacat ttacagtgaa attctacgct 3600
ctttaa 3606
<210> 5
<211> 3441
<212> DNA
<213> 苏云金芽孢杆菌
<400> 5
atgaatcaat ataacaatac gaataatgaa ataattgatg cttctacaaa gagatctcct 60
caatacccac tagcaaataa cccacaaaat tctataaaaa ctacgaacta taaagactgg 120
attaatatgt gtgaagggaa tgcagaagca ttttttttaa ctgatgaaca aatggtttct 180
attgttggag ctgcaatttc taaacttctt ggatttgtcc ctgtggttgg agacatttta 240
agcttcttgg cggatacgta ttggccaaaa attgcaggac aagaggtaga tacaagagtt 300
tgggcaggat tgataagaca tacagcaaat ttaatagaca atagagaagc tgaaaaagta 360
atagggcaag cgacgactaa tttaatgtca ctctacggag ctttaggtgt atataataga 420
tttcttgagc aatggaaaca gaatgaaaag tcgtttgcta acctcgctga tgaagtacga 480
acacagatgt ctgctcttca ccttctattt acgacaaaaa ttattagtga tttcacgtta 540
cacggttatg aatcaatatt actaccttca tacgcaagtg ccgcgaatct gcacttacta 600
ctattgcgcg atattgcaat ttatggagaa agattaggtt ttgatccaaa ggttctgcaa 660
gcttatcatg atgaacaagt gcttttcaca agacaatata cagctcattg tataaatacg 720
tacaatttaa ctttaaacgc acaaaaacct agaggttggg tagctttcaa tcaatatcgt 780
agggatatga ctttgacagt actagatcta attgcattat ttccaagtta tgatacacat 840
aaatatcctg tagataaaaa aaatgtaaaa aaactgtcaa caactgaatt tacaagagaa 900
atttatacag cattaataga acctaatcct aataaaacag tagaaggaat ggaagcatca 960
cttacaagaa ctccccattt atttacttgg ataaagagat tagacttcta tacaaatact 1020
ttatacccag atttacgata cctatctgct aatagaattg ggttttcata tacaaattct 1080
tcaacaatac aacaaagtgg aatctatgga gactctggtt tcggttcaaa tctcactcac 1140
caattgccga taaatccaaa tatatttaaa tcctctatca ctgatactag atcaccctct 1200
aatcaaatta caaaaatgga tttttataaa actgatggaa ctcaagcatc ttataattca 1260
ggaataacgc caactcctgg ggatttaaga accacatttt ttggattttc gacaaatgag 1320
aacacaccta accagccaag cattaacgat tatacacatt ttttaactta tatgaaaacg 1380
gatgttatat caggtggagc accaaaaaga gtgtcattgg cttgggcaca taagagtgtt 1440
aatcttaaca accaaatatt cacagatgat atcacgcaag ttccagctgt aaaatcaaat 1500
gttttaaata cgcaagctaa agtaattaag ggacctggcc atacaggtgg agatttagtt 1560
gctattacca gtgacggtgt tttatctgga agaatggaaa tccaatgtaa agcaagtgtt 1620
tttaatgaac ctgaaagaag gtatggttta cgcatacgtt atgctgcaaa tagtatatta 1680
acagtaaatg catcctatac atctcaaggc aatactagat caataacatt tactacagaa 1740
tctactttta caggaaatac aataccaaca gatttaaaat atgaaaattt aaaatacaaa 1800
gaaccttttg atgcgattct tccaatgcgt ttaacttcta atgaattaac aaatataact 1860
attcaaccac aaaatatgtc gtcaaatcaa ttattgatca ttgacagaat agaatttatt 1920
ccaatcactt caactgtctt aggtgataca gagaagcaaa acttagaaaa agtacagaaa 1980
gctgtgaatg atttgtttac taatactgcg aaaaatgcgt tgaaagcaga aacgacagat 2040
tatgaaatag atcaaaccgc aaatatagta gagtgtttat ctgatgaaca ctctacaaaa 2100
gaaaaaatga tattgttaga tgaagtgaaa tatgcgaaac aactaagcca atctcgaaat 2160
gtactccaaa atggggattt tgaatctgat acgcttggct ggacaacgag caataatatt 2220
acaattcaag ccgataatcc gatttttaaa gggaagtatc ttcatatgtc aggggcaaga 2280
gacattgacg gatctgtatt tccaacttat atttaccaaa aaattgatga atcgaaatta 2340
aagccctata cacgctatcg agtaagggga tttgtgggaa gtagtaaaga actagaatta 2400
gtcgtttcgc gttatggaga agaaattgat gcgattatga atgttccgaa caaattggta 2460
gatatgtatc cacctgcttc tgattgtggg ggtcttaatc gttgcgagat atcctctgct 2520
cttgaaataa atcaggtgga ttacacgaat atgtcctatc catgtcaaaa tgatggaaat 2580
aaaaaacatg ttttgtgtca cgatcgtcat tcatacgatt ttcatattga tacggggtca 2640
gtagacctca atgaaaatat agggatttgg gtcttgttta aagtctcttc cccggatgga 2700
tatgcaacat tagataattt agaagtggtc gaagaaagat cactcgatgg ggaagcattg 2760
gcacgtgtga aacaccgaga aaagaaatgg attcatcaaa tagaagtaaa acgttatgaa 2820
acccaacaag catatgacgc gacgaaacag gcaatggatg cattattcac aaatgaccaa 2880
gatgaagcgt tacaatttga tacaacatta gcacaaattc agcacgctga tgatttggta 2940
cagtccattc cctatgtgta taatgaatgg gtaccaagtg ctccaggcat gaattatgac 3000
ttgtatgtag aattagaagc acgagtggtg aaagcaaggt acttgtatga tacaagaaat 3060
gtcattagaa atggtgattt ttcagaagga ttacagggtt ggcatgtaac aggcaatgca 3120
aaagtacaac aaatagatgg tgtatcggta ttagttctat cgaattggag tgcaggtgtc 3180
gctcaaaata tgtatgtcca acataatcat gggtatgtat tacgagtaac tgccaaaaaa 3240
gagggtcatg gaaaaggata tgttacgctc atggactgtg atgggaatca agaaacactc 3300
acatttactt cttgtgaaga aggatatgtc acaaaaactg tagatgtatt ccctgacaca 3360
gatcgtgtac gcgtagatat cggagaaact gaaggtcctt tctatataga aagcattgaa 3420
ttaatttgta tgaacgggta g 3441
<210> 6
<211> 3519
<212> DNA
<213> 人工序列
<220>
<223> 针对单子叶植物而优化的密码子
<400> 6
atgggtggca tcaacatgtc gccaaactac tcggacgact atgagatcat taatgcccca 60
agcaatacta gcccacgcta tccgcttgtt cacgacctta caccccaatt ccaagacatg 120
aattataaag actatctgag gatgacggaa ggtaacagag gggtgtcagc cacttcggtt 180
cgctcgggtg gcgaagctat tgacgcggcg ttgtcaataa cagctattct gctcggtgtg 240
ctcggacatc ctgtcggcag cgccgttgtt ggtactttta acgcactgct gggtcttctg 300
tggcctaatg gccagactat tgtttgggag gatttgctgg ctaaagcgga ggattttgct 360
aacaaggtca ttactgccga aattagatct aatgcgtttt cagctctcaa cgtctcatat 420
gcgatggtca gcgaatatac ttccgctctc aatgactgga tcgaaaaccc cggcgtcaga 480
atatcgcagc agttgatgag ggagatcttc acgaataccg tgctgcaatt ggcctctcaa 540
atgccttatt ttaatgtcgc aggttatgag acatcgctgt tgacaatgta cgcgcaggct 600
gctaacttgc atctgagcgt tctcaaagat atttttattt tcgggaaaga gtgggggttc 660
ccacaaactg atatcgactt ctactactat gaagagttta tagaccactt gccagtctac 720
gtcgaccatt gtactaagtg gtataacgag gggttgaata acctgcctaa atccaactca 780
tatgattggt acaactacaa taaatttagg agagaaatga cattgatggt gcttgacata 840
gtggcgctgt tcccgtcata tgatgcttat gtctatacat tggaaacaac gaccgaactt 900
acgcggatag tgtacactga tcctctgggc ataatgatac cccccccacc cggttacgaa 960
gagatggtgg ggtatggagg aaacctcgac tggagaaact atgggttttc ttttagctat 1020
ttggaatctc aacttcgcca accggtgctg ttctcatggc ttaactcgat taaaatgtac 1080
actcggaaga taatttgcga agcggggaca cctcatagcc tttggtctgg aaatgaaatc 1140
aacttgtcgt acacatcgga tccaagcaac acctttaccc tgcaatccgg gtattccact 1200
ggttacacac acacggattt cctcgatata aactcgaaag atatctatga agtggtgtct 1260
aagattggct cggaagcagt tgtgggtcct ggcgacgact cgtatcttta tggtttgtac 1320
caagcggctt ttcgcatcat accaaaagac tctagcgcgt attcttatct ctatccaacg 1380
tatgacatag gcatgaatgg ttactccatg tcctccctgg ttgaattgcc gcccgaatca 1440
tcggacccac cccagcctga cgaatatact tacacacacc ggctctctta tgctaccctt 1500
ctttcggtgc attcgtacac ctctgatttc tttaatgacg gagcgattcc tatatatggt 1560
tggacacacc ggagcgtgaa ccgggataat cagatttatc ctgacagaat cacacaaata 1620
cctgctgtta agggaaagca gctcatcgag ggtgcttcgg tgcacaaagg tcccgggtcg 1680
acggggggag acctggtccg cctttatctc aacgaccgcg tttatttgaa tgtgaatgtt 1740
gattcagtct ctcaaaaata tagggtcagg gtccggtgcg caacttacaa tcccggcagc 1800
atctatcttt atagagataa caccattatc tcgagcgcaa ctgcccccaa aacgacggac 1860
acaaccgata ctacccagat taagttcaac gacttccagt acattacatt ctcagacatt 1920
ttcacgttta cgagcacctg gcaacaaatc tctatcgggg cagggaccac atatgctgaa 1980
gtgtatatcg ataagattga attcataccg gtcaacgaaa catatgaggc ggaacgcaat 2040
ttggaaaatg ccaaaaaagc agtctcggct ctgttcaccg gaacgatgga cacactgaaa 2100
cgcgaggtga ctgattacca gattgacagg gctagcaatt tgatagagtg cgtttcggac 2160
gaaatgtacg ggaacgacaa gaggcttctg tttgaggcgg ttaaaacggc gaaacgcctt 2220
tctcaaagca gaaatttgct ccaggacttg aactttgaaa tgttgaatac atcgggtaac 2280
ggcgagaatg gatgggtggg atcgacgggg atccaggtcg tcgaaggcga cgctctcttc 2340
aaaaatagat cattgcgcct tccaggtgca cggcaattcg acacggagac ttaccccact 2400
tacctctatc aaaaaataga agagagcaaa ctgaagccat acactcgcta taaggtgaga 2460
ggtttcatca agggttctaa ggatctggag gtcgacgtta tgaggtacgg cgcaaaacag 2520
aaggtgctga atgtcccaaa caaccttaac cccgatatca tacctataaa cgcgtgcggg 2580
gatgtcgaca ggtgcaggca gcagcaggcc gtgaatgcga gactccagcc agcgacaatc 2640
tccccttgcg aaggtggaga taccaacacg tccgcacacg cgttctcctt ttcgattgat 2700
accggagcaa ttgataccag cgagcgccca gggataggtg tggcgtttaa gattgcgact 2760
ccagaggggt atgccagcct gggaaatctc gaagtcatcg aggagggccc gcttaccggt 2820
gaagcgttgg ctcacgtcaa gcagagggaa agacagtgga aagacaaaat taccaagaaa 2880
agagctgaaa cagaaacaat atacacaagg gctaaacagg caatcaataa ccttttcgct 2940
gattatcaag atcggcaatt gaagcacgac gttgaaattc caaatataat tgccgccgac 3000
caaatcgtcg agtcgatcag agatagatac aatgaatgga ttcccgcaat acctgggatg 3060
aactatgaga tatacacaga gctgaaaaac cgcatccaaa gggcctatgc gctctacgat 3120
gctagaaaca taattaaaaa cggagatttt aggaatggat tggccaattg gaatgcaacc 3180
cctggagcac gggttcaaca gatgaacgga aatccagttt tggtcatccc gaactgggac 3240
actcaggtgt cccagtcggt gcctgttgag cccaatcata ggtatttgct gcgggtgact 3300
gcacaaaagt tgggcgctgg taatgggtac gttaccgtca cggacgggac gaatcataca 3360
gagacgctta cgttcgatag atgtgacaac aacactacag gttcaaacag gtacgttacg 3420
aagacgatcg aattcactcc acgcactaac caactccaag tcgagattgg agagacagag 3480
ggaacattta acatagagag cgtcaatctg ctcggatgc 3519
<210> 7
<211> 3570
<212> DNA
<213> 人工序列
<220>
<223> 针对单子叶植物而优化的密码子
<400> 7
atgacccaaa acaacaacga gtatgaaatc atagatcaaa acacgtcacc ctattcatca 60
aaccggaaca ataataacag cagatacccc ttcgcgaaca accctaacca ggcgttgcag 120
cagaccaact acaaggattg gattaatatg tgtcaaaaaa accagcagtg cggagaaaac 180
ctggaaacgt tcgcttcagc tgacacgata gccgccgttt ccgctggcgt catagtcgtt 240
ggaacaatgc tcggagcgtt tggcgcacca gtcactactg gtctcattat atcgttcggt 300
accctgctgc ccatattttg gggtccatcc gaagacccaa aaaaggtgtg gaaggagttc 360
ctgacgattg gcaaccgccc cttcggatcc gaggttgatc aaggtataat tgatcttctg 420
tacaccaaag ttaacgggct ccggtctcag ttcgaagact tccaacggta cttcgacctc 480
tggaaaaata acaaaaaccc agttaacgcg gatgtcgtca ggcaaaagtt tttgtcactg 540
gactcggatg ttatacgcga gctcgagaca ctcaaaggga actactatat cacgttgctc 600
cctggttaca cccaggttgc gaactggcat ttgaatctcc tgaggcaggc agcctactac 660
tatgacgaat gggcaccgtc cagcaatctg tcaatccaaa gcatctatcc ccaagactat 720
accaatgacc tccagacttg cctcgacaac tgtccgtccg aatcaggaaa taaggtgagc 780
tcggcctact acaaatgtat actgaaatgc cgcatcaatg aatacataaa ttactgcagc 840
aaaacttacc aagaaggtct caacaagctc aaaaattcat cggatataaa gtggaatatt 900
tataacgaat atcggcgcga gatgacgctg acagtccttg atctcatcgc cgctttccca 960
aactatgatc tcgaaaaata tcctattggc acgaaatgtg aactcacaag agaggtgtac 1020
accaatgcac tcatgggctc gtcatctatg tcgatagctg agttggagaa gagcttgaca 1080
aaagatcctt tccttatcac ctggcttaat aagattcttc tgtacactcg gaactataag 1140
cagcctacga cagaggatgt gttcgtgttt acgggtaatc agcttcggta ctcatttacg 1200
atggactcca acctcgggta ctctgggttc tatggcgacg tctcatatac cgatgatacc 1260
gaacaaatac ttgagatacc gggcaattct caaatagtca aggtggaagt tgagcggcat 1320
cgcgattcgc ccgacattat ctggaaaata gacttccatc ttaacaacgg ggcggtgctt 1380
aagtataatt cgggatcaac tgccgaccct aattttaggg ttagagacgt tctgacgatt 1440
ccaccggatt cgaaggggaa cgcctcccat tttctcagct atatgaagtc cgcctatgtc 1500
acatccgatg ttaaacaact gagacgggtg agcttcgcct ggacccacaa ctcaataaat 1560
tataataacg aaatctataa tgacatcatt acccaaatcg cagcagtcaa gggacactac 1620
ctcggcctcg aagggctcgc gtcgagagtc atccaggggc cgggacacac cggcggtgac 1680
ctggttgatc tgaaggacga tctgcggttg gcttgccaac acagcgggac ccagcagtca 1740
tactatattc ggattagata tgcctcggat ggggacacga ggattgtcct tgtgatacct 1800
ctcatggagt cccaaaatat acctttgaaa tccacatttt cgggagtcaa ccacgatgag 1860
ttgaaataca aggatttcgg atacgtgcaa tttccggggg agatcaccct caaccaacat 1920
agcaaaatca cgctcatttt ccggctccaa gacatttatt caaacatttc ggtgtttatt 1980
gataagatag agtttatccc aataacttct tccatccgcg aaaatagaga aaaatatcag 2040
ctggagaagg ccaaacgcgc ggttgacgat ctcttcataa gcgccaaaaa acaaaatatt 2100
aagattgaca taacagacta ccaaatagac caaacagcta acctcgtgga ctcactcagc 2160
gaagaacctt atccgcagga gaaaatgatg ctgttgaacc agatcaaata cgcgaagcaa 2220
ctctcacaat cgaggaacct cctctcgaat ggagacttcg agtcgctcat agggtggaca 2280
acaagctcgt cgatcactgt tcagacggga aatactattt ttaagggatt ttcgctccat 2340
atgttgggag caaggacaac tgaaattaat gcaacagttt tccctaccta tgtgtatcaa 2400
aaaatagatg agtcgcgctt gaaaccatat acacggtata tagtgagagg gtttataggg 2460
tccagcaagg gattgggaat ttttgttaca aggtataaca atgtgcctga caaactggca 2520
tacataaggt ctactaactc ctgcggggag cttaatcagt acgaaagcca aaattactcg 2580
cttgtttcag agaataactc taccatgtcc cttcaaaata tcaccgcctc caatgacaca 2640
tcgtgccttt cggagaacct cagatactgt gagccaaatc agctgtaccc gacttgtcac 2700
aatttgcatg acttcagctt ttccatcgac accggcgaac tcgatttcaa cgaaaaccca 2760
ggcatatgga ttctgttcaa aatttcgaat cctgacggct acgcgaccct tgggaacctg 2820
gaggtgattg aagaaaagac tctcgtcgga gaggagatta acaacgttaa agagaaggga 2880
aagcgctgga agaaagaaat ggacaccaaa caaaccaaga ccgagacagc cttctcacag 2940
gctcaacagg ccgttaatgg cttgtttatg aacacgcagt actcaatgct gaagatcgag 3000
accaccatgc aagacatcgt gacggccgac aatttgatta acgagattcc atacgtctat 3060
gatgagcttc ttcccaacga acctgcgggc cggaattata atatgtttat tgagctgaaa 3120
aatcaaataa gccaagtcta ttcgctctac aatgccagaa acattataca gaacggcaat 3180
ttcaacaatg gcttgaaaaa ctggcacact agccctgatg ctaaggttca aaagatcgac 3240
aatacctcag tgcttgtcat accaaactgg tccacacagg tctcacagca tactaatctt 3300
cagcaaaatc aaagatatct gctcagagtc acggccaaga aagagggaat gggtaatggc 3360
tatgtcaagg tttcagactg tgctaataac gtggaaacac ttacctttaa gtccagcgat 3420
attactaata ataatatgtg gaatgagtcg ataggctaca tgactaaaac tatgtatata 3480
acaccacaca caagccaggt gcggatagac attggggaga ctgaagggaa ctttaagata 3540
aattcgatcg aactgatctg tattaagaat 3570
<210> 8
<211> 3576
<212> DNA
<213> 人工序列
<220>
<223> 针对单子叶植物而优化的密码子
<400> 8
atgagcagcg gggggacaaa catgaactca aatcgcaata agaacgagta tgaaatcctg 60
gatgcatctt cttccacctc aaatatgaca aaccaatatt ctcggtaccc cctcgcaaac 120
aatccgcagg catttatgcg gaacacgaat tataaagatt ggcttgctat gtgtgagagg 180
aacgacacgg gtgtgttgga gaaccccgaa gtcctctcgc ttcggggggc agtcggaacg 240
ggtgtcagca tcgttggaat gattttttcc ctgataggca ttccagtgat aggtgaagtt 300
gtggggattc tcgtctctct taccaatctg ctttggccgg aatctgaggg ctccgctcag 360
tatacatggc aagaattgat tacgcacgtc gaggagctta tggaccagcg cataggtgag 420
acgcaaaaag ctaatgctct tgccaagttg tcgggattga aggcccaggt ggctgcttat 480
aaccgcgccc tcgaagactg ggagaaaaac ccgaacagcc gctccgcaag cgaagtgatc 540
gcgcgcttca ggtctactaa taacgatttt gttggtagca tgccgcaatt ttccccgaac 600
ggatacgaga tattgcttct cagcgtctac gcccaagctg cgaacttgca cttgctgttg 660
attcgggacg ccactattta cggctctcag tggggcctct cacagggaga cgtcaacttg 720
tactacaatg aacaactgtt gtatacaaag caatatgtga accattgcgt gacctggtac 780
aataacggac tcgcacagca gaaagccctc tttgcaacga gccccaactg gaatcgcttc 840
aatgcctacc gccgcgacat gacgatcaac gttttggacc tgatcgccct ctttcccatt 900
tatgacgcac ggctctaccc ccaacccgtc cgcgcggaac ttactcgcga gatttactca 960
aacatattga attctgatgt ctacggcgtc caatgggccg attttgaaaa gaatgaaagc 1020
acttttacac gcccccccca ccttttcact tggttgcgca aattcgattt ctatacccgg 1080
acgaagtatt acaatcaggg gttgggatgg ctgttcttgg gaggccacac caactactat 1140
tcatatacaa acagctcgaa tctgaagtcg gggtcttaca acaatttctg gggatcagac 1200
atgcagactt ccactcttac cattcctgac aatccttcaa tttaccgcct ctggacaaaa 1260
tcttacacgc acatatatcc gtataccgat ccggtgaata taactcagat gcaattttat 1320
ttgaccaaca accaacagtt gacatacacg gccacggcca atcctaggta tccagtgaga 1380
gaaacgaact tcgaacttcc gtcaacagat gagaatcctc tgacatacca aaactactct 1440
catatccttt catatatgat ctcgtcgcaa cattttggtg ataagcggtc aggctacacg 1500
ttcgcctgga ctcacaattc agttgatccc accaatacgc ttgccccaaa taaaattacc 1560
cagattcctg ccgttaaggc caataccctc gaaggtaata aaagctttgt ggtgaaagga 1620
ccgaaccata cgggggggga tttggttata cttgaggctg agcctggacc agtgtatcct 1680
attgtttatc ggggcgtcat ggggattacg tgcaaagtga ctcaggccca gaactatcgc 1740
attaggatcc gctatgcttc caatggaggg gcgcagatgg ctatcagcct tcgcaacagg 1800
gggaccggga cggtctttac agtgtcgaaa acgtacacgg ggaactctat tgagaatctt 1860
cagtacaatg atttccagta taaagacatg ccagtgatac ttgaggcttc acaatacgaa 1920
cccaacaatt ccatctacgt ttatctctat caagaatctc cttatatcca agtcatcatc 1980
gacaagatag aattcatccc gattgacaca acttcgcagg agtatgagga aaagcatcaa 2040
cttgaaaagg cgaagaaagc tgtgggagtt ctgttcacga atgacgccaa gaaagctttg 2100
aagatcgata ctaccgatta cgatgttgac caggccgcaa acctcattga gtgcctttca 2160
gatgaacaat acgctaaaga gaagatgata ttgctggatg aagtcaaata cgctaagcaa 2220
ctttcccagt ctcggaatct cctgcagaat ggagactttg agtccagcga gatcggatgg 2280
gagacctcca acacgatcac gatacaagca gggaacttga tcttcaaagg taagtatttg 2340
aacatgtcag gtgcacggaa catagatggg gccatctttc ctacgtacgc cttccagaag 2400
gtcgacgagt ctcggctcaa gccttatacg cggtacaagg ttaggggatt cgtcggctca 2460
tcgaaagacg tcgaagtggt cgttactcgg tatggggagg aagtcgatac catcatgaac 2520
gtgccaaatg accttacata tgacgttggt agcgtcaaga gctgcggtga gtggaatcgc 2580
tgtgagcagc agccttacca gaatcgcaac caagtgctca ataactctat gataatagct 2640
aacacgtcca acgcgtccaa ctcatgcgaa tatgtcccag aaaagaaaag ggtcatgtgc 2700
cctgagcccc atcaattcag cttccatgtg gatacgggcg agaccaatct caacgaaaat 2760
ttggggattt cagtcctgtt taaaatttct agcccggagg ggtatgcaat acttgacaac 2820
atagagttga tcgaagaagg gtccctcgtt ggtgaatcgc ttgcttacgt tcaaaaccgg 2880
gagaaaagat ggaaaaataa aatgcaggcg gaaagaatgg agacccaaca agcgtataat 2940
atagctaagc aagtggtcga catacttttt acagatccac aggataccgc cctccgcttc 3000
gaaactaata aatccaatat aatttctgca gatgagctcg tccaatcgat cccatacatc 3060
tacaatgact ggcttagaga cgtccccggc atgaactaca acatgttcac tgagctcaag 3120
ggtagaatta ctcaagctta ttatctttac gatgatagga acgtgttgca gaacggggac 3180
ttcaacaatg ggctcacgag ctggtacgtc accggaaatg cagaagtgca gcagatagat 3240
gggacttttg tcctcgttct gcaaaattgg tcgactacag tctcgcagaa cgtgtgcctt 3300
cagcacaata ggggatatgt tctgcgggtg acggcacgca aagaaggaat gggcaacggg 3360
tacgtcacca tgtctgactg cgcgaatcac atagagaaaa tcattttcac atcgtgtgat 3420
aacaacatcg ttgttacctc cacggattcc gccgaatatg tgactagaac cgtgtctttc 3480
tttccagaca ccgaccatgt tcgcatagaa ataggggaaa ctgagggcac cttcaaggtc 3540
gagtcagttg aactcatatg tatggaggga aaagaa 3576
<210> 9
<211> 3603
<212> DNA
<213> 人工序列
<220>
<223> 针对单子叶植物而优化的密码子
<400> 9
atgaatcaaa acatagccgc agtgcgggaa gcggtcaatg ctctcttttc taatcacacg 60
cttcaactta aagtgacaga ctaccacgtc gaccaggtgg ctaaattggt ggaatgcata 120
tctgaccaga accatagcaa ggagaagatg tgcctgcttg atcaggtgaa gttggcaaaa 180
agattgtcga gggagaggaa cctgttgaac tacggtgact tcgaatcctc taactgggca 240
ggtgcagatg gctggaacat ttctgcgcac gtttacacca ttgccgataa cctgatcttc 300
aaggaccatt atcttaatat gccgtcggtg aataatccca tactgtcgga caaaatattc 360
cccacttatg cgtatcagaa aatagaggag tcaaagctga aaccttacac gagatacatg 420
gtgcgcggat tcgttggttc ttccaaggac cttgagatct tggttgctcg gcacggcaag 480
gaggtgcata aacgcatgaa tgttcctaat gacatcattc ccaccaaccc ttgcactggc 540
gaactcgtct cccagccgcc gccatatcca gttatgccta tacacacaat ggcccaaaac 600
atgtggtgca atccttgcga aaatggttat caaaccgctg caggtatgat ggtccaggag 660
acgaatatgg tctgtcagga ccctcacgag ttcaaattta gcatcgacat cggagagatc 720
gaccgcgaaa ggaatttggg tatatggatt gggttcaaag tcggaacgac tgaaggtatg 780
gccacactcg actctataga ggtggttgag gtcggaccac tgacaggcga tgcactgaag 840
cgcatgcaaa aaagagagca gaagtggaaa aagaaatggg ctgagaagca aatgaaaata 900
gagcgcgccg ttcagattgc acgcaatgct attcaaactc ttttcactga cccaaatcag 960
aataggcttc aatcggcaat tactctgaag aacattgtgg acgctgagaa gtgggttcag 1020
aaaattccct atgtctataa tcaatttctt cagggggcta ttcctgaggt tccgggtgag 1080
caatacaacg tgtttcaaca actctcgcag gccgtcgtca cggctagggg gttgtacaac 1140
caaagaaatg tcatcaataa tggtgacttc agcgccggct tgagcaactg gaacgggact 1200
aaaggtgcag atgtccaaca aattggaaaa gagtcagttc tcatgatcag cgattggtca 1260
gcaaacatat cacaacaagt ctgtgttgag cctgagcatt catacctgct gcgcgtgaca 1320
gcacggaaag aaggctctgg ggaaggttac gtgacgatct ctgatggaac taaagataac 1380
accgaaacgc tcaaatttat cgtgggagaa gagacaactg gcgcaaccat gagcactatc 1440
cggtcacaca taagggagag atacaacgaa cgcaacatgg ttacttcgga ggtctatgac 1500
gcgagcggat atgccagcaa tcagaatatg gtcaactact cttcggagaa ttatggcatg 1560
tccgcataca gcgggaacaa caataaaaat taccaatcag agtcattcgg atttactcct 1620
tatggtgacg agaactccat gatgaattac ccaagcgaga actacgggga gaatgcgtat 1680
tcgggaaacg ataacatgaa ttatccttct aataactacg agatgaaccc ctattccagc 1740
gacatgaaca tgtctatgaa tcaggggagc gactgcaggt gtggctgtag cactaattcc 1800
taccctggcg gggacatgac catgaataat tatccctctt cgatgtatga aacaaacgca 1860
tacccctctt ctaccaacat gacggacaac ctgggaatgg gctgtggttg ctattactct 1920
actaatgaac atccaatggt tgagcagagc acactggacc tgtcggatta cgttatgaaa 1980
accgttgaaa ttttccctga aacgaataga gtctgtatag aaatcggaga aactgccggg 2040
atatttatga tagagtcgat agagttcgtg ccggtcaatc cgattgaatc agtgcccgag 2100
cctgggccag ggatatatca gagcgttaca gcattgaata atagctctgt cgtggagatg 2160
gccagccagg gagctaggaa cgttattaaa gcccttccgc aaaatgcgag caatatagag 2220
cttgagtatg ccccggtcta tgactatgat accgatggct gctacgctac cgctgcaata 2280
tcaccagatg ggacaacgaa tcctggcctg ggcatgggcg attcaccctc gtccggttgc 2340
aggggcccgg ctcagctcga aaatagcaac acctattcga gggctaagtc taacaacgga 2400
tggaccgcca taatgtacgc tagctacttt gaaaaggatc aaacttctct cgggcctggg 2460
tcggctgggc atagacacga ctgggagcac accattgttt gggtcaagga cgggcaagtc 2520
caatacgtca catactccgc acacgggaac tggtacacga atcctagatc taacgttcgg 2580
ttttcaggca atcacccgaa gatcgtgtat cacaaagatt ctatttctac ccatgctttt 2640
cgcctggcta attctaacga cgaacctcca gagaattatt accaccagtg gcttcttctc 2700
cctatagttg gttggtatgg ttatccctct agagcaatta gggagaaact gatgacgacc 2760
aattttgggt cagcgacgat tgagatcaag gacggtaact tcgaacgggc cttggaaaaa 2820
gcgaagccac caataaactt cgacccgtat gcccctgagc tcgaggacgg gggcgcgtac 2880
caaatcgtta gcaccctgaa taacaggtct gttgtggaca tggatccacc atcgaagaat 2940
gtgcatctgt gggaaaatgg taatgcaaat aaccaaaaat ggaagctggt ttatgactca 3000
attaaaagcg cttatcagat gaagaatatc gccaatgaga atctggtcct gacctggaat 3060
gatctgaatg ggagcataaa tgttattgct actagcaacc agaaccagga agagcaatat 3120
tggatcccaa ctgaagcggg aaatgggtat tattacgtta gaaacaagaa ggatccaaat 3180
aaagttttgg atgtctcagg ctatgggacc gcaaatggga cgaatgtcac agtttataat 3240
gtgcatgggg gaaataacca aaaattcaaa ttgtcaaacg ttaccggcat cctcacgaga 3300
gaggtggaaa gcttgtacaa agcccagccc ggtcagtcca gccggtccag caacaacttc 3360
tcccttgagc atctcgccgc tggtacgaag gtccgcgtca tacttgcagg cgagggcgcg 3420
acgagcctgt cgttcaacat ttcgcgcgac aaatccggca ccgattcttc gatatggtca 3480
aatgtcagag actccagcgt tctcactata cctagcggag atgatagaaa gaacctttat 3540
atttcagggc cgccaagcgg ctacacatcc aacgggacct tcactgttaa gttctatgca 3600
ctg 3603
<210> 10
<211> 3438
<212> DNA
<213> 人工序列
<220>
<223> 针对单子叶植物而优化的密码子
<400> 10
atgaaccaat acaacaacac caacaacgag ataatagatg cgtccactaa acgctccccc 60
cagtatcccc tggctaacaa tccacagaat agcattaaga ctactaacta caaagattgg 120
ataaacatgt gcgagggaaa cgcagaagct tttttcttga ccgatgagca aatggtttcc 180
attgttggtg ccgctatttc taagttgttg ggtttcgttc cggttgtggg cgacatcctt 240
tcgtttctcg cagacacata ttggcctaag atagcgggac aggaggtgga cacccgggtt 300
tgggcaggcc tgatccgcca cactgccaac ctgatcgata acagggaagc ggaaaaagtt 360
attggccagg ctaccaccaa ccttatgtcg ttgtacggag cgctcggcgt ttacaataga 420
tttctggagc aatggaaaca aaatgagaaa tcatttgcga atctggccga cgaagtgaga 480
acacaaatgt ctgcgctgca cctccttttc accaccaaga taatctctga ttttactctc 540
catggttacg agtccatcct tctgccatcc tatgcctccg cagcaaatct ccatctgctt 600
cttctgaggg acattgctat ttacggtgag aggcttggat ttgacccaaa agtcctccag 660
gcttaccatg acgagcaagt tctctttact aggcagtata cagcacactg tatcaatact 720
tataacctta cattgaacgc gcagaaaccc agaggatggg ttgccttcaa ccaatataga 780
cgggatatga cactcacagt tttggatttg atagctctgt ttccgagcta cgacactcac 840
aagtatcctg tggataagaa aaatgttaag aagttgagca ctaccgagtt tactcgggaa 900
atctatacgg ctttgatcga acctaatcct aacaagaccg tcgagggcat ggaggcctcg 960
ctgacaagga ctccccacct cttcacttgg attaaacgcc ttgactttta caccaacacg 1020
ctttacccgg atctcagata tttgtccgca aaccgcattg gttttagcta cacaaattcg 1080
tcgacgatcc aacagagcgg tatttacggt gattcaggat ttgggtccaa tctgacgcat 1140
cagcttccga taaatccaaa catatttaaa agctccatca cggataccag atcaccttcg 1200
aaccaaatta ctaagatgga cttttacaaa acagacggta cccaagcgag ctacaattcg 1260
gggataacac caacgcctgg tgatctgcgc accacattct tcggtttctc gactaatgaa 1320
aataccccaa atcagccttc tatcaatgac tatacgcatt ttcttacgta catgaagacc 1380
gatgttatat cgggtggagc cccaaaaagg gtctcattgg cctgggccca caaaagcgtc 1440
aacctcaata atcaaatttt cactgatgac attactcagg tccctgccgt caaaagcaac 1500
gttctcaaca cacaagccaa agttataaaa ggaccgggac atacaggggg cgatctggtg 1560
gctattactt ctgatggagt gctcagcggc cggatggaaa tccagtgtaa ggcatctgtc 1620
tttaacgaac cggagcgccg gtatgggctc agaattcgct acgcggcgaa ttcgatcctt 1680
acagtcaacg cttcgtatac gtcacagggc aacacgcgct ctatcacgtt tacgaccgag 1740
agcacgttta cagggaacac tattcccacc gacctgaaat atgaaaattt gaagtacaaa 1800
gaacctttcg acgccatcct ccctatgaga cttacgtcga atgagctcac gaatattaca 1860
attcaaccgc agaatatgtc atctaatcaa cttcttataa ttgatcgcat cgagtttata 1920
cctataacct caacggttct cggcgatact gagaagcaaa atctggagaa agtgcaaaag 1980
gctgttaacg atctcttcac taacaccgca aagaacgcac tcaaggctga aacgacagac 2040
tatgaaatag accagactgc aaacattgtc gagtgtttgt cagacgagca ttctacgaag 2100
gagaagatga ttctcctgga cgaggtcaag tacgctaagc aactttcgca atcacgcaat 2160
gtgctgcaaa atggtgactt cgagtcggat acactgggat ggacaacttc aaacaatatt 2220
accatacaag cagacaatcc catcttcaaa gggaaatacc ttcacatgtc cggggccagg 2280
gatatcgacg gttctgtctt tcccacttat atctaccaaa aaattgacga gtccaaactt 2340
aaaccttaca cgcggtacag agtgaggggt ttcgtggggt cgtctaaaga gctcgagctt 2400
gtggtttcaa ggtacggcga ggagatcgat gcaatcatga acgtcccgaa caaattggtc 2460
gatatgtatc cgcccgcctc ggattgcggt ggcttgaata gatgtgaaat ctcgtccgct 2520
ttggagatca accaagtcga ctacactaac atgagctacc cttgccaaaa cgatggtaac 2580
aagaagcatg tcttgtgcca cgatagacat tcatacgatt tccatatcga cacggggtcc 2640
gttgatctca acgaaaatat tggcatatgg gtgcttttca aggtctcatc acctgacggt 2700
tacgctacct tggataatct tgaggtggtg gaggagcgct ctctcgacgg agaagctctc 2760
gctagggtga aacacaggga aaaaaaatgg attcaccaga tagaagtgaa acggtacgaa 2820
acccagcaag cttacgacgc gacaaaacag gcaatggacg cattgtttac taacgaccag 2880
gacgaagcgc tccaattcga tactactctc gcgcagattc aacacgcgga cgaccttgtg 2940
caatcaatcc catatgttta caacgaatgg gtccccagcg cacctgggat gaactacgac 3000
ctctatgtcg agttggaagc gcgcgttgtc aaagcgcggt acctttacga tacacggaat 3060
gttatacgga atggagattt ctctgaagga ctccaagggt ggcatgttac cggaaacgcc 3120
aaggttcagc agattgacgg agtgtccgtc cttgtgttgt ccaactggag cgcaggggtg 3180
gctcaaaata tgtacgttca gcacaaccat ggctatgtcc tccgggtgac tgccaagaaa 3240
gaaggacacg gtaagggcta tgtgacactt atggactgtg acgggaatca ggagaccctt 3300
acctttacat cttgcgaaga ggggtacgtc acaaagacag ttgacgtttt ccctgataca 3360
gatagagtca gagtggatat cggggagaca gaaggccctt tttacatcga gtcgattgag 3420
cttatttgta tgaatggc 3438
<210> 11
<211> 3519
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT0264
<400> 11
atgggtggca tcaacatgtc gccaaactac tcggacgact atgagatcat taatgcccca 60
agcaatacta gcccacgcta tccgcttgtt cacgacctta caccccaatt ccaagacatg 120
aattataaag actatatcag gatgacggaa ggtaacagag gggtgtcagc cacttcggtt 180
cgctcgggtg gcgaagctat tgacgcggcg ttgtcaataa cagctattct gctcggtgtg 240
ctcggacatc ctgtcggcag cgccgttgtt ggtactttta acgcactgct gggtcttctg 300
tggcctaatg gccagactat tgtttgggag gatttgctgg ctaaagcgga ggattttgct 360
aacaaggtca ttactgccga aattagatct aatgcgtttt cagctctcaa cgtctcatat 420
gcgatggtca gcgaatatac ttccgctctc aatgactgga tcgaaaaccc cggcgtcaga 480
atatcgcagc agttgatgag ggagatcttc acgaataccg tgctgcaatt ggcctctcaa 540
atgccttatt ttaatgtcgc aggttatgag acatcgctgt tgacaatgta cgcgcaggct 600
gctaacttgc atctgagcgt tctcaaagat atttttattt tcgggaaaga gtgggggttc 660
ccacaaactg atatcgactt ctactactat gaagagttta tagaccactt gccagtctac 720
gtcgaccatt gtactaagtg gtataacgag gggttgaata acctgcctaa atccaactca 780
tatgattggt acaactacaa taaatttagg agagaaatga cattgatggt gcttgacata 840
gtggcgctgt tcccgtcata tgatgcttat gtctatacat tggaaacaac gaccgaactt 900
acgcggatag tgtacactga tcctctgggc ataatgatac cccccccacc cggttacgaa 960
gagatggtgg ggtatggagg aaacctcgac tggagaaact atgggttttc ttttagctat 1020
ttggaatctc aacttcgcca accggtgctg ttctcatggc ttaactcgat taaaatgtac 1080
actcggaaga taatttgcga agcggggaca cctcatagcc tttggtctgg aaatgaaatc 1140
aacttgtcgt acacatcgga tccaagcaac acctttaccc tgcaatccgg gtattccact 1200
ggttacacac acacggattt cctcgatata aactcgaaag atatctatga agtggtgtct 1260
aagattggct cggaagcagt tgtgggtcct ggcgacgact cgtatcttta tggtttgtac 1320
caagcggctt ttcgcatcat accaaaagac tctagcgcgt attcttatct ctatccaacg 1380
tatgacatag gcatgaatgg ttactccatg tcctccctgg ttgaattgcc gcccgaatca 1440
tcggacccac cccagcctga cgaatatact tacacacacc ggctctctta tgctaccctt 1500
ctttcggtgc attcgtacac ctctgatttc tttaatgacg gagcgattcc tatatatggt 1560
tggacacacc ggagcgtgaa ccgggataat cagatttatc ctgacagaat cacacaaata 1620
cctgctgtta agggaaagca gctcatcgag ggtgcttcgg tgcacaaagg tcccgggtcg 1680
acggggggag acctggtccg cctttatctc aacgaccgcg tttatttgaa tgtgaatgtt 1740
gattcagtct ctcaaaaata tagggtcagg gtccggtgcg caacttacaa tcccggcagc 1800
atctatcttt atagagataa caccattatc tcgagcgcaa ctgcccccaa aacgacggac 1860
acaaccgata ctacccagat taagttcaac gacttccagt acattacatt ctcagacatt 1920
ttcacgttta cgagcacctg gcaacaaatc tctatcgggg cagggaccac atatgctgaa 1980
gtgtatatcg ataagattga attcataccg gtcaacgaaa catatgaggc ggaacgcaat 2040
ttggaaaatg ccaaaaaagc agtctcggct ctgttcaccg gaacgatgga cacactgaaa 2100
cgcgaggtga ctgattacca gattgacagg gctagcaatt tgatagagtg cgtttcggac 2160
gaaatgtacg ggaacgacaa gaggcttctg tttgaggcgg ttaaaacggc gaaacgcctt 2220
tctcaaagca gaaatttgct ccaggacttg aactttgaaa tgttgaatac atcgggtaac 2280
ggcgagaatg gatgggtggg atcgacgggg atccaggtcg tcgaaggcga cgctctcttc 2340
aaaaatagat cattgcgcct tccaggtgca cggcaattcg acacggagac ttaccccact 2400
tacctctatc aaaaaataga agagagcaaa ctgaagccat acactcgcta taaggtgaga 2460
ggtttcatca agggttctaa ggatctggag gtcgacgtta tgaggtacgg cgcaaaacag 2520
aaggtgctga atgtcccaaa caaccttaac cccgatatca tacctataaa cgcgtgcggg 2580
gatgtcgaca ggtgcaggca gcagcaggcc gtgaatgcga gactccagcc agcgacaatc 2640
tccccttgcg aaggtggaga taccaacacg tccgcacacg cgttctcctt ttcgattgat 2700
accggagcaa ttgataccag cgagcgccca gggataggtg tggcgtttaa gattgcgact 2760
ccagaggggt atgccagcct gggaaatctc gaagtcatcg aggagggccc gcttaccggt 2820
gaagcgttgg ctcacgtcaa gcagagggaa agacagtgga aagacaaaat taccaagaaa 2880
agagctgaaa cagaaacaat atacacaagg gctaaacagg caatcaataa ccttttcgct 2940
gattatcaag atcggcaatt gaagcacgac gttgaaattc caaatataat tgccgccgac 3000
caaatcgtcg agtcgatcag agatagatac aatgaatgga ttcccgcaat acctgggatg 3060
aactatgaga tatacacaga gctgaaaaac cgcatccaaa gggcctatgc gctctacgat 3120
gctagaaaca taattaaaaa cggagatttt aggaatggat tggccaattg gaatgcaacc 3180
cctggagcac gggttcaaca gatgaacgga aatccagttt tggtcatccc gaactgggac 3240
actcaggtgt cccagtcggt gcctgttgag cccaatcata ggtatttgct gcgggtgact 3300
gcacaaaagt tgggcgctgg taatgggtac gttaccgtca cggacgggac gaatcataca 3360
gagacgctta cgttcgatag atgtgacaac aacactacag gttcaaacag gtacgttacg 3420
aagacgctgg aattcactcc acgcactaac caactccaag tcgagattgg agagacagag 3480
ggaacattta acatagagag cgtcaatctg ctcggatgc 3519
<210> 12
<211> 3570
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT0288
<400> 12
atgacccaaa acaacaacga gtatgaaatc atagatcaaa acacgtcacc ctattcatca 60
aaccggaaca ataataacag cagatacccc ttcgcgaaca accctaacca ggcgttgcag 120
cagaccaact acaaggattg gctgaatatg tgtcaaaaaa accagcagtg cggagaaaac 180
ctggaaacgt tcgcttcagc tgacacgata gccgccgttt ccgctggcgt catagtcgtt 240
ggaacaatgc tcggagcgtt tggcgcacca gtcactactg gtctcattat atcgttcggt 300
accctgctgc ccatattttg gggtccatcc gaagacccaa aaaaggtgtg gaaggagttc 360
ctgacgattg gcaaccgccc cttcggatcc gaggttgatc aaggtataat tgatcttctg 420
tacaccaaag ttaacgggct ccggtctcag ttcgaagact tccaacggta cttcgacctc 480
tggaaaaata acaaaaaccc agttaacgcg gatgtcgtca ggcaaaagtt tttgtcactg 540
gactcggatg ttatacgcga gctcgagaca ctcaaaggga actactatat cacgttgctc 600
cctggttaca cccaggttgc gaactggcat ttgaatctcc tgaggcaggc agcctactac 660
tatgacgaat gggcaccgtc cagcaatctg tcaatccaaa gcatctatcc ccaagactat 720
accaatgacc tccagacttg cctcgacaac tgtccgtccg aatcaggaaa taaggtgagc 780
tcggcctact acaaatgtat actgaaatgc cgcatcaatg aatacataaa ttactgcagc 840
aaaacttacc aagaaggtct caacaagctc aaaaattcat cggatataaa gtggaatatt 900
tataacgaat atcggcgcga gatgacgctg acagtccttg atctcatcgc cgctttccca 960
aactatgatc tcgaaaaata tcctattggc acgaaatgtg aactcacaag agaggtgtac 1020
accaatgcac tcatgggctc gtcatctatg tcgatagctg agttggagaa gagcttgaca 1080
aaagatcctt tccttatcac ctggcttaat aagattcttc tgtacactcg gaactataag 1140
cagcctacga cagaggatgt gttcgtgttt acgggtaatc agcttcggta ctcatttacg 1200
atggactcca acctcgggta ctctgggttc tatggcgacg tctcatatac cgatgatacc 1260
gaacaaatac ttgagatacc gggcaattct caaatagtca aggtggaagt tgagcggcat 1320
cgcgattcgc ccgacattat ctggaaaata gacttccatc ttaacaacgg ggcggtgctt 1380
aagtataatt cgggatcaac tgccgaccct aattttaggg ttagagacgt tctgacgatt 1440
ccaccggatt cgaaggggaa cgcctcccat tttctcagct atatgaagtc cgcctatgtc 1500
acatccgatg ttaaacaact gagacgggtg agcttcgcct ggacccacaa ctcaataaat 1560
tataataacg aaatctataa tgacatcatt acccaaatcg cagcagtcaa gggacactac 1620
ctcggcctcg aagggctcgc gtcgagagtc atccaggggc cgggacacac cggcggtgac 1680
ctggttgatc tgaaggacga tctgcggttg gcttgccaac acagcgggac ccagcagtca 1740
tactatattc ggattagata tgcctcggat ggggacacga ggattgtcct tgtgatacct 1800
ctcatggagt cccaaaatat acctttgaaa tccacatttt cgggagtcaa ccacgatgag 1860
ttgaaataca aggatttcgg atacgtgcaa tttccggggg agatcaccct caaccaacat 1920
agcaaaatca cgctcatttt ccggctccaa gacatttatt caaacatttc ggtgtttatt 1980
gataagatag agtttatccc aataacttct tccatccgcg aaaatagaga aaaatatcag 2040
ctggagaagg ccaaacgcgc ggttgacgat ctcttcataa gcgccaaaaa acaaaatatt 2100
aagattgaca taacagacta ccaaatagac caaacagcta acctcgtgga ctcactcagc 2160
gaagaacctt atccgcagga gaaaatgatg ctgttgaacc agatcaaata cgcgaagcaa 2220
ctctcacaat cgaggaacct cctctcgaat ggagacttcg agtcgctcat agggtggaca 2280
acaagctcgt cgatcactgt tcagacggga aatactattt ttaagggatt ttcgctccat 2340
atgttgggag caaggacaac tgaaattaat gcaacagttt tccctaccta tgtgtatcaa 2400
aaaatagatg agtcgcgctt gaaaccatat acacggtata tagtgagagg gtttataggg 2460
tccagcaagg gattgggaat ttttgttaca aggtataaca atgtgcctga caaactggca 2520
tacataaggt ctactaactc ctgcggggag cttaatcagt acgaaagcca aaattactcg 2580
cttgtttcag agaataactc taccatgtcc cttcaaaata tcaccgcctc caatgacaca 2640
tcgtgccttt cggagaacct cagatactgt gagccaaatc agctgtaccc gacttgtcac 2700
aatttgcatg acttcagctt ttccatcgac accggcgaac tcgatttcaa cgaaaaccca 2760
ggcatatgga ttctgttcaa aatttcgaat cctgacggct acgcgaccct tgggaacctg 2820
gaggtgattg aagaaaagac tctcgtcgga gaggagatta acaacgttaa agagaaggga 2880
aagcgctgga agaaagaaat ggacaccaaa caaaccaaga ccgagacagc cttctcacag 2940
gctcaacagg ccgttaatgg cttgtttatg aacacgcagt actcaatgct gaagatcgag 3000
accaccatgc aagacatcgt gacggccgac aatttgatta acgagattcc atacgtctat 3060
gatgagcttc ttcccaacga acctgcgggc cggaattata atatgtttat tgagctgaaa 3120
aatcaaataa gccaagtcta ttcgctctac aatgccagaa acattataca gaacggcaat 3180
ttcaacaatg gcttgaaaaa ctggcacact agccctgatg ctaaggttca aaagatcgac 3240
aatacctcag tgcttgtcat accaaactgg tccacacagg tctcacagca tactaatctt 3300
cagcaaaatc aaagatatct gctcagagtc acggccaaga aagagggaat gggtaatggc 3360
tatgtcaagg tttcagactg tgctaataac gtggaaacaa tcacctttaa gtccagcgat 3420
attactaata ataatatgtg gaatgagtcg ataggctaca tgactaaaac tatgtatata 3480
acaccacaca caagccaggt gcggatagac attggggaga ctgaagggaa ctttaagata 3540
aattcgatcg aactgatctg tattaagaat 3570
<210> 13
<211> 3576
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT0302
<400> 13
atgagcagcg gggggacaaa catgaactca aatcgcaata agaacgagta tgaaatcctg 60
gatgcatctt cttccacctc aaatatgaca aaccaatatt ctcggtaccc cctcgcaaac 120
aatccgcagg catttatgcg gaacacgaat tataaagatt ggatcgctat gtgtgagagg 180
aacgacacgg gtgtgttgga gaaccccgaa gtcctctcgc ttcggggggc agtcggaacg 240
ggtgtcagca tcgttggaat gattttttcc ctgataggca ttccagtgat aggtgaagtt 300
gtggggattc tcgtctctct taccaatctg ctttggccgg aatctgaggg ctccgctcag 360
tatacatggc aagaattgat tacgcacgtc gaggagctta tggaccagcg cataggtgag 420
acgcaaaaag ctaatgctct tgccaagttg tcgggattga aggcccaggt ggctgcttat 480
aaccgcgccc tcgaagactg ggagaaaaac ccgaacagcc gctccgcaag cgaagtgatc 540
gcgcgcttca ggtctactaa taacgatttt gttggtagca tgccgcaatt ttccccgaac 600
ggatacgaga tattgcttct cagcgtctac gcccaagctg cgaacttgca cttgctgttg 660
attcgggacg ccactattta cggctctcag tggggcctct cacagggaga cgtcaacttg 720
tactacaatg aacaactgtt gtatacaaag caatatgtga accattgcgt gacctggtac 780
aataacggac tcgcacagca gaaagccctc tttgcaacga gccccaactg gaatcgcttc 840
aatgcctacc gccgcgacat gacgatcaac gttttggacc tgatcgccct ctttcccatt 900
tatgacgcac ggctctaccc ccaacccgtc cgcgcggaac ttactcgcga gatttactca 960
aacatattga attctgatgt ctacggcgtc caatgggccg attttgaaaa gaatgaaagc 1020
acttttacac gcccccccca ccttttcact tggttgcgca aattcgattt ctatacccgg 1080
acgaagtatt acaatcaggg gttgggatgg ctgttcttgg gaggccacac caactactat 1140
tcatatacaa acagctcgaa tctgaagtcg gggtcttaca acaatttctg gggatcagac 1200
atgcagactt ccactcttac cattcctgac aatccttcaa tttaccgcct ctggacaaaa 1260
tcttacacgc acatatatcc gtataccgat ccggtgaata taactcagat gcaattttat 1320
ttgaccaaca accaacagtt gacatacacg gccacggcca atcctaggta tccagtgaga 1380
gaaacgaact tcgaacttcc gtcaacagat gagaatcctc tgacatacca aaactactct 1440
catatccttt catatatgat ctcgtcgcaa cattttggtg ataagcggtc aggctacacg 1500
ttcgcctgga ctcacaattc agttgatccc accaatacgc ttgccccaaa taaaattacc 1560
cagattcctg ccgttaaggc caataccctc gaaggtaata aaagctttgt ggtgaaagga 1620
ccgaaccata cgggggggga tttggttata cttgaggctg agcctggacc agtgtatcct 1680
attgtttatc ggggcgtcat ggggattacg tgcaaagtga ctcaggccca gaactatcgc 1740
attaggatcc gctatgcttc caatggaggg gcgcagatgg ctatcagcct tcgcaacagg 1800
gggaccggga cggtctttac agtgtcgaaa acgtacacgg ggaactctat tgagaatctt 1860
cagtacaatg atttccagta taaagacatg ccagtgatac ttgaggcttc acaatacgaa 1920
cccaacaatt ccatctacgt ttatctctat caagaatctc cttatatcca agtcatcatc 1980
gacaagatag aattcatccc gattgacaca acttcgcagg agtatgagga aaagcatcaa 2040
cttgaaaagg cgaagaaagc tgtgggagtt ctgttcacga atgacgccaa gaaagctttg 2100
aagatcgata ctaccgatta cgatgttgac caggccgcaa acctcattga gtgcctttca 2160
gatgaacaat acgctaaaga gaagatgata ttgctggatg aagtcaaata cgctaagcaa 2220
ctttcccagt ctcggaatct cctgcagaat ggagactttg agtccagcga gatcggatgg 2280
gagacctcca acacgatcac gatacaagca gggaacttga tcttcaaagg taagtatttg 2340
aacatgtcag gtgcacggaa catagatggg gccatctttc ctacgtacgc cttccagaag 2400
gtcgacgagt ctcggctcaa gccttatacg cggtacaagg ttaggggatt cgtcggctca 2460
tcgaaagacg tcgaagtggt cgttactcgg tatggggagg aagtcgatac catcatgaac 2520
gtgccaaatg accttacata tgacgttggt agcgtcaaga gctgcggtga gtggaatcgc 2580
tgtgagcagc agccttacca gaatcgcaac caagtgctca ataactctat gataatagct 2640
aacacgtcca acgcgtccaa ctcatgcgaa tatgtcccag aaaagaaaag ggtcatgtgc 2700
cctgagcccc atcaattcag cttccatgtg gatacgggcg agaccaatct caacgaaaat 2760
ttggggattt cagtcctgtt taaaatttct agcccggagg ggtatgcaat acttgacaac 2820
atagagttga tcgaagaagg gtccctcgtt ggtgaatcgc ttgcttacgt tcaaaaccgg 2880
gagaaaagat ggaaaaataa aatgcaggcg gaaagaatgg agacccaaca agcgtataat 2940
atagctaagc aagtggtcga catacttttt acagatccac aggataccgc cctccgcttc 3000
gaaactaata aatccaatat aatttctgca gatgagctcg tccaatcgat cccatacatc 3060
tacaatgact ggcttagaga cgtccccggc atgaactaca acatgttcac tgagctcaag 3120
ggtagaatta ctcaagctta ttatctttac gatgatagga acgtgttgca gaacggggac 3180
ttcaacaatg ggctcacgag ctggtacgtc accggaaatg cagaagtgca gcagatagat 3240
gggacttttg tcctcgttct gcaaaattgg tcgactacag tctcgcagaa cgtgtgcctt 3300
cagcacaata ggggatatgt tctgcgggtg acggcacgca aagaaggaat gggcaacggg 3360
tacgtcacca tgtctgactg cgcgaatcac atagagaaaa tcattttcac atcgtgtgat 3420
aacaacctgg ttgttacctc cacggattcc gccgaatatg tgactagaac cgtgtctttc 3480
tttccagaca ccgaccatgt tcgcatagaa ataggggaaa ctgagggcac cttcaaggtc 3540
gagtcagttg aactcatatg tatggaggga aaagaa 3576
<210> 14
<211> 3603
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT0454
<400> 14
atgaatcaaa acatagccgc agtgcgggaa gcggtcaatg ctctcttttc taatcacacg 60
cttcaactta aagtgacaga ctaccacgtc gaccaggtgg ctaaattggt ggaatgcata 120
tctgaccaga accatagcaa ggagaagatg tgcctgcttg atcaggtgaa gatcgcaaaa 180
agattgtcga gggagaggaa cctgttgaac tacggtgact tcgaatcctc taactgggca 240
ggtgcagatg gctggaacat ttctgcgcac gtttacacca ttgccgataa cctgatcttc 300
aaggaccatt atcttaatat gccgtcggtg aataatccca tactgtcgga caaaatattc 360
cccacttatg cgtatcagaa aatagaggag tcaaagctga aaccttacac gagatacatg 420
gtgcgcggat tcgttggttc ttccaaggac cttgagatct tggttgctcg gcacggcaag 480
gaggtgcata aacgcatgaa tgttcctaat gacatcattc ccaccaaccc ttgcactggc 540
gaactcgtct cccagccgcc gccatatcca gttatgccta tacacacaat ggcccaaaac 600
atgtggtgca atccttgcga aaatggttat caaaccgctg caggtatgat ggtccaggag 660
acgaatatgg tctgtcagga ccctcacgag ttcaaattta gcatcgacat cggagagatc 720
gaccgcgaaa ggaatttggg tatatggatt gggttcaaag tcggaacgac tgaaggtatg 780
gccacactcg actctataga ggtggttgag gtcggaccac tgacaggcga tgcactgaag 840
cgcatgcaaa aaagagagca gaagtggaaa aagaaatggg ctgagaagca aatgaaaata 900
gagcgcgccg ttcagattgc acgcaatgct attcaaactc ttttcactga cccaaatcag 960
aataggcttc aatcggcaat tactctgaag aacattgtgg acgctgagaa gtgggttcag 1020
aaaattccct atgtctataa tcaatttctt cagggggcta ttcctgaggt tccgggtgag 1080
caatacaacg tgtttcaaca actctcgcag gccgtcgtca cggctagggg gttgtacaac 1140
caaagaaatg tcatcaataa tggtgacttc agcgccggct tgagcaactg gaacgggact 1200
aaaggtgcag atgtccaaca aattggaaaa gagtcagttc tcatgatcag cgattggtca 1260
gcaaacatat cacaacaagt ctgtgttgag cctgagcatt catacctgct gcgcgtgaca 1320
gcacggaaag aaggctctgg ggaaggttac gtgacgatct ctgatggaac taaagataac 1380
accgaaacgc tcaaatttat cgtgggagaa gagacaactg gcgcaaccat gagcactatc 1440
cggtcacaca taagggagag atacaacgaa cgcaacatgg ttacttcgga ggtctatgac 1500
gcgagcggat atgccagcaa tcagaatatg gtcaactact cttcggagaa ttatggcatg 1560
tccgcataca gcgggaacaa caataaaaat taccaatcag agtcattcgg atttactcct 1620
tatggtgacg agaactccat gatgaattac ccaagcgaga actacgggga gaatgcgtat 1680
tcgggaaacg ataacatgaa ttatccttct aataactacg agatgaaccc ctattccagc 1740
gacatgaaca tgtctatgaa tcaggggagc gactgcaggt gtggctgtag cactaattcc 1800
taccctggcg gggacatgac catgaataat tatccctctt cgatgtatga aacaaacgca 1860
tacccctctt ctaccaacat gacggacaac ctgggaatgg gctgtggttg ctattactct 1920
actaatgaac atccaatggt tgagcagagc acactggacc tgtcggatta cgttatgaaa 1980
accgttgaaa ttttccctga aacgaataga gtctgtatag aaatcggaga aactgccggg 2040
atatttatga tagagtcgat agagttcgtg ccggtcaatc cgattgaatc agtgcccgag 2100
cctgggccag ggatatatca gagcgttaca gcattgaata atagctctgt cgtggagatg 2160
gccagccagg gagctaggaa cgttattaaa gcccttccgc aaaatgcgag caatatagag 2220
cttgagtatg ccccggtcta tgactatgat accgatggct gctacgctac cgctgcaata 2280
tcaccagatg ggacaacgaa tcctggcctg ggcatgggcg attcaccctc gtccggttgc 2340
aggggcccgg ctcagctcga aaatagcaac acctattcga gggctaagtc taacaacgga 2400
tggaccgcca taatgtacgc tagctacttt gaaaaggatc aaacttctct cgggcctggg 2460
tcggctgggc atagacacga ctgggagcac accattgttt gggtcaagga cgggcaagtc 2520
caatacgtca catactccgc acacgggaac tggtacacga atcctagatc taacgttcgg 2580
ttttcaggca atcacccgaa gatcgtgtat cacaaagatt ctatttctac ccatgctttt 2640
cgcctggcta attctaacga cgaacctcca gagaattatt accaccagtg gcttcttctc 2700
cctatagttg gttggtatgg ttatccctct agagcaatta gggagaaact gatgacgacc 2760
aattttgggt cagcgacgat tgagatcaag gacggtaact tcgaacgggc cttggaaaaa 2820
gcgaagccac caataaactt cgacccgtat gcccctgagc tcgaggacgg gggcgcgtac 2880
caaatcgtta gcaccctgaa taacaggtct gttgtggaca tggatccacc atcgaagaat 2940
gtgcatctgt gggaaaatgg taatgcaaat aaccaaaaat ggaagctggt ttatgactca 3000
attaaaagcg cttatcagat gaagaatatc gccaatgaga atctggtcct gacctggaat 3060
gatctgaatg ggagcataaa tgttattgct actagcaacc agaaccagga agagcaatat 3120
tggatcccaa ctgaagcggg aaatgggtat tattacgtta gaaacaagaa ggatccaaat 3180
aaagttttgg atgtctcagg ctatgggacc gcaaatggga cgaatgtcac agtttataat 3240
gtgcatgggg gaaataacca aaaattcaaa ttgtcaaacg ttaccggcat cctcacgaga 3300
gaggtggaaa gcttgtacaa agcccagccc ggtcagtcca gccggtccag caacaacttc 3360
tcccttgagc atctcgccgc tggtacgaag gtccgcgtca tacttgcagg cgagggcgcg 3420
acgagcctgt cgttcaacat ttcgcgcgac aaatccggca ccgattcttc gatatggtca 3480
aatgtcagag actccagcgt tctcactctg cctagcggag atgatagaaa gaacctttat 3540
atttcagggc cgccaagcgg ctacacatcc aacgggacct tcactgttaa gttctatgca 3600
ctg 3603
<210> 15
<211> 3438
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT0485
<400> 15
atgaaccaat acaacaacac caacaacgag ataatagatg cgtccactaa acgctccccc 60
cagtatcccc tggctaacaa tccacagaat agcattaaga ctactaacta caaagattgg 120
ataaacatgt gcgagggaaa cgcagaagct tttttcatca ccgatgagca aatggtttcc 180
attgttggtg ccgctatttc taagttgttg ggtttcgttc cggttgtggg cgacatcctt 240
tcgtttctcg cagacacata ttggcctaag atagcgggac aggaggtgga cacccgggtt 300
tgggcaggcc tgatccgcca cactgccaac ctgatcgata acagggaagc ggaaaaagtt 360
attggccagg ctaccaccaa ccttatgtcg ttgtacggag cgctcggcgt ttacaataga 420
tttctggagc aatggaaaca aaatgagaaa tcatttgcga atctggccga cgaagtgaga 480
acacaaatgt ctgcgctgca cctccttttc accaccaaga taatctctga ttttactctc 540
catggttacg agtccatcct tctgccatcc tatgcctccg cagcaaatct ccatctgctt 600
cttctgaggg acattgctat ttacggtgag aggcttggat ttgacccaaa agtcctccag 660
gcttaccatg acgagcaagt tctctttact aggcagtata cagcacactg tatcaatact 720
tataacctta cattgaacgc gcagaaaccc agaggatggg ttgccttcaa ccaatataga 780
cgggatatga cactcacagt tttggatttg atagctctgt ttccgagcta cgacactcac 840
aagtatcctg tggataagaa aaatgttaag aagttgagca ctaccgagtt tactcgggaa 900
atctatacgg ctttgatcga acctaatcct aacaagaccg tcgagggcat ggaggcctcg 960
ctgacaagga ctccccacct cttcacttgg attaaacgcc ttgactttta caccaacacg 1020
ctttacccgg atctcagata tttgtccgca aaccgcattg gttttagcta cacaaattcg 1080
tcgacgatcc aacagagcgg tatttacggt gattcaggat ttgggtccaa tctgacgcat 1140
cagcttccga taaatccaaa catatttaaa agctccatca cggataccag atcaccttcg 1200
aaccaaatta ctaagatgga cttttacaaa acagacggta cccaagcgag ctacaattcg 1260
gggataacac caacgcctgg tgatctgcgc accacattct tcggtttctc gactaatgaa 1320
aataccccaa atcagccttc tatcaatgac tatacgcatt ttcttacgta catgaagacc 1380
gatgttatat cgggtggagc cccaaaaagg gtctcattgg cctgggccca caaaagcgtc 1440
aacctcaata atcaaatttt cactgatgac attactcagg tccctgccgt caaaagcaac 1500
gttctcaaca cacaagccaa agttataaaa ggaccgggac atacaggggg cgatctggtg 1560
gctattactt ctgatggagt gctcagcggc cggatggaaa tccagtgtaa ggcatctgtc 1620
tttaacgaac cggagcgccg gtatgggctc agaattcgct acgcggcgaa ttcgatcctt 1680
acagtcaacg cttcgtatac gtcacagggc aacacgcgct ctatcacgtt tacgaccgag 1740
agcacgttta cagggaacac tattcccacc gacctgaaat atgaaaattt gaagtacaaa 1800
gaacctttcg acgccatcct ccctatgaga cttacgtcga atgagctcac gaatattaca 1860
attcaaccgc agaatatgtc atctaatcaa cttcttataa ttgatcgcat cgagtttata 1920
cctataacct caacggttct cggcgatact gagaagcaaa atctggagaa agtgcaaaag 1980
gctgttaacg atctcttcac taacaccgca aagaacgcac tcaaggctga aacgacagac 2040
tatgaaatag accagactgc aaacattgtc gagtgtttgt cagacgagca ttctacgaag 2100
gagaagatga ttctcctgga cgaggtcaag tacgctaagc aactttcgca atcacgcaat 2160
gtgctgcaaa atggtgactt cgagtcggat acactgggat ggacaacttc aaacaatatt 2220
accatacaag cagacaatcc catcttcaaa gggaaatacc ttcacatgtc cggggccagg 2280
gatatcgacg gttctgtctt tcccacttat atctaccaaa aaattgacga gtccaaactt 2340
aaaccttaca cgcggtacag agtgaggggt ttcgtggggt cgtctaaaga gctcgagctt 2400
gtggtttcaa ggtacggcga ggagatcgat gcaatcatga acgtcccgaa caaattggtc 2460
gatatgtatc cgcccgcctc ggattgcggt ggcttgaata gatgtgaaat ctcgtccgct 2520
ttggagatca accaagtcga ctacactaac atgagctacc cttgccaaaa cgatggtaac 2580
aagaagcatg tcttgtgcca cgatagacat tcatacgatt tccatatcga cacggggtcc 2640
gttgatctca acgaaaatat tggcatatgg gtgcttttca aggtctcatc acctgacggt 2700
tacgctacct tggataatct tgaggtggtg gaggagcgct ctctcgacgg agaagctctc 2760
gctagggtga aacacaggga aaaaaaatgg attcaccaga tagaagtgaa acggtacgaa 2820
acccagcaag cttacgacgc gacaaaacag gcaatggacg cattgtttac taacgaccag 2880
gacgaagcgc tccaattcga tactactctc gcgcagattc aacacgcgga cgaccttgtg 2940
caatcaatcc catatgttta caacgaatgg gtccccagcg cacctgggat gaactacgac 3000
ctctatgtcg agttggaagc gcgcgttgtc aaagcgcggt acctttacga tacacggaat 3060
gttatacgga atggagattt ctctgaagga ctccaagggt ggcatgttac cggaaacgcc 3120
aaggttcagc agattgacgg agtgtccgtc cttgtgttgt ccaactggag cgcaggggtg 3180
gctcaaaata tgtacgttca gcacaaccat ggctatgtcc tccgggtgac tgccaagaaa 3240
gaaggacacg gtaagggcta tgtgacactt atggactgtg acgggaatca ggagaccctt 3300
acctttacat cttgcgaaga ggggtacgtc acaaagacag ttgacgtttt ccctgataca 3360
gatagagtca gagtggatct gggggagaca gaaggccctt tttacatcga gtcgattgag 3420
cttatttgta tgaatggc 3438
<210> 16
<211> 1173
<212> PRT
<213> 苏云金芽孢杆菌
<400> 16
Met Gly Gly Ile Asn Met Ser Pro Asn Tyr Ser Asp Asp Tyr Glu Ile
1 5 10 15
Ile Asn Ala Pro Ser Asn Thr Ser Pro Arg Tyr Pro Leu Val His Asp
20 25 30
Leu Thr Pro Gln Phe Gln Asp Met Asn Tyr Lys Asp Tyr Leu Arg Met
35 40 45
Thr Glu Gly Asn Arg Gly Val Ser Ala Thr Ser Val Arg Ser Gly Gly
50 55 60
Glu Ala Ile Asp Ala Ala Leu Ser Ile Thr Ala Ile Leu Leu Gly Val
65 70 75 80
Leu Gly His Pro Val Gly Ser Ala Val Val Gly Thr Phe Asn Ala Leu
85 90 95
Leu Gly Leu Leu Trp Pro Asn Gly Gln Thr Ile Val Trp Glu Asp Leu
100 105 110
Leu Ala Lys Ala Glu Asp Phe Ala Asn Lys Val Ile Thr Ala Glu Ile
115 120 125
Arg Ser Asn Ala Phe Ser Ala Leu Asn Val Ser Tyr Ala Met Val Ser
130 135 140
Glu Tyr Thr Ser Ala Leu Asn Asp Trp Ile Glu Asn Pro Gly Val Arg
145 150 155 160
Ile Ser Gln Gln Leu Met Arg Glu Ile Phe Thr Asn Thr Val Leu Gln
165 170 175
Leu Ala Ser Gln Met Pro Tyr Phe Asn Val Ala Gly Tyr Glu Thr Ser
180 185 190
Leu Leu Thr Met Tyr Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu
195 200 205
Lys Asp Ile Phe Ile Phe Gly Lys Glu Trp Gly Phe Pro Gln Thr Asp
210 215 220
Ile Asp Phe Tyr Tyr Tyr Glu Glu Phe Ile Asp His Leu Pro Val Tyr
225 230 235 240
Val Asp His Cys Thr Lys Trp Tyr Asn Glu Gly Leu Asn Asn Leu Pro
245 250 255
Lys Ser Asn Ser Tyr Asp Trp Tyr Asn Tyr Asn Lys Phe Arg Arg Glu
260 265 270
Met Thr Leu Met Val Leu Asp Ile Val Ala Leu Phe Pro Ser Tyr Asp
275 280 285
Ala Tyr Val Tyr Thr Leu Glu Thr Thr Thr Glu Leu Thr Arg Ile Val
290 295 300
Tyr Thr Asp Pro Leu Gly Ile Met Ile Pro Pro Pro Pro Gly Tyr Glu
305 310 315 320
Glu Met Val Gly Tyr Gly Gly Asn Leu Asp Trp Arg Asn Tyr Gly Phe
325 330 335
Ser Phe Ser Tyr Leu Glu Ser Gln Leu Arg Gln Pro Val Leu Phe Ser
340 345 350
Trp Leu Asn Ser Ile Lys Met Tyr Thr Arg Lys Ile Ile Cys Glu Ala
355 360 365
Gly Thr Pro His Ser Leu Trp Ser Gly Asn Glu Ile Asn Leu Ser Tyr
370 375 380
Thr Ser Asp Pro Ser Asn Thr Phe Thr Leu Gln Ser Gly Tyr Ser Thr
385 390 395 400
Gly Tyr Thr His Thr Asp Phe Leu Asp Ile Asn Ser Lys Asp Ile Tyr
405 410 415
Glu Val Val Ser Lys Ile Gly Ser Glu Ala Val Val Gly Pro Gly Asp
420 425 430
Asp Ser Tyr Leu Tyr Gly Leu Tyr Gln Ala Ala Phe Arg Ile Ile Pro
435 440 445
Lys Asp Ser Ser Ala Tyr Ser Tyr Leu Tyr Pro Thr Tyr Asp Ile Gly
450 455 460
Met Asn Gly Tyr Ser Met Ser Ser Leu Val Glu Leu Pro Pro Glu Ser
465 470 475 480
Ser Asp Pro Pro Gln Pro Asp Glu Tyr Thr Tyr Thr His Arg Leu Ser
485 490 495
Tyr Ala Thr Leu Leu Ser Val His Ser Tyr Thr Ser Asp Phe Phe Asn
500 505 510
Asp Gly Ala Ile Pro Ile Tyr Gly Trp Thr His Arg Ser Val Asn Arg
515 520 525
Asp Asn Gln Ile Tyr Pro Asp Arg Ile Thr Gln Ile Pro Ala Val Lys
530 535 540
Gly Lys Gln Leu Ile Glu Gly Ala Ser Val His Lys Gly Pro Gly Ser
545 550 555 560
Thr Gly Gly Asp Leu Val Arg Leu Tyr Leu Asn Asp Arg Val Tyr Leu
565 570 575
Asn Val Asn Val Asp Ser Val Ser Gln Lys Tyr Arg Val Arg Val Arg
580 585 590
Cys Ala Thr Tyr Asn Pro Gly Ser Ile Tyr Leu Tyr Arg Asp Asn Thr
595 600 605
Ile Ile Ser Ser Ala Thr Ala Pro Lys Thr Thr Asp Thr Thr Asp Thr
610 615 620
Thr Gln Ile Lys Phe Asn Asp Phe Gln Tyr Ile Thr Phe Ser Asp Ile
625 630 635 640
Phe Thr Phe Thr Ser Thr Trp Gln Gln Ile Ser Ile Gly Ala Gly Thr
645 650 655
Thr Tyr Ala Glu Val Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Asn
660 665 670
Glu Thr Tyr Glu Ala Glu Arg Asn Leu Glu Asn Ala Lys Lys Ala Val
675 680 685
Ser Ala Leu Phe Thr Gly Thr Met Asp Thr Leu Lys Arg Glu Val Thr
690 695 700
Asp Tyr Gln Ile Asp Arg Ala Ser Asn Leu Ile Glu Cys Val Ser Asp
705 710 715 720
Glu Met Tyr Gly Asn Asp Lys Arg Leu Leu Phe Glu Ala Val Lys Thr
725 730 735
Ala Lys Arg Leu Ser Gln Ser Arg Asn Leu Leu Gln Asp Leu Asn Phe
740 745 750
Glu Met Leu Asn Thr Ser Gly Asn Gly Glu Asn Gly Trp Val Gly Ser
755 760 765
Thr Gly Ile Gln Val Val Glu Gly Asp Ala Leu Phe Lys Asn Arg Ser
770 775 780
Leu Arg Leu Pro Gly Ala Arg Gln Phe Asp Thr Glu Thr Tyr Pro Thr
785 790 795 800
Tyr Leu Tyr Gln Lys Ile Glu Glu Ser Lys Leu Lys Pro Tyr Thr Arg
805 810 815
Tyr Lys Val Arg Gly Phe Ile Lys Gly Ser Lys Asp Leu Glu Val Asp
820 825 830
Val Met Arg Tyr Gly Ala Lys Gln Lys Val Leu Asn Val Pro Asn Asn
835 840 845
Leu Asn Pro Asp Ile Ile Pro Ile Asn Ala Cys Gly Asp Val Asp Arg
850 855 860
Cys Arg Gln Gln Gln Ala Val Asn Ala Arg Leu Gln Pro Ala Thr Ile
865 870 875 880
Ser Pro Cys Glu Gly Gly Asp Thr Asn Thr Ser Ala His Ala Phe Ser
885 890 895
Phe Ser Ile Asp Thr Gly Ala Ile Asp Thr Ser Glu Arg Pro Gly Ile
900 905 910
Gly Val Ala Phe Lys Ile Ala Thr Pro Glu Gly Tyr Ala Ser Leu Gly
915 920 925
Asn Leu Glu Val Ile Glu Glu Gly Pro Leu Thr Gly Glu Ala Leu Ala
930 935 940
His Val Lys Gln Arg Glu Arg Gln Trp Lys Asp Lys Ile Thr Lys Lys
945 950 955 960
Arg Ala Glu Thr Glu Thr Ile Tyr Thr Arg Ala Lys Gln Ala Ile Asn
965 970 975
Asn Leu Phe Ala Asp Tyr Gln Asp Arg Gln Leu Lys His Asp Val Glu
980 985 990
Ile Pro Asn Ile Ile Ala Ala Asp Gln Ile Val Glu Ser Ile Arg Asp
995 1000 1005
Arg Tyr Asn Glu Trp Ile Pro Ala Ile Pro Gly Met Asn Tyr Glu
1010 1015 1020
Ile Tyr Thr Glu Leu Lys Asn Arg Ile Gln Arg Ala Tyr Ala Leu
1025 1030 1035
Tyr Asp Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Arg Asn Gly
1040 1045 1050
Leu Ala Asn Trp Asn Ala Thr Pro Gly Ala Arg Val Gln Gln Met
1055 1060 1065
Asn Gly Asn Pro Val Leu Val Ile Pro Asn Trp Asp Thr Gln Val
1070 1075 1080
Ser Gln Ser Val Pro Val Glu Pro Asn His Arg Tyr Leu Leu Arg
1085 1090 1095
Val Thr Ala Gln Lys Leu Gly Ala Gly Asn Gly Tyr Val Thr Val
1100 1105 1110
Thr Asp Gly Thr Asn His Thr Glu Thr Leu Thr Phe Asp Arg Cys
1115 1120 1125
Asp Asn Asn Thr Thr Gly Ser Asn Arg Tyr Val Thr Lys Thr Ile
1130 1135 1140
Glu Phe Thr Pro Arg Thr Asn Gln Leu Gln Val Glu Ile Gly Glu
1145 1150 1155
Thr Glu Gly Thr Phe Asn Ile Glu Ser Val Asn Leu Leu Gly Cys
1160 1165 1170
<210> 17
<211> 1190
<212> PRT
<213> 苏云金芽孢杆菌
<400> 17
Met Thr Gln Asn Asn Asn Glu Tyr Glu Ile Ile Asp Gln Asn Thr Ser
1 5 10 15
Pro Tyr Ser Ser Asn Arg Asn Asn Asn Asn Ser Arg Tyr Pro Phe Ala
20 25 30
Asn Asn Pro Asn Gln Ala Leu Gln Gln Thr Asn Tyr Lys Asp Trp Ile
35 40 45
Asn Met Cys Gln Lys Asn Gln Gln Cys Gly Glu Asn Leu Glu Thr Phe
50 55 60
Ala Ser Ala Asp Thr Ile Ala Ala Val Ser Ala Gly Val Ile Val Val
65 70 75 80
Gly Thr Met Leu Gly Ala Phe Gly Ala Pro Val Thr Thr Gly Leu Ile
85 90 95
Ile Ser Phe Gly Thr Leu Leu Pro Ile Phe Trp Gly Pro Ser Glu Asp
100 105 110
Pro Lys Lys Val Trp Lys Glu Phe Leu Thr Ile Gly Asn Arg Pro Phe
115 120 125
Gly Ser Glu Val Asp Gln Gly Ile Ile Asp Leu Leu Tyr Thr Lys Val
130 135 140
Asn Gly Leu Arg Ser Gln Phe Glu Asp Phe Gln Arg Tyr Phe Asp Leu
145 150 155 160
Trp Lys Asn Asn Lys Asn Pro Val Asn Ala Asp Val Val Arg Gln Lys
165 170 175
Phe Leu Ser Leu Asp Ser Asp Val Ile Arg Glu Leu Glu Thr Leu Lys
180 185 190
Gly Asn Tyr Tyr Ile Thr Leu Leu Pro Gly Tyr Thr Gln Val Ala Asn
195 200 205
Trp His Leu Asn Leu Leu Arg Gln Ala Ala Tyr Tyr Tyr Asp Glu Trp
210 215 220
Ala Pro Ser Ser Asn Leu Ser Ile Gln Ser Ile Tyr Pro Gln Asp Tyr
225 230 235 240
Thr Asn Asp Leu Gln Thr Cys Leu Asp Asn Cys Pro Ser Glu Ser Gly
245 250 255
Asn Lys Val Ser Ser Ala Tyr Tyr Lys Cys Ile Leu Lys Cys Arg Ile
260 265 270
Asn Glu Tyr Ile Asn Tyr Cys Ser Lys Thr Tyr Gln Glu Gly Leu Asn
275 280 285
Lys Leu Lys Asn Ser Ser Asp Ile Lys Trp Asn Ile Tyr Asn Glu Tyr
290 295 300
Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile Ala Ala Phe Pro
305 310 315 320
Asn Tyr Asp Leu Glu Lys Tyr Pro Ile Gly Thr Lys Cys Glu Leu Thr
325 330 335
Arg Glu Val Tyr Thr Asn Ala Leu Met Gly Ser Ser Ser Met Ser Ile
340 345 350
Ala Glu Leu Glu Lys Ser Leu Thr Lys Asp Pro Phe Leu Ile Thr Trp
355 360 365
Leu Asn Lys Ile Leu Leu Tyr Thr Arg Asn Tyr Lys Gln Pro Thr Thr
370 375 380
Glu Asp Val Phe Val Phe Thr Gly Asn Gln Leu Arg Tyr Ser Phe Thr
385 390 395 400
Met Asp Ser Asn Leu Gly Tyr Ser Gly Phe Tyr Gly Asp Val Ser Tyr
405 410 415
Thr Asp Asp Thr Glu Gln Ile Leu Glu Ile Pro Gly Asn Ser Gln Ile
420 425 430
Val Lys Val Glu Val Glu Arg His Arg Asp Ser Pro Asp Ile Ile Trp
435 440 445
Lys Ile Asp Phe His Leu Asn Asn Gly Ala Val Leu Lys Tyr Asn Ser
450 455 460
Gly Ser Thr Ala Asp Pro Asn Phe Arg Val Arg Asp Val Leu Thr Ile
465 470 475 480
Pro Pro Asp Ser Lys Gly Asn Ala Ser His Phe Leu Ser Tyr Met Lys
485 490 495
Ser Ala Tyr Val Thr Ser Asp Val Lys Gln Leu Arg Arg Val Ser Phe
500 505 510
Ala Trp Thr His Asn Ser Ile Asn Tyr Asn Asn Glu Ile Tyr Asn Asp
515 520 525
Ile Ile Thr Gln Ile Ala Ala Val Lys Gly His Tyr Leu Gly Leu Glu
530 535 540
Gly Leu Ala Ser Arg Val Ile Gln Gly Pro Gly His Thr Gly Gly Asp
545 550 555 560
Leu Val Asp Leu Lys Asp Asp Leu Arg Leu Ala Cys Gln His Ser Gly
565 570 575
Thr Gln Gln Ser Tyr Tyr Ile Arg Ile Arg Tyr Ala Ser Asp Gly Asp
580 585 590
Thr Arg Ile Val Leu Val Ile Pro Leu Met Glu Ser Gln Asn Ile Pro
595 600 605
Leu Lys Ser Thr Phe Ser Gly Val Asn His Asp Glu Leu Lys Tyr Lys
610 615 620
Asp Phe Gly Tyr Val Gln Phe Pro Gly Glu Ile Thr Leu Asn Gln His
625 630 635 640
Ser Lys Ile Thr Leu Ile Phe Arg Leu Gln Asp Ile Tyr Ser Asn Ile
645 650 655
Ser Val Phe Ile Asp Lys Ile Glu Phe Ile Pro Ile Thr Ser Ser Ile
660 665 670
Arg Glu Asn Arg Glu Lys Tyr Gln Leu Glu Lys Ala Lys Arg Ala Val
675 680 685
Asp Asp Leu Phe Ile Ser Ala Lys Lys Gln Asn Ile Lys Ile Asp Ile
690 695 700
Thr Asp Tyr Gln Ile Asp Gln Thr Ala Asn Leu Val Asp Ser Leu Ser
705 710 715 720
Glu Glu Pro Tyr Pro Gln Glu Lys Met Met Leu Leu Asn Gln Ile Lys
725 730 735
Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn Leu Leu Ser Asn Gly Asp
740 745 750
Phe Glu Ser Leu Ile Gly Trp Thr Thr Ser Ser Ser Ile Thr Val Gln
755 760 765
Thr Gly Asn Thr Ile Phe Lys Gly Phe Ser Leu His Met Leu Gly Ala
770 775 780
Arg Thr Thr Glu Ile Asn Ala Thr Val Phe Pro Thr Tyr Val Tyr Gln
785 790 795 800
Lys Ile Asp Glu Ser Arg Leu Lys Pro Tyr Thr Arg Tyr Ile Val Arg
805 810 815
Gly Phe Ile Gly Ser Ser Lys Gly Leu Gly Ile Phe Val Thr Arg Tyr
820 825 830
Asn Asn Val Pro Asp Lys Leu Ala Tyr Ile Arg Ser Thr Asn Ser Cys
835 840 845
Gly Glu Leu Asn Gln Tyr Glu Ser Gln Asn Tyr Ser Leu Val Ser Glu
850 855 860
Asn Asn Ser Thr Met Ser Leu Gln Asn Ile Thr Ala Ser Asn Asp Thr
865 870 875 880
Ser Cys Leu Ser Glu Asn Leu Arg Tyr Cys Glu Pro Asn Gln Leu Tyr
885 890 895
Pro Thr Cys His Asn Leu His Asp Phe Ser Phe Ser Ile Asp Thr Gly
900 905 910
Glu Leu Asp Phe Asn Glu Asn Pro Gly Ile Trp Ile Leu Phe Lys Ile
915 920 925
Ser Asn Pro Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Val Ile Glu
930 935 940
Glu Lys Thr Leu Val Gly Glu Glu Ile Asn Asn Val Lys Glu Lys Gly
945 950 955 960
Lys Arg Trp Lys Lys Glu Met Asp Thr Lys Gln Thr Lys Thr Glu Thr
965 970 975
Ala Phe Ser Gln Ala Gln Gln Ala Val Asn Gly Leu Phe Met Asn Thr
980 985 990
Gln Tyr Ser Met Leu Lys Ile Glu Thr Thr Met Gln Asp Ile Val Thr
995 1000 1005
Ala Asp Asn Leu Ile Asn Glu Ile Pro Tyr Val Tyr Asp Glu Leu
1010 1015 1020
Leu Pro Asn Glu Pro Ala Gly Arg Asn Tyr Asn Met Phe Ile Glu
1025 1030 1035
Leu Lys Asn Gln Ile Ser Gln Val Tyr Ser Leu Tyr Asn Ala Arg
1040 1045 1050
Asn Ile Ile Gln Asn Gly Asn Phe Asn Asn Gly Leu Lys Asn Trp
1055 1060 1065
His Thr Ser Pro Asp Ala Lys Val Gln Lys Ile Asp Asn Thr Ser
1070 1075 1080
Val Leu Val Ile Pro Asn Trp Ser Thr Gln Val Ser Gln His Thr
1085 1090 1095
Asn Leu Gln Gln Asn Gln Arg Tyr Leu Leu Arg Val Thr Ala Lys
1100 1105 1110
Lys Glu Gly Met Gly Asn Gly Tyr Val Lys Val Ser Asp Cys Ala
1115 1120 1125
Asn Asn Val Glu Thr Leu Thr Phe Lys Ser Ser Asp Ile Thr Asn
1130 1135 1140
Asn Asn Met Trp Asn Glu Ser Ile Gly Tyr Met Thr Lys Thr Met
1145 1150 1155
Tyr Ile Thr Pro His Thr Ser Gln Val Arg Ile Asp Ile Gly Glu
1160 1165 1170
Thr Glu Gly Asn Phe Lys Ile Asn Ser Ile Glu Leu Ile Cys Ile
1175 1180 1185
Lys Asn
1190
<210> 18
<211> 1192
<212> PRT
<213> 苏云金芽孢杆菌
<400> 18
Met Ser Ser Gly Gly Thr Asn Met Asn Ser Asn Arg Asn Lys Asn Glu
1 5 10 15
Tyr Glu Ile Leu Asp Ala Ser Ser Ser Thr Ser Asn Met Thr Asn Gln
20 25 30
Tyr Ser Arg Tyr Pro Leu Ala Asn Asn Pro Gln Ala Phe Met Arg Asn
35 40 45
Thr Asn Tyr Lys Asp Trp Leu Ala Met Cys Glu Arg Asn Asp Thr Gly
50 55 60
Val Leu Glu Asn Pro Glu Val Leu Ser Leu Arg Gly Ala Val Gly Thr
65 70 75 80
Gly Val Ser Ile Val Gly Met Ile Phe Ser Leu Ile Gly Ile Pro Val
85 90 95
Ile Gly Glu Val Val Gly Ile Leu Val Ser Leu Thr Asn Leu Leu Trp
100 105 110
Pro Glu Ser Glu Gly Ser Ala Gln Tyr Thr Trp Gln Glu Leu Ile Thr
115 120 125
His Val Glu Glu Leu Met Asp Gln Arg Ile Gly Glu Thr Gln Lys Ala
130 135 140
Asn Ala Leu Ala Lys Leu Ser Gly Leu Lys Ala Gln Val Ala Ala Tyr
145 150 155 160
Asn Arg Ala Leu Glu Asp Trp Glu Lys Asn Pro Asn Ser Arg Ser Ala
165 170 175
Ser Glu Val Ile Ala Arg Phe Arg Ser Thr Asn Asn Asp Phe Val Gly
180 185 190
Ser Met Pro Gln Phe Ser Pro Asn Gly Tyr Glu Ile Leu Leu Leu Ser
195 200 205
Val Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Ile Arg Asp Ala
210 215 220
Thr Ile Tyr Gly Ser Gln Trp Gly Leu Ser Gln Gly Asp Val Asn Leu
225 230 235 240
Tyr Tyr Asn Glu Gln Leu Leu Tyr Thr Lys Gln Tyr Val Asn His Cys
245 250 255
Val Thr Trp Tyr Asn Asn Gly Leu Ala Gln Gln Lys Ala Leu Phe Ala
260 265 270
Thr Ser Pro Asn Trp Asn Arg Phe Asn Ala Tyr Arg Arg Asp Met Thr
275 280 285
Ile Asn Val Leu Asp Leu Ile Ala Leu Phe Pro Ile Tyr Asp Ala Arg
290 295 300
Leu Tyr Pro Gln Pro Val Arg Ala Glu Leu Thr Arg Glu Ile Tyr Ser
305 310 315 320
Asn Ile Leu Asn Ser Asp Val Tyr Gly Val Gln Trp Ala Asp Phe Glu
325 330 335
Lys Asn Glu Ser Thr Phe Thr Arg Pro Pro His Leu Phe Thr Trp Leu
340 345 350
Arg Lys Phe Asp Phe Tyr Thr Arg Thr Lys Tyr Tyr Asn Gln Gly Leu
355 360 365
Gly Trp Leu Phe Leu Gly Gly His Thr Asn Tyr Tyr Ser Tyr Thr Asn
370 375 380
Ser Ser Asn Leu Lys Ser Gly Ser Tyr Asn Asn Phe Trp Gly Ser Asp
385 390 395 400
Met Gln Thr Ser Thr Leu Thr Ile Pro Asp Asn Pro Ser Ile Tyr Arg
405 410 415
Leu Trp Thr Lys Ser Tyr Thr His Ile Tyr Pro Tyr Thr Asp Pro Val
420 425 430
Asn Ile Thr Gln Met Gln Phe Tyr Leu Thr Asn Asn Gln Gln Leu Thr
435 440 445
Tyr Thr Ala Thr Ala Asn Pro Arg Tyr Pro Val Arg Glu Thr Asn Phe
450 455 460
Glu Leu Pro Ser Thr Asp Glu Asn Pro Leu Thr Tyr Gln Asn Tyr Ser
465 470 475 480
His Ile Leu Ser Tyr Met Ile Ser Ser Gln His Phe Gly Asp Lys Arg
485 490 495
Ser Gly Tyr Thr Phe Ala Trp Thr His Asn Ser Val Asp Pro Thr Asn
500 505 510
Thr Leu Ala Pro Asn Lys Ile Thr Gln Ile Pro Ala Val Lys Ala Asn
515 520 525
Thr Leu Glu Gly Asn Lys Ser Phe Val Val Lys Gly Pro Asn His Thr
530 535 540
Gly Gly Asp Leu Val Ile Leu Glu Ala Glu Pro Gly Pro Val Tyr Pro
545 550 555 560
Ile Val Tyr Arg Gly Val Met Gly Ile Thr Cys Lys Val Thr Gln Ala
565 570 575
Gln Asn Tyr Arg Ile Arg Ile Arg Tyr Ala Ser Asn Gly Gly Ala Gln
580 585 590
Met Ala Ile Ser Leu Arg Asn Arg Gly Thr Gly Thr Val Phe Thr Val
595 600 605
Ser Lys Thr Tyr Thr Gly Asn Ser Ile Glu Asn Leu Gln Tyr Asn Asp
610 615 620
Phe Gln Tyr Lys Asp Met Pro Val Ile Leu Glu Ala Ser Gln Tyr Glu
625 630 635 640
Pro Asn Asn Ser Ile Tyr Val Tyr Leu Tyr Gln Glu Ser Pro Tyr Ile
645 650 655
Gln Val Ile Ile Asp Lys Ile Glu Phe Ile Pro Ile Asp Thr Thr Ser
660 665 670
Gln Glu Tyr Glu Glu Lys His Gln Leu Glu Lys Ala Lys Lys Ala Val
675 680 685
Gly Val Leu Phe Thr Asn Asp Ala Lys Lys Ala Leu Lys Ile Asp Thr
690 695 700
Thr Asp Tyr Asp Val Asp Gln Ala Ala Asn Leu Ile Glu Cys Leu Ser
705 710 715 720
Asp Glu Gln Tyr Ala Lys Glu Lys Met Ile Leu Leu Asp Glu Val Lys
725 730 735
Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn Leu Leu Gln Asn Gly Asp
740 745 750
Phe Glu Ser Ser Glu Ile Gly Trp Glu Thr Ser Asn Thr Ile Thr Ile
755 760 765
Gln Ala Gly Asn Leu Ile Phe Lys Gly Lys Tyr Leu Asn Met Ser Gly
770 775 780
Ala Arg Asn Ile Asp Gly Ala Ile Phe Pro Thr Tyr Ala Phe Gln Lys
785 790 795 800
Val Asp Glu Ser Arg Leu Lys Pro Tyr Thr Arg Tyr Lys Val Arg Gly
805 810 815
Phe Val Gly Ser Ser Lys Asp Val Glu Val Val Val Thr Arg Tyr Gly
820 825 830
Glu Glu Val Asp Thr Ile Met Asn Val Pro Asn Asp Leu Thr Tyr Asp
835 840 845
Val Gly Ser Val Lys Ser Cys Gly Glu Trp Asn Arg Cys Glu Gln Gln
850 855 860
Pro Tyr Gln Asn Arg Asn Gln Val Leu Asn Asn Ser Met Ile Ile Ala
865 870 875 880
Asn Thr Ser Asn Ala Ser Asn Ser Cys Glu Tyr Val Pro Glu Lys Lys
885 890 895
Arg Val Met Cys Pro Glu Pro His Gln Phe Ser Phe His Val Asp Thr
900 905 910
Gly Glu Thr Asn Leu Asn Glu Asn Leu Gly Ile Ser Val Leu Phe Lys
915 920 925
Ile Ser Ser Pro Glu Gly Tyr Ala Ile Leu Asp Asn Ile Glu Leu Ile
930 935 940
Glu Glu Gly Ser Leu Val Gly Glu Ser Leu Ala Tyr Val Gln Asn Arg
945 950 955 960
Glu Lys Arg Trp Lys Asn Lys Met Gln Ala Glu Arg Met Glu Thr Gln
965 970 975
Gln Ala Tyr Asn Ile Ala Lys Gln Val Val Asp Ile Leu Phe Thr Asp
980 985 990
Pro Gln Asp Thr Ala Leu Arg Phe Glu Thr Asn Lys Ser Asn Ile Ile
995 1000 1005
Ser Ala Asp Glu Leu Val Gln Ser Ile Pro Tyr Ile Tyr Asn Asp
1010 1015 1020
Trp Leu Arg Asp Val Pro Gly Met Asn Tyr Asn Met Phe Thr Glu
1025 1030 1035
Leu Lys Gly Arg Ile Thr Gln Ala Tyr Tyr Leu Tyr Asp Asp Arg
1040 1045 1050
Asn Val Leu Gln Asn Gly Asp Phe Asn Asn Gly Leu Thr Ser Trp
1055 1060 1065
Tyr Val Thr Gly Asn Ala Glu Val Gln Gln Ile Asp Gly Thr Phe
1070 1075 1080
Val Leu Val Leu Gln Asn Trp Ser Thr Thr Val Ser Gln Asn Val
1085 1090 1095
Cys Leu Gln His Asn Arg Gly Tyr Val Leu Arg Val Thr Ala Arg
1100 1105 1110
Lys Glu Gly Met Gly Asn Gly Tyr Val Thr Met Ser Asp Cys Ala
1115 1120 1125
Asn His Ile Glu Lys Ile Ile Phe Thr Ser Cys Asp Asn Asn Ile
1130 1135 1140
Val Val Thr Ser Thr Asp Ser Ala Glu Tyr Val Thr Arg Thr Val
1145 1150 1155
Ser Phe Phe Pro Asp Thr Asp His Val Arg Ile Glu Ile Gly Glu
1160 1165 1170
Thr Glu Gly Thr Phe Lys Val Glu Ser Val Glu Leu Ile Cys Met
1175 1180 1185
Glu Gly Lys Glu
1190
<210> 19
<211> 1201
<212> PRT
<213> 苏云金芽孢杆菌
<400> 19
Met Asn Gln Asn Ile Ala Ala Val Arg Glu Ala Val Asn Ala Leu Phe
1 5 10 15
Ser Asn His Thr Leu Gln Leu Lys Val Thr Asp Tyr His Val Asp Gln
20 25 30
Val Ala Lys Leu Val Glu Cys Ile Ser Asp Gln Asn His Ser Lys Glu
35 40 45
Lys Met Cys Leu Leu Asp Gln Val Lys Leu Ala Lys Arg Leu Ser Arg
50 55 60
Glu Arg Asn Leu Leu Asn Tyr Gly Asp Phe Glu Ser Ser Asn Trp Ala
65 70 75 80
Gly Ala Asp Gly Trp Asn Ile Ser Ala His Val Tyr Thr Ile Ala Asp
85 90 95
Asn Leu Ile Phe Lys Asp His Tyr Leu Asn Met Pro Ser Val Asn Asn
100 105 110
Pro Ile Leu Ser Asp Lys Ile Phe Pro Thr Tyr Ala Tyr Gln Lys Ile
115 120 125
Glu Glu Ser Lys Leu Lys Pro Tyr Thr Arg Tyr Met Val Arg Gly Phe
130 135 140
Val Gly Ser Ser Lys Asp Leu Glu Ile Leu Val Ala Arg His Gly Lys
145 150 155 160
Glu Val His Lys Arg Met Asn Val Pro Asn Asp Ile Ile Pro Thr Asn
165 170 175
Pro Cys Thr Gly Glu Leu Val Ser Gln Pro Pro Pro Tyr Pro Val Met
180 185 190
Pro Ile His Thr Met Ala Gln Asn Met Trp Cys Asn Pro Cys Glu Asn
195 200 205
Gly Tyr Gln Thr Ala Ala Gly Met Met Val Gln Glu Thr Asn Met Val
210 215 220
Cys Gln Asp Pro His Glu Phe Lys Phe Ser Ile Asp Ile Gly Glu Ile
225 230 235 240
Asp Arg Glu Arg Asn Leu Gly Ile Trp Ile Gly Phe Lys Val Gly Thr
245 250 255
Thr Glu Gly Met Ala Thr Leu Asp Ser Ile Glu Val Val Glu Val Gly
260 265 270
Pro Leu Thr Gly Asp Ala Leu Lys Arg Met Gln Lys Arg Glu Gln Lys
275 280 285
Trp Lys Lys Lys Trp Ala Glu Lys Gln Met Lys Ile Glu Arg Ala Val
290 295 300
Gln Ile Ala Arg Asn Ala Ile Gln Thr Leu Phe Thr Asp Pro Asn Gln
305 310 315 320
Asn Arg Leu Gln Ser Ala Ile Thr Leu Lys Asn Ile Val Asp Ala Glu
325 330 335
Lys Trp Val Gln Lys Ile Pro Tyr Val Tyr Asn Gln Phe Leu Gln Gly
340 345 350
Ala Ile Pro Glu Val Pro Gly Glu Gln Tyr Asn Val Phe Gln Gln Leu
355 360 365
Ser Gln Ala Val Val Thr Ala Arg Gly Leu Tyr Asn Gln Arg Asn Val
370 375 380
Ile Asn Asn Gly Asp Phe Ser Ala Gly Leu Ser Asn Trp Asn Gly Thr
385 390 395 400
Lys Gly Ala Asp Val Gln Gln Ile Gly Lys Glu Ser Val Leu Met Ile
405 410 415
Ser Asp Trp Ser Ala Asn Ile Ser Gln Gln Val Cys Val Glu Pro Glu
420 425 430
His Ser Tyr Leu Leu Arg Val Thr Ala Arg Lys Glu Gly Ser Gly Glu
435 440 445
Gly Tyr Val Thr Ile Ser Asp Gly Thr Lys Asp Asn Thr Glu Thr Leu
450 455 460
Lys Phe Ile Val Gly Glu Glu Thr Thr Gly Ala Thr Met Ser Thr Ile
465 470 475 480
Arg Ser His Ile Arg Glu Arg Tyr Asn Glu Arg Asn Met Val Thr Ser
485 490 495
Glu Val Tyr Asp Ala Ser Gly Tyr Ala Ser Asn Gln Asn Met Val Asn
500 505 510
Tyr Ser Ser Glu Asn Tyr Gly Met Ser Ala Tyr Ser Gly Asn Asn Asn
515 520 525
Lys Asn Tyr Gln Ser Glu Ser Phe Gly Phe Thr Pro Tyr Gly Asp Glu
530 535 540
Asn Ser Met Met Asn Tyr Pro Ser Glu Asn Tyr Gly Glu Asn Ala Tyr
545 550 555 560
Ser Gly Asn Asp Asn Met Asn Tyr Pro Ser Asn Asn Tyr Glu Met Asn
565 570 575
Pro Tyr Ser Ser Asp Met Asn Met Ser Met Asn Gln Gly Ser Asp Cys
580 585 590
Arg Cys Gly Cys Ser Thr Asn Ser Tyr Pro Gly Gly Asp Met Thr Met
595 600 605
Asn Asn Tyr Pro Ser Ser Met Tyr Glu Thr Asn Ala Tyr Pro Ser Ser
610 615 620
Thr Asn Met Thr Asp Asn Leu Gly Met Gly Cys Gly Cys Tyr Tyr Ser
625 630 635 640
Thr Asn Glu His Pro Met Val Glu Gln Ser Thr Leu Asp Leu Ser Asp
645 650 655
Tyr Val Met Lys Thr Val Glu Ile Phe Pro Glu Thr Asn Arg Val Cys
660 665 670
Ile Glu Ile Gly Glu Thr Ala Gly Ile Phe Met Ile Glu Ser Ile Glu
675 680 685
Phe Val Pro Val Asn Pro Ile Glu Ser Val Pro Glu Pro Gly Pro Gly
690 695 700
Ile Tyr Gln Ser Val Thr Ala Leu Asn Asn Ser Ser Val Val Glu Met
705 710 715 720
Ala Ser Gln Gly Ala Arg Asn Val Ile Lys Ala Leu Pro Gln Asn Ala
725 730 735
Ser Asn Ile Glu Leu Glu Tyr Ala Pro Val Tyr Asp Tyr Asp Thr Asp
740 745 750
Gly Cys Tyr Ala Thr Ala Ala Ile Ser Pro Asp Gly Thr Thr Asn Pro
755 760 765
Gly Leu Gly Met Gly Asp Ser Pro Ser Ser Gly Cys Arg Gly Pro Ala
770 775 780
Gln Leu Glu Asn Ser Asn Thr Tyr Ser Arg Ala Lys Ser Asn Asn Gly
785 790 795 800
Trp Thr Ala Ile Met Tyr Ala Ser Tyr Phe Glu Lys Asp Gln Thr Ser
805 810 815
Leu Gly Pro Gly Ser Ala Gly His Arg His Asp Trp Glu His Thr Ile
820 825 830
Val Trp Val Lys Asp Gly Gln Val Gln Tyr Val Thr Tyr Ser Ala His
835 840 845
Gly Asn Trp Tyr Thr Asn Pro Arg Ser Asn Val Arg Phe Ser Gly Asn
850 855 860
His Pro Lys Ile Val Tyr His Lys Asp Ser Ile Ser Thr His Ala Phe
865 870 875 880
Arg Leu Ala Asn Ser Asn Asp Glu Pro Pro Glu Asn Tyr Tyr His Gln
885 890 895
Trp Leu Leu Leu Pro Ile Val Gly Trp Tyr Gly Tyr Pro Ser Arg Ala
900 905 910
Ile Arg Glu Lys Leu Met Thr Thr Asn Phe Gly Ser Ala Thr Ile Glu
915 920 925
Ile Lys Asp Gly Asn Phe Glu Arg Ala Leu Glu Lys Ala Lys Pro Pro
930 935 940
Ile Asn Phe Asp Pro Tyr Ala Pro Glu Leu Glu Asp Gly Gly Ala Tyr
945 950 955 960
Gln Ile Val Ser Thr Leu Asn Asn Arg Ser Val Val Asp Met Asp Pro
965 970 975
Pro Ser Lys Asn Val His Leu Trp Glu Asn Gly Asn Ala Asn Asn Gln
980 985 990
Lys Trp Lys Leu Val Tyr Asp Ser Ile Lys Ser Ala Tyr Gln Met Lys
995 1000 1005
Asn Ile Ala Asn Glu Asn Leu Val Leu Thr Trp Asn Asp Leu Asn
1010 1015 1020
Gly Ser Ile Asn Val Ile Ala Thr Ser Asn Gln Asn Gln Glu Glu
1025 1030 1035
Gln Tyr Trp Ile Pro Thr Glu Ala Gly Asn Gly Tyr Tyr Tyr Val
1040 1045 1050
Arg Asn Lys Lys Asp Pro Asn Lys Val Leu Asp Val Ser Gly Tyr
1055 1060 1065
Gly Thr Ala Asn Gly Thr Asn Val Thr Val Tyr Asn Val His Gly
1070 1075 1080
Gly Asn Asn Gln Lys Phe Lys Leu Ser Asn Val Thr Gly Ile Leu
1085 1090 1095
Thr Arg Glu Val Glu Ser Leu Tyr Lys Ala Gln Pro Gly Gln Ser
1100 1105 1110
Ser Arg Ser Ser Asn Asn Phe Ser Leu Glu His Leu Ala Ala Gly
1115 1120 1125
Thr Lys Val Arg Val Ile Leu Ala Gly Glu Gly Ala Thr Ser Leu
1130 1135 1140
Ser Phe Asn Ile Ser Arg Asp Lys Ser Gly Thr Asp Ser Ser Ile
1145 1150 1155
Trp Ser Asn Val Arg Asp Ser Ser Val Leu Thr Ile Pro Ser Gly
1160 1165 1170
Asp Asp Arg Lys Asn Leu Tyr Ile Ser Gly Pro Pro Ser Gly Tyr
1175 1180 1185
Thr Ser Asn Gly Thr Phe Thr Val Lys Phe Tyr Ala Leu
1190 1195 1200
<210> 20
<211> 1146
<212> PRT
<213> 苏云金芽孢杆菌
<400> 20
Met Asn Gln Tyr Asn Asn Thr Asn Asn Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Lys Arg Ser Pro Gln Tyr Pro Leu Ala Asn Asn Pro Gln Asn Ser Ile
20 25 30
Lys Thr Thr Asn Tyr Lys Asp Trp Ile Asn Met Cys Glu Gly Asn Ala
35 40 45
Glu Ala Phe Phe Leu Thr Asp Glu Gln Met Val Ser Ile Val Gly Ala
50 55 60
Ala Ile Ser Lys Leu Leu Gly Phe Val Pro Val Val Gly Asp Ile Leu
65 70 75 80
Ser Phe Leu Ala Asp Thr Tyr Trp Pro Lys Ile Ala Gly Gln Glu Val
85 90 95
Asp Thr Arg Val Trp Ala Gly Leu Ile Arg His Thr Ala Asn Leu Ile
100 105 110
Asp Asn Arg Glu Ala Glu Lys Val Ile Gly Gln Ala Thr Thr Asn Leu
115 120 125
Met Ser Leu Tyr Gly Ala Leu Gly Val Tyr Asn Arg Phe Leu Glu Gln
130 135 140
Trp Lys Gln Asn Glu Lys Ser Phe Ala Asn Leu Ala Asp Glu Val Arg
145 150 155 160
Thr Gln Met Ser Ala Leu His Leu Leu Phe Thr Thr Lys Ile Ile Ser
165 170 175
Asp Phe Thr Leu His Gly Tyr Glu Ser Ile Leu Leu Pro Ser Tyr Ala
180 185 190
Ser Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ile Ala Ile Tyr
195 200 205
Gly Glu Arg Leu Gly Phe Asp Pro Lys Val Leu Gln Ala Tyr His Asp
210 215 220
Glu Gln Val Leu Phe Thr Arg Gln Tyr Thr Ala His Cys Ile Asn Thr
225 230 235 240
Tyr Asn Leu Thr Leu Asn Ala Gln Lys Pro Arg Gly Trp Val Ala Phe
245 250 255
Asn Gln Tyr Arg Arg Asp Met Thr Leu Thr Val Leu Asp Leu Ile Ala
260 265 270
Leu Phe Pro Ser Tyr Asp Thr His Lys Tyr Pro Val Asp Lys Lys Asn
275 280 285
Val Lys Lys Leu Ser Thr Thr Glu Phe Thr Arg Glu Ile Tyr Thr Ala
290 295 300
Leu Ile Glu Pro Asn Pro Asn Lys Thr Val Glu Gly Met Glu Ala Ser
305 310 315 320
Leu Thr Arg Thr Pro His Leu Phe Thr Trp Ile Lys Arg Leu Asp Phe
325 330 335
Tyr Thr Asn Thr Leu Tyr Pro Asp Leu Arg Tyr Leu Ser Ala Asn Arg
340 345 350
Ile Gly Phe Ser Tyr Thr Asn Ser Ser Thr Ile Gln Gln Ser Gly Ile
355 360 365
Tyr Gly Asp Ser Gly Phe Gly Ser Asn Leu Thr His Gln Leu Pro Ile
370 375 380
Asn Pro Asn Ile Phe Lys Ser Ser Ile Thr Asp Thr Arg Ser Pro Ser
385 390 395 400
Asn Gln Ile Thr Lys Met Asp Phe Tyr Lys Thr Asp Gly Thr Gln Ala
405 410 415
Ser Tyr Asn Ser Gly Ile Thr Pro Thr Pro Gly Asp Leu Arg Thr Thr
420 425 430
Phe Phe Gly Phe Ser Thr Asn Glu Asn Thr Pro Asn Gln Pro Ser Ile
435 440 445
Asn Asp Tyr Thr His Phe Leu Thr Tyr Met Lys Thr Asp Val Ile Ser
450 455 460
Gly Gly Ala Pro Lys Arg Val Ser Leu Ala Trp Ala His Lys Ser Val
465 470 475 480
Asn Leu Asn Asn Gln Ile Phe Thr Asp Asp Ile Thr Gln Val Pro Ala
485 490 495
Val Lys Ser Asn Val Leu Asn Thr Gln Ala Lys Val Ile Lys Gly Pro
500 505 510
Gly His Thr Gly Gly Asp Leu Val Ala Ile Thr Ser Asp Gly Val Leu
515 520 525
Ser Gly Arg Met Glu Ile Gln Cys Lys Ala Ser Val Phe Asn Glu Pro
530 535 540
Glu Arg Arg Tyr Gly Leu Arg Ile Arg Tyr Ala Ala Asn Ser Ile Leu
545 550 555 560
Thr Val Asn Ala Ser Tyr Thr Ser Gln Gly Asn Thr Arg Ser Ile Thr
565 570 575
Phe Thr Thr Glu Ser Thr Phe Thr Gly Asn Thr Ile Pro Thr Asp Leu
580 585 590
Lys Tyr Glu Asn Leu Lys Tyr Lys Glu Pro Phe Asp Ala Ile Leu Pro
595 600 605
Met Arg Leu Thr Ser Asn Glu Leu Thr Asn Ile Thr Ile Gln Pro Gln
610 615 620
Asn Met Ser Ser Asn Gln Leu Leu Ile Ile Asp Arg Ile Glu Phe Ile
625 630 635 640
Pro Ile Thr Ser Thr Val Leu Gly Asp Thr Glu Lys Gln Asn Leu Glu
645 650 655
Lys Val Gln Lys Ala Val Asn Asp Leu Phe Thr Asn Thr Ala Lys Asn
660 665 670
Ala Leu Lys Ala Glu Thr Thr Asp Tyr Glu Ile Asp Gln Thr Ala Asn
675 680 685
Ile Val Glu Cys Leu Ser Asp Glu His Ser Thr Lys Glu Lys Met Ile
690 695 700
Leu Leu Asp Glu Val Lys Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn
705 710 715 720
Val Leu Gln Asn Gly Asp Phe Glu Ser Asp Thr Leu Gly Trp Thr Thr
725 730 735
Ser Asn Asn Ile Thr Ile Gln Ala Asp Asn Pro Ile Phe Lys Gly Lys
740 745 750
Tyr Leu His Met Ser Gly Ala Arg Asp Ile Asp Gly Ser Val Phe Pro
755 760 765
Thr Tyr Ile Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Pro Tyr Thr
770 775 780
Arg Tyr Arg Val Arg Gly Phe Val Gly Ser Ser Lys Glu Leu Glu Leu
785 790 795 800
Val Val Ser Arg Tyr Gly Glu Glu Ile Asp Ala Ile Met Asn Val Pro
805 810 815
Asn Lys Leu Val Asp Met Tyr Pro Pro Ala Ser Asp Cys Gly Gly Leu
820 825 830
Asn Arg Cys Glu Ile Ser Ser Ala Leu Glu Ile Asn Gln Val Asp Tyr
835 840 845
Thr Asn Met Ser Tyr Pro Cys Gln Asn Asp Gly Asn Lys Lys His Val
850 855 860
Leu Cys His Asp Arg His Ser Tyr Asp Phe His Ile Asp Thr Gly Ser
865 870 875 880
Val Asp Leu Asn Glu Asn Ile Gly Ile Trp Val Leu Phe Lys Val Ser
885 890 895
Ser Pro Asp Gly Tyr Ala Thr Leu Asp Asn Leu Glu Val Val Glu Glu
900 905 910
Arg Ser Leu Asp Gly Glu Ala Leu Ala Arg Val Lys His Arg Glu Lys
915 920 925
Lys Trp Ile His Gln Ile Glu Val Lys Arg Tyr Glu Thr Gln Gln Ala
930 935 940
Tyr Asp Ala Thr Lys Gln Ala Met Asp Ala Leu Phe Thr Asn Asp Gln
945 950 955 960
Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu Ala Gln Ile Gln His Ala
965 970 975
Asp Asp Leu Val Gln Ser Ile Pro Tyr Val Tyr Asn Glu Trp Val Pro
980 985 990
Ser Ala Pro Gly Met Asn Tyr Asp Leu Tyr Val Glu Leu Glu Ala Arg
995 1000 1005
Val Val Lys Ala Arg Tyr Leu Tyr Asp Thr Arg Asn Val Ile Arg
1010 1015 1020
Asn Gly Asp Phe Ser Glu Gly Leu Gln Gly Trp His Val Thr Gly
1025 1030 1035
Asn Ala Lys Val Gln Gln Ile Asp Gly Val Ser Val Leu Val Leu
1040 1045 1050
Ser Asn Trp Ser Ala Gly Val Ala Gln Asn Met Tyr Val Gln His
1055 1060 1065
Asn His Gly Tyr Val Leu Arg Val Thr Ala Lys Lys Glu Gly His
1070 1075 1080
Gly Lys Gly Tyr Val Thr Leu Met Asp Cys Asp Gly Asn Gln Glu
1085 1090 1095
Thr Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr Val Thr Lys Thr
1100 1105 1110
Val Asp Val Phe Pro Asp Thr Asp Arg Val Arg Val Asp Ile Gly
1115 1120 1125
Glu Thr Glu Gly Pro Phe Tyr Ile Glu Ser Ile Glu Leu Ile Cys
1130 1135 1140
Met Asn Gly
1145
<210> 21
<211> 1173
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0264
<400> 21
Met Gly Gly Ile Asn Met Ser Pro Asn Tyr Ser Asp Asp Tyr Glu Ile
1 5 10 15
Ile Asn Ala Pro Ser Asn Thr Ser Pro Arg Tyr Pro Leu Val His Asp
20 25 30
Leu Thr Pro Gln Phe Gln Asp Met Asn Tyr Lys Asp Tyr Ile Arg Met
35 40 45
Thr Glu Gly Asn Arg Gly Val Ser Ala Thr Ser Val Arg Ser Gly Gly
50 55 60
Glu Ala Ile Asp Ala Ala Leu Ser Ile Thr Ala Ile Leu Leu Gly Val
65 70 75 80
Leu Gly His Pro Val Gly Ser Ala Val Val Gly Thr Phe Asn Ala Leu
85 90 95
Leu Gly Leu Leu Trp Pro Asn Gly Gln Thr Ile Val Trp Glu Asp Leu
100 105 110
Leu Ala Lys Ala Glu Asp Phe Ala Asn Lys Val Ile Thr Ala Glu Ile
115 120 125
Arg Ser Asn Ala Phe Ser Ala Leu Asn Val Ser Tyr Ala Met Val Ser
130 135 140
Glu Tyr Thr Ser Ala Leu Asn Asp Trp Ile Glu Asn Pro Gly Val Arg
145 150 155 160
Ile Ser Gln Gln Leu Met Arg Glu Ile Phe Thr Asn Thr Val Leu Gln
165 170 175
Leu Ala Ser Gln Met Pro Tyr Phe Asn Val Ala Gly Tyr Glu Thr Ser
180 185 190
Leu Leu Thr Met Tyr Ala Gln Ala Ala Asn Leu His Leu Ser Val Leu
195 200 205
Lys Asp Ile Phe Ile Phe Gly Lys Glu Trp Gly Phe Pro Gln Thr Asp
210 215 220
Ile Asp Phe Tyr Tyr Tyr Glu Glu Phe Ile Asp His Leu Pro Val Tyr
225 230 235 240
Val Asp His Cys Thr Lys Trp Tyr Asn Glu Gly Leu Asn Asn Leu Pro
245 250 255
Lys Ser Asn Ser Tyr Asp Trp Tyr Asn Tyr Asn Lys Phe Arg Arg Glu
260 265 270
Met Thr Leu Met Val Leu Asp Ile Val Ala Leu Phe Pro Ser Tyr Asp
275 280 285
Ala Tyr Val Tyr Thr Leu Glu Thr Thr Thr Glu Leu Thr Arg Ile Val
290 295 300
Tyr Thr Asp Pro Leu Gly Ile Met Ile Pro Pro Pro Pro Gly Tyr Glu
305 310 315 320
Glu Met Val Gly Tyr Gly Gly Asn Leu Asp Trp Arg Asn Tyr Gly Phe
325 330 335
Ser Phe Ser Tyr Leu Glu Ser Gln Leu Arg Gln Pro Val Leu Phe Ser
340 345 350
Trp Leu Asn Ser Ile Lys Met Tyr Thr Arg Lys Ile Ile Cys Glu Ala
355 360 365
Gly Thr Pro His Ser Leu Trp Ser Gly Asn Glu Ile Asn Leu Ser Tyr
370 375 380
Thr Ser Asp Pro Ser Asn Thr Phe Thr Leu Gln Ser Gly Tyr Ser Thr
385 390 395 400
Gly Tyr Thr His Thr Asp Phe Leu Asp Ile Asn Ser Lys Asp Ile Tyr
405 410 415
Glu Val Val Ser Lys Ile Gly Ser Glu Ala Val Val Gly Pro Gly Asp
420 425 430
Asp Ser Tyr Leu Tyr Gly Leu Tyr Gln Ala Ala Phe Arg Ile Ile Pro
435 440 445
Lys Asp Ser Ser Ala Tyr Ser Tyr Leu Tyr Pro Thr Tyr Asp Ile Gly
450 455 460
Met Asn Gly Tyr Ser Met Ser Ser Leu Val Glu Leu Pro Pro Glu Ser
465 470 475 480
Ser Asp Pro Pro Gln Pro Asp Glu Tyr Thr Tyr Thr His Arg Leu Ser
485 490 495
Tyr Ala Thr Leu Leu Ser Val His Ser Tyr Thr Ser Asp Phe Phe Asn
500 505 510
Asp Gly Ala Ile Pro Ile Tyr Gly Trp Thr His Arg Ser Val Asn Arg
515 520 525
Asp Asn Gln Ile Tyr Pro Asp Arg Ile Thr Gln Ile Pro Ala Val Lys
530 535 540
Gly Lys Gln Leu Ile Glu Gly Ala Ser Val His Lys Gly Pro Gly Ser
545 550 555 560
Thr Gly Gly Asp Leu Val Arg Leu Tyr Leu Asn Asp Arg Val Tyr Leu
565 570 575
Asn Val Asn Val Asp Ser Val Ser Gln Lys Tyr Arg Val Arg Val Arg
580 585 590
Cys Ala Thr Tyr Asn Pro Gly Ser Ile Tyr Leu Tyr Arg Asp Asn Thr
595 600 605
Ile Ile Ser Ser Ala Thr Ala Pro Lys Thr Thr Asp Thr Thr Asp Thr
610 615 620
Thr Gln Ile Lys Phe Asn Asp Phe Gln Tyr Ile Thr Phe Ser Asp Ile
625 630 635 640
Phe Thr Phe Thr Ser Thr Trp Gln Gln Ile Ser Ile Gly Ala Gly Thr
645 650 655
Thr Tyr Ala Glu Val Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Asn
660 665 670
Glu Thr Tyr Glu Ala Glu Arg Asn Leu Glu Asn Ala Lys Lys Ala Val
675 680 685
Ser Ala Leu Phe Thr Gly Thr Met Asp Thr Leu Lys Arg Glu Val Thr
690 695 700
Asp Tyr Gln Ile Asp Arg Ala Ser Asn Leu Ile Glu Cys Val Ser Asp
705 710 715 720
Glu Met Tyr Gly Asn Asp Lys Arg Leu Leu Phe Glu Ala Val Lys Thr
725 730 735
Ala Lys Arg Leu Ser Gln Ser Arg Asn Leu Leu Gln Asp Leu Asn Phe
740 745 750
Glu Met Leu Asn Thr Ser Gly Asn Gly Glu Asn Gly Trp Val Gly Ser
755 760 765
Thr Gly Ile Gln Val Val Glu Gly Asp Ala Leu Phe Lys Asn Arg Ser
770 775 780
Leu Arg Leu Pro Gly Ala Arg Gln Phe Asp Thr Glu Thr Tyr Pro Thr
785 790 795 800
Tyr Leu Tyr Gln Lys Ile Glu Glu Ser Lys Leu Lys Pro Tyr Thr Arg
805 810 815
Tyr Lys Val Arg Gly Phe Ile Lys Gly Ser Lys Asp Leu Glu Val Asp
820 825 830
Val Met Arg Tyr Gly Ala Lys Gln Lys Val Leu Asn Val Pro Asn Asn
835 840 845
Leu Asn Pro Asp Ile Ile Pro Ile Asn Ala Cys Gly Asp Val Asp Arg
850 855 860
Cys Arg Gln Gln Gln Ala Val Asn Ala Arg Leu Gln Pro Ala Thr Ile
865 870 875 880
Ser Pro Cys Glu Gly Gly Asp Thr Asn Thr Ser Ala His Ala Phe Ser
885 890 895
Phe Ser Ile Asp Thr Gly Ala Ile Asp Thr Ser Glu Arg Pro Gly Ile
900 905 910
Gly Val Ala Phe Lys Ile Ala Thr Pro Glu Gly Tyr Ala Ser Leu Gly
915 920 925
Asn Leu Glu Val Ile Glu Glu Gly Pro Leu Thr Gly Glu Ala Leu Ala
930 935 940
His Val Lys Gln Arg Glu Arg Gln Trp Lys Asp Lys Ile Thr Lys Lys
945 950 955 960
Arg Ala Glu Thr Glu Thr Ile Tyr Thr Arg Ala Lys Gln Ala Ile Asn
965 970 975
Asn Leu Phe Ala Asp Tyr Gln Asp Arg Gln Leu Lys His Asp Val Glu
980 985 990
Ile Pro Asn Ile Ile Ala Ala Asp Gln Ile Val Glu Ser Ile Arg Asp
995 1000 1005
Arg Tyr Asn Glu Trp Ile Pro Ala Ile Pro Gly Met Asn Tyr Glu
1010 1015 1020
Ile Tyr Thr Glu Leu Lys Asn Arg Ile Gln Arg Ala Tyr Ala Leu
1025 1030 1035
Tyr Asp Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Arg Asn Gly
1040 1045 1050
Leu Ala Asn Trp Asn Ala Thr Pro Gly Ala Arg Val Gln Gln Met
1055 1060 1065
Asn Gly Asn Pro Val Leu Val Ile Pro Asn Trp Asp Thr Gln Val
1070 1075 1080
Ser Gln Ser Val Pro Val Glu Pro Asn His Arg Tyr Leu Leu Arg
1085 1090 1095
Val Thr Ala Gln Lys Leu Gly Ala Gly Asn Gly Tyr Val Thr Val
1100 1105 1110
Thr Asp Gly Thr Asn His Thr Glu Thr Leu Thr Phe Asp Arg Cys
1115 1120 1125
Asp Asn Asn Thr Thr Gly Ser Asn Arg Tyr Val Thr Lys Thr Leu
1130 1135 1140
Glu Phe Thr Pro Arg Thr Asn Gln Leu Gln Val Glu Ile Gly Glu
1145 1150 1155
Thr Glu Gly Thr Phe Asn Ile Glu Ser Val Asn Leu Leu Gly Cys
1160 1165 1170
<210> 22
<211> 1190
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0288
<400> 22
Met Thr Gln Asn Asn Asn Glu Tyr Glu Ile Ile Asp Gln Asn Thr Ser
1 5 10 15
Pro Tyr Ser Ser Asn Arg Asn Asn Asn Asn Ser Arg Tyr Pro Phe Ala
20 25 30
Asn Asn Pro Asn Gln Ala Leu Gln Gln Thr Asn Tyr Lys Asp Trp Leu
35 40 45
Asn Met Cys Gln Lys Asn Gln Gln Cys Gly Glu Asn Leu Glu Thr Phe
50 55 60
Ala Ser Ala Asp Thr Ile Ala Ala Val Ser Ala Gly Val Ile Val Val
65 70 75 80
Gly Thr Met Leu Gly Ala Phe Gly Ala Pro Val Thr Thr Gly Leu Ile
85 90 95
Ile Ser Phe Gly Thr Leu Leu Pro Ile Phe Trp Gly Pro Ser Glu Asp
100 105 110
Pro Lys Lys Val Trp Lys Glu Phe Leu Thr Ile Gly Asn Arg Pro Phe
115 120 125
Gly Ser Glu Val Asp Gln Gly Ile Ile Asp Leu Leu Tyr Thr Lys Val
130 135 140
Asn Gly Leu Arg Ser Gln Phe Glu Asp Phe Gln Arg Tyr Phe Asp Leu
145 150 155 160
Trp Lys Asn Asn Lys Asn Pro Val Asn Ala Asp Val Val Arg Gln Lys
165 170 175
Phe Leu Ser Leu Asp Ser Asp Val Ile Arg Glu Leu Glu Thr Leu Lys
180 185 190
Gly Asn Tyr Tyr Ile Thr Leu Leu Pro Gly Tyr Thr Gln Val Ala Asn
195 200 205
Trp His Leu Asn Leu Leu Arg Gln Ala Ala Tyr Tyr Tyr Asp Glu Trp
210 215 220
Ala Pro Ser Ser Asn Leu Ser Ile Gln Ser Ile Tyr Pro Gln Asp Tyr
225 230 235 240
Thr Asn Asp Leu Gln Thr Cys Leu Asp Asn Cys Pro Ser Glu Ser Gly
245 250 255
Asn Lys Val Ser Ser Ala Tyr Tyr Lys Cys Ile Leu Lys Cys Arg Ile
260 265 270
Asn Glu Tyr Ile Asn Tyr Cys Ser Lys Thr Tyr Gln Glu Gly Leu Asn
275 280 285
Lys Leu Lys Asn Ser Ser Asp Ile Lys Trp Asn Ile Tyr Asn Glu Tyr
290 295 300
Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile Ala Ala Phe Pro
305 310 315 320
Asn Tyr Asp Leu Glu Lys Tyr Pro Ile Gly Thr Lys Cys Glu Leu Thr
325 330 335
Arg Glu Val Tyr Thr Asn Ala Leu Met Gly Ser Ser Ser Met Ser Ile
340 345 350
Ala Glu Leu Glu Lys Ser Leu Thr Lys Asp Pro Phe Leu Ile Thr Trp
355 360 365
Leu Asn Lys Ile Leu Leu Tyr Thr Arg Asn Tyr Lys Gln Pro Thr Thr
370 375 380
Glu Asp Val Phe Val Phe Thr Gly Asn Gln Leu Arg Tyr Ser Phe Thr
385 390 395 400
Met Asp Ser Asn Leu Gly Tyr Ser Gly Phe Tyr Gly Asp Val Ser Tyr
405 410 415
Thr Asp Asp Thr Glu Gln Ile Leu Glu Ile Pro Gly Asn Ser Gln Ile
420 425 430
Val Lys Val Glu Val Glu Arg His Arg Asp Ser Pro Asp Ile Ile Trp
435 440 445
Lys Ile Asp Phe His Leu Asn Asn Gly Ala Val Leu Lys Tyr Asn Ser
450 455 460
Gly Ser Thr Ala Asp Pro Asn Phe Arg Val Arg Asp Val Leu Thr Ile
465 470 475 480
Pro Pro Asp Ser Lys Gly Asn Ala Ser His Phe Leu Ser Tyr Met Lys
485 490 495
Ser Ala Tyr Val Thr Ser Asp Val Lys Gln Leu Arg Arg Val Ser Phe
500 505 510
Ala Trp Thr His Asn Ser Ile Asn Tyr Asn Asn Glu Ile Tyr Asn Asp
515 520 525
Ile Ile Thr Gln Ile Ala Ala Val Lys Gly His Tyr Leu Gly Leu Glu
530 535 540
Gly Leu Ala Ser Arg Val Ile Gln Gly Pro Gly His Thr Gly Gly Asp
545 550 555 560
Leu Val Asp Leu Lys Asp Asp Leu Arg Leu Ala Cys Gln His Ser Gly
565 570 575
Thr Gln Gln Ser Tyr Tyr Ile Arg Ile Arg Tyr Ala Ser Asp Gly Asp
580 585 590
Thr Arg Ile Val Leu Val Ile Pro Leu Met Glu Ser Gln Asn Ile Pro
595 600 605
Leu Lys Ser Thr Phe Ser Gly Val Asn His Asp Glu Leu Lys Tyr Lys
610 615 620
Asp Phe Gly Tyr Val Gln Phe Pro Gly Glu Ile Thr Leu Asn Gln His
625 630 635 640
Ser Lys Ile Thr Leu Ile Phe Arg Leu Gln Asp Ile Tyr Ser Asn Ile
645 650 655
Ser Val Phe Ile Asp Lys Ile Glu Phe Ile Pro Ile Thr Ser Ser Ile
660 665 670
Arg Glu Asn Arg Glu Lys Tyr Gln Leu Glu Lys Ala Lys Arg Ala Val
675 680 685
Asp Asp Leu Phe Ile Ser Ala Lys Lys Gln Asn Ile Lys Ile Asp Ile
690 695 700
Thr Asp Tyr Gln Ile Asp Gln Thr Ala Asn Leu Val Asp Ser Leu Ser
705 710 715 720
Glu Glu Pro Tyr Pro Gln Glu Lys Met Met Leu Leu Asn Gln Ile Lys
725 730 735
Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn Leu Leu Ser Asn Gly Asp
740 745 750
Phe Glu Ser Leu Ile Gly Trp Thr Thr Ser Ser Ser Ile Thr Val Gln
755 760 765
Thr Gly Asn Thr Ile Phe Lys Gly Phe Ser Leu His Met Leu Gly Ala
770 775 780
Arg Thr Thr Glu Ile Asn Ala Thr Val Phe Pro Thr Tyr Val Tyr Gln
785 790 795 800
Lys Ile Asp Glu Ser Arg Leu Lys Pro Tyr Thr Arg Tyr Ile Val Arg
805 810 815
Gly Phe Ile Gly Ser Ser Lys Gly Leu Gly Ile Phe Val Thr Arg Tyr
820 825 830
Asn Asn Val Pro Asp Lys Leu Ala Tyr Ile Arg Ser Thr Asn Ser Cys
835 840 845
Gly Glu Leu Asn Gln Tyr Glu Ser Gln Asn Tyr Ser Leu Val Ser Glu
850 855 860
Asn Asn Ser Thr Met Ser Leu Gln Asn Ile Thr Ala Ser Asn Asp Thr
865 870 875 880
Ser Cys Leu Ser Glu Asn Leu Arg Tyr Cys Glu Pro Asn Gln Leu Tyr
885 890 895
Pro Thr Cys His Asn Leu His Asp Phe Ser Phe Ser Ile Asp Thr Gly
900 905 910
Glu Leu Asp Phe Asn Glu Asn Pro Gly Ile Trp Ile Leu Phe Lys Ile
915 920 925
Ser Asn Pro Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Val Ile Glu
930 935 940
Glu Lys Thr Leu Val Gly Glu Glu Ile Asn Asn Val Lys Glu Lys Gly
945 950 955 960
Lys Arg Trp Lys Lys Glu Met Asp Thr Lys Gln Thr Lys Thr Glu Thr
965 970 975
Ala Phe Ser Gln Ala Gln Gln Ala Val Asn Gly Leu Phe Met Asn Thr
980 985 990
Gln Tyr Ser Met Leu Lys Ile Glu Thr Thr Met Gln Asp Ile Val Thr
995 1000 1005
Ala Asp Asn Leu Ile Asn Glu Ile Pro Tyr Val Tyr Asp Glu Leu
1010 1015 1020
Leu Pro Asn Glu Pro Ala Gly Arg Asn Tyr Asn Met Phe Ile Glu
1025 1030 1035
Leu Lys Asn Gln Ile Ser Gln Val Tyr Ser Leu Tyr Asn Ala Arg
1040 1045 1050
Asn Ile Ile Gln Asn Gly Asn Phe Asn Asn Gly Leu Lys Asn Trp
1055 1060 1065
His Thr Ser Pro Asp Ala Lys Val Gln Lys Ile Asp Asn Thr Ser
1070 1075 1080
Val Leu Val Ile Pro Asn Trp Ser Thr Gln Val Ser Gln His Thr
1085 1090 1095
Asn Leu Gln Gln Asn Gln Arg Tyr Leu Leu Arg Val Thr Ala Lys
1100 1105 1110
Lys Glu Gly Met Gly Asn Gly Tyr Val Lys Val Ser Asp Cys Ala
1115 1120 1125
Asn Asn Val Glu Thr Ile Thr Phe Lys Ser Ser Asp Ile Thr Asn
1130 1135 1140
Asn Asn Met Trp Asn Glu Ser Ile Gly Tyr Met Thr Lys Thr Met
1145 1150 1155
Tyr Ile Thr Pro His Thr Ser Gln Val Arg Ile Asp Ile Gly Glu
1160 1165 1170
Thr Glu Gly Asn Phe Lys Ile Asn Ser Ile Glu Leu Ile Cys Ile
1175 1180 1185
Lys Asn
1190
<210> 23
<211> 1192
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0302
<400> 23
Met Ser Ser Gly Gly Thr Asn Met Asn Ser Asn Arg Asn Lys Asn Glu
1 5 10 15
Tyr Glu Ile Leu Asp Ala Ser Ser Ser Thr Ser Asn Met Thr Asn Gln
20 25 30
Tyr Ser Arg Tyr Pro Leu Ala Asn Asn Pro Gln Ala Phe Met Arg Asn
35 40 45
Thr Asn Tyr Lys Asp Trp Ile Ala Met Cys Glu Arg Asn Asp Thr Gly
50 55 60
Val Leu Glu Asn Pro Glu Val Leu Ser Leu Arg Gly Ala Val Gly Thr
65 70 75 80
Gly Val Ser Ile Val Gly Met Ile Phe Ser Leu Ile Gly Ile Pro Val
85 90 95
Ile Gly Glu Val Val Gly Ile Leu Val Ser Leu Thr Asn Leu Leu Trp
100 105 110
Pro Glu Ser Glu Gly Ser Ala Gln Tyr Thr Trp Gln Glu Leu Ile Thr
115 120 125
His Val Glu Glu Leu Met Asp Gln Arg Ile Gly Glu Thr Gln Lys Ala
130 135 140
Asn Ala Leu Ala Lys Leu Ser Gly Leu Lys Ala Gln Val Ala Ala Tyr
145 150 155 160
Asn Arg Ala Leu Glu Asp Trp Glu Lys Asn Pro Asn Ser Arg Ser Ala
165 170 175
Ser Glu Val Ile Ala Arg Phe Arg Ser Thr Asn Asn Asp Phe Val Gly
180 185 190
Ser Met Pro Gln Phe Ser Pro Asn Gly Tyr Glu Ile Leu Leu Leu Ser
195 200 205
Val Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Ile Arg Asp Ala
210 215 220
Thr Ile Tyr Gly Ser Gln Trp Gly Leu Ser Gln Gly Asp Val Asn Leu
225 230 235 240
Tyr Tyr Asn Glu Gln Leu Leu Tyr Thr Lys Gln Tyr Val Asn His Cys
245 250 255
Val Thr Trp Tyr Asn Asn Gly Leu Ala Gln Gln Lys Ala Leu Phe Ala
260 265 270
Thr Ser Pro Asn Trp Asn Arg Phe Asn Ala Tyr Arg Arg Asp Met Thr
275 280 285
Ile Asn Val Leu Asp Leu Ile Ala Leu Phe Pro Ile Tyr Asp Ala Arg
290 295 300
Leu Tyr Pro Gln Pro Val Arg Ala Glu Leu Thr Arg Glu Ile Tyr Ser
305 310 315 320
Asn Ile Leu Asn Ser Asp Val Tyr Gly Val Gln Trp Ala Asp Phe Glu
325 330 335
Lys Asn Glu Ser Thr Phe Thr Arg Pro Pro His Leu Phe Thr Trp Leu
340 345 350
Arg Lys Phe Asp Phe Tyr Thr Arg Thr Lys Tyr Tyr Asn Gln Gly Leu
355 360 365
Gly Trp Leu Phe Leu Gly Gly His Thr Asn Tyr Tyr Ser Tyr Thr Asn
370 375 380
Ser Ser Asn Leu Lys Ser Gly Ser Tyr Asn Asn Phe Trp Gly Ser Asp
385 390 395 400
Met Gln Thr Ser Thr Leu Thr Ile Pro Asp Asn Pro Ser Ile Tyr Arg
405 410 415
Leu Trp Thr Lys Ser Tyr Thr His Ile Tyr Pro Tyr Thr Asp Pro Val
420 425 430
Asn Ile Thr Gln Met Gln Phe Tyr Leu Thr Asn Asn Gln Gln Leu Thr
435 440 445
Tyr Thr Ala Thr Ala Asn Pro Arg Tyr Pro Val Arg Glu Thr Asn Phe
450 455 460
Glu Leu Pro Ser Thr Asp Glu Asn Pro Leu Thr Tyr Gln Asn Tyr Ser
465 470 475 480
His Ile Leu Ser Tyr Met Ile Ser Ser Gln His Phe Gly Asp Lys Arg
485 490 495
Ser Gly Tyr Thr Phe Ala Trp Thr His Asn Ser Val Asp Pro Thr Asn
500 505 510
Thr Leu Ala Pro Asn Lys Ile Thr Gln Ile Pro Ala Val Lys Ala Asn
515 520 525
Thr Leu Glu Gly Asn Lys Ser Phe Val Val Lys Gly Pro Asn His Thr
530 535 540
Gly Gly Asp Leu Val Ile Leu Glu Ala Glu Pro Gly Pro Val Tyr Pro
545 550 555 560
Ile Val Tyr Arg Gly Val Met Gly Ile Thr Cys Lys Val Thr Gln Ala
565 570 575
Gln Asn Tyr Arg Ile Arg Ile Arg Tyr Ala Ser Asn Gly Gly Ala Gln
580 585 590
Met Ala Ile Ser Leu Arg Asn Arg Gly Thr Gly Thr Val Phe Thr Val
595 600 605
Ser Lys Thr Tyr Thr Gly Asn Ser Ile Glu Asn Leu Gln Tyr Asn Asp
610 615 620
Phe Gln Tyr Lys Asp Met Pro Val Ile Leu Glu Ala Ser Gln Tyr Glu
625 630 635 640
Pro Asn Asn Ser Ile Tyr Val Tyr Leu Tyr Gln Glu Ser Pro Tyr Ile
645 650 655
Gln Val Ile Ile Asp Lys Ile Glu Phe Ile Pro Ile Asp Thr Thr Ser
660 665 670
Gln Glu Tyr Glu Glu Lys His Gln Leu Glu Lys Ala Lys Lys Ala Val
675 680 685
Gly Val Leu Phe Thr Asn Asp Ala Lys Lys Ala Leu Lys Ile Asp Thr
690 695 700
Thr Asp Tyr Asp Val Asp Gln Ala Ala Asn Leu Ile Glu Cys Leu Ser
705 710 715 720
Asp Glu Gln Tyr Ala Lys Glu Lys Met Ile Leu Leu Asp Glu Val Lys
725 730 735
Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn Leu Leu Gln Asn Gly Asp
740 745 750
Phe Glu Ser Ser Glu Ile Gly Trp Glu Thr Ser Asn Thr Ile Thr Ile
755 760 765
Gln Ala Gly Asn Leu Ile Phe Lys Gly Lys Tyr Leu Asn Met Ser Gly
770 775 780
Ala Arg Asn Ile Asp Gly Ala Ile Phe Pro Thr Tyr Ala Phe Gln Lys
785 790 795 800
Val Asp Glu Ser Arg Leu Lys Pro Tyr Thr Arg Tyr Lys Val Arg Gly
805 810 815
Phe Val Gly Ser Ser Lys Asp Val Glu Val Val Val Thr Arg Tyr Gly
820 825 830
Glu Glu Val Asp Thr Ile Met Asn Val Pro Asn Asp Leu Thr Tyr Asp
835 840 845
Val Gly Ser Val Lys Ser Cys Gly Glu Trp Asn Arg Cys Glu Gln Gln
850 855 860
Pro Tyr Gln Asn Arg Asn Gln Val Leu Asn Asn Ser Met Ile Ile Ala
865 870 875 880
Asn Thr Ser Asn Ala Ser Asn Ser Cys Glu Tyr Val Pro Glu Lys Lys
885 890 895
Arg Val Met Cys Pro Glu Pro His Gln Phe Ser Phe His Val Asp Thr
900 905 910
Gly Glu Thr Asn Leu Asn Glu Asn Leu Gly Ile Ser Val Leu Phe Lys
915 920 925
Ile Ser Ser Pro Glu Gly Tyr Ala Ile Leu Asp Asn Ile Glu Leu Ile
930 935 940
Glu Glu Gly Ser Leu Val Gly Glu Ser Leu Ala Tyr Val Gln Asn Arg
945 950 955 960
Glu Lys Arg Trp Lys Asn Lys Met Gln Ala Glu Arg Met Glu Thr Gln
965 970 975
Gln Ala Tyr Asn Ile Ala Lys Gln Val Val Asp Ile Leu Phe Thr Asp
980 985 990
Pro Gln Asp Thr Ala Leu Arg Phe Glu Thr Asn Lys Ser Asn Ile Ile
995 1000 1005
Ser Ala Asp Glu Leu Val Gln Ser Ile Pro Tyr Ile Tyr Asn Asp
1010 1015 1020
Trp Leu Arg Asp Val Pro Gly Met Asn Tyr Asn Met Phe Thr Glu
1025 1030 1035
Leu Lys Gly Arg Ile Thr Gln Ala Tyr Tyr Leu Tyr Asp Asp Arg
1040 1045 1050
Asn Val Leu Gln Asn Gly Asp Phe Asn Asn Gly Leu Thr Ser Trp
1055 1060 1065
Tyr Val Thr Gly Asn Ala Glu Val Gln Gln Ile Asp Gly Thr Phe
1070 1075 1080
Val Leu Val Leu Gln Asn Trp Ser Thr Thr Val Ser Gln Asn Val
1085 1090 1095
Cys Leu Gln His Asn Arg Gly Tyr Val Leu Arg Val Thr Ala Arg
1100 1105 1110
Lys Glu Gly Met Gly Asn Gly Tyr Val Thr Met Ser Asp Cys Ala
1115 1120 1125
Asn His Ile Glu Lys Ile Ile Phe Thr Ser Cys Asp Asn Asn Leu
1130 1135 1140
Val Val Thr Ser Thr Asp Ser Ala Glu Tyr Val Thr Arg Thr Val
1145 1150 1155
Ser Phe Phe Pro Asp Thr Asp His Val Arg Ile Glu Ile Gly Glu
1160 1165 1170
Thr Glu Gly Thr Phe Lys Val Glu Ser Val Glu Leu Ile Cys Met
1175 1180 1185
Glu Gly Lys Glu
1190
<210> 24
<211> 1201
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0454
<400> 24
Met Asn Gln Asn Ile Ala Ala Val Arg Glu Ala Val Asn Ala Leu Phe
1 5 10 15
Ser Asn His Thr Leu Gln Leu Lys Val Thr Asp Tyr His Val Asp Gln
20 25 30
Val Ala Lys Leu Val Glu Cys Ile Ser Asp Gln Asn His Ser Lys Glu
35 40 45
Lys Met Cys Leu Leu Asp Gln Val Lys Ile Ala Lys Arg Leu Ser Arg
50 55 60
Glu Arg Asn Leu Leu Asn Tyr Gly Asp Phe Glu Ser Ser Asn Trp Ala
65 70 75 80
Gly Ala Asp Gly Trp Asn Ile Ser Ala His Val Tyr Thr Ile Ala Asp
85 90 95
Asn Leu Ile Phe Lys Asp His Tyr Leu Asn Met Pro Ser Val Asn Asn
100 105 110
Pro Ile Leu Ser Asp Lys Ile Phe Pro Thr Tyr Ala Tyr Gln Lys Ile
115 120 125
Glu Glu Ser Lys Leu Lys Pro Tyr Thr Arg Tyr Met Val Arg Gly Phe
130 135 140
Val Gly Ser Ser Lys Asp Leu Glu Ile Leu Val Ala Arg His Gly Lys
145 150 155 160
Glu Val His Lys Arg Met Asn Val Pro Asn Asp Ile Ile Pro Thr Asn
165 170 175
Pro Cys Thr Gly Glu Leu Val Ser Gln Pro Pro Pro Tyr Pro Val Met
180 185 190
Pro Ile His Thr Met Ala Gln Asn Met Trp Cys Asn Pro Cys Glu Asn
195 200 205
Gly Tyr Gln Thr Ala Ala Gly Met Met Val Gln Glu Thr Asn Met Val
210 215 220
Cys Gln Asp Pro His Glu Phe Lys Phe Ser Ile Asp Ile Gly Glu Ile
225 230 235 240
Asp Arg Glu Arg Asn Leu Gly Ile Trp Ile Gly Phe Lys Val Gly Thr
245 250 255
Thr Glu Gly Met Ala Thr Leu Asp Ser Ile Glu Val Val Glu Val Gly
260 265 270
Pro Leu Thr Gly Asp Ala Leu Lys Arg Met Gln Lys Arg Glu Gln Lys
275 280 285
Trp Lys Lys Lys Trp Ala Glu Lys Gln Met Lys Ile Glu Arg Ala Val
290 295 300
Gln Ile Ala Arg Asn Ala Ile Gln Thr Leu Phe Thr Asp Pro Asn Gln
305 310 315 320
Asn Arg Leu Gln Ser Ala Ile Thr Leu Lys Asn Ile Val Asp Ala Glu
325 330 335
Lys Trp Val Gln Lys Ile Pro Tyr Val Tyr Asn Gln Phe Leu Gln Gly
340 345 350
Ala Ile Pro Glu Val Pro Gly Glu Gln Tyr Asn Val Phe Gln Gln Leu
355 360 365
Ser Gln Ala Val Val Thr Ala Arg Gly Leu Tyr Asn Gln Arg Asn Val
370 375 380
Ile Asn Asn Gly Asp Phe Ser Ala Gly Leu Ser Asn Trp Asn Gly Thr
385 390 395 400
Lys Gly Ala Asp Val Gln Gln Ile Gly Lys Glu Ser Val Leu Met Ile
405 410 415
Ser Asp Trp Ser Ala Asn Ile Ser Gln Gln Val Cys Val Glu Pro Glu
420 425 430
His Ser Tyr Leu Leu Arg Val Thr Ala Arg Lys Glu Gly Ser Gly Glu
435 440 445
Gly Tyr Val Thr Ile Ser Asp Gly Thr Lys Asp Asn Thr Glu Thr Leu
450 455 460
Lys Phe Ile Val Gly Glu Glu Thr Thr Gly Ala Thr Met Ser Thr Ile
465 470 475 480
Arg Ser His Ile Arg Glu Arg Tyr Asn Glu Arg Asn Met Val Thr Ser
485 490 495
Glu Val Tyr Asp Ala Ser Gly Tyr Ala Ser Asn Gln Asn Met Val Asn
500 505 510
Tyr Ser Ser Glu Asn Tyr Gly Met Ser Ala Tyr Ser Gly Asn Asn Asn
515 520 525
Lys Asn Tyr Gln Ser Glu Ser Phe Gly Phe Thr Pro Tyr Gly Asp Glu
530 535 540
Asn Ser Met Met Asn Tyr Pro Ser Glu Asn Tyr Gly Glu Asn Ala Tyr
545 550 555 560
Ser Gly Asn Asp Asn Met Asn Tyr Pro Ser Asn Asn Tyr Glu Met Asn
565 570 575
Pro Tyr Ser Ser Asp Met Asn Met Ser Met Asn Gln Gly Ser Asp Cys
580 585 590
Arg Cys Gly Cys Ser Thr Asn Ser Tyr Pro Gly Gly Asp Met Thr Met
595 600 605
Asn Asn Tyr Pro Ser Ser Met Tyr Glu Thr Asn Ala Tyr Pro Ser Ser
610 615 620
Thr Asn Met Thr Asp Asn Leu Gly Met Gly Cys Gly Cys Tyr Tyr Ser
625 630 635 640
Thr Asn Glu His Pro Met Val Glu Gln Ser Thr Leu Asp Leu Ser Asp
645 650 655
Tyr Val Met Lys Thr Val Glu Ile Phe Pro Glu Thr Asn Arg Val Cys
660 665 670
Ile Glu Ile Gly Glu Thr Ala Gly Ile Phe Met Ile Glu Ser Ile Glu
675 680 685
Phe Val Pro Val Asn Pro Ile Glu Ser Val Pro Glu Pro Gly Pro Gly
690 695 700
Ile Tyr Gln Ser Val Thr Ala Leu Asn Asn Ser Ser Val Val Glu Met
705 710 715 720
Ala Ser Gln Gly Ala Arg Asn Val Ile Lys Ala Leu Pro Gln Asn Ala
725 730 735
Ser Asn Ile Glu Leu Glu Tyr Ala Pro Val Tyr Asp Tyr Asp Thr Asp
740 745 750
Gly Cys Tyr Ala Thr Ala Ala Ile Ser Pro Asp Gly Thr Thr Asn Pro
755 760 765
Gly Leu Gly Met Gly Asp Ser Pro Ser Ser Gly Cys Arg Gly Pro Ala
770 775 780
Gln Leu Glu Asn Ser Asn Thr Tyr Ser Arg Ala Lys Ser Asn Asn Gly
785 790 795 800
Trp Thr Ala Ile Met Tyr Ala Ser Tyr Phe Glu Lys Asp Gln Thr Ser
805 810 815
Leu Gly Pro Gly Ser Ala Gly His Arg His Asp Trp Glu His Thr Ile
820 825 830
Val Trp Val Lys Asp Gly Gln Val Gln Tyr Val Thr Tyr Ser Ala His
835 840 845
Gly Asn Trp Tyr Thr Asn Pro Arg Ser Asn Val Arg Phe Ser Gly Asn
850 855 860
His Pro Lys Ile Val Tyr His Lys Asp Ser Ile Ser Thr His Ala Phe
865 870 875 880
Arg Leu Ala Asn Ser Asn Asp Glu Pro Pro Glu Asn Tyr Tyr His Gln
885 890 895
Trp Leu Leu Leu Pro Ile Val Gly Trp Tyr Gly Tyr Pro Ser Arg Ala
900 905 910
Ile Arg Glu Lys Leu Met Thr Thr Asn Phe Gly Ser Ala Thr Ile Glu
915 920 925
Ile Lys Asp Gly Asn Phe Glu Arg Ala Leu Glu Lys Ala Lys Pro Pro
930 935 940
Ile Asn Phe Asp Pro Tyr Ala Pro Glu Leu Glu Asp Gly Gly Ala Tyr
945 950 955 960
Gln Ile Val Ser Thr Leu Asn Asn Arg Ser Val Val Asp Met Asp Pro
965 970 975
Pro Ser Lys Asn Val His Leu Trp Glu Asn Gly Asn Ala Asn Asn Gln
980 985 990
Lys Trp Lys Leu Val Tyr Asp Ser Ile Lys Ser Ala Tyr Gln Met Lys
995 1000 1005
Asn Ile Ala Asn Glu Asn Leu Val Leu Thr Trp Asn Asp Leu Asn
1010 1015 1020
Gly Ser Ile Asn Val Ile Ala Thr Ser Asn Gln Asn Gln Glu Glu
1025 1030 1035
Gln Tyr Trp Ile Pro Thr Glu Ala Gly Asn Gly Tyr Tyr Tyr Val
1040 1045 1050
Arg Asn Lys Lys Asp Pro Asn Lys Val Leu Asp Val Ser Gly Tyr
1055 1060 1065
Gly Thr Ala Asn Gly Thr Asn Val Thr Val Tyr Asn Val His Gly
1070 1075 1080
Gly Asn Asn Gln Lys Phe Lys Leu Ser Asn Val Thr Gly Ile Leu
1085 1090 1095
Thr Arg Glu Val Glu Ser Leu Tyr Lys Ala Gln Pro Gly Gln Ser
1100 1105 1110
Ser Arg Ser Ser Asn Asn Phe Ser Leu Glu His Leu Ala Ala Gly
1115 1120 1125
Thr Lys Val Arg Val Ile Leu Ala Gly Glu Gly Ala Thr Ser Leu
1130 1135 1140
Ser Phe Asn Ile Ser Arg Asp Lys Ser Gly Thr Asp Ser Ser Ile
1145 1150 1155
Trp Ser Asn Val Arg Asp Ser Ser Val Leu Thr Leu Pro Ser Gly
1160 1165 1170
Asp Asp Arg Lys Asn Leu Tyr Ile Ser Gly Pro Pro Ser Gly Tyr
1175 1180 1185
Thr Ser Asn Gly Thr Phe Thr Val Lys Phe Tyr Ala Leu
1190 1195 1200
<210> 25
<211> 1146
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0485
<400> 25
Met Asn Gln Tyr Asn Asn Thr Asn Asn Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Lys Arg Ser Pro Gln Tyr Pro Leu Ala Asn Asn Pro Gln Asn Ser Ile
20 25 30
Lys Thr Thr Asn Tyr Lys Asp Trp Ile Asn Met Cys Glu Gly Asn Ala
35 40 45
Glu Ala Phe Phe Ile Thr Asp Glu Gln Met Val Ser Ile Val Gly Ala
50 55 60
Ala Ile Ser Lys Leu Leu Gly Phe Val Pro Val Val Gly Asp Ile Leu
65 70 75 80
Ser Phe Leu Ala Asp Thr Tyr Trp Pro Lys Ile Ala Gly Gln Glu Val
85 90 95
Asp Thr Arg Val Trp Ala Gly Leu Ile Arg His Thr Ala Asn Leu Ile
100 105 110
Asp Asn Arg Glu Ala Glu Lys Val Ile Gly Gln Ala Thr Thr Asn Leu
115 120 125
Met Ser Leu Tyr Gly Ala Leu Gly Val Tyr Asn Arg Phe Leu Glu Gln
130 135 140
Trp Lys Gln Asn Glu Lys Ser Phe Ala Asn Leu Ala Asp Glu Val Arg
145 150 155 160
Thr Gln Met Ser Ala Leu His Leu Leu Phe Thr Thr Lys Ile Ile Ser
165 170 175
Asp Phe Thr Leu His Gly Tyr Glu Ser Ile Leu Leu Pro Ser Tyr Ala
180 185 190
Ser Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ile Ala Ile Tyr
195 200 205
Gly Glu Arg Leu Gly Phe Asp Pro Lys Val Leu Gln Ala Tyr His Asp
210 215 220
Glu Gln Val Leu Phe Thr Arg Gln Tyr Thr Ala His Cys Ile Asn Thr
225 230 235 240
Tyr Asn Leu Thr Leu Asn Ala Gln Lys Pro Arg Gly Trp Val Ala Phe
245 250 255
Asn Gln Tyr Arg Arg Asp Met Thr Leu Thr Val Leu Asp Leu Ile Ala
260 265 270
Leu Phe Pro Ser Tyr Asp Thr His Lys Tyr Pro Val Asp Lys Lys Asn
275 280 285
Val Lys Lys Leu Ser Thr Thr Glu Phe Thr Arg Glu Ile Tyr Thr Ala
290 295 300
Leu Ile Glu Pro Asn Pro Asn Lys Thr Val Glu Gly Met Glu Ala Ser
305 310 315 320
Leu Thr Arg Thr Pro His Leu Phe Thr Trp Ile Lys Arg Leu Asp Phe
325 330 335
Tyr Thr Asn Thr Leu Tyr Pro Asp Leu Arg Tyr Leu Ser Ala Asn Arg
340 345 350
Ile Gly Phe Ser Tyr Thr Asn Ser Ser Thr Ile Gln Gln Ser Gly Ile
355 360 365
Tyr Gly Asp Ser Gly Phe Gly Ser Asn Leu Thr His Gln Leu Pro Ile
370 375 380
Asn Pro Asn Ile Phe Lys Ser Ser Ile Thr Asp Thr Arg Ser Pro Ser
385 390 395 400
Asn Gln Ile Thr Lys Met Asp Phe Tyr Lys Thr Asp Gly Thr Gln Ala
405 410 415
Ser Tyr Asn Ser Gly Ile Thr Pro Thr Pro Gly Asp Leu Arg Thr Thr
420 425 430
Phe Phe Gly Phe Ser Thr Asn Glu Asn Thr Pro Asn Gln Pro Ser Ile
435 440 445
Asn Asp Tyr Thr His Phe Leu Thr Tyr Met Lys Thr Asp Val Ile Ser
450 455 460
Gly Gly Ala Pro Lys Arg Val Ser Leu Ala Trp Ala His Lys Ser Val
465 470 475 480
Asn Leu Asn Asn Gln Ile Phe Thr Asp Asp Ile Thr Gln Val Pro Ala
485 490 495
Val Lys Ser Asn Val Leu Asn Thr Gln Ala Lys Val Ile Lys Gly Pro
500 505 510
Gly His Thr Gly Gly Asp Leu Val Ala Ile Thr Ser Asp Gly Val Leu
515 520 525
Ser Gly Arg Met Glu Ile Gln Cys Lys Ala Ser Val Phe Asn Glu Pro
530 535 540
Glu Arg Arg Tyr Gly Leu Arg Ile Arg Tyr Ala Ala Asn Ser Ile Leu
545 550 555 560
Thr Val Asn Ala Ser Tyr Thr Ser Gln Gly Asn Thr Arg Ser Ile Thr
565 570 575
Phe Thr Thr Glu Ser Thr Phe Thr Gly Asn Thr Ile Pro Thr Asp Leu
580 585 590
Lys Tyr Glu Asn Leu Lys Tyr Lys Glu Pro Phe Asp Ala Ile Leu Pro
595 600 605
Met Arg Leu Thr Ser Asn Glu Leu Thr Asn Ile Thr Ile Gln Pro Gln
610 615 620
Asn Met Ser Ser Asn Gln Leu Leu Ile Ile Asp Arg Ile Glu Phe Ile
625 630 635 640
Pro Ile Thr Ser Thr Val Leu Gly Asp Thr Glu Lys Gln Asn Leu Glu
645 650 655
Lys Val Gln Lys Ala Val Asn Asp Leu Phe Thr Asn Thr Ala Lys Asn
660 665 670
Ala Leu Lys Ala Glu Thr Thr Asp Tyr Glu Ile Asp Gln Thr Ala Asn
675 680 685
Ile Val Glu Cys Leu Ser Asp Glu His Ser Thr Lys Glu Lys Met Ile
690 695 700
Leu Leu Asp Glu Val Lys Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn
705 710 715 720
Val Leu Gln Asn Gly Asp Phe Glu Ser Asp Thr Leu Gly Trp Thr Thr
725 730 735
Ser Asn Asn Ile Thr Ile Gln Ala Asp Asn Pro Ile Phe Lys Gly Lys
740 745 750
Tyr Leu His Met Ser Gly Ala Arg Asp Ile Asp Gly Ser Val Phe Pro
755 760 765
Thr Tyr Ile Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Pro Tyr Thr
770 775 780
Arg Tyr Arg Val Arg Gly Phe Val Gly Ser Ser Lys Glu Leu Glu Leu
785 790 795 800
Val Val Ser Arg Tyr Gly Glu Glu Ile Asp Ala Ile Met Asn Val Pro
805 810 815
Asn Lys Leu Val Asp Met Tyr Pro Pro Ala Ser Asp Cys Gly Gly Leu
820 825 830
Asn Arg Cys Glu Ile Ser Ser Ala Leu Glu Ile Asn Gln Val Asp Tyr
835 840 845
Thr Asn Met Ser Tyr Pro Cys Gln Asn Asp Gly Asn Lys Lys His Val
850 855 860
Leu Cys His Asp Arg His Ser Tyr Asp Phe His Ile Asp Thr Gly Ser
865 870 875 880
Val Asp Leu Asn Glu Asn Ile Gly Ile Trp Val Leu Phe Lys Val Ser
885 890 895
Ser Pro Asp Gly Tyr Ala Thr Leu Asp Asn Leu Glu Val Val Glu Glu
900 905 910
Arg Ser Leu Asp Gly Glu Ala Leu Ala Arg Val Lys His Arg Glu Lys
915 920 925
Lys Trp Ile His Gln Ile Glu Val Lys Arg Tyr Glu Thr Gln Gln Ala
930 935 940
Tyr Asp Ala Thr Lys Gln Ala Met Asp Ala Leu Phe Thr Asn Asp Gln
945 950 955 960
Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu Ala Gln Ile Gln His Ala
965 970 975
Asp Asp Leu Val Gln Ser Ile Pro Tyr Val Tyr Asn Glu Trp Val Pro
980 985 990
Ser Ala Pro Gly Met Asn Tyr Asp Leu Tyr Val Glu Leu Glu Ala Arg
995 1000 1005
Val Val Lys Ala Arg Tyr Leu Tyr Asp Thr Arg Asn Val Ile Arg
1010 1015 1020
Asn Gly Asp Phe Ser Glu Gly Leu Gln Gly Trp His Val Thr Gly
1025 1030 1035
Asn Ala Lys Val Gln Gln Ile Asp Gly Val Ser Val Leu Val Leu
1040 1045 1050
Ser Asn Trp Ser Ala Gly Val Ala Gln Asn Met Tyr Val Gln His
1055 1060 1065
Asn His Gly Tyr Val Leu Arg Val Thr Ala Lys Lys Glu Gly His
1070 1075 1080
Gly Lys Gly Tyr Val Thr Leu Met Asp Cys Asp Gly Asn Gln Glu
1085 1090 1095
Thr Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr Val Thr Lys Thr
1100 1105 1110
Val Asp Val Phe Pro Asp Thr Asp Arg Val Arg Val Asp Leu Gly
1115 1120 1125
Glu Thr Glu Gly Pro Phe Tyr Ile Glu Ser Ile Glu Leu Ile Cys
1130 1135 1140
Met Asn Gly
1145
<210> 26
<211> 669
<212> PRT
<213> 人工序列
<220>
<223> 衍生自组装的序列。
<400> 26
Met Thr Gln Asn Asn Asn Glu Tyr Glu Ile Ile Asp Gln Asn Thr Ser
1 5 10 15
Pro Tyr Ser Ser Asn Arg Asn Asn Asn Asn Ser Arg Tyr Pro Phe Ala
20 25 30
Asn Asn Pro Asn Gln Ala Leu Gln Gln Thr Asn Tyr Lys Asp Trp Ile
35 40 45
Asn Met Cys Gln Lys Asn Gln Gln Cys Gly Glu Asn Leu Glu Thr Phe
50 55 60
Ala Ser Ala Asp Thr Ile Ala Ala Val Ser Ala Gly Val Ile Val Val
65 70 75 80
Gly Thr Met Leu Gly Ala Phe Gly Ala Pro Val Thr Thr Gly Leu Ile
85 90 95
Ile Ser Phe Gly Thr Leu Leu Pro Ile Phe Trp Gly Pro Ser Glu Asp
100 105 110
Pro Lys Lys Val Trp Lys Glu Phe Leu Thr Ile Gly Asn Arg Pro Phe
115 120 125
Gly Ser Glu Val Asp Gln Gly Ile Ile Asp Leu Leu Tyr Thr Lys Val
130 135 140
Asn Gly Leu Arg Ser Gln Phe Glu Asp Phe Gln Arg Tyr Phe Asp Leu
145 150 155 160
Trp Lys Asn Asn Lys Asn Pro Val Asn Ala Asp Val Val Arg Gln Lys
165 170 175
Phe Leu Ser Leu Asp Ser Asp Val Ile Arg Glu Leu Glu Thr Leu Lys
180 185 190
Gly Asn Tyr Tyr Ile Thr Leu Leu Pro Gly Tyr Thr Gln Val Ala Asn
195 200 205
Trp His Leu Asn Leu Leu Arg Gln Ala Ala Tyr Tyr Tyr Asp Glu Trp
210 215 220
Ala Pro Ser Ser Asn Leu Ser Ile Gln Ser Ile Tyr Pro Gln Asp Tyr
225 230 235 240
Thr Asn Asp Leu Gln Thr Cys Leu Asp Asn Cys Pro Ser Glu Ser Gly
245 250 255
Asn Lys Val Ser Ser Ala Tyr Tyr Lys Cys Ile Leu Lys Cys Arg Ile
260 265 270
Asn Glu Tyr Ile Asn Tyr Cys Ser Lys Thr Tyr Gln Glu Gly Leu Asn
275 280 285
Lys Leu Lys Asn Ser Ser Asp Ile Lys Trp Asn Ile Tyr Asn Glu Tyr
290 295 300
Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile Ala Ala Phe Pro
305 310 315 320
Asn Tyr Asp Leu Glu Lys Tyr Pro Ile Gly Thr Lys Cys Glu Leu Thr
325 330 335
Arg Glu Val Tyr Thr Asn Ala Leu Met Gly Ser Ser Ser Met Ser Ile
340 345 350
Ala Glu Leu Glu Lys Ser Leu Thr Lys Asp Pro Phe Leu Ile Thr Trp
355 360 365
Leu Asn Lys Ile Leu Leu Tyr Thr Arg Asn Tyr Lys Gln Pro Thr Thr
370 375 380
Glu Asp Val Phe Val Phe Thr Gly Asn Gln Leu Arg Tyr Ser Phe Thr
385 390 395 400
Met Asp Ser Asn Leu Gly Tyr Ser Gly Phe Tyr Gly Asp Val Ser Tyr
405 410 415
Thr Asp Asp Thr Glu Gln Ile Leu Glu Ile Pro Gly Asn Ser Gln Ile
420 425 430
Val Lys Val Glu Val Glu Arg His Arg Asp Ser Pro Asp Ile Ile Trp
435 440 445
Lys Ile Asp Phe His Leu Asn Asn Gly Ala Val Leu Lys Tyr Asn Ser
450 455 460
Gly Ser Thr Ala Asp Pro Asn Phe Arg Val Arg Asp Val Leu Thr Ile
465 470 475 480
Pro Pro Asp Ser Lys Gly Asn Ala Ser His Phe Leu Ser Tyr Met Lys
485 490 495
Ser Ala Tyr Val Thr Ser Asp Val Lys Gln Leu Arg Arg Val Ser Phe
500 505 510
Ala Trp Thr His Asn Ser Ile Asn Tyr Asn Asn Glu Ile Tyr Asn Asp
515 520 525
Ile Ile Thr Gln Ile Ala Ala Val Lys Gly His Tyr Leu Gly Leu Glu
530 535 540
Gly Leu Ala Ser Arg Val Ile Gln Gly Pro Gly His Thr Gly Gly Asp
545 550 555 560
Leu Val Asp Leu Lys Asp Asp Leu Arg Leu Ala Cys Gln His Ser Gly
565 570 575
Thr Gln Gln Ser Tyr Tyr Ile Arg Ile Arg Tyr Ala Ser Asp Gly Asp
580 585 590
Thr Arg Ile Val Leu Val Ile Pro Leu Met Glu Ser Gln Asn Ile Pro
595 600 605
Leu Lys Ser Thr Phe Ser Gly Val Asn His Asp Glu Leu Lys Tyr Lys
610 615 620
Asp Phe Gly Tyr Val Gln Phe Pro Gly Glu Ile Thr Leu Asn Gln His
625 630 635 640
Ser Lys Ile Thr Leu Ile Phe Arg Leu Gln Asp Ile Tyr Ser Asn Ile
645 650 655
Ser Val Phe Ile Asp Lys Ile Glu Phe Ile Pro Ile Thr
660 665
<210> 27
<211> 521
<212> PRT
<213> 人工序列
<220>
<223> 衍生自组装的序列。
<400> 27
Ser Ser Ile Arg Glu Asn Arg Glu Lys Tyr Gln Leu Glu Lys Ala Lys
1 5 10 15
Arg Ala Val Asp Asp Leu Phe Ile Ser Ala Lys Lys Gln Asn Ile Lys
20 25 30
Ile Asp Ile Thr Asp Tyr Gln Ile Asp Gln Thr Ala Asn Leu Val Asp
35 40 45
Ser Leu Ser Glu Glu Pro Tyr Pro Gln Glu Lys Met Met Leu Leu Asn
50 55 60
Gln Ile Lys Tyr Ala Lys Gln Leu Ser Gln Ser Arg Asn Leu Leu Ser
65 70 75 80
Asn Gly Asp Phe Glu Ser Leu Ile Gly Trp Thr Thr Ser Ser Ser Ile
85 90 95
Thr Val Gln Thr Gly Asn Thr Ile Phe Lys Gly Phe Ser Leu His Met
100 105 110
Leu Gly Ala Arg Thr Thr Glu Ile Asn Ala Thr Val Phe Pro Thr Tyr
115 120 125
Val Tyr Gln Lys Ile Asp Glu Ser Arg Leu Lys Pro Tyr Thr Arg Tyr
130 135 140
Ile Val Arg Gly Phe Ile Gly Ser Ser Lys Gly Leu Gly Ile Phe Val
145 150 155 160
Thr Arg Tyr Asn Asn Val Pro Asp Lys Leu Ala Tyr Ile Arg Ser Thr
165 170 175
Asn Ser Cys Gly Glu Leu Asn Gln Tyr Glu Ser Gln Asn Tyr Ser Leu
180 185 190
Val Ser Glu Asn Asn Ser Thr Met Ser Leu Gln Asn Ile Thr Ala Ser
195 200 205
Asn Asp Thr Ser Cys Leu Ser Glu Asn Leu Arg Tyr Cys Glu Pro Asn
210 215 220
Gln Leu Tyr Pro Thr Cys His Asn Leu His Asp Phe Ser Phe Ser Ile
225 230 235 240
Asp Thr Gly Glu Leu Asp Phe Asn Glu Asn Pro Gly Ile Trp Ile Leu
245 250 255
Phe Lys Ile Ser Asn Pro Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu
260 265 270
Val Ile Glu Glu Lys Thr Leu Val Gly Glu Glu Ile Asn Asn Val Lys
275 280 285
Glu Lys Gly Lys Arg Trp Lys Lys Glu Met Asp Thr Lys Gln Thr Lys
290 295 300
Thr Glu Thr Ala Phe Ser Gln Ala Gln Gln Ala Val Asn Gly Leu Phe
305 310 315 320
Met Asn Thr Gln Tyr Ser Met Leu Lys Ile Glu Thr Thr Met Gln Asp
325 330 335
Ile Val Thr Ala Asp Asn Leu Ile Asn Glu Ile Pro Tyr Val Tyr Asp
340 345 350
Glu Leu Leu Pro Asn Glu Pro Ala Gly Arg Asn Tyr Asn Met Phe Ile
355 360 365
Glu Leu Lys Asn Gln Ile Ser Gln Val Tyr Ser Leu Tyr Asn Ala Arg
370 375 380
Asn Ile Ile Gln Asn Gly Asn Phe Asn Asn Gly Leu Lys Asn Trp His
385 390 395 400
Thr Ser Pro Asp Ala Lys Val Gln Lys Ile Asp Asn Thr Ser Val Leu
405 410 415
Val Ile Pro Asn Trp Ser Thr Gln Val Ser Gln His Thr Asn Leu Gln
420 425 430
Gln Asn Gln Arg Tyr Leu Leu Arg Val Thr Ala Lys Lys Glu Gly Met
435 440 445
Gly Asn Gly Tyr Val Lys Val Ser Asp Cys Ala Asn Asn Val Glu Thr
450 455 460
Leu Thr Phe Lys Ser Ser Asp Ile Thr Asn Asn Asn Met Trp Asn Glu
465 470 475 480
Ser Ile Gly Tyr Met Thr Lys Thr Met Tyr Ile Thr Pro His Thr Ser
485 490 495
Gln Val Arg Ile Asp Ile Gly Glu Thr Glu Gly Asn Phe Lys Ile Asn
500 505 510
Ser Ile Glu Leu Ile Cys Ile Lys Asn
515 520
<210> 28
<211> 687
<212> PRT
<213> 人工序列
<220>
<223> 衍生自组装的序列。
<400> 28
Met Asn Ser Asn Arg Asn Lys Asn Glu Tyr Glu Ile Leu Asp Ala Ser
1 5 10 15
Ser Ser Thr Ser Asn Met Thr Asn Gln Tyr Ser Arg Tyr Pro Leu Ala
20 25 30
Asn Asn Pro Gln Ala Phe Met Arg Asn Thr Asn Tyr Lys Asp Trp Leu
35 40 45
Ala Met Cys Glu Arg Asn Asp Thr Gly Val Leu Glu Asn Pro Glu Val
50 55 60
Leu Ser Leu Arg Gly Ala Val Gly Thr Gly Val Ser Ile Val Gly Met
65 70 75 80
Ile Phe Ser Leu Ile Gly Ile Pro Val Ile Gly Glu Val Val Gly Ile
85 90 95
Leu Val Ser Leu Thr Asn Leu Leu Trp Pro Glu Ser Glu Gly Ser Ala
100 105 110
Gln Tyr Thr Trp Gln Glu Leu Ile Thr His Val Glu Glu Leu Met Asp
115 120 125
Gln Arg Ile Gly Glu Thr Gln Lys Ala Asn Ala Leu Ala Lys Leu Ser
130 135 140
Gly Leu Lys Ala Gln Val Ala Ala Tyr Asn Arg Ala Leu Glu Asp Trp
145 150 155 160
Glu Lys Asn Pro Asn Ser Arg Ser Ala Ser Glu Val Ile Ala Arg Phe
165 170 175
Arg Ser Thr Asn Asn Asp Phe Val Gly Ser Met Pro Gln Phe Ser Pro
180 185 190
Asn Gly Tyr Glu Ile Leu Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Ile Arg Asp Ala Thr Ile Tyr Gly Ser Gln Trp
210 215 220
Gly Leu Ser Gln Gly Asp Val Asn Leu Tyr Tyr Asn Glu Gln Leu Leu
225 230 235 240
Tyr Thr Lys Gln Tyr Val Asn His Cys Val Thr Trp Tyr Asn Asn Gly
245 250 255
Leu Ala Gln Gln Lys Ala Leu Phe Ala Thr Ser Pro Asn Trp Asn Arg
260 265 270
Phe Asn Ala Tyr Arg Arg Asp Met Thr Ile Asn Val Leu Asp Leu Ile
275 280 285
Ala Leu Phe Pro Ile Tyr Asp Ala Arg Leu Tyr Pro Gln Pro Val Arg
290 295 300
Ala Glu Leu Thr Arg Glu Ile Tyr Ser Asn Ile Leu Asn Ser Asp Val
305 310 315 320
Tyr Gly Val Gln Trp Ala Asp Phe Glu Lys Asn Glu Ser Thr Phe Thr
325 330 335
Arg Pro Pro His Leu Phe Thr Trp Leu Arg Lys Phe Asp Phe Tyr Thr
340 345 350
Arg Thr Lys Tyr Tyr Asn Gln Gly Leu Gly Trp Leu Phe Leu Gly Gly
355 360 365
His Thr Asn Tyr Tyr Ser Tyr Thr Asn Ser Ser Asn Leu Lys Ser Gly
370 375 380
Ser Tyr Asn Asn Phe Trp Gly Ser Asp Met Gln Thr Ser Thr Leu Thr
385 390 395 400
Ile Pro Asp Asn Pro Ser Ile Tyr Arg Leu Trp Thr Lys Ser Tyr Thr
405 410 415
His Ile Tyr Pro Tyr Thr Asp Pro Val Asn Ile Thr Gln Met Gln Phe
420 425 430
Tyr Leu Thr Asn Asn Gln Gln Leu Thr Tyr Thr Ala Thr Ala Asn Pro
435 440 445
Arg Tyr Pro Val Arg Glu Thr Asn Phe Glu Leu Pro Ser Thr Asp Glu
450 455 460
Asn Pro Leu Thr Tyr Gln Asn Tyr Ser His Ile Leu Ser Tyr Met Ile
465 470 475 480
Ser Ser Gln His Phe Gly Asp Lys Arg Ser Gly Tyr Thr Phe Ala Trp
485 490 495
Thr His Asn Ser Val Asp Pro Thr Asn Thr Leu Ala Pro Asn Lys Ile
500 505 510
Thr Gln Ile Pro Ala Val Lys Ala Asn Thr Leu Glu Gly Asn Lys Ser
515 520 525
Phe Val Val Lys Gly Pro Asn His Thr Gly Gly Asp Leu Val Ile Leu
530 535 540
Glu Ala Glu Pro Gly Pro Val Tyr Pro Ile Val Tyr Arg Gly Val Met
545 550 555 560
Gly Ile Thr Cys Lys Val Thr Gln Ala Gln Asn Tyr Arg Ile Arg Ile
565 570 575
Arg Tyr Ala Ser Asn Gly Gly Ala Gln Met Ala Ile Ser Leu Arg Asn
580 585 590
Arg Gly Thr Gly Thr Val Phe Thr Val Ser Lys Thr Tyr Thr Gly Asn
595 600 605
Ser Ile Glu Asn Leu Gln Tyr Asn Asp Phe Gln Tyr Lys Asp Met Pro
610 615 620
Val Ile Leu Glu Ala Ser Gln Tyr Glu Pro Asn Asn Ser Ile Tyr Val
625 630 635 640
Tyr Leu Tyr Gln Glu Ser Pro Tyr Ile Gln Val Ile Ile Asp Lys Ile
645 650 655
Glu Phe Ile Pro Ile Asp Thr Thr Ser Gln Glu Tyr Glu Glu Lys His
660 665 670
Gln Leu Glu Lys Ala Lys Lys Ala Val Gly Val Leu Phe Thr Asn
675 680 685
<210> 29
<211> 498
<212> PRT
<213> 人工序列
<220>
<223> 衍生自组装的序列。
<400> 29
Asp Ala Lys Lys Ala Leu Lys Ile Asp Thr Thr Asp Tyr Asp Val Asp
1 5 10 15
Gln Ala Ala Asn Leu Ile Glu Cys Leu Ser Asp Glu Gln Tyr Ala Lys
20 25 30
Glu Lys Met Ile Leu Leu Asp Glu Val Lys Tyr Ala Lys Gln Leu Ser
35 40 45
Gln Ser Arg Asn Leu Leu Gln Asn Gly Asp Phe Glu Ser Ser Glu Ile
50 55 60
Gly Trp Glu Thr Ser Asn Thr Ile Thr Ile Gln Ala Gly Asn Leu Ile
65 70 75 80
Phe Lys Gly Lys Tyr Leu Asn Met Ser Gly Ala Arg Asn Ile Asp Gly
85 90 95
Ala Ile Phe Pro Thr Tyr Ala Phe Gln Lys Val Asp Glu Ser Arg Leu
100 105 110
Lys Pro Tyr Thr Arg Tyr Lys Val Arg Gly Phe Val Gly Ser Ser Lys
115 120 125
Asp Val Glu Val Val Val Thr Arg Tyr Gly Glu Glu Val Asp Thr Ile
130 135 140
Met Asn Val Pro Asn Asp Leu Thr Tyr Asp Val Gly Ser Val Lys Ser
145 150 155 160
Cys Gly Glu Trp Asn Arg Cys Glu Gln Gln Pro Tyr Gln Asn Arg Asn
165 170 175
Gln Val Leu Asn Asn Ser Met Ile Ile Ala Asn Thr Ser Asn Ala Ser
180 185 190
Asn Ser Cys Glu Tyr Val Pro Glu Lys Lys Arg Val Met Cys Pro Glu
195 200 205
Pro His Gln Phe Ser Phe His Val Asp Thr Gly Glu Thr Asn Leu Asn
210 215 220
Glu Asn Leu Gly Ile Ser Val Leu Phe Lys Ile Ser Ser Pro Glu Gly
225 230 235 240
Tyr Ala Ile Leu Asp Asn Ile Glu Leu Ile Glu Glu Gly Ser Leu Val
245 250 255
Gly Glu Ser Leu Ala Tyr Val Gln Asn Arg Glu Lys Arg Trp Lys Asn
260 265 270
Lys Met Gln Ala Glu Arg Met Glu Thr Gln Gln Ala Tyr Asn Ile Ala
275 280 285
Lys Gln Val Val Asp Ile Leu Phe Thr Asp Pro Gln Asp Thr Ala Leu
290 295 300
Arg Phe Glu Thr Asn Lys Ser Asn Ile Ile Ser Ala Asp Glu Leu Val
305 310 315 320
Gln Ser Ile Pro Tyr Ile Tyr Asn Asp Trp Leu Arg Asp Val Pro Gly
325 330 335
Met Asn Tyr Asn Met Phe Thr Glu Leu Lys Gly Arg Ile Thr Gln Ala
340 345 350
Tyr Tyr Leu Tyr Asp Asp Arg Asn Val Leu Gln Asn Gly Asp Phe Asn
355 360 365
Asn Gly Leu Thr Ser Trp Tyr Val Thr Gly Asn Ala Glu Val Gln Gln
370 375 380
Ile Asp Gly Thr Phe Val Leu Val Leu Gln Asn Trp Ser Thr Thr Val
385 390 395 400
Ser Gln Asn Val Cys Leu Gln His Asn Arg Gly Tyr Val Leu Arg Val
405 410 415
Thr Ala Arg Lys Glu Gly Met Gly Asn Gly Tyr Val Thr Met Ser Asp
420 425 430
Cys Ala Asn His Ile Glu Lys Ile Ile Phe Thr Ser Cys Asp Asn Asn
435 440 445
Ile Val Val Thr Ser Thr Asp Ser Ala Glu Tyr Val Thr Arg Thr Val
450 455 460
Ser Phe Phe Pro Asp Thr Asp His Val Arg Ile Glu Ile Gly Glu Thr
465 470 475 480
Glu Gly Thr Phe Lys Val Glu Ser Val Glu Leu Ile Cys Met Glu Gly
485 490 495
Lys Glu
<210> 30
<211> 668
<212> PRT
<213> 人工序列
<220>
<223> 衍生自组装的序列。
<400> 30
Met Asn Gln Tyr Asn Asn Thr Asn Asn Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Lys Arg Ser Pro Gln Tyr Pro Leu Ala Asn Asn Pro Gln Asn Ser Ile
20 25 30
Lys Thr Thr Asn Tyr Lys Asp Trp Ile Asn Met Cys Glu Gly Asn Ala
35 40 45
Glu Ala Phe Phe Leu Thr Asp Glu Gln Met Val Ser Ile Val Gly Ala
50 55 60
Ala Ile Ser Lys Leu Leu Gly Phe Val Pro Val Val Gly Asp Ile Leu
65 70 75 80
Ser Phe Leu Ala Asp Thr Tyr Trp Pro Lys Ile Ala Gly Gln Glu Val
85 90 95
Asp Thr Arg Val Trp Ala Gly Leu Ile Arg His Thr Ala Asn Leu Ile
100 105 110
Asp Asn Arg Glu Ala Glu Lys Val Ile Gly Gln Ala Thr Thr Asn Leu
115 120 125
Met Ser Leu Tyr Gly Ala Leu Gly Val Tyr Asn Arg Phe Leu Glu Gln
130 135 140
Trp Lys Gln Asn Glu Lys Ser Phe Ala Asn Leu Ala Asp Glu Val Arg
145 150 155 160
Thr Gln Met Ser Ala Leu His Leu Leu Phe Thr Thr Lys Ile Ile Ser
165 170 175
Asp Phe Thr Leu His Gly Tyr Glu Ser Ile Leu Leu Pro Ser Tyr Ala
180 185 190
Ser Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ile Ala Ile Tyr
195 200 205
Gly Glu Arg Leu Gly Phe Asp Pro Lys Val Leu Gln Ala Tyr His Asp
210 215 220
Glu Gln Val Leu Phe Thr Arg Gln Tyr Thr Ala His Cys Ile Asn Thr
225 230 235 240
Tyr Asn Leu Thr Leu Asn Ala Gln Lys Pro Arg Gly Trp Val Ala Phe
245 250 255
Asn Gln Tyr Arg Arg Asp Met Thr Leu Thr Val Leu Asp Leu Ile Ala
260 265 270
Leu Phe Pro Ser Tyr Asp Thr His Lys Tyr Pro Val Asp Lys Lys Asn
275 280 285
Val Lys Lys Leu Ser Thr Thr Glu Phe Thr Arg Glu Ile Tyr Thr Ala
290 295 300
Leu Ile Glu Pro Asn Pro Asn Lys Thr Val Glu Gly Met Glu Ala Ser
305 310 315 320
Leu Thr Arg Thr Pro His Leu Phe Thr Trp Ile Lys Arg Leu Asp Phe
325 330 335
Tyr Thr Asn Thr Leu Tyr Pro Asp Leu Arg Tyr Leu Ser Ala Asn Arg
340 345 350
Ile Gly Phe Ser Tyr Thr Asn Ser Ser Thr Ile Gln Gln Ser Gly Ile
355 360 365
Tyr Gly Asp Ser Gly Phe Gly Ser Asn Leu Thr His Gln Leu Pro Ile
370 375 380
Asn Pro Asn Ile Phe Lys Ser Ser Ile Thr Asp Thr Arg Ser Pro Ser
385 390 395 400
Asn Gln Ile Thr Lys Met Asp Phe Tyr Lys Thr Asp Gly Thr Gln Ala
405 410 415
Ser Tyr Asn Ser Gly Ile Thr Pro Thr Pro Gly Asp Leu Arg Thr Thr
420 425 430
Phe Phe Gly Phe Ser Thr Asn Glu Asn Thr Pro Asn Gln Pro Ser Ile
435 440 445
Asn Asp Tyr Thr His Phe Leu Thr Tyr Met Lys Thr Asp Val Ile Ser
450 455 460
Gly Gly Ala Pro Lys Arg Val Ser Leu Ala Trp Ala His Lys Ser Val
465 470 475 480
Asn Leu Asn Asn Gln Ile Phe Thr Asp Asp Ile Thr Gln Val Pro Ala
485 490 495
Val Lys Ser Asn Val Leu Asn Thr Gln Ala Lys Val Ile Lys Gly Pro
500 505 510
Gly His Thr Gly Gly Asp Leu Val Ala Ile Thr Ser Asp Gly Val Leu
515 520 525
Ser Gly Arg Met Glu Ile Gln Cys Lys Ala Ser Val Phe Asn Glu Pro
530 535 540
Glu Arg Arg Tyr Gly Leu Arg Ile Arg Tyr Ala Ala Asn Ser Ile Leu
545 550 555 560
Thr Val Asn Ala Ser Tyr Thr Ser Gln Gly Asn Thr Arg Ser Ile Thr
565 570 575
Phe Thr Thr Glu Ser Thr Phe Thr Gly Asn Thr Ile Pro Thr Asp Leu
580 585 590
Lys Tyr Glu Asn Leu Lys Tyr Lys Glu Pro Phe Asp Ala Ile Leu Pro
595 600 605
Met Arg Leu Thr Ser Asn Glu Leu Thr Asn Ile Thr Ile Gln Pro Gln
610 615 620
Asn Met Ser Ser Asn Gln Leu Leu Ile Ile Asp Arg Ile Glu Phe Ile
625 630 635 640
Pro Ile Thr Ser Thr Val Leu Gly Asp Thr Glu Lys Gln Asn Leu Glu
645 650 655
Lys Val Gln Lys Ala Val Asn Asp Leu Phe Thr Asn
660 665
<210> 31
<211> 478
<212> PRT
<213> 人工序列
<220>
<223> 衍生自组装的序列。
<400> 31
Thr Ala Lys Asn Ala Leu Lys Ala Glu Thr Thr Asp Tyr Glu Ile Asp
1 5 10 15
Gln Thr Ala Asn Ile Val Glu Cys Leu Ser Asp Glu His Ser Thr Lys
20 25 30
Glu Lys Met Ile Leu Leu Asp Glu Val Lys Tyr Ala Lys Gln Leu Ser
35 40 45
Gln Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser Asp Thr Leu
50 55 60
Gly Trp Thr Thr Ser Asn Asn Ile Thr Ile Gln Ala Asp Asn Pro Ile
65 70 75 80
Phe Lys Gly Lys Tyr Leu His Met Ser Gly Ala Arg Asp Ile Asp Gly
85 90 95
Ser Val Phe Pro Thr Tyr Ile Tyr Gln Lys Ile Asp Glu Ser Lys Leu
100 105 110
Lys Pro Tyr Thr Arg Tyr Arg Val Arg Gly Phe Val Gly Ser Ser Lys
115 120 125
Glu Leu Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile Asp Ala Ile
130 135 140
Met Asn Val Pro Asn Lys Leu Val Asp Met Tyr Pro Pro Ala Ser Asp
145 150 155 160
Cys Gly Gly Leu Asn Arg Cys Glu Ile Ser Ser Ala Leu Glu Ile Asn
165 170 175
Gln Val Asp Tyr Thr Asn Met Ser Tyr Pro Cys Gln Asn Asp Gly Asn
180 185 190
Lys Lys His Val Leu Cys His Asp Arg His Ser Tyr Asp Phe His Ile
195 200 205
Asp Thr Gly Ser Val Asp Leu Asn Glu Asn Ile Gly Ile Trp Val Leu
210 215 220
Phe Lys Val Ser Ser Pro Asp Gly Tyr Ala Thr Leu Asp Asn Leu Glu
225 230 235 240
Val Val Glu Glu Arg Ser Leu Asp Gly Glu Ala Leu Ala Arg Val Lys
245 250 255
His Arg Glu Lys Lys Trp Ile His Gln Ile Glu Val Lys Arg Tyr Glu
260 265 270
Thr Gln Gln Ala Tyr Asp Ala Thr Lys Gln Ala Met Asp Ala Leu Phe
275 280 285
Thr Asn Asp Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu Ala Gln
290 295 300
Ile Gln His Ala Asp Asp Leu Val Gln Ser Ile Pro Tyr Val Tyr Asn
305 310 315 320
Glu Trp Val Pro Ser Ala Pro Gly Met Asn Tyr Asp Leu Tyr Val Glu
325 330 335
Leu Glu Ala Arg Val Val Lys Ala Arg Tyr Leu Tyr Asp Thr Arg Asn
340 345 350
Val Ile Arg Asn Gly Asp Phe Ser Glu Gly Leu Gln Gly Trp His Val
355 360 365
Thr Gly Asn Ala Lys Val Gln Gln Ile Asp Gly Val Ser Val Leu Val
370 375 380
Leu Ser Asn Trp Ser Ala Gly Val Ala Gln Asn Met Tyr Val Gln His
385 390 395 400
Asn His Gly Tyr Val Leu Arg Val Thr Ala Lys Lys Glu Gly His Gly
405 410 415
Lys Gly Tyr Val Thr Leu Met Asp Cys Asp Gly Asn Gln Glu Thr Leu
420 425 430
Thr Phe Thr Ser Cys Glu Glu Gly Tyr Val Thr Lys Thr Val Asp Val
435 440 445
Phe Pro Asp Thr Asp Arg Val Arg Val Asp Ile Gly Glu Thr Glu Gly
450 455 460
Pro Phe Tyr Ile Glu Ser Ile Glu Leu Ile Cys Met Asn Gly
465 470 475
<210> 32
<211> 673
<212> PRT
<213> 苏云金芽孢杆菌
<400> 32
Met Ser Met Lys Ser Leu Ile Gln Arg Ile Tyr Leu Val Leu Leu Thr
1 5 10 15
Glu Ile Leu Thr Ile Leu Asp Thr Leu Leu Gln Ile Ile Arg Ile Asn
20 25 30
His Tyr Lys Asn Trp Ile Asn Met Cys Gln Lys Asn Gln Gln Tyr Gly
35 40 45
Glu Asn Leu Glu Thr Phe Ala Ser Ala Asp Thr Ile Ala Gly Val Ser
50 55 60
Ala Gly Val Ile Val Val Gly Thr Met Leu Gly Ala Phe Ala Ala Pro
65 70 75 80
Ile Thr Ala Gly Leu Ile Ile Ser Phe Gly Thr Leu Leu Pro Ile Phe
85 90 95
Trp Lys Pro Gly Glu Asp Pro Lys Thr Val Trp Gln Ala Phe Leu Lys
100 105 110
Ile Gly Asn Arg Pro Phe Ser Ser Pro Val Asp Gln Ala Leu Ile Asp
115 120 125
Leu Leu Ser Asn Lys Ala Arg Ser Leu Glu Ser Gln Phe Asn Asp Phe
130 135 140
Gln Arg Tyr Phe Asp Ile Trp Asn Asn Asn Lys Thr Pro Gly Asn Ala
145 150 155 160
Gly Glu Val Leu Arg Arg Phe Ser Ser Leu Asp Ala Asp Ile Ile Arg
165 170 175
Glu Leu Glu Gln Leu Lys Gly Asn Tyr Tyr Ile Thr Val Leu Pro Gly
180 185 190
Tyr Ala Gln Val Ala Asn Trp His Leu Asn Leu Leu Arg Ile Ala Ala
195 200 205
Phe Tyr Tyr Asp Gln Trp Ala Ser Ser Ser Asn Leu Ser Ile Gln Ser
210 215 220
Ile Tyr Pro Glu Asp Tyr Ile Asn Asp Leu Gln Thr Cys Leu Thr Asn
225 230 235 240
Cys Ala Ile Glu Ser Gly Asn Lys Ile Ser Ser Lys Tyr Tyr Lys Cys
245 250 255
Val Leu Lys Cys Arg Ile Asn Glu Tyr Ile Asn Tyr Cys Ser Lys Thr
260 265 270
Tyr Gln Glu Gly Leu Asn Ile Leu Lys Asn Ser Ser Gly Leu Lys Trp
275 280 285
Asn Glu Tyr Asn Thr Tyr Arg Arg Glu Met Thr Leu Asn Val Leu Asp
290 295 300
Leu Ile Ala Val Phe Pro Asn Tyr Asp Pro Asp Lys Tyr Leu Ile Ser
305 310 315 320
Thr Lys Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asp Ala Leu Ile Asp
325 330 335
Ala Phe Ala Asn Ala His Phe Asn Ile Asn Asp Ile Glu Asn Ser Leu
340 345 350
Thr Arg Pro Pro Gly Leu Val Thr Trp Ile Asn Arg Leu Asp Phe Tyr
355 360 365
Thr Gly Met Phe Thr Lys Ser Val Pro Gly Leu Thr Ala Asn Gly Ile
370 375 380
Asn Tyr Ser Phe Thr Asn Gly Asn Ser Asn Asp Ser Pro Ile Tyr Gly
385 390 395 400
Tyr Arg Leu Ser Asp Asp Ser Ser Thr Pro Ile Gln Ile Pro Arg Asn
405 410 415
Gln Tyr Val Tyr Asn Met Leu Ile Thr Tyr Leu Arg Asp Ser Pro Ser
420 425 430
Val Ile Gln Lys Ile Glu Phe Asn Leu Asn Asn Gln Gln Thr Arg Thr
435 440 445
Tyr Asp Thr Gly Leu Thr Leu Ala Pro Thr Tyr Gln Ser Thr Ile Asn
450 455 460
Leu Ser Leu Pro Gly Lys Asp Arg Ser Phe Pro Pro Lys Phe Asn Asn
465 470 475 480
Tyr Thr His Phe Leu Ser Tyr Val Lys Thr Ala Pro Gly Asp Glu Arg
485 490 495
Pro Ser Ser Ser Arg Ala Arg Asn Val Cys Phe Gly Trp Met His Phe
500 505 510
Ser Val Asn Asp Tyr Asp Val Leu Ala Gly Gly Tyr Asn Thr Ile Ser
515 520 525
Asn Lys Ile Ile Thr Gln Ile Pro Ala Val Lys Ala Arg His Leu Pro
530 535 540
Leu Pro Ser Phe Val Met Pro Gly Pro Gly His Thr Gly Gly Asn Leu
545 550 555 560
Val Val Leu Ser Thr Gln Ile Glu Phe Gln Cys Ile Val Leu Asn Pro
565 570 575
Val Ser Tyr Lys Ile Arg Met Arg Tyr Val Ala Tyr Ser Pro Asn Arg
580 585 590
Ser Ile Asn Leu Thr Val Ser Ile Arg Ser Glu Ile Gly Asn Tyr Gln
595 600 605
Asn Ile Val Pro Asn Ile Ser Ser Thr Val Gln Ser Pro Glu Asp Thr
610 615 620
Lys Asn Pro Lys Tyr Glu His Phe Gln Tyr Leu Asp Ile Ser Ile Pro
625 630 635 640
Leu Glu Leu Phe Gly Ile Thr Asn Ile Thr Ile Thr Arg Ser Asp Ser
645 650 655
Ile Ser Asn Asn Thr Leu Ile Ile Asp Lys Ile Glu Phe Thr Pro Asp
660 665 670
Val
<210> 33
<211> 1180
<212> PRT
<213> 苏云金芽孢杆菌
<400> 33
Met Asn Pro Tyr Gln Asn Lys Asn Glu Tyr Glu Thr Leu Asn Ala Ser
1 5 10 15
Gln Lys Lys Leu Asn Ile Ser Asn Asn Tyr Thr Arg Tyr Pro Ile Glu
20 25 30
Asn Ser Pro Lys Gln Leu Leu Gln Ser Thr Asn Tyr Lys Asp Trp Leu
35 40 45
Asn Met Cys Gln Gln Asn Gln Gln Tyr Gly Gly Asp Phe Glu Thr Phe
50 55 60
Ile Asp Ser Gly Glu Leu Ser Ala Tyr Thr Ile Val Val Gly Thr Val
65 70 75 80
Leu Thr Gly Phe Gly Phe Thr Thr Pro Leu Gly Leu Ala Leu Ile Gly
85 90 95
Phe Gly Thr Leu Ile Pro Val Leu Phe Pro Ala Gln Asp Gln Ser Asn
100 105 110
Thr Trp Ser Asp Phe Ile Thr Gln Thr Lys Asn Ile Ile Lys Lys Glu
115 120 125
Ile Ala Ser Thr Tyr Ile Ser Asn Ala Asn Lys Ile Leu Asn Arg Ser
130 135 140
Phe Asn Val Ile Ser Thr Tyr His Asn His Leu Lys Thr Trp Glu Asn
145 150 155 160
Asn Pro Asn Pro Gln Asn Thr Gln Asp Val Arg Thr Gln Ile Gln Leu
165 170 175
Val His Tyr His Phe Gln Asn Val Ile Pro Glu Leu Val Asn Ser Cys
180 185 190
Pro Pro Asn Pro Ser Asp Cys Asp Tyr Tyr Asn Ile Leu Val Leu Ser
195 200 205
Ser Tyr Ala Gln Ala Ala Asn Leu His Leu Thr Val Leu Asn Gln Ala
210 215 220
Val Lys Phe Glu Ala Tyr Leu Lys Asn Asn Arg Gln Phe Asp Tyr Leu
225 230 235 240
Glu Pro Leu Pro Thr Ala Ile Asp Tyr Tyr Pro Val Leu Thr Lys Ala
245 250 255
Ile Glu Asp Tyr Thr Asn Tyr Cys Val Thr Thr Tyr Lys Lys Gly Leu
260 265 270
Asn Leu Ile Lys Thr Thr Pro Asp Ser Asn Leu Asp Gly Asn Ile Asn
275 280 285
Trp Asn Thr Tyr Asn Thr Tyr Arg Thr Lys Met Thr Thr Ala Val Leu
290 295 300
Asp Val Val Ala Leu Phe Pro Asn Tyr Asp Val Gly Lys Tyr Pro Ile
305 310 315 320
Gly Val Gln Ser Glu Leu Thr Arg Glu Ile Tyr Gln Val Leu Asn Phe
325 330 335
Glu Glu Ser Pro Tyr Lys Tyr Tyr Asp Phe Gln Tyr Gln Glu Asp Ser
340 345 350
Leu Thr Arg Arg Pro His Leu Phe Thr Trp Leu Asp Ser Leu Asn Phe
355 360 365
Tyr Glu Lys Ala Gln Thr Thr Pro Asn Asn Phe Phe Thr Ser His Tyr
370 375 380
Asn Met Phe His Tyr Thr Leu Asp Asn Ile Ser Gln Lys Ser Ser Val
385 390 395 400
Phe Gly Asn His Asn Val Thr Asp Lys Leu Lys Ser Leu Gly Leu Ala
405 410 415
Thr Asn Ile Tyr Ile Phe Leu Leu Asn Val Ile Ser Leu Asp Asn Lys
420 425 430
Tyr Leu Asn Asp Tyr Asn Asn Ile Ser Lys Met Asp Phe Phe Ile Thr
435 440 445
Asn Gly Thr Arg Leu Leu Glu Lys Glu Leu Thr Ala Gly Ser Gly Gln
450 455 460
Ile Thr Tyr Asp Val Asn Lys Asn Ile Phe Gly Leu Pro Ile Leu Lys
465 470 475 480
Arg Arg Glu Asn Gln Gly Asn Pro Thr Leu Phe Pro Thr Tyr Asp Asn
485 490 495
Tyr Ser His Ile Leu Ser Phe Ile Lys Ser Leu Ser Ile Pro Ala Thr
500 505 510
Tyr Lys Thr Gln Val Tyr Thr Phe Ala Trp Thr His Ser Ser Val Asp
515 520 525
Pro Lys Asn Thr Ile Tyr Thr His Leu Thr Thr Gln Ile Pro Ala Val
530 535 540
Lys Ala Asn Ser Leu Gly Thr Ala Ser Lys Val Val Gln Gly Pro Gly
545 550 555 560
His Thr Gly Gly Asp Leu Ile Asp Phe Lys Asp His Phe Lys Ile Thr
565 570 575
Cys Gln His Ser Asn Phe Gln Gln Ser Tyr Phe Ile Arg Ile Arg Tyr
580 585 590
Ala Ser Asn Gly Ser Ala Asn Thr Arg Ala Val Ile Asn Leu Ser Ile
595 600 605
Pro Gly Val Ala Glu Leu Gly Met Ala Leu Asn Pro Thr Phe Ser Gly
610 615 620
Thr Asp Tyr Thr Asn Leu Lys Tyr Lys Asp Phe Gln Tyr Leu Glu Phe
625 630 635 640
Ser Asn Glu Val Lys Phe Ala Pro Asn Gln Asn Ile Ser Leu Val Phe
645 650 655
Asn Arg Ser Asp Val Tyr Thr Asn Thr Thr Val Leu Ile Asp Lys Ile
660 665 670
Glu Phe Leu Pro Ile Thr Arg Ser Ile Arg Glu Asp Arg Glu Lys Gln
675 680 685
Lys Leu Glu Thr Val Gln Gln Ile Ile Asn Thr Phe Tyr Ala Asn Pro
690 695 700
Ile Lys Asn Thr Leu Gln Ser Glu Leu Thr Asp Tyr Asp Ile Asp Gln
705 710 715 720
Ala Ala Asn Leu Val Glu Cys Ile Ser Glu Glu Leu Tyr Pro Lys Glu
725 730 735
Lys Met Leu Leu Leu Asp Glu Val Lys Asn Ala Lys Gln Leu Ser Gln
740 745 750
Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser Ala Thr Leu Gly
755 760 765
Trp Thr Thr Ser Asp Asn Ile Thr Ile Gln Glu Asp Asp Pro Ile Phe
770 775 780
Lys Gly His Tyr Leu His Met Ser Gly Ala Arg Asp Ile Asp Gly Thr
785 790 795 800
Ile Phe Pro Thr Tyr Ile Phe Gln Lys Ile Asp Glu Ser Lys Leu Lys
805 810 815
Pro Tyr Thr Arg Tyr Leu Val Arg Gly Phe Val Gly Ser Ser Lys Asp
820 825 830
Val Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile Asp Ala Ile Met
835 840 845
Asn Val Pro Ala Asp Leu Asn Tyr Leu Tyr Pro Ser Thr Phe Asp Cys
850 855 860
Glu Gly Ser Asn Arg Cys Glu Thr Ser Ala Val Pro Ala Asn Ile Gly
865 870 875 880
Asn Thr Ser Asp Met Leu Tyr Ser Cys Gln Tyr Asp Thr Gly Lys Lys
885 890 895
His Val Val Cys Gln Asp Ser His Gln Phe Ser Phe Thr Ile Asp Thr
900 905 910
Gly Ala Leu Asp Thr Asn Glu Asn Ile Gly Val Trp Val Met Phe Lys
915 920 925
Ile Ser Ser Pro Asp Gly Tyr Ala Ser Leu Asp Asn Leu Glu Val Ile
930 935 940
Glu Glu Gly Pro Ile Asp Gly Glu Ala Leu Ser Arg Val Lys His Met
945 950 955 960
Glu Lys Lys Trp Asn Asp Gln Met Glu Ala Lys Arg Ser Glu Thr Gln
965 970 975
Gln Ala Tyr Asp Val Ala Lys Gln Ala Ile Asp Ala Leu Phe Thr Asn
980 985 990
Val Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu Ala Gln Ile Gln
995 1000 1005
Tyr Ala Glu Tyr Leu Val Gln Ser Ile Pro Tyr Val Tyr Asn Asp
1010 1015 1020
Trp Leu Ser Asp Val Pro Gly Met Asn Tyr Asp Ile Tyr Val Glu
1025 1030 1035
Leu Asp Ala Arg Val Ala Gln Ala Arg Tyr Leu Tyr Asp Ile Arg
1040 1045 1050
Asn Ile Ile Lys Asn Gly Asp Phe Thr Gln Gly Val Met Gly Trp
1055 1060 1065
His Val Thr Gly Asn Ala Asp Val Gln Gln Ile Asp Gly Val Ser
1070 1075 1080
Val Leu Val Leu Ser Asn Trp Ser Ala Gly Val Ser Gln Asn Val
1085 1090 1095
His Leu Gln His Asn His Gly Tyr Val Leu Gly Val Ile Ala Lys
1100 1105 1110
Lys Glu Gly Pro Gly Asn Gly Tyr Val Thr Leu Met Asp Trp Glu
1115 1120 1125
Glu Asn Gln Glu Lys Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr
1130 1135 1140
Ile Thr Lys Thr Val Asp Val Phe Pro Asp Thr Asp Arg Val Arg
1145 1150 1155
Ile Glu Ile Gly Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser Ile
1160 1165 1170
Glu Leu Ile Cys Met Asn Glu
1175 1180
<210> 34
<211> 660
<212> PRT
<213> 苏云金芽孢杆菌
<400> 34
Met Asn Ser Tyr Glu Asn Lys Asn Glu Tyr Glu Ile Leu Asn Asp Ser
1 5 10 15
Lys Lys Ser Asn Met Ser Asn Pro Tyr Leu Arg Tyr Pro Leu Ala Asn
20 25 30
Asp Ser Leu Ala Ser Met Gln Asn Thr Asn Tyr Lys Asp Trp Leu Thr
35 40 45
Met Cys Asp Arg Thr Asp Thr Asp Val Leu Ser Ser Arg Gly Ala Val
50 55 60
Ser Thr Gly Val Gly Met Leu Ser Thr Ile Leu Ser Leu Phe Gly Ile
65 70 75 80
Pro Leu Ile Gly Glu Gly Ile Asp Leu Leu Leu Gly Ala Ala Asp Phe
85 90 95
Leu Trp Pro Glu Ser Asp Gly Gly His Gln Tyr Thr Trp Glu Asp Leu
100 105 110
Met Asn His Ile Glu Glu Leu Met Asp Glu Arg Leu Glu Thr Glu Lys
115 120 125
Arg Thr Thr Ala Leu Asp Asp Leu Arg Gly Leu Lys Ala Leu Leu Gly
130 135 140
Leu Phe Arg Asp Ala Phe Asp Ser Trp Glu Lys Asn Gln Asn Asp Pro
145 150 155 160
Ile Ala Lys Asn Arg Val Gly Gly Tyr Phe Glu Asp Val His Thr His
165 170 175
Phe Val Lys Asp Met Ala Ser Ile Phe Ser Ala Thr Asn Tyr Glu Val
180 185 190
Leu Leu Leu Pro Val Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu
195 200 205
Leu Arg Glu Gly Val Ile Tyr Gly Ser Arg Trp Gly Ile Ala Pro Ala
210 215 220
Ala Asp Phe Tyr His Asp Gln Leu Leu Lys Tyr Thr Ala Ile Tyr Ala
225 230 235 240
Asn His Cys Val Thr Trp Tyr Asn Asn Gly Leu Ala Gln Gln Lys Glu
245 250 255
Leu Phe Ala Lys Ser Pro Asn Trp Asn Arg Phe Asn Ala Tyr Arg Arg
260 265 270
Asp Met Thr Ile Thr Val Leu Asp Ile Ile Ala Leu Phe Pro Thr Tyr
275 280 285
Asp Ala Arg Leu Tyr Thr Lys Pro Ile Lys Thr Glu Leu Thr Arg Glu
290 295 300
Ile Tyr Ser Asp Val Leu Asn Leu Asp Val Tyr Gly Val Gln Gln Thr
305 310 315 320
Asp Leu Asn Lys Asn Glu Ala Ala Phe Thr Arg Ser Pro His Leu Val
325 330 335
Thr Arg Leu Arg Gly Phe Asp Phe Tyr Thr Arg Thr Lys Tyr Ala Tyr
340 345 350
Trp Arg Tyr Leu Ala Gly His Thr Asn Tyr Phe Ser Phe Thr Gly Asn
355 360 365
Gly Thr Ile Tyr Ser Ser Ser Phe Asn Asn Trp Tyr Asp Thr Asp Met
370 375 380
Thr Lys Ser Thr Ile Asn Ile Pro Asp Tyr Ala Asn Ile Tyr Lys Leu
385 390 395 400
Trp Thr Lys Ser Tyr Thr Asn Ile Ser Pro Tyr Thr Asp Pro Val Gly
405 410 415
Ile Ser Gln Met Gln Phe Ser Leu Thr Asn Asn Gln Gln Leu Thr Tyr
420 425 430
Thr Gly Thr Ser Ala Pro Lys Tyr Pro Val Arg Glu Thr Phe Phe Glu
435 440 445
Ile Pro Pro Thr Asp Glu Lys Pro Leu Thr Tyr Glu Asn Tyr Ser His
450 455 460
Ile Leu Ser Tyr Met Thr Ser Ala Gln His Phe Gly Asp Lys Lys Ile
465 470 475 480
Gly Tyr Thr Phe Ala Trp Met His Glu Ser Val Asp Phe Asp Asn Arg
485 490 495
Val Asp Pro Asp Lys Ile Thr Gln Ile Pro Ala Val Lys Gly Asp Tyr
500 505 510
Leu Gln Tyr Gly Tyr Val Lys Gln Gly Pro Gly His Thr Gly Gly Asp
515 520 525
Leu Val Ser Met Ile Arg Thr Asp Arg Leu Gly Ile Asn Val Tyr Phe
530 535 540
Pro Gln Pro Leu Asp Tyr Arg Ile Arg Ile Arg Tyr Ser Thr Ser Ser
545 550 555 560
Asn Gly Tyr Leu Tyr Ile Tyr Ser Pro Asn Thr Lys Ile Val Tyr Leu
565 570 575
Pro Pro Thr Thr Leu Val Asp Gly Gln Pro Thr Phe Asp Pro Met Asp
580 585 590
Phe Ser Ala Phe Arg Val Val Glu Val Pro Ala Ser Phe Arg Ala Ser
595 600 605
Val Ala Gly Tyr Thr Asn Phe Thr Ile Glu Ala Gly Phe Gly Pro Val
610 615 620
Tyr Ile Asp Lys Ile Glu Phe Ile Pro Asp Asn Thr Thr Thr Leu Glu
625 630 635 640
Tyr Glu Gly Gly Arg Asp Leu Glu Lys Thr Lys Asn Ala Val Asn Asp
645 650 655
Leu Phe Thr Asn
660
<210> 35
<211> 1192
<212> PRT
<213> 苏云金芽孢杆菌
<400> 35
Met Asp Ser Tyr His Asn Lys Asn Glu Asp Glu Met Leu Asn Ala Ser
1 5 10 15
Leu Asn Gln Ser Asn Met Asp Asn Arg Tyr Pro Leu Ala Asn Tyr Pro
20 25 30
Asn Lys Ser Leu Gln Asn Thr Asn Tyr Lys Asp Trp Leu Thr Met Cys
35 40 45
Glu Gly Thr Pro Val Val Phe Ala Ser Glu Ala Gln Ala Phe Lys Val
50 55 60
Leu Gly Ala Thr Ile Ala Arg Val Leu Gly Leu Ile Pro Ala Val Gly
65 70 75 80
Pro Leu Leu Ser Ser Leu Val Ser Ile Phe Trp Pro Thr Leu Gln Thr
85 90 95
Pro Asn Thr Ile Trp Gln Asp Met Met Lys Tyr Val Ala Asp Leu Ile
100 105 110
Arg Gln Glu Leu Thr Thr Tyr Thr Ile Asn Gln Ala Thr Arg Asn Leu
115 120 125
Thr Gly Leu Tyr Glu Ser Leu Asn Ile Tyr Asn Arg Ala Leu Ala Ala
130 135 140
Trp Lys Ile Asn Lys Asn His Phe Ala Ser Ala Glu Leu Val Arg Gly
145 150 155 160
Tyr Ile Asn Asp Leu His Ile Arg Phe Gly Ala Asp Ile Gln Ala Asp
165 170 175
Phe Thr Leu Lys Gly Tyr Glu Thr Ile Leu Leu Pro Ser Tyr Ala Ser
180 185 190
Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ile Ser Val Tyr Gly
195 200 205
Lys Glu Leu Gly Tyr Ser Gln Gln Asp Leu Asp Phe Tyr Tyr Gly Glu
210 215 220
Gln Lys His Tyr Thr Glu Arg Tyr Ser Asn His Cys Val Asn Lys Tyr
225 230 235 240
Asn Ala Gly Leu Asn Leu Glu Lys Gln Lys Gly Trp Ser Ser Phe Asn
245 250 255
Arg Tyr Arg Arg Asp Met Thr Leu Leu Val Leu Asp Leu Val Ala Leu
260 265 270
Phe Pro Leu Tyr Asp Leu Arg Ile Tyr Pro Ser Lys Asp Asp Asn Ile
275 280 285
Asn Val Lys Ser Glu Leu Thr Arg Glu Ile Tyr Ser Asp Val Ile Asn
290 295 300
Ala His Val Tyr Leu Val Leu Asn Glu Asp Met Ala Tyr Phe Ala Gln
305 310 315 320
Ala Glu Ala Leu Tyr Thr Arg Gln Pro His Leu Phe Thr Trp Leu Arg
325 330 335
Gly Phe Arg Phe Val Thr Asn Ser Ile Ser Ser Trp Thr Phe Leu Ser
340 345 350
Gly Ser Gln Asn Lys Tyr Ser Tyr Thr Asn Asn Asn Ser Ile Phe Asn
355 360 365
Gly Pro Phe Tyr Gly Gln Asp Thr Glu Tyr Gly Gly Thr Ser Ser Asn
370 375 380
Met Asp Ile Ala Glu Gly Ser Tyr Ile Tyr Gln Leu Trp Thr Lys Asn
385 390 395 400
Tyr Glu Tyr Ile Tyr Pro Trp Leu Asp Pro Val Asn Ile Thr Lys Ile
405 410 415
Asn Phe Ser Val Thr Asp Asn Asn Phe Ser Lys Glu Val Thr Tyr Gly
420 425 430
Gly Glu Arg Ile Asn Ile Pro Thr Val Arg Thr Asp Phe Asp Phe Leu
435 440 445
Ile Lys Lys Asp Gly Thr Gly Leu Ala Thr His Asn Asn Tyr Ser His
450 455 460
Ile Leu Ser Ser Ile Leu Thr Asn Gly Ser Thr Ala Gly Gln Lys Lys
465 470 475 480
His Gly Tyr Ser Phe Ala Phe Thr His Ser Ser Val Asp Gln Lys Asn
485 490 495
Ser Leu Ser Phe Asp Lys Ile Thr Gln Ile Pro Ala Val Lys Ser Ser
500 505 510
Asp Trp Leu Phe Tyr Gly Asn Leu Leu Lys Gly Pro Gly His Thr Gly
515 520 525
Gly Asp Leu Val Phe Leu Asp Asn Gly Asn Asn Phe Asn Val Arg Val
530 535 540
Asn Phe Pro Val Gln Ser Tyr Arg Val Arg Ile Arg Tyr Ala Ala Asp
545 550 555 560
Gly Asn Gly Glu Met Ala Ile Ser Val Asp Gly Thr Leu Tyr Thr Pro
565 570 575
Phe Asn Val Glu Arg Thr Phe Ser Asn Asn Asn Tyr Asn Asp Leu Lys
580 585 590
Phe Glu Asp Phe Lys Val Ile Asp Thr Pro Leu Ile Tyr Asn Ala Ser
595 600 605
Tyr Glu Gly Ala Lys Ser Ile Phe Leu Tyr Asn Asn Ser Asn Lys Arg
610 615 620
Val Ile Ile Asp Lys Ile Glu Phe Ile Pro Ile Gly Lys Ser Ala Leu
625 630 635 640
Glu Tyr Glu Ser Lys Gln Asn Leu Glu Gln Ala Gln Lys Ala Val Asn
645 650 655
Asp Leu Phe Thr Asn Asp Thr Lys Asn Met Leu Lys Thr Asp Thr Thr
660 665 670
Asp Tyr Gln Ile Asp Gln Val Val Asn Trp Val Asp Cys Val Ser Glu
675 680 685
Glu Leu Tyr Val Lys Glu Lys Met Ile Leu Arg Asp Glu Ile Lys Tyr
690 695 700
Ala Lys Gln Gln Ser Leu Ser Arg Asn Leu Leu Gln Asn Gly Asp Phe
705 710 715 720
Glu Asp Thr Ser Lys Gly Trp Thr Thr Ser Asn Thr Ile Thr Ile Gln
725 730 735
Ala Asp Asn Pro Ile Phe Lys Gly His Tyr Leu Asn Met Ser Gly Ala
740 745 750
Arg Glu Ile Asp Gly Thr Ile Phe Pro Thr Tyr Ile Tyr Gln Lys Ile
755 760 765
Asp Glu Ser Lys Leu Lys Pro Tyr Thr Arg Tyr Gln Val Arg Gly Phe
770 775 780
Val Gly Ser Ser Lys Gly Leu Glu Phe Val Val Thr Arg Tyr Gly Lys
785 790 795 800
Glu Thr Asp Ala Ile Met Asn Val Pro Asn Asp Trp Pro Tyr Ile Gln
805 810 815
Pro Asn Ser Ser Cys Gly Asp Tyr His Arg Cys Asp Thr Ser Ser Glu
820 825 830
Pro Val Met Tyr Gln Gly Tyr Pro Thr Pro Leu Pro Glu Gly Tyr Ala
835 840 845
Pro Asp Leu Gly Leu Leu Cys Gln Asn Ser Leu Gly Lys Lys His Val
850 855 860
Val Cys His Asp Arg His Gln Phe Asp Phe His Ile Thr Thr Gly Glu
865 870 875 880
Leu Asp Ile Asn Thr Asn Leu Gly Ile Gln Val Leu Phe Lys Ile Ser
885 890 895
Ser Pro Asp Gly Tyr Ala Thr Leu Asn Asn Leu Glu Val Ile Glu Glu
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Val Lys His Arg Glu Lys
915 920 925
Lys Trp Lys Gln Asn Met Glu Ala Lys Arg Leu Glu Thr Gln Gln Ala
930 935 940
Tyr Asn Ala Ala Lys Gln Val Val Asp Ser Leu Phe Thr Asn Ala Lys
945 950 955 960
Asp Glu Ser Leu Arg Phe Asp Thr Thr Leu Thr His Ile Met Asn Ala
965 970 975
Glu His Trp Val Gln Ser Ile Pro Tyr Val Asp Asn Ala Trp Ser Ser
980 985 990
Asp Ile Pro Gly Thr Ser Asn Asp Leu Tyr Val Glu Leu Glu Ala Arg
995 1000 1005
Leu Ala Gln Ala Arg Tyr Leu Tyr Asp Ala Gln Asn Val Ile Thr
1010 1015 1020
Asn Gly Asn Phe Thr Gln Gly Leu Met Gly Trp His Ala Thr Arg
1025 1030 1035
Asp Val Glu Val Gln Gln Met Asn Gly Ala Ser Val Leu Val Leu
1040 1045 1050
Ser Asn Trp Ser Ala Gly Ala Ser Gln Asn Val His Ala Gln His
1055 1060 1065
His Gln Gly Tyr Val Leu Arg Val Ile Ala Arg Lys Glu Gly Thr
1070 1075 1080
Gly Lys Gly Tyr Val Thr Met Met Asp Cys Asn Asn Asn Gln Glu
1085 1090 1095
Thr Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr Ile Thr Lys Thr
1100 1105 1110
Val Glu Val Phe Pro Asp Thr Asp Ser Val Arg Ile Glu Ile Gly
1115 1120 1125
Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser Ile Glu Leu Asn Cys
1130 1135 1140
Met Lys Gly Tyr Tyr Asp Gln Lys Ser Asp Ser Ile Tyr Asp Gln
1145 1150 1155
Gly Tyr Asn Asn Asn Tyr Asn Gln Asn Ser Ser Asn Met His Asn
1160 1165 1170
Gln Gly Tyr Lys Asn Asn Tyr Asn Gln Asn Gly Ser Ser Ala Lys
1175 1180 1185
Phe Leu Lys Arg
1190
<210> 36
<211> 679
<212> PRT
<213> 苏云金芽孢杆菌
<400> 36
Met Asn Ser Tyr Gln Asn Thr Asn Glu Tyr Glu Ile Leu Asp Ala Ser
1 5 10 15
Pro Ser Tyr Ser Asn Met Thr Asn Ser Tyr Pro Arg Tyr Pro Leu Ala
20 25 30
Asn Asn Arg Gln Gly Ser Met Lys Asn Thr Asn Tyr Lys Asp Trp Leu
35 40 45
Ala Met Cys Glu Gly Asn Val Glu Gly Leu Phe Leu Thr Asp Glu Gln
50 55 60
Met Val Ser Ile Val Gly Ala Ala Ile Ser Lys Leu Leu Gly Phe Val
65 70 75 80
Pro Val Val Gly Asp Ile Leu Ser Ser Leu Ala Asp Thr Tyr Trp Pro
85 90 95
Lys Ile Ala Gly Gln Glu Ala Asp Thr Arg Val Trp Ala Gly Leu Ile
100 105 110
Arg His Thr Ala Asn Leu Ile Asp Asn Arg Asp Val Asp Arg Val Ile
115 120 125
Gly Gln Ala Thr Ala Asn Val Met Ser Leu Tyr Ala Ala Leu Gly Val
130 135 140
Tyr Asn Arg Phe Leu Glu Gln Trp Lys Ser Pro Val Lys Pro Tyr Ala
145 150 155 160
Gly Leu Ala Asp Glu Ile Arg Ala Gln Met Ser Thr Leu His Leu Leu
165 170 175
Phe Thr Thr Lys Ile Ile Ser Asp Phe Thr Ile Gln Gly Tyr Glu Ala
180 185 190
Ile Leu Leu Pro Ser Tyr Ala Asn Ala Ala Ser Leu His Leu Leu Leu
195 200 205
Leu Arg Asp Ile Ser Ile Tyr Gly Glu Lys Leu Gly Phe Asp Ser Lys
210 215 220
Thr Leu Gln Ala Tyr His Asn Glu Gln Val Lys Phe Thr Thr Asp Tyr
225 230 235 240
Thr Ala His Cys Ile Lys Thr Tyr Asn Leu Asn Leu Asn Ala Gln Lys
245 250 255
Ser Lys Gly Trp Val Ala Phe Asn Gln Tyr Arg Arg Asp Met Thr Leu
260 265 270
Thr Val Leu Asp Leu Ile Ala Leu Phe Pro Ser Tyr Asp Thr His Arg
275 280 285
Tyr Pro Ala Asp Glu Lys Asn Val Lys Lys Leu Ser Asn Thr Glu Leu
290 295 300
Thr Arg Glu Ile Tyr Thr Ala Leu Thr Glu Ser Ser Pro Ser Lys Thr
305 310 315 320
Val Glu Ala Met Glu Glu Ser Leu Thr Arg Gly Pro His Leu Phe Thr
325 330 335
Trp Pro Lys Arg Leu Asp Phe Trp Thr Phe Asn Tyr Asn Met Tyr Pro
340 345 350
Asp Thr Arg Tyr Leu Ser Ala Asn Arg Ile Gly Phe Ser Tyr Thr Asn
355 360 365
Ser Ser Glu Ile Glu Asp Ser Gly Ile Tyr Gly Ser Pro Thr Phe Gly
370 375 380
Thr Val Leu Thr His Gln Ile Pro Leu Asn Ser Asn Val Tyr Arg Thr
385 390 395 400
Ser Ile Thr Asp Thr Thr Ala Val Pro Asn Gln Val Thr Lys Met Asp
405 410 415
Phe Tyr Lys Ile Asp Gly Thr Asn Ala Ser Tyr Asn Ser Asn Ile Thr
420 425 430
Pro Val Pro Ala Asn Leu Arg Thr Thr Phe Phe Gly Phe Ser Ser Asp
435 440 445
Ala Asn Arg Pro Pro Asn Gln Pro Thr Val Gln Asp Tyr Asn Asn Ile
450 455 460
Leu Ser Tyr Ile Lys Thr Asp Ile Ile Gly Gly His Gln Ala Arg Val
465 470 475 480
Ser Phe Ala Trp Thr His Lys Gly Val Asn Pro Asn Asn Gln Ile Leu
485 490 495
Thr Asp Asn Val Thr Gln Val Pro Ala Val Lys Ser Ser Leu Leu Asn
500 505 510
Ala Pro Ala Arg Val Ile Lys Gly Pro Gly His Thr Gly Gly Asp Leu
515 520 525
Val Ala Leu Leu Asn Asn Gly Thr Gln Ala Gly Thr Met Gln Ile Gln
530 535 540
Cys Lys Thr Gly Ser Phe Thr Glu Thr Ser Arg Arg Tyr Gly Ile Arg
545 550 555 560
Met Arg Tyr Ala Ala Asn Asn Ala Phe Thr Val Ser Leu Ser Tyr Thr
565 570 575
Leu Gln Gly Gly Asn Pro Ile Gly Ile Thr Phe Gly Thr Glu Arg Thr
580 585 590
Phe Ser Arg Thr Asn Asn Ile Ile Pro Thr Asp Leu Lys Tyr Glu Glu
595 600 605
Phe Lys Tyr Lys Glu Tyr Asn Gln Ile Ile Thr Met Asn Ser Pro Gln
610 615 620
Asn Thr Ile Val Thr Ile Asp Ile Arg Gln Leu Asn Pro Ser Ser Asn
625 630 635 640
Asp Gln Leu Ile Ile Asp Arg Ile Glu Phe Ile Pro Ile Thr Gln Ser
645 650 655
Val Leu Asp Tyr Thr Glu Glu Gln Asn Leu Glu Thr Ala Gln Ala Val
660 665 670
Val Asp Asn Leu Phe Thr Asn
675
<210> 37
<211> 1136
<212> PRT
<213> 苏云金芽孢杆菌
<400> 37
Met Asn Ser Gly Tyr Pro Leu Ala Asn Asp Leu Gln Gly Ser Met Lys
1 5 10 15
Asn Thr Asn Tyr Lys Asp Trp Leu Ala Met Cys Glu Asn Asn Gln Gln
20 25 30
Tyr Gly Val Asn Pro Ala Ala Ile Asn Ser Ser Ser Val Ser Thr Ala
35 40 45
Leu Lys Val Ala Gly Ala Ile Leu Lys Phe Val Asn Pro Pro Ala Gly
50 55 60
Thr Val Leu Thr Val Leu Ser Ala Val Leu Pro Ile Leu Trp Pro Thr
65 70 75 80
Asn Thr Pro Thr Pro Glu Arg Val Trp Asn Asp Phe Met Thr Asn Thr
85 90 95
Gly Asn Leu Ile Asp Gln Thr Val Thr Ala Tyr Val Arg Thr Asp Ala
100 105 110
Asn Ala Lys Met Thr Val Val Lys Asp Tyr Leu Asp Gln Tyr Thr Thr
115 120 125
Lys Phe Asn Thr Trp Lys Arg Glu Pro Asn Asn Gln Ser Tyr Arg Thr
130 135 140
Ala Val Ile Thr Gln Phe Asn Leu Thr Ser Ala Lys Leu Arg Glu Thr
145 150 155 160
Ala Val Tyr Phe Ser Asn Leu Val Gly Tyr Glu Leu Leu Leu Leu Pro
165 170 175
Ile Tyr Ala Gln Val Ala Asn Phe Asn Leu Leu Leu Ile Arg Asp Gly
180 185 190
Leu Ile Asn Ala Gln Glu Trp Ser Leu Ala Arg Ser Ala Gly Asp Gln
195 200 205
Leu Tyr Asn Thr Met Val Gln Tyr Thr Lys Glu Tyr Ile Ala His Ser
210 215 220
Ile Thr Trp Tyr Asn Lys Gly Leu Asp Val Leu Arg Asn Lys Ser Asn
225 230 235 240
Gly Gln Trp Ile Thr Phe Asn Asp Tyr Lys Arg Glu Met Thr Ile Gln
245 250 255
Val Leu Asp Ile Leu Ala Leu Phe Ala Ser Tyr Asp Pro Arg Arg Tyr
260 265 270
Pro Ala Asp Lys Ile Asp Asn Thr Lys Leu Ser Lys Thr Glu Phe Thr
275 280 285
Arg Glu Ile Tyr Thr Ala Leu Val Glu Ser Pro Ser Ser Lys Ser Ile
290 295 300
Ala Ala Leu Glu Ala Ala Leu Thr Arg Asp Val His Leu Phe Thr Trp
305 310 315 320
Leu Lys Arg Val Asp Phe Trp Thr Asn Thr Ile Tyr Gln Asp Leu Arg
325 330 335
Phe Leu Ser Ala Asn Lys Ile Gly Phe Ser Tyr Thr Asn Ser Ser Ala
340 345 350
Met Gln Glu Ser Gly Ile Tyr Gly Ser Ser Gly Phe Gly Ser Asn Leu
355 360 365
Thr His Gln Ile Gln Leu Asn Ser Asn Val Tyr Lys Thr Ser Ile Thr
370 375 380
Asp Thr Ser Ser Pro Ser Asn Arg Val Thr Lys Met Asp Phe Tyr Lys
385 390 395 400
Ile Asp Gly Thr Leu Ala Ser Tyr Asn Ser Asn Ile Thr Pro Thr Pro
405 410 415
Glu Gly Leu Arg Thr Thr Phe Phe Gly Phe Ser Thr Asn Glu Asn Thr
420 425 430
Pro Asn Gln Pro Thr Val Asn Asp Tyr Thr His Ile Leu Ser Tyr Ile
435 440 445
Lys Thr Asp Val Ile Asp Tyr Asn Ser Asn Arg Val Ser Phe Ala Trp
450 455 460
Thr His Lys Ile Val Asp Pro Asn Asn Gln Ile Tyr Thr Asp Ala Ile
465 470 475 480
Thr Gln Val Pro Ala Val Lys Ser Asn Phe Leu Asn Ala Thr Ala Lys
485 490 495
Val Ile Lys Gly Pro Gly His Thr Gly Gly Asp Leu Val Ala Leu Thr
500 505 510
Ser Asn Gly Thr Leu Ser Gly Arg Met Glu Ile Gln Cys Lys Thr Ser
515 520 525
Ile Phe Asn Asp Pro Thr Arg Ser Tyr Gly Leu Arg Ile Arg Tyr Ala
530 535 540
Ala Asn Ser Pro Ile Val Leu Asn Val Ser Tyr Val Leu Gln Gly Val
545 550 555 560
Ser Arg Gly Thr Thr Ile Ser Thr Glu Ser Thr Phe Ser Arg Pro Asn
565 570 575
Asn Ile Ile Pro Thr Asp Leu Lys Tyr Glu Glu Phe Arg Tyr Lys Asp
580 585 590
Pro Phe Asp Ala Ile Val Pro Met Arg Leu Ser Ser Asn Gln Leu Ile
595 600 605
Thr Ile Ala Ile Gln Pro Leu Asn Met Thr Ser Asn Asn Gln Val Ile
610 615 620
Ile Asp Arg Ile Glu Ile Ile Pro Ile Thr Gln Ser Val Leu Asp Glu
625 630 635 640
Thr Glu Asn Gln Asn Leu Glu Ser Glu Arg Glu Val Val Asn Ala Leu
645 650 655
Phe Thr Asn Asp Ala Lys Asp Ala Leu Asn Ile Gly Thr Thr Asp Tyr
660 665 670
Asp Ile Asp Gln Ala Ala Asn Leu Val Glu Cys Ile Ser Glu Glu Leu
675 680 685
Tyr Pro Lys Glu Lys Met Leu Leu Leu Asp Glu Val Lys Asn Ala Lys
690 695 700
Gln Leu Ser Gln Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser
705 710 715 720
Ala Thr Leu Gly Trp Thr Thr Ser Asp Asn Ile Thr Ile Gln Glu Asp
725 730 735
Asp Pro Ile Phe Lys Gly His Tyr Leu His Met Ser Gly Ala Arg Asp
740 745 750
Ile Asp Gly Thr Ile Phe Pro Thr Tyr Ile Phe Gln Lys Ile Asp Glu
755 760 765
Ser Lys Leu Lys Pro Tyr Thr Arg Tyr Leu Val Arg Gly Phe Val Gly
770 775 780
Ser Ser Lys Asp Val Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile
785 790 795 800
Asp Ala Ile Met Asn Val Pro Ala Asp Leu Asn Tyr Leu Tyr Pro Ser
805 810 815
Thr Phe Asp Cys Glu Gly Ser Asn Arg Cys Glu Thr Ser Ala Val Pro
820 825 830
Ala Asn Ile Gly Asn Thr Ser Asp Met Leu Tyr Ser Cys Gln Tyr Asp
835 840 845
Thr Gly Lys Lys His Val Val Cys Gln Asp Ser His Gln Phe Ser Phe
850 855 860
Thr Ile Asp Thr Gly Ala Leu Asp Thr Asn Glu Asn Ile Gly Val Trp
865 870 875 880
Val Met Phe Lys Ile Ser Ser Pro Asp Gly Tyr Ala Ser Leu Asp Asn
885 890 895
Leu Glu Val Ile Glu Glu Gly Pro Ile Asp Gly Glu Ala Leu Ser Arg
900 905 910
Val Lys His Met Glu Lys Lys Trp Asn Asp Gln Met Glu Ala Lys Arg
915 920 925
Ser Glu Thr Gln Gln Ala Tyr Asp Val Ala Lys Gln Ala Ile Asp Ala
930 935 940
Leu Phe Thr Asn Val Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu
945 950 955 960
Ala Gln Ile Gln Tyr Ala Glu Tyr Leu Val Gln Ser Ile Pro Tyr Val
965 970 975
Tyr Asn Asp Trp Leu Ser Asp Val Pro Gly Met Asn Tyr Asp Ile Tyr
980 985 990
Val Glu Leu Asp Ala Arg Val Ala Gln Ala Arg Tyr Leu Tyr Asp Thr
995 1000 1005
Arg Asn Ile Ile Lys Asn Gly Asp Phe Thr Gln Gly Val Met Gly
1010 1015 1020
Trp His Val Thr Gly Asn Ala Asp Val Gln Gln Ile Asp Gly Val
1025 1030 1035
Ser Val Leu Val Leu Ser Asn Trp Ser Ala Gly Val Ser Gln Asn
1040 1045 1050
Val His Leu Gln His Asn His Gly Tyr Val Leu Arg Val Ile Ala
1055 1060 1065
Lys Lys Glu Gly Pro Gly Asn Gly Tyr Val Thr Leu Met Asp Cys
1070 1075 1080
Glu Glu Asn Gln Glu Lys Leu Thr Phe Thr Ser Cys Glu Glu Gly
1085 1090 1095
Tyr Ile Thr Lys Thr Val Asp Val Phe Pro Asp Thr Asp Arg Val
1100 1105 1110
Arg Ile Glu Ile Gly Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser
1115 1120 1125
Ile Glu Leu Ile Cys Met Asn Glu
1130 1135

Claims (43)

1.一种核酸分子,所述核酸分子包含如下核苷酸序列,所述核苷酸序列编码对鳞翅目有害生物有毒的Cry蛋白,其中所述核苷酸序列(a)与SEQ ID NO:1-5中任一项或其毒素编码片段具有至少80%到至少99%序列同一性;或者(b)编码如下Cry蛋白,所述Cry蛋白包含与SEQ ID NO:16-25中任一项或其毒素片段具有至少80%到至少99%序列同一性的氨基酸序列;或者(c)是(a)或(b)的组装的核苷酸序列;或者(d)是(a)、(b)或(c)的合成序列,所述合成序列已经进行密码子优化用于在转基因生物中表达。
2.如权利要求1所述的核酸分子,其中所述核苷酸序列包含SEQ ID NO:1-5中任一项或其毒素编码片段。
3.如权利要求1所述的核酸分子,其中所述Cry蛋白包含SEQ ID NO:16-25中任一项或其毒素片段的氨基酸序列。
4.如权利要求1所述的核酸分子,其中所述合成核苷酸序列包含SEQ ID NO:6-15中任一项或其毒素编码片段。
5.一种嵌合基因,所述嵌合基因包含可操作地连接至如权利要求1-4中任一项所述的核酸分子的异源启动子。
6.如权利要求5所述的嵌合基因,其中所述异源启动子是植物可表达型启动子。
7.如权利要求6所述的嵌合基因,其中所述植物可表达型启动子选自下组启动子,该组由以下组成:泛素、夜香树属黄病毒、玉米TrpA、OsMADS 6、玉蜀黍H3组蛋白、噬菌体T3基因95'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基RuBP羧化酶、水稻肌动蛋白、水稻亲环蛋白、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
8.如权利要求5所述的嵌合基因,其中所述鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、欧洲玉米蛀虫(欧洲玉米螟)、以及秋黏虫(草地贪夜蛾)。
9.如权利要求5所述的嵌合基因,其中所述转基因生物是细菌。
10.一种对鳞翅目有害生物有毒的Cry蛋白,并且任选地一种分离的Cry蛋白,其中所述Cry蛋白或分离的Cry蛋白包含(a)与SEQ ID NO:16-25中任一项或其毒素片段的氨基酸序列具有至少80%到至少99%序列同一性的氨基酸序列;或者(b)由与SEQ ID NO:6-15中任一项或其毒素编码片段的核苷酸序列具有至少80%到至少99%序列同一性的核苷酸序列或组装的核苷酸序列编码的氨基酸序列。
11.如权利要求10所述的Cry蛋白,其中所述氨基酸序列包含SEQ ID NO:16-25中任一项或其毒素片段。
12.如权利要求10所述的Cry蛋白,其中所述氨基酸序列由核苷酸序列编码,所述核苷酸序列包含SEQ ID NO:6-15中任一项或其毒素编码片段。
13.如权利要求10-12中任一项所述的Cry蛋白,其中所述鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、欧洲玉米蛀虫(欧洲玉米螟)、以及秋黏虫(草地贪夜蛾)。
14.一种产生如权利要求11所述的Cry蛋白的分离的苏云金芽孢杆菌菌株。
15.一种杀昆虫组合物,所述杀昆虫组合物包含如权利要求10所述的Cry蛋白和农业上可接受的载体。
16.如权利要求15所述的组合物,其中所述农业上可接受的载体选自下组,该组由以下组成:粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。
17.如权利要求10所述的组合物,其中所述组合物通过脱水、冷冻干燥、均化、提取、过滤、离心、沉降或浓缩苏云金芽孢杆菌菌株的培养物而制备。
18.如权利要求17所述的组合物,其中所述苏云金芽孢杆菌菌株是如权利要求14所述的苏云金芽孢杆菌菌株。
19.如权利要求10所述的组合物,其中所述组合物包含产生所述Cry蛋白的转基因细菌细胞。
20.如权利要求10所述的组合物,所述组合物包含按重量计从约1%至约99%的Cry蛋白。
21.一种重组载体,所述重组载体包含如权利要求1所述的核酸分子或如权利要求5所述的嵌合基因。
22.一种转基因细菌细胞或植物细胞,所述转基因细菌细胞或植物细胞包含如权利要求21所述的重组载体。
23.如权利要求22所述的转基因细菌细胞,其中所述细菌细胞是芽孢杆菌属、梭菌属、致病杆菌属、发光杆菌属、巴斯德氏芽菌属、埃希氏菌属、假单胞菌属、欧文氏菌属、沙雷氏菌属、克雷伯菌属、沙门氏菌属、巴氏杆菌属、黄单胞菌属、链霉菌属、根瘤菌属、红假单胞菌属、嗜甲基菌属、农杆菌属、醋杆菌属、乳杆菌属、节杆菌属、固氮菌属、明串珠菌属或产碱杆菌属的。
24.如权利要求23所述的转基因芽孢杆菌属细胞,其中所述芽孢杆菌属细胞是苏云金芽孢杆菌细胞。
25.如权利要求22所述的转基因植物细胞,其中所述植物细胞是双子叶植物细胞或单子叶植物细胞。
26.如权利要求25所述的双子叶植物细胞,其中所述双子叶植物细胞选自下组,该组由以下组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、甜菜细胞以及烟草细胞。
27.如权利要求25所述的单子叶植物细胞,其中所述单子叶植物细胞选自下组,该组由以下组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。
28.一种衍生自如权利要求25-27中任一项所述的转基因植物细胞的收获产物,其中所述收获产物包含所述蛋白质。
29.一种衍生自如权利要求28所述的收获产物的加工产物,其中所述加工产物选自下组,该组由以下组成:细粉、粗粉、油、以及淀粉、或从其衍生的产物。
30.一种衍生自包含如权利要求25所述的植物细胞的转基因植物的收获产物,其中所述收获产物包含所述蛋白质。
31.一种衍生自如权利要求30所述的收获产物的加工产物,其中所述加工产物选自下组,该组由以下组成:细粉、粗粉、油、以及淀粉、或从其衍生的产物。
32.一种产生对鳞翅目有害生物有毒的Cry蛋白的方法,所述方法包括:在所述转基因细胞产生所述Cry蛋白的条件下,培养如权利要求22所述的转基因细胞。
33.如权利要求32所述的方法,其中所述鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、欧洲玉米蛀虫(欧洲玉米螟)、以及秋黏虫(草地贪夜蛾)、或其任何组合。
34.如权利要求32所述的方法,其中所述核苷酸序列进行了密码子优化用于在植物中表达。
35.如权利要求32所述的方法,其中所述核酸分子或所述嵌合基因包含SEQ ID NO:1-15中任一项或其毒素编码片段。
36.如权利要求32所述的方法,其中所述Cry蛋白包含SEQ ID NO:16-25中任一项或毒素片段的氨基酸序列。
37.一种产生抗昆虫转基因植物的方法,所述方法包括:向植物中引入如权利要求6所述的嵌合基因,其中使所述Cry蛋白在所述植物中表达,由此产生抗昆虫转基因植物。
38.如权利要求37所述的方法,其中所述引入步骤通过以下实现:a)转化所述植物;或者b)使包含所述嵌合基因的第一植物与不同的第二植物杂交。
39.如权利要求37或38所述的方法,其中所述植物是稻植物或玉蜀黍植物。
40.一种控制鳞翅目有害生物的方法,所述方法包括向所述鳞翅目有害生物或其环境递送杀昆虫组合物,所述杀昆虫组合物包含效量的如权利要求10所述的Cry蛋白。
41.如权利要求40所述的方法,其中所述鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、欧洲玉米蛀虫(欧洲玉米螟)、以及秋黏虫(草地贪夜蛾)、或其任何组合。
42.如权利要求40所述的方法,其中所述组合物是转基因植物。
43.一种杂合杀昆虫蛋白,所述杂合杀昆虫蛋白在N-末端至C-末端方向上包含:a)与Cry4A蛋白的C-末端区域融合的Cry54A蛋白的N-末端区域,其中所述Cry54A蛋白和所述Cry4A蛋白之间的交换位置位于Cry54A的结构域III和Cry4A的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与SEQ ID NO:17具有至少90%同一性;或者b)与Cry19C蛋白的C-末端区域融合的Cry39A蛋白的N-末端区域,其中所述Cry39A蛋白和所述Cry19蛋白之间的交换位置位于Cry39A的结构域III和Cry19C的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与SEQ ID NO:18具有至少90%同一性;或者c)与Cry4B蛋白的C-末端区域融合的Cry50B蛋白的N-末端区域,其中所述Cry50B蛋白和所述Cry4B蛋白之间的交换位置位于Cry50B的结构域III和Cry4B的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与SEQ ID NO:20具有至少90%同一性;并且其中所述杂合杀昆虫蛋白针对鳞翅目昆虫有害生物具有活性。
CN201880024792.2A 2018-09-03 用于控制植物有害生物的组合物和方法 Active CN111148837B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/103787 WO2020047704A1 (en) 2018-09-03 2018-09-03 Compositions and methods for controlling plant pests

Publications (2)

Publication Number Publication Date
CN111148837A true CN111148837A (zh) 2020-05-12
CN111148837B CN111148837B (zh) 2024-10-29

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115623986A (zh) * 2022-10-27 2023-01-20 天津农学院 一种鉴定芹菜愈伤组织完全胚性化的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102586285A (zh) * 2003-02-20 2012-07-18 阿则耐克斯公司 δ-内毒素基因及其使用方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102586285A (zh) * 2003-02-20 2012-07-18 阿则耐克斯公司 δ-内毒素基因及其使用方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GOMIS-CEBOLLA, J.等: "Bacillus thuringiensis Cry32Eb-like protein gene, complete cds", 《GENBANK:KY420196.1》 *
PENG, G.: "Bacillus thuringiensis strain BtMC28 cry-like protein gene, partial cds; and hypotheticalprotein gene, complete cds", 《GENBANK:JQ916908.1》 *
PUNWAR, B.S.等: "Bacillus thuringiensis strain SK700 insecticidal crystal protein 3 gene, complete cds", 《GENBANK: KM053254.1》 *
XIE, B.等: "Bacillus thuringiensis strain QZL183-2 Cry8Ca gene, complete cds", 《GENBANK: KF148681.1》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115623986A (zh) * 2022-10-27 2023-01-20 天津农学院 一种鉴定芹菜愈伤组织完全胚性化的方法
CN115623986B (zh) * 2022-10-27 2023-12-15 天津农学院 一种鉴定芹菜愈伤组织完全胚性化的方法

Also Published As

Publication number Publication date
WO2020050905A1 (en) 2020-03-12
WO2020047704A1 (en) 2020-03-12

Similar Documents

Publication Publication Date Title
US11578105B2 (en) Compositions and methods for controlling plant pests
CN107849098B (zh) 用于控制植物有害生物的组合物和方法
CN107109418B (zh) 用于控制植物有害生物的组合物和方法
CN113302199A (zh) 用于控制昆虫有害生物的组合物和方法
WO2017146899A1 (en) Compositions and methods for controlling plant pests
US20220251599A1 (en) Compositions and Methods for Control of Insect Pests
CN111148432B (zh) 工程化的杀有害生物蛋白和控制植物有害生物的方法
CN106998697B (zh) 用于控制植物有害生物的组合物和方法
WO2020247465A2 (en) Control of spodoptera
CN113382634A (zh) 工程化的杀有害生物蛋白及控制植物有害生物的方法
WO2020050905A1 (en) Compositions and methods for controlling plant pests
CN111148837B (zh) 用于控制植物有害生物的组合物和方法
US12122808B2 (en) Control of Spodoptera
CN114026111A (zh) 用于控制植物有害生物的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant