CN114026111A - 用于控制植物有害生物的组合物和方法 - Google Patents

用于控制植物有害生物的组合物和方法 Download PDF

Info

Publication number
CN114026111A
CN114026111A CN202080044490.9A CN202080044490A CN114026111A CN 114026111 A CN114026111 A CN 114026111A CN 202080044490 A CN202080044490 A CN 202080044490A CN 114026111 A CN114026111 A CN 114026111A
Authority
CN
China
Prior art keywords
plant
seq
protein
sequence
cry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080044490.9A
Other languages
English (en)
Inventor
K·赛吉恩
C·弗莱明
R·塞斯勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Crop Protection AG Switzerland
Original Assignee
Syngenta Crop Protection AG Switzerland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Crop Protection AG Switzerland filed Critical Syngenta Crop Protection AG Switzerland
Publication of CN114026111A publication Critical patent/CN114026111A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/20Bacteria; Substances produced thereby or obtained therefrom
    • A01N63/22Bacillus
    • A01N63/23B. thuringiensis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Pest Control & Pesticides (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Agronomy & Crop Science (AREA)
  • Virology (AREA)
  • Environmental Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Dentistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Insects & Arthropods (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本文披露了对鳞翅目有害生物有毒的新颖杀昆虫蛋白。编码所述杀昆虫蛋白的DNA可以用于转化原核和真核生物以表达所述杀昆虫蛋白。所述重组生物或含有所述重组生物或所述杀昆虫蛋白的组合物单独或与适当的农用载体组合可以用于控制不同环境中的鳞翅目有害生物。

Description

用于控制植物有害生物的组合物和方法
序列表
序列表的官方副本是以ASCII格式的序列表以2019年6月26日生成的名为“81291-US-L-ORG-P-1_SeqList_ST25.txt”的文件进行电子提交的,并且该序列表的大小为281千字节并且与本说明书同时提交。包含在该ASCII格式文件中的序列表是本说明书的一部分,并且通过引用以其全文并入本文。
技术领域
本发明涉及杀有害生物蛋白和编码它们的核酸分子,以及用于控制植物有害生物的组合物和方法。
背景技术
苏云金芽孢杆菌(Bacillus thuringiensis,Bt)是一种革兰氏阳性的孢子形成的土壤细菌,其特征在于它产生晶体包含体的能力,这些晶体包含体对于某些目以及种的植物有害生物(包括昆虫)是特异性地有毒的,但是对于植物和其他非靶标生物是无害的。出于这个原因,包括苏云金芽孢杆菌菌株或它们的杀昆虫蛋白的组合物可以用作环境上可接受的杀昆虫剂以控制农业昆虫有害生物或多种人或动物疾病的昆虫媒介。
来自苏云金芽孢杆菌的晶体(Cry)蛋白主要针对鳞翅目的、双翅目的、以及鞘翅目的有害昆虫具有有力的杀昆虫活性。这些蛋白质还已经显示针对以下目的有害生物的活性:膜翅目、同翅目、毛虱目、食毛目、以及壁虱目,连同其他的无脊椎动物目,如线虫动物门、扁形动物门、以及肉足鞭毛亚门(Feitelson,J.,1993,The Bacillus Thuringiensisfamily tree[苏云金芽孢杆菌家族树],在:Advanced Engineered Pesticides[前沿的工程化的杀有害生物剂],马塞尔德克尔公司(Marcel Dekker,Inc.),纽约,纽约州)。这些蛋白最初主要基于它们的杀昆虫活性而被分类为CryI至CryVI。主要的类别是鳞翅目特异性(I)、鳞翅目和双翅目特异性(II)、鞘翅目特异性(III)、双翅目特异性(IV)、以及线虫特异性(V)和(VI)。这些蛋白被进一步分为亚家族;在各个家族内更高度相关的蛋白指定了区分的字母,例如CryIA、CryIB、CryIC等。在各个区分内的甚至更紧密相关的蛋白质被给定名称,例如CryIC(a)、CryIC(b)等。术语“Cry毒素”以及“δ-内毒素”与术语“Cry蛋白”已可互换地使用。对于Cry蛋白和基因的当前新命名法基于氨基酸序列同源性而不是昆虫靶标特异性(Crickmore等人(1998)Microbiol.Mol.Biol.Rev.[微生物分子生物学评论]62:807-813)。在这个更可接受的分类中,每种毒素被指定唯一的名称,所述名称合并了初级等级(阿拉伯数字)、二级等级(大写字母)、三级等级(小写字母)、以及四级等级(另一个阿拉伯数字)。在当前分类中,在初级等级中罗马数字已经换为阿拉伯数字。例如,在旧命名法下的“CryIA(a)”现在在当前命名法下是“Cry1Aa”。根据Ibrahim等人(2010,Bioeng.Bugs[生物工程学蝽象],1:31-50),Cry毒素仍然可以根据其昆虫宿主特异性被分为六个主要类别并且包括:组1—鳞翅目(例如Cry1、Cry9和Cry15);组2—鳞翅目和双翅目(例如Cry2);组3—鞘翅目(Cry3、Cry7和Cry8);组4—双翅目(Cry4、Cry10、Cry11、Cry16、Cry17、Cry19和Cry20);组5—鳞翅目和鞘翅目(Cry1I);以及组6—线虫(Cry6)。Cry1I、Cry2、Cry3、Cry10和Cry11毒素(73–82kDa)是独特的,因为它们似乎是更大Cry1和Cry4蛋白(130–140kDa)的天然截短。
Cry蛋白是在Bt的孢子形成阶段期间以晶体形式积聚为原毒素的球状蛋白质分子。在由有害生物摄取后,这些晶体典型地被溶解以释放原毒素,原毒素大小的范围可以为,例如,对于许多具有鳞翅目活性的Cry蛋白如Cry1和Cry9为从130-140kDa,并且对于具有鞘翅目活性的Cry3蛋白及具有鳞翅目/双翅目活性的Cry2蛋白为60-80kDa。在这些晶体被易感昆虫溶解后,这些释放的原毒素被昆虫肠道中的蛋白酶例如胰蛋白酶和胰凝乳蛋白酶加工,以产生抗蛋白酶的核心Cry蛋白毒素。这种蛋白水解加工涉及从各种Cry原毒素的不同区域去除氨基酸。例如,为130-140kDa的Cry原毒素典型地通过蛋白水解移除25-30个氨基酸的N-末端肽以及C-末端的大约一半的剩余蛋白来激活,产生约60-70kDa成熟Cry毒素。为60-80kDa的原毒素(例如Cry1I、Cry2和Cry3)也被加工但是其程度不与更大的原毒素相同。与更大的原毒素相比,较小的原毒素典型地从N-末端去除相等或更多个氨基酸,但较少氨基酸被从C-末端去除。例如,Cry2家族成员的蛋白水解激活典型地涉及去除约40-50个N-末端氨基酸。许多Cry蛋白对特定的靶标昆虫是相当有毒的,但许多具有窄的活性谱。
Cry蛋白通常具有五个保守序列结构域、以及三个保守结构性结构域(参见例如,de Maagd等人,(2001)Trends Genetics[遗传学趋势],17:193-199)。第一保守结构性结构域(称作结构域I)典型地由七个α螺旋组成并且参与膜插入以及孔形成。结构域II典型地由三个布置为希腊钥匙构型的β片层组成,并且结构域III典型地由两个处于“果冻卷”(‘jelly-roll’)构造的反平行的β片层组成(de Maagd等人,2001,同上)。结构域II和III参与受体识别和结合,并且因此被认为是毒素特异性的决定物。
另外,非内毒素基因和它们编码的蛋白也已经从苏云金芽孢杆菌中分离出。不像Cry蛋白是在孢子形成期间产生并且以一种伴孢晶体维持在细胞内,这些新的杀昆虫蛋白是在植物生长阶段期间从芽孢杆菌分泌并且因此已经被特指为营养期杀昆虫蛋白(VIP)。(参见例如,美国专利号5,877,012;6,107,279;6,137,033;5,849,870和5,889,174,以上通过引用并入本文)。
这些蛋白属于Cry1I家族,是来自苏云金芽孢杆菌的独特的杀昆虫蛋白,其中它们具有类似于Cry和VIP两者的生物化学特性。例如,Cry1Ia具有其他Cry蛋白的保守结构域但不是在伴孢晶体中产生。以前的报道已经在Cry1Ia-型蛋白不存在于伴孢晶体中的基础上表明cry1Ia-型基因的隐含的性质。Kamenidou等人(1996.J.Bacteriol.[细菌学杂志]178:2141-2144)首先报道了Cry1Ia的分泌以及Cry1I的N-末端结构域的存在,该N-末端结构域可能充当分泌信号肽。以前的报道已经显示Cry1Ia针对鳞翅目以及鞘翅目昆虫两者是有活性的。
众多商业上有价值的植物(包括普通的农作物)易受植物有害生物(包括昆虫和线虫有害生物)的攻击的影响,导致作物产量和品质的实质性降低。例如,植物有害生物是在全世界重要农作物损失中的主要因素。由于病虫害,在中国每年收获的谷类损失约15%-20%。此外,由于无脊椎有害生物(包含昆虫)的侵染,仅在美国每年就损失约80亿美元。昆虫有害生物对于菜农和果农,对于观赏性花卉的生产商,以及对于家庭花匠也是负担。
昆虫有害生物主要是通过密集使用化学杀有害生物剂来控制,这些化学杀有害生物剂通过抑制昆虫成长、预防昆虫摄食或繁殖、或者导致死亡而有效。生物性有害生物控制剂,如表达杀有害生物毒素(如Cry蛋白)的苏云金芽孢杆菌菌株,也已经施用于作物植物中,产生了令人满意的结果,提供化学杀有害生物剂的替代物或补充物。已经分离了编码这些Cry蛋白的一些的基因并且它们在异源性宿主(如转基因植物)中的表达已经显示出提供了另一种用于控制经济上重要的昆虫有害生物的手段。
因此可以达到良好的昆虫控制,但是某些化学药剂有时也能影响非靶标有益昆虫,并且某些生物药剂具有非常窄的活性谱。此外,某些化学和生物控制方法的继续使用增加了昆虫有害生物对此类控制措施产生抗性的机会。通过各种抗性管理实践已部分地缓和了这种状况,但仍需要开发新的并有效的有害生物控制剂,这些有害生物控制剂为农民提供经济利益并且是环境可接受的。特别需要的是可以靶向更广谱的经济上重要的昆虫有害生物并有效控制昆虫品系的控制剂,这些昆虫品系对现有的昆虫控制剂是有抗性的或可以变得有抗性。
发明内容
鉴于这些需求,本发明的目的是通过提供可以用来控制多种植物有害生物的新颖基因和杀有害生物蛋白来提供新的有害生物控制剂。
本发明提供了用于赋予细菌、植物、植物细胞、组织以及种子的杀有害生物活性的组合物以及方法。特别地,提供了包含编码Cry蛋白的新颖多核苷酸的嵌合基因,这些新颖多核苷酸衍生自组装的多核苷酸以及基本上与其相同的序列,这些嵌合基因的表达产生具有对经济上重要的昆虫有害生物(特别是侵染植物的昆虫有害生物)的毒性的蛋白。本发明进一步涉及由这些多核苷酸的表达产生的新颖Cry蛋白,并且涉及含有这些Cry蛋白的组合物以及配制品,它们通过抑制昆虫有害生物的生存、生长以及繁殖或者限制昆虫相关的对作物植物的损害或损失的能力对昆虫是有毒的。本发明的Cry蛋白包括衍生自组装的多核苷酸的Cry蛋白以及具有一个或多个氨基酸取代、添加或缺失的突变型或变体Cry蛋白。突变型Cry蛋白的实例包括但不限于被突变为具有比天然Cry蛋白对应物更宽的活性谱或更高的特异活性的那些,经突变以引入表位来产生从天然蛋白质中差异性地识别出经突变的蛋白质的抗体的那些,或经突变以调节在转基因生物中的表达的那些。本发明的新颖Cry蛋白对昆虫有害生物是高毒性的。例如,本发明的Cry蛋白可以用于控制一种或多种经济学上重要的昆虫有害生物,这些昆虫有害生物例如亚洲玉米蛀虫(Asian corn borer)(亚洲玉米螟(Ostrinia furnacalis))、黑色地老虎(black cutworm)(小地老虎(Agrotisipsilon))、棉螟蛉(cotton bollworm)(棉铃虫(Helicoverpa armigera))、黄色桃螟虫(yellow peach borer)(桃蛀螟(Conogethes punctiferalis))、东方黏虫(Orientalarmyworm)(东方粘虫(Mythimna sepatate))、欧洲玉米蛀虫(European corn borer)(欧洲玉米螟(Ostrinia nubilalis))、秋黏虫(fall armyworm)(草地贪夜蛾(Spodopterafrugiperda))、玉米穗蛾(corn earworm)(玉米穗虫(Helicoverpa zea))、甘蔗螟(sugarcane borer)(小蔗螟(Diatraea saccharalis))、绒毛豆毛虫(velvetbeancaterpillar)(黎豆夜蛾(Anticarsia gemmatalis))、大豆夜蛾(soybean looper)(大豆尺蠖(Chrysodeixis includes))、西南玉米蛀虫(southwest corn borer)(西南玉米螟(Diatraea grandiosella))、西部豆切根虫(western bean cutworm)(西方豆地香(Richiaalbicosta))、烟夜蛾(tobacco budworm)(烟芽夜蛾(Heliothis virescens))、条纹蛀茎虫(striped stem borer)(二化螟(Chilo suppressalis))、粉蛀茎虫(pink stem borer)(非洲大螟(Sesamia calamistis))、水稻卷叶螟(rice leaffolder)(稻纵卷叶螟(Cnaphalocrocis medinalis))等。
本发明还提供了合成多核苷酸,这些合成多核苷酸编码本发明的Cry蛋白,这些Cry蛋白已经进行一个或多个密码子优化用于在转基因生物(例如转基因细菌或转基因植物)中表达。
本发明进一步涉及表达盒和重组载体,其包含编码本发明的Cry蛋白的多核苷酸。本发明还提供了包含嵌合基因、或表达盒或重组载体的经转化的细菌、植物、植物细胞、组织、以及种子,该嵌合基因或表达盒或重组载体在经转化的细菌、植物、植物细胞、组织以及种子中表达本发明的Cry蛋白方面是有用的。
本发明还涉及分离的苏云金芽孢杆菌(Bt)菌株,这些菌株产生本发明的Cry蛋白。
本发明还涉及使用这些本发明的多核苷酸的方法,例如在DNA构建体或嵌合基因或表达盒或重组载体中用于在生物(包括植物和微生物,如细菌)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(如植物或细菌)中表达的组装的、天然的或密码子优化的序列,或者制成杂合的、具有增强的杀有害生物活性的Cry毒素。本发明进一步涉及制备这些Cry蛋白的方法以及使用这些多核苷酸序列和Cry蛋白的方法,例如,在微生物中控制昆虫或者在转基因植物中赋予保护免受昆虫损害。
本发明的另一个方面包括杀昆虫组合物和配制品,这些组合物和配制品包含本发明的Cry蛋白或苏云金芽孢杆菌菌株;以及使用这些组合物或配制品来控制昆虫群体的方法,例如通过将这些组合物或配制品施用至昆虫侵袭的区域,或者施用至预防性处理易感染昆虫的区域或植物以赋予针对昆虫有害生物的保护。任选地,除本发明的Cry蛋白或Bt菌株之外,本发明的这些组合物或配制品还可以包含其他杀有害生物剂(如化学杀有害生物剂)以加强或增强组合物或配制品的昆虫控制能力。
本发明的这些组合物和方法可用于控制攻击植物、特别是作物植物的昆虫有害生物。本发明的这些组合物对于产生改变的或改进的具有杀有害生物活性的Cry蛋白、或对于检测商用产品或转基因生物中的Cry蛋白或核酸的存在也是有用的。
参考以下详细的说明和权利要求书,本发明的这些和其他特征、方面、以及优点将变得更好理解。
序列表中的序列简述
SEQ ID NO:1是编码BT204蛋白的组装的多核苷酸。
SEQ ID NO:2是编码BT235蛋白的组装的多核苷酸。
SEQ ID NO:3是编码BT645蛋白的组装的多核苷酸。
SEQ ID NO:4是编码BT727蛋白的组装的多核苷酸。
SEQ ID NO:5是编码BT1047蛋白的组装的多核苷酸。
SEQ ID NO:6是编码BT1280蛋白的组装的多核苷酸。
SEQ ID NO:7是编码BT1555蛋白的组装的多核苷酸。
SEQ ID NO:8是编码BT1559蛋白的组装的多核苷酸。
SEQ ID NO:9是编码BT1563蛋白的组装的多核苷酸。
SEQ ID NO:10是编码BT1571蛋白的组装的多核苷酸。
SEQ ID NO:11是编码BT1633蛋白的组装的多核苷酸。
SEQ ID NO:12是编码BT204的玉蜀黍密码子优化序列。
SEQ ID NO:13是编码BT235的玉蜀黍密码子优化序列。
SEQ ID NO:14是编码BT645的玉蜀黍密码子优化序列。
SEQ ID NO:15是编码BT727的玉蜀黍密码子优化序列。
SEQ ID NO:16是编码BT1047的玉蜀黍密码子优化序列。
SEQ ID NO:17是编码BT1280的玉蜀黍密码子优化序列。
SEQ ID NO:18是编码BT1555的玉蜀黍密码子优化序列。
SEQ ID NO:19是编码BT1559的玉蜀黍密码子优化序列。
SEQ ID NO:20是编码BT1563的玉蜀黍密码子优化序列。
SEQ ID NO:21是编码BT1571的玉蜀黍密码子优化序列。
SEQ ID NO:22是编码BT1633的玉蜀黍密码子优化序列。
SEQ ID NO:23是编码mBT204的玉蜀黍密码子优化序列。
SEQ ID NO:24是编码mBT235的玉蜀黍密码子优化序列。
SEQ ID NO:25是编码mBT645的玉蜀黍密码子优化序列。
SEQ ID NO:26是编码mBT645-2的大豆密码子优化序列。
SEQ ID NO:27是编码mBT645-3的大豆密码子优化序列。
SEQ ID NO:28是编码mBT727的玉蜀黍密码子优化序列。
SEQ ID NO:29是编码mBT1047的玉蜀黍密码子优化序列。
SEQ ID NO:30是编码mBT1280的玉蜀黍密码子优化序列。
SEQ ID NO:31是编码mBT1555的玉蜀黍密码子优化序列。
SEQ ID NO:32是编码mBT1559的玉蜀黍密码子优化序列。
SEQ ID NO:33是编码mBT1563的玉蜀黍密码子优化序列。
SEQ ID NO:34是编码mBT1571的玉蜀黍密码子优化序列。
SEQ ID NO:35是编码mBT1633的玉蜀黍密码子优化序列。
SEQ ID NO:36是BT204蛋白的氨基酸序列。
SEQ ID NO:37是BT235蛋白的氨基酸序列。
SEQ ID NO:38是BT645蛋白的氨基酸序列。
SEQ ID NO:39是BT727蛋白的氨基酸序列。
SEQ ID NO:40是BT1047蛋白的氨基酸序列。
SEQ ID NO:41是BT1280蛋白的氨基酸序列。
SEQ ID NO:42是BT1555蛋白的氨基酸序列。
SEQ ID NO:43是BT1559蛋白的氨基酸序列。
SEQ ID NO:44是BT1563蛋白的氨基酸序列。
SEQ ID NO:45是BT1571蛋白的氨基酸序列。
SEQ ID NO:46是BT1633蛋白的氨基酸序列。
SEQ ID NO:47是突变型BT204(mBT204)蛋白的氨基酸序列。
SEQ ID NO:48是突变型BT235(mBT235)蛋白的氨基酸序列。
SEQ ID NO:49是突变型BT645(mBT645)蛋白的氨基酸序列。
SEQ ID NO:50是突变型BT645-2(mBT645-2)蛋白的氨基酸序列。
SEQ ID NO:51是突变型BT645-3(mBT645-3)蛋白的氨基酸序列。
SEQ ID NO:52是突变型BT727(mBT727)蛋白的氨基酸序列。
SEQ ID NO:53是突变型BT1047(mBT1047)蛋白的氨基酸序列。
SEQ ID NO:54是突变型BT1280(mBT1280)蛋白的氨基酸序列。
SEQ ID NO:55是突变型BT1555(mBT1555)蛋白的氨基酸序列。
SEQ ID NO:56是突变型BT1559(mBT1559)蛋白的氨基酸序列。
SEQ ID NO:57是突变型BT1563(mBT1563)蛋白的氨基酸序列。
SEQ ID NO:58是突变型BT1571(mBT1571)蛋白的氨基酸序列。
SEQ ID NO:59是突变型BT1633(mBT1633)蛋白的氨基酸序列。
SEQ ID NO:60-66是Cry1I蛋白的氨基酸序列。
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明预期了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。此外,鉴于本披露内容,本文建议的不同实施例的众多变化以及增加物对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在本文的发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。
定义
如本文和所附权利要求所使用的,单数形式“一个/一种(a/an)”和“所述/该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等。
如本文所使用的,词语“和/或”是指并且涵盖一个或多个相关联的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。
术语“约”本文用于意指大约、大致、约或在……左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐述的数值来限定这个范围。一般而言,术语“约”本文用于将数值限定至以20%的变化,优选地10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,确切值(即,无“约”)是优选的。
如本文所使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。扩增系统包括聚合酶链式反应(PCR)系统、连接酶链式反应(LCR)系统、基于核酸序列的扩增(NASBA,安大略省密西索加的坎基尼公司(Cangene,Mississauga,Ontario))、Q-β复制酶系统、基于转录的扩增系统(TAS)、以及链置换扩增(SDA)。参见,例如,Diagnostic Molecular Microbiology:Principles andApplications[诊断分子微生物学:原理与应用],PERSING等人编,American Society forMicrobiology[美国微生物学会],华盛顿(Washington,D.C.),(1993)。扩增的产物被称为“扩增子”。
根据本发明的“组装的序列”、“组装的多核苷酸”、“组装的核苷酸序列”等是通过比对多核苷酸或测序的多核苷酸的部分(即k-mer,通过DNA测序获得的读数的长度k的所有可能的子序列)的重叠序列制备的合成多核苷酸,其使用DNA测序技术从基因组DNA确定。组装的序列典型地含有碱基识别(base-calling)错误,与获得基因组DNA的基因组中包含的天然DNA序列相比,碱基识别错误可能是错误确定的碱基、插入和/或缺失。因此,例如,“组装的多核苷酸”可以编码蛋白质,并且根据本发明,该多核苷酸和该蛋白质二者都不是天然产物,而是仅通过人类行为而存在。
如本文所使用的,术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”(或类似术语)是指如下构建体或分子,该构建体或分子包含被组装进单个核酸分子中的不同来源的两个或更多个多核苷酸。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,该构建体或分子含有但不限于(1)多核苷酸(例如,DNA),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包含衍生自不同来源的调节多核苷酸和编码多核苷酸,或包含衍生自相同来源、但以与在自然界中所发现的不同的方式进行布置的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、特别地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。
“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。优选地,RNA进而在生物中被翻译以产生蛋白。
如本文所使用的,“密码子优化的”序列意指如下核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由待优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组DNA构建体的DNA序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014,通过引用并入本文。
“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
术语“包含(comprises或comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。
如本文所使用的,过渡短语“基本上由……组成”(以及语法变体)意指,权利要求的范围有待被解读为涵盖权利要求中所列举的指定材料或步骤以及非实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。
在本发明的上下文中,“对应于(corresponding to或corresponds to)”意指当变体或同系物Cry蛋白的氨基酸序列与彼此比对时,“对应于”在该变体或同系物蛋白中某些枚举的位置的氨基酸是与参考蛋白中的这些位置对齐的那些,但不一定是位于这些精确的数字位置(相对于本发明的特定参考氨基酸序列)的那些。例如,如果SEQ ID NO:36是参考序列并且与SEQ ID NO:38比对的话,SEQ ID NO:38的Thr237“对应于”SEQ ID NO:36的Thr241,或者例如,SEQ ID NO:38的Ala601“对应于”SEQ ID NO:36的Val605。
如本文所使用的,术语“Cry蛋白”意指可以在苏云金芽孢杆菌或相关细菌中以晶体形式存在的杀昆虫蛋白,或者可以是在营养生长期间分泌到Bt细胞外的具有Cry蛋白样结构域(例如结构域I、II和III)的可溶性蛋白。术语“Cry蛋白”可以指原毒素形式或其任何杀昆虫片段或毒素。
“递送”组合物或毒性蛋白意指该组合物或毒性蛋白与昆虫接触,这促进该组合物或毒性蛋白的经口摄取,产生对昆虫的毒性作用和控制。可以按照许多公认的方式,包括但不限于转基因植物表达、一种或多种配制的蛋白组合物、一种或多种可喷洒的蛋白组合物、饵基(bait matrix)、或任何其他的领域公认的蛋白递送系统来递送该组合物或毒性蛋白。
术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽组。
“有效的昆虫控制量”意指毒性蛋白的浓度,它通过毒性作用抑制昆虫存活、生长、摄食或繁殖的能力,或者限制昆虫相关的损害或作物植物损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“有效的昆虫控制量”可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
如本文所使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种目的多核苷酸(例如编码本发明的Cry蛋白的多核苷酸)的表达的核酸序列,包括启动子,该启动子可操作地连接至目的多核苷酸,该多核苷酸可操作地连接至终止信号。“表达盒”还典型地包含正确翻译目的多核苷酸所需的另外的多核苷酸。该表达盒还可以包含在目的多核苷酸的直接表达中不是必需的但是由于用于从一个表达载体去除该表达盒的方便限制位点而存在的其他多核苷酸。包含一个或多个目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即在该表达盒中的目的多核苷酸不是天然存在于该宿主细胞中的,并且必须已经通过转化过程或育种过程引入到该宿主细胞或该宿主细胞的祖先中。该表达盒中的一个或多个目的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。
“基因”在本文定义为包括一个或多个多核苷酸的遗传单位,该遗传单位占据染色体或质粒上特定位置并且包含用于生物中的特定特征或性状的遗传指令。
“肠蛋白酶”是在昆虫的消化道中天然发现的蛋白酶。这种蛋白酶通常参与被摄取的蛋白质的消化。肠蛋白酶的实例包括胰蛋白酶,其典型地切割赖氨酸(K)或精氨酸(R)残基的C-末端侧上的肽;以及胰凝乳蛋白酶,其典型地切割苯丙氨酸(F)、色氨酸(W)或酪氨酸(Y)的C-末端侧上的肽。
当提及基因或多核苷酸或多肽使用时,术语“异源”是指基因或多核苷酸或多肽不是在其天然环境中或含有其非天然环境中存在的一部分(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的多核苷酸。异源基因还可以包括对生物来说是天然的多核苷酸,该多核苷酸已经以一些方式(例如,经突变;以多个拷贝添加;连接至一种非天然启动子或增强子多核苷酸等)被改变。异源基因可以包括植物基因多核苷酸,该植物基因多核苷酸包括植物基因的cDNA形式;这些cDNA可以以正义方向(以产生mRNA)或反义方向(以产生一种与mRNA转录本是互补的反义RNA转录本)被表达。在本发明的一个方面,异源基因与内源性植物基因的区别在于该异源基因多核苷酸被典型地连接至包含调节元件如启动子的多核苷酸上,未发现这些多核苷酸与由该异源基因编码的蛋白质的基因或与该染色体中的植物基因多核苷酸天然相关联,或者与在自然界中未发现的染色体的部分(例如,在该基因通常不表达的基因座中表达的基因)相关联。另外,“异源”多核苷酸是指不与多核苷酸被引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。
“同源重组”是在相同的多核苷酸的区域中成对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“交叉”)。“重组事件”在本文被理解为意指减数分裂交叉。
当核酸序列编码了多肽(该多肽与由参考核酸序列所编码的多肽具有相同的氨基酸序列)时,这种核苷酸序列与这种参考核酸序列“同类编码”。例如,SEQ ID NO:12与SEQID NO:1为同类编码,因为它们都编码由SEQ ID NO:36代表的氨基酸序列。
术语“分离的”核酸分子、多核苷酸或蛋白质是不再存在于其天然环境中的核酸分子、多核苷酸或蛋白质。本发明的分离的核酸分子、多核苷酸或蛋白质可以按照纯化的形式存在,或者可以存在于重组宿主中,例如转基因细菌或转基因植物中。因此,如本文所列举的对“分离的”核酸分子的权利要求涵盖当核酸分子包含在转基因植物基因组内时的核酸分子。
“核酸分子”是可以从任何来源中分离的或可以合成制备的单链或双链DNA或RNA。在本发明的上下文中,该核酸分子优选地是DNA区段。
“可操作地连接”是指在单一核酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能RNA的表达时(即,该编码多核苷酸或功能RNA处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能RNA是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。
如本文所使用的“杀有害生物”、“杀昆虫”等是指本发明的Cry蛋白控制有害生物的能力或者可以控制如本文所定义的有害生物的Cry蛋白的量。因此,杀有害生物Cry蛋白可以杀死或抑制有害生物(例如,昆虫有害生物)存活、生长、摄食、或繁殖的能力。
“植物”是在发育的任何阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。
“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花芽或胚。
如本文所使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。
“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括DNA、RNA、经修饰的寡核苷酸(例如,包含对于生物RNA或DNA非典型的碱基的寡核苷酸,如2'-O-甲基化寡核苷酸)等。在一些实施例中,核酸或多核苷酸可以是单链的、双链的、多链的或其组合。除非另有说明,否则除任何明确指示的多核苷酸之外,本发明的具体核酸或多核苷酸任选地还包含或编码互补多核苷酸。
“目的多核苷酸”是指任何多核苷酸,当将其转移至生物(例如,植物)中时赋予该生物所希望的特征,如昆虫抗性、疾病抗性、除草剂耐受性、抗生素抗性、改进的营养价值、工业过程中改进的性能、商业上有价值的酶或代谢物的产生、或者改变的繁殖能力。
术语“启动子”是指多核苷酸,通常在它的编码多核苷酸的上游(5'),它通过提供对正确转录所需的RNA聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。
“原生质体”是分离的植物细胞,没有细胞壁或仅具有部分的细胞壁。
如本文所使用的,术语“重组”是指核酸分子(例如,DNA或RNA)或蛋白或生物的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如本文所使用的,“重组核酸分子”是包含多核苷酸组合的核酸分子,这些多核苷酸不会天然地共同存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,或人工合成的(例如,使用组装的核苷酸序列合成的多核苷酸)并且包含不同于通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,或包含人工掺入至宿主细胞的基因组DNA中和该宿主细胞基因组相关侧翼DNA中的转基因的核酸分子。重组核酸分子的另一个实例是由将转基因插入至植物的基因组DNA中产生的DNA分子,其可以最终导致该生物中的重组RNA/或蛋白分子的表达。如本文所使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,重组植物明显不同于相关的野生型植物。
“调节元件”是指参与控制核苷酸序列的表达的序列。调节元件包含可操作地连接至目的核苷酸序列的启动子以及终止信号。它们还典型地涵盖适当翻译该核苷酸序列所需的序列。
在两个核酸或氨基酸序列的上下文中,术语“同一性”或“相同的”或“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少60%、优选至少80%、更优选90%、甚至更优选95%、并且最优选至少99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,基本的同一性存在于整个具有长度为至少约50个残基或碱基的序列的区域中,更优选地在整个至少约100个残基或碱基的区域中,并且最优选地这些序列在至少约150个残基或碱基上是基本上相同的。在一个尤其优选的实施例中,这些序列在整个编码区域长度中是基本上相同的。此外,基本上相同的核酸或氨基酸序列基本上执行相同的功能。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。
用于比较的序列的最佳比对可以按照以下方式进行,例如通过Smith和Waterman,Adv.Appl.Math.[应用数学进展]2:482(1981)的局部同源性算法、通过Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443(1970)的同源比对算法、通过Pearson和Lipman,Proc.Nat'l.Acad.Sci.USA[美国国家科学院院刊]85:2444(1988)的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包(Wisconsin GeneticsSoftware Package)中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算机组(GeneticsComputer Group),科学街575号,麦迪逊,威斯康星州),或通过目测检查(总体上参见Ausubel等人,下文)。
适于确定序列同一性百分比以及序列相似性的算法的一个实例是BLAST算法,其描述于以下文献中:Altschul等人,J.Mol.Biol.[分子生物学杂志]215:403-410(1990)。执行BLAST分析的软件是通过国家生物技术信息中心(the National Center forBiotechnology Information,美国国家医学图书馆(U.S.National Library ofMedicine),美国洛克维尔大道8600号(8600Rockville Pike),贝塞斯达,马里兰州20894)可供公众使用的。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈(Altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff和Henikoff,Proc.Natl.Acad Sci.USA[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分比之外,BLAST算法还进行两个序列之间相似性的统计分析(参见例如,Karlin和Altschul,Proc.Nat'l.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。
两个核酸序列基本上相同的另一个指示是这两种分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)DNA或RNA中时进行的。“基本上结合”是指在探针核酸与靶核酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格度来调适,以实现靶核酸序列的所希望的检测。
在核酸杂交实验(如DNA杂交和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列在较高的温度下特异性杂交。对核酸杂交的广泛指导见于以下文献中:Tijssen(1993)LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy of nucleic acidprobe assays[杂交原理和核酸探针测定策略综述]”Elsevier[爱思唯尔集团],纽约。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶序列进行杂交,但不会与其他序列杂交。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的Tm。对于互补核酸(它们在DNA或RNA印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15M NaCl在72℃下持续约15分钟。严格洗涤条件的实例是0.2×SSC洗涤在65℃下持续15分钟(参见,Sambrook,下文,对于SSC缓冲液的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的中等严格洗涤的实例是1×SSC在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6×SSC在40℃下持续15分钟。对于短探针(例如,约10至50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐类),并且该温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的核酸所编码的蛋白是基本上相同的,则它们仍然是基本上相同的。例如,当使用遗传密码允许的最大程度的密码子简并而创建核酸的拷贝时,则发生这种情况。
以下是可以用来克隆同源核苷酸序列(这些序列与本发明的参考核苷酸序列基本上相同)的杂交/洗涤条件的设置的实例:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在2×SSC、0.1%SDS中在50℃洗涤;更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在1×SSC、0.1%SDS中在50℃洗涤;仍更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.5×SSC、0.1%SDS中在50℃洗涤;优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在50℃洗涤;更优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在65℃洗涤。
两个核酸序列或蛋白基本上相同的另一个指示是由第一核酸编码的蛋白与由第二核酸编码的蛋白进行免疫性交联反应或与其特异性结合。因此,蛋白典型地是与第二蛋白基本上一致的,例如其中这两种蛋白仅区别于保守性取代。
如本文所使用的,“合成多核苷酸”是指包含天然存在的多核苷酸中不存在的碱基或结构性特征的多核苷酸。例如,编码本发明的Cry蛋白的合成多核苷酸(其包含更类似于双子叶植物或单子叶植物基因的G+C含量和正常密码子分布的核苷酸序列)被表述为合成的。本发明的合成多核苷酸还可以例如包含本发明的组装的核苷酸序列。
如本文所使用的,对昆虫有害生物是“有毒的”Cry蛋白意指该Cry蛋白充当口服活性的昆虫控制剂以杀死昆虫有害生物,或者该Cry蛋白能够破坏或阻止昆虫摄食、或引起对昆虫有害生物的生长抑制,其两者可以引起或可以不引起昆虫死亡。当本发明的Cry蛋白被递送至昆虫或昆虫与Cry蛋白进行经口接触时,结果典型地是该昆虫的死亡、或者该昆虫的生长减慢、或者该昆虫停止以使该有毒的Cry蛋白可供该昆虫利用的来源为食。
“转化”是用于将异源核酸引入到宿主细胞或生物的方法。特别地,“转化”意指DNA分子稳定地整合到目的生物的基因组中。
“转化的/转基因的/重组的”是指异源核酸分子已经引入其中的宿主生物(例如细菌或植物)。核酸分子可以被稳定地整合到宿主的基因组中,或者核酸分子还可以作为染色体外分子存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含该异源的核酸分子的野生型生物,例如细菌或植物。
核苷酸在本文中由以下标准缩写表示:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。氨基酸也由以下标准缩写表示:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;1)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。
本发明提供了用于控制有害的植物有害生物的组合物以及方法。特别地,本发明涉及由分离自细菌(如苏云金芽孢杆菌)的基因组DNA组装的多核苷酸编码的Cry样蛋白,该Cry样蛋白对昆虫有害生物是有毒的;并且涉及包含编码这些Cry样蛋白的核苷酸序列的组装的多核苷酸和相关多核苷酸;以及涉及制备和使用这些组装的多核苷酸和相关多核苷酸以及Cry蛋白来控制昆虫有害生物。
根据一些实施例,本发明提供了核酸分子或任选地分离的核酸分子,该核酸分子或任选地分离的核酸分子包含以下、基本上由以下组成、或由以下组成:编码处于其原毒素形式的Cry蛋白或其生物活性片段或毒素片段的核苷酸序列,其中该核苷酸序列(a)与SEQID NO:1-11中任一项的组装的序列或其毒素编码片段具有至少80%到至少99%序列同一性;或者(b)编码包含如下氨基酸序列的蛋白,该氨基酸序列与SEQ ID NO:36-46中任一项或其毒素片段具有至少80%到至少99%序列同一性;或者(c)是(a)或(b)的组装的核苷酸序列;或者(d)是(a)、(b)或(c)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,该核苷酸序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、或SEQ ID NO:1-11中任一项的任何毒素编码片段。在其他实施例中,该合成核苷酸序列包含SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:33、SEQ ID NO:34、SEQ ID NO:35、或SEQ ID NO:12-35中任一项的任何毒素编码片段。
本发明还涵盖多核苷酸,该多核苷酸是编码Cry蛋白原毒素的多核苷酸的片段。“片段”旨在编码Cry蛋白的核苷酸序列的一个部分。核苷酸序列的片段可以编码Cry蛋白的生物活性部分,即所谓的“毒性片段”,或它可以是如下片段,使用以下披露的方法该片段可以用作杂交探针或PCR引物。编码Cry蛋白的核苷酸序列的片段的核酸分子根据所期望的用途包括至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸,或高达比本文所披露的全长Cry蛋白编码核苷酸序列少一个密码子的核苷酸的数目(例如,针对SEQ ID NO:1是2157个核苷酸)。“连续的”核苷酸旨在彼此直接相邻的核苷酸残基。本发明的核苷酸序列的一些片段将编码保留Cry蛋白的生物活性、并且因此保留杀昆虫活性的毒性片段。“保留杀昆虫活性”旨在该片段将具有至少约30%、优选地至少约50%、更优选地至少约70%、甚至更优选地至少约80%的Cry蛋白的杀昆虫活性。用于测量杀昆虫活性的方法在本领域是熟知的。参见例如,Czapla和Lang(1990)J.Econ.Entomol.[经济昆虫学杂志]83:2480-2485;Andrews等人(1988)Biochem.J.[生物化学杂志]252:199-206;Marrone等人(1985)J.of Economic Entomology[经济昆虫学杂志]78:290-293;和美国专利号5,743,477,将其全部通过引用以其全文并入本文。
本发明的Cry蛋白的毒素片段将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、和450个连续的氨基酸,或高达比本发明的全长Cry蛋白少一个氨基酸的长度(例如,针对SEQ ID NO:36是718个氨基酸)。
在一些实施例中,本发明的核酸分子包含以下、基本上由以下组成、或由以下组成:编码包含如下氨基酸序列的Cry蛋白的核苷酸序列,该氨基酸序列与SEQ ID NO:36-46中任一项或其毒素片段具有至少80%到至少99%序列同一性。在一些其他实施例中,该氨基酸序列包含以下、基本由以下组成、或由以下组成:SEQ ID NO:36-46中任一项或其毒素片段。因此,在一些实施例中,借助于蛋白酶水解加工(例如通过从昆虫的肠中制备的蛋白酶)而已经被激活的Cry蛋白可以被表征并且经激活的毒素片段的N-末端或C-末端氨基酸被鉴定。在本发明的这个方面,本领域技术人员可以确定:例如,SEQ ID NO:36的毒素片段可以包含SEQ ID NO:36的约149-719个或约153-719个氨基酸,或者在N-末端包含分泌信号的Cry蛋白可以去除分泌信号以产生该蛋白的毒素片段,例如SEQ ID NO:38的毒素片段可以包含约33-715个氨基酸,或者通过在该编码序列的适当的位置处引入或消除蛋白酶加工位点以允许、或消除昆虫、植物或微生物蛋白酶对较大变体蛋白的蛋白水解切割而产生的Cry蛋白变体的毒素片段也在本发明的范围内。此类操作的最终结果被理解为产生具有与完整Cry原毒素蛋白相同或更好活性的毒素片段分子。
在本发明的一些实施例中,提供了嵌合基因,该嵌合基因包含可操作地连接至多核苷酸的异源启动子,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码对鳞翅目有害生物有毒的Cry蛋白的核苷酸序列,其中该核苷酸序列(a)与SEQ ID NO:1-11中任一项或其毒素编码片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(b)编码包含如下氨基酸序列的蛋白,该氨基酸序列与SEQ ID NO:36-46中任一项或其毒素片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
在其他实施例中,该异源启动子是植物可表达型启动子。例如但不限于,该植物可表达型启动子选自下组启动子,该组由以下组成:泛素、夜香树属黄病毒、玉米TrpA、OsMADS6、玉蜀黍H3组蛋白、噬菌体T3基因9 5'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基RuBP羧化酶、水稻肌动蛋白、水稻亲环蛋白、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白(potato patatin)、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
在另外的实施例中,由嵌合基因编码的蛋白质对一种或多种鳞翅目有害生物是有毒的,这些鳞翅目有害生物选自由以下组成的组:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。
在另外的实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:与SEQ ID NO:1或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:2或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:3或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:4或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:5或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:6或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:7或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:8或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:9或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:10或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列,或者与SEQ ID NO:11或其毒素编码片段具有至少85%到至少99%序列同一性的核苷酸序列。在其他实施例中,该多核苷酸包含以下、基本由以下组成、或由以下组成:SEQ ID NO:1-11中任一项或其毒素编码片段。
在其他实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白的核苷酸序列,该蛋白包含以下、基本上由以下组成、或由以下组成:与SEQ IDNO:36-46中任一项或其毒素片段具有至少80%到至少99%序列同一性的氨基酸序列。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:36或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:37或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:38或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:39或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:40或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:41或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:42或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:43或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:44或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:45或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:46或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列的合成序列,该核苷酸序列的合成序列与SEQID NO:12-35中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白的核苷酸序列的合成序列,该蛋白包含如下氨基酸序列,该氨基酸序列与SEQID NO:36-59中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在另外的实施例中,该转基因生物是转基因细菌或转基因植物。
在一些实施例中,本发明提供了合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:编码对鳞翅目有害生物有毒的蛋白的核苷酸序列,其中该核苷酸序列与SEQ ID NO:12-35中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,本发明提供了合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:编码对鳞翅目有害生物有毒的蛋白的核苷酸序列,其中该核苷酸序列编码如下氨基酸序列,该氨基酸序列与SEQ ID NO:36-46中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
可以使用来自苏云金芽孢杆菌(Bt)菌株的基因组来组装本发明的Cry蛋白。Bt菌株可以通过标准技术分离并且测试对本发明的鳞翅目有害生物的毒性或用于分离基因组DNA而不测试Bt菌株对昆虫的毒性。通常,Bt菌株可以通过本领域中已知的方法分离自任何环境样品,包括土壤、植物、昆虫、谷物升降机粉尘、以及其他样品材料等。参见例如,Travers等人(1987)Appl.Environ.Microbiol.[应用环境微生物学]53:1263-1266;Saleh等人(1969)Can J.Microbiol.[加拿大微生物学杂志]15:1101-1104;DeLucca等人(1981)Can J.Microbiol.[加拿大微生物学杂志]27:865-870;和Norris等人(1981)“The generaBacillus and Sporolactobacillus[芽孢杆菌属和芽孢乳杆菌属]”,于Starr等人(编辑),The Prokaryotes:A Handbook on Habitats,Isolation,and Identification ofBacteria[原核生物:关于细菌的栖息地、分离和鉴别手册],第II卷,Springer-Verlog[施普林格出版社]柏林海德堡。分离之后,可以测试Bt菌株对于昆虫有害生物的毒性并且可以鉴定由本发明涵盖的Cry蛋白。因此,在一些实施例中,本发明提供了分离的苏云金芽孢杆菌(Bt)菌株,该菌株产生Cry蛋白或重组Cry蛋白,该Cry蛋白或重组Cry蛋白包含以下、基本上由以下组成、或由以下组成:与SEQ ID NO:35-56中任一项具有至少80%到至少99%序列同一性的氨基酸序列。在仍另外的实施例中,该Cry蛋白或重组Cry蛋白包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:36-59中的任一项。
根据一些实施例,本发明提供了对鳞翅目有害生物有毒的Cry蛋白,并且任选地对鳞翅目有害生物有毒的分离的Cry蛋白,其中该Cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)与SEQ ID NO:36-46中任一项所示的的氨基酸序列或者其毒素片段具有至少80%序列同一性到至少99%序列同一性的氨基酸序列;或者(b)由与SEQ ID NO:1-11中任一项所示的或其毒素编码片段的核苷酸序列具有至少80%序列同一性到至少99%序列同一性的核苷酸序列或组装的核苷酸序列编码的氨基酸序列。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:36或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:37或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:38或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:39或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:40或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:41或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:42或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:43或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:44或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:45或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与SEQ ID NO:46或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,该氨基酸序列包含以下、基本上由以下组成、或由以下组成:SEQID NO:36-59中任一项或其毒素片段。在其他实施例中,该氨基酸序列是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:1-35中任一项或其毒素编码片段。
在其他实施例中,本发明的Cry蛋白对鳞翅目有害生物是有毒的,该鳞翅目有害昆虫选自由以下组成的组:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。在其他实施例中,本发明的Cry蛋白对至少玉米蛀虫(亚洲玉米螟)是有毒的。
在一些实施例中,本发明涵盖对鳞翅目有害生物有毒的突变型Cry蛋白,其中该突变型Cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)与SEQ ID NO:47-59中任一项所示的氨基酸序列或其毒素片段具有至少80%到至少99%序列同一性的氨基酸序列;或者(b)由与SEQ ID NO:23-35中任一项所示的或其毒素编码片段的核苷酸序列具有至少80%到至少99%序列同一性的核苷酸序列编码的氨基酸序列。
在其他实施例中,该突变型Cry蛋白包含以下、基本上由以下组成、或由以下组成:与SEQ ID NO:47-59中任一项或其毒素片段具有至少80%到至少99%序列同一性的氨基酸序列。在仍其他实施例中,该氨基酸序列与SEQ ID NO:47或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:48或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:49或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:50或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:51或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:52或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:53或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:54或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:55或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:56或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:57或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:58或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:59或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该突变型Cry蛋白包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:47-59中任一项的氨基酸序列或其毒素片段。在其他实施例中,该突变型Cry蛋白是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本由以下组成、或由以下组成:SEQ ID NO:23-35中任一项或其毒素编码片段。
本发明还涵盖响应于通过组装的或突变型BT204、BT235、BT645、BT727、BT1027、BT1280、BT1555、BT1559、BT1563、BT1571和BT1633、或相关Cry蛋白(包括天然Cry蛋白)的免疫激发而产生的抗体。此类抗体可以使用生产多克隆抗血清的标准免疫学技术生产,并且如果需要的话,无限增殖免疫宿主的抗体产生细胞用于单克隆抗体生产源。用于生产任何目的物质的抗体的技术是熟知的,例如如在以下文献中:Harlow和Lane(1988.Antibodiesa laboratory manual.[抗体实验室手册]第726页.Cold Spring Harbor Laboratory[冷泉港实验室])和Goding(Monoclonal Antibodies:Principles&practice.[单克隆抗体:原理与实践]1986.Academic Press,Inc.[美国学术出版社公司],佛罗里达州奥兰多市(Orlando,FL))。本发明涵盖杀昆虫蛋白,其与针对本发明的杀昆虫Cry蛋白中的一种或多种而产生的抗体(特别是单克隆抗体)交叉反应。
本发明中生产的这些抗体在用于在免疫测定中确定生物样品中组装的或突变型BT204、BT235、BT645、BT727、BT1027、BT1280、BT1555、BT1559、BT1563、BT1571和BT1633 Cry蛋白、或相关Cry蛋白(包括天然Cry蛋白)的量或存在也是有用的。此类测定在质量控制生产含有本发明的Cry蛋白中的一种或多种或相关毒性蛋白的组合物中也是有用的。此外,这些抗体可以用来评估本发明的Cry蛋白中的一种或多种或相关蛋白的重组生产的功效,连同针对编码本发明的Cry蛋白中的一种或多种的核苷酸序列或相关蛋白编码序列的存在而筛选表达文库的功效。抗体还作为亲和配体用于纯化或分离本发明的蛋白中的任何一种或多种以及相关蛋白是有用的。本发明的Cry蛋白和含有相关抗原表位的蛋白可以通过在优选的宿主细胞中过度表达编码全部或部分本发明的Cry蛋白或相关蛋白的序列的全长或部分长度来获得。
应当认识到,可以通过不同方法来改变编码本发明的Cry蛋白的组装的DNA序列,并且这些改变可以产生编码如下蛋白的DNA序列,这些蛋白具有不同于由本发明的组装的Cry蛋白所编码的氨基酸序列。所得的突变型Cry蛋白可以按照不同的方式进行改变,包括SEQ ID NO:36-46中任一项的一个或多个氨基酸的氨基酸取代、缺失、截短、以及插入,包括多达约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155个、或更多个氨基酸取代、缺失或插入。用于此类操作的方法在本领域中通常是已知的。例如,通过在编码该蛋白质的多核苷酸中的突变可以制备天然Cry蛋白的氨基酸序列变体。这还可以通过若干种诱变形式之一或在定向进化中来完成。在一些方面中,在该氨基酸序列中所编码的改变将基本上不影响该蛋白质的功能。此类变体将具有所希望的杀昆虫活性。在本发明的一些实施例中,SEQ ID NO:1-11所示的核苷酸序列被改变,以在编码的蛋白中引入氨基酸取代。在其他实施例中,所得的突变型蛋白是由合成的突变型多核苷酸编码的,该多核苷酸包含SEQ ID NO:23-35中任一项所示的核苷酸序列。在其他实施例中,该突变型Cry蛋白包含以下、基本上由以下组成、或由以下组成:SEQ ID NO:47-59中任一项所示的氨基酸序列。
应当理解的是可以通过使用此类技术改善杀昆虫蛋白对本发明的这些组合物赋予杀昆虫活性的能力。例如,可以在以下宿主细胞中表达Cry蛋白,这些宿主细胞在DNA复制过程中表现出高比率的碱基错误结合,如XL-1Red(斯特塔杰公司(Stratagene),拉荷亚(LaJolla),加利福尼亚州)。在此类菌株中繁殖之后,可以分离出DNA(例如通过制备质粒DNA,或通过PCR进行扩增并且将得到的PCR片段克隆到载体中),在非诱变菌株中培养这些Cry蛋白突变体,并且鉴定具有杀昆虫活性的经突变的基因,例如通过进行试验测试杀昆虫活性。通常,在摄食试验中混合并使用了该蛋白。参见例如Marrone等人,(1985),J.of EconomicEntomology[经济昆虫学杂志]78:290-293。此类试验可以包括使植物与一种或多种有害生物接触,并且确定该植物存活或引起这些有害生物死亡的能力。导致毒性提高的突变的实例见于Schnepf等人,(1998),Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:775-806中。
可替代地,可以在氨基或羧基的末端上对本发明的氨基酸序列进行改变,而基本上不影响活性。这可以包括通过现代分子方法所引入的插入、缺失、或改变,这些方法是如PCR,包括PCR扩增,这些PCR扩增借助于将编码氨基酸的序列包含到在PCR扩增中所使用的寡核苷酸之中而改变或延长该蛋白质编码序列。可替代地,所添加的蛋白序列可以包括完整的蛋白编码序列,如在本领域内通常用于产生蛋白融合物的那些序列。此类融合蛋白常常用于(1)提高目的蛋白的表达;(2)引入结合结构域、酶活性、或表位以促进蛋白纯化、蛋白检测、或本领域已知的其他实验用途;(3)将蛋白的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白的糖基化。
本发明的Cry蛋白还可以被突变以引入表位来产生识别该经突变的蛋白的抗体。因此,在一些实施例中,本发明提供了经突变的Cry蛋白,其中在天然Cry蛋白中的氨基酸取代产生了具有抗原区域的突变型Cry蛋白,该抗原区域允许该突变型Cry蛋白在蛋白质检测分析中区别于该天然Cry蛋白。
在一些实施例中,本发明提供了制备如下抗体的方法,该抗体从衍生出经突变的Cry蛋白的组装的或相关的天然Cry蛋白中差异性地识别出经突变的Cry蛋白,该方法包括以下步骤:在组装的或天然Cry蛋白的抗原环中取代氨基酸;并且产生特异性识别经突变Cry蛋白的经突变抗原环但不识别该组装的或天然Cry蛋白的抗体。在一个实施例中,该抗原环在组装的或天然Cry蛋白的结构域I外部的非保守区域中被鉴别出。在另一个实施例中,该抗原环不是参与Cry蛋白的昆虫肠受体识别或参与Cry蛋白的蛋白酶活化的环。
本发明的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如DNA改组)所衍生的序列。使用此类程序,可以将一个或多个不同的毒性蛋白编码区用来创造出具有所希望特性的新的毒性蛋白。以这种方式,从相关序列多核苷酸的群体产生重组多核苷酸文库,这些相关序列多核苷酸包含如下序列区域,这些序列区域具有基本的序列同一性并且可以在体外或体内进行同源重组。例如,使用这种方法,可以将编码目的结构域的序列基序在本发明的杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码如下蛋白的新基因,该蛋白具有改善的目的特性,如增加的杀昆虫活性。用于此种DNA改组的策略在本领域中是已知的。参见例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:10747-10751;Stemmer(1994)Nature[自然]370:389-391;Crameri等人(1997)Nature Biotech.[自然生物技术]15:436-438;Moore等人(1997)J.Mol.Biol.[分子生物学杂志]272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]94:4504-4509;Crameri等人(1998)Nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。
结构域交换或改组是用于产生本发明的经改变的Cry蛋白的另一种机制。可以在Cry蛋白之间交换结构域,从而产生具有改进的杀有害生物活性或靶标谱的杂合或嵌合毒性蛋白。用于产生重组蛋白和测试它们的杀有害生物活性的方法在本领域是熟知的(参见例如,Naimov等人(2001)Appl.Environ.Microbiol.[应用与环境微生物学]67:5328-5330;de Maagd等人,(1996)Appl.Environ.Microbiol.[应用与环境微生物学]62:1537-1543;Ge等人(1991)J.Biol.Chem.[生物化学杂志]266:17954-17958;Schnepf等人,(1990)J.Biol.Chem.[生物化学杂志]265:20923-20930;Rang等人,91999)Appl.Environ.Microbiol.[应用与环境微生物学]65:2918-2925)。
在一些实施例中,本发明提供了如下重组载体,该重组载体包含本发明的多核苷酸、组装的多核苷酸、核酸分子、表达盒或嵌合基因。在其他实施例中,该载体被进一步限定为质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。用于在植物和其他生物的转化中使用的某些载体在本领域是已知的。
因此,本发明的一些实施例涉及被设计成表达本发明的多核苷酸和核酸分子的表达盒。如本文所使用的,“表达盒”意指如下核酸分子,该核酸分子具有至少一种可操作地连接至目的核苷酸序列(例如,编码本发明的Cry蛋白的本发明的核苷酸序列)上的控制序列。以这种方式,例如,可操作地连接至待表达的核苷酸序列的植物启动子可以在表达盒中提供,用于在植物、植物部分或植物细胞中的表达。
包含目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少另外一种是异源的。表达盒还可以是天然存在但已经是以适用于异源表达的重组形式获得的表达盒。然而,典型地,该表达盒相对于该宿主而言是异源的,即该表达盒的特定核酸序列不是天然存在于该宿主细胞中的,并且必须已经通过转化事件引入到该宿主细胞或该宿主细胞的祖先中。
除可操作地连接至本发明的核苷酸序列的启动子之外,本发明的表达盒还可以包括其他调节序列。如本文所使用的,“调节序列”意指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于增强子、内含子、翻译前导序列、终止信号、以及聚腺苷酸化信号序列。
在一些实施例中,本发明的表达盒还可以包括编码除本发明的Cry蛋白之外的其他所希望的性状的多核苷酸。此类包含叠加性状的表达盒可以用来产生具有所希望的具有叠加性状(即,分子叠加)的表型的植物、植物部分或植物细胞。植物中的此类叠加的组合还可以通过其他方法来产生,包括但不限于通过任何常规的方法学的杂交育种植物。如果是通过遗传转化这些植物来进行叠加的,目的核苷酸序列可以在任何时间并且以任何次序进行组合。例如,包含一种或多种所希望的性状的转基因植物可以用作通过后续转化而引入另外的性状的靶标。另外的核苷酸序列可以在共转化方案中与由表达盒的任何组合提供的本发明的核苷酸序列、核酸分子、核酸构建体、或组合物同时引入。例如,如果将引入两个核苷酸序列,则它们可以合并在分开的盒(反式)中或可以合并在相同的盒(顺式)上。多核苷酸的表达可以通过相同的启动子或通过不同的启动子驱动。进一步认识到多核苷酸可以使用位点特异性重组系统在所希望的基因组位置处叠加。参见,例如,国际专利申请公开号WO99/25821;WO 99/25854;WO 99/25840;WO 99/25855和WO 99/25853。
表达盒还可以包括用于农艺性状的一种或多种目的多肽或双链RNA分子(dsRNA)的另外的编码序列,这些农艺性状的主要受益者是种子公司、栽培者或谷物加工者。目的多肽可以是由目的核苷酸序列编码的任何多肽。适合用于在植物中生产的目的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见,例如美国专利号5,569,823;5,304,730;5,495,071;6,329,504;和6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及光照和降水水平下生长的性状)的多肽,或是允许对表现目的性状(例如,选择性标记、种皮颜色等)的植物进行鉴别的多肽。不同的目的多肽以及将这些多肽引入植物的方法描述于例如美国专利号4,761,373;4,769,061;4,810,648;4,940,835;4,975,374;5,013,659;5,162,602;5,276,268;5,304,730;5,495,071;5,554,798;5,561,236;5,569,823;5,767,366;5,879,903;5,928,937;6,084,155;6,329,504和6,337,431;以及美国专利申请公开号2001/0016956中。还参见,万维网上的lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/。
赋予对抑制生长点或分生组织的除草剂(如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于本发明的一些实施例中。对于突变型ALS和AHAS酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659涉及抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下核酸的植物细胞和植物,该核酸编码突变型谷氨酰胺合成酶(GS),该突变型谷氨酰胺合成酶抗已知抑制GS的除草剂(例如,草胺膦和甲硫氨酸磺基肟(methioninesulfoximine))的抑制作用。美国专利号5,162,602披露了抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶A羧化酶(ACCase)赋予。
赋予对草甘膦抗性的、由核苷酸序列编码的多肽也适用于本发明。参见例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,该抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合成酶基因赋予。
编码对磷酰基化合物(如草铵膦或草胺膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见欧洲专利申请号0 242 246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他适合的多核苷酸包括编码对抑制光合作用的除草剂(如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的适合的多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。以下多核苷酸也是合适的:这些多核苷酸赋予原卟啉原氧化酶抗性或提供增强的植物病害抗性;增强对不利环境条件(非生物胁迫)的耐受性,包括但不限于干旱、过冷、过热或土壤盐分过高或极端的酸度或碱度;和植物结构或发育的改变,包括发育时间的变化。参见例如,美国专利公开号2001/0016956和美国专利号6,084,155。
另外的适合的多核苷酸包括对杀有害生物(例如杀昆虫)多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应当认识到在植物中对控制昆虫或其他有害生物必要的杀有害生物多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。有用于另外的昆虫或有害生物抗性的多核苷酸包括例如编码芽孢杆菌属(Bacillus)生物中鉴定到的毒素的那些。已经克隆了包含编码来自若干个亚种的苏云金芽孢杆菌(Bt)Cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和/或鞘翅目昆虫幼虫是有毒的。此类Bt杀昆虫蛋白的实例包括如下Cry蛋白,例如Cry1Aa、Cry1Ab、Cry1Ac、Cry1B、Cry1C、Cry1D、Cry1Ea、Cry1Fa、Cry3A、Cry9A、Cry9B、Cry9C等,连同营养期杀昆虫蛋白例如Vip1、Vip2、Vip3等。Bt来源的蛋白的完整清单可以在万维网在苏塞克斯大学(University of Sussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,Crickmore等人(1998)Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:807-813)。
适于在植物中生产的多肽进一步包括改善或通过其他方式有助于收获的植物或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量或分布、改善的发酵特性、增加的油含量、增加的蛋白质含量、改善的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些。目的多肽还包括,例如在收获的作物中导致或促成不需要的成分(例如植酸、或降解糖的酶类)的含量降低的那些。“导致(resulting in)”或“促成(contributingto)”是指这种目的多肽可以直接或间接地促成目的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。
在一些实施例中,该多肽促成了食品或饲料的改善的消化率。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。
许多源自真菌和细菌微生物的木聚糖酶已被鉴定和表征(参见例如,美国专利号5,437,992;Coughlin等人(1993)“Proceedings of the Second TRICEL Symposium onTrichoderma reesei Cellulases and Other Hydrolases[里氏木霉纤维素酶和其他水解酶的第二届TRICEL研讨会论文集]”埃斯波(Espoo);Souminen和Rein编辑,(1993)Foundation for Biotechnical and Industrial Fermentation Research[生物技术和工业发酵研究基金会]8:125-135;美国专利申请公开号2005/0208178;以及PCT公开号WO 03/16654)。特别地,已经在里氏木霉中鉴定出三种特定的木聚糖酶(XYL-I、XYL-II和XYL-III)(Tenkanen等人(1992)Enzyme Microb.Technol.[酶与微生物技术]14:566;Torronen等人(1992)Bio/Technology[生物/技术]10:1461;和Xu等人(1998)Appl.Microbiol.Biotechnol.[应用微生物学和生物技术]49:718)。
在其他实施例中,对于本发明有用的多肽可以是多糖降解酶。产生这样一种酶的本发明的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。
多糖降解酶包括:淀粉降解酶如α-淀粉酶(EC 3.2.1.1)、葡萄糖醛酸酶(E.C.3.2.1.131);外切-1,4-α-D葡聚糖酶如淀粉葡糖苷酶和葡糖淀粉酶(EC 3.2.1.3)、β-淀粉酶(EC 3.2.1.2)、α-葡糖苷酶(EC 3.2.1.20)和其他外切淀粉酶;淀粉去分支酶,如a)异淀粉酶(EC 3.2.1.68)、支链淀粉酶(EC 3.2.1.41)等;b)纤维素酶如外切-1,4-3-纤维二糖水解酶(EC 3.2.1.91)、外切-1,3-β-D-葡聚糖酶(EC 3.2.1.39)、β-葡糖苷酶(EC3.2.1.21);c)L-阿拉伯糖酶(arabinase)、如内切-1,5-α-L-阿拉伯糖酶(EC 3.2.1.99)、α-阿拉伯糖苷酶(EC 3.2.1.55)等;d)半乳聚糖酶如内切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、内切-1,3-β-D-半乳聚糖酶(EC 3.2.1.90)、α-半乳糖苷酶(EC 3.2.1.22)、β-半乳糖苷酶(EC 3.2.1.23)等;e)甘露聚糖酶,如内切-1,4-β-D-甘露聚糖(EC 3.2.1.78)、β-甘露糖苷酶(EC 3.2.1.25)、α-甘露糖苷酶(EC 3.2.1.24)等;f)木聚糖酶,如内切-1,4-β-木聚糖酶(EC 3.2.1.8)、β-D-木糖苷酶(EC 3.2.1.37)、1,3-β-D-木聚糖酶等;和g)其他酶如α-L-岩藻糖苷酶(EC 3.2.1.51)、α-L-鼠李糖苷酶(EC 3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶(EC 3.2.1.7)等。在一个实施例中,该α-淀粉酶是描述于美国专利号8,093,453(通过引用以其全文并入本文)中的合成α-淀粉酶Amy797E。
可以与本发明一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(Aspergillus)、木霉属(Trichoderma)、毛霉属(Mucor)和根霉属(Rhizopus),如黑曲霉(A.niger)、泡盛曲霉(A.awamori)、米曲霉(A.oryzae)和米黑毛霉(M.miehei)获得的那些。在一些实施例中,本发明的多肽可以是纤维二糖水解酶(CBH)(EC3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是CBH1或CBH2。
与本发明一起使用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(EC 3.2.1.55);木质素酶;脂肪酶(例如,E.C.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1,6葡糖苷酶(例如,E.C.3.2.1.20);酯酶,如阿魏酸酯酶(EC3.1.1.73)和乙酰基木聚糖酯酶(EC 3.1.1.72);以及角质酶(例如E.C.3.1.1.74)。
与本发明一起使用的双链RNA分子包括但不限于抑制靶标昆虫基因的那些。如本文所使用的词语“基因抑制”当一起考虑时旨在是指用于减少作为基因转录为mRNA和该mRNA的后续翻译的结果而产生的蛋白质的水平的任何熟知的方法。基因抑制还旨在意指减少从基因或编码序列表达蛋白质,包括转录后基因抑制和转录抑制。转录后基因抑制由从靶向抑制的基因或编码序列转录的mRNA的全部或其一部分与用于抑制的相应双链RNA之间的同源性介导,并且是指在细胞中可供被核糖体结合使用的可获得的mRNA的量的实质且可测量的减少。经转录的RNA可以处于正义方向而发挥作用,称为共抑制,处于反义方向而发挥作用,称为反义抑制,或在两个方向上产生dsRNA而发挥作用,称为RNA干扰(RNAi)。转录抑制由细胞中存在作为基因抑制剂的与启动子DNA序列或其补体展示出实质序列同一性而发挥作用的dsRNA介导,称为启动子反式抑制。针对与性状相关的天然植物基因,基因抑制可以是有效的,例如,以提供具有减少水平的由该天然基因编码的蛋白质或具有增强或减少水平的受影响代谢物的植物。针对植物有害生物中的靶基因,基因抑制也可以是有效的,这些有害生物可以摄取或接触含有基因抑制剂的植物材料,这些基因抑制剂专门设计用于阻抑或抑制一种或多种同源或互补序列在该有害生物的细胞中的表达。靶向抑制的此类基因可以编码必需蛋白质,其预测功能选自由以下组成的组:肌肉形成、保幼激素形成、保幼激素调节、离子调节和转运、消化酶合成、细胞膜电势的维持、氨基酸生物合成、氨基酸降解、精子形成、外激素(pheromone)合成、外激素感测、触角形成、翼形成、腿形成、发育和分化、卵形成、幼虫成熟、消化酶形成、血淋巴合成、血淋巴维持、神经传递、细胞分裂、能量代谢、呼吸以及凋亡。
在一些实施例中,本发明提供了如下转基因非人类宿主细胞,该细胞包括本发明的多核苷酸、核酸分子、嵌合基因、表达盒或重组载体。转基因非人类宿主细胞可以包括但不限于植物细胞、酵母细胞、细菌细胞或昆虫细胞。因此,在一些实施例中,本发明提供了选自以下属的细菌细胞:芽孢杆菌属、短芽孢杆菌属(Brevibacillus)、梭菌属(Clostridium)、致病杆菌属(Xenorhabdus)、发光杆菌属(Photorhabdus)、巴斯德氏芽菌属(Pasteuria)、埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯菌属(Klebsiella)、沙门氏菌属(Salmonella)、巴氏杆菌属(Pasteurella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、嗜甲基菌属(Methylophilius)、土壤杆菌属(Agrobacterium)、醋杆菌属(Acetobacter)、乳杆菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)或产碱杆菌属(Alcaligenes)。因此,例如,作为生物昆虫控制剂,本发明的Cry蛋白可以通过在细菌细胞中表达编码本发明的Cry蛋白的嵌合基因而产生。例如,在一些实施例中,提供了包含本发明的嵌合基因的苏云金芽孢杆菌细胞。
在另外的实施例中,本发明提供了作为双子叶植物细胞或单子叶植物细胞的转基因植物细胞。在另外的实施例中,双子叶植物细胞选自由以下组成的组:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、甜菜细胞以及烟草细胞。在另外的实施例中,单子叶植物细胞选自由以下组成的组:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。在一些实施例中,本发明提供了多个双子叶植物细胞或单子叶植物细胞,这些细胞表达由本发明的嵌合基因编码的本发明的Cry蛋白。在其他实施例中,将该多个细胞并列以形成质外体并且使其在自然光照中生长。
在本发明的其他实施例中,在高等生物(例如,植物)中表达本发明的杀昆虫Cry蛋白。在这种情况下,表达有效量的杀昆虫蛋白的转基因植物保护自身免受植物有害生物如昆虫有害生物的伤害。当昆虫开始摄食这样一种转基因植物时,它摄取了所表达的杀昆虫Cry蛋白。这可以妨碍昆虫进一步咬食植物组织或者甚至可以伤害或杀死昆虫。本发明的多核苷酸被插入表达盒中,然后该表达盒被稳定地整合到植物的基因组中。在其他实施例中,该多核苷酸被包含在非致病性自我复制的病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,并且包括但不限于玉米(玉蜀黍)、大豆、水稻、小麦、大麦、黑麦、燕麦、高粱、粟、向日葵、红花、甜菜、棉花、甘蔗、油菜、苜蓿、烟草、花生、蔬菜(包括甘薯、豆类、豌豆、菊苣、莴苣、甘蓝、花椰菜、西兰花、芜菁、胡萝卜、茄子、黄瓜、萝卜、菠菜、马铃薯、番茄、芦笋、洋葱、大蒜、瓜类、胡椒、芹菜、南瓜、西葫芦、绿皮西葫芦)、水果(包括苹果、梨、榅桲、李、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉)和特种植物如拟南芥以及木本植物如针叶树和落叶树。优选地,本发明的植物是作物植物,如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等。
一旦所希望的多核苷酸已经被转化进特定的植物物种中,便可以使用传统的育种技术将其在该物种中繁殖或将其转移到相同物种的其他品种中,特别是包括商业品种。
在转基因植物中表达本发明的多核苷酸,由此导致在这些转基因植物中对处于原毒素或毒素形式的编码的Cry蛋白的生物合成。以此方式,产生在存在昆虫压力下具有增强的产量保护的转基因植物。用于它们在转基因植物中的表达,本发明的核苷酸序列可能需要修饰和优化。尽管在许多情况下,来自微生物的基因能够在植物中高水平表达而无需修饰,但在转基因植物中的低表达可能是由于微生物核苷酸序列的缘故,这些序列具有在植物中并不优选的密码子。在本领域中已知,活生物具有特定的密码子使用偏好,而且在本发明中所描述的这些核苷酸序列的密码子可以被改变以符合植物偏好,同时维持由其编码的氨基酸。此外,在植物(例如玉米植物)中高表达最好是由如下编码序列实现的,这些编码序列具有至少约35%、或至少约45%、或至少约50%、或至少约60%的GC含量。具有低GC含量的微生物核苷酸序列在植物中也许表达欠佳,这是由于存在着可能使信息不稳定的ATTTA基序,以及可导致不恰当的聚腺苷酸化的AATAAA基序。尽管某些基因序列可以在单子叶植物和双子叶植物物种两者中充分表达,但是可以对序列进行修饰以便迎合单子叶植物或双子叶植物的特定密码子偏好以及GC含量偏好,因为这些偏好已经被证明是不同的(Murray等人,Nucl.Acids Res.[核酸研究]17:477-498(1989))。此外,针对不正常剪接位点的存在来对这些核苷酸序列进行筛选,这些位点可能导致信息平截(message truncation)。使用描述于例如美国专利号5,625,136、5,500,365和6,013,523中的方法,使用熟知的定点诱变、PCR以及合成基因构建技术对在这些核苷酸序列之内所有需要做出的变化(如上文所述的那些)进行改变。
在一些实施例中,本发明提供了根据披露于美国专利号5,625,136(通过引用并入本文)中的程序制备的合成编码序列或多核苷酸。在这个程序中,使用了玉蜀黍优选的密码子,即最频繁地编码玉蜀黍中的氨基酸的单个密码子。针对特定的氨基酸的玉蜀黍优选的密码子可衍生自例如源自玉蜀黍的已知基因序列。例如,针对源自玉蜀黍植物的28个基因的玉蜀黍密码子使用可在以下文献找到:Murray等人,Nucleic Acids Research[核酸研究]17:477-498(1989),其披露内容通过引用并入本文。本发明的确切示例的用玉蜀黍优化密码子或大豆优化密码子制备的合成序列由SEQ ID NO:12-35中的任一项表示。以这种方式,这些核苷酸序列可以进行优化用于在任何植物中表达。应当认识到,核苷酸序列的全部或任何部分可以是优化的或合成的。也就是说,多核苷酸可以包含作为部分天然序列和部分密码子优化序列的核苷酸序列。
为了有效地启动翻译,可能需要修饰与起始甲硫氨酸相邻的序列。例如,它们可以通过包含已知在植物中有效的序列而被修饰。Joshi已经提出了针对植物的适当的共有序列(NAR 15:6643-6653(1987))。这些共有序列适于与本发明的核苷酸序列一起使用。将这些序列掺入至包含核苷酸序列的构建体中,达到ATG并且包括ATG(同时保持不修饰第二氨基酸),或者可替代地达到ATG后的GTC并且包括ATG后的GTC(具有修饰该转基因的第二氨基酸的可能性)。
本发明的新颖Cry蛋白编码序列(作为它们的组装的序列、天然序列或作为如上所述的合成序列)可以可操作地融合至用于在植物中表达的多种启动子(包括组成型、诱导型、时序性调节的、发育调节的、化学调节的、组织优选的以及组织特异性启动子)以制备重组DNA分子(即,嵌合基因)。启动子的选择将根据表达的时间和空间需要而变化,并且还根据靶物种而变化。因此,本发明的核苷酸序列在叶、在柄(stalk)或茎(stem)、在穗、在花序(例如穗状花序、圆锥花序、穗轴等)、在根或籽苗中的表达是优选的。然而在许多情况下,寻求针对多于一种类型昆虫有害生物的保护,并且因此在多个组织中的表达是令人希望的。尽管已经显示来自双子叶植物的很多启动子在单子叶植物中是可操作的并且反之亦然,但理想的是选择双子叶植物启动子用于在双子叶植物中表达,并且选择单子叶植物启动子用于在单子叶植物中表达。不过,对于所选的启动子的起源没有限制;只要它们可有效驱动核苷酸序列在所希望细胞中表达就足够了。
适合的组成型启动子包括例如CaMV 35S启动子(SEQ ID NO:1546;Odell等人,Nature[自然]313:810-812,1985);拟南芥At6669启动子(SEQ ID NO:1652;参见PCT公开号W0 04081173A2);玉蜀黍Ubi 1(Christensen等人,Plant Mol.Biol.[植物分子生物学]18:675-689,1992);水稻肌动蛋白(McElroy等人,Plant Cell[植物细胞]2:163-171,1990);pEMU(Last等人,Theor.Appl.Genet.[理论与应用遗传学]81:581-588,1991);CaMV 19S(Nilsson等人,Physiol.Plant[植物生理学]100:456-462,1997);GOS2(de Pater等人,Plant J[植物杂志]11月;2(6):837-44,1992);泛素(Christensen等人,Plant Mol.Biol.[植物分子生物学]18:675-689,1992);水稻亲环蛋白(Bucholz等人,Plant Mol.Biol.[植物分子生物学]25(5):837-43,1994);玉蜀黍H3组蛋白(Lepetit等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]231:276-285,1992);肌动蛋白2(An等人,Plant J.[植物杂志]10(1);107-121,1996)、组成型根尖CT2启动子(SEQ ID NO:1535;还参见PCT申请号IL/2005/000627)以及Synthetic Super MAS(Ni等人,The Plant Journal[植物杂志]7:661-76,1995)。其他组成型启动子包括在美国专利号5,659,026、5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463和5,608,142中的那些。
对于在植物(特别是玉蜀黍)中表达本发明的新颖cry蛋白编码序列有用的组织特异性或组织优先启动子是指导在根、髓、叶或花粉中的表达的那些。适合的组织特异性启动子包括但不限于叶特异性启动子[如例如由Yamamoto等人,Plant J.[植物杂志]12:255-265,1997;Kwon等人,Plant Physiol.[植物生理学]105:357-67,1994;Yamamoto等人,Plant Cell Physiol.[植物细胞生理学]35:773-778,1994;Gotor等人,Plant J.[植物杂志]3:509-18,1993;Orozco等人,Plant Mol.Biol.[植物分子生物学]23:1129-1138,1993;以及Matsuoka等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:9586-9590,1993所描述],种子优选启动子[例如来自种子特异性基因(Simon等人,Plant Mol.Biol.[植物分子生物学]5.191,1985;Scofield等人,J.Biol.Chem.[生物化学杂志]262:12202,1987;Baszczynski等人,Plant Mol.Biol.[植物分子生物学]14:633,1990)、巴西坚果白蛋白(Pearson等人,Plant Mol.Biol.[植物分子生物学]18:235-245,1992)、豆球蛋白(Ellis等人,Plant Mol.Biol.[植物分子生物学]10:203-214,1988)、谷蛋白(水稻)(Takaiwa等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]208:15-22,1986;Takaiwa等人,FEBS Letts.[欧洲生化学会联合会快报]221:43-47,1987)、玉米蛋白(Matzke等人,Plant Mol Biol[植物分子生物学],143).323-32 1990)、napA(Stalberg等人,Planta[植物]199:515-519,1996)、小麦SPA(Albanietal,Plant Cell[植物细胞],9:171-184,1997)、向日葵油体蛋白(oleosin)(Cummins等人,Plant Mol.Biol.[植物分子生物学]19:873-876,1992)],胚乳特异性启动子[例如,小麦LMW和HMW,麦谷蛋白-1(Mol Gen Genet[分子遗传学与普通遗传学]216:81-90,1989;NAR 17:461-2),小麦a、b和g麦醇溶蛋白(EMB03:1409-15,1984),大麦ltrl启动子,大麦B1、C、D大麦醇溶蛋白(Theor Appl Gen[理论与应用遗传学]98:1253-62,1999;Plant J[植物杂志]4:343-55,1993;Mol Gen Genet[分子遗传学与普通遗传学]250:750-60,1996),大麦DOF(Mena等人,The Plant Journal[植物杂志]116(1):53-62,1998),Biz2(EP 99106056.7),合成启动子(Vicente-Carbajosa等人,Plant J.[植物杂志]13:629-640,1998),水稻谷醇溶蛋白NRP33、水稻-球蛋白Glb-1(Wu等人,Plant CellPhysiology[植物细胞生理学]39(8)885-889,1998),水稻α-球蛋白REB/OHP-1(Nakase等人,Plant Mol.Biol.[植物分子生物学]33:513-S22,1997),水稻ADP-葡萄糖PP(Trans Res6:157-68,1997),玉蜀黍ESR基因家族(Plant J[植物杂志]12:235-46,1997),高粱γ-高粱醇溶蛋白(Plant Mol.Biol[植物分子生物学]32:1029-35,1996)],胚特异性启动子[例如,水稻OSH1(Sato等人,Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]93:8117-8122),KNOX(Postma-Haarsma等人,Plant Mol.Biol.[植物分子生物学]39:257-71,1999),水稻油体蛋白(Wu等人,J.Biochem.[生物化学杂志],123:386,1998)],花特异性启动子[例如,AtPRP4,查尔酮合酶(chalene synthase;chsA)(Van der Meer等人,Plant Mol.Biol.[植物分子生物学]15,95-109,1990),LAT52(Twell等人,Mol.Gen Genet.[分子遗传学与普通遗传学]217:240-245;1989),apetala-3,植物繁殖组织[例如,OsMADS启动子(美国专利申请2007/0006344)]。
本发明的核苷酸序列也可以在被化学调节的启动子的调节下进行表达。这使得本发明的Cry蛋白能够仅在用诱导化学品对作物植物进行处理时被合成。用于基因表达的化学诱导的此类技术的实例详述于公开申请EP 0 332 104和美国专利号5,614,395中。在一个实施例中,化学调节的启动子是烟草PR-1a启动子。
另一类在本发明中有用的启动子是创伤可诱导的启动子。已经描述了数量众多的在创伤部位并且还在植物病原菌感染的部位表达的启动子。理想的是,这样的启动子在昆虫入侵的部位应该仅有局部活性,并且以此方式这些杀昆虫蛋白仅在需要合成这些杀昆虫蛋白的细胞中积聚以杀死入侵的昆虫有害生物。这类启动子的实例包括由以下文献所描述的那些:Stanford等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]215:200-208(1989);Xu等人,Plant Molec.Biol.[植物分子生物学]22:573-588(1993);Logemann等人,PlantCell[植物细胞]1:151-158(1989);Rohrmeier和Lehle,Plant Molec.Biol.[植物分子生物学]22:783-792(1993);Firek等人,Plant Molec.Biol.[植物分子生物学]22:129-142(1993)以及Warner等人,Plant J.[植物杂志]3:191-201(1993)。
导致在本发明中有用的组织特异性表达模式的启动子的非限制性实例包括绿色组织特异性的、根特异性的、茎特异性的或花特异性的。适于在绿色组织中表达的启动子包括调节涉及光合作用的基因的许多启动子,并且这些中的许多已经从单子叶植物和双子叶植物两者中得以克隆。一种此类启动子是源自磷酸烯醇羧化酶基因的玉蜀黍PEPC启动子(Hudspeth和Grula,Plant Molec.Biol.[植物分子生物学]12:579-589(1989))。另一种用于根特异性表达的启动子是由de Framond(FEBS 290:103-106(1991)或美国专利号5,466,785)描述的启动子。另一种在本发明中有用的启动子是描述于美国专利号5,625,136中的茎特异性启动子,它天然地驱动玉蜀黍trpA基因的表达。
除了选择适合的启动子之外,用于在植物中表达杀昆虫毒素的构建体还需要适当的可操作地连接在异源核苷酸序列下游的转录终止子。一些此类的终止子是可获得的并且在本领域中是已知的(例如来自CaMV的tml,来自rbcS的E9)。任何已知在植物中发挥作用的可供使用的终止子均可以在本发明的上下文中使用。
可以将数量众多的其他序列掺入本发明所描述的表达盒中。这些序列包括已经显示出增强表达的序列,如内含子序列(例如,来自Adhl和bronzel)以及病毒的前导序列(例如,来自TMV、MCMV、和AMV)。
本发明的核苷酸序列在植物中针对不同的细胞定位的靶向表达可能是更优选的。在一些情况下,在胞质溶胶中的定位可能是令人希望的,而在其他情况下,在某个亚细胞器中的定位可能是优选的。用于靶向例如植物中的基因产物的任何机构都可以用于实践本发明,并且已知此类机构存在于植物中并且已经相当详细地表征了控制这些机构的功能的序列。已经表征了导致将基因产物靶向其他细胞区室的序列。氨基末端序列可以负责将目的蛋白质靶向任何细胞区室,如植物的液泡、线粒体、过氧化物酶体、蛋白体、内质网、叶绿体、淀粉颗粒、淀粉体、质外体或细胞壁(例如Unger等人Plant Molec.Biol.[植物分子生物学]13:411-418(1989);Rogers等人(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82:6512-651;美国专利号7,102,057;WO 2005/096704,将其全部通过引用而特此结合)。任选地,信号序列可以是来自Waxy蛋白的N-末端信号序列、来自γ-玉米蛋白的N-末端信号序列、淀粉结合结构域、C-末端淀粉结合结构域、将成熟蛋白质导入到叶绿体的叶绿体靶向序列(Comai等人,(1988)J.Biol.Chem.[生物化学杂志]263:15104-15109;van den Broeck等人,(1985)Nature[自然]313:358-363;美国专利号5,639,949)或者来自糊粉细胞的分泌信号序列(Koehler和Ho,Plant Cell[植物细胞]2:769-783(1990))。另外,与羧基末端序列结合的氨基末端序列负责基因产物的液泡靶向(Shinshi等人(1990)Plant Molec.Biol.[植物分子生物学]14:357-368)。在一个实施例中,所选择的信号序列包括已知的切割位点,并且构建的融合体考虑了在一个或多个切割位点之后的需要切割的任何氨基酸。在一些情况下,这个要求可以通过在切割位点与转基因ATG之间添加小数目的氨基酸,或可替代地置换转基因序列内的一些氨基酸来满足。这些构建技术在本领域是熟知的并且同样适用于任何细胞区室。
应认识到,用于细胞靶向的上述机制不仅可以与其同源启动子结合使用,还可以与异源启动子结合使用,从而在启动子的转录调节下实现特定的细胞靶向目标,该启动子具有不同于自其衍生靶向信号的启动子的表达谱。
植物转化
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下项的转化:细菌介导的核酸递送(例如,经由土壤杆菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:Miki等人(“Procedures for Introducing ForeignDNA into Plants”in Methods in Plant Molecular Biology and Biotechnology[植物分子生物学与生物技术方法中的“用于将外来DNA引入植物中的程序”],Glick,B.R.和Thompson,J.E.编辑,CRC出版公司(CRC Press,Inc.),波卡拉顿(Boca Raton),1993,第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞与分子生物学快报]7:849-858(2002))。
对于土壤杆菌介导的转化,二元载体或携带至少一个T-DNA边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且仅含有目的构建体的线性DNA可以是优选的。在直接基因转移的情况下,可以使用以单个DNA种类的转化或共转化(Schocher等人,Biotechnology[生物技术]4:1093-1096(1986))。对于直接基因转移以及土壤杆菌介导的转移两者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草铵膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。
土壤杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。土壤杆菌介导的转化典型地涉及将携带目的外来DNA的二元运载体转移至适当的土壤杆菌菌株,这可能取决于由宿主土壤杆菌菌株在共同存在的Ti质粒上或在染色体上携带的vir基因的互补物(Uknes等人(1993)Plant Cell[植物细胞]5:159-169)。将该重组二元运载体转移至土壤杆菌可以使用携带该重组二元运载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元运载体移动到靶标土壤杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元运载体转移至土壤杆菌中(
Figure BDA0003416595550000601
和Willmitzer,(1988)Nucleic Acids Res.[核酸研究]16:9877)。
可以使用土壤杆菌转化双子叶植物以及单子叶植物。用于土壤杆菌介导的水稻转化方法包括熟知的水稻转化方法,如任何以下文献中描述的那些:欧洲专利申请EP1198985 A1,Aldemita和Hodges(Planta[植物]199:612-617,1996);Chan等人(Plant MolBiol[植物分子生物学]22(3):491-506,1993),Hiei等人(Plant J[植物杂志]6(2):271-282,1994),将其披露内容通过引用并入本文,其引用程度如同完全阐明一样。在玉米转化的情况下,优选方法是如Ishida等人(Nat.Biotechnol[自然生物技术]14(6):745-50,1996)或Frame等人(Plant Physiol[植物生理学]129(1):13-22,2002)中所描述的,将这些披露通过引用结合在此,其引用程度如同完全阐明一样。所述方法通过以下中的实例来进一步描述:B.Jenes等人,Techniques for Gene Transfer[基因转移技术],于:TransgenicPlants[转基因植物],第1卷,Engineering and Utilization[工程与利用],编著S.D.Kung和R.Wu,Academic Press[学院出版社](1993)128-143以及Potrykus Annu.Rev.PlantPhysiol.Plant Molec.Biol.[植物生理学与植物分子生物学年度综述]42(1991)205-225)。有待表达的核酸或构建体优选地克隆至适合于转化根癌土壤杆菌(Agrobacteriumtumefaciens)的载体例如pBin19中(Bevan等人,Nucl.Acids Res.[核酸研究]12(1984)8711)。然后,能够以已知的方式使用由这种载体转化的土壤杆菌来转化植物,如用作模型的植物像拟南芥或作物植物如烟草植物,方法是例如通过将捣碎的叶或切碎的叶浸没于土壤杆菌溶液中,并且然后将其在适合的培养基中培养。通过根癌土壤杆菌转化植物例如Hagen和Willmitzer在Nucl.Acid Res.[核酸研究](1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transfer in Higher Plants[在高等植物中基因转移的载体];Transgenic Plants[转基因植物],第1卷,Engineering and Utilization[工程与利用],编著S.D.Kung和R.Wu,Academic Press[学院出版社],1993,第15-38页中已知。
通过重组土壤杆菌进行的植物转化通常涉及该土壤杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的核酸)推进到植物组织中。
在其他实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单个启动子的控制下表达多个开放阅读框。在以下文献中广泛描述了质体转化技术:美国专利号5,451,513、5,545,817和5,545,818;PCT申请号WO 95/16783;以及McBride等人(1994)Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]91,7301-7305。基本的叶绿体转化技术涉及例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或PEG介导的转化),将位于选择性标记侧翼的经克隆的质体DNA区连同目的基因一起引入合适的靶组织中。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16S rRNA和rps12基因(赋予针对大观霉素或链霉素的抗性)的点突变用作供转化用的选择性标记(Svab,Z.、Hajdukiewicz,P.和Maliga,P.(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87,8526-8530;Staub,J.M.和Maliga,P.(1992)Plant Cell[植物细胞]4,39-45)。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(Staub,J.M.和Maliga,P.,(1993)EMBO J.[欧洲分子生物学杂志]12,601-606)。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aadA基因)置换隐性的rRNA或r蛋白抗生素抗性基因而获得(Svab,Z.和Maliga,P.,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90,913-917)。先前,这种标记已经被成功地用于莱茵衣藻(Chlamydomonas reinhardtii)这种绿藻的质体基因组的高频率转化(Goldschmidt-Clermont,M.(1991)Nucl.Acids Res.[核酸研究]19:4083-4089)。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向运载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。
选择转化的转基因植物、植物细胞或植物组织培养物的方法在本领域中是常规的,并且可以用于本文提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分或植物细胞。如本文所使用的,“选择性标记”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码选择性或筛选性标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,R基因座性状)。当然,适合的选择性标记的许多实例在本领域是已知的并且可以用于本文描述的表达盒中。
选择性标记的实例包括但不限于:编码neo或nptII的核苷酸序列,其赋予针对卡那霉素、G418等的抗性(Potrykus等人(1985)Mol.Gen.Genet.[分子遗传学和基因组学]199:183-188);编码bar的核苷酸序列,其赋予针对草胺膦的抗性;编码改变的5-烯醇丙酮酰莽草酸-3-磷酸(EPSP)合酶的核苷酸序列,其赋予针对草甘膦的抗性(Hinchee等人(1988)Biotech.[生物技术]6:915-922);编码腈水解酶(如来自臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn)的核苷酸序列,其赋予对溴苯腈的抗性(Stalker等人(1988)Science[科学]242:419-423);编码改变的乙酰乳酸合酶(ALS)的核苷酸序列,其赋予针对咪唑啉酮、磺酰脲或其他ALS抑制化学药剂的抗性(欧洲专利申请号154204);编码抗甲氨蝶呤二氢叶酸还原酶(DHFR)的核苷酸序列(Thillet等人(1988)J.Biol.Chem.[生物化学杂志]263:12500-12508);编码茅草枯脱卤酶的核苷酸序列,其赋予针对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(PMI))的核苷酸序列,其赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸合酶的核苷酸序列,其赋予针对5-甲基色氨酸的抗性;或编码hph的核苷酸序列,其赋予针对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
另外的选择性标记包括但不限于编码β-葡萄糖醛酸酶的核苷酸序列或编码多种显色底物已知的酶的uidA(GUS);编码调节植物组织中花色苷色素(红色)产生的产物的R-基因座核苷酸序列(Dellaporta等人,“Molecular cloning of the maize R-nj alleleby transposon-tagging with Ac[通过Ac转座子标签技术对玉蜀黍R-nj等位基因的分子克隆]”263-282于:Chromosome Structure and Function:Impact of New Concepts[染色体结构和功能:新概念的影响],18th Stadler Genetics Symposium[第十八届斯塔德勒遗传学研讨会](Gustafson和Appels编,Plenum Press[Plenum出版社]1988));编码β-内酰胺酶的核苷酸序列,β-内酰胺酶是多种显色底物已知的酶(例如PADAC,一种显色头孢菌素)(Sutcliffe(1978)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3737-3741);编码xylE的核苷酸序列,xylE编码儿茶酚双加氧酶(Zukowsky等人(1983)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:1101-1105);编码酪氨酸酶的核苷酸序列,所述酪氨酸酶是能够将酪氨酸氧化成DOPA和多巴醌的酶,DOPA和多巴-+醌又缩合形成黑色素(Katz等人(1983)J.Gen.Microbiol.[普通微生物学杂志]129:2703-2714);编码β-半乳糖苷酶的核苷酸序列,β-半乳糖苷酶是存在显色底物的酶;编码荧光素酶(lux)的核苷酸序列,荧光素酶可用于生物发光检测(Ow等人(1986)Science[科学]234:856-859);编码水母发光蛋白的核苷酸序列,水母发光蛋白可用于钙敏感生物发光检测(Prasher等人(1985)Biochem.Biophys.Res.Comm.[生化和生物物理研究通讯]126:1259-1268);或编码绿色荧光蛋白的核苷酸序列(Niedz等人(1995)Plant Cell Reports[植物细胞报道]14:403-406)。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
此外,如本领域中所熟知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物或培养的原生质体再生而来。在以下文献中描述了从植物细胞、植物组织培养物或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,MacMilanPublishing Co.[麦克米兰出版公司],纽约(1983));以及Vasil I.R.(编辑)(CellCulture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],Acad.Press[学术出版社],奥兰多市,第I卷(1984)和第II卷(1986))。
另外,工程化入以上所述的本发明的转基因种子和植物、植物部分或植物细胞中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。
因此,可以按本领域熟知的任意多种方法(如上所述的)将多核苷酸引入该植物、植物部分或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的特定方法,相反可以使用允许将该一种或多种多核苷酸稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单一核酸分子的一部分、或者作为分开的核酸分子而进行组装,并且可以位于相同的或不同的核酸分子上。因此,可以在单个转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入目的细胞中。
本发明的另外的实施例包括从本发明的转基因植物或其部分产生的收获产物以及从该收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中该种子或其他植物部分包含本发明的核酸分子/多核苷酸/核苷酸序列。
在其他实施例中,本发明提供了来自本发明的转基因种子或转基因植物的提取物,其中该提取物包含本发明的核酸分子、多核苷酸、核苷酸序列或毒性蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,de la Torre等人,Food,Agric.Environ.[食品农业与环境]2(1):84-89(2004);Guidet,Nucleic Acids Res.[核酸研究]22(9):1772-1773(1994);Lipton等人,Food Agric.Immun.[食品农业通讯]12:153-164(2000))。
杀昆虫组合物
在一些实施例中,本发明提供了一种杀昆虫组合物,该杀昆虫组合物包含农业上可接受的载体中的本发明的Cry蛋白。如本文所使用的“农业上可接受的载体”可以包括与活性Cry蛋白组合以有助于它施用至或植物或其部分的天然或合成的有机或无机材料。农业上可接受的载体的实例包括但不限于粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。农业上可接受的载体进一步包括但不限于可用于农业配制品中的惰性组分、分散剂、表面活性剂、佐剂、增粘剂、粘着剂、粘合剂或其组合。此类组合物可以按使杀昆虫蛋白或其他有害生物控制剂与这些有害生物接触的任何方式施用。因此,可以将这些组合物施用于植物或植物部分的表面,包括种子、叶、花、茎、块茎、根等。在其他实施例中,在植物体内产生本发明的Cry蛋白的植物是被表达的Cry蛋白的农业载体。
在另外的实施例中,该杀昆虫组合物包含细菌细胞或本发明的转基因细菌细胞,其中该细菌细胞或转基因细菌细胞产生本发明的Cry蛋白。这种杀昆虫组合物可以通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩苏云金芽孢杆菌(Bt)的培养物而制备。在另外的实施例中,该组合物包含按重量计从约1%至约99%的本发明的Cry蛋白。
本发明的Cry蛋白可以与其他有害生物控制剂组合使用,以增加有害生物靶标范围或用于预防或管理昆虫抗性。因此,在一些实施例中,本发明提供了控制一种或多种植物有害生物的组合物,其中该组合物包含本发明的第一Cry蛋白和不同于该第一Cry蛋白的第二有害生物控制剂。在其他实施例中,该组合物是用于局部施用至植物的配制品。在仍其他实施例中,该组合物是转基因植物。在另外的实施例中,该组合物是局部施用至转基因植物的配制品的组合。在一些实施例中,当该转基因植物包含该第二有害生物控制剂时,该配制品包含本发明的该第一Cry蛋白。在其他实施例中,当该转基因植物包含本发明的该第一Cry蛋白时,该配制品包含该第二有害生物控制剂。
在一些实施例中,第二有害生物控制剂可以是选自由以下组成的组的试剂:化学杀有害生物剂(如杀昆虫剂)、苏云金芽孢杆菌(Bt)杀昆虫蛋白、致病杆菌属杀昆虫蛋白、发光杆菌属杀昆虫蛋白、侧孢短芽孢杆菌(Brevibacillus laterosporus)杀昆虫蛋白、球形芽孢杆菌(Bacillus sphaericus)杀昆虫蛋白、蛋白酶抑制剂(丝氨酸和半胱氨酸类型两者)、凝集素、α-淀粉酶、过氧化物酶、胆固醇氧化酶以及双链RNA(dsRNA)分子。
在其他实施例中,第二有害生物控制剂是选自由以下组成的组的化学杀有害生物剂:拟除虫菊酯、氨基甲酸酯、新烟碱、神经元钠通道阻断剂、杀昆虫大环内酯、γ-氨基丁酸(GABA)拮抗剂、杀昆虫脲以及保幼激素模拟物。在其他实施例中,化学杀有害生物剂选自由以下组成的组:阿巴美丁、乙酰甲胺磷、啶虫脒、磺胺螨酯(amidoflumet)(S-1955)、除虫菌素(avermectin)、印楝素、甲基谷硫磷、联苯菊酯、联苯肼酯(binfenazate)、噻嗪酮、克百威、溴虫腈、定虫隆、毒死蜱、甲基毒死蜱、环虫酰肼、噻虫胺、氟氯氰菊酯、β-氟氯氰菊酯、三氯氟氰菊酯、λ-三氯氟氰菊酯、氯氰菊酯、灭蝇胺、溴氰菊酯、杀螨隆、二嗪磷、除虫脲、乐果、苯虫醚、甲氨基阿维菌素、硫丹、高氰戊菊酯、乙虫腈、苯硫威(fenothicarb)、苯氧威、甲氰菊酯、唑螨酯、氰戊菊酯、氟虫腈、氟啶虫酰胺、氟氰戊菊酯、τ-氟胺氰菊酯、嘧虫胺(UR-50701)、氟虫脲、地虫硫磷、氯虫酰肼、氟铃脲、吡虫啉、茚虫威、异柳磷、虱螨脲、马拉硫磷、聚乙醛、甲胺磷、杀扑磷、灭多威、烯虫酯、甲氧氯、久效磷、甲氧虫酰肼、噻虫醛(nithiazin)、双苯氟脲、多氟脲(XDE-007)、杀线威、对硫磷、甲基对硫磷、氯菊酯、甲拌磷、伏杀磷、亚胺硫磷、磷胺、抗蚜威、丙溴磷、吡蚜酮、啶虫丙醚、蚊蝇醚、鱼藤酮、多杀菌素、螺甲螨酯(spiromesifin)(BSN 2060)、硫丙磷、虫酰肼、伏虫隆、七氟菊酯、特丁硫磷、杀虫畏、噻虫啉、噻虫嗪、硫双威、杀虫双(thiosultap-sodium)、四溴菊酯、敌百虫和杀铃脲、涕灭威、杀线威、苯线磷、双甲脒、灭螨猛、乙酯杀螨醇、三环锡、三氯杀螨醇、除螨灵、依杀螨、喹螨醚、苯丁锡、甲氰菊酯、唑螨酯、噻螨酮、克螨特、哒螨灵以及吡螨胺。在仍其他实施例中,化学杀有害生物剂选自由以下组成的组:氯氰菊酯、三氯氟氰菊酯、氟氯氰菊酯和β-氟氯氰菊酯、高氰戊菊酯、氰戊菊酯、四溴菊酯、苯硫威、灭多威、杀线威、硫双威、噻虫胺、吡虫啉、噻虫啉、茚虫威、多杀菌素、阿巴美丁、除虫菌素、甲氨基阿维菌素、硫丹、乙虫腈、氟虫腈、氟虫脲、杀铃脲、苯虫醚、蚊蝇醚、吡蚜酮以及双甲脒。
在另外的实施例中,第二有害生物控制剂可以是任何数目的苏云金芽孢杆菌杀昆虫蛋白中的一种或多种,包括但不限于Cry蛋白、营养期杀昆虫蛋白(VIP)以及任何前述杀昆虫蛋白的杀昆虫嵌合体。在其他实施例中,该第二有害生物控制剂是选自下组的Cry蛋白,该组由以下组成:Cry1Aa、Cry1Ab、Cry1Ac、Cry1Ad、Cry1Ae、Cry1Af、Cry1Ag、Cry1Ah、Cry1Ai、Cry1Aj、Cry1Ba、Cry1Bb、Cry1Bc、Cry1Bd、Cry1Be、Cry1Bf、Cry1Bg、Cry1Bh、Cry1Bi、Cry1Ca、Cry1Cb、Cry1Da、Cry1Db、Cry1Dc、Cry1Dd、Cry1Ea、Cry1Eb、Cry1Fa、Cry1Fb、Cry1Ga、Cry1Gb、Cry1Gc、Cry1Ha、Cry1Hb、Cry1Hc、Cry1Ia、Cry1Ib、Cry1Ic、Cry1Id、Cry1Ie、Cry1If、Cry1Ig、Cry1Ja、Cry1Jb、Cry1Jc、Cry1Jd、Cry1Ka、Cry1La、Cry1Ma、Cry1Na、Cry1Nb、Cry2Aa、Cry2Ab、Cry2Ac、Cry2Ad、Cry2Ae、Cry2Af、Cry2Ag、Cry2Ah、Cry2Ai、Cry2Aj、Cry2Ak,Cry2Al、Cry2Ba、Cry3Aa、Cry3Ba、Cry3Bb、Cry3Ca、Cry4Aa、Cry4Ba、Cry4Ca、Cry4Cb、Cry4Cc、Cry5Aa、Cry5Ab、Cry5Ac、Cry5Ad、Cry5Ba、Cry5Ca、Cry5Da、Cry5Ea、Cry6Aa、Cry6Ba、Cry7Aa、Cry7Ab、Cry7Ac、Cry7Ba、Cry7Bb、Cry7Ca、Cry7Cb、Cry7Da、Cry7Ea、Cry7Fa、Cry7Fb、Cry7Ga、Cry7Gb、Cry7Gc、Cry7Gd、Cry7Ha、Cry7Ia、Cry7Ja、Cry7Ka、Cry7Kb、Cry7La、Cry8Aa、Cry8Ab、Cry8Ac、Cry8Ad、Cry8Ba、Cry8Bb、Cry8Bc、Cry8Ca、Cry8Da、Cry8Db、Cry8Ea、Cry8Fa、Cry8Ga、Cry8Ha、Cry8Ia、Cry8Ib、Cry8Ja、Cry8Ka、Cry8Kb、Cry8La、Cry8Ma、Cry8Na、Cry8Pa、Cry8Qa、Cry8Ra、Cry8Sa、Cry8Ta、Cry9Aa、Cry9Ba、Cry9Bb、Cry9Ca、Cry9Da、Cry9Db、Cry9Dc、Cry9Ea、Cry9Eb、Cry9Ec、Cry9Ed、Cry9Ee、Cry9Fa、Cry9Ga、Cry10Aa、Cry11Aa、Cry11Ba、Cry11Bb、Cry12Aa,Cry13Aa、Cry14Aa、Cry14Ab、Cry15Aa、Cry16Aa、Cry17Aa、Cry18Aa、Cry18Ba、Cry18Ca、Cry19Aa、Cry19Ba、Cry19Ca、Cry20Aa、Cry20Ba、Cry21Aa、Cry21Ba、Cry21Ca、Cry21Da、Cry21Ea、Cry21Fa、Cry21Ga、Cry21Ha、Cry22Aa、Cry22Ab、Cry22Ba、Cry22Bb、Cry23Aa、Cry24Aa、Cry24Ba、Cry24Ca、Cry25Aa、Cry26Aa、Cry27Aa、Cry28Aa、Cry29Aa、Cry29Ba、Cry30Aa、Cry30Ba、Cry30Ca、Cry30Da、Cry30Db、Cry30Ea、Cry30Fa、Cry30Ga,Cry31Aa、Cry31Ab、Cry31Ac、Cry31Ad、Cry32Aa、Cry32Ab、Cry32Ba、Cry32Ca、Cry32Cb、Cry32Da、Cry32Ea、Cry32Eb、Cry32Fa、Cry32Ga、Cry32Ha、Cry32Hb、Cry32Ia、Cry32Ja、Cry32Ka、Cry32La、Cry32Ma、Cry32Mb、Cry32Na、Cry32Oa、Cry32Pa、Cry32Qa、Cry32Ra、Cry32Sa、Cry32Ta、Cry32Ua、Cry33Aa、Cry34Aa、Cry34Ab、Cry34Ac、Cry34Ba、Cry35Aa、Cry35Ab、Cry35Ac、Cry35Ba、Cry36Aa、Cry37Aa、Cry38Aa、Cry39Aa、Cry40Aa、Cry40Ba、Cry40Ca、Cry40Da、Cry41Aa、Cry41Ab、Cry41Ba、Cry42Aa、Cry43Aa、Cry43Ba、Cry43Ca、Cry43Cb、Cry43Cc、Cry44Aa、Cry45Aa、Cry46Aa、Cry46Ab、Cry47Aa、Cry48Aa、Cry48Ab、Cry49Aa、Cry49Ab、Cry50Aa、Cry50Ba、Cry51Aa、Cry52Aa、Cry52Ba、Cry53Aa、Cry53Ab、Cry54Aa、Cry54Ab、Cry54Ba、Cry55Aa、Cry56Aa、Cry57Aa、Cry57Ab、Cry58Aa、Cry59Aa、Cry59Ba、Cry60Aa、Cry60Ba、Cry61Aa、Cry62Aa、Cry63Aa、Cry64Aa、Cry65Aa、Cry66Aa、Cry67Aa、Cry68Aa、Cry69Aa、Cry69Ab、Cry70Aa、Cry70Ba、Cry70Bb、Cry71Aa、Cry72Aa以及Cry73Aa。
在另外的实施例中,该第二有害生物控制剂是选自下组的Vip3营养期杀昆虫蛋白,该组由以下组成:Vip3Aa1、Vip3Aa2、Vip3Aa3、Vip3Aa4、Vip3Aa5、Vip3Aa6、Vip3Aa7、Vip3Aa8、Vip3Aa9、Vip3Aa10、Vip3Aa11、Vip3Aa12、Vip3Aa13、Vip3Aa14、Vip3Aa15、Vip3Aa16、Vip3Aa17、Vip3Aa18、Vip3Aa19、Vip3Aa20、Vip3Aa21、Vip3Aa22、Vip3Aa2、Vip3Aa24、Vip3Aa25、Vip3Aa26、Vip3Aa27、Vip3Aa28、Vip3Aa29、Vip3Aa30、Vip3Aa31、Vip3Aa32、Vip3Aa33、Vip3Aa34、Vip3Aa35、Vip3Aa36、Vip3Aa37、Vip3Aa38、Vip3Aa39、Vip3Aa40、Vip3Aa41、Vip3Aa42、Vip3Aa43、Vip3Aa44、Vip3Ab1、Vip3Ab2、Vip3Ac1、Vip3Ad1、Vip3Ad2、Vip3Ae1、Vip3Af1、Vip3Af2、Vip3Af3、Vip3Ag1、Vip3Ag2、Vip3Ag3、HM117633、Vip3Ag4、Vip3Ag5、Vip3Ah1、Vip3Ba1、Vip3Ba2、Vip3Bb1、Vip3Bb2以及Vip3Bb3。
在仍另外的实施例中,在转基因植物中共表达本发明的第一Cry蛋白和该第二有害生物控制剂。可以通过将植物遗传工程化以含有并表达所有的必需基因来实现一种以上杀有害生物成分在同一个转基因植物中的共表达。可替代地,可以将植物(亲本1)遗传工程化,用于本发明的Cry蛋白的表达。可以将第二植物(亲本2)遗传工程化,用于第二有害生物控制剂的表达。通过将亲本1与亲本2杂交,获得了表达被引入至亲本1和亲本2中的所有基因的子代植物。
在其他实施例中,本发明提供了对植物有害生物侵染有抗性的叠加性转基因植物,该植物包含编码用于在靶标有害生物中抑制必需基因的dsRNA的DNA序列和编码针对该靶标有害生物表现出生物活性的本发明的Cry蛋白的DNA序列。据报道,dsRNAs对某些鳞翅目有害生物无效(Rajagopol等人2002.J.Biol.Chem.[生物化学杂志]277:468-494),这可能是由于中肠的高pH破坏了dsRNA的稳定。因此,在一些靶标有害生物是鳞翅目有害生物的实施例中,本发明的Cry蛋白起作用以瞬时降低中肠pH,这用于稳定共摄取的dsRNA,从而使得该dsRNA有效沉默靶基因。
除了提供组合物之外,本发明还提供了产生对鳞翅目有害生物有毒的Cry蛋白的方法。这样一种方法包括在转基因非人类宿主细胞产生对鳞翅目有害生物有毒的蛋白质的条件下培养该宿主细胞,该宿主细胞包含本发明的多核苷酸或嵌合基因或核酸分子或重组载体。在一些实施例中,该转基因非人类宿主细胞是植物细胞。在一些其他实施例中,该植物细胞是玉蜀黍细胞。在其他实施例中,植物细胞或玉蜀黍细胞在其下生长的条件包括自然光照。在其他实施例中,该转基因非人类宿主细胞是细菌细胞。在仍其他实施例中,该转基因非人类宿主细胞是酵母细胞。
在该方法的其他实施例中,该鳞翅目有害生物选自由以下组成的组:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在该方法的另外的实施例中,嵌合基因包含SEQ ID NO:1-11中的任一项。在仍其他实施例中,所产生的蛋白包含SEQ ID NO:36-46中任一项的氨基酸序列。
在该方法的一些实施例中,嵌合基因包含针对在植物中表达进行了密码子优化的核苷酸序列。在其他实施例中,该嵌合基因包含SEQ ID NO:12-35中的任一项。在另外的实施例中,所产生的蛋白包含SEQ ID NO:36-59中任一项的氨基酸序列。
在另外的实施例中,本发明提供了一种产生抗有害生物(例如,抗昆虫)转基因植物的方法,该方法包括向植物中引入包含编码本发明的Cry蛋白的核苷酸序列的本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子,其中该核苷酸序列被表达于该植物中,由此赋予该植物对鳞翅目有害生物的抗性,并且产生抗昆虫转基因植物。在一些实施例中,与缺乏本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子的对照植物相比,抗有害生物转基因植物对杆野螟属(Ostrinia)的鳞翅目有害生物有抗性。在其他实施例中,杆野螟属的该昆虫是玉米蛀虫(亚洲玉米螟)。在一些实施例中,通过转化植物实现引入。在其他实施例中,通过使包含本发明的嵌合基因、重组载体、表达盒或核酸分子的第一植物与不同的第二植物杂交来实现引入。
在一些实施例中,至少对亚洲玉米蛀虫(亚洲玉米螟)有抗性的本发明的转基因植物还对至少一种另外的鳞翅目有害生物有抗性,其中该另外的鳞翅目有害生物包括但不限于黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在另外的实施例中,提供了一种控制鳞翅目有害生物如玉米蛀虫(亚洲玉米螟)的方法,该方法包括向这些昆虫递送有效量的本发明的Cry蛋白。为了有效,该Cry蛋白首先被昆虫经口摄取。然而,该Cry蛋白可以按许多公认的方式被递送至该昆虫。将蛋白经口递送至昆虫的方式包括但不限于(1)在转基因植物中提供该蛋白,其中昆虫采食(摄取)转基因植物的一个或多个部分,从而摄取在转基因植物中表达的多肽;(2)在一种或多种可施用于或掺入例如昆虫生长培养基的配制的蛋白组合物中提供该蛋白;(3)在一种或多种可施用于植物部分的表面(例如喷洒到植物部分的表面上)的蛋白组合物中提供该蛋白,然后当昆虫采食一个或多个被喷洒的植物部分时被昆虫摄取;(4)饵基;(5)任何其他本领域公认的蛋白质递送系统。因此,可以使用经口递送至昆虫的任何方法来递送本发明的毒性Cry蛋白。在一些特定实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取转基因植物的一个或多个部分。
在其他实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取用包含本发明的Cry蛋白的组合物喷雾的植物的一个或多个部分。可以使用本领域技术人员已知的用于将化合物、组合物、配制品等施用于植物表面的任何方法将本发明的组合物递送至植物表面。递送至或接触植物或其部分的一些非限制性实例包括喷雾、撒粉、喷洒、分散、下雾、雾化、撒播、浸泡、土壤注入、土壤掺入、浸透(例如,根、土壤处理)、浸渍、灌注、涂覆、叶或茎浸润、侧施或种子处理等及其组合。用于使植物或其部分与一种或多种化合物、一种或多种组合物或一种或多种配制品接触的这些和其他程序是本领域技术人员熟知的。
在一些实施例中,本发明涵盖为农民提供控制鳞翅目有害生物的手段的方法,该方法包括向该农民供应或出售植物材料如种子,该植物材料包含能够在由该种子生长的植物中表达本发明的Cry蛋白的多核苷酸、嵌合基因、表达盒或重组载体,如上所述。
本发明的实施例可以通过参考以下实例而被更好地理解。前述的和以下的本发明的实施例以及各种实施例的描述不是旨在限制权利要求,而是对其具有说明性。因此,应理解的是权利要求不旨在受限于这些实例的具体细节。本领域技术人员应理解的是本发明的其他实施例可以在不偏离本披露内容的精神和范围的情况下进行实践,本披露内容的范围是由所附权利要求限定的。
实例
实例1.用于基因组测序的Bt菌株的鉴别
从环境样品(例如土壤、谷粒或植物)中分离苏云金芽孢杆菌(Bt)菌株。将环境样品悬浮于LB+2.5M乙酸钠液体培养基中,随后70℃热处理约20min。然后将一微升悬浮液涂布在T3+青霉素琼脂平板上并且在28℃下孵育,直到形成菌落。将具有芽孢杆菌属样形态学的菌落从这些平板中挑出并且在T3+青霉素琼脂平板上重新划线直到它们已经形成孢子,典型地持续大约三天。通过用考马斯蓝/乙酸将培养物染色并且用显微镜目测来鉴别Bt菌株。孢子形成之后,将可溶的和不溶的部分都针对感兴趣的鳞翅目物种的活性进行测试。在表面污染生物测定中测试各部分,在该生物测定中将各部分覆盖到多物种人工饲料上。针对至少四种鳞翅目种类(包括玉米穗虫(玉米穗蛾)、小地老虎(黑色地老虎)、欧洲玉米螟(欧洲玉米蛀虫)和草地贪夜蛾(秋黏虫)筛选每种分离物,其中样本量为12只新生幼虫。每次试验在室温下持续约7天;对平板的死亡率和幼虫生长抑制情况进行评分。将在相对于阴性对照观察到的死亡率增加30%时认为是有效的。基于初始昆虫测试,选择12个Bt菌株用于进一步分析。鉴别Bt菌株后,如下所述分离基因组DNA。
实例2.基因组组装和分析
使用全基因组测序方法,从如实例1中所述分离的Bt菌株的基因组组装本发明的Bt cry基因。简言之,使用Covaris S2超声波装置(科瓦里斯公司(Covaris,Inc.),沃本,马萨诸塞州)剪切芽孢杆菌属DNA,其中将程序DNA_400bp设为工作循环:10%;强度:4;循环/脉冲:200。将DNA用
Figure BDA0003416595550000751
UltraTMEnd Repair/dA-加尾模块(新英格兰生物实验室公司(New England Biolabs,Inc.),伊普斯维奇,马萨诸塞州)处理。如供应商(新英格兰生物实验室公司,伊普斯维奇,马萨诸塞州)所述的,使用NEB Quick LigationTM连接生物科技(Biooscience)有索引的1-57个适配子(1-27巴西,28-57美国、英国和瑞士)。如供应商(贝克曼库尔特公司(Beckman Coulter,Inc.),印第安纳波利斯,印第安纳州)所述的,使用Agencourt AMPure XP珠粒清理连接物。
将文库如下进行大小分级:将50uL样品与45ul 75%珠粒混合物(25%AMPure珠粒加75%NaCl/PEG溶液TekNova目录号P4136)混合。搅拌混合物并置于磁性支架上。将所得上清液转移至新孔中并且添加45ul 50%珠粒混合物(50%AMPure珠粒加50%NaCl/PEG溶液TekNova目录号P4136)。搅拌该混合物并置于磁性支架上。除去所得上清液并且用80%乙醇洗涤珠粒。添加25uL的洗脱缓冲液(EB)并且将混合物置于磁性支架上。去除所得最终上清液并置于1.5mL管中。这个方法产生了525个DNA碱基对(bp)(插入物加适配子)大小范围内的文库。
使用KAPA生物系统高保真热启动(KAPA Biosystem HiFi Hot Start)(Kapa生物系统公司(Kapa Biosystems,Inc.),马萨诸塞州威尔明顿(Wilmington,MA)),使用以下循环条件:[98℃,45s];12x[98℃,15s,60℃,30s,72℃,30s];[72℃,1min],扩增大小确定的DNA文库。每个反应含有:5ul DNA文库、1uL生物科技(Bioscience)通用引物(25uM)、18uL无菌水、1uL生物科技有索引的引物(25uM)、25ul 2X KAPA HiFi聚合酶。
使用高灵敏度芯片在Agilent 2100生物分析仪(安捷伦科技公司(AgilentTechnologies),圣克拉拉,加利福尼亚州)上跑文库,以确定文库大小范围和平均插入物大小。使用标准的制造商测序方案(亿明达公司(Illumina,Inc.),圣地亚哥,加利福尼亚州)在HiSeq 2500测序系统上针对配对末端(PE)测序(100个循环/读数;12-24个文库/泳道)处理所有文库。
使用被开发用于鉴别和表征可能的Cry样基因的芽孢杆菌属的专有计算分析工具来优先化引导物,用于进一步实验室测试。
上文所述的基因组的组装和分析鉴别出11个Cry样编码序列和衍生蛋白,它们列于表1中。技术人员将认识到,由于基因组测序和基因组装过程,组装的核苷酸序列和由其衍生的氨基酸序列不太可能是天然存在的,因为本领域已知序列的组装不是100%准确的并且可能引入不同于天然核苷酸序列的碱基。因此,这些核苷酸序列在本文称为“组装的序列”,并且它们编码的Cry蛋白“衍生自”组装的序列。
使用衍生自组装的核苷酸序列的全长Cry样蛋白氨基酸序列进行序列同源性搜索。使用NCBI蛋白质-蛋白质BLAST程序确定同源性。与每种组装的Cry样蛋白具有最高同源性的已知Cry蛋白表明了组装的Cry样蛋白所属的最近的Cry家族。组装的编码序列和蛋白的鉴别特征示于表1中。
尽管BT235和BT727具有使其置于Cry毒素超家族中的结构域,但它们与任何已知的Cry蛋白都没有任何显著的同一性,即<45%。因此,根据当前的命名方案(Crickmore等人),这两种蛋白都可能被置于它们自己的Cry家族中。例如,根据当前的命名法,BT235很可能被命名为Cry79Aa1,并且BT727会被命名为Cry79Ab1。
表1.由苏云金芽孢杆菌基因组组装的Cry基因/蛋白。
Figure BDA0003416595550000761
Figure BDA0003416595550000771
实例3.重组宿主细胞中的Bt蛋白表达
芽孢杆菌属表达.经由设计用于在大肠杆菌和Bt两者中表达的指定为pCIB5634`的穿梭载体,在没有可观察到的背景杀昆虫活性的无晶体(crystal minus)苏云金芽孢杆菌(Bt)菌株中表达实例2中描述的Cry蛋白。载体pCIB5634`包括驱动经克隆的Bt Cry基因的表达的Cry1Ac启动子和红霉素抗性标记。经由电穿孔将包括目的Cry编码序列的表达盒转化进宿主Bt菌株中并且在含有红霉素的琼脂平板上选择转基因Bt菌株。使所选择的转基因Bt菌株在T3培养基中于28℃下生长4-5天至孢子形成阶段。收获细胞沉淀并且在溶解于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中之前反复洗涤。可替代地,在营养生长阶段从培养上清液中去除细胞沉淀,并使用用过的培养基测试分泌到生长培养基中的Cry样蛋白的存在。
大肠杆菌表达.使用pET28a或pET29a载体(默克公司(Merck KGaA),达姆施塔特,德国)在大肠杆菌菌株中表达Cry蛋白。通过电穿孔转化构建体并且在含有卡那霉素的琼脂平板上选择转大肠杆菌克隆。使所选择的转基因大肠杆菌菌株生长并且使用IPTG诱导在28℃下诱导Cry蛋白表达。将细胞再悬浮于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中并且然后使用Microfluidics LV-1匀浆器打碎。
表达分析.经由离心澄清来自转基因Bt或大肠杆菌菌株的所得细胞裂解物并且使用BioRad Experion系统(伯乐公司(Biorad),加利福尼亚州赫拉克勒斯(Hercules,CA))经由SDS-PAGE和电泳图分析样品的纯度。经由布雷福德(Bradford)或赛默(Thermo)660测定来确定总蛋白浓度。然后在以下描述的生物测定中测试经纯化的Cry蛋白。
实例4.Cry蛋白在生物测定中的活性
使用适合靶标有害生物的本领域公认的人工饲料生物测定方法,针对以下鳞翅目有害生物物种中的一种或多种测试实例3中产生的Cry蛋白:欧洲玉米蛀虫(European cornborer)(ECB;欧洲玉米螟(Ostrinia nubilalis))、黑色地老虎(black cutworm)(BCW;小地老虎(Agrotis ipsilon))、秋黏虫(fall armyworm)(FAW;草地贪夜蛾(Spodopterafrugiperda))、玉米穗蛾(corn earworm)(CEW;玉米穗虫(Helicoverpa zea))、大豆夜蛾(soybean looper)(SBL;大豆尺蠖(Pseudoplusia includens))、绒毛豆毛虫(velvetbeancaterpillar)(黎豆夜蛾(Chrysodeixis includes))、烟夜蛾(tobacco budworm)(TBW;烟芽夜蛾(Heliothis virescens))、南部粘虫(southern armyworm)(SAW;南部灰翅夜蛾(Spodoptera eridania))、考斯粘虫(cosmid armyworm)(CAW;考斯夜蛾(Spodopteracosmioides))、亚洲玉米蛀虫(Asian corn borer)(ACB;亚洲玉米螟(Ostriniafurnacalis))、棉螟蛉(cotton bollworm)(CBW;棉铃虫(Helicoverpa armigera))、东方黏虫(Oriental armyworm)(OAW;东方粘虫(Mythimna sepatate))和西方玉米根虫(westerncorn rootworm)(WCR,玉米根虫(Diabrotica virgifera)。
向24孔平板中的人工昆虫饲料(Bioserv(Bioserv,Inc.),弗伦奇敦,新泽西州)的表面施用等量的溶液中的蛋白质。在饲料表面干燥之后,向每个孔中添加有待测试的昆虫物种的幼虫。将这些平板密封并且保持在就温度、光照以及相对湿度而言的环境实验室条件下。阳性对照组由暴露于非常具活性且广谱的野生型芽孢杆菌属菌株的幼虫组成。阴性对照组由暴露于仅用缓冲溶液处理的昆虫饲料的幼虫和未处理的昆虫饲料(即只有饲料)上的幼虫组成。约120小时之后评估死亡率并且相对于对照评分。
结果示于表2中,其中“-”意指与对照组相比无活性,“+/-”意指与对照组相比0-10%的活性(此类别还包括具有强烈幼虫生长抑制的0%死亡率),“+”意指与对照组相比10%-25%的活性,“++”意指与对照组相比25%-75%的活性,并且“+++”意指与对照组相比75%-100%的活性。表2中的名称“nt”意指没有针对该具体有害生物物种测试所指示的蛋白质。
表2.本发明的组装的杀昆虫蛋白的生物测定结果。
Figure BDA0003416595550000791
表3.
Figure BDA0003416595550000792
目前尚未知Cry1I蛋白对黑色地老虎(BCW,小地老虎)具有活性。在此,与Cry1Ia、Cry1Ib和Cry1Ie具有93%同一性的BT204对BCW具有惊人的活性。当BT204的氨基酸序列(SEQ ID NO:36)与三个已知的Cry1I蛋白(SEQ ID NO:60、SEQ ID NO:61和SEQ ID NO:64)比对时,与三个已知的非BCW活性Cry1I蛋白相比,BT204在整个序列全长中的17个位置处具有独特的氨基酸。与三个Cry1I氨基酸序列相比,SEQ ID NO:36的17个位置处的氨基酸取代由以下组成:N或D113A、A164S、V223A、T249K、I或Q281H、D298N、N454T、S519P、L571V、Y651H、E659K、R670G、D675N、K677T、D678E、D693N和E716G,这表明这些位置解释了与非活性Cry1I蛋白相比,BT204的BCW活性的差异。
实例5.用于植物表达的基因定向
在植物中表达之前,在自动化基因合成平台(例如,金斯瑞公司(Genscript,Inc.),皮斯卡塔韦,新泽西州)上合成编码本发明的Cry蛋白的多核苷酸,例如编码SEQ IDNO:36-59中任一项的多核苷酸。用于这个实例,制备包含可操作地连接至Cry蛋白编码序列(该编码序列可操作地连接至终止子)的植物可表达型启动子的第一表达盒,并且制备包含可操作地连接至选择性标记(该选择性标记可操作地连接至终止子)的植物可表达型启动子的第二表达盒。选择性标记的表达允许在选择培养基上鉴别转基因植物。将两个表达盒克隆进适于土壤杆菌介导的水稻或玉蜀黍转化的载体中。
实例6.Cry蛋白在玉蜀黍植物中的表达与活性
未成熟的玉蜀黍胚的转化基本上如在以下文献中描述的来进行:Negrotto等人,2000,Plant Cell Reports[植物细胞报道]19:798 803。简言之,使包含描述于实例5中的表达载体的土壤杆菌菌株LBA4404(pSB1)在28℃下在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/l琼脂,pH 6.8)固体培养基上生长2-4天。将大约0.8X109个土壤杆菌细胞悬浮于补充有100μM As的LS-inf培养基中。在这个培养基中对细菌预诱导大约30-60分钟。
将来自近交玉蜀黍系的未成熟胚从8-12天龄的穗中切除到液体LS-inf+100μM As中。用新鲜的感染培养基漂洗这些胚。然后添加土壤杆菌溶液,并且将这些胚涡旋30秒并且允许其与细菌一起沉降5分钟。然后将这些胚盾片向上地转移到LSA培养基中,并且在暗处培养两到三天。随后,将每皮氏板(petri plate)大约20与25个之间的胚转移至补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中,并且在大约28℃下在黑暗中培养10天。
将产生胚性愈伤组织的未成熟胚转移至LSD1M0.5S培养基中。在这种培养基上对培养物进行持续大约6周的选择,在约3周时进行传代培养步骤。将存活的愈伤组织转移至补充有甘露糖的Reg1培养基中。然后在光照中(16小时光照/8小时黑暗方案)培养之后,将绿色组织转移至没有生长调节剂的Reg2培养基中并孵育约1至2周。将这些小植株转移至含有Reg3培养基的Magenta GA-7盒(马真塔公司(Magenta Corp),芝加哥,伊利诺伊州)中并使其在光照中生长。约2-3周之后,通过PCR测试植物的选择性标记基因和Bt cry基因的存在。将来自PCR测定的阳性植物转移至温室用于进一步评估。
在叶切除生物测定中,针对拷贝数(通过Taqman分析确定)、蛋白质表达水平(通过ELISA确定)和对抗目的昆虫种类的功效对转基因植物进行评估。确切地说,从单拷贝事件(V3-V4阶段)中切取植物组织(叶或花丝)并且用靶标有害生物的新生幼虫侵染,然后在室温下孵育5天。针对一种或多种鳞翅目有害生物对来自表达以下蛋白的转基因植物的叶圆片进行测试:BT204(SEQ ID NO:36)、BT235(SEQ ID NO:37)、BT645(SEQ ID NO:38)、BT727(SEQ ID NO:39)、BT1047(SEQ ID NO:40)、BT1280(SEQ ID NO:41)、BT1555(SEQ ID NO:42)、BT1559(SEQ ID NO:43)、BT1563(SEQ ID NO:44)、BT1571(SEQ ID NO:45)或BT1633(SEQ ID NO:46)或突变型Cry蛋白、mBT204(SEQ ID NO:47)、mBT235(SEQ ID NO:48)、mBT645(SEQ ID NO:49)、mBT645-2(SEQ ID NO:50)、mBT645-3(SEQ ID NO:51)、mBT727(SEQID NO:52)、mBT1047(SEQ ID NO:53)、mBT1280(SEQ ID NO:54)、mBT1555(SEQ ID NO:55)、mBT1559(SEQ ID NO:56)、mBT1563(SEQ ID NO:57)、mBT1571(SEQ ID NO:58)或mBT1633(SEQ ID NO:59)。转基因植物组织生物测定的结果将证实当在转基因植物中表达时本发明的Cry蛋白对于目标鳞翅目有害生物中的一种或多种是有毒的。
实例7.Cry蛋白在大豆植物中的表达与活性
用植物可表达型启动子构建用于大豆转化的二元载体,该启动子可操作地连接至大豆密码子优化的多核苷酸(SEQ ID NO:26或SEQ ID NO:27),该多核苷酸编码突变型BT645(分别为SEQ ID NO:50或SEQ ID NO:51),可操作地连接至终止子。对于这个实例,二元载体包含两个表达盒,第一表达盒包含可操作地连接至SEQ ID NO:26或SEQ ID NO:27的UBQ3启动子,SEQ ID NO:26或SEQ ID NO:27可操作地连接至AtUBQ3终止子。每个载体的第二表达盒包含可操作地连接至NtALS编码序列(用作可选择性标记)的GmEF启动子,NtALS编码序列可操作地连接至GmEPSPS终止子。使用本领域技术人员所熟知的方法(如重叠PCR、DNA合成、限制性片段亚克隆以及连接)的组合来构建二元载体。
可以将大豆植物材料适当地转化并且通过本领域的普通技术人员熟知的多种方法再生育性植物。例如,可以通过以下各项得到育性的形态学正常的转基因大豆植物:1)从例如未成熟的子叶、下胚轴或其他合适的组织产生体细胞胚性组织;2)通过粒子轰击或土壤杆菌感染进行转化;以及3)再生植物。在一个实例中,如在美国专利号5,024,944中描述的,从大豆的未成熟胚中切除子叶组织,任选地将胚轴移出,并且在含有激素的培养基中进行培养从而形成体细胞胚性植物材料。使用例如直接DNA方法、DNA包被的微弹轰击或用土壤杆菌感染来将该材料转化,在一种适合的选择培养基上进行培养并且任选地还在选择剂的连续存在下再生成育性转基因大豆植物。选择剂可以是抗生素(例如卡那霉素、潮霉素),或除草剂(例如HPPD抑制剂、草胺膦或草甘膦),或者可替代地,选择可以基于可视化标记基因(例如GUS)的表达。用于转化的靶组织包括分生组织、体细胞克隆胚性组织和花或花形成组织。大豆转化的其他实例包括物理DNA递送方法,如微粒轰击(参见例如,Finer和McMullen,In Vitro Cell Dev.Biol.[体外细胞与发育生物学],1991,27P:175-182;McCabe等人,Bio/technology[生物/技术],1998,6:923-926)、晶须法(whisker)(Khalafalla等人,African J.of Biotechnology[非洲生物技术杂志],2006,5:1594-1599)、气溶胶束注射(美国专利号7,001,754)、或通过土壤杆菌介导的递送方法(Hinchee等人,Bio/Technology[生物/技术],1988,6:915-922;美国专利号7,002,058;美国专利申请号20040034889和20080229447;Paz等人,Plant Cell Report[植物细胞通讯],2006,25:206-213)。
用上述包含本发明的mBT645-2编码序列或mBT645-3编码序列的二元载体产生大豆转基因植物。将T0植物从组织培养中取出到温室中,在温室中在2”方形花盆中以5-10g/gal土壤将其移植到与1%颗粒
Figure BDA0003416595550000831
(奥林匹克园艺产品公司(OlympicHorticultural Products,Co.),梅因兰(Mainland),宾夕法尼亚州)混合的水饱和土壤中(
Figure BDA0003416595550000832
插秧混合料(Plug and Seedling Mix),阳光种植园艺公司(Sun GroHorticulture),贝尔维尤(Bellevue),华盛顿州,或发发得萌发混合料(FafardGerminating Mix))。将这些植物用潮湿拱顶进行覆盖,并置于具有以下环境条件的Conviron室中(彭比纳(Pembina),北达科他州):日间24℃;夜间20℃;16-23小时光照-1-8小时黑暗光周期;相对湿度80%。
在植物已经被建立在土壤中并且出现新的生长(约1至2周)之后,将植物取样并且使用适当的用于Cry基因的探针、或启动子(例如prUBQ3)通过
Figure BDA0003416595550000833
分析对所希望的转基因的存在进行测试。将阳性植物移植到装有Fafard#3土壤的4”方形花盆中。以推荐的比率将Sierra 17-6-12缓释肥料掺入土壤中。然后将这些植物重新安置在标准温室中以适应环境(约1周)。环境条件是:日间27℃夜间21℃;14小时光照期(有补充光);环境湿度。在适应环境之后(约1周),对这些植物取样并且详细测试插入的转基因的存在和拷贝数量。将这些转基因大豆植物生长至成熟用于T1种子生产。通过
Figure BDA0003416595550000834
分析确定T1植物的接合性,使纯合植物生长用于种子生产。使用转基因种子和子代植物来进一步对它们的有害昆虫摄食损伤耐受性以及分子特征进行评估。
为了生物测定,表达mBT645-2(SEQ ID NO:50)或mBT645-3(SEQ ID NO:51)蛋白的转基因大豆叶片针对大豆夜蛾(soybean looper)、绒毛豆毛虫(velvetbean caterpillar)和/或烟叶蛾(tobacco budworm)进行了测试。不表达BT645蛋白的阴性分离物用作阴性对照。叶生物测定的结果表明,在大豆叶中表达的mBT645蛋白对三个昆虫有害生物物种有毒。
序列表
<110> Syngenta Paticipations AG
SEGUIN, Katherine
FLEMING, Christopher
SESLER, Richard
<120> 用于控制植物有害生物的组合物和方法
<130> 81318-WO-REG-ORG-P-1
<160> 66
<170> PatentIn 3.5版
<210> 1
<211> 2160
<212> DNA
<213> 人工序列
<220>
<223> 编码BT204的组装的多核苷酸
<400> 1
atgaaactaa agaatccaga taagcatcaa agtttttcta gcaatgcgaa agtagataaa 60
atcgctacgg attcactaaa aaatgaaaca gatatagaat tgaaaaatat gaataatgaa 120
gattatttga gaatgtctga gcatgagagt attgatccgt ttgttagtgc atcaacaatt 180
caaacgggta ttggaattgc tggtaaaatc cttggtactc taggtgttcc ctttgctggg 240
caaatagcta gcctctatag ttttatccta ggcgagcttt ggccaaaggg gaaaagtcag 300
tgggaaatct ttatggaaca tgtagaagag cttattgcac aaaaaatatc aacttacgca 360
agaaacaaag cactcacaga tttaaaaggt ttaggagatg ctttggctgt ttaccatgag 420
tcacttgaaa gttggattaa aaatcgcaat aacacaaggg ctagaagtgt tgttaagagc 480
caatatatct ctctagaact tatgtttgtt cagaagctgc cttcctttgc ggtatctggg 540
gaagaagttc ctctattacc aatatacgcc caagctgcaa atctacactt gttgctatta 600
agagatgcat ctatttttgg aaaagagtgg ggattatcat cttcagaaat ttcaacattt 660
tataaccgtc aagccgaaag aacgagtgac tattccgacc attgtgtgaa atggtatagt 720
acaggtctaa ataacttgag gggtaaaaat gccgaaagct gggttcgcta taatcaattt 780
cgtaaagata tgatattaat ggtactagat ttagtggcac tattcccaag ttatgataca 840
catatgtatc caattaaaac tacagcccaa cttactagag aagtatatac aaacgcaatt 900
gggacagtac atccgcatcc aagttttgca agtacgactt ggtataataa taatgcacct 960
tcgttttctg ccatagaggc tgccgttatc cgaagcccgc acctactcga ttttctagaa 1020
caagttacaa tttacagctt attaagtcgg tggagtaaca ctcagtatat gaatatgtgg 1080
ggagggcata gacttgaatt ccgaacaata ggaggagcat taaatacctc aacacaagga 1140
tctactaata cttctattaa tcctgtaaca ttaccgttca cgtcacgaga cgtctatagg 1200
actgaatcat tggcagggct gaatctattt ttaactcaac ctgttaatgg agtacctagg 1260
gttgattttc attggaaatt cgtcacacat ccgatcgcat ctgataattt ctattatcca 1320
gggtatgctg gaattgggac gcaattacaa gattcagaaa ctgaattacc acctgaaaca 1380
acaggacagc caaattatga atcatatagt catagattat ctcatatagg actcatttca 1440
gcatcacatg tgaaagcatt ggtatattct tggacgcatc gtagtgcaga tcgtacaaat 1500
acaattgagc caaatagcat tacacaaata ccattagtaa aagcattcaa tcttccttca 1560
ggtgccgctg ttgttagagg accaggattt acaggtgggg atatccttcg aagaacaaat 1620
actggtacat ttggggatat acgagtaaat attaatccac catttgcaca aaggtatcgc 1680
gtaaggattc gttatgcttc tactacagat gtacaattcc atacgtcaat taacggtaaa 1740
gctattaatc aaggtaattt ttcagcaact atgaatagag gagaggactt agactataaa 1800
acctttagaa ctgtaggatt tactactcca tttagctttt cggatgtaca aagtacattc 1860
acaataggtg cttggaactt ctcttcaggt aacgaagttt atatagatag aattgaattt 1920
gttccggtag aagtaacata tgaggcagag catgattttg aaaaagcgca agaggaggtt 1980
actgcactgt ttacatctac gaatccaggt gggttaaaaa caaatgtaac ggagtatcat 2040
attgaccagg tatcaaattt agtagagtct ttatcaaatg aattctatct cgatgaaaag 2100
agagaattat tcgagatagt taaatacgcg aagcaactcc atattgggcg taacatgtag 2160
<210> 2
<211> 1878
<212> DNA
<213> 人工序列
<220>
<223> 编码BT235的组装的多核苷酸
<400> 2
atgagaaatg cttcaaaaga ggtgaagata ttgagaacaa gacagtatga aaaagattct 60
gcgatggtat atgctatgga agatcaacct ctttcatttg gaggagtggt agagctttct 120
gggaaaatag gtttaggggt tgttaaaacg gtgatttctt ctattactcg acgtggtaga 180
gacgatgaaa ttgctggaag aatactatca gatgtttatg gcgtactttg gtcaaatcgt 240
aaagggtatt ggaatgaaat gatagaggct gtagagactt taattcgaca cgatattaat 300
gagaatgtaa aaaataacac cttagctgta ttaaccgata ttcgtaatgc tttactccta 360
tatcagcaag ctactgaagc ttggcaaaac aatcgaactg atccccaact tcaagaacga 420
atcagaaatc agtttattgc tacaaataca tttatagaat ttgctatgcc ttcgtttata 480
gtcccacatt atgaagtaat attactacct atattcgctc aagttgctaa ctttcattta 540
ttattattac gagatatcgc aatattcgga cttgaatgga ggatgagtaa agccgaaata 600
gatgattatt attttgcaaa cactggatta actggactta cctcaaaata caccagccat 660
tgtgtcaaat ggtattgtga aggtttatgt atagctacaa atgtagactt aggtcaatat 720
ccagaatttt atcaacttga taaatggaat gcaatgaatg actttcgacg agaaatgacc 780
tttatggttt tagatattat tgcgttatgg ccaacgtatg atccgattag atatccacta 840
gggattaaaa cagagcttac aagagaagtc ttcaccccct tattaggaat aaacccgaat 900
agttcttggt tgatacacac tatggaagaa atagaggcta agctaacttt tttatctcct 960
ttcttgagtt ggatcagttt tgaacaatta gttaaacaag gtgatggtat atcaactttt 1020
acagattggg gaagttttac gctaagtaac acaatgctac cattaagcta cattcttggt 1080
ggggcgggat ctggaactgg tgagtctaca aacattccaa taaaatcaga aaattatgat 1140
gtttataagg tgcttgttgg taccgattat agtcacccta gtaatgttcc aattcgaaag 1200
cttgaatact attgtacaaa tggaactata gaaaatgtga ttactgctgg aacaggtaca 1260
actaatgccc tttttgaact tcctaataac ggatgtatag attatagtca ccgtgtatct 1320
agactttctt gttcgaacgt agaagtttat gaatgggagg gggggcctaa gtatgcccta 1380
aaaaatattg cttatggatg gacacatata agtgttgatt ctaaaaatac tttaagcgct 1440
aacgtaataa ctcaaattcc cgctaggaaa ggttactcat ctagtgagtc aaatccaagt 1500
atagcagggc cttatttcac aggaggtgat ttgatagccc tacctcctaa tggagctcaa 1560
ttgcaaatgc gtgtgacccc tccagtatca tcctgcacaa caaattattg tgtacgactt 1620
cgttacgcaa gtagtggaaa tacgaatata tatgtcgaaa gagtgcttcc ttctggtgat 1680
acttacggtg aaactcatga tgtcccggct acatattatg gaggttcact atcatatagt 1740
tcctttgcat atgttgtaaa tttgacggcc atgttcgagg gggtcaatgt agaaataaaa 1800
atcaaaaata taggttcttc acaaatcatt cttgataaaa ttgaattcct tccaattaaa 1860
gaatcattga aagaatag 1878
<210> 3
<211> 2148
<212> DNA
<213> 人工序列
<220>
<223> 编码BT645的组装的多核苷酸
<400> 3
atgaaactaa agaatcaaga taagcatcaa agttattcta gcaatgagaa ggtagataaa 60
atctctacaa ataaaacaga tatagaatta aaaaatatgg ataatgaaga ttatttgaga 120
gtgtctgagc acgagagcat taatccattt gttagtgcat caacaattca aacgggtatt 180
ggaattgctg gaaaaatcct tggtactcta ggtgttcctt ttgctggaca aatagcaagc 240
ctttatagtt ttatcttggg cgagctttgg cctaaaggga aaagccaatg ggaaatcttt 300
atggaacatg tagaagagat tattaatcaa aaaatatcaa cttatgcaag aaataaagca 360
cttacagact tgaaaggatt aggagatgct ttagctgtct accatgaatc gcttgaaagt 420
tgggttgaaa accgtaataa cacacgagcg aggagtgtag tcaagggcca atacatcgca 480
ttagaactga tgtttgttca gaaacttcct tcttttgcag tatctggtga ggaagtacca 540
ttattaccga tatatgtaca agcggcaaat ttgcatttgt tgctattgag agatgcatct 600
atttttggaa aagaatgggg attgtcacct tcggaaattt caacttttta taaccgtcaa 660
gtcgatcgaa caagagatta ttccgaccat tgtgtaaaat ggtataatac aggcctaaat 720
aatttgagag gtacaaatgc cgaaagctgg gttcgttata atcaatttcg taaagatatg 780
acattaatgg tattagattt aattgcgcta ttcccaagct atgatacaat tgtttatcct 840
attaaaacca cttcacaact tacaagagaa gtatatacag acgcaattgg gacagtacat 900
ccgcatgcaa gttttgcaag tacgacttgg tataataata atgcaccttc gttctctgcc 960
atagaggctg ctgttatccg aagcccacac ctacttgatt ttctagaaaa agttacaatt 1020
tatagtttat taagtcggtg gagtaatact cagtatatga atatgtgggg aggacataga 1080
cttgaatccc gcccaatagg aggggcatta aatatctcaa cacaaggatc taccaatact 1140
tctattaatc cagtaacatt acagttcacg tctcgtgacg tctataggac agaatcatgg 1200
gcagggctga atttattttt aactcaacct gttaatggag tacctagagt tgatttccat 1260
tggaaatacc ccacacttcc aatagcatct gataattttt attatctagg gtatgctgga 1320
gttgggacac aattacaaga ttcagaaaat gaattaccac ctgaaacaac aggacagcca 1380
aattatgaat catatagtca tagattatct catataggac tcatttcagc atcccacgtg 1440
aaagcattag tatattcttg gacgcatagt agtgcaaatc gtacaaatac aattgaggca 1500
aacagcatta cacaaatacc attagtaaaa gcattcaatc ttccttcggg tgctactgtt 1560
gttagagggc caggatttac aggaggggat atccttcgaa gaacgaatac gggtacattt 1620
ggagatatac gagtaactat taatccgcca tttgcacaaa ggtatcgcgt aaggattcgt 1680
tatgcttcta caacagattt acaattccat acatcaatta atggaagagc tattaatcaa 1740
gggaattttt cagcaactat gaatagggaa gataacttaa actatagaac ctttagaact 1800
gcgggattta cgactccatt tagcttttca gatacacaaa gtacattcac aataggtgct 1860
tggagcttct cttcaggtaa cgaagtttat atagatagaa ttgaatttgt tccggtagaa 1920
gtagcgcatg aggaaaatta tgattttgaa aaagtgcaag aggaggttac agcactgttt 1980
acacctacta atcctagagg attaaaaaca aatgtaacgg attatgatat tgaccaggta 2040
ttaaatctag tagagtctct atcagatgaa ttctacgtcg atgaaaagag agaattactc 2100
gaaattgtta aatatgcgaa gcaacttaat attgaccgta acatgtag 2148
<210> 4
<211> 1851
<212> DNA
<213> 人工序列
<220>
<223> 编码BT727的组装的多核苷酸
<400> 4
atgttgagaa caagacagta taaaaaaggt ccagagatgg tatacacggg gagggaacag 60
acccttccat ttgaagaagt ggtaaaaatt tctggtaaaa taggtctagg ggttgtaaaa 120
actgtgatta cttctatcat tcgatgtggt agagacaatg aaatagctgg aagaatacta 180
tcagatgttt acagcgtact ttggtcaact cctaaagggt attgggctga aatgatagag 240
gctgtagaga ctttaatcca acacgagatt agtgagaata tcagaaataa cgcctttgcg 300
gtattaaccg atgttcgtaa tgctttactc ctatatcagc aagctgctga agagtggcaa 360
agcaatcgaa ctgatcctca actacaagaa cgagtcagaa atcaatttat tgctacgaat 420
acacttatag aatttgctat gccttcgttt acagtcccac attatgaagt aatattacta 480
cctatattcg ctcaagctgc taaccttcat ttattattat tacgggatgt cgaaatattc 540
ggactcgaat ggggaatgag taaagccgaa atagatgatt attattttgc aaactctgga 600
ttaactggac ttacacaaaa atacaccaac catagtgtca aatggtatcg tgaaggttta 660
tgtatagcta caaatataga cttaggtcaa tttccagaat tttatcaact tgataaatgg 720
aatgcaatga atgactttcg acgagaaatg acctttatgg ttttagatat tattgcgtta 780
tggccaacgt atgatccgat tagatatcca ctagggatta aaacagagct tacaagagaa 840
gtcttcaccc ccttattagg aataaaccct aatagttctt ggttgataca cactatggaa 900
gaaatagagg ctaagctaac ttttttatcc cctttcttaa gttggatcag ttttgaacaa 960
ttagttaaac aaggtgatgg tatagcaact tttacagatt ggggaaattt tacgctaagt 1020
aacacaatgc tgccattaag ttatattctt ggtggggcgg gctctggaac tggtgactct 1080
acaaatattc caatgcaatc agaaaattat gatgtttata aggtacatgt tggtaccgat 1140
tatagtcacc ctagtaatgt tccaattcga aagcttgaat actattgtac aaatggaacg 1200
atggaaaagg tgattactgt tggaacaggt agaactaatg ccctttttga acttcctaat 1260
aacggctgtg tagattatag tcaccgtata tctaggctgt cttgttcgaa cgtagaagtt 1320
tatgaatggg agggaggacc tagatatgcc ctaaaaaata ttgcttatgg atggacacat 1380
ataagtgtag actctaaaaa tacgttaagc gctaacgcaa taacccaaat tcctgctagg 1440
aagggttacg catctagtgg gtcaaatcta agtatagcag gtccttattt cacaggaggc 1500
gatttgatag tcctacctcc taatggagct caattgcaaa tacgagtgac ccctccagta 1560
tcatccaaat caaaaaaata ttgtgtgaga tttcgttatg caagtagtgg gaatacgaat 1620
atatatttcg aaagagtgct ttcttctggt gatacttaca gtgaaactca tgatgtcccg 1680
gccacatatc ctggaggtgc actatcttat agttcctttg catatgttgt aaatttgacg 1740
gctatattcg agggattcaa tgtagaaata aaaatcaaaa atataggttc ttcgcaaatc 1800
attcttgata aaatcgaatt ccttccaatc aaagaatcat tgaaagaata g 1851
<210> 5
<211> 2277
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1047的组装的多核苷酸
<400> 5
atgaatctat gcttttatct aaatataaaa aatgctttat cttacactat attctggaaa 60
tgtttatttg aacaagattt tatcagaaaa ttgaaactaa ttataaatgg agtgattaat 120
atgaaaccaa aaaatcaaaa taagtgtcag agcttatata gcaatgggac atttgatatg 180
gactctaaag cttcattaaa aaatgacaag aatatggaat tacaaagtat tactcatgaa 240
gattgtttga ggatgtctga gcatgaaagt atagagccgc ttgttagcgc gtcagtaatt 300
caaaatggga ttggaattgc tggtaaaatc cttggtacct taggtgttcc ttttgctgga 360
caaatagcta gtctctatag ttttatctta ggcgagcttt ggcctaaggg gaaaagtcaa 420
tgggagatct ttatggaaca tgtagaagaa cttattgacc aaaaaatatc aatttacgca 480
agaaataaag cactcacaga gttaaaagga ttaggagatg ctttggctgt ctaccatgaa 540
tcgcttgaaa gttggattga aaatcgtaat aatacaagag caagaagtgt tgtcaaaagc 600
caatacatta ctttggaact gatgttcgtt caggggctac cttcctttgc agtgtctggg 660
gaagaagttc tactattacc aatatatgcc caagctgcaa atctacactt gttgctatta 720
agagatgcgt ctatttttgg agaagagtgg ggattatcag cttcagaaat ttcaacattt 780
tataatcgac aagtcgagag agtgaatgat tatactgact attgtgtaaa attctataat 840
acaggtctaa attcgtcgag gggtacagat gcgaagagct gggctagtta taatcaattt 900
cgtaaagata tgacattaat ggtactagat ttagtcgcac tatttccaag ctatgataca 960
catgtatatc caattaaaac caattcccaa cttacaagag acgtatatac agatgcaatt 1020
gggacagtac atccaaatcc aagttttgca agtacgactt ggtataataa taatgcacct 1080
gcgttctctg ctatagaggc cgctgttatc cgaagcccac atctacttga ttttttagaa 1140
gaagttacaa tttacagtgc attaagccga tggagtaaca ctcagtatat gaatatatgg 1200
tcaggtcata gtcttaaatt ccgaacaata ggaggaggat tgaatacctc aacccaagga 1260
tctaccaata gtactattag tcctgtaaca tttcagtttc cagcccgaga cgtttataga 1320
acagaatcat tggccgggtt gaatatattt ctaactcaac ctgtaaatgg ggtaccttcg 1380
gttagcttcc attggatact tcctggaatt gaggtgggga attctattac ctataaccct 1440
gggtatgttg gagttgggac gcaattacaa gattcagaaa ctgaattacc acctgaaacg 1500
acagaacggc caaattatga atcttacagt catagattat ctcacatagg actaattaca 1560
gcatcccatg taagagcatt agtatattct tggacgcatc gtagtgcaga acgtacaaat 1620
acaattgagc caaatagaat tacacaaatc ccattagtaa aagcattgaa tctctattca 1680
ggtaccactg ttgtcaaagg accagggttt acaggtgggg atattcttcg tagaactaat 1740
acgggtatat ttggagatat acgagtaaat ataactgcac cattatcaca aagatataga 1800
gtaagggttc gttatgcttc tactacagat ttagaatttt acacgagtgt taatggaacc 1860
actattaata tgggtaattt ctcgaaaact atggatagcg ggaataattt agaatttagt 1920
agttttaaga ctacaggatt tagtacgcct tttagttttt caaatgcgca aagtacattc 1980
acattaggta ctatggattt ttcaaatcag gaagtttata tagatagaat tgaatttttt 2040
ccggtagagg taacatatga ggaagagtgt gattttgaaa aagcgcaaga ggcggttact 2100
gcactgttta cacctaagaa tccaaaaggg ttaagaatga atgtaacgga ttatcatatt 2160
gaccaggtat caaatttagt agagggtcta tcggatgaat catatctcga tgaaaagaga 2220
gaattatttg agaaagtcga atacgcgaag caactcaata ttgagcgtaa catttag 2277
<210> 6
<211> 2205
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1280的组装的多核苷酸
<400> 6
atgaaactaa agaatcaaga taagcatcaa agtttttcta gcaatgcgaa agtagataaa 60
atctctacgg attcactaaa aaatgaaaca gatatagaat tacaaaacat taatcatgaa 120
gattgtttga aaatgtctga gtatgaaaat gtagagccgt ttgttagtgc atcaacaatt 180
caaacaggta ttggtattgc gggtaaaata cttggtaccc taggcgttcc ttttgcagga 240
caagtagcta gtctttatag ttttatctta ggtgagctat ggcctaaggg gaaaaatcaa 300
tgggaaatct ttatggaaca tgtagaagag attattaatc aaaaaatatc aacttatgca 360
agaaataaag cacttacaga cttgaaagga ttaggagatg ccttagctgt ctaccatgat 420
tcgcttgaaa gttgggttgg aaatcgtaat aacacaaggg ctaggagtgt tgtcaagagc 480
caatatatcg cattagaatt gatgttcgtt cagaaactac cttcttttgc agtgtctgga 540
gaggaggtac cattattacc gatatatgcc caagctgcaa atttacattt gttgctatta 600
agagatgcat ctatttttgg aaaagagtgg ggattatcat cttcagaaat ttcaacattt 660
tataaccgtc aagtcgaacg agcaggagat tattccgacc attgtgtgaa atggtatagc 720
acaggtctaa ataacttgag gggtacaaat gccgaaagtt gggtacgata taatcaattc 780
cgtagagaca tgactttaat ggtactagat ttagtggcac tatttccaag ctatgataca 840
caaatgtatc caattaaaac tacagcccaa cttacaagag aagtatatac agacgcaatt 900
gggacagtac atccgcatcc aagttttaca agtacgactt ggtataataa taatgcacct 960
tcgttctctg ccatagaggc tgctgttgtt cgaaacccgc atctactcga ttttctagaa 1020
caagttacaa tttacagctt attaagtcga tggagtaaca ctcagtatat gaatatgtgg 1080
ggaggacata aactagaatt ccgaacaata ggaggaacgt taaatatctc aacacaagga 1140
tctactaata cttctattaa tcctgtaaca ttaccgttca ctagccgaga cgtctatagg 1200
actgaatcat tggcagggct gaatctattt ttaactcaac ctgttaatgg agtacctagg 1260
gttgattttc attggaaatt cgtcacacat ccgatcgcat ctgataattt ctattatcca 1320
gggtatgctg gaattgggac gcaattacag gattcagaaa atgaattacc acctgaagca 1380
acaggacagc caaattatga atcttatagt catagattat ctcatatagg actcatttca 1440
gcatcacatg tgaaagcatt ggtatattct tggacgcatc gtagtgcaga tcgtacaaat 1500
acaattgagc caaatagcat tacacaaata ccattagtaa aagcgttcaa tctgtcttca 1560
ggtgccgctg tagtgagagg accaggattt acaggtgggg atatccttcg aagaaagaat 1620
actggtacat ttggggatat acgagtaaat attaatccac catttgcaca aagatatcgc 1680
gtgaggattc gctatgcttc taccacagat ttacaattcc atacgtcaat taacggtaaa 1740
gctattaatc aaggtaattt ttcagcaact atgaatagag gagaggactt agactataaa 1800
acctttagaa ctgtaggctt taccacccca tttagctttt ctaacggtaa agctattaat 1860
caaggtaatt tttcagcaac tatgaataga ggagaggact tagactataa aacctttaga 1920
actgtaggct ttaccactcc atttagcttt ttagatgtac aaagtacatt cacaataggt 1980
gcttggaact tctcttcagg taacgaagtt tatatagata gaattgaatt tgttccggta 2040
gaagtaacat atgaggcaga atatgatttt gaaaaagcgc aagagaaggt tactgcactg 2100
tttacatcta cgaatccaag aggattaaaa acagatgtaa aggattatca tattgaccag 2160
gtatcaaatt tagtagagtc tctatcagat gttctcttca ggtaa 2205
<210> 7
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1555的组装的多核苷酸
<400> 7
atggatctat caccagatgc tcgcattgag gatagcttgt gtgtagccga ggggaacaat 60
attgatccat ttgttagcgc atcaacagtc caaacaggta ttagtatagc tggtagaata 120
ttaggcgtat taggggtgcc gtttgccgga caactagcta gtttttatag ttttcttgtt 180
ggggaattat ggcctagcgg cagagatcca tgggaaattt ttatggaaca tgtcgaacaa 240
attgtaagac aacaaataac ggacagtgtt agggataccg ctattgctcg tttagaaggt 300
ctaggaagag ggtatagatc ttaccagcag gctcttgaaa cttggttaga taaccgaaat 360
gatgcaagat caagaagcat tattcgtgag agatatattg ctttagaact tgacattact 420
actgctatac cgcttttcag catacgaaat caagaggttc cattattaat ggtatatgct 480
caagctgcaa atttacacct attattatta agagatgcat ctatttttgg aaaagaatgg 540
ggattatcag cttcagaaat ttcaacattt tataaccgtc aagtcgaacg aacaagagat 600
tattccgacc attgtgtaaa atggtataat acaggcctaa ataacttgag gggtacaaat 660
gccaaaagtt gggttcgtta taatcaattt cgtaaagata tgacattaat ggtattagat 720
ttagttgcgc tattcccaag ctatgataca cttgtatatc ctattaaaac cacttcacaa 780
cttacaagag aagtatatac agacgcaatt gggaccgtgc atccgaatca agcttttgca 840
agtacgactt ggtataataa taatgcacct tcgttctcta cgatagaggc tgctgttgtt 900
cgaaacccgc atctactcga ttttctagaa caagttacaa tttacagctt attaagtcga 960
tggagtaaca ctcagtatat gaatatgtgg ggaggacata aactagaatt ccgaacaata 1020
ggaggaacgt taaatacctc aacacaagga tctactaata cttctattaa tcctgtaaca 1080
ttaccgttca cgagtcgaga cgtctatagg actgaatcat tggcagggct aaatctattt 1140
ttaactcaac ctgttaatgg agtacctagg gttgattttc attggaaatt cgtcacacat 1200
ccgatcgcat ctgataattt ctattatcca gggtatgctg gaattgggac gcaattacag 1260
gattcagaaa atgaattacc acctgaaaca acaggacagc caaattatga atcatatagt 1320
catagattat cccatatagg actcatttca gcatcccatg tgaaagcgtt ggtatattct 1380
tggacgcatc gtagtgcaga tcgtacaaat acaattgagc caaatagcat tacacaaata 1440
ccattagtaa aagcattcaa tcttccttca ggtgccgctg ttgttagagg accaggattt 1500
acaggtgggg atatccttca aagaacgaat acgggtacat ttggggatat acgagtaaat 1560
attaatccac catttgcaca acggtatcgc gtaaggattc gttatgcttc tactacaaat 1620
gtagaattcc atacgtcaat taacggtaaa gctattaatc aaggtaattt ttcagcaact 1680
atgaatagag gagaggactt agactataaa acctttagaa ctgtaggatt tactactcca 1740
tttagccttt cggatgtaca aagtacattc acaataggtg cttggaactt ctcttcaggt 1800
aacgaagttt atatagatag aattgaattt gttccggtag aagtaacata tgaggcagag 1860
tatgatttaa aaaaagcaca agatgagatt actgcaatgt ttacatctac gaatccaggt 1920
gggttaaaaa caaatgtaac ggagtatcat attgaccagg tatcaaattt agtagagtct 1980
ctatcggatg aattctacct cgatgaaaag agagaattat tcgagatagt taaatactag 2040
<210> 8
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1559的组装的多核苷酸
<400> 8
atgaatctat caaccgatgc tcgtattgag gatagcttgt gtatagccga ggggaacaat 60
atcgatccat ttgttagcgc atcaacagtc caaacgggta ttaacatagc tggtagaata 120
ctaggtgtat taggcgtacc gtttgctgga caaatagcta gtttttatag ttttcttgtt 180
ggtgaattat ggccccgcgg cagagatcct tgggaaattt tcctagaaca tgtcgaacaa 240
cttataagac aacaagtaac agaaaatact agggatacgg ctcttgctcg attacaaggt 300
ttaggaaatt cctttagagc ctatcaacag tcacttgaag attggctaga aaaccgtgat 360
gatgcaagaa cgagaagtgt tctttatacc caatatatag ccttagaact tgattttctt 420
aatgcgatgc cgcttttcgc aattagaaac caagaagttc cattattaat ggtatatgct 480
caagctgcaa atttacacct attattattg agagatgcct ctctttttgg tagtgaattt 540
gggcttacat cccaagaaat tcaacgttat tatgagcgcc aagtggaaaa aacgagagaa 600
tattctgatt attgcgcaag atggtataat acgggtttaa ataatttgag agggacaaat 660
gctgaaagtt ggttgcgata taatcaattc cgtagagact taacgctagg agtattagat 720
ctagtggcac tattcccaag ctatgacacg cgtgtttatc caatgaatac cagtgctcaa 780
ttaacaagag aaatttatac agatccaatt gggagaacaa atgcaccttc aggatttgca 840
agtacgaatt ggtttaataa taatgcacca tcgttttctg ccatagaggc tgccgttatc 900
cgaagcccgc acctactcga ttttctagaa caagttacaa tttacagctt attaagtcga 960
tggagtaaca ctcagtatat gaatatgtgg ggaggacata aactagaatt ccgaacaata 1020
ggaggaacgt taaatacctc aacacaagga tctactaata cttctattaa tcctgtaaca 1080
ttaccgttca cgagccgaga catctatagg actgaatcat tggcagggct gaatctattt 1140
ttaactcaac ctgttaatgg agtacctagg gttgattttc attggaaatt cgtcacacat 1200
ccgatcgcat ctgataattt ctattatcca gggtatgctg gaattgggac gcaattacag 1260
gattcagaaa atgaattacc acctgaaaca acaggacagc caaattatga atcttatagt 1320
catagattat ctcatatagg actcatttca gcatcacatg tgaaagcatt ggtatattct 1380
tggacgcatc gtagtgcaga tcgtacgaat acaattcatt cagatagtat aacacaaata 1440
ccactggtaa aagcacatac ccttcagtca ggtactactg ttgtaaaagg gccagggttt 1500
acaggtggag atatcctccg acgaactagt ggaggaccat ttgcttttag taatgttaat 1560
ttagactgga acttgtcaca aagatatcgt gctagaatac gctatgcttc tactactaat 1620
ctaagaatgt acgtaacgat tgcaggggaa cgaatttttg ctggtcaatt taataaaaca 1680
atgaatactg gtgatccatt aacattccaa tcttttagtt acgcaactat tgatacagca 1740
tttacattcc caacgaaagc gagcagcttg actgtaggtg ctgatacttt tagctcaggt 1800
aatgaagttt atgtagatag atttgaattg atcccagtta ctgcaacact tgaggcagta 1860
actgatttag aaagagcgca gaaggcggtt catgaactgt ttacatctac gaatccggga 1920
ggattaaaaa cggatgtaaa ggattatcat attgaccagg tatcaaattt agtagagtct 1980
ctatcagatg aattctatct tgatgaaaag agagaattat tcgagatagt taaatactag 2040
<210> 9
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1563的组装的多核苷酸
<400> 9
atgaatctat caaccgatgc tcgtattgag gatagcttgt gtatagccga ggggaacaat 60
atcgatccat ttgttagcgc atcaacagtc caaacgggta ttaacatagc tggtagaata 120
ctaggtgtat taggcgtacc gtttgctgga caaatagcta gtttttatag ttttcttgtt 180
ggtgaattat ggccccgcgg cagagatcct tgggaaattt tcctagaaca tgtcgaacaa 240
cttataagac aacaagtaac agaaaatact agggatacgg ctcttgctcg attacaaggt 300
ttaggaaatt cctttagagc ctatcaacag tcacttgaag attggctaga aaaccgtgat 360
gatgcaagaa cgagaagtgt tctttatacc caatatatag ccttagaact tgattttctt 420
aatgcgatgc cgcttttcgc aattagaaac caagaagttc cattattaat ggtatatgct 480
caagctgcaa atttacacct attattattg agagatgcct ctctttttgg tagtgaattt 540
gggcttacat cccaagaaat tcaacgttat tatgagcgcc aagtggaaaa aacgagagaa 600
tattctgatt attgcgcaag atggtataat acgggtttaa ataatttgag agggacaaat 660
gctgaaagtt ggttgcgata taatcaattc cgtagagaca tgactttaat ggtactagat 720
ttagtggcac tatttccaag ctatgatacg cgtgtttatc caatgaatac cagtgctcaa 780
ttaacaagag aaatttatac agatccaatt gggagaacaa atgcaccttc aggatttgca 840
agtacgaatt ggtttaataa taatgcacct tcgttctctg ccatagaggc tgctgttgtt 900
cgaaacccgc atctactcga ttttctagaa caagttacaa tttacagctt attaagtcga 960
tggagtaaca ctcagtatat gaatatgtgg ggaggacata aactagaatt ccgaacaata 1020
ggaggaacgt taaatacctc aacacaagga tctactaata cttctattaa tcctgtaaca 1080
ttaccgttca cttcacgaga cgtctatagg actgaatcat tggcagggct gaatctattt 1140
ttaactcaac ctgttaatgg agtacctagg gttgattttc attggaaatt cgtcacacat 1200
ccgatcgcat ctgataattt ctattatcca gggtatgctg gaattgggac gcaattacag 1260
gattcagaaa atgaattacc acctgaagca acaggacagc caaattatga atcttatagt 1320
catagattat ctcatatagg actcatttca gcatcacatg tgaaagcatt ggtatattct 1380
tggacgcatc gtagtgcaga tcgtacaaat acaattgagc caaatagcat tacacaaata 1440
ccattagtaa aagctttcaa tctgtcttca ggtgccgctg tagtgagagg accaggattt 1500
acaggtgggg atatccttcg aagaacgaat actggtacat ttggggatat acgagtaaat 1560
attaatccac catttgcaca aagatatcgc gtgaggattc gctatgcttc taccacagat 1620
ttacaattcc atacgtcaat taacggtaaa gctattaatc aaggtaattt ttcagcaact 1680
atgaatagag gagaggactt agactataaa acctttagaa ctgtaggctt taccacccca 1740
tttagctttt cagatgtaca aagtacattc acaataggtg cttggaactt ctcttcaggt 1800
aacgaagttt atatagatag aattgaattt gttccggtag aagtaacata tgaggcagaa 1860
tatgattttg aaaaagcgca agagaaggtt actgcactgt ttacatctac gaatccaaga 1920
ggattaaaaa cagatgtaaa ggattatcat attgaccagg tatcaaattt agtagagtct 1980
ctatcagatg aattctatct tgatgaaaag agagaattat tcgagatagt taaatactag 2040
<210> 10
<211> 2118
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1571的组装的多核苷酸
<400> 10
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ccttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat ggatctatcg ctagatgctc gtattgagga ttctttgtgt 120
atagccgagg ggaataatat caatccactt gttagcgcat caacagtcca aacgggtata 180
aacatagctg gtagaatatt gggcgtatta ggtgtgccgt ttgctggaca actagctagt 240
ttttatagtt ttcttgttgg ggaattatgg cctagtggca gagatccatg ggaaattttc 300
ctggaacatg tagaacaact tataagacaa caagtaacag aaaatactag gaatacggct 360
attgctcgat tagaaggtct aggaagaggc tatagatctt accagcaggc tcttgaaact 420
tggttagata accgaaatga tgcaagatca agaagcatta ttcttgagcg ctatgttgct 480
ttagaacttg acattactac tgctataccg cttttcagaa tacgaaatga agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agacgcatcc 600
ctttttggta gtgaatgggg gatggcatct tccgatgtta accaatatta ccaagaacaa 660
atcagatata cagaggaata ttctaaccat tgcgtacaat ggtataatac agggctaaat 720
aacttaagag ggacaaatgc tgaaagttgg ttgcggtata atcaattccg tagagaccta 780
acgttagggg tattagattt agtagcccta ttcccaagct atgatactcg cacttatcca 840
atcaatacga gtgctcagtt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttctctgcc 960
atagagtctg ctgttgttcg aaacccgcat ctactcgatt ttttagaaca agttacaatt 1020
tacagcttat taagtaggtg gagtaacact cagtatatga atatgtgggg aggacataga 1080
ctggaattcc gaacaatagg tggagtgtta aatacctcaa cacaagggtc tactaatact 1140
tctattaatc ctgtaacatt accgttcacg tcgcgagacg tctataggac tgaatcattg 1200
gcagggctga atctattttt aactcaacct gttaatggag tacctagggt tgattttcat 1260
tggaaattcg ccacacttcc gattgcatct gataattttt attatctagg gtatgctgga 1320
gttggtacgc aattacaaga ttcagaaaat gaattaccac ctgaaacaac aggacagcca 1380
aattatgaat catatagtca tagattatcc catataggac tcatttcagc atcccacgtg 1440
aaagcattgg tatattcttg gacacatcgt agtgcagatc gtacaaatac aattgagcca 1500
aatagcatta cacaaatacc attagtaaaa gcgttcaatc tgtcttcagg tgccgctgta 1560
gtgagaggac caggatttac aggtggggat atccttcgaa gaacgaatac tggtacattt 1620
ggggatatac gagtaaatat taatccacca tttgcacaaa gatatcgcgt gaggattcgc 1680
tatgcttcta ctacagattt acaattccat acgtcaatta acggtaaagc tattaatcaa 1740
ggtaattttt cagcaactat gaatagagga gaggacttag actataaaac ctttagaact 1800
gtaggcttta ccactccatt tagcttttca gatgtacaaa gtacattcac aataggtgct 1860
tggaacttct cttcaggtaa cgaagtttat atagatcgaa ttgaatttgt tccggtagaa 1920
gtaacatatg aggcagaata tgattttgaa aaagcgcaag agaaggttac tgcactgttt 1980
acatctacga atccaagagg attaaaaaca gatgtaaagg attatcatat tgaccaggta 2040
tcaaatttag tagagtctct atcagatgaa ttctatcttg atgaaaagag agaattattc 2100
gagatagtta aatactag 2118
<210> 11
<211> 2121
<212> DNA
<213> 人工序列
<220>
<223> 编码BT1633的组装的多核苷酸
<400> 11
atgaaactaa agaatcaaaa tatgcatcaa agcttgtcta gcaatgcgac agttgataaa 60
agctttacag attcactaga acataacaca aatatggaat tacaaaactc taatcatgaa 120
gattgtttga aaatgtctga gtatgagagt attgagccgt ttgttagtgc atcaacaatt 180
caaacgggta ttggaattgc tggtaagatt cttggtactc taggtgttcc ttttgctgga 240
caaatagcta gcctctatag ttttatctta ggcgagcttt ggcctaaagg gaaaagtcaa 300
tgggaaatct ttatggaaca tgtagaagag cttattaatc aaaaaatatc aacttatgca 360
agaaataaag cacttgcaga tttaaaagga ttaggagatg ctttagctgt ctaccatgaa 420
tctcttgaaa gttggattga aaatcgtaat aacacaagag ctaggagtgt tgtcaagaac 480
caatatatcg cattagaact gatgtttgtt caaaaacttc cttcctttgc agtttctgga 540
gaagaggtgc cgctattacc aatctatgca caagctgcaa atttacactt gctgttatta 600
agagatgcgt ctatttttgg aaaagaatgg ggattgtcag aatcagagat ttcaacattt 660
tataaccgtc aagtcgaacg aacaagagat tattccgacc attgtgtaaa atggtataat 720
acaggtctaa atcgcttgag gggtacaaat gccaaaagtt gggttcgtta taatcaattt 780
cgtaaagata tgacattaat ggtattagat ttagttgcgc tattcccaag ctatgataca 840
cttgtatatc ctattaaaac cacttcacaa cttacaagag aagtatatac agacgcaatt 900
gggaccgtgc atccgaatca agcttttgca agtacgactt ggtataataa taatgcacct 960
tcgttctctg ccatagaggc tgctgttatc cgaagtccac acctacttga ttttctagaa 1020
aaagttacaa tttacagctt attaagtcgg tggagtaata ctcagtatat gaatatgtgg 1080
ggaggacata aactagaatt ccgaacaata ggaggaacgt taaatacctc aacacaagga 1140
tctactaata cttctattaa tcctgtaaca ttaccgttca cgagtcgaga cgtctatagg 1200
actgaatcat tggcagggct aaatctattt ttaactcaac ctgttaatgg agtacctagg 1260
gttgattttc attggaaatt cgtcacacat ccgatcgcat ctgataattt ctattatcca 1320
gggtatgctg gaattgggac gcaattacag gattcagaaa atgaattacc acctgaaaca 1380
acaggacagc caaattatga atcttatagt catagactat ctcatatagg actcatttca 1440
gcatcccacg tgaaagcatt ggtatattct tggacacatc gtagtgcaga tcgtacaaat 1500
acaattgagc caaatagcat tacacaaata ccattagtaa aagcattcaa tcttccttca 1560
ggtgccgctg ttgttagagg accagggttt acaggtggtg atatccttcg aagaacgaat 1620
actggcacat ttgcagatat gagagtaaat attactgggc cattatccca aagatatcgt 1680
gtaagaattc gctatgcttc tactactgat ttacaatttt tcacgaatat taatggaact 1740
accattaata tgggtaattt cccaaaaacc gtgaataatt cgagttctga aggctataga 1800
actgtatcat ttagtactcc atttagcttt tcaaatgcac aaagtatatt tagattaggt 1860
atacaagctt tttctggagt ccacgagatt cacgttgata gaattgaatt tgtcccggca 1920
gaggtaacat ttgaggcaga gtatgattta gaaagggcgc aaaaggcggt aaatgcacta 1980
tttacatcta caaatccaaa agatatgaaa acatatgtga cagaatctca gattgaccaa 2040
gtgttcaatc tagtagagtg cttatcggac gaggtctgtc tcgatgagaa gagagaatta 2100
ttcaagaaag taaaatacta g 2121
<210> 12
<211> 2157
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT204编码序列
<400> 12
atgaagctca agaaccccga taagcatcag agcttcagca gcaatgccaa agtcgataaa 60
attgccaccg atagccttaa gaatgagacg gatatcgaac tcaaaaatat gaataacgaa 120
gattaccttc ggatgtcgga gcatgagagc atagatccgt ttgtctctgc atctacaatt 180
cagacgggaa ttggtatcgc tggaaaaatc ttgggcaccc ttggagtgcc cttcgctggg 240
cagatcgctt cgctttactc gttcatattg ggagaactgt ggccaaaggg taagtcccaa 300
tgggaaatct ttatggaaca tgtcgaagag ttgattgccc aaaagatctc aacatatgct 360
cgcaataaag cactcacgga tctcaagggt cttggtgacg ctttggcagt ttaccatgaa 420
tctcttgagt cttggattaa aaatcgcaac aatactaggg ctcggtcggt cgtcaagtcc 480
caatacatca gcttggagct gatgtttgtc cagaaactcc cgtcgtttgc tgtctcggga 540
gaagaggttc ctctgttgcc catatatgca caggctgcta acctgcacct ccttcttttg 600
cgcgacgcat ccatctttgg gaaagaatgg gggctgtctt cttctgagat cagcacgttt 660
tataaccggc aagccgaaag gacatccgac tactcggatc actgtgtcaa atggtattcc 720
acgggtctga ataacctcag gggcaaaaat gcggaaagct gggtgaggta taatcaattc 780
agaaaagata tgattcttat ggtcttggat cttgtggcgc tgtttccttc ctatgacaca 840
catatgtatc cgatcaagac taccgcacaa ctgactaggg aggtgtatac taacgcgata 900
ggcacggtcc acccgcaccc ctccttcgcg tccacaactt ggtataacaa taatgcccct 960
tcgttctcag ccatagaagc cgccgttatt cgctcgccac acttgctgga ctttctggaa 1020
caagtcacaa tttatagcct gctgtcacgc tggtcgaaca cgcaatatat gaacatgtgg 1080
ggagggcacc ggctggagtt caggaccatt ggtggagctc tgaacactag cacgcaaggt 1140
tcaaccaaca ctagcatcaa tcctgtcaca ctcccgttta catcccggga cgtgtaccgc 1200
acagagtcct tggctgggct caacctcttc cttacgcaac ctgtcaatgg cgttccaaga 1260
gtggattttc actggaagtt cgttacccac ccaatcgcct ccgataattt ttactatcct 1320
ggctatgctg gaatcggcac tcaactccag gattctgaaa ctgagctccc acctgaaacc 1380
accgggcaac ctaactatga gtcttactca catcggttga gccatattgg acttatatcg 1440
gcatctcacg ttaaagcact ggtctatagc tggacccata gatcggctga tcggacaaat 1500
acaatcgaac ccaactcgat aactcaaata ccacttgtga aagcgtttaa cttgcctagc 1560
ggtgcagctg ttgtgagagg accgggtttc actgggggag acatccttag acggacaaac 1620
accgggactt tcggagatat acgggtcaac attaatcccc ccttcgccca gagatacagg 1680
gttcggatca gatacgcctc gacaacagat gtccagttcc atacaagcat caacggaaaa 1740
gcaatcaatc aggggaattt ttccgccacc atgaaccgcg gtgaggatct ggattacaaa 1800
acattcagaa ctgtcgggtt tacaactcct ttttccttct cggacgttca gtcgacgttc 1860
acgataggtg cttggaattt ctcttcaggg aatgaggtgt atatagatcg catagaattc 1920
gtgcctgtcg aggtgaccta tgaggcggag catgactttg aaaaagccca agaggaggtt 1980
accgccctgt tcacatctac aaacccgggt gggctgaaga ccaacgtcac cgagtatcac 2040
atagatcagg tctcgaattt ggtcgagtct ctgtccaatg aattctattt ggacgagaaa 2100
cgcgaactgt ttgaaattgt gaagtacgcc aagcagcttc atatcggtag aaatatg 2157
<210> 13
<211> 1875
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT235编码序列
<400> 13
atgagaaacg cttcaaaaga agtgaaaatt ctgcgcactc ggcaatatga gaaagacagc 60
gcgatggtgt acgcgatgga ggatcaacct ctctcattcg gtggtgtggt ggagctgtct 120
ggcaaaatcg ggctgggtgt ggtgaaaacg gttatatctt caataacccg gagagggagg 180
gatgacgaga tagccgggag aatcttgtca gacgtgtacg gtgtgctttg gtcaaacaga 240
aaaggctatt ggaacgaaat gattgaagct gtcgaaacac tgataagaca tgacatcaat 300
gaaaacgtca agaataatac gttggctgtg ctgacagaca ttcggaatgc tctccttctt 360
taccagcagg cgaccgaagc ctggcaaaac aatagaactg acccgcagct tcaggaaagg 420
atcaggaacc aattcattgc cacgaacacc ttcattgaat ttgctatgcc ttccttcatc 480
gttccgcact acgaggtgat tttgctcccg atattcgctc aagtcgcaaa ctttcatctt 540
cttcttttga gagacattgc catatttgga cttgaatggc ggatgtcgaa ggcagagatc 600
gacgactact acttcgcaaa taccgggctt acagggctca cgtctaagta cacgtcgcat 660
tgcgtcaagt ggtactgcga aggactgtgc atagctacca atgtcgacct cggtcagtac 720
ccagagtttt accaactcga caaatggaac gctatgaatg atttcagaag agaaatgacc 780
tttatggttt tggatattat cgctctgtgg cctacatatg accccataag ataccctctg 840
ggaatcaaaa ccgaattgac tcgggaggtc tttacacctc tccttgggat taatccgaac 900
agctcatggt tgatccatac catggaagag atagaagcta aactcacatt ccttagcccg 960
tttcttagct ggatttcgtt tgagcaactc gtcaagcaag gggatggcat ctccacattt 1020
acagactggg gatcatttac cttgtccaat accatgctcc cgctttcata catcctgggc 1080
ggagctggtt caggcacggg cgagtccacg aacatcccca ttaagtctga aaactatgac 1140
gtttacaagg ttctggttgg cactgattat tcacaccctt caaatgtgcc cataagaaag 1200
cttgaatatt attgcaccaa tggaacaatc gaaaacgtca tcacggcagg cactggtacg 1260
acgaacgctc tgtttgagct gcctaacaac ggttgtattg actactccca ccgggtctcg 1320
agactgtcgt gttccaatgt cgaagtctac gaatgggagg gtggaccgaa gtatgccttg 1380
aaaaatattg catatggatg gacccatatt tcagtcgact caaaaaacac tctgtccgcc 1440
aatgtcatta cgcagatacc cgcacgcaag ggttactctt cttcggaatc aaacccgtcc 1500
atagctggac cgtacttcac aggtggcgat cttatcgcat tgccgccaaa cggcgctcaa 1560
ctccaaatgc gggtcactcc tccagtttca tcatgtacaa caaactactg tgtcaggttg 1620
agatatgctt catctgggaa tactaacatt tacgtcgaga gggtcctgcc gagcggggat 1680
acgtacggag agacccacga cgttcccgcc acttattatg gaggctcact gtcatacagc 1740
tccttcgcct acgtggtgaa cttgacggcc atgttcgagg gggtcaacgt tgagataaag 1800
atcaaaaata ttggatcatc acaaatcatc ttggacaaga tcgaattcct ccctatcaaa 1860
gagtctctca aagaa 1875
<210> 14
<211> 2145
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT645编码序列
<400> 14
atgaagctca agaatcaaga caagcaccag tcgtacagct cgaacgagaa agttgacaaa 60
atcagcacga acaaaacgga catagaactt aaaaacatgg ataatgagga ctatcttagg 120
gtctcagaac atgaatccat aaacccattt gttagcgctt caaccattca aaccggtatt 180
gggatcgcgg ggaagatact ggggacgttg ggcgtgccgt tcgccggtca gatagcttct 240
ctttactctt tcatacttgg tgagctttgg cccaagggca agtcacagtg ggaaattttt 300
atggagcatg tcgaggaaat cattaatcaa aagatctcaa cctatgcccg gaacaaggca 360
ctgaccgatc tcaagggctt gggcgacgca ctcgcagtct atcatgagtc cttggagagc 420
tgggttgaga acagaaacaa cacacgggct cggtccgtgg tcaaaggtca atatatcgcc 480
cttgagctga tgttcgtgca aaaacttcca tcgtttgcag tgtctggcga agaagtccct 540
cttttgccca tatacgtgca agcagccaat cttcacttgt tgcttctcag agatgcctct 600
atttttggga aggaatgggg gttgtcccca tccgagatca gcacgtttta taacagacaa 660
gtcgacagaa ctcgggacta ctcggatcac tgcgtgaagt ggtacaacac tgggctcaac 720
aatttgcggg gtacaaatgc ggagtcttgg gttcggtata accagtttcg gaaagatatg 780
acactcatgg tgttggatct tattgccctc ttcccgtcgt acgatactat tgtgtatccg 840
atcaaaacga cttctcaact caccagagaa gtctatacag acgctattgg tactgttcac 900
cctcatgcga gctttgcgtc aacgacgtgg tacaataata acgcaccgtc cttttctgcc 960
attgaagctg cggttattcg ctcacctcac ctgttggact ttctcgagaa ggtgaccata 1020
tactcccttc tgagcagatg gtctaacacg cagtatatga atatgtgggg gggacaccgc 1080
ctggaatcta ggcccattgg cggggcactt aatatatcta ctcaagggtc aacgaacaca 1140
tctataaacc ccgttaccct tcaatttacc tcgcgcgatg tttatcgcac tgaatcatgg 1200
gctggtctta atctctttct cacgcaacca gtcaacggag tccctagggt tgatttccac 1260
tggaagtacc ctactcttcc aatagcttct gataactttt actacctggg gtacgccggg 1320
gttgggaccc agctccaaga ctccgaaaat gaattgccac cagagacgac cggtcagccc 1380
aactacgaaa gctattctca ccggctttca catattggtt tgatttctgc gtcgcacgtt 1440
aaggcgttgg tttattcatg gacccactca tcggcaaacc gcaccaacac tatagaagcc 1500
aactcgatta cccagatccc gcttgtgaaa gccttcaacc ttccatcggg tgcaacggtg 1560
gttagggggc ctggatttac gggcggtgat atacttcgcc gcaccaacac aggtactttt 1620
ggtgacatcc gcgttacaat aaacccgccg tttgctcagc gctacagggt ccggatcagg 1680
tatgcatcaa ccactgactt gcaattccac acctccatca atgggcgcgc catcaaccag 1740
ggcaatttct ctgccacgat gaatagggaa gataacctca attacagaac gttccggacg 1800
gcaggattca caaccccttt ctcattctcg gacacgcaaa gcacatttac tatcggcgcg 1860
tggtcgttta gctccggcaa tgaagtctat atcgatcgca tagagttcgt tccggtcgag 1920
gttgcacatg aggaaaatta cgactttgag aaggtgcagg aggaggttac ggcattgttc 1980
acccccacca atcctagggg attgaagaca aacgtcacag attacgacat cgaccaagtc 2040
cttaatctgg tcgagtcgtt gtccgacgag ttttacgtcg acgagaagcg ggagctcctt 2100
gaaattgtga aatacgcaaa gcagttgaac atagatagga acatg 2145
<210> 15
<211> 1848
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT727编码序列
<400> 15
atgctcagaa cgaggcaata taaaaagggc ccggagatgg tctatacggg cagggaacag 60
acccttccgt tcgaggaagt ggtcaaaata tccgggaaaa tagggctcgg tgtggttaaa 120
actgtgataa cctcaatcat tagatgtggc cgggataacg agattgcggg ccgcatcctc 180
tcagacgtgt actcggtcct gtggagcacg cctaaagggt actgggcaga aatgatagaa 240
gccgtggaaa ctctgatcca gcatgagatc tccgagaaca tcaggaacaa cgctttcgcc 300
gtcctgactg acgtgagaaa cgcacttctt ctttaccaac aggcggcgga ggaatggcaa 360
tccaacagaa ccgaccctca actgcaggag agagtgagaa atcagtttat tgcaacgaac 420
acacttatcg aattcgcaat gccctcgttt accgtccctc attacgaggt gattcttctc 480
cctatctttg cgcaagcggc gaacctccat ttgctcctcc ttagagatgt ggagatattt 540
gggctcgagt ggggcatgag caaggcggaa attgacgact actattttgc aaattccggc 600
ctcaccggcc tgacacaaaa atacacaaat cactccgtta aatggtacag agaggggctc 660
tgcatcgcaa ctaatataga cctcggacag tttccagagt tttaccagct ggacaaatgg 720
aacgccatga atgattttag gagggaaatg actttcatgg ttttggacat cattgcgctg 780
tggcccacgt atgatcctat aaggtatcca ctcggaataa aaacagagtt gacaagagag 840
gtctttacgc ctcttctcgg aattaatccg aactcttcgt ggctgataca tacaatggaa 900
gaaatcgaag cgaaattgac ttttctgtcg ccgttcttgt cgtggatttc cttcgagcaa 960
ctggtcaagc aaggggatgg cattgcaaca ttcaccgatt ggggtaactt cacactgtca 1020
aataccatgc tgcctctttc atatattctt ggaggggcag gttcggggac aggagactca 1080
actaatatac cgatgcagtc agaaaactac gatgtgtaca aggttcatgt ggggactgat 1140
tactcccatc cgtccaatgt gccgatccgc aaactcgaat actactgtac caacgggaca 1200
atggaaaaag tgattactgt ggggacagga aggactaacg ctctttttga gcttccgaat 1260
aatggttgtg ttgattactc tcatcgcatc tcaagattgt catgtagcaa cgttgaagtc 1320
tatgaatggg agggcggccc gaggtatgcg cttaaaaaca ttgcctacgg ctggacgcac 1380
atcagcgtgg atagcaagaa tactttgagc gccaacgcca ttacgcaaat tcccgcacgg 1440
aagggctatg catcttccgg tagcaatctc tccatagcgg ggccctactt tactggaggt 1500
gacctcatcg ttctcccacc caatggcgcc caacttcaaa tacgggttac gccaccggtg 1560
tcaagcaagt ctaagaagta ctgtgttagg ttccggtatg ccagctccgg aaacacgaac 1620
atttatttcg aacgggtcct gtcttcaggt gatacgtatt cagaaaccca cgatgtcccg 1680
gcgacctatc cgggtggcgc actttcttat tcgagctttg cctatgttgt gaatttgacg 1740
gcgatttttg aggggttcaa cgttgagatc aaaatcaaaa acataggttc gtcccaaatc 1800
atactcgaca agatagagtt ccttccgata aaagaatcgc tgaaagaa 1848
<210> 16
<211> 2277
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1047编码序列
<400> 16
atgaacctgt gcttctactt gaacatcaag aacgcactct catataccat attttggaag 60
tgcttgttcg aacaggactt tatacgcaag ttgaaactta ttattaatgg agtcataaat 120
atgaagccga aaaaccaaaa caaatgtcag agcctttact ccaatggtac cttcgatatg 180
gacagcaaag cttctcttaa gaatgacaag aacatggaat tgcagtcaat aactcacgag 240
gactgcttgc gcatgtccga gcatgaatca atagaaccac tggtgtcagc ttctgtgata 300
caaaacggga taggaatagc agggaaaata ttgggtacac ttggagtgcc attcgcgggg 360
cagattgcat ctctctattc ctttattctc ggcgagctct ggcccaaagg aaagtcacag 420
tgggagatat tcatggagca tgttgaggag ctcatcgatc aaaaaatttc tatatacgcc 480
cggaacaaag cgcttactga gctcaagggc ctcggcgatg ccttggccgt ttatcatgag 540
tccctcgaat cttggataga gaacaggaac aacaccagag cgagatccgt cgtcaaaagc 600
caatacataa ccttggagct catgtttgtc caaggtctcc cttccttcgc tgtgagcggt 660
gaggaagtct tgttgctccc gatttacgca caagcggcca acctccatct cctccttctg 720
cgcgacgcgt ctattttcgg tgaggagtgg ggtctgtccg catccgaaat atccaccttt 780
tataacagac aggttgagcg ggtgaacgac tataccgatt actgcgttaa attttacaac 840
actggcctga atagctcacg cgggaccgac gccaagtcct gggccagcta taaccaattc 900
agaaaagata tgactctcat ggttctcgac ctcgtggcac tttttccctc ctacgataca 960
catgtgtatc cgatcaaaac caattcccaa ctcacgagag atgtctatac tgatgccata 1020
gggacggttc atccgaaccc atctttcgcg agcacgacct ggtacaataa taatgcacct 1080
gcgttttcag ctatcgaggc cgcagtgatc aggtcccctc accttcttga cttcttggag 1140
gaggtcacga tatattcagc cttgtctcgg tggtccaata cgcaatacat gaacatatgg 1200
tcagggcact ccctcaagtt taggacgata ggaggtggtt tgaatacttc tacccaaggg 1260
tcgacgaact ctacaatatc ccccgtcacc ttccaattcc ctgcgcggga cgtgtaccgg 1320
accgagtctt tggcaggtct taacattttt ctgactcaac ccgtgaacgg cgttccatct 1380
gtttcgtttc actggatcct gcccggtata gaggtgggta actccataac atataatccg 1440
gggtacgttg gtgtggggac acaattgcaa gattctgaaa cagaactccc accggagact 1500
actgaacggc ccaattatga atcttacagc catcgcctga gccacatagg actgatcacc 1560
gcgagccatg tcagggctct ggtttattca tggactcata ggtctgcgga gaggacaaac 1620
actattgagc ccaaccgcat tactcaaata ccactcgtga aagccctcaa cttgtactcg 1680
ggtacaacag ttgttaaagg acctggattt acgggtggcg acattctgag aaggacgaat 1740
acgggtatct ttggggacat tcgggtgaac atcacggcac ctctttcaca acggtatcgc 1800
gtccgggtta gatacgctag cacaacggac ctcgaatttt atacttccgt taacgggact 1860
acgatcaata tgggtaattt ttccaagaca atggactctg gaaacaattt ggagttttca 1920
tcgtttaaga ccacaggctt ttccacccca ttttctttct ccaacgccca atccaccttc 1980
actctgggga ctatggattt ctcaaaccaa gaggtctata tagatcggat cgaatttttc 2040
ccggttgaag tgacatacga ggaggaatgc gactttgaga aggcccaaga ggctgtcaca 2100
gcactgttca cgccgaaaaa tccaaagggg ctgagaatga atgtgacaga ctaccatatt 2160
gatcaggttt cgaatcttgt ggagggtctg tctgatgagt cgtatctgga tgaaaaacgc 2220
gagttgttcg aaaaggtgga gtatgcaaag caacttaata tagagcggaa catctag 2277
<210> 17
<211> 2205
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1280编码序列
<400> 17
atgaaattga aaaaccaaga taaacatcaa tcgttctcaa gcaacgccaa agttgataaa 60
atctcgactg attcgcttaa aaacgaaact gacattgaac tccagaacat caaccatgag 120
gattgtctga agatgtccga gtacgagaat gtcgagccat ttgtctctgc atcgacaata 180
cagactggaa ttggtattgc tgggaaaata ttgggtaccc ttggcgtgcc tttcgccgga 240
caggtggcat ccttgtatag ctttatattg ggcgagctgt ggccgaaggg aaaaaatcag 300
tgggaaattt tcatggaaca cgttgaagag ataataaatc agaagatatc aacatacgca 360
aggaacaaag cccttacgga tctgaaggga ctcggcgacg cactcgcggt ttatcacgac 420
tctcttgaat catgggtcgg aaaccggaac aataccaggg cccgctctgt ggtcaaaagc 480
cagtacattg cattggagct catgtttgtt cagaagctcc caagctttgc ggtttccggc 540
gaggaggtcc ctctcctgcc tatttacgca caggcggcaa acttgcacct gttgttgctt 600
agggatgcct ctatcttcgg taaagaatgg ggcctcagct cttcggaaat atctactttt 660
tacaatcgcc aggttgaaag ggcgggtgac tactctgacc attgtgtcaa gtggtattcg 720
actggcctta ataatcttag ggggaccaat gcggaatcct gggtgcgcta taaccaattc 780
aggcgcgaca tgacgcttat ggttcttgac cttgttgctt tgttcccaag ctatgacacc 840
caaatgtacc ccataaaaac gactgcgcaa ttgacccgcg aggtctacac tgatgccatc 900
gggacggttc atccgcatcc gagcttcact tcgactacat ggtataacaa caatgcaccc 960
agctttagcg ccattgaagc ggccgtggtt cggaaccccc accttctgga cttccttgaa 1020
caagtgacga tatatagcct gctttctcgc tggtccaata ctcaatatat gaatatgtgg 1080
gggggacaca agctggaatt ccgcaccata gggggtacac tgaacatctc cactcagggc 1140
tctacaaata catccattaa cccggtcaca ttgccattca cgtcacggga tgtgtataga 1200
accgaatctt tggccggcct gaatctcttt cttactcagc cggttaacgg ggtgccacgc 1260
gtggactttc actggaaatt tgtcacgcat ccaatcgcat ctgacaattt ctattatcct 1320
gggtatgctg gcattgggac ccagctccag gactcagaaa acgaactgcc tccagaggcc 1380
actgggcagc ctaactacga atcatactcc caccggctct ctcatattgg gttgataagc 1440
gcttctcacg tgaaggctct cgtttattcg tggacacatc ggtccgcaga cagaacaaat 1500
acaattgagc caaactcaat cacccagatc cccctggtca aagcgttcaa cctgtcttca 1560
ggcgctgccg tggtgagggg ccctgggttc actggtggag atatcctccg cagaaagaat 1620
acgggcactt tcggggatat ccgggtgaat ataaatccgc cgtttgcgca gagatacaga 1680
gtccgcataa ggtatgcctc cacaacagac ttgcaattcc atacgtccat caatggaaag 1740
gcaattaatc aagggaattt ctcggccaca atgaaccggg gcgaggatct cgactataag 1800
acttttagaa cagttggctt tacgacacct ttctcattct cgaacggaaa agccataaat 1860
caaggcaatt ttagcgcgac catgaatcgc ggtgaagatc ttgattacaa aacttttagg 1920
accgtgggct tcacaacgcc attttccttc ctggacgtcc aatctacgtt tacaataggt 1980
gcctggaact tctcctctgg taatgaggtt tacatcgatc ggatagaatt cgtccctgtt 2040
gaggtcacat atgaggctga gtacgacttc gagaaagccc aagagaaggt cactgccctc 2100
tttactagca ccaatcctcg cggattgaaa acggacgtta aagactatca catagatcag 2160
gtctcaaatc tggtcgagtc cctttctgat gtgctcttcc ggtaa 2205
<210> 18
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1155编码序列
<400> 18
atggacctct cacctgatgc caggattgaa gattccctct gcgtggccga aggtaacaat 60
atcgatcctt ttgtctccgc ttccacagtc caaacgggca tatcaatagc ggggcgcatc 120
ctgggtgtgc tcggcgttcc ctttgctggt caactggcct ccttctactc ctttctggtc 180
ggcgaactct ggccgtctgg ccgcgaccca tgggagatct tcatggagca tgtcgaacaa 240
attgttcggc agcaaattac cgattctgtc cgggataccg caatagcgcg cctggaggga 300
cttggccggg ggtatcggtc gtaccaacaa gctcttgaga cgtggctgga caaccggaat 360
gacgccaggt cgcggtccat catcagggag aggtatatcg cactggaact ggacattaca 420
acggccattc cccttttttc aattagaaat caagaggtcc ctcttcttat ggtttatgct 480
caggctgcaa acttgcacct tctcctcctc agggacgctt caatcttcgg taaggagtgg 540
ggtcttagcg cgagcgaaat cagcaccttc tataaccggc aagtcgaacg cacgcgggat 600
tacagcgacc attgtgttaa atggtataat accggtctta ataaccttcg cggtacaaat 660
gcaaagtcct gggttcggta caatcagttc agaaaggata tgactctcat ggttcttgac 720
ctcgtcgctc ttttcccttc gtatgataca ctcgtttacc ctataaaaac cacctcacag 780
cttactcggg aggtttatac agatgccata ggcacggttc atcccaatca agcgtttgca 840
tcaacgacct ggtataacaa caatgctcct tccttctcga ctatagaagc agcggttgtt 900
aggaatcccc atcttttgga ttttctggag caggttacga tatacagcct cctgtcccgg 960
tggtcgaaca cgcaatatat gaacatgtgg ggtgggcata agttggaatt tcgcactatc 1020
ggcggcactc tcaatacgtc cacccagggg agcactaaca cctccatcaa tccagtgaca 1080
ctccccttta cgtctcggga cgtctacaga actgagtcac tggctgggct caatcttttc 1140
cttacgcagc ccgttaacgg cgtccctcgg gttgacttcc attggaaatt cgtgacacac 1200
ccaatagcaa gcgataactt ctactatccc ggatatgctg gaattggcac gcagcttcaa 1260
gattcagaga acgaactccc tcctgaaaca accggacaac ccaattatga gtcgtattct 1320
cacagattga gccatatagg tctgatctct gcgtcgcatg tcaaggctct cgtctacagc 1380
tggacccaca gatctgcaga caggaccaac actattgaac ctaactcaat aacccaaatc 1440
cctcttgtta aggcgttcaa ccttccgtcc ggtgccgcgg tcgtcagggg gcctggtttc 1500
acaggtggcg atatattgca gagaacaaat acaggcacat tcggtgatat tcgcgtcaac 1560
attaatccgc cttttgctca gaggtatcgc gtgagaattc gctacgcgtc tacaaccaat 1620
gttgagtttc acacgtctat caacggcaaa gctatcaatc agggtaactt tagcgccacg 1680
atgaacaggg gggaagatct tgactacaag acctttagga ctgtgggctt tactactccg 1740
ttctccttgt cagatgtgca gtccacattc acaatcggtg catggaattt cagctcaggg 1800
aatgaagttt atatagacag aatagagttc gtgcctgttg aagttactta cgaggctgag 1860
tatgatctca agaaggcaca agacgaaata actgctatgt tcacgtcaac gaaccctgga 1920
ggcctgaaaa cgaatgttac ggaatatcac atcgatcaag tgtcaaacct cgttgagtcg 1980
ctgtcagacg agttttattt ggatgaaaag cgcgagctct ttgagattgt taaatactag 2040
<210> 19
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1559编码序列
<400> 19
atgaacctct ccacggatgc gaggatcgaa gactccctct gtatagcaga aggcaataac 60
attgatcctt tcgtttcagc ttctacggtg cagacaggga taaacatcgc aggccgcata 120
ttgggagtcc ttggagttcc tttcgcaggc caaatagctt cgttttattc ctttctggtc 180
ggcgaacttt ggccccgcgg acgggatccc tgggaaatat ttctggaaca cgtcgagcag 240
ttgatccggc agcaagtgac ggagaatacg cgcgataccg ctttggcaag gctccagggt 300
ttggggaatt ccttcagggc ctatcaacag agccttgagg actggttgga gaatcgcgac 360
gatgcgcgga cgcgcagcgt cctgtatacc caatatattg cactggagct tgatttcctt 420
aatgcgatgc ctctgtttgc gataagaaac caagaagttc ccttgctcat ggtgtatgca 480
caggccgcca acctccacct gcttttgctc agggatgcgt cgcttttcgg ttcggagttt 540
ggacttacgt cacaggagat ccaaagatat tatgaaagac aggtggaaaa gacgcgcgaa 600
tactcggact actgtgccag gtggtacaac acaggactta ataacttgcg ggggacaaac 660
gccgagtcat ggttgcggta taaccaattt aggagggacc ttacgttggg tgtgttggac 720
ttggtggcac tttttccttc gtatgacacc agggtttatc cgatgaatac ctcagctcag 780
ctcaccaggg agatctatac ggaccccatc gggcggacta atgcgccgtc tggcttcgca 840
tcaacaaatt ggtttaacaa taacgcacca tcgttttctg ctatcgaagc agctgtgatc 900
cggtcaccac acttgcttga cttcttggaa caggttacga tttattctct gctctcaaga 960
tggtcgaaca cccagtacat gaatatgtgg ggcggccata agctcgaatt cagaacaatc 1020
ggcggtactc tcaacacaag cacacagggg tcaactaata cgtccattaa cccagttacg 1080
ctcccattca cgagccgcga catctaccgg accgagtctt tggcagggct caatctgttc 1140
ctgacccaac cggtcaatgg ggtcccgcgg gtcgattttc actggaaatt cgtgacacat 1200
cccatcgctt ctgacaactt ttattatccc gggtacgcgg gtattgggac tcagttgcaa 1260
gactcggaga atgagctccc accggagacc acggggcagc caaattacga aagctattcc 1320
catcgcctta gccacatagg tctcatcagc gcctcacacg tgaaagcatt ggtttactcg 1380
tggacacatc ggagcgccga caggacaaac acaatccatt cagactctat cacacagatc 1440
cctctggtga aagcacatac cttgcaatcg ggcactaccg ttgtgaaagg tccgggattc 1500
actgggggtg atattttgag gcgcacatcc ggtggaccct tcgccttttc aaatgttaat 1560
ttggattgga acctgtccca gagatatcgc gcaaggatca gatatgcgtc tacgactaat 1620
cttcggatgt atgtgacgat agcaggtgag aggatattcg ccgggcaatt taacaaaacg 1680
atgaacacag gggacccctt gacattccaa agcttcagct atgccacgat agatacagca 1740
ttcaccttcc cgacgaaagc ttcgtctttg acggtgggag ccgacacgtt ttctagcggg 1800
aatgaggtct atgtggatag atttgagctg atccctgtca cagccactct ggaagccgtg 1860
accgacctcg aacgcgccca gaaagctgtt catgagcttt ttacctccac taaccctggt 1920
ggcctgaaaa cggatgtcaa agattaccat atcgatcagg ttagcaatct tgttgagtcc 1980
ctctcagatg agttctatct cgatgaaaaa agagaactgt ttgagatcgt gaaatactag 2040
<210> 20
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1563编码序列
<400> 20
atgaacctct caaccgatgc caggatagaa gacagcctgt gtatcgctga gggaaataac 60
attgatccgt ttgtgtccgc gtcgacggtc caaacgggga taaatatagc cgggagaata 120
ctcggagttc tgggagtccc tttcgcaggc cagattgcaa gcttttatag ctttcttgtg 180
ggggagcttt ggccgagagg ccgcgatcca tgggaaatct ttttggagca tgtggaacaa 240
ctcataagac agcaagtgac ggaaaacacc cgggacacag cacttgccag gctccaagga 300
cttgggaatt cttttcgggc gtaccagcag tccctggagg actggctcga gaaccgcgac 360
gacgccagga ctagaagcgt gctctacaca cagtacatcg ctttggaact cgactttctc 420
aatgcgatgc ctctgttcgc cataaggaac caagaagttc ctcttctcat ggtgtatgcg 480
caggccgcaa acttgcatct gctcctgttg agggatgctt ccctcttcgg gagcgaattc 540
ggcctcacct cccaagagat tcagaggtac tatgagcggc aggtggaaaa gaccagggag 600
tactcagatt actgcgccag gtggtataac accggcctca acaacctgag aggaactaac 660
gcagagagct ggctcagata caaccaattt agacgcgaca tgaccctcat ggtgctggat 720
ctcgttgcgc ttttcccctc atacgacacc cgggtctatc ccatgaacac gtccgcacag 780
ttgacaagag aaatttatac agacccaata gggagaacaa atgccccatc tggtttcgca 840
tccactaact ggtttaacaa taatgctcct tccttcagcg caatagaagc tgcggtggtc 900
cggaacccgc accttttgga ttttctcgag caagttacca tatacagcct tctgtcccgc 960
tggtccaata ctcaatatat gaatatgtgg ggtggccaca agctggaatt tagaaccatc 1020
ggtggaaccc tcaacacgtc tacgcaaggt tcgactaaca catctattaa tcccgtcaca 1080
ctccctttca catcacggga cgtctatcgc actgaatcgt tggcagggtt gaacctcttt 1140
cttacacagc cggtcaatgg tgtccctcgg gttgacttcc actggaaatt tgtgacgcat 1200
cctatagcta gcgacaattt ttattaccca ggttacgccg gcatcgggac tcaactccaa 1260
gattcagaaa acgaacttcc ccccgaggca actggtcaac ctaattatga gtcgtactca 1320
cacaggcttt cacatattgg actgatctcc gcctcacacg tcaaagcgct ggtctattct 1380
tggacccaca ggtcagccga caggacgaat accatagaac ccaattcaat cacccagatc 1440
ccccttgtca aggcatttaa tctcagcagc ggggcagcag ttgtcagggg ccccggcttt 1500
accggtggtg atatactcag acggacaaat accggcacct ttggtgatat aagagtgaat 1560
attaaccctc cgttcgcgca aaggtataga gtccggataa gatatgcctc gacaacggac 1620
ctgcagtttc acaccagcat aaacggcaaa gcgatcaacc agggcaattt ttctgcgact 1680
atgaatcggg gcgaggatct ggactataaa acatttcgga cagtcggttt tactacccct 1740
ttttcattct cggatgtcca gtcaacattt acgattgggg catggaactt ctcttcgggg 1800
aacgaggtgt acatcgaccg cattgaattc gtcccggtcg aagttacata tgaagctgaa 1860
tacgatttcg aaaaggcgca agaaaaggtg accgcccttt ttacttccac gaatcccagg 1920
ggcttgaaga cggatgtgaa ggattatcat atagatcagg tgtccaattt ggtcgaatca 1980
ctttctgacg agttctacct cgatgagaaa cgcgaattgt tcgaaattgt caagtactag 2040
<210> 21
<211> 2118
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1571编码序列
<400> 21
atgacctcta accggaaaaa cgagaatgag ataattaacg cgctctcgat tccggcagtt 60
agcaaccatt cagcccagat ggacctttca cttgatgcca ggatcgagga cagcctctgc 120
attgccgaag gtaataacat aaaccctctc gtctcagctt ccaccgtcca aacaggcatt 180
aacatcgcag gacggatcct cggggtgctc ggggtccctt ttgctggcca attggcctcc 240
ttctactctt tcctcgtggg cgagctgtgg ccctctggca gagatccatg ggaaatcttc 300
cttgaacatg tcgaacagtt gatacggcaa caagtcactg aaaacactcg gaatacggcg 360
atcgcgaggc ttgaaggact cggccggggc tatagatcat atcaacaagc tttggaaacg 420
tggctcgaca accggaatga tgcccggagc agatcaatta tactcgagcg ctacgttgca 480
cttgaactgg atatcacaac agcaattcca ctgtttagga tcaggaatga ggaggtgccc 540
ttgctgatgg tctacgccca ggccgcgaac ctccacttgc ttcttcttcg cgatgcctca 600
ctgttcggtt ccgagtgggg tatggcttca agcgacgtta accaatacta ccaagagcaa 660
attagataca ccgaagaata ttctaatcac tgcgtgcaat ggtataatac tgggctcaac 720
aatctgcgcg gtaccaacgc tgaatcatgg cttcggtata accagttccg gcgcgacctc 780
accctgggag tgctcgacct cgtcgctctg tttcccagct atgacacgcg cacataccct 840
atcaacacat ctgcacaact cacacgcgag atctacacgg atccgattgg gcgcacgaac 900
gctccgtcgg gtttcgcatc tacaaattgg tttaataaca acgcgccttc cttcagcgct 960
attgagtccg cggttgttcg caaccctcat ttgctggact tcctggagca ggtgacgatc 1020
tactcactgc ttagccggtg gtccaatacg cagtacatga atatgtgggg agggcatcgc 1080
ctcgagttca ggacaatagg gggggtgctg aacacctcca cccaaggaag cactaacacc 1140
tccattaatc cagtgacact gccctttaca agcagagacg tttataggac tgagtcactc 1200
gccgggttga acttgttcct gacacagccc gttaacgggg ttccaagagt ggattttcat 1260
tggaaatttg ccacactccc tatcgcgagc gacaactttt attacttggg gtacgctgga 1320
gttgggactc agctgcaaga ttctgaaaat gaactgccac ctgaaacgac gggacaacca 1380
aattatgaat cgtactcaca ccggcttagc cacataggct tgatatctgc ctcgcacgtt 1440
aaagcgcttg tctactcctg gacccatcgg tctgctgata ggacgaacac tatagaacca 1500
aattccataa cccagatccc tcttgttaag gcgtttaatc tttcaagcgg cgccgcggtg 1560
gttaggggtc cgggatttac aggcggtgat atactcagga gaacgaatac ggggacattc 1620
ggcgacatta gagtgaatat aaacccacct tttgctcagc ggtaccgggt ccggatccgg 1680
tacgcatcca caacggatct ccaattccat acatcaatca acggaaaagc aataaatcag 1740
ggaaactttt cagcaaccat gaatcgcggt gaggatctgg actataagac attccgcacg 1800
gtgggattca cgacaccgtt ctcgttttct gatgtccaat cgacattcac cattggagcc 1860
tggaatttct cttctggcaa tgaggtttat atagaccgca ttgaatttgt cccagtcgaa 1920
gttacgtatg aagccgaata cgacttcgaa aaggcgcagg agaaagtcac ggcgttgttt 1980
actagcacca acccccgcgg cctcaagaca gatgttaaag actaccacat agatcaagtt 2040
tccaaccttg tggagagctt gagcgatgaa ttctaccttg atgagaaacg cgaactcttt 2100
gaaattgtga aatactag 2118
<210> 22
<211> 2121
<212> DNA
<213> 人工序列
<220>
<223> 玉蜀黍密码子优化的BT1633编码序列
<400> 22
atgaagctta agaatcaaaa tatgcaccag tccctcagct ccaatgccac tgttgataag 60
agctttacgg attctttgga acacaataca aatatggaac tccagaattc caatcacgag 120
gactgcctga agatgagcga atacgaatcg atagaacctt ttgtttcagc ttcaactatt 180
cagaccggga tcgggattgc tggaaaaatc ctgggtactt tgggggtgcc attcgctggg 240
cagattgctt cgctgtactc attcattctt ggcgagctct ggcctaaagg taaatcacaa 300
tgggaaattt ttatggagca tgttgaagaa ctcatcaacc agaagatttc aacgtacgcc 360
cggaacaagg cactggcaga cctcaaaggg ctcggggatg ctcttgctgt gtatcacgag 420
agcttggagt catggataga aaacaggaat aacacgagag ctcgcagcgt ggtcaaaaat 480
caatatatcg ccctcgagct tatgtttgtc cagaagctgc cttcatttgc cgtttcaggc 540
gaagaggtgc cactcctgcc aatatacgcg caggctgcaa acctccatct tctcctcctc 600
cgcgacgcgt ctatcttcgg caaggaatgg gggctctcgg aatccgaaat ttcaacattc 660
tataatcgcc aggtggaaag gacccgggac tactcagatc actgtgtcaa atggtacaac 720
acagggttga ataggttgcg ggggaccaat gccaaatctt gggtccggta taaccagttc 780
agaaaggata tgacgcttat ggtccttgat ttggtggctc ttttcccatc ttatgacacc 840
ctggtttacc ccatcaagac cacttcgcag cttactaggg aagtgtatac agacgctatt 900
ggcaccgtcc accctaatca ggcatttgcc tccacgactt ggtacaataa caatgctccg 960
agcttctcag cgatcgaggc agccgtcatt cggtctccgc atctgttgga ctttttggag 1020
aaagtcacaa tatactcctt gttgagccgc tggtcgaaca cgcagtatat gaacatgtgg 1080
ggcgggcaca agctcgaatt cagaaccatt ggtgggaccc ttaacacatc tacacaggga 1140
tctaccaata cctctataaa ccccgttacg cttccgttca cctcccgcga cgtctaccgc 1200
actgagtcgt tggctggttt gaatttgttc ctcacgcaac ccgtgaacgg tgtccctcgg 1260
gtcgattttc attggaaatt cgttacgcat cctatagctt ccgacaactt ctactaccct 1320
ggatacgctg gtatcgggac gcaactgcag gattcagaaa atgaattgcc gccagaaacc 1380
acgggccagc cgaactacga atcttactca catcgcctgt cgcatattgg cctcatttct 1440
gcctctcatg tcaaagcgct ggtttacagc tggacacaca ggtctgctga tcggacgaat 1500
actatagagc caaactctat tactcaaatc cctttggtta aggcctttaa cctgccgtcg 1560
ggggcagccg tggtcagagg gcctgggttc actgggggag atatactcag gaggaccaac 1620
actgggacct tcgcggatat gcgggtgaat atcacaggtc cactctcgca acgctaccgc 1680
gtgagaatcc ggtatgcttc gacgacggat ttgcagtttt ttacgaacat taatggtaca 1740
accataaata tgggaaattt tccaaagacc gtcaataact cgagctcgga ggggtataga 1800
actgtctcct tctcaacacc tttttccttc tccaatgctc agagcatttt tcgccttgga 1860
atacaggcct tctccggcgt gcacgagatt catgtggaca gaatcgagtt tgtcccggcc 1920
gaagttacgt ttgaagcaga atatgatttg gaacgggctc aaaaggcggt caatgccctt 1980
tttacatcta ctaaccctaa agatatgaaa acatacgtga ctgagtcaca gatcgaccag 2040
gtgttcaatc ttgtcgagtg tctttcagat gaagtttgcc ttgacgagaa aagagagttg 2100
ttcaagaaag ttaaatatta g 2121
<210> 23
<211> 2157
<212> DNA
<213> 人工序列
<220>
<223> 突变型BT0204编码序列
<400> 23
atgaagctca agaaccccga taagcaccag agcttcagca gcaatgccaa agtcgacaaa 60
attgccaccg atagccttaa gaatgagacg gatatcgaac tcaagaacat gaataacgaa 120
gattacatcc ggatgtcgga gcatgagagc atagatccgt ttgtctctgc atctacaatt 180
cagacgggaa ttggtatcgc tggaaaaatc ttgggcaccc ttggagtgcc cttcgctggg 240
cagatcgctt cgctttactc gttcatattg ggagaactgt ggccaaaggg taagtcccaa 300
tgggaaatct ttatggaaca tgtcgaagag ttgattgccc aaaagatctc aacatatgct 360
cgcaacaagg cactcacgga tctcaagggt cttggtgacg ctttggcagt ttaccatgaa 420
tctcttgagt cttggattaa aaatcgcaac aacactaggg ctcggtcggt cgtcaagtcc 480
cagtacatca gcttggagct gatgtttgtc cagaaactcc cgtcgtttgc tgtctcggga 540
gaagaggttc ctctgttgcc catatatgca caggctgcta acctgcacct ccttcttttg 600
cgcgacgcat ccatctttgg gaaagaatgg gggctgtctt cttctgagat cagcacgttt 660
tataaccggc aagccgaaag gacatccgac tactcggatc actgtgtcaa atggtattcc 720
acgggtctga ataacctcag gggcaaaaat gcggaaagct gggtgaggta taatcaattc 780
agaaaagata tgattcttat ggtcttggat cttgtggcgc tgtttccttc ctatgacaca 840
catatgtatc cgatcaagac taccgcacaa ctgactaggg aggtgtacac taacgcgata 900
ggcacggtcc acccgcaccc ctccttcgcg tccacaactt ggtataacaa taatgcccct 960
tcgttctcag ccatagaagc cgccgttatt cgctcgccac acttgctgga ctttctggaa 1020
caagtcacaa tctatagcct gctgtcacgc tggtcgaaca cgcaatatat gaacatgtgg 1080
ggagggcacc ggctggagtt caggaccatt ggtggagctc tgaacactag cacgcaaggt 1140
tcaaccaaca ctagcatcaa tcctgtcaca ctcccgttta catcccggga cgtgtaccgc 1200
acagagtcct tggctgggct caacctcttc cttacgcaac ctgtcaatgg cgttccaaga 1260
gtggattttc actggaagtt cgttacccac ccaatcgcct ccgataattt ttactatcct 1320
ggctatgctg gaatcggcac tcaactccag gattctgaaa ctgagctccc acctgaaacc 1380
accgggcaac ctaactatga gtcttactca catcggttga gccatattgg acttatatcg 1440
gcatctcacg ttaaagcact ggtctatagc tggacccata gatcggctga tcggacaaac 1500
acaatcgaac ccaactcgat aactcaaata ccacttgtga aagcgtttaa cttgcctagc 1560
ggtgcagctg ttgtgagagg accgggtttc actgggggag acatccttag acggacaaac 1620
accgggactt tcggagatat acgggtcaac attaatcccc ccttcgccca gagatacagg 1680
gttcggatca gatacgcctc gacaacagat gtccagttcc ataccagcat caacggaaaa 1740
gcaatcaatc aggggaattt ttccgccacc atgaaccgcg gtgaggatct ggattacaaa 1800
acattcagaa ctgtcgggtt tacaactcct ttttccttct cggacgttca gtcgacgttc 1860
acgataggtg cttggaattt ctcttcaggg aatgaggtgt atatagatcg catagaattc 1920
gtgcctgtcg aggtgaccta tgaggcggag catgactttg aaaaagccca agaggaggtt 1980
accgccctgt tcacatctac aaacccgggt gggctgaaga ccaacgtcac cgagtatcac 2040
atagatcagg tctcgaattt ggtcgagtct ctgtccaatg aattctattt ggacgagaaa 2100
cgcgaactgt ttgaaattgt gaagtacgcc aagcagcttc atctcggtag aaatatg 2157
<210> 24
<211> 1875
<212> DNA
<213> 人工序列
<220>
<223> 突变型BT0235编码序列
<400> 24
atgagaaacg cttcaaaaga agtgaaaatt ctgcgcactc ggcaatatga gaaagacagc 60
gcgatggtgt acgcgatgga ggatcaacct ctctcattcg gtggtgtggt ggagatctct 120
ggcaaaatcg ggctgggtgt ggtgaaaacg gttatatctt caataacccg gagagggagg 180
gatgacgaga tagccgggag aatcttgtca gacgtgtacg gtgtgctttg gtcaaacaga 240
aaaggctatt ggaacgaaat gattgaagct gtcgaaacac tgataagaca tgacatcaac 300
gaaaacgtca agaataatac gttggctgtg ctgacagaca ttcggaatgc tctccttctt 360
taccagcagg cgaccgaagc ctggcaaaac aatagaactg acccgcagct tcaggaaagg 420
atcaggaacc aattcattgc cacgaacacc ttcattgaat ttgctatgcc ttccttcatc 480
gttccgcact acgaggtgat tttgctcccg atattcgctc aagtcgcaaa ctttcatctt 540
cttcttttga gagacattgc catatttgga cttgaatggc ggatgtcgaa ggcagagatc 600
gacgactact acttcgcaaa taccgggctt acagggctca cgtctaagta cacgtcgcat 660
tgcgtcaagt ggtactgcga aggactgtgc atagctacca atgtcgacct cggtcagtac 720
ccagagtttt accaactcga caaatggaac gctatgaatg atttcagaag agaaatgacc 780
tttatggttt tggatattat cgctctgtgg cctacatatg accccataag ataccctctg 840
ggcatcaaaa ccgaattgac tcgggaggtc tttacacctc tccttgggat taatccgaac 900
agctcatggt tgatccatac catggaagag atagaagcta aactcacatt ccttagcccg 960
tttcttagct ggatttcgtt tgagcaactc gtcaagcaag gggatggcat ctccacattt 1020
acagactggg gatcatttac cttgtccaat accatgctcc cgctttccta catcctgggc 1080
ggagctggtt caggcacggg cgagtccacg aacatcccca ttaagtctga aaactatgac 1140
gtttacaagg ttctggttgg cactgattat tcacaccctt caaatgtgcc cataagaaag 1200
cttgaatatt attgcaccaa tggaacaatc gaaaacgtca tcacggcagg cactggtacg 1260
acgaacgctc tgtttgagct gcctaacaac ggttgtattg actactccca ccgggtctcg 1320
agactgtcgt gttccaatgt cgaagtctac gaatgggagg gtggaccgaa gtatgccttg 1380
aaaaacattg catatggatg gacccatatt tcagtcgact caaaaaacac tctgtccgcc 1440
aatgtcatta cgcagatacc cgcacgcaag ggttactctt cttcggaatc aaacccgtcc 1500
atagctggac cgtacttcac aggtggcgat cttatcgcat tgccgccaaa cggcgctcaa 1560
ctccaaatgc gggtcactcc tccagtttca tcatgtacaa caaactactg tgtcaggttg 1620
agatatgctt catctgggaa tactaacatt tacgtcgaga gggtcctgcc gagcggggat 1680
acgtacggag agacccacga cgttcccgcc acttattatg gaggctcact gtcatacagc 1740
tccttcgcct acgtggtgaa cttgacggcc atgttcgagg gggtcaacgt tgagataaag 1800
atcaaaaaca ttggatcatc acaaatcatc ttggacaagc tcgaattcct ccctatcaaa 1860
gagtctctca aagaa 1875
<210> 25
<211> 2145
<212> DNA
<213> 人工序列
<220>
<223> 突变型BT0645编码序列
<400> 25
atgaagctca agaaccaaga caagcaccag tcgtacagct cgaacgagaa agttgacaaa 60
atcagcacga acaaaacgga catagaactt aaaaacatgg ataatgagga ctatatcagg 120
gtctcagaac atgaatccat caacccattt gttagcgctt caaccattca aaccggtatt 180
gggatcgcgg ggaagatact ggggacgttg ggcgtgccgt tcgccggtca gatagcttct 240
ctttactctt tcatacttgg tgagctttgg cccaagggca agtcacagtg ggaaattttt 300
atggagcatg tcgaggaaat cattaatcaa aagatctcaa cctatgcccg gaacaaggca 360
ctgaccgatc tcaagggctt gggcgacgca ctcgcagtct atcatgagtc cttggagagc 420
tgggttgaga acagaaacaa cacacgggct cggtccgtgg tcaaaggtca atatatcgcc 480
cttgagctga tgttcgtgca aaaacttcca tcgtttgcag tgtctggcga agaagtccct 540
cttttgccca tatacgtgca agcagccaat cttcacttgt tgcttctcag agatgcctct 600
atttttggga aggaatgggg gttgtcccca tccgagatca gcacgtttta taacagacaa 660
gtcgacagaa ctcgggacta ctcggatcac tgcgtgaagt ggtacaacac tgggctcaac 720
aatttgcggg gtacaaatgc ggagtcttgg gttcggtata accagtttcg gaaagatatg 780
acactcatgg tgttggatct tattgccctc ttcccgtcgt acgatactat tgtgtatccg 840
atcaaaacga cttctcaact caccagagaa gtctatacag acgctattgg tactgttcac 900
cctcatgcga gctttgcgtc aacgacgtgg tacaataata acgcaccgtc cttttctgcc 960
attgaagctg cggttattcg ctcacctcac ctgttggact ttctcgagaa ggtgaccata 1020
tactcccttc tgagcagatg gtctaacacg cagtatatga atatgtgggg gggacaccgc 1080
ctggaatcta ggcccattgg cggggcactt aatatatcta ctcaagggtc aacgaacaca 1140
tctataaacc ccgttaccct tcaatttacc tcgcgcgatg tttatcgcac tgaatcatgg 1200
gctggtctta atctctttct cacgcaacca gtcaacggag tccctagggt tgatttccac 1260
tggaagtacc ctactcttcc aatagcttct gataactttt actacctggg gtacgccggg 1320
gttgggaccc agctccaaga ctccgaaaat gaattgccac cagagacgac cggtcagccc 1380
aactacgaaa gctattctca ccggctttca catattggtt tgatttctgc gtcgcacgtt 1440
aaggcgttgg tttattcatg gacccactca tcggcaaacc gcaccaacac tatagaagcc 1500
aactcgatta cccagatccc gcttgtgaaa gccttcaacc ttccatcggg tgcaacggtg 1560
gttagggggc ctggatttac gggcggtgat atacttcgcc gcaccaacac aggtactttt 1620
ggtgacatcc gcgttacaat aaacccgccg tttgctcagc gctacagggt ccggatcagg 1680
tatgcatcaa ccactgactt gcaattccac acctccatca atgggcgcgc catcaaccag 1740
ggcaatttct ctgccacgat gaatagggaa gataacctca attacagaac gttccggacg 1800
gcaggattca caaccccttt ctcattctcg gacacgcaaa gcacatttac tatcggcgcg 1860
tggtcgttta gctccggcaa tgaagtctat atcgatcgca tagagttcgt tccggtcgag 1920
gttgcacatg aggaaaatta cgactttgag aaggtgcagg aggaggttac ggcattgttc 1980
acccccacca atcctagggg attgaagaca aacgtcacag attacgacat cgaccaagtc 2040
cttaatctgg tcgagtcgtt gtccgacgag ttttacgtcg acgagaagcg ggagctcctt 2100
gaactcgtga aatacgcaaa gcagttgaac atagatagga acatg 2145
<210> 26
<211> 2148
<212> DNA
<213> 人工序列
<220>
<223> 大豆密码子优化的mBT645-2编码序列.
<400> 26
atgaagctta agaaccagga taagcatcag tcttactctt caaacgagaa ggttgataag 60
atctcaacta acaagacaga tatcgaactt aagaacatgg ataacgagga ttacttgaga 120
gtttcagagc acgaaagcat taacccattt gtgtctgctt caaccattca aactggaatt 180
ggtattgcag gaaagatttt gggaaccctt ggtgttccat ttgctggtca gatcgcatct 240
ttgtactcat tcattttggg agagctttgg cctaagggaa agtctcaatg ggaaattttc 300
atggagcatg tggaggaaat tattaatcag aagatctcta catatgctag aaacaaggca 360
ttgaccgatc ttaagggatt gggagatgct cttgcagttt accacgagtc tttggaatca 420
tgggtggaga ataggaacaa tacaagagct aggtctgttg tgaagggaca atatattgca 480
cttgagttga tgtttgttca gaagcttcca tcattcgctg tttctggaga ggaagtgcca 540
cttttgccta tctatgtgca agctgcaaac cttcatcttt tgcttttgag agatgcaagc 600
atttttggaa aggaatgggg tttgtctcct tcagagattt caacattcta taataggcag 660
gttgatagaa ccagggatta ttctgatcac tgtgtgaagt ggtacaacac tggacttaac 720
aatttgagag gtacaaatgc tgaatcttgg gttagataca accaattcag aaaggatatg 780
acacttatgg tgcttgattt gattgcattg ttcccatctt acgataccat cgtttaccct 840
attaagacta catcacagct tacaagggag gtttataccg atgctattgg aactgtgcat 900
cctcacgctt cttttgcatc aaccacttgg tacaacaata acgctccatc tttctcagca 960
attgaagctg cagttattag atcacctcat cttttggatt ttcttgagaa agtgactatc 1020
tattctcttt tgtcaaggtg gtctaacaca cagtacatga acatgtgggg aggtcacaga 1080
cttgaatcta ggccaattgg aggtgctttg aacatctcaa ctcaaggatc tacaaatacc 1140
tccatcaacc ctgttacctt gcagtttact tctagagatg tgtataggac cgagtcatgg 1200
gctggactta atttgtttct tactcagcca gtgaacggtg ttcctagagt ggatttccat 1260
tggaagtatc caacacttcc tattgcttca gataacttct attacttggg ttacgcagga 1320
gttggtaccc aacttcagga ttctgagaac gagcttccac cagaaacaac cggacagcca 1380
aactatgagt cttactcaca tagactttca cacattggtt tgatttctgc ttcacatgtt 1440
aaggcacttg tgtactcttg gacccactct tcagctaata ggactaacac aatcgaagca 1500
aactcaatca ctcagatccc acttgttaag gcttttaact tgccttctgg tgcaaccgtt 1560
gtgagaggac ctggattcac tggaggagat attttgagaa ggaccaatac tggaacattt 1620
ggagatatca gggttactat taacccacct ttcgctcaaa gatatagggt gagaattagg 1680
tatgcttcta ctacagatct tcaattccat acttctatta acggaagagc tatcaatcag 1740
ggtaacttct ctgcaactat gaacagggag gataatttga actacagaac ttttagaact 1800
gctggattca ccactccatt ttctttctca gatactcaat ctacctttac tattggagca 1860
tggtcattct cttctggtaa cgaggtttac atcgatagaa tcgaatttgt tcctgtggag 1920
gttgctcacg aggaaaacta cgattttgag aaggttcaag aggaagtgac agcacttttc 1980
acaccaacta atcctagggg tttgaagact aacgtgacag attacgatat tgatcaggtt 2040
ttgaatcttg tggaatctct ttcagatgag ttctatcttg atgagaagag agaacttttg 2100
gagattgtga agtacgctaa gcaattgaat attgagagga acatgtga 2148
<210> 27
<211> 2052
<212> DNA
<213> 人工序列
<220>
<223> 大豆密码子优化的mBT645-3编码序列
<400> 27
atggataacg aggattactt gagagtttca gagcacgaaa gcattaaccc atttgtgtct 60
gcttcaacca ttcaaactgg aattggtatt gcaggaaaga ttttgggaac ccttggtgtt 120
ccatttgctg gtcagatcgc atctttgtac tcattcattt tgggagagct ttggcctaag 180
ggaaagtctc aatgggaaat tttcatggag catgtggagg aaattattaa tcagaagatc 240
tctacatatg ctagaaacaa ggcattgacc gatcttaagg gattgggaga tgctcttgca 300
gtttaccacg agtctttgga atcatgggtg gagaatagga acaatacaag agctaggtct 360
gttgtgaagg gacaatatat tgcacttgag ttgatgtttg ttcagaagct tccatcattc 420
gctgtttctg gagaggaagt gccacttttg cctatctatg tgcaagctgc aaaccttcat 480
cttttgcttt tgagagatgc aagcattttt ggaaaggaat ggggtttgtc tccttcagag 540
atttcaacat tctataatag gcaggttgat agaaccaggg attattctga tcactgtgtg 600
aagtggtaca acactggact taacaatttg agaggtacaa atgctgaatc ttgggttaga 660
tacaaccaat tcagaaagga tatgacactt atggtgcttg atttgattgc attgttccca 720
tcttacgata ccatcgttta ccctattaag actacatcac agcttacaag ggaggtttat 780
accgatgcta ttggaactgt gcatcctcac gcttcttttg catcaaccac ttggtacaac 840
aataacgctc catctttctc agcaattgaa gctgcagtta ttagatcacc tcatcttttg 900
gattttcttg agaaagtgac tatctattct cttttgtcaa ggtggtctaa cacacagtac 960
atgaacatgt ggggaggtca cagacttgaa tctaggccaa ttggaggtgc tttgaacatc 1020
tcaactcaag gatctacaaa tacctccatc aaccctgtta ccttgcagtt tacttctaga 1080
gatgtgtata ggaccgagtc atgggctgga cttaatttgt ttcttactca gccagtgaac 1140
ggtgttccta gagtggattt ccattggaag tatccaacac ttcctattgc ttcagataac 1200
ttctattact tgggttacgc aggagttggt acccaacttc aggattctga gaacgagctt 1260
ccaccagaaa caaccggaca gccaaactat gagtcttact cacatagact ttcacacatt 1320
ggtttgattt ctgcttcaca tgttaaggca cttgtgtact cttggaccca ctcttcagct 1380
aataggacta acacaatcga agcaaactca atcactcaga tcccacttgt taaggctttt 1440
aacttgcctt ctggtgcaac cgttgtgaga ggacctggat tcactggagg agatattttg 1500
agaaggacca atactggaac atttggagat atcagggtta ctattaaccc acctttcgct 1560
caaagatata gggtgagaat taggtatgct tctactacag atcttcaatt ccatacttct 1620
attaacggaa gagctatcaa tcagggtaac ttctctgcaa ctatgaacag ggaggataat 1680
ttgaactaca gaacttttag aactgctgga ttcaccactc cattttcttt ctcagatact 1740
caatctacct ttactattgg agcatggtca ttctcttctg gtaacgaggt ttacatcgat 1800
agaatcgaat ttgttcctgt ggaggttgct cacgaggaaa actacgattt tgagaaggtt 1860
caagaggaag tgacagcact tttcacacca actaatccta ggggtttgaa gactaacgtg 1920
acagattacg atattgatca ggttttgaat cttgtggaat ctctttcaga tgagttctat 1980
cttgatgaga agagagaact tttggagatt gtgaagtacg ctaagcaatt gaatattgag 2040
aggaacatgt ga 2052
<210> 28
<211> 1848
<212> DNA
<213> 人工序列
<220>
<223> 突变型BT0727编码序列
<400> 28
atgctcagaa cgaggcaata caagaagggc ccggagatgg tctatacggg cagggaacag 60
acccttccgt tcgaggaagt ggtcaagata tccgggaaga tagggatcgg tgtggttaaa 120
actgtgataa cctcaatcat tagatgtggc cgggataacg agattgcggg ccgcatcctc 180
tcagacgtgt actcggtcct gtggagcacg cctaaagggt actgggcaga aatgatagaa 240
gccgtggaaa ctctgatcca gcatgagatc tccgagaaca tcaggaacaa cgctttcgcc 300
gtcctgactg acgtgagaaa cgcacttctt ctttaccaac aggcggcgga ggaatggcaa 360
tccaacagaa ccgaccctca actgcaggag agagtgagaa atcagtttat tgcaacgaac 420
acacttatcg aattcgcaat gccctcgttt accgtccctc attacgaggt gattcttctc 480
cctatctttg cgcaagcggc gaacctccat ttgctcctcc ttagagatgt ggagatattt 540
gggctcgagt ggggcatgag caaggcggaa attgacgact actattttgc aaattccggc 600
ctcaccggcc tgacacaaaa gtacacaaat cactccgtta aatggtacag agaggggctc 660
tgcatcgcaa ctaatataga cctcggacag tttccagagt tttaccagct ggacaaatgg 720
aacgccatga atgattttag gagggaaatg actttcatgg ttttggacat cattgcgctg 780
tggcccacgt atgatcctat aaggtatcca ctcggcatca aaacagagtt gacaagagag 840
gtctttacgc ctcttctcgg aatcaatccg aactcttcgt ggctgatcca tacaatggaa 900
gaaatcgaag cgaaattgac ttttctgtcg ccgttcttgt cgtggatttc cttcgagcaa 960
ctggtcaagc aaggggatgg cattgcaaca ttcaccgatt ggggtaactt cacactgtca 1020
aataccatgc tgcctctttc atatattctt ggaggggcag gttcggggac aggagactca 1080
actaatatac cgatgcagtc agaaaactac gatgtgtaca aggttcatgt ggggactgat 1140
tactcccatc cgtccaatgt gccgatccgc aaactcgaat actactgtac caacgggaca 1200
atggaaaaag tgattactgt ggggacagga aggactaacg ctctttttga gcttccgaat 1260
aatggttgtg ttgattactc tcatcgcatc tcaagattgt catgtagcaa cgttgaagtc 1320
tatgaatggg agggcggccc gaggtatgcg cttaaaaaca ttgcctacgg ctggacgcac 1380
atcagcgtgg atagcaagaa tactttgagc gccaacgcca ttacgcaaat tcccgcacgg 1440
aagggctatg catcttccgg tagcaatctc tccatagcgg ggccctactt tactggaggt 1500
gacctcatcg ttctcccacc caatggcgcc caacttcaaa tacgggttac gccaccggtg 1560
tcaagcaagt ctaagaagta ctgtgttagg ttccggtatg ccagctccgg aaacacgaac 1620
atttatttcg aacgggtcct gtcttcaggt gatacgtatt cagaaaccca cgatgtcccg 1680
gcgacctatc cgggtggcgc actttcttat tcgagctttg cctatgttgt gaatttgacg 1740
gcgatttttg aggggttcaa cgttgagatc aaaatcaaaa acataggttc gtcccaaatc 1800
atactcgaca agatagagtt ccttccgctc aaagaatcgc tgaaagaa 1848
<210> 29
<211> 2277
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1047的合成多核苷酸序列
<400> 29
atgaatctct gtttctatct caacattaaa aacgctctct catatacaat attttggaag 60
tgtttgttcg agcaagactt tataaggaag ttgaagctca taattaatgg agttattaat 120
atgaaaccaa aaaatcagaa taagtgtcaa tcgctttact ctaatgggac cttcgatatg 180
gactctaagg cctcactcaa gaacgacaaa aatatggaac tccagtccat tactcacgaa 240
gattgcctgc ggatgtctga gcatgaaagc atagaaccgc ttgttagcgc gtccgtgata 300
caaaacggca taggtatagc tggaaagata ttgggtaccc tcggggttcc atttgctggg 360
cagattgcgt cgctgtactc gttcattctg ggtgagctct ggcccaaggg caagtcgcaa 420
tgggagatat tcatggagca tgttgaggaa ttgatagacc aaaagatttc gatctatgct 480
aggaacaagg ccctgactga gcttaaaggc cttggggatg ccctcgcagt ttaccacgaa 540
tcactggagt catggataga aaataggaac aacacacgcg cgcgctcagt ggtcaaatcg 600
caatatatca cactcgaact gatgttcgtc caaggtttgc cttcgttcgc cgtctccggg 660
gaagaagtcc ttttgcttcc gatctatgca caagcggcga atctgcatct gctgctcctt 720
cgggatgcgt ctatttttgg cgaggagtgg ggtctttctg cttccgagat ttctacattt 780
tataatcgcc aagttgaacg cgtgaatgac tacacagact actgtgtgaa gttctacaac 840
acgggtttga attcctccag aggtacggat gcgaaaagct gggcatcata caatcaattt 900
aggaaagata tgaccttgat ggttctggat ttggtggccc ttttcccttc gtatgacact 960
catgtttatc cgatcaagac taattctcaa ctgactcgcg acgtgtatac cgatgcgatt 1020
gggacagtcc accctaatcc atcattcgcc tcaacgacgt ggtacaacaa caatgcccct 1080
gccttctctg cgatagaggc agcagtcata agaagcccac atctcttgga cttcctggag 1140
gaggttacga tttactcagc cctcagcaga tggtctaata ctcagtacat gaacatttgg 1200
tccggtcact ctctgaaatt tcgcactatc ggaggagggc tgaatacgtc aacacagggc 1260
tccactaatt ctacgatttc acctgttaca ttccagtttc ccgcccggga tgtttaccgg 1320
acagaatcat tggcagggct gaatatattt cttacgcaac cagtcaacgg agttccgtca 1380
gtttcgtttc attggatact gcctggcatc gaagttggta atagcatcac atataatcct 1440
gggtacgtgg gagtgggcac ccagctgcaa gattcggaaa ctgaactgcc gcccgagacc 1500
acggagcgcc ccaactatga aagctactcc caccgcttgt cccacatagg attgataaca 1560
gcgtcgcatg tccgggcatt ggtttattcc tggacgcacc ggtcagccga acgcacaaac 1620
accatagagc cgaacaggat aactcagata ccactcgtta aggctctcaa tctgtactcc 1680
ggaacaacgg ttgttaaggg accagggttc accgggggag atattcttcg gcgcacgaat 1740
accggcattt tcggagatat tagggttaac attactgcgc ccctgagcca aaggtacaga 1800
gtgcgggtga ggtatgccag cacgactgac cttgagtttt acacctcagt gaacggcacc 1860
acaataaaca tgggaaattt tagcaaaacg atggatagcg ggaacaattt ggagttctcg 1920
agcttcaaga caactggctt ttcgacgcca ttcagcttct cgaacgcgca gagcacgttc 1980
acgttgggta cgatggactt ttctaaccaa gaagtttata tcgatagaat tgaattcttt 2040
cccgttgaag tgacctatga agaggagtgc gactttgaga aggctcagga ggccgtgact 2100
gccctcttta cacccaagaa tcctaagggg ttgcgcatga atgtcacgga ctatcacatc 2160
gatcaagcgt ccaacctggt tgagggtctt tctgacgaat catacctcga tgagaaaagg 2220
gagcttttcg aaaaggttga atacgtaaag cagcttaata tagagcggaa catatag 2277
<210> 30
<211> 2205
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1280的合成多核苷酸序列
<400> 30
atgaagctca agaatcaaga taagcatcag tcgttttcaa gcaatgccaa agttgacaag 60
ataagcactg attccttgaa gaatgaaacc gacatcgagc ttcaaaatat aaaccacgaa 120
gattgcctga aaatgtctga gtacgaaaac gtggaacctt ttgtgtcggc atcaacaata 180
cagacaggta taggcatagc tggaaaaatt ctgggtactc tgggcgttcc gttcgcgggt 240
caagtggcct ctttgtacag ctttattttg ggcgagctct ggcccaaagg taagaaccaa 300
tgggagattt ttatggaaca cgtcgaggag ataataaacc agaagatatc gacctatgca 360
cgcaataagg ctctcacaga ccttaaaggc ctcggtgatg cacttgctgt ctaccacgac 420
agccttgagt cttgggtcgg caacaggaat aacacgcggg ctaggtccgt tgtgaagagc 480
cagtatatcg cgcttgagct gatgtttgtc cagaaacttc catcttttgc tgtttctggc 540
gaagaggtcc ctctgttgcc gatatatgct caagctgcaa acctgcatct tttgttgttg 600
agggacgcgt caatcttcgg taaggagtgg ggtctgtcta gctcagagat cagcacgttt 660
tacaaccgcc aagttgaaag agctggggat tactcagatc attgtgtcaa atggtattca 720
accggactta ataaccttag gggtacgaat gctgagtctt gggttagata taatcaattc 780
cgcagggata tgaccttgat ggttctcgac cttgtggctc ttttcccatc atatgatacc 840
caaatgtacc caatcaaaac cacagcccag cttaccagag aggtgtacac agacgcgatt 900
gggacggtgc acccgcaccc ctcgtttacg tccacaacat ggtataataa taatgccccg 960
tcattttcag ccattgaagc ggcggtggtc cggaacccac acttgctcga cttcctggaa 1020
caggtgacca tatattcact gctgtctcgc tggagcaaca cgcaatatat gaacatgtgg 1080
ggcgggcata agcttgaatt tcgcacaatc ggaggtacgc ttaatatttc tacacaggga 1140
tctaccaata catccatcaa ccctgttacc cttccgttta cttctagaga cgtttatagg 1200
accgaaagcc tcgctggttt gaatctcttc ctcacacagc ccgtgaacgg ggttccgcgc 1260
gtcgattttc attggaaatt tgttacacat ccgattgcat cggataattt ttattaccca 1320
gggtatgctg gtataggaac acagctccaa gattctgaaa atgaactccc tcccgaagca 1380
acagggcaac caaattatga atcctattct cacagacttt cgcacatcgg cctgatatcg 1440
gcatcacacg tcaaggctct ggtctactct tggacccatc gcagcgcaga taggacaaac 1500
acaatagagc cgaactcaat aactcagatt ccgttggtta aagccttcaa cctgtcctcc 1560
ggtgcggctg tcgtcagggg accggggttc accggagggg atatattgcg caggaagaat 1620
actgggacct ttggggacat cagggtcaac ataaatccgc ccttcgctca gagatacagg 1680
gttagaatca gatacgccag caccaccgac ttgcaattcc acacgagcat caatggcaag 1740
gcaattaatc aggggaactt ttcagccacg atgaaccggg gagaagatct ggactacaag 1800
actttcagga ccgtgggctt tacaaccccg ttctcatttt ccaacgggaa ggctattaac 1860
cagggtaatt tttcagctac catgaatcgg ggcgaggacc tggattataa aactttccgc 1920
actgtgggtt tcacaacacc cttttctttc cttgacgtcc agtcaacctt cacgatcggt 1980
gcatggaact tctcctccgg gaatgaggtt tatattgacc gcatagagtt tgttcctgtt 2040
gaagtcactt acgaggcaga atatgacttt gagaaggccc aagagaaagt tacggccttg 2100
ttcacaagca ctaatcctag gggccttaag accgatgtca aggattatca tatagaccag 2160
gcctctaacc ttgctgaatc tctttccgat gtccttttta gataa 2205
<210> 31
<211> 1787
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1555的合成多核苷酸序列
<400> 31
atggacctgt cacccgatgc gcggattgag gattcgcttt gcgttgcaga aggcaacaac 60
atcgacccat tcgtgtcagc ctcaacagtc cagactggta tatccatcgc tgggaggata 120
ctgggagtct tgggtgtgcc ctttgccggc caacttgcca gcttttactc atttcttgtg 180
ggtgaattgt ggccatccgg gagggacccc tgggagatat tcatggagca tgtcgaacaa 240
atagtgcggc aacaaattac ggactcagtc cgcgatacag ccatcgctag gctcgaaggg 300
ttgggtcggg ggtatcggtc atatcagcaa gctctggaga cttggcttga taacaggaat 360
gatgcccgct cacgctcaat cattagggag aggtacatag ccctggagct tgacatcacc 420
actgctatac cgctgttcag catcaggaat caagaggtgc ctcttcttat ggtttacgca 480
caggccgcaa atctccacct cctgcttttg agggatgcat ccatcttcgg gaaggaatgg 540
gggctgtctg cgtcggagat ctcgactttc tataatagac aggtcgaacg gacccgggat 600
tattccgacc actgtgttaa gtggtataac acgggcctga acaatctccg gggtacaaac 660
gccaaatctt gggttcgcta taatcaattc cggaaggata tgaccctgat ggtgcttgac 720
ctggttgcac tcttcccttc ttatgatacc ttggtgtacc caattaagac tacctctcag 780
ttgactcggg aggtctatac tgacgcaatc ggtacggttc atccgaacca agccttcgcc 840
tcgacaacat ggtacaacaa caacgcgccc tctttttcaa ccatcgaggc ggcggttgtg 900
cgcaaccctc acctccttga cttcctcgag caagtcacaa tttactcctt gctgtcgagg 960
tggagcaaca cccaatacat gaatatgtgg ggcggccaca agttggaatt tcgcacaata 1020
ggcgggacac tgaatacatc tacgcaagga tcaaccaata cttcaataaa ccccgttacg 1080
ttgccattca cttccagaga cgtttatcgg accgagagct tggccggcct taatctcttt 1140
cttacgcaac ctgttaatgg tgttccaaga gttgactttc attggaaatt cgtgacccac 1200
cccattgcta gcgataactt ttattatcca gggtacgcgg gaatagggac tcagcttcag 1260
gactctgaaa atgaattgcc tcccgaaacg accgggcaac cgaactatga atcatactca 1320
cacagactct cgcatattgg acttatatcg gcctcccacg ttaaagccct ggtgtattcc 1380
tggacccata ggagcgcaga caggactaat actatagagc cgaacagcat cactcaaatc 1440
ccgctggtta aagcctttaa tttgccatcc ggagctgccg tggtcagagg cccgggtttt 1500
accggtggcg acatcctcca gcgcacaaat acaggtacct tcggagacat tagagttaac 1560
atcaaccctc cctttgcaca aagatatagg gtgaggatac gctatgcgtc cactactaat 1620
gttgagttcc ataccagcat taatggcaag gcgattaacc agggtaattt ttctgccacc 1680
atgaacagag gtgaagatct tgattacaag acatttagga ccgttggttt caccacgccc 1740
ttctcgttga gcgatgttca gtcgactttc acaataggtg cgtggaa 1787
<210> 32
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1559的合成多核苷酸序列
<400> 32
atgaatctgt caacagatgc aagaattgag gactcgctgt gtatagcaga aggtaataac 60
atcgatccct ttgtctccgc atctactgtg caaactggga taaatatagc gggaaggatc 120
cttggagtct tgggcgtgcc gttcgcaggc caaattgcat cattctattc cttcctggtt 180
ggcgagctgt ggccaagagg gagggatccg tgggaaattt ttcttgagca cgttgagcag 240
ctgattcggc aacaagtgac tgaaaataca cgggatactg cgctggcgcg gctgcagggg 300
ttgggaaact catttcgggc ataccagcag tcactggaag attggcttga aaatcgggac 360
gacgctcgga cccgctcagt gctctatacg caatacattg ccctcgagct ggatttcttg 420
aacgccatgc cactgttcgc aatacgcaac caagaggtcc ctctgctcat ggtgtacgca 480
caagctgcaa atcttcatct tttgctcttg cgggatgctt cactgtttgg atccgaattt 540
ggtctgacat cccaagagat acaaaggtac tatgaacggc aggtcgaaaa gacccgggaa 600
tattccgatt attgtgcacg gtggtataac acggggctca acaacctccg gggtaccaac 660
gcagagtcat ggctgcggta caaccagttt cggagagacc tcaccctcgg tgtcctcgat 720
ttggtggcat tgtttccatc ttacgataca agagtttatc ccatgaatac gagcgcgcag 780
ttgacccgcg aaatttatac agatccgata ggacgcacga acgccccttc cggatttgca 840
tccactaatt ggtttaataa taatgctccc tcgttctccg ccatagaagc tgccgtgatc 900
cggtcaccac atctgctcga ctttctcgaa caagtcacta tttatagcct tttgtccaga 960
tggtcgaaca cgcaatatat gaacatgtgg ggcggccata agctcgaatt ccggacgatt 1020
ggtgggactt tgaatacgtc tactcagggg tccacaaata cgtctattaa ccctgtgacg 1080
ctgccgttca catcacggga tatctatcgc accgagagcc tcgccgggct caaccttttc 1140
ctgactcaac cggtgaacgg cgtgcctaga gtggacttcc actggaagtt cgttacccac 1200
ccaatcgctt cggacaactt ttattacccg gggtatgcgg gtatcgggac ccaacttcaa 1260
gactcagaga acgagcttcc cccagaaaca accggtcagc cgaactatga gtcctattcc 1320
catcggttgt cacacatcgg ccttataagc gcgtctcacg tcaaagcttt ggtctattcg 1380
tggacccatc gctccgcaga taggactaac accatccact ctgattcgat aactcaaatc 1440
ccattggtca aagctcatac gttgcagagc ggcactacgg ttgtcaaggg tcccggtttc 1500
actggcggcg atatcctgcg ccggacttcc ggagggccct ttgcgttttc gaacgttaat 1560
ctcgattgga acctctcaca aaggtatcgc gccaggatcc gctacgcgtc aacaacgaac 1620
ctcagaatgt acgtgactat cgctggggag cggatttttg ccggccagtt caataagacg 1680
atgaacactg gcgatcctct gaccttccaa tcgttttcat atgccactat cgataccgct 1740
tttacctttc ctactaaagc ttcgagcctc acggtgggtg cagacacctt ctccagcggt 1800
aacgaagtct atgtggatcg gttcgaactt ataccagtta ctgcaaccct cgaagctgtg 1860
accgacttgg agcgggcaca gaaagcggtg cacgagctct tcacctcaac taaccccgga 1920
ggacttaaga cagacgtgaa ggactaccat atagatcaag tgtctaactt ggcggaatct 1980
ctttcggatg aattctattt ggacgagaag cgggagctgt ttgagattgc gaagtattag 2040
<210> 33
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1563的合成多核苷酸序列
<400> 33
atgaaccttt ccacggacgc gagaatagaa gacagcttgt gcatagccga gggaaacaat 60
atcgacccct tcgtttccgc gagcactgtg cagaccggta taaacatcgc cggtcgcatc 120
ctcggagtcc tcggggtgcc gtttgctggt cagatagcca gcttttattc gttcctcgtg 180
ggtgagctgt ggcccagagg tagggatcct tgggaaattt ttctcgagca cgtggagcaa 240
ttgattcggc aacaggtgac cgagaacacg cgcgacaccg cacttgcgcg gttgcaaggg 300
ctcggcaatt cgtttagggc gtaccagcag tcacttgaag attggctgga gaaccgcgat 360
gatgcgagaa ctcggtcggt tctctacacc caatacatag cactcgaact tgatttcttg 420
aatgctatgc cgctttttgc cattcggaac caagaggtcc ctcttttgat ggtgtacgca 480
caagcagcca acctccactt gctgctcctt cgcgacgcat ctttgttcgg gtcagaattt 540
ggtctgacat cacaggagat acaacgctac tatgaacggc aggtcgaaaa aacccgggag 600
tactcggact actgtgcgcg ctggtataac actgggctca acaacctcag ggggacaaat 660
gctgaatcgt ggctgagata taatcagttc cggagggaca tgacattgat ggttttggat 720
ctggttgcat tgtttccgag ctacgacaca cgggtgtacc ccatgaacac ctccgcccag 780
cttactagag aaatttacac ggatcccatc ggtcgcacta acgcaccctc cggattcgca 840
tcaactaact ggtttaataa caatgctccc tcattttcgg ctatcgaggc agcggtcgtg 900
agaaacccac atctcctcga ttttcttgag caggtgacaa tctactcgct cctttcgagg 960
tggtcaaaca cacaatatat gaatatgtgg ggaggacaca agctggagtt ccggacaatt 1020
ggaggcacac ttaatacttc gactcagggc tccaccaaca cgtccatcaa cccagtcact 1080
ttgcctttta ccagccgcga tgtttacagg acagaatcgc tcgccggctt gaacctcttt 1140
ttgactcagc cggtcaatgg ggtgcctaga gttgatttcc actggaagtt tgttacgcac 1200
ccgatcgcta gcgacaactt ctactaccct ggctacgccg ggataggcac gcagctccaa 1260
gactctgaaa acgagctgcc ccctgaagca actggccaac cgaattatga aagctacagc 1320
cacaggttgt cccatatagg tcttatctct gcatcccacg ttaaggcgct cgtttattcc 1380
tggacgcatc gcagcgccga caggactaac acgatcgagc cgaactcgat aactcagatt 1440
cccttggtca aggccttcaa tctgtcgagc ggcgcggcgg ttgtcagagg tcccggattt 1500
acgggtggcg atatcttgcg gaggactaac acaggaacgt tcggggacat ccgcgtgaat 1560
attaacccgc cattcgcaca acgctatcgc gtgaggatac ggtacgcctc aacgacagac 1620
cttcaatttc acactagcat aaacggtaag gcaatcaacc aagggaactt ctcagctacc 1680
atgaaccgcg gcgaggattt ggattacaag acgtttcgca cagtgggttt cactacaccg 1740
ttctcattta gcgatgtgca atccacgttt actataggtg catggaactt ctctagcgga 1800
aacgaggttt acatcgacag aattgaattt gtgcccgttg aagtgaccta cgaggctgag 1860
tatgatttcg agaaagcgca agaaaaagtc acggccctct ttacatccac aaatccgcgc 1920
ggccttaaga cagatgtgaa ggactatcac atcgaccaag tgagcaacct tgtcgagtcg 1980
atcagcgatg agttctacct ggacgaaaag cgcgagttgt tcgaaatcgc caaatattag 2040
<210> 34
<211> 2118
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1571的合成多核苷酸序列
<400> 34
atgacttcaa acaggaagaa cgagaacgag ataattaacg cactgtcgat accagcggtc 60
tctaaccatt ccgcacagat ggatctttcg cttgatgcgc ggattgaaga ctccctgtgc 120
attgctgagg gcaacaacat aaatccattg gtcagcgcct caacggtgca gactgggatc 180
aacattgctg ggcgcatact cggtgtcctc ggagttccgt tcgcaggaca actcgcttca 240
ttctactctt ttctcgtcgg tgaactctgg ccttctggta gggatccttg ggaaatattt 300
ttggagcacg tggagcaact gatacggcag caggttacag aaaatacaag gaatacagca 360
atcgcacgcc tggaggggct gggacgcgga tacaggtctt atcaacaggc actcgaaaca 420
tggttggata acagaaacga cgcacgctcg agatcgataa tacttgagag atacgttgct 480
ctcgagcttg atatcacgac cgccatcccc ttgtttcgca tccggaacga agaggtcccg 540
ttgctcatgg tctatgccca ggctgccaac ctccatcttt tgctcttgcg cgacgcatca 600
ctgttcggtt cagaatgggg tatggcgtct agcgatgtta atcaatatta tcaggaacag 660
atccggtata ctgaggagta ctctaatcat tgtgttcagt ggtacaatac tggactcaat 720
aacctcaggg gtaccaatgc cgagtcgtgg ctgaggtaca atcagttccg cagggacttg 780
acgctgggcg ttcttgatct cgttgcgctc ttcccttctt acgatacacg cacctaccct 840
ataaatacta gcgctcaact cactagggaa atctatacgg atccaatcgg gcgcaccaat 900
gccccatctg gtttcgcctc aacgaattgg ttcaacaata atgccccatc tttttccgct 960
atcgaatcag cagtggtccg gaacccccat ctcttggact ttcttgaaca ggttaccatt 1020
tactccttgc tttctagatg gtcgaacacc caatatatga acatgtgggg tggacaccgg 1080
cttgaattta ggacgatcgg cggtgttctt aatacttcta cacaagggtc aaccaacact 1140
tctattaatc ccgttactct tccctttacg tcgcgggatg tctatcggac ggaaagcctc 1200
gctgggctga atctgtttct cactcaacct gtcaacgggg ttccgagggt tgatttccat 1260
tggaaatttg ctactctccc gatagcatcg gataatttct attacttggg gtatgctgga 1320
gtcggcactc aacttcaaga ctcagaaaat gaacttcccc ccgaaacaac tggtcagccc 1380
aattatgaat cgtactcaca ccggctttcc catataggcc tcatctctgc atcccatgtg 1440
aaggcgctgg tgtactcctg gacgcacagg agcgcagata ggaccaatac gatagaaccg 1500
aactctatca cgcagattcc actggtcaag gcattcaatt tgagctctgg ggcggctgtt 1560
gtcagagggc ccggatttac cggcggggac atcctgcgca gaactaatac gggaaccttt 1620
ggagacataa gagtgaatat caatcctccc tttgcccagc ggtatcgcgt gcgcattcgg 1680
tatgcgtcaa ccaccgatct gcaattccac accagcatca atggcaaggc aattaaccaa 1740
gggaacttct cagctacaat gaataggggc gaagatctcg actacaagac gtttcggacg 1800
gttgggttta cgactccgtt ttccttctct gatgtccaat ctacgttcac catcggggcg 1860
tggaactttt cctcaggcaa cgaagtttat atagacagaa tcgagtttgt ccctgtggag 1920
gtgacatacg aagctgagta tgatttcgaa aaggcgcagg agaaagtcac tgctcttttt 1980
acctcgacca atccccgcgg gttgaagacg gatgtgaaag actaccatat agatcaggtg 2040
tccaacttgg tggagtcttt gtcagacgaa ttctatatcg atgagaagag agaactgttc 2100
gaactcgtca aatattag 2118
<210> 35
<211> 2121
<212> DNA
<213> 人工序列
<220>
<223> 编码突变型BT1633的合成多核苷酸序列
<400> 35
atgaagctta agaaccaaaa catgcaccag tctttgagct ctaacgctac agttgataaa 60
tcctttactg attccctcga acataatacg aacatggagc ttcaaaattc aaatcacgaa 120
gattgcctga agatgtccga atatgaatca atagagccct ttgtctcggc atcaaccata 180
cagactggca taggaattgc tggtaaaatt ttgggcacat tgggtgttcc tttcgccggc 240
caaatagcgt cgctttactc ttttatattg ggtgagcttt ggcctaaggg caagagccag 300
tgggagatct tcatggaaca tgttgaagaa ctgattaacc agaagatctc cacgtacgct 360
aggaataaag cattggcaga tcttaagggc cttggagatg cactcgcggt ttaccacgaa 420
tctttggaat cctggatcga aaataggaat aacacacggg ctaggtcagt cgtgaagaat 480
cagtatattg cactggagct catgtttgtt cagaaactgc cctccttcgc agtctccggt 540
gaggaggtcc cattgttgcc gatctatgca caagcggcca acttgcatct cctgctgctc 600
cgggatgcca gcatttttgg taaggaatgg ggattgtccg agtctgaaat ttccaccttc 660
tacaacagac aagttgaacg gacacgggat tattcggatc attgcgtcaa gtggtacaac 720
acgggcttga atagattgcg cggtactaat gccaagtcgt gggtccgcta caaccagttt 780
aggaaagaca tgaccttgat ggtcctcgac ttggtcgcat tgtttccttc ttacgataca 840
cttgtttacc ctattaaaac aactagccaa ctcacacggg aagtgtatac agatgctatc 900
ggtacagtgc acccgaatca ggcctttgct tccactacgt ggtataacaa caatgctcca 960
tcgttttccg caatagaagc tgcggttatc agatcacccc atctccttga ttttcttgaa 1020
aaggttacaa tatattcact cctctcaaga tggagcaaca cccagtatat gaacatgtgg 1080
ggcggccaca aacttgagtt tcggaccatt ggtgggacat tgaacacatc gacccagggg 1140
tctacgaata catcaattaa tcccgttacg cttccgttca cgtcaaggga tgtttacagg 1200
actgaatccc tggcgggcct caacctgttc ctgactcagc cagttaatgg ggtcccgagg 1260
gttgactttc attggaaatt tgtcacccat ccgatagcct ccgataactt ctactaccca 1320
ggctacgcgg gtatcggaac acagcttcag gatagcgaaa atgagctgcc gccagagaca 1380
accggacagc cgaattacga atcctatagc cacagactgt cacacatagg actcatttca 1440
gcttcgcacg ttaaggcact ggtgtatagc tggacacatc ggagcgcgga tcgcactaac 1500
acgatagagc cgaattcgat cacacaaata ccattggtta aagccttcaa tcttccgtcg 1560
ggcgctgcgg tggttcgcgg acccggtttt acaggtggtg atattcttcg cagaaccaac 1620
acaggcacct tcgccgatat gcgcgtgaat attaccgggc ccctgtcaca aaggtaccgc 1680
gttcgcatta ggtatgctag cacgaccgat ctgcaattct ttaccaatat taacggcacg 1740
acgataaaca tgggcaattt cccgaagaca gtgaacaatt cgtcttctga aggctaccgc 1800
acggtttcct tttcaacacc tttttctttc agcaacgcac aatccatctt cagattggga 1860
atccaggcat tctctggagt gcatgagata cacgtggata gaatcgagtt tgtccctgcg 1920
gaagttactt tcgaagctga gtacgatctg gagagagcgc agaaggccgt gaatgcgctg 1980
tttacgagca caaacccgaa ggacatgaaa acttatgtta ctgagtctca aattgatcaa 2040
gtcttcaatc tggtcgagtg tatttctgac gaggtttgct tggatgaaaa aagagagatt 2100
ttcaagaagg tgaaatatta g 2121
<210> 36
<211> 719
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT204
<400> 36
Met Lys Leu Lys Asn Pro Asp Lys His Gln Ser Phe Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ala Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Lys Asn Met Asn Asn Glu Asp Tyr Leu Arg Met Ser Glu His
35 40 45
Glu Ser Ile Asp Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Ala Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Lys Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Ser Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Ser Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Ala Glu Arg Thr Ser Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Ser
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Lys Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Met Ile Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr His Met Tyr Pro Ile Lys Thr Thr
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asn Ala Ile Gly Thr Val His
290 295 300
Pro His Pro Ser Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Arg Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Ala Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Val Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu His Asp Phe Glu Lys Ala
645 650 655
Gln Glu Glu Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Gly Gly Leu
660 665 670
Lys Thr Asn Val Thr Glu Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asn Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Leu His Ile Gly Arg Asn Met
705 710 715
<210> 37
<211> 625
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT235
<400> 37
Met Arg Asn Ala Ser Lys Glu Val Lys Ile Leu Arg Thr Arg Gln Tyr
1 5 10 15
Glu Lys Asp Ser Ala Met Val Tyr Ala Met Glu Asp Gln Pro Leu Ser
20 25 30
Phe Gly Gly Val Val Glu Leu Ser Gly Lys Ile Gly Leu Gly Val Val
35 40 45
Lys Thr Val Ile Ser Ser Ile Thr Arg Arg Gly Arg Asp Asp Glu Ile
50 55 60
Ala Gly Arg Ile Leu Ser Asp Val Tyr Gly Val Leu Trp Ser Asn Arg
65 70 75 80
Lys Gly Tyr Trp Asn Glu Met Ile Glu Ala Val Glu Thr Leu Ile Arg
85 90 95
His Asp Ile Asn Glu Asn Val Lys Asn Asn Thr Leu Ala Val Leu Thr
100 105 110
Asp Ile Arg Asn Ala Leu Leu Leu Tyr Gln Gln Ala Thr Glu Ala Trp
115 120 125
Gln Asn Asn Arg Thr Asp Pro Gln Leu Gln Glu Arg Ile Arg Asn Gln
130 135 140
Phe Ile Ala Thr Asn Thr Phe Ile Glu Phe Ala Met Pro Ser Phe Ile
145 150 155 160
Val Pro His Tyr Glu Val Ile Leu Leu Pro Ile Phe Ala Gln Val Ala
165 170 175
Asn Phe His Leu Leu Leu Leu Arg Asp Ile Ala Ile Phe Gly Leu Glu
180 185 190
Trp Arg Met Ser Lys Ala Glu Ile Asp Asp Tyr Tyr Phe Ala Asn Thr
195 200 205
Gly Leu Thr Gly Leu Thr Ser Lys Tyr Thr Ser His Cys Val Lys Trp
210 215 220
Tyr Cys Glu Gly Leu Cys Ile Ala Thr Asn Val Asp Leu Gly Gln Tyr
225 230 235 240
Pro Glu Phe Tyr Gln Leu Asp Lys Trp Asn Ala Met Asn Asp Phe Arg
245 250 255
Arg Glu Met Thr Phe Met Val Leu Asp Ile Ile Ala Leu Trp Pro Thr
260 265 270
Tyr Asp Pro Ile Arg Tyr Pro Leu Gly Ile Lys Thr Glu Leu Thr Arg
275 280 285
Glu Val Phe Thr Pro Leu Leu Gly Ile Asn Pro Asn Ser Ser Trp Leu
290 295 300
Ile His Thr Met Glu Glu Ile Glu Ala Lys Leu Thr Phe Leu Ser Pro
305 310 315 320
Phe Leu Ser Trp Ile Ser Phe Glu Gln Leu Val Lys Gln Gly Asp Gly
325 330 335
Ile Ser Thr Phe Thr Asp Trp Gly Ser Phe Thr Leu Ser Asn Thr Met
340 345 350
Leu Pro Leu Ser Tyr Ile Leu Gly Gly Ala Gly Ser Gly Thr Gly Glu
355 360 365
Ser Thr Asn Ile Pro Ile Lys Ser Glu Asn Tyr Asp Val Tyr Lys Val
370 375 380
Leu Val Gly Thr Asp Tyr Ser His Pro Ser Asn Val Pro Ile Arg Lys
385 390 395 400
Leu Glu Tyr Tyr Cys Thr Asn Gly Thr Ile Glu Asn Val Ile Thr Ala
405 410 415
Gly Thr Gly Thr Thr Asn Ala Leu Phe Glu Leu Pro Asn Asn Gly Cys
420 425 430
Ile Asp Tyr Ser His Arg Val Ser Arg Leu Ser Cys Ser Asn Val Glu
435 440 445
Val Tyr Glu Trp Glu Gly Gly Pro Lys Tyr Ala Leu Lys Asn Ile Ala
450 455 460
Tyr Gly Trp Thr His Ile Ser Val Asp Ser Lys Asn Thr Leu Ser Ala
465 470 475 480
Asn Val Ile Thr Gln Ile Pro Ala Arg Lys Gly Tyr Ser Ser Ser Glu
485 490 495
Ser Asn Pro Ser Ile Ala Gly Pro Tyr Phe Thr Gly Gly Asp Leu Ile
500 505 510
Ala Leu Pro Pro Asn Gly Ala Gln Leu Gln Met Arg Val Thr Pro Pro
515 520 525
Val Ser Ser Cys Thr Thr Asn Tyr Cys Val Arg Leu Arg Tyr Ala Ser
530 535 540
Ser Gly Asn Thr Asn Ile Tyr Val Glu Arg Val Leu Pro Ser Gly Asp
545 550 555 560
Thr Tyr Gly Glu Thr His Asp Val Pro Ala Thr Tyr Tyr Gly Gly Ser
565 570 575
Leu Ser Tyr Ser Ser Phe Ala Tyr Val Val Asn Leu Thr Ala Met Phe
580 585 590
Glu Gly Val Asn Val Glu Ile Lys Ile Lys Asn Ile Gly Ser Ser Gln
595 600 605
Ile Ile Leu Asp Lys Ile Glu Phe Leu Pro Ile Lys Glu Ser Leu Lys
610 615 620
Glu
625
<210> 38
<211> 715
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT645
<400> 38
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Tyr Ser Ser Asn Glu
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asn Lys Thr Asp Ile Glu Leu Lys Asn
20 25 30
Met Asp Asn Glu Asp Tyr Leu Arg Val Ser Glu His Glu Ser Ile Asn
35 40 45
Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly
50 55 60
Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln
85 90 95
Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile Asn Gln Lys Ile
100 105 110
Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu Lys Gly Leu Gly
115 120 125
Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser Trp Val Glu Asn
130 135 140
Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Gly Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe Ala Val Ser Gly
165 170 175
Glu Glu Val Pro Leu Leu Pro Ile Tyr Val Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys Glu Trp Gly Leu
195 200 205
Ser Pro Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln Val Asp Arg Thr
210 215 220
Arg Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg Tyr Asn Gln Phe
245 250 255
Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Ile Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Ile Val Tyr Pro Ile Lys Thr Thr Ser Gln Leu Thr
275 280 285
Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His Pro His Ala Ser
290 295 300
Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu
325 330 335
Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Met Trp Gly Gly His Arg Leu Glu Ser Arg Pro Ile Gly Gly
355 360 365
Ala Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Trp
385 390 395 400
Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg
405 410 415
Val Asp Phe His Trp Lys Tyr Pro Thr Leu Pro Ile Ala Ser Asp Asn
420 425 430
Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln Leu Gln Asp Ser
435 440 445
Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Ala Ser His Val
465 470 475 480
Lys Ala Leu Val Tyr Ser Trp Thr His Ser Ser Ala Asn Arg Thr Asn
485 490 495
Thr Ile Glu Ala Asn Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe
500 505 510
Asn Leu Pro Ser Gly Ala Thr Val Val Arg Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe Gly Asp Ile Arg
530 535 540
Val Thr Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser Ile Asn Gly Arg
565 570 575
Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn Arg Glu Asp Asn
580 585 590
Leu Asn Tyr Arg Thr Phe Arg Thr Ala Gly Phe Thr Thr Pro Phe Ser
595 600 605
Phe Ser Asp Thr Gln Ser Thr Phe Thr Ile Gly Ala Trp Ser Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu
625 630 635 640
Val Ala His Glu Glu Asn Tyr Asp Phe Glu Lys Val Gln Glu Glu Val
645 650 655
Thr Ala Leu Phe Thr Pro Thr Asn Pro Arg Gly Leu Lys Thr Asn Val
660 665 670
Thr Asp Tyr Asp Ile Asp Gln Val Leu Asn Leu Val Glu Ser Leu Ser
675 680 685
Asp Glu Phe Tyr Val Asp Glu Lys Arg Glu Leu Leu Glu Ile Val Lys
690 695 700
Tyr Ala Lys Gln Leu Asn Ile Asp Arg Asn Met
705 710 715
<210> 39
<211> 616
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT727
<400> 39
Met Leu Arg Thr Arg Gln Tyr Lys Lys Gly Pro Glu Met Val Tyr Thr
1 5 10 15
Gly Arg Glu Gln Thr Leu Pro Phe Glu Glu Val Val Lys Ile Ser Gly
20 25 30
Lys Ile Gly Leu Gly Val Val Lys Thr Val Ile Thr Ser Ile Ile Arg
35 40 45
Cys Gly Arg Asp Asn Glu Ile Ala Gly Arg Ile Leu Ser Asp Val Tyr
50 55 60
Ser Val Leu Trp Ser Thr Pro Lys Gly Tyr Trp Ala Glu Met Ile Glu
65 70 75 80
Ala Val Glu Thr Leu Ile Gln His Glu Ile Ser Glu Asn Ile Arg Asn
85 90 95
Asn Ala Phe Ala Val Leu Thr Asp Val Arg Asn Ala Leu Leu Leu Tyr
100 105 110
Gln Gln Ala Ala Glu Glu Trp Gln Ser Asn Arg Thr Asp Pro Gln Leu
115 120 125
Gln Glu Arg Val Arg Asn Gln Phe Ile Ala Thr Asn Thr Leu Ile Glu
130 135 140
Phe Ala Met Pro Ser Phe Thr Val Pro His Tyr Glu Val Ile Leu Leu
145 150 155 160
Pro Ile Phe Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp
165 170 175
Val Glu Ile Phe Gly Leu Glu Trp Gly Met Ser Lys Ala Glu Ile Asp
180 185 190
Asp Tyr Tyr Phe Ala Asn Ser Gly Leu Thr Gly Leu Thr Gln Lys Tyr
195 200 205
Thr Asn His Ser Val Lys Trp Tyr Arg Glu Gly Leu Cys Ile Ala Thr
210 215 220
Asn Ile Asp Leu Gly Gln Phe Pro Glu Phe Tyr Gln Leu Asp Lys Trp
225 230 235 240
Asn Ala Met Asn Asp Phe Arg Arg Glu Met Thr Phe Met Val Leu Asp
245 250 255
Ile Ile Ala Leu Trp Pro Thr Tyr Asp Pro Ile Arg Tyr Pro Leu Gly
260 265 270
Ile Lys Thr Glu Leu Thr Arg Glu Val Phe Thr Pro Leu Leu Gly Ile
275 280 285
Asn Pro Asn Ser Ser Trp Leu Ile His Thr Met Glu Glu Ile Glu Ala
290 295 300
Lys Leu Thr Phe Leu Ser Pro Phe Leu Ser Trp Ile Ser Phe Glu Gln
305 310 315 320
Leu Val Lys Gln Gly Asp Gly Ile Ala Thr Phe Thr Asp Trp Gly Asn
325 330 335
Phe Thr Leu Ser Asn Thr Met Leu Pro Leu Ser Tyr Ile Leu Gly Gly
340 345 350
Ala Gly Ser Gly Thr Gly Asp Ser Thr Asn Ile Pro Met Gln Ser Glu
355 360 365
Asn Tyr Asp Val Tyr Lys Val His Val Gly Thr Asp Tyr Ser His Pro
370 375 380
Ser Asn Val Pro Ile Arg Lys Leu Glu Tyr Tyr Cys Thr Asn Gly Thr
385 390 395 400
Met Glu Lys Val Ile Thr Val Gly Thr Gly Arg Thr Asn Ala Leu Phe
405 410 415
Glu Leu Pro Asn Asn Gly Cys Val Asp Tyr Ser His Arg Ile Ser Arg
420 425 430
Leu Ser Cys Ser Asn Val Glu Val Tyr Glu Trp Glu Gly Gly Pro Arg
435 440 445
Tyr Ala Leu Lys Asn Ile Ala Tyr Gly Trp Thr His Ile Ser Val Asp
450 455 460
Ser Lys Asn Thr Leu Ser Ala Asn Ala Ile Thr Gln Ile Pro Ala Arg
465 470 475 480
Lys Gly Tyr Ala Ser Ser Gly Ser Asn Leu Ser Ile Ala Gly Pro Tyr
485 490 495
Phe Thr Gly Gly Asp Leu Ile Val Leu Pro Pro Asn Gly Ala Gln Leu
500 505 510
Gln Ile Arg Val Thr Pro Pro Val Ser Ser Lys Ser Lys Lys Tyr Cys
515 520 525
Val Arg Phe Arg Tyr Ala Ser Ser Gly Asn Thr Asn Ile Tyr Phe Glu
530 535 540
Arg Val Leu Ser Ser Gly Asp Thr Tyr Ser Glu Thr His Asp Val Pro
545 550 555 560
Ala Thr Tyr Pro Gly Gly Ala Leu Ser Tyr Ser Ser Phe Ala Tyr Val
565 570 575
Val Asn Leu Thr Ala Ile Phe Glu Gly Phe Asn Val Glu Ile Lys Ile
580 585 590
Lys Asn Ile Gly Ser Ser Gln Ile Ile Leu Asp Lys Ile Glu Phe Leu
595 600 605
Pro Ile Lys Glu Ser Leu Lys Glu
610 615
<210> 40
<211> 758
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1047
<400> 40
Met Asn Leu Cys Phe Tyr Leu Asn Ile Lys Asn Ala Leu Ser Tyr Thr
1 5 10 15
Ile Phe Trp Lys Cys Leu Phe Glu Gln Asp Phe Ile Arg Lys Leu Lys
20 25 30
Leu Ile Ile Asn Gly Val Ile Asn Met Lys Pro Lys Asn Gln Asn Lys
35 40 45
Cys Gln Ser Leu Tyr Ser Asn Gly Thr Phe Asp Met Asp Ser Lys Ala
50 55 60
Ser Leu Lys Asn Asp Lys Asn Met Glu Leu Gln Ser Ile Thr His Glu
65 70 75 80
Asp Cys Leu Arg Met Ser Glu His Glu Ser Ile Glu Pro Leu Val Ser
85 90 95
Ala Ser Val Ile Gln Asn Gly Ile Gly Ile Ala Gly Lys Ile Leu Gly
100 105 110
Thr Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser Leu Tyr Ser Phe
115 120 125
Ile Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln Trp Glu Ile Phe
130 135 140
Met Glu His Val Glu Glu Leu Ile Asp Gln Lys Ile Ser Ile Tyr Ala
145 150 155 160
Arg Asn Lys Ala Leu Thr Glu Leu Lys Gly Leu Gly Asp Ala Leu Ala
165 170 175
Val Tyr His Glu Ser Leu Glu Ser Trp Ile Glu Asn Arg Asn Asn Thr
180 185 190
Arg Ala Arg Ser Val Val Lys Ser Gln Tyr Ile Thr Leu Glu Leu Met
195 200 205
Phe Val Gln Gly Leu Pro Ser Phe Ala Val Ser Gly Glu Glu Val Leu
210 215 220
Leu Leu Pro Ile Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu
225 230 235 240
Arg Asp Ala Ser Ile Phe Gly Glu Glu Trp Gly Leu Ser Ala Ser Glu
245 250 255
Ile Ser Thr Phe Tyr Asn Arg Gln Val Glu Arg Val Asn Asp Tyr Thr
260 265 270
Asp Tyr Cys Val Lys Phe Tyr Asn Thr Gly Leu Asn Ser Ser Arg Gly
275 280 285
Thr Asp Ala Lys Ser Trp Ala Ser Tyr Asn Gln Phe Arg Lys Asp Met
290 295 300
Thr Leu Met Val Leu Asp Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr
305 310 315 320
His Val Tyr Pro Ile Lys Thr Asn Ser Gln Leu Thr Arg Asp Val Tyr
325 330 335
Thr Asp Ala Ile Gly Thr Val His Pro Asn Pro Ser Phe Ala Ser Thr
340 345 350
Thr Trp Tyr Asn Asn Asn Ala Pro Ala Phe Ser Ala Ile Glu Ala Ala
355 360 365
Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu Glu Val Thr Ile
370 375 380
Tyr Ser Ala Leu Ser Arg Trp Ser Asn Thr Gln Tyr Met Asn Ile Trp
385 390 395 400
Ser Gly His Ser Leu Lys Phe Arg Thr Ile Gly Gly Gly Leu Asn Thr
405 410 415
Ser Thr Gln Gly Ser Thr Asn Ser Thr Ile Ser Pro Val Thr Phe Gln
420 425 430
Phe Pro Ala Arg Asp Val Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn
435 440 445
Ile Phe Leu Thr Gln Pro Val Asn Gly Val Pro Ser Val Ser Phe His
450 455 460
Trp Ile Leu Pro Gly Ile Glu Val Gly Asn Ser Ile Thr Tyr Asn Pro
465 470 475 480
Gly Tyr Val Gly Val Gly Thr Gln Leu Gln Asp Ser Glu Thr Glu Leu
485 490 495
Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser Tyr Ser His Arg
500 505 510
Leu Ser His Ile Gly Leu Ile Thr Ala Ser His Val Arg Ala Leu Val
515 520 525
Tyr Ser Trp Thr His Arg Ser Ala Glu Arg Thr Asn Thr Ile Glu Pro
530 535 540
Asn Arg Ile Thr Gln Ile Pro Leu Val Lys Ala Leu Asn Leu Tyr Ser
545 550 555 560
Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
565 570 575
Arg Arg Thr Asn Thr Gly Ile Phe Gly Asp Ile Arg Val Asn Ile Thr
580 585 590
Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Val Arg Tyr Ala Ser Thr
595 600 605
Thr Asp Leu Glu Phe Tyr Thr Ser Val Asn Gly Thr Thr Ile Asn Met
610 615 620
Gly Asn Phe Ser Lys Thr Met Asp Ser Gly Asn Asn Leu Glu Phe Ser
625 630 635 640
Ser Phe Lys Thr Thr Gly Phe Ser Thr Pro Phe Ser Phe Ser Asn Ala
645 650 655
Gln Ser Thr Phe Thr Leu Gly Thr Met Asp Phe Ser Asn Gln Glu Val
660 665 670
Tyr Ile Asp Arg Ile Glu Phe Phe Pro Val Glu Val Thr Tyr Glu Glu
675 680 685
Glu Cys Asp Phe Glu Lys Ala Gln Glu Ala Val Thr Ala Leu Phe Thr
690 695 700
Pro Lys Asn Pro Lys Gly Leu Arg Met Asn Val Thr Asp Tyr His Ile
705 710 715 720
Asp Gln Val Ser Asn Leu Val Glu Gly Leu Ser Asp Glu Ser Tyr Leu
725 730 735
Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Glu Tyr Ala Lys Gln Leu
740 745 750
Asn Ile Glu Arg Asn Ile
755
<210> 41
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1280
<400> 41
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Phe Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Gln Asn Ile Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Asn Val Glu Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Val Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Asn Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Asp Ser Leu Glu Ser
130 135 140
Trp Val Gly Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Ser Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Ala Gly Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Ser
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Gln Met Tyr Pro Ile Lys Thr Thr
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro His Pro Ser Phe Thr Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Val Arg Asn Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Ala Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Lys Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe
610 615 620
Ser Ala Thr Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg
625 630 635 640
Thr Val Gly Phe Thr Thr Pro Phe Ser Phe Leu Asp Val Gln Ser Thr
645 650 655
Phe Thr Ile Gly Ala Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile
660 665 670
Asp Arg Ile Glu Phe Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr
675 680 685
Asp Phe Glu Lys Ala Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr
690 695 700
Asn Pro Arg Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln
705 710 715 720
Val Ser Asn Leu Val Glu Ser Leu Ser Asp Val Leu Phe Arg
725 730
<210> 42
<211> 679
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1555
<400> 42
Met Asp Leu Ser Pro Asp Ala Arg Ile Glu Asp Ser Leu Cys Val Ala
1 5 10 15
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
20 25 30
Gly Ile Ser Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
35 40 45
Ala Gly Gln Leu Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
50 55 60
Pro Ser Gly Arg Asp Pro Trp Glu Ile Phe Met Glu His Val Glu Gln
65 70 75 80
Ile Val Arg Gln Gln Ile Thr Asp Ser Val Arg Asp Thr Ala Ile Ala
85 90 95
Arg Leu Glu Gly Leu Gly Arg Gly Tyr Arg Ser Tyr Gln Gln Ala Leu
100 105 110
Glu Thr Trp Leu Asp Asn Arg Asn Asp Ala Arg Ser Arg Ser Ile Ile
115 120 125
Arg Glu Arg Tyr Ile Ala Leu Glu Leu Asp Ile Thr Thr Ala Ile Pro
130 135 140
Leu Phe Ser Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
145 150 155 160
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe
165 170 175
Gly Lys Glu Trp Gly Leu Ser Ala Ser Glu Ile Ser Thr Phe Tyr Asn
180 185 190
Arg Gln Val Glu Arg Thr Arg Asp Tyr Ser Asp His Cys Val Lys Trp
195 200 205
Tyr Asn Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Lys Ser Trp
210 215 220
Val Arg Tyr Asn Gln Phe Arg Lys Asp Met Thr Leu Met Val Leu Asp
225 230 235 240
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys
245 250 255
Thr Thr Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr
260 265 270
Val His Pro Asn Gln Ala Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn
275 280 285
Ala Pro Ser Phe Ser Thr Ile Glu Ala Ala Val Val Arg Asn Pro His
290 295 300
Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg
305 310 315 320
Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu
325 330 335
Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr
340 345 350
Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val
355 360 365
Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro
370 375 380
Val Asn Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His
385 390 395 400
Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly
405 410 415
Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly
420 425 430
Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu
435 440 445
Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg
450 455 460
Ser Ala Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile
465 470 475 480
Pro Leu Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ala Val Val Arg
485 490 495
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Gln Arg Thr Asn Thr Gly
500 505 510
Thr Phe Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg
515 520 525
Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Val Glu Phe His
530 535 540
Thr Ser Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr
545 550 555 560
Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly
565 570 575
Phe Thr Thr Pro Phe Ser Leu Ser Asp Val Gln Ser Thr Phe Thr Ile
580 585 590
Gly Ala Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile
595 600 605
Glu Phe Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Leu Lys
610 615 620
Lys Ala Gln Asp Glu Ile Thr Ala Met Phe Thr Ser Thr Asn Pro Gly
625 630 635 640
Gly Leu Lys Thr Asn Val Thr Glu Tyr His Ile Asp Gln Val Ser Asn
645 650 655
Leu Val Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu
660 665 670
Leu Phe Glu Ile Val Lys Tyr
675
<210> 43
<211> 679
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1559
<400> 43
Met Asn Leu Ser Thr Asp Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala
1 5 10 15
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
20 25 30
Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
35 40 45
Ala Gly Gln Ile Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
50 55 60
Pro Arg Gly Arg Asp Pro Trp Glu Ile Phe Leu Glu His Val Glu Gln
65 70 75 80
Leu Ile Arg Gln Gln Val Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala
85 90 95
Arg Leu Gln Gly Leu Gly Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu
100 105 110
Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala Arg Thr Arg Ser Val Leu
115 120 125
Tyr Thr Gln Tyr Ile Ala Leu Glu Leu Asp Phe Leu Asn Ala Met Pro
130 135 140
Leu Phe Ala Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
145 150 155 160
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe
165 170 175
Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu
180 185 190
Arg Gln Val Glu Lys Thr Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp
195 200 205
Tyr Asn Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp
210 215 220
Leu Arg Tyr Asn Gln Phe Arg Arg Asp Leu Thr Leu Gly Val Leu Asp
225 230 235 240
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn
245 250 255
Thr Ser Ala Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg
260 265 270
Thr Asn Ala Pro Ser Gly Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn
275 280 285
Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His
290 295 300
Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg
305 310 315 320
Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu
325 330 335
Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr
340 345 350
Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Ile
355 360 365
Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro
370 375 380
Val Asn Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His
385 390 395 400
Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly
405 410 415
Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly
420 425 430
Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu
435 440 445
Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg
450 455 460
Ser Ala Asp Arg Thr Asn Thr Ile His Ser Asp Ser Ile Thr Gln Ile
465 470 475 480
Pro Leu Val Lys Ala His Thr Leu Gln Ser Gly Thr Thr Val Val Lys
485 490 495
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly
500 505 510
Pro Phe Ala Phe Ser Asn Val Asn Leu Asp Trp Asn Leu Ser Gln Arg
515 520 525
Tyr Arg Ala Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Met Tyr
530 535 540
Val Thr Ile Ala Gly Glu Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr
545 550 555 560
Met Asn Thr Gly Asp Pro Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr
565 570 575
Ile Asp Thr Ala Phe Thr Phe Pro Thr Lys Ala Ser Ser Leu Thr Val
580 585 590
Gly Ala Asp Thr Phe Ser Ser Gly Asn Glu Val Tyr Val Asp Arg Phe
595 600 605
Glu Leu Ile Pro Val Thr Ala Thr Leu Glu Ala Val Thr Asp Leu Glu
610 615 620
Arg Ala Gln Lys Ala Val His Glu Leu Phe Thr Ser Thr Asn Pro Gly
625 630 635 640
Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn
645 650 655
Leu Val Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu
660 665 670
Leu Phe Glu Ile Val Lys Tyr
675
<210> 44
<211> 679
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1563
<400> 44
Met Asn Leu Ser Thr Asp Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala
1 5 10 15
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
20 25 30
Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
35 40 45
Ala Gly Gln Ile Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
50 55 60
Pro Arg Gly Arg Asp Pro Trp Glu Ile Phe Leu Glu His Val Glu Gln
65 70 75 80
Leu Ile Arg Gln Gln Val Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala
85 90 95
Arg Leu Gln Gly Leu Gly Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu
100 105 110
Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala Arg Thr Arg Ser Val Leu
115 120 125
Tyr Thr Gln Tyr Ile Ala Leu Glu Leu Asp Phe Leu Asn Ala Met Pro
130 135 140
Leu Phe Ala Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
145 150 155 160
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe
165 170 175
Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu
180 185 190
Arg Gln Val Glu Lys Thr Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp
195 200 205
Tyr Asn Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp
210 215 220
Leu Arg Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp
225 230 235 240
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn
245 250 255
Thr Ser Ala Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg
260 265 270
Thr Asn Ala Pro Ser Gly Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn
275 280 285
Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Val Val Arg Asn Pro His
290 295 300
Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg
305 310 315 320
Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu
325 330 335
Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr
340 345 350
Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val
355 360 365
Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro
370 375 380
Val Asn Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His
385 390 395 400
Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly
405 410 415
Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Ala Thr Gly
420 425 430
Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu
435 440 445
Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg
450 455 460
Ser Ala Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile
465 470 475 480
Pro Leu Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg
485 490 495
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly
500 505 510
Thr Phe Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg
515 520 525
Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His
530 535 540
Thr Ser Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr
545 550 555 560
Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly
565 570 575
Phe Thr Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile
580 585 590
Gly Ala Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile
595 600 605
Glu Phe Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu
610 615 620
Lys Ala Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg
625 630 635 640
Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn
645 650 655
Leu Val Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu
660 665 670
Leu Phe Glu Ile Val Lys Tyr
675
<210> 45
<211> 705
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1571
<400> 45
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asp Leu Ser Leu Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asn
35 40 45
Pro Leu Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Leu Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Ser Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asn Thr Ala Ile Ala Arg Leu Glu Gly Leu Gly
115 120 125
Arg Gly Tyr Arg Ser Tyr Gln Gln Ala Leu Glu Thr Trp Leu Asp Asn
130 135 140
Arg Asn Asp Ala Arg Ser Arg Ser Ile Ile Leu Glu Arg Tyr Val Ala
145 150 155 160
Leu Glu Leu Asp Ile Thr Thr Ala Ile Pro Leu Phe Arg Ile Arg Asn
165 170 175
Glu Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Trp Gly Met
195 200 205
Ala Ser Ser Asp Val Asn Gln Tyr Tyr Gln Glu Gln Ile Arg Tyr Thr
210 215 220
Glu Glu Tyr Ser Asn His Cys Val Gln Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ser Ala Val Val Arg Asn Pro His Leu Leu Asp Phe Leu Glu
325 330 335
Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Met Trp Gly Gly His Arg Leu Glu Phe Arg Thr Ile Gly Gly
355 360 365
Val Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Leu
385 390 395 400
Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg
405 410 415
Val Asp Phe His Trp Lys Phe Ala Thr Leu Pro Ile Ala Ser Asp Asn
420 425 430
Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln Leu Gln Asp Ser
435 440 445
Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Ala Ser His Val
465 470 475 480
Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe
500 505 510
Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe Gly Asp Ile Arg
530 535 540
Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser Ile Asn Gly Lys
565 570 575
Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn Arg Gly Glu Asp
580 585 590
Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr Thr Pro Phe Ser
595 600 605
Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala Trp Asn Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu
625 630 635 640
Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu Lys Ala Gln Glu Lys Val
645 650 655
Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu Lys Thr Asp Val
660 665 670
Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Ser Leu Ser
675 680 685
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe Glu Ile Val Lys
690 695 700
Tyr
705
<210> 46
<211> 706
<212> PRT
<213> 人工序列
<220>
<223> 组装的BT1633
<400> 46
Met Lys Leu Lys Asn Gln Asn Met His Gln Ser Leu Ser Ser Asn Ala
1 5 10 15
Thr Val Asp Lys Ser Phe Thr Asp Ser Leu Glu His Asn Thr Asn Met
20 25 30
Glu Leu Gln Asn Ser Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Ser Ile Glu Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Ala Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Glu Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Asn
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Glu Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Thr Arg Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Asn
225 230 235 240
Thr Gly Leu Asn Arg Leu Arg Gly Thr Asn Ala Lys Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys Thr Thr
275 280 285
Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro Asn Gln Ala Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Asn
565 570 575
Ile Asn Gly Thr Thr Ile Asn Met Gly Asn Phe Pro Lys Thr Val Asn
580 585 590
Asn Ser Ser Ser Glu Gly Tyr Arg Thr Val Ser Phe Ser Thr Pro Phe
595 600 605
Ser Phe Ser Asn Ala Gln Ser Ile Phe Arg Leu Gly Ile Gln Ala Phe
610 615 620
Ser Gly Val His Glu Ile His Val Asp Arg Ile Glu Phe Val Pro Ala
625 630 635 640
Glu Val Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala
645 650 655
Val Asn Ala Leu Phe Thr Ser Thr Asn Pro Lys Asp Met Lys Thr Tyr
660 665 670
Val Thr Glu Ser Gln Ile Asp Gln Val Phe Asn Leu Val Glu Cys Leu
675 680 685
Ser Asp Glu Val Cys Leu Asp Glu Lys Arg Glu Leu Phe Lys Lys Val
690 695 700
Lys Tyr
705
<210> 47
<211> 719
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0204
<400> 47
Met Lys Leu Lys Asn Pro Asp Lys His Gln Ser Phe Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ala Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Lys Asn Met Asn Asn Glu Asp Tyr Ile Arg Met Ser Glu His
35 40 45
Glu Ser Ile Asp Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Ala Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Lys Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Ser Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Ser Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Ala Glu Arg Thr Ser Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Ser
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Lys Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Met Ile Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr His Met Tyr Pro Ile Lys Thr Thr
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asn Ala Ile Gly Thr Val His
290 295 300
Pro His Pro Ser Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Arg Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Ala Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Val Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu His Asp Phe Glu Lys Ala
645 650 655
Gln Glu Glu Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Gly Gly Leu
660 665 670
Lys Thr Asn Val Thr Glu Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asn Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Leu His Leu Gly Arg Asn Met
705 710 715
<210> 48
<211> 625
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0235
<400> 48
Met Arg Asn Ala Ser Lys Glu Val Lys Ile Leu Arg Thr Arg Gln Tyr
1 5 10 15
Glu Lys Asp Ser Ala Met Val Tyr Ala Met Glu Asp Gln Pro Leu Ser
20 25 30
Phe Gly Gly Val Val Glu Ile Ser Gly Lys Ile Gly Leu Gly Val Val
35 40 45
Lys Thr Val Ile Ser Ser Ile Thr Arg Arg Gly Arg Asp Asp Glu Ile
50 55 60
Ala Gly Arg Ile Leu Ser Asp Val Tyr Gly Val Leu Trp Ser Asn Arg
65 70 75 80
Lys Gly Tyr Trp Asn Glu Met Ile Glu Ala Val Glu Thr Leu Ile Arg
85 90 95
His Asp Ile Asn Glu Asn Val Lys Asn Asn Thr Leu Ala Val Leu Thr
100 105 110
Asp Ile Arg Asn Ala Leu Leu Leu Tyr Gln Gln Ala Thr Glu Ala Trp
115 120 125
Gln Asn Asn Arg Thr Asp Pro Gln Leu Gln Glu Arg Ile Arg Asn Gln
130 135 140
Phe Ile Ala Thr Asn Thr Phe Ile Glu Phe Ala Met Pro Ser Phe Ile
145 150 155 160
Val Pro His Tyr Glu Val Ile Leu Leu Pro Ile Phe Ala Gln Val Ala
165 170 175
Asn Phe His Leu Leu Leu Leu Arg Asp Ile Ala Ile Phe Gly Leu Glu
180 185 190
Trp Arg Met Ser Lys Ala Glu Ile Asp Asp Tyr Tyr Phe Ala Asn Thr
195 200 205
Gly Leu Thr Gly Leu Thr Ser Lys Tyr Thr Ser His Cys Val Lys Trp
210 215 220
Tyr Cys Glu Gly Leu Cys Ile Ala Thr Asn Val Asp Leu Gly Gln Tyr
225 230 235 240
Pro Glu Phe Tyr Gln Leu Asp Lys Trp Asn Ala Met Asn Asp Phe Arg
245 250 255
Arg Glu Met Thr Phe Met Val Leu Asp Ile Ile Ala Leu Trp Pro Thr
260 265 270
Tyr Asp Pro Ile Arg Tyr Pro Leu Gly Ile Lys Thr Glu Leu Thr Arg
275 280 285
Glu Val Phe Thr Pro Leu Leu Gly Ile Asn Pro Asn Ser Ser Trp Leu
290 295 300
Ile His Thr Met Glu Glu Ile Glu Ala Lys Leu Thr Phe Leu Ser Pro
305 310 315 320
Phe Leu Ser Trp Ile Ser Phe Glu Gln Leu Val Lys Gln Gly Asp Gly
325 330 335
Ile Ser Thr Phe Thr Asp Trp Gly Ser Phe Thr Leu Ser Asn Thr Met
340 345 350
Leu Pro Leu Ser Tyr Ile Leu Gly Gly Ala Gly Ser Gly Thr Gly Glu
355 360 365
Ser Thr Asn Ile Pro Ile Lys Ser Glu Asn Tyr Asp Val Tyr Lys Val
370 375 380
Leu Val Gly Thr Asp Tyr Ser His Pro Ser Asn Val Pro Ile Arg Lys
385 390 395 400
Leu Glu Tyr Tyr Cys Thr Asn Gly Thr Ile Glu Asn Val Ile Thr Ala
405 410 415
Gly Thr Gly Thr Thr Asn Ala Leu Phe Glu Leu Pro Asn Asn Gly Cys
420 425 430
Ile Asp Tyr Ser His Arg Val Ser Arg Leu Ser Cys Ser Asn Val Glu
435 440 445
Val Tyr Glu Trp Glu Gly Gly Pro Lys Tyr Ala Leu Lys Asn Ile Ala
450 455 460
Tyr Gly Trp Thr His Ile Ser Val Asp Ser Lys Asn Thr Leu Ser Ala
465 470 475 480
Asn Val Ile Thr Gln Ile Pro Ala Arg Lys Gly Tyr Ser Ser Ser Glu
485 490 495
Ser Asn Pro Ser Ile Ala Gly Pro Tyr Phe Thr Gly Gly Asp Leu Ile
500 505 510
Ala Leu Pro Pro Asn Gly Ala Gln Leu Gln Met Arg Val Thr Pro Pro
515 520 525
Val Ser Ser Cys Thr Thr Asn Tyr Cys Val Arg Leu Arg Tyr Ala Ser
530 535 540
Ser Gly Asn Thr Asn Ile Tyr Val Glu Arg Val Leu Pro Ser Gly Asp
545 550 555 560
Thr Tyr Gly Glu Thr His Asp Val Pro Ala Thr Tyr Tyr Gly Gly Ser
565 570 575
Leu Ser Tyr Ser Ser Phe Ala Tyr Val Val Asn Leu Thr Ala Met Phe
580 585 590
Glu Gly Val Asn Val Glu Ile Lys Ile Lys Asn Ile Gly Ser Ser Gln
595 600 605
Ile Ile Leu Asp Lys Leu Glu Phe Leu Pro Ile Lys Glu Ser Leu Lys
610 615 620
Glu
625
<210> 49
<211> 715
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0645
<400> 49
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Tyr Ser Ser Asn Glu
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asn Lys Thr Asp Ile Glu Leu Lys Asn
20 25 30
Met Asp Asn Glu Asp Tyr Ile Arg Val Ser Glu His Glu Ser Ile Asn
35 40 45
Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly
50 55 60
Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln
85 90 95
Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile Asn Gln Lys Ile
100 105 110
Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu Lys Gly Leu Gly
115 120 125
Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser Trp Val Glu Asn
130 135 140
Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Gly Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe Ala Val Ser Gly
165 170 175
Glu Glu Val Pro Leu Leu Pro Ile Tyr Val Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys Glu Trp Gly Leu
195 200 205
Ser Pro Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln Val Asp Arg Thr
210 215 220
Arg Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg Tyr Asn Gln Phe
245 250 255
Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Ile Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Ile Val Tyr Pro Ile Lys Thr Thr Ser Gln Leu Thr
275 280 285
Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His Pro His Ala Ser
290 295 300
Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu
325 330 335
Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Met Trp Gly Gly His Arg Leu Glu Ser Arg Pro Ile Gly Gly
355 360 365
Ala Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Trp
385 390 395 400
Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg
405 410 415
Val Asp Phe His Trp Lys Tyr Pro Thr Leu Pro Ile Ala Ser Asp Asn
420 425 430
Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln Leu Gln Asp Ser
435 440 445
Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Ala Ser His Val
465 470 475 480
Lys Ala Leu Val Tyr Ser Trp Thr His Ser Ser Ala Asn Arg Thr Asn
485 490 495
Thr Ile Glu Ala Asn Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe
500 505 510
Asn Leu Pro Ser Gly Ala Thr Val Val Arg Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe Gly Asp Ile Arg
530 535 540
Val Thr Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser Ile Asn Gly Arg
565 570 575
Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn Arg Glu Asp Asn
580 585 590
Leu Asn Tyr Arg Thr Phe Arg Thr Ala Gly Phe Thr Thr Pro Phe Ser
595 600 605
Phe Ser Asp Thr Gln Ser Thr Phe Thr Ile Gly Ala Trp Ser Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu
625 630 635 640
Val Ala His Glu Glu Asn Tyr Asp Phe Glu Lys Val Gln Glu Glu Val
645 650 655
Thr Ala Leu Phe Thr Pro Thr Asn Pro Arg Gly Leu Lys Thr Asn Val
660 665 670
Thr Asp Tyr Asp Ile Asp Gln Val Leu Asn Leu Val Glu Ser Leu Ser
675 680 685
Asp Glu Phe Tyr Val Asp Glu Lys Arg Glu Leu Leu Glu Leu Val Lys
690 695 700
Tyr Ala Lys Gln Leu Asn Ile Asp Arg Asn Met
705 710 715
<210> 50
<211> 715
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT645-2
<400> 50
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Tyr Ser Ser Asn Glu
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asn Lys Thr Asp Ile Glu Leu Lys Asn
20 25 30
Met Asp Asn Glu Asp Tyr Leu Arg Val Ser Glu His Glu Ser Ile Asn
35 40 45
Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly
50 55 60
Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln
85 90 95
Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile Asn Gln Lys Ile
100 105 110
Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu Lys Gly Leu Gly
115 120 125
Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser Trp Val Glu Asn
130 135 140
Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Gly Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe Ala Val Ser Gly
165 170 175
Glu Glu Val Pro Leu Leu Pro Ile Tyr Val Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys Glu Trp Gly Leu
195 200 205
Ser Pro Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln Val Asp Arg Thr
210 215 220
Arg Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg Tyr Asn Gln Phe
245 250 255
Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Ile Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Ile Val Tyr Pro Ile Lys Thr Thr Ser Gln Leu Thr
275 280 285
Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His Pro His Ala Ser
290 295 300
Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu
325 330 335
Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Met Trp Gly Gly His Arg Leu Glu Ser Arg Pro Ile Gly Gly
355 360 365
Ala Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Trp
385 390 395 400
Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg
405 410 415
Val Asp Phe His Trp Lys Tyr Pro Thr Leu Pro Ile Ala Ser Asp Asn
420 425 430
Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln Leu Gln Asp Ser
435 440 445
Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Ala Ser His Val
465 470 475 480
Lys Ala Leu Val Tyr Ser Trp Thr His Ser Ser Ala Asn Arg Thr Asn
485 490 495
Thr Ile Glu Ala Asn Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe
500 505 510
Asn Leu Pro Ser Gly Ala Thr Val Val Arg Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe Gly Asp Ile Arg
530 535 540
Val Thr Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser Ile Asn Gly Arg
565 570 575
Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn Arg Glu Asp Asn
580 585 590
Leu Asn Tyr Arg Thr Phe Arg Thr Ala Gly Phe Thr Thr Pro Phe Ser
595 600 605
Phe Ser Asp Thr Gln Ser Thr Phe Thr Ile Gly Ala Trp Ser Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu
625 630 635 640
Val Ala His Glu Glu Asn Tyr Asp Phe Glu Lys Val Gln Glu Glu Val
645 650 655
Thr Ala Leu Phe Thr Pro Thr Asn Pro Arg Gly Leu Lys Thr Asn Val
660 665 670
Thr Asp Tyr Asp Ile Asp Gln Val Leu Asn Leu Val Glu Ser Leu Ser
675 680 685
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Leu Glu Ile Val Lys
690 695 700
Tyr Ala Lys Gln Leu Asn Ile Glu Arg Asn Met
705 710 715
<210> 51
<211> 683
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT645-3
<400> 51
Met Asp Asn Glu Asp Tyr Leu Arg Val Ser Glu His Glu Ser Ile Asn
1 5 10 15
Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly
20 25 30
Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
35 40 45
Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln
50 55 60
Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile Asn Gln Lys Ile
65 70 75 80
Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu Lys Gly Leu Gly
85 90 95
Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser Trp Val Glu Asn
100 105 110
Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Gly Gln Tyr Ile Ala
115 120 125
Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe Ala Val Ser Gly
130 135 140
Glu Glu Val Pro Leu Leu Pro Ile Tyr Val Gln Ala Ala Asn Leu His
145 150 155 160
Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys Glu Trp Gly Leu
165 170 175
Ser Pro Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln Val Asp Arg Thr
180 185 190
Arg Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Asn Thr Gly Leu Asn
195 200 205
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg Tyr Asn Gln Phe
210 215 220
Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Ile Ala Leu Phe Pro
225 230 235 240
Ser Tyr Asp Thr Ile Val Tyr Pro Ile Lys Thr Thr Ser Gln Leu Thr
245 250 255
Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His Pro His Ala Ser
260 265 270
Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala
275 280 285
Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu
290 295 300
Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr
305 310 315 320
Met Asn Met Trp Gly Gly His Arg Leu Glu Ser Arg Pro Ile Gly Gly
325 330 335
Ala Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro
340 345 350
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Trp
355 360 365
Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg
370 375 380
Val Asp Phe His Trp Lys Tyr Pro Thr Leu Pro Ile Ala Ser Asp Asn
385 390 395 400
Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln Leu Gln Asp Ser
405 410 415
Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro Asn Tyr Glu Ser
420 425 430
Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Ala Ser His Val
435 440 445
Lys Ala Leu Val Tyr Ser Trp Thr His Ser Ser Ala Asn Arg Thr Asn
450 455 460
Thr Ile Glu Ala Asn Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe
465 470 475 480
Asn Leu Pro Ser Gly Ala Thr Val Val Arg Gly Pro Gly Phe Thr Gly
485 490 495
Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe Gly Asp Ile Arg
500 505 510
Val Thr Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg
515 520 525
Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser Ile Asn Gly Arg
530 535 540
Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn Arg Glu Asp Asn
545 550 555 560
Leu Asn Tyr Arg Thr Phe Arg Thr Ala Gly Phe Thr Thr Pro Phe Ser
565 570 575
Phe Ser Asp Thr Gln Ser Thr Phe Thr Ile Gly Ala Trp Ser Phe Ser
580 585 590
Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu
595 600 605
Val Ala His Glu Glu Asn Tyr Asp Phe Glu Lys Val Gln Glu Glu Val
610 615 620
Thr Ala Leu Phe Thr Pro Thr Asn Pro Arg Gly Leu Lys Thr Asn Val
625 630 635 640
Thr Asp Tyr Asp Ile Asp Gln Val Leu Asn Leu Val Glu Ser Leu Ser
645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Leu Glu Ile Val Lys
660 665 670
Tyr Ala Lys Gln Leu Asn Ile Glu Arg Asn Met
675 680
<210> 52
<211> 616
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT0727
<400> 52
Met Leu Arg Thr Arg Gln Tyr Lys Lys Gly Pro Glu Met Val Tyr Thr
1 5 10 15
Gly Arg Glu Gln Thr Leu Pro Phe Glu Glu Val Val Lys Ile Ser Gly
20 25 30
Lys Ile Gly Ile Gly Val Val Lys Thr Val Ile Thr Ser Ile Ile Arg
35 40 45
Cys Gly Arg Asp Asn Glu Ile Ala Gly Arg Ile Leu Ser Asp Val Tyr
50 55 60
Ser Val Leu Trp Ser Thr Pro Lys Gly Tyr Trp Ala Glu Met Ile Glu
65 70 75 80
Ala Val Glu Thr Leu Ile Gln His Glu Ile Ser Glu Asn Ile Arg Asn
85 90 95
Asn Ala Phe Ala Val Leu Thr Asp Val Arg Asn Ala Leu Leu Leu Tyr
100 105 110
Gln Gln Ala Ala Glu Glu Trp Gln Ser Asn Arg Thr Asp Pro Gln Leu
115 120 125
Gln Glu Arg Val Arg Asn Gln Phe Ile Ala Thr Asn Thr Leu Ile Glu
130 135 140
Phe Ala Met Pro Ser Phe Thr Val Pro His Tyr Glu Val Ile Leu Leu
145 150 155 160
Pro Ile Phe Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp
165 170 175
Val Glu Ile Phe Gly Leu Glu Trp Gly Met Ser Lys Ala Glu Ile Asp
180 185 190
Asp Tyr Tyr Phe Ala Asn Ser Gly Leu Thr Gly Leu Thr Gln Lys Tyr
195 200 205
Thr Asn His Ser Val Lys Trp Tyr Arg Glu Gly Leu Cys Ile Ala Thr
210 215 220
Asn Ile Asp Leu Gly Gln Phe Pro Glu Phe Tyr Gln Leu Asp Lys Trp
225 230 235 240
Asn Ala Met Asn Asp Phe Arg Arg Glu Met Thr Phe Met Val Leu Asp
245 250 255
Ile Ile Ala Leu Trp Pro Thr Tyr Asp Pro Ile Arg Tyr Pro Leu Gly
260 265 270
Ile Lys Thr Glu Leu Thr Arg Glu Val Phe Thr Pro Leu Leu Gly Ile
275 280 285
Asn Pro Asn Ser Ser Trp Leu Ile His Thr Met Glu Glu Ile Glu Ala
290 295 300
Lys Leu Thr Phe Leu Ser Pro Phe Leu Ser Trp Ile Ser Phe Glu Gln
305 310 315 320
Leu Val Lys Gln Gly Asp Gly Ile Ala Thr Phe Thr Asp Trp Gly Asn
325 330 335
Phe Thr Leu Ser Asn Thr Met Leu Pro Leu Ser Tyr Ile Leu Gly Gly
340 345 350
Ala Gly Ser Gly Thr Gly Asp Ser Thr Asn Ile Pro Met Gln Ser Glu
355 360 365
Asn Tyr Asp Val Tyr Lys Val His Val Gly Thr Asp Tyr Ser His Pro
370 375 380
Ser Asn Val Pro Ile Arg Lys Leu Glu Tyr Tyr Cys Thr Asn Gly Thr
385 390 395 400
Met Glu Lys Val Ile Thr Val Gly Thr Gly Arg Thr Asn Ala Leu Phe
405 410 415
Glu Leu Pro Asn Asn Gly Cys Val Asp Tyr Ser His Arg Ile Ser Arg
420 425 430
Leu Ser Cys Ser Asn Val Glu Val Tyr Glu Trp Glu Gly Gly Pro Arg
435 440 445
Tyr Ala Leu Lys Asn Ile Ala Tyr Gly Trp Thr His Ile Ser Val Asp
450 455 460
Ser Lys Asn Thr Leu Ser Ala Asn Ala Ile Thr Gln Ile Pro Ala Arg
465 470 475 480
Lys Gly Tyr Ala Ser Ser Gly Ser Asn Leu Ser Ile Ala Gly Pro Tyr
485 490 495
Phe Thr Gly Gly Asp Leu Ile Val Leu Pro Pro Asn Gly Ala Gln Leu
500 505 510
Gln Ile Arg Val Thr Pro Pro Val Ser Ser Lys Ser Lys Lys Tyr Cys
515 520 525
Val Arg Phe Arg Tyr Ala Ser Ser Gly Asn Thr Asn Ile Tyr Phe Glu
530 535 540
Arg Val Leu Ser Ser Gly Asp Thr Tyr Ser Glu Thr His Asp Val Pro
545 550 555 560
Ala Thr Tyr Pro Gly Gly Ala Leu Ser Tyr Ser Ser Phe Ala Tyr Val
565 570 575
Val Asn Leu Thr Ala Ile Phe Glu Gly Phe Asn Val Glu Ile Lys Ile
580 585 590
Lys Asn Ile Gly Ser Ser Gln Ile Ile Leu Asp Lys Ile Glu Phe Leu
595 600 605
Pro Leu Lys Glu Ser Leu Lys Glu
610 615
<210> 53
<211> 758
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1047
<400> 53
Met Asn Leu Cys Phe Tyr Leu Asn Ile Lys Asn Ala Leu Ser Tyr Thr
1 5 10 15
Ile Phe Trp Lys Cys Leu Phe Glu Gln Asp Phe Ile Arg Lys Leu Lys
20 25 30
Leu Ile Ile Asn Gly Val Ile Asn Met Lys Pro Lys Asn Gln Asn Lys
35 40 45
Cys Gln Ser Leu Tyr Ser Asn Gly Thr Phe Asp Met Asp Ser Lys Ala
50 55 60
Ser Leu Lys Asn Asp Lys Asn Met Glu Leu Gln Ser Ile Thr His Glu
65 70 75 80
Asp Cys Leu Arg Met Ser Glu His Glu Ser Ile Glu Pro Leu Val Ser
85 90 95
Ala Ser Val Ile Gln Asn Gly Ile Gly Ile Ala Gly Lys Ile Leu Gly
100 105 110
Thr Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser Leu Tyr Ser Phe
115 120 125
Ile Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln Trp Glu Ile Phe
130 135 140
Met Glu His Val Glu Glu Leu Ile Asp Gln Lys Ile Ser Ile Tyr Ala
145 150 155 160
Arg Asn Lys Ala Leu Thr Glu Leu Lys Gly Leu Gly Asp Ala Leu Ala
165 170 175
Val Tyr His Glu Ser Leu Glu Ser Trp Ile Glu Asn Arg Asn Asn Thr
180 185 190
Arg Ala Arg Ser Val Val Lys Ser Gln Tyr Ile Thr Leu Glu Leu Met
195 200 205
Phe Val Gln Gly Leu Pro Ser Phe Ala Val Ser Gly Glu Glu Val Leu
210 215 220
Leu Leu Pro Ile Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu
225 230 235 240
Arg Asp Ala Ser Ile Phe Gly Glu Glu Trp Gly Leu Ser Ala Ser Glu
245 250 255
Ile Ser Thr Phe Tyr Asn Arg Gln Val Glu Arg Val Asn Asp Tyr Thr
260 265 270
Asp Tyr Cys Val Lys Phe Tyr Asn Thr Gly Leu Asn Ser Ser Arg Gly
275 280 285
Thr Asp Ala Lys Ser Trp Ala Ser Tyr Asn Gln Phe Arg Lys Asp Met
290 295 300
Thr Leu Met Val Leu Asp Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr
305 310 315 320
His Val Tyr Pro Ile Lys Thr Asn Ser Gln Leu Thr Arg Asp Val Tyr
325 330 335
Thr Asp Ala Ile Gly Thr Val His Pro Asn Pro Ser Phe Ala Ser Thr
340 345 350
Thr Trp Tyr Asn Asn Asn Ala Pro Ala Phe Ser Ala Ile Glu Ala Ala
355 360 365
Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu Glu Val Thr Ile
370 375 380
Tyr Ser Ala Leu Ser Arg Trp Ser Asn Thr Gln Tyr Met Asn Ile Trp
385 390 395 400
Ser Gly His Ser Leu Lys Phe Arg Thr Ile Gly Gly Gly Leu Asn Thr
405 410 415
Ser Thr Gln Gly Ser Thr Asn Ser Thr Ile Ser Pro Val Thr Phe Gln
420 425 430
Phe Pro Ala Arg Asp Val Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn
435 440 445
Ile Phe Leu Thr Gln Pro Val Asn Gly Val Pro Ser Val Ser Phe His
450 455 460
Trp Ile Leu Pro Gly Ile Glu Val Gly Asn Ser Ile Thr Tyr Asn Pro
465 470 475 480
Gly Tyr Val Gly Val Gly Thr Gln Leu Gln Asp Ser Glu Thr Glu Leu
485 490 495
Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser Tyr Ser His Arg
500 505 510
Leu Ser His Ile Gly Leu Ile Thr Ala Ser His Val Arg Ala Leu Val
515 520 525
Tyr Ser Trp Thr His Arg Ser Ala Glu Arg Thr Asn Thr Ile Glu Pro
530 535 540
Asn Arg Ile Thr Gln Ile Pro Leu Val Lys Ala Leu Asn Leu Tyr Ser
545 550 555 560
Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
565 570 575
Arg Arg Thr Asn Thr Gly Ile Phe Gly Asp Ile Arg Val Asn Ile Thr
580 585 590
Ala Pro Leu Ser Gln Arg Tyr Arg Val Arg Val Arg Tyr Ala Ser Thr
595 600 605
Thr Asp Leu Glu Phe Tyr Thr Ser Val Asn Gly Thr Thr Ile Asn Met
610 615 620
Gly Asn Phe Ser Lys Thr Met Asp Ser Gly Asn Asn Leu Glu Phe Ser
625 630 635 640
Ser Phe Lys Thr Thr Gly Phe Ser Thr Pro Phe Ser Phe Ser Asn Ala
645 650 655
Gln Ser Thr Phe Thr Leu Gly Thr Met Asp Phe Ser Asn Gln Glu Val
660 665 670
Tyr Ile Asp Arg Ile Glu Phe Phe Pro Val Glu Val Thr Tyr Glu Glu
675 680 685
Glu Cys Asp Phe Glu Lys Ala Gln Glu Ala Val Thr Ala Leu Phe Thr
690 695 700
Pro Lys Asn Pro Lys Gly Leu Arg Met Asn Val Thr Asp Tyr His Ile
705 710 715 720
Asp Gln Ala Ser Asn Leu Val Glu Gly Leu Ser Asp Glu Ser Tyr Leu
725 730 735
Asp Glu Lys Arg Glu Leu Phe Glu Lys Val Glu Tyr Val Lys Gln Leu
740 745 750
Asn Ile Glu Arg Asn Ile
755
<210> 54
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1280
<400> 54
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Phe Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Gln Asn Ile Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Asn Val Glu Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Val Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Asn Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Asp Ser Leu Glu Ser
130 135 140
Trp Val Gly Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Ser Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Ala Gly Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Ser
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Gln Met Tyr Pro Ile Lys Thr Thr
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro His Pro Ser Phe Thr Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Val Arg Asn Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Ala Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Lys Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe
610 615 620
Ser Ala Thr Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg
625 630 635 640
Thr Val Gly Phe Thr Thr Pro Phe Ser Phe Leu Asp Val Gln Ser Thr
645 650 655
Phe Thr Ile Gly Ala Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile
660 665 670
Asp Arg Ile Glu Phe Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr
675 680 685
Asp Phe Glu Lys Ala Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr
690 695 700
Asn Pro Arg Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln
705 710 715 720
Ala Ser Asn Leu Ala Glu Ser Leu Ser Asp Val Leu Phe Arg
725 730
<210> 55
<211> 595
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1555
<400> 55
Met Asp Leu Ser Pro Asp Ala Arg Ile Glu Asp Ser Leu Cys Val Ala
1 5 10 15
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
20 25 30
Gly Ile Ser Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
35 40 45
Ala Gly Gln Leu Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
50 55 60
Pro Ser Gly Arg Asp Pro Trp Glu Ile Phe Met Glu His Val Glu Gln
65 70 75 80
Ile Val Arg Gln Gln Ile Thr Asp Ser Val Arg Asp Thr Ala Ile Ala
85 90 95
Arg Leu Glu Gly Leu Gly Arg Gly Tyr Arg Ser Tyr Gln Gln Ala Leu
100 105 110
Glu Thr Trp Leu Asp Asn Arg Asn Asp Ala Arg Ser Arg Ser Ile Ile
115 120 125
Arg Glu Arg Tyr Ile Ala Leu Glu Leu Asp Ile Thr Thr Ala Ile Pro
130 135 140
Leu Phe Ser Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
145 150 155 160
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe
165 170 175
Gly Lys Glu Trp Gly Leu Ser Ala Ser Glu Ile Ser Thr Phe Tyr Asn
180 185 190
Arg Gln Val Glu Arg Thr Arg Asp Tyr Ser Asp His Cys Val Lys Trp
195 200 205
Tyr Asn Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Lys Ser Trp
210 215 220
Val Arg Tyr Asn Gln Phe Arg Lys Asp Met Thr Leu Met Val Leu Asp
225 230 235 240
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys
245 250 255
Thr Thr Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr
260 265 270
Val His Pro Asn Gln Ala Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn
275 280 285
Ala Pro Ser Phe Ser Thr Ile Glu Ala Ala Val Val Arg Asn Pro His
290 295 300
Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg
305 310 315 320
Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu
325 330 335
Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr
340 345 350
Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val
355 360 365
Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro
370 375 380
Val Asn Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His
385 390 395 400
Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly
405 410 415
Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly
420 425 430
Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu
435 440 445
Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg
450 455 460
Ser Ala Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile
465 470 475 480
Pro Leu Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ala Val Val Arg
485 490 495
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Gln Arg Thr Asn Thr Gly
500 505 510
Thr Phe Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg
515 520 525
Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Val Glu Phe His
530 535 540
Thr Ser Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr
545 550 555 560
Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly
565 570 575
Phe Thr Thr Pro Phe Ser Leu Ser Asp Val Gln Ser Thr Phe Thr Ile
580 585 590
Gly Ala Trp
595
<210> 56
<211> 679
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1559
<400> 56
Met Asn Leu Ser Thr Asp Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala
1 5 10 15
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
20 25 30
Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
35 40 45
Ala Gly Gln Ile Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
50 55 60
Pro Arg Gly Arg Asp Pro Trp Glu Ile Phe Leu Glu His Val Glu Gln
65 70 75 80
Leu Ile Arg Gln Gln Val Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala
85 90 95
Arg Leu Gln Gly Leu Gly Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu
100 105 110
Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala Arg Thr Arg Ser Val Leu
115 120 125
Tyr Thr Gln Tyr Ile Ala Leu Glu Leu Asp Phe Leu Asn Ala Met Pro
130 135 140
Leu Phe Ala Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
145 150 155 160
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe
165 170 175
Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu
180 185 190
Arg Gln Val Glu Lys Thr Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp
195 200 205
Tyr Asn Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp
210 215 220
Leu Arg Tyr Asn Gln Phe Arg Arg Asp Leu Thr Leu Gly Val Leu Asp
225 230 235 240
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn
245 250 255
Thr Ser Ala Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg
260 265 270
Thr Asn Ala Pro Ser Gly Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn
275 280 285
Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His
290 295 300
Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg
305 310 315 320
Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu
325 330 335
Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr
340 345 350
Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Ile
355 360 365
Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro
370 375 380
Val Asn Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His
385 390 395 400
Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly
405 410 415
Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly
420 425 430
Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu
435 440 445
Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg
450 455 460
Ser Ala Asp Arg Thr Asn Thr Ile His Ser Asp Ser Ile Thr Gln Ile
465 470 475 480
Pro Leu Val Lys Ala His Thr Leu Gln Ser Gly Thr Thr Val Val Lys
485 490 495
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly
500 505 510
Pro Phe Ala Phe Ser Asn Val Asn Leu Asp Trp Asn Leu Ser Gln Arg
515 520 525
Tyr Arg Ala Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Met Tyr
530 535 540
Val Thr Ile Ala Gly Glu Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr
545 550 555 560
Met Asn Thr Gly Asp Pro Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr
565 570 575
Ile Asp Thr Ala Phe Thr Phe Pro Thr Lys Ala Ser Ser Leu Thr Val
580 585 590
Gly Ala Asp Thr Phe Ser Ser Gly Asn Glu Val Tyr Val Asp Arg Phe
595 600 605
Glu Leu Ile Pro Val Thr Ala Thr Leu Glu Ala Val Thr Asp Leu Glu
610 615 620
Arg Ala Gln Lys Ala Val His Glu Leu Phe Thr Ser Thr Asn Pro Gly
625 630 635 640
Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn
645 650 655
Leu Ala Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu
660 665 670
Leu Phe Glu Ile Ala Lys Tyr
675
<210> 57
<211> 679
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1563]
<400> 57
Met Asn Leu Ser Thr Asp Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala
1 5 10 15
Glu Gly Asn Asn Ile Asp Pro Phe Val Ser Ala Ser Thr Val Gln Thr
20 25 30
Gly Ile Asn Ile Ala Gly Arg Ile Leu Gly Val Leu Gly Val Pro Phe
35 40 45
Ala Gly Gln Ile Ala Ser Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp
50 55 60
Pro Arg Gly Arg Asp Pro Trp Glu Ile Phe Leu Glu His Val Glu Gln
65 70 75 80
Leu Ile Arg Gln Gln Val Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala
85 90 95
Arg Leu Gln Gly Leu Gly Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu
100 105 110
Glu Asp Trp Leu Glu Asn Arg Asp Asp Ala Arg Thr Arg Ser Val Leu
115 120 125
Tyr Thr Gln Tyr Ile Ala Leu Glu Leu Asp Phe Leu Asn Ala Met Pro
130 135 140
Leu Phe Ala Ile Arg Asn Gln Glu Val Pro Leu Leu Met Val Tyr Ala
145 150 155 160
Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe
165 170 175
Gly Ser Glu Phe Gly Leu Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu
180 185 190
Arg Gln Val Glu Lys Thr Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp
195 200 205
Tyr Asn Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp
210 215 220
Leu Arg Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp
225 230 235 240
Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn
245 250 255
Thr Ser Ala Gln Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg
260 265 270
Thr Asn Ala Pro Ser Gly Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn
275 280 285
Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Val Val Arg Asn Pro His
290 295 300
Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg
305 310 315 320
Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu
325 330 335
Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr
340 345 350
Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val
355 360 365
Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro
370 375 380
Val Asn Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His
385 390 395 400
Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly
405 410 415
Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Ala Thr Gly
420 425 430
Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu
435 440 445
Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg
450 455 460
Ser Ala Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile
465 470 475 480
Pro Leu Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg
485 490 495
Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly
500 505 510
Thr Phe Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg
515 520 525
Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His
530 535 540
Thr Ser Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr
545 550 555 560
Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly
565 570 575
Phe Thr Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile
580 585 590
Gly Ala Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile
595 600 605
Glu Phe Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu
610 615 620
Lys Ala Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg
625 630 635 640
Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn
645 650 655
Leu Val Glu Ser Ile Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu
660 665 670
Leu Phe Glu Ile Ala Lys Tyr
675
<210> 58
<211> 705
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1571
<400> 58
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asp Leu Ser Leu Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asn
35 40 45
Pro Leu Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Leu Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Ser Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asn Thr Ala Ile Ala Arg Leu Glu Gly Leu Gly
115 120 125
Arg Gly Tyr Arg Ser Tyr Gln Gln Ala Leu Glu Thr Trp Leu Asp Asn
130 135 140
Arg Asn Asp Ala Arg Ser Arg Ser Ile Ile Leu Glu Arg Tyr Val Ala
145 150 155 160
Leu Glu Leu Asp Ile Thr Thr Ala Ile Pro Leu Phe Arg Ile Arg Asn
165 170 175
Glu Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Trp Gly Met
195 200 205
Ala Ser Ser Asp Val Asn Gln Tyr Tyr Gln Glu Gln Ile Arg Tyr Thr
210 215 220
Glu Glu Tyr Ser Asn His Cys Val Gln Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ser Ala Val Val Arg Asn Pro His Leu Leu Asp Phe Leu Glu
325 330 335
Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Met Trp Gly Gly His Arg Leu Glu Phe Arg Thr Ile Gly Gly
355 360 365
Val Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Leu
385 390 395 400
Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg
405 410 415
Val Asp Phe His Trp Lys Phe Ala Thr Leu Pro Ile Ala Ser Asp Asn
420 425 430
Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln Leu Gln Asp Ser
435 440 445
Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Ala Ser His Val
465 470 475 480
Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe
500 505 510
Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe Gly Asp Ile Arg
530 535 540
Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser Ile Asn Gly Lys
565 570 575
Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn Arg Gly Glu Asp
580 585 590
Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr Thr Pro Phe Ser
595 600 605
Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala Trp Asn Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu
625 630 635 640
Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu Lys Ala Gln Glu Lys Val
645 650 655
Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu Lys Thr Asp Val
660 665 670
Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Ser Leu Ser
675 680 685
Asp Glu Phe Tyr Ile Asp Glu Lys Arg Glu Leu Phe Glu Leu Val Lys
690 695 700
Tyr
705
<210> 59
<211> 706
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT1633
<400> 59
Met Lys Leu Lys Asn Gln Asn Met His Gln Ser Leu Ser Ser Asn Ala
1 5 10 15
Thr Val Asp Lys Ser Phe Thr Asp Ser Leu Glu His Asn Thr Asn Met
20 25 30
Glu Leu Gln Asn Ser Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Ser Ile Glu Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Ala Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Glu Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Asn
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Glu Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Thr Arg Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Asn
225 230 235 240
Thr Gly Leu Asn Arg Leu Arg Gly Thr Asn Ala Lys Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys Thr Thr
275 280 285
Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro Asn Gln Ala Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Asn
565 570 575
Ile Asn Gly Thr Thr Ile Asn Met Gly Asn Phe Pro Lys Thr Val Asn
580 585 590
Asn Ser Ser Ser Glu Gly Tyr Arg Thr Val Ser Phe Ser Thr Pro Phe
595 600 605
Ser Phe Ser Asn Ala Gln Ser Ile Phe Arg Leu Gly Ile Gln Ala Phe
610 615 620
Ser Gly Val His Glu Ile His Val Asp Arg Ile Glu Phe Val Pro Ala
625 630 635 640
Glu Val Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Ala
645 650 655
Val Asn Ala Leu Phe Thr Ser Thr Asn Pro Lys Asp Met Lys Thr Tyr
660 665 670
Val Thr Glu Ser Gln Ile Asp Gln Val Phe Asn Leu Val Glu Cys Ile
675 680 685
Ser Asp Glu Val Cys Leu Asp Glu Lys Arg Glu Ile Phe Lys Lys Val
690 695 700
Lys Tyr
705
<210> 60
<211> 719
<212> PRT
<213> 苏云金芽孢杆菌
<400> 60
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Phe Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Gln Asn Ile Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Asn Val Glu Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Val Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Asn Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Asp Ser Leu Glu Ser
130 135 140
Trp Val Gly Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Ser Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Ala Gly Asp Tyr Ser Tyr His Cys Val Lys Trp Tyr Ser
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Gln Met Tyr Pro Ile Lys Thr Thr
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro His Pro Ser Phe Thr Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Val Arg Asn Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Ile Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Ala Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Leu Asp Val Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu Lys Ala
645 650 655
Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu
660 665 670
Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Leu His Ile Glu Arg Asn Met
705 710 715
<210> 61
<211> 719
<212> PRT
<213> 苏云金芽孢杆菌
<400> 61
Met Lys Leu Lys Asn Pro Asp Lys His Gln Ser Leu Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ala Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Lys Asn Met Asn Asn Glu Asp Tyr Leu Arg Met Ser Glu His
35 40 45
Glu Ser Ile Asp Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Ile Ile
100 105 110
Asn Gln Lys Ile Leu Thr Tyr Ala Arg Asn Lys Ala Leu Ser Asp Leu
115 120 125
Arg Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Val Glu Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Asn
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Ala Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Thr Arg Asp Tyr Ser Asp His Cys Ile Lys Trp Tyr Asn
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Lys Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys Thr Thr
275 280 285
Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro Asn Gln Ala Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Arg Leu Glu Ser Arg
355 360 365
Pro Ile Gly Gly Ala Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Pro Thr Leu Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Ile Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu Lys Ala
645 650 655
Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu
660 665 670
Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Ile His Ile Glu Arg Asn Met
705 710 715
<210> 62
<211> 719
<212> PRT
<213> 苏云金芽孢杆菌
<400> 62
Met Lys Leu Lys Asn Pro Asp Lys His Gln Thr Leu Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ala Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Lys Asn Met Asn Asn Glu Asp Tyr Leu Arg Met Ser Glu His
35 40 45
Glu Ser Ile Asp Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Pro Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Ala Ile Ile
100 105 110
Asn Arg Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Thr Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Val Gly Asn Arg Asn Asn Thr Arg Ala Arg Ser Val Val Lys Asn
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Glu Lys
195 200 205
Asn Gly Gly Leu Ser Ala Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Thr Arg Asp Tyr Ser Tyr His Cys Val Lys Trp Asn Asn
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Ala Thr Asn Gly Gln Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Ile Glu Leu Met Val Leu Asp Leu Val
260 265 270
Arg Val Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys Thr Thr
275 280 285
Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val Asp
290 295 300
Pro Asn Gln Ala Leu Arg Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Lys Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Arg Leu Glu Ser Arg
355 360 365
Pro Ile Gly Gly Ala Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Gln Phe Thr Ser Arg Asp Phe Tyr Arg
385 390 395 400
Thr Glu Ser Trp Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Pro Thr Leu Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Gly Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly His Ile Leu Arg Arg Thr Lys Ser Gly Thr Phe
530 535 540
Gly His Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Met Ser Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Gly Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu Lys Ala
645 650 655
Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu
660 665 670
Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asp Glu Leu Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Ile His Ile Glu Arg Asn Met
705 710 715
<210> 63
<211> 719
<212> PRT
<213> 苏云金芽孢杆菌
<400> 63
Met Lys Ser Lys Asn Gln Asn Met Tyr Arg Ser Phe Ser Ser Asn Ala
1 5 10 15
Thr Val Asp Lys Ser Phe Thr Asp Pro Leu Glu His Asn Thr Asn Met
20 25 30
Glu Leu Gln Asn Ser Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Ser Val Glu Pro Phe Val Ser Val Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Asn Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Val Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Ala Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Glu Asn Arg Asn Asn Thr Arg Val Arg Ser Val Val Lys Asn
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Glu Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Ser Ser Gln Thr Gln Glu Tyr Ser Asp Tyr Cys Ser Glu Trp Tyr Asn
225 230 235 240
Thr Gly Leu Asn Arg Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Arg Met Tyr Pro Ile Pro Thr Ser
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro Asn Ala Ser Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Thr Ile Glu Ala Ala Val Val Arg Asn Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Asn Ser Asp Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Pro Ser Gly Ala Ser Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Gln Arg Thr Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Leu Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Glu Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Ala Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Leu Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Leu Lys Lys Ala
645 650 655
Gln Asp Glu Ile Thr Ala Met Phe Thr Ser Thr Asn Leu Arg Arg Leu
660 665 670
Lys Thr Asn Val Thr Asp Cys His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Leu Asn Ile Glu Arg Asn Met
705 710 715
<210> 64
<211> 719
<212> PRT
<213> 苏云金芽孢杆菌
<400> 64
Met Lys Leu Lys Asn Pro Asp Lys His Gln Ser Leu Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ala Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Lys Asn Ile Asn His Glu Asp Phe Leu Arg Met Ser Glu His
35 40 45
Glu Ser Ile Asp Pro Phe Val Ser Ala Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Thr Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Ile Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Asp Gln Lys Ile Ser Thr Tyr Ala Arg Asn Ile Ala Leu Ala Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Lys Asn Arg Asn Asn Ala Arg Ala Thr Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Ala Leu Glu Leu Leu Phe Val Gln Lys Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Val Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Asn Ser Gln Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Thr Ser Asp Tyr Ser Asp His Cys Val Lys Trp Tyr Ser
225 230 235 240
Thr Gly Leu Asn Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Val Arg
245 250 255
Tyr Asn Gln Phe Arg Lys Asp Met Thr Leu Met Val Leu Asp Leu Ile
260 265 270
Ala Leu Phe Pro Ser Tyr Asp Thr Leu Val Tyr Pro Ile Lys Thr Thr
275 280 285
Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Ala Ile Gly Thr Val His
290 295 300
Pro Asn Ala Ser Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ser Ala Val Val Arg Asn Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Arg Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Val Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Val Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Ala Thr Leu Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Leu Gly Tyr Ala Gly Val Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile Glu Pro Asn Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala Phe Asn Leu Ser Ser Gly Ala Ala Val Val Arg Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
530 535 540
Gly Asp Ile Arg Val Asn Ile Asn Pro Pro Phe Ala Gln Arg Tyr Arg
545 550 555 560
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe His Thr Ser
565 570 575
Ile Asn Gly Lys Ala Ile Asn Gln Gly Asn Phe Ser Ala Thr Met Asn
580 585 590
Arg Gly Glu Asp Leu Asp Tyr Lys Thr Phe Arg Thr Val Gly Phe Thr
595 600 605
Thr Pro Phe Ser Phe Ser Asp Val Gln Ser Thr Phe Thr Ile Gly Ala
610 615 620
Trp Asn Phe Ser Ser Gly Asn Glu Val Tyr Ile Asp Arg Ile Glu Phe
625 630 635 640
Val Pro Val Glu Val Thr Tyr Glu Ala Glu Tyr Asp Phe Glu Lys Ala
645 650 655
Gln Glu Lys Val Thr Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu
660 665 670
Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Ile His Ile Glu Arg Asn Met
705 710 715
<210> 65
<211> 710
<212> PRT
<213> 苏云金芽孢杆菌
<220>
<221> 尚未归类的特征
<222> (200)..(200)
<223> Xaa可以是任何天然存在的氨基酸
<400> 65
Met Lys Ser Lys Asn Gln Asn Met His Gln Ser Leu Ser Asn Asn Ala
1 5 10 15
Thr Val Asp Lys Asn Phe Thr Gly Ser Leu Glu Asn Asn Thr Asn Thr
20 25 30
Glu Leu Gln Asn Phe Asn His Glu Gly Ile Glu Pro Phe Val Ser Val
35 40 45
Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly Lys Ile Leu Gly Asn
50 55 60
Leu Gly Val Pro Phe Ala Gly Gln Val Ala Ser Leu Tyr Ser Phe Ile
65 70 75 80
Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln Trp Glu Ile Phe Met
85 90 95
Glu His Val Glu Glu Leu Ile Asn Gln Lys Ile Ser Thr Tyr Ala Arg
100 105 110
Asn Lys Ala Leu Ala Asp Leu Lys Gly Leu Gly Asp Ala Leu Ala Val
115 120 125
Tyr His Glu Ser Leu Glu Ser Trp Ile Glu Asn Arg Asn Asn Thr Arg
130 135 140
Thr Arg Ser Val Val Lys Ser Gln Tyr Ile Thr Leu Glu Leu Met Phe
145 150 155 160
Val Gln Ser Leu Pro Ser Phe Ala Val Ser Gly Glu Glu Val Pro Leu
165 170 175
Leu Pro Ile Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg
180 185 190
Asp Ala Ser Ile Phe Gly Lys Xaa Trp Gly Leu Ser Asp Ser Glu Ile
195 200 205
Ser Thr Phe Tyr Asn Arg Gln Ser Gly Lys Ser Lys Glu Tyr Ser Asp
210 215 220
His Cys Val Lys Trp Tyr Asn Thr Gly Leu Asn Arg Leu Met Gly Asn
225 230 235 240
Asn Ala Glu Ser Trp Val Arg Tyr Asn Gln Phe Arg Arg Asp Met Thr
245 250 255
Leu Met Val Leu Asp Leu Val Ala Leu Phe Pro Ser Tyr Asp Thr Gln
260 265 270
Met Tyr Pro Ile Lys Thr Thr Ala Gln Leu Thr Arg Glu Val Tyr Thr
275 280 285
Asp Ala Ile Gly Thr Val His Pro His Pro Ser Phe Thr Ser Thr Thr
290 295 300
Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Thr Ile Glu Ala Ala Val
305 310 315 320
Val Arg Asn Pro His Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr
325 330 335
Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly
340 345 350
Gly His Lys Leu Glu Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser
355 360 365
Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe
370 375 380
Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu
385 390 395 400
Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg Val Asp Phe His Trp
405 410 415
Lys Phe Val Thr His Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly
420 425 430
Tyr Ala Gly Ile Gly Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro
435 440 445
Pro Glu Ala Thr Gly Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu
450 455 460
Ser His Ile Gly Leu Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr
465 470 475 480
Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn Thr Ile Glu Pro Asn
485 490 495
Ser Ile Thr Gln Ile Pro Leu Val Lys Ala Phe Asn Leu Ser Ser Gly
500 505 510
Ala Ala Val Val Arg Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg
515 520 525
Arg Lys Asn Thr Gly Thr Phe Gly Asp Ile Arg Val Asn Ile Asn Pro
530 535 540
Pro Phe Ala Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
545 550 555 560
Asp Leu Gln Phe His Thr Ser Ile Asn Gly Lys Ala Ile Asn Gln Gly
565 570 575
Asn Phe Ser Ala Thr Met Asn Arg Gly Glu Asp Leu Asp Tyr Lys Thr
580 585 590
Phe Arg Thr Val Gly Phe Thr Thr Pro Phe Ser Phe Ser Asp Val Gln
595 600 605
Ser Thr Phe Thr Ile Gly Ala Trp Asn Phe Ser Ser Gly Asn Glu Val
610 615 620
Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Glu Val Thr Tyr Glu Ala
625 630 635 640
Glu Tyr Asp Phe Glu Lys Ala Gln Glu Glu Val Thr Ala Leu Phe Thr
645 650 655
Ser Thr Asn Pro Arg Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile
660 665 670
Asp Gln Val Ser Asn Leu Val Glu Ser Leu Ser Asp Lys Phe Tyr Leu
675 680 685
Asp Glu Lys Arg Glu Leu Phe Glu Ile Val Lys Tyr Ala Lys Gln Leu
690 695 700
His Ile Glu Arg Asn Met
705 710
<210> 66
<211> 719
<212> PRT
<213> 苏云金芽孢杆菌
<400> 66
Met Lys Leu Lys Asn Gln Asp Lys His Gln Ser Phe Ser Ser Asn Ala
1 5 10 15
Lys Val Asp Lys Ile Ser Thr Asp Ser Leu Lys Asn Glu Thr Asp Ile
20 25 30
Glu Leu Gln Asn Ile Asn His Glu Asp Cys Leu Lys Met Ser Glu Tyr
35 40 45
Glu Asn Val Glu Pro Phe Val Ser Val Ser Thr Ile Gln Thr Gly Ile
50 55 60
Gly Ile Ala Gly Lys Ile Leu Gly Asn Leu Gly Val Pro Phe Ala Gly
65 70 75 80
Gln Val Ala Ser Leu Tyr Ser Phe Ile Leu Gly Glu Leu Trp Pro Lys
85 90 95
Gly Lys Ser Gln Trp Glu Ile Phe Met Glu His Val Glu Glu Leu Ile
100 105 110
Asn Gln Lys Ile Ser Thr Tyr Ala Arg Asn Lys Ala Leu Ala Asp Leu
115 120 125
Lys Gly Leu Gly Asp Ala Leu Ala Val Tyr His Glu Ser Leu Glu Ser
130 135 140
Trp Ile Lys Asn Arg Asn Asn Thr Arg Thr Arg Ser Val Val Lys Ser
145 150 155 160
Gln Tyr Ile Thr Leu Glu Leu Met Phe Val Gln Ser Leu Pro Ser Phe
165 170 175
Ala Val Ser Gly Glu Glu Val Pro Leu Leu Pro Ile Tyr Ala Gln Ala
180 185 190
Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Ser Ile Phe Gly Lys
195 200 205
Glu Trp Gly Leu Ser Asp Ser Glu Ile Ser Thr Phe Tyr Asn Arg Gln
210 215 220
Val Glu Arg Thr Ser Asp Tyr Ser Asp His Cys Thr Lys Trp Phe Asp
225 230 235 240
Thr Gly Leu Asn Arg Leu Lys Gly Ser Asn Ala Glu Ile Trp Val Lys
245 250 255
Tyr Asn Gln Phe Arg Arg Asp Met Thr Leu Met Val Leu Asp Leu Val
260 265 270
Ala Leu Phe Gln Ser Tyr Asp Thr His Met Tyr Pro Ile Lys Thr Thr
275 280 285
Ala Gln Leu Thr Arg Glu Val Tyr Thr Asn Ala Ile Gly Thr Val His
290 295 300
Pro His Pro Ser Phe Ala Ser Thr Thr Trp Tyr Asn Asn Asn Ala Pro
305 310 315 320
Ser Phe Ser Ala Ile Glu Ala Ala Val Ile Arg Ser Pro His Leu Leu
325 330 335
Asp Phe Leu Glu Gln Val Thr Ile Tyr Ser Leu Leu Ser Arg Trp Ser
340 345 350
Asn Thr Gln Tyr Met Asn Met Trp Gly Gly His Lys Leu Glu Phe Arg
355 360 365
Thr Ile Gly Gly Thr Leu Asn Thr Ser Thr Gln Gly Ser Thr Asn Thr
370 375 380
Ser Ile Asn Pro Val Thr Leu Pro Phe Thr Ser Arg Asp Ile Tyr Arg
385 390 395 400
Thr Glu Ser Leu Ala Gly Leu Asn Leu Phe Leu Thr Gln Pro Val Asn
405 410 415
Gly Val Pro Arg Val Asp Phe His Trp Lys Phe Val Thr His Pro Ile
420 425 430
Ala Ser Asp Asn Phe Tyr Tyr Pro Gly Tyr Ala Gly Ile Gly Thr Gln
435 440 445
Leu Gln Asp Ser Glu Asn Glu Leu Pro Pro Glu Thr Thr Gly Gln Pro
450 455 460
Asn Tyr Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser
465 470 475 480
Ala Ser His Val Lys Ala Leu Val Tyr Ser Trp Thr His Arg Ser Ala
485 490 495
Asp Arg Thr Asn Thr Ile His Ser Asp Ser Ile Thr Gln Ile Pro Leu
500 505 510
Val Lys Ala His Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro
515 520 525
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe
530 535 540
Ala Phe Ser Asn Val Asn Leu Asp Trp Asn Leu Ser Gln Arg Tyr Arg
545 550 555 560
Ala Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Met Tyr Val Thr
565 570 575
Ile Ala Gly Glu Arg Ile Phe Ala Gly Gln Phe Asn Lys Thr Met Asn
580 585 590
Thr Gly Asp Pro Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asp
595 600 605
Thr Ala Phe Thr Phe Pro Thr Lys Ala Ser Ser Leu Thr Val Gly Ala
610 615 620
Asp Thr Phe Ser Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu
625 630 635 640
Ile Pro Val Thr Ala Thr Leu Glu Ala Val Thr Asp Leu Glu Arg Ala
645 650 655
Gln Lys Ala Val His Glu Leu Phe Thr Ser Thr Asn Pro Gly Gly Leu
660 665 670
Lys Thr Asp Val Lys Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
675 680 685
Glu Ser Leu Ser Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Phe
690 695 700
Glu Ile Val Lys Tyr Ala Lys Gln Leu His Ile Glu Pro Asn Met
705 710 715

Claims (43)

1.一种核酸分子,所述核酸分子包含编码对鳞翅目有害生物有毒的Cry蛋白的核苷酸序列,其中所述核苷酸序列(a)与SEQ ID NO:1-11中任一项或其毒素编码片段具有至少80%到至少99%序列同一性;或者(b)编码包含如下氨基酸序列的Cry蛋白,所述氨基酸序列与SEQ ID NO:36-46中任一项或其毒素片段具有至少80%到至少99%序列同一性;或者(c)是(a)或(b)的组装的核苷酸序列;或者(d)是(a)、(b)或(c)的合成序列,所述合成序列已经进行密码子优化用于在转基因生物中表达。
2.如权利要求1所述的核酸分子,其中所述核苷酸序列包含SEQ ID NO:1-11中任一项或其毒素编码片段。
3.如权利要求1所述的核酸分子,其中所述Cry蛋白包含SEQ ID NO:36-59中任一项的氨基酸序列或其毒素片段。
4.如权利要求1所述的核酸分子,其中所述合成核苷酸序列包含SEQ ID NO:12-35中任一项或其毒素编码片段。
5.一种嵌合基因,所述嵌合基因包含可操作地连接至如权利要求1-4中任一项所述的核酸分子的异源启动子。
6.如权利要求5所述的嵌合基因,其中所述异源启动子是植物可表达型启动子。
7.如权利要求6所述的嵌合基因,其中所述植物可表达型启动子选自下组的启动子,该组由以下组成:泛素、夜香树属黄病毒、玉米TrpA、OsMADS 6、玉蜀黍H3组蛋白、噬菌体T3基因9 5'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基RuBP羧化酶、水稻肌动蛋白、水稻亲环蛋白、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
8.如权利要求5所述的嵌合基因,其中所述鳞翅目有害生物选自由以下组成的组:玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、欧洲玉米蛀虫(欧洲玉米螟)、以及秋黏虫(草地贪夜蛾)。
9.如权利要求5所述的嵌合基因,其中所述转基因生物是细菌。
10.一种Cry蛋白,并且任选地一种分离的Cry蛋白,所述Cry蛋白或分离的Cry蛋白是对鳞翅目有害生物有毒的,其中所述Cry蛋白或分离的Cry蛋白包含(a)与SEQ ID NO:36-46中任一项的氨基酸序列或其毒素片段具有至少80%到至少99%序列同一性的氨基酸序列;或者(b)由与SEQ ID NO:1-35中任一项的核苷酸序列或其毒素编码片段具有至少80%到至少99%序列同一性的核苷酸序列或组装的核苷酸序列编码的氨基酸序列。
11.如权利要求10所述的Cry蛋白,其中所述氨基酸序列包含SEQ ID NO:36-59中任一项或其毒素片段。
12.如权利要求10所述的Cry蛋白,其中所述氨基酸序列由包含SEQ ID NO:1-35中任一项的核苷酸序列或其毒素编码片段编码。
13.如权利要求10-12中任一项所述的Cry蛋白,其中所述鳞翅目有害生物选自由以下组成的组:欧洲玉米蛀虫(European corn borer)(ECB;欧洲玉米螟(Ostrinianubilalis))、黑色地老虎(black cutworm)(BCW;小地老虎(Agrotis ipsilon))、秋黏虫(fall armyworm)(FAW;草地贪夜蛾(Spodoptera frugiperda))、玉米穗蛾(corn earworm)(CEW;玉米穗虫(Helicoverpa zea))、大豆夜蛾(soybean looper)(SBL;大豆尺蠖(Pseudoplusia includens))、绒毛豆毛虫(velvetbean caterpillar)(黎豆夜蛾(Anticarsia gemmatalis))、烟夜蛾(tobacco budworm)(TBW;烟芽夜蛾(Heliothisvirescens))、南部粘虫(southern armyworm)(SAW;南部灰翅夜蛾(Spodopteraeridania))、考斯粘虫(cosmid armyworm)(CAW;考斯夜蛾(Spodoptera cosmioides))、亚洲玉米蛀虫(Asian corn borer)(ACB;亚洲玉米螟(Ostrinia furnacalis))、棉螟蛉(cotton bollworm)(CBW;棉铃虫(Helicoverpa armigera))、东方黏虫(Orientalarmyworm)(OAW;东方粘虫(Mythimna separate))。
14.一种分离的苏云金芽孢杆菌菌株,所述分离的苏云金芽孢杆菌菌株产生如权利要求11所述的Cry蛋白。
15.一种杀昆虫组合物,所述杀昆虫组合物包含如权利要求10所述的Cry蛋白和农业上可接受的载体。
16.如权利要求15所述的组合物,其中所述农业上可接受的载体选自由以下组成的组:粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。
17.如权利要求15所述的组合物,其中所述组合物通过脱水、冷冻干燥、均化、提取、过滤、离心、沉降或浓缩苏云金芽孢杆菌菌株的培养物而制备。
18.如权利要求17所述的组合物,其中所述苏云金芽孢杆菌菌株是如权利要求14所述的苏云金芽孢杆菌菌株。
19.如权利要求15所述的组合物,其中所述组合物包含产生所述Cry蛋白的转基因细菌细胞。
20.如权利要求15所述的组合物,所述组合物包含按重量计从约1%至约99%的Cry蛋白。
21.一种重组载体,所述重组载体包含如权利要求1所述的核酸分子或如权利要求5所述的嵌合基因。
22.一种转基因细菌细胞或植物细胞,所述转基因细菌细胞或植物细胞包含如权利要求21所述的重组载体。
23.如权利要求22所述的转基因细菌细胞,其中所述细菌细胞在芽孢杆菌属、梭菌属、致病杆菌属、发光杆菌属、巴斯德氏芽菌属、埃希氏菌属、假单胞菌属、欧文氏菌属、沙雷氏菌属、克雷伯菌属、沙门氏菌属、巴氏杆菌属、黄单胞菌属、链霉菌属、根瘤菌属、红假单胞菌属、嗜甲基菌属、土壤杆菌属、醋杆菌属、乳杆菌属、节杆菌属、固氮菌属、明串珠菌属或产碱杆菌属中。
24.如权利要求23所述的转基因芽孢杆菌属细胞,其中所述芽孢杆菌属细胞是苏云金芽孢杆菌细胞。
25.如权利要求22所述的转基因植物细胞,其中所述植物细胞是双子叶植物细胞或单子叶植物细胞。
26.如权利要求25所述的双子叶植物细胞,其中所述双子叶植物细胞是大豆细胞。
27.如权利要求25所述的单子叶植物细胞,其中所述单子叶植物细胞是玉蜀黍细胞。
28.一种转基因植物,所述转基因植物包含如权利要求25-27中任一项所述的转基因植物细胞。
29.如权利要求28所述的转基因植物,其中所述大豆植物表达包含SEQ ID NO:50或SEQID NO:51的突变型BT645蛋白。
30.一种收获产物,所述收获产物衍生自如权利要求28所述的转基因植物,其中所述收获产物包含所述蛋白。
31.一种加工产物,所述加工产物衍生自如权利要求30所述的收获产物,其中所述加工产物选自由以下组成的组:细粉、粗粉、油、以及淀粉、或从其衍生的产物。
32.一种产生对鳞翅目有害生物有毒的Cry蛋白的方法,所述方法包括:在如权利要求22所述的转基因细胞产生所述Cry蛋白的条件下培养所述转基因细胞。
33.如权利要求32所述的方法,其中所述转基因植物细胞在转基因植物中。
34.如权利要求33所述的方法,其中所述转基因植物是转基因玉蜀黍植物或转基因大豆植物。
35.如权利要求32所述的方法,其中所述鳞翅目有害生物选自由以下组成的组:欧洲玉米蛀虫(European corn borer)(ECB;欧洲玉米螟(Ostrinia nubilalis))、黑色地老虎(black cutworm)(BCW;小地老虎(Agrotis ipsilon))、秋黏虫(fall armyworm)(FAW;草地贪夜蛾(Spodoptera frugiperda))、玉米穗蛾(corn earworm)(CEW;玉米穗虫(Helicoverpa zea))、大豆夜蛾(soybean looper)(SBL;大豆尺蠖(Pseudoplusiaincludens))、绒毛豆毛虫(velvetbean caterpillar)(黎豆夜蛾(Anticarsiagemmatalis))、烟夜蛾(tobacco budworm)(TBW;烟芽夜蛾(Heliothis virescens))、南部粘虫(southern armyworm)(SAW;南部灰翅夜蛾(Spodoptera eridania))、考斯粘虫(cosmid armyworm)(CAW;考斯夜蛾(Spodoptera cosmioides))、亚洲玉米蛀虫(Asiancorn borer)(ACB;亚洲玉米螟(Ostrinia furnacalis))、棉螟蛉(cotton bollworm)(CBW;棉铃虫(Helicoverpa armigera))、东方黏虫(Oriental armyworm)(OAW;东方粘虫(Mythimna separate))或其任意组合。
36.如权利要求32所述的方法,其中所述核苷酸序列进行了密码子优化用于在植物中表达。
37.如权利要求32所述的方法,其中所述核酸分子或所述嵌合基因包含SEQ ID NO:1-35中任一项或其毒素编码片段。
38.如权利要求32所述的方法,其中所述Cry蛋白包含SEQ ID NO:36-59中任一项的氨基酸序列或毒素片段。
39.一种产生抗昆虫转基因植物的方法,所述方法包括:向植物中引入如权利要求5所述的嵌合基因,其中使所述Cry蛋白在所述植物中表达,由此产生抗昆虫转基因植物。
40.如权利要求39所述的方法,其中所述引入步骤通过以下实现:a)转化所述植物;或者b)使包含所述嵌合基因的第一植物与不同的第二植物杂交。
41.如权利要求38或39所述的方法,其中所述植物是水稻植物或玉蜀黍植物。
42.一种控制鳞翅目有害生物的方法,所述方法包括向所述鳞翅目有害生物或其环境递送杀昆虫组合物,所述杀昆虫组合物包含有效量的如权利要求10所述的Cry蛋白。
43.如权利要求42所述的方法,其中所述鳞翅目有害生物选自由以下组成的组:欧洲玉米蛀虫(European corn borer)(ECB;欧洲玉米螟(Ostrinia nubilalis))、黑色地老虎(black cutworm)(BCW;小地老虎(Agrotis ipsilon))、秋黏虫(fall armyworm)(FAW;草地贪夜蛾(Spodoptera frugiperda))、玉米穗蛾(corn earworm)(CEW;玉米穗虫(Helicoverpa zea))、大豆夜蛾(soybean looper)(SBL;大豆尺蠖(Pseudoplusiaincludens))、绒毛豆毛虫(velvetbean caterpillar)(黎豆夜蛾(Anticarsiagemmatalis))、烟夜蛾(tobacco budworm)(TBW;烟芽夜蛾(Heliothis virescens))、南部粘虫(southern armyworm)(SAW;南部灰翅夜蛾(Spodoptera eridania))、考斯粘虫(cosmid armyworm)(CAW;考斯夜蛾(Spodoptera cosmioides))、亚洲玉米蛀虫(Asiancorn borer)(ACB;亚洲玉米螟(Ostrinia furnacalis))、棉螟蛉(cotton bollworm)(CBW;棉铃虫(Helicoverpa armigera))、东方黏虫(Oriental armyworm)(OAW;东方粘虫(Mythimna separate))或其任意组合。
CN202080044490.9A 2019-06-26 2020-06-10 用于控制植物有害生物的组合物和方法 Pending CN114026111A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962866979P 2019-06-26 2019-06-26
US62/866,979 2019-06-26
PCT/US2020/036911 WO2020263567A1 (en) 2019-06-26 2020-06-10 Compositions and methods for controlling plant pests

Publications (1)

Publication Number Publication Date
CN114026111A true CN114026111A (zh) 2022-02-08

Family

ID=74061084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080044490.9A Pending CN114026111A (zh) 2019-06-26 2020-06-10 用于控制植物有害生物的组合物和方法

Country Status (4)

Country Link
US (1) US20220322680A1 (zh)
CN (1) CN114026111A (zh)
BR (1) BR112021025937A2 (zh)
WO (1) WO2020263567A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103328637A (zh) * 2011-01-24 2013-09-25 先锋国际良种公司 具有抗鳞翅目昆虫活性的新型苏云金芽孢杆菌基因
CN107849098A (zh) * 2015-07-07 2018-03-27 先正达参股股份有限公司 用于控制植物有害生物的组合物和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI1007260A2 (pt) * 2009-01-23 2015-09-08 Hi Bred International Inc mólecula de ácido nucleico isolada, construção de dna, célula hospedeira, planta transgênica, semente transformada, polipetídeo isolado com atividade pesticida, composição e métodos para controlar uma população de praga de insetos, exterminar uma praga de insetos, para produzir um polipeptídeo com atividade pesticida e para proteger uma planta de uma praga.
BR112020012477A2 (pt) * 2017-12-19 2020-11-24 Pioneer Hi-Bred International, Inc. polipeptídeo recombinante; polipeptídeo inseticida recombinante; composição agrícola; construto de dna; célula hospedeira; planta transgênica; método para inibir o crescimento ou exterminar uma praga de inseto ou população de praga; método para controlar a infestação de praga; e método para melhorar o rendimento de uma cultura

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103328637A (zh) * 2011-01-24 2013-09-25 先锋国际良种公司 具有抗鳞翅目昆虫活性的新型苏云金芽孢杆菌基因
CN107849098A (zh) * 2015-07-07 2018-03-27 先正达参股股份有限公司 用于控制植物有害生物的组合物和方法

Also Published As

Publication number Publication date
US20220322680A1 (en) 2022-10-13
BR112021025937A2 (pt) 2022-02-08
WO2020263567A1 (en) 2020-12-30

Similar Documents

Publication Publication Date Title
US11578105B2 (en) Compositions and methods for controlling plant pests
CN107849098B (zh) 用于控制植物有害生物的组合物和方法
CN113302199A (zh) 用于控制昆虫有害生物的组合物和方法
CN107109418B (zh) 用于控制植物有害生物的组合物和方法
WO2017146899A1 (en) Compositions and methods for controlling plant pests
US20220251599A1 (en) Compositions and Methods for Control of Insect Pests
CN106998697B (zh) 用于控制植物有害生物的组合物和方法
WO2020050905A1 (en) Compositions and methods for controlling plant pests
CN113382634A (zh) 工程化的杀有害生物蛋白及控制植物有害生物的方法
CN114026111A (zh) 用于控制植物有害生物的组合物和方法
WO2023004334A2 (en) Compositions and methods for controlling insects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination