CN106998697A - 用于控制植物有害生物的组合物和方法 - Google Patents

用于控制植物有害生物的组合物和方法 Download PDF

Info

Publication number
CN106998697A
CN106998697A CN201580067475.5A CN201580067475A CN106998697A CN 106998697 A CN106998697 A CN 106998697A CN 201580067475 A CN201580067475 A CN 201580067475A CN 106998697 A CN106998697 A CN 106998697A
Authority
CN
China
Prior art keywords
plant
protein
cell
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580067475.5A
Other languages
English (en)
Other versions
CN106998697B (zh
Inventor
M·R·布拉姆莱特
K·赛吉恩
V·C·克拉默
M·S·罗斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN106998697A publication Critical patent/CN106998697A/zh
Application granted granted Critical
Publication of CN106998697B publication Critical patent/CN106998697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/10Animals; Substances produced thereby or obtained therefrom
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/20Bacteria; Substances produced thereby or obtained therefrom
    • A01N63/22Bacillus
    • A01N63/23B. thuringiensis
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Pest Control & Pesticides (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Virology (AREA)
  • Environmental Sciences (AREA)
  • Dentistry (AREA)
  • Agronomy & Crop Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Insects & Arthropods (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Peptides Or Proteins (AREA)

Abstract

披露了从苏云金芽孢杆菌中分离的新颖的杀昆虫蛋白,这些杀昆虫蛋白针对鳞翅目昆虫有害生物是有活性的。编码这些杀昆虫蛋白的DNA可以用于转化各种原核和真核生物以表达这些杀昆虫蛋白。这些重组生物可以用于控制在不同环境中的鳞翅目昆虫。

Description

用于控制植物有害生物的组合物和方法
电子提交的序列表参考
该序列表的官方副本是通过EFS-Web以ASCII格式的序列表以2014年12月5日生成的名为“80670-US-L-ORG-NAT-1_SeqList.txt”的文件进行电子提交的,并且该序列表的大小为170千字节并且与本说明书同时提交。包含在该ASCII格式文件中的序列表是本说明书的一部分,并且通过引用以其全文结合在此。
技术领域
本发明涉及杀有害生物蛋白和编码它们的核酸分子,连同用于控制植物有害生物的组合物和方法。
背景技术
苏云金芽孢杆菌(Bt)是一种革兰氏阳性的孢子形成的土壤细菌,其特征在于它产生晶体包含体的能力,这些晶体包含体对于某些目和种的植物有害生物(包括昆虫)是特异地有毒性的,但是对于植物和其他非目标生物是无害的。出于这个原因,包含苏云金芽孢杆菌菌株或它们的杀昆虫蛋白的组合物可以用作环境上可接受的杀昆虫剂以控制农业昆虫有害生物或多种人或动物疾病的昆虫载体。
来自苏云金芽孢杆菌的晶体(Cry)蛋白主要针对鳞翅目的、双翅目的、以及鞘翅目的幼虫具有有力的杀昆虫活性。这些蛋白质还已经显示针对以下目的有害生物的活性:膜翅目、同翅目、毛虱目、食毛目、以及壁虱目,连同其他的无脊椎动物目,例如线虫动物门、扁形动物门、以及肉足鞭毛亚门(Feitelson,J.1993.The Bacillus Thuringiensis familytree.In Advanced Engineered Pesticides.Marcel Dekker,Inc.,New York,N.Y.[Feitelson,J,1993,在前沿的工程化的杀有害生物剂中的苏云金芽孢杆菌家族树,马塞尔德克尔公司,纽约,纽约州])。这些蛋白质最初主要基于它们的杀虫活性而被分类为CryI至CryVI。主要的类别是鳞翅目特异性(I)、鳞翅目和双翅目特异性(II)、鞘翅目特异性(III)、双翅目特异性(IV)、以及线虫特异性(V)和(VI)。这些蛋白质进一步被分类为子族,在各个家族内的更高相关的蛋白质指定了区分的字母,例如CryIA、CryIB、CryIC等。在各个区分内的甚至更紧密相关的蛋白质被给定名称,例如CryIC(a)、CryIC(b)等。术语“Cry毒素”以及“δ-内毒素”与术语“Cry蛋白”已可互换地使用。对于Cry蛋白和基因的当前新命名法基于氨基酸序列同源性而不是昆虫靶标特异性(Crickmore et al.(1998)Microbiol.Mol.Biol.Rev.62:807-813[Crickmore等人(1998)微生物分子生物学评论,62:807-813])。在这个更可接受的分类中,每种毒素被指定唯一的名称,该名称合并了初级等级(阿拉伯数字)、二级等级(大写字母)、三级等级(小写字母)、以及四级等级(另一个阿拉伯数字)。在当前分类中,在初级等级中罗马数字已经换为阿拉伯数字。例如,在旧命名法下的“CryIA(a)”现在在当前命名法下是“Cry1Aa”。
Cry蛋白是在Bt的孢子形成阶段期间以晶态形式积聚为原毒素的球状蛋白质分子。在被有害生物摄取后,这些晶体典型地被溶解以释放原毒素,原毒素大小的范围可以为,例如,对于鳞翅目活性的Cry蛋白为从130-140kDa,并且对于鞘翅目活性的Cry蛋白为60-80kDa。原毒素经由靶有害生物中的肠蛋白酶转变为成熟的毒素片段(大约60-70kDa N末端区域)。这些蛋白质中许多对于特异性目标昆虫是相当有毒性的,但是对于植物和其他非目标生物是无害的。
Cry蛋白通常具有五个保守序列结构域、以及三个保守结构性结构域(参见例如,de Maagd et al.(2001)Trends Genetics 17:193-199[de Maagd等人(2001)遗传学趋势,17:193-199])。第一保守结构性结构域(称作结构域I)典型地由七个α螺旋组成并且参与膜插入以及孔形成。结构域II典型地由三个安排为希腊钥匙构型的β片层组成,并且结构域III典型地由两个处于“果冻卷”(‘jelly-roll’)构造的反平行的β片层组成(de Maagd etal.,2001,supra[de Maagd等人,2001,同上])。结构域II和III参与受体识别和结合,并且因此被考虑为毒素特异性的决定物。
众多商业上有价值的植物(包括普通的农作物)易受植物有害生物(包括昆虫和线虫有害生物)的攻击的影响,导致作物产量和品质的实质性降低。例如,植物有害生物是在全世界重要农作物损失中的主要因素。由于非哺乳动物有害生物(包括昆虫)的侵染,仅在美国每年就损失大约80亿美元。除了农作物中的损失之外,昆虫有害生物对于菜农和果农,对于观赏性花卉的生产商,以及对于家庭花匠也是负担。
昆虫有害生物主要是通过密集使用化学杀有害生物剂来控制,这些化学杀有害生物剂通过抑制昆虫成长、预防昆虫摄食或繁殖、或者导致死亡而有效。生物性有害生物控制剂,例如表达杀有害生物毒素(如Cry蛋白)的苏云金芽孢杆菌(Bacillus thuringiensis)菌株,也已经应用至作物植物中,产生了令人满意的结果,提供化学杀有害生物剂的替代物或补充物。已经分离了编码这些Cry蛋白的一些的基因并且它们在异源性宿主(例如转基因植物)中的表达已经显示出提供了另一种用于控制经济上重要的昆虫有害生物的手段。
因此可以达到良好的昆虫控制,但是某些化学品有时也能影响非目标有益昆虫,并且某些生物制剂具有非常窄的活性谱。此外,某些化学和生物控制方法的继续使用增加了昆虫有害生物对此类控制措施产生抗性的机会。通过各种抗性管理实践已部分地缓和了这种状况,但仍需要找到新型并有效的有害生物控制剂,这些有害生物控制剂为农民提供经济利益并且是环境可接受的。特别需要的是靶向更广谱的经济上重要的昆虫有害生物并有效控制昆虫品系的控制剂,这些昆虫品系对现有的昆虫控制剂是有抗性或可以变得有抗性。
发明内容
鉴于这些需求,本发明的目的是通过提供可以用来控制多种植物有害生物的新颖基因和杀有害生物蛋白来提供新的有害生物控制剂。
本发明提供了用于赋予细菌、植物、植物细胞、组织以及种子的杀有害生物活性的组合物以及方法。具体地,提供了包含从苏云金芽孢杆菌(Bt)中分离的编码Cry蛋白的新颖多核苷酸的嵌合基因以及基本上与其一致的序列,这些序列的表达导致具有对经济上重要的昆虫有害生物(特别是侵染植物的昆虫有害生物)的毒性的蛋白质。本发明进一步涉及由这些核酸序列的表达生成的新颖的Cry1蛋白,并且涉及含有这些Cry蛋白的组合物以及配制品,它们通过抑制昆虫有害生物的生存、生长以及繁殖或者限制昆虫相关的对作物植物的损害或损失的能力对昆虫是有毒的。本发明的Cry蛋白包括天然Cry蛋白以及具有一个或多个氨基酸置换、添加或缺失的突变型Cry蛋白。突变型Cry蛋白的实例包括但不限于被突变为具有比其天然Cry蛋白对应物更宽的活性谱的那些,或经突变以引入表位来产生从天然蛋白中差异性地识别出经突变的蛋白的抗体的那些。本发明的新颖Cry蛋白对昆虫有害生物是高活性的。例如,本发明的Cry蛋白可以用于控制一种或多种经济上重要的昆虫有害生物,例如黑色地老虎(black cutworm)(小地老虎(Agrotis ipsilon))、欧洲玉米蛀虫(European corn borer)(欧洲玉米螟(Ostrinia nubilalis))、秋黏虫(fall armyworm)(草地贪夜蛾(Spodoptera frugiperda))、玉米穗蛾(corn earworm)(玉米穗虫(Helicoverpa zea))、甘蔗螟(sugarcane borer)(小蔗螟(Diatraea saccharalis)),绒毛豆毛虫(velvetbean caterpillar)(黎豆夜蛾(Anticarsia gemmatalis))、大豆夜蛾(soybean looper)(大豆尺蠖(Chrysodeixis includens)),西南玉米蛀虫(southwestcorn borer)(西南玉米螟(Diatraea grandiosella))、西部豆切根虫(western beancutworm)(西部豆夜蛾(Richia albicosta))、烟夜蛾(tobacco budworm)(烟芽夜蛾(Heliothis virescens))、亚洲玉米蛀虫(Asian corn borer)(亚洲玉米螟(Ostriniafurnacalis))、棉螟蛉(cotton bollworm)(棉铃虫(Helicoverpa armigera))、条纹蛀茎虫(striped stem borer)(二化螟(Chilo suppressalis))、粉蛀茎虫(pink stem borer)(非洲大螟(Sesamia calamistis))、水稻卷叶螟(rice leaffolder)(稻纵卷叶螟(Cnaphalocrocis medinalis))等。
本发明还提供了合成的多核苷酸,其编码本发明的Cry蛋白,并已经进行一个或多个密码子优化用于在转基因生物如细菌和植物中表达。
本发明进一步涉及表达盒和重组载体,其包含编码本发明的Cry蛋白的多核苷酸。本发明还提供了包含嵌合基因、或表达盒或重组载体的经转化的细菌、植物、植物细胞、组织、以及种子,该嵌合基因或表达盒或重组载体包含编码本发明的Cry蛋白的多核苷酸。
本发明还涉及使用这些多核苷酸的方法,例如在DNA构建体或嵌合基因或表达盒或重组载体中用于在生物(包括微生物和植物)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(包括但不限于微生物或植物)中表达的合成序列,或者已经被设计用于在制备杂交的、具有增强的杀有害生物活性的毒素的合成序列。本发明进一步涉及制备这些Cry蛋白的方法以及例如在微生物中使用这些核酸序列以控制昆虫或在转基因植物中使用这些核酸序列以赋予对抗昆虫损害的保护的方法,并且涉及使用这些Cry蛋白、以及包含这些Cry蛋白的组合物以及配制品的方法,例如将Cry蛋白或组合物或配制品施用至昆虫侵染的区域,或施用它们以预防性地处理易受昆虫影响的区域或植物从而赋予针对昆虫有害生物的保护。核苷酸或氨基酸序列可以是已经被设计用于在生物(包括但不限于微生物或植物)中表达的合成序列。
本发明的组合物以及方法对于对昆虫有毒的生物(确切地为细菌和植物)的产生是有用的。这些生物以及从它们衍生的组合物用于农业目的是所希望的。本发明的组合物对于产生改变的或改进的具有杀有害生物活性的Cry蛋白,或对于检测在产物或生物中的Cry蛋白或核酸的存在也是有用的。
参考以下详细说明书和权利要求书,本发明的这些和其他特征、方面、以及优点将变得更好理解。
序列表中的序列简述
SEQ ID NO:1代表对BT-0009蛋白进行编码的核苷酸序列。
SEQ ID NO:2代表对BT-0012蛋白进行编码的核苷酸序列。
SEQ ID NO:3代表对BT-0013蛋白进行编码的核苷酸序列。
SEQ ID NO:4代表对BT-0023蛋白进行编码的核苷酸序列。
SEQ ID NO:5代表对BT-0067蛋白进行编码的核苷酸序列。
SEQ ID NO:6代表对BT-0009蛋白进行编码的密码子优化序列。
SEQ ID NO:7代表对BT-0012蛋白进行编码的密码子优化序列。
SEQ ID NO:8代表对BT-0013蛋白进行编码的密码子优化序列。
SEQ ID NO:9代表对BT-0023蛋白进行编码的密码子优化序列。
SEQ ID NO:10代表对BT-0067蛋白进行编码的密码子优化序列。
SEQ ID NO:11代表对突变型BT-0009蛋白进行编码的核苷酸序列。
SEQ ID NO:12代表对突变型BT-0012蛋白进行编码的核苷酸序列。
SEQ ID NO:13代表对突变型BT-0013蛋白进行编码的核苷酸序列。
SEQ ID NO:14代表对突变型BT-0023蛋白进行编码的核苷酸序列。
SEQ ID NO:15代表对突变型BT-0067蛋白进行编码的核苷酸序列。
SEQ ID NO:16代表BT-0009蛋白的氨基酸序列。
SEQ ID NO:17代表BT-0012蛋白的氨基酸序列。
SEQ ID NO:18代表BT-0013蛋白的氨基酸序列。
SEQ ID NO:19代表BT-0023蛋白的氨基酸序列。
SEQ ID NO:20代表BT-0067蛋白的氨基酸序列。
SEQ ID NO:21代表突变型BT-0009蛋白的氨基酸序列。
SEQ ID NO:22代表突变型BT-0012蛋白的氨基酸序列。
SEQ ID NO:23代表突变型BT-0013蛋白的氨基酸序列。
SEQ ID NO:24代表突变型BT-0023蛋白的氨基酸序列
SEQ ID NO:25代表突变型BT-0067蛋白的氨基酸序列。
SEQ ID NO:26-31代表在本发明中有用的引物。
具体实施方式
本说明不旨在是本发明以其而实施的所有不同方式,或可以加入本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以结合入其他实施例中,并且关于具体实施例所说明的特征可以从那个实施例删除。因此,本发明考虑了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。另外,鉴于本披露内容,对在此建议的不同实施例的众多变体以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些具体实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,否则所有在此使用的技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的意思。在此的本发明的说明中使用的术语仅仅是出于描述具体实施例的目的并且不旨在限制本发明。还应当理解的是在此使用的术语仅仅是出于描述具体实施例的目的并且不旨在限制本发明的范围。
定义
当在此和所附权利要求书中使用时,单数形式“一个/种(a)”、“和(and)”和“该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等等。如在此使用的,词语“或(or)”意指具体清单的任何一个成员并且还包括这个清单的成员的任何组合(即,还包括“和”)。
术语“约”在此用于意指大约、大致、约或在...左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐明的数值来限定这个范围。通常,术语“约”在此用于将数值限定至以20%的变化,优选10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,精确值(即,无“约”)是优选的。
本发明的毒性Cry蛋白的“活性”意指该毒性蛋白作为口服活性的昆虫控制剂发挥作用,具有毒性作用、或者能够干扰或阻止昆虫摄食,这可能引起或者可能不引起昆虫的死亡。当本发明的毒性蛋白被递送至昆虫时,这种结果典型地是该昆虫的死亡,或者该昆虫不以使该毒性蛋白可供该昆虫利用的来源为食。
如在此所使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核苷酸分子的多个拷贝或与该核酸分子互补的多个拷贝。扩增系统包括聚合酶链式反应(PCR)系统、连接酶链式反应(LCR)系统、基于核酸序列的扩增(NASBA,Cangene公司,密西索加,安大略省)、Q-β复制酶系统、基于转录的扩增系统(TAS)以及链置换扩增(SDA)。参见例如Diagnostic Molecular Microbiology:Principles and Applications,PERSING et al.,Ed.,American Society for Microbiology,Washington,D.C.(1993)[诊断分子微生物学:原理与应用,PERSING等人编著,美国微生物学会,华盛顿哥伦比亚特区(1993)]。扩增产物被称为“扩增子”。
如在此使用的术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”(或类似术语)是指如下构建体或分子,该构建体或分子包含被组装进单个核酸分子中的不同来源的两个或更多个多核苷酸。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,其含有但不限于(1)多核苷酸(例如,DNA),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白质部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包括衍生自不同来源的调节多核苷酸和编码多核苷酸,或包括衍生自相同来源、但以与在自然界中所发现的不同的方式进行安排的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、具体地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。
“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。优选地,RNA进而在生物中被翻译以产生蛋白质。
如在此使用的,“密码子优化的”序列意指重组的、转基因的、或合成的多核苷酸的核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由密码子优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组DNA构建体的DNA序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使它的全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如美国专利号6,121,014,通过引用结合在此。
“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、和/或繁殖的能力,或者限制与昆虫有关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管它优选意指杀死昆虫。
术语“包含(comprises和/或comprising)”当在本说明书中使用时,指明所列举特征、整体、步骤、操作、元件、和/或部件的存在,但是不排除一种或多种其他特征、整体、步骤、操作、元件、部件、和/或其组的存在或添加。
如在此使用的,连接词“基本上由...组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由...组成”并不旨在被解释为等同于“包含(comprising)”。
在本发明的上下文中,“对应于(corresponding to或corresponds to)”意指当变体Cry蛋白的氨基酸序列与彼此比对时,“对应于”在该变体或同系物蛋白中某些枚举的位置的氨基酸是与参考蛋白中的这些位置比对的那些,但在相对于本发明的特定参考氨基酸序列而言的这些精确的数字位置中是不必要的。例如,如果SEQ ID NO:16是参考序列并且与SEQ ID NO:17比对的话,SEQ ID NO:17的Ala150“对应于”SEQ ID NO:16的Ala163。
“递送(deliver)”组合物或毒性蛋白意指该组合物或毒性蛋白与昆虫接触,产生毒性作用和对该昆虫的控制。该组合物或毒性蛋白可以按照许多公认的方式进行递送,例如,通过昆虫摄取经口或通过经由转基因植物表达、一种或多种配制的蛋白质组合物、一种或多种可喷洒的蛋白质组合物、饵基、或任何其他的领域公认的蛋白质递送系统与昆虫接触。
术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白质的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白质同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽家族。
“有效的昆虫控制量”意指毒性蛋白的浓度,它通过毒性作用抑制昆虫存活、生长、摄食和/或繁殖的能力,或者限制与昆虫有关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“有效的昆虫控制量”可以是或可以不是意指杀死昆虫,尽管它优选意指杀死昆虫。
如在此使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种感兴趣的多核苷酸的表达的核酸序列,包含可操作地连接至该感兴趣的多核苷酸的启动子,该多核苷酸可操作地连接至终止信号。“表达盒”还典型地包含正确翻译感兴趣的多核苷酸所需的另外的多核苷酸。该表达盒还可以包含在感兴趣的多核苷酸的直接表达中不是必需的但是由于用于从表达载体去除该表达盒的方便限制位点而存在的其他多核苷酸。包含一个或多个感兴趣的核苷酸序列的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即在该表达盒中的感兴趣的多核苷酸不是天然存在于该宿主细胞中的,并且必须已经通过转化过程或育种过程引入到该宿主细胞或该宿主细胞的祖先中。该表达盒中的一个或多个感兴趣的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。
“基因”在此定义为由多核苷酸组成的遗传单位,该遗传单位占据染色体或质粒上特定位置并且含有用于生物中的具体特征或性状的遗传指令。
“肠蛋白酶”是在昆虫的消化道中天然发现的蛋白酶。这种蛋白酶通常参与被摄取的蛋白质的消化。
当提及基因或核酸使用时,术语“异源”是指编码因子的基因不是在其天然环境中(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的基因。异源基因还可以包括对生物来说是天然的基因,该基因已经以一些方式(例如,突变;以多个拷贝添加;连接至非天然启动子或增强子多核苷酸等)被改变。异源基因可以进一步包含植物基因多核苷酸,其包含植物基因的cDNA形式;这些cDNA可以以正义方向(以产生mRNA)或反义方向(以产生反义RNA转录本,其与mRNA转录本是互补的)被表达。在本发明的一个方面中,异源基因区别于内源性植物基因在于该异源基因多核苷酸被典型地连接至包含调节元件如启动子的多核苷酸上,未发现这些多核苷酸与由该异源基因编码的蛋白质的基因或与该染色体中的植物基因多核苷酸天然相关联,或者与在自然界中未发现的染色体的部分(例如,在基因座中表达的基因,其中该基因未正常表达)相关联。另外,“异源”多核苷酸是指不与将多核苷酸引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。
“同源重组”是在相同的多核苷酸的区域中成对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“交叉”)。“重组事件”在此被理解为意指减数分裂交叉。
当核酸序列编码了多肽(该多肽与由参考核酸序列所编码的多肽具有相同的氨基酸序列)时,这种核苷酸序列与这种参考核酸序列“同类编码”。
术语“分离的”核酸分子、多核苷酸或毒素是不再存在于其天然环境中的核酸分子、多核苷酸或毒性蛋白。本发明的分离的核酸分子、多核苷酸或毒素可以按照纯化的形式存在,或者可以存在于重组宿主中,例如转基因细菌细胞或转基因植物中。
“核酸分子”是可以从任何来源中分离的单链或双链DNA或RNA。在本发明的上下文中,核酸分子优选地是DNA区段。
“可操作地连接”是指在单一核酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能RNA的表达时(即,该编码多核苷酸或功能RNA处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能RNA是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。
如在此使用的“杀有害生物”、“杀昆虫”等是指本发明的Cry蛋白控制有害生物的能力或者可以控制如在此所定义的有害生物的Cry蛋白的量。因此,杀有害生物Cry蛋白可以杀死或抑制有害生物(例如,昆虫有害生物)存活、生长、摄食、和/或繁殖的能力。
“植物”是在发育的任何阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单细胞或培养细胞的形式,或者是作为较高级的组织单位(例如,植物组织、植物器官、或整株植物)的一部分。
“植物细胞培养物”意指植物单元(例如像,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花蕾或胚。
如在此使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于全株植物、植物器官、植物种子、组织培养物以及被组织化成结构和/或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。
“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括DNA、RNA、经修饰的寡核苷酸(例如,包含对于生物RNA或DNA不典型的碱基的寡核苷酸,如2'-O-甲基化寡核苷酸)等。在一些实施例中,核酸或多核苷酸可以是单链的、双链的、多链的或其组合。除非另外指示,否则本发明的具体核酸或多核苷酸任选地包含或编码除明确指示的任何多核苷酸之外的互补多核苷酸。
“感兴趣的多核苷酸”是指如下任何多核苷酸,当其转移至生物(例如,植物)中时赋予该生物所希望的特征,如抗生素抗性、病毒抗性、昆虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、工业过程中改进的性能、商业上有价值的酶或代谢物的生产、或者改变的繁殖能力。
术语“启动子”是指如下多核苷酸,通常在它的编码多核苷酸的上游(5'),它通过提供对正确转录所需的RNA聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。
“原生质体”是分离的植物细胞,没有细胞壁或仅具有部分的细胞壁。
如在此使用的,术语“重组”是指核酸分子(例如,DNA或RNA)和/或蛋白质和/或生物的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如在此使用的,“重组核酸分子”是包含多核苷酸组合的核酸分子,这些多核苷酸不会天然地一起存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,和/或人工合成的并且包含偏离通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,和/或包含人工掺入至宿主细胞的基因组DNA中的转基因和该宿主细胞基因组的相关侧翼DNA的核酸分子。重组核酸分子的实例是由将转基因插入至植物的基因组DNA中产生的DNA分子,其可以最终导致该生物中的重组RNA和/或蛋白质分子的表达。如在此使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,重组植物明显不同于相关的野生型植物。
“调节元件”是指参与控制核苷酸序列的表达的序列。调节元件包含可操作地连接至感兴趣的核苷酸序列的启动子以及终止信号。它们还典型地涵盖正确翻译该核苷酸序列所需的序列。
在两个核酸或蛋白质序列的背景下,术语“一致的”或“基本上一致的”是指当针对最大对应性进行比较和比对时具有至少60%、优选80%、更优选90%、甚至更优选95%、并且最优选至少99%核苷酸或氨基酸残基一致性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,基本上的一致性存在于这些序列的整个长度为至少约50个残基的区域中,更优选地在整个至少约100个残基的区域中,并且最优选地这些序列在至少约150个残基中是基本上一致的。在尤其优选的实施例中,这些序列在编码区的全部长度上基本上是一致的。此外,基本上一致的核酸或蛋白质序列基本上执行相同的功能。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(若有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列一致性百分比。
用于比较的序列的最佳比对可以按照以下方式进行,例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)[Smith和Waterman,应用数学进展,2:482(1981)]的局部同源性算法、通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)[Needleman和Wunsch,分子生物学杂志,48:443(1970)]的同源比对算法、通过Pearson&Lipman,Proc.Nat'l.AcadSci.USA 85:2444(1988)[Pearson和Lipman,美国国家科学院院刊,85:2444(1988)]的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包(WisconsinGenetics Software Package),遗传学计算机组(Genetics Computer Group),科学街575号(575Science Dr.),麦迪逊,威斯康星州中的GAP、BESTFIT、FASTA、和TFASTA),或通过目测检查(总体上参见Ausubel et al.,infra[Ausubel等人,下文])。
适合于确定序列一致性百分比以及序列相似性的算法的一个实例是BLAST算法,它描述于以下文献中:Altschul et al.,J.Mol.Biol.215:403-410(1990)[Altschul等人,分子生物学杂志,215:403-410(1990)]。执行BLAST分析的软件是通过国家生物技术信息中心(the National Center for Biotechnology Information,美国国家医学图书馆(U.S.National Library of Medicine),洛克维尔大道8600号(8600Rockville Pike),贝塞斯达,马里兰州20894美国)可供公众使用的。这种算法涉及首先通过识别查询序列中具有长度W的短字码而识别得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈(Altschul et al.,1990[Altschul等人,1990])。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以得到增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用评分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了该比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad Sci.USA 89:10915(1989)[Henikoff和Henikoff,美国国家科学院院刊,89:10915(1989)])。
除计算序列一致性百分比之外,BLAST算法还执行两个序列之间的相似性统计分析(参见例如,Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA 90:5873-5787(1993)[Karlin和Altschul,美国国家科学院院刊,90:5873-5787(1993)])。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相类似的。
两个核酸序列基本上一致的另一指示是这两个分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)DNA或RNA中时进行的。“实质上结合”是指在探针核酸与靶核酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格来容纳,以实现靶核酸序列的所希望的检测。
在核酸杂交实验(如DNA杂交和RNA杂交)的背景下,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列特定地在较高的温度下杂交。对核酸杂交的广泛指导见于以下文献中:Tijssen(1993)LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes part I chapter 2"Overview of principles of hybridization and thestrategy of nucleic acid probe assays"Elsevier,New York[Tijssen(1993)生物化学和分子生物学实验室技术-使用核酸探针的杂交第2章第I部分“杂交原理和核酸探针检验策略综述”,爱思唯尔,纽约]。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶子序列进行杂交,但不会与其他序列杂交。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。极严格条件被选定为等于具体探针的Tm。对于互补核酸(它们在DNA或RNA印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15M NaCl在72℃下持续约15分钟。严格洗涤条件的实例是0.2x SSC洗涤在65℃下持续15分钟(参见,Sambrook,下文,对于SSC缓冲剂的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的示例性中等严格洗涤是1x SSC在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6x SSC在40℃下持续15分钟。对于短探针(例如,约10至50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐),并且温度典型地是至少约30℃。通过加入去稳定剂例如甲酰胺也可以实现严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的核酸所编码的蛋白质是基本上一致的,则它们仍然是基本上一致的。例如,当使用遗传密码允许的最大程度的密码子简并而生成核酸的拷贝时,则发生这种情况。
以下是杂交/洗涤条件组的实例,这些条件可被用来克隆与本发明的参考核苷酸序列基本上一致的同源核苷酸序列:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃下,并且在2x SSC、0.1%SDS中在50℃下洗涤;更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中在50℃下,并且在1x SSC、0.1%SDS中在50℃下洗涤;仍更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃下,并且在0.5x SSC、0.1%SDS中在50℃下洗涤;优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃下,并且在0.1x SSC、0.1%SDS中在50℃下洗涤;更优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃下,并且在0.1x SSC、0.1%SDS中在65℃下洗涤。
两个核酸序列或蛋白质基本上一致的另一个指示是由第一核酸编码的蛋白质与由第二核酸编码的蛋白质进行免疫性交联反应或与其特异性结合。因此,蛋白质典型地是与第二蛋白质基本上一致的,例如其中这两种蛋白质仅区别于保守性置换。
“合成的”是指如下核苷酸序列,该核苷酸序列包含在天然序列中不存在的碱基和/或结构特征。例如,编码本发明的Cry蛋白的人工序列(其更类似于双子叶植物和/或单子叶植物基因的G+C含量和正常密码子分布)被表述为合成的。
“转化”是用于将异源核酸引入到宿主细胞或生物的方法。具体地,“转化”意指DNA分子稳定整合到感兴趣生物的基因组中。
“转化的/转基因的/重组的”是指引入了异源核酸分子的宿主生物,例如细菌或植物。该核酸分子可以被稳定地整合到宿主的基因组中,或者该核酸分子还可以作为染色体外分子存在。这样的染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含有该异源的核酸分子的野生型生物,例如细菌或植物。
通过以下标准缩写由核苷酸的碱基来指示这些核苷酸:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。氨基酸同样是由以下标准缩写来指示:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。
本发明提供了用于控制有害的植物有害生物的组合物以及方法。具体地,本发明涉及对植物有害生物有毒的Cry蛋白,并且涉及包含编码这些Cry蛋白的核苷酸序列的多核苷酸,并且涉及制备和使用这些多核苷酸和Cry蛋白控制植物有害生物的方法。
因此,在一些实施例中,提供了如下嵌合基因,该嵌合基因包含可操作地连接至多核苷酸的异源启动子,该多核苷酸包含编码对于至少欧洲玉米蛀虫(欧洲玉米螟)有毒的蛋白质的核苷酸序列,其中该核苷酸序列(a)与SEQ ID NO:1-5中任一项具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列一致性;或者(b)编码包含氨基酸序列的蛋白质,该氨基酸序列与SEQ ID NO:16-20中任一项具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列一致性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
在其他实施例中,该异源启动子是植物可表达型启动子。例如但不限于,该植物可表达型启动子可以选自下组,该组由以下各项组成:泛素、cmp、玉米TrpA、噬菌体T3基因95'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、豌豆小亚基RuBP羧化酶、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛花查尔酮异构酶、大豆富甘氨酸蛋白1、马铃薯糖蛋白(Potato patatin)、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
在另外的实施例中,由嵌合基因编码的蛋白质另外对选自下组的一个或多个昆虫种类是有毒的,该组由以下各项组成:黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)以及水稻卷叶螟(稻纵卷叶螟)。
在另外的实施例中,该多核苷酸包含如下核苷酸序列,该核苷酸序列与SEQ IDNO:1具有至少80%到至少99%序列一致性,或者与SEQ ID NO:2具有至少80%到至少99%序列一致性,或者与SEQ ID NO:3具有至少80%到至少99%序列一致性,或者与SEQ ID NO:4具有至少80%到至少99%序列一致性,或者与SEQ ID NO:5具有至少80%到至少99%序列一致性。
在其他实施例中,该多核苷酸包含编码如下蛋白质的核苷酸序列,该蛋白质包含与SEQ ID NO:16-20中任一项具有至少80%到至少99%序列一致性的氨基酸序列。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:16具有至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在另外的实施例中,该氨基酸序列与SEQ ID NO:17具有至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在仍另外的实施例中,该氨基酸序列与SEQ ID NO:18具有至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在其他实施例中,该氨基酸序列与SEQ ID NO:19具有至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:20具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在一些实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含如下核苷酸序列的合成序列,该核苷酸序列与SEQ ID NO:6-15中任一项具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%一致性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含编码如下蛋白质的核苷酸序列的合成序列,该蛋白质包含如下氨基酸序列,该氨基酸序列与SEQ ID NO:16-25中任一项具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在另外的实施例中,该转基因生物是转基因细菌或转基因植物。
在一些实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下项、基本上由以下项组成、或由以下项组成:编码对于至少欧洲玉米蛀虫(欧洲玉米螟)有活性的蛋白质的核苷酸序列,其中该核苷酸序列与SEQ ID NO:6-15中任一项具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在其他实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下项、基本上由以下项组成、或由以下项组成:编码对于至少欧洲玉米蛀虫(欧洲玉米螟)有活性的蛋白质的核苷酸序列,其中该核苷酸序列编码如下氨基酸序列,该氨基酸序列与SEQ IDNO:16-25中任一项具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
根据一些实施例,本发明提供了对于至少欧洲玉米蛀虫(欧洲玉米螟)有毒的分离的蛋白质,其中该蛋白质包含以下项、基本上由以下项组成、或由以下项组成:(a)与SEQ IDNO:16-25中任一项代表的氨基酸序列具有至少80%序列一致性到至少99%序列一致性的氨基酸序列;或者(b)由如下核苷酸序列编码的氨基酸序列,该核苷酸序列与由SEQ ID NO:6-15中任一项代表的核苷酸序列具有至少80%序列一致性到至少99%序列一致性。
在其他实施例中,该分离的蛋白质包含以下项、基本上由以下项组成、或由以下项组成:与SEQ ID NO:16-20中任一项具有至少80%到至少99%序列一致性的氨基酸序列。在仍其他实施例中,该氨基酸序列与SEQ ID NO:16具有至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在其他实施例中,该氨基酸序列与SEQ ID NO:17具有至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在另外的实施例中,该氨基酸序列与SEQ ID NO:18具有至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在仍另外的实施例中,该氨基酸序列与SEQ ID NO:19具有至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:20具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、至少90%、或至少91%、或至少92%、或至少94%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列一致性。
在一些实施例中,该氨基酸序列包含以下项、基本上由以下项组成、或由以下项组成:SEQ ID NO:16-25中任一项。
本发明的响应于通过天然的或突变型BT-0009、BT-0012、BT-0013、BT-0023和BT-0067等或相关蛋白的免疫激发而产生的抗体可以使用生产多克隆抗血清的标准免疫学技术来生产,并且如果需要的话,无限增殖经免疫宿主的抗体产生细胞用作单克隆抗体生产源。用于生产任何感兴趣物质的抗体的技术是熟知的,例如如在以下文献中:Harlow andLane(1988)[Harlow和Lane(1988)]和Goding(1986)[Goding(1986)]。本发明涵盖杀昆虫蛋白,其与针对本发明的杀昆虫Cry蛋白中的一种或多种产生的抗体交叉反应。
本发明中生产的这些抗体在用于确定生物样品中天然或突变型BT-0044、BT-0051、BT-0068和BT-0128或相关蛋白的量或存在的免疫测定中也是有用的。此类测定在质量控制生产含有本发明的毒性蛋白中的一种或多种或相关毒性蛋白的组合物中也是有用的。此外,这些抗体可以用来评估本发明的蛋白中的一种或多种或相关蛋白的重组生产的效力,连同针对编码本发明的蛋白中的一种或多种的核苷酸序列或相关蛋白编码序列的存在而筛选表达文库的效力。抗体还作为亲和配体用于纯化和/或分离本发明的蛋白中的任何一种或多种和相关蛋白是有用的。本发明的蛋白和含有相关抗原表位的蛋白可以通过在优选的宿主细胞中过度表达编码全部或部分本发明的蛋白或相关蛋白的序列的全长或部分长度来获得。
应当认识到,可以通过不同的方法来改变编码本发明的Cry蛋白的DNA序列,并且这些改变可以产生编码如下蛋白质的DNA序列,这些蛋白质具有不同于由本发明的天然Cry蛋白所编码的氨基酸序列。这种蛋白质可以按照不同的方式进行改变,包括SEQ ID NO:13-16中任一项的一个或多个氨基酸的氨基酸置换、缺失、截短、以及插入,包括多达约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155个、或更多个氨基酸的置换、缺失或插入。用于这样的操作的方法在本领域中通常是已知的。例如,通过在编码该蛋白质的多核苷酸中的突变可以制备天然Cry蛋白的氨基酸序列变体。这还可以通过几种诱变形式之一和/或在定向进化中来完成。在一些方面中,在该氨基酸序列中所编码的改变将实质上不影响该蛋白质的功能。此类变体将具有所希望的杀昆虫活性。在本发明的一个实施例中,由SEQ ID NO:1-5代表的核苷酸序列被改变,以在编码的蛋白质中引入氨基酸置换。在一些实施例中,所得到的突变型蛋白是由合成的突变型多核苷酸编码的,该多核苷酸包含由SEQ ID NO:11-15中任一项代表的核苷酸序列。在其他实施例中,这些突变型蛋白包含以下项、基本上由以下项组成、或由以下项组成:由SEQ ID NO:21-25中任一项代表的氨基酸序列。
应当理解的是可以通过使用此类技术改善杀昆虫蛋白对本发明的这些组合物赋予杀昆虫活性的能力。例如,可以在如下宿主细胞中表达Cry蛋白,这些宿主细胞在DNA复制过程中显示出高比率的的碱基错掺入,如XL-l Red(Stratagene公司,拉荷亚,加利福尼亚州)。在此类菌株中繁殖之后,可以分离出DNA(例如通过制备质粒DNA,或通过由PCR进行扩增并且将得到的PCR片段克隆到载体中),在非诱变菌株中培养这些Cry蛋白突变体,并且鉴定具有杀昆虫活性的经突变的基因,例如通过进行对杀昆虫活性进行测试的测定。通常,在摄食测定中混合并使用了该蛋白质。参见例如Marrone et al.(1985)J.of EconomicEntomology 78:290-293[Marrone等人(1985)经济昆虫学杂志,78:290-293]。此类测定可以包括使植物与一种或多种有害生物接触,并且确定该植物存活和/或引起这些有害生物死亡的能力。导致毒性提高的突变的实例见于Schnepf et al.(1998)Microbiol.Mol.Biol.Rev.62:775-806[Schnepf等人(1998)微生物分子生物学综述,62:775-806]。
可替代地,可以在氨基或羧基的末端上对本发明的氨基酸序列进行改变,而实质上不影响活性。这可以包括通过现代分子方法所引入的插入、缺失、或改变,这些方法是如PCR,包括PCR扩增,这些PCR扩增借助于将编码氨基酸的序列包含到在PCR扩增中所使用的寡核苷酸之中而改变或延长该蛋白质编码序列。可替代地,所加入的蛋白质序列可以包括完整的蛋白质编码序列,例如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加感兴趣的蛋白质的表达;(2)引入结合结构域、酶活性、或表位以促进蛋白质纯化、蛋白质检测、或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,例如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白质的糖基化。
本发明的Cry蛋白还可以被突变以引入表位来产生识别该经突变蛋白的抗体。因此,在一些实施例中,本发明提供了经突变的Cry蛋白,其中在天然Cry蛋白中的氨基酸置换产生了具有抗原区域的突变型Cry蛋白,该抗原区域允许该突变型Cry蛋白在蛋白质检测分析中区别于该天然Cry蛋白。
在一些实施例中,本发明提供了制备如下抗体的方法,所述抗体从衍生出经突变的Cry蛋白的天然Cry蛋白中差异性地识别出经突变的Cry蛋白,该方法包括以下步骤:在天然Cry蛋白的抗原环中置换氨基酸;并且产生特异性识别茎突变Cry蛋白的经突变抗原环但不识别该天然Cry蛋白的抗体。在一个实施例中,该抗原环在天然Cry蛋白的结构域I的外部的非保守区中被鉴定出。在另一个实施例中,该抗原环不是参与Cry蛋白的昆虫肠受体识别或参与Cry蛋白的蛋白酶活化的环。
本发明的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如DNA改组)所衍生的序列。使用此类程序,可以将一个或多个不同的毒性蛋白编码区用来创造出新的具有所希望特性的毒性蛋白。用这种方式,从相关序列多核苷酸的群体产生重组多核苷酸文库,这些相关序列多核苷酸包含如下序列区域,这些序列区域具有基本的序列一致性并且可以在体外或体内进行同源重组。例如,使用这种方法,可以将编码感兴趣的结构域的序列基序在本发明的杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码如下蛋白质的新基因,该蛋白质具有改进的感兴趣的特性,例如增加的杀昆虫活性。用于此种DNA改组的策略在本领域中是已知的。参见例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751[Stemmer(1994)美国国家科学院院刊,91:10747-10751];Stemmer (1994)Nature 370:389-391[Stemmer(1994)自然,370:389-391];Crameri et al.(1997)Nature Biotech.15:436-438[Crameri等人(1997)自然生物技术,15:436-438];Moore et al.(1997)J.Mol.Biol.272:336-347[Moore等人(1997)分子生物学杂志,272:336-347];Zhang et al.(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509[Zhang等人(1997)美国国家科学院院刊,94:4504-4509];Crameri et al.(1998)Nature391:288-291[Crameri等人(1998)自然,391:288-291];以及美国专利号5,605,793和5,837,458。
结构域交换或改组是用于产生本发明的经改变的Cry蛋白的另一种机制。可以在Cry蛋白之间交换结构域,从而产生具有改进的杀有害生物活性或目标谱的杂合或嵌合毒性蛋白。用于产生重组蛋白和测试它们的杀有害生物活性的方法在本领域是熟知的(参见例如,Naimov et al.(2001)Appl.Environ.Microbiol.67:5328-5330[Naimov等人(2001)应用与环境微生物学,67:5328-5330];de Maagd et al.(1996)Appl.Environ.Microbiol.62:1537-1543[de Maagd等人(1996)应用与环境微生物学,62:1537-1543];Ge et al.(1991)J.Biol.Chem.266:17954-17958[Ge等人(1996)生物化学杂志,266:17954-17958];Schnepf et al.(1990)J.Biol.Chem.265:20923-20930[Schnepf等人(1990)生物化学杂志,265:20923-20930];Rang et al.(1999)Appl.Environ.Microbiol.65:2918-2925[Rang等人(1999)应用与环境微生物学,65:2918-2925])。
在一些实施例中,本发明提供了如下重组载体,该重组载体包含本发明的多核苷酸、核酸分子、表达盒或嵌合基因。在其他实施例中,该载体被进一步限定为质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。用于在植物和其他生物的转化中使用的某些载体在本领域是已知的。
因此,本发明的一些实施例针对被设计成表达本发明的多核苷酸和核酸分子的表达盒。如在此使用的,“表达盒”是指如下核酸分子,该核酸分子具有至少一个操作性地连接到感兴趣的核苷酸序列上的控制序列。以这种方式,例如,可操作地连接至待表达的核苷酸序列的植物启动子可以在表达盒中提供,用于在植物、植物部分和/或植物细胞中进行表达。
包含感兴趣的核苷酸序列的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即该表达盒的特定核酸序列不是天然存在于该宿主细胞中的,并且必须已经通过转化事件引入到该宿主细胞或该宿主细胞的祖先中。
除可操作地连接至本发明的核苷酸序列的启动子之外,本发明的表达盒还可以包括其他调节序列。如在此使用的,“调节序列”意指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)并且影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于增强子、内含子、翻译前导序列、终止信号、以及多腺苷酸化信号序列。
在一些实施例中,本发明的表达盒还可以包括对其他所希望的性状进行编码的核苷酸序列。此类核苷酸序列可以与核苷酸序列的任何组合叠加,以产生具有所希望的表型的植物、植物部分或植物细胞。叠加的组合可以通过任何方法来产生,包括但不限于,通过任何常规的方法学的杂交育种植物或通过遗传转化(即,分子叠加)。如果是通过遗传转化这些植物来进行叠加的,感兴趣的核苷酸序列可以在任何时间并且以任何次序进行组合。例如,包含一种或多种所希望的性状的转基因植物可以用作通过后续转化而引入另外的性状的靶标。另外的核苷酸序列可以在共转化方案中与由表达盒的任何组合提供的本发明的核苷酸序列、核酸分子、核酸构建体、和/或组合物同时引入。例如,如果将引入两个核苷酸序列,则它们可以掺入在分开的盒(反式)中或可以掺入在相同的盒(顺式)上。多核苷酸的表达可以通过相同的启动子或通过不同的启动子来驱动。应进一步认识到多核苷酸可以使用位点特异性重组系统在所希望的基因组位置处叠加。参见例如,国际专利申请公开号WO99/25821;WO 99/25854;WO 99/25840;WO 99/25855以及WO 99/25853。
表达盒还可以包括一种或多种多肽的编码序列,这一种或多种多肽用于主要受益者是种子公司、栽培者或谷物加工者的农艺性状。感兴趣的多肽可以是由感兴趣的核苷酸序列编码的任何多肽。适合用于在植物中产生的感兴趣的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状是如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、和/或真菌抗性。参见例如,美国专利号5,569,823;5,304,730;5,495,071;6,329,504;以及6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的性状)的多肽,或是允许对展现感兴趣性状(例如,选择性标记、种皮颜色等)的植物进行鉴定的多肽。不同的感兴趣的多肽,以及用于将这些多肽引入植物的方法描述于例如,美国专利号4,761,373、4,769,061、4,810,648、4,940,835、4,975,374、5,013,659、5,162,602、5,276,268、5,304,730、5,495,071、5,554,798、5,561,236、5,569,823、5,767,366、5,879,903、5,928,937、6,084,155、6,329,504以及6,337,431;以及美国专利公开号2001/0016956中。还参见,万维网上的lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/。
赋予对抑制生长点或分生组织的除草剂(例如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于本发明的一些实施例中。对于突变型ALS和AHAS酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659针对抵抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下核酸的植物细胞和植物,所述核酸编码突变型谷氨酰胺合成酶(GS),所述突变型谷氨酰胺合成酶抵抗已知抑制GS的除草剂(例如,草胺膦和甲硫氨酸磺基肟(methionine sulfoximine))的抑制作用。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶A羧化酶(ACCase)赋予。
赋予对草甘膦抗性的由核苷酸序列编码的多肽也适用于本发明。参见例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,所述抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合酶基因赋予。
编码对磷酰基化合物(例如草铵膦或草胺膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见欧洲专利申请号0 242246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他合适的多核苷酸包括编码对抑制光合作用的除草剂(例如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的合适多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物构造或发育中的改变(包括发育时间方面的变化)的多核苷酸。参见例如,美国专利公开号2001/0016956和美国专利号6,084,155。
另外的合适的多核苷酸包括对杀有害生物(例如杀昆虫)多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应认识到在植物中对控制昆虫或其他有害生物必要的杀有害生物多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。有用于另外的昆虫或有害生物抗性的多核苷酸例如包括如下核苷酸序列,它们编码芽孢杆菌属(Bacillus)生物中鉴定到的毒素。已经克隆了包含编码来自几个亚种的苏云金芽孢杆菌(Bt)Cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和鞘翅目昆虫幼虫是有毒的。此类Bt杀昆虫蛋白的实例包括以下Cry蛋白,例如Cry1Aa、Cry1Ab、Cry1Ac、Cry1B、Cry1C、Cry1D、Cry1Ea、Cry1Fa、Cry3A、Cry9A、Cry9B、Cry9C等,连同营养期杀昆虫蛋白例如Vip1、Vip2、Vip3等。Bt来源的蛋白质的完整清单可以在万维网在苏塞克斯大学(University of Sussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,Crickmore et al.(1998)Microbiol.Mol.Biol.Rev.62:807-813[Crickmore等人(1998)微生物分子生物学综述,62:807-813])。
适合在植物中产生的多肽进一步包括改进或通过其他方式有助于收获的植物和/或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量和/或分布、改进的发酵特性、增加的油含量、增加的蛋白含量、改进的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量和/或增加的维生素含量))的那些。感兴趣的多肽还包括例如在收获的作物中导致或促成不需要的成分,例如植酸、或降解糖的酶类的含量降低的那些。“导致(resulting in)”或“促成(contributing to)”是指这种感兴趣的多肽可以直接或间接地促成感兴趣的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。
在一个实施例中,多肽有助于改进的食品或饲料的可消化性。木聚糖酶是半纤维素分解酶,这些酶改善了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。
来自真菌和细菌微生物的多种木聚糖酶已经得到鉴别和表征(参见例如,美国专利号5,437,992;Coughlin et al.(1993)“Proceedings of the Second TRICELSymposium on Trichoderma reesei Cellulases and Other Hydrolases”Espoo[Coughlin等人(1993)“里氏木霉纤维素酶和其他水解酶的第二TRICEL研讨会论文集”,埃斯波];Souminen and Reinikainen,eds.(1993)Foundation for Biotechnical andIndustrial Fermentation Research 8:125-135[Souminen和Reinikainen编著(1993)生物技术和工业发酵研究基金会,8:125-135];美国专利公开号2005/0208178;以及PCT公开号WO 03/16654)。具体地说,在里氏木霉(T.reesei)中已经鉴别出三种特异性木聚糖酶(XYL-I、XYL-II、和XYL-III)(Tenkanen et al.(1992)Enzyme Microb.Technol.14:566[Tenkanen等人(1992)酶与微生物技术,14:566];Torronen et al.(1992)Bio/Technology10:1461[Torronen等人(1992)生物/技术,10:1461];以及Xu et al.(1998)Appl.Microbiol.Biotechnol.49:718[Xu等人(1998)应用微生物与生物技术,49:718])。
在另一个实施例中,对于本发明有用的多肽可以是多糖降解酶。产生这样的酶的本发明的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。
多糖降解酶包括:淀粉降解酶,例如α-淀粉酶(EC 3.2.1.1)、葡糖醛酸酶(E.C.3.2.1.131);外-1,4-α-D葡聚糖酶,例如淀粉糖化酶和葡糖淀粉酶(EC 3.2.1.3)、β-淀粉酶(EC 3.2.1.2)、α-糖苷酶(EC 3.2.1.20)以及其他外-淀粉酶;淀粉脱支酶,例如a)异淀粉酶(EC 3.2.1.68)、支链淀粉酶(EC 3.2.1.41)等;b)纤维素酶,例如外-1,4-3-纤维二糖水解酶(EC 3.2.1.91)、外-1,3-β-D-葡聚糖酶(EC 3.2.1.39)、β-糖苷酶(EC 3.2.1.21);c)L-阿拉伯糖酶,例如内-1,5-α-L-阿拉伯糖酶(EC 3.2.1.99)、α-阿拉伯糖苷酶(EC3.2.1.55)等;d)半乳聚糖酶,例如内-1,4-β-D-半乳聚糖酶(EC 3.2.1.89)、内-1,3-β-D-半乳聚糖酶(EC 3.2.1.90)、α-半乳糖苷酶(EC 3.2.1.22)、β-半乳糖苷酶(EC 3.2.1.23)等;e)甘露聚糖酶,例如内-1,4-β-D-甘露聚糖酶(EC 3.2.1.78)、β-甘露糖苷酶(EC3.2.1.25)、α-甘露糖苷酶(EC 3.2.1.24)等;f)木聚糖酶,例如内-1,4-β-木聚糖酶(EC3.2.1.8)、β-D-木糖苷酶(EC 3.2.1.37)、1,3-β-D-木聚糖酶等;以及g)其他酶,例如α-L-岩藻糖苷酶(EC 3.2.1.51)、α-L-鼠李糖苷酶(EC 3.2.1.40)、果聚糖酶(EC 3.2.1.65)、菊粉酶(EC 3.2.1.7)等。在一个实施例中,α-淀粉酶是描述于美国专利号8,093,453中的合成α-淀粉酶Amy797E,将该专利通过引用以其全文结合在此。
可以与本发明一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(Aspergillus)、木霉属(Trichoderma)、毛霉属(Mucor)和根霉属(Rhizopus),如黑曲霉(A.niger)、泡盛曲霉(A.awamori)、米曲霉(A.oryzae)和米黑毛霉(M.miehei)获得的那些。在一些实施例中,本发明的多肽可以是纤维二糖水解酶(CBH)(EC3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是CBH1或CBH2。
与本发明一起使用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(EC 3.2.1.55);木质素酶;脂肪酶(例如,E.C.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1.6葡糖苷酶(例如,E.C.3.2.1.20);酯酶,如阿魏酸酯酶(EC3.1.1.73)和乙酰基木聚糖酯酶(EC 3.1.1.72);以及角质酶(例如E.C.3.1.1.74)。
在一些实施例中,本发明提供了如下转基因非人类宿主细胞,该细胞包含本发明的多核苷酸、核酸分子、嵌合基因、表达盒或重组载体。转基因非人类宿主细胞可以包括但不限于植物细胞、酵母细胞、细菌细胞或昆虫细胞。因此,在一些实施例中,本发明提供了选自以下属的细菌细胞:芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacillus)、梭菌属(Clostridium)、致病杆菌属(Xenorhabdus)、发光杆菌属(Photorhabdus)、巴斯德氏芽菌属(Pasteuria)、埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯菌属(Klebsiella)、沙门氏菌属(Salmonella)、巴氏杆菌属(Pasteurella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、嗜甲基菌属(Methylophilius)、农杆菌属(Agrobacterium)、醋杆菌属(Acetobacter)、乳杆菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)或产碱杆菌属(Alcaligenes)。因此,例如,作为生物昆虫控制剂,本发明的Cry蛋白可以通过在细菌细胞中表达编码本发明的Cry蛋白的嵌合基因而产生。例如,在一个实施例中,提供了包含本发明的嵌合基因的苏云金芽孢杆菌细胞。
在另外的实施例中,本发明提供了作为双子叶植物细胞或单子叶植物细胞的植物细胞。在另外的实施例中,该双子叶植物细胞选自下组,该组由以下各项组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、糖用甜菜细胞以及烟草细胞。在另外的实施例中,该单子叶植物细胞选自下组,该组由以下各项组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。在一些实施例中,本发明提供了多个双子叶植物细胞或单子叶植物细胞,这些细胞表达由本发明的嵌合基因编码的本发明的毒性蛋白。在其他实施例中,将该多个细胞并列以形成质外体并且使其在自然光照中生长。
在本发明的另一个实施例中,在高等生物(例如,植物)中表达本发明的毒性蛋白。在这种情况下,表达有效量的毒性蛋白的转基因植物保护自身免受植物有害生物如昆虫有害生物的伤害。在昆虫开始以这种转基因植物为食时,它也摄取了这种已表达的毒素。这可以妨碍昆虫进一步咬食植物组织或者甚至可以伤害或杀死昆虫。本发明的多核苷酸被插入表达盒中,然后该表达盒被稳定地整合到植物的基因组中。在另一个实施例中,该多核苷酸被包括在非致病性自我复制病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,并且包括但不限于玉米(玉蜀黍)、大豆、水稻、小麦、大麦、黑麦、燕麦、高粱、粟、向日葵、红花、糖用甜菜、棉花、甘蔗、油菜、苜蓿、烟草、花生、蔬菜(包括甘薯、豆类、豌豆、菊苣、莴苣、甘蓝、花椰菜、西兰花、芜菁、胡萝卜、茄子、黄瓜、萝卜、菠菜、马铃薯、番茄、芦笋、洋葱、大蒜、瓜类、胡椒、芹菜、南瓜、西葫芦、绿皮西葫芦)、水果(包括苹果、梨、榅桲、李、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉)和特种植物如拟南芥以及木本植物如针叶树和落叶树。优选地,本发明的植物是作物植物,如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、糖用甜菜、甘蔗、烟草、大麦、油菜等。
一旦所希望的多核苷酸已经被转化进特定的植物种类中,便可以使用传统的育种技术将其在该种类中繁殖或将其转移到相同种类的其他品种中,特别是包括商业品种。
在转基因植物中表达本发明的多核苷酸,由此导致在这些转基因植物中相应Cry蛋白的生物合成。以此方式,产生在存在昆虫压力下具有增强的产量保护的转基因植物。用于它们在转基因植物中的表达,本发明的核苷酸序列可能需要修饰和优化。尽管在许多情况下,来自微生物有机体的基因能够在植物中高水平表达而无需修饰,在转基因植物中的低表达可能是由于微生物核苷酸序列的缘故,这些序列具有在植物中并不优选的密码子。在本领域中已知,活生物具有特定的密码子使用偏好,而且在本发明中所描述的这些核苷酸序列的密码子可以被改变以符合植物偏好,同时维持由其编码的氨基酸。此外,在植物(例如玉米植物)中高表达最好是由如下编码序列实现的,这些编码序列具有至少约35%、或至少约45%、或至少约50%、或至少约60%的GC含量。具有低GC含量的微生物核苷酸序列在植物中也许表达欠佳,这是由于存在着可能使信息不稳定的ATTTA基序,以及可导致不恰当的多腺苷酸化的AATAAA基序。尽管某些基因序列可以在单子叶植物和双子叶植物种类两者中充分表达,但是可以对序列进行修饰以便迎合单子叶植物或双子叶植物的特定密码子偏好以及GC含量偏好,因为这些偏好已经被证明是不同的(Murray et al.Nucl.AcidsRes.17:477-498(1989)[Murray等人,核酸研究,17:477-498(1989)])。此外,针对不正常剪接位点的存在来对这些核苷酸序列进行筛选,这些位点可能导致信息平截(messagetruncation)。使用描述于例如美国专利号5,625,136、5,500,365和6,013,523中的方法,使用熟知的定点诱变、PCR以及合成基因构建技术对在这些核苷酸序列之内所有需要做出的变化(如以上所描述的那些)进行改变。
在一些实施例中,本发明提供了根据披露于美国专利号5,625,136中的程序制备的合成基因,将该专利通过引用结合在此。在这个操作中,使用了玉蜀黍偏好的密码子,即最频繁地编码玉蜀黍中的氨基酸的单一密码子。针对特定的氨基酸的玉蜀黍偏好的密码子可源自例如来自玉蜀黍的已知基因序列。例如,针对来自玉蜀黍植物的28个基因的玉蜀黍密码子使用发现于以下文献中:Murray et al.,Nucleic Acids Research 17:477-498(1989)[Murray等人,核酸研究,17:477-498(1989)],将其披露内容通过引用结合在此。本发明的确切示例的用玉蜀黍优化密码子制备的合成序列由SEQ ID NO:13-20中的任一项代表。以此方式,这些核苷酸序列可以进行优化用于在任何植物中表达。应认识到,核苷酸序列的全部或任何部分可以是优化的或合成的。也就是说,多核苷酸可以包含作为部分天然序列和部分合成优化序列的核苷酸序列。
为了有效的翻译起始,可能需要修饰与起始甲硫氨酸相邻的序列。例如,它们可以通过包含已知在植物中有效的序列而被修饰。Joshi已经提出了针对植物的适当的共有序列(NAR 15:6643-6653(1987)),并且Clonetech提出了另一种共有翻译起始子(1993/1994目录,第210页)。这些共有序列适于与本发明的核苷酸序列一起使用。将这些序列掺入至包含核苷酸序列的构建体中,达到ATG并且包括ATG(同时保持不修饰第二氨基酸),或者可替代地达到ATG后的GTC并且包括ATG后的GTC(具有修饰该转基因的第二氨基酸的可能性)。
本发明的新颖cry蛋白编码序列(作为它们的天然序列或作为如上所述的合成序列)可以可操作地融合至用于在植物中表达的多种启动子(包括组成型、诱导型、时序性调节的、发育调节的、化学调节的、组织优选的以及组织特异性启动子)以制备重组DNA分子(即,嵌合基因)。启动子的选择将取决于表达的时间和空间需要而变化,并且还取决于目标种类而变化。因此,本发明的核苷酸序列在叶、柄(stalk)或茎(stem)、穗、花序(例如穗状花序、圆锥花序、穗轴等)、根、和/或籽苗中的表达是优选的。然而在许多情况下,寻求针对多于一种类型昆虫有害生物的保护,并且因此在多个组织中的表达是令人希望的。尽管已经显示来自双子叶植物的很多启动子在单子叶植物中是可操作的并且反之亦然,但理想的是选择双子叶植物启动子用于在双子叶植物中表达,并且选择单子叶植物启动子用于在单子叶植物中表达。然而,对所选择的启动子的起源并没有限制,足够的是它们在驱动核苷酸序列在所希望的细胞中的表达中是操作性的。
在本发明中有用的组成型启动子的实例包括CaMV 35S和19S启动子(Fraley等人,美国专利号5,352,605,通过引用结合在此)。此外,启动子是从肌动蛋白基因的任一种衍生的,这些肌动蛋白基因在大多数细胞类型中被表达。由McElroy等人(Mol.Gen.Genet.231:150-160(1991)[分子遗传学与普通遗传学,231:150-160(1991)])描述的启动子表达盒可以易于被修饰用于新颖的毒素基因的表达并且特别适用于在单子叶植物宿主中使用。又另一种组成型启动子是从泛素衍生的,泛素是在许多细胞类型中积聚的已知的另一种基因产物。泛素启动子已经从一些物种中克隆用于在转基因植物中使用,例如在向日葵(Binet etal.,1991.Plant Science 79:87-94[Binet等人,1991,植物科学,79:87-94])、玉蜀黍(Christensen et al.,1989.Plant Molec.Biol.12:619-632[Christensen等人,1989,植物分子生物学,12:619-632])、以及拟南芥属(Norris et al.1993.Plant Molec.Biol.21:895-906[Norris等人,1993,植物分子生物学,21:895-906])中使用。玉蜀黍泛素启动子已经在转基因单子叶植物系统中得到发展,并且它的序列以及构建用于单子叶植物转化的载体披露于专利公开EP 0 342 926中。泛素启动子适用于新颖的毒素基因在转基因植物(尤其是单子叶植物)中的表达。
对于在植物(特别是玉蜀黍)中表达本发明的新颖cry蛋白编码序列有用的组织特异性或组织优先启动子是指导在根、髓、叶或花粉中的表达的那些。此类启动子披露于美国专利号5625136中,通过引用以其全文结合在此。在本发明中有用的其他组织特异性启动子包括棉花二磷酸核酮糖羧化酶(rubisco)启动子,披露于美国专利号6,040,504中;水稻蔗糖合成酶启动子,披露于美国专利号5,604,121中;以及夜香树黄化曲叶病毒启动子,披露于美国专利号7,166,770中,所有这些专利都通过引用以其全文结合。对于指导新颖毒素基因在植物中的表达有用的化学诱导型启动子披露于美国专利号5,614,395中(通过引用以其全文结合在此)。
本发明的核苷酸序列也可以在被化学调节的启动子的调节下进行表达。这使得本发明的Cry蛋白能够仅在用诱导化学品对作物植物进行处理时被合成。用于基因表达的化学诱导的此类技术的实例详述于公开申请EP 0 332 104和美国专利号5,614,395中。在一个实施例中,该化学调节的启动子是烟草PR-1a启动子。
另一类在本发明中有用的启动子是创伤可诱导的启动子。已经描述了数量众多的在创伤部位并且还在植物病原菌感染的部位表达的启动子。理想的是,这样的启动子在昆虫入侵的部位应该仅有局部活性,并且以此方式这些杀昆虫蛋白仅在需要合成这些杀昆虫蛋白的细胞中积聚以杀死入侵的昆虫有害生物。这类启动子的实例包括由以下文献所描述的那些:Stanford et al.Mol.Gen.Genet.215:200-208(1989)[Stanford等人,分子遗传学与普通遗传学,215:200-208(1989)];Xu et al.Plant Molec.Biol.22:573-588(1993)[Xu等人,植物分子生物学,22:573-588(1993)];Logemann et al.Plant Cell 1:151-158(1989)[Logemann等人,植物细胞,1:151-158(1989)];Rohrmeier&Lehle,PlantMolec.Biol.22:783-792(1993)[Rohrmeier和Lehle,植物分子生物,22:783-792(1993)];Firek et al.Plant Molec.Biol.22:129-142(1993)[Firek等人,植物分子生物学,22:129-142(1993)]以及Warner et al.Plant J.3:191-201(1993)[Warner等人,植物杂志,3:191-201(1993)]。
导致在本发明中有用的组织特异性表达模式的启动子的非限制性实例包括绿色组织特异性的、根特异性的、茎特异性的和/或花特异性的。适用于在绿色组织中表达的启动子包括调节参与光合作用的基因的许多启动子,并且这些中的许多已经从单子叶植物和双子叶植物两者中得以克隆。一种这样的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,Plant Molec.Biol.12:579-589(1989)[Hudspeth和Grula,植物分子生物学,12:579-589(1989)])。另一种用于根特异性表达的启动子是由以下文献描述的启动子:de Framond(FEBS 290:103-106(1991)[de Framond(FEBS 290:103-106(1991)]或美国专利号5,466,785。另一种在本发明中有用的启动子是描述于美国专利号5,625,136中的茎特异性启动子,它天然地驱动玉蜀黍trpA基因的表达。
除了选择适合的启动子之外,用于在植物中表达杀昆虫毒素的构建体还需要适当的可操作地连接在异源核苷酸序列下游的转录终止子。一些此类的终止子是可获得的并且在本领域中是已知的(例如来自CaMV的tml,来自rbcS的E9)。任何已知在植物中发挥功能的可供使用的终止子均可以在本发明的上下文下使用。
可以将数量众多的其他序列掺入本发明所描述的表达盒中。这些序列包括已经显示出增强表达的序列,如内含子序列(例如,来自Adhl和bronzel)以及病毒的前导序列(例如,来自TMV、MCMV、和AMV)。
本发明的核苷酸序列在植物中针对不同的细胞定位的靶向表达可能是更优选的。在一些情况下,在胞质溶胶中的定位可能是令人希望的,而在其他情况下,在某个亚细胞器中的定位可能是优选的。用于靶向例如植物中的基因产物的任何机构都可以用于实践本发明,并且已知此类机构存在于植物中并且已经相当详细地表征了控制这些机构的功能的序列。已经表征了导致将基因产物靶向其他细胞区室的序列。氨基末端序列可以负责将感兴趣的蛋白质靶向任何细胞区室,如植物的液泡、线粒体、过氧化物酶体、蛋白体、内质网、叶绿体、淀粉颗粒、淀粉体、质外体或细胞壁(例如Unger et.al.Plant Molec.Biol.13:411-418(1989)[Unger等人,植物分子生物学,13:411-418(1989)];Rogers et.al.(1985)Proc.Natl.Acad.Sci.USA 82:6512-651[Rogers等人(1985)美国国家科学院院刊,82:6512-651];美国专利号7,102,057;WO 2005/096704,将其全部通过引用而特此结合)。任选地,信号序列可以是来自waxy的N-末端信号序列、来自γ-玉米蛋白的N-末端信号序列、淀粉结合结构域、C-末端淀粉结合结构域、将成熟蛋白引入叶绿体的叶绿体靶向序列(Comaiet.al.(1988)J.Biol.Chem.263:15104-15109[Comai等人(1988)生物化学杂志,263:15104-15109];van den Broeck,et.al.(1985)Nature 313:358-363[van den Broeck等人(1985)自然,313:358-363];美国专利号5,639,949)或来自糊粉细胞的分泌信号序列(Koehler&Ho,Plant Cell 2:769-783(1990)[Koehler和Ho,植物细胞,2:769-783(1990)])。另外,与羧基末端序列结合的氨基末端序列负责基因产物的液泡靶向(Shinshiet.al.(1990)Plant Molec.Biol.14:357-368[Shinshi等人(1990)植物分子生物学,14:357-368])。在一个实施例中,所选择的信号序列包括已知的切割位点,并且构建的融合体考虑了在一个或多个切割位点之后的需要切割的任何氨基酸。在一些情况下,这个要求可以通过在切割位点与转基因ATG之间添加小数目的氨基酸,或可替代地置换转基因序列内的一些氨基酸来满足。这些构建技术在本领域是熟知的并且同样适用于任何细胞区室。
应认识到,用于细胞靶向的上述机构不仅可以与其同源启动子结合使用,还可以与异源启动子结合使用,从而在启动子的转录调节下实现特定的细胞靶向目标,该启动子具有不同于自其衍生靶向信号的启动子的表达谱。
植物转化
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下各项的转化:细菌介导的核酸递送(例如,经由农杆菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)和/或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:Miki等人(“Procedures for Introducing ForeignDNA into Plants”in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.and Thompson,J.E.,Eds.(CRC Press,Inc.,Boca Raton,1993),pages 67-88[在Glick,B.R.和Thompson,J.E.编辑的植物分子生物学与生物技术方法中的“用于将外来DNA引入植物中的程序”(CRC出版公司,波卡拉顿,1993),第67-88页])和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002)[细胞与分子生物学快报,7:849-858(2002)])。
对于农杆菌介导的转化,二元载体或携带至少一个T-DNA边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且仅含有感兴趣的构建体的线性DNA可以是优选的。在直接基因转移的情况下,可以使用以单个DNA种类的转化或共转化(Schocher et al.,Biotechnology 4:1093-1096(1986)[Schocher等人,生物技术,4:1093-1096(1986)])。对于直接基因转移以及农杆菌介导的转移二者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草丁膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。
农杆菌介导的转化是用于转化植物(特别是双子叶植物)的常用方法,这是由于其高转化效率并且由于其在许多不同物种中的广泛实用性。农杆菌介导的转化典型地涉及将携带感兴趣的外来DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株或者在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes et al.(1993)Plant Cell 5:159-169[Uknes等人(1993)植物细胞,5:159-169])。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到目标农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元载体转移至农杆菌中(&Willmitzer(1988)Nucleic Acids Res.16:9877[和Willmitzer(1988)核酸研究,16:9877])。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050、5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有感兴趣的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的核酸)推进到植物组织中。
在另一个实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单一启动子的控制下表达多个开放阅读框。在以下文献中广泛描述了质体转化技术:美国专利号5,451,513、5,545,817和5,545,818;PCT申请号WO 95/16783;以及McBride et al.(1994)Proc.Nati.Acad.Sci.USA 91,7301-7305[McBride等人(1994)美国国家科学院院刊,91,7301-7305]。基本的叶绿体转化技术涉及将位于选择性标记侧翼的经克隆的质体DNA区连同感兴趣的基因一起引入适合的靶组织中,这是例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或PEG介导的转化)来进行的。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16S rRNA和rps12基因(赋予针对大观霉素和/或链霉素的抗性)的点突变用作供转化用的选择性标记(Svab,Z.,Hajdukiewicz,P.,andMaliga,P.(1990)Proc.Natl.Acad.Sci.USA 87,8526-8530[Svab,Z.、Hajdukiewicz,P.和Maliga,P.(1990)美国国家科学院院刊,87,8526-8530];Staub,J.M.,and Maliga,P.(1992)Plant Cell 4,39-45[Staub,J.M.和Maliga,P.(1992)植物细胞,4,39-45])。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(Staub,J.M.,andMaliga,P.(1993)EMBO J.12,601-606[Staub,J.M.和Maliga,P.(1993)欧洲分子生物学杂志,12,601-606])。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aadA基因)置换隐性的rRNA或r蛋白抗生素抗性基因而获得(Svab,Z.,and Maliga,P.(1993)Proc.Natl.Acad.Sci.USA 90,913-917[Svab,Z.和Maliga,P.(1993)美国国家科学院院刊,90,913-917])。先前,这种标记已经被成功地用于莱茵衣藻(Chlamydomonas reinhardtii)这种绿藻的质体基因组的高频率转化(Goldschmidt-Clermont,M.(1991)Nucl.Acids Res.19:4083-4089[Goldschmidt-Clermont,M.(1991)核酸研究,19:4083-4089])。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。
选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分和/或植物细胞。如在此使用的,“选择性标记(selectable marker)”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分和/或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分和/或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码可选择的或可筛选的标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,R基因座性状)。当然,适合的选择性标记的许多实例在本领域中是已知的并且可以用于在此描述的表达盒中。
选择性标记的实例包括但不限于编码neo或nptII的核苷酸序列,它赋予对卡那霉素、G418等的抗性(Potrykus et al.(1985)Mol.Gen.Genet.199:183-188[Potrykus等人(1985)分子遗传学与普通遗传学,199:183-188]);编码bar的核苷酸序列,它赋予对草丁膦的抗性;编码改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合酶的核苷酸序列,它赋予对草甘膦的抗性(Hinchee et al.(1988)Biotech.6:915-922[Hinchee等人(1988)生物技术,6:915-922]);编码腈水解酶(如来自臭鼻克雷伯菌(Klebsiella ozaenae)的bxn)的核苷酸序列,它赋予对溴草腈的抗性(Stalker et al.(1988)Science 242:419-423[Stalker等人(1988)科学,242:419-423]);编码改变的乙酰乳酸合酶(ALS)的核苷酸序列,它赋予对咪唑啉酮、磺酰脲或其他ALS-抑制化学品的抗性(欧洲专利申请号154204);编码甲氨蝶呤-抗性的二氢叶酸还原酶(DHFR)的核苷酸序列(Thillet et al.(1988)J.Biol.Chem.263:12500-12508[Thillet等人(1988)生物化学杂志,263:12500-12508]);编码茅草枯脱卤素酶的核苷酸序列,它赋予对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(PMI))的核苷酸序列,它赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸盐合酶的核苷酸序列,它赋予对5-甲基色氨酸的抗性;和/或编码hph的核苷酸序列,它赋予对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
另外的选择性标记包括但不限于编码β-葡糖醛酸酶的核苷酸序列或编码对于多种显色底物已知的酶的uidA(GUS);编码在植物组织中对花色苷色素(红色)进行调节的产物的R基因座核苷酸序列(Dellaporta et al.,“Molecular cloning of the maize R-njallele by transposon-tagging with Ac”263-282 In:Chromosome Structure andFunction:Impact of New Concepts,18th Stadler Genetics Symposium(Gustafson&Appels eds.,Plenum Press 1988)[Dellaporta等人,“染色体结构与功能:新概念的影响中的通过Ac转座子标签技术对玉蜀黍R-nj等位基因的分子克隆”,第18届斯特德莱遗传学专题讨论会(Gustafson和Appels编著,Plenum出版社,1988)]);编码β-内酰胺酶的核苷酸序列,对于β-内酰胺酶而言多种显色底物是已知的(例如,PADAC,一种显色头孢菌素)(Sutcliffe(1978)Proc.Natl.Acad.Sci.USA 75:3737-3741[Sutcliffe(1978)美国国家科学院院刊,75:3737-3741]);编码xylE的核苷酸序列,xylE编码儿茶酚双加氧酶(Zukowskyet al.(1983)Proc.Natl.Acad.Sci.USA 80:1101-1105[Zukowsky等人(1983)美国国家科学院院刊,80:1101-1105]);编码酪氨酸酶的核苷酸序列,酪氨酸酶能够氧化酪氨酸成为DOPA和多巴醌,其进而缩合形成黑色素(Katz et al.(1983)J.Gen.Microbiol.129:2703-2714[Katz等人(1983)普通微生物学杂志,129:2703-2714]);编码β-半乳糖苷酶的核苷酸序列,对于β-半乳糖苷酶而言存在显色底物;编码荧光素酶(lux)的核苷酸序列,荧光素酶允许生物发光检测(Ow et al.(1986)Science 234:856-859[Ow等人(1986)科学,234:856-859]);编码水母发光蛋白的核苷酸序列,水母发光蛋白可以在钙敏感的生物发光检测中采用(Prasher et al.(1985)Biochem.Biophys.Res.Comm.126:1259-1268[Prasher等人(1985)生物化学与生物物理学研究通讯,126:1259-1268]);或编码绿色荧光蛋白的核苷酸序列(Niedz et al.(1995)Plant Cell Reports 14:403-406[Niedz等人(1995)植物细胞报道,14:403-406])。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
此外,如本领域中所熟知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物和/或培养的原生质体再生而来。例如在以下文献中描述了从植物细胞、植物组织培养物和/或培养的原生质体进行的植物再生:Evans etal.(Handbook of Plant Cell Cultures,Vol.1,MacMilan Publishing Co.New York(1983))[Evans等人(植物细胞培养手册,第1卷,麦克米兰出版公司,纽约(1983))];和Vasil I.R.(ed.)(Cell Culture and Somatic Cell Genetics of Plants,Acad.Press,Orlando,Vol.I(1984),and Vol.II(1986))[Vasil I.R.(编著)(植物的细胞培养和体细胞遗传学,学术出版社,奥兰多,第I卷(1984)和第II卷(1986))]。
另外,工程化进以上所述的本发明的转基因种子和植物、植物部分和/或植物细胞中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。
因此,可以按本领域熟知的任何数目的方法(如上所述的)将多核苷酸引入该植物、植物部分和/或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的具体方法,相反可以使用允许将该一种或多种多核苷酸稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单一核酸分子的一部分、或者作为分开的核酸分子而进行组装,并且可以位于相同的或不同的核酸分子上。因此,可以在单一转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入感兴趣的细胞中。
本发明的另外的实施例包括从本发明的转基因植物和/或其部分产生的收获产物以及从所述收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中所述种子或其他植物部分包含本发明的核酸分子/多核苷酸/核苷酸序列。
在其他实施例中,本发明提供了来自本发明的转基因种子和/或转基因植物的提取物,其中该提取物包含本发明的核酸分子、多核苷酸、核苷酸序列或毒性蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,de la Torre et al.,Food,Agric.Environ.2(1):84-89(2004)[de la Torre等人,食品农业与环境,2(1):84-89(2004)];Guidet,Nucleic Acids Res.22(9):1772-1773(1994)[Guidet,核酸研究,22(9):1772-1773(1994)];Lipton et al.,Food Agric.Immun.12:153-164(2000)[Lipton等人,食品农业通讯,12:153-164(2000)])。
杀昆虫组合物
在一些实施例中,本发明提供了杀昆虫组合物,该组合物包含农业上可接受的载体中的本发明的Cry蛋白。如在此使用的,“农业上可接受的载体”可以包括与该活性组分结合以有助于它施用于植物或其部分的天然或合成、有机或无机材料。农业上可接受的载体的实例包括但不限于粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。农业上可接受的载体进一步包括但不限于可用于农业配制品中的惰性组分、分散剂、表面活性剂、佐剂、增粘剂、粘着剂、粘合剂或其组合。此类组合物可以按使杀昆虫蛋白或其他有害生物控制剂与这些有害生物接触的任何方式施用。因此,可以将这些组合物施用于植物或植物部分的表面,包括种子、叶、花、茎、块茎、根等。另一种农业上可接受的载体可以是转基因植物或植物部分。
在另外的实施例中,该杀昆虫组合物包含本发明的转基因细菌细胞,其中该细菌细胞包含本发明的嵌合基因。例如,这样的杀昆虫组合物可以通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩包含本发明的多核苷酸的苏云金芽孢杆菌细胞的培养物来制备。在另外的实施例中,该组合物包含按重量计从约1%至约99%的本发明的Cry蛋白。
本发明的Cry蛋白可以与其他有害生物控制剂组合使用,以增加有害生物目标范围或用于预防和/或管理昆虫抗性。因此,在一些实施例中,本发明提供了控制一种或多种植物有害生物的组合物,其中该组合物包含本发明的第一Cry蛋白和不同于该第一Cry蛋白的第二有害生物控制剂。在其他实施例中,该组合物是用于局部施用至植物的配制品。在仍其他实施例中,该组合物是转基因植物。在另外的实施例中,该组合物是局部施用至转基因植物的配制品的组合。在一个实施例中,当该转基因植物包含第二有害生物控制剂时,该配制品包含本发明的第一Cry蛋白。在另一个实施例中,当该转基因植物包含本发明的第一Cry蛋白时,该配制品包括第二有害生物控制剂。
在一些实施例中,该第二有害生物控制剂可以是选自下组的试剂,该组由以下各项组成:化学杀有害生物剂、苏云金芽孢杆菌(Bt)杀昆虫蛋白、致病杆菌属杀昆虫蛋白、发光杆菌属杀昆虫蛋白、侧孢短芽孢杆菌(Brevibacillus laterosporus)杀昆虫蛋白、球形芽孢杆菌(Bacillus sphaericus)杀昆虫蛋白、蛋白酶抑制剂(丝氨酸和半胱氨酸类型两者)、凝集素、α-淀粉酶、过氧化物酶以及胆固醇氧化酶。
在其他实施例中,该第二有害生物控制剂是选自下组的化学杀有害生物剂,该组由以下各项组成:拟除虫菊酯、氨基甲酸酯、新烟碱、神经元钠通道阻断剂、杀昆虫大环内酯、γ-氨基丁酸(GABA)拮抗剂、杀昆虫脲以及保幼激素模拟物。在另一个实施例中,该化学杀有害生物剂选自下组,该组由以下各项组成:阿巴美丁、乙酰甲胺磷、啶虫脒、磺胺螨酯(amidoflumet)(S-1955)、除虫菌素(avermectin)、印楝素、甲基谷硫磷、联苯菊酯、联苯肼酯(binfenazate)、噻嗪酮、克百威、溴虫腈、定虫隆、毒死蜱、甲基毒死蜱、环虫酰肼、噻虫胺、氟氯氰菊酯、β-氟氯氰菊酯、三氯氟氰菊酯、λ-三氯氟氰菊酯、氯氰菊酯、灭蝇胺、溴氰菊酯、杀螨隆、二嗪磷、除虫脲、乐果、苯虫醚、甲氨基阿维菌素、硫丹、高氰戊菊酯、乙虫腈、苯硫威(fenothicarb)、苯氧威、甲氰菊酯、唑螨酯、氰戊菊酯、氟虫腈、氟啶虫酰胺、氟氰戊菊酯、τ-氟胺氰菊酯、嘧虫胺(UR-50701)、氟虫脲、地虫硫磷、氯虫酰肼、氟铃脲、吡虫啉、茚虫威、异柳磷、虱螨脲、马拉硫磷、聚乙醛、甲胺磷、杀扑磷、灭多威、烯虫酯、甲氧氯、久效磷、甲氧虫酰肼、噻虫醛(nithiazin)、双苯氟脲、多氟脲(XDE-007)、杀线威、对硫磷、甲基对硫磷、氯菊酯、甲拌磷、伏杀磷、亚胺硫磷、磷胺、抗蚜威、丙溴磷、吡蚜酮、啶虫丙醚、蚊蝇醚、鱼藤酮、多杀菌素、螺甲螨酯(spiromesifin)(BSN 2060)、硫丙磷、虫酰肼、伏虫隆、七氟菊酯、特丁硫磷、杀虫畏、噻虫啉、噻虫嗪、硫双威、杀虫双(thiosultap-sodium)、四溴菊酯、敌百虫和杀铃脲、涕灭威、杀线威、苯线磷、双甲脒、灭螨猛、乙酯杀螨醇、三环锡、三氯杀螨醇、除螨灵、依杀螨、喹螨醚、苯丁锡、甲氰菊酯、唑螨酯、噻螨酮、克螨特、哒螨灵以及吡螨胺。在另一个实施例中,该化学杀有害生物剂选自下组,该组由以下各项组成:氯氰菊酯、三氯氟氰菊酯、氟氯氰菊酯和β-氟氯氰菊酯、高氰戊菊酯、氰戊菊酯、四溴菊酯、苯硫威、灭多威、杀线威、硫双威、噻虫胺、吡虫啉、噻虫啉、茚虫威、多杀菌素、阿巴美丁、除虫菌素(avermectin)、苯虫醚、硫丹、乙虫腈、氟虫腈、氟虫脲、杀铃脲、苯虫醚、蚊蝇醚、吡蚜酮以及双甲脒。
在另外的实施例中,该第二有害生物控制剂可以是任何数目的苏云金芽孢杆菌杀昆虫蛋白中的一种或多种,包括但不限于Cry蛋白、营养期杀昆虫蛋白(VIP)以及任何前述杀昆虫蛋白的杀昆虫嵌合体。在其他实施例中,该第二有害生物控制剂是选自下组的Cry蛋白,该组由以下各项组成:Cry1Aa、Cry1Ab、Cry1Ac、Cry1Ad、Cry1Ae、Cry1Af、Cry1Ag、Cry1Ah、Cry1Ai、Cry1Aj、Cry1Ba、Cry1Bb、Cry1Bc、Cry1Bd、Cry1Be、Cry1Bf、Cry1Bg、Cry1Bh、Cry1Bi、Cry1Ca、Cry1Cb、Cry1Da、Cry1Db、Cry1Dc、Cry1Dd、Cry1Ea、Cry1Eb、Cry1Fa、Cry1Fb、Cry1Ga、Cry1Gb、Cry1Gc、Cry1Ha、Cry1Hb、Cry1Hc、Cry1Ia、Cry1Ib、Cry1Ic、Cry1Id、Cry1Ie、Cry1If、Cry1Ig、Cry1Ja、Cry1Jb、Cry1Jc、Cry1Jd、Cry1Ka、Cry1La、Cry1Ma、Cry1Na、Cry1Nb、Cry2Aa、Cry2Ab、Cry2Ac、Cry2Ad、Cry2Ae、Cry2Af、Cry2Ag、Cry2Ah、Cry2Ai、Cry2Aj、Cry2Ak、Cry2Al、Cry2Ba、Cry3Aa、Cry3Ba、Cry3Bb、Cry3Ca、Cry4Aa、Cry4Ba、Cry4Ca、Cry4Cb、Cry4Cc、Cry5Aa、Cry5Ab、Cry5Ac、Cry5Ad、Cry5Ba、Cry5Ca、Cry5Da、Cry5Ea、Cry6Aa、Cry6Ba、Cry7Aa、Cry7Ab、Cry7Ac、Cry7Ba、Cry7Bb、Cry7Ca、Cry7Cb、Cry7Da、Cry7Ea、Cry7Fa、Cry7Fb、Cry7Ga、Cry7Gb、Cry7Gc、Cry7Gd、Cry7Ha、Cry7Ia、Cry7Ja、Cry7Ka、Cry7Kb、Cry7La、Cry8Aa、Cry8Ab、Cry8Ac、Cry8Ad、Cry8Ba、Cry8Bb、Cry8Bc、Cry8Ca、Cry8Da、Cry8Db、Cry8Ea、Cry8Fa、Cry8Ga、Cry8Ha、Cry8Ia、Cry8Ib、Cry8Ja、Cry8Ka、Cry8Kb、Cry8La、Cry8Ma、Cry8Na、Cry8Pa、Cry8Qa、Cry8Ra、Cry8Sa、Cry8Ta、Cry9Aa、Cry9Ba、Cry9Bb、Cry9Ca、Cry9Da、Cry9Db、Cry9Dc、Cry9Ea、Cry9Eb、Cry9Ec、Cry9Ed、Cry9Ee、Cry9Fa、Cry9Ga、Cry10Aa、Cry11Aa、Cry11Ba、Cry11Bb、Cry12Aa、Cry13Aa、Cry14Aa、Cry14Ab、Cry15Aa、Cry16Aa、Cry17Aa、Cry18Aa、Cry18Ba、Cry18Ca、Cry19Aa、Cry19Ba、Cry19Ca、Cry20Aa、Cry20Ba、Cry21Aa、Cry21Ba、Cry21Ca、Cry21Da、Cry21Ea、Cry21Fa、Cry21Ga、Cry21Ha、Cry22Aa、Cry22Ab、Cry22Ba、Cry22Bb、Cry23Aa、Cry24Aa、Cry24Ba、Cry24Ca、Cry25Aa、Cry26Aa、Cry27Aa、Cry28Aa、Cry29Aa、Cry29Ba、Cry30Aa、Cry30Ba、Cry30Ca、Cry30Da、Cry30Db、Cry30Ea、Cry30Fa、Cry30Ga、Cry31Aa、Cry31Ab、Cry31Ac、Cry31Ad、Cry32Aa、Cry32Ab、Cry32Ba、Cry32Ca、Cry32Cb、Cry32Da、Cry32Ea、Cry32Eb、Cry32Fa、Cry32Ga、Cry32Ha、Cry32Hb、Cry32Ia、Cry32Ja、Cry32Ka、Cry32La、Cry32Ma、Cry32Mb、Cry32Na、Cry32Oa、Cry32Pa、Cry32Qa、Cry32Ra、Cry32Sa、Cry32Ta、Cry32Ua、Cry33Aa、Cry34Aa、Cry34Ab、Cry34Ac、Cry34Ba、Cry35Aa、Cry35Ab、Cry35Ac、Cry35Ba、Cry36Aa、Cry37Aa、Cry38Aa、Cry39Aa、Cry40Aa、Cry40Ba、Cry40Ca、Cry40Da、Cry41Aa、Cry41Ab、Cry41Ba、Cry42Aa、Cry43Aa、Cry43Ba、Cry43Ca、Cry43Cb、Cry43Cc、Cry44Aa、Cry45Aa、Cry46Aa、Cry46Ab、Cry47Aa、Cry48Aa、Cry48Ab、Cry49Aa、Cry49Ab、Cry50Aa、Cry50Ba、Cry51Aa、Cry52Aa、Cry52Ba、Cry53Aa、Cry53Ab、Cry54Aa、Cry54Ab、Cry54Ba、Cry55Aa、Cry56Aa、Cry57Aa、Cry57Ab、Cry58Aa、Cry59Aa、Cry59Ba、Cry60Aa、Cry60Ba、Cry61Aa、Cry62Aa、Cry63Aa、Cry64Aa、Cry65Aa、Cry66Aa、Cry67Aa、Cry68Aa、Cry69Aa、Cry69Ab、Cry70Aa、Cry70Ba、Cry70Bb、Cry71Aa、Cry72Aa以及Cry73Aa。
在另外的实施例中,该第二有害生物控制剂是选自下组的Vip3营养期杀昆虫蛋白,该组由以下各项组成:Vip3Aa1、Vip3Aa2、Vip3Aa3、Vip3Aa4、Vip3Aa5、Vip3Aa6、Vip3Aa7、Vip3Aa8、Vip3Aa9、Vip3Aa10、Vip3Aa11、Vip3Aa12、Vip3Aa13、Vip3Aa14、Vip3Aa15、Vip3Aa16、Vip3Aa17、Vip3Aa18、Vip3Aa19、Vip3Aa20、Vip3Aa21、Vip3Aa22、Vip3Aa2、Vip3Aa24、Vip3Aa25、Vip3Aa26、Vip3Aa27、Vip3Aa28、Vip3Aa29、Vip3Aa30、Vip3Aa31、Vip3Aa32、Vip3Aa33、Vip3Aa34、Vip3Aa35、Vip3Aa36、Vip3Aa37、Vip3Aa38、Vip3Aa39、Vip3Aa40、Vip3Aa41、Vip3Aa42、Vip3Aa43、Vip3Aa44、Vip3Ab1、Vip3Ab2、Vip3Ac1、Vip3Ad1、Vip3Ad2、Vip3Ae1、Vip3Af1、Vip3Af2、Vip3Af3、Vip3Ag1、Vip3Ag2、Vip3Ag3HM117633、Vip3Ag4、Vip3Ag5、Vip3Ah1、Vip3Ba1、Vip3Ba2、Vip3Bb1、Vip3Bb2以及Vip3Bb3。
在仍另外的实施例中,在转基因植物中共表达本发明的第一Cry蛋白和该第二有害生物控制剂。可以通过将植物遗传工程化以含有并表达所有的必需基因来实现一种以上杀有害生物成分在同一个转基因植物中的共表达。可替代地,可以将植物(亲本1)遗传工程化,用于本发明的Cry蛋白的表达。可以将第二植物(亲本2)遗传工程化,用于第二有害生物控制剂的表达。通过将亲本1与亲本2杂交,获得了表达被引入至亲本1和亲本2中的所有基因的子代植物。
在另外的实施例中,提供了产生对于至少欧洲玉米蛀虫(欧洲玉米螟)有毒的蛋白质的方法,该方法包括培养包含本发明的多核苷酸或嵌合基因或核酸分子或重组载体的转基因非人类宿主细胞,在该宿主产生对于至少欧洲玉米蛀虫(欧洲玉米螟)有毒的蛋白质的条件下。在一些实施例中,该转基因非人类宿主细胞是植物细胞。在一个实施例中,该植物细胞是玉蜀黍细胞。在其他实施例中,植物细胞或玉蜀黍细胞在其下生长的条件包括自然光照。在其他实施例中,该转基因非人类宿主细胞是细菌细胞。在仍其他实施例中,该转基因非人类宿主细胞是酵母细胞。
在其他实施例中,所产生的蛋白质对至少一种另外的昆虫有杀昆虫活性,其中该另外的昆虫选自下组,该组由以下各项组成:黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在其他实施例中,该嵌合基因包含SEQ ID NO:1-5中的任一项。在仍其他实施例中,所产生的蛋白质包含SEQ ID NO:16-20中任一项的氨基酸序列。
在一些实施例中,该嵌合基因包含密码子优化用于在植物中表达的核苷酸序列。在其他实施例中,该嵌合基因包含SEQ ID NO:6-15中的任一项。在另外的实施例中,所产生的蛋白质包含SEQ ID NO:16-25中任一项的氨基酸序列。
在另外的实施例中,本发明提供了产生抗有害生物(例如,抗昆虫)转基因植物的方法,该方法包括向植物中引入包含编码本发明的Cry蛋白的核苷酸序列的本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子,其中该核苷酸序列被表达于该植物中,由此赋予该植物对至少欧洲玉米蛀虫的抗性,并且产生抗有害生物(例如,抗昆虫)转基因植物。在一些实施例中,与缺乏本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子的对照植物相比,抗有害生物转基因植物对至少黑色地老虎(小地老虎)有抗性。在一些实施例中,通过转化植物实现引入。在其他实施例中,通过使包含本发明的嵌合基因、重组载体、表达盒或核酸分子的第一植物与不同的第二植物杂交来实现引入。
在一些实施例中,对至少欧洲玉米蛀虫(欧洲玉米螟)有抗性的本发明的转基因植物还对至少一种另外的昆虫有抗性,其中该另外的昆虫包括但不限于黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在另外的实施例中,提供了控制至少黑色地老虎(小地老虎)昆虫的方法,该方法包括向这些昆虫递送有效量的本发明的Cry蛋白。为了有效,该Cry蛋白首先被昆虫经口摄取。然而,该Cry蛋白可以按许多公认的方式被递送至该昆虫。用于将蛋白质经口递送至昆虫的方式包括但不限于将该蛋白质提供于(1)转基因植物中,其中该昆虫取食(摄取)该转基因植物的一个或多个部分,由此摄取在该转基因植物中表达的多肽;(2)一种或多种配制的蛋白质组合物中,它们可以被施用至或掺入例如昆虫生长介质中;(3)一种或多种蛋白质组合物中,它们可以被施用至表面,例如喷雾在植物部分的表面,然后当该昆虫取食喷雾的一个或多个植物部分时组合物被该昆虫摄取;(4)饵基;(5)经注射进该昆虫;或(6)任何其他本领域公认的蛋白质递送系统。因此,可以使用经口递送至昆虫的任何方法来递送本发明的毒性Cry蛋白。在一些具体实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取转基因植物的一个或多个部分。
在其他实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取用包含本发明的Cry蛋白的组合物喷雾的植物的一个或多个部分。可以使用本领域技术人员已知的用于将化合物、组合物、配制品等施用于植物表面的任何方法将本发明的组合物递送至植物表面。递送至或接触植物或其部分的一些非限制性实例包括喷雾、撒粉、喷洒、分散、下雾、雾化、撒播、浸泡、土壤注入、土壤掺入、浸透(例如,根、土壤处理)、浸渍、灌注、涂覆、叶或茎渗透、侧施或种子处理等及其组合。用于使植物或其部分与一种或多种化合物、一种或多种组合物或一种或多种配制品接触的这些和其他程序是本领域技术人员熟知的。
在一些实施例中,本发明涵盖为农民提供控制鳞翅目昆虫有害生物的手段的方法,该方法包括向该农民供应或出售植物材料如种子,该植物材料包含能够表达本发明的Cry蛋白的多核苷酸、嵌合基因、表达盒或重组载体,如上所述的。
本发明的实施例可以通过参考以下实例而被更好地理解。前述的和以下的本发明的实施例以及各种实施例的描述不是旨在限制权利要求书,而是对其具有说明性。因此,应理解的是权利要求书不旨在限制这些实例的具体细节。本领域技术人员应理解的是本发明的其他实施例可以在不偏离本披露的精神和范围的情况下进行实践,本披露的范围是由所附权利要求书限定的。
实例
实例1.活性Bt菌株的鉴别
将来自当前收集物中存在的孢子的苏云金芽孢杆菌分离株在T3+盘尼西林琼脂平板上进行培养和维持。在28℃下使每种分离株需氧地生长在24孔深块中约10天直至孢子形成,将其通过用考马斯蓝/乙酸染色并且用显微镜可视化来验证。孢子形成之后,将可溶的和不溶的部分都针对感兴趣的鳞翅目种类的活性进行测试。在表面污染生物测定中测试各部分,在该生物测定中将各部分覆盖到多种类人工饲料上。针对至少四种鳞翅目种类(包括玉米穗虫(玉米穗蛾)、小地老虎(黑色地老虎)、欧洲玉米螟(欧洲玉米蛀虫)和草地贪夜蛾(秋黏虫)筛选每种分离物,其中样本量为12只新生幼虫。每个测定的持续时间为在室温下约7天;针对死亡率以及幼虫生长抑制对这些平板评分。将在相对于阴性对照观察到的死亡率增加30%时认为是有效的。基于初始昆虫测试,选择菌株C0588、C0633、C0680和M0262用于进一步分析。
实例2.Bt基因的分离和测序
Fosmid基因组文库构建:对于在实例1中鉴别的一些Bt菌株,使用Park等人(FEMSMicrobiol.Lett.284:28-34(2008)[FEMS微生物学简讯,284:28-34(2008)])描述的fosmid文库方法来分离编码推定活性蛋白质的基因。使用CopyControlTMFosmid LibraryProduction Kit(Epicentre公司,麦迪逊,威斯康星州)根据制造商方案构建fosmid文库。简言之,将来自每个Bt菌株的纯化DNA(约0.5μg)经酶处理以对平端进行修端(endrepair),并且然后连接到fosmid载体pCC1FOS(Epicentre公司)中。在体外包装进λ噬菌体和感染大肠杆菌(E.coli)后,将细菌细胞铺板在含有12.5μg/ml氯霉素的Luria-Bertani(LB)上。在选择菌落之前,将各板在约37℃下孵育24h。将经转染的大肠杆菌菌落转移到含有150μl含氯霉素的LB培养基的96孔平板中,并在37℃下孵育24h。
菌落杂交筛选:以300cfu/100x 15mm L-琼脂加15μg/ml氯霉素平板的密度铺板fosmid文库。总计铺板3000板fosmid。使用Immobilon-Ny+87mm过滤圆片(EMD密理博公司(Millipore),比勒利卡,马萨诸塞州)进行膜杂交。如下完成菌落转移:将滤器置于各板上约5min,然后使用镊子,将滤器从琼脂表面转移并将菌落向上放置在用0.5M NaOH浸泡5min的Whatman滤纸上。然后将菌落滤器放置于2X SSC中浸泡5分钟的Whatman滤纸上。用设定为2000x 100μJ的UV(Stratagene公司,拉荷亚,加利福尼亚州)将DNA固定在膜上。然后将滤器在Whatman滤纸上进行空气干燥。如供应商所述的,将滤器预杂交,并在65℃下在250mM NaPO4(pH 7.0)、7%SDS、1%BSA中杂交。将杂交滤器在65℃下在2X SSC、0.5%SDS中洗涤30min,随后在65℃下在0.2X SSC、0.2%SDS中洗涤30min。在-80℃下用增感屏将滤器暴露于X射线胶片(XAR,飞世尔科技公司(Fisher Scientific),匹兹堡,宾夕法尼亚州)过夜。将阳性菌落影印(patched)到L琼脂(加有15μg/ml氯霉素)上。
杂交探针:设计PCR引物以从指定为C0633的Bt菌株的基因组DNA扩增cry9B样基因的720bp片段。引物对包括具有序列AAACATGAACCGAAATAATCAAAATG(SEQ ID NO:26)的指定为OAR2613a的正向引物和具有序列ATCCGTCCCTTGTGCGTGTAAA(SEQ ID NO:27)的指定为OAR2615a的反向引物。PCR反应在以下循环条件下运行:[94℃,5min],12x[94℃,30sec,57℃至51℃,每次循环下降0.5℃,30sec,72℃2.5min],以及35x[94℃,30sec,52℃,30sec,72℃,2.5min]。该反应含有1X One缓冲液(新英格兰生物实验室(New EnglandBiolabs),贝弗利,马萨诸塞州)、200um dNTP、80ng DNA、2.5U OneDNA聚合酶、50ng各引物和无菌蒸馏水至50μl总反应。
在含有溴化乙锭的1%琼脂糖TAE凝胶上分离得到的扩增子。在UV光下观察扩增子,并从凝胶中切出。使用凝胶提取试剂盒如供应商(凯杰公司(Qiagen),巴伦西亚,加利福尼亚州)所述的分离DNA。使用Rediprime II随机引物标记系统(通用电气医疗集团(GEHealthcare),匹兹堡,宾夕法尼亚州),用EasyTidedCTP 3000Ci/mmol(珀金埃尔默公司(Perkin Elmer),沃尔瑟姆,马萨诸塞州)标记探针。使用Micro Bio-Spin30色谱柱(伯乐公司(BioRad),赫拉克勒斯(Hercules),加利福尼亚州)除去未掺入的核苷酸。将探针在添加至杂交溶液中之前在95℃下加热5min。
Bt基因测序:遵循制造商的说明书(凯杰公司)制备2-4个独立克隆的DNA制剂。根据制造商的说明书,使用BigDyeTMTerminator Kit(应用生物系统公司(AppliedBiosystems)),福斯特城,加利福尼亚州)进行用针对感兴趣的预测核苷酸序列的两条链设计的引物的测序反应。将反应产物在ABI373或ABI377测序仪上进行电泳。使用Phred/Phrap/Consed软件包(华盛顿大学)对所有测序数据进行分析,其误差率在共有序列水平下等于或小于10-4。将序列用程序SequencherTM(4.7版,基因密码公司(Gene Codes Corp.),安阿伯,密歇根州)进行组装。每个基因被测序到4X覆盖度。
实例3.Bt基因克隆和合成
设计Cry9特异性引物对以促进cry9型基因的鉴别和克隆。将引物对设计成伴随加入PmeI限制性位点与cry9型基因的5'末端杂交,并伴随加入AscI限制性位点与3'末端杂交。用于扩增5'末端的引物对包括具有序列GTTTAAACATGAATCGAAATAATCAAAATG(SEQ IDNO:28)的正向引物和具有序列GGCGCGCCCTACTCTTGTGTTTCAATAAA(SEQ ID NO:29)的反向引物。用于扩增3'末端的引物对包括具有序列GTTTAAACATGAATCAAAATAAACACGGA(SEQ ID NO:30)的正向引物和具有序列GGCGCGCCTTACTGTTGGGTTTCCATGAACT(SEQ ID NO:31)的反向引物。插入的限制性位点在相应的引物中加下划线。使用以下循环条件进行PCR反应:[94℃,5min]和30x[94℃,30sec,45℃,30sec,72℃,3.5min]。该反应含有1X OneTaq缓冲液、200umdNTP、80ng DNA、2.5U OneTaq DNA聚合酶(新英格兰生物实验室)、50ng各引物和无菌蒸馏水至50μl总反应。
如供应商(生命技术公司(Life Technologies))所述的,将所得扩增子克隆到TOPO pCR 4.0载体中。如供应商(新英格兰生物实验室)所述的,将分离的质粒DNA用PmeI和AscI消化。
将PmeI/AscI片段克隆到设计用于在大肠杆菌和苏云金芽孢杆菌中表达的指定为pCIB5634`的穿梭载体中。将pCIB5634`载体用PmeI和AscI消化。将消化的载体和基因片段通过在基于1%琼脂糖Tris乙酸盐EDTA缓冲液的凝胶上跑胶而纯化。从凝胶中切出各片段,并使用QIAGEN凝胶提取试剂盒如供应商所述的进行清理。使用来自新英格兰生物实验室的连接试剂盒如供应商所述的将各片段连接在一起。如供应商所述的,将连接反应转化到TOP10细胞(生命技术公司)中,并将其铺板在含有100mg/ml氨苄青霉素的L-琼脂上。从单菌落中分离质粒DNA,并将鉴别的克隆再次测序到2X覆盖度以证实序列正确。
选择用于重组产生但未直接克隆出基因组DNA的一些Bt基因被提交给第三销售方用于全基因合成。将这些合成的Bt基因亚克隆到上述穿梭载体中,用于随后的表达和测试进一步的生物活性。
实例4.基因组组装与分析
使用全基因组测序方法鉴别本发明的一些Bt基因。简言之,使用Covaris S2超声波装置(Covaris公司,沃本,马萨诸塞州)剪切芽孢杆菌属DNA,其中将程序DNA_400bp设为工作循环:10%;强度:4;循环/脉冲:200。将DNA用UltraTMEnd Repair/dA-加尾模块(新英格兰生物实验室公司(New England Biolabs,Inc.),伊普斯维奇,马萨诸塞州)处理。如供应商(新英格兰生物实验室公司,伊普斯维奇,马萨诸塞州)所述的,使用NEBQuick LigationTM连接生物科技(Biooscience)有索引的1-57个适配子(1-27巴西,28-57美国、英国和瑞士)。如供应商(贝克曼库尔特公司(Beckman Coulter,Inc.),印第安纳波利斯,印第安纳州)所述的,使用Agencourt AMPure XP珠粒清理连接物。
将文库如下进行大小分级:将50uL样品与45ul 75%珠粒混合物(25%AMPure珠粒加75%NaCl/PEG溶液TekNova目录号P4136)混合。搅拌混合物并置于磁性支架上。将所得上清液转移至新孔中并且添加45ul 50%珠粒混合物(50%AMPure珠粒加50%NaCl/PEG溶液TekNova目录号P4136)。搅拌此混合物并置于磁性支架上。除去所得上清液并且用80%乙醇洗涤珠粒。添加25uL的洗脱缓冲液(EB)并且将混合物置于磁性支架上。除去所得最终上清液并置于1.5mL管中。这个方法产生了525个DNA碱基对(bp)(插入物加适配子)大小范围内的文库。
使用KAPA Biosystem HiFi Hot Start(KAPA生物系统公司(Kapa Biosystems,Inc.),威尔明顿,马萨诸塞州)使用以下循环条件扩增大小确定的DNA文库:[98℃,45s];12x[98℃,15s,60℃,30s,72℃,30s];[72℃,1min]。每个反应含有:5ul DNA文库、1uL生物科技通用引物(25uM)、18uL无菌水、1uL生物科技有索引的引物(25uM)、25ul2X KAPA HiFi聚合酶。
使用高灵敏度芯片在Agilent 2100 Bioanalyzer(安捷伦科技公司(AgilentTechnologies),圣克拉拉,加利福尼亚州)上跑文库,以确定文库大小范围和平均插入物大小。使用标准的制造商测序方案(亿明达公司(Illumina,Inc.),圣地亚哥,加利福尼亚州)在HiSeq 2500测序系统上针对配对末端(PE)测序(100个循环/读数;12-24个文库/泳道)处理所有文库。
开发用以鉴别和表征可能的毒性基因的芽孢杆菌属计算分析工具来优先化引导物,用于进一步实验室测试。
上述基因组组装与分析以及基因组文库分析在苏云金芽孢杆菌菌株中鉴别出五个Cry9样基因,它们对至少欧洲玉米蛀虫(欧洲玉米螟)有毒性。这些Cry9样基因和蛋白质的鉴别特征示于表1中。
表1.苏云金芽孢杆菌菌株中鉴别的Cry9样基因。
实例5.BT0009、BT0012、BT0013、BT0023和BT0067与已知Bt Cry蛋白的同源性
利用本发明蛋白质的氨基酸序列搜索蛋白质数据库揭示它们与已知的杀昆虫蛋白同源。使用BLAST算法将本发明蛋白质的氨基酸序列与由NCBI维护的非冗余(nr)数据库进行比较,揭示以下蛋白质与本发明的序列具有一批(block)最强的氨基酸一致性(表2)。
表2.本发明的Cry蛋白与已知Cry蛋白的一致性百分比。
实例6.重组宿主细胞中的Bt蛋白表达
芽孢杆菌属表达。将感兴趣的基因通过上述含有适当的Cry蛋白启动子和红霉素抗性标记的pCIB5634`表达载体在不具有可观察到的鞘翅目或鳞翅目活性的无晶芽孢杆菌数菌株中进行表达。通过电穿孔将构建体转化到宿主菌株中,并且随后在含有红霉素的琼脂平板上进行选择。使这些重组菌株在T3培养基中于28℃下生长4-5天至孢子形成阶段。收获细胞沉淀并且在溶解于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中之前反复洗涤。
大肠杆菌表达。使用pET28a或pET29a载体(EMD密理博公司)在各个大肠杆菌菌株中表达感兴趣的基因。通过电穿孔转化构建体,并且随后在含有卡那霉素的琼脂平板上进行选择。使这些重组菌株生长并且使用IPTG诱导在28℃下诱导表达。将细胞再悬浮于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中并且然后使用Microfluidics LV-1匀浆器打碎。
表达分析。然后通过离心澄清所得的细胞裂解液(来自任一宿主),并通过SDS-PAGE和电泳图谱(BioRad Experion)分析样品的纯度。经由Bradford或Thermo660测定确定总蛋白浓度。然后在生物测定中测试经纯化的Cry蛋白。
实例7.Cry蛋白在生物测定中的活性
使用本领域公认的人工饲料生物测定法针对以下昆虫有害生物种类中的一种或多种测试实例6中产生的蛋白质:秋黏虫(FAW;草地贪夜蛾)、玉米穗蛾(CEW;玉米穗虫)、欧洲玉米蛀虫(ECB;欧洲玉米螟)、黑色地老虎(BCW;小地老虎)、甘蔗螟(SCB;小蔗螟)、绒毛豆毛虫(VBC;黎豆夜蛾)、大豆夜蛾(SBL;大豆尺夜蛾(Pseudoplusia includens))、西南玉米蛀虫(SWCB;西南玉米螟)、西部豆切根虫(WBCW;西部豆夜蛾)、烟夜蛾(TBW;烟芽夜蛾)、亚洲玉米蛀虫(ACB;亚洲玉米螟)、棉螟蛉(CBW;棉铃虫)、条纹蛀茎虫(SSB;二化螟)、粉蛀茎虫(PSB;水稻大螟(Sesamia inferens))和水稻卷叶螟(RLF;稻纵卷叶螟)。
向24孔平板中的人工昆虫饲料(Bioserv公司,弗伦奇敦,新泽西州)的表面施加等量的溶液中的蛋白质。在饲料表面干燥之后,向每个孔中添加有待测试的昆虫种类的幼虫。将这些平板密封并且保持在就温度、光照以及相对湿度而言的环境实验室条件下。阳性对照组由暴露于非常具活性且广谱的野生型芽孢杆菌属菌株的幼虫组成。阴性对照组由暴露于仅用缓冲溶液处理的昆虫饲料的幼虫和未处理的昆虫饲料(即只有饲料)上的幼虫组成。约120小时之后评估死亡率并且相对于对照评分。
结果示于表3中,其中“-”意指与对照相比无活性,“+/-”意指与对照相比0-10%的活性(此类别还包括具有强烈幼虫生长抑制的0%死亡率),“+”意指与对照相比10%-25%的活性,“++”意指与对照相比25%-75%的活性,并且“+++”意指与对照相比75%-100%的活性。
表3.Cry蛋白的生物测定结果。
实例8.Cry蛋白在模拟胃液测定中的结局
某些Cry蛋白已经在植物中表达,并且来自这样的植物的种子每年出售给农民用于控制各种昆虫有害生物。使这样的自我保护的杀有害生物产品经历各种监管机构的审查和注册,包括例如美国环保署(EPA)。
膳食暴露是人类可以暴露于转基因植物中表达的Cry蛋白的主要途径。哺乳动物急性经口毒性和蛋白质消化率是EPA对人体健康风险评估的终点。Cry蛋白安全性的进一步科学证据在于,它们已显示使用模拟胃液在体外迅速降解。用代表性Cry1、Cry2和Cry3蛋白进行的七次体外测定的结果确立这些蛋白质通常在30秒内迅速降解。这些结果支持更广泛的结论,即Cry蛋白的这些组的成员(共享显著的氨基酸序列一致性)在人类摄入后可能迅速降解。另一方面考虑是Cry蛋白是否可能引起过敏反应。所证实的Cry蛋白在体外迅速降解应使这种发生的可能性降至最低。相比之下,食物过敏原通常保留在体外胃肠道模型中,而无过敏史的常见食物蛋白在模拟胃液中迅速降解(Metcalfe et al.1996[Metcalfe等人,1996])。
通过对模拟胃液(SGF)中蛋白质消化率的分析可以获得对蛋白质潜在过敏原性的另外的见解。在迄今为止已经测试的转基因植物中表达的几乎所有Cry蛋白都被快速消化,并且因此已被确定为不会引起过敏。然而,发现在称为Starlink的转基因玉米产品中发现的Cry9C蛋白对SGF部分稳定。虽然Starlink Cry9C对动物无毒性,但部分消化率和部分加工稳定性的特性使得EPA很难绝对排除Starlink Cry9C蛋白可成为食物过敏原的可能性,最终导致开发Starlink的公司从美国市场召回产品。
目前,不存在用于确定新颖蛋白的致敏可能性的确定性测试。因此,EPA使用证据权衡法,其中考虑以下因素:性状来源;与已知过敏原的氨基酸序列比较;以及该蛋白质的生物化学性质,包括模拟胃液(SGF)中的体外消化率和糖基化。
模拟胃液(SGF)测定在代表哺乳动物上消化道的严格控制的条件下测量测试蛋白的体外消化率。简言之,在37℃下经一小时的时间段,将细菌产生的测试Cry蛋白(在0.5-5mg/ml的浓度下)以10单位的胃蛋白酶活性/μg测试蛋白的比率暴露于胃蛋白酶(来自猪胃粘膜,溶解于2mg/ml NaCl中,pH 1.2)。将样品在1、2、5、10、30和60分钟时取出,并通过加入预热的(95℃-2分钟)终止缓冲液(65%0.5M碳酸氢钠(pH 11)、35%Tricine加样缓冲液)立即淬灭,以使胃蛋白酶立即失活,并返回加热再持续5分钟。一旦测定完成,便通过SDS-PAGE在10%-20%Tris-Tricine凝胶(肽可见低至1kDa)上检查时间点样品和对照(只有测试蛋白,只有胃蛋白酶))以跟踪由胃蛋白酶进行的消化的动力学和水平。
SGF测定的结果表明本发明的所有Cry蛋白质都非常迅速地降解。这些结果提供了如下证据,即尽管本发明的Cry蛋白与Cry9蛋白家族有关,但是与某些公开的结果相比,例如Starlink中的Cry9C,它们对SGF测定的响应是非常不同的,这表明在蛋白质中的关键胃蛋白酶切割位点具有显著的结构差异。这些结果进一步表明本发明的Cry蛋白的致敏可能性是极小的。
实例9.针对植物表达的基因定向
在植物中表达之前,在自动化基因合成平台(金斯瑞公司(Genscript,Inc.),皮斯卡塔韦,新泽西州)上合成包含编码Bt Cry蛋白BT-0009、BT-0012、BT-0013、BT-0023和BT-0067中每种的核苷酸序列(分别为SEQ ID NO:6-10)的合成多核苷酸以及包含编码突变型Bt Cry蛋白mBT-0009、mBT-0012、mBT-0013、mBT-0023和mBT-0067中每种的核苷酸序列(分别为SEQ ID NO:21-25)的合成多核苷酸。用于这个实例,制备包含可操作地连接至Cry蛋白编码序列(该编码序列可操作地连接至Nos终止子)的玉蜀黍泛素启动子(Ubi1)的第一表达盒,并且制备包含可操作地连接至磷酸甘露糖异构酶(PMI)编码序列(该编码序列可操作地连接至Nos终止子)的Ubi1启动子的第二表达盒。PMI的表达允许在甘露糖上正向选择转基因植物。将两个表达盒克隆进适于农杆菌介导的玉蜀黍转化的载体中。
实例11.Cry蛋白在植物中的表达
未成熟的玉蜀黍胚的转化基本上如在以下文献中描述的来进行:Negrotto etal.,2000,Plant Cell Reports 19:798 803[Negrotto等人,2000,植物细胞报告,19:798-803]内。简言之,使包含描述于实例12中的载体的农杆菌菌株LBA4404(pSB1)在28℃下在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/l琼脂,pH 6.8)固体培养基上生长2-4天。将大约0.8X 109个农杆菌细胞悬浮于补充有100μM As的LS-inf培养基中。在这个培养基中对细菌预诱导大约30-60分钟。
将来自自交玉蜀黍系的未成熟胚从8-12天大的穗中切除到液体LS-inf+100μM As中。用新鲜的感染培养基漂洗这些胚。然后添加农杆菌溶液,并且将这些胚涡旋30秒并且允许其与细菌一起沉降5分钟。然后将这些胚盾片向上地转移到LSA培养基中,并且在暗处培养两到三天。随后,将每皮氏板(petri plate)大约20与25个之间的胚转移至补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中,并且在大约28℃下在黑暗中培养10天。
将产生胚性愈伤组织的未成熟胚转移至LSD1M0.5S培养基中。在这种培养基上对培养物进行持续大约6周的选择,在约3周时进行传代培养步骤。将存活的愈伤组织转移至补充有甘露糖的Reg1培养基中。在光照中(16小时光照/8小时黑暗方案)培养之后,然后将绿色组织转移至没有生长调节剂的Reg2培养基中并且孵育约1-2周。将这些小植株转移至含有Reg3培养基的Magenta GA-7盒(Magenta公司,芝加哥,伊利诺伊州)中并使其在光照中生长。约2-3周之后,通过PCR测试植物的PMI基因和Bt cry基因的存在。将来自PCR测定的阳性植物转移至温室用于进一步评估。
在叶切除生物测定中,针对拷贝数(通过Taqman分析确定)、蛋白质表达水平(通过ELISA确定)和对抗感兴趣的昆虫种类的功效对转基因植物进行评估。确切地说,从单拷贝事件(V3-V4阶段)中切取叶组织并且用新生幼虫侵染,然后在室温下孵育5天。叶圆片生物测定的样品量取决于所测试的昆虫种类(欧洲玉米蛀虫(ECB),n=10;玉米穗蛾(CEW),n=3,黑色地老虎(BCW),n=5)而变化。在大约第3天和第5天读取评估组织损伤和死亡率的读数;样品相对于阴性对照的损伤使用以下量表进行评定:“+”:<5%组织损伤,所有幼虫死亡;“+/-”:5%-20%组织损伤,所有幼虫死亡;或“-”:>20%组织损伤,一些幼虫活着和/或进展到2龄。
转基因植物组织生物测定的结果证实当在转基因植物中表达时本发明的Cry蛋白对于目标昆虫是有毒的。例如,表达于用本发明的嵌合基因稳定转化的玉蜀黍中的mBT-0012对至少欧洲玉米蛀虫(欧洲玉米螟)有活性。
序列表
<110> Syngenta Participations AG
Bramlett, Matthew Richard
Seguin, Katherine
Kramer, Vance Cary
Rose, Mark Scott
<120> 用于控制植物有害生物的组合物和方法
<130> 80670-WO-REG-ORG-P-1
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 3507
<212> DNA
<213> 苏云金芽孢杆菌
<400> 1
atgaatcgaa ataatcaaaa tgaatatgaa gttattgatg ccccacattg tgggtgtccg 60
gcagatgatg ttgtaaaata tcctttgaca gatgatccga atgctggatt gcaaaatatg 120
aactataagg aatatttaca aacgtatggt ggagactata cagatcctct tattaatcct 180
aacttatctg ttagtggaaa agatgtaata caagttggaa ttaatattgt agggagatta 240
ctaagctttt ttggattccc cttttctagt caatgggtta ctgtatatac ctatctttta 300
aacagcttgt ggccggatga cgagaattct gtatgggacg cttttatgga gagagtagaa 360
gaacttattg atcaaaaaat ctcagaagca gtaaagggta gggcattgga tgacctaact 420
ggattacaat ataattataa tttatatgta gaagcattag atgagtggct gaatagacca 480
aatggcgcaa gggcatcctt agtttctcag cgatttaaca ttttagatag cctatttaca 540
caatttatgc caagctttgg ctctggtcct ggaagtcaaa attatgcaac tatattactt 600
ccagtatatg cacaagcagc aaaccttcat ttgttattat taaaagatgc agacatttat 660
ggagctagat gggggctgaa tcaaactcaa atagatcaat tccattctcg tcaacaaagc 720
cttactcaga cttatacaaa tcattgtgtt actgcgtata atgatggatt agcggaatta 780
agaggcacaa gcgttgcgag ttggctcaaa tatcatcaat accgtaggga aatgacagta 840
acggcaatgg atttagtggc attattccca tactataatg ttagacaata tccaaatggg 900
gcaaatccac aacttacacg tgaggtatat acagatccaa tcgtatttaa tccgcctgag 960
cgtccaagtg gcgctttctg cgaaagtttt tatactatcc gagcggctcg agaacgttta 1020
actttttcgc aacttgaaca tgcaataatt cgtccgccgc gcttgtttga aaggtttcaa 1080
gctttaggga tttatacagg cgaggcgcga ctgaatgcaa atagtgctcc aatgaactat 1140
tggattggac attttataag aaatacacgt ttaggtgact caacaacaat tactacaaat 1200
tatggaacaa ccaataatcg tttaactaac ttcagtatgc cttctgatgt ttatcaaatc 1260
aattcaacct caagtaattt agccgctatt ttaggcactt tatatggggt tactagagca 1320
caattccatt ttggatcagg aagtttttcg acgtatgtcg gacaaaatag cgttcttcca 1380
caatgtcatc aaaactataa ttcaatagaa gaattaccaa accaaagcga tgaacctaca 1440
gttagaagtt atagccatag attatctcat atcacctctt ttaatttcaa tgtacagctt 1500
aataatcctt taatttctgc gggcaatatg cctgtatatg tgtggacaca tcgcagtgtg 1560
gaccttacta acaggatttc ttcagataga attactcaaa taccagtggt aaaggcatat 1620
gagctaagta gtggtgctac tgtcgtgaaa ggtccaggat tcacaggagg agatgtaatc 1680
cgaagaacaa atactggtgg attcggagca ataagggtgt cggtcactgg accgctaaca 1740
caacgatatc gcataaggtt ccgttatgct tcgacaatag attttgattt ctttgtaaca 1800
cgtggaggaa ctactataaa taattttaga tttacacgta caatgaacag gggacaggaa 1860
tcaagatatg aatcctatcg tactgtagag tttacaactc cttttaactt tacacaaagt 1920
caagatataa ttcgaacatc tatccaggga cttagtggaa atggggaagt ataccttgat 1980
agaattgaaa tcatccctgt aaatccaaca cgagaagcgg aagaggattt agaagcggcg 2040
aagaaagcgg tggcgagctt gtttacacgc acaagggacg gattacaagt aaatgtgaaa 2100
gattatcaag tcgatcaagc ggcaaattta gtgtcatgct tatcagatga acaatatggg 2160
tatgacaaaa agatgttatt ggaagcggta cgcgcggcaa aacgcctcag ccgagaacgt 2220
aacttacttc aggacccaga ttttaataca atcaatagta cagaagaaaa tggatggaaa 2280
gcaagtaacg gcgttactat tagtgagggc ggtccattct ataaaggccg tgcacttcag 2340
ctagcaagtg cacgagaaaa ttatccaaca tacatttatc aaaaagtaga tgcatcggag 2400
ttaaaacctt atacacgata tagactagat gggttcgtga agagtagtca agatttagaa 2460
attgatctca ttcaccatca taaagtccat cttgtgaaaa atgtaccaga taatttagta 2520
tctgatactt acccagatga ttcttgtagt ggaatcaatc gatgtcagga acaacagatg 2580
gtaaatgcgc aactggaaac agagcatcat catccgatgg attgctgtga agcagctcaa 2640
acacatgagt tttcttccta tattgataca ggggatttaa attcgactgt agaccaggga 2700
atctgggtga tctttaaagt tcgaacaacc gatggttatg cgacgttagg aaatcttgaa 2760
ttggtagagg tcggaccgtt attgggtgaa cctctagaac gtgaacaaag agaaaatgcg 2820
aaatggaatg cagagttagg aagaaaacgt gcagaaacag atcgcgtgta tcaagatgcc 2880
aaacaatcca tcaatcattt atttgtggat tatcaagatc aacaattaaa tccagaaata 2940
gggatggcag atattatgga cgctcaaaat cttgtcgcat caatttcaga tgtatatagc 3000
gatgccgtac tgcaaatccc tggaattaac tatgagattt acacagagct gtccaatcgc 3060
ttacaacaag catcgtatct gtatacgtct cgaaatgcgg tgcaaaatgg ggactttaac 3120
aacgggctag atagctggaa tgcaacagcg ggtgcatcgg tacaacagga tggcaatacg 3180
catttcttag ttctttctca ttgggatgca caagtttctc aacaatttag agtgcagccg 3240
aattgtaaat atgtattacg tgtaacagca gagaaagtag gcggcggaga cggatacgtg 3300
actatccggg atgatgctca tcatacagaa acgcttacat ttaatgcatg tgattatgat 3360
ataaatggca cgtacgtgac tgataatacg tatctaacaa aagaagtggt attctattca 3420
catacagatc acatgtgggt agaggtaagt gaaacagaag gtgcatttca tatagatagt 3480
attgaattcg ttgaaacaga aaagtaa 3507
<210> 2
<211> 3471
<212> DNA
<213> 苏云金芽孢杆菌
<400> 2
atgaatcaaa ataaacacgg aattattggc gcttccaatt gtggttgtgc atctgatgat 60
gttgcgaaat atcctttagc caacaatcca tattcatctg ctttaaattt aaattcttgt 120
caaaatagta gtattctcaa ctggattaac ataataggcg atgcagcaaa agaagcagta 180
tctattggga caaccatagt ctctcttatc acagcacctt ctcttactgg attaatttca 240
atagtatatg accttatagg taaagtacta ggaggtagta gtggacaatc catatcagat 300
ttgtctatat gtgacttatt atctattatt gatttacggg taagtcagag tgtcttaaat 360
gatgggattg cagattttaa tggttctgta ctcttataca ggaactattt agaggctctg 420
gatagctgga ataagaatcc taattctgct tctgctgaag aactccgtac tcgttttaga 480
atcgccgact cagaatttga tagaatttta acccgagggt ctttaacgaa tggtggctcg 540
ttagctagac aaaatgccca aatattatta ttaccttctt ttgcgagcgc tgcatttttc 600
catttattac tactaaggga tgctactaga tatggcacta attgggggct atacaatgct 660
acacctttta taaattatca atcaaaacta gtagagctta ttgaactata tactgattat 720
tgcgtacatt ggtataatcg aggtttcaac gaactaagac aacgaggcac tagtgctaca 780
gcttggttag aatttcatag atatcgtaga gagatgacat tgatggtatt agatatagta 840
gcatcatttt caagtcttga tattactaat tacccaatag aaacagattt tcagttgagt 900
agggtcattt atacagatcc aattggtttt gtacatcgta gtagtcttag gggagaaagt 960
tggtttagct ttgttaatag agctaatttc tcagatttag aaaatgcaat acctaatcct 1020
agaccgtctt ggtttttaaa taatatgatt atatctactg gttcacttac attgccggtt 1080
agcccaagta ctgatagagc gagggtatgg tatggaagtc gagatcgaat ttcccctgct 1140
aattcacaat ttattactga actaatctct ggacaacata cgactgctac acaaactatt 1200
ttagggcgaa atatatttag agtagattct caagcttgta atttaaatga taccacatat 1260
ggagtgaata gggcggtatt ttatcatgat gcgagtgaag gttctcaaag atccgtgtac 1320
gaggggtata ttcgaacaac tgggatagat aaccctagag ttcaaaatat taacacttat 1380
ttacctggag aaaattcaga tatcccaact ccagaagact atactcatat attaagcaca 1440
acaataaatt taacaggagg acttagacaa gtagcatcta atcgccgttc atctttagta 1500
atgtatggtt ggacacataa aagtctggct cgtaacaata ccattaatcc agatagaatt 1560
acacagatac cattgacgaa ggttgatacc cgaggcacag gtgtttctta tgtgaatgat 1620
ccaggattta taggaggagc tctacttcaa aggactgacc atggttcgct tggagtattg 1680
agggtccaat ttccacttca cttaagacaa caatatcgca ttagagtccg ttatgcttct 1740
acaacaaata ttcgattgag tgtgaatggc agtttcggta ctatttctca aaatctccct 1800
agtacaatga gattaggaga ggatttaaga tacggatctt ttgctataag agagtttaat 1860
acttctatta gacccactgc aagtccggac caaattcgat tgacaataga accatctttt 1920
attagacaag aggtctatgt agatagaatt gagttcattc cagttaatcc gacgcgagag 1980
gcgaaagagg atctagaagc agcaaaaaaa gcggtggcga gcttgtttac acgcacaagg 2040
gacggattac aagtaaatgt gaaagattat caagtcgatc aagcggcaaa tttagtgtca 2100
tgcttatcag atgaacaata tgggtatgac aaaaagatgt tattggaagc ggtacgtgcg 2160
gcaaaacgac ttagccgaga acgcaactta cttcaggatc cagattttaa tacaattaat 2220
agtacagaag aaaatggatg gaaagcaagt aacggcgtta ctattagtga gggcgggcca 2280
ttctataaag gccgtgcaat tcagctagca agcgcacgag aaaattatcc aacatacatt 2340
tatcaaaaag tagatgcatc ggagttaaag ccatatacac gctatagact ggatggattc 2400
gtgaagagta gtcaagattt agaaattgat ctcattcacc atcataaagt ccatcttgtg 2460
aaaaatgtac cagataattt agtacttgat acttacccag atgattcctg caacggaatt 2520
aaccgttgtg atgaacagaa gatggtaaat gcgcaactgg aaacagaaca tcatcatccg 2580
atggattgct gtgaagcggc tcaaacacat gagttttctt cctatattaa tacaggcgat 2640
ctaaatgcaa gtgtagatca aggcatttgg gttgtattga aagttcgaac aacagatggt 2700
tatgcgacgc taggaaatct tgaattggta gaggtcggac cgttatcggg tgaatctcta 2760
gaacgtgaac aaagggataa tgcgaaatgg agtgcagagc taggaagaaa gcgtgcagaa 2820
acagagagag tatattatgc tgccaaacaa tccatcaatc atttatttgt ggattatcga 2880
gatcaacaat taaatccaca aatagggatg gcagatatta tggacgctca aaatcttgtc 2940
gcatcaattt cagatgtata tagcgatgcc gtactgcaaa tccctggaat taactatgag 3000
atttacacag agctatccaa tcgcttacaa caagcatcgt atctgcatat gtctcgaaat 3060
gcgatgcaaa atggggactt taacagcggt ctagatagtt ggaatgcaac agcgggtgct 3120
acggtacaac aggatggcaa tacgcatttc ttagttcttt ctcattggga tgcacaagtt 3180
tctcaacaat ttagagtgca gccgaattgt aaatatgtat tacgtgtaac agcagagaaa 3240
gtaggcggcg gagacggata cgtgacaatc cgggatggtg ctcatcatac agaaacgctt 3300
acatttaatg catgtgatta tgatataaat ggcacgtacg tgactgataa tacgtatcta 3360
acaaaagaag tggtattcca tccggagaca caacatatgt gggtagaggt aagtgaaaca 3420
gaaggtgttt tccatataga cagtgttgag ttcatggaaa cccaacagta a 3471
<210> 3
<211> 3471
<212> DNA
<213> 苏云金芽孢杆菌
<400> 3
atgaatcaaa ataaacacgg aattattggc gcttccaatt gtggttgtgc atctgatgat 60
gttgcgaaat atcctttagc caacaatcca tattcatctg ctttaaattt aaattcttgt 120
caaaatagta gtattctcaa ctggattaac ataataggcg atgcagcaaa agaagcagta 180
tctattggga caaccatagt ctctcttatc acagcacctt ctcttactgg attaatttca 240
atagtatatg accttatagg taaagtacta ggaggtagta gtggacaatc catatcagat 300
ttgtctatat gtgacttatt atctattatt gatttacggg taagtcagag tgtcttaaat 360
gatgggattg cagattttaa tggttctgta ctcttataca ggaactattt agaggctctg 420
gatagctgga ataagaatcc taattctgct tctgctgaag aactccgtac tcgttttaga 480
atcgccgact cagaatttga tagaatttta acccgagggt ctttaacgaa tggtggctcg 540
ttagctagac aaaatgccca aatattatta ttaccttctt ttgcgagcgc tgcatttttc 600
catttattac tactaaggga tgctactaga tatggcacta attgggggct atacaatgct 660
acacctttta taaattatca atcaaaacta gtagagctta ttgaactata tactgattat 720
tgcgtacatt ggtataatcg aggtttcaac gaactaagac aacgaggcac tagtgctaca 780
gcttggttag aatttcatag atatcgtaga gagatgacat tgatggtatt agatatagta 840
gcatcatttt caagtcttga tattactaat tacccaatag aaacagattt tcagttgagt 900
agggtcattt atacagatcc aattggtttt gtacatcgta gtagtcttag gggagaaagt 960
tggtttagct ttgttaatag agctaatttc tcagatttag aaaatgcaat acctaatcct 1020
agaccgtctt ggtttttaaa taatatgatt atatctactg gttcacttac attgccggtt 1080
agcccaagta ctgatagagc gagggtatgg tatggaagtc gagatcgaat ttcccctgct 1140
aattcacaat ttattactga actaatctct ggacaacata cgactgctac acaaactatt 1200
ttagggcgaa atatatttag agtagattct caagcttgta atttaaatga taccacatat 1260
ggagtgaata gggcggtatt ttatcatgat gcgagtgaag gttctcaaag atccgtgtac 1320
gaggggtata ttcgaacaac tgggatagat aaccctagag ttcaaaatat taacacttat 1380
ttacctggag aaaattcaga tatcccaact ccagaagact atactcatat attaagcaca 1440
acaataaatt taacaggagg acttagacaa gtagcatcta atcgccgttc atctttagta 1500
atgtatggtt ggacacataa aagtctggct cgtaacaata ccattaatcc agatagaatt 1560
acacagatac cattgacgaa ggttgatacc cgaggcacag gtgtttctta tgtgaatgat 1620
ccaggattta taggaggagc tctacttcaa aggactgacc atggttcgct tggagtattg 1680
agggtccaat ttccacttca cttaagacaa caatatcgca ttagagtccg ttatgcttct 1740
acaacaaata ttcgattgag tgtgaatggc agtttcggta ctatttctca aaatctccct 1800
agtacaatga gattaggaga ggatttaaga tacggatctt ttgctataag agagtttaat 1860
acttctatta gacccactgc aagtccggac caaattcgat tgacaataga accatctttt 1920
attagacaag aggtctatgt agatagaatt gagttcattc cagttaatcc gacgcgagag 1980
gcgaaagagg atctagaagc agcaaaaaaa gcggtggcga gcttgtttac acgcacaagg 2040
gacggattac aagtaaatgt gaaagattat caagtcgatc aagcggcaaa tttagtgtca 2100
tgcttatcag atgaacaata tgggtatgac aaaaagatgt tattggaagc ggtacgtgcg 2160
gcaaaacgac ttagccgaga acgcaactta cttcaggatc cagattttaa tacaattaat 2220
agtacagaag aaaatggatg gaaagcaagt aacggcgtta ctattagtga gggcgggcca 2280
ttctataaag gccgtgcaat tcagctagca agcgcacgag aaaattatcc aacatacatt 2340
tatcaaaaag tagatgcatc ggagttaaag ccatatacac gctatagact ggatggattc 2400
gtgaagagta gtcaagattt agaaattgat ctcattcacc atcataaagt ccatcttgtg 2460
aaaaatgtac cagataattt agtacttgat acttacccag atgattcctg caacggaatt 2520
aaccgttgtg atgaacagaa gatggtaaat gcgcaactgg aaacaggaca tcatcatccg 2580
atggattgct gtgaagcggc tcaaacacat gagttttctt cctatattaa tacaggcgat 2640
ctaaatgcaa gtgtagatca aggcatttgg gttgtattga aagttcgaac aacagatggt 2700
tatgcgacgc taggaaatct tgaattggta gaggtcggac cgttatcggg tgaatctcta 2760
gaacgtgaac aaagggataa tgcgaaatgg agtgcagagc taggaagaaa gcgtgcagaa 2820
acagagagag tatattatgc tgccaaacaa tccatcaatc atttatttgt ggattatcaa 2880
gatcaacaat taaatccaca aatagggatg gcagatatta tggacgctca aaatcttgtc 2940
gcatcaattt cagatgtata tagcgatgcc gtactgcaaa tccctggaat taactatgag 3000
atttacacag agctatccaa tcgcttacaa caagcatcgt atctgcatac gtctcgaaat 3060
gcgatgcaaa atggggactt taacagcggt ctagatagtt ggaatgcaac agcgggtgct 3120
acggtacaac aggatggcaa tacgcatttc ttagttcttt ctcattggga tgcacaagtt 3180
tctcaacaat ttagagtgca gccgaattgt aaatatgtat tacgtgtaac agcagagaaa 3240
gtaggcggcg gagacggata cgtgacaatc cgggatggtg ctcatcatac agaaacgctt 3300
acatttaatg catgtgatta tgatataaat ggcacgtacg tgactgataa tacgtatcta 3360
acaaaagaag tggtattcca tccggagaca caacatatgt gggtagaggt aagtgaaaca 3420
gaaggtgttt tccatataga cagtgttgag ttcatggaaa cccaacagta a 3471
<210> 4
<211> 3459
<212> DNA
<213> 苏云金芽孢杆菌
<400> 4
atgaatcgaa ataatccaaa tgaatatgaa attattgatg ccccctattg tgggtgtccg 60
tcagatgatg atgtgaggta tcctttggca agtgacccaa atgcagcgtt ccaaaatatg 120
aactataaag agtatttaca aacgtatgat ggagactaca caggttctct tatcaatcct 180
aacttatcta ttaatcctag agatgtacta caaacaggta ttaatattgt gggaagaata 240
ctagggtttt taggtgttcc atttgcgggt caactagtta ctttctatac ctttctctta 300
aatcagttgt ggccaactaa tgataatgca gtatgggaag cttttatggc gcaaatagaa 360
gagctaatcg atcaaaaaat atcggcgcaa gtagtaagga atgcactcga tgacttaact 420
ggattacacg attattatga ggagtattta gcagcattag aggagtggct ggaaagaccg 480
aacggagcaa gagctaactt agttacacag aggtttgaaa acctgcatac tgcatttgta 540
actagaatgc caagctttgg tacgggtcct ggtagtcaaa gagatgcggt agcgttgttg 600
acggtatatg cacaagcagc gaatttgcat ttgttattat taaaagatgc agaaatctat 660
ggggcaagat ggggacttca acaagggcaa attaacttat attttaatgc tcaacaagaa 720
cgtactcgaa tttataccaa tcattgcgtg gaaacatata atagaggatt agaagatgta 780
agaggaacaa atacagaaag ttggttaaat taccatcgat tccgtagaga gatgacatta 840
atggcaatgg atttagtggc cttattccca tactataatg tgcgacaata tccaaatggg 900
gcaaatccac agcttacacg tgaaatatat acggacccaa tcgtatataa tccaccagct 960
aatcagggaa tttgccgacg ttgggggaat aatccgtata atacattttc tgaacttgaa 1020
aatgctttta ttcgcccgcc acatcttttt gataggttga atagattaac tatttctaga 1080
aaccgatata cagctccaac aactaatagc tacctagact attggtcagg tcatacttta 1140
caaagccagt atgcaaataa cccgacgaca tatgaaacta gttacggtca gattacctct 1200
aacacacgtt tattcaatac gactaatgga gccaatgcaa tagattcaag ggcaagaaat 1260
tttggtaact tatacgctaa tttgtatggc gttagcagct tgaacatttt cccaacaggt 1320
gtgatgagtg aaatcacctc agcccctaat acgtgttggc aagaccttac tacaactgag 1380
gaactaccac tagtgaataa taattttaat cttttatctc atgttacttt cttacgcttc 1440
aatactactc agggtggccc ccttgcaact gtagggtttg tacccacata tgtgtggaca 1500
cgtcaagatg tagattttaa taatataatt actcccaata gaattactca aataccagtg 1560
gtaaaggcat atgagctaag tagtggtgct actgtcgtga aaggtccagg attcacagga 1620
ggagatgtaa tccgaagaac aaatactggt ggattcggag caataagggt gtcggtcact 1680
ggaccgctaa cacaacgata tcgcataagg ttccgttatg cttcgacaat agattttgat 1740
ttctttgtaa cacgtggagg aactactata aataatttta gatttacacg tacaatgaac 1800
aggggacagg aatcaagata tgaatcctat cgtactgtag agtttacaac tccttttaac 1860
tttacacaaa gtcaagatat aattcgaaca tctatccagg gacttagtgg aaatggggaa 1920
gtataccttg atagaattga aatcatccct gtaaatccaa cacgagaagc ggaagaggat 1980
ttagaagcgg cgaagaaagc ggtggcgagc ttgtttacac gcacaaggga cggattacaa 2040
gtaaatgtga cagattatca agtcgatcaa gcggcaaatt tagtgtcatg cttatcagat 2100
gaacaatatg cgcatgataa aaagatgtta ttggaagcgg tacgcgcggc aaaacgcctc 2160
agccgagaac gtaacttact tcaggaccca gattttaata caatcaatag tacagaagaa 2220
aatggatgga aagcaagtaa cggcgttact attagtgagg gcggtccatt ctataaaggc 2280
cgtgcacttc agctagcaag tgcacgagaa aattacccaa catacatcta tcaaaaagta 2340
gatgcatcgg agttaaaacc ttatacacga tatagactgg atgggttcgt gaagagtagt 2400
caagatttag aaattgatct cattcaccat cataaagtcc atcttgtgaa aaatgtacta 2460
gataatttag tatctgatac ttacccagat gattcttgta gtggaatcaa tcgatgtgag 2520
gaacaacaga tggtaaatgc gcaactggaa acagaacatc atcatccgat ggattgctgt 2580
gaagcagctc aaacacatga gttttcttcc tatattgata caggggattt aaattcgact 2640
gtagaccagg gaatctgggt gatctttaaa gttcgaacaa cagatggtta tgcgacgcta 2700
ggaaatcttg aattggtaga ggtcggaccg ttattgggtg aacctctaga acgtgaacaa 2760
agagaaaatg cgaaatggaa tgcagagtta ggaagaaaac gtgcagaaac agatcgcgtg 2820
tatcaagatg ccaaacaatc catcaatcat ttatttgtgg attatcaaga tcaacaatta 2880
aatccacaaa tagggatggc agatattatg gacgctcaaa atcttgtcgc atcaatttca 2940
gatgtatata gcgatgcagt actgcaaatc cctggaatta actatgagat ttacacagag 3000
ctgtccaatc gcttacaaca agcatcgtat ctgtatacgt ctcgaaatgc ggtgcaaaat 3060
ggggacttta acaacgggct agatagctgg aatgcaacag cgggtgcatc ggtacaacag 3120
gatggcaata cgcatttctt agttctttct cattgggatg cacaagtttc ccaacaattt 3180
agagtgcagc cgaattgtaa atatgtatta cgtgtaacag cagagaaagt aggcggcgga 3240
gacggatacg tgactatccg ggatggtgct catcatacag aaacgcttac atttaatgca 3300
tgtgattatg atataaatgg cacgtacgtg actgataata cgtatctaac aaaagaagtg 3360
atattctatt cacatacaga acacatgtgg gtagaggtaa atgaaacaga aggtgcattt 3420
catatagata gtattgaatt cgttgaaaca gaaaagtaa 3459
<210> 5
<211> 3468
<212> DNA
<213> 苏云金芽孢杆菌
<400> 5
atgaatcgaa ataatcaaga tgaatatgaa attattgacg cttccacttg tggttgttcg 60
tcagatgatg ttgttcaata ccctttggca agagatccga atgctgtatt ccaaaatatg 120
cattataaag attatttgca aacgtatgat ggagactata caggttctct tataaatcct 180
aacttatcta ttaatcctag agatgtactg caaactggaa ttaatattgt gggaagatta 240
ctaggatttc taggtgttcc atttgctggt cagttagtta ctttctatac ctttctttta 300
aatcaactgt ggccaacaaa tgataatgca gtatgggaag cttttatggc acaaatagaa 360
gagcttatta atcaaagaat atccgaagca gtagtaggga cagcagcgga tcatttaacg 420
ggattacacg ataattatga gttatatgta gaggcattgg aggaatggct ggaaagaccg 480
aatgctgcta gaactaatct actttttaat agatttacca ccctagatag tctttttaca 540
caatttatgc caagctttgg tactggacct ggaagtcaaa actacgcagt tccattactt 600
acagtatacg cacaagcagc gaaccttcat ttgttattat taaaggatgc tgaaatatat 660
ggagcaagat ggggactgaa ccaaaatcag attaactcat tccatacgcg ccaacaagaa 720
cgtactcaat attatacaaa tcattgcgta acgacgtata ataccggttt agatagatta 780
agaggcacaa atactgaaag ttggttaaat tatcatcgtt tccgtagaga gatgacatta 840
atggcaatgg atttagtagc gctattccca tattataatg tacgacaata tccaaatgga 900
gcaaatcctc agcttacacg tgaaatatat acagatccaa ttgtatttaa tccaccagct 960
aatgtgggat tatgtagacg ttggggcaat aacccatata atagattttc tgaactagaa 1020
aacgctttta tccgcccgcc acatcttttt gatagattga ataccttaac aattagtaga 1080
aatagatttg acgttgggtc aaactttata gaaccgtggt ctggacatac gttacgccgt 1140
agttattcga ataattcgac agtatatgaa gatagttatg gccaaattac agccacaaga 1200
acaacaatta atctgccggc taatggaact ggccgagtag aatcaacagc agtagatttt 1260
cgtagcgcgc ttgtggggat atacggtgtt aatagagctt cttttattcc aggtggtgtg 1320
tttagtggca cgactcagcc ttctactgga ggatgtagag atttgtatga ttcaagtgat 1380
gaattaccac cagacgaaag tactggaagt tttgcccata gactatctca tgttaccttt 1440
ttaagtttta caactaatca ggccggttcc atagccaatt caggacgcgt ccctacttat 1500
gtctggaccc atcgcgatgt ggactttaat aatacaatta accccaatag aattactcaa 1560
ataccagtgg taaaggcata tgagctaagt agtggtgcta ctgtcgtgaa aggtccagga 1620
ttcacaggag gagatgtaat ccgaagaaca aatattggtg ggttcggagc aataagggtg 1680
tcggtcactg gaccgctaac acaacgatat cgcataaggt tccgttatgc ttcgacaata 1740
gattttgatt tctttgtaac acgtggagga actactataa ataattttag atttacacgt 1800
acaatgaaca ggggacagga atcaagatat gaatcctatc gtactgtaga gtttacaact 1860
ccttttaact ttacacaaag tcaagatata attcgaacat ctatccaggg acttagtgga 1920
aatggggaag tataccttga tagaattgaa atcatccctg taaatccaac acgagaagcg 1980
gaagaggatc tagaagcagc gaagaaagcg gtggcgagct tgtttacacg tacaagggac 2040
ggattacaag taaatgtgac agattatcaa gtcgatcaag cggcaaattt agtgtcatgc 2100
ttatcagatg aacaatatgg gcatgacaaa aagatgttat tggaagcggt aagagcggca 2160
aaacgcctca gccgagaacg caacttactt caagatccag attttaatac aatcaatagt 2220
acagaagaaa atggatggaa agcaagtaac ggcgttacta ttagcgaggg cggtccattc 2280
tataaaggcc gtgcgcttca gctagcaagc gcaagagaaa attacccaac atacatttat 2340
caaaaagtaa atgcatcaga gttaaagccg tatacacgtt atagactgga tgggttcgtg 2400
aagagtagtc aagatttaga aattgatctc attcaccatc ataaagtcca tctcgtgaaa 2460
aatgtaccag ataatttagt atccgatact tactcggatg gttcttgcag tggaatgaat 2520
cgatgtgagg aacaacagat ggtaaatgcg caactggaaa cagaacatca tcatccgatg 2580
gattgctgtg aagcggctca aacacatgag ttttcttcct atattaatac aggcgatcta 2640
aattcaagtg tagatcaagg catttgggtt gtattgaaag ttcgaacaac cgatggttat 2700
gcgacgctag gaaatcttga attggtagag gtcggaccgt tatcgggtga atctctagaa 2760
cgtgaacaaa gggataatgc gaaatggagt gcagagctag gaagaaagcg tgcagaaaca 2820
gatcgcgtgt atcaagatgc caaacaatcc atcaatcatt tatttgtgga ttatcaagat 2880
caacaattaa atccagaaat agggatggca gatattattg acgctcaaaa tcttgtcgca 2940
tcaatttcag atgtgtatag cgatgcagta ctgcaaatcc ctggaattaa ctatgagatt 3000
tacacagagc tatccaatcg cttacaacaa gcatcgtatc tgtatacgtc tcgaaatgcg 3060
gtgcaaaatg gggactttaa cagcggtcta gatagttgga atgcaacagg gggggctacg 3120
gtacaacagg atggcaatac gcatttctta gttctttctc attgggatgc acaagtttct 3180
caacaattta gagtgcagcc gaattgtaaa tatgtattac gtgtaacagc agagaaagta 3240
ggcggcggag acggatacgt gacaatccgg gatggtgctc atcatacaga aaagcttaca 3300
tttaatgcat gtgattatga tataaatggc acgtacgtga ctgataatac gtatctaaca 3360
aaagaagtgg tattctattc acatacagaa cacatgtggg tagaggtaag tgaaacagaa 3420
ggtgcatttc atatagatag tattgaattc gttgaaacag aaaagtaa 3468
<210> 6
<211> 3471
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 6
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtccta ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccgagca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactacagg 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacat gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacataga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 7
<211> 3471
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 7
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtccta ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccgagca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactacagg 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacat gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacataga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 8
<211> 3471
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 8
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtccta ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccggaca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactaccaa 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacac gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacataga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 9
<211> 3459
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 9
atgaacagga acaacccaaa cgagtacgag attattgatg ctccatactg cggctgcccc 60
tccgatgacg atgtgcgcta ccccctcgcc agcgacccga acgccgcgtt ccagaatatg 120
aactacaagg agtacctgca gacctacgac ggcgattaca cggggtcact gattaatcca 180
aacctctcca tcaatcctcg cgacgtcctc cagaccggaa tcaacattgt tggccgcatc 240
ctcggcttcc tgggcgtgcc gttcgctggc cagctggtta ccttctacac gttcctcctg 300
aaccagctct ggcctacgaa tgacaacgcg gtgtgggagg ccttcatggc gcagatcgag 360
gagctgattg atcagaagat ctccgctcag gtggtcagga acgccctcga cgatctgacc 420
ggcctccacg actactacga ggagtacctg gctgctctcg aggagtggct cgagaggcca 480
aacggcgctc gcgctaatct ggtcacgcag cgcttcgaga acctccatac cgccttcgtg 540
acgaggatgc cgagcttcgg gacaggcccc gggtcgcaga gggacgcggt tgctctcctg 600
actgtgtacg cgcaggcggc taacctgcac ctcctgctcc tgaaggatgc tgagatctac 660
ggcgctcggt gggggctgca gcagggccag atcaacctct acttcaatgc ccagcaggag 720
cgcacaagga tctacactaa ccactgcgtt gagacctaca atagggggct cgaggacgtg 780
cggggcacga acacagagag ctggctgaat taccatcgct tccgcaggga gatgacgctc 840
atggcgatgg acctcgtggc gctcttcccc tactacaacg tccgccagta cccaaatggc 900
gccaaccctc agctgacaag ggagatctac actgacccga tcgtgtacaa cccaccagct 960
aatcagggga tctgcaggcg ctggggcaac aatccctaca acaccttctc tgagctggag 1020
aatgcgttca ttaggccacc tcacctcttc gaccgcctga acaggctcac catctcccgg 1080
aatcgctaca cggctccaac cacgaactcg tacctggatt actggtctgg ccataccctc 1140
cagtcacagt acgcgaacaa tcctacaact tacgagacgt cctacggcca gattacaagc 1200
aacactcgcc tcttcaatac cacgaacggc gctaatgcta tcgacagcag ggcccggaac 1260
ttcgggaatc tgtacgcgaa tctctacggc gtctccagcc tgaacatttt cccaaccggc 1320
gttatgtcag agatcacctc cgcccctaac acgtgctggc aggacctcac aactaccgag 1380
gagctgccac tggtgaacaa taacttcaat ctcctgtccc acgtcacatt cctgaggttc 1440
aacacgacac agggcggccc actcgcgact gttggcttcg tgcccaccta cgtgtggacg 1500
cggcaggacg tcgatttcaa taacatcatt acaccaaacc gcatcactca gattcctgtt 1560
gtgaaggcgt acgagctgtc gtctggcgct acagtcgtta agggcccggg gttcactggc 1620
ggggacgtca ttaggaggac taacaccggc gggttcgggg ctatcagggt gagcgtcaca 1680
ggccccctca ctcagcgcta caggattcgg ttccgctacg cgtcgaccat cgacttcgat 1740
ttcttcgtca cgcgcggcgg gactaccatc aataacttcc ggttcacgcg caccatgaac 1800
aggggccagg agagccggta cgagtcgtac cgcaccgtgg agttcacgac accgttcaac 1860
ttcacacaga gccaggacat cattcgcact tctattcagg gcctgtcagg caacggggag 1920
gtttacctcg accggatcga gatcattcca gtgaacccaa ccagggaggc tgaggaggat 1980
ctcgaggctg cgaagaaggc tgtggcctcg ctgttcacta ggacccggga cggcctccag 2040
gttaatgtga cggactacca ggtggatcag gctgccaacc tggtctcgtg cctctctgac 2100
gagcagtacg ctcacgataa gaagatgctc ctggaggccg tccgcgctgc taagaggctg 2160
tcgagggaga ggaacctcct gcaggaccca gatttcaaca ccattaattc tacggaggag 2220
aacgggtgga aggcgtcgaa tggcgtgacc atctctgagg gcgggccttt ctacaagggc 2280
cgcgctctcc agctggcttc agctagggag aactacccga catacatcta ccagaaggtc 2340
gacgcctccg agctgaagcc ctacacgcgc taccgcctcg atggcttcgt gaagtcatcc 2400
caggacctgg agatcgatct cattcaccat cacaaggtcc acctggttaa gaacgtgctg 2460
gacaatctcg tcagcgatac ctacccggac gattcttgct caggcatcaa tcgctgcgag 2520
gagcagcaga tggtgaacgc ccagctcgag accgagcatc accatccgat ggactgctgc 2580
gaggctgctc agacgcatga gttcagctcg tacatcgaca caggggatct gaactccact 2640
gtggaccagg gcatctgggt catcttcaag gtgcgcacta ccgatgggta cgcgaccctc 2700
ggcaacctcg agctggtcga ggttgggccg ctcctgggcg agccactgga gagggagcag 2760
agggagaacg ctaagtggaa tgctgagctg ggcaggaagc gggctgagac cgaccgcgtc 2820
taccaggatg ctaagcagtc catcaatcac ctgttcgtgg actaccagga tcagcagctc 2880
aacccacaga ttggcatggc tgacatcatg gatgcccaga acctggtcgc gtccatcagc 2940
gacgtctact ctgatgccgt tctccagatc cctggcatta attacgagat ctacacagag 3000
ctgtcaaacc ggctccagca ggcctcctac ctgtacacta gccgcaacgc ggtgcagaat 3060
ggggacttca ataacggcct cgattcctgg aatgctacag ctggggctag cgtccagcag 3120
gacggcaaca ctcacttcct cgttctgtct cattgggatg cccaggtttc acagcagttc 3180
agggtgcagc cgaactgcaa gtatgtgctg agggttaccg ctgagaaggt tggcgggggc 3240
gacggctacg tgacgatcag ggatggcgct caccatacgg agacactgac tttcaacgcc 3300
tgcgactacg atatcaatgg cacctacgtc acggacaaca catacctcac taaggaggtc 3360
atattctaca gccacaccga gcatatgtgg gtggaggtca acgagacgga gggcgccttc 3420
cacatagact cgattgagtt cgtggagacc gagaagtga 3459
<210> 10
<211> 3468
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 10
atgaatagga ataaccagga cgagtacgag atcattgacg cttcgacttg cgggtgcagc 60
tcagacgatg ttgttcagta ccccctcgct cgcgatccca atgccgtgtt ccagaacatg 120
cactacaagg actacctcca gacatacgac ggcgattaca ctgggtcgct cattaaccca 180
aatctgtcta tcaatcctcg cgacgtcctg cagacgggaa tcaacattgt tgggaggctc 240
ctgggcttcc tcggggttcc gttcgctggc cagctggtga cattctacac tttcctcctg 300
aaccagctct ggcccaccaa cgacaatgcg gtctgggagg ccttcatggc gcagatcgag 360
gagctgatta accagcgcat ctccgaggct gtggtcggca ccgctgctga tcacctcacg 420
gggctgcatg acaactacga gctttacgtg gaggctctcg aggagtggct ggagaggcca 480
aacgctgcta ggacgaacct cctgttcaat aggttcacca cgctcgactc cctgttcaca 540
cagttcatgc catcattcgg gactggcccc ggctcccaga actacgccgt ccctctcctg 600
accgtttacg cgcaggcggc taacctccac ctcctgctcc tgaaggacgc tgagatctac 660
ggcgctcgct gggggctgaa ccagaatcag atcaacagct tccacacaag gcagcaggag 720
cggacccagt actacacgaa tcattgcgtg acaacttaca acaccggcct cgataggctg 780
agggggacca atacggagtc ctggctcaac taccataggt tccgcaggga gatgaccctg 840
atggcgatgg acctcgtggc gctgttcccg tactacaacg tccggcagta cccaaacggc 900
gctaatccac agctcacccg cgagatctac acggacccaa tcgtcttcaa cccaccagct 960
aatgttggcc tgtgcaggcg ctgggggaac aatccttaca atcgcttcag cgagctggag 1020
aacgccttca tcaggccacc tcacctgttc gatcggctca atacactgac tatttcgagg 1080
aaccggttcg acgtcggcag caatttcatc gagccgtggt cgggccatac gctgaggagg 1140
tcctacagca acaattcaac agtgtacgag gattcctacg gccagattac cgctacgagg 1200
accacgatca acctccctgc caatggcaca gggcgggtgg agtctactgc tgtcgacttc 1260
cgctcagccc tggttggcat ctacggggtg aacagggcga gcttcatccc gggcggggtc 1320
ttcagcggca caactcagcc atcgaccggc gggtgcaggg acctctacga ttccagcgac 1380
gagctgccac cagacgagag cacgggctcg ttcgctcaca ggctctctca tgtcacattc 1440
ctgtcattca ccacgaacca ggctggctcg atcgccaatt ctgggagggt tccgacatac 1500
gtgtggactc accgggacgt ggatttcaac aataccatca acccaaatcg catcacgcag 1560
attcctgttg tgaaggcgta cgagctgtcc tccggcgcta ccgtcgttaa gggcccgggg 1620
ttcacgggcg gggacgtgat tcgcaggaca aacatcggcg ggttcggcgc tatcagggtc 1680
tccgttaccg gccccctgac gcagcgctac aggattcggt tccgctacgc ctccactatc 1740
gacttcgatt tcttcgtcac ccggggcggg acaactatca acaatttccg cttcacaagg 1800
actatgaaca ggggccagga gtcacggtac gagtcctacc gcaccgtgga gttcaccacg 1860
cccttcaact tcacgcagtc ccaggacatc attaggacat ccattcaggg cctcagcggc 1920
aacggggagg tttacctgga tcgcatcgag atcattccag tgaaccctac gagggaggct 1980
gaggaggacc tcgaggctgc gaagaaggct gtggctagcc tcttcaccag gacgagggat 2040
ggcctgcaag tgaatgtcac cgattaccag gtggaccagg ctgccaacct cgtctcttgc 2100
ctgtcagatg agcagtacgg ccacgacaag aagatgctcc tggaggccgt ccgcgctgct 2160
aagaggctgt ccagggagag gaacctcctg caggacccag atttcaacac aatcaatagc 2220
actgaggaga atggctggaa ggcgtccaac ggggtgacca tcagcgaggg cgggcctttc 2280
tacaagggcc gcgctctcca gctggcttcg gctagggaga attacccaac ttacatctac 2340
cagaaggtca acgcctctga gctgaagcct tacacgcgct accgcctgga tggcttcgtg 2400
aagtcatccc aggatctcga gatcgacctg attcaccatc acaaggtgca cctcgtcaag 2460
aacgttccgg acaatctggt cagcgatacg tactcggacg gctcgtgctc tgggatgaat 2520
cgctgcgagg agcagcagat ggtgaacgcg cagctcgaga cagagcatca ccatccgatg 2580
gactgctgcg aggccgcgca gactcatgag ttcagctcgt acattaatac cggcgatctg 2640
aactcttcag tcgaccaggg catctgggtg gtcctcaagg ttcgcacaac tgatggctac 2700
gccacgctgg ggaacctcga gctggttgaa gtgggcccac tctccgggga gagcctggag 2760
agggagcaga gggacaacgc gaagtggtcc gctgagctgg gcaggaagcg ggctgagacc 2820
gatagggttt accaggacgc taagcagtcc atcaatcacc tcttcgtgga ttaccaggac 2880
cagcagctga acccggagat tggcatggct gatatcattg acgcccagaa cctcgtcgcg 2940
tcaatctccg atgtctacag cgacgccgtt ctgcagatcc ccggcattaa ttacgagatc 3000
tacacggagc tgtcgaacag gctgcagcag gcctcgtacc tctacacatc tcggaacgcg 3060
gtgcagaatg gcgatttcaa ctctgggctg gactcatgga atgctaccgg cggggctacg 3120
gtgcagcagg atggcaacac ccacttcctc gtcctgtccc attgggacgc tcaggtgagc 3180
cagcagttcc gggtccagcc gaactgcaag tatgtgctga gggtcactgc tgagaaggtt 3240
ggcgggggcg atggctacgt gaccatcagg gacggggctc accatacaga gaagctcact 3300
ttcaacgcct gcgactacga tatcaatggc acctacgtca cggacaacac atacctaact 3360
aaggaggttg tgttctactc gcacactgag catatgtggg tcgaggtttc tgagaccgag 3420
ggcgccttcc acatagactc aattgagttc gtggagaccg agaagtga 3468
<210> 11
<211> 3507
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 11
atgaatagga ataaccagaa cgagtacgag gtcattgatg ctccccattg cggctgcccg 60
gcggacgatg ttgtgaagta cccactgacc gacgatccga acgccggcct gcagaacatg 120
aattacaagg agtacctcca gacctacggc ggggactaca ccgacccgct gatcaaccct 180
aatctctcgg tttctggcaa ggacgtgatt caggtcggaa tcaacattgt ggggcgcctc 240
ctgtccttct tcgggttccc attctccagc cagtgggtga cagtctacac ttacctcctg 300
aattcactgt ggcctgacga tgagaactcc gtttgggacg ccttcatgga gcgggtggag 360
gagctgatcg atcagaagat tagcgaggct gtcaagggcc gcgcgctcga cgatctgacc 420
gggctccagt acaactacaa cctctacgtg gaggcgctgg acgagtggct caacaggcca 480
aatggcgctc gggcctctct cgtgtcacag aggttcaaca tcctggattc cctcttcacc 540
cagttcatgc catccttcgg gagcggcccc gggagccaga attacgcgac gatcctcctg 600
cctgtgtacg ctcaggccgc gaacctgcac ctcctgctcc tgaaggacgc tgatatctac 660
ggcgccaggt gggggctcaa ccagacccag attgaccagt tccactctag gcagcagtca 720
ctcacccaga cgtacacaaa ccattgcgtg acagcctaca atgacggcct ggctgagctg 780
agggggactt cggtcgcctc ttggctgaag taccaccagt accgcaggga gatgactgtc 840
accgcgatgg acctggttgc tctcttccca tactacaacg tgcgccagta cccgaacggc 900
gcgaatcccc agctcaccag ggaggtgtac acggacccaa tcgtcttcaa cccaccagag 960
aggccttctg gcgctttctg cgagtcattc tacaccatca gggctgctag ggagaggctg 1020
acgttctccc agctcgagca cgcgatcatt cgcccaccta ggctgttcga gcggttccag 1080
gctctcggca tctacacagg ggaggcccgc ctcaacgcta attccgcccc gatgaattac 1140
tggatcggcc atttcattag gaacacgagg ctgggggaca gcaccacgat cacaactaat 1200
tacggcacca cgaacaatag gctcaccaac ttctcaatgc cctccgacgt ctaccagatc 1260
aactccacgt cgtctaatct cgcggctatt ctgggcacac tctacggggt gactcgcgcc 1320
cagttccact tcggctcagg gtccttcagc acctacgtgg gccagaacag cgtcctgccg 1380
cagtgccatc agaactacaa tagcatcgag gagctgccaa accagtcgga cgagcctacc 1440
gttcgctcgt actctcacag gctgtcccat atcacgagct tcaacttcaa tgtgcagctg 1500
aacaatccgc tcatttctgc gggcaacatg cccgtttacg tgtggaccca caggtcagtc 1560
gacctgacga accggatctc atccgatcgc atcacccaga ttccggtggt caaggcttac 1620
gagctgtcct ccggcgctac agttgtgaag ggccccgggt tcactggcgg ggacgtgatc 1680
aggaggacga acacaggcgg gttcggcgcg attagggtct cggttaccgg gccgctcacg 1740
cagcgctacc gcatccgctt ccgctacgct tctaccattg acttcgattt cttcgtcacg 1800
cggggcggga caactatcaa caatttcagg ttcactcgga ccatgaacag gggccaggag 1860
tcgcggtacg agtcttaccg caccgtggag ttcaccacgc ccttcaactt cacacagtcc 1920
caggacatca ttcgcacttc aatccagggc ctgtccggca atggggaggt ctacctcgac 1980
cgcattgaga tcattccggt taaccccacg agggaggctg aggaggatct ggaggctgcg 2040
aagaaggcgg tggctagcct gttcacgagg acacgggacg gcctccaagt gaatgtcaag 2100
gactaccagg tcgatcaggc tgccaacctg gttagctgcc tctcggacga gcagtacggc 2160
tacgataaga agatgctcct ggaggccgtg cgcgctgcta agaggctctc gagggagagg 2220
aacctcctgc aggacccgga tttcaacaca atcaattcta ctgaggagaa cggctggaag 2280
gcttccaatg gggtgaccat tagcgagggc ggcccattct acaagggcag ggccctccag 2340
ctggcttcag ctcgggagaa ctacccaaca tacatctacc agaaggtcga cgccagcgag 2400
ctgaagcctt acactcgcta ccgcctcgat ggcttcgtga agtcttcaca ggacctggag 2460
atcgatctca ttcaccatca caaggttcac ctggtgaaga acgtcccgga caatctcgtc 2520
tccgatacgt accccgacga ttcatgctcc ggcatcaata ggtgccagga gcagcagatg 2580
gtgaacgccc agctggagac agagcatcac catccgatgg actgctgcga ggccgcgcag 2640
actcatgagt tctccagcta catcgacaca ggcgatctga acagcactgt ggaccagggg 2700
atctgggtca ttttcaaggt taggacaact gatggctacg cgaccctcgg gaacctcgag 2760
ctggttgaag tgggcccact cctgggggag cctctggaga gggagcagag ggagaacgcg 2820
aagtggaatg ctgagctggg caggaagcgg gctgagaccg accgcgtcta ccaggatgcc 2880
aagcagagca tcaatcacct gttcgttgac taccaggatc agcagctcaa cccagagatc 2940
ggcatggccg acattatgga tgcgcagaac ctggtcgcta gcatctcgga cgtttactcg 3000
gatgccgtgc tccagatccc tggcattaat tacgagatct acaccgagct gagcaacagg 3060
ctccagcagg cgagctacct gtacacgtcg cggaacgctg tgcagaatgg cgacttcaac 3120
aatgggctcg attcttggaa tgctaccgct ggcgcttcag tgcagcagga cgggaacacg 3180
cacttcctcg tcctgtcgca ttgggatgcc caggtttctc agcagttccg ggtgcagccg 3240
aactgcaagt atgtgctcag ggtgacagct gagaaagtgg gcgggggcga cggctacgtc 3300
actatccgcg acgatgccca ccatactgag accctgacgt tcaacgcgtg cgactacgat 3360
atcaatggca cctacgtcac ggacaacaca tacatcacta aggaggtcgt tttctactcc 3420
cacacagatc atatgtgggt cgaggttagc gagactgagg gcgccttcca catcgactcg 3480
cttgagttcg tggagaccga gaagtga 3507
<210> 12
<211> 3471
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 12
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtcatc ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccgagca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactacagg 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacat gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacctgga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 13
<211> 3471
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 13
atgaatcaga acaagcacgg catcattggg gcctcgaact gcggctgcgc ctccgacgat 60
gtggctaagt accctctcgc taacaaccct tactccagcg ccctgaacct caattcctgc 120
cagaactcgt ctatcctcaa ttggattaac atcattgggg acgccgcgaa ggaggctgtc 180
agcatcggca ccacgattgt ttcactgatc acggccccgt ccctgacagg cctcatcagc 240
attgtgtacg acctcatcgg gaaggtcatc ggcgggtcat ccggccagag catttcggac 300
ctgtcgatct gcgatctcct gtctatcatt gacctcaggg tgtctcagtc agtcctgaac 360
gacgggatcg ccgatttcaa tggctcagtg ctcctgtacc gcaactacct ggaggcgctc 420
gactcctgga acaagaatcc caactccgct agcgctgagg agctgaggac caggttcagg 480
attgccgact ccgagttcga tcgcatcctc actcgcggct cactgaccaa tggcggctcc 540
ctcgcccgcc agaacgctca gatcctcctg ctccctagct tcgcgtcggc tgccttcttc 600
cacctgctcc tgctcaggga cgctacgcgc tacggaacca actggggcct ctacaatgct 660
actccgttca taaactacca gtccaagctg gtcgagctga tcgagctgta caccgactac 720
tgcgttcact ggtacaatag ggggttcaac gagctgaggc agaggggcac gagcgctaca 780
gcttggctgg agttccatcg ctaccgcagg gagatgacgc tcatggttct ggacatcgtg 840
gccagcttca gctcgctcga tattactaac taccctatcg agaccgactt ccagctgtcg 900
cgcgtgattt acaccgaccc gatcgggttc gtccaccgct cttcactgag gggcgagtct 960
tggttctcat tcgtcaatag ggcgaacttc tcggacctcg agaatgctat cccgaacccc 1020
cggccatctt ggttcctgaa caatatgatc atttccactg gcagcctgac cctccccgtt 1080
tcgccatcta cggatcgcgc gagggtgtgg tacggctcac gggaccgcat ctcaccggct 1140
aactcccagt tcattacaga gctgatctct ggccagcaca caactgctac acagactatt 1200
ctgggccgga atatcttccg cgtggacagc caggcctgca atctcaacga taccacgtac 1260
ggcgtcaaca gggctgtttt ctaccatgac gcctcggagg gctctcagcg ctcagtctac 1320
gagggataca tcaggacaac tggcatcgat aatcctcggg tgcagaatat taacacgtac 1380
ctcccgggcg agaacagcga catccctacg ccggaggatt acacacacat tctgtcgacc 1440
acaatcaacc tcaccggcgg gctgaggcag gtcgcttcta acaggcgctc cagcctcgtt 1500
atgtacggct ggactcataa gtcactggcg cgcaacaaca caatcaaccc tgataggatc 1560
actcagattc cgctcaccaa ggtggacact agggggaccg gcgtgtcgta cgtcaacgat 1620
cccggcttca tcggcggggc cctgctccag cgcaccgacc acggctccct cggggttctg 1680
cgggtgcagt tcccactgca tctccgccag cagtacagga ttcgggtccg ctacgcgtcc 1740
acaactaaca tccgcctcag cgtgaatggg tcgttcggca cgatctccca gaacctgccc 1800
agcacaatga ggctcgggga ggacctgcgc tacggctcct tcgccattcg ggagttcaac 1860
acgagcatcc gccccacagc gtcgccagat cagattaggc tcactatcga gccaagcttc 1920
atcaggcagg aggtctacgt tgaccggatc gagttcattc ctgtcaaccc gacgagggag 1980
gctaaggagg atctggaggc tgctaagaag gctgtggcta gcctcttcac caggacgagg 2040
gacggcctgc aagtgaatgt caaggactac caggttgatc aggccgcgaa cctcgtgtcc 2100
tgcctgagcg acgagcagta cggctacgat aagaagatgc tgctcgaggc ggtcagggct 2160
gctaagaggc tctccaggga gaggaacctg ctccaggacc ctgatttcaa tacgatcaac 2220
agcacagagg agaacgggtg gaaggcgtct aatggcgtga ccatttcaga gggcggccca 2280
ttctacaagg gcagggctat ccagctggct tcggctcggg agaactaccc cacgtacatc 2340
taccagaagg tcgacgcctc tgagctgaag ccatacacac gctaccgcct ggatggcttc 2400
gtgaagtcgt ctcaggacct cgagatcgat ctgattcacc atcacaaggt ccacctggtt 2460
aagaatgtgc ccgacaacct ggtcctcgac acctacccag acgattcctg caatggcatc 2520
aacaggtgcg acgagcagaa gatggtgaac gcccagctcg agaccggaca tcaccatccg 2580
atggactgct gcgaggcggc tcagacgcac gagttctcat cctacattaa cacaggggac 2640
ctgaatgcca gcgtggatca gggcatctgg gtggtcctca aagtcaggac cacggacggg 2700
tacgctacgc tgggcaacct ggagctggtt gaagtggggc cactctcggg cgagtctctg 2760
gagagggagc agagggacaa cgccaagtgg agcgctgagc tgggcaggaa gagggctgag 2820
accgagaggg tctactacgc cgcgaagcag tcgatcaatc acctcttcgt ggactaccaa 2880
gatcagcagc tgaaccccca gattggcatg gctgacatca tggatgccca gaacctcgtc 2940
gcgtcaatct ccgacgtgta ctccgatgcg gtcctgcaga tcccaggcat caactacgag 3000
atctacacgg agctgagcaa ccggctgcag caggcctcgt acctccacac gtctcgcaat 3060
gcgatgcaga acggggactt caattctggc ctggattcat ggaatgcgac tgctggggcc 3120
accgttcagc aggacggcaa cacccacttc ctggtgctct cccattggga tgcccaagtt 3180
agccagcagt tccgcgtgca gccgaactgc aagtacgtcc tgagggttac tgctgagaag 3240
gtcggcgggg gcgacggcta cgttaccatc cgcgatggcg ctcaccatac agagactctc 3300
accttcaacg cctgcgacta cgatatcaat ggcacgtacg tgacagacaa cacttacctg 3360
accaaggagg ttgtgttcca cccggagacc cagcatatgt gggtcgaggt tagcgagacg 3420
gagggcgtgt tccacctgga cagcgttgag ttcatggaga cccagcagta g 3471
<210> 14
<211> 5919
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 14
atggacctgg atgggaataa gacagagaca gagaccgaga ttgtgaatgg gagcgagagc 60
agcattgacc cgagcagcgt ttcgtacgct gggaacaata gctactccag cgccctgaac 120
ctcaattcgt gccagaatag gggcatcgct cagtgggtta acacgctggg cggggctatt 180
gggcaggccg tgagcatcgg cacatctatc atttcactcc tggccgcgcc gacactcact 240
gggtctattt cactggcctt caatctcatc aggaggatgg ggaccggctc caacggctcg 300
tctatttccg acctgagcat ctgcgatctc ctgagcatca ttaacctgcg ggtttcgcag 360
gctgtgctca acgacgggat cgctgatttc aatggctccg ttgctgtgta cgacctgtac 420
ctccacgccc tgcgcagctg gaacaataac cctaacgctg ctactgctga ggagctgagg 480
acccgcttca ggatcgccga ttcggagttc gagaggattc tgacgagggg ctcgctcaca 540
catggcggct ccctcgcccg ccaggacgct caggtcctcc tgctcccgtc cttcgttaac 600
gcggcttacc tgcacctgct catcctccgc gatgcttcgc gctacggggc ctcttggggc 660
ctcttcaaca ccacgccgca tatcaattac cccgtgaggc tgcagcagct cattggcagc 720
tacacgcact actgcacaca ttggtacaac caggggctga atgagatccg gcagcgcggc 780
aacactgccg tgaattggct cgagttccac cgctaccgcc gcgacatgac gctgatggtc 840
ctcgatgtgg tctcgctgtt ctctgccctc gacacgatcc gctacccgaa cgctacagtt 900
gtgcagctca gccgcactgt ctacaccgat ccgattggct tcgttaaccg cgggtcaggc 960
aataggctgt cctggttcga ctggaggaac caggcgaatt tctctactct cgagtcagag 1020
atgccgaccc cctcatcccc actgagcctc aaccacatgt cgatcttcac tgggcctctg 1080
accctcccag tgtcccctaa cacgcatagg gcccgggtct ggtacggcaa ccagaatatg 1140
ttcacaactg ggtcacagaa ctccggccag accacgaact ctattcagaa tatctcaggc 1200
ctggagattt tccgcatcga ctctcaggcg tgcaatctca ataacaattc atacggcgtg 1260
aacagggcgg agttcttcca cggggctagc cagggctcgc agcggtctgt ctaccaggga 1320
tacatccgcc agagcggcct ggacaaccct gtcgttatga atctgcagtc tttcctccca 1380
ggcgagaact cagccacccc tacggcgcag gattacaccc acattctgtc caacccggtt 1440
aatatcaggg gcgggctcag gcagattgtg gccgacaggc gctcctccgt ggtcgtttac 1500
ggctggacgc acaagtccct gagcaggagg tcactcgtgg ctccagacca gatcacccag 1560
gtcccagccg ttaaggcgtc cccttcttca cattgcacta tcattgccgg cccaggcttc 1620
accggcgggg acctggtgtc gctccagccc aacggccagc tcgtcatccc gttccaggtt 1680
tctgcgcccg agacgaacta ccacattcgc atctgctacg tctcgacgtc tgattgcagc 1740
attaacacaa tctgcaatga cgagacgcat ctgtccacac tcccgagcac aacttccagc 1800
ctggagaacc tccagtgcaa tcacctgcat tacttcaacg tgggcacttt caagccaacc 1860
atcgactcga agctgacgct cgtcaacaca tctcctaacg ctaacatcat tatcgacaag 1920
atcgagttca tcccggtgga taccgcccag cagcagaacg aggacctcga ggccgcgaag 1980
aaggctgtcg cctccctgtt cacacgcact agggacggcc tccaggtcaa tgttaaggac 2040
taccaggtgg atcaggctgc caacctggtc tcatgcctct ccgacgagca gtacggctac 2100
gataagaaga tgctgctcga ggccgtgagg gctgctaaga ggctgagcag ggagaggaac 2160
ctgctccagg accccgattt caacacaatc aactcgaccg aggagaacgg gtggaaggcg 2220
tcaaatggcg tcaccatctc cgagggcggg ccattctaca agggcagggc tattcagctc 2280
gcgtctgctc gggagaacta ccccacatac atctaccaga aggtggatgc ctccgagctg 2340
aagccataca cccgctaccg cctcgacggc ttcgtcaagt cgtctcagga cctggagatt 2400
gatctcatcc accatcacaa ggtgcacctg gtcaagaacg ttccggacaa tctcgtgagc 2460
atgaacagga acaacccaaa cgagtacgag attattgatg ctccatactg cggctgcccc 2520
tccgatgacg atgtgcgcta ccccctcgcc agcgacccga acgccgcgtt ccagaatatg 2580
aactacaagg agtacctgca gacctacgac ggcgattaca cggggtcact gattaatcca 2640
aacctctcca tcaatcctcg cgacgtcctc cagaccggaa tcaacattgt tggccgcatc 2700
ctcggcttcc tgggcgtgcc gttcgctggc cagctggtta ccttctacac gttcctcctg 2760
aaccagctct ggcctacgaa tgacaacgcg gtgtgggagg ccttcatggc gcagatcgag 2820
gagctgattg atcagaagat ctccgctcag gtggtcagga acgccctcga cgatctgacc 2880
ggcctccacg actactacga ggagtacctg gctgctctcg aggagtggct cgagaggcca 2940
aacggcgctc gcgctaatct ggtcacgcag cgcttcgaga acctccatac cgccttcgtg 3000
acgaggatgc cgagcttcgg gacaggcccc gggtcgcaga gggacgcggt tgctctcctg 3060
actgtgtacg cgcaggcggc taacctgcac ctcctgctcc tgaaggatgc tgagatctac 3120
ggcgctcggt gggggctgca gcagggccag atcaacctct acttcaatgc ccagcaggag 3180
cgcacaagga tctacactaa ccactgcgtt gagacctaca atagggggct cgaggacgtg 3240
cggggcacga acacagagag ctggctgaat taccatcgct tccgcaggga gatgacgctc 3300
atggcgatgg acctcgtggc gctcttcccc tactacaacg tccgccagta cccaaatggc 3360
gccaaccctc agctgacaag ggagatctac actgacccga tcgtgtacaa cccaccagct 3420
aatcagggga tctgcaggcg ctggggcaac aatccctaca acaccttctc tgagctggag 3480
aatgcgttca ttaggccacc tcacctcttc gaccgcctga acaggctcac catctcccgg 3540
aatcgctaca cggctccaac cacgaactcg tacctggatt actggtctgg ccataccctc 3600
cagtcacagt acgcgaacaa tcctacaact tacgagacgt cctacggcca gattacaagc 3660
aacactcgcc tcttcaatac cacgaacggc gctaatgcta tcgacagcag ggcccggaac 3720
ttcgggaatc tgtacgcgaa tctctacggc gtctccagcc tgaacatttt cccaaccggc 3780
gttatgtcag agatcacctc cgcccctaac acgtgctggc aggacctcac aactaccgag 3840
gagctgccac tggtgaacaa taacttcaat ctcctgtccc acgtcacatt cctgaggttc 3900
aacacgacac agggcggccc actcgcgact gttggcttcg tgcccaccta cgtgtggacg 3960
cggcaggacg tcgatttcaa taacatcatt acaccaaacc gcatcactca gattcctgtt 4020
gtgaaggcgt acgagctgtc gtctggcgct acagtcgtta agggcccggg gttcactggc 4080
ggggacgtca ttaggaggac taacaccggc gggttcgggg ctatcagggt gagcgtcaca 4140
ggccccctca ctcagcgcta caggattcgg ttccgctacg cgtcgaccat cgacttcgat 4200
ttcttcgtca cgcgcggcgg gactaccatc aataacttcc ggttcacgcg caccatgaac 4260
aggggccagg agagccggta cgagtcgtac cgcaccgtgg agttcacgac accgttcaac 4320
ttcacacaga gccaggacat cattcgcact tctattcagg gcctgtcagg caacggggag 4380
gtttacctcg accggatcga gatcattcca gtgaacccaa ccagggaggc tgaggaggat 4440
ctcgaggctg cgaagaaggc tgtggcctcg ctgttcacta ggacccggga cggcctccag 4500
gttaatgtga cggactacca ggtggatcag gctgccaacc tggtctcgtg cctctctgac 4560
gagcagtacg ctcacgataa gaagatgctc ctggaggccg tccgcgctgc taagaggctg 4620
tcgagggaga ggaacctcct gcaggaccca gatttcaaca ccattaattc tacggaggag 4680
aacgggtgga aggcgtcgaa tggcgtgacc atctctgagg gcgggccttt ctacaagggc 4740
cgcgctctcc agctggcttc agctagggag aactacccga catacatcta ccagaaggtc 4800
gacgcctccg agctgaagcc ctacacgcgc taccgcctcg atggcttcgt gaagtcatcc 4860
caggacctgg agatcgatct cattcaccat cacaaggtcc acctggttaa gaacgtgctg 4920
gacaatctcg tcagcgatac ctacccggac gattcttgct caggcatcaa tcgctgcgag 4980
gagcagcaga tggtgaacgc ccagctcgag accgagcatc accatccgat ggactgctgc 5040
gaggctgctc agacgcatga gttcagctcg tacatcgaca caggggatct gaactccact 5100
gtggaccagg gcatctgggt catcttcaag gtgcgcacta ccgatgggta cgcgaccctc 5160
ggcaacctcg agctggtcga ggttgggccg ctcctgggcg agccactgga gagggagcag 5220
agggagaacg ctaagtggaa tgctgagctg ggcaggaagc gggctgagac cgaccgcgtc 5280
taccaggatg ctaagcagtc catcaatcac ctgttcgtgg actaccagga tcagcagctc 5340
aacccacaga ttggcatggc tgacatcatg gatgcccaga acctggtcgc gtccatcagc 5400
gacgtctact ctgatgccgt tctccagatc cctggcatta attacgagat ctacacagag 5460
ctgtcaaacc ggctccagca ggcctcctac ctgtacacta gccgcaacgc ggtgcagaat 5520
ggggacttca ataacggcct cgattcctgg aatgctacag ctggggctag cgtccagcag 5580
gacggcaaca ctcacttcct cgttctgtct cattgggatg cccaggtttc acagcagttc 5640
agggtgcagc cgaactgcaa gtatgtgctg agggttaccg ctgagaaggt tggcgggggc 5700
gacggctacg tgacgatcag ggatggcgct caccatacgg agacactgac tttcaacgcc 5760
tgcgactacg atatcaatgg cacctacgtc acggacaaca catacctcac taaggaggtc 5820
ctcttctaca gccacaccga gcatatgtgg gtggaggtca acgagacgga gggcgccttc 5880
cacctcgact cgattgagtt cgtggagacc gagaagtga 5919
<210> 15
<211> 3468
<212> DNA
<213> 人工序列
<220>
<223> 合成Cry基因
<400> 15
atgaatagga ataaccagga cgagtacgag atcattgacg cttcgacttg cgggtgcagc 60
tcagacgatg ttgttcagta ccccctcgct cgcgatccca atgccgtgtt ccagaacatg 120
cactacaagg actacctcca gacatacgac ggcgattaca ctgggtcgct cattaaccca 180
aatctgtcta tcaatcctcg cgacgtcctg cagacgggaa tcaacattgt tgggaggctc 240
ctgggcttcc tcggggttcc gttcgctggc cagctggtga cattctacac tttcctcctg 300
aaccagctct ggcccaccaa cgacaatgcg gtctgggagg ccttcatggc gcagatcgag 360
gagctgatta accagcgcat ctccgaggct gtggtcggca ccgctgctga tcacctcacg 420
gggctgcatg acaactacga gctttacgtg gaggctctcg aggagtggct ggagaggcca 480
aacgctgcta ggacgaacct cctgttcaat aggttcacca cgctcgactc cctgttcaca 540
cagttcatgc catcattcgg gactggcccc ggctcccaga actacgccgt ccctctcctg 600
accgtttacg cgcaggcggc taacctccac ctcctgctcc tgaaggacgc tgagatctac 660
ggcgctcgct gggggctgaa ccagaatcag atcaacagct tccacacaag gcagcaggag 720
cggacccagt actacacgaa tcattgcgtg acaacttaca acaccggcct cgataggctg 780
agggggacca atacggagtc ctggctcaac taccataggt tccgcaggga gatgaccctg 840
atggcgatgg acctcgtggc gctgttcccg tactacaacg tccggcagta cccaaacggc 900
gctaatccac agctcacccg cgagatctac acggacccaa tcgtcttcaa cccaccagct 960
aatgttggcc tgtgcaggcg ctgggggaac aatccttaca atcgcttcag cgagctggag 1020
aacgccttca tcaggccacc tcacctgttc gatcggctca atacactgac tatttcgagg 1080
aaccggttcg acgtcggcag caatttcatc gagccgtggt cgggccatac gctgaggagg 1140
tcctacagca acaattcaac agtgtacgag gattcctacg gccagattac cgctacgagg 1200
accacgatca acctccctgc caatggcaca gggcgggtgg agtctactgc tgtcgacttc 1260
cgctcagccc tggttggcat ctacggggtg aacagggcga gcttcatccc gggcggggtc 1320
ttcagcggca caactcagcc atcgaccggc gggtgcaggg acctctacga ttccagcgac 1380
gagctgccac cagacgagag cacgggctcg ttcgctcaca ggctctctca tgtcacattc 1440
ctgtcattca ccacgaacca ggctggctcg atcgccaatt ctgggagggt tccgacatac 1500
gtgtggactc accgggacgt ggatttcaac aataccatca acccaaatcg catcacgcag 1560
attcctgttg tgaaggcgta cgagctgtcc tccggcgcta ccgtcgttaa gggcccgggg 1620
ttcacgggcg gggacgtgat tcgcaggaca aacatcggcg ggttcggcgc tatcagggtc 1680
tccgttaccg gccccctgac gcagcgctac aggattcggt tccgctacgc ctccactatc 1740
gacttcgatt tcttcgtcac ccggggcggg acaactatca acaatttccg cttcacaagg 1800
actatgaaca ggggccagga gtcacggtac gagtcctacc gcaccgtgga gttcaccacg 1860
cccttcaact tcacgcagtc ccaggacatc attaggacat ccattcaggg cctcagcggc 1920
aacggggagg tttacctgga tcgcatcgag atcattccag tgaaccctac gagggaggct 1980
gaggaggacc tcgaggctgc gaagaaggct gtggctagcc tcttcaccag gacgagggat 2040
ggcctgcaag tgaatgtcac cgattaccag gtggaccagg ctgccaacct cgtctcttgc 2100
ctgtcagatg agcagtacgg ccacgacaag aagatgctcc tggaggccgt ccgcgctgct 2160
aagaggctgt ccagggagag gaacctcctg caggacccag atttcaacac aatcaatagc 2220
actgaggaga atggctggaa ggcgtccaac ggggtgacca tcagcgaggg cgggcctttc 2280
tacaagggcc gcgctctcca gctggcttcg gctagggaga attacccaac ttacatctac 2340
cagaaggtca acgcctctga gctgaagcct tacacgcgct accgcctgga tggcttcgtg 2400
aagtcatccc aggatctcga gatcgacctg attcaccatc acaaggtgca cctcgtcaag 2460
aacgttccgg acaatctggt cagcgatacg tactcggacg gctcgtgctc tgggatgaat 2520
cgctgcgagg agcagcagat ggtgaacgcg cagctcgaga cagagcatca ccatccgatg 2580
gactgctgcg aggccgcgca gactcatgag ttcagctcgt acattaatac cggcgatctg 2640
aactcttcag tcgaccaggg catctgggtg gtcctcaagg ttcgcacaac tgatggctac 2700
gccacgctgg ggaacctcga gctggttgaa gtgggcccac tctccgggga gagcctggag 2760
agggagcaga gggacaacgc gaagtggtcc gctgagctgg gcaggaagcg ggctgagacc 2820
gatagggttt accaggacgc taagcagtcc atcaatcacc tcttcgtgga ttaccaggac 2880
cagcagctga acccggagat tggcatggct gatatcattg acgcccagaa cctcgtcgcg 2940
tcaatctccg atgtctacag cgacgccgtt ctgcagatcc ccggcattaa ttacgagatc 3000
tacacggagc tgtcgaacag gctgcagcag gcctcgtacc tctacacatc tcggaacgcg 3060
gtgcagaatg gcgatttcaa ctctgggctg gactcatgga atgctaccgg cggggctacg 3120
gtgcagcagg atggcaacac ccacttcctc gtcctgtccc attgggacgc tcaggtgagc 3180
cagcagttcc gggtccagcc gaactgcaag tatgtgctga gggtcactgc tgagaaggtt 3240
ggcgggggcg atggctacgt gaccatcagg gacggggctc accatacaga gaagctcact 3300
ttcaacgcct gcgactacga tatcaatggc acctacgtca cggacaacac atacatcact 3360
aaggaggttg tgttctactc gcacactgag catatgtggg tcgaggtttc tgagaccgag 3420
ggcgccttcc acctcgactc aattgagttc gtggagaccg agaagtga 3468
<210> 16
<211> 1168
<212> PRT
<213> 苏云金芽孢杆菌
<400> 16
Met Asn Arg Asn Asn Gln Asn Glu Tyr Glu Val Ile Asp Ala Pro His
1 5 10 15
Cys Gly Cys Pro Ala Asp Asp Val Val Lys Tyr Pro Leu Thr Asp Asp
20 25 30
Pro Asn Ala Gly Leu Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Gly Gly Asp Tyr Thr Asp Pro Leu Ile Asn Pro Asn Leu Ser Val
50 55 60
Ser Gly Lys Asp Val Ile Gln Val Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Ser Phe Phe Gly Phe Pro Phe Ser Ser Gln Trp Val Thr Val Tyr
85 90 95
Thr Tyr Leu Leu Asn Ser Leu Trp Pro Asp Asp Glu Asn Ser Val Trp
100 105 110
Asp Ala Phe Met Glu Arg Val Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Glu Ala Val Lys Gly Arg Ala Leu Asp Asp Leu Thr Gly Leu Gln Tyr
130 135 140
Asn Tyr Asn Leu Tyr Val Glu Ala Leu Asp Glu Trp Leu Asn Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Ser Leu Val Ser Gln Arg Phe Asn Ile Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Ser Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Thr Ile Leu Leu Pro Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Asp Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Thr Gln Ile Asp Gln Phe His Ser Arg Gln Gln Ser
225 230 235 240
Leu Thr Gln Thr Tyr Thr Asn His Cys Val Thr Ala Tyr Asn Asp Gly
245 250 255
Leu Ala Glu Leu Arg Gly Thr Ser Val Ala Ser Trp Leu Lys Tyr His
260 265 270
Gln Tyr Arg Arg Glu Met Thr Val Thr Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Val Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Glu
305 310 315 320
Arg Pro Ser Gly Ala Phe Cys Glu Ser Phe Tyr Thr Ile Arg Ala Ala
325 330 335
Arg Glu Arg Leu Thr Phe Ser Gln Leu Glu His Ala Ile Ile Arg Pro
340 345 350
Pro Arg Leu Phe Glu Arg Phe Gln Ala Leu Gly Ile Tyr Thr Gly Glu
355 360 365
Ala Arg Leu Asn Ala Asn Ser Ala Pro Met Asn Tyr Trp Ile Gly His
370 375 380
Phe Ile Arg Asn Thr Arg Leu Gly Asp Ser Thr Thr Ile Thr Thr Asn
385 390 395 400
Tyr Gly Thr Thr Asn Asn Arg Leu Thr Asn Phe Ser Met Pro Ser Asp
405 410 415
Val Tyr Gln Ile Asn Ser Thr Ser Ser Asn Leu Ala Ala Ile Leu Gly
420 425 430
Thr Leu Tyr Gly Val Thr Arg Ala Gln Phe His Phe Gly Ser Gly Ser
435 440 445
Phe Ser Thr Tyr Val Gly Gln Asn Ser Val Leu Pro Gln Cys His Gln
450 455 460
Asn Tyr Asn Ser Ile Glu Glu Leu Pro Asn Gln Ser Asp Glu Pro Thr
465 470 475 480
Val Arg Ser Tyr Ser His Arg Leu Ser His Ile Thr Ser Phe Asn Phe
485 490 495
Asn Val Gln Leu Asn Asn Pro Leu Ile Ser Ala Gly Asn Met Pro Val
500 505 510
Tyr Val Trp Thr His Arg Ser Val Asp Leu Thr Asn Arg Ile Ser Ser
515 520 525
Asp Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
530 535 540
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
545 550 555 560
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
565 570 575
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
580 585 590
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
595 600 605
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
610 615 620
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
625 630 635 640
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
645 650 655
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
660 665 670
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
675 680 685
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys Asp Tyr Gln Val
690 695 700
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly
705 710 715 720
Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
725 730 735
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
740 745 750
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
755 760 765
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
770 775 780
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
785 790 795 800
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
805 810 815
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
820 825 830
Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
835 840 845
Cys Ser Gly Ile Asn Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln
850 855 860
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
865 870 875 880
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
885 890 895
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
900 905 910
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
915 920 925
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
930 935 940
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
945 950 955 960
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
965 970 975
Asn Pro Glu Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
980 985 990
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
995 1000 1005
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln
1010 1015 1020
Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp
1025 1030 1035
Phe Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser
1040 1045 1050
Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp
1055 1060 1065
Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys
1070 1075 1080
Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly
1085 1090 1095
Tyr Val Thr Ile Arg Asp Asp Ala His His Thr Glu Thr Leu Thr
1100 1105 1110
Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp
1115 1120 1125
Asn Thr Tyr Leu Thr Lys Glu Val Val Phe Tyr Ser His Thr Asp
1130 1135 1140
His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe His Ile
1145 1150 1155
Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1160 1165
<210> 17
<211> 1156
<212> PRT
<213> 苏云金芽孢杆菌
<400> 17
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Leu Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Arg
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Met Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Ile Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 18
<211> 1156
<212> PRT
<213> 苏云金芽孢杆菌
<400> 18
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Leu Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Gly His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Thr Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Ile Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 19
<211> 1152
<212> PRT
<213> 苏云金芽孢杆菌
<400> 19
Met Asn Arg Asn Asn Pro Asn Glu Tyr Glu Ile Ile Asp Ala Pro Tyr
1 5 10 15
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp
20 25 30
Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Ile
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Ala Gln Val Val Arg Asn Ala Leu Asp Asp Leu Thr Gly Leu His Asp
130 135 140
Tyr Tyr Glu Glu Tyr Leu Ala Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Asn Leu Val Thr Gln Arg Phe Glu Asn Leu His
165 170 175
Thr Ala Phe Val Thr Arg Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Arg Asp Ala Val Ala Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Gln Gln Gly Gln Ile Asn Leu Tyr Phe Asn Ala Gln Gln Glu
225 230 235 240
Arg Thr Arg Ile Tyr Thr Asn His Cys Val Glu Thr Tyr Asn Arg Gly
245 250 255
Leu Glu Asp Val Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Tyr Asn Pro Pro Ala
305 310 315 320
Asn Gln Gly Ile Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Thr Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Arg Leu Thr Ile Ser Arg Asn Arg Tyr Thr Ala Pro Thr Thr
355 360 365
Asn Ser Tyr Leu Asp Tyr Trp Ser Gly His Thr Leu Gln Ser Gln Tyr
370 375 380
Ala Asn Asn Pro Thr Thr Tyr Glu Thr Ser Tyr Gly Gln Ile Thr Ser
385 390 395 400
Asn Thr Arg Leu Phe Asn Thr Thr Asn Gly Ala Asn Ala Ile Asp Ser
405 410 415
Arg Ala Arg Asn Phe Gly Asn Leu Tyr Ala Asn Leu Tyr Gly Val Ser
420 425 430
Ser Leu Asn Ile Phe Pro Thr Gly Val Met Ser Glu Ile Thr Ser Ala
435 440 445
Pro Asn Thr Cys Trp Gln Asp Leu Thr Thr Thr Glu Glu Leu Pro Leu
450 455 460
Val Asn Asn Asn Phe Asn Leu Leu Ser His Val Thr Phe Leu Arg Phe
465 470 475 480
Asn Thr Thr Gln Gly Gly Pro Leu Ala Thr Val Gly Phe Val Pro Thr
485 490 495
Tyr Val Trp Thr Arg Gln Asp Val Asp Phe Asn Asn Ile Ile Thr Pro
500 505 510
Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
515 520 525
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
530 535 540
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
545 550 555 560
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
565 570 575
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
580 585 590
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
595 600 605
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
610 615 620
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
625 630 635 640
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
645 650 655
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
660 665 670
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val
675 680 685
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Ala
690 695 700
His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
705 710 715 720
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
725 730 735
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
740 745 750
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
755 760 765
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
770 775 780
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
785 790 795 800
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
805 810 815
Lys Asn Val Leu Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
820 825 830
Cys Ser Gly Ile Asn Arg Cys Glu Glu Gln Gln Met Val Asn Ala Gln
835 840 845
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
850 855 860
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
865 870 875 880
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
885 890 895
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
900 905 910
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
915 920 925
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
930 935 940
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
945 950 955 960
Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
965 970 975
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
980 985 990
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala
995 1000 1005
Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe
1010 1015 1020
Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val
1025 1030 1035
Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp
1040 1045 1050
Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr
1055 1060 1065
Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr
1070 1075 1080
Val Thr Ile Arg Asp Gly Ala His His Thr Glu Thr Leu Thr Phe
1085 1090 1095
Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn
1100 1105 1110
Thr Tyr Leu Thr Lys Glu Val Ile Phe Tyr Ser His Thr Glu His
1115 1120 1125
Met Trp Val Glu Val Asn Glu Thr Glu Gly Ala Phe His Ile Asp
1130 1135 1140
Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150
<210> 20
<211> 1155
<212> PRT
<213> 苏云金芽孢杆菌
<400> 20
Met Asn Arg Asn Asn Gln Asp Glu Tyr Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp
20 25 30
Pro Asn Ala Val Phe Gln Asn Met His Tyr Lys Asp Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asn Gln Arg Ile Ser
115 120 125
Glu Ala Val Val Gly Thr Ala Ala Asp His Leu Thr Gly Leu His Asp
130 135 140
Asn Tyr Glu Leu Tyr Val Glu Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Ala Ala Arg Thr Asn Leu Leu Phe Asn Arg Phe Thr Thr Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Val Pro Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Asn Gln Ile Asn Ser Phe His Thr Arg Gln Gln Glu
225 230 235 240
Arg Thr Gln Tyr Tyr Thr Asn His Cys Val Thr Thr Tyr Asn Thr Gly
245 250 255
Leu Asp Arg Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Ala
305 310 315 320
Asn Val Gly Leu Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Arg Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Thr Leu Thr Ile Ser Arg Asn Arg Phe Asp Val Gly Ser Asn
355 360 365
Phe Ile Glu Pro Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Ser Asn
370 375 380
Asn Ser Thr Val Tyr Glu Asp Ser Tyr Gly Gln Ile Thr Ala Thr Arg
385 390 395 400
Thr Thr Ile Asn Leu Pro Ala Asn Gly Thr Gly Arg Val Glu Ser Thr
405 410 415
Ala Val Asp Phe Arg Ser Ala Leu Val Gly Ile Tyr Gly Val Asn Arg
420 425 430
Ala Ser Phe Ile Pro Gly Gly Val Phe Ser Gly Thr Thr Gln Pro Ser
435 440 445
Thr Gly Gly Cys Arg Asp Leu Tyr Asp Ser Ser Asp Glu Leu Pro Pro
450 455 460
Asp Glu Ser Thr Gly Ser Phe Ala His Arg Leu Ser His Val Thr Phe
465 470 475 480
Leu Ser Phe Thr Thr Asn Gln Ala Gly Ser Ile Ala Asn Ser Gly Arg
485 490 495
Val Pro Thr Tyr Val Trp Thr His Arg Asp Val Asp Phe Asn Asn Thr
500 505 510
Ile Asn Pro Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu
515 520 525
Leu Ser Ser Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly
530 535 540
Asp Val Ile Arg Arg Thr Asn Ile Gly Gly Phe Gly Ala Ile Arg Val
545 550 555 560
Ser Val Thr Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr
565 570 575
Ala Ser Thr Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr
580 585 590
Ile Asn Asn Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser
595 600 605
Arg Tyr Glu Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe
610 615 620
Thr Gln Ser Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly
625 630 635 640
Asn Gly Glu Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro
645 650 655
Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala
660 665 670
Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp
675 680 685
Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu
690 695 700
Gln Tyr Gly His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala
705 710 715 720
Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn
725 730 735
Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val
740 745 750
Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu
755 760 765
Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asn
770 775 780
Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val
785 790 795 800
Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val
805 810 815
His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Ser
820 825 830
Asp Gly Ser Cys Ser Gly Met Asn Arg Cys Glu Glu Gln Gln Met Val
835 840 845
Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu
850 855 860
Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp Leu
865 870 875 880
Asn Ser Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg Thr
885 890 895
Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly
900 905 910
Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala Lys
915 920 925
Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr
930 935 940
Gln Asp Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp
945 950 955 960
Gln Gln Leu Asn Pro Glu Ile Gly Met Ala Asp Ile Ile Asp Ala Gln
965 970 975
Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln
980 985 990
Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu
995 1000 1005
Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn
1010 1015 1020
Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Gly Gly
1025 1030 1035
Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser
1040 1045 1050
His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn
1055 1060 1065
Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly
1070 1075 1080
Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu Lys
1085 1090 1095
Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val
1100 1105 1110
Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe Tyr Ser His
1115 1120 1125
Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe
1130 1135 1140
His Ile Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150 1155
<210> 21
<211> 1168
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT-0009
<400> 21
Met Asn Arg Asn Asn Gln Asn Glu Tyr Glu Val Ile Asp Ala Pro His
1 5 10 15
Cys Gly Cys Pro Ala Asp Asp Val Val Lys Tyr Pro Leu Thr Asp Asp
20 25 30
Pro Asn Ala Gly Leu Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Gly Gly Asp Tyr Thr Asp Pro Leu Ile Asn Pro Asn Leu Ser Val
50 55 60
Ser Gly Lys Asp Val Ile Gln Val Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Ser Phe Phe Gly Phe Pro Phe Ser Ser Gln Trp Val Thr Val Tyr
85 90 95
Thr Tyr Leu Leu Asn Ser Leu Trp Pro Asp Asp Glu Asn Ser Val Trp
100 105 110
Asp Ala Phe Met Glu Arg Val Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Glu Ala Val Lys Gly Arg Ala Leu Asp Asp Leu Thr Gly Leu Gln Tyr
130 135 140
Asn Tyr Asn Leu Tyr Val Glu Ala Leu Asp Glu Trp Leu Asn Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Ser Leu Val Ser Gln Arg Phe Asn Ile Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Ser Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Thr Ile Leu Leu Pro Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Asp Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Thr Gln Ile Asp Gln Phe His Ser Arg Gln Gln Ser
225 230 235 240
Leu Thr Gln Thr Tyr Thr Asn His Cys Val Thr Ala Tyr Asn Asp Gly
245 250 255
Leu Ala Glu Leu Arg Gly Thr Ser Val Ala Ser Trp Leu Lys Tyr His
260 265 270
Gln Tyr Arg Arg Glu Met Thr Val Thr Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Val Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Glu
305 310 315 320
Arg Pro Ser Gly Ala Phe Cys Glu Ser Phe Tyr Thr Ile Arg Ala Ala
325 330 335
Arg Glu Arg Leu Thr Phe Ser Gln Leu Glu His Ala Ile Ile Arg Pro
340 345 350
Pro Arg Leu Phe Glu Arg Phe Gln Ala Leu Gly Ile Tyr Thr Gly Glu
355 360 365
Ala Arg Leu Asn Ala Asn Ser Ala Pro Met Asn Tyr Trp Ile Gly His
370 375 380
Phe Ile Arg Asn Thr Arg Leu Gly Asp Ser Thr Thr Ile Thr Thr Asn
385 390 395 400
Tyr Gly Thr Thr Asn Asn Arg Leu Thr Asn Phe Ser Met Pro Ser Asp
405 410 415
Val Tyr Gln Ile Asn Ser Thr Ser Ser Asn Leu Ala Ala Ile Leu Gly
420 425 430
Thr Leu Tyr Gly Val Thr Arg Ala Gln Phe His Phe Gly Ser Gly Ser
435 440 445
Phe Ser Thr Tyr Val Gly Gln Asn Ser Val Leu Pro Gln Cys His Gln
450 455 460
Asn Tyr Asn Ser Ile Glu Glu Leu Pro Asn Gln Ser Asp Glu Pro Thr
465 470 475 480
Val Arg Ser Tyr Ser His Arg Leu Ser His Ile Thr Ser Phe Asn Phe
485 490 495
Asn Val Gln Leu Asn Asn Pro Leu Ile Ser Ala Gly Asn Met Pro Val
500 505 510
Tyr Val Trp Thr His Arg Ser Val Asp Leu Thr Asn Arg Ile Ser Ser
515 520 525
Asp Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
530 535 540
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
545 550 555 560
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
565 570 575
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
580 585 590
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
595 600 605
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
610 615 620
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
625 630 635 640
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
645 650 655
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
660 665 670
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
675 680 685
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys Asp Tyr Gln Val
690 695 700
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly
705 710 715 720
Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
725 730 735
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
740 745 750
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
755 760 765
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
770 775 780
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
785 790 795 800
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
805 810 815
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
820 825 830
Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
835 840 845
Cys Ser Gly Ile Asn Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln
850 855 860
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
865 870 875 880
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
885 890 895
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
900 905 910
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
915 920 925
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
930 935 940
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
945 950 955 960
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
965 970 975
Asn Pro Glu Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
980 985 990
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
995 1000 1005
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln
1010 1015 1020
Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp
1025 1030 1035
Phe Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser
1040 1045 1050
Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp
1055 1060 1065
Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys
1070 1075 1080
Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly
1085 1090 1095
Tyr Val Thr Ile Arg Asp Asp Ala His His Thr Glu Thr Leu Thr
1100 1105 1110
Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp
1115 1120 1125
Asn Thr Tyr Ile Thr Lys Glu Val Val Phe Tyr Ser His Thr Asp
1130 1135 1140
His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe His Ile
1145 1150 1155
Asp Ser Leu Glu Phe Val Glu Thr Glu Lys
1160 1165
<210> 22
<211> 1156
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT-0012
<400> 22
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Ile Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Arg
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Met Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Leu Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 23
<211> 1156
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT-0013
<400> 23
Met Asn Gln Asn Lys His Gly Ile Ile Gly Ala Ser Asn Cys Gly Cys
1 5 10 15
Ala Ser Asp Asp Val Ala Lys Tyr Pro Leu Ala Asn Asn Pro Tyr Ser
20 25 30
Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Ser Ser Ile Leu Asn Trp
35 40 45
Ile Asn Ile Ile Gly Asp Ala Ala Lys Glu Ala Val Ser Ile Gly Thr
50 55 60
Thr Ile Val Ser Leu Ile Thr Ala Pro Ser Leu Thr Gly Leu Ile Ser
65 70 75 80
Ile Val Tyr Asp Leu Ile Gly Lys Val Ile Gly Gly Ser Ser Gly Gln
85 90 95
Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser Ile Ile Asp Leu
100 105 110
Arg Val Ser Gln Ser Val Leu Asn Asp Gly Ile Ala Asp Phe Asn Gly
115 120 125
Ser Val Leu Leu Tyr Arg Asn Tyr Leu Glu Ala Leu Asp Ser Trp Asn
130 135 140
Lys Asn Pro Asn Ser Ala Ser Ala Glu Glu Leu Arg Thr Arg Phe Arg
145 150 155 160
Ile Ala Asp Ser Glu Phe Asp Arg Ile Leu Thr Arg Gly Ser Leu Thr
165 170 175
Asn Gly Gly Ser Leu Ala Arg Gln Asn Ala Gln Ile Leu Leu Leu Pro
180 185 190
Ser Phe Ala Ser Ala Ala Phe Phe His Leu Leu Leu Leu Arg Asp Ala
195 200 205
Thr Arg Tyr Gly Thr Asn Trp Gly Leu Tyr Asn Ala Thr Pro Phe Ile
210 215 220
Asn Tyr Gln Ser Lys Leu Val Glu Leu Ile Glu Leu Tyr Thr Asp Tyr
225 230 235 240
Cys Val His Trp Tyr Asn Arg Gly Phe Asn Glu Leu Arg Gln Arg Gly
245 250 255
Thr Ser Ala Thr Ala Trp Leu Glu Phe His Arg Tyr Arg Arg Glu Met
260 265 270
Thr Leu Met Val Leu Asp Ile Val Ala Ser Phe Ser Ser Leu Asp Ile
275 280 285
Thr Asn Tyr Pro Ile Glu Thr Asp Phe Gln Leu Ser Arg Val Ile Tyr
290 295 300
Thr Asp Pro Ile Gly Phe Val His Arg Ser Ser Leu Arg Gly Glu Ser
305 310 315 320
Trp Phe Ser Phe Val Asn Arg Ala Asn Phe Ser Asp Leu Glu Asn Ala
325 330 335
Ile Pro Asn Pro Arg Pro Ser Trp Phe Leu Asn Asn Met Ile Ile Ser
340 345 350
Thr Gly Ser Leu Thr Leu Pro Val Ser Pro Ser Thr Asp Arg Ala Arg
355 360 365
Val Trp Tyr Gly Ser Arg Asp Arg Ile Ser Pro Ala Asn Ser Gln Phe
370 375 380
Ile Thr Glu Leu Ile Ser Gly Gln His Thr Thr Ala Thr Gln Thr Ile
385 390 395 400
Leu Gly Arg Asn Ile Phe Arg Val Asp Ser Gln Ala Cys Asn Leu Asn
405 410 415
Asp Thr Thr Tyr Gly Val Asn Arg Ala Val Phe Tyr His Asp Ala Ser
420 425 430
Glu Gly Ser Gln Arg Ser Val Tyr Glu Gly Tyr Ile Arg Thr Thr Gly
435 440 445
Ile Asp Asn Pro Arg Val Gln Asn Ile Asn Thr Tyr Leu Pro Gly Glu
450 455 460
Asn Ser Asp Ile Pro Thr Pro Glu Asp Tyr Thr His Ile Leu Ser Thr
465 470 475 480
Thr Ile Asn Leu Thr Gly Gly Leu Arg Gln Val Ala Ser Asn Arg Arg
485 490 495
Ser Ser Leu Val Met Tyr Gly Trp Thr His Lys Ser Leu Ala Arg Asn
500 505 510
Asn Thr Ile Asn Pro Asp Arg Ile Thr Gln Ile Pro Leu Thr Lys Val
515 520 525
Asp Thr Arg Gly Thr Gly Val Ser Tyr Val Asn Asp Pro Gly Phe Ile
530 535 540
Gly Gly Ala Leu Leu Gln Arg Thr Asp His Gly Ser Leu Gly Val Leu
545 550 555 560
Arg Val Gln Phe Pro Leu His Leu Arg Gln Gln Tyr Arg Ile Arg Val
565 570 575
Arg Tyr Ala Ser Thr Thr Asn Ile Arg Leu Ser Val Asn Gly Ser Phe
580 585 590
Gly Thr Ile Ser Gln Asn Leu Pro Ser Thr Met Arg Leu Gly Glu Asp
595 600 605
Leu Arg Tyr Gly Ser Phe Ala Ile Arg Glu Phe Asn Thr Ser Ile Arg
610 615 620
Pro Thr Ala Ser Pro Asp Gln Ile Arg Leu Thr Ile Glu Pro Ser Phe
625 630 635 640
Ile Arg Gln Glu Val Tyr Val Asp Arg Ile Glu Phe Ile Pro Val Asn
645 650 655
Pro Thr Arg Glu Ala Lys Glu Asp Leu Glu Ala Ala Lys Lys Ala Val
660 665 670
Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Lys
675 680 685
Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp
690 695 700
Glu Gln Tyr Gly Tyr Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala
705 710 715 720
Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe
725 730 735
Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly
740 745 750
Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Ile Gln
755 760 765
Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val
770 775 780
Asp Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe
785 790 795 800
Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys
805 810 815
Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp Thr Tyr
820 825 830
Pro Asp Asp Ser Cys Asn Gly Ile Asn Arg Cys Asp Glu Gln Lys Met
835 840 845
Val Asn Ala Gln Leu Glu Thr Gly His His His Pro Met Asp Cys Cys
850 855 860
Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp
865 870 875 880
Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg
885 890 895
Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val
900 905 910
Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala
915 920 925
Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Glu Arg Val
930 935 940
Tyr Tyr Ala Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln
945 950 955 960
Asp Gln Gln Leu Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala
965 970 975
Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu
980 985 990
Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg
995 1000 1005
Leu Gln Gln Ala Ser Tyr Leu His Thr Ser Arg Asn Ala Met Gln
1010 1015 1020
Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Ala
1025 1030 1035
Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu
1040 1045 1050
Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro
1055 1060 1065
Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly
1070 1075 1080
Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu
1085 1090 1095
Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr
1100 1105 1110
Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe His Pro
1115 1120 1125
Glu Thr Gln His Met Trp Val Glu Val Ser Glu Thr Glu Gly Val
1130 1135 1140
Phe His Leu Asp Ser Val Glu Phe Met Glu Thr Gln Gln
1145 1150 1155
<210> 24
<211> 1152
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT-0023
<400> 24
Met Asn Arg Asn Asn Pro Asn Glu Tyr Glu Ile Ile Asp Ala Pro Tyr
1 5 10 15
Cys Gly Cys Pro Ser Asp Asp Asp Val Arg Tyr Pro Leu Ala Ser Asp
20 25 30
Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys Glu Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Ile
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asp Gln Lys Ile Ser
115 120 125
Ala Gln Val Val Arg Asn Ala Leu Asp Asp Leu Thr Gly Leu His Asp
130 135 140
Tyr Tyr Glu Glu Tyr Leu Ala Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Gly Ala Arg Ala Asn Leu Val Thr Gln Arg Phe Glu Asn Leu His
165 170 175
Thr Ala Phe Val Thr Arg Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Arg Asp Ala Val Ala Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Gln Gln Gly Gln Ile Asn Leu Tyr Phe Asn Ala Gln Gln Glu
225 230 235 240
Arg Thr Arg Ile Tyr Thr Asn His Cys Val Glu Thr Tyr Asn Arg Gly
245 250 255
Leu Glu Asp Val Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Tyr Asn Pro Pro Ala
305 310 315 320
Asn Gln Gly Ile Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Thr Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Arg Leu Thr Ile Ser Arg Asn Arg Tyr Thr Ala Pro Thr Thr
355 360 365
Asn Ser Tyr Leu Asp Tyr Trp Ser Gly His Thr Leu Gln Ser Gln Tyr
370 375 380
Ala Asn Asn Pro Thr Thr Tyr Glu Thr Ser Tyr Gly Gln Ile Thr Ser
385 390 395 400
Asn Thr Arg Leu Phe Asn Thr Thr Asn Gly Ala Asn Ala Ile Asp Ser
405 410 415
Arg Ala Arg Asn Phe Gly Asn Leu Tyr Ala Asn Leu Tyr Gly Val Ser
420 425 430
Ser Leu Asn Ile Phe Pro Thr Gly Val Met Ser Glu Ile Thr Ser Ala
435 440 445
Pro Asn Thr Cys Trp Gln Asp Leu Thr Thr Thr Glu Glu Leu Pro Leu
450 455 460
Val Asn Asn Asn Phe Asn Leu Leu Ser His Val Thr Phe Leu Arg Phe
465 470 475 480
Asn Thr Thr Gln Gly Gly Pro Leu Ala Thr Val Gly Phe Val Pro Thr
485 490 495
Tyr Val Trp Thr Arg Gln Asp Val Asp Phe Asn Asn Ile Ile Thr Pro
500 505 510
Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser
515 520 525
Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile
530 535 540
Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr
545 550 555 560
Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr
565 570 575
Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn
580 585 590
Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu
595 600 605
Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser
610 615 620
Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu
625 630 635 640
Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu
645 650 655
Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe
660 665 670
Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val
675 680 685
Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Ala
690 695 700
His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu
705 710 715 720
Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn
725 730 735
Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser
740 745 750
Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala
755 760 765
Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu
770 775 780
Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser
785 790 795 800
Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val
805 810 815
Lys Asn Val Leu Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser
820 825 830
Cys Ser Gly Ile Asn Arg Cys Glu Glu Gln Gln Met Val Asn Ala Gln
835 840 845
Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln
850 855 860
Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr
865 870 875 880
Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly
885 890 895
Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu
900 905 910
Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala
915 920 925
Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala
930 935 940
Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu
945 950 955 960
Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val
965 970 975
Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly
980 985 990
Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala
995 1000 1005
Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe
1010 1015 1020
Asn Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val
1025 1030 1035
Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp
1040 1045 1050
Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr
1055 1060 1065
Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr
1070 1075 1080
Val Thr Ile Arg Asp Gly Ala His His Thr Glu Thr Leu Thr Phe
1085 1090 1095
Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn
1100 1105 1110
Thr Tyr Leu Thr Lys Glu Val Leu Phe Tyr Ser His Thr Glu His
1115 1120 1125
Met Trp Val Glu Val Asn Glu Thr Glu Gly Ala Phe His Leu Asp
1130 1135 1140
Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150
<210> 25
<211> 1155
<212> PRT
<213> 人工序列
<220>
<223> 突变型BT-0067
<400> 25
Met Asn Arg Asn Asn Gln Asp Glu Tyr Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp
20 25 30
Pro Asn Ala Val Phe Gln Asn Met His Tyr Lys Asp Tyr Leu Gln Thr
35 40 45
Tyr Asp Gly Asp Tyr Thr Gly Ser Leu Ile Asn Pro Asn Leu Ser Ile
50 55 60
Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Leu
65 70 75 80
Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr
85 90 95
Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asn Gln Arg Ile Ser
115 120 125
Glu Ala Val Val Gly Thr Ala Ala Asp His Leu Thr Gly Leu His Asp
130 135 140
Asn Tyr Glu Leu Tyr Val Glu Ala Leu Glu Glu Trp Leu Glu Arg Pro
145 150 155 160
Asn Ala Ala Arg Thr Asn Leu Leu Phe Asn Arg Phe Thr Thr Leu Asp
165 170 175
Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Thr Gly Pro Gly Ser
180 185 190
Gln Asn Tyr Ala Val Pro Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Asn Gln Asn Gln Ile Asn Ser Phe His Thr Arg Gln Gln Glu
225 230 235 240
Arg Thr Gln Tyr Tyr Thr Asn His Cys Val Thr Thr Tyr Asn Thr Gly
245 250 255
Leu Asp Arg Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His
260 265 270
Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln
290 295 300
Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Ala
305 310 315 320
Asn Val Gly Leu Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Arg Phe
325 330 335
Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg
340 345 350
Leu Asn Thr Leu Thr Ile Ser Arg Asn Arg Phe Asp Val Gly Ser Asn
355 360 365
Phe Ile Glu Pro Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Ser Asn
370 375 380
Asn Ser Thr Val Tyr Glu Asp Ser Tyr Gly Gln Ile Thr Ala Thr Arg
385 390 395 400
Thr Thr Ile Asn Leu Pro Ala Asn Gly Thr Gly Arg Val Glu Ser Thr
405 410 415
Ala Val Asp Phe Arg Ser Ala Leu Val Gly Ile Tyr Gly Val Asn Arg
420 425 430
Ala Ser Phe Ile Pro Gly Gly Val Phe Ser Gly Thr Thr Gln Pro Ser
435 440 445
Thr Gly Gly Cys Arg Asp Leu Tyr Asp Ser Ser Asp Glu Leu Pro Pro
450 455 460
Asp Glu Ser Thr Gly Ser Phe Ala His Arg Leu Ser His Val Thr Phe
465 470 475 480
Leu Ser Phe Thr Thr Asn Gln Ala Gly Ser Ile Ala Asn Ser Gly Arg
485 490 495
Val Pro Thr Tyr Val Trp Thr His Arg Asp Val Asp Phe Asn Asn Thr
500 505 510
Ile Asn Pro Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu
515 520 525
Leu Ser Ser Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly
530 535 540
Asp Val Ile Arg Arg Thr Asn Ile Gly Gly Phe Gly Ala Ile Arg Val
545 550 555 560
Ser Val Thr Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr
565 570 575
Ala Ser Thr Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr
580 585 590
Ile Asn Asn Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser
595 600 605
Arg Tyr Glu Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe
610 615 620
Thr Gln Ser Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly
625 630 635 640
Asn Gly Glu Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro
645 650 655
Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala
660 665 670
Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp
675 680 685
Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu
690 695 700
Gln Tyr Gly His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala
705 710 715 720
Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn
725 730 735
Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val
740 745 750
Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu
755 760 765
Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asn
770 775 780
Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val
785 790 795 800
Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val
805 810 815
His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Ser
820 825 830
Asp Gly Ser Cys Ser Gly Met Asn Arg Cys Glu Glu Gln Gln Met Val
835 840 845
Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu
850 855 860
Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp Leu
865 870 875 880
Asn Ser Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg Thr
885 890 895
Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly
900 905 910
Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala Lys
915 920 925
Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr
930 935 940
Gln Asp Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp
945 950 955 960
Gln Gln Leu Asn Pro Glu Ile Gly Met Ala Asp Ile Ile Asp Ala Gln
965 970 975
Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln
980 985 990
Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu
995 1000 1005
Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn
1010 1015 1020
Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Gly Gly
1025 1030 1035
Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser
1040 1045 1050
His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn
1055 1060 1065
Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly
1070 1075 1080
Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu Lys
1085 1090 1095
Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val
1100 1105 1110
Thr Asp Asn Thr Tyr Ile Thr Lys Glu Val Val Phe Tyr Ser His
1115 1120 1125
Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe
1130 1135 1140
His Leu Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150 1155
<210> 26
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> OAR2613a正向引物
<400> 26
aaacatgaac cgaaataatc aaaatg 26
<210> 27
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> OAR2615a反向引物
<400> 27
atccgtccct tgtgcgtgta aa 22
<210> 28
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> OAR2611a-F正向引物
<400> 28
gtttaaacat gaatcgaaat aatcaaaatg 30
<210> 29
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> OAR2612a-R反向引物
<400> 29
ggcgcgccct actcttgtgt ttcaataaa 29
<210> 30
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> OAR2768-F正向引物
<400> 30
gtttaaacat gaatcaaaat aaacacgga 29
<210> 31
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> OAR2769-R反向引物
<400> 31
ggcgcgcctt actgttgggt ttccatgaac t 31

Claims (65)

1.一种嵌合基因,该嵌合基因包含可操作地连接至核酸分子的异源启动子,该核酸分子包含编码对至少黑色地老虎(小地老虎)有毒的蛋白质的核苷酸序列,其中该核苷酸序列(a)与SEQ ID NO:1-5中任一项具有至少80%到至少99%序列一致性;或者(b)编码如下蛋白质,该蛋白质包含与SEQ ID NO:16-25中任一项具有至少80%到至少99%序列一致性的氨基酸序列;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
2.如权利要求1所述的嵌合基因,其中该异源启动子是植物可表达型启动子。
3.如权利要求2所述的嵌合基因,其中该植物可表达型启动子选自下组,该组由以下各项组成:泛素、cmp、玉米TrpA、噬菌体T3基因9 5'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、豌豆小亚基RuBP羧化酶、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛花查尔酮异构酶、大豆富甘氨酸蛋白1、马铃薯糖蛋白、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
4.如权利要求1所述的嵌合基因,其中该蛋白质另外对欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)是有毒的。
5.如权利要求1所述的嵌合基因,其中该核苷酸序列编码如下蛋白质,该蛋白质包含与SEQ ID NO:16具有至少90%到至少99%一致性的氨基酸序列。
6.如权利要求1所述的嵌合基因,其中该核苷酸序列编码如下蛋白质,该蛋白质包含与SEQ ID NO:17具有至少99%一致性的氨基酸序列。
7.如权利要求1所述的嵌合基因,其中该核苷酸序列编码如下蛋白质,该蛋白质包含与SEQ ID NO:18具有至少99%一致性的氨基酸序列。
8.如权利要求1所述的嵌合基因,其中该核苷酸序列编码如下蛋白质,该蛋白质包含与SEQ ID NO:19具有至少90%到至少99%一致性的氨基酸序列。
9.如权利要求1所述的嵌合基因,其中该核苷酸序列编码如下蛋白质,该蛋白质包含与SEQ ID NO:19具有至少80%到至少99%一致性的氨基酸序列。
10.如权利要求1所述的嵌合基因,其中该合成序列包含SEQ ID NO:6-15中的任一项。
11.如权利要求1所述的嵌合基因,其中该合成序列编码如下蛋白质,该蛋白质包含SEQID NO:16-25中的任一项。
12.如权利要求1所述的嵌合基因,其中该转基因生物是细菌或植物。
13.一种合成核酸分子,该合成核酸分子包含编码对至少欧洲玉米蛀虫(欧洲玉米螟)有活性的蛋白质的核苷酸序列,其中该核苷酸序列(a)与SEQ ID NO:6-15中任一项具有至少80%到至少99%序列一致性;或者(b)编码与SEQ ID NO:16-25中任一项具有至少80%到至少99%序列一致性的氨基酸序列。
14.如权利要求13所述的合成核酸分子,其中该核苷酸序列与SEQ ID NO:6具有至少80%一致性。
15.如权利要求13所述的合成核酸分子,其中该核苷酸序列与SEQ ID NO:7具有至少80%一致性。
16.如权利要求13所述的合成核酸分子,其中该核苷酸序列与SEQ ID NO:8具有至少80%一致性。
17.如权利要求13所述的合成核酸分子,其中该核苷酸序列与SEQ ID NO:9具有至少80%一致性。
18.如权利要求13所述的合成核酸分子,其中该核苷酸序列与SEQ ID NO:10具有至少80%一致性。
19.一种对至少欧洲玉米蛀虫(欧洲玉米螟)有毒的分离的蛋白质,其中该蛋白质包含与(a)由SEQ ID NO:16-25中任一项代表的氨基酸序列具有至少95%序列一致性的氨基酸序列;或者(b)由SEQ ID NO:6-15中任一项代表的核苷酸序列编码的氨基酸序列具有至少95%序列一致性的氨基酸序列。
20.如权利要求19所述的蛋白质,其中该氨基酸序列包含SEQ ID NO:16-25中的任一项。
21.如权利要求19所述的蛋白质,其中该氨基酸序列是由SEQ ID NO:6-15中任一项代表的核苷酸序列编码的。
22.一种杀昆虫组合物,该杀昆虫组合物包含如权利要求19所述的蛋白质和农业上可接受的载体。
23.如权利要求22所述的组合物,其中该农业上可接受的载体选自下组,该组由以下各项组成:粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。
24.如权利要求22所述的组合物,其中该农业上可接受的载体是转基因植物。
25.如权利要求22所述的组合物,其中该组合物包含转基因细菌细胞,该转基因细菌细胞包含该蛋白质。
26.如权利要求22所述的组合物,其中该组合物通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩苏云金芽孢杆菌细胞的培养物来制备。
27.如权利要求22所述的组合物,该组合物包含按重量计从约1%至约99%的杀昆虫蛋白。
28.如权利要求22-27中任一项所述的组合物,其中该组合物包含如下蛋白质,该蛋白质具有由SEQ ID NO:16-25中任一项代表的氨基酸序列。
29.一种重组载体,该重组载体包含如权利要求1所述的嵌合基因。
30.一种转基因非人类宿主细胞,该转基因非人类宿主细胞包含如权利要求1所述的嵌合基因或如权利要求29所述的重组载体。
31.如权利要求30所述的转基因宿主细胞,该转基因宿主细胞是细菌细胞或植物细胞。
32.如权利要求31所述的转基因细菌细胞,其中该细菌细胞是芽孢杆菌属、梭菌属、致病杆菌属、发光杆菌属、巴斯德氏芽菌属、埃希氏菌属、假单胞菌属、欧文氏菌属、沙雷氏菌属、克雷伯菌属、沙门氏菌属、巴氏杆菌属、黄单胞菌属、链霉菌属、根瘤菌属、红假单胞菌属、嗜甲基菌属、农杆菌属、醋杆菌属、乳杆菌属、节杆菌属、固氮菌属、明串珠菌属或产碱杆菌属的。
33.如权利要求32所述的转基因芽孢杆菌属细胞,其中该芽孢杆菌属细胞是苏云金芽孢杆菌细胞。
34.如权利要求31所述的转基因植物细胞,其中该植物细胞是双子叶植物细胞或单子叶植物细胞。
35.如权利要求34所述的双子叶植物细胞,其中该双子叶植物细胞选自下组,该组由以下各项组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、糖用甜菜细胞、烟草细胞。
36.如权利要求34所述的单子叶植物细胞,其中该单子叶植物细胞选自下组,该组由以下各项组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。
37.生长在自然光照下的如权利要求34所述的多个植物细胞。
38.如权利要求37所述的多个植物细胞,其中该多个植物细胞并列以形成质外体。
39.一种转基因植物,该转基因植物包含如权利要求34所述的植物细胞。
40.一种转基因植物,该转基因植物包含如权利要求35所述的双子叶植物细胞。
41.一种转基因植物,该转基因植物包含如权利要求36所述的单子叶植物细胞。
42.如权利要求41所述的转基因植物,该转基因植物是玉蜀黍植物。
43.一种转基因植物,该转基因植物包含如权利要求1所述的嵌合基因。
44.如权利要求43所述的转基因植物,其中该植物选自下组,该组由以下各项组成:大麦、芸苔属作物、棉花、玉蜀黍、水稻、高粱、大豆、糖用甜菜、甘蔗、向日葵、烟草、番茄以及小麦。
45.如权利要求44所述的转基因植物,其中该植物是玉蜀黍植物。
46.如权利要求39-45中任一项所述的转基因植物的转基因种子。
47.一种衍生自如权利要求34-38中任一项所述的转基因植物细胞的收获产物,其中该收获产物包含该蛋白质。
48.一种衍生自如权利要求47所述的收获产物的加工产物,其中该加工产物选自下组,该组由以下各项组成:细粉、粗粉、油以及淀粉或从其衍生的产物。
49.一种衍生自如权利要求39-45中任一项所述的转基因植物的收获产物,其中该收获产物包含该蛋白质。
50.一种衍生自如权利要求49所述的收获产物的加工产物,其中该加工产物选自下组,该组由以下各项组成:细粉、粗粉、油以及淀粉或从其衍生的产物。
51.来自如权利要求46所述的转基因种子或如权利要求39-45中任一项所述的转基因植物的提取物,其中该提取物包含如权利要求1所述的嵌合基因或蛋白质。
52.一种产生具有针对至少欧洲玉米蛀虫(欧洲玉米螟)的杀昆虫活性的蛋白质的方法,该方法包括:在如权利要求30所述的宿主细胞产生该蛋白质的条件下培养该宿主细胞。
53.如权利要求52所述的方法,其中该宿主细胞是植物细胞。
54.如权利要求53所述的方法,其中该植物细胞是玉蜀黍细胞。
55.如权利要求52所述的方法,其中这些条件包括自然光照和使这些细胞在植物基质内生长。
56.如权利要求52所述的方法,其中该蛋白质对选自下组的至少一种另外的昆虫具有杀昆虫活性,该组由以下各项组成:黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
57.如权利要求52所述的方法,其中该核苷酸序列进行密码子优化用于在植物中表达。
58.如权利要求52所述的方法,其中该嵌合基因包含SEQ ID NO:1-5中的任一项。
59.如权利要求59所述的方法,其中该嵌合基因包含SEQ ID NO:6-10中的任一项。
60.如权利要求58所述的方法,其中该蛋白质包含SEQ ID NO:16-20中任一项的氨基酸序列。
61.如权利要求59所述的方法,其中该蛋白质包含SEQ ID NO:21-25中任一项的氨基酸序列。
62.一种产生抗昆虫转基因植物的方法,该方法包括:向植物中引入如权利要求1所述的嵌合基因,其中该杀昆虫蛋白被表达于该植物中,由此赋予该植物对至少欧洲玉米蛀虫(欧洲玉米螟)的植物抗性,并且产生抗昆虫转基因植物。
63.如权利要求62所述的方法,其中通过转化该植物实现该引入步骤。
64.如权利要求62所述的方法,其中通过使包含该嵌合基因的第一植物与不同的第二植物杂交来实现该引入步骤。
65.一种控制至少欧洲玉米蛀虫(欧洲玉米螟)昆虫的方法,该方法包括向这些昆虫递送有效量的如权利要求1所述的蛋白质。
CN201580067475.5A 2014-12-12 2015-12-03 用于控制植物有害生物的组合物和方法 Active CN106998697B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462090900P 2014-12-12 2014-12-12
US62/090,900 2014-12-12
PCT/US2015/063620 WO2016094165A1 (en) 2014-12-12 2015-12-03 Compositions and methods for controlling plant pests

Publications (2)

Publication Number Publication Date
CN106998697A true CN106998697A (zh) 2017-08-01
CN106998697B CN106998697B (zh) 2021-09-03

Family

ID=56107971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580067475.5A Active CN106998697B (zh) 2014-12-12 2015-12-03 用于控制植物有害生物的组合物和方法

Country Status (11)

Country Link
US (2) US10537109B2 (zh)
EP (2) EP3795582B1 (zh)
CN (1) CN106998697B (zh)
AR (1) AR102963A1 (zh)
BR (1) BR112017012362A2 (zh)
CA (1) CA2969672A1 (zh)
MX (1) MX2017007619A (zh)
PH (1) PH12017501010A1 (zh)
RU (1) RU2741833C2 (zh)
UA (1) UA124050C2 (zh)
WO (1) WO2016094165A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109776659A (zh) * 2019-03-14 2019-05-21 中国农业科学院生物技术研究所 cry2Ah-vp基因在抗黏虫中的应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR105155A1 (es) 2015-07-07 2017-09-13 Syngenta Participations Ag Composiciones y métodos para controlar plagas de plantas
BR112021013326A2 (pt) * 2019-01-10 2021-11-09 Syngenta Crop Protection Ag Molécula de ácido nucleico, gene quimérico, proteína inseticida, cepa de bacillus thuringiensis ou escherichia coli recombinante, composição inseticida, vetor recombinante, célula bacteriana transgênica, produtos colhidos, produtos processados, proteína inseticida mutante, uso de uma célula de planta, tecido de planta, parte de planta ou planta transgênica, bem como método para produção de uma proteína inseticida que é tóxica para uma praga de inseto, método para produção de uma planta transgênica resistente a insetos, e método para controle de uma praga de lepidópteros e/ou coleópteros
MX2022007445A (es) * 2019-12-20 2022-06-27 Syngenta Crop Protection Ag Proteinas insecticidas.
CN111449089A (zh) * 2020-03-05 2020-07-28 安徽省农业科学院植物保护与农产品质量安全研究所 一种防治草地贪夜蛾的生物制剂及其使用方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050138685A1 (en) * 2003-12-22 2005-06-23 E.I Du Pont De Nemours And Company Bacillus Cry9 family members
US7888471B2 (en) * 1992-08-27 2011-02-15 Bayer Bioscience N.V. Bacillus thuringiensis strains and their insecticidal proteins

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3993756A (en) * 1973-05-09 1976-11-23 Takashi Kaneda Antilipemic agent containing a soybean oil fraction
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US4761373A (en) 1984-03-06 1988-08-02 Molecular Genetics, Inc. Herbicide resistance in plants
ATE100141T1 (de) 1984-03-06 1994-01-15 Mgi Pharma Inc Herbizide resistenz in pflanzen.
US5100792A (en) 1984-11-13 1992-03-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues
US5036006A (en) 1984-11-13 1991-07-30 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5273894A (en) 1986-08-23 1993-12-28 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5276268A (en) 1986-08-23 1994-01-04 Hoechst Aktiengesellschaft Phosphinothricin-resistance gene, and its use
US5013659A (en) 1987-07-27 1991-05-07 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
TR27832A (tr) 1987-04-29 1995-08-31 Monsanto Co Zararli ucucu hasarata mukavim bitkiler.
US6040504A (en) 1987-11-18 2000-03-21 Novartis Finance Corporation Cotton promoter
FI891054A (fi) 1988-03-08 1989-09-09 Ciba Geigy Ag Kemiskt reglerbara dna-sekvenser och gener samt olika anvaendningar daerav.
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
NZ230375A (en) 1988-09-09 1991-07-26 Lubrizol Genetics Inc Synthetic gene encoding b. thuringiensis insecticidal protein
US5162602A (en) 1988-11-10 1992-11-10 Regents Of The University Of Minnesota Corn plants tolerant to sethoxydim and haloxyfop herbicides
BR9007159A (pt) 1989-02-24 1991-12-10 Monsanto Co Genes sinteticos de plantas e processo para a preparacao dos mesmos
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
EP0452269B1 (en) 1990-04-12 2002-10-09 Syngenta Participations AG Tissue-preferential promoters
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
US5639949A (en) 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
US5767366A (en) 1991-02-19 1998-06-16 Louisiana State University Board Of Supervisors, A Governing Body Of Louisiana State University Agricultural And Mechanical College Mutant acetolactate synthase gene from Ararbidopsis thaliana for conferring imidazolinone resistance to crop plants
HU219057B (hu) 1991-08-27 2001-02-28 Novartis Ag. Inszekticid hatású proteinek Homoptera rovarok ellen és alkalmazásuk a növényvédelemben
GB9304200D0 (en) 1993-03-02 1993-04-21 Sandoz Ltd Improvements in or relating to organic compounds
US5994629A (en) 1991-08-28 1999-11-30 Novartis Ag Positive selection
US5304730A (en) 1991-09-03 1994-04-19 Monsanto Company Virus resistant plants and method therefore
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
DE4317845A1 (de) 1993-05-28 1994-12-01 Bayer Ag Desoxyribonukleinsäuren
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5437992A (en) 1994-04-28 1995-08-01 Genencor International, Inc. Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp
US6808904B2 (en) 1994-06-16 2004-10-26 Syngenta Participations Ag Herbicide-tolerant protox genes produced by DNA shuffling
ES2289743T3 (es) 1994-12-30 2008-02-01 Seminis Vegetable Seeds, Inc. Plantas transgenicas expresando construcciones de adn comprendiendo una pluralidad de genes para impartir una resistencia viral.
US5853973A (en) 1995-04-20 1998-12-29 American Cyanamid Company Structure based designed herbicide resistant products
US6084155A (en) 1995-06-06 2000-07-04 Novartis Ag Herbicide-tolerant protoporphyrinogen oxidase ("protox") genes
US6121436A (en) 1996-12-13 2000-09-19 Monsanto Company Antifungal polypeptide and methods for controlling plant pathogenic fungi
EP1032692A1 (en) 1997-11-18 2000-09-06 Pioneer Hi-Bred International, Inc. Targeted manipulation of herbicide-resistance genes in plants
AU760113C (en) 1997-11-18 2004-04-22 Pioneer Hi-Bred International, Inc. Compositions and methods for genetic modification of plants
DE69833457T2 (de) 1997-11-18 2006-09-14 Pioneer Hi-Bred International, Inc. Neuartige methode zur integration von fremd-dna ins eukaryotische genom
WO1999025855A1 (en) 1997-11-18 1999-05-27 Pioneer Hi-Bred International, Inc. Mobilization of viral genomes from t-dna using site-specific recombination systems
US6489542B1 (en) * 1998-11-04 2002-12-03 Monsanto Technology Llc Methods for transforming plants to express Cry2Ab δ-endotoxins targeted to the plastids
AR025349A1 (es) * 1999-08-23 2002-11-20 Mycogen Corp Metodos para controlar las plagas del gusano gris
BR0014516A (pt) * 1999-09-15 2002-07-02 Monsanto Technology Llc Composições e métodos de uso de delta-endotoxina do bacilo thuringiensis ativo de lepidopteran
BR0016851A (pt) * 1999-12-28 2002-10-08 Bayer Crospscience N V Proteìnas inseticidas do bacillus thuringiensis
US7166770B2 (en) 2000-03-27 2007-01-23 Syngenta Participations Ag Cestrum yellow leaf curling virus promoters
DE20122778U1 (de) 2001-08-10 2007-10-25 Akzenta Paneele + Profile Gmbh Paneel sowie Befestigungssystem für Paneele
AR036370A1 (es) 2001-08-27 2004-09-01 Syngenta Participations Ag Plantas con auto-procesamiento y partes de las mismas
WO2006083240A2 (en) 2003-12-19 2006-08-10 Syngenta Participations Ag Microbially expressed xylanases and their use as feed additives and other uses
WO2005096704A2 (en) 2004-04-08 2005-10-20 Kgk Synergize Inc. Cholesterol lowering composition
EP1868426B1 (en) 2005-03-16 2018-02-21 Syngenta Participations AG Corn event 3272 and methods of detection thereof
WO2007107302A2 (en) * 2006-03-21 2007-09-27 Bayer Bioscience N.V. Novel genes encoding insecticidal proteins
MX2009000774A (es) * 2006-07-21 2009-02-17 Pioneer Hi Bred Int Gen novedoso de bacillus thuringiensis con actividad lepidoptera.
EP2949659A1 (en) * 2008-07-02 2015-12-02 Athenix Corporation AXMI-115, AXMI-113, AXMI-005, AXMI-163 and AXMI-184: insecticidal proteins and methods for their use
US8445749B2 (en) * 2008-09-19 2013-05-21 Pioneer Hi Bred International Inc Bacillus thuringiensis gene with lepidopteran activity
US8319019B2 (en) * 2009-01-23 2012-11-27 Pioneer Hi Bred International Inc Bacillus thuringiensis gene with lepidopteran activity
US8318900B2 (en) 2009-02-27 2012-11-27 Athenix Corp. Pesticidal proteins and methods for their use
CA2860864A1 (en) 2012-01-11 2013-07-18 The Australian National University Method for modulating plant root architecture
CN107109418B (zh) 2014-12-12 2021-07-16 先正达参股股份有限公司 用于控制植物有害生物的组合物和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7888471B2 (en) * 1992-08-27 2011-02-15 Bayer Bioscience N.V. Bacillus thuringiensis strains and their insecticidal proteins
US20050138685A1 (en) * 2003-12-22 2005-06-23 E.I Du Pont De Nemours And Company Bacillus Cry9 family members
US20060242733A1 (en) * 2003-12-22 2006-10-26 E.I. Du Pont De Nemours And Company Bacillus Cry9 family members

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张永安等: "《我国不同森林立地带土壤中苏云金芽孢杆菌cry基因资源研究》", 《林业科学研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109776659A (zh) * 2019-03-14 2019-05-21 中国农业科学院生物技术研究所 cry2Ah-vp基因在抗黏虫中的应用

Also Published As

Publication number Publication date
RU2017124613A3 (zh) 2019-11-05
CN106998697B (zh) 2021-09-03
RU2017124613A (ru) 2019-01-15
EP3795582A1 (en) 2021-03-24
US10537109B2 (en) 2020-01-21
EP3795582B1 (en) 2023-09-13
RU2741833C2 (ru) 2021-01-29
PH12017501010A1 (en) 2017-11-27
UA124050C2 (uk) 2021-07-14
EP3229596A4 (en) 2018-06-13
US20170339964A1 (en) 2017-11-30
MX2017007619A (es) 2017-09-18
US20200068902A1 (en) 2020-03-05
AR102963A1 (es) 2017-04-05
BR112017012362A2 (pt) 2018-07-31
WO2016094165A1 (en) 2016-06-16
EP3229596A1 (en) 2017-10-18
US11060105B2 (en) 2021-07-13
CA2969672A1 (en) 2016-06-16

Similar Documents

Publication Publication Date Title
US11578105B2 (en) Compositions and methods for controlling plant pests
CN107129992B (zh) 用于控制植物有害生物的组合物和方法
US11680272B2 (en) Compositions and methods for controlling plant pests
CN107849098A (zh) 用于控制植物有害生物的组合物和方法
CN110062579A (zh) 工程化的杀有害生物蛋白和控制植物有害生物的方法
US11060105B2 (en) Compositions and methods for controlling plant pests
US20220089658A1 (en) Compositions and methods for controlling insect pests
US20220251599A1 (en) Compositions and Methods for Control of Insect Pests

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant