CN110022676B - 用于控制植物有害生物的组合物和方法 - Google Patents

用于控制植物有害生物的组合物和方法 Download PDF

Info

Publication number
CN110022676B
CN110022676B CN201780074747.3A CN201780074747A CN110022676B CN 110022676 B CN110022676 B CN 110022676B CN 201780074747 A CN201780074747 A CN 201780074747A CN 110022676 B CN110022676 B CN 110022676B
Authority
CN
China
Prior art keywords
leu
protein
thr
glu
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780074747.3A
Other languages
English (en)
Other versions
CN110022676A (zh
Inventor
K·赛吉恩
M·S·罗斯
M·乔科维奇
M·R·布拉姆莱特
C·弗雷明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Priority to CN202310905283.3A priority Critical patent/CN117024535A/zh
Publication of CN110022676A publication Critical patent/CN110022676A/zh
Application granted granted Critical
Publication of CN110022676B publication Critical patent/CN110022676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N37/00Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
    • A01N37/44Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing at least one carboxylic group or a thio analogue, or a derivative thereof, and a nitrogen atom attached to the same carbon skeleton by a single or double bond, this nitrogen atom not being a member of a derivative or of a thio analogue of a carboxylic group, e.g. amino-carboxylic acids
    • A01N37/46N-acyl derivatives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal protein (delta-endotoxin)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本文披露了对鳞翅目有害生物有毒的新颖杀昆虫蛋白。编码这些杀昆虫蛋白的多核苷酸可以用于转化原核和真核生物以表达这些杀昆虫蛋白。这些重组生物或含有这些重组生物或这些杀昆虫蛋白的组合物单独或与其他有害生物控制剂和适当的农用载体组合可以用于控制不同环境中的鳞翅目有害生物。

Description

用于控制植物有害生物的组合物和方法
对电子提交的序列表的引用
该序列表的官方副本是通过EFS-Web以ASCII格式的序列表以2016年12月13日生成的名为“81065-US-ORG-NAT-1_SeqList_ST25.txt”的文件进行电子提交的,并且该序列表的大小为224千字节并且与本说明书同时提交。包含在该ASCII格式文件中的序列表是本说明书的一部分,并且通过引用以其全文结合在此。
技术领域
本发明涉及杀有害生物蛋白和编码它们的多核苷酸,连同用于控制植物有害生物的组合物和方法。
背景技术
植物有害生物是在全世界重要农作物损失中的一个主要因素。由于无脊椎有害生物(包括昆虫)的侵染,仅在美国每年就损失约80亿美元。除了大田作物中的损失之外,昆虫有害生物也是衍生自作物植物的商品、蔬菜和水果生产、以及家庭园艺中的经济问题。
昆虫有害生物主要是通过密集使用化学杀有害生物剂来控制,这些化学杀有害生物剂通过抑制昆虫成长、预防昆虫摄食或繁殖、或者导致死亡而有效。生物性有害生物控制剂,如表达杀有害生物毒素(如Cry蛋白)的苏云金芽孢杆菌(Bacillus thuringiensis)菌株,也已经施用于作物植物中,产生了令人满意的结果,提供化学杀有害生物剂的替代物或补充物。已经分离了编码这些Cry蛋白的一些的基因并且它们在异源性宿主(如转基因植物)中的表达已经显示出提供了另一种用于控制经济上重要的昆虫有害生物的手段。
因此可以达到良好的昆虫控制,但是某些化学品有时也能影响非目标有益昆虫,并且某些生物制剂具有非常窄的活性谱。此外,某些化学和生物控制方法的继续使用增加了昆虫有害生物对此类控制措施产生抗性的机会。通过各种抗性管理实践已部分地缓和了这种状况,但仍需要开发新的并有效的有害生物控制剂,这些有害生物控制剂为农民提供经济利益并且是环境可接受的。特别需要的是可以靶向不同谱的经济上重要的昆虫有害生物并有效控制昆虫品系的控制剂,这些昆虫品系对现有的昆虫控制剂是有抗性的或可以变得有抗性。
发明内容
鉴于这些需求,本发明的一个目的是通过提供新的苏云金芽孢杆菌(Bt)分离株连同可以用来控制多种植物和商品有害生物的新颖基因和杀有害生物蛋白来提供新的有害生物控制剂。
本发明提供了用于赋予细菌、植物、植物部分、植物细胞、组织以及种子的杀有害生物活性的组合物以及方法。特别地,提供了编码从Bt分离的Cry蛋白的新颖多核苷酸以及实质上与其同一的序列。本发明进一步涉及包含新颖多核苷酸的嵌合基因,这些多核苷酸的表达导致对经济上重要的昆虫有害生物(特别是侵染植物或衍生自植物的商品的昆虫有害生物)具有毒性的Cry蛋白。本发明进一步涉及由这些多核苷酸的表达生成的新颖的Cry蛋白,并且涉及含有这些Cry蛋白的组合物以及配制品,它们通过抑制昆虫有害生物的存活、生长以及繁殖或者限制昆虫相关的对作物植物或衍生自作物植物的商品的损害或损失的能力对昆虫是有毒的。本发明的Cry蛋白包括天然Cry蛋白及它们的变体,连同具有一个或多个氨基酸取代、添加或缺失的经修饰的Cry蛋白。经修饰的Cry蛋白的实例包括但不限于被突变以调节它们的生物活性的那些。与它们的天然Cry蛋白对应物相比,这种调节可以例如,扩大或缩小它们的活性谱,或者增加或降低它们的特异性。本发明的Cry蛋白可以被突变以引入表位来产生从天然蛋白中差异性地识别出经修饰的蛋白的抗体,或者它们可以被突变以修饰在转基因生物(如植物或细菌)中的表达。本发明的Cry蛋白对经济上重要的昆虫有害生物是高活性的,例如,作物植物的昆虫有害生物,如黑色地老虎(BCW;小地老虎(Agrotis ipsilon))、欧洲玉米蛀虫(ECB;欧洲玉米螟(Ostrinia nubilalis))、秋黏虫(FAW;草地贪夜蛾(Spodoptera frugiperda))、玉米穗蛾(CEW;玉米穗虫(Helicoverpazea))、甘蔗螟(SCB;小蔗螟(Diatraea saccharalis))、绒毛豆毛虫(VBC;黎豆夜蛾(Anticarsia gemmatalis))、大豆夜蛾(SBL;大豆尺蠖(Chrysodeixis includes))、西南玉米蛀虫(SWCB;西南玉米螟(Diatraea grandiosella))、西部豆切根虫(WBC;西方豆地香(Richia albicosta))、烟夜蛾(TBW;烟芽夜蛾(Heliothis virescens))、亚洲玉米蛀虫(ACB;亚洲玉米螟(Ostrinia furnacalis))、棉螟蛉(CBW;棉铃虫(Helicoverpaarmigera))、条纹蛀茎虫(SSB;二化螟(Chilo suppressalis))、粉蛀茎虫(PSB;非洲大螟(Sesamia calamistis))、水稻卷叶螟(RLF;稻纵卷叶螟(Cnaphalocrocis medinalis))等,或者衍生自作物植物的储存产品或商品的经济上重要的昆虫有害生物,如白肩家蛾(WHM;白胸织蛾(Endrosis sarcitrella))、褐色家蛾(BHM;褐织叶蛾(Hofmannophilapseudospretella))、麦蛾(AGM;麦蛾(Sitotroga cerealella))、粉斑螟(ADM;粉斑螟蛾(Cadra cautella))、地中海粉蛾(MFM;地中海斑螟(Ephestia kuehniella))、印度粉螟(IMM;印度谷螟(Plodia interpunctella))、欧洲谷蛾(EGM;欧谷蛾(Nemapogongranella))等。
本发明还提供了合成的多核苷酸,其编码本发明的Cry蛋白,这些Cry蛋白已经进行一个或多个密码子优化用于在转基因生物如转基因细菌或转基因植物中表达。
本发明进一步涉及表达盒和重组载体,其包含编码本发明的Cry蛋白的多核苷酸。本发明还提供了包含嵌合基因、或表达盒或重组载体的经转化的细菌、植物、植物部分、植物细胞、组织、以及种子,该嵌合基因或表达盒或重组载体在经转化的细菌、植物、植物细胞、组织以及种子中表达本发明的Cry蛋白方面是有用的。
本发明还涉及分离的苏云金芽孢杆菌(Bt)菌株,这些菌株产生本发明的Cry蛋白。此类Bt菌株可以是天然存在的分离株或一种重组Bt菌株,其产生本发明的Cry蛋白中的一种或多种。
本发明还涉及使用这些本发明的多核苷酸的方法,例如在DNA构建体或嵌合基因或表达盒或重组载体中用于在生物(包括植物和微生物,如细菌)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(如植物或细菌)中表达的天然的或合成的序列,或者制成杂交的、具有增强的杀有害生物活性的Cry毒素。本发明进一步涉及制备这些Cry蛋白的方法以及使用这些多核苷酸序列和Cry蛋白的方法,例如,在微生物中控制昆虫或者在转基因植物中赋予保护免受昆虫损害。
本发明的另一个方面包括杀昆虫组合物和配制品,这些组合物和配制品包括本发明的Cry蛋白或苏云金芽孢杆菌菌株;以及使用这些组合物或配制品来控制昆虫有害生物群体的方法,例如通过将这些组合物或配制品施用至昆虫侵染的区域,或者施用至预防性处理易感染昆虫的区域或植物以赋予针对昆虫有害生物的保护。任选地,除本发明的Cry蛋白或Bt菌株之外,本发明的这些组合物或配制品可以包含其他杀有害生物剂(如化学或生物杀有害生物剂)以加强或增强本发明的这些组合物或配制品的昆虫控制能力。
本发明的这些组合物和方法可用于控制攻击植物、特别是作物植物或衍生自作物植物的商品产品的昆虫有害生物。本发明的这些组合物对于产生改变的或改进的具有杀有害生物活性的Cry蛋白、或对于检测商用产品或转基因生物中的Cry蛋白或多核苷酸的存在也是有用的。
参考以下详细的说明和权利要求书,本发明的这些和其他特征、方面、以及优点将变得更好理解。
附图说明
图1A-E显示了BT2Cry1J蛋白和经修饰的BT2Cry1J蛋白的各种实施例的比对。
图2A-B显示了Cry1Ig1蛋白、BT25Cry1I蛋白和变体BT25Cry1I蛋白的比对。
图3A-B显示了Cry1Ja1蛋白、BT2Cry1J蛋白和变体BT2Cry1J蛋白的比对。
图4A-B显示了Cry1Jc1蛋白、BT53Cry1J蛋白和变体BT53Cry1J蛋白的比对。
序列表中序列的简要说明
SEQ ID NO:1是BT2Cry1J氨基酸序列。
SEQ ID NO:2是BT25Cry1I氨基酸序列。
SEQ ID NO:3是BT53Cry1J氨基酸序列。
SEQ ID NO:4是变体BT2Cry1J氨基酸序列。
SEQ ID NO:5是变体BT25Cry1I氨基酸序列。
SEQ ID NO:6是变体BT53Cry1J氨基酸序列。
SEQ ID NO:7是α-螺旋3修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:8是α-螺旋4修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:9是α-螺旋5/6修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:10是α-螺旋3/4修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:11是α-螺旋4/5/6修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:12是α-螺旋3/5/6修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:13是α-螺旋3/4/5/6修饰的BT2Cry1J氨基酸序列。
SEQ ID NO:14是对SEQ ID NO:1进行编码的核苷酸序列。
SEQ ID NO:15是对SEQ ID NO:2进行编码的核苷酸序列。
SEQ ID NO:16是对SEQ ID NO:3进行编码的核苷酸序列。
SEQ ID NO:17是对SEQ ID NO:1进行编码的密码子优化序列。
SEQ ID NO:18是对SEQ ID NO:2进行编码的密码子优化序列。
SEQ ID NO:19是对SEQ ID NO:3进行编码的密码子优化序列。
SEQ ID NO:20是对SEQ ID NO:4进行编码的核苷酸序列。
SEQ ID NO:21是对SEQ ID NO:5进行编码的核苷酸序列。
SEQ ID NO:22是对SEQ ID NO:6进行编码的核苷酸序列。
SEQ ID NO:23是对SEQ ID NO:7进行编码的核苷酸序列。
SEQ ID NO:24是对SEQ ID NO:8进行编码的核苷酸序列。
SEQ ID NO:25是对SEQ ID NO:9进行编码的核苷酸序列。
SEQ ID NO:26是对SEQ ID NO:10进行编码的核苷酸序列。
SEQ ID NO:27是对SEQ ID NO:11进行编码的核苷酸序列。
SEQ ID NO:28是对SEQ ID NO:12进行编码的核苷酸序列。
SEQ ID NO:29是对SEQ ID NO:13进行编码的核苷酸序列。
SEQ ID NO:30是穿梭载体的核苷酸序列。
SEQ ID NO:31是二元转化载体的核苷酸序列。
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明考虑了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。此外,鉴于本披露内容,在此建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,在此所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在此本发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。
定义
当在此和所附权利要求书中使用时,单数形式“一个/种(a/an)”和“该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等。如在此使用的,词语“或(or)”意指特定清单的任何一个成员并且还包括这个清单的成员的任何组合(即,还包括“和”)。
术语“约”在此用于意指大约、大致、约或在……左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐明的数值来限定这个范围。通常,术语“约”在此用于将数值限定至以20%的变化,优选地10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,精确值(即,无“约”)是优选的。
本发明的“活性”Cry蛋白或Cry蛋白的“活性”意指该Cry蛋白作为昆虫控制剂发挥作用,具有毒性作用、或者能够干扰或阻止昆虫摄食,这可能引起或者可能不引起昆虫的死亡。当本发明的Cry蛋白被递送至昆虫时,这种结果典型地是该昆虫的死亡,或者该昆虫不以使该Cry蛋白可供该昆虫利用的来源为食。
如在此使用的,术语“扩增的”意指使用至少一种多核苷酸作为模板,构建多核苷酸的多个拷贝或与该多核苷酸互补的多个拷贝。扩增系统包括聚合酶链式反应(PCR)系统、连接酶链式反应(LCR)系统、基于核苷酸序列的扩增(NASBA,Cangene公司,密西索加,安大略省)、Q-β复制酶系统、基于转录的扩增系统(TAS)以及链置换扩增(SDA)。参见,例如,Diagnostic Molecular Microbiology:Principles and Applications[诊断分子微生物学:原理与应用],PERSING等人编著,美国微生物学会(American Society forMicrobiology),华盛顿(1993)。扩增产物被称为“扩增子”。
如在此使用的术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”(或类似术语)是指如下构建体或分子,该构建体或分子包括被组装进单个多核苷酸中的不同来源的两个或更多个多核苷酸。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,其含有但不限于(1)多核苷酸(例如,DNA),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白质部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包含衍生自不同来源的调节多核苷酸和编码多核苷酸,或包含源自相同来源、但以与在自然界中所发现的不同的方式进行安排的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、特别地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。
“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核苷酸序列。优选地,RNA进而在生物中被翻译以产生蛋白质。
如在此使用的,“密码子优化的”序列意指重组的、转基因的、或合成的多核苷酸的核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由密码子优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组DNA构建体的DNA序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见,例如,美国专利号6,121,014,通过引用结合在此。
“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
术语“包含(comprises)”或“包含(comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。
如在此使用的,过渡短语“基本由...组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由...组成”并不旨在被解释为等同于“包含(comprising)”。
在本发明的上下文中,“对应于(corresponding to或corresponds to)”意指当变体或经修饰的Cry蛋白的氨基酸序列与彼此比对时,“对应于”在该变体或经修饰的蛋白中某些枚举的位置的氨基酸是与参考蛋白中的这些位置比对的那些,但在相对于本发明的特定参考氨基酸序列而言的这些精确的数字位置中是不必要的。例如,如果SEQ ID NO:1是参考序列并且与SEQ ID NO:3比对的话,SEQ ID NO:3的Pro419“对应于”SEQ ID NO:1的Pro421,或者SEQ ID NO:3的Tyr417“对应于”SEQ ID NO:1的Asn419。
如在此使用的,术语“Cry蛋白”意指苏云金芽孢杆菌晶体δ-内毒素类型的杀昆虫蛋白。术语“Cry蛋白”可以指原毒素形式或其任何杀昆虫活性的片段或毒素。来自苏云金芽孢杆菌的Cry蛋白主要针对鳞翅目的、双翅目的、以及鞘翅目的有害生物昆虫具有有力的杀昆虫活性。这些蛋白质还已经显示针对以下目的有害生物的活性:膜翅目、同翅目、毛虱目、食毛目、以及壁虱目,连同其他的无脊椎动物目,例如线虫动物门、扁形动物门、以及肉足鞭毛亚门(Feitelson,J.,1993.The Bacillus Thuringiensis family tree[苏云金芽孢杆菌家族树],在:Advanced Engineered Pesticides[前沿的工程化的杀有害生物剂]中.马塞尔德克尔公司(Marcel Dekker,Inc.),纽约,纽约州)。这些蛋白质最初主要基于它们的杀昆虫活性而被分类。主要的类别是鳞翅目特异性(CryI)、鳞翅目和双翅目特异性(CryII)、鞘翅目特异性(CryIII)、双翅目特异性(CryIV)、以及线虫特异性(CryV)和(CryVI)。这些蛋白质进一步被分类为子族;在各个家族内的更高相关的蛋白质指定了区分的字母,如CryIA、CryIB、CryIC等。在各个区分内的甚至更紧密相关的蛋白质被给定名称,如CryIC(a)、CryIC(b)等。术语“Cry毒素”以及“δ-内毒素”与术语“Cry蛋白”已可互换地使用。对于Cry蛋白和基因的当前新命名法基于氨基酸序列同源性而不是昆虫靶标特异性(Crickmore等人(1998)Microbiol.Mol.Biol.Rev.[微生物分子生物学评论]62:807-813)。在这个更可接受的分类中,每种Cry蛋白被指定唯一的名称,该名称合并了初级等级(阿拉伯数字)(如果该蛋白与已知命名的Cry蛋白(例如Cry1或Cry2等)具有<45%的序列同一性)、二级等级(大写字母)(如果该蛋白与已知命名的Cry蛋白(例如Cry1I或Cry1J等)具有≥45%和<75%的序列同一性)、三级等级(小写字母)(如果该蛋白与已知命名的Cry蛋白(例如Cry1Ja或Cry1Jc等)具有从75%至95%的序列同一性)、以及四级等级(另一个阿拉伯数字)(如果该蛋白与已知命名的Cry蛋白(例如Cry1Ja1或Cry1Ja2等)具有>95%的序列同一性)。在当前分类中,在初级等级中罗马数字已经换为阿拉伯数字。例如,在旧命名法下的“CryIA(a)”现在在当前命名法下是“Cry1Aa”。根据Ibrahim等人(2010,Bioeng.Bugs[生物工程学蝽象],1:31-50),Cry毒素仍然可以根据其昆虫宿主特异性被分为六个主要类别并且包括:组1—鳞翅目(例如Cry1、Cry9和Cry15);组2—鳞翅目和双翅目(例如Cry2);组3—鞘翅目(Cry3、Cry7和Cry8);组4—双翅目(Cry4、Cry10、Cry11、Cry16、Cry17、Cry19和Cry20);组5—鳞翅目和鞘翅目(Cry1I);以及组6—线虫(Cry6)。Cry1I、Cry2、Cry3、Cry10和Cry11毒素(73-82kDa)是独特的,因为它们似乎是更大Cry1和Cry4蛋白(130-140kDa)的天然截短。
Cry蛋白是在Bt的孢子形成阶段期间以晶态形式积聚为原毒素的球状蛋白质分子。在由有害生物摄取后,这些晶体典型地被溶解以释放原毒素,原毒素大小的范围可以为,例如,对于许多鳞翅目活性的Cry蛋白如Cry1和Cry9为从130-140kDa,并且对于鞘翅目活性的Cry3蛋白及鳞翅目/双翅目活性的Cry2蛋白为60-80kDa。在这些晶体被易感昆虫溶解后,这些释放的原毒素被昆虫肠道中的蛋白酶例如胰蛋白酶和胰凝乳蛋白酶加工,以产生抗蛋白酶的核心Cry蛋白毒素。这种蛋白水解加工涉及从各种Cry原毒素的不同区域去除氨基酸。例如,为130-140kDa的Cry原毒素典型地通过蛋白水解去除25-30个氨基酸的N-末端肽以及C-末端的大约一半的剩余蛋白,产生一种约60-70kDa成熟Cry毒素。为60-80kDa的原毒素(例如Cry2和Cry3)也被加工但是其程度不与更大的原毒素相同。与更大的原毒素相比,较小的原毒素典型地从N-末端去除相等或更多个氨基酸,但较少氨基酸被从C-末端去除。例如,Cry2家族成员的蛋白水解活化典型地涉及去除约40-50个N-末端氨基酸。许多Cry蛋白对特定的靶标昆虫是相当有毒的,但许多具有窄的活性谱。
Cry蛋白通常具有五个保守序列结构域,以及三个保守结构性结构域(参见例如,de Maagd等人(2001)Trends Genetics[遗传学趋势],17:193-199)。第一保守结构性结构域(称作结构域I)典型地由七个α螺旋组成并且参与膜插入以及孔形成。结构域II典型地由三个安排为希腊钥匙构型的β片层组成,并且结构域III典型地由两个处于“果冻卷”(‘jelly-roll’)构造的反平行的β片层组成(de Maagd等人,2001,同上)。结构域II和III参与受体识别和结合,并且因此被考虑为毒素特异性的决定物。
术语“Cry1I”是指与全型Cry1I蛋白(NCBI登录号CAA44633)具有至少75%序列同一性的一组Cry蛋白的任何成员,以及术语“Cry1Ig”是指与全型Cry1Ig蛋白(NCBI登录号KC156701)具有至少95%序列同一性的Cry1I蛋白家族的任何成员(根据Crickmore等人,同上,通过引用结合在此)。
术语“Cry1J”是指与全型Cry1J蛋白(NCBI登录号AA22341)具有至少75%序列同一性的一组Cry蛋白的任何成员,以及术语“Cry1Ja”是指与上述鉴定的全型Cry1Ja蛋白具有至少95%序列同一性的Cry蛋白家族的任何成员(根据Crickmore等人,同上,通过引用结合在此)。术语“Cry1Jc”是指与全型Cry1Jc1蛋白(NCBI登录号AAC31092)具有至少95%序列同一性的Cry蛋白家族的任何成员。
“递送”组合物或毒性蛋白意指该组合物或毒性蛋白与昆虫接触,这促进该组合物或毒性Cry蛋白的经口摄取,产生对昆虫的毒性作用和控制。可以按照许多公认的方式,包括但不限于转基因植物表达、一种或多种配制的蛋白质组合物、一种或多种可喷洒的蛋白质组合物、饵基(baitmatrix)、或任何其他的领域公认的蛋白质递送系统来递送该组合物或毒性Cry蛋白。
术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白质的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白质同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽组。
“有效的昆虫控制量”意指Cry蛋白的浓度,它通过毒性作用抑制昆虫存活、生长、摄食或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“有效的昆虫控制量”可以或可以不意指杀死昆虫的量,尽管其优选地意指杀死昆虫的量。
如在此使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种感兴趣的多核苷酸(如编码本发明的Cry蛋白的多核苷酸)的表达的多核苷酸,包含启动子,该启动子可操作地连接至感兴趣的多核苷酸,该多核苷酸可操作地连接至终止信号。“表达盒”还典型地包含正确翻译感兴趣的多核苷酸所需的另外的多核苷酸。该表达盒还可以包含在感兴趣的多核苷酸的直接表达中不是必需的但是由于用于从一个表达载体去除该表达盒的方便限制位点而存在的其他多核苷酸。包含一个或多个感兴趣的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即在该表达盒中的感兴趣的多核苷酸不是天然存在于该宿主细胞中的,并且必须已经通过转化过程或育种过程引入到该宿主细胞或该宿主细胞的祖先中。该表达盒中的一个或多个感兴趣的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。
“基因”在此定义为包括一个或多个多核苷酸的遗传单位,该遗传单位占据染色体或质粒上特定位置并且包含用于生物中的特定特征或性状的遗传指令。
“肠蛋白酶”是在昆虫的消化道中天然发现的蛋白酶。该肠蛋白酶典型地参与被摄取的蛋白质的消化。昆虫肠蛋白质酶的实例包括胰蛋白酶,其典型地切割赖氨酸(K)或精氨酸(R)残基的C-末端侧上的肽;以及胰凝乳蛋白酶,其典型地切割苯丙氨酸(F)、色氨酸(W)或酪氨酸(Y)的C-末端侧上的肽。
当提及基因或多核苷酸或多肽使用时,术语“异源”是指基因或多核苷酸或多肽不是在其天然环境中或包含其非天然环境中存在的一部分(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的多核苷酸。异源基因还可以包括对生物来说是天然的多核苷酸,该多核苷酸已经以一些方式(例如,经突变;以多个拷贝添加;连接至一种非天然启动子或增强子多核苷酸等)被改变。异源基因可以进一步包含植物基因多核苷酸,其包含植物基因的cDNA形式;这些cDNA可以以正义方向(以产生mRNA)或反义方向(以产生一种反义RNA转录本,其与mRNA转录本是互补的)被表达。在本发明的一个方面,异源基因区别于内源性植物基因在于该异源基因多核苷酸被典型地连接至包含调节元件如启动子的多核苷酸上,未发现这些多核苷酸与由该异源基因编码的蛋白质的基因或与该染色体中的植物基因多核苷酸天然相关联,或者与在自然界中未发现的染色体的部分(例如,在基因座中表达的基因,其中该基因未正常表达)相关联。另外,“异源”多核苷酸是指不与将多核苷酸引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。
“同源重组”是在相同的多核苷酸的区域中成对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“交叉”)。“重组事件”在此被理解为意指减数分裂交叉。
当核苷酸序列编码了多肽(该多肽与由参考核苷酸序列所编码的多肽具有相同的氨基酸序列)时,这种核苷酸序列与这种参考核苷酸序列“同类编码”。例如,SEQ ID NO:17与SEQ ID NO:14为同类编码,因为它们都编码由SEQ ID NO:1代表的氨基酸序列。
术语“分离的”多核苷酸或蛋白质是不再存在于其天然环境中的多核苷酸或蛋白质。本发明的分离的多核苷酸或蛋白质可以按照纯化的形式存在,或者可以存在于重组宿主中,如转基因细菌或转基因植物中。因此,当多核苷酸包含在植物中时,针对“分离的多核苷酸”的权利要求旨在涵盖该多核苷酸。
“可操作地连接”是指在单个多核苷酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能RNA的表达时(即,该编码多核苷酸或功能RNA处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能RNA是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。
如在此使用的“杀有害生物”、“杀昆虫”等是指本发明的Cry蛋白控制有害生物的能力或者可以控制如在此所定义的有害生物的Cry蛋白的量。因此,杀有害生物Cry蛋白可以杀死或抑制有害生物(例如,昆虫有害生物)存活、生长、摄食、或繁殖的能力。
“植物”是在发育的任何阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。
“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花蕾或胚。
如在此使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。
“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括DNA、RNA、经修饰的寡核苷酸(例如,包含对于生物RNA或DNA不典型的碱基的寡核苷酸,如2'-O-甲基化寡核苷酸)等。在一些实施例中,多核苷酸可以是单链的、双链的、多链的或其组合。除非另外指示,否则本发明的特定多核苷酸任选地包含或编码除明确指示的任何多核苷酸之外的互补多核苷酸。
“感兴趣的多核苷酸”是指任何多核苷酸,当其转移至生物(例如,植物)中时赋予该生物所希望的特征,如昆虫抗性、疾病抗性、除草剂耐受性、抗生素抗性、改进的营养价值、工业过程中改进的性能、商业上有价值的酶或代谢物的生产、或者改变的繁殖能力。
术语“启动子”是指多核苷酸,通常在它的编码多核苷酸的上游(5'),它通过提供对正确转录所需的RNA聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。
“原生质体”是分离的植物细胞,没有细胞壁或仅具有部分的细胞壁。
如在此使用的,术语“重组”是指多核苷酸(例如,DNA或RNA)或蛋白质或生物的一种形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如在此使用的,“重组多核苷酸”是包含多核苷酸组合的多核苷酸,这些多核苷酸不会天然地一起存在并且是人类干预的结果,例如,一种多核苷酸,该多核苷酸由至少两种彼此异源的多核苷酸的组合组成,或一种多核苷酸,该多核苷酸是人工合成的并且包含偏离通常存在于自然界中的多核苷酸的多核苷酸,或一种多核苷酸,该多核苷酸包含人工掺入至宿主细胞的基因组DNA中的转基因和该宿主细胞基因组的相关侧翼DNA。重组多核苷酸的实例是由将转基因插入至植物的基因组DNA中产生的DNA分子,其可以最终导致该生物中的重组RNA或蛋白质分子的表达。“重组蛋白”是由重组多核苷酸编码的蛋白质,该重组多核苷酸已经克隆在支持该多核苷酸表达和mRNA翻译的系统中。例如,具有天然氨基酸序列或突变氨基酸序列并在植物中表达的Cry蛋白是重组Cry蛋白。如在此使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因或异源多核苷酸。由于此类基因组改变,重组植物明显不同于相关的野生型植物。
“调节元件”是指参与控制核苷酸序列的表达的序列。调节元件包含可操作地连接至感兴趣的核苷酸序列的启动子以及终止信号。它们还典型地涵盖适当翻译该核苷酸序列所需的序列。
在两个核苷酸或氨基酸序列的上下文中,术语“同一性”或“同一的”或“实质上同一的”是指当针对最大对应性进行比较和比对时具有至少60%、优选地至少80%、更优选地至少90%、甚至更优选地至少95%、并且最优选地至少99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,该实质上的同一性存在于整个具有长度为至少约50个残基或碱基的序列的区域中,更优选地在整个至少约100个残基或碱基的区域中,并且最优选地这些序列在至少约150个残基或碱基上是实质上同一的。在一个尤其优选的实施例中,这些序列在这些编码区的全部长度上实质上是同一的。此外,实质上同一的核苷酸或氨基酸序列实质上执行相同的功能。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。
用于比较的序列的最佳比对可以按照以下方式进行,例如通过Smith和Waterman,Adv.Appl.Math.[应用数学进展]2:482(1981)的局部同源性算法、通过Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443(1970)的同源比对算法、通过Pearson和Lipman,Proc.Nat'l.Acad Sci.USA[美国国家科学院院刊]85:2444(1988)的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算机组(Genetics Computer Group),科学街575号(575ScienceDr.),麦迪逊,威斯康星州),或通过目测检查(总体上参见Ausubel等人,下文)。
适合于确定序列同一性百分比以及序列相似性的算法的一个实例是BLAST算法,它描述于以下文献中:Altschul等人,J.Mol.Biol.[分子生物学杂志]215:403-410(1990)。执行BLAST分析的软件是通过国家生物技术信息中心(the National Center forBiotechnology Information,美国国家医学图书馆(U.S.National Library ofMedicine),洛克维尔大道8600号(8600Rockville Pike),贝塞斯达,马里兰州20894美国)可供公众使用的。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈(Altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff和Henikoff,Proc.Natl.Acad Sci.USA[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分比之外,BLAST算法还进行两个序列之间相似性的统计分析(参见例如,Karlin和Altschul,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,如果在测试核苷酸序列与参考核苷酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核苷酸序列被认为是与该参考序列相似的。
两个核苷酸序列实质上同一的另一指示是这两个分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)DNA或RNA中时进行的。“实质上结合”是指在探针核苷酸与靶核苷酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格来容纳,以实现靶核苷酸序列的所希望的检测。
在多核苷酸杂交实验(如DNA杂交和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列在较高的温度下特异性杂交。对核苷酸杂交的广泛指导见于以下文献中:Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy ofnucleic acid probe assays[杂交原理和核酸探针检验策略综述]”,爱思唯尔集团(Elsevier),纽约。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶子序列进行杂交,但不会与其他序列杂交。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的Tm。对于互补多核苷酸(它们在DNA或RNA印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15M NaCl在72℃下持续约15分钟。严格洗涤条件的实例是0.2×SSC洗涤在65℃下持续15分钟(参见,Sambrook,下文,对于SSC缓冲剂的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的中等严格洗涤的实例是1×SSC在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6×SSC在40℃下持续15分钟。对于短探针(例如,约10-50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0-8.3下约0.01至1.0M的Na离子浓度(或其他盐类),并且该温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的多核苷酸所编码的蛋白质是实质上同一的,则它们仍然是实质上同一的。例如,当使用遗传密码允许的最大程度的密码子简并而生成多核苷酸的拷贝时,则发生这种情况。
以下是可以用来克隆同源核苷酸序列(这些序列与本发明的参考核苷酸序列实质上同一)的杂交/洗涤条件的设置的实例:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在2×SSC、0.1%SDS中在50℃洗涤;更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在1×SSC、0.1%SDS中在50℃洗涤;仍更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA中在50℃,并且在0.5×SSC、0.1%SDS中在50℃洗涤;优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在50℃洗涤;更优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在65℃洗涤。
两种蛋白质实质上同一的另一个指示是针对由第一多核苷酸编码的蛋白质产生的抗体与由第二多核苷酸编码的蛋白质进行免疫性交叉反应或与其特异性结合。因此,蛋白质典型地是与第二蛋白质实质上同一的,例如其中这两种蛋白质仅区别于保守性取代。
“合成的”是指一种核苷酸序列,该核苷酸序列包含在天然序列中不存在的碱基或结构特征。例如,编码本发明的Cry蛋白的人工序列(其更类似于双子叶植物或单子叶植物基因的G+C含量和正常密码子分布)被表述为合成的。
如在此使用的,“有毒的”与“杀昆虫的”同义,并且意指本发明的Cry蛋白通过杀死昆虫有害生物,或者通过干扰或阻止昆虫有害生物的摄食或引起对昆虫有害生物的生长抑制(两者可以引起或可以不引起昆虫死亡)而对昆虫有害生物具有负面作用。当本发明的Cry蛋白被递送至昆虫或昆虫与Cry蛋白进行经口接触时,该毒性作用典型地是该昆虫的死亡、或者该昆虫的生长减慢、或者该昆虫停止以使该有毒的Cry蛋白可供该昆虫利用的来源为食。
“转化”是用于将异源多核苷酸引入到宿主细胞或生物的方法。特别地,“转化”意指DNA分子稳定地整合到感兴趣生物的基因组中。
“转化的/转基因的/重组的”是指引入了异源多核苷酸的宿主生物,如细菌或植物。该多核苷酸可以被稳定地整合到宿主的基因组中,或者该多核苷酸还可以作为染色体外分子存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含该异源多核苷酸的野生型生物,例如细菌或植物。
在此的核苷酸通过其碱基由以下标准缩写进行指示:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。氨基酸也由以下标准缩写进行指示:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;1)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。
本发明提供了用于控制作物植物和衍生自作物植物的商品的有害的有害生物的组合物以及方法。特别地,本发明涉及Cry蛋白,其可以分离自细菌如苏云金芽孢杆菌,其对昆虫有害生物是有毒的;并且涉及包含编码这些Cry蛋白质的核苷酸序列的多核苷酸;以及涉及制备和使用这些多核苷酸和Cry蛋白以控制昆虫有害生物的方法。
本发明还涵盖多核苷酸,其是Cry蛋白原毒素编码多核苷酸的片段。“片段”旨在编码Cry蛋白的核苷酸序列的一个部分。核苷酸序列的片段可以编码Cry蛋白的生物活性部分,即所谓的“毒性片段”,或它可以是如下片段,使用以下披露的方法该片段可以用作杂交探针或PCR引物。多核苷酸是Cry蛋白编码核苷酸序列的片段,根据所期望的用途包含至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸,或高达存在于在此披露的全长Cry蛋白编码核苷酸序列中的核苷酸的数目(例如,针对SEQ IDNO:14是3504个核苷酸)。“连续的”核苷酸旨在彼此直接相邻的核苷酸残基。本发明的核苷酸序列的一些片段将编码保留Cry蛋白的生物活性、并且因此保留杀昆虫活性的毒性片段。“保留杀昆虫活性”旨在该片段将具有至少约30%、优选地至少约50%、更优选地至少约70%、甚至更优选地至少约80%的Cry蛋白的杀昆虫活性。用于测量杀昆虫活性的方法在本领域是已熟知的。参见例如,Czapla和Lang,(1990),J.Econ.Entomol.[经济昆虫学杂志]83:2480-2485;Andrews等人,(1988),Biochem.J.[生物化学杂志]252:199-206;Marrone等人,(1985),J.of Economic Entomology[经济昆虫学杂志]78:290-293;以及美国专利号5,743,477,将其全部通过引用以其全文结合在此。
本发明的Cry蛋白的毒素片段将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、和450个连续的氨基酸,或高达存在于本发明的全长Cry蛋白中的总数目的氨基酸(例如,针对SEQ ID NO:1是1167个氨基酸)。因此,在一些实施例中,借助于蛋白水解加工(例如通过从昆虫的肠中制备的蛋白酶)而已经被激活的Cry蛋白可以被表征并且经激活的毒素片段的N-末端或C-末端氨基酸被鉴定。在本发明的这个方面,本领域技术人员可以确定:例如,SEQ ID NO:1的毒素片段可包含SEQ ID NO:1的从约位置28、30、36、41、43、44、45、47或48至约位置610、615、616、622、623、624或625的氨基酸,或者SEQ ID NO:2的毒素片段可包含SEQ ID NO:2的从约位置21、23、28、35、38、46或61至约位置607、611、618、625或628的氨基酸,或者SEQ ID NO:3的毒素片段可包含SEQ ID NO:3的从约位置23、24、28、30、32、33、35、36、37或40至约位置611、616、617、625、626、647、653或654的氨基酸。通过在该编码序列的适当的位置处引入或消除蛋白酶加工位点以允许、或消除由昆虫、植物或微生物蛋白酶对较大变体蛋白质的蛋白水解切割而产生的Cry蛋白变体也在本发明的范围内。此类操作的最终结果被理解为产生具有与完整原毒素Cry蛋白相同或不同活性的毒素片段分子。
根据一些实施例,本发明提供了多核苷酸或任选地分离的多核苷酸,该多核苷酸包含编码处于其原毒素形式的Cry蛋白或对鳞翅目有害生物有毒的其毒素片段的核苷酸序列,其中该核苷酸序列(a)与SEQ ID NO:14-16中任一项或SEQ ID NO:14-16中任一项的毒素编码片段具有至少80%到至少99%序列同一性;或者(b)编码包含氨基酸序列的蛋白,该氨基酸序列与SEQ ID NO:1-3中任一项或SEQ ID NO:1-3中任一项的毒素片段具有至少80%到至少99%序列同一性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
在其他实施例中,该鳞翅目有害生物选自下组,该组由以下各项组成:欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)以及水稻卷叶螟(稻纵卷叶螟)。
在仍其他实施例中,该核苷酸序列或该合成的核苷酸序列包含SEQ ID NO:14-29中任一项或SEQ ID NO:14-29中任一项的毒素编码片段。在其他实施例中,该合成的核苷酸序列包含SEQ ID NO:17-22中任一项或SEQ ID NO:17-22中任一项的毒素编码片段。
在一些实施例中,本发明的多核苷酸包含以下项、基本由以下项组成、或由以下项组成:编码Cry蛋白的核苷酸序列,该Cry蛋白包含一种氨基酸序列,该氨基酸序列与SEQ IDNO:1-3中任一项或SEQ ID NO:1-3中任一项的毒素片段具有至少80%到至少99%序列同一性。在一些其他实施例中,该氨基酸序列包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段。
在一些实施例中,本发明的多核苷酸编码Cry蛋白,该Cry蛋白是Cry1I或Cry1J蛋白。在其他实施例中,该Cry1I蛋白是Cry1Ig蛋白。在仍其他实施例中,该Cry1Ig蛋白包含SEQ ID NO:2、SEQ ID NO:5、或者SEQ ID NO:2或SEQ ID NO:5的毒素片段。在其他实施例中,该Cry1Ig蛋白对选自下组的鳞翅目有害生物是有毒的,该组由以下各项组成:欧洲玉米蛀虫(欧洲玉米螟)、甘蔗螟(小蔗螟)、大豆夜蛾(大豆尺蠖)和西南玉米蛀虫(西南玉米螟)。在仍其他实施例中,该合成序列包含以下项、基本由以下项组成、或由以下项组成:SEQ IDNO:18或其毒素编码片段。
在一些实施例中,本发明的多核苷酸编码Cry1J蛋白,该Cry1J蛋白是Cry1Ja或Cry1Jc蛋白。在其他实施例中,该Cry1Ja蛋白包含以下项、基本由以下项组成、或由以下项组成:选自下组的氨基酸序列,该组由以下各项组成:SEQ ID NO:1,SEQ ID NO:4,SEQ IDNO:7-13,以及SEQ ID NO:1、SEQ ID NO:4或SEQ ID NO:7-13中任一项的毒素片段。在其他实施例中,该Cry1Ja蛋白对选自下组的鳞翅目有害生物是有毒的,该组由以下各项组成:欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)。在仍其他实施例中,该合成序列包含SEQ ID NO:17或其毒素编码片段。
在其他实施例中,该Cry1Jc蛋白包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:3、SEQ ID NO:6、或者SEQ ID NO:3或SEQ ID NO:6的毒素片段。在仍其他实施例中,该Cry1Jc蛋白对选自下组的鳞翅目有害生物是有毒的,该组由以下各项组成:欧洲玉米蛀虫(欧洲玉米螟)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)。在其他实施例中,该合成序列包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:19或其毒素编码片段。
在本发明的一些实施例中,提供了嵌合基因,该嵌合基因包含异源启动子,该启动子可操作地连接至多核苷酸,该多核苷酸包含以下项、或基本由以下项组成、或由以下项组成:编码对鳞翅目有害生物有毒的Cry蛋白的核苷酸序列,其中该核苷酸序列(a)与SEQ IDNO:14-16中任一项或SEQ ID NO:14-16中任一项的毒素编码片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(b)编码包含如下氨基酸序列的蛋白质,该氨基酸序列与SEQ ID NO:1-3中任一项或SEQ ID NO:1-3中任一项的毒素片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
在其他实施例中,本发明的嵌合基因中的异源启动子在多种细菌物种中是可操作的。在其他实施例中,这些细菌物种是苏云金芽孢杆菌或大肠杆菌。在仍其他实施例中,该异源启动子是Cry1Ac启动子或其变体。在另外的实施例中,该Cry1Ac启动子包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:30的核苷酸12-197或其片段。在仍其他实施例中,该异源启动子是Cry1Ac启动子并且该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:1-3中任一项或SEQ ID NO:1-3中任一项的毒素片段。
在其他实施例中,本发明的嵌合基因中的异源启动子是植物可表达型启动子。例如但不限于,该植物可表达型启动子可以选自下组,该组由以下各项组成:泛素、夜香树属黄病毒、玉米TrpA、OsMADS 6、玉蜀黍H3组蛋白、噬菌体T3基因9 5'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基RuBP羧化酶、水稻肌动蛋白、水稻亲环蛋白、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白(potato patatin)、凝集素、CaMV 35S以及S-E9小亚基RuBP羧化酶启动子。
在另外的实施例中,由嵌合基因编码的蛋白质对选自下组的一个或多个鳞翅目有害生物是有毒的,该组由以下各项组成:欧洲玉米蛀虫(ECB;欧洲玉米螟)、黑色地老虎(BCW;小地老虎)、秋黏虫(FAW;草地贪夜蛾)、玉米穗蛾(CEW;玉米穗虫)、甘蔗螟(SCB;小蔗螟)、绒毛豆毛虫(VBC;黎豆夜蛾)、大豆夜蛾(SBL;大豆尺蠖)、西南玉米蛀虫(SWCB;西南玉米螟)、西部豆切根虫(WBC;西方豆地香)、烟夜蛾(TBW;烟芽夜蛾)、亚洲玉米蛀虫(ACB;亚洲玉米螟)、棉螟蛉(CBW;棉铃虫)、条纹蛀茎虫(SSB;二化螟)、粉蛀茎虫(PSB;非洲大螟)以及水稻卷叶螟(RLF;稻纵卷叶螟)。
在另外的实施例中,该嵌合基因包含多核苷酸,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:核苷酸序列,该核苷酸序列与SEQ ID NO:14或其毒素编码片段具有至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,或者与SEQ IDNO:15或其毒素编码片段具有至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,或者与SEQ ID NO:16或其毒素编码片段具有至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:14-29中任一项或SEQ ID NO:14-29中任一项的毒素编码片段。
在仍其他实施例中,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:编码蛋白质的核苷酸序列,该蛋白质包含以下项、基本由以下项组成、或由以下项组成:氨基酸序列,该氨基酸序列与SEQ ID NO:1-3中任一项或SEQ ID NO:1-3中任一项的毒素片段具有至少80%到至少99%序列同一性。
在仍其他实施例中,该氨基酸序列与SEQ ID NO:1或其毒素片段具有至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在另外的实施例中,该氨基酸序列与SEQ ID NO:2或其毒素片段具有至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该氨基酸序列与SEQ ID NO:3或其毒素片段具有至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段。
在一些实施例中,本发明的嵌合基因包含多核苷酸,该多核苷酸包含合成核苷酸序列,该合成核苷酸序列与SEQ ID NO:14-22中任一项在整个长度上具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,本发明的嵌合基因包含多核苷酸,该多核苷酸包含编码蛋白质的核苷酸序列的合成序列,该蛋白质包含氨基酸序列,该氨基酸序列与SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段在整个长度上具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%、或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,该蛋白质包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段。在另外的实施例中,该转基因生物是转基因细菌或转基因植物。在仍其他实施例中,该转基因细菌是大肠杆菌或苏云金芽孢杆菌。在其他实施例中,该转基因植物是玉蜀黍。
在一些实施例中,本发明的嵌合基因包含编码Cry1I或Cry1J蛋白的多核苷酸。在其他实施例中,该Cry1I蛋白是Cry1Ig蛋白。在其他实施例中,该Cry1Ig蛋白包含SEQ IDNO:2、SEQ ID NO:5、或者SEQ ID NO:2或SEQ ID NO:5的毒素片段。在仍其他实施例中,该Cry1Ig对欧洲玉米蛀虫(欧洲玉米螟)、甘蔗螟(小蔗螟)、大豆夜蛾(大豆尺蠖)和西南玉米蛀虫(西南玉米螟)是有毒的。在其他实施例中,该Cry1Ig蛋白由合成的多核苷酸编码,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:18或其毒素编码片段。
在一些实施例中,该嵌合基因编码Cry1J蛋白,该Cry1J蛋白是Cry1Ja或Cry1Jc蛋白。在其他实施例中,该Cry1Ja蛋白包含选自下组的氨基酸序列,该组由以下各项组成:SEQID NO:1,SEQ ID NO:4,SEQ ID NO:7-13,以及SEQ ID NO:1、SEQ ID NO:4或SEQ ID NO:7-13中任一项的毒素片段。在其他实施例中,该Cry1Ja蛋白对欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)是有毒的。在其他实施例中,该Cry1Ja蛋白由合成的多核苷酸编码,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:17或其毒素编码片段。
在一些实施例中,该嵌合基因编码Cry1J蛋白,该Cry1J蛋白是Cry1Jc蛋白。在其他实施例中,该Cry1Jc蛋白包含SEQ ID NO:3、SEQ ID NO:6、或者SEQ ID NO:3或SEQ ID NO:6的毒素片段。在仍其他实施例中,该Cry1Jc蛋白对欧洲玉米蛀虫(欧洲玉米螟)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)是有毒的。在其他实施例中,该Cry1Jc蛋白由合成的多核苷酸编码,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:19或其毒素编码片段。
在一些实施例中,本发明提供了一种合成多核苷酸,该合成多核苷酸包含以下项、基本由以下项组成、或由以下项组成:核苷酸序列,该核苷酸序列编码对鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列与SEQ ID NO:14-22中任一项或SEQ ID NO:14-22中任一项的毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,本发明提供了合成多核苷酸,该合成多核苷酸包含以下项、基本由以下项组成、或由以下项组成:核苷酸序列,该核苷酸序列编码对鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列编码氨基酸序列,该氨基酸序列与SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段在整个长度上具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。在其他实施例中,该合成多核苷酸编码蛋白质,该蛋白质包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段。
本发明的Cry蛋白可以分离自某些苏云金芽孢杆菌(Bt)菌株,如在此描述的SC0532、SC0705和SC0666。应当认识到本发明的Cry蛋白还可以分离自其他Bt菌株并且此类Bt菌株可以通过标准技术分离并且测试本发明的Cry蛋白的存在或测试对本发明的鳞翅目有害生物的毒性。通常,Bt菌株可以通过本领域中已知的方法分离自任何环境样品,包括土壤、植物、昆虫、谷物升降机粉尘、以及其他样品材料。参见,例如,Travers等人,(1987),Appl.Environ.Microbiol.[应用与环境微生物学]53:1263-1266;Saleh等人,(1969),CanJ.Microbiol.[加拿大微生物学杂志]15:1101-1104;DeLucca等人,(1981),CanJ.Microbiol.[加拿大微生物学杂志]27:865-870;以及Norris等人,(1981),“The generaBacillus and Sporolactobacillus[芽孢杆菌属和芽孢乳杆菌属]”,于Starr等人,(编著),The Prokaryotes:A Handbook on Habitats,Isolation,and Identification ofBacteria[原核生物:关于细菌的栖息地、分离和鉴定手册],第II卷,施普林格出版社(SpringerVerlog)柏林海德堡;所有专利文献通过引用结合在此。分离之后,可以测试Bt菌株对鳞翅目有害生物的毒性,并且使用例如本文披露的核苷酸或氨基酸序列,以及本领域标准的分子技术可以鉴定本发明涵盖的一种或多种Cry蛋白。因此,在一些实施例中,本发明涵盖了苏云金芽孢杆菌(Bt)菌株,该菌株产生Cry蛋白或重组Cry蛋白,该Cry蛋白包含以下项、基本由以下项组成、或由以下项组成:氨基酸序列,其与SEQ ID NO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段具有至少80%到至少99%序列同一性。在其他实施例中,该Bt菌株选自下组,该组由以下各项组成:SC0532、SC0705和SC0666。在仍另外的实施例中,该Cry蛋白或重组Cry蛋白包含以下项、基本由以下项组成、或由以下项组成:SEQ IDNO:1-13中任一项或SEQ ID NO:1-13中任一项的毒素片段。
根据一些实施例,本发明提供了Cry蛋白或任选地被分离的Cry蛋白或重组Cry蛋白,其对鳞翅目有害生物是有毒的,其中该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白包含以下项、基本由以下项组成、或由以下项组成:(a)氨基酸序列,其与SEQ ID NO:1-6中任一项或SEQ ID NO:1-6中任一项的毒素片段具有至少80%序列同一性到至少99%序列同一性;或者(b)氨基酸序列,其由核苷酸序列编码,该核苷酸序列与由SEQ ID NO:14-19中任一项或SEQ ID NO:14-19中任一项的毒素编码片段代表的核苷酸序列具有至少80%序列同一性到至少99%序列同一性。
在其他实施例中,该Cry蛋白或任选地被分离的Cry蛋白或重组Cry蛋白包含以下项、基本由以下项组成、或由以下项组成:氨基酸序列,其与SEQ ID NO:1-6中任一项或SEQID NO:1-6中任一项的毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与SEQ ID NO:1或其毒素片段具有至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在另外的实施例中,该氨基酸序列与SEQ ID NO:2或其毒素片段具有至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该氨基酸序列与SEQ ID NO:3或其毒素片段具有至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,该氨基酸序列包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:1-13中任一项或其毒素片段。在其他实施例中,该氨基酸序列是由核苷酸序列编码的,该核苷酸序列包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:14-29中任一项或SEQ ID NO:14-29中任一项的毒素编码片段。
在其他实施例中,本发明的Cry蛋白或任选地被分离的Cry蛋白或重组Cry蛋白对选自下组的鳞翅目有害生物是有毒的,该组由以下各项组成:欧洲玉米蛀虫(欧洲玉米螟)、黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)以及水稻卷叶螟(稻纵卷叶螟)。
在其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白包含以下项、基本由以下项组成、或由以下项组成:氨基酸序列,其与SEQ ID NO:1-13中任一项或SEQID NO:1-13中任一项的毒素片段具有至少80%到至少99%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:1或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:2或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:3或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:4或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:5或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:6或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:7或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:8或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:9或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:10或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:11或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:12或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白的氨基酸序列与SEQ ID NO:13或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白包含以下项、基本由以下项组成、或由以下项组成:SEQ IDNO:4-13中任一项或其毒素片段的氨基酸序列。在其他实施例中,该重组Cry蛋白是由核苷酸序列编码的,该核苷酸序列包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:17-29中任一项或其毒素编码片段。
在一些实施例中,本发明的Cry蛋白、任选地被分离的Cry蛋白或重组Cry蛋白是Cry1I或Cry1J蛋白。在其他实施例中,该Cry1I蛋白是Cry1Ig蛋白。在其他实施例中,该Cry1Ig蛋白包含SEQ ID NO:2、SEQ ID NO:5、或者SEQ ID NO:2或SEQ ID NO:5的毒素片段。在仍其他实施例中,该Cry1Ig对欧洲玉米蛀虫(欧洲玉米螟)、甘蔗螟(小蔗螟)、大豆夜蛾(大豆尺蠖)和西南玉米蛀虫(西南玉米螟)是有毒的。在其他实施例中,该Cry1Ig蛋白由合成的多核苷酸编码,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ IDNO:18或其毒素编码片段。
在一些实施例中,该Cry1J蛋白、任选地被分离的Cry1J蛋白或重组Cry1J蛋白是Cry1Ja或Cry1Jc蛋白。在其他实施例中,该Cry1Ja蛋白包含选自下组的氨基酸序列,该组由以下各项组成:SEQ ID NO:1,SEQ ID NO:4,SEQ ID NO:7-13,以及SEQ ID NO:1、SEQ IDNO:4或SEQ ID NO:7-13中任一项的毒素片段。在其他实施例中,该Cry1Ja蛋白对欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)是有毒的。在其他实施例中,该Cry1Ja蛋白由合成的多核苷酸编码,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:17或其毒素编码片段。
在一些实施例中,该Cry1J蛋白、任选地被分离的Cry1J蛋白或重组Cry1J蛋白是Cry1Jc蛋白。在其他实施例中,该Cry1Jc蛋白包含SEQ ID NO:3、SEQ ID NO:6、或者SEQ IDNO:3或SEQ ID NO:6的毒素片段。在仍其他实施例中,该Cry1Jc蛋白对欧洲玉米蛀虫(欧洲玉米螟)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)是有毒的。在其他实施例中,该Cry1Jc蛋白由合成的多核苷酸编码,该多核苷酸包含以下项、基本由以下项组成、或由以下项组成:SEQ ID NO:19或其毒素编码片段。
本发明还涵盖响应于通过天然的或突变型BT2Cry1J、BT25Cry1I和BT53Cry1J Cry蛋白、或相关Cry蛋白的免疫激发而产生的抗体。此类抗体可以使用生产多克隆抗血清的标准免疫学技术生产,并且如果需要的话,无限增殖免疫宿主的抗体产生细胞用于单克隆抗体生产源。用于生产针对任何感兴趣物质的抗体的技术是熟知的,例如如在以下文献中:Harlow和Lane(1988,Antibodies a laboratory manual.[抗体:实验室手册],第726页,冷泉港实验室)以及如在Goding(Monoclonal Antibodies:Principles&practice[单克隆抗体:原理与实践]1986,学术出版社公司(Academic Press,Inc.),奥兰多,佛罗里达州),这两者均通过引用结合在此。本发明涵盖杀昆虫蛋白,其与抗体、特别是单克隆抗体交叉反应,产生了针对本发明的杀昆虫Cry蛋白中的一种或多种。
本发明中生产的这些抗体在用于确定生物样品中天然的或突变型BT2Cry1J、BT25Cry1I和BT53Cry1J或相关Cry蛋白的量或存在的免疫测定中也是有用的。此类测定在质量控制生产含有本发明的Cry蛋白中的一种或多种或相关Cry蛋白的组合物中也是有用的。此外,这些抗体可以用来评估本发明的Cry蛋白中的一种或多种或相关蛋白的重组生产的功效,连同针对编码本发明的Cry蛋白中的一种或多种的核苷酸序列或相关蛋白编码序列的存在而筛选表达文库的功效。抗体还作为亲和配体用于纯化或分离本发明的蛋白质中的任何一种或多种以及相关蛋白是有用的。本发明的Cry蛋白和含有相关抗原表位的蛋白质可以通过在优选的宿主细胞中过度表达编码全部或部分本发明的Cry蛋白或相关蛋白的序列的全长或部分长度来获得。
应当认识到,可以通过不同的方法来改变编码本发明的Cry蛋白的DNA序列,并且这些改变可以产生编码如下蛋白质的DNA序列,这些蛋白质具有不同于由本发明的天然Cry蛋白所编码的氨基酸序列。Cry蛋白可以按照不同的方式进行改变从而成为突变型Cry蛋白,包括SEQID NO:1-3中任一项或SEQ ID NO:1-3中任一项的毒素片段的一个或多个氨基酸的氨基酸取代、缺失、截短、以及插入,包括多达约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155个、或更多个氨基酸取代、缺失或插入。用于此类操作的方法在本领域中通常是已知的。例如,通过在编码该蛋白质的多核苷酸中的突变可以制备天然Cry蛋白的氨基酸序列变体。这还可以通过几种诱变形式之一或在定向进化中来完成。在一些方面中,在该氨基酸序列中所编码的改变将实质上不影响该蛋白质的功能。此类变体将具有所希望的杀昆虫活性。在本发明的一些实施例中,由SEQ ID NO:14-16代表的核苷酸序列被改变,以在所编码的蛋白质中引入氨基酸取代,产生具有与天然蛋白基本相同的杀昆虫特性的突变型蛋白。在其他实施例中,所得到的突变型蛋白是由合成的突变型多核苷酸编码的,该多核苷酸包含由SEQ ID NO:17-29中任一项或SEQ ID NO:17-29中任一项的毒素编码片段代表的核苷酸序列。在其他实施例中,该突变型蛋白包含以下项、基本由以下项组成、或由以下项组成:SEQID NO:4-13中任一项或SEQ ID NO:4-13中任一项的毒素片段代表的氨基酸序列。
在其他实施例中,本发明的天然Cry蛋白的杀昆虫活性可以通过在天然Cry蛋白氨基酸序列中插入、缺失或取代氨基酸来调节,产生本发明的经修饰的Cry蛋白。例如,调节Cry蛋白的杀昆虫活性,其中与受天然Cry蛋白影响的昆虫范围相比,经修饰的Cry蛋白对更广泛或更窄范围的昆虫是有毒的。可能所希望的是创建经修饰的Cry蛋白,其具有与天然Cry蛋白相比对更广泛范围的昆虫有害生物具有毒性,其中多种有害生物以感兴趣的单一作物植物为食,而对较窄范围的昆虫具有毒性的经修饰的Cry蛋白可能是希望的,其中例如,天然Cry蛋白对其具有活性的特定昆虫有害生物不以该经修饰的Cry蛋白在其中表达的作物植物为食。靶标有害生物范围的这种减少可以帮助减轻多种作物系统环境(例如,其中转基因玉米、转基因大豆和转基因棉花彼此非常接近地生长)中的昆虫抗性发展。
在一些其他实施例中,通过用与天然Cry蛋白中处于该位置的氨基酸不同的氨基酸取代天然Cry氨基酸序列结构域I的α-螺旋3、α-螺旋4、α-螺旋5或α-螺旋6中的至少一个氨基酸,可以调节该天然Cry蛋白的杀昆虫活性。在其他实施例中,该天然Cry蛋白是Cry1J蛋白。在其他实施例中,该Cry1J蛋白是Cry1Ja或Cry1Jc蛋白。在仍其他实施例中,对应于SEQ ID NO:1或SEQ ID NO:3的氨基酸位置97、105、108、110、118和119的天然Cry1J蛋白的α-螺旋3中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1J蛋白的这些位置处,产生经修饰的Cry1J蛋白。在一些实施例中,Cry1Ja蛋白的α-螺旋3中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比对较窄范围的昆虫是有毒的。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1,并且该经修饰的Cry1Ja在α-螺旋3中具有A97T、S105N、L108I、G110A、K118S和T119D取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:7或其毒素片段。在仍其他实施例中,该经修饰的Cry1Ja与天然Cry1Ja蛋白相比,对大豆夜蛾和烟夜蛾具有活性,但对欧洲玉米蛀虫、甘蔗螟、西南玉米蛀虫、黑色地老虎、秋黏虫、玉米穗蛾或绒毛豆毛虫几乎不具有或不具有活性。
在一些实施例中,对应于SEQ ID NO:1的氨基酸位置123、126、130、131、136、138、139、149和150的天然Cry1Ja蛋白的α-螺旋4中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1Ja蛋白的这些位置处,产生经修饰的Cry1Ja蛋白。在其他实施例中,该Cry1Ja蛋白的α-螺旋4中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比对较窄范围的昆虫是有毒的。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1或其毒素片段,并且经修饰的Cry1Ja在α-螺旋4中具有T123E、R126K、T130I、E131D、I136L、A138G、Q139L、V149I和S150I取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:8或其毒素片段。在仍其他实施例中,该经修饰的Cry1Ja与天然Cry1Ja蛋白相比,对大豆夜蛾、绒毛豆毛虫和烟夜蛾具有活性,但对欧洲玉米蛀虫、甘蔗螟、西南玉米蛀虫、黑色地老虎、秋黏虫和玉米穗蛾几乎不具有或不具有活性。
在一些实施例中,对应于SEQ ID NO:1的氨基酸位置158、161、176、186、196、197、198和200的天然Cry1Ja蛋白的α-螺旋5/6中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1Ja蛋白的这些位置处,产生经修饰的Cry1Ja蛋白。在其他实施例中,该Cry1Ja蛋白的α-螺旋5/6中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白具有与天然Cry1Ja基本相同的杀昆虫活性谱。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1或其毒素片段,并且经修饰的Cry1Ja在α-螺旋5/6中具有L158S、T161V、V176I、T186K、V196I、N197R、R198E和G200H取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:9或其毒素片段。
在一些实施例中,对应于SEQ ID NO:1的氨基酸位置97、105、108、110、118、119、123、126、130、131、136、138、139、149和150的天然Cry1Ja蛋白的α-螺旋3和α-螺旋4中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1Ja蛋白的这些位置处,产生经修饰的Cry1Ja蛋白。在一些实施例中,该Cry1Ja蛋白的α-螺旋3和α-螺旋4中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比对较窄范围的昆虫是有毒的。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1或其毒素片段,并且经修饰的Cry1Ja在α-螺旋3和α-螺旋4中具有A97T、S105N、L108I、G110A、K118S、T119D、T123E、R126K、T130I、E131D、I136L、A138G、Q139L、V149I和S150I取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:10或其毒素片段。在仍其他实施例中,该经修饰的Cry1J与天然Cry1Ja蛋白相比,对甘蔗螟、FAW和CEW不具有活性或具有减少的活性,并且对欧洲玉米蛀虫、西南玉米蛀虫、黑色地老虎、大豆夜蛾、绒毛豆毛虫和烟夜蛾具有基本相同的活性。
在一些实施例中,对应于SEQ ID NO:1的氨基酸位置123、126、130、131、136、138、139、149、150、158、161、176、186、196、197、198和200的天然Cry1Ja蛋白的α-螺旋4和α-螺旋5/6中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1Ja蛋白的这些位置处,产生经修饰的Cry1Ja蛋白。在其他实施例中,该Cry1Ja蛋白的α-螺旋4和α-螺旋5/6中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比对较窄范围的昆虫是有毒的。在其他实施例中,该经修饰的Cry1Ja蛋白对夜蛾科家族中的昆虫有害生物具有活性,但对草螟科家族中的昆虫有害生物不具有活性。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1或其毒素片段,并且经修饰的Cry1Ja在α-螺旋4和α-螺旋5/6中具有T123E、R126K、T130I、E131D、I136L、A138G、Q139L、V149I、S150I、L158S、T161V、V176I、T186K、V196I、N197R、R198E和G200H取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:11或其毒素片段。在仍其他实施例中,该经修饰的Cry1Ja蛋白对草螟科家族成员欧洲玉米蛀虫、甘蔗螟和SWCB不具有活性。在其他实施例中,该经修饰的Cry1Ja蛋白对夜蛾科成员黑色地老虎、秋黏虫、玉米穗蛾、大豆夜蛾、绒毛豆毛虫和烟夜蛾具有活性。在仍其他实施例中,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比,对黑色地老虎、秋黏虫和玉米穗蛾具有减少的活性。在仍其他实施例中,该经修饰的Cry1Ja蛋白对欧洲玉米蛀虫、甘蔗螟和西南玉米蛀虫不具有活性,并且对黑色地老虎、秋黏虫、玉米穗蛾、大豆夜蛾、绒毛豆毛虫和烟夜蛾具有活性。
在一些实施例中,对应于SEQ ID NO:1的氨基酸位置97、105、108、110、118、119、158、161、176、186、196、197、198和200的天然Cry1Ja蛋白的α-螺旋3和α-螺旋5/6中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1Ja蛋白的这些位置处,产生经修饰的Cry1Ja蛋白。在一些实施例中,该Cry1Ja蛋白的α-螺旋3和α-螺旋5/6中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比不具有杀昆虫活性。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1或其毒素片段,并且经修饰的Cry1Ja在α-螺旋3和α-螺旋5/6中具有A97T、S105N、L108I、G110A、K118S、T119D、L158S、T161V、V176I、T186K、V196I、N197R、R198E和G200H取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:12或其毒素片段。
在一些实施例中,对应于SEQ ID NO:1的氨基酸位置97、105、108、110、118、119、123、126、130、131、136、138、139、149、150、158、161、176、186、196、197、198和200的天然Cry1Ja蛋白的α-螺旋3、α-螺旋4和α-螺旋5/6中的氨基酸被不同于如下氨基酸的氨基酸取代,该氨基酸存在于天然Cry1Ja蛋白的这些位置处,产生经修饰的Cry1Ja蛋白。在一些实施例中,该Cry1Ja蛋白的α-螺旋3、α-螺旋4和α-螺旋5/6中的氨基酸取代产生经修饰的Cry1Ja蛋白,该经修饰的Cry1Ja蛋白与天然Cry1Ja蛋白相比具有相同的杀昆虫活性。在其他实施例中,该天然Cry1Ja蛋白包含SEQ ID NO:1或其毒素片段,并且经修饰的Cry1Ja在α-螺旋3、α-螺旋4和α-螺旋5/6中具有A97T、S105N、L108I、G110A、K118S、T119D、T123E、R126K、T130I、E131D、I136L、A138G、Q139L、V149I、S150I、L158S、T161V、V176I、T186K、V196I、N197R、R198E和G200H取代。在仍其他实施例中,该经修饰的Cry1Ja包含SEQ ID NO:13或其毒素片段。
应当理解的是可以通过使用此类技术改进杀昆虫蛋白对本发明的这些组合物赋予杀昆虫活性的能力。例如,可以在以下宿主细胞中表达Cry蛋白,这些宿主细胞在DNA复制过程中展现高比率的碱基错误结合,如XL-1Red(斯特塔杰公司(Stratagene),拉荷亚(LaJolla),加利福尼亚州)。在此类菌株中繁殖之后,可以分离出该DNA(例如通过制备质粒DNA,或通过由PCR进行扩增并且将得到的PCR片段克隆到载体中),在非诱变菌株中培养这些Cry蛋白突变体,并且鉴定具有杀昆虫活性的经突变的基因,例如通过进行对杀昆虫活性进行测试的测定。通常,在摄食测定中混合并使用了该蛋白质。参见例如Marrone等人,(1985),J.of Economic Entomology[经济昆虫学杂志]78:290-293。此类测定可以包括使植物与一种或多种有害生物接触,并且确定该植物存活或引起这些有害生物死亡的能力。导致毒性提高的突变的实例见于Schnepf等人,(1998),Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:775-806中。
可替代地,可以在氨基或羧基的末端上对本发明的氨基酸序列进行改变,而实质上不影响活性。这可以包括通过现代分子方法所引入的插入、缺失、或改变,这些方法是如PCR,包括PCR扩增,这些PCR扩增借助于将编码氨基酸的序列包含到在PCR扩增中所使用的寡核苷酸之中而改变或延长该蛋白质编码序列。可替代地,所添加的蛋白质序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加感兴趣的蛋白质的表达;(2)引入结合域、酶活性、或表位以促进蛋白质纯化、蛋白质检测、或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白质的糖基化。
本发明的Cry蛋白还可以被突变以引入表位来产生识别该经突变蛋白的抗体。因此,在一些实施例中,本发明提供了经突变的Cry蛋白,其中在天然Cry蛋白中的氨基酸取代产生了具有抗原区域的突变型Cry蛋白,该抗原区域允许该突变型Cry蛋白在蛋白质检测分析中区别于该天然Cry蛋白。
在一些实施例中,本发明提供了制备如下抗体的方法,该抗体从衍生出经突变的Cry蛋白的天然Cry蛋白中差异性地识别出经突变的Cry蛋白,该方法包括以下步骤:在天然Cry蛋白的抗原环中取代氨基酸;并且产生特异性识别经突变Cry蛋白的经突变抗原环但不识别该天然Cry蛋白的抗体。、在一个实施例中,该抗原环在天然Cry蛋白的结构域I的外部的非保守区中被鉴定出。在另一个实施例中,该抗原环不是参与Cry蛋白的昆虫肠受体识别或参与Cry蛋白的蛋白酶活化的环。
本发明的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如DNA改组)所衍生的序列。使用此类程序,可以将一个或多个不同的毒性蛋白编码区用来创造出具有所希望特性的新的毒性蛋白。以这种方式,从相关序列多核苷酸的群体产生重组多核苷酸文库,这些相关序列多核苷酸包含以下的序列区域,这些序列区域具有实质性的序列同一性并且可以在体外或活体内进行同源重组。例如,使用这种方法,可以将编码感兴趣的结构域的序列基序在本发明的杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码如下蛋白质的新基因,该蛋白质具有改进的感兴趣的特性,如增加的杀昆虫活性。用于此种DNA改组的策略在本领域中是已知的。参见例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:10747-10751;Stemmer(1994)Nature[自然]370:389-391;Crameri等人(1997)Nature Biotech.[自然生物技术]15:436-438;Moore等人(1997)J.Mol.Biol.[分子生物学杂志]272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]94:4504-4509;Crameri等人(1998)Nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。
结构域交换或改组是用于产生本发明的经改变的Cry蛋白的另一种机制。可以在Cry蛋白之间交换结构域,从而产生具有改进的杀有害生物活性或靶标谱的杂合或嵌合毒性蛋白。用于产生重组蛋白和测试它们的杀有害生物活性的方法在本领域是熟知的(参见例如,Naimov等人(2001)Appl.Environ.Microbiol.[应用与环境微生物学]67:5328-5330];de Maagd等人(1996)Appl.Environ.Microbiol.[应用与环境微生物学]62:1537-1543];Ge等人(1991)J.Biol.Chem.[生物化学杂志]266:17954-17958;Schnepf等人(1990)J.Biol.Chem.[生物化学杂志]265:20923-20930;Rang等人(1999)Appl.Environ.Microbiol.[应用与环境微生物学]65:2918-2925])。在一些实施例中,本发明提供了杂合Cry蛋白,其在C-末端包含来自本发明的第一Cry蛋白的氨基酸并在N-末端包含来自与本发明的第一Cry蛋白不同的第二Cry蛋白的氨基酸。在其他实施例中,本发明提供了杂合Cry蛋白,其在N-末端包含来自本发明的Cry蛋白的氨基酸并在C-末端包含来自与本发明的第一Cry蛋白不同的第二Cry蛋白的氨基酸。
当编码本发明所涵盖的Cry蛋白的异源多核苷酸序列被引入到植物中时,该引入的多核苷酸被稳定地整合到现在转基因植物的基因组中。因此,根据本发明,编码的Cry蛋白可以使用各种基因组编辑技术(如锌指核酸酶(ZNF)、转录激活子样效应子核酸酶(TALEN)、大范围核酸酶和成簇规律间隔短回文重复(CRISPR))通过定向DNA编辑原位突变(美国专利号8,697,359;Ran等人,通过引用结合在此)。CRISPR系统可用于在靶序列处引入特定的核苷酸修饰。工程化的CRISPR-Cas9系统,最初在细菌中发现,其中几种不同的CRISPR级联起着先天免疫系统和天然防御机制的作用,可被编程以靶向特定的遗传密码延伸并在精确位置处进行切割。在过去几年中,这些功能已被利用并用作基因组编辑工具,使得研究人员能够永久性地修饰植物细胞中的基因。
因此,本发明涵盖了产生编码经修饰的Cry蛋白的突变型多核苷酸的方法,其中所述方法包括使用CRISPR修饰包含编码Cry蛋白的多核苷酸的植物基因组。该方法涉及通过单引导RNA的20nt引导序列将Cas9靶向特定的基因组基因座,在这种情况下是编码Cry蛋白的多核苷酸。在线CRISPR设计工具可以鉴定适合的靶位点(万维网上的tools.genome-engineering.org.Ran等人Genome engineering using the CRISPR-Cas9system[使用CRISPR-Cas9系统的基因组工程]nature protocols[自然实验手册]第8卷,第11期,2281-2308,2013)。用于根据本发明的诱变/基因组编辑方法的靶植物是任何单子叶植物或双子叶植物,其中已经引入了本发明的编码Cry蛋白的多核苷酸。
在示例性实施例中,Cry1J蛋白的活性可以通过突变cry1J基因(例如编码BT2Cry1Ja(SEQ ID NO:1)或BT53Cry1J(SEQ ID NO:3)的基因)来调节,该基因通过将核酸酶(例如FokI)与结合cry1J基因中的位点的结构融合以在该cry1J基因内进行双链切割并用包含感兴趣突变的工程化多核苷酸进行置换通过工程化重组DNA限制酶包含在转基因玉蜀黍基因组中。FokI是由N-末端DNA结合结构域组成的细菌型IIS限制内切核酸酶,其可以被制备成结合基因组中的特定DNA序列和C-末端处的非特定DNA切割结构域。可以使用如在此披露的昆虫生物测定法选择表达具有调节的活性的经突变的Cry1J蛋白的植物。
在一些实施例中,本发明提供了如下重组载体,该重组载体包含本发明的多核苷酸、表达盒或嵌合基因。在其他实施例中,该载体被进一步限定为质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。用于在植物和其他生物转化中使用的包含一种或多种表达盒的某些载体在本领域是已知的。
因此,本发明的一些实施例针对被设计成表达本发明的编码Cry蛋白的多核苷酸的表达盒。如在此使用的,“表达盒”意指如下多核苷酸,该多核苷酸具有至少一个可操作地连接至感兴趣的核苷酸序列上的控制序列。以这种方式,例如,可操作地连接至待表达的核苷酸序列的植物启动子可以在表达盒中提供,用于在植物、植物部分或植物细胞中的表达。
包含感兴趣的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少另外一种是异源的。表达盒还可以是天然存在但已经是以适用于异源表达的重组形式获得的表达盒。然而,典型地,该表达盒相对于该宿主而言是异源的,即该表达盒的特定核苷酸序列不是天然存在于该宿主细胞中的,并且必须已经通过转化事件引入到该宿主细胞或该宿主细胞的祖先中。
除可操作地连接至本发明的核苷酸序列的启动子之外,本发明的表达盒还可以包括其他调节序列。如在此使用的,“调节序列”意指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)并且影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于增强子、内含子、翻译前导序列、终止信号、以及多腺苷酸化信号序列。
在一些实施例中,本发明的表达盒还可以包括编码除本发明的Cry蛋白之外的其他所希望的性状的多核苷酸。此类包含叠加性状的表达盒可以用来产生具有所希望的具有叠加性状(即,分子叠加)的表型的植物、植物部分或植物细胞。植物中的此类叠加的组合还可以通过其他方法来产生,包括但不限于通过任何常规的方法学的杂交育种植物。如果是通过遗传转化这些植物来进行叠加的,感兴趣的核苷酸序列可以在任何时间并且以任何次序进行组合。例如,包含一种或多种所希望的性状的转基因植物可以用作通过后续转化而引入另外的性状的靶标。另外的核苷酸序列可以在共转化方案中与由表达盒的任何组合提供的本发明的核苷酸序列、多核苷酸、多核苷酸构建体、或组合物同时引入。例如,如果将引入两个核苷酸序列,则它们可以合并在分开的盒(反式)中或可以合并在相同的盒(顺式)上。多核苷酸的表达可以通过相同的启动子或通过不同的启动子驱动。进一步认识到多核苷酸可以使用位点特异性重组系统在所希望的基因组位置处叠加。参见例如,国际专利申请公开号WO 99/25821、WO 99/25854、WO 99/25840、WO 99/25855、以及WO 99/25853。
表达盒还可以包括用于农艺性状的感兴趣的一种或多种多肽或双链RNA分子(dsRNA)的另外的编码序列,这些农艺性状的主要受益者是种子公司、栽培者或谷物加工者。感兴趣的多肽可以是由感兴趣的核苷酸序列编码的任何多肽。适合用于在植物中生产的感兴趣的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见例如,美国专利号5,569,823、5,304,730、5,495,071、6,329,504、以及6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的性状)的多肽,或是允许对展现感兴趣性状(例如,选择性标记、种皮颜色等)的植物进行鉴定的多肽。不同的感兴趣的多肽,连同用于将这些多肽引入植物中的方法描述于例如美国专利号4,761,373、4,769,061、4,810,648、4,940,835、4,975,374、5,013,659、5,162,602、5,276,268、5,304,730、5,495,071、5,554,798、5,561,236、5,569,823、5,767,366、5,879,903、5,928,937、6,084,155、6,329,504和6,337,431,连同美国专利公开号2001/0016956中。还参见,万维网上的lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/。
赋予对抑制生长点或分生组织的除草剂(如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于本发明的一些实施例中。对于突变型ALS和AHAS酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659针对抵抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下多核苷酸的植物细胞和植物,该多核苷酸编码突变型谷氨酰胺合成酶(GS),该突变型谷氨酰胺合成酶抵抗已知抑制GS的除草剂(例如,草丁膦和甲硫氨酸磺基肟(methionine sulfoximine))的抑制作用。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶A羧化酶(ACCase)赋予。
赋予对草甘膦抗性的、由核苷酸序列编码的多肽也适用于本发明。参见例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,该抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合成酶基因赋予。
编码对磷酰基化合物(如草铵膦或草丁膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见欧洲专利申请号0 242 246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他适合的多核苷酸包括编码对抑制光合作用的除草剂(如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的适合的多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物构造或发育中的改变(包括发育时间方面的变化)的多核苷酸。参见例如,美国专利公开号2001/0016956和美国专利号6,084,155。
另外的适合的多核苷酸包括对杀有害生物(例如杀昆虫)多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应当认识到在植物中对控制昆虫或其他有害生物必要的杀有害生物多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。有用于另外的昆虫或有害生物抗性的多核苷酸包括例如编码芽孢杆菌属(Bacillus)生物中鉴定到的毒素的那些。已经克隆了包含编码来自几个亚种的苏云金芽孢杆菌(Bt)Cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和鞘翅目昆虫幼虫是有毒的。此类Bt杀昆虫蛋白的实例包括如下Cry蛋白,如Cry1Aa、Cry1Ab、Cry1Ac、Cry1B、Cry1C、Cry1D、Cry1Ea、Cry1Fa、Cry3A、Cry9A、Cry9B、Cry9C等,连同营养期杀昆虫蛋白如Vip1、Vip2、Vip3等。Bt来源的蛋白的完整清单可以在万维网在苏塞克斯大学(University of Sussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,Crickmore等人(1998)Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:807-813)。
适合在植物中生产的多肽进一步包括改进或通过其他方式有助于收获的植物或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量或分布、改进的发酵特性、增加的油含量、增加的蛋白质含量、改进的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些。感兴趣的多肽还包括,例如在收获的作物中导致或促成不需要的成分(例如植酸、或降解糖的酶类)的含量降低的那些。“导致(resultingin)”或“促成(contributingto)”是指这种感兴趣的多肽可以直接或间接地促成感兴趣的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。
在一些实施例中,多肽促成了食品或饲料的改进的可消化度。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。
来自真菌和细菌微生物的多种木聚糖酶已经得到鉴别和表征(参见例如,美国专利号5,437,992;Coughlin等人(1993)“Proceedings of the Second TRICEL Symposiumon Trichoderma reesei Cellulases and Other Hydrolases[里氏木霉纤维素酶和其他水解酶的第二TRICEL研讨会论文集]”,埃斯波;Souminen和Reinikainen编著(1993)Foundation for Biotechnical and Industrial Fermentation Research[生物技术和工业发酵研究基金会]8:125-135;美国专利公开号2005/0208178;以及PCT公开号WO 03/16654)。具体地说,在里氏木霉(T.reesei)中已经鉴别出三种特异性木聚糖酶(XYL-I、XYL-II、和XYL-III)(Tenkanen等人(1992)Enzyme Microb.Technol.[酶与微生物技术]14:566;Torronen等人(1992)Bio/Technology[生物/技术]10:1461;以及Xu等人(1998)Appl.Microbiol.Biotechnol.[应用微生物与生物技术]49:718)。
在其他实施例中,对于本发明有用的多肽可以是多糖降解酶。产生这样一种酶的本发明的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。
多糖降解酶包括:淀粉降解酶如α-淀粉酶(EC 3.2.1.1)、葡糖醛酸糖苷酶(E.C.3.2.1.131);外切-1,4-α-D葡聚糖酶如淀粉葡糖苷酶和葡糖淀粉酶(EC 3.2.1.3)、β-淀粉酶(EC 3.2.1.2)、α-葡糖苷酶(EC 3.2.1.20)和其他外切淀粉酶;淀粉去分支酶,如a)异戊基(EC 3.2.1.68)、支链淀粉酶(EC 3.2.1.41)等;b)纤维素酶如外切-1,4-3-纤维二糖水解酶(EC 3.2.1.91)、外切-1,3-β-D-葡聚糖酶(EC 3.2.1.39)、β-葡糖苷酶(EC3.2.1.21);c)L-阿拉伯糖酶(arabinase)、如内切-1,5-α-L-阿拉伯糖酶(EC 3.2.1.99)、α-阿拉伯糖苷酶(EC 3.2.1.55)等;d)半乳聚糖酶如内切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、内切-1,3-β-D-半乳聚糖酶(EC 3.2.1.90)、α-半乳糖苷酶(EC 3.2.1.22)、β-半乳糖苷酶(EC 3.2.1.23)等;e)甘露聚糖酶,如内切-1,4-β-D-甘露聚糖(EC 3.2.1.78)、β-甘露糖苷酶(EC 3.2.1.25)、α-甘露糖苷酶(EC 3.2.1.24)等;f)木聚糖酶,如内切-1,4-β-木聚糖酶(EC 3.2.1.8)、β-D-木糖苷酶(EC 3.2.1.37)、1.3-β-D-木聚糖酶等;和g)其他酶如α-L-岩藻糖苷酶(EC 3.2.1.51)、α-L-鼠李糖苷酶(EC 3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶(EC 3.2.1.7)等。在一个实施例中,α-淀粉酶是描述于美国专利号8,093,453中的合成α-淀粉酶Amy797E,将该专利通过引用以其全文结合在此。
可以与本发明一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(Aspergillus)、木霉属(Trichoderma)、毛霉属(Mucor)和根霉属(Rhizopus),如黑曲霉(A.niger)、泡盛曲霉(A.awamori)、米曲霉(A.oryzae)和米黑毛霉(M.miehei)获得的那些。在一些实施例中,本发明的多肽可以是纤维二糖水解酶(CBH)(EC3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是CBH1或CBH2。
与本发明一起使用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(EC 3.2.1.55);木质素酶;脂肪酶(例如,E.C.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1,6葡糖苷酶(例如,E.C.3.2.1.20);酯酶,如阿魏酸酯酶(EC3.1.1.73)和乙酰基木聚糖酯酶(EC 3.1.1.72);以及角质酶(例如E.C.3.1.1.74)。
与本发明一起使用的双链RNA分子包括但不限于抑制靶标昆虫基因的那些。如在此使用的词语“基因抑制”当一起考虑时旨在是指用于减少作为基因转录为mRNA和该mRNA的后续翻译的结果而产生的蛋白质的水平的任何熟知的方法。基因抑制还旨在意指减少从基因或编码序列表达蛋白质,包括转录后基因抑制和转录抑制。转录后基因抑制由从靶向抑制的基因或编码序列转录的mRNA的全部或其一部分与用于抑制的相应双链RNA之间的同源性介导,并且是指在细胞中可供被核糖体结合使用的可获得的mRNA的量的实质且可测量的减少。经转录的RNA可以处于正义方向而发挥作用,称为共抑制,处于反义方向而发挥作用,称为反义抑制,或在两个方向上产生dsRNA而发挥作用,称为RNA干扰(RNAi)。转录抑制由细胞中存在作为基因抑制剂的与启动子DNA序列或其补体展示出实质序列同一性而发挥作用的dsRNA介导,称为启动子反式抑制。针对与性状相关的天然植物基因,基因抑制可以是有效的,例如,以提供具有减少水平的由该天然基因编码的蛋白质或具有增强或减少水平的受影响代谢物的植物。针对植物有害生物中的靶基因,基因抑制也可以是有效的,这些有害生物可以摄取或接触含有基因抑制剂的植物材料,这些基因抑制剂专门设计用于阻抑或抑制一种或多种同源或互补序列在该有害生物的细胞中的表达。靶向抑制的此类基因可以编码必需蛋白质,其预测功能选自下组,该组由以下各项组成:肌肉形成、保幼激素形成、保幼激素调节、离子调节和转运、消化酶合成、细胞膜电势的维持、氨基酸生物合成、氨基酸降解、精子形成、外激素(pheromone)合成、外激素感测、触角形成、翼形成、腿形成、发育和分化、卵形成、幼虫成熟、消化酶形成、血淋巴合成、血淋巴维持、神经传递、细胞分裂、能量代谢、呼吸以及凋亡。
在一些实施例中,本发明提供了如下转基因非人类宿主细胞,该细胞包含本发明的多核苷酸、嵌合基因、表达盒或重组载体。转基因非人类宿主细胞可以包括但不限于植物细胞、酵母细胞、细菌细胞或昆虫细胞。因此,在一些实施例中,本发明提供了选自以下属的细菌细胞:芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacillus)、梭菌属(Clostridium)、致病杆菌属(Xenorhabdus)、发光杆菌属(Photorhabdus)、巴斯德氏芽菌属(Pasteuria)、埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯菌属(Klebsiella)、沙门氏菌属(Salmonella)、巴氏杆菌属(Pasteurella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、嗜甲基菌属(Methylophilius)、农杆菌属(Agrobacterium)、醋杆菌属(Acetobacter)、乳杆菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)或产碱杆菌属(Alcaligenes)。因此,例如,作为生物昆虫控制剂,本发明的Cry蛋白可以通过在细菌细胞中表达编码本发明的Cry蛋白的嵌合基因而产生。例如,在一些实施例中,提供了包含本发明的嵌合基因的苏云金芽孢杆菌细胞。
在另外的实施例中,本发明提供了作为双子叶植物细胞或单子叶植物细胞的转基因植物细胞。在另外的实施例中,该双子叶植物细胞选自下组,该组由以下各项组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、糖用甜菜细胞以及烟草细胞。在另外的实施例中,该单子叶植物细胞选自下组,该组由以下各项组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。在一些实施例中,本发明提供了多个双子叶植物细胞或单子叶植物细胞,这些细胞表达由本发明的嵌合基因编码的本发明的Cry蛋白。在其他实施例中,将该多个细胞并列以形成质外体并且使其在自然光照中生长。
在本发明的其他实施例中,在高等生物(例如,植物)中表达本发明的杀昆虫Cry蛋白。在这种情况下,表达有效量的杀昆虫蛋白的转基因植物保护自身免受植物有害生物如昆虫有害生物的伤害。当昆虫开始摄食这样一种转基因植物时,它摄取了所表达的杀昆虫Cry蛋白。这可以妨碍昆虫进一步咬食植物组织或者甚至可以伤害或杀死昆虫。本发明的多核苷酸被插入表达盒中,然后该表达盒被稳定地整合到植物的基因组中。在其他实施例中,该多核苷酸被包括在非致病性自我复制病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,并且包括但不限于玉米(玉蜀黍)、大豆、水稻、小麦、大麦、黑麦、燕麦、高粱、粟、向日葵、红花、糖用甜菜、棉花、甘蔗、油菜、苜蓿、烟草、花生、蔬菜(包括甘薯、豆类、豌豆、菊苣、莴苣、甘蓝、花椰菜、西兰花、芜菁、胡萝卜、茄子、黄瓜、萝卜、菠菜、马铃薯、番茄、芦笋、洋葱、大蒜、瓜类、胡椒、芹菜、南瓜、西葫芦、绿皮西葫芦)、水果(包括苹果、梨、榅桲、李、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉)和特种植物如拟南芥以及木本植物如针叶树和落叶树。优选地,本发明的植物是作物植物,如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、糖用甜菜、甘蔗、烟草、大麦、油菜等。
一旦所希望的多核苷酸已经被转化进特定的植物物种中,便可以使用传统的育种技术将其在该物种中繁殖或将其转移到相同物种的其他品种中,特别是包括商业品种。
在转基因植物中表达本发明的多核苷酸,由此导致在这些转基因植物中对处于原毒素或成熟毒素形式的相应Cry蛋白的生物合成。以此方式,产生在存在昆虫压力下具有增强的产量保护的转基因植物。用于它们在转基因植物中的表达,本发明的核苷酸序列可能需要修饰和优化。尽管在许多情况下,来自微生物生物的基因能够在植物中高水平表达而无需修饰,但在转基因植物中的低表达可能是由于微生物核苷酸序列的缘故,这些序列具有在植物中并不优选的密码子。在本领域中已知,活生物具有特定的密码子使用偏好,而且在本发明中所描述的这些核苷酸序列的密码子可以被改变以符合植物偏好,同时维持由其编码的氨基酸。此外,在植物(例如玉米植物)中高表达最好是由如下编码序列实现的,这些编码序列具有至少约35%、或至少约45%、或至少约50%、或至少约60%的GC含量。具有低GC含量的微生物核苷酸序列在植物中也许表达欠佳,这是由于存在着可能使信息不稳定的ATTTA基序,以及可导致不恰当的多腺苷酸化的AATAAA基序。尽管某些基因序列可以在单子叶植物和双子叶植物物种两者中充分表达,但是可以对序列进行修饰以便迎合单子叶植物或双子叶植物的特定密码子偏好以及GC含量偏好,因为这些偏好已经被证明是不同的(Murray等人Nucl.Acids Res.[核酸研究]17:477-498(1989))。此外,针对不正常剪接位点的存在来对这些核苷酸序列进行筛选,这些位点可能导致信息平截(messagetruncation)。使用描述于例如美国专利号5,625,136、5,500,365和6,013,523中的方法,使用熟知的定点诱变、PCR以及合成基因构建技术对在这些核苷酸序列之内所有需要做出的变化(如以上所描述的那些)进行改变。
在一些实施例中,本发明提供了根据披露于美国专利号5,625,136中的程序制备的合成编码序列或多核苷酸,将该专利通过引用结合在此。在这个程序中,使用了玉蜀黍优选的密码子,即最频繁地编码玉蜀黍中的氨基酸的单个密码子。针对特定的氨基酸的玉蜀黍偏好的密码子可衍生自例如来自玉蜀黍的已知基因序列。例如,针对来自玉蜀黍植物的28个基因的玉蜀黍密码子使用发现于以下文献中:Murray等人,Nucleic Acids Research[核酸研究]17:477-498(1989),将其披露内容通过引用结合在此。本发明的确切示例的用玉蜀黍优化密码子制备的合成序列由SEQ ID NO:17-22中的任一项代表。应当认识到,密码子进行优化用于在一种植物物种中的表达也将作用于其他植物物种,但密码子进行优化用于表达的植物物种可能不在相同水平。以这种方式,这些核苷酸序列可以进行优化用于在任何植物中表达。应当认识到,核苷酸序列的全部或任何部分可以是优化的或合成的。也就是说,多核苷酸可以包含作为部分天然序列和部分密码子优化序列的核苷酸序列。
为了有效的翻译起始,可能需要修饰与起始甲硫氨酸相邻的序列。例如,它们可以通过包含已知在植物中有效的序列而被修饰。Joshi已经提出了针对植物的适当的共有序列(NAR 15:6643-6653(1987)),并且Clonetech提出了另一种共有翻译起始子(1993/1994目录,第210页)。这些共有序列适于与本发明的核苷酸序列一起使用。将这些序列掺入至包含核苷酸序列的构建体中,达到ATG并且包括ATG(同时保持不修饰第二氨基酸),或者可替代地达到ATG后的GTC并且包括ATG后的GTC(具有修饰该转基因的第二氨基酸的可能性)。
本发明的新颖Cry蛋白编码序列(作为它们的天然序列或作为如上所述的合成序列)可以可操作地融合至用于在植物中表达的多种启动子(包括组成型、诱导型、时序性调节的、发育调节的、化学调节的、组织优选的以及组织特异性启动子)以制备重组DNA分子(即,嵌合基因)。启动子的选择将取决于表达的时间和空间需要而变化,并且还取决于靶物种而变化。因此,本发明的核苷酸序列在叶、在柄(stalk)或茎(stem)、在穗、在花序(例如穗状花序、圆锥花序、穗轴等)、在根或籽苗中的表达是优选的。然而在许多情况下,寻求针对多于一种类型昆虫有害生物的保护,并且因此在多个组织中的表达是令人希望的。尽管已经显示来自双子叶植物的很多启动子在单子叶植物中是可操作的并且反之亦然,但理想的是选择双子叶植物启动子用于在双子叶植物中表达,并且选择单子叶植物启动子用于在单子叶植物中表达。然而,对所选择的启动子的起源并没有限制,足够的是它们在驱动核苷酸序列在所希望的细胞中的表达中是操作性的。
适合的组成型启动子包括例如CaMV 35S启动子(Odell等人,Nature[自然]313:810-812,1985);拟南芥At6669启动子(参见PCT公开号W0 04081173A2);玉蜀黍Ubi 1(Christensen等人,Plant Mol.Biol.[植物分子生物学]18:675-689,1992);水稻肌动蛋白(McElroy等人,Plant Cell[植物细胞]2:163-171,1990);pEMU(Last等人,Theor.Appl.Genet.[理论与应用遗传学]81:581-588,1991);CaMV 19S(Nilsson等人,Physiol.Plant[植物生理学]100:456-462,1997);GOS2(de Pater等人,Plant J[植物杂志]11月;2(6):837-44,1992);泛素(Christensen等人,Plant Mol.Biol.[植物分子生物学]18:675-689,1992);水稻亲环蛋白(Bucholz等人,Plant Mol.Biol.[植物分子生物学]25(5):837-43,1994);玉蜀黍H3组蛋白(Lepetit等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]231:276-285,1992);肌动蛋白2(An等人,Plant J.[植物杂志]10(1);107-121,1996)、组成型根尖CT2启动子(PCT申请号IL/2005/000627))以及Synthetic Super MAS(Ni等人,The Plant Journal[植物杂志]7:661-76,1995)。其他组成性启动子包括美国专利号5,659,026、5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、以及5,608,142中的那些。
对于在植物(特别是玉蜀黍)中表达本发明的新颖cry蛋白编码序列有用的组织特异性或组织优先启动子是指导在根、髓、叶或花粉中的表达的那些。适合的组织特异性启动子包括但不限于叶特异性启动子[如例如由Yamamoto等人,Plant J.[植物杂志]12:255-265,1997;Kwon等人,Plant Physiol.[植物生理学]105:357-67,1994;Yamamoto等人,Plant Cell Physiol.[植物细胞生理学]35:773-778,1994;Gotor等人,Plant J.[植物杂志]3:509-18,1993;Orozco等人,Plant Mol.Biol.[植物分子生物学]23:1129-1138,1993;以及Matsuoka等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:9586-9590,1993所描述],种子优选启动子[例如来自种子特异性基因(Simon等人,Plant Mol.Biol.[植物分子生物学]5.191,1985;Scofield等人,J.Biol.Chem.[生物化学杂志]262:12202,1987;Baszczynski等人,Plant Mol.Biol.[植物分子生物学]14:633,1990)、巴西坚果白蛋白(Pearson等人,Plant Mol.Biol.[植物分子生物学]18:235-245,1992)、豆球蛋白(Ellis等人,Plant Mol.Biol.[植物分子生物学]10:203-214,1988)、谷蛋白(水稻)(Takaiwa等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]208:15-22,1986;Takaiwa等人,FEBS Letts.[欧洲生化学会联合会快报]221:43-47,1987)、玉米蛋白(Matzke等人,Plant Mol Biol[植物分子生物学],143).323-32 1990)、napA(Stalberg等人,Planta[植物]199:515-519,1996)、小麦SPA(Albanietal,Plant Cell[植物细胞],9:171-184,1997)、向日葵油体蛋白(oleosin)(Cummins等人,Plant Mol.Biol.[植物分子生物学]19:873-876,1992)],胚乳特异性启动子[例如,小麦LMW和HMW、麦谷蛋白-1(Mol Gen Genet[分子遗传学与普通遗传学]216:81-90,1989;NAR 17:461-2)、小麦a、b和g麦醇溶蛋白(EMBO3:1409-15,1984)、大麦ltrl启动子、大麦B1、C、D大麦醇溶蛋白(Theor Appl Gen[理论与应用遗传学]98:1253-62,1999;Plant J[植物杂志]4:343-55,1993;Mol Gen Genet[分子遗传学与普通遗传学]250:750-60,1996)、大麦DOF(Mena等人,The Plant Journal[植物杂志]116(1):53-62,1998)、Biz2(EP 99106056.7)、合成启动子(Vicente-Carbajosa等人,Plant J.[植物杂志]13:629-640,1998)、水稻谷醇溶蛋白NRP33、水稻-球蛋白Glb-1(Wu等人,Plant CellPhysiology[植物细胞生理学]39(8)885-889,1998)、水稻α-球蛋白REB/OHP-1(Nakase等人,Plant Mol.Biol.[植物分子生物学]33:513-S22,1997)、水稻ADP-葡萄糖PP(Trans Res6:157-68,1997)、玉蜀黍ESR基因家族(Plant J[植物杂志]12:235-46,1997)、高粱γ-高粱醇溶蛋白(Plant Mol.Biol[植物分子生物学]32:1029-35,1996)],胚特异性启动子[例如,水稻OSH1(Sato等人,Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]93:8117-8122)、KNOX(Postma-Haarsma等人,Plant Mol.Biol.[植物分子生物学]39:257-71,1999)、水稻油体蛋白(Wu等人,J.Biochem.[生物化学杂志],123:386,1998)],花特异性启动子[例如,AtPRP4,查尔酮合酶(chalene synthase;chsA)(Van der Meer等人,Plant Mol.Biol.[植物分子生物学]15,95-109,1990),LAT52(Twell等人,Mol.Gen Genet.[分子遗传学与普通遗传学]217:240-245;1989),apetala-3,植物繁殖组织[例如,OsMADS启动子(美国专利申请公开号2007/0006344)]。
本发明的核苷酸序列也可以在被化学调节的启动子的调节下进行表达。这使得本发明的Cry蛋白能够仅在用诱导化学品对作物植物进行处理时被合成。用于基因表达的化学诱导的此类技术的实例详述于公开申请EP 0 332 104和美国专利号5,614,395中。在一个实施例中,该化学调节的启动子是烟草PR-1a启动子。
另一类在本发明中有用的启动子是创伤可诱导的启动子。已经描述了数量众多的在创伤部位并且还在植物病原菌感染的部位表达的启动子。理想的是,这样的启动子在昆虫入侵的部位应该仅有局部活性,并且以此方式这些杀昆虫蛋白仅在需要合成这些杀昆虫蛋白的细胞中积聚以杀死入侵的昆虫有害生物。这类启动子的实例包括由以下文献所描述的那些:Stanford等人Mol.Gen.Genet.[分子遗传学与普通遗传学]215:200-208(1989);Xu等人Plant Molec.Biol.[植物分子生物学]22:573-588(1993);Logemann等人Plant Cell[植物细胞]1:151-158(1989);Rohrmeier和Lehle Plant Molec.Biol.[植物分子生物学]22:783-792(1993);Firek等人Plant Molec.Biol.[植物分子生物学]22:129-142(1993)以及Warner等人Plant J.[植物杂志]3:191-201(1993)。
导致在本发明中有用的组织特异性表达模式的启动子的非限制性实例包括绿色组织特异性的、根特异性的、茎特异性的或花特异性的。适用于在绿色组织中表达的启动子包括调节涉及光合作用的基因的许多启动子,并且这些中的许多已经从单子叶植物和双子叶植物两者中得以克隆。一个这样的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth和Grula,Plant Molec.Biol.[植物分子生物学]12:579-589(1989))。另一种用于根特异性表达的启动子是由de Framond(FEBS 290:103-106(1991)或美国专利号5,466,785)描述的启动子。另一种在本发明中有用的启动子是描述于美国专利号5,625,136中的茎特异性启动子,它天然地驱动玉蜀黍trpA基因的表达。
除了选择适合的启动子之外,用于在植物中表达杀昆虫毒素的构建体还需要适当的可操作地连接在异源核苷酸序列下游的转录终止子。一些此类的终止子是可获得的并且在本领域中是已知的(例如来自CaMV的tml,来自rbcS的E9)。任何已知在植物中发挥作用的可供使用的终止子均可以在本发明的上下文中使用。
可以将数量众多的其他序列并入本发明所描述的表达盒中。这些序列包括已经显示出增强表达的序列,如内含子序列(例如,来自Adhl和bronzel)以及病毒的前导序列(例如,来自TMV、MCMV、和AMV)。
本发明的核苷酸序列在植物中针对不同的细胞定位的靶向表达可能是更优选的。在一些情况下,在胞质溶胶中的定位可能是令人希望的,而在其他情况下,在某个亚细胞器中的定位可能是优选的。用于靶向例如植物中的基因产物的任何机构都可以用于实践本发明,并且已知此类机构存在于植物中并且已经相当详细地表征了控制这些机构的功能的序列。已经表征了导致将基因产物靶向其他细胞区室的序列。氨基末端序列可以负责将感兴趣的蛋白质靶向任何细胞区室,如植物的液泡、线粒体、过氧化物酶体、蛋白体、内质网、叶绿体、淀粉颗粒、淀粉体、质外体或细胞壁(例如Unger等人Plant Molec.Biol.[植物分子生物学]13:411-418(1989);Rogers等人(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82:6512-651;美国专利号7,102,057;WO 2005/096704,将其全部通过引用而特此结合)。任选地,信号序列可以是来自waxy的N-末端信号序列、来自γ-玉米蛋白的N-末端信号序列、淀粉结合结构域、C-末端淀粉结合结构域、将成熟蛋白引入叶绿体的叶绿体靶向序列(Comai等人(1988)J.Biol.Chem.[生物化学杂志]263:15104-15109;van den Broeck等人(1985)Nature[自然]313:358-363;美国专利号5,639,949)或来自糊粉细胞的分泌信号序列(Koehler和Ho,Plant Cell[植物细胞]2:769-783(1990))。另外,与羧基末端序列结合的氨基末端序列负责基因产物的液泡靶向(Shinshi等人(1990)Plant Molec.Biol.[植物分子生物学]14:357-368)。在一个实施例中,所选择的信号序列包括已知的切割位点,并且构建的融合体考虑了在一个或多个切割位点之后的需要切割的任何氨基酸。在一些情况下,这个要求可以通过在切割位点与转基因ATG之间添加小数目的氨基酸,或可替代地置换转基因序列内的一些氨基酸来满足。这些构建技术在本领域是熟知的并且同样适用于任何细胞区室。
应认识到,用于细胞靶向的上述机制不仅可以与其同源启动子结合使用,还可以与异源启动子结合使用,从而在启动子的转录调节下实现特定的细胞靶向目标,该启动子具有不同于自其衍生靶向信号的启动子的表达谱。
植物转化
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下项的转化:细菌介导的多核苷酸递送(例如,经由农杆菌)、病毒介导的多核苷酸递送、碳化硅或须晶介导的多核苷酸递送、脂质体介导的多核苷酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、浸润、PEG介导的多核苷酸吸收、连同使得多核苷酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:Miki等人(Glick,B.R.和Thompson,J.E.编辑的Methods in Plant Molecular Biology and Biotechnology[植物分子生物学与生物技术方法]中的“Procedures for Introducing Foreign DNA intoPlants[用于将外来DNA引入植物中的程序]”(CRC出版公司(CRC Press,Inc.),波卡拉顿,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞与分子生物学快报]7:849-858(2002))。
对于农杆菌介导的转化,二元载体或携带至少一个T-DNA边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且仅含有感兴趣的构建体的线性DNA可以是优选的。在直接基因转移的情况下,可以使用单个DNA物种的转化或共转化(Schocher等人,Biotechnology[生物技术]4:1093-1096(1986))。对于直接基因转移以及农杆菌介导的转移二者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草丁膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带感兴趣的外来DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或在染色体上携带的vir基因的互补物(Uknes等人(1993)Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶标农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过多核苷酸转化将该重组二元载体转移至农杆菌中(和Willmitzer(1988)Nucleic Acids Res.[核酸研究]16:9877)。
可以使用农杆菌转化双子叶植物以及单子叶植物。用于农杆菌介导的水稻转化方法包括熟知的水稻转化方法,如任何以下文献中描述的那些:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta[植物]199:612-617,1996);Chan等人(Plant Mol Biol[植物分子生物学]22(3):491-506,1993),Hiei等人(Plant J[植物杂志]6(2):271-282,1994),将这些披露通过引用结合在此,其引用程度如同完全阐明一样。在玉米转化的情况下,优选方法是如Ishida等人(Nat.Biotechnol[自然生物技术]14(6):745-50,1996)或Frame等人(Plant Physiol[植物生理学]129(1):13-22,2002)中所描述的,将这些披露通过引用结合在此,其引用程度如同完全阐明一样。所述方法例如在B.Jenes等人,Techniques for GeneTransfer[基因转移技术],在:Transgenic Plants[转基因植物],第1卷,Engineering andUtilization[工程化以及利用]中,S.D.Kung和R.Wu编著,学术出版社(1993)128-143以及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.[植物生理学年评和植物分子生物学]42(1991)205-225)中进一步描述。有待表达的多核苷酸或构建体优选地克隆到适合于转化根癌农杆菌(Agrobacterium tumefaciens)的载体例如pBin19中(Bevan等人,Nucl.Acids Res.[核酸研究]12(1984)8711)。然后,能够以已知的方式使用由这种载体转化的农杆菌来转化植物,如用作模型的植物像拟南芥或作物植物如烟草植物,方法是例如通过将捣碎的叶或切碎的叶浸没于农杆菌溶液中,并且然后将其在适合的培养基中培养。例如,借助于根癌农杆菌来转化植物由Hagen和Willmitzer描述于Nucl.Acid Res.[核酸研究](1988)16,9877中或尤其自以下文献已知:F.F.White,Vectors for Gene Transfer inHigher Plants;in Transgenic Plants[用于高等植物中的基因转移的载体],第1卷,Engineering and Utilization[工程化以及利用],编辑S.D.Kung和R.Wu,学术出版社(Academic Press),1993,第15-38页。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有感兴趣的多核苷酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的多核苷酸)推进到植物组织中。
在其他实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单个启动子的控制下表达多个开放阅读框。在美国专利号5,451,513、5,545,817和5,545,818中,在PCT申请号WO 95/16783中,以及在McBride等人(1994)Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]91,7301-7305中广泛描述了质体转化技术。基本的叶绿体转化技术涉及将位于选择性标记侧翼的经克隆的质体DNA区连同感兴趣的基因一起引入合适的靶组织中,这是例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或PEG介导的转化)来进行的。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16S rRNA和rps12基因(赋予针对大观霉素或链霉素的抗性)的点突变用作供转化用的选择性标记(Svab,Z.、Hajdukiewicz,P.和Maliga,P.,(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87,8526-8530);Staub,J.M.和Maliga,P.,(1992)Plant Cell[植物细胞]4,39-45)。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(Staub,J.M.和Maliga,P.,(1993)EMBO J.[欧洲分子生物学杂志]12,601-606)。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aadA基因)置换隐性的rRNA或r蛋白抗生素抗性基因而获得(Svab,Z.和Maliga,P.,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90,913-917)。先前,这种标记已经被成功地用于莱茵衣藻这种绿藻的质体基因组的高频率转化(Goldschmidt-Clermont,M.(1991)Nucl.Acids Res.[核酸研究]19:4083-4089)。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。
选择转化的转基因植物、植物细胞或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分或植物细胞。如在此使用的,“选择性标记(selectable marker)”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码选择性或筛选性标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,R基因座性状)。当然,适合的选择性标记的许多实例在本领域是已知的并且可以用于在此描述的表达盒中。
选择性标记的实例包括但不限于编码neo或nptII的核苷酸序列,它赋予对卡那霉素、G418等的抗性(Potrykus等人(1985)Mol.Gen.Genet.[分子遗传学与普通遗传学]199:183-188);编码bar的核苷酸序列,它赋予对草丁膦的抗性;编码改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合酶的核苷酸序列,它赋予对草甘膦的抗性(Hinchee等人(1988)Biotech.[生物技术]6:915-922);编码腈水解酶(如来自臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn)的核苷酸序列,它赋予对溴草腈的抗性(Stalker等人(1988)Science[科学]242:419-423);编码改变的乙酰乳酸合酶(ALS)的核苷酸序列,它赋予对咪唑啉酮、磺酰脲或其他ALS-抑制化学品的抗性(欧洲专利申请号154204);编码甲氨蝶呤-抗性的二氢叶酸还原酶(DHFR)的核苷酸序列(Thillet等人(1988)J.Biol.Chem.[生物化学杂志]263:12500-12508);编码茅草枯脱卤素酶的核苷酸序列,它赋予对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(PMI))的核苷酸序列,它赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸盐合酶的核苷酸序列,它赋予对5-甲基色氨酸的抗性;或编码hph的核苷酸序列,它赋予对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
另外的选择性标记包括但不限于编码β-葡糖醛酸酶的核苷酸序列或编码对于多种显色底物已知的酶的uidA(GUS);编码在植物组织中对花色苷色素(红色)进行调节的产物的R基因座核苷酸序列(Dellaporta等人,Chromosome Structure and Function:Impactof New Concepts[染色体结构与功能:新概念的影响]中263-282页,“Molecular cloningof the maize R-nj allele by transposon-tagging with Ac[通过Ac转座子标签技术对玉蜀黍R-nj等位基因的分子克隆]”,第18届斯特德莱遗传学专题讨论会(18th StadlerGenetics Symposium)(Gustafson和Appels编辑,Plenum出版社1988));编码β-内酰胺酶的核苷酸序列,对于β-内酰胺酶而言多种显色底物是已知的(例如,PADAC,显色头孢菌素)(Sutcliffe(1978)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3737-3741);编码xylE的核苷酸序列,xylE编码儿茶酚双加氧酶(Zukowsky等人(1983)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:1101-1105);编码酪氨酸酶的核苷酸序列,酪氨酸酶能够氧化酪氨酸成为DOPA和多巴醌,其进而缩合形成黑色素(Katz等人(1983)J.Gen.Microbiol.[普通微生物学杂志]129:2703-2714);编码β-半乳糖苷酶的核苷酸序列,对于β-半乳糖苷酶而言存在显色底物;编码荧光素酶(lux)的核苷酸序列,荧光素酶允许生物发光检测(Ow等人(1986)Science[科学]234:856-859);编码水母发光蛋白的核苷酸序列,水母发光蛋白可以在钙敏感的生物发光检测中采用(Prasher等人(1985)Biochem.Biophys.Res.Comm.[生物化学与生物物理学研究通讯]126:1259-1268);或编码绿色荧光蛋白的核苷酸序列(Niedz等人(1995)Plant Cell Reports[植物细胞报道]14:403-406)。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
此外,如本领域中所熟知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物或培养的原生质体再生而来。在以下文献中描述了从植物细胞、植物组织培养物或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,麦克米兰出版公司(MacMilan Publishing Co.),纽约(1983));以及Vasil I.R.(编辑)(Cell Culture andSomatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第I卷(1984)和第II卷(1986))。
另外,工程化进以上所述的本发明的转基因种子和植物、植物部分或植物细胞中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。
因此,可以按本领域熟知的任何数目的方法(如上所述的)将多核苷酸引入该植物、植物部分或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的特定方法,相反可以使用允许将该一种或多种多核苷酸稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单个多核苷酸、或者作为分开的多核苷酸而进行组装,并且可以位于相同的或不同的表达盒或载体上。因此,可以在单个转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入感兴趣的细胞中。
本发明的另外的实施例涵盖从包含本发明的编码Cry蛋白的多核苷酸的转基因植物或其部分产生的收获产物,连同从这些收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中该种子或其他植物部分包含本发明的多核苷酸或核苷酸序列。在一些实施例中,本发明涵盖收获产物和加工产物,如包含本发明的Cry蛋白的粗粉或细粉,其中该Cry蛋白继续执行它在产生该收获产物或加工产物的转基因植物中所具有的这种杀昆虫功能。
在其他实施例中,本发明提供了来自本发明的转基因种子或转基因植物的提取物,其中该提取物包含本发明的多核苷酸或Cry蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,de laTorre等人,Food,Agric.Environ.[食品农业与环境]2(1):84-89(2004);Guidet,Nucleic Acids Res.[核酸研究]22(9):1772-1773(1994);Lipton等人,Food Agric.Immun.[食品农业通讯]12:153-164(2000))。
杀昆虫组合物
在一些实施例中,本发明提供了杀昆虫组合物,该组合物包含农业上可接受的载体中的本发明的Cry蛋白。如在此使用的“农业上可接受的载体”可以包括与活性Cry蛋白组合以有助于它施用至或植物或其部分的天然或合成的有机或无机材料。农业上可接受的载体的实例包括但不限于粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。农业上可接受的载体进一步包括但不限于可用于农业配制品中的惰性组分、分散剂、表面活性剂、佐剂、增粘剂、粘着剂、粘合剂或其组合。此类组合物可以按使杀昆虫蛋白或其他有害生物控制剂与这些有害生物接触的任何方式施用。因此,可以将这些组合物施用于植物或植物部分的表面,包括种子、叶、花、茎、块茎、根等。在其他实施例中,在植物体内产生本发明的Cry蛋白的植物是被表达的Cry蛋白的农业载体。
在另外的实施例中,该杀昆虫组合物包含细菌细胞或本发明的转基因细菌细胞,其中该细菌细胞或转基因细菌细胞产生本发明的Cry蛋白。这样一种杀昆虫组合物可以通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩苏云金芽孢杆菌(Bt)的培养物而制备。此类Bt培养物可选自下文实例中描述的Bt菌株的组,该组由SC0532、SC0705、SC0666组成,或者转基因Bt培养物。在另外的实施例中,该组合物包含按重量计从约1%至约99%的本发明的Cry蛋白。
本发明的Cry蛋白可以与其他有害生物控制剂组合使用,以增加有害生物靶标范围或用于预防或管理昆虫抗性。因此,在一些实施例中,本发明提供了控制一种或多种植物有害生物的组合物,其中该组合物包含本发明的第一Cry蛋白和不同于该第一Cry蛋白的第二有害生物控制剂。在其他实施例中,该组合物是用于局部施用至植物的配制品。在仍其他实施例中,该组合物是转基因植物。在另外的实施例中,该组合物是局部施用至转基因植物的配制品的组合。在一些实施例中,当该转基因植物包含该第二有害生物控制剂时,该配制品包含本发明的该第一Cry蛋白。在其他实施例中,当该转基因植物包含本发明的该第一Cry蛋白时,该配制品包含该第二有害生物控制剂。
在一些实施例中,该第二有害生物控制剂可以是选自下组的试剂,该组由以下各项组成:化学杀有害生物剂(如杀昆虫剂)、苏云金芽孢杆菌(Bt)杀昆虫蛋白、致病杆菌属杀昆虫蛋白、发光杆菌属杀昆虫蛋白、侧孢短芽孢杆菌(Brevibacillus laterosporus)杀昆虫蛋白、球形芽孢杆菌(Bacillus sphaericus)杀昆虫蛋白、蛋白酶抑制剂(丝氨酸和半胱氨酸类型两者)、凝集素、α-淀粉酶、过氧化物酶、胆固醇氧化酶以及双链RNA(dsRNA)分子。
在其他实施例中,该第二有害生物控制剂是一种选自下组的化学杀有害生物剂,该组由以下各项组成:拟除虫菊酯、氨基甲酸酯、新烟碱、神经元钠通道阻断剂、杀昆虫大环内酯、γ-氨基丁酸(GABA)拮抗剂、杀昆虫脲以及保幼激素模拟物。在其他实施例中,该化学杀有害生物剂选自下组,该组由以下各项组成:阿巴美丁、乙酰甲胺磷、啶虫脒、磺胺螨酯(amidoflumet)(S-1955)、除虫菌素(avermectin)、印楝素、甲基谷硫磷、联苯菊酯、联苯肼酯(binfenazate)、噻嗪酮、克百威、溴虫腈、定虫隆、毒死蜱、甲基毒死蜱、环虫酰肼、噻虫胺、氟氯氰菊酯、β-氟氯氰菊酯、三氯氟氰菊酯、λ-三氯氟氰菊酯、氯氰菊酯、灭蝇胺、溴氰菊酯、杀螨隆、二嗪磷、除虫脲、乐果、苯虫醚、甲氨基阿维菌素、硫丹、高氰戊菊酯、乙虫腈、苯硫威(fenothicarb)、苯氧威、甲氰菊酯、唑螨酯、氰戊菊酯、氟虫腈、氟啶虫酰胺、氟氰戊菊酯、τ-氟胺氰菊酯、嘧虫胺(UR-50701)、氟虫脲、地虫硫磷、氯虫酰肼、氟铃脲、吡虫啉、茚虫威、异柳磷、虱螨脲、马拉硫磷、聚乙醛、甲胺磷、杀扑磷、灭多威、烯虫酯、甲氧氯、久效磷、甲氧虫酰肼、噻虫醛(nithiazin)、双苯氟脲、多氟脲(XDE-007)、杀线威、对硫磷、甲基对硫磷、氯菊酯、甲拌磷、伏杀磷、亚胺硫磷、磷胺、抗蚜威、丙溴磷、吡蚜酮、啶虫丙醚、蚊蝇醚、鱼藤酮、多杀菌素、螺甲螨酯(spiromesifin)(BSN 2060)、硫丙磷、虫酰肼、伏虫隆、七氟菊酯、特丁硫磷、杀虫畏、噻虫啉、噻虫嗪、硫双威、杀虫双(thiosultap-sodium)、四溴菊酯、敌百虫和杀铃脲、涕灭威、杀线威、苯线磷、双甲脒、灭螨猛、乙酯杀螨醇、三环锡、三氯杀螨醇、除螨灵、依杀螨、喹螨醚、苯丁锡、甲氰菊酯、唑螨酯、噻螨酮、克螨特、哒螨灵以及吡螨胺。在仍其他实施例中,该化学杀有害生物剂选自下组,该组由以下各项组成:氯氰菊酯、三氯氟氰菊酯、氟氯氰菊酯和β-氟氯氰菊酯、高氰戊菊酯、氰戊菊酯、四溴菊酯、苯硫威、灭多威、杀线威、硫双威、噻虫胺、吡虫啉、噻虫啉、茚虫威、多杀菌素、阿巴美丁、除虫菌素(avermectin)、甲氨基阿维菌素、硫丹、乙虫腈、氟虫腈、氟虫脲、杀铃脲、苯虫醚、蚊蝇醚、吡蚜酮以及双甲脒。
在另外的实施例中,该第二有害生物控制剂可以是任何数目的苏云金芽孢杆菌杀昆虫蛋白中的一种或多种,包括但不限于Cry蛋白、营养期杀昆虫蛋白(VIP)以及任何前述杀昆虫蛋白的杀昆虫嵌合体。在其他实施例中,该第二有害生物控制剂是选自下组的Cry蛋白,该组由以下各项组成:Cry1Aa、Cry1Ab、Cry1Ac、Cry1Ad、Cry1Ae、Cry1Af、Cry1Ag、Cry1Ah、Cry1Ai、Cry1Aj、Cry1Ba、Cry1Bb、Cry1Bc、Cry1Bd、Cry1Be、Cry1Bf、Cry1Bg、Cry1Bh、Cry1Bi、Cry1Ca、Cry1Cb、Cry1Da、Cry1Db、Cry1Dc、Cry1Dd、Cry1Ea、Cry1Eb、Cry1Fa、Cry1Fb、Cry1Ga、Cry1Gb、Cry1Gc、Cry1Ha、Cry1Hb、Cry1Hc、Cry1Ia、Cry1Ib、Cry1Ic、Cry1Id、Cry1Ie、Cry1If、Cry1Ig、Cry1Ja、Cry1Jb、Cry1Jc、Cry1Jd、Cry1Ka、Cry1La、Cry1Ma、Cry1Na、Cry1Nb、Cry2Aa、Cry2Ab、Cry2Ac、Cry2Ad、Cry2Ae、Cry2Af、Cry2Ag、Cry2Ah、Cry2Ai、Cry2Aj、Cry2Ak,Cry2Al、Cry2Ba、Cry3Aa、Cry3Ba、Cry3Bb、Cry3Ca、Cry4Aa、Cry4Ba、Cry4Ca、Cry4Cb、Cry4Cc、Cry5Aa、Cry5Ab、Cry5Ac、Cry5Ad、Cry5Ba、Cry5Ca、Cry5Da、Cry5Ea、Cry6Aa、Cry6Ba、Cry7Aa、Cry7Ab、Cry7Ac、Cry7Ba、Cry7Bb、Cry7Ca、Cry7Cb、Cry7Da、Cry7Ea、Cry7Fa、Cry7Fb、Cry7Ga、Cry7Gb、Cry7Gc、Cry7Gd、Cry7Ha、Cry7Ia、Cry7Ja、Cry7Ka、Cry7Kb、Cry7La、Cry8Aa、Cry8Ab、Cry8Ac、Cry8Ad、Cry8Ba、Cry8Bb、Cry8Bc、Cry8Ca、Cry8Da、Cry8Db、Cry8Ea、Cry8Fa、Cry8Ga、Cry8Ha、Cry8Ia、Cry8Ib、Cry8Ja、Cry8Ka、Cry8Kb、Cry8La、Cry8Ma、Cry8Na、Cry8Pa、Cry8Qa、Cry8Ra、Cry8Sa、Cry8Ta、Cry9Aa、Cry9Ba、Cry9Bb、Cry9Ca、Cry9Da、Cry9Db、Cry9Dc、Cry9Ea、Cry9Eb、Cry9Ec、Cry9Ed、Cry9Ee、Cry9Fa、Cry9Ga、Cry10Aa、Cry11Aa、Cry11Ba、Cry11Bb、Cry12Aa,Cry13Aa、Cry14Aa、Cry14Ab、Cry15Aa、Cry16Aa、Cry17Aa、Cry18Aa、Cry18Ba、Cry18Ca、Cry19Aa、Cry19Ba、Cry19Ca、Cry20Aa、Cry20Ba、Cry21Aa、Cry21Ba、Cry21Ca、Cry21Da、Cry21Ea、Cry21Fa、Cry21Ga、Cry21Ha、Cry22Aa、Cry22Ab、Cry22Ba、Cry22Bb、Cry23Aa、Cry24Aa、Cry24Ba、Cry24Ca、Cry25Aa、Cry26Aa、Cry27Aa、Cry28Aa、Cry29Aa、Cry29Ba、Cry30Aa、Cry30Ba、Cry30Ca、Cry30Da、Cry30Db、Cry30Ea、Cry30Fa、Cry30Ga,Cry31Aa、Cry31Ab、Cry31Ac、Cry31Ad、Cry32Aa、Cry32Ab、Cry32Ba、Cry32Ca、Cry32Cb、Cry32Da、Cry32Ea、Cry32Eb、Cry32Fa、Cry32Ga、Cry32Ha、Cry32Hb、Cry32Ia、Cry32Ja、Cry32Ka、Cry32La、Cry32Ma、Cry32Mb、Cry32Na、Cry32Oa、Cry32Pa、Cry32Qa、Cry32Ra、Cry32Sa、Cry32Ta、Cry32Ua、Cry33Aa、Cry34Aa、Cry34Ab、Cry34Ac、Cry34Ba、Cry35Aa、Cry35Ab、Cry35Ac、Cry35Ba、Cry36Aa、Cry37Aa、Cry38Aa、Cry39Aa、Cry40Aa、Cry40Ba、Cry40Ca、Cry40Da、Cry41Aa、Cry41Ab、Cry41Ba、Cry42Aa、Cry43Aa、Cry43Ba、Cry43Ca、Cry43Cb、Cry43Cc、Cry44Aa、Cry45Aa、Cry46Aa、Cry46Ab、Cry47Aa、Cry48Aa、Cry48Ab、Cry49Aa、Cry49Ab、Cry50Aa、Cry50Ba、Cry51Aa、Cry52Aa、Cry52Ba、Cry53Aa、Cry53Ab、Cry54Aa、Cry54Ab、Cry54Ba、Cry55Aa、Cry56Aa、Cry57Aa、Cry57Ab、Cry58Aa、Cry59Aa、Cry59Ba、Cry60Aa、Cry60Ba、Cry61Aa、Cry62Aa、Cry63Aa、Cry64Aa、Cry65Aa、Cry66Aa、Cry67Aa、Cry68Aa、Cry69Aa、Cry69Ab、Cry70Aa、Cry70Ba、Cry70Bb、Cry71Aa、Cry72Aa以及Cry73Aa。
在另外的实施例中,该第二有害生物控制试剂是选自下组的Vip3营养期杀昆虫蛋白,该组由以下各项组成:Vip3Aa1、Vip3Aa2、Vip3Aa3、Vip3Aa4、Vip3Aa5、Vip3Aa6、Vip3Aa7、Vip3Aa8、Vip3Aa9、Vip3Aa10、Vip3Aa11、Vip3Aa12、Vip3Aa13、Vip3Aa14、Vip3Aa15、Vip3Aa16、Vip3Aa17、Vip3Aa18、Vip3Aa19、Vip3Aa20、Vip3Aa21、Vip3Aa22、Vip3Aa2、Vip3Aa24、Vip3Aa25、Vip3Aa26、Vip3Aa27、Vip3Aa28、Vip3Aa29、Vip3Aa30、Vip3Aa31、Vip3Aa32、Vip3Aa33、Vip3Aa34、Vip3Aa35、Vip3Aa36、Vip3Aa37、Vip3Aa38、Vip3Aa39、Vip3Aa40、Vip3Aa41、Vip3Aa42、Vip3Aa43、Vip3Aa44、Vip3Ab1、Vip3Ab2、Vip3Ac1、Vip3Ad1、Vip3Ad2、Vip3Ae1、Vip3Af1、Vip3Af2、Vip3Af3、Vip3Ag1、Vip3Ag2、Vip3Ag3HM117633、Vip3Ag4、Vip3Ag5、Vip3Ah1、Vip3Ba1、Vip3Ba2、Vip3Bb1、Vip3Bb2以及Vip3Bb3。
在仍另外的实施例中,在转基因植物中共表达本发明的第一Cry蛋白和该第二有害生物控制剂。可以通过将植物遗传工程化以含有并表达所有的必需基因来实现一种以上杀有害生物成分在同一个转基因植物中的共表达。可替代地,可以将植物(亲本1)遗传工程化,用于本发明的Cry蛋白的表达。可以将第二植物(亲本2)遗传工程化,用于第二有害生物控制剂的表达。通过将亲本1与亲本2杂交,获得了表达被引入至亲本1和亲本2中的所有基因的子代植物。
在其他实施例中,本发明提供了对植物有害生物侵染有抗性的叠加性转基因植物,该植物包含编码用于在靶标有害生物中抑制必需基因的dsRNA的DNA序列和编码针对该靶标有害生物展示出生物活性的本发明的Cry蛋白的DNA序列。已经报道,dsRNA对抗某些鳞翅目有害生物是无效的(Rajagopol等人2002J.Biol.Chem.[生物化学杂志]277:468-494),这可能是由于中肠中的高pH使得dsRNA不稳定。因此,在一些靶标有害生物是鳞翅目有害生物的实施例中,本发明的Cry蛋白起作用以瞬时降低中肠pH,这用于稳定共摄取的dsRNA,从而使得该dsRNA有效沉默靶基因。
除了提供组合物之外,本发明还提供了产生对鳞翅目有害生物有毒的Cry蛋白的方法。这样一种方法包括在转基因非人类宿主细胞产生对鳞翅目有害生物有毒的蛋白质的条件下培养该宿主细胞,该宿主细胞包含本发明的多核苷酸或嵌合基因或重组载体。在一些实施例中,该转基因非人类宿主细胞是植物细胞。在一些其他实施例中,该植物细胞是玉蜀黍细胞。在其他实施例中,植物细胞或玉蜀黍细胞在其下生长的条件包括自然光照。在其他实施例中,该转基因非人类宿主细胞是细菌细胞。在仍其他实施例中,该转基因非人类宿主细胞是酵母细胞。
在该方法的其他实施例中,该鳞翅目有害生物选自下组,该组由以下各项组成:欧洲玉米蛀虫(欧洲玉米螟)、黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)、水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在该方法的另外的实施例中,该嵌合基因包含SEQ ID NO:14-29中的任一项或其毒素编码片段。在仍其他实施例中,所产生的蛋白质包含SEQ ID NO:1-13中任一项或其毒素片段的氨基酸序列。
在该方法的一些实施例中,该嵌合基因包含针对在植物中表达进行了密码子优化的核苷酸序列。在其他实施例中,该嵌合基因包含SEQ ID NO:17-22中的任一项或其毒素编码片段。在另外的实施例中,所产生的蛋白质包含SEQ ID NO:1-6中任一项或其毒素片段的氨基酸序列。
在另外的实施例中,本发明提供了产生抗有害生物(例如,抗昆虫)转基因植物的方法,该方法包括向植物中引入包含编码本发明的Cry蛋白的核苷酸序列的本发明的多核苷酸、嵌合基因、重组载体、表达盒或多核苷酸,其中该编码的Cry蛋白被表达于该植物中,由此赋予该植物至少对鳞翅目昆虫有害生物的抗性,并且产生抗有害生物转基因植物。在一些实施例中,该多核苷酸、嵌合基因、重组载体、表达盒或多核苷酸包含编码SEQ ID NO:1-13中任一项的核苷酸序列。在其他实施例中,该多核苷酸、嵌合基因、重组载体、表达盒或多核苷酸包含SEQ ID NO:17-22中的任一项。在仍其他实施例中,与缺乏本发明的多核苷酸、嵌合基因、重组载体、表达盒或多核苷酸的对照植物相比,该抗有害生物转基因植物至少对欧洲玉米蛀虫(欧洲玉米螟)或黑色地老虎(小地老虎)有抗性。在一些实施例中,通过转化植物实现引入。在其他实施例中,通过将包含本发明的多核苷酸、嵌合基因、重组载体、表达盒或多核苷酸的第一植物,与不同的第二植物杂交来实现引入,产生后代种子和植物(其基因组中掺入了该多核苷酸、嵌合基因、重组载体、表达盒或多核苷酸)。
在一些实施例中,对至少欧洲玉米蛀虫(欧洲玉米螟)或黑色地老虎(小地老虎)有抗性的本发明的转基因植物还对至少一种另外的昆虫有抗性,其中该另外的昆虫包括但不限于秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西方豆地香)、烟夜蛾(烟芽夜蛾)、亚洲玉米蛀虫(亚洲玉米螟)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在另外的实施例中,提供了控制至少鳞翅目昆虫有害生物如欧洲玉米蛀虫(欧洲玉米螟)或黑色地老虎(小地老虎)的方法,该方法包括向这些昆虫递送有效量的本发明的Cry蛋白。为了有效,该Cry蛋白首先被昆虫经口摄取。然而,该Cry蛋白可以按许多公认的方式被递送至该昆虫。用于将蛋白质经口递送至昆虫的方式包括但不限于将该蛋白质提供于(1)转基因植物中,其中该昆虫取食(摄取)该转基因植物的一个或多个部分,由此摄取在该转基因植物中表达的多肽;(2)一种或多种配制的蛋白质组合物中,它们可以被施用至或掺入例如昆虫生长介质中;(3)一种或多种蛋白质组合物中,它们可以被施用至表面,例如喷雾在植物部分的表面,然后当该昆虫取食喷雾的一个或多个植物部分时组合物被该昆虫摄取;(4)饵基;或(5)任何其他本领域公认的蛋白质递送系统。因此,可以使用经口递送至昆虫的任何方法来递送本发明的毒性Cry蛋白。在一些特定实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取转基因植物的一个或多个部分。
在其他实施例中,将本发明的Cry蛋白经口递送至昆虫,其中该昆虫摄取用包含本发明的Cry蛋白的组合物喷雾的植物的一个或多个部分。可以使用本领域技术人员已知的用于将化合物、组合物、配制品等施用于植物表面的任何方法将本发明的组合物递送至植物表面。递送至或接触植物或其部分的一些非限制性实例包括喷雾、撒粉、喷洒、分散、下雾、雾化、撒播、浸泡、土壤注入、土壤掺入、浸透(例如,根、土壤处理)、浸渍、灌注、涂覆、叶或茎浸润、侧施或种子处理等及其组合。用于使植物或其部分与一种或多种化合物、一种或多种组合物或一种或多种配制品接触的这些和其他程序是本领域技术人员熟知的。
在一些实施例中,本发明涵盖为农民提供控制鳞翅目有害生物的手段的方法,该方法包括向该农民供应或出售植物材料如种子,该植物材料包含能够在由该种子生长的植物中表达本发明的Cry蛋白的多核苷酸、嵌合基因、表达盒或重组载体,如上所述。
本发明的实施例可以通过参考以下实例而被更好地理解。前述的和以下的本发明的实施例以及各种实施例的描述不是旨在限制权利要求书,而是对其具有说明性。因此,应理解的是权利要求书不旨在受限于这些实例的具体细节。本领域技术人员应理解的是本发明的其他实施例可以在不偏离本披露的精神和范围的情况下进行实践,本披露的范围是由所附权利要求书限定的。
实例
实例1.含有新颖Cry蛋白的Bt菌株的鉴定
将来自孢子的当前收集物中存在的苏云金芽孢杆菌分离株在T3+青霉素琼脂平板上进行培养和维持。在28℃下使每种分离株需氧地生长在24孔深块中约10天直至孢子形成,将其通过用考马斯蓝/乙酸染色并且用显微镜可视化来验证。孢子形成之后,将可溶的和不溶的部分都针对感兴趣的鳞翅目物种的活性进行测试。在表面污染生物测定中测试各部分,在该生物测定中将各部分覆盖到多物种人工饲料上。针对至少四种鳞翅目物种(包括玉米穗虫(玉米穗蛾)、小地老虎(黑色地老虎)、欧洲玉米螟(欧洲玉米蛀虫)和草地贪夜蛾(秋黏虫)筛选每种分离物,其中样本量为12只新生幼虫。每个测定的持续时间为在室温下约7天;针对死亡率以及幼虫生长抑制对这些平板评分。将在相对于阴性对照观察到的死亡率增加30%时认为是有效的。基于初始昆虫测试,选择三个Bt菌株(指定为SC0532、SC0666和SC0705)用于进一步分析。
实例2.基因组组装与分析
使用全基因组测序方法从实例1中鉴别的菌株中分离本发明的Btcry基因。简言之,使用Covaris S2超声波装置(Covaris公司,沃本,
马萨诸塞州)剪切芽孢杆菌属DNA,其中将程序DNA_400bp设为工作循环:10%;强度:4;循环/脉冲:200。将DNA用UltraTMEnd Repair/dA-加尾模块(新英格兰生物实验室公司(New England Biolabs,Inc.),伊普斯维奇,马萨诸塞州)处理。如供应商(新英格兰生物实验室公司,伊普斯维奇,马萨诸塞州)所述的,使用NEB QuickLigationTM连接生物科技(Biooscience)有索引的1-57个适配子(1-27巴西,28-57美国、英国和瑞士)。如供应商(贝克曼库尔特公司(Beckman Coulter,Inc.),印第安纳波利斯,印第安纳州)所述的,使用Agencourt AMPure XP珠粒清理连接物。
将文库如下进行大小分级:将50μl样品与45μl 75%珠粒混合物(25%AMPure珠粒加75%NaCl/PEG溶液;TekNova公司,霍利斯特,加利福尼亚州,美国;目录号P4136)混合。搅拌该混合物并置于磁性支架上。将所得上清液转移至新孔中并且添加45μl 50%珠粒混合物(50%AMPure珠粒加50%NaCl/PEG溶液;TekNova目录号P4136)。搅拌该混合物并置于磁性支架上。去除所得上清液并且用80%乙醇洗涤珠粒。添加25μl的洗脱缓冲液(EB)并且将混合物置于磁性支架上。去除所得最终上清液并置于1.5ml管中。这个方法产生了525个DNA碱基对(bp)(插入物加适配子)大小范围内的文库。
使用KAPA生物系统高保真热启动(KAPA Biosystem HiFi Hot Start)(KAPA生物系统公司(Kapa Biosystems,Inc.),威尔明顿,马萨诸塞州)使用以下循环条件扩增大小确定的DNA文库:[98℃,45s];12x[98℃,15s,60℃,30s,72℃,30s];[72℃,1min]。每个反应含有:5μl DNA文库、1μl生物科技通用引物(25μM)、18μl无菌水、1μl生物科技有索引的引物(25μM)、25μl 2X KAPA高保真聚合酶。
使用高灵敏度芯片在Agilent 2100Bioanalyzer(安捷伦科技公司(AgilentTechnologies),圣克拉拉,加利福尼亚州)上跑文库,以确定文库大小范围和平均插入物大小。使用标准的制造商测序方案(亿明达公司(Illumina,Inc.),圣地亚哥,加利福尼亚州)在HiSeq 2500测序系统上针对配对末端(PE)测序(100个循环/读数;12-24个文库/泳道)处理所有文库。
使用被开发用于鉴别和表征Cry样基因的芽孢杆菌属计算分析工具来优先化引导物,用于进一步实验室测试。
上述基因组组装与分析连同基因组文库分析在苏云金芽孢杆菌菌株中鉴别出三个Cry1样基因,它们对至少欧洲玉米蛀虫(欧洲玉米螟)或玉米穗蛾(玉米穗虫)有毒性。这些Cry1样基因和蛋白质的鉴别特征示于表1中。
表1.苏云金芽孢杆菌菌株中鉴别的Cry基因/蛋白质。
实例3.BT2Cry1J、BT25Cry1I和BT53Cry1J与已知Bt Cry蛋白的同源性
使用BLAST算法将表1中的蛋白质的氨基酸序列与由美国国家生物技术信息中心(NCBI)(在万维网ncbi.nlm.nih.gov可获得)维护的非冗余(nr)数据库进行比较,揭示这些蛋白质与Cry蛋白(特别是Cry1家族的那些)具有最高的同一性。更确切地,BT2Cry1J与Cry1Ja蛋白具有约98%同一性,其实例序列可在NCBI的登录号AAA22341(Cry1Ja1)、HM070030(Cry1Ja2)和JQ228425(Cry1Ja3)下发现。BT25Cry1I与Cry1Ig蛋白具有约95%同一性,其实例序列可在NCBI的登录号KC156701(cry1Ig1)下发现。BT53Cry1J与Cry1Jc蛋白具有约99%同一性,其实例可在NCBI的登录号AAC31092(Cry1Jc1)和AAQ52372(Cry1Jc2)下发现。
实例4.重组宿主细胞中的Bt蛋白表达
经由设计用于在大肠杆菌和苏云金芽孢杆菌两者中表达的命名为pCIB5634`的穿梭载体在重组细菌宿主细胞中表达实例2和3中描述的Cry蛋白。载体pCIB5634`包含修饰的变体Cry1Ac启动子(SEQ ID NO:30的bp 12-97),其相较于天然Cry1Ac启动子,改进经克隆的Bt Cry基因和红霉素抗性标记的表达。例如,使用BamHI和SacI限制位点将BT25Cry1I编码序列克隆到pCIB5634`载体中,产生包含SEQ ID NO:30的序列的Cry表达穿梭载体。
芽孢杆菌属表达。经由电穿孔将包含感兴趣的Cry蛋白编码序列的表达盒转化进没有可观察的背景杀昆虫活性的无晶体型(crystal-minus)苏云金芽孢杆菌(Bt)菌株中,并且在含有红霉素的琼脂平板上选择转基因Bt菌株。使所选择的转基因Bt菌株在T3培养基中于28℃下生长4-5天至孢子形成阶段。收获细胞沉淀并且在该表达的蛋白质溶解于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中之前反复洗涤。
大肠杆菌表达。使用pET28a或pET29a载体(默克公司(MerckKGaA),达姆施塔特,德国)在大肠杆菌菌株中表达Cry蛋白。通过电穿孔转化构建体并且在含有卡那霉素的琼脂平板上选择转基因大肠杆菌克隆。使所选择的转基因大肠杆菌菌株生长并且使用IPTG诱导在28℃下诱导Cry蛋白表达。将细胞再悬浮于含有2mM DTT的高pH碳酸盐缓冲液(50mM)中并且然后使用Microfluidics LV-1匀浆器打碎。
表达分析。然后经由离心澄清来自转基因Bt或大肠杆菌菌株的所得细胞裂解物并且使用BioRad Experion系统(伯乐公司(Biorad),赫拉克勒斯,加利福尼亚州)经由SDS-PAGE和电泳图分析样品的纯度。经由布雷福德(Bradford)或赛默(Thermo)660测定确定总蛋白浓度。然后在以下描述的生物测定中测试经纯化的Cry蛋白。
实例5.Cry蛋白在生物测定中的活性
使用本领域公认的人工饲料生物测定法针对以下昆虫有害生物物种中的一种或多种测试实例4中产生的Cry蛋白:秋黏虫(FAW;草地贪夜蛾)、玉米穗蛾(CEW;玉米穗虫)、欧洲玉米蛀虫(ECB;欧洲玉米螟)、黑色地老虎(BCW;小地老虎)、甘蔗螟(SCB;小蔗螟)、绒毛豆毛虫(VBC;黎豆夜蛾)、大豆夜蛾(SBL;大豆尺夜蛾(Pseudoplusia includens))、西南玉米蛀虫(SWCB;西南玉米螟)、西部豆切根虫(WBCW;西部豆夜蛾(Striacosta albicosta))、烟夜蛾(TBW;烟芽夜蛾)、亚洲玉米蛀虫(ACB;亚洲玉米螟)、棉螟蛉(CBW;棉铃虫)、条纹蛀茎虫(SSB;二化螟)、粉蛀茎虫(PSB;水稻大螟(Sesamia inferens))或水稻卷叶螟(RLF;稻纵卷叶螟)。
向24孔平板中的人工昆虫饲料(Bioserv公司,弗伦奇敦,新泽西州)的表面施加等量的溶液中的蛋白质。在饲料表面干燥之后,向每个孔中添加有待测试的昆虫物种的幼虫。将这些平板密封并且保持在就温度、光照以及相对湿度而言的环境实验室条件下。阳性对照组由暴露于非常具活性且广谱的野生型芽孢杆菌属菌株的幼虫组成。阴性对照组由暴露于仅用缓冲溶液或空载体处理的昆虫饲料的幼虫和未处理的昆虫饲料(即只有饲料)上的幼虫组成。约120小时之后评估死亡率并且相对于对照评分。
结果示于表2中,其中“-”意指与对照组相比无死亡率,“+/-”意指与对照组相比0-10%的死亡率(此类别还包括具有强烈幼虫生长抑制的0%死亡率),“+”意指与对照组相比10%-25%的活性,“++”意指与对照组相比26%-75%的死亡率,并且“+++”意指与对照组相比76%-100%的死亡率。
表2.Cry蛋白的生物测定结果。
实例6.BT2Cry1J蛋白的诱变
BT2Cry1J蛋白与已知的Cry1Ja蛋白、Cry1Ja1(NCBI登录号AAA22341)、Cry1Ja2(NCBI登录号HM070030)和Cry1Ja3(NCBI登录号JQ228425)具有98%同一性。基于标准BtCry蛋白命名法(Crickmore等人1998.Microbiol.Molecular Biol.Rev.[微生物分子生物学综述]62:807-813),BT2Cry1J最可能被命名为Cry1Ja蛋白。鉴于BT2Cry1Ja和Cry1Ja1之间具有非常高的同一性,在总共1167个氨基酸中仅具有24个氨基酸差异,可以预期这两种蛋白质具有相同的活性谱和特异性谱。出人意料地,BT2Cry1Ja似乎比已知的Cry1Ja蛋白具有更宽的活性谱或更高的特异活性。例如,一些研究的结果表明Cry1Ja1对秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)和欧洲玉米蛀虫(欧洲玉米螟)具有最低的活性,并且对黑色地老虎(小地老虎)不具有活性(美国专利号5,322,687和6,593,293),而BT2Cry1Ja对秋黏虫、玉米穗蛾、欧洲玉米蛀虫和黑色地老虎具有高活性。其他报告表明Cry1Ja1对棉螟蛉(棉铃虫)具有一些活性,但对小菜蛾或甜菜夜蛾(甜菜粘虫(Spodoptera exigua))不具有活性(Choi等人2007.J.Microbiol.Biotechnol.[微生物与生物技术]17:1498-1503)。仍其他报告表明Cry1Ja2对小菜蛾具有活性,并且Cry1Ja3对亚洲玉米蛀虫(亚洲玉米螟)具有活性(Hai-Shou等人2015.Genetics[遗传]11:1145-1451)。
本发明的BT2Cry1J和Cry1Ja1之间的二十四个氨基酸差异中的二十三个在跨越α-螺旋3至6的结构域I的区域中。最后的氨基酸差异在称为环α-8的结构域II中的区域中,其是被认为在昆虫肠受体结合中重要的区域。为了确定哪种结构域I氨基酸在调节Cry1J蛋白的活性中可能是重要的,在BT2Cry1J氨基酸序列(SEQ ID NO:1)中进行三区段的突变,其基本上分别对应于跨越α-螺旋3、α-螺旋4和α-螺旋5&6的区域。三个突变区段命名为:BLK-1,包含以下氨基酸取代:A97T、S105N、L108I、G110A、K118S和T119D,其跨越α-螺旋3以及α-螺旋3和4之间的环中的一个另外的氨基酸;BLK-2,包含以下氨基酸取代:T123E、R126K、T130I、E131D、I136L、A138G、Q139L、V149I和S150I,其跨越α-螺旋4以及α-螺旋4和5之间的环中的两个氨基酸;和BLK-3,包含以下氨基酸取代:L158S、T161V、V176I、T186K、V196I、N197R、R198E和G200H,其跨越α-螺旋5以及α-螺旋6的一部分。还制备了包含三个突变区段的组合的BT2Cry1J蛋白,产生总共七种经修饰的BT2Cry1J蛋白,对其针对靶标昆虫进行了测试。
通过合成SEQ ID NO:14的大约663bp NcoI-BglII 5`多核苷酸片段(该SEQ IDNO:14编码BT2Cry1J氨基酸序列的所希望区域中的取代氨基酸),制备包含每个突变区段和这些突变区段组合的构建体。将每个多核苷酸片段克隆到包含用NcoI-BglII酶切割的全长天然BT2Cry1J编码序列的载体中。然后每个片段置换全长基因的5`末端,产生编码经修饰的BT2Cry1J蛋白(SEQ ID NO:7-13)的经修饰的全长编码序列(SEQID NO:23-29)。如上所述,将每种载体克隆到无晶体型苏云金芽孢杆菌菌株中。
如上所述表达经修饰的BT2Cry1J蛋白,并针对以下进行测试:草螟科家族中的三种昆虫有害生物物种,欧洲玉米蛀虫(欧洲玉米螟)、甘蔗螟(小蔗螟)和西南玉米蛀虫(西南玉米螟),以及夜蛾科家族中的六种昆虫有害生物物种,黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、大豆夜蛾(大豆尺蠖)、绒毛豆毛虫(黎豆夜蛾)和烟夜蛾(烟芽夜蛾)。使用携带空载体的Bt细胞作为阴性对照,通过考马斯染色的SDS-PAGE证实每种经修饰的BT2Cry1J蛋白的存在。与天然BT2Cry1J蛋白(SEQ ID NO:1)和空载体对照相比,七种经修饰的BT2Cry1J蛋白的杀昆虫活性(作为校正的死亡率百分比)示于表3中。
表3.经修饰的BT2Cry1J蛋白的杀昆虫活性。
实例7.针对植物表达的基因定向
在植物中表达之前,通过本领域已知的方法合成包含核苷酸序列的合成多核苷酸,该核苷酸序列具有用于在植物中表达而优化的密码子,并编码本发明的Cry蛋白,如BT2Cry1J(SEQ ID NO:1)或变体序列(SEQ ID NO:4)、BT25Cry1I(SEQ ID NO:2)或变体序列(SEQ ID NO:5)或者BT53Cry1J(SEQ ID NO:3)或变体序列(SEQ ID NO:6)。针对这个实例,制备包含可操作地连接至BT53Cry1J合成编码序列(SEQ ID NO:19)(该编码序列可操作地连接至玉蜀黍泛素(Ubi361)终止子)的玉蜀黍泛素启动子(Ubi1)的第一表达盒,并且制备包含可操作地连接至磷酸甘露糖异构酶(PMI)编码序列(该编码序列可操作地连接至玉蜀黍Ubi1终止子)的玉蜀黍泛素1(Ubi1)启动子的第二表达盒。PMI的表达允许在甘露糖上正向选择转基因植物。将两个表达盒克隆到用于农杆菌介导的玉蜀黍转化的二元载体(SEQID NO:31)中。
实例8.Cry蛋白在玉蜀黍植物中的表达与活性
未成熟的玉米胚的转化基本上如在Negrotto等人,2000,Plant Cell Reports[植物细胞报告]19:798 803中所描述的来执行。简言之,使包含描述于实例7中的二元载体的农杆菌菌株LBA4404(pSB1)在28℃下在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/l琼脂,pH 6.8)固体培养基上生长2-4天。将大约0.8X 109个农杆菌细胞悬浮于补充有100μM As的LS-inf培养基中。在这个培养基中对细菌预诱导大约30-60分钟。
将来自近交玉蜀黍系的未成熟胚从约8-12天大的穗中切除到液体LS-inf+100μMAs中。用新鲜的感染培养基漂洗这些胚。然后添加农杆菌溶液,并且将这些胚涡旋约30秒并且允许其与细菌一起沉降5分钟。然后将这些胚盾片向上地转移到LSA培养基中,并且在黑暗中培养两至三天。随后,将每皮氏板(petri plate)大约20与25个之间的胚转移到补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中,并且在大约28℃下在黑暗中培养10天。
将产生胚性愈伤组织的未成熟的胚转移到LSD1M0.5S培养基中。在这种培养基上对培养物进行持续大约6周的选择,在约3周时进行传代培养步骤。将存活着的愈伤组织(calli)转移到补充有甘露糖的Reg1培养基中。在光照中培养(16小时光照/8小时黑暗方案)之后,然后将绿色组织转移到不具有生长调节剂的Reg2培养基中,并且孵育约1-2周。将这些小植株转移到含有Reg3培养基的马真塔(Magenta)GA-7盒(伊利诺斯州芝加哥的马真塔公司(Magenta Corp,Chicago Ill.))中,并且使它们在光照中生长。约2-3周之后,通过PCR测试植物的PMI基因和Bt53cry1J基因的存在。将来自PCR测定的阳性植物转移到温室用于进一步评估。
在叶切除生物测定中,针对拷贝数(通过Taqman分析确定)、蛋白质表达水平(通过ELISA确定)和对抗感兴趣的昆虫有害生物物种的功效对来自多重独立事件中的转基因植物进行评估。确切地,从25个单拷贝事件(V3-V4阶段)中切除植物组织并且用靶标有害生物的新生幼虫侵染,然后在室温下孵育约5天。将来自表达变体BT53Cry1J蛋白(SEQ ID NO:6)的转基因植物的叶圆片针对玉米穗蛾(玉米穗虫;CEW)、黑色地老虎(小地老虎;BCW)、和甘蔗螟(小蔗螟;SCB)进行测试。
25个转基因事件中的BT53Cry1J蛋白的表达水平范围为从约3ng/mg TSP至约11ng/mg TSP。植物生物测定的结果证实,表达BT53Cry1J蛋白的稳定转化的玉蜀黍植物对一种或多种鳞翅目昆虫有害生物是有毒的,其中15/25植物对CEW具有活性,7/25植物对BCW具有活性,以及11/25植物对SCB具有活性。
实例9.包含在转基因植物中的编码Cry蛋白的基因的突变
以下实例说明了使用基因组编辑以将突变掺入到包含在转基因玉蜀黍植物中的编码本发明Cry1J蛋白的基因中,包括但不限于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:6。
定向基因组修饰(也称为基因组编辑)可用于在特定DNA序列中引入突变。这些基因组编辑技术,其包括锌指核酸酶(ZNF)、转录激活子样效应子核酸酶(TALEN)、大范围核酸酶和成簇规律间隔短回文重复(CRISPR),已成功施用至包括作物植物在内的50多种不同生物。参见例如,Belhaj,K.等人,Plant Methods[植物方法]9,39(2013);Jiang,W.等人,Nucleic Acids Res[核酸研究]41,e188(2013))。用于基因组编辑的CRISPR/Cas系统基于Cas9核酸酶和指定靶标多核苷酸序列的工程化的单引导RNA(sgRNA)的瞬时表达。
Cas9是一种大的单体DNA核酸酶,其借助两个20-核苷酸(nt)非编码RNA的复合物被引导至DNA靶序列:CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA),其功能上可作为单合成RNA嵌合体获得。Cas9蛋白含有两个与RuvC和HNH核酸酶同源的核酸酶结构域。HNH核酸酶结构域切割互补DNA链,而RuvC样结构域切割非互补链,因此,在靶cry1J DNA中引入钝切(blunt cut)。
当Cas9和sgRNA在活的玉蜀黍细胞中瞬时表达时,在转基因玉蜀黍中产生特异性靶标cry1J DNA中的双链断裂(DSB)。通过非同源末端连接和同源定向DNA修复途径引入断裂位点处的突变。
通过使用表达Cas9核酸酶的重组质粒和针对在转基因玉蜀黍中的cry1J序列进行了密码子优化的sgRNA靶标,将特定突变(例如上述的BLK1突变)引入到编码BT2Cry1J或其变体(如SEQ ID NO:1或SEQ ID NO:4)的基因中。该方法的实施是通过根癌农杆菌(Agrobacterium tumefaciens)的农杆菌浸润方法,该根癌农杆菌携带含有cry1J的指定的感兴趣靶序列的二元质粒。在sgRNA与cry1J编码序列结合后,该Cas9核酸酶对编码序列进行特异性切割,并在DNA修复过程中引入BLK1突变。因此,现在经突变的cry1J基因将编码经修饰的Cry1J蛋白,如SEQ ID NO:7,其中在位置97处的突变用Thr(T)置换Ala(A);在位置105处的突变用Asn(N)置换Ser(S);在位置108处的突变用Ile(I)置换Leu(L);在位置110处的突变用Ala(A)置换Gly(G);在位置118处的突变用Ser(S)置换Lys(K),并且在位置119处的突变用Asp(D)置换Thr(T)。通过PCR和测序筛选包含经突变的cry1J多核苷酸的植物细胞。诱导在cry1J基因中含有突变的愈伤组织以再生植物,这些植物用于针对经表达修饰的Cry1J蛋白的调节杀昆虫活性的表型评估。
序列表
<110> Syngenta Participations AG
Bramlett, Matthew
Jucovic, Milan
Seguin, Katherine
Rose, Mark
<120> 用于控制植物有害生物的组合物和方法
<130> 81065-WO-REG-ORG-P-1
<150> 62/442155
<151> 2017-1-04
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 1167
<212> PRT
<213> 苏云金芽孢杆菌
<400> 1
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 2
<211> 710
<212> PRT
<213> 苏云金芽孢杆菌
<400> 2
Met Lys Ser Lys Asn Gln Asn Met His Gln Ser Leu Ser Asn Asn Ala
1 5 10 15
Thr Val Asp Lys Asn Phe Thr Gly Ser Leu Glu Asn Asn Thr Asn Thr
20 25 30
Glu Leu Gln Asn Phe Asn His Glu Gly Ile Glu Pro Phe Val Ser Val
35 40 45
Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly Lys Ile Leu Gly Asn
50 55 60
Leu Gly Val Pro Phe Ala Gly Gln Val Ala Ser Leu Tyr Ser Phe Ile
65 70 75 80
Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln Trp Glu Ile Phe Met
85 90 95
Glu His Val Glu Glu Leu Ile Asn Gln Lys Ile Ser Thr Tyr Ala Arg
100 105 110
Asn Lys Ala Leu Ala Asp Leu Lys Gly Leu Gly Asp Ala Leu Ala Val
115 120 125
Tyr His Glu Ser Leu Glu Ser Trp Ile Lys Asn Arg Asn Asn Thr Arg
130 135 140
Thr Arg Ser Val Val Lys Ser Gln Tyr Ile Thr Leu Glu Leu Met Phe
145 150 155 160
Val Gln Ser Leu Pro Ser Phe Ala Val Ser Gly Glu Glu Val Pro Leu
165 170 175
Leu Pro Ile Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg
180 185 190
Asp Ala Ser Ile Phe Gly Lys Glu Trp Gly Leu Ser Asp Ser Glu Ile
195 200 205
Ser Thr Phe Tyr Asn Arg Gln Val Glu Arg Thr Ser Asp Tyr Ser Asp
210 215 220
His Cys Thr Lys Trp Phe Asp Thr Gly Leu Asn Arg Leu Lys Gly Ser
225 230 235 240
Asn Ala Glu Ile Trp Val Lys Tyr Asn Gln Phe Arg Arg Asp Met Thr
245 250 255
Leu Met Val Leu Asp Leu Val Ala Leu Phe Gln Ser Tyr Asp Thr His
260 265 270
Met Tyr Pro Ile Lys Thr Thr Ala Gln Leu Thr Arg Glu Val Tyr Thr
275 280 285
Asn Ala Leu Gly Thr Val His Pro His Pro Ser Phe Thr Ser Thr Thr
290 295 300
Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Val
305 310 315 320
Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr
325 330 335
Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly
340 345 350
Gly His Lys Leu Glu Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser
355 360 365
Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe
370 375 380
Thr Ser Arg Asp Ile Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu
385 390 395 400
Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg Val Asp Phe His Trp
405 410 415
Lys Phe Val Thr His Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly
420 425 430
Tyr Ala Gly Ile Gly Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro
435 440 445
Pro Glu Ala Thr Gly Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu
450 455 460
Ser His Ile Gly Leu Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr
465 470 475 480
Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn Thr Ile His Ser Asp
485 490 495
Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His Thr Leu Gln Ser Gly
500 505 510
Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg
515 520 525
Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn Val Asn Leu Asp Trp
530 535 540
Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg Tyr Ala Ser Thr Thr
545 550 555 560
Asn Leu Arg Met Tyr Val Thr Ile Ala Gly Glu Arg Ile Phe Ala Gly
565 570 575
Gln Phe Asn Lys Thr Met Asn Thr Gly Asp Pro Leu Thr Phe Gln Ser
580 585 590
Phe Ser Tyr Ala Thr Ile Asp Thr Ala Phe Thr Phe Pro Thr Lys Ala
595 600 605
Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser Ser Gly Asn Glu Val
610 615 620
Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr Ala Thr Leu Glu Ala
625 630 635 640
Val Thr Asp Leu Glu Arg Ala Gln Lys Ala Val His Glu Leu Phe Thr
645 650 655
Ser Thr Asn Pro Gly Gly Leu Lys Thr Asp Val Lys Asp Tyr His Ile
660 665 670
Asp Gln Val Ser Asn Leu Val Glu Ser Leu Ser Asp Lys Phe Tyr Leu
675 680 685
Asp Glu Lys Arg Glu Leu Phe Glu Ile Val Lys Tyr Ala Lys Gln Leu
690 695 700
His Ile Glu Arg Asn Met
705 710
<210> 3
<211> 1168
<212> PRT
<213> 苏云金芽孢杆菌
<400> 3
Met Glu Ile Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Phe Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Leu Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Asp Trp Glu Leu Phe Leu Glu Gln Ile Glu
65 70 75 80
Gln Leu Ile Asp Arg Arg Ile Glu Arg Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Lys His Cys Val Asp
195 200 205
Thr Tyr Lys Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Val Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Arg Thr Ile Ser Gln Leu Thr Arg Glu Ile Tyr Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Asn Asn Ile Ile Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Thr Asn Thr Glu Gly His Gln Arg Ser Phe Pro
325 330 335
Leu Ala Gly Thr Ile Gly Asn Ser Ala Pro Pro Val Thr Val Arg Asn
340 345 350
Asn Gly Glu Gly Ile Tyr Arg Ile Leu Ser Glu Pro Phe Tyr Ser Ala
355 360 365
Pro Phe Leu Gly Thr Ser Val Leu Gly Ser Arg Gly Glu Glu Phe Ala
370 375 380
Phe Ala Ser Asn Thr Thr Thr Ser Leu Pro Ser Thr Ile Tyr Arg Asn
385 390 395 400
Arg Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp Tyr Ser
405 410 415
Val Pro Pro His Arg Gly Tyr Ser His Leu Leu Ser His Val Thr Met
420 425 430
Arg Asn Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala Thr Pro
435 440 445
Arg Asn Thr Ile Asp Pro Asp Ser Ile Thr Gln Ile Pro Ala Val Lys
450 455 460
Gly Ala Tyr Ile Phe Asn Ser Pro Val Ile Thr Gly Pro Gly His Thr
465 470 475 480
Gly Gly Asp Ile Ile Arg Phe Asn Pro Asn Thr Gln Asn Asn Ile Arg
485 490 495
Ile Pro Phe Gln Ser Asn Ala Val Gln Arg Tyr Arg Ile Arg Met Arg
500 505 510
Tyr Ala Ala Glu Ala Asp Cys Ile Leu Glu Ser Gly Val Asn Ile Val
515 520 525
Thr Gly Ala Gly Val Thr Phe Arg Pro Ile Pro Ile Lys Ala Thr Met
530 535 540
Thr Pro Gly Ser Pro Leu Thr Tyr Tyr Ser Phe Gln Tyr Ala Asp Leu
545 550 555 560
Asn Ile Asn Leu Thr Ala Pro Ile Arg Pro Asn Asn Phe Val Ser Ile
565 570 575
Arg Arg Ser Asn Gln Pro Gly Asn Leu Tyr Ile Asp Arg Ile Glu Phe
580 585 590
Ile Pro Ile Asp Pro Ile Arg Glu Ala Glu His Asp Leu Glu Arg Ala
595 600 605
Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu
610 615 620
Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
625 630 635 640
Ala Cys Leu Ser Asp Lys Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser
645 650 655
Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu
660 665 670
Gln Asp Gln Asn Phe Thr Gly Ile Asn Arg Gln Val Asp Arg Gly Trp
675 680 685
Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys
690 695 700
Glu Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr
705 710 715 720
Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Pro Tyr Thr Arg
725 730 735
Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr
740 745 750
Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Leu Asn Val Pro Gly Thr
755 760 765
Gly Ser Leu Trp Pro Leu Ala Ala Glu Ser Ser Ile Gly Arg Cys Gly
770 775 780
Glu Pro Asn Arg Cys Ala Pro His Ile Glu Trp Asn Pro Glu Leu Asp
785 790 795 800
Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe
805 810 815
Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly
820 825 830
Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly Tyr Ala Arg Leu
835 840 845
Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu
850 855 860
Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Asp Lys
865 870 875 880
Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val
885 890 895
Asp Ala Leu Phe Val Asp Ser Gln Tyr Asn Arg Leu Gln Thr Asp Thr
900 905 910
Asn Ile Ala Met Ile His Val Ala Asp Lys Arg Val His Arg Ile Arg
915 920 925
Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala
930 935 940
Ile Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr
945 950 955 960
Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn His Gly Leu Ser
965 970 975
Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His
980 985 990
Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
995 1000 1005
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala
1010 1015 1020
Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile
1025 1030 1035
Glu Asp His Thr Asp Glu Leu Lys Phe Arg Asn Cys Glu Glu Glu
1040 1045 1050
Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Pro Ala
1055 1060 1065
Asn Gln Glu Glu Tyr Arg Ala Ala Glu Thr Ser Arg Asn Arg Gly
1070 1075 1080
Tyr Gly Glu Ser Tyr Glu Ser Asn Ser Ser Ile Pro Ala Glu Tyr
1085 1090 1095
Ala Pro Ile Tyr Glu Lys Ala Tyr Thr Asp Gly Arg Lys Glu Asn
1100 1105 1110
Ser Cys Glu Ser Asn Arg Gly Tyr Gly Asn Tyr Thr Pro Leu Pro
1115 1120 1125
Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1130 1135 1140
Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val
1145 1150 1155
Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 4
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 变体BT0002蛋白
<220>
<221> 尚未归类的特征
<223> 氨基酸取代:I1146L和L1163I
<400> 4
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Leu Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Ile Leu Met Glu Glu
1160 1165
<210> 5
<211> 710
<212> PRT
<213> 人工序列
<220>
<223> 变体BT0025蛋白
<220>
<221> 尚未归类的特征
<223> 氨基酸取代:I672L和I697L
<400> 5
Met Lys Ser Lys Asn Gln Asn Met His Gln Ser Leu Ser Asn Asn Ala
1 5 10 15
Thr Val Asp Lys Asn Phe Thr Gly Ser Leu Glu Asn Asn Thr Asn Thr
20 25 30
Glu Leu Gln Asn Phe Asn His Glu Gly Ile Glu Pro Phe Val Ser Val
35 40 45
Ser Thr Ile Gln Thr Gly Ile Gly Ile Ala Gly Lys Ile Leu Gly Asn
50 55 60
Leu Gly Val Pro Phe Ala Gly Gln Val Ala Ser Leu Tyr Ser Phe Ile
65 70 75 80
Leu Gly Glu Leu Trp Pro Lys Gly Lys Ser Gln Trp Glu Ile Phe Met
85 90 95
Glu His Val Glu Glu Leu Ile Asn Gln Lys Ile Ser Thr Tyr Ala Arg
100 105 110
Asn Lys Ala Leu Ala Asp Leu Lys Gly Leu Gly Asp Ala Leu Ala Val
115 120 125
Tyr His Glu Ser Leu Glu Ser Trp Ile Lys Asn Arg Asn Asn Thr Arg
130 135 140
Thr Arg Ser Val Val Lys Ser Gln Tyr Ile Thr Leu Glu Leu Met Phe
145 150 155 160
Val Gln Ser Leu Pro Ser Phe Ala Val Ser Gly Glu Glu Val Pro Leu
165 170 175
Leu Pro Ile Tyr Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg
180 185 190
Asp Ala Ser Ile Phe Gly Lys Glu Trp Gly Leu Ser Asp Ser Glu Ile
195 200 205
Ser Thr Phe Tyr Asn Arg Gln Val Glu Arg Thr Ser Asp Tyr Ser Asp
210 215 220
His Cys Thr Lys Trp Phe Asp Thr Gly Leu Asn Arg Leu Lys Gly Ser
225 230 235 240
Asn Ala Glu Ile Trp Val Lys Tyr Asn Gln Phe Arg Arg Asp Met Thr
245 250 255
Leu Met Val Leu Asp Leu Val Ala Leu Phe Gln Ser Tyr Asp Thr His
260 265 270
Met Tyr Pro Ile Lys Thr Thr Ala Gln Leu Thr Arg Glu Val Tyr Thr
275 280 285
Asn Ala Leu Gly Thr Val His Pro His Pro Ser Phe Thr Ser Thr Thr
290 295 300
Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala Ile Glu Ala Ala Val
305 310 315 320
Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu Gln Val Thr Ile Tyr
325 330 335
Ser Leu Leu Ser Arg Trp Ser Asn Thr Gln Tyr Met Asn Met Trp Gly
340 345 350
Gly His Lys Leu Glu Phe Arg Thr Ile Gly Gly Thr Leu Asn Thr Ser
355 360 365
Thr Gln Gly Ser Thr Asn Thr Ser Ile Asn Pro Val Thr Leu Pro Phe
370 375 380
Thr Ser Arg Asp Ile Tyr Arg Thr Glu Ser Leu Ala Gly Leu Asn Leu
385 390 395 400
Phe Leu Thr Gln Pro Val Asn Gly Val Pro Arg Val Asp Phe His Trp
405 410 415
Lys Phe Val Thr His Pro Ile Ala Ser Asp Asn Phe Tyr Tyr Pro Gly
420 425 430
Tyr Ala Gly Ile Gly Thr Gln Leu Gln Asp Ser Glu Asn Glu Leu Pro
435 440 445
Pro Glu Ala Thr Gly Gln Pro Asn Tyr Glu Ser Tyr Ser His Arg Leu
450 455 460
Ser His Ile Gly Leu Ile Ser Ala Ser His Val Lys Ala Leu Val Tyr
465 470 475 480
Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn Thr Ile His Ser Asp
485 490 495
Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His Thr Leu Gln Ser Gly
500 505 510
Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg
515 520 525
Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn Val Asn Leu Asp Trp
530 535 540
Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg Tyr Ala Ser Thr Thr
545 550 555 560
Asn Leu Arg Met Tyr Val Thr Ile Ala Gly Glu Arg Ile Phe Ala Gly
565 570 575
Gln Phe Asn Lys Thr Met Asn Thr Gly Asp Pro Leu Thr Phe Gln Ser
580 585 590
Phe Ser Tyr Ala Thr Ile Asp Thr Ala Phe Thr Phe Pro Thr Lys Ala
595 600 605
Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser Ser Gly Asn Glu Val
610 615 620
Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr Ala Thr Leu Glu Ala
625 630 635 640
Val Thr Asp Leu Glu Arg Ala Gln Lys Ala Val His Glu Leu Phe Thr
645 650 655
Ser Thr Asn Pro Gly Gly Leu Lys Thr Asp Val Lys Asp Tyr His Leu
660 665 670
Asp Gln Val Ser Asn Leu Val Glu Ser Leu Ser Asp Lys Phe Tyr Leu
675 680 685
Asp Glu Lys Arg Glu Leu Phe Glu Leu Val Lys Tyr Ala Lys Gln Leu
690 695 700
His Ile Glu Arg Asn Met
705 710
<210> 6
<211> 1168
<212> PRT
<213> 人工序列
<220>
<223> 变体BT0053蛋白
<220>
<221> 尚未归类的特征
<223> 氨基酸取代:E2A和I1157L
<400> 6
Met Ala Ile Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Phe Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Leu Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Asp Trp Glu Leu Phe Leu Glu Gln Ile Glu
65 70 75 80
Gln Leu Ile Asp Arg Arg Ile Glu Arg Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Lys His Cys Val Asp
195 200 205
Thr Tyr Lys Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Val Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Arg Thr Ile Ser Gln Leu Thr Arg Glu Ile Tyr Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Asn Asn Ile Ile Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Thr Asn Thr Glu Gly His Gln Arg Ser Phe Pro
325 330 335
Leu Ala Gly Thr Ile Gly Asn Ser Ala Pro Pro Val Thr Val Arg Asn
340 345 350
Asn Gly Glu Gly Ile Tyr Arg Ile Leu Ser Glu Pro Phe Tyr Ser Ala
355 360 365
Pro Phe Leu Gly Thr Ser Val Leu Gly Ser Arg Gly Glu Glu Phe Ala
370 375 380
Phe Ala Ser Asn Thr Thr Thr Ser Leu Pro Ser Thr Ile Tyr Arg Asn
385 390 395 400
Arg Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp Tyr Ser
405 410 415
Val Pro Pro His Arg Gly Tyr Ser His Leu Leu Ser His Val Thr Met
420 425 430
Arg Asn Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala Thr Pro
435 440 445
Arg Asn Thr Ile Asp Pro Asp Ser Ile Thr Gln Ile Pro Ala Val Lys
450 455 460
Gly Ala Tyr Ile Phe Asn Ser Pro Val Ile Thr Gly Pro Gly His Thr
465 470 475 480
Gly Gly Asp Ile Ile Arg Phe Asn Pro Asn Thr Gln Asn Asn Ile Arg
485 490 495
Ile Pro Phe Gln Ser Asn Ala Val Gln Arg Tyr Arg Ile Arg Met Arg
500 505 510
Tyr Ala Ala Glu Ala Asp Cys Ile Leu Glu Ser Gly Val Asn Ile Val
515 520 525
Thr Gly Ala Gly Val Thr Phe Arg Pro Ile Pro Ile Lys Ala Thr Met
530 535 540
Thr Pro Gly Ser Pro Leu Thr Tyr Tyr Ser Phe Gln Tyr Ala Asp Leu
545 550 555 560
Asn Ile Asn Leu Thr Ala Pro Ile Arg Pro Asn Asn Phe Val Ser Ile
565 570 575
Arg Arg Ser Asn Gln Pro Gly Asn Leu Tyr Ile Asp Arg Ile Glu Phe
580 585 590
Ile Pro Ile Asp Pro Ile Arg Glu Ala Glu His Asp Leu Glu Arg Ala
595 600 605
Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu
610 615 620
Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
625 630 635 640
Ala Cys Leu Ser Asp Lys Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser
645 650 655
Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu
660 665 670
Gln Asp Gln Asn Phe Thr Gly Ile Asn Arg Gln Val Asp Arg Gly Trp
675 680 685
Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys
690 695 700
Glu Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr
705 710 715 720
Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Pro Tyr Thr Arg
725 730 735
Tyr Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr
740 745 750
Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Leu Asn Val Pro Gly Thr
755 760 765
Gly Ser Leu Trp Pro Leu Ala Ala Glu Ser Ser Ile Gly Arg Cys Gly
770 775 780
Glu Pro Asn Arg Cys Ala Pro His Ile Glu Trp Asn Pro Glu Leu Asp
785 790 795 800
Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe
805 810 815
Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly
820 825 830
Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly Tyr Ala Arg Leu
835 840 845
Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu
850 855 860
Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Asp Lys
865 870 875 880
Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val
885 890 895
Asp Ala Leu Phe Val Asp Ser Gln Tyr Asn Arg Leu Gln Thr Asp Thr
900 905 910
Asn Ile Ala Met Ile His Val Ala Asp Lys Arg Val His Arg Ile Arg
915 920 925
Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala
930 935 940
Ile Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr
945 950 955 960
Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn His Gly Leu Ser
965 970 975
Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His
980 985 990
Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
995 1000 1005
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala
1010 1015 1020
Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile
1025 1030 1035
Glu Asp His Thr Asp Glu Leu Lys Phe Arg Asn Cys Glu Glu Glu
1040 1045 1050
Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Pro Ala
1055 1060 1065
Asn Gln Glu Glu Tyr Arg Ala Ala Glu Thr Ser Arg Asn Arg Gly
1070 1075 1080
Tyr Gly Glu Ser Tyr Glu Ser Asn Ser Ser Ile Pro Ala Glu Tyr
1085 1090 1095
Ala Pro Ile Tyr Glu Lys Ala Tyr Thr Asp Gly Arg Lys Glu Asn
1100 1105 1110
Ser Cys Glu Ser Asn Arg Gly Tyr Gly Asn Tyr Thr Pro Leu Pro
1115 1120 1125
Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1130 1135 1140
Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Leu Val
1145 1150 1155
Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 7
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋3 BT0002
<220>
<221> 尚未归类的特征
<222> (97)..(119)
<223> BT0002区段1突变:A97T; S105N; L108I; G110A; K118S & T119D
<400> 7
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Thr Glu Leu Glu Gly Leu Gly Arg Asn Tyr Gln Ile Tyr Ala Glu Ala
100 105 110
Phe Lys Glu Trp Glu Ser Asp Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 8
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋4 BT0002
<220>
<221> 尚未归类的特征
<222> (123)..(150)
<223> BT0002区段2突变:T123E; R126K; T130I; E131D; I136L; A138G; Q139L;V149I & S150I
<400> 8
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Glu Ala Ala Lys Ser Arg
115 120 125
Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Ile Ile Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 9
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋5/6 BT0002
<220>
<221> 尚未归类的特征
<222> (158)..(200)
<223> BT0002区段3突变:L158S; T161V; V176I; T186K; V196I; N197R; R198E &G200H
<400> 9
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Val Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Lys Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Ile Arg Glu Ile His Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 10
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋3/4 BT0002
<220>
<221> 尚未归类的特征
<222> (97)..(150)
<223> BT0002区段1和2突变:A97T; S105N; L108I; G110A; K118S; T119D; T123E;R126K; T130I; E131D; I136L; A138G; Q139L; V149I & S150I
<400> 10
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Thr Glu Leu Glu Gly Leu Gly Arg Asn Tyr Gln Ile Tyr Ala Glu Ala
100 105 110
Phe Lys Glu Trp Glu Ser Asp Pro Asp Asn Glu Ala Ala Lys Ser Arg
115 120 125
Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Ile Ile Gly Phe Glu Val Pro Leu Leu Leu Val Tyr
145 150 155 160
Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Val
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Thr Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Val Asn Arg Ile Gly Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 11
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋4/5/6 BT0002
<220>
<221> 尚未归类的特征
<222> (123)..(200)
<223> BT0002区段2和3突变:T123E; R126K; T130I; E131D; I136L; A138G; Q139L;V149I; S150I; L158S; T161V; V176I; T186K; V196I; N197R; R198E & G200H
<400> 11
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala
100 105 110
Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Glu Ala Ala Lys Ser Arg
115 120 125
Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Ile Ile Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Val Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Lys Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Ile Arg Glu Ile His Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 12
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋3/5/6 BT0002
<220>
<221> 尚未归类的特征
<222> (97)..(200)
<223> BT0002区段1和3突变:A97T; S105N; L108I; G110A; K118S; T119D; L158S;T161V; V176I; T186K; V196I; N197R; R198E & G200H
<400> 12
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Thr Glu Leu Glu Gly Leu Gly Arg Asn Tyr Gln Ile Tyr Ala Glu Ala
100 105 110
Phe Lys Glu Trp Glu Ser Asp Pro Asp Asn Thr Ala Ala Arg Ser Arg
115 120 125
Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Val Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Lys Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Ile Arg Glu Ile His Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 13
<211> 1167
<212> PRT
<213> 人工序列
<220>
<223> 经修饰的α-螺旋3/4/5/6 BT0002
<220>
<221> 尚未归类的特征
<223> BT0002区段1、2和3突变:A97T; S105N; L108I; G110A; K118S; T119D; T123E;R126K; T130I; E131D; I136L; A138G; Q139L; V149I; S150I; L158S; T161V; V176I; T186K;V196I; N197R; R198E & G200H
<400> 13
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
65 70 75 80
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Thr Glu Leu Glu Gly Leu Gly Arg Asn Tyr Gln Ile Tyr Ala Glu Ala
100 105 110
Phe Lys Glu Trp Glu Ser Asp Pro Asp Asn Glu Ala Ala Lys Ser Arg
115 120 125
Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Ile Ile Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Val Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Lys Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Ile Arg Glu Ile His Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Asn Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Met Arg Val Asn Ile Thr Gly Pro Leu Ser Gln Arg Tyr Arg
500 505 510
Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr Arg
515 520 525
Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Gln Arg Thr Met Asn
530 535 540
Arg Gly Asp Asn Leu Glu Ser Gly Asn Phe Arg Thr Ala Gly Phe Ser
545 550 555 560
Thr Pro Phe Ser Phe Ser Asn Ala Gln Ser Thr Phe Thr Leu Gly Thr
565 570 575
Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe Val
580 585 590
Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
595 600 605
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys
610 615 620
Thr Asp Val Thr Asp Tyr Gln Ile Asp Gln Val Ser Asn Leu Val Glu
625 630 635 640
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
645 650 655
Lys Val Lys His Ala Lys Arg Leu Ser Asp Lys Arg Asn Leu Leu Gln
660 665 670
Asp Pro Asn Phe Thr Ser Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg
675 680 685
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys Glu
690 695 700
Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr
705 710 715 720
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
725 730 735
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr Leu
740 745 750
Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly
755 760 765
Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu
770 775 780
Pro Asn Arg Cys Val Pro His Ile Glu Trp Asn Pro Asp Leu Asp Cys
785 790 795 800
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser
805 810 815
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
820 825 830
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
835 840 845
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
850 855 860
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Gln Leu
865 870 875 880
Gln Phe Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
885 890 895
Ala Leu Phe Val Asp Ser His Tyr Asn Arg Leu Gln Ala Asp Thr Asn
900 905 910
Ile Thr Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
915 920 925
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile
930 935 940
Phe Glu Glu Leu Glu Gly Leu Ile Phe Thr Ala Phe Ser Leu Tyr Asp
945 950 955 960
Ala Arg Asn Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys
965 970 975
Trp Asn Val Lys Gly His Val Asp Ile Gln Gln Asn Asp His Arg Ser
980 985 990
Val Leu Val Val Pro Glu Trp Glu Ser Glu Val Ser Gln Glu Val Arg
995 1000 1005
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1010 1015 1020
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp
1025 1030 1035
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Ile Glu Glu Glu Val
1040 1045 1050
Tyr Pro Thr Asp Thr Gly Asn Asp Tyr Thr Ala His Gln Gly Thr
1055 1060 1065
Thr Gly Cys Ala Asp Ala Cys Asn Ser Arg Asn Val Gly Tyr Glu
1070 1075 1080
Asp Gly Tyr Glu Ile Asn Thr Thr Ala Ser Val Asn Tyr Lys Pro
1085 1090 1095
Thr Tyr Glu Glu Glu Met Tyr Thr Asp Val Arg Arg Asp Asn His
1100 1105 1110
Cys Glu Tyr Asp Arg Gly Tyr Gly Asn His Thr Pro Leu Pro Ala
1115 1120 1125
Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Thr
1130 1135 1140
Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp
1145 1150 1155
Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165
<210> 14
<211> 3504
<212> DNA
<213> 苏云金芽孢杆菌
<400> 14
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcgc tgaattagaa 300
ggtttaggga gaagttatca actatatgga gaggcattta aagagtggga aaaaactcca 360
gataacacag cggctcggtc tagagtaact gagagatttc gtataattga tgctcaaatt 420
gaagcaaata tcccttcgtt tcgggtttcc ggatttgaag tgccacttct attggtttat 480
acccaagcag ctaatttgca tctcgctcta ttaagagatt ctgttgtttt tggagagaga 540
tggggattga cgactacaaa tgtcaatgat atctataata gacaagttaa tagaattggt 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 15
<211> 2133
<212> DNA
<213> 苏云金芽孢杆菌
<400> 15
atgaaatcta agaatcaaaa tatgcatcaa agcttgtcta acaatgcgac agttgataaa 60
aactttacag gttcactaga aaataacaca aatacggaat tacaaaactt taatcatgaa 120
ggtatagagc cgtttgttag tgtatcaaca attcaaacgg gtattggtat tgctggtaaa 180
atccttggta acctaggcgt tccctttgct gggcaagtag ctagcctcta tagttttatc 240
ctaggtgagc tttggcccaa agggaaaagc caatgggaaa tttttatgga acatgtagaa 300
gagcttatta atcaaaagat atcgacttat gcaagaaaca aagcacttgc agatttaaaa 360
ggattaggag atgctttggc tgtctaccat gaatcgctgg aaagttggat taaaaatcgc 420
aataacacaa gaactagaag tgttgtcaag agccaataca ttaccttgga acttatgttc 480
gtacaatcat taccttcttt tgcagtgtct ggagaggaag taccactatt accaatatat 540
gctcaagctg caaatttaca cttgttgcta ttaagagatg cgtctatttt tggaaaagaa 600
tggggattat cagactcaga aatttcgaca ttctataatc gtcaagtgga aagaacatca 660
gattattccg atcattgcac gaaatggttt gatacgggct tgaatagatt aaagggctca 720
aatgctgaaa tctgggtaaa gtataatcaa ttccgtagag acatgacttt aatggtacta 780
gatttagtgg cactattcca aagctatgat acacatatgt acccaattaa aactacagcc 840
caacttacta gagaagtata tacaaacgca ttggggacag tacatccgca cccaagtttt 900
acaagtacga cttggtataa taataatgca ccttcgtttt ctgccataga ggctgccgtt 960
atccgaagcc cgcacctact cgattttcta gaacaagtta caatttacag cttattaagc 1020
cgatggagta acactcagta tatgaatatg tggggaggac ataaactaga attccgaaca 1080
ataggaggaa cgttaaatac ctcaacacaa ggatctacta atacttctat taatcctgta 1140
acattaccgt tcacgtctcg agacatctat aggactgaat cattggcagg gctgaatcta 1200
tttttaactc aacctgttaa tggagtacct agggttgatt ttcattggaa attcgtcaca 1260
catccgatcg catctgataa tttctattat ccagggtatg ctggaattgg gacgcaatta 1320
caggattcag aaaatgaatt accacctgaa gcaacaggac agccaaatta tgaatcttat 1380
agtcatagat tatctcatat aggactcatt tcagcatcac atgtgaaagc attggtatat 1440
tcttggacgc atcgtagtgc agatcgtacg aatacaattc attcagatag tataacacaa 1500
ataccactgg taaaagcaca tacccttcag tcaggtacta ctgttgtaaa agggccaggg 1560
tttacaggtg gagatatcct ccgacgaact agtggaggac catttgcttt tagtaatgtt 1620
aatttagact ggaacttgtc acaaagatat cgtgctagaa tacgctatgc ttctactact 1680
aatctaagaa tgtacgtaac gattgcaggg gaacgaattt ttgctggtca atttaataaa 1740
acaatgaata ctggtgatcc attaacattc caatctttta gttacgcaac tattgataca 1800
gcatttacat tcccaacgaa agcgagcagc ttgactgtag gtgctgatac ttttagctca 1860
ggtaatgaag tttatgtaga tagatttgaa ttgatcccag ttactgcaac acttgaggca 1920
gtaactgatt tagaaagagc gcagaaggcg gttcatgaac tgtttacatc tacgaatccg 1980
ggaggattaa aaacggatgt aaaggattat catattgacc aggtatcaaa tttagtagag 2040
tctctatcag ataaattcta tcttgatgaa aagagagaat tattcgagat agttaaatac 2100
gcgaagcaac tccatattga gcgtaacatg tag 2133
<210> 16
<211> 3507
<212> DNA
<213> 苏云金芽孢杆菌
<400> 16
atggagataa ataatcagaa ccaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtatttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccaggggggg ggtttatttc aggattactt 180
gataaaatat ggggggcttt gagaccatct gattgggaat tatttcttga acagattgaa 240
cagttgattg atcgaagaat agaaagaaca gtaagagcaa aagcaatcgc tgaattagaa 300
ggtttaggga gaagttatca actatatgga gaggcattta aagagtggga aaaaactcca 360
gataacacag cggctcggtc tagagtaact gagagatttc gtataattga tgctcaaatt 420
gaagcaaata tcccttcgtt tcgggtttcc ggatttgaag tgccacttct attggtttat 480
acccaagcag ctaatttgca tctcgctcta ttaagagatt ctgttgtttt tggagagaga 540
tggggattga cgactacaaa tgtcaatgat atctataata gacaagttaa tagaattggt 600
gaatatagca agcattgtgt agatacgtat aaaacagaat tagaacgtct aggatttaga 660
tctatagcgc aatggagaat atataatcag tttagaaggg aattgacact aacggtatta 720
gatattgtcg ctgttttccc gaactatgat agtagactgt atccgattcg aacaatttct 780
caattgacaa gagaaattta tacatcccca gtaagcgaat tttattatgg tgtcattaat 840
agtaataata taattggtac ccttactgaa cagcaaataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggctactaa tactgaggga catcaaaggt cattcccttt agctgggact 1020
atagggaatt cagctccacc agtaactgtt agaaataatg gtgagggaat ttatagaata 1080
ttatcggaac cattttattc agcacctttt ctaggcacaa gtgtgctagg aagtcgtggg 1140
gaagaatttg cttttgcatc taatactact acaagtctgc catctacaat atatagaaat 1200
cgtggaacag tagattcatt agtcagcata ccgccacagg attatagcgt accaccgcac 1260
agggggtata gtcatttatt aagtcacgtt acgatgcgca atagttctcc tatattccac 1320
tggacacatc gtagtgcaac ccctagaaat acaattgatc cagatagtat cactcaaatt 1380
ccagcagtta agggagcgta tatttttaat agtccagtca ttactgggcc aggacataca 1440
ggtggggata taataaggtt taaccctaat actcagaaca acataagaat tccatttcaa 1500
tcaaatgcgg tacagcgtta tcgaattaga atgcgttatg cggcagaagc tgattgtatt 1560
ttagaaagtg gagtaaacat tgttactggg gcaggggtca cctttaggcc aattcctatt 1620
aaagctacaa tgactcctgg aagtccttta acatattaca gcttccagta tgcagattta 1680
aatataaatc ttactgcgcc gataagacct aataattttg tatctattag acgttcaaac 1740
caaccaggaa acctttatat agatagaatt gaattcattc caattgaccc aatccgtgag 1800
gcagaacatg atttagaaag agcgcaaaag gcggtgaatg cgctgtttac ttcttccaat 1860
caaatcgggt taaaaacaga tgtgacggat tatcatattg atcaagtgtc caatttagtt 1920
gcgtgtttat cggataaatt ctgcctggat gaaaagcgag aattgtccga gaaagttaaa 1980
catgcgaagc gactcagtga tgagagaaat ttactccaag atcaaaactt tacaggcatc 2040
aataggcaag tagaccgtgg gtggagagga agtacggata ttaccatcca aggagggaat 2100
gatgtattca aagagaatta cgtcacacta ccaggtacct ttgatgagtg ttacccaacg 2160
tatttgtatc aaaaaataga tgagtcaaaa ttaaaacctt atactcgcta tgaattaaga 2220
gggtatattg aagatagtca agacttagaa gtctatttga tccgttacaa tgcaaaacac 2280
gaaacgttaa atgtgccagg tacgggttcc ttatggccac ttgcagccga aagttcaatc 2340
gggaggtgcg gcgaaccgaa tcgatgcgcg ccacatattg aatggaatcc tgaactagat 2400
tgttcgtgta gggatggaga aaaatgtgca catcattctc atcatttctc cttggatatt 2460
gatgttggat gtacagactt aaatgaggat ttaggtgtat gggtgatatt taagattaag 2520
acgcaagatg gctatgcaag actaggaaat ttagagtttc tcgaagagaa accattgtta 2580
ggagaagcgc tagctcgtgt gaagagagcg gagaaaaaat ggagagacaa acgcgacaaa 2640
ttggaatggg aaacaaatat tgtttataaa gaggcaaaag aatctgtaga tgctttattc 2700
gtagattctc aatataatag attacaaacg gatacgaaca ttgcgatgat tcatgtggca 2760
gataaacgcg ttcatcgaat ccgagaagcg tatttgccag agttatctgt gattccgggt 2820
gtcaatgcgg ctattttcga agaattagaa ggtcttattt tcactgcatt ctccctatat 2880
gatgcgagaa atgtcattaa aaacggagat ttcaatcatg gtttatcatg ctggaacgtg 2940
aaagggcatg tagatgtaga agaacaaaat aaccaccgtt cggtccttgt tgttccggaa 3000
tgggaagcag aagtgtcaca agaagtccgc gtatgtccag gacgtggcta tatcctgcgt 3060
gttacagcgt acaaagaggg ctacggagaa ggatgcgtaa cgatccatga aattgaagat 3120
catacagacg aactgaaatt tagaaactgt gaagaagagg aagtgtatcc gaataacacg 3180
gtaacgtgta atgattatcc agcaaatcaa gaagaataca gggctgcgga aacttcccgt 3240
aatcgtggat atggcgaatc ttatgaaagt aattcttcca taccagctga gtatgcgcca 3300
atttatgaga aagcatatac agatggaaga aaagagaatt cttgtgaatc taacagagga 3360
tatggaaatt acacaccgtt accagcaggt tatgtgacaa aagaattaga gtacttccca 3420
gaaaccgata aggtatggat agagattgga gaaacggaag gaacattcat cgtagacagt 3480
gtggaattac tcctcatgga ggaatag 3507
<210> 17
<211> 3501
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的BT0002
<400> 17
atggagatta acaaccaaaa gcaatgcatc ccatataact gtttgtcgaa cccggaggag 60
gttctgttgg acggtgaaag aatattgccc gacatagatc cgcttgaggt ttctttgagc 120
ttgttgcagt ttctgttgaa caacttcgtt cccggcggag gattcatcag cgggcttgtc 180
gataagatct ggggagcgct gagaccatcg gaatgggact tgttcctggc ccagatcgaa 240
cgccttattg accaaaggat agaagccacg gttcgggcca aggctattgc agaacttgaa 300
ggactcggcc ggtcctatca actgtatgga gaggcattca aagaatggga aaaaacgcct 360
gacaacactg cagccaggtc gagagtgact gagcgcttta ggataatcga cgcacaaatc 420
gaggcaaaca tcccatcgtt ccgcgtctct ggttttgagg tccccctctt gctcgtctat 480
acacaagctg caaatcttca tttggcattg ttgagggact ccgttgtctt cggggagcgc 540
tggggtctta caacaacgaa cgtgaatgat atctacaaca ggcaggtgaa caggattgga 600
gaatactcta atcattgtgt tgacacatac aacacggagc tggagcgcct cggatttcgg 660
agcattgcgc agtggcggat ttacaatcag ttcaggagag agctcacgct gacagtgctg 720
gacatcgtcg ctctctttcc taactatgac tcgcgcctct atcccatcca gaccttttcg 780
cagttgaccc gcgaaatagt cacttcaccc gtgtctgaat tttactacgg cgtcataaat 840
tcagggaaca taaatggaac actgactgag cagcaaatca ggaggcccca tctgatggac 900
ttcttcaatt ccatgattat gtacacatct gacaaccgcc gcgagcatta ttggtcaggc 960
ctggagatga cggcgtactt cacaggtttt gcgggcgcac aggtgtcttt tcctttggtg 1020
gggacgaggg gggagtcagc tcctcctctg acagtccgct cagtgaatga cggcatatat 1080
aggattttga gcgccccttt ctattcggct ccgtttcttg gtactatagt gcttggctca 1140
cggggtgaaa agtttgattt tgcgctgaac aacattagcc cgcctccttc tacaatctac 1200
cggcatccgg gaaccgtcga ttctctcgtg tctattccgc cgcaagataa ctcggtgcca 1260
cctcatcgcg gctcgtccca ccggttgtca cacgttacaa tgagggcttc atccccgatc 1320
ttccactgga ctcatagatc tgccactacg actaatacca tcaatccgaa cgccataata 1380
cagatccccc ttgttaaagc ttttaatctc cactccggtg ccaccgttgt tagagggccg 1440
ggtttcaccg ggggagatat acttagaaga actaataccg gcacattcgc tgatatgagg 1500
gtgaatatta ccgggcccct gtcgcagaga tacagggttc ggatcagata cgcctcaaca 1560
actgatttgc aattttttac acgcatcaat gggacctcgg tgaatcaagg aaatttccag 1620
cggacaatga atagagggga taacttggaa tccgggaact ttcggacggc aggtttctca 1680
actcccttta gcttttccaa cgctcaatct accttcaccc tcgggactca ggcattctct 1740
aatcaggaag tctatataga caggattgaa tttgtgccag cggaagttac gttcgaggct 1800
gagagcgatc tcgaaagagc gcaaaaagca gttaatgctc tgttcacctc cacgaatcaa 1860
ctgggcctga agactgatgt tactgattac cagatcgatc aggtgagcaa tctggtcgaa 1920
tgtctctctg atgaattttg tctcgacgag aaaagggaat tgtcagaaaa ggtcaaacat 1980
gccaaaaggc tgtctgataa gcgcaatttg ctccaagatc ccaattttac aagcattaat 2040
cgccagctcg accgcggctg gcggggttct accgacatta ctatacaggg cgggaacgat 2100
gtcttcaaag aaaactacgt gaccttgccg ggcaccttcg atgaatgtta ccctacttac 2160
ttgtatcaaa agatagacga gtccaaattg aaggcgtaca ctcgctatga attgaggggg 2220
tatatcgaag atagccagga tcttgaagtt tatctcatta gatataatgc taagcatgaa 2280
acagtgaacg ttcccggtac aggttctctt tggccactta gcgtcgaatc gccgataggt 2340
aggtgtggcg agccgaacag atgcgttccc cacatcgagt ggaatcctga cttggattgt 2400
tcctgcaggg acggagagaa atgcgcgcac catagccatc acttttcctt ggacatagat 2460
gttggttgta cagacttgaa cgaggatctt ggtgtttggg tgatttttaa aataaagaca 2520
caggatggac acgcaagact tggcaatctc gaatttctgg aggagaagcc cctgttggga 2580
gaagctctcg ctcgggttaa gcgggcggaa aagaaatgga gagacaagcg ggagcagctc 2640
cagttcgaga cgaatatagt ttataaggag gccaaggaga gcgtggacgc cctctttgtt 2700
gattcccatt acaacagact gcaggccgat actaacatca ctatgattca cgccgcagat 2760
aagagggtcc accggatcag agaagcatac ctgccagaac tctctgtgat accaggggtt 2820
aatgctgata tcttcgaaga gctcgaaggg ctgatcttca cagcattttc actctacgac 2880
gcccgcaaca taataaagaa tggagacttt aataacggtc tgagctgctg gaacgttaaa 2940
ggtcacgttg acatccaaca gaatgaccat cgctctgtgc tcgttgtgcc agaatgggag 3000
agcgaggtgt cccaagaagt ccgcgtctgc ccagggcgcg gttacattct cagagttaca 3060
gcctataagg aaggctacgg cgaggggtgt gttacgatac atgaaatcga ggataatacc 3120
gacgaactca agttctcgaa ctgcatcgag gaagaagttt acccgacgga cactggaaac 3180
gattacaccg ctcatcaagg tacaaccggc tgcgctgacg catgtaactc tcgcaacgtg 3240
gggtatgagg acggctacga aattaatacc accgcttcgg tgaactacaa acccacgtac 3300
gaggaggaga tgtatacgga tgttagacgg gacaatcact gtgagtacga tagaggttac 3360
ggcaaccaca cacctcttcc cgcaggatac gttactaaag aattggagta cttcccagaa 3420
actgatactg tgtggattga gatcggcgaa acggaaggca cattcatcgt ggattccgtg 3480
gaattgctgc tcatggagga a 3501
<210> 18
<211> 2130
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的BT0025
<400> 18
atgaaatcga aaaatcagaa catgcaccaa agcctgtcga acaatgcaac cgtggataag 60
aacttcactg gatcgttgga aaataatacc aatacggagc tgcaaaactt taaccatgaa 120
ggcatcgagc cttttgtgtc agtgagcacg atccagacag gtatcggtat cgccggtaaa 180
attctcggaa atctgggagt gcctttcgcg ggacaagtcg ctagcctgta ttcattcata 240
ctgggtgagc tgtggcccaa aggtaaatcg cagtgggaaa tcttcatgga gcacgttgaa 300
gagcttataa atcaaaagat atccacctac gctcgcaaca aagctctggc cgatttgaaa 360
gggcttggag acgcgctcgc agtgtatcat gaatctctgg agtcatggat aaagaatcgg 420
aataacacga gaacgcggtc tgttgtcaag agccagtaca tcactcttga actcatgttc 480
gtccaatctc tcccgtcctt cgcagtgtcc ggcgaagagg tccctttgct gccgatctat 540
gcacaggcag cgaacctcca cctgcttttg cttcgggatg cgtccatctt tggaaaagag 600
tggggtctta gcgattctga gatatccact ttctataacc ggcaggtgga aaggacctcg 660
gattactccg accactgtac aaaatggttt gacacggggt tgaataggct taaggggtcg 720
aacgccgaaa tctgggttaa gtacaatcaa ttccggagag atatgacact tatggttctc 780
gatctcgtcg cgcttttcca gtcctacgac actcacatgt accctataaa gaccacagcg 840
cagttgacac gggaggtgta tactaatgct ctcgggacgg ttcaccccca tccctctttc 900
actagcacca cttggtataa taataatgcg ccctcatttt ctgcgataga ggccgcagtc 960
atacggagcc cacatctctt ggattttctg gagcaagtca cgatatattc gctcctctct 1020
cgctggtcaa acacacaata tatgaatatg tggggcggtc ataagctgga gtttagaact 1080
attggaggta cgctcaatac gtccacccag ggatcgacaa acacctccat aaaccccgtt 1140
acgctcccat tcacgtctag agacatatat cggactgaga gcctcgccgg cctcaacctc 1200
tttctgacgc aacccgtgaa cggggtccca cgcgttgatt tccactggaa attcgtgaca 1260
catccgattg cgtcagacaa tttctattac cctgggtacg cgggaatcgg cacgcaactg 1320
caggattcgg agaacgaact tcctccggag gcgacagggc agcccaatta tgaaagctac 1380
agccatcggc tgagccacat cggtctcatc tccgcctctc atgttaaggc gttggtgtat 1440
tcatggacgc acagatccgc agaccggacc aacacgatcc actcggactc gataacccag 1500
attccgctcg ttaaggccca cactctccag agcggaacta ctgtcgtcaa agggccaggg 1560
ttcaccggag gggatatact gaggagaact agcggtggac cgttcgcttt cagcaacgtc 1620
aatctcgact ggaatctctc acagagatac cgcgctcgca taagatatgc ctccaccacg 1680
aatctccgga tgtacgtcac cattgcggga gagcgcatct ttgctggtca gtttaacaag 1740
acaatgaaca ctggcgatcc actgaccttt caatccttct catatgccac aattgacacg 1800
gcgttcacct ttccgaccaa ggcttccagc cttacggttg gtgcggacac cttttctagc 1860
ggcaatgagg tttacgtgga ccgcttcgag ttgattcccg ttaccgctac tctcgaagca 1920
gtgactgatt tggagcgcgc gcaaaaggcg gtgcatgaac ttttcacgag caccaatcct 1980
ggcggcctta aaacggatgt caaagattat catatagacc aggtgtctaa cctggttgag 2040
tcactctcgg ataagtttta tttggatgaa aagcgggaac tttttgagat cgtgaagtac 2100
gctaaacagc tccatatcga acggaatatg 2130
<210> 19
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的BT0053
<400> 19
atggagatta acaaccagaa ccaatgcata ccttataact gtttgagcaa cccagaagaa 60
gtgttccttg atggggagcg gatactcccc gacatagacc cgctcgaagt cagcttgagc 120
ttgttgcaat tccttctgaa taacttcgtg cctggcgggg gcttcatatc tggtcttctg 180
gataagatct ggggggccct tagaccgagc gattgggaac tcttcctgga gcagatcgag 240
cagctcatag acagaaggat tgagagaact gtgagggcta aagcaattgc agagctggaa 300
ggtttgggca ggagctacca gttgtacggc gaggcgttca aggaatggga aaaaacaccg 360
gataacacag ctgcccggtc cagagttacg gagaggttcc ggataattga cgctcagatt 420
gaagctaaca taccatcttt tcgcgtgtct ggattcgagg ttcctctgct gcttgtttat 480
acccaagccg ctaatctgca ccttgctctc ttgagggata gcgtcgtgtt cggcgagcgg 540
tggggtttga ccacgaccaa tgtgaatgat atttataatc ggcaggtgaa tcggatcggc 600
gagtactcaa aacattgtgt cgacacgtat aaaacagagc tcgaacgcct tggattccgc 660
agcatagctc agtggaggat ttacaatcag tttcggagag agctcacatt gaccgtcctt 720
gatatagtgg ccgtctttcc caactatgat tctcggctct atcccatccg gactatatca 780
cagcttacca gagagattta tacctcgcct gtctcagaat tttattatgg agtcattaac 840
tctaacaaca taataggaac cctgactgaa cagcagatca gaaggcctca tctgatggac 900
tttttcaact cgatgataat gtatacatcc gacaacaggc gcgagcacta ctggtcgggc 960
ctcgaaatga cagctaccaa cactgaggga catcaacgga gctttccgct tgccggtacc 1020
ataggcaaca gcgctccgcc ggttacagtc cggaacaacg gagaaggaat ataccgcatc 1080
ctcagcgagc cgttctactc tgcacccttt ttggggactt cggtgctggg tagccgcggg 1140
gaggaatttg cattcgcgtc gaatacgaca acgtccttgc catcaactat atacaggaac 1200
cggggcaccg ttgatagctt ggtgtctata ccaccccagg attactcggt cccccctcat 1260
cggggatatt cacacttgct cagccacgtc acgatgagga actcatcgcc catcttccat 1320
tggactcacc ggtcagcaac acctaggaat acgatcgacc cagattcgat tacccagata 1380
cctgctgtta agggggcata catcttcaac agcccagtca taaccggacc cggccacact 1440
ggaggtgata ttatcaggtt caatcccaat acgcagaata acatcaggat accgttccaa 1500
agcaatgctg tgcagagata tcgcatccgg atgcggtacg cagccgaggc tgactgtatc 1560
cttgaatcgg gcgtgaacat tgttaccgga gccggtgtta cattccgccc gatcccgata 1620
aaagctacga tgactcctgg ttctccattg acttactatt cttttcagta tgccgatctc 1680
aatataaacc tcactgcccc catacgcccg aacaattttg tttccatacg caggtctaac 1740
caacctggga acctctatat cgaccgcatc gaattcattc ctatagatcc catcagggaa 1800
gccgaacacg accttgaacg cgctcagaaa gccgtcaatg cgctttttac gtcgtccaat 1860
caaattggtc tcaaaaccga cgttaccgac taccacatcg atcaagtgtc aaaccttgtc 1920
gcttgcttgt cagataagtt ctgcctcgat gaaaaaaggg agctttcgga aaaagttaag 1980
catgctaaac gcctgtcgga cgaacgcaac ctgctgcagg atcagaattt caccgggatt 2040
aataggcagg tggatagagg ctggcgcggc tccacagaca tcacaatcca aggggggaat 2100
gatgtcttta aggaaaacta cgtcacgttg ccaggaacgt tcgatgagtg ctaccctacg 2160
tatctttacc agaagattga tgaatcgaaa ttgaagccct atactaggta cgagcttcgc 2220
gggtatattg aggatagcca ggaccttgag gtttacctta taaggtacaa cgcgaaacac 2280
gagacgctta acgtgccagg gacaggttct ttgtggcccc tcgccgcaga gtcgtctata 2340
ggccggtgcg gtgaaccaaa ccggtgcgct cctcacattg agtggaatcc ggagctggac 2400
tgtagctgta gggacggaga aaagtgtgcc catcactcgc atcacttttc cctggacata 2460
gacgttgggt gtactgatct taacgaagac cttggagttt gggtgatatt caagatcaag 2520
actcaggatg gctatgctag gctcgggaac ttggagtttc tcgaggagaa acccctcctc 2580
ggggaggctc ttgctagagt caagagagcg gaaaaaaaat ggcgcgataa acgcgacaag 2640
ttggagtggg agacgaacat cgtctacaaa gaagctaaag aatcagtgga cgcccttttt 2700
gtggactctc aatataaccg cctccaaact gacactaaca tcgctatgat tcacgtggcc 2760
gataagcggg tgcataggat aagagaagcg tatttgcccg agctgtcagt tatccctggg 2820
gtgaacgctg caattttcga ggaactggaa ggtctgatat ttaccgcatt ttctctctat 2880
gacgcgcgga atgttattaa gaacggcgat ttcaaccacg gattgtcatg ttggaacgtc 2940
aagggccatg tggatgtcga agaacagaac aaccacagaa gcgttcttgt cgttccggag 3000
tgggaagctg aggtgagcca agaggtccgc gtctgccctg gacgggggta tattttgcgg 3060
gtcaccgctt ataaagaggg gtacggagag gggtgtgtca cgatccacga gattgaagac 3120
cacacagacg agcttaaatt cagaaattgt gaggaagaag aggtctaccc aaataacacc 3180
gttacatgca acgattatcc cgctaatcag gaggaatatc gcgccgcaga aacgagcaga 3240
aatcgcgggt acggcgaatc atacgagtcc aattcttcta tacccgctga atacgcccct 3300
atttatgaga aggcttacac agacgggcgg aaggaaaata gctgcgagtc taataggggg 3360
tacgggaatt acacaccact tccggcaggg tacgttacga aggaactgga gtattttccg 3420
gaaaccgata aggtttggat cgagattggc gagacagaag gaacttttat cgttgactcc 3480
gtcgaacttt tgcttatgga agag 3504
<210> 20
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的变体BT0002
<400> 20
atggagatta acaatcagaa gcagtgcatc ccctacaact gcctgtccaa tccggaggag 60
gtgctcctgg acggcgagcg catcctccct gacattgatc cgctggaggt ctcactctcc 120
ctcctgcagt tcctcctgaa caatttcgtt cccggcgggg gcttcatttc ggggctggtg 180
gacaagatct ggggcgcgct caggccatcc gagtgggatc tcttcctggc tcagatcgag 240
aggctcattg accagaggat cgaggctacc gtgcgcgcta aggccatcgc tgagctggag 300
gggctgggca ggtcctacca gctgtacggc gaggcgttca aggagtggga gaagaccccg 360
gataacaccg cggccaggag cagggtcacg gagcgcttca ggatcattga cgcccagatt 420
gaggcgaaca tccccagctt cagggtgtcg ggcttcgagg tcccactcct gctcgtttac 480
acccaggctg ctaacctcca cctggctctg ctccgcgata gcgtggtctt cggcgagcgc 540
tgggggctca ccacgacaaa cgtgaatgac atctacaacc ggcaggtcaa tcgcatcggc 600
gagtactcta accactgcgt ggacacttac aataccgagc tggagaggct gggcttccgg 660
tcaattgctc agtggcgcat ctacaaccag ttccgcaggg agctgaccct gacggtcctg 720
gatatcgttg ccctcttccc caactacgac tcgcggctgt acccaattca gactttctct 780
cagctcaccc gcgagatcgt gacgtctcct gtctcagagt tctactacgg cgtcattaac 840
tccggcaaca tcaatgggac actgactgag cagcagattc ggcgcccgca cctcatggat 900
ttcttcaact caatgatcat gtacacctcc gacaataggc gggagcatta ctggtcgggc 960
ctcgagatga cggcgtactt cacgggcttc gcgggggcgc aggtgtcttt ccccctggtg 1020
ggcacacgcg gggagtctgc gccgcccctc actgtgcggt cagtcaacga cggcatctac 1080
cgcattctgt cggctccctt ctactctgcc ccattcctgg gcaccatcgt gctgggctcc 1140
cgcggcgaga agttcgactt cgccctgaac aatatttctc cacctccgtc aaccatctac 1200
cgccaccctg gcacggttga ttccctcgtg agcatcccgc cgcaggacaa ctcggtccct 1260
ccgcataggg gctccagcca caggctgtct catgttacca tgagggcgtc gtctccgatc 1320
ttccactgga cccatcggag cgccactacc acgaatacaa tcaaccctaa tgcgatcatt 1380
cagatcccgc tggtcaaggc gttcaacctc cactccggcg ctacggttgt gagggggccc 1440
ggcttcaccg gcggcgacat cctgcgcagg accaacacgg ggacattcgc ggacatgcgg 1500
gtgaatatta ccggcccact gagccagcgc taccgcgtgc gcatccgcta cgctagcaca 1560
actgacctcc agttcttcac acgcatcaac ggcacttccg tgaaccaggg gaatttccag 1620
cgcacgatga acaggggcga caatctcgag tcagggaact tcaggaccgc cggcttctcc 1680
acgcctttca gcttctcgaa tgctcagagc actttcaccc tgggcaccca ggccttctcg 1740
aaccaggagg tctacatcga tcgcattgag ttcgtcccgg cggaggttac gttcgaggct 1800
gagtctgacc tggagagggc ccagaaggcg gtgaacgctc tcttcacgtc aacaaatcag 1860
ctcggcctga agacggacgt cacagattac cagatcgacc aggtgagcaa cctggtcgag 1920
tgcctctcgg acgagttctg cctggatgag aagcgggagc tgtctgagaa ggtgaagcac 1980
gcgaagcggc tgtcagacaa gcgcaacctg ctccaggacc cgaacttcac ctcaatcaat 2040
aggcagctgg acaggggctg gagggggtcc actgatatca ccattcaggg cggcaacgac 2100
gtcttcaagg agaattacgt tacgctgcct ggcacattcg atgagtgcta cccgacatac 2160
ctctaccaga agatcgacga gtcaaagctg aaggcctaca ctcggtacga gctgcgcgga 2220
tacatcgagg actcccagga tctggaggtg tacctcatcc gctacaacgc gaagcacgag 2280
acagtgaatg tgccggggac tggctccctc tggccactgt cggttgagtc tccaattggc 2340
cggtgcgggg agcctaacag gtgcgtgccc catatcgagt ggaatccaga cctggattgc 2400
tcctgcaggg acggcgagaa gtgcgctcac cattcccacc atttcagcct cgacatcgat 2460
gtcgggtgca cagacctgaa cgaggatctc ggcgtttggg tcatcttcaa gatcaagacc 2520
caggacggcc acgctaggct ggggaacctg gagttcctgg aggagaagcc cctgctgggc 2580
gaggctctgg ctagggtgaa gagggcggag aagaagtggc gcgacaagag ggagcagctc 2640
cagttcgaga ccaacatcgt ctacaaggag gccaaggagt ccgttgacgc gctgttcgtg 2700
gatagccact acaacaggct ccaggcggat acgaatatca caatgattca cgcggctgac 2760
aagcgggtgc atcgcattag ggaggcctac ctgcctgagc tgtcggttat tccgggcgtg 2820
aacgcggaca tcttcgagga gctggagggc ctcatcttca ccgctttctc tctgtacgat 2880
gccaggaaca tcattaagaa tggcgacttc aacaatgggc tcagctgctg gaacgtcaag 2940
ggccacgttg acatccagca gaatgatcat cgctcggtcc tcgtcgttcc tgagtgggag 3000
tcagaggttt cccaggaggt cagggtttgc cccgggaggg gatacatcct gcgcgttacc 3060
gcctacaagg aggggtacgg cgaggggtgc gtgacaatcc acgagattga ggacaacact 3120
gatgagctga agttctccaa ttgcatcgag gaggaggtgt acccgactga caccggcaac 3180
gattacaccg ctcatcaggg caccaccggg tgcgccgatg cttgcaactc caggaatgtc 3240
ggctacgagg acgggtacga gatcaacaca actgcgagcg tgaattacaa gcccacatac 3300
gaggaggaga tgtacactga cgtccggcgc gataaccact gcgagtacga ccgcggctac 3360
gggaatcata ccccgctccc agcgggctac gtgaccaagg agctggagta cttcccagag 3420
acggatacag tctggctcga gattggcgag actgagggga ccttcatcgt tgacagcgtg 3480
gagctgatcc tgatggagga gtga 3504
<210> 21
<211> 2133
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的变体BT0025
<400> 21
atgaagtcca agaatcagaa catgcatcag tcactctcca acaatgcgac ggtcgacaag 60
aatttcacag gcagcctcga gaacaatacc aacacggagc tgcagaattt caaccacgag 120
ggcatcgagc cgttcgtcag cgtttcgaca attcagactg gcatcgggat tgccggcaag 180
atcctcggca acctcggcgt gccgttcgcc ggccaggttg cttcgctcta ctctttcatc 240
ctgggcgagc tgtggcccaa ggggaagtcg cagtgggaga ttttcatgga gcatgtcgag 300
gagctgatca atcagaagat ttctacgtac gcccgcaaca aggccctggc tgacctcaag 360
ggcctggggg atgctctggc cgtgtaccac gagtcactgg agtcctggat caagaacagg 420
aacaatacaa ggactcgctc cgtggtcaag agccagtaca ttaccctcga gctgatgttc 480
gtgcagtcgc tcccctcctt cgccgtttcc ggcgaggagg tgccgctcct gccaatctac 540
gcccaggctg cgaatctcca tctcctgctc ctgcgcgacg cttctatctt cggcaaggag 600
tgggggctgt ctgattcaga gatttcaacg ttctacaaca ggcaggtcga gcggacatct 660
gactactcag atcactgcac aaagtggttc gacactggcc tcaataggct gaaggggtcc 720
aacgcggaga tctgggtgaa gtacaaccag ttccgcaggg acatgacgct catggttctc 780
gatctggtgg ccctgttcca gagctacgac acccacatgt accccatcaa gaccacggct 840
cagctcaccc gggaggttta cacgaacgcc ctgggcacag tgcacccaca tccttccttc 900
accagcacaa cttggtacaa caataacgct ccgtccttca gcgccatcga ggctgccgtc 960
attaggagcc cccatctcct ggacttcctc gagcaggtta cgatctactc gctcctgtct 1020
cggtggtcaa atacacaata catgaacatg tggggcgggc acaagctcga gttccgcaca 1080
attggcggga ctctgaacac ttcgacgcag ggctctacaa atacttcaat caacccagtc 1140
accctccctt tcacgtcacg cgacatctac aggactgagt ccctggcggg cctcaatctg 1200
ttcctcacgc agcccgttaa cggggtgccc agggtcgact tccactggaa gttcgtgacc 1260
catccaatcg cgagcgataa cttctactac cctggctacg ctggcattgg gacgcagctc 1320
caggactcgg agaatgagct gccgcccgag gctacaggcc agccaaacta cgagtcgtac 1380
tctcaccgcc tctcccatat cggcctgatt tcagcgtccc acgtcaaggc tctcgtttac 1440
agctggaccc atcgctccgc cgaccgcacc aacacgatcc acagcgattc gatcactcag 1500
attccgctcg tgaaggctca caccctgcag tcgggcacca ccgttgtgaa gggcccaggg 1560
ttcactggcg gggacatcct gaggcgcacc tcgggcgggc ctttcgcgtt ctctaatgtt 1620
aacctcgatt ggaatctgtc ccagcgctac cgcgcccgca tccgctacgc ctccacaact 1680
aacctcagga tgtatgtgac catcgcgggc gagcggattt tcgctgggca gttcaataag 1740
accatgaaca cgggcgaccc actgacgttc cagtctttct catacgctac aatcgatact 1800
gccttcacct tccctaccaa ggcctccagc ctcactgtgg gcgccgacac cttctcgtct 1860
gggaacgagg tctacgtgga taggttcgag ctgatcccgg tgacagccac gctggaggcc 1920
gtcacggacc tggagcgggc tcagaaggcg gtgcatgagc tgttcacctc cacgaatcca 1980
ggcggcctga agaccgacgt caaggattac cacctcgatc aggtgagcaa cctcgtcgag 2040
tccctgagcg acaagttcta cctcgatgag aagcgcgagc tgttcgagct cgtgaagtac 2100
gccaagcagc tgcacattga gaggaacatg tga 2133
<210> 22
<211> 3507
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的变体BT0053
<400> 22
atggcgatta acaatcagaa ccagtgcatc ccatacaact gcctgtccaa tcctgaggag 60
gtgttcctgg acggcgagcg catcctcccg gacattgatc ccctggaggt gtctctctca 120
ctcctgcagt tcctcctgaa caatttcgtc ccaggcgggg gcttcatttc gggcctcctg 180
gacaagatct ggggcgccct caggccttcg gattgggagc tgttcctcga gcagatcgag 240
cagctcattg acaggaggat cgagcgcacc gtcagggcta aggccatcgc tgagctggag 300
gggctgggcc gctcttacca gctctacggc gaggcgttca aggagtggga gaagacgccc 360
gacaacacgg cggccaggtc aagggtgacg gagcgcttca ggatcattga tgcccagatt 420
gaggcgaaca tcccgtcctt ccgcgtgagc ggcttcgagg tccccctcct gctcgtttac 480
acgcaggctg ccaacctcca tctggccctg ctccgggact cggtggtgtt cggcgagagg 540
tgggggctca ccaccacaaa cgtcaatgat atctacaacc ggcaggttaa tcgcatcggc 600
gagtactcaa agcactgcgt cgacacttac aagaccgagc tggagaggct gggcttccgg 660
tccattgcgc agtggaggat ctacaaccag ttccggcgcg agctgacact gactgtgctc 720
gacatcgtcg ctgttttccc aaactacgat tcccggctgt accctatccg cacgattagc 780
cagctcacac gcgagatcta cacttcccca gttagcgagt tctactacgg cgtgatcaac 840
tccaacaata tcattggcac cctcacggag cagcagatta ggcggcctca cctcatggac 900
ttcttcaact cgatgatcat gtacacctct gataatcgca gggagcacta ctggagcggc 960
ctggagatga cagccactaa caccgagggg catcagcgct ccttcccact ggccggcacc 1020
atcgggaatt ctgctccgcc cgtgaccgtg cgcaacaatg gggagggcat ctacaggatt 1080
ctgtccgagc cattctactc ggcccctttc ctgggcacgt cggtcctggg ctctcgcggg 1140
gaggagttcg ctttcgcgtc gaacactacc acgtcgctgc catctacaat ctacaggaat 1200
cgcggcactg tggactcact cgtctccatc ccacctcagg attactctgt tccgccccac 1260
aggggctact cacacctgct ctcccatgtg acaatgcgca actccagccc gatcttccac 1320
tggactcata ggagcgccac gccacggaat acaatcgacc ctgattcgat cacacagatt 1380
cccgctgtga agggcgccta cattttcaac tcgccggtca tcaccgggcc cggccacacc 1440
ggcggcgaca tcattcgctt caacccaaat acgcagaaca atatcaggat tcctttccag 1500
tccaacgcgg tccagcgcta ccgcatccgc atgcgctacg cggctgaggc tgactgcatt 1560
ctggagagcg gcgttaacat cgtgacaggg gctggcgtga ctttccgccc aatccctatt 1620
aaggccacga tgacaccagg ctcacctctc acctactact ccttccagta cgccgacctg 1680
aacattaatc tcacggcgcc gatccgcccc aacaatttcg tgagcatcag gaggtccaac 1740
cagcccggca atctgtacat cgacaggatt gagttcatcc caattgatcc tatcagggag 1800
gccgagcacg acctcgagcg cgcgcagaag gctgtcaacg ccctgttcac ctcgtctaat 1860
cagattggcc tcaagacgga cgtgacagat taccatatcg accaggttag caacctggtg 1920
gcctgcctct cggacaagtt ctgcctggat gagaagaggg agctgtcaga gaaggtcaag 1980
cacgcgaagc gcctgtccga cgagaggaac ctgctccagg atcagaattt cacgggcatc 2040
aacaggcagg tggatagggg ctggaggggg agcactgaca tcaccattca gggcggcaac 2100
gatgtcttca aggagaatta cgttactctg ccgggcacct tcgacgagtg ctaccccaca 2160
tacctctacc agaagatcga tgagtcgaag ctgaagccgt acactcgcta cgagctgagg 2220
ggatacatcg aggactctca ggatctggag gtctacctca tccgctacaa cgccaagcat 2280
gagaccctca atgtgcccgg gacgggcagc ctctggccgc tggcggccga gtcatccatc 2340
ggcaggtgcg gggagccaaa caggtgcgcc cctcacatcg agtggaatcc ggagctggac 2400
tgctcgtgca gggatggcga gaagtgcgcg caccattctc accatttctc actcgacatc 2460
gatgtgggct gcaccgacct gaacgaggat ctcggggttt gggtcatctt caagatcaag 2520
acccaggacg gctacgctag gctggggaac ctggagttcc tggaggagaa gccgctgctg 2580
ggcgaggctc tggctagggt caagagggcg gagaagaagt ggcgcgacaa gagggataag 2640
ctcgagtggg agaccaacat cgtgtacaag gaggccaagg agtctgtgga cgcgctgttc 2700
gtcgattcac agtacaacag gctccagact gacaccaata tcgcgatgat tcacgttgct 2760
gataagcggg tgcatcgcat ccgcgaggct tacctgcccg agctgtccgt cattcccggc 2820
gttaacgctg ccatcttcga ggagctggag gggctcatct tcaccgcttt cagcctgtac 2880
gacgccagga acgtcatcaa gaatggcgat ttcaaccacg ggctctcgtg ctggaacgtg 2940
aagggccacg tcgacgttga ggagcagaac aatcatcgct ctgttctggt tgtgccggag 3000
tgggaggctg aggtgtcaca ggaggtgcgg gtctgcccgg ggaggggata catcctcagg 3060
gtcaccgcct acaaggaggg gtacggcgag gggtgcgtta ccatccacga gattgaggac 3120
catacggatg agctgaagtt ccggaactgc gaggaggagg aggtgtaccc aaacaatacg 3180
gtcacatgca atgactaccc ggccaaccag gaggagtaca gggccgctga gacatccagg 3240
aacaggggct acggggagag ctacgagtcg aatagctcga ttccggcgga gtacgctccc 3300
atctacgaga aggcctacac tgacggcagg aaggagaatt cttgcgagtc aaaccggggc 3360
tacgggaatt acacaccgct gcccgcgggc tacgtcacta aggagctgga gtacttcccg 3420
gagaccgaca aggtttggat cgagattggc gagacggagg ggacattcct cgtcgatagc 3480
gttgagctgc tcctgatgga ggagtga 3507
<210> 23
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋3 BT0002的合成序列
<400> 23
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcac tgaattagaa 300
ggtttaggga gaaattatca aatatatgca gaggcattta aagagtggga aagtgatcca 360
gataacacag cggctcggtc tagagtaact gagagatttc gtataattga tgctcaaatt 420
gaagcaaata tcccttcgtt tcgggtttcc ggatttgaag tgccacttct attggtttat 480
acccaagcag ctaatttgca tctcgctcta ttaagagatt ctgttgtttt tggagagaga 540
tggggattga cgactacaaa tgtcaatgat atctataata gacaagttaa tagaattggt 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 24
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋4 BT0002的合成序列
<400> 24
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcgc tgaattagaa 300
ggtttaggga gaagttatca actatatgga gaggcattta aagagtggga aaaaactcca 360
gataacgaag cggctaagtc tagagtaatt gatagatttc gtatattaga tggtttaatt 420
gaagcaaata tcccttcgtt tcggattatc ggatttgaag tgccacttct attggtttat 480
acccaagcag ctaatttgca tctcgctcta ttaagagatt ctgttgtttt tggagagaga 540
tggggattga cgactacaaa tgtcaatgat atctataata gacaagttaa tagaattggt 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 25
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋5/6 BT0002的合成序列
<400> 25
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcgc tgaattagaa 300
ggtttaggga gaagttatca actatatgga gaggcattta aagagtggga aaaaactcca 360
gataacacag cggctcggtc tagagtaact gagagatttc gtataattga tgctcaaatt 420
gaagcaaata tcccttcgtt tcgggtttcc ggatttgaag tgccacttct atcagtttat 480
gttcaagcag ctaatttgca tctcgctcta ttaagagatt ctgttatttt tggagagaga 540
tggggattga cgactaaaaa tgtcaatgat atctataata gacaaataag agaaattcat 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 26
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋3-4 BT0002的合成序列
<400> 26
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcac tgaattagaa 300
ggtttaggga gaaattatca aatatatgca gaggcattta aagagtggga aagtgatcca 360
gataacgaag cggctaagtc tagagtaatt gatagatttc gtatattaga tggtttaatt 420
gaagcaaata tcccttcgtt tcggattatc ggatttgaag tgccacttct attggtttat 480
acccaagcag ctaatttgca tctcgctcta ttaagagatt ctgttgtttt tggagagaga 540
tggggattga cgactacaaa tgtcaatgat atctataata gacaagttaa tagaattggt 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 27
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋4/5/6 BT0002的合成序列
<400> 27
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcgc tgaattagaa 300
ggtttaggga gaagttatca actatatgga gaggcattta aagagtggga aaaaactcca 360
gataacgaag cggctaagtc tagagtaatt gatagatttc gtatattaga tggtttaatt 420
gaagcaaata tcccttcgtt tcggattatc ggatttgaag tgccacttct atcagtttat 480
gttcaagcag ctaatttgca tctcgctcta ttaagagatt ctgttatttt tggagagaga 540
tggggattga cgactaaaaa tgtcaatgat atctataata gacaaataag agaaattcat 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 28
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋3/5/6 BT0002的合成序列
<400> 28
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcac tgaattagaa 300
ggtttaggga gaaattatca aatatatgca gaggcattta aagagtggga aagtgatcca 360
gataacacag cggctcggtc tagagtaact gagagatttc gtataattga tgctcaaatt 420
gaagcaaata tcccttcgtt tcgggtttcc ggatttgaag tgccacttct atcagtttat 480
gttcaagcag ctaatttgca tctcgctcta ttaagagatt ctgttatttt tggagagaga 540
tggggattga cgactaaaaa tgtcaatgat atctataata gacaaataag agaaattcat 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 29
<211> 3504
<212> DNA
<213> 人工序列
<220>
<223> 编码经修饰的α-螺旋3/4/5/6 BT0002的合成序列
<400> 29
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcac tgaattagaa 300
ggtttaggga gaaattatca aatatatgca gaggcattta aagagtggga aagtgatcca 360
gataacgaag cggctaagtc tagagtaatt gatagatttc gtatattaga tggtttaatt 420
gaagcaaata tcccttcgtt tcggattatc ggatttgaag tgccacttct atcagtttat 480
gttcaagcag ctaatttgca tctcgctcta ttaagagatt ctgttatttt tggagagaga 540
tggggattga cgactaaaaa tgtcaatgat atctataata gacaaataag agaaattcat 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taaatggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggcgctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggtgatat ccttcgaaga acgaatactg gcacatttgc agatatgaga 1500
gtaaatatta ctgggccatt atcccaaaga tatcgtgtaa gaattcgcta tgcttctacg 1560
acagatttac aatttttcac gagaatcaat ggaacttctg taaatcaagg taatttccaa 1620
agaactatga atagagggga taatttagaa tctggaaact ttaggactgc aggatttagt 1680
acgcctttta gtttttcaaa tgcgcaaagt acattcacat tgggtactca ggctttttca 1740
aatcaggaag tttatataga tcgaattgaa tttgtcccgg cagaagtaac attcgaggca 1800
gaatctgatt tagaaagagc gcaaaaggcg gtgaatgccc tgtttacttc tacaaaccaa 1860
ctagggctaa aaacagatgt gacggattat cagattgatc aagtgtccaa tttagtagaa 1920
tgtttatcag atgaattttg tctggatgaa aagagagaat tgtccgagaa agtcaaacat 1980
gcaaagcgac ttagtgataa gcggaaccta cttcaagatc caaacttcac atctatcaat 2040
agacaactag accgtggatg gagaggaagt acggatatta ccatccaagg aggaaatgac 2100
gtattcaaag agaattacgt cacactacca ggtacctttg atgagtgtta tccaacgtat 2160
ttgtatcaaa aaatagatga gtcaaaatta aaagcctata ctcgctatga attaagaggg 2220
tatattgaag atagtcaaga tttagaagtc tatttgattc gttacaatgc gaaacatgaa 2280
acagtaaatg ttcccggtac agggtcctta tggccgcttt cagtcgaaag cccaatcgga 2340
aggtgcggag aaccgaatcg atgtgtgcca catattgaat ggaatcctga tttagattgt 2400
tcgtgtaggg atggggagaa gtgtgcccat cattcgcatc atttctctct agatattgat 2460
gttggatgta cagacctaaa tgaggaccta ggtgtatggg tgatctttaa gattaaaacg 2520
caggatggcc atgcaagatt aggaaatcta gagtttctcg aagagaaacc attgttagga 2580
gaagcgttag ctcgtgtgaa aagagcggag aaaaaatgga gagacaaacg cgaacaattg 2640
cagtttgaaa cgaatatcgt ttacaaagag gcaaaagaat ctgtagatgc tttattcgta 2700
gattctcact ataatagatt acaagcggat acgaacatta cgatgattca tgcggcagat 2760
aaacgcgttc atcgaatccg agaggcttat cttccggaat tatccgttat cccaggtgta 2820
aatgcggaca tttttgaaga attagaaggt cttattttca ctgcattctc cctatatgat 2880
gcgagaaata tcattaaaaa cggtgatttc aataatggtt tatcgtgttg gaacgtgaaa 2940
gggcatgtag atatacaaca gaatgatcat cgttctgtcc tcgttgtccc ggaatgggaa 3000
tcagaggtat cacaagaagt ccgcgtatgt ccaggtcgtg gctatattct tcgtgtcaca 3060
gcgtacaaag agggctacgg agaaggatgc gtaacgatcc atgagatcga agacaataca 3120
gacgaattga agtttagtaa ctgcatagaa gaggaagtct atccaacgga tacaggtaat 3180
gattatactg cacaccaagg tacaacagga tgcgcagatg catgtaattc ccgtaatgtt 3240
ggatatgagg atggatatga aataaatact acagcatctg ttaattacaa accgacttat 3300
gaagaagaaa tgtatacaga tgtacgaaga gataatcatt gtgaatatga cagaggatat 3360
gggaaccata caccgttacc agctggttat gtaacaaaag aattagagta cttccctgaa 3420
acagatacag tatggataga gattggagaa acggaaggaa cattcatcgt agatagtgtg 3480
gaattactcc tcatggagga ataa 3504
<210> 30
<211> 9078
<212> DNA
<213> 人工序列
<220>
<223> 在大肠杆菌和苏云金芽孢杆菌中起作用的穿梭载体
<400> 30
agaggccatc gtggcctata tatggcctgg gcgagaagta agtagattgt taacaccctg 60
ggtcaaaaat tgatatttag taaaattagt tgcactttgt gcattttttc ataagatgag 120
tcatatgttt taaattgtag taatgaaaaa cagtattata tcataatcaa ttggtatctt 180
aataaaagag atggaggttt aaacggatcc atgaaatcta agaatcaaaa tatgcatcaa 240
agcttgtcta acaatgcgac agttgataaa aactttacag gttcactaga aaataacaca 300
aatacggaat tacaaaactt taatcatgaa ggtatagagc cgtttgttag tgtatcaaca 360
attcaaacgg gtattggtat tgctggtaaa atccttggta acctaggcgt tccctttgct 420
gggcaagtag ctagcctcta tagttttatc ctaggtgagc tttggcccaa agggaaaagc 480
caatgggaaa tttttatgga acatgtagaa gagcttatta atcaaaagat atcgacttat 540
gcaagaaaca aagcacttgc agatttaaaa ggattaggag atgctttggc tgtctaccat 600
gaatcgctgg aaagttggat taaaaatcgc aataacacaa gaactagaag tgttgtcaag 660
agccaataca ttaccttgga acttatgttc gtacaatcat taccttcttt tgcagtgtct 720
ggagaggaag taccactatt accaatatat gctcaagctg caaatttaca cttgttgcta 780
ttaagagatg cgtctatttt tggaaaagaa tggggattat cagactcaga aatttcgaca 840
ttctataatc gtcaagtgga aagaacatca gattattccg atcattgcac gaaatggttt 900
gatacgggct tgaatagatt aaagggctca aatgctgaaa tctgggtaaa gtataatcaa 960
ttccgtagag acatgacttt aatggtacta gatttagtgg cactattcca aagctatgat 1020
acacatatgt acccaattaa aactacagcc caacttacta gagaagtata tacaaacgca 1080
ttggggacag tacatccgca cccaagtttt acaagtacga cttggtataa taataatgca 1140
ccttcgtttt ctgccataga ggctgccgtt atccgaagcc cgcacctact cgattttcta 1200
gaacaagtta caatttacag cttattaagc cgatggagta acactcagta tatgaatatg 1260
tggggaggac ataaactaga attccgaaca ataggaggaa cgttaaatac ctcaacacaa 1320
ggatctacta atacttctat taatcctgta acattaccgt tcacgtctcg agacatctat 1380
aggactgaat cattggcagg gctgaatcta tttttaactc aacctgttaa tggagtacct 1440
agggttgatt ttcattggaa attcgtcaca catccgatcg catctgataa tttctattat 1500
ccagggtatg ctggaattgg gacgcaatta caggattcag aaaatgaatt accacctgaa 1560
gcaacaggac agccaaatta tgaatcttat agtcatagat tatctcatat aggactcatt 1620
tcagcatcac atgtgaaagc attggtatat tcttggacgc atcgtagtgc agatcgtacg 1680
aatacaattc attcagatag tataacacaa ataccactgg taaaagcaca tacccttcag 1740
tcaggtacta ctgttgtaaa agggccaggg tttacaggtg gagatatcct ccgacgaact 1800
agtggaggac catttgcttt tagtaatgtt aatttagact ggaacttgtc acaaagatat 1860
cgtgctagaa tacgctatgc ttctactact aatctaagaa tgtacgtaac gattgcaggg 1920
gaacgaattt ttgctggtca atttaataaa acaatgaata ctggtgatcc attaacattc 1980
caatctttta gttacgcaac tattgataca gcatttacat tcccaacgaa agcgagcagc 2040
ttgactgtag gtgctgatac ttttagctca ggtaatgaag tttatgtaga tagatttgaa 2100
ttgatcccag ttactgcaac acttgaggca gtaactgatt tagaaagagc gcagaaggcg 2160
gttcatgaac tgtttacatc tacgaatccg ggaggattaa aaacggatgt aaaggattat 2220
catattgacc aggtatcaaa tttagtagag tctctatcag ataaattcta tcttgatgaa 2280
aagagagaat tattcgagat agttaaatac gcgaagcaac tccatattga gcgtaacatg 2340
taggagctcg aattcgtaat catgtcatag ctgtttcctg tgtgaaattg ttatccgctc 2400
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 2460
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 2520
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 2580
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 2640
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 2700
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 2760
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 2820
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 2880
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 2940
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 3000
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 3060
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 3120
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 3180
tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 3240
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 3300
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 3360
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 3420
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 3480
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 3540
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 3600
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 3660
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 3720
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 3780
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 3840
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 3900
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 3960
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 4020
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 4080
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 4140
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 4200
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 4260
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 4320
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 4380
ctcatactct tcctttttca atgtacccca aattccccgt aggcgctagg gacctcttta 4440
gcttcttgga agctgtcagt agtatatcta ataatttatc tccattccct ttagtaacgt 4500
gtaactttcc aaatttaaaa aagcgactca tagaattatt tcctcccgtt aaataataga 4560
taactattaa aaatagacaa tacttgctca taagtaatgg tacttaaatt gtttactttg 4620
gcgtgtttca ttgcttgatg aaactgattt ttagtaaaca gttgacgata ttctcgattg 4680
acccattttg aaacaaagta cgtatatagc ttccaatatt tatctggaac atctgtggta 4740
tggcgggtaa gttttattaa gacactgttt acttttggtt taggatgaaa gcattccgct 4800
ggcagcttaa gcaattgctg aatcgagact tgagtgtgca agagcaaccc tagtgttcgg 4860
tgaatatcca aggtacgctt gtagaatcct tcttcaacaa tcagatagat gtcagacgca 4920
tggctttcaa aaaccacttt tttaataatt tgtgtgctta aatggtaagg aatactccca 4980
acaattttat acctctgttt gttagggaat tgaaactgta gaatatcttg gtgaattaaa 5040
gtgacacgaa tgttcagttt taatttttct gacgataagt tgaatagatg actgtctaat 5100
tcaatagacg ttacctgttt acttatttta gccagtttcg tcgttaaatg ccctttacct 5160
gttccaattt cgtaaacggt atcggtttct tttaaattca attgttttat tatttggttg 5220
agtacttttt cactcgttaa aaagttttga gaatatttta tatttttgtt catgtaatta 5280
ctcctgaagt gattacatct gtaaataaat acagaagtta aacgatttgt ttgtaatttt 5340
agttatctgt ttaaaaagtc ataagattag tcactggtag gaattaatct aacgtattta 5400
tttatctgcg taatcactgt ttttagtctg tttcaaaaca gtagatgttt tatctacatt 5460
acgcatttgg aataccaaca tgacgaatcc ctccttctta attacaaatt tttagcatct 5520
aatttaactt caattcctat tatacacaaa attttaagat actgcactat caacacactc 5580
ttaagtttgc ttcggggatc gatcccacat tagaaataga attggcatca gctaagagtt 5640
gttcagcttc aagaatcttc ctctccaatt gagcgctttt ctcctctagc acagaaactt 5700
tactttctgc ttcttctaat tttctactag cctcgtccat attcttttta gcacgcttat 5760
tagaatatgt aacataagca aacgctgctg taaaaaccgc cgttataatt gccactccaa 5820
tacctactgc tgttaacata ttagatatcg tggtgttcaa aaacgctacc tcatgatcct 5880
gcaatgatat aactttatct tgcaaatcct ttacgacatc agtagatggc gccgctgtaa 5940
atagtatccc cagcatcaat agttccccct gattatataa attcagacga atactattat 6000
ccattatttt tttattaagg taaattaata ttttacctat taaaggaggg acgatttaag 6060
tatggacgtg atgtttggtc aaggtgggaa cataaatttt aattacattg gaacatattg 6120
tggacaagca tctaattcat aatccccact ttccaagcat gaaagtccct tataccatca 6180
attattcaat aaaatatccc tatcataaac ctgtcccgcg cgacggttca aatactcctt 6240
tatgataaaa taaagatata aagagacgag atgagggaga aatttgacgg ctaataaaaa 6300
aaagattgta aataaaccaa ctgttgtggc aaaacttcca caaatcatta tagatacata 6360
taacttgact tgcacttcta acgatgtaaa aatgtttccc ggatttataa agcacgtaaa 6420
gaaacaacat cctggtattt atgaaaaata ttcatcgcac ataaaagata tcgttgaaca 6480
ccccgactat gtcgggcaaa atcctaaaga acctaatagc gttgaattgg taaagatttt 6540
aaatgaccat atactaattg ctataaagtt ggacccaagc ggttatttgt tcttatcaac 6600
tatgttcgat ctaaaaaacg gtcctgcgaa aatccaaaga cgattgaata gtggacgttt 6660
aattgcttac aaagacctgt taagctaacg gggagtttac taaaatataa gaacatggta 6720
tactacctgt agaaagtaac ataataatga tataggatct ttgaggtggg aaaggttccc 6780
cacgcgctta tctaaccgcc gttctcaagc atttgattgg ctaggtaagt taccagagat 6840
gtaggatacg ccgccctacc aacgatccta tgtacggtaa gccatccgtt ttttacggat 6900
ggctttttat attgactttt tcatcgctaa tggttacttt tctatcaaac gacaccgaaa 6960
ggcgatgatt attgtgttaa aaaacccaat attataacat ccactaatgg ataatcttac 7020
ttttagtaag taggttgcct agtgaaatac aataattcca acattgggcc ttaatacata 7080
ttaattagtt ttaaccctct cactataaaa gagttaaata tgactccgca acctctttaa 7140
tatcactatt acattttgta acaacattat tactttcatc ctctgtacca ttaacaaata 7200
aatgaggatt ctttaccata aagtctaaca atagatcaat aaaccgctgc ctttgttctc 7260
tagccatttc ctttctcata gagaaccact cccctatctt tcactattct tttaatttca 7320
tcttgtcttt cacttgattt aaacagctct ggattcttcc tcaatccccc actatcttag 7380
ttaatggtag ttgcttcagt actctacatt ttttgctaat cgaggttaaa atccttcaaa 7440
tcccttgact ttaaggtctt aaggttttca tactggcgag tttgttagga aatctgaatg 7500
tagttttggg catagtaacc cctgttgaaa atttacgagg ttaaaacgcc cactcattcg 7560
tactggctta gatgccgagg tctcgaattg agattggttg cattgacgac aaacggttat 7620
agcttacaaa actactatac cgtccgtata tagcttattg gcattgtatt gcgccgtacg 7680
gtgcgtttct cacgcccaac accgttccct ttcgggtgat tcgctatata acccgcatat 7740
ccttgtaata aagcttgtac aagaatagcc gtgaatcagt gtcatgatcg ccgcttacga 7800
gtaactgttt aactccagtc gcacaatcat gtcttatttt gaacccccaa cactttttgc 7860
cgctaacgtc ttggttatca tcattattag gatttacatc ccgtaggctt gttttatgca 7920
aggcttgtgt cctttacctc gcttacgtca gacagttgaa tgcaacgaca actgatatcc 7980
gagtgtactc tcctgcattg gctacactag accatctttt taaagtggta gcttccactg 8040
gaacggaaca caaaaagggc gttctctata tctaaacgcc ctgtacattt acaagacttc 8100
taggtataga aaacgccctt ttatatccgt tttattatgt atatgacaat gctagtaatt 8160
actagttgaa atattcgtag agtaacggta caataggtgt atctaataag ccttgttcgc 8220
gaaaacaagg caaataactt atttgaggtt ggcgcctctt ataagtcgaa gtcctgtatg 8280
gctgtacagg attaagtcat tctcgctaaa ggttggtagc caatagcata tgagagtggc 8340
ttttttcatt tccgttctat taagttactg ctaattttac cgctatgttt ctattaaatc 8400
aacgaaaatt tgataaggtt caccagaaac attaatattt gcgacataaa actcactctc 8460
caactttgga ggatggatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 8520
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 8580
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 8640
atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg 8700
cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt 8760
cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag 8820
cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 8880
aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 8940
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 9000
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag 9060
cttgcatgcc tgcagtct 9078
<210> 31
<211> 16384
<212> DNA
<213> 人工序列
<220>
<223> 用于Cry蛋白的植物表达的二元载体
<400> 31
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactggcact agcctaacgg tgttgactaa ctaggccgct 180
tccctaatta gctaacccgg gggcgcgccg ggacccctgc agtgcagcgt gacccggtcg 240
tgcccctctc tagagataat gagcattgca tgtctaagtt ataaaaaatt accacatatt 300
ttttttgtca cacttgtttg aagtgcagtt tatctatctt tatacatata tttaaacttt 360
actctacgaa taatataatc tatagtacta caataatatc agtgttttag agaatcatat 420
aaatgaacag ttagacatgg tctaaaggac aattgagtat tttgacaaca ggactctaca 480
gttttatctt tttagtgtgc atgtgttctc cttttttttt gcaaatagct tcacctatat 540
aatacttcat ccattttatt agtacatcca tttagggttt agggttaatg gtttttatag 600
actaattttt ttagtacatc tattttattc tattttagcc tctaaattaa gaaaactaaa 660
actctatttt agttttttta tttaataatt tagatataaa atagaataaa ataaagtgac 720
taaaaattaa acaaataccc tttaagaaat taaaaaaact aaggaaacat ttttcttgtt 780
tcgagtagat aatgccagcc tgttaaacgc cgccgacgag tctaacggac accaaccagc 840
gaaccagcag cgtcgcgtcg ggccaagcga agcagacggc acggcatctc tgtcgctgcc 900
tctggacccc tctcgagagt tccgctccac cgttggactt gctccgctgt cggcatccag 960
aaattgcgtg gcggagcggc agacgtgagc cggcacggca ggcggcctcc tcctcctctc 1020
acggcaccgg cagctacggg ggattccttt cccaccgctc cttcgctttc ccttcctcgc 1080
ccgccgtaat aaatagacac cccctccaca ccctctttcc ccaacctcgt gttgttcgga 1140
gcgcacacac acacaaccag atctccccca aatccacccg tcggcacctc cgcttcaagg 1200
tacgccgctc gtcctccccc cccccccctc tctaccttct ctagatcggc gttccggtcc 1260
atagttaggg cccggtagtt ctacttctgt tcatgtttgt gttagatccg tgtttgtgtt 1320
agatccgtgc tgttagcgtt cgtacacgga tgcgacctgt acgtcagaca cgttctgatt 1380
gctaacttgc cagtgtttct ctttggggaa tcctgggatg gctctagccg ttccgcagac 1440
gggatcgatt tcatgatttt ttttgtttcg ttgcataggg tttggtttgc ccttttcctt 1500
tatttcaata tatgccgtgc acttgtttgt cgggtcatct tttcatgctt ttttttgtct 1560
tggttgtgat gatgtggtct ggttgggcgg tcgttctaga tcggagtaga attctgtttc 1620
aaactacctg gtggatttat taattttgga tctgtatgtg tgtgccatac atattcatag 1680
ttacgaattg aagatgatgg atggaaatat cgatctagga taggtataca tgttgatgcg 1740
ggttttactg atgcatatac agagatgctt tttgttcgct tggttgtgat gatgtggtgt 1800
ggttgggcgg tcgttcattc gttctagatc ggagtagaat actgtttcaa actacctggt 1860
gtatttatta attttggaac tgtatgtgtg tgtcatacat cttcatagtt acgagtttaa 1920
gatggatgga aatatcgatc taggataggt atacatgttg atgtgggttt tactgatgca 1980
tatacatgat ggcatatgca gcatctattc atatgctcta accttgagta cctatctatt 2040
ataataaaca agtatgtttt ataattattt tgatcttgat atacttggat gatggcatat 2100
gcagcagcta tatgtggatt tttttagccc tgccttcata cgctatttat ttgcttggta 2160
ctgtttcttt tgtcgatgct caccctgttg tttggtgtta cttctgcagg gatcctaaac 2220
catggcgatt aacaatcaga accagtgcat cccatacaac tgcctgtcca atcctgagga 2280
ggtgttcctg gacggcgagc gcatcctccc ggacattgat cccctggagg tgtctctctc 2340
actcctgcag ttcctcctga acaatttcgt cccaggcggg ggcttcattt cgggcctcct 2400
ggacaagatc tggggcgccc tcaggccttc ggattgggag ctgttcctcg agcagatcga 2460
gcagctcatt gacaggagga tcgagcgcac cgtcagggct aaggccatcg ctgagctgga 2520
ggggctgggc cgctcttacc agctctacgg cgaggcgttc aaggagtggg agaagacgcc 2580
cgacaacacg gcggccaggt caagggtgac ggagcgcttc aggatcattg atgcccagat 2640
tgaggcgaac atcccgtcct tccgcgtgag cggcttcgag gtccccctcc tgctcgttta 2700
cacgcaggct gccaacctcc atctggccct gctccgggac tcggtggtgt tcggcgagag 2760
gtgggggctc accaccacaa acgtcaatga tatctacaac cggcaggtta atcgcatcgg 2820
cgagtactca aagcactgcg tcgacactta caagaccgag ctggagaggc tgggcttccg 2880
gtccattgcg cagtggagga tctacaacca gttccggcgc gagctgacac tgactgtgct 2940
cgacatcgtc gctgttttcc caaactacga ttcccggctg taccctatcc gcacgattag 3000
ccagctcaca cgcgagatct acacttcccc agttagcgag ttctactacg gcgtgatcaa 3060
ctccaacaat atcattggca ccctcacgga gcagcagatt aggcggcctc acctcatgga 3120
cttcttcaac tcgatgatca tgtacacctc tgataatcgc agggagcact actggagcgg 3180
cctggagatg acagccacta acaccgaggg gcatcagcgc tccttcccac tggccggcac 3240
catcgggaat tctgctccgc ccgtgaccgt gcgcaacaat ggggagggca tctacaggat 3300
tctgtccgag ccattctact cggccccttt cctgggcacg tcggtcctgg gctctcgcgg 3360
ggaggagttc gctttcgcgt cgaacactac cacgtcgctg ccatctacaa tctacaggaa 3420
tcgcggcact gtggactcac tcgtctccat cccacctcag gattactctg ttccgcccca 3480
caggggctac tcacacctgc tctcccatgt gacaatgcgc aactccagcc cgatcttcca 3540
ctggactcat aggagcgcca cgccacggaa tacaatcgac cctgattcga tcacacagat 3600
tcccgctgtg aagggcgcct acattttcaa ctcgccggtc atcaccgggc ccggccacac 3660
cggcggcgac atcattcgct tcaacccaaa tacgcagaac aatatcagga ttcctttcca 3720
gtccaacgcg gtccagcgct accgcatccg catgcgctac gcggctgagg ctgactgcat 3780
tctggagagc ggcgttaaca tcgtgacagg ggctggcgtg actttccgcc caatccctat 3840
taaggccacg atgacaccag gctcacctct cacctactac tccttccagt acgccgacct 3900
gaacattaat ctcacggcgc cgatccgccc caacaatttc gtgagcatca ggaggtccaa 3960
ccagcccggc aatctgtaca tcgacaggat tgagttcatc ccaattgatc ctatcaggga 4020
ggccgagcac gacctcgagc gcgcgcagaa ggctgtcaac gccctgttca cctcgtctaa 4080
tcagattggc ctcaagacgg acgtgacaga ttaccatatc gaccaggtta gcaacctggt 4140
ggcctgcctc tcggacaagt tctgcctgga tgagaagagg gagctgtcag agaaggtcaa 4200
gcacgcgaag cgcctgtccg acgagaggaa cctgctccag gatcagaatt tcacgggcat 4260
caacaggcag gtggataggg gctggagggg gagcactgac atcaccattc agggcggcaa 4320
cgatgtcttc aaggagaatt acgttactct gccgggcacc ttcgacgagt gctaccccac 4380
atacctctac cagaagatcg atgagtcgaa gctgaagccg tacactcgct acgagctgag 4440
gggatacatc gaggactctc aggatctgga ggtctacctc atccgctaca acgccaagca 4500
tgagaccctc aatgtgcccg ggacgggcag cctctggccg ctggcggccg agtcatccat 4560
cggcaggtgc ggggagccaa acaggtgcgc ccctcacatc gagtggaatc cggagctgga 4620
ctgctcgtgc agggatggcg agaagtgcgc gcaccattct caccatttct cactcgacat 4680
cgatgtgggc tgcaccgacc tgaacgagga tctcggggtt tgggtcatct tcaagatcaa 4740
gacccaggac ggctacgcta ggctggggaa cctggagttc ctggaggaga agccgctgct 4800
gggcgaggct ctggctaggg tcaagagggc ggagaagaag tggcgcgaca agagggataa 4860
gctcgagtgg gagaccaaca tcgtgtacaa ggaggccaag gagtctgtgg acgcgctgtt 4920
cgtcgattca cagtacaaca ggctccagac tgacaccaat atcgcgatga ttcacgttgc 4980
tgataagcgg gtgcatcgca tccgcgaggc ttacctgccc gagctgtccg tcattcccgg 5040
cgttaacgct gccatcttcg aggagctgga ggggctcatc ttcaccgctt tcagcctgta 5100
cgacgccagg aacgtcatca agaatggcga tttcaaccac gggctctcgt gctggaacgt 5160
gaagggccac gtcgacgttg aggagcagaa caatcatcgc tctgttctgg ttgtgccgga 5220
gtgggaggct gaggtgtcac aggaggtgcg ggtctgcccg gggaggggat acatcctcag 5280
ggtcaccgcc tacaaggagg ggtacggcga ggggtgcgtt accatccacg agattgagga 5340
ccatacggat gagctgaagt tccggaactg cgaggaggag gaggtgtacc caaacaatac 5400
ggtcacatgc aatgactacc cggccaacca ggaggagtac agggccgctg agacatccag 5460
gaacaggggc tacggggaga gctacgagtc gaatagctcg attccggcgg agtacgctcc 5520
catctacgag aaggcctaca ctgacggcag gaaggagaat tcttgcgagt caaaccgggg 5580
ctacgggaat tacacaccgc tgcccgcggg ctacgtcact aaggagctgg agtacttccc 5640
ggagaccgac aaggtttgga tcgagattgg cgagacggag gggacattcc tcgtcgatag 5700
cgttgagctg ctcctgatgg aggagtgaga gctcgccatc agtcgttgaa gctgctgctg 5760
tatctgggtt atctagtgtc tctgccattg cccaaggatg gtgctgtctt tcaaagtatt 5820
tgtatggttt gtgtcgtgag tcgtgactga gctggtttca tggaccagtt gtgttctcgt 5880
tacccaaaac tatcgtgcga ccgcatatgg cttaatcatg aataaatgtt gtttgaattt 5940
aaactattcg ctgaatattg ttgttttttg tcatgtcagt taatgttact aaattggttg 6000
ccttctaatt tttgtttact ggtgtttgtc gcaccttatc tttttactgt atgtttactt 6060
caggttctgg cagtctcatt ttttgtgact agttaaaact tacagctaaa aaaatgcagt 6120
ttttcatttt catttgaagt ttgattagag ctattgatac ccggaccatc aggttaggtt 6180
agttgtgcat agaatcataa atattaatca tgttttctat gaattaagtc aaacttgaaa 6240
gtctggctga atatagtttc tatgaatcat attgatatac atgtttgatt atttgttttg 6300
ctattagcta tttactttgg tgaatctata taggcttatg cagaaccttt ttttttgttc 6360
tatatatcca tatcctagta ctcagtagct ctatgttttc tggagactag tggcttgctt 6420
tttcgtatgt ctaatttttt gcttgaccat tgcaaaacaa aaattaccta gtgtaatctc 6480
tttttataat aatcttgtaa tgcgtctacc tataggtcaa agtaggtttt gtttggaacc 6540
cttagagcta actgttagct agttgataaa ttattagctg agttaagcta gctaatgaac 6600
tagttttgat attagctgag gatgtttgaa acctaataat tattttttat tagctaacta 6660
tactaaattt tagtagagag attccaaaca ggagttaaca tgggatcaga ttggctatgc 6720
gtttgcaatc ccatactaat tagctaacgg accgcgatcg cttaattaag cttgcatgcc 6780
tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 6840
gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 6900
ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 6960
atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 7020
tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 7080
tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 7140
tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 7200
gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata atttagatat 7260
aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 7320
actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgccgac 7380
gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 7440
ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc caccgttgga 7500
cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg agccggcacg 7560
gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc tttcccaccg 7620
ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 7680
tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 7740
ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc ctctctacct 7800
tctctagatc ggcgttccgg tccatagtta gggcccggta gttctacttc tgttcatgtt 7860
tgtgttagat ccgtgtttgt gttagatccg tgctgttagc gttcgtacac ggatgcgacc 7920
tgtacgtcag acacgttctg attgctaact tgccagtgtt tctctttggg gaatcctggg 7980
atggctctag ccgttccgca gacgggatcg atttcatgat tttttttgtt tcgttgcata 8040
gggtttggtt tgcccttttc ctttatttca atatatgccg tgcacttgtt tgtcgggtca 8100
tcttttcatg cttttttttg tcttggttgt gatgatgtgg tctggttggg cggtcgttct 8160
agatcggagt agaattctgt ttcaaactac ctggtggatt tattaatttt ggatctgtat 8220
gtgtgtgcca tacatattca tagttacgaa ttgaagatga tggatggaaa tatcgatcta 8280
ggataggtat acatgttgat gcgggtttta ctgatgcata tacagagatg ctttttgttc 8340
gcttggttgt gatgatgtgg tgtggttggg cggtcgttca ttcgttctag atcggagtag 8400
aatactgttt caaactacct ggtgtattta ttaattttgg aactgtatgt gtgtgtcata 8460
catcttcata gttacgagtt taagatggat ggaaatatcg atctaggata ggtatacatg 8520
ttgatgtggg ttttactgat gcatatacat gatggcatat gcagcatcta ttcatatgct 8580
ctaaccttga gtacctatct attataataa acaagtatgt tttataatta ttttgatctt 8640
gatatacttg gatgatggca tatgcagcag ctatatgtgg atttttttag ccctgccttc 8700
atacgctatt tatttgcttg gtactgtttc ttttgtcgat gctcaccctg ttgtttggtg 8760
ttacttctgc agggatctcc gatcatgcaa aaactcatta actcagtgca aaactatgcc 8820
tggggcagca aaacggcgtt gactgaactt tatggtatgg aaaatccgtc cagccagccg 8880
atggccgagc tgtggatggg cgcacatccg aaaagcagtt cacgagtgca gaatgccgcc 8940
ggagatatcg tttcactgcg tgatgtgatt gagagtgata aatcgactct gctcggagag 9000
gccgttgcca aacgctttgg cgaactgcct ttcctgttca aagtattatg cgcagcacag 9060
ccactctcca ttcaggttca tccaaacaaa cacaattctg aaatcggttt tgccaaagaa 9120
aatgccgcag gtatcccgat ggatgccgcc gagcgtaact ataaagatcc taaccacaag 9180
ccggagctgg tttttgcgct gacgcctttc cttgcgatga acgcgtttcg tgaattttcc 9240
gagattgtct ccctactcca gccggtcgca ggtgcacatc cggcgattgc tcacttttta 9300
caacagcctg atgccgaacg tttaagcgaa ctgttcgcca gcctgttgaa tatgcagggt 9360
gaagaaaaat cccgcgcgct ggcgatttta aaatcggccc tcgatagcca gcagggtgaa 9420
ccgtggcaaa cgattcgttt aatttctgaa ttttacccgg aagacagcgg tctgttctcc 9480
ccgctattgc tgaatgtggt gaaattgaac cctggcgaag cgatgttcct gttcgctgaa 9540
acaccgcacg cttacctgca aggcgtggcg ctggaagtga tggcaaactc cgataacgtg 9600
ctgcgtgcgg gtctgacgcc taaatacatt gatattccgg aactggttgc caatgtgaaa 9660
ttcgaagcca aaccggctaa ccagttgttg acccagccgg tgaaacaagg tgcagaactg 9720
gacttcccga ttccagtgga tgattttgcc ttctcgctgc atgaccttag tgataaagaa 9780
accaccatta gccagcagag tgccgccatt ttgttctgcg tcgaaggcga tgcaacgttg 9840
tggaaaggtt ctcagcagtt acagcttaaa ccgggtgaat cagcgtttat tgccgccaac 9900
gaatcaccgg tgactgtcaa aggccacggc cgtttagcgc gtgtttacaa caagctgtaa 9960
gagcttactg aaaaaattaa catctcttgc taagctgggt catgggtcgt ttaagctgcc 10020
gatgtgcctg cgtcgtctgg tgccctctct ccatatggag gttgtcaaag tatctgctgt 10080
tcgtgtcatg agtcgtgtca gtgttggttt aataatggac cggttgtgtt gtgtgtgcgt 10140
actacccaga actatgacaa atcatgaata agtttgatgt ttgaaattaa agcctgtgct 10200
cattatgttc tgtctttcag ttgtctccta atatttgcct ccaggtactg gctatctacc 10260
gtttcttact taggaggtgt ttgaatgcac taaaactaat agttagtggc taaaattagt 10320
taaaacatcc aaacaccata gctaatagtt gaactattag ctatttttgg aaaattagtt 10380
aatagtgagg tagttatttg ttagctagct aattcaacta acaattttta gccaactaac 10440
aattagtttc agtgcattca aacaccccct taatgttaac gtggttctat ctaccgtctc 10500
ctaatatatg gttgattgtt cggtttgttg ctatgctatt gggttctgat tgctgctagt 10560
tcttgctgaa tccagaagtt ctcgtagtat agctcagatt catattattt atttgagtga 10620
taagtgatcc aggttattac tatgttagct aggttttttt tacaaggata aattatctgt 10680
gatcataatt cttatgaaag ctttatgttt cctggaggca gtggcatgca atgcatgaca 10740
gcaacttgat cacaccagct gaggtagata cggtaacaag gttcttaaat ctgttcacca 10800
aatcattgga gaacacacat acacattctt gccagtcttg gttagagaaa tttcatgaca 10860
aaatgccaaa gctgtcttga ctcttcactt ttggccatga gtcgtgactt agtttggttt 10920
aatggaccgg ttctcctagc ttgttctact caaaactgtt gttgatgcga ataagttgtg 10980
atggttgatc tctggatttt gttttgctct caatagtgga cgagattaga tagcctgcag 11040
gcccgggggc gcgccctaat tagctaacgg ccaggatcgc cgcgtgagcc tttagcaact 11100
agctagatta attaacgcaa tctgttatta agttgtctaa gcgtcaattt gtttacacca 11160
caatatatcc tgccaccagc cagccaacag ctccccgacc ggcagctcgg cacaaaatca 11220
ccactcgata caggcagccc atcagaatta attctcatgt ttgacagctt atcatcgact 11280
gcacggtgca ccaatgcttc tggcgtcagg cagccatcgg aagctgtggt atggctgtgc 11340
aggtcgtaaa tcactgcata attcgtgtcg ctcaaggcgc actcccgttc tggataatgt 11400
tttttgcgcc gacatcataa cggttctggc aaatattctg aaatgagctg ttgacaatta 11460
atcatccggc tcgtataatg tgtggaattg tgagcggata acaatttcac acaggaaaca 11520
gaccatgagg gaagcgttga tcgccgaagt atcgactcaa ctatcagagg tagttggcgt 11580
catcgagcgc catctcgaac cgacgttgct ggccgtacat ttgtacggct ccgcagtgga 11640
tggcggcctg aagccacaca gtgatattga tttgctggtt acggtgaccg taaggcttga 11700
tgaaacaacg cggcgagctt tgatcaacga ccttttggaa acttcggctt cccctggaga 11760
gagcgagatt ctccgcgctg tagaagtcac cattgttgtg cacgacgaca tcattccgtg 11820
gcgttatcca gctaagcgcg aactgcaatt tggagaatgg cagcgcaatg acattcttgc 11880
aggtatcttc gagccagcca cgatcgacat tgatctggct atcttgctga caaaagcaag 11940
agaacatagc gttgccttgg taggtccagc ggcggaggaa ctctttgatc cggttcctga 12000
acaggatcta tttgaggcgc taaatgaaac cttaacgcta tggaactcgc cgcccgactg 12060
ggctggcgat gagcgaaatg tagtgcttac gttgtcccgc atttggtaca gcgcagtaac 12120
cggcaaaatc gcgccgaagg atgtcgctgc cgactgggca atggagcgcc tgccggccca 12180
gtatcagccc gtcatacttg aagctaggca ggcttatctt ggacaagaag atcgcttggc 12240
ctcgcgcgca gatcagttgg aagaatttgt tcactacgtg aaaggcgaga tcaccaaagt 12300
agtcggcaaa taaagctcta gtggatctcc gtacccaggg atctggctcg cggcggacgc 12360
acgacgccgg ggcgagacca taggcgatct cctaaatcaa tagtagctgt aacctcgaag 12420
cgtttcactt gtaacaacga ttgagaattt ttgtcataaa attgaaatac ttggttcgca 12480
tttttgtcat ccgcggtcag ccgcaattct gacgaactgc ccatttagct ggagatgatt 12540
gtacatcctt cacgtgaaaa tttctcaagc gctgtgaaca agggttcaga ttttagattg 12600
aaaggtgagc cgttgaaaca cgttcttctt gtcgatgacg acgtcgctat gcggcatctt 12660
attattgaat accttacgat ccacgccttc aaagtgaccg cggtagccga cagcacccag 12720
ttcacaagag tactctcttc cgcgacggtc gatgtcgtgg ttgttgatct agatttaggt 12780
cgtgaagatg ggctcgagat cgttcgtaat ctggcggcaa agtctgatat tccaatcata 12840
attatcagtg gcgaccgcct tgaggagacg gataaagttg ttgcactcga gctaggagca 12900
agtgatttta tcgctaagcc gttcagtatc agagagtttc tagcacgcat tcgggttgcc 12960
ttgcgcgtgc gccccaacgt tgtccgctcc aaagaccgac ggtctttttg ttttactgac 13020
tggacactta atctcaggca acgtcgcttg atgtccgaag ctggcggtga ggtgaaactt 13080
acggcaggtg agttcaatct tctcctcgcg tttttagaga aaccccgcga cgttctatcg 13140
cgcgagcaac ttctcattgc cagtcgagta cgcgacgagg aggtttatga caggagtata 13200
gatgttctca ttttgaggct gcgccgcaaa cttgaggcag atccgtcaag ccctcaactg 13260
ataaaaacag caagaggtgc cggttatttc tttgacgcgg acgtgcaggt ttcgcacggg 13320
gggacgatgg cagcctgagc caattcccag atccccgagg aatcggcgtg agcggtcgca 13380
aaccatccgg cccggtacaa atcggcgcgg cgctgggtga tgacctggtg gagaagttga 13440
aggccgcgca ggccgcccag cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt 13500
ggcaagcggc cgctgatcga atccgcaaag aatcccggca accgccggca gccggtgcgc 13560
cgtcgattag gaagccgccc aagggcgacg agcaaccaga ttttttcgtt ccgatgctct 13620
atgacgtggg cacccgcgat agtcgcagca tcatggacgt ggccgttttc cgtctgtcga 13680
agcgtgaccg acgagctggc gaggtgatcc gctacgagct tccagacggg cacgtagagg 13740
tttccgcagg gccggccggc atggccagtg tgtgggatta cgacctggta ctgatggcgg 13800
tttcccatct aaccgaatcc atgaaccgat accgggaagg gaagggagac aagcccggcc 13860
gcgtgttccg tccacacgtt gcggacgtac tcaagttctg ccggcgagcc gatggcggaa 13920
agcagaaaga cgacctggta gaaacctgca ttcggttaaa caccacgcac gttgccatgc 13980
agcgtacgaa gaaggccaag aacggccgcc tggtgacggt atccgagggt gaagccttga 14040
ttagccgcta caagatcgta aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc 14100
tggctgattg gatgtaccgc gagatcacag aaggcaagaa cccggacgtg ctgacggttc 14160
accccgatta ctttttgatc gatcccggca tcggccgttt tctctaccgc ctggcacgcc 14220
gcgccgcagg caaggcagaa gccagatggt tgttcaagac gatctacgaa cgcagtggca 14280
gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc 14340
tgccggagta cgatttgaag gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct 14400
accgcaacct gatcgagggc gaagcatccg ccggttccta atgtacggag cagatgctag 14460
ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt 14520
acattgggaa cccaaagccg tacattggga accggaaccc gtacattggg aacccaaagc 14580
cgtacattgg gaaccggtca cacatgtaag tgactgatat aaaagagaaa aaaggcgatt 14640
tttccgccta aaactcttta aaacttatta aaactcttaa aacccgcctg gcctgtgcat 14700
aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc 14760
gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg 14820
ctggcctacg gccaggcaat ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc 14880
gccggcgctg aggtctgcct cgtgaagaag gtgttgctga ctcataccag gcctgaatcg 14940
ccccatcatc cagccagaaa gtgagggagc cacggttgat gagagctttg ttgtaggtgg 15000
accagttggt gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat 15060
gcgtgatctg atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cgccgtcccg 15120
tcaagtcagc gtaatgctct gccagtgtta caaccaatta accaattctg attagaaaaa 15180
ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt 15240
ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc 15300
aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt 15360
cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg 15420
tgagaatggc aaaagctctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 15480
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 15540
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 15600
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 15660
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 15720
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 15780
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 15840
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 15900
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 15960
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 16020
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 16080
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 16140
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 16200
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 16260
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 16320
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttgatccgga 16380
atta 16384

Claims (11)

1.一种对鳞翅目有害生物有毒的重组Cry蛋白,其中该Cry蛋白由SEQ ID NO:1的氨基酸序列组成。
2.一种由核苷酸序列组成的多核苷酸,该核苷酸序列a)编码根据权利要求1所述的Cry蛋白;或者b)由SEQ ID NO:14和17中任一项组成。
3.一种嵌合基因,该嵌合基因包含可操作地连接至根据权利要求2所述的多核苷酸的在植物或细菌中起作用的异源启动子。
4.根据权利要求3所述的嵌合基因,其中a)该在植物中起作用的异源启动子是泛素、夜香树属黄病毒、玉米TrpA、OsMADS 6、玉蜀黍H3组蛋白、噬菌体T3基因9 5'UTR、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基RuBP羧化酶、水稻肌动蛋白、水稻亲环蛋白、Ti质粒甘露碱合酶、Ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白、凝集素、CaMV 35S或S-E9小亚基RuBP羧化酶启动子;或者b)该在细菌中起作用的异源启动子包含SEQ ID NO:30的核苷酸12-197。
5.一种杀昆虫组合物,该杀昆虫组合物包含根据权利要求1所述的Cry蛋白,其中该组合物包含含有该Cry蛋白的细菌或植物。
6.一种重组载体,该重组载体包含根据权利要求2所述的多核苷酸。
7.一种转基因细菌细胞,该转基因细菌细胞包含根据权利要求6所述的重组载体。
8.一种产生对鳞翅目有害生物有毒的Cry蛋白的方法,该方法包括:将根据权利要求7所述的转基因细菌细胞在该转基因细菌细胞产生该Cry蛋白的条件下进行培养,其中该鳞翅目有害生物选自由以下各项组成的组:欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)。
9.一种产生抗昆虫转基因植物的方法,该方法包括:向植物中引入根据权利要求3所述的嵌合基因,其中使该Cry蛋白在该植物中表达,由此产生抗昆虫转基因植物;其中该昆虫选自由以下各项组成的组:欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)。
10.根据权利要求9所述的方法,其中该引入步骤通过以下实现:a)用该嵌合基因转化该植物;或者b)使包含该嵌合基因的第一植物与不同的第二植物杂交;或者c)基因组编辑预先存在于转基因植物中的嵌合基因。
11.一种控制鳞翅目有害生物的方法,该方法包括向该鳞翅目有害生物或其环境递送组合物,该组合物包含有效量的根据权利要求1所述的Cry蛋白,其中该鳞翅目有害生物选自由以下各项组成的组:欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)和烟夜蛾(烟芽夜蛾)。
CN201780074747.3A 2017-01-04 2017-12-06 用于控制植物有害生物的组合物和方法 Active CN110022676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310905283.3A CN117024535A (zh) 2017-01-04 2017-12-06 用于控制植物有害生物的组合物和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762442155P 2017-01-04 2017-01-04
US62/442,155 2017-01-04
PCT/US2017/064897 WO2018128744A1 (en) 2017-01-04 2017-12-06 Compositions and methods for controlling plant pests

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310905283.3A Division CN117024535A (zh) 2017-01-04 2017-12-06 用于控制植物有害生物的组合物和方法

Publications (2)

Publication Number Publication Date
CN110022676A CN110022676A (zh) 2019-07-16
CN110022676B true CN110022676B (zh) 2023-07-25

Family

ID=62791415

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201780074747.3A Active CN110022676B (zh) 2017-01-04 2017-12-06 用于控制植物有害生物的组合物和方法
CN202310905283.3A Pending CN117024535A (zh) 2017-01-04 2017-12-06 用于控制植物有害生物的组合物和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202310905283.3A Pending CN117024535A (zh) 2017-01-04 2017-12-06 用于控制植物有害生物的组合物和方法

Country Status (12)

Country Link
US (2) US11359209B2 (zh)
EP (1) EP3565404A4 (zh)
CN (2) CN110022676B (zh)
AR (1) AR110667A1 (zh)
BR (1) BR112019013710A2 (zh)
CA (1) CA3044425A1 (zh)
CL (1) CL2019001778A1 (zh)
MX (1) MX2019007704A (zh)
PH (1) PH12019501509A1 (zh)
RU (1) RU2019123825A (zh)
WO (1) WO2018128744A1 (zh)
ZA (1) ZA201904125B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113382634B (zh) * 2019-02-20 2023-09-12 先正达农作物保护股份公司 工程化的杀有害生物蛋白及控制植物有害生物的方法
AR118478A1 (es) * 2019-03-28 2021-10-06 Syngenta Crop Protection Ag Modulación de expresión transgénica

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5322687A (en) * 1993-07-29 1994-06-21 Ecogen Inc. Bacillus thuringiensis cryet4 and cryet5 toxin genes and proteins toxic to lepidopteran insects
CN104673706A (zh) * 2014-12-20 2015-06-03 东北农业大学 苏云金芽胞杆菌fh21、杀虫基因,表达蛋白及其应用
WO2016061208A1 (en) * 2014-10-15 2016-04-21 Pioneer Hi-Bred International Inc Insecticidal polypeptides having broad spectrum activity and uses thereof

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6593293B1 (en) * 1999-09-15 2003-07-15 Monsanto Technology, Llc Lepidopteran-active Bacillus thuringiensis δ-endotoxin compositions and methods of use
ATE421973T1 (de) 1999-12-28 2009-02-15 Bayer Bioscience Nv Inzektizide proteinen von bacillus thuringiensis
RU2013132357A (ru) * 2010-12-13 2015-01-20 Зингента Партисипейшнс Аг Cry1I БЕЛКИ И ГЕНЫ ДЛЯ БОРЬБЫ С НАСЕКОМЫМИ
CN110172466A (zh) * 2013-03-07 2019-08-27 巴斯夫农业解决方案种子美国有限责任公司 毒素基因及其使用方法
EP3715362A1 (en) 2014-10-16 2020-09-30 Monsanto Technology LLC Novel chimeric insecticidal proteins toxic or inhibitory to lepidopteran pests

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5322687A (en) * 1993-07-29 1994-06-21 Ecogen Inc. Bacillus thuringiensis cryet4 and cryet5 toxin genes and proteins toxic to lepidopteran insects
WO2016061208A1 (en) * 2014-10-15 2016-04-21 Pioneer Hi-Bred International Inc Insecticidal polypeptides having broad spectrum activity and uses thereof
CN104673706A (zh) * 2014-12-20 2015-06-03 东北农业大学 苏云金芽胞杆菌fh21、杀虫基因,表达蛋白及其应用

Also Published As

Publication number Publication date
US20220251599A1 (en) 2022-08-11
US11359209B2 (en) 2022-06-14
AR110667A1 (es) 2019-04-17
RU2019123825A (ru) 2021-02-05
CN117024535A (zh) 2023-11-10
US20210261631A1 (en) 2021-08-26
BR112019013710A2 (pt) 2020-03-03
EP3565404A4 (en) 2021-01-20
CA3044425A1 (en) 2018-07-12
PH12019501509A1 (en) 2020-06-29
CL2019001778A1 (es) 2019-10-04
CN110022676A (zh) 2019-07-16
WO2018128744A1 (en) 2018-07-12
ZA201904125B (en) 2021-01-27
MX2019007704A (es) 2019-09-09
EP3565404A1 (en) 2019-11-13

Similar Documents

Publication Publication Date Title
US11578105B2 (en) Compositions and methods for controlling plant pests
CN107849098B (zh) 用于控制植物有害生物的组合物和方法
RU2745322C2 (ru) Композиции и способы контроля вредителей растений
WO2017146899A1 (en) Compositions and methods for controlling plant pests
CA3125438A1 (en) Compositions and methods for controlling insect pests
US20220251599A1 (en) Compositions and Methods for Control of Insect Pests
EP4340618A1 (en) Compositions and methods for controlling insects
RU2741833C2 (ru) Композиции и способы контроля вредителей растений
WO2020050905A1 (en) Compositions and methods for controlling plant pests
WO2022155876A1 (en) Control of noctuid, crambid, and pyralid pests
RU2817591C2 (ru) Сконструированные пестицидные белки и способы контроля вредителей растений
CN114026111A (zh) 用于控制植物有害生物的组合物和方法
WO2023004334A2 (en) Compositions and methods for controlling insects
CN116782768A (zh) 夜蛾科、草螟科和螟蛾科有害生物的控制

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant