CN1918296A

CN1918296A - 来自伯氏致病杆菌的毒素复合物蛋白和基因

Info

Publication number: CN1918296A
Application number: CNA2004800420040A
Authority: CN
Inventors: P·C·阿沛比克侯德; T·D·海伊; J·J·希茨; T·米德; Z·S·李; J·M·里拉; S·M·拉塞尔; R·L·汤普森; J·C·米切尔; K·芬斯尔
Original assignee: Dow AgroSciences LLC
Current assignee: Corteva Agriscience LLC
Priority date: 2004-01-07
Filing date: 2004-12-23
Publication date: 2007-02-21
Also published as: US20100004177A1; WO2005067491A3; CA2551126A1; US7795395B2; US20080058248A1; EP1706491A2; US7285632B2; US20050155104A1; WO2005067491A2; MXPA06007784A; US7585944B2; BRPI0418372A; AR047374A1; AU2004313474A1; EP1706491A4

Abstract

本发明涉及新的致病杆菌毒素复合物(TC)蛋白和编码这些蛋白质的基因。更具体的，本发明涉及得自伯氏致病杆菌ILM104菌株的TC基因和蛋白。

Description

来自伯氏致病杆菌的毒素复合物蛋白和基因

技术领域

昆虫和其他害虫引起的作物损失和控制这些害虫的花费使农民每年损失数十亿美元。由虫害引起的损失在农业生产领域包括作物产量下降、作物质量降低和收获成本提高。虫害对于蔬菜和水果种植者、观赏花卉生产者和家庭园丁和户主也是一种负担。

栽培方法(如轮作和使用高水平的氮肥)部分减轻了由农业害虫引起的问题。然而，农田利用的多种需要限制了轮作的使用。此外，一些昆虫的越冬性特征在一些地区破坏了轮作。

因此，有效水平的控制最依赖合成化学杀虫剂。然而，使用合成化学杀虫剂具有若干缺点。例如，使用这些化学品可能对许多益虫产生不利影响。靶昆虫也已发展出了对一些化学杀虫剂的抗性。另外，雨和杀虫剂使用装置校准不正确可能导致很差的控制。使用杀虫剂经常引起环境问题，如不正确使用时的土壤和供水污染，残留物还可能残留于经处理的水果和蔬菜中。操作一些杀虫剂还可能对使用者造成危害。对使用杀虫剂的新的严格限制和一些有效杀虫剂的消失可能限制了对控制具有破坏性且代价高昂的害虫的有效选择。

用生物杀虫剂取代合成化学杀虫剂或这些物质的组合可以降低环境中有毒化学品的水平。现在成功使用的一些生物杀虫剂来自土壤微生物苏云金芽孢杆菌(Bacillus thuringiensis，(B.t.))。大多数B.t.菌株不表现杀虫活性，但一些B.t.菌株产生对害虫(如昆虫)具有高毒性并且其毒活性具有特异性的蛋白质。已经分离了编码δ-内毒素蛋白的基因。其他芽孢杆菌物种也产生杀虫蛋白质。

Hofte和Whiteley将B.t.晶体蛋白分为四个大类(Hofte，H.，H.R.Whiteley[1989]Mcirobiological Reviews 52(2)：242-255)。这些类别为CryI(鳞翅目特异性)、CryII(鳞翅目和双翅目特异性)、CryIII(鞘翅目特异性)和CryIV(双翅目特异性)。也已报道发现了对其他害虫具有特异毒性的菌株。例如，已经提出以CryV和CryVI命名一类线虫特异性的毒素基因。

Hofte和Whiteley于1989年对晶体蛋白的命名和分类方案是基于推定的氨基酸序列和毒素的活性谱。该系统适于覆盖分为五个主要类别的14种不同类型的毒素基因。随着越来越多的编码具有多种杀虫活性谱的基因被发现，1989年的命名方案已变得难以实行。因此，采用了修订的命名方案，该命名方案只基于氨基酸同一性(Crickmore等1998，Microbiology andMolecular Biology Reviews 62：807-813)。

已经产生并批准使用了基于重组DNA的B.t.产物。另外，使用遗传工程技术完善了多种将这些毒素递送到农业环境的方法。它们包括使用用毒素基因遗传改造以获得昆虫抗性的植物和使用稳定的完整微生物细胞作为毒素递送载体。因此，分离的芽孢杆菌毒素开始具有商业价值。

最初将B.t.蛋白毒素配制成可喷雾的昆虫控制剂。B.t.技术相对较新的应用是分离编码这些毒素的基因并转化植物。接着转基因植物产生毒素，从而提供昆虫控制。参阅Mycogen Corporation的U.S.专利No.5,380,831、5,567,600、5,567,862。转基因B.t.植物相当高效，预测在一些作物和地区中可得到高度应用。

农业上成功的使用芽孢杆菌(及其他生物)杀虫蛋白还存在一些障碍。某些昆虫可以耐受芽孢杆菌毒素的效力。现已证明如棉子象鼻虫、切根虫和美洲棉铃虫(Helicoverpa zea)等昆虫以及多数物种的成虫对许多B.t.δ-内毒素不具有显著的敏感性。

另一个潜在的障碍是昆虫发展出对B.t.毒素的抗性。B.t.植物广泛应用的可能已经引起一些担忧，即可能比传统的喷雾应用更快的出现抗性治理问题。尽管在实验室中已经选择了大量昆虫对B.t.毒素的抗性，但只有菱形斑蛾(Plutella xylostella)已证明在大田环境中具有抗性(Ferre，J.和Van Rie，J.，Annu.Rev.Entomol.47：501-533，2002)。

B.t.转基因植物技术中的抗性治理策略已经引起巨大的关注。已经提出了若干策略来保持有效使用苏云金芽孢杆菌毒素的能力。这些策略包括如带有保护区(refuge)的高剂量、(如天然细菌中)交替使用或共同使用不同的毒素(McGaughey等(1998)，″B.t.Resistance Management，″NatureBiotechnol.16：144-146)。

因此，仍然非常需要发展可以在植物中表达以有效控制多种昆虫的其他基因。除了继续尝试发现新的B.t.毒素以外(由于已经发现了大量B.t.毒素而变得越来越困难)，还非常需要发现产生可用于转基因植物策略的毒素的(不同于B.t.的)其他细菌来源。

最近从光杆状菌(Photorhabdus)/致病杆菌(Xenorhabdus)组细菌中克隆杀虫毒素基因的尝试提出了苏云金芽孢杆菌毒素的潜在替代物。致病杆菌属分类学定义为肠杆菌科成员，尽管其具有该科的某些非典型特征。例如，该属菌株一般为硝酸盐还原阴性和过氧化氢酶阴性。最近刚刚将致病杆菌细分产生第二个属——光杆状菌，其含有三个物种，光杆状菌asymbiotica、光杆状菌temperata和发光光杆状菌(P.luminescens)。发光光杆状菌有三个公认的亚种，发光光杆状菌akhurstii亚种、发光光杆状菌laumondii亚种和发光光杆状菌luminescens亚种(典型种)。(Fischer-LeSaux，M.，Viallard，V.，Brunel，B.，Normand，P.，Boemare，N.E.TitlePolyphasic classification of the genus Photorhabdus and proposal of newtaxa：P.luminescens subsp.luminescens subsp.nov.，P.luminescens subsp.akhurstii subsp.nov.，P.luminescens subsp.laumondii subsp.nov.，P.temperata sp.nov.，P.temperata subsp.temperata subsp.nov.and P.asymbiotica sp.nov.Int.J.Syst.Bacteriol.49；1645-1656，(1999))。这一区分基于本领域技术人员容易鉴定的若干区别特征。这些区别包括：DNA-DNA表征研究、过氧化氢酶活性表型存在(光杆状菌)或不存在(致病杆菌)、生物发光存在(光杆状菌)或不存在(致病杆菌)、宿主线虫的科(致病杆菌发现于斯氏线虫(Steinernematidae)而光杆状菌发现于异小杆线虫(Heterorhabditidae))以及胞内脂肪酸比较分析(Janse等1990，Lett.Appl.Microbiol.10，131-135、Suzuki等1990，J.Gen.Appl.Microbiol.，36，393-401)。另外，最近着眼于16S rRNA基因的序列(Rainey等，1995，Int.J.Syst.Bacteril.，45，379-381)和限制性(Brunel等，1997，App.Environ.Micro.，63，574-580)分析的分子研究也支持这两个属的划分。

致病杆菌的预计特征为：革兰氏染色阴性杆菌、白色到黄色/褐色菌落着色、存在包涵体、无过氧化氢酶、不能还原硝酸盐、无生物发光、能从培养基中摄取染料、阳性明胶水解、在肠杆菌选择性培养基上生长、生长温度低于37℃、在缺氧条件下存活以及活动性。

目前，致病杆菌属细菌包括四个公认的物种，嗜线虫致病杆菌(Xenorhabdus nematophilus)、波氏致病杆菌(Xenorhabdus poinarii)、伯氏致病杆菌(Xenorhabdus bovienii)和贝氏致病杆菌(Xenorhabdusbeddingii)(Brunel等，1997，App.Environ.Micro.，63，574-580)。在文献中已描述了多种相关菌株(如Akhurst和Boemare 1988J.Gen.Microbiol.，134，1835-1845、Boemare等1993 Int.J.Syst.Bacteriol.43，249-255页；Putz等1990，App.Environ.Microbiol.，56，181-186、Brunel等1997，App.Environ.Micro.，63，574-580、Rainey等1995，Int.J.Syst.Bacteriol.，45，379-381)。

光杆状菌和致病杆菌种是与土壤线虫共生的昆虫致病性革兰氏阴性细菌。这些细菌发现于侵袭并杀死昆虫的昆虫致病性线虫的肠中。当线虫侵袭昆虫宿主时，细菌释放到昆虫血腔(开放式循环系统)中，细菌和线虫都进行数轮复制，昆虫宿主一般死亡。可以脱离其线虫宿主培养这些细菌。对于这些细菌更详细的讨论可参阅Forst和Nealson，60 Microbiol.Rev.1(1996)，21-43页。不幸的是，如在许多文章中所报道的，该细菌只在注射到昆虫幼虫时具有杀虫活性，而在经口递送时不表现生物活性。

致病杆菌和光杆状菌细菌向培养基中分泌多种物质。与光杆状菌昆虫毒性相关的多种因子的综述参阅R.H.ffrench-Constant等66 AEM No.8，3310-3329页(2000年8月)。

有效地开发线虫或其细菌共生生物的杀虫特性是困难的。因此，需要具有经口活性的来自光杆状菌/致病杆菌细菌的蛋白质剂，从而其产生的产物可以配制成喷雾杀虫剂，或者可以分离编码所述蛋白质剂的基因并用于产生转基因植物。

从发光光杆状菌和嗜线虫致病杆菌克隆编码杀虫毒素的基因已经取得了显著的进展。首先检查了来自发光光杆状菌的毒素复合物编码基因。参阅WO 98/08932。最近从嗜线虫致病杆菌克隆了平行基因。Morgan等，Applied and Environmental Microbiology 2001，67：20062-69。WO95/00647涉及致病杆菌蛋白毒素控制昆虫的用途，但未识别经口活性毒素。WO 98/08388涉及来自致病杆菌的经口施用杀虫剂。U.S.专利No.6,048,838涉及得自致病杆菌物种和菌株的具有经口活性的蛋白毒素/毒素复合物。

已经在光杆状菌属中鉴定了四种不同的毒素复合物(TC)——Tca、Tcb、Tcc和Tcd。这些毒素复合物每种在天然琼脂糖凝胶上均解离为单体或二聚体类型，但在变性凝胶上的解离显示每个复合物由25-280kDa之间的一系列蛋白质组成。图1中展示了来自光杆状菌的编码典型TC的ORF以及蛋白酶切割位点(竖箭头)。还可参阅R.H.ffrench-Constant和Bowen，57 Cell.Mol.Life Sci.828-833(2000)。

用DNA探针和针对毒素产生的单克隆和/或多克隆抗体筛选了发光光杆状菌的基因组文库。克隆了四个tc基因座：tca、tcb、tcc和tcd。tca基因座是转录自同一DNA链的三个开放读码框(ORF)tcaA、tcaB和tcaC的推定操纵子，带有反方向转录的较小的末端ORF(tcaZ)。tcc基因座还含有推定从同方向转录的三个ORF(tccA、tccB和tccC)。tcb基因座是单独的大ORF(tcbA)，而tcd基因座由两个ORF(tcdA和tcdB)组成，tcbA和tcdA各约为7.5kb，编码大昆虫毒素。TcdB与TcaC具有一定水平的同源性。已经确定许多这些基因产物被蛋白酶切割。例如TcbA和TcdA都被切割成名为i、ii和iii的三个片段(如TcbAi、TcbAii和TcbAiii)。tca和tcc ORF的产物也被切割。参阅图1。还可参阅R.H.ffrench-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12：284-288。

Tca毒素复合物的生物测定显示，在经口给予(每平方厘米人工食物875ng LD₅₀)时，它们对1龄番茄天蛾幼虫(Manduca Sexta)具有高毒性。R.H.ffrench-Constant和Bowen 1999。进食被低至40ng/cm²的Tca剂量所抑制。考虑到所预计Tca的高分子量，发光光杆状菌毒素在摩尔基础上具有高活性，且似乎需要相对较少的分子便可发挥毒效应。R.H.ffrench-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12：284-288。

四个基因座均未与GenBank中已知功能的任何序列显示出总体相似性。序列相似性区域提示这些蛋白质(TcaC和TccA)可能通过攻击昆虫血细胞来克服昆虫免疫系统。R.H.ffrench-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12：284-288。

互相进行比较时，TcaB、TcbA和TcdA在紧靠其预计的蛋白酶切割位点周围均显示出氨基酸保守性(～50％同一性)。三种不同Tc蛋白之间的这一保守性提示它们可能由相同或相似的蛋白酶进行加工。TcbA和TcdA总体上也具有～50％的同一性以及相似的羧基和氨基端预测切割模式。因此认为这些蛋白可能彼此是同源物。另外，TcbA和TcdA相似的大尺寸和两种毒素似乎均在昆虫肠中发挥作用这一事实可以提示相似的作用模式。R.H.ffrench-Constant和D.J.Bowen，Current Opinions inMicrobiology，1999，12：284-288。

缺失/敲除研究提示tca和tcd基因座的产物决定了对鳞翅目主要的经口毒性。缺失tca或tcd基因大幅降低对烟草天蛾的经口活性。即，tca和tcd基因座的产物本身为经口鳞翅目毒素，其组合效应对分泌经口活性的贡献最大。R.H.ffrench-Constant和D.J.Bowen，57Cell.Mol.Life.Sci.831(2000)。有趣的是，单独缺失tcb或tcc基因座也降低了死亡率，提示在不同基因产物间可能存在复杂的相互作用。因此，tca基因座的产物可能增强了tcd产物的毒性。或者，tcd产物可能调控tca产物(和其他复合物(如果可能))的毒性。注意到上文涉及针对单一昆虫物种的经口毒性，tcb或tcc基因座可能产生对其他昆虫群更具活性的毒素(或通过直接注射进昆虫血腔——由细菌在体内分泌时的正常递送途径——发挥活性)。R.H.ffrench-Constant和Bowen，Current Opinions in Microbiology，1999，12：284-288。

昆虫中肠上皮含有柱状(结构)和杯形(分泌)细胞。烟草天蛾摄食tca产物引起柱状细胞顶端肿胀和大细胞质囊泡起泡，导致最终将囊泡中的细胞核挤压进肠腔。杯状细胞也以同一方式受到明显影响。在经口递送或注射后，tca的产物在昆虫中肠发挥作用。R.H.french-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12：284-288。纯化的tca产物已显示出对烟草天蛾的经口毒性(875ng/cm²的LD₅₀)。R.H.french-Constant和D.J.Bowen，57 Cell.Mol. Life Sci.828-833(2000)。

WO 99/42589和U.S.专利No.6,281,413公开了来自发光光杆状菌的TC样ORF。WO 00/30453和WO 00/42855公开了来自致病杆菌的TC样蛋白。WO 99/03328和WO 99/54472(和U.S.专利No.6,174,860和6,277,823)涉及来自致病杆菌和光杆状菌的其他毒素。

尽管目前尚不了解TC相互间确切的分子相互作用及其作用机制，但是已经知道，例如光杆状菌的Tca毒素复合物对烟草天蛾具有毒性。另外，已知一些TC蛋白具有“独立的”杀虫活性，而其他TC蛋白已知可促进或增强独立毒素的活性。已知单独是TcdA蛋白对烟草天蛾具有活性，但是可以与TcdB和TccC共同使用(与TcdA缀合)来大幅增强TcdA的活性。TcbA是来自光杆状菌的另一主要独立毒素。TcdB与TccC样蛋白也可大幅增强该毒素(TcbA)的活性。

光杆状菌TC蛋白	光杆状菌菌株W14命名	同源性
光杆状菌TC蛋白	光杆状菌菌株W14命名	同源性	TcaA	毒素C	TccA
TcaB	TccB		TcaA		TccA
TcaB	TccB	TcaC			TcdB
Tcb	毒素B	TcaC			TcdB

TccA	毒素D	TcdA N端
TccA		TcdA N端	TccB	TcdA C端
TccC			TccB	TcdA C端
TccC	TcdA		毒素A	TccA+TccB
TcdB	TcdA		毒素A	TccA+TccB	TcaC

一些光杆状菌TC蛋白与其他光杆状菌TC蛋白具有一定水平的序列同源性。如上文所指出，TccA与TcdA的N端具有一定水平的同源性，而TccB与TcdA的C端具有一定水平的同源性。另外，TcdA约为280kDa，而TccA与TccB结合后一起与TcdA约为相同的大小。尽管在SCR上TccA和TccB活性远低于TcdA，仍然将来自光杆状菌W14菌株的TccA和TccB称为“毒素D”。上文还标明了“毒素A”(TcdA)、“毒素B”(Tcb或TcbA)和“毒素C”(TcaA和TcaB)。

另外，TcaA与TccA(并类似的与TcdA的N端)具有一定水平的同源性。另外，TcaB与TccB(并类似的与TcdA的N端)具有一定水平的同源性。TcdB与TcaC具有显著水平的相似性。

最近在嗜线虫致病杆菌中克隆的尝试似乎也已鉴定了与发光光杆状菌tc基因座具有同源性的新杀虫毒素基因。参阅如WO 98/08388和Morgan等Applied and Enviromental Mcirobiology 2001，67：20062-69。在R.H.和D.J.Bowen Current Opinions in Micriobiology，1999，12：284-288中，直接筛选粘粒克隆对另一鳞翅目欧洲粉蝶(Pieris brassicae)的经口毒性。测序了一个经口毒性粘粒克隆。该粘粒中的序列分析提示存在与光杆状菌tc基因具有相似性的五个不同的ORF；orf2和orf5与tcbA和tcdA具有一定水平的序列相关性，而orf1与tccB相似，orf3与tccC相似，而orf4与tcaC相似。重要的是，大量这些预测的ORF还共有发光光杆状菌中证明的推定切割位点，提示活性毒素也可能被蛋白水解加工。

存在五种来自致病杆菌的典型TC蛋白：XptA1、XptA2、XptB1、XptC1和XptD1。XptA1为“独立”毒素。XptA2为来自致病杆菌的另一个具有独立毒素活性的TC蛋白。XptB1和XptC1为能增强一种(或两种)XptA毒素活性的致病杆菌增强剂。XptD1与TccB具有一定水平的同源性。

已知XptC1与TcaC具有一定程度的相似性。已知致病杆菌的XptA2蛋白与TcdA蛋白具有一定程度的相似性。XptB1与TccC具有一定水平的相似性。

以这些毒性基因可能的来源来看，在这两种不同细菌中发现具有某些相似性的编码毒素的基因座是很有意义的。嗜线虫致病杆菌粘粒似乎也含有转座酶样序列，其存在可能提示这些基因座能在不同细菌菌株或物种中横向转移。这些转移事件的范围还可以解释两种不同细菌中tc操纵子明显不同的基因组组织。另外，仅有嗜线虫致病杆菌和发光光杆状菌的子集对烟草天蛾表现毒性，提示不同的菌株缺乏tc基因或它们带有不同的tc基因compliment。对两种菌株的详细分析和这些细菌物种之中(和之间)的毒素系统发生可能帮助阐明毒素基因可能的来源以及它们如何在不同的细菌种群中维持。R.H.ffrench-Constant和Bowen，Current Opinions inMicrobiology，1999，12：284-288。

近来已从其他昆虫相关细菌(如昆虫病原体嗜虫沙雷氏菌(Serratiaentomophila))中描述了TC蛋白和基因。Waterfield等TRENDS inMicrobiology，第9卷，No.4，2001年4月。

总而言之，来自发光光杆状菌和嗜线虫致病杆菌的毒素复合物蛋白似乎与先前鉴定的细菌毒素同源性很低，应该能够提供苏云金芽孢杆菌毒素的有用替代物。尽管它们与其他经口活性毒素在昆虫中肠具有相似的毒效应，其精确的作用模式仍不清楚。未来的工作将可能阐明其作用机制。

类芽孢杆菌(Paenibacillus)属细菌通过其独特的rRNA和表型特征区别于其他细菌(C.Ash等(1993)，″Molecular identification group 3bacilli(Ash，Farrow，Wallbanks and Collins)using a PCR probe test：Proposal for the creation of a new genus Paenibacillus”Antonie VanLeeuwenhoek 64：253-260)。已知该属中的一些物种对蜜蜂(幼虫类芽孢杆菌(Paenibacillus larvae))和金龟幼虫(日本金龟类芽孢杆菌(P.popilliae)和患病类芽孢杆菌(P.lentimorbus))具有致病性。幼虫类芽孢杆菌、日本金龟类芽孢杆菌和患病类芽孢杆菌认为是金龟乳样病相关的专性昆虫病原体(A.Balows等编辑，《The Procaryotes》，第二版，第2卷，Springer-Verlag，New York，NY中D.P.Stahly等(1992)，″The genusBacillus：insect pathogens，″1697-1745页)。

已在日本金龟类芽孢杆菌和患病类芽孢杆菌菌株中鉴定了晶体蛋白Cry18。Cry18具有金龟和幼虫毒性，并与Cry2蛋白具有约40％同一性(Zhang等，1997；Harrison等，2000)。

最近已在类芽孢杆菌中发现了TC蛋白和鳞翅目毒Cry蛋白。参阅提交于2002年6月28日的U.S.Serial No.60/392,633(Bintrim等)。

尽管发现一些致病杆菌TC蛋白“对应于”(具有相似的功能和一定水平的序列同源性)一些光杆状菌TC蛋白，但“对应的”蛋白彼此仅共有约40％(近似值)的序列同一性。新近从类芽孢杆菌中发现的TC蛋白也是如此(这些蛋白及其发现为共同未决的U.S.Serial No.60/392,633的主题)。

出于对昆虫发展出对给定杀虫毒素的抗性的考虑以及其他考虑(其中一些在上文已有讨论)，需要继续发现新的杀虫毒素和可用于控制昆虫的其他蛋白质。

发明概述

本发明涉及新的致病杆菌毒素复合物(TC)蛋白质及编码这些蛋白质的基因。更具体地，本发明涉及得自伯氏致病杆菌ILM104菌株的TC蛋白和基因。

附图简述

图1显示来自光杆状菌的TC操纵子。

序列简述

SEQ ID NO：1为天然xptB1_xb编码区(4521个碱基)。

SEQ ID NO：2为SEQ ID NO：1编码的天然XptB1_xb蛋白(1506个氨基酸)。

SEQ ID NO：3为天然xptC1_xb编码区(2889个碱基)。

SEQ ID NO：4为SEQ ID NO：3编码的天然XptC1_xb蛋白(962个氨基酸)。

SEQ ID NO：5为天然xptA1_xb编码区(局部)(3822个碱基)。

SEQ ID NO：6为SEQ ID NO：5(局部)编码的天然XptA1_xb蛋白(1273个氨基酸)。

SEQ ID NO：7为含有天然xptB1_xb编码区的表达质粒pDAB6031的Xba I至Xho I片段(4595个碱基)，其中40到4557碱基编码SEQ ID NO：2的蛋白质。

SEQ ID NO：9为含有天然xptB1_xb和天然xptC1_xb编码区的表达质粒pDAB6033的Xba I至Xho I片段(7508个碱基)，其中40到4557碱基编码SEQ ID NO：2的蛋白质，4601到7486碱基编码SEQ ID NO：4的蛋白质。

SEQ ID NO：10为名为xptA1_xb的新A类基因的全长编码序列。

SEQ ID NO：11为SEQ ID NO：10的读码框编码的蛋白质(XptA1_xb)。

发明详述

本发明涉及新致病杆菌毒素复合物(TC)蛋白质及编码这些蛋白质的基因。更具体地，本发明涉及可得自伯氏致病杆菌ILM104菌株的TC基因和蛋白。

存在三种主要的TC蛋白类型。在本文中，A类蛋白(“A蛋白”)为独立毒素。天然A类蛋白约为280kDa。B类蛋白(“B蛋白”)和C类蛋白(“C蛋白”)增强A类蛋白的毒性。在本文中，天然B蛋白约为170kDa，天然C蛋白约为112kDa。A类蛋白的实例为TcbA、TcdA、XptA1和XptA2。B类蛋白的实例为TcaC、TcdB、XptB1_xb和XptC1_wi。C类蛋白的实例为TccC、XptC1_xb和XptB1_wi。

先前显示(U.S.专利No.6,048,838)致病杆菌ILM104菌株(NRRLB-30021，保藏于1998年4月30日)产生对鞘翅目、鳞翅目、双翅目和螨目昆虫的成员具有经口杀虫活性的胞外蛋白。本文公开了可得自ILM104菌株的两种特异性TC增强剂和一种TC毒素(及它们的编码基因)。

可以将本发明的多核苷酸插入植物基因组，以使植物产生该多核苷酸所编码的蛋白质。从而使以产生(和含有)该蛋白质的植物组织为食的昆虫与蛋白质接触，并以这种方式受到控制。可以以这种方式(即在植物中表达)或其他方式使用TC蛋白基因控制昆虫和其他类似的害虫。优选地，产生表达本发明基因的植物，以使植物细胞中产生(优选存在)一种或多种本发明的蛋白质。可以构建植物以共表达本发明的基因，以使得到的蛋白质促进或增强如XptA1和/或XptA2TC蛋白毒素。

对昆虫或其他害虫施用本发明蛋白质的其他方法为本领域所熟知。另外，本发明蛋白质不限于彼此共同使用，如本领域所共知，它们可以与其他蛋白质(如B.t.毒素)分开(或组合)使用。

蛋白质和毒素

本发明提供易于施用的功能性蛋白质。本发明还提供递送杀虫毒素的方法，所述杀虫毒素对多个目的昆虫(优选鳞翅目昆虫)具有功能活性和效力。在本文中“功能活性”(或“针对……的活性”)指蛋白质毒素(单独或与其他蛋白质组合)发挥经口活性昆虫控制剂的功能、蛋白质(单独或与其他蛋白质组合)具有毒效应或能够破坏或终止昆虫生长和/或进食，引起或不引起昆虫死亡。当昆虫与有效剂量的本发明“毒素”接触时，结果一般为昆虫死亡、抑制昆虫的生长和/或繁殖和/或阻止昆虫进食对昆虫发生作用的毒素来源(优选转基因植物)，其中所述毒素通过转基因植物表达、制备的蛋白质组合物、可喷雾蛋白质组合物、毒饵基质或其他递送系统进行递送。还可以单独或共同使用本发明的功能性蛋白质以增强或提高一种或多种其他毒素的活性。本文所使用的术语“有毒的”、“毒性”或“毒素”旨在表示对象“毒素”具有如本文定义的“功能活性”。

实现功能活性优选但不必须完全致死进食昆虫。如果昆虫逃避毒素或停止进食，该逃避在一些应用中将是有用的，尽管该效应是非致死的或者致死性是延后的或间接的。例如，如果需要昆虫抗性的转基因植物，阻碍昆虫进食该植物与对昆虫的致死毒性是同样有效的，因为最终目的是避免昆虫引起的植物损害。

还有许多将毒素掺入昆虫食物的其他方法。例如，可以如本文所述通过用蛋白质溶液喷雾食物将毒蛋白掺入幼虫食物。另外，可以将纯化的蛋白质遗传改造进本来无害的细菌中，然后在培养基中培养所述细菌，之后用于食物来源或使其存在于需要根除昆虫的地区的土壤中。也可以直接将蛋白质遗传改造进昆虫食物来源中。例如，许多昆虫幼虫的主要食物来源为植物材料。因此可以将编码毒素的基因转移到植物材料，以使所述植物材料表达目的毒素。

将功能活性转移到植物或细菌系统一般需要将编码毒素氨基酸序列的核苷酸序列整合进蛋白质表达载体中，所述载体适合于该载体将滞留的宿主。如本文所述，获得编码功能活性蛋白质的核酸序列的一种方法为使用从毒素氨基酸序列推导的信息，从产生该毒素的细菌物种中分离天然遗传物质。可以优化天然序列以在植物中表达，例如下文更详细的讨论。也可以基于蛋白质序列设计优化的多核苷酸。

本发明提供具有有利的杀虫活性的新毒素类别。表征这些毒素类别和编码它们的多核苷酸的一种方法是通过在一系列指定条件下与示例核苷酸序列(其互补物和/或来自任一链的探针)杂交的能力和/或通过使用来自示例序列的引物的PCR对其扩增的能力来定义多核苷酸。

存在多种获得本发明杀虫毒素的方法。例如，可以使用本文公开和要求的杀虫毒素抗体从蛋白质混合物中鉴定和分离其他毒素。具体地，可以针对毒素中最恒定和与其他毒素区别最大的毒素部分产生抗体。然后可以通过免疫沉淀、酶联免疫吸附测定(ELISA)或Western印迹，使用这些抗体特异性鉴定具有特征活性的毒素。可以使用标准程序便利地制备针对本发明毒素或等价毒素或这些毒素的片段的抗体。这些抗体作为一方面包含于本发明中。本发明的毒素可得自多种来源/来源微生物。

本领域技术人员容易理解，可以从多种来源获得本发明的毒素(和基因)。“来自”或“得自”对象隔离群指该毒素(或相似的毒素)可得自伯氏致病杆菌ILM104菌株或其他一些来源，如其他细菌菌株或植物。例如，本领域技术人员容易理解，在细菌基因和毒素公开后就可以设计植物以产生该毒素。可以使用本文公开的多核苷酸和/或氨基酸序列制备抗体制剂、核酸探针(DNA和RNA)等，并用于从其他(天然)来源筛选和回收其他毒素基因。

多核苷酸和探针

本发明还提供编码本发明毒素的核苷酸序列。本发明还提供鉴定和表征编码杀虫毒素的基因的方法。在一个实施方案中，本发明提供可作为杂交探针和/或PCR技术的引物使用的独有核苷酸序列。引物产生可用于鉴定、表征和/或分离特定毒素基因的特征性基因片段。本发明的核苷酸序列编码与先前已描述毒素不同的毒素。

本发明的多核苷酸序列可用于形成完整“基因”，以在所需宿主细胞中编码蛋白质或多肽。例如，本领域技术人员容易了解，可以如本领域所熟知的，在目的宿主中将本发明的多核苷酸适当地放置于启动子的控制之下。

如本领域技术人员所知，DNA一般以双链形式存在。在这种排列下，一条链与另一条链互补，反之亦然。当DNA在(例如)植物中复制时产生了额外的互补DNA链。本领域中经常使用“编码链”指代与反义链结合的链。mRNA转录自DNA的“反义”链。“有义”或“编码”链具有一连串密码子(密码子是可以作为三残基单位阅读以指定特定氨基酸的三个核苷酸)，所述密码子可以作为开放读码框(ORF)阅读以形成目的蛋白质或多肽。为在体内产生蛋白质，一般将DNA链转录成用作蛋白质模板的mRNA互补链。因此，本发明包括附带的序列列表中所示的示例多核苷酸和/或等价物(包括互补链)的用途。与示例DNA功能性等价的RNA和PNA(肽核酸)也包含于本发明中。

在本发明的一个实施方案中，可以在使微生物高度增殖的条件下培养细菌隔离群。在处理微生物以提供单链基因组核酸后，可以用本发明的引物与DNA接触并进行PCR扩增。毒素编码基因的特征性片段将被该操作扩增，从而鉴定毒素编码基因的存在。

本发明的其他方面包括使用本文公开的方法和核苷酸序列鉴定的基因和隔离群。所鉴定的基因编码对害虫具有活性的毒素。

可以通过如使用寡核苷酸探针鉴定和获得本发明的毒素和基因。这些探针为可检测的核苷酸序列，所述核苷酸序列由于适当的标记或如国际申请No.WO 93/16094所述使其具有固有的荧光性而可被检测。探针(和本发明的多核苷酸)可以是DNA、RNA或PNA。除了腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U，RNA分子中)之外，本发明的合成探针(和多核苷酸)还可以含有次黄嘌呤核苷(能与全部四种碱基配对的中性碱基，有时用于在合成探针中代替全部四种碱基的混合物)。因此，当本文中提到合成的简并寡核苷酸时一般使用“n”，“n”可以是G、A、T、C或次黄嘌呤核苷。本文使用的多义密码子与提交本申请的标准IUPAC命名约定一致(如R为A或G、Y为C或T等)。

如本领域所熟知，如果探针分子与核酸样品杂交，可以合理的假设探针和样品具有显著同源性/相似性/同一性。优选地，首先进行多核苷酸杂交，之后使用本领域所熟知的技术在低、中或高严格条件下进行洗涤，如Keller，G.H.，M.M.Manak(1987)《DNA Probes》，Press，New York，NY，169-170页中所述。例如，如文中所述可以通过首先在室温下用2×SSC(标准柠檬酸盐水)/0.1％SDS(十二烷基硫酸钠)洗涤15分钟来得到低严格条件。一般进行两次洗涤。可以通过降低盐浓度和/或通过提高温度得到较高的严格度。例如，在上述洗涤之后可以接着在室温下两次用0.1×SSC/0.1％SDS洗涤15分钟，然后在55℃用0.1×SSC/0.1％SDS接着洗涤30分钟。如本领域技术人员所知，这些温度可以与本文公开的其他杂交和洗涤程序一起使用(例如可以用SSPE代替SSC作为盐使用)。可以通过向445ml水中加入50ml 20×SSC和5ml 10％SDS制备2×SSC/0.1％SDS。可以通过组合NaCl(175.3g/0.150M)、柠檬酸钠(88.2g/0.015M)和1升水并接着用10N NaOH调整pH至7.0来制备20×SSC。可以通过将10g SDS溶解到50ml高压灭菌水中、稀释到100ml来制备10％SDS并分成等分试样％。

检测探针提供了以已知方式测定是否保持了杂交的方法。这种探针分析提供了鉴定本发明的毒素编码基因的快速方法。可以使用DNA合成仪和标准程序合成本发明用作探针的核苷酸片段。这些核苷酸片段还可以用作PCR引物以扩增本发明的基因。

可以用分子的杂交特征定义本发明的多核苷酸。因此本发明包括与本文示例的多核苷酸杂交的多核苷酸(和/或其互补物、优选其完整互补物)。

本文使用的“严格”杂交条件指得到与本应用中所使用条件相同或大致相同程度杂交特异性的条件。具体地，通过标准方法进行固定在Southern印迹上的DNA与32P标记的基因特异性探针的杂交(参阅如Maniatis，T.，E.F.Fritsch，J.Sambrook[1982]《Molecular Cloning：ALaboratory Manual》，Cold Spring Harbor Laboratory，Cold SpringHarbor，NY)。一般在允许检测靶序列的条件下进行杂交和其后的洗涤。对于双链DNA基因探针，在6×SSPE、5×Denhardt溶液、0.1％SDS、0.1mg/ml变性DNA中在DNA杂交体解链温度(Tm)以下20-25℃进行过夜杂交。按下式描述解链温度(Beltz，G.A.，K.A.Jacobs，T.H.Eickbush，P.T.Cherbas和F.C.Kafatos[1983]《Methods of Enzymology》，R.Wu，L.和K.Moldave[编辑]Academic Press，New York 100：266-285)：

T_m＝81.5℃+16.6Log[Na+]+0.41(G+C％)-0.61(甲酰胺％)-600/双链体长度(碱基对)

一般如下述进行洗涤：

(1)在1×SSPE、0.1％SDS中室温15分钟洗涤两次(低严格洗涤)。

(2)在0.2×SSPE、0.1％SDS中在Tm-20℃15分钟洗涤一次(中度严格洗涤)。

对于寡核苷酸探针，在6×SSPE、5×Denhardt溶液、0.1％SDS、0.1mg/ml变性DNA中在杂交体解链温度(T_m)以下10-20℃进行过夜杂交。按下式确定寡核苷酸探针的T_m：

T_m(℃)＝2(T/A碱基对数)+4(G/C碱基对数)

(Suggs，S.V.，T.Miyake，E.H.Kawashime，M.J.Johnson，K.Itakura和R.B.Wallace[1981]ICN-UCLA Symp.Dev.Biol.UsingPurified Genes，D.D.Brown[编辑]，Academic Press，New York，23：683-693)。

一般如下述进行洗涤：

(1)1×SSPE、0.1％SDS中室温15分钟洗涤两次(低严格洗涤)。

一般可以改变盐和/或温度来改变严格度。对于长度＞70碱基左右的标记DNA片段，可以使用以下条件：

低：1或2×SSPE，室温

低：1或2×SSPE，42℃

中：0.2×或1×SSPE，65℃

高：0.1×SSPE，65℃

双链体的形成和稳定依赖于杂交体两条链间的显著互补性，且如上文所提到的，某种程度的错配是允许的。因此，本发明的探针序列包括所述序列的突变(单链和双链)、缺失、插入及其组合，其中所突变、插入和缺失允许与目的靶多核苷酸形成稳定的杂交体。可以以多种方法在给定的多核苷酸序列中产生突变、插入和缺失，这些方法为本领域普通技术人员所共知。其他方法可能在将来逐渐被了解。

PCR技术

聚合酶链式反应(PCR)是核苷酸序列的引发式的重复性酶合成。该方法为本领域技术人员所熟知并普遍使用(参阅Mullis，U.S.专利No.4,683，195、4,683,202和4,800,159；Saiki，Randall K.，Stephen Scharf，FredFaloona，Kary B.Mullis，Glenn T.Horn，Henry A.Erlich，NormanArnheim[1985]″Enzymatic Amplification of Genomic Sequences andRestriction Site Analysis for Diagnosis of Sickle Cell Anemia，″Science 230：1350-1354)。PCR是基于目的DNA片段的酶扩增，所述DNA片段两侧为与靶序列相反链杂交的两个寡核苷酸引物。引物在3’末端彼此指向。模板热变性、引物与其互补序列退火和用DNA聚合酶延伸退火引物的重复循环引起PCR引物5’末端所定义片段的延伸。每一引物的延伸产物可作为其他引物的模板，因此每个循环基本上倍增前一循环中产生的DNA片段数量。这引起特定靶片段的指数积累，可在几小时内多达数百万倍。通过使用热稳定的DNA聚合酶(如分离自嗜热水生菌(Thermus aquaticus)的Taq聚合酶)可以自动完成扩增过程。可以使用的其他酶为本领域技术人员所共知。

本发明的DNA序列可以用作PCR扩增的引物。在PCR中，引物和模板间某种程度的错配是可以接受的。因此，示例引物的突变、缺失和插入(特别是在5’末端加入核苷酸)在本发明的范围内。可以通过本领域普通技术人员已知的方法在给定的引物中产生突变、插入和缺失。

基因和毒素的修饰

本发明的有用基因和毒素不仅包括具体示例的全长序列，还包括这些序列的部分、区段和/或片段(包括与全长分子相比内部和/或末端缺失)、其变体、突变体、嵌合体和融合物。只要保留本文具体示例的氨基酸的特征性杀虫/功能活性，本发明的蛋白质可以具有替代的氨基酸。“变体”基因含有编码具有与示例蛋白质等价杀虫活性的相同毒素或等价毒素的核苷酸序列。术语“变体蛋白”和“等价毒素”指对靶害虫具有相同或基本相同的生物/功能活性和与示例毒素等价的序列的毒素。本文所使用的“等价”序列指含有提高或不对杀虫活性产生不利影响的氨基酸替代、缺失、添加或插入的序列。保留了杀虫活性的片段也包含于本发明中。保留了如示例毒素相应片段的相同或相似功能或“毒素活性”的片段和其他等价物在本发明的范围内。可以为了各种目的(如(不严重/显著降低毒素功能活性地)提高(或降低)蛋白质的蛋白酶稳定性)产生变化，如氨基酸替代或添加。

可以使用本文提供的教导，从野生型或重组细菌和/或来自其他野生型或重组生物获得/产生等价毒素和/或编码这些等价毒素的基因。可以使用其他芽孢杆菌、类芽孢杆菌、光杆状菌和致病杆菌物种作为来源隔离群。

例如，可以使用产生点突变的标准技术便利地构建基因的变异。另外，如U.S.专利No.5,605,793描述了在随机破碎后使用DNA重组装产生额外的分子多样性的方法。可以使用变体基因产生变体蛋白质，可以使用重组宿主产生变体蛋白质。使用这些“基因改组”技术可以构建含有本文示例的任何序列中任何5、10或20个连续残基(氨基酸或核苷酸)的等价基因或蛋白质。如本领域技术人员所了解的，可以调整基因改组技术以获得具有如与任何示例序列(或其互补物(完整互补物))中(相同大小)的片段相对应的3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、183、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、219、220、221、222、223、224、226、227、228、229、230、231、232、235、236、237、238、239、240、242、243、244、245、246、247、248、249、250、251、253、254、255、256、258、259、260、261、262、263、264、265、266、268、269、270、271、272、273、274、275、276、277、278、279、282、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、366、367、368、369、370、371、372、373、374、375、376、377、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个连续残基(氨基酸或核苷酸)的等价物。类似大小的片段特别是保守区的片段也可以作为探针和/或引物。

可以根据标准程序使用市售的外切核酸酶或内切核酸酶产生全长基因的片段。例如，可以使用酶如(Bal31)或定向诱变从这些基因的末端系统地切除核苷酸。还可以使用多种限制性酶获得编码活性片段的基因。可以使用蛋白酶直接获得这些毒素的活性片段。

如本文所公开的，可以截短毒素而仍保留功能活性，这也在本发明的范围内。“截短的毒素”指毒素蛋白的部分可被切除，并在切除后仍表现活性。可以通过昆虫中肠内外的蛋白酶进行切割。另外，可以使用分子生物学技术产生有效切割的蛋白质，其中通过用限制性内切核酸酶消化或本领域技术人员可使用的其他技术去除编码所述毒素的DNA碱基。截短后，可以在异源系统(如大肠杆菌、杆状病毒、基于植物的病毒系统、酵母等)中表达所述蛋白质，然后置于本文公开的昆虫实验中测定活性。如本领域所熟知，可以成功地产生小于完整的全长序列而保留功能活性的截短毒素。本领域熟知，可以以截短(核心毒素)形式使用B.t.毒素。参阅如Adang等，Gene 36：289-300(1985)，″Characterized full-length and truncatedplasmid clones of the crystal protein of Bacillus thuringiensis subspkurstaki HD-73 and their toxicity to sexta.″。还有其他保留杀虫活性的截短蛋白的实例，包括昆虫保幼激素酯酶(Regents of the University ofCalifornia的U.S.专利No.5,674,485)。本文所使用的术语“毒素”还旨在包括功能活性的截短物。

本发明的某些毒素已在本文中具体示例。这些毒素仅是本发明毒素的范例，显然本发明包括具有与示例毒素相同或相似杀虫活性的变体或等价毒素(和编码等价毒素的核苷酸序列)。等价毒素与示例毒素具有氨基酸相似性(和/或同源性)。氨基酸同一性一般高于60％，优选高于75％，更优选高于80％，甚至更优选高于90％并可以高于95％。还可以通过更具体的同一性和/或相似性范围定义本发明优选的多核苷酸和蛋白质。例如，与本文示例的序列相比，同一性和/或相似性可以为41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、82、83、84、86、87、88、90、91、92、93、94、95、96、97、98或99％。

除非另有说明，使用如Karlin和Altschul(1993)，Proc.Natl.Acad.Sci.USA 90：5873-5877中所改良的Karlin和Altschul(1990)，Proc.Natl.Acad.Sci.USA 87：2264-2268的算法测定本文所使用的两个核酸的序列同一性和/或相似性百分比。这样的算法整合在Altschul等(1990)，J.Mol.Biol.215：402-410的NBLAST和XBLAST程序中。使用NBLAST程序进行BLAST核苷酸搜索，评分＝100、字宽＝12。可以如Altschul等(1997)，Nucl.Acids Res.25：3389-3402中所述使用Gapped BLAST。使用BLAST和Gapped BLAST程序时，使用程序(NBLAST和XBLAST)各自的默认参数。参阅NCBI/NIH网址。使用上文背景部分中Crickmore等所述的方法和算法计算分数。使用默认参数用Vector NTI Suite 8(InforMax，Inc.，North Bethesda，MD，U.S.A)中的AlignX函数得到用于比较目的的缺口比对。它们是：缺口打开罚分15、缺口延伸罚分6.66和缺口分离罚分范围8。

氨基酸同源性/相似性/同一性在决定生物活性的毒素关键区域中是最高的或者与最终决定生物活性的三维构型决定相关。考虑到这一点，某些氨基酸替换是可以接受的并预计是可承受的。例如，这些替换可以在对活性非关键的蛋白质区域中。可以使用蛋白质晶体结构分析和基于软件的蛋白质结构模拟来鉴定可(使用定向诱变、改组等)进行修饰以确实改变特性和/或提高蛋白质功能性的蛋白质区域。

还可以改变蛋白质的多种特性和三维特征而不对蛋白质的毒素活性/功能性产生不利影响。可以预计保守性氨基酸替代是可接受的/不对分子的三维构型产生不利影响。氨基酸可按以下分类：非极性、极性不带电荷、碱性和酸性。只要替代不损害化合物的生物活性，则保守性替代在本发明的范围内，在所述保守性氨基酸替代中，一类氨基酸被同一类型的另一氨基酸替换。

表I提供属于每一类的氨基酸实例列表

表I
表I		氨基酸类别极性极性不带电荷酸性碱性	氨基酸实例丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、甲硫氨酸、苯丙氨酸、色氨酸甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、谷氨酰胺天冬氨酸、谷氨酸赖氨酸、精氨酸、组氨酸

在一些情况下，还可以进行非保守性替代。关键因素是这些替代不能明显降低毒素的功能/生物活性。

本文提到的“分离的”多核苷酸和/或“纯化的”毒素是指它们不伴随有与其天然共存的其他分子。因此，提到“分离的”和/或“纯化的”表示与本文所述的“人为”相关。例如，放入植物进行表达的本发明细菌毒素“基因”是“分离的多核苷酸”。同样，本文示例的植物所产生的致病杆菌蛋白质是“分离的蛋白质”。

由于遗传密码的简并性/冗余性，多种不同的DNA序列都可以编码本文公开的氨基酸序列。产生编码相同或基本相同毒素的替代DNA序列在受本领域训练的技术人员的能力范围内。这些变体DNA序列在本发明的范围内。

用于植物表达的序列优化

为了在植物中得到异源基因的高表达，可能优选重新设计所述基因以使其在植物细胞(的胞质)中更有效的表达。玉米就是这样的一种植物，其中在转化前重新设计异源基因以提高其在所述植物中的表达水平可能是优选的。因此，在设计编码细菌毒素的基因中额外的步骤是重新改造异源基因以得到最优表达。

在玉米中进行表达时重新改造细菌毒素的一个原因是由于天然基因的非最优G+C含量。例如，许多天然细菌基因极低的G+C含量(和因此高A+T含量的倾向)引起产生模拟或复制已知为高度富含A+T的植物控制序列的序列。在引入植物的基因中存在一些富含A+T的序列(如一般见于基因启动子中的TATA盒区)可能引起基因的异常转录。另一方面，转录的mRNA中其他调节序列(如多腺苷酸化信号序列(AAUAAA)或与前mRNA剪接相关的核内小RNA的互补序列)的存在可能导致RNA的不稳定性。因此，设计用于玉米表达的编码细菌毒素的基因(更优选称为植物优化基因)的一个目的是产生具有较高G+C含量(优选与编码代谢酶的玉米基因接近的G+C含量)的DNA序列。设计编码细菌毒素的植物优化基因的另一个目的是产生其序列修饰不阻碍翻译的DNA序列。

下表(表II)展示了玉米中的G+C含量有多高。对于表II中的数据，基因的编码区出自GenBank(第71次发布)条目，并用Mac Vector.TM.(IBI，New Haven，Conn.)程序计算碱基组成。计算中忽略了内含子序列。

由于遗传密码的冗余性/简并性(即一些氨基酸由多于一个密码子指定)提供的可塑性，基因组在不同生物或不同纲的生物中的进化引起了对冗余密码子不同的使用。在蛋白质编码区的平均碱基组成中反映了这种“密码子偏好”。例如，具有相对低G+C含量的生物使用冗余密码子的第三个位置上为A或T的密码子，而具有较高G+C含量的使用第三个位置上为G或C的密码子。mRNA中少见密码子的存在被认为可降低该mRNA的绝对翻译率，特别是对应于少见密码子的载荷tRNA的相对丰度低时。这一事实可扩展为：对于多个少见密码子，单个少见密码子对翻译的降低将至少是累加的。因此，具有相对高含量少见密码子的mRNA将相应的具有低翻译率。该翻译率将进而反映为低水平的编码蛋白质。

在设计用于玉米(或其他植物，如棉花或大豆)表达的编码细菌毒素的基因时已经测定了所述植物的密码子偏好。玉米的密码子偏好是该植物用于编码其蛋白质的密码子统计分布，表III显示了优选的密码子使用。测定偏好之后，测定目的基因中密码子的频率百分比。应该测定植物优选的主要密码子以及优选密码子的第二和第三选择。其后，反向翻译目的细菌毒素的氨基酸序列，以使得到的核酸序列与待异源表达的天然基因编码完全相同的蛋白质。使用密码子偏好信息设计新的DNA序列，使其对应于所需植物最优选的密码子。然后分析新序列中可能由修饰产生的限制性酶切位点。通过用第二或第三选择的优选密码子取代该密码子来进一步修饰鉴定出的位点。序列中可能影响目的基因转录或翻译的其他位点为外显子-内含子接合处(5’或3’)、多腺苷酸加成信号或RNA聚合酶终止信号。进一步分析和修饰序列，以降低TA或GC双联体的频率。除了双联体之外，具有多于约四个相同碱基的G或C序列嵌段也能影响序列的转录。因此，也通过用下一优选的密码子选择取代首选或次选的密码子来修饰这些嵌段。

表II
表II			玉米基因蛋白质编码区蛋白质分类_注a	G+C含量汇编G+C百分比范围	平均G+C百分比_注b

代谢酶(76)结构蛋白(18)调节蛋白(5)未表征蛋白质(9)所有蛋白质(108)

44.4-75.348.6-70.557.2-68.841.5-70.344.4-75.3

59.0(.+-.8.0)63.6(.+-.6.7)62.0(.+-.4.9)64.3(.+-.7.2)60.8(.+-.5.2)

注a：每一类基因的数目在括号内给出。

注b：标准差在括号内给出。

注c：平均值计算中忽略了组合组平均值。

编码细菌毒素的植物优化基因优选含有约63％的首选密码子、约22％到约37％之间的次选密码子和约15％到约0％之间的三选密码子，其中总百分比为100％。最优选植物优化基因含有约63％的首选密码子、至少约22％的次选密码子、约7.5％的三选密码子和约7.5％的四选密码子，其中总百分比为100％。设计用于玉米表达的基因所优选的密码子使用示于表III。上述方法使本领域技术人员能够修饰就具体植物而言是外来的基因，从而使基因在植物中优化表达。PCT申请WO 97/13402中进一步说明了该方法。

为了设计编码细菌毒素的植物优化基因，使用建立自密码子偏好表的非冗余遗传密码将所述蛋白质的氨基酸序列反向翻译成DNA序列，所述偏好表整理自具体植物的基因序列，并示于表II。进一步修饰得到的在密码子使用上完全同质的DNA序列，以产生除了具有高度密码子多样性以外还含有根据策略放置的限制性酶识别位点、所需的碱基组成并缺少可能干扰基因转录或产物mRNA翻译的序列的DNA序列。

表III
表III		在玉米中表达的蛋白质优选的氨基酸密码子
氨基酸	密码子^*	在玉米中表达的蛋白质优选的氨基酸密码子
氨基酸	密码子^*	丙氨酸半胱氨酸天冬氨酸	GCC/GCGTGC/TGTGAC/GAT

谷氨酸苯丙氨酸甘氨酸组氨酸异亮氨酸赖氨酸亮氨酸甲硫氨酸天冬酰胺脯氨酸谷氨酰胺精氨酸丝氨酸苏氨酸缬氨酸色氨酸酪氨酸终止

GAG/GAATTC/TTTGGC/GGGCAC/CATATC/ATTAAG/AAACTG/CTCATGAAC/AATCCG/CCACAG/CAAAGG/CGCAGC/TCCACC/ACGGTG/GTCTGGTAC/TATTGA/TAG

^*玉米的首选和次选密码子

因此，可以使用与本发明的毒素/基因功能性等价的合成基因转化宿主(包括植物)。关于产生合成基因的其他指导可见如U.S.专利No.5,380,831。

在一些情况下，特别是在植物中进行表达时，使用表达截短蛋白的截短基因可能是有利的。例如上文背景技术部分讨论过的Hofte等，1989讨论了B.t.毒素的原毒素和核心毒素。优选的截短基因一般编码全长毒素的40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％。

转基因宿主

可以将本发明的毒素编码基因引入多种微生物或植物宿主中。在优选的实施方案中，使用转基因植物细胞和植物。优选的植物(和植物细胞)为谷类、玉米和棉花。

在优选的实施方案中，毒素基因的表达直接或间接引起杀虫蛋白在细胞内的产生和保持。植物可以以这种方式得到昆虫抗性。当转基因/重组/转化的/转染的宿主细胞(或其内含物)被害虫消化时，害虫将消化毒素。这是使害虫与毒素接触优选的方式。其结果为控制(杀死或致病)害虫。也可以以类似的方式控制吸吮害虫。另外，当存在靶害虫时，可以使用合适的微生物宿主，例如假单胞菌如荧光假单胞菌，微生物可以在其中增殖并被靶害虫消化。可以在延长毒素活性并使细胞稳定的条件下处理携带毒素基因的微生物。然后可以将保留有毒活性的经处理细胞应用于靶害虫的环境中。

当通过合适的载体将毒素基因引入微生物宿主并将活状态的所述宿主应用于环境时，应该使用某些宿主微生物。微生物宿主选自已知占据一种或多种目的作物“植物圈”(叶面、叶圈、根际和/或根面)的微生物。选择这些微生物以使其能够在具体环境(作物或其他昆虫生境)中成功地与野生型微生物竞争，提供表达多肽杀虫剂的基因稳定的保持和表达，并理想地为杀虫剂提供针对环境降解和失活的提高的保护。

已知大量微生物栖息于多种重要作物的叶面(植物叶子的表面)和/或根际(植物根周围的土壤)中。这些微生物包括细菌、藻类和真菌。特别感兴趣的是微生物，例如细菌，如假单胞菌属、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯氏菌属(Klebsiella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、Methylophilius属、农杆菌属(Agrobacterium)、醋酸菌属(Acetobacter)、乳酸菌属(Lactobacillus)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、白联球菌属(Leuconostoc)和产碱菌属(Alcaligenes)；真菌特别是酵母如酵母菌(Saccharomyces)、隐球菌属(Cryptococcus)、克鲁维酵母菌属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)和短柄霉属(Aureobasidium)。特别感兴趣的是植物圈细菌物种，如丁香假单胞菌(Pseudomonas syringae)、荧光假单胞菌(Pseudomonas fluorescens)、粘质沙雷氏菌(Serratia marcescens)、木醋杆菌(Acetobacter xylinum)、根瘤农杆菌(Agrobacterium tumefaciens)、球形红假单胞菌(Rhodopseudomonas spheroides)、野油菜黄单胞菌(Xanthomonas campestris)、苜蓿根瘤菌(Rhizobium melioti)、真养产碱菌(Alcaligenes entrophus)和棕色固氮菌(Azotobacter vinlandii)；植物圈酵母物种如深红酵母(Rhodotorula rubra)、胶红酵母(R.glutinis)、海滨红酵母(R.marina)、橙红酵母(R.aurantiaca)、白色隐球菌(Cryptococcus albidus)、液化隐球菌(C.diffluens)、劳伦梯氏隐球菌(C.lurentii)、Saccharomyces rosei、S.pretoriensis、酿酒酵母(S.cerevisiae)、掷孢酵母(Sporobolomyces roseus)、S.odorus、Kluyveromycesveronae和Aureobasidium pollulans。感兴趣的还有色素微生物。

插入基因以形成转基因宿主

本发明的一个方面是用表达本发明蛋白质的本发明多核苷酸转化/转染植物、植物细胞和其他宿主细胞。以这种方式转化的细胞可以获得对靶害虫攻击的抗性。

可以使用多种方法在允许稳定保持和表达基因的条件下将编码杀虫剂蛋白的基因引入靶宿主。这些方法为本领域技术人员所熟知，并描述于如美国专利No.5,135,867。

例如，大量克隆载体可用于将外来基因插入到高等植物中，所述载体含有大肠杆菌复制系统和允许选择转化的细胞的标记物。载体包括如pBR322、pUC系列、M13mp系列、pACYC184等。因此，可以在合适的限制性位点将编码毒素的序列插入载体。得到的质粒用于转化进大肠杆菌中。在合适的营养培养基上培养大肠杆菌细胞，然后收获并裂解。回收质粒。作为分析方法，一般进行序列分析、限制性分析、电泳和其他生物化学-分子生物学方法。每次操作之后，可以切开所使用的DNA序列并与下一个DNA序列连接。每个质粒序列都可以克隆到同一个或其他质粒中。取决于将所需基因插入到植物中的方法，其他DNA序列可能是必要的。例如，如果使用Ti或Ri质粒转化植物细胞，则必须连接Ti或Ri质粒T-DNA序列的至少右侧边界(常为右侧和左侧边界)作为待插入基因的侧翼区域。T-DNA用于转化植物细胞的用途已在EP 120 516、Hoekema(1985)在《The Binary Plant Vector System》，Offset-durkkerij Kanters B.V.，Alblasserdam，第5章中、Fraley等，Crit.Rev.Plant Sci.4：1-46和An等(1985)EMBO J 4：277-287中有深入的研究和详细的描述。

大量技术可用于将DNA插入植物宿主细胞。这些技术包括使用根瘤农杆菌或发根农杆菌(Agrobacterium rhizogenes)作为转化剂用T-DNA转化、融合、注射、生物射弹(微粒轰击)或电穿孔以及其他可能的方法。如果用农杆菌进行转化，必须将待插入的DNA克隆进特殊的质粒中，即中间载体或二元载体中。由于与T-DNA中序列同源的序列，中间载体可以通过同源重组整合进Ti或Ri质粒。Ti或Ri质粒还含有转移T-DNA所必需的vir区。中间载体不能在农杆菌中自我复制。可以通过辅助质粒(缀合)将中间载体转移到根瘤农杆菌中。二元载体在大肠杆菌和农杆菌中都可以自我复制。它们含有选择标记物基因和接头或多聚接头，两侧为右和左T-DNA边界区。它们可以直接转化进农杆菌中(Holsters等，[1978]Mol.Gen.Gent.163：181-187)。作为宿主的农杆菌含有携带vir区的质粒。vir区是将T-DNA转移进植物细胞所必需的。还可以含有额外的T-DNA。将这样转化的细菌用于转化植物细胞。可以有利地用根瘤农杆菌或发根农杆菌培养植物外植体，以将DNA转移进植物细胞。然后可以在合适的培养基中从感染的植物材料(如叶碎片、茎节段、根以及原生质体或悬浮培养的细胞)再生完整植物，所述培养基可以含有用于选择的抗生素或杀虫剂。然后可以测试这样得到的植物中插入DNA的存在。在注射和电穿孔的情况下质粒没有特殊的要求。可以使用普通质粒，如pUC衍生物。

转化细胞以通常的方式在植物中生长。它们可以形成生殖细胞并将转化的性状传递到子代植物。可以以正常方式培养这些植物并与具有同一转化遗传因子或其他遗传因子的植物杂交。得到的杂合个体具有相应的表型特性。

在本发明优选的一些实施方案中，从插入植物基因组的转录单位表达编码细菌毒素的基因。优选地，所述转录单位是重组载体，所述重组载体能够稳定整合进植物基因组，并使得可以选择表达编码蛋白质的mRNA的转化植物株系。

一但整合进基因组，则插入DNA在其中是相对稳定的(并不再释放出来)。它一般包含赋予转化植物细胞对杀虫剂或抗生素(如卡那霉素、G418、博来霉素、潮霉素或氯霉素等)的抗性的选择标记物。因此单独使用的标记物应允许从不含有插入DNA的细胞中选择转化细胞。目的基因在植物中优选由组成型或诱导型启动子表达。一但表达之后，mRNA翻译成蛋白质，从而将目的氨基酸掺入蛋白质中。在植物中表达的编码毒素的基因可以在组成型启动子、组织特异性启动子或诱导型启动子的控制下。

存在若干将外来重组载体引入植物细胞和获得稳定保持和表达引入基因的方法。这些技术包括将包裹在微粒上的遗传物质直接引入细胞(Cornell的U.S.专利No.4,945,050和DowElanco，现在的DowAgroSciences，LLC的U.S.专利No.5,141,131)。此外，可以使用农杆菌技术转化植物，参阅University of Toledo的U.S.专利No.5,177,010；TexasA&M的5,104,310；欧洲专利申请0131624B1；Schilperoot的欧洲专利申请120516、159418B1和176112；Schilperoot的U.S.专利No.5,149,645、5,469,976、5,464,763和4,940,838和4,693,976；Max Planck的欧洲专利申请116718、290799、320500；Japan Tobacco的欧洲专利申请604662和627752和U.S.专利No.5,591,616；Ciba Geigy，现在的Novartis的欧洲专利申请0267159和0292435和U.S.专利No.5,231,019；Calgene的U.S.专利No.5,463,174和4,762,785和Agracetus的U.S.专利No.5,004,863和5,159,135。其他转化技术包括颈须技术。参阅Zeneca的U.S.专利No.5,302,523和5,464,765。也可以使用电穿孔技术转化植物。参阅Boyce ThompsonInstitute的WO 87/06614；Dekalb的U.S.专利No.5,472,869和5,384,253和Plant Genetic Systems的WO 92/09696和WO 93/21335。另外，也可以用病毒载体产生表达目的蛋白质的转基因植物。例如，可以用MycogenPlant Science和Ciba-Giegy，现在的Novartis的U.S.专利No.5,569,597以及Biosource的U.S.专利No.5,589,367和5,316,931中所述的方法用病毒载体转化单子叶植物。

如前述，将DNA构建体引入植物宿主的方法对于本发明不是关键的。任何提供有效转化的方法都可以使用。例如，本文描述了多种植物细胞转化的方法，包括使用Ti或Ri质粒等进行农杆菌介导的转化。在许多情况下，需要用T-DNA边界与用于转化的载体的一侧或两侧(更具体地为右侧)相连。尽管T-DNA边界也可见用于其他转化模式，但在使用根瘤农杆菌或发根农杆菌作为转化模式时特别有用。在将农杆菌用于植物细胞转化时，可以使用能引入宿主以与宿主中存在的T-DNA或Ti或Ri质粒同源重组的质粒。可以通过电穿孔、三亲杂交和本领域技术人员已知的用于转化革兰氏阴性菌的其他技术进行载体导入。载体转化进农杆菌宿主的方式对于本发明不是关键的。含有用于重组的T-DNA的Ti或Ri质粒可以能够或不能引起根肿大成瘤(gall formation)，只要所述宿主中存在vir基因，这对本发明就不是关键的。

将农杆菌用于转化时，在一些情况下将T-DNA边界内的表达载体插入广谱载体如pRK2或其衍生物中，如本文引入作为参考文献的Ditta等，PNAS USA(1980)77：7347-7351和EPO 0 120 515中所述。表达构建体和T-DNA内包括一个或多个如本文所述允许选择转化农杆菌和转化植物细胞的标记物。使用的具体标记物对于本发明并不重要，优选的标记物取决于所使用的宿主和构建体。

为了用农杆菌转化植物细胞，可以将外植体与转化农杆菌组合并孵育足够的时间以允许其转化。转化后，通过用适当抗生素的选择杀死农杆菌，并用适当的选择培养基培养植物细胞。一但形成愈伤组织，可以根据植物组织培养和植物再生领域已知的方法通过使用适当的植物激素促进芽形成。然而，愈伤组织中间期并不总是必要的。芽形成以后，可以将所述植物细胞转移到促进根形成的培养基，从而完成植物再生。可以培养植物产生种子，所述种子可以用于建立将来的世代。不考虑转化技术，优选将编码细菌毒素的基因整合进基因转移载体中，通过在载体中包含植物启动子调节元件以及3’非翻译转录终止区(如Nos等)使所述转移载体适于在植物细胞中表达该基因。

除了用于转化植物的大量技术之外，与外来基因接触的组织类型也可以是多样的。这些组织包括但不仅限于胚胎发生组织、I、II、和III型愈伤组织、下胚轴、分生组织、根组织、用于韧皮部表达的组织等。使用本文所述的适当技术几乎可以在去分化中转化几乎所有的植物组织。

如上文所述，需要时可以使用多种选择标记物。具体标记物的选择由技术人员决定，但是任何以下的选择标记物以及本文未列出的能发挥选择标记物功能的其他基因都可以使用。这些选择标记物包括但不仅限于编码对抗生素卡那霉素、新霉素和G418的抗性的转座子Tn5氨基糖苷磷酸转移酶基因(Aph II)以及编码对草甘磷、潮霉素、氨甲喋呤、草铵磷(双丙氨磷)、咪唑啉酮、磺酰脲和三唑嘧啶除草剂(如氯磺隆、溴草腈、茅草枯等)抗性或耐性的基因。

除了选择标记物以外，可能需要使用报道基因。在一些情况下，报道基因可以与或不与选择标记物一起使用。报道基因一般是在受体生物或组织中不存在的基因，一般编码引起一些表型变化或酶特性的蛋白质。K.Wising等.Ann.Rev.Genetics，22，421(1998)中提供了这些基因的实例。优选的报道基因包括大肠杆菌uidA基因座的β-葡糖醛酸糖苷酶(GUS)、来自大肠杆菌Tn9的氯霉素乙酰转移酶基因、来自生物发光水母维多利亚多管水母(Aequorea victoria)的绿色荧光蛋白和来自萤火虫Photinuspyralis的荧光素酶基因。接着可以在所述基因引入受体细胞后的适当时间实施检测报道基因表达的试验。优选的这些方法使用如Jefferson等(1987Biochem.Soc.Trans.15，17-19)所述的大肠杆菌uidA基因座编码β-葡糖醛酸糖苷酶(GUS)的基因鉴定转化细胞。

除了植物启动子调节元件以外，可以在植物细胞中有效地使用来自多种来源的启动子调节元件表达外源基因。例如，可以使用细菌来源的启动子调节元件，如章鱼碱合酶启动子、胭脂碱合酶启动子、甘露碱合酶启动子；病毒来源的启动子，如花椰菜花叶病毒(35S和19S)、35T(再改造的35S启动子，参阅U.S.专利No.6,166,302，特别是实施例7E)等。植物启动子调节元件包括但不仅限于核酮醣-1，6-二磷酸羧化酶(RUBP)小亚基(ssu)、β-伴大豆球蛋白(conglycinin)启动子、β-菜豆素启动子、ADH启动子、热休克启动子和组织特异性启动子。还可以存在其他元件，如基质附着区、支架附着区、内含子、增强子、多腺苷酸化序列等，从而提高转录效率或DNA整合。尽管这些元件可能通过影响转录、mRNA稳定性等提供较好的DNA表达或功能，但是它们对DNA功能可能是或不是必需的。这些元件可以如所需包含在DNA中，以得到转化DNA在植物中的优化表达。典型元件包括但不仅限于Adh-内含子1、Adh-内含子6、苜蓿花叶病毒外壳蛋白前导序列、玉米线条病毒外壳蛋白前导序列以及其他本领域技术人员可用的元件。还可以使用组成型启动子调节元件从而指导在所有细胞类型和所有时间的持续基因表达(如肌动蛋白、泛素、CaMV 35S等)。组织特异性启动子负责在特定细胞或组织类型(如叶或种子)中的基因表达(如玉米蛋白、油质蛋白、油菜籽蛋白、ACP、球蛋白等)，这些也可以使用。

启动子调节元件也可以在植物发育的某些阶段有活性以及在植物组织和器官中有活性。这些的实例包括但不仅限于花粉特异性、胚胎特异性、玉米穗丝特异性、棉花纤维特异性、根特异性、种子胚乳特异性启动子调节元件等。在某些情况下可能需要使用诱导型启动子调节元件，其负责应答于特定信号(如物理刺激(热休克基因)、光(RUBP羧化酶)、激素(Em)、代谢物、化学品和胁迫)的基因表达。还可以使用在植物中发挥功能的其他所需的转录和翻译元件。本领域已知大量植物特异性基因转移载体。

可以使用标准分子生物学技术克隆和测序本文所述的毒素。其他信息可见于本文引入作为参考文献的Sambrook，J.，Fritsch，E.F.和Maniatis，T.(1989)，《Molecular Cloning，A Laboratory Manual》，Cold SpringHarbor Press。

抗性治理

随着杀虫蛋白在转基因植物中日益增加的商业使用，一个需要考虑的因素是抗性治理。即，大量公司在其产品中使用苏云金芽孢杆菌毒素，并存在对于昆虫发展出B.t.毒素抗性的担心。昆虫抗性治理的一种策略是将致病杆菌、光杆状菌等产生的TC毒素与如B.t.晶体毒素(来自芽孢杆菌菌株的可溶性杀虫蛋白，参阅如WO 98/18932和WO 99/57282)或其他昆虫毒素组合。组合物可以配制成可喷雾剂应用或者可以是分子组合物。可以用产生两种或更多不同昆虫毒素的细菌基因转化植物(参阅如Gould，38Bioscience 26-33(1988)和U.S.专利No.5,500,365；类似的，欧洲专利申请0 400 246 A1和U.S.专利5,866,784、5,908,970和6,172,281也描述了用两种B.t.晶体蛋白转化植物)。产生含有多于一种昆虫抗性基因的转基因植物的另一种方法是首先产生两种植物，每种植物含有一种昆虫抗性基因。然后可以使用常规植物育种技术杂交这些植物以产生含有多于一种昆虫抗性基因的植物。因此，除非另有说明，本文中使用的“含有多核苷酸”这一说法显然指至少一种(并可以是相邻或不相邻的多种)多核苷酸。

制剂和其他递送系统

可以在土壤中应用配制的含有受试者隔离群的孢子和/或结晶的毒饵粒颗或含有可得自本文公开隔离群的基因的重组微生物。也可以在轮作周期的后段将配制的产物用作种子包衣或根处理或全植物处理。通过与多种惰性材料如无机矿物质(层状硅酸盐、碳酸盐、硫酸盐、磷酸盐等)或植物材料(粉状玉米芯、稻壳、胡桃壳等)混合作为可湿的散剂、颗粒剂或粉剂进行细胞的植物和土壤处理。制剂可以包括涂布器粘着佐剂、稳定剂、其他杀虫添加剂或表面活性剂。液体制剂可以是水基的或非水基的，并可以泡沫剂、凝胶剂、悬液剂、乳化浓缩液等进行应用。成分可以包括流变剂、表面活性剂、乳化剂、分散剂或多聚体。

本领域技术人员会理解，取决于具体制剂的性质(不管其是否为浓缩剂或直接使用)，杀虫浓度可以广泛的变化。可以存在以重量计至少1％的杀虫剂，并可以为以重量计100％。干制剂含有以重量计从约1-95％的杀虫剂，而液体制剂一般在液相中含有以重量计约1-60％的固体。制剂一般含有从约10²到10⁴个细胞/mg。以每公顷约50mg(液体或干的)到1kg施用这些制剂。

可以通过喷雾、撒粉、洒水等将制剂应用于害虫的环境(如土壤和叶子)。

另一种递送方案是将毒素遗传物质整合入杆状病毒载体。杆状病毒感染特定的昆虫宿主，包括毒素需要靶向的宿主。可以将带有毒素表达载体的侵染性杆状病毒引入昆虫侵扰的地区，从而使感染的昆虫中毒或染毒。

已知昆虫病毒或杆状病毒可感染某些昆虫并产生不利影响。病毒对于昆虫的影响是慢性的，病毒并不立即终止昆虫进食。因此，病毒不被看成是最佳的害虫控制剂。然而，将毒素基因组合进杆状病毒载体可以提供传递毒素的有效方法。此外，由于不同的杆状病毒对不同的昆虫具有特异性，因此可以使用特定的毒素选择性地靶向具体造成损害的害虫。对于毒素基因特别有用的载体是核型多角体病毒。已经描述了用这种病毒转移载体，并且目前是将外来基因转移到昆虫的首选载体。可以以经口传递的形式构建病毒-毒素基因重组体。杆状病毒一般通过中肠肠粘膜感染昆虫受者。插入到病毒外壳蛋白强启动子后面的毒素基因将表达并迅速杀死感染昆虫。

除了本发明蛋白毒素的昆虫病毒或杆状病毒或转基因植物递送系统之外，还可以用苏云金芽孢杆菌包胶技术将蛋白质包入胶囊，例如但不仅限于本文引入为参考的U.S.专利No.4,695,455、4,695,642、4,861,595。本发明蛋白毒素的另一递送系统为将蛋白质配制到毒饵基质中，然后在昆虫投饵地点于地上或地下使用所述毒饵。这些技术的实例包括但不仅限于本文引入为参考的PCT专利申请WO 93/23998。

基于植物RNA病毒的系统也可用于表达细菌毒素。为此，可以将编码毒素的基因插入感染目的宿主植物的适当植物病毒的外壳启动子区。然后可以表达毒素从而为植物提供对昆虫损害的保护。基于植物RNA病毒的系统描述于Mycogen Plant Sciences，Inc.的U.S.专利No.5,500,360和Biosource Genetics Corp的U.S.专利No.5,316,931和5,589,367。

除了产生转基因植物以外，还有其他可能需要再改造细菌基因的递送系统。例如，可以通过将能作为食物来源吸引昆虫的分子与毒素融合来构建蛋白毒素。在实验室纯化之后，可以将这些带有“内置”毒饵的毒剂包装在标准昆虫诱捕盒内。

突变体

可以通过本领域熟知的方法产生本发明伯氏致病杆菌隔离群的突变体。例如，可以通过用甲基磺酸乙酯(EMS)诱变隔离群得到不产孢子的突变体。可以通过本领域熟知的程序使用紫外光和亚硝基胍产生突变体。

本文提到或引用的所有专利、专利申请、临时申请和出版物整体引入为参考，引用程度不与本说明书的明确教导相冲突。

以下为说明本发明操作实践的实施例。这些实施例不应理解为限制性的。除非另有说明，所有的百分比均以重量计，所有的溶剂混合物比例以体积计。

实施例1-概述

使用粘粒互补筛选实现基因的鉴定和分离，所述基因编码加强或协同昆虫活性蛋白光杆状菌TcdA和致病杆菌XptA2_wi活性的因子。使用来自伯氏致病杆菌粘粒基因组文库的大肠杆菌单克隆(ILM104菌株)产生粗细胞提取物，将所述提取物与纯化毒素混合并进行生物测定。将裂解液与纯化的光杆状菌毒素TcaA一起针对南方玉米食根虫幼虫(Diabroticaundecimpunctata howardi)进行测试。同样，还将裂解液与纯化的致病杆菌XptA2_wi蛋白混合并针对烟草蚜虫(Heliothis virescens)或玉米earworm(美洲棉铃虫)幼虫进行测试。如果裂解液加纯化毒素的组合比任一组分单独的活性更高，则将粘粒裂解液评分为阳性。

两次测试(96孔形式的)首轮筛选样品并与对照比较杀虫活性进行评分。再培养阳性样品并在第二轮筛选中进行测试。对首轮和第二轮筛选中鉴定为阳性的粘粒进行第三轮筛选。在第三轮筛选中使用较大的培养体积(见下文)，在128孔形式的生物测定中测试生物活性。

亚克隆在这一筛选中鉴定为具有加强活性的粘粒之一的DNA。测定保留活性的单个亚克隆的DNA序列，其显示含有两个开放读码框，命名为xptB1_xb和xptC1_xb。将这些编码区亚克隆进pET质粒并在大肠杆菌中进行表达。当TcaA或XptA2_wi中任一蛋白质与共表达XptB1_xb和XptC1_xb的裂解液混合时，可见昆虫活性的显著提高。在与纯化的TcdA或XptA2_wi混合时，仅含有XptB1_xb或仅含有XptC1_xb的裂解液具有最低的效力。

实施例2-昆虫生物测定方法学

使用96孔微孔板(Becton Dickinson and Company，Franklin Lakes，NJ)或特别设计用于昆虫生物测定的128孔盘(C-D International，Pitman，NJ)中的人工饲料进行昆虫生物测定。在96孔微孔板中进行的生物测定使用两种鳞翅目物种的卵：玉米earworm(美洲棉铃虫(Boddie))和烟草蚜虫(Heliothis virescens(F.))。在128孔盘中进行的生物测定使用新生幼虫。在这一形式中测试的鳞翅目物种包括玉米earworm、烟草蚜虫和甜菜粘虫(Spodoptera exigua(Hubner))。在这一生物测定形式中还测试了一种鞘翅目物种：南方玉米食根虫(Diabrotica undecimpunctata howardii(Barber))。

这些生物测定中记录的数据包括处理昆虫总数、死亡昆虫数、生长障碍昆虫数和存活昆虫的重量。对于报道生长抑制的情况，按以下进行计算：

生长抑制％＝[1-(处理中昆虫平均重量/载体中昆虫的平均重量-仅对照)]×100

实施例3-粘粒文库构建

在28℃下，将通过16S RNA序列测定(Midi Labs，Newark，DE)确定为代表伯氏致病杆菌的致病杆菌ILM104菌株在含有0.0025％溴麝香草酚蓝的2％蛋白胨#3(下文中称为PP3)琼脂中培养72小时。选择吸收溴麝香草酚蓝的单菌落并用其接种到含有175mL PP3的500mL三角瓶中。以150rpm摇动摇瓶并在28℃下孵育约24小时。以2400×g离心50mL这种培养物以沉淀细胞。去除上清液并将细胞沉淀冻于-20℃直至将其融化用于细胞总DNA分离。

用Genomic DNA纯化试剂盒(Qiagen Inc.，Valencia，CA)分离细胞总DNA。通过涡旋将冷冻的细菌细胞重悬于含有11μL Qiagen RNase A溶液(100mg/mL)的11mL缓冲液B1(50mM Tris/HCI，pH 8.0；50mMEDTA，pH 8.0；0.5％Tween 20；0.5％Triton X-100)中。将300μL溶菌酶储备溶液(100mg/mL；Sigma Chemical Co.，St.Louis，MO)和500μL蛋白酶K储备溶液(50mg/mL；Sigma Chemical Co.)加入悬液中。涡旋混合悬液并在37℃孵育30分钟。在细菌裂解液中加入4mL缓冲液B2(3M盐酸胍；20％Tween 20)并将管轻柔颠倒混合溶液。将细菌裂解液在50℃孵育30分钟，然后按照生产商的说明书(Qiagen Genomic DNAHandbook)用Qiagen Genomic-tip 500/G吸头分离细胞总DNA。将得到的纯化DNA溶于500μL TE缓冲液(10mM Tris/HCl pH 8.0；1mM EDTApH 8.0)中并储存于4℃。

使用基于Ausubel等(《Current Protocols in Molecular Biology》，JohnWiley and Sons，New York，NY)中3.1.3节的操作从细胞总DNA产生Sau3A I局部消化物。进行小规模反应(80μL反应体积中40μg细胞总DNA)以测定产生最高浓度的大小为25-50Kb(千碱基对)的部分消化DNA片段的酶与细胞总DNA的正确比例。将反应物在65℃加热15分钟以使Sau3A I酶失活，并在0.3％琼脂糖凝胶上电泳反应物的等分试样以测定所需大小范围内的部分消化DNA片段的相对丰度。一但观察到酶与细胞总DNA的最佳比例，将反应体积扩大以得到足量的可用作粘粒文库构建中插入片段DNA的部分消化的细胞总DNA。典型的扩大反应包括在800μL总体积的1×React 4缓冲液(由Gibco BRL以10×提供)中将400μg伯氏致病杆菌细胞总DNA与9单位Sau3A I(Gibco BRL，Gaithersburg，MD)在37℃孵育15分钟。将反应物在65℃加热20分钟使酶失活。在粘粒文库构建过程中，为了使插入片段DNA与其他插入片段DNA之间的连接最小化，通过在1.2mL总体积的1×SAP缓冲液(生产商以10×提供)中与20单位的虾碱性磷酸酶(Boehringer Mannheim，Mannheim，德国)在37℃孵育2小时使部分消化的致病杆菌细胞总DNA去磷酸化。将去磷酸化的插入片段DNA与等体积用缓冲液平衡的酚-氯仿溶液(50∶50，体积/体积)混合并轻柔颠倒混合。以14000×g离心15分钟后，取出液相并轻柔颠倒与等体积的氯仿-异戊醇溶液(24∶1，体积/体积)混合。通过在14000×g离心15分钟再次使相分离。将液相移到新管中并加入0.1体积的3M乙酸钠(pH 5.2)。加入两倍体积用冰预冷的100％乙醇，轻柔颠倒混合溶液并置于-70℃过夜。以14000×g离心20分钟沉淀析出的DNA，将DNA沉淀重悬于50μL双蒸水并储存于-20℃。

使用如生产商所推荐制备的SuperCos 1载体(Stratagene，La Jolla，CA)构建粘粒文库。使用3∶1比例的部分消化的插入片段和载体在1×T4DNA连接酶缓冲液(生产商以10×提供)中与20单位的T4DNA连接酶(New England BioLabs Inc.，Beverly，MA)在16℃孵育过夜，将插入DNA连接进SuperCos I DNA的BamH I位点。用Gigapack Gold III GoldPackaging Extract(Stratagene)包装连接混合物并如生产商所推荐用大肠杆菌XLl-Blue MR菌株细胞滴定重组噬菌体。将重组噬菌体和宿主细胞培养物的等分试样(20-40μL)涂到含有氨苄青霉素(100mg/L；SigmaChemical Co.)的LB琼脂(10g/L细菌用蛋白胨、10g/L NaCl、5g/L细菌用酵母提取物、15g/L细菌用琼脂；Difco Laboratories)上，并在37℃孵育过夜。为构建用于长期保存的粘粒文库主平皿，用无菌的木制牙签挑取单菌落并接种到含有添加了100ml/mL氨苄青霉素或50mg/mL卡那霉素(Sigma Chemical Co.)的100-1000μL Terrific Broth(TB培养基：12g/L细菌用蛋白胨、24g/L细菌用酵母提取物、0.4％(体积/体积)甘油、17mM KH₂PO₄、72mM K₂HPO₄)的无菌96孔板的单个孔中，并在37℃静置孵育过夜。为从主平皿产生复制平皿，用96孔微孔板复制器(V &P Scientific，Inc.，San Diego，CA)接种含有添加了100mg/L氨苄青霉素的100-1000μL LB培养液的无菌96孔微孔板。将复制平皿在37℃静置孵育过夜。对于主平皿和复制平皿，均在平皿中加入等体积(100-1000μL)过滤灭菌的TB：甘油或LB：甘油，并用多通道移液器将培养物和甘油溶液混匀。用Biomek Seal and Sample铝箔盖(Beckman Instruments，Inc.，Fullerton，CA)封口并置于-70℃保存。

通过用NucleoSpin Nucleic Acid Purification Kit(CLONTECHLaboratories，Inc.，Palo Alto，CA)分离粘粒DNA并用20单位的限制性内切酶EcoR I(New England BioLabs)在37℃消化1小时回收的DNA来评估选定的重组粘粒的平均插入片段大小。将限制性DNA在1.0％琼脂糖凝胶上电泳。用0.5％溴化乙啶(New England BioLabs)染色后用紫外光使DNA片段显影，通过与1Kb梯度DNA比较来估计片段的相对大小。所构建粘粒文库的平均插入片段大小范围在30Kb-45Kb。

实施例4-互补筛选：培养物生长条件

对于首轮和第二轮互补筛选，在深96孔板中含有100μg/mL氨苄青霉素的2mL TB培养基中将粘粒文库的大肠杆菌单菌落在28℃下培养48小时。对于第三轮互补筛选，在28℃下将含有粘粒的大肠杆菌在100mL含有50μg/mL卡那霉素、100mM葡萄糖的TB培养基中以200-250rpm振荡培养24-48小时。

实施例5-互补筛选：裂解液制备

对于首轮和第二轮筛选，含有文库细胞的两份重复的2mL深孔板在Eppendorf 5810R离心机中以4000rpm(2250xg)离心5分钟。重悬两份重复的沉淀并组合进共计250μL LB中。将上清液加入含有3-4mm 0.1mm直径玻璃珠的1.2mL Costar管(Fisher Scientific)中。然后将管在Kleco^TM 4-94 Pulverizer玻珠研磨机(Garcia Manufacturing，Visalia，CA)中以最高速摇动3分钟。在Eppendorf 5810R离心机中以2500rpm离心样品3分钟，并在新的96孔板中加入200μL得到的上清液。在昆虫生物测定前，在该大肠杆菌细胞裂解物中加入50μL适当纯化的毒素(TcdA或XptA2_wi)或10mm磷酸缓冲液(作为阴性对照)。

通过在50mL锥形管中以3000xg离心从100mL培养物中制备第三轮筛选的裂解液。将沉淀重悬于LB培养基中至约40 OD₆₀₀单位/mL(Shimadzu UV160U分光光度计(Kyoto，JP))。然后将细胞分装入含有3-4mm 0.1mm直径玻璃珠的96孔1.2mL Costar管中，在Kleco^TM 4-94Pulverizer玻珠研磨机中以最高速摇动3分钟，然后在Eppendorf 5810R离心机中以2500rpm离心3分钟。将每一样品的上清液倒入一个管中并加入纯化的毒素。在昆虫生物测定前，加入TcdA(终浓度50ng/cm²)或XptA2_wi(终浓度250ng/cm²)或10mm磷酸缓冲液。

实施例6-互补筛选：活性粘粒片段的亚克隆

上述的活性筛选在鉴定产生提高TcdA和XptA2_wi活性的提取物的粘粒时是有效的。选择一种粘粒(命名为5H4)用于进一步研究。按照生产商的说明书使用Promega(Madison，WI)的Wizard^ Plus Midipreps DNAPurification System从含有5H4粘粒的细胞中分离DNA。按照生产商的说明书使用Roche Applied Science(Indianapolis，IN)的限制性内切酶表征DNA。使用标准分子生物学技术在0.7％琼脂糖凝胶上电泳消化产物并用溴化乙锭显影。使用标准分子生物学技术(Sambrook和Russell，《Molecular Cloning：A Laboratory Manual》，第三版，Cold SpringHarbor Laboratory Press，2001)，通过连接进载体pBCKS+(Stratagene)的BamH I位点从Xenorhabdus ILM104粘粒5H4中亚克隆约12Kb的BgIII片段。按照供应商的说明书将连接物转化进大肠杆菌DH5α亚克隆高效细胞(Stratagene)中。得到的质粒称为pDAB6026。

质粒pDAB6026显示编码与TcdA和XptA2_wi的昆虫毒活性协同的活性。将含有质粒pDAB6026或pBCKS+载体对照的大肠杆菌细胞接种进200mL含有氯霉素(50μg/mL)和75μM IPTG(异丙基-β-D-硫代半乳糖苷)的LB中并在28℃以180rpm振荡培养两天。然后将细胞在3500×g离心10分钟。将沉淀重悬于5mL Butterfield′s磷酸盐溶液(Fisher Scientific)中并转移至含有1.5mL 0.1mm直径玻璃珠(Biospec，Bartlesville，OK，目录号1107901)的50mL锥形管中。在冰上冷却细胞-玻璃珠混合物，然后用Branson Sonifier 250(Danbury CT)用2mm探针以～20输出通过两次45秒脉冲以超声处理法裂解细胞，脉冲间冷却完全。将上清液转移至2mL微量离心管中并在16000×g离心5分钟。然后将上清液转移至15mL管中并测定蛋白质浓度。用H₂O以1∶5稀释Bio-Rad Protein Dye AssayReagent并向10μL每一样品的1∶10稀释液中加入1mL，并以5、10、15、20和25μg/ml的浓度加入牛血清白蛋白(BSA)中。然后将样品在分光光度计上读数，在Shimadzu UV160U分光光度计(Kyoto，JP)上测量波长595处的吸光度。然后根据BSA标准曲线计算每一样品中含有的蛋白质量并用磷酸盐缓冲液调整至3-6mg/mL。在昆虫喂养生物测定中的测试之前，向500μL大肠杆菌裂解液中加入600纳克XptA2_wi毒素蛋白。pDAB6026和XptA2_wi的组合显示具有有效活性(表IV)。

表IV.2个鳞翅目物种对单独的pDAB6026裂解液和与纯化的XptA2_wi蛋白一起的应答。
表IV.2个鳞翅目物种对单独的pDAB6026裂解液和与纯化的XptA2_wi蛋白一起的应答。										处理		烟草蚜虫				玉米earworm
死亡	发育障碍	总计	重量	死亡	发育障碍	总计	重量					烟草蚜虫				玉米earworm
死亡	发育障碍	总计	重量	死亡	发育障碍	总计	重量	1	pBC			0	0	8	674	0	0	8	352
2	pBC+XptA2_wi	0	0	8	538	0	0	1	pBC	8	423	0	0	8	674	0	0	8	352
2	pBC+XptA2_wi	0	0	8	538	0	0	3	pDAB6026	8	423	0	0	8	539	0	0	8	519
4	pDAB6026+XptA2_wi	0	8	8	18	8	---	3	pDAB6026	8	---	0	0	8	539	0	0	8	519

实施例7-xptB1_xb和xptC1_xb基因的发现、设计和测试

将质粒pDAB6026的DNA送至Seq Wright DNA Sequencing(Houston，TX)测定DNA序列。发现两个很大的完整开放读码框(ORF)。第一个(作为SEQ ID NO：1公开)与属于“B”类的已知毒素复合物基因具有显著的相似性。因此将该ORF称为xptB1_xb，其编码SEQ ID NO：2公开的蛋白质。第二个ORF(SEQ ID NO：3)编码与毒素复合物“C”蛋白具有同源性的蛋白质(SEQ ID NO：4)，因此称为xptC1_xb。还发现了局部开放读码框(SEQ ID NO：5)，其与“A”类毒素复合物基因具有显著同源性。该局部ORF编码SEQ ID NO：6的蛋白质序列。

(使用聚合酶链式反应；PCR)通过在编码区5’和3’添加限制性位点并提供核糖体结合序列和最佳翻译终止信号来构建两个完整的基因xptB1_xb和xptC1_xb以得到高水平重组表达。另外，向编码区的5’端引入沉默突变(氨基酸序列无变化)以减少可能的mRNA二级结构，从而提高翻译。策略是扩增/改造基因的5’和3’端的片段，使用“剪接重叠延伸”反应加入末端片段，然后通过限制性位点加入开放读码框的非扩增中心部分。该方法使DNA序列中可能由PCR引入的变化最小化。将设计的编码区以分开的编码区(SEQ ID NO：7和SEQ ID NO：8)或双顺反子操纵子(SEQID NO：9)克隆进pET表达质粒(Novagen，Madison，WI)。表达质粒的名称示于表V。

表V.含有克隆进pET载体的不同编码区的表达质粒
表V.含有克隆进pET载体的不同编码区的表达质粒		质粒名称pDAB6031pDAB6032pDAB6033	改造来用于表达的编码区如SEQ ID NO：7的xptB1_xb如SEQ ID NO：8的xptC1_xb如SEQ ID NO：9的xptB1_xb+xptC1_xb

用pET(对照)载体或质粒pDAB6031、pDAB6032或pDAB6033的DNA转化新制大肠杆菌T7表达菌株BL21(DE3)Star^TM(Stratagene，LaJolla，CA)感受态细胞，并接种进250mL含有50μg/mL氯霉素和75μMIPTG的LB中。在28℃ 180rpm振荡培养24小时后，将细胞在5500×g离心10分钟。将沉淀重悬于5mL磷酸盐溶液中并转移至含有1.5mL0.1mm直径玻璃珠的50mL锥形管中，然后在“恒定”和如上文所述30设置下两次以45秒脉冲超声处理。样品在3000×g离心15分钟，并将上清液转移至2mL微量离心管中，在14000rpm离心5分钟，然后将上清液转移至15mL管中。如上文所述测定蛋白质浓度并用磷酸缓冲液将裂解液调整至5mg/mL。每一裂解液三个样品一组进行昆虫生物测定。对于第一个样品，加入磷酸缓冲液代替纯化毒素；对于第二个样品，加入足够的TcdA蛋白质以在昆虫生物测定孔中提供50ng/cm²的剂量，而对于第三个样品，加入足量的XptA2_wi以在昆虫生物测定孔中提供250ng/cm²的剂量。

生物测定的结果示于表VI。未补充低水平添加的TcdA或XptA2_wi蛋白质的对照样品(例如来自载体、pDAB6031、pDAB6032和pDAB6033的样品)对昆虫几乎没有影响。同样，含有低水平TcdA或XptA2_wi与pDAB6031或pDAB6032裂解液的样品具有最小影响。相反，在包含低水平TcdA或XptA2_wi以及pDAB6033裂解液的样品观测到显著活性。

表VI.鞘翅目和鳞翅目物种对大肠杆菌裂解液和纯化蛋白质的应答。应答用百分比死亡率/生长抑制百分比来表示。
表VI.鞘翅目和鳞翅目物种对大肠杆菌裂解液和纯化蛋白质的应答。应答用百分比死亡率/生长抑制百分比来表示。						样品	昆虫物种
测试的裂解液	南方玉米食根虫	玉米earworm	烟草蚜虫	甜菜粘虫			昆虫物种
测试的裂解液	南方玉米食根虫	玉米earworm	烟草蚜虫	甜菜粘虫	载体			0/0	8/0	0/0	31/0
pDAB6031	XptB1_xb	0/0	0/0	0/0	载体	31/33		0/0	8/0	0/0	31/0
pDAB6031	XptB1_xb	0/0	0/0	0/0	pDAB6032	31/33	XptC1_xb	0/0	4/11	0/2	13/15
pDAB6033	XptB1_xb+XptC1_xb	0/0	0/0	0/6	pDAB6032	13/38	XptC1_xb	0/0	4/11	0/2	13/15
pDAB6033	XptB1_xb+XptC1_xb	0/0	0/0	0/6	载体+TcdA	13/38		4/0	4/3	0/6	25/22
pDAB6031+TcdA	XptB1_xb+TcdA	0/0	0/0	0/5	载体+TcdA	13/34		4/0	4/3	0/6	25/22
pDAB6031+TcdA	XptB1_xb+TcdA	0/0	0/0	0/5	pDAB6032+TcdA	13/34	XptC1_xb+TcdA	0/0	0/2	0/14	6/25
pDAB6033+TcdA	XptB1_xb+XptC1_xb+TcdA	25/68	4/14	4/0	pDAB6032+TcdA	31/48	XptC1_xb+TcdA	0/0	0/2	0/14	6/25
pDAB6033+TcdA	XptB1_xb+XptC1_xb+TcdA	25/68	4/14	4/0	载体	31/48		0/0	0/79	0/9	31/0
pDAB6031+XptA2_wi	XptB1_xb+XptA2_wi	0/0	4/75	8/22	载体	25/36		0/0	0/79	0/9	31/0
pDAB6031+XptA2_wi	XptB1_xb+XptA2_wi	0/0	4/75	8/22	pDAB6032+XptA2_wi	25/36	XptC1_xb+XptA2_wi	0/0	0/71	0/22	6/14
pDAB6033+XptA2_wi	XptB1_xb+XptC1_xb+XptA2_wi	0/0	83/100	29/98	pDAB6032+XptA2_wi	81/100	XptC1_xb+XptA2_wi	0/0	0/71	0/22	6/14

实施例8-鉴定、纯化和表征伯氏致病杆菌ILM104菌株的XptB1_xb和XptC1_xb蛋白

本实施例涉及含pDAB6033的大肠杆菌裂解液的生物测定驱动分级，其引起通过MALDI-TOF鉴定两种共纯化蛋白(XptB1_xb和XptC1_xb)。含有这两种蛋白质的峰有效地赋予TcdA和XptA2_wi活性。

活性级分基于其协同或赋予活性的能力进行鉴定，所述活性为针对南方玉米食根虫的TcdA或针对玉米earworm的XptA2_wi的活性。以实施例2中描述的128孔形式进行所有的生物测定。

将三升来自含有pDAB6033的转基因大肠杆菌培养物的培养液离心(10,000×g 20分钟)，并将细胞移至150mL含有0.1M DTT(二硫苏糖醇)和1M EDTA(乙二胺四乙酸)的25mM Tris-HCl，pH 7.8(T缓冲液)中。按照制造商的说明书加入通用蛋白酶抑制剂混合物(SigmaChemical目录号P2714)。通过对每一小份重悬细胞在最大功率下置于冰上超声处理30秒来裂解细胞。重复该过程三次，然后将破碎的细胞以48400×g在4℃下离心1小时。收集裂解液并加入硫酸氨至80％饱和。通过以48400×g离心15分钟收集沉淀的蛋白质，悬于T缓冲液并用2升T缓冲液透析过夜(换液一次)。通过离心(48400×g 10分钟)澄清悬浮的蛋白质，然后上样到Q Sepharose XL离子交换柱(1.6cm直径×10cm长)。用2倍柱床体积的T缓冲液洗涤柱，然后用含300mM NaCl的T缓冲液分批不连续梯度洗脱。混和用300mM NaCl洗脱的蛋白质并加入(NH₄)₂SO₄至终浓度为1M，上样到苯琼脂糖疏水作用柱(1.0cm直径×10cm长)上。用2倍柱床体积含有1.25M(NH₄)₂SO₄的25mM T缓冲液洗涤后，在10倍柱床体积中以T缓冲液中从625mM到0mM(NH₄)₂SO₄的线性梯度和额外的4倍柱床体积T缓冲液等度洗脱来洗脱蛋白质。目的蛋白质在40-60mS/cm之间的导率洗脱。混和这些样品并用T缓冲液在4℃透析过夜。然后将透析过的蛋白质样品上样到用T缓冲液平衡的MonoQ离子交换柱(1.0cm直径×10cm长)。在15倍柱床体积中，以从0到400mM NaCl的线性梯度洗脱蛋白质。从22-24mS/cm导率下洗脱的蛋白质级分中检测到两个活性峰(峰1和峰2)。峰1和峰2加强活性的实例示于表VII。接着对峰1和峰2进行纯化和分析。

将峰浓缩至1.0mL并使用由50mM磷酸钠、100mM NaCl、0.05％吐温20和10％甘油组成的pH7.8的缓冲液以1.0cm/分钟上样到Superdex200(1.6cm直径×60cm长)大小排阻柱上。两种情况下，蛋白质都以对应于约300kDa分子量的单个主峰被洗脱。稀释蛋白质主峰，通过上样到用T缓冲液平衡的Mono Q(0.5cm直径×5cm长)离子交换柱并在15倍柱床体积中使用150-300mM的NaCl梯度洗脱来进一步纯化。

通过SDS-PAGE分析该离子交换纯化所得的级分。将蛋白质级分(20μL)加入5X浓缩的Laemmli缓冲液(Ausubel等，《Current Protocols inMolecular Biology》，John Wiley and Sons，Inc.，New York，NY第10节)(5μL)中，90℃加热3分钟、离心并将上清液上样到SDS电泳缓冲液中的4-20％聚丙烯酰胺Tris-甘氨酸凝胶上。用160V 90分钟将蛋白质分开，通过考马斯蓝染色显影，然后用含有5％水合甲醇加7％乙酸的溶液脱色。用Bio-Rad Fluoro-S Multi Imager成像并分析凝胶。来自峰1和峰2的凝胶都包含两条主要条带，一条迁移到～170kDa而另一条迁移到～80kDa。来自峰1的凝胶包含以约18、33和50kDa迁移的三个另外的蛋白质。回顾分析显示～170kDa和～80kDa条带在纯化的最初阶段含量丰富并在各步逐渐富集。

使用MALDI-TOF分析确定2个主要条带的身份。从pDAB6033裂解液高度富集级分的SDS凝胶上切出～170kDa和～80kDa的条带，放入经硅化处理的Eppendorf微量离心管中并用含50％乙氰的12.5mMNH₄HCO₃脱色。在Speed-Vac(Savant Instruments，Holbrook，NY)中干燥样品并在37℃用测序级胰蛋白酶(Roche Diagnostics，Indianapolis，IN)消化过夜(约16小时)。短暂离心沉淀凝胶碎片后，将含有肽的上清液转移至新管中并在Speed-Vac中干燥。然后将肽悬浮于6μL 0.1％三氟乙酸(TFA)中，用C₁₈ZipTip树脂(Millipore，Bedford，MA)吸收并用75％乙氰/0.1％TFA洗脱。如下文所述分析洗脱液。

在Voyager DE-STR MALDI-TOF质谱仪(PerSeptive Biosystems，Framingham，MA)上使用MALDI-TOF质谱法分析提取的肽以产生肽质量指纹(PMF)。以0.5μL样品与0.5μL介质按1∶1的比例在平板上混和使用干燥微滴点样技术(晾干)将上文得到的样品点样在MALDI不锈钢平板上。基质为α-氰基-4-羟基肉桂酸在含有0.1％TFA的50％乙氰中的饱和溶液。使用血管紧张素I、促肾上腺皮质激素(ACTH，片段1-17、18-39、7-38)溶液进行外部校准。使用m/z 2163.05的自溶胰蛋白酶峰进行内部校准。所有的质谱以具有延迟提取的阳离子反射器模式收集。设备使用337nm氮激光(用于解吸/离子化事件)和3.0米反射器飞行时间管。将获得的谱去同位素并产生PMF表用于数据库搜索。使用基于Web的搜索引擎Mascot(MatrixSciences，UK)进行数据库搜索。质量限制(mass tolerance)设定为0.15Da并在搜索中选择无修饰。分析提取自～170kDa的样品确认为XptB1_xb。分析取自～80kDa的样品确认了XptC1_xb。尽管根据基因序列(SEQ ID NO：3)计算的XptC1_xb蛋白预计分子量为108kDa，但是提取的蛋白质在SDS/PAGE中的电泳速度预计明显更快。代表完整肽序列的肽片段的存在说明提取的蛋白质是全长的。

表VII：来自pDAB6033的纯化峰1和峰2的生物活性。
表VII：来自pDAB6033的纯化峰1和峰2的生物活性。						玉米earworm		南方玉米食根虫
样品	死亡	发育障碍	死亡	发育障碍		玉米earworm		南方玉米食根虫
样品	死亡	发育障碍	死亡	发育障碍	峰1
0	0	0	0	0	峰1
0	0	0	0	0	125	2	6	4	2
峰2					125	2	6	4	2
峰2					0	1	0	0	0
125	0	8	5	3	0	1	0	0	0

样品列的值代表应用于饲料的峰1或峰2XptB1_xb/XptC1_xb的浓度(ng/cm²)。对于针对玉米earworm的生物测定，生物测定中包括了250ng/cm²的XptA1_xi。对于针对南方玉米食根虫的生物测定，生物测定中包括了100ng/cm²的TcdA。每种样品使用总计八只幼虫。

实施例9-完整测序来自伯氏致病杆菌ILM104菌株的新“A”类毒素复合物基因

在实施例6中，鉴定5H4粘粒编码提高A类蛋白TcdA和XptA2活性的蛋白质。昆虫生物测定显示该粘粒的亚克隆(质粒pDAB6026)编码协同活性。pDAB6026的DNA序列分析鉴定了三个开放读码框。第一个(以SEQ ID NO：1公开)与属于“B”类的已知毒素复合物基因具有相似性。该ORF因此称为xptB1_xb，编码如SEQ ID NO：2公开的XptB1_xb蛋白。第二个ORF(SEQ ID NO：3)编码与毒素复合物“C”蛋白具有同源性的蛋白质(XptC1_xb，SEQ ID NO：4)，因此称为xptC1_xb。显示这两个读码框负责TcdA和XptA2协同或增强的活性(实施例7和实施例8)。还发现与“A”类毒素复合物基因具有显著同源性的局部开放读码框(SEQID NO：5)。该局部ORF编码SEQ ID NO：6公开的蛋白质序列。

通过分析5H4粘粒的完整DNA序列确定该新A类基因的全长DNA序列和推定的编码蛋白质序列。如实施例6所述制备粘粒DNA并送至LarkTechnologies(Houston，TX)进行全DNA序列测定。测定了新A类基因的DNA编码序列(称为xptA1_xb)并以SEQ ID NO：10公开。该读码框(xptA1_xb)编码的蛋白质以SEQ ID NO：11公开。

序列表

<110>美国陶氏益农公司

<120>来自伯氏致病杆菌的毒素复合物蛋白和基因

<130>DAS-114XC1

<150>US 60/534,893

<151>2004-01-07

<160>11

<170>PatentIn版本3.2

<210>1

<211>4521

<212>DNA

<213>伯氏致病杆菌

<400>1

atgaaacaag attcacagga catgacagta acacagctgt ccctgcccaa agggggcggt 60

gcgatcagtg gcatgggtga cactatcagc aatgcagggc cggatgggat ggcttcgctt 120

tccgtgcctt tgcctatctc tgccggtcgg gggggcgcac cgaatttatc cctgaactac 180

agtagcggag caggaaacgg gtcatttggt attggctggc aatccagtac catggctatc 240

agccgtcgta ctcaacatgg cgtaccgcaa tatcacggcg aagatacttt tttatgtccg 300

atgggagaag tgatggcggt tgccgtcaat cagagcgggc aacccgatgt gcgtaaaacc 360

gataaactat taggcgggca actgcctgtt acttataccg ttacgcgtca tcagcccaga 420

aatattcagc acttcagcaa acttgaatac tggcagcccc caacggatgt ggaaaccacg 480

cctttttggt taatgtattc acccgatgga caaattcaca ttttcggaaa aactgagcag 540

gctcagatcg ctaacccggc agaggtttca cagattgccc aatggctttt ggaagaaacc 600

gtaacaccag cgggagaaca catttattac cagtatcggg cagaagacga tatcggttgt 660

gatgacagcg aaaaaaatgc ccaccctaat gccagtgctc aacgttattt gactcaggtg 720

aactacggca atattacacc tgaatccagc ctgcttgtgc tgaagaatac gccaccggcg 780

gataacgaat ggctattcca tttggttttt gattatggtg aacgagcgca ggaaataaac 840

acggttcctc ctttcaaagc accttcaaac aactggaaaa tacggccaga ccgtttctcc 900

cgctttgaat atggttttga ggtgcgaacc cgccgcctgt gtcaacaaat tctgatgttc 960

catcgcctga aatcccttgc aggagaacag attgacggag aagaaatccc tgccttggtt 1020

gcccgtctgc ttctcagtta tgacctgaac gacagcgtga caacccttac cgccattcgg 1080

caaatggcgt atgaaactga cgcaacctta atcgctttac cgccactgga gtttgactat 1140

cagccctttg aggcaaaagt cacgcagaaa tggcaggaaa tgcctcaatt ggccggattg 1200

aatgcccaac aaccttacca actcgtcgat ctctatggtg aaggtatctc cggcatcttg 1260

tatcaggaca gacccggagc atggtggtat caggcaccga tccgtcagaa aaacgttgaa 1320

gatattaacg ctgtcaccta tagcccaata aaccccttac ctaagatccc cagccagcag 1380

gacagagcaa cgttgatgga tatcgacggt gatggacatc tggattgggt gatcgctggc 1440

gcaggtattc aggggcggta cagtatgcag ccgaatggag agtggacaca ctttattccc 1500

atttctgcac tgccaacaga atattttcat ccacaggcac aactggcgga tctggtgggg 1560

gccgggttat ctgatttagc gctgattggc cccagaagtg tgcgtttata tgccaacgac 1620

cgaggaaact ggaaagcggg tattaatgtt atgccacctg atggtgtgaa tttgccgata 1680

tttggtggtg atgccagcag tctggtcgca ttttctgaca tgttgggatc gggacagcag 1740

catttggtgg aaattgccgc tcagagcgtc aaatgctggc cgaatctagg acatggccgt 1800

tttggtgcgg ctattttgct gccggggttt agccagccga atggaacatt caatgctaac 1860

caagtttttc tggcagatat cgatggttcc ggcaccgccg acatcatcta tgcacacagt 1920

acgtatctgg atatttacct gaacgaaagc ggcaaccgtt tcagtgcacc cgttcggctt 1980

aatttgccgg aaggggtgat gtttgacaat acctgtcagt tacaggtgtc ggatattcaa 2040

ggattgggcg ctgccagcat tgtactgacc gtacctcata tgacaccgcg ccattggcgt 2100

tatgatttta ctcacaataa accttggctg ctcaatgtca tcaacaacaa tcgtggcgca 2160

gaaaccacgt tgttttaccg tagttctgcc caattctggc tggatgaaaa aagtcagatc 2220

gaagagctgg gaaaatttgc agcgagttat ctgcctttcc ccatacattt gttgtggcgc 2280

aatgaggcgc tggatgaaat tactggtaat cgactgacta aggtcatgaa ttatgcccac 2340

ggtgcatggg atggcagaga gagagaattt tgcggatttg gccgtgtaac gcaaattgat 2400

accgacgaat ttgccaaggg aaccacagag aaagcgccgg atgaaaatat ctatccttcc 2460

cgtagcataa gctggtttgc cacgggttta ccagaagtgg attctcaact tccggcagaa 2520

tactggcgtg gtgacgatca ggcatttgcc ggctttacac cgcgcttcac tcgttatgaa 2580

aaaggtaatg cggggcaaga ggggcaggat accccgatta aagaaccgac cgaaacagaa 2640

gcgtattggc ttaaccgcgc catgaaaggc caattactgc gcagtgaagt ctatggtgac 2700

gacaaaacag aaaaagctaa aattccgtac accgtcacag aagctcgctg tcaggtcaga 2760

ttaattccca gcaatgacga agccgcgccg tcgtcttgga cgtcgatcat tgaaaaccgc 2820

agttatcact atgagcgtat cgtcgtcgat ccgagttgca aacaacaggt cgtgctcaag 2880

gcggatgaat atggcttccc actggcaaaa gtagatatcg cctatccacg gcgcaataaa 2940

ccggcacaga acccttatcc ggattcgtta ccggatactc tgttcgccga tagctatgac 3000

gaccagcaaa aacagttata tctgacaaaa cagcagcaga gctattacca cctgacccag 3060

caggatgatt gggttctggg tttgacggat agccgataca gcgaagttta tcattatgcg 3120

caaactgacg ctcaaagtga catccccaag gcagggctga tattggaaga cctgctgaaa 3180

gttgacggcc tgataggtaa agacaagact tttatctatt tagggcagca gcgagtggct 3240

tatgtgggag gagatgcaga aaaaccgaca cgtcaggtgc gggtggctta tacagaaacc 3300

gctgcttttg atgacaatgc gctgcacgcc tttgatggcg tgattgcccc tgatgaactg 3360

acgcaacagt tgctggcggg tggatacctg ctcgtgccgc agatttctga tgtggcaggc 3420

agtagtgaaa aggtatgggt agctcggcag ggatacaccg aatacggcag tgctgctcaa 3480

ttctaccggc cactcatcca gcgcaaaagc ttgctgaccg gaaaatatac ccttagttgg 3540

gatacgcact attgtgtggt ggtaaaaacc gaagatggtg cgggaatgac cacgcaagcg 3600

aagtacgatt accgcttcct gcttccggcg caattgacag atatcaatga caaccagcac 3660

atcgtgacat ttaatgcatt ggggcaggtg acttccagcc gtttctgggg cacagaaaat 3720

ggcaaaataa gcggttactc gacgccggag agtaaaccgt tcacagtacc cgataccgtc 3780

gaaaaagccc ttgccttgca accgacgatc ccggtttcac agtgcaacat ttatgtgccg 3840

gatagttgga tgcggcttct gccccaacag tctctgactg gccagctaaa agagggggaa 3900

actttgtgga acgcattaca ccgggcgggt gtagtaacgg aagacggttt gatctgtgaa 3960

ctggcctatc gtcgttggat caaacgtcag gcaacgtctt caatgatggc cgtgacatta 4020

cagcaaatct tggctcagac tccacgacaa cctccgcatg ccatgacgat cacgacagat 4080

cgttatgaca gcgattctca gcagcaactt cggcagtcga tagtattgag tgatggtttt 4140

ggtcgcgtat tgcaaagcgc ccagcgtcat gaagcaggag aggcatggca gcgtgcagaa 4200

gatggttctt tggttgtcga taataccggt aaacccgttg ttgctaatac cacaacgcgc 4260

tgggcagtat ccggtcgcac agaatacgac ggcaaagggc aggcgatcag agcttacctg 4320

ccttattatc tcaatgattg gcgctatgtc agtgatgaca gcgcccggga tgacctgtac 4380

gccgataccc atttttacga tcctctgggg cgtgaatatc aggtaaaaac cgcgaaagga 4440

ttttggcgtg aaaacatgtt tatgccgtgg tttgtcgtca atgaagatga aaatgacaca 4500

gcagcacgtt taacatctta a 4521

<210>2

<211>1506

<212>PRT

<213>伯氏致病杆菌

<400>2

Met Lys Gln Asp Ser Gln Asp Met Thr Val Thr Gln Leu Set Leu Pro

1 5 10 15

Lys Gly Gly Gly Ala Ile Ser Gly Met Gly Asp Thr Ile Ser Asn Ala

20 25 30

Gly Pro Asp Gly Met Ala Ser Leu Ser Val Pro Leu Pro Ile Ser Ala

35 40 45

Gly Arg Gly Gly Ala Pro Asn Leu Ser Leu Asn Tyr Ser Ser Gly Ala

50 55 60

Gly Asn Gly Ser Phc Gly Ile Gly Trp Gln Ser Ser Thr Met Ala Ile

65 70 75 80

Ser Arg Arg Thr Gln His Gly Val Pro Gln Tyr His Gly Glu Asp Thr

85 90 95

Phe Leu Cys Pro Met Gly Glu Val Met Ala Val Ala Val Asn Gln Ser

100 105 110

Gly Gln Pro Asp Val Arg Lys Thr Asp Lys Leu Leu Gly Gly Gln Leu

115 120 125

Pro Val Thr Tyr Thr Val Thr Arg His Gln Pro Arg Asn Ile Gln His

130 135 140

Phe Ser Lys Leu Glu Tyr Trp Gln Pro Pro Thr Asp Val Glu Thr Thr

145 150 155 160

Pro Phe Trp Leu Met Tyr Ser Pro Asp Gly Gln Ile His Ile Phe Gly

165 170 175

Lys Thr Glu Gln Ala Gln Ile Ala Asn Pro Ala Glu Val Ser Gln Ile

180 185 190

Ala Gln Trp Leu Leu Glu Glu Thr Val Thr Pro Ala Gly Glu His Ile

195 200 205

Tyr Tyr Gln Tyr Arg Ala Glu Asp Asp Ile Gly Cys Asp Asp Ser Glu

210 215 220

Lys Asn Ala His Pro Asn Ala Ser Ala Gln Arg Tyr Leu Thr Gln Val

225 230 235 240

Asn Tyr Gly Asn Ile Thr Pro Glu Ser Ser Leu Leu Val Leu Lys Asn

245 250 255

Thr Pro Pro Ala Asp Asn Glu Trp Leu Phe His Leu Val Phe Asp Tyr

260 265 270

Gly Glu Arg Ala Gln Glu Ile Asn Thr Val Pro Pro Phe Lys Ala Pro

275 280 285

Ser Asn Asn Trp Lys Ile Arg Pro Asp Arg Phe Ser Arg Phe Glu Tyr

290 295 300

Gly Phe Glu Val Arg Thr Arg Arg Leu Cys Gln Gln Ile Leu Met Phe

305 310 315 320

His Arg Leu Lys Ser Leu Ala Gly Glu Gln Ile Asp Gly Glu Glu Ile

325 330 335

Pro Ala Leu Val Ala Arg Leu Leu Leu Ser Tyr Asp Leu Asn Asp Ser

340 345 350

Val Thr Thr Leu Thr Ala Ile Arg Gln Met Ala Tyr Glu Thr Asp Ala

355 360 365

Thr Leu Ile Ala Leu Pro Pro Leu Glu Phe Asp Tyr Gln Pro Phe Glu

370 375 380

Ala Lys Val Thr Gln Lys Trp Gln Glu Met Pro Gln Leu Ala Gly Leu

385 390 395 400

Asn Ala Gln Gln Pro Tyr Gln Leu Val Asp Leu Tyr Gly Glu Gly Ile

405 410 415

Ser Gly Ile Leu Tyr Gln Asp Arg Pro Gly Ala Trp Trp Tyr Gln Ala

420 425 430

Pro Ile Arg Gln Lys Asn Val Glu Asp Ile Asn Ala Val Thr Tyr Ser

435 440 445

Pro Ile Asn Pro Leu Pro Lys Ile Pro Ser Gln Gln Asp Arg Ala Thr

450 455 460

Leu Met Asp Ile Asp Gly Asp Gly His Leu Asp Trp Val Ile Ala Gly

465 470 475 480

Ala Gly Ile Gln Gly Arg Tyr Ser Met Gln Pro Asn Gly Glu Trp Thr

485 490 495

His Phe Ile Pro Ile Ser Ala Leu Pro Thr Glu Tyr Phe His Pro Gln

500 505 510

Ala Gln Leu Ala Asp Leu Val Gly Ala Gly Leu Ser Asp Leu Ala Leu

515 520 525

Ile Gly Pro Arg Ser Val Arg Leu Tyr Ala Asn Asp Arg Gly Asn Trp

530 535 540

Lys Ala Gly Ile Asn Val Met Pro Pro Asp Gly Val Asn Leu Pro Ile

545 550 555 560

Phe Gly Gly Asp Ala Ser Ser Leu Val Ala Phe Ser Asp Met Leu Gly

565 570 575

Ser Gly Gln Gln His Leu Val Glu Ile Ala Ala Gln Ser Val Lys Cys

580 585 590

Trp Pro Asn Leu Gly His Gly Arg Phe Gly Ala Ala Ile Leu Leu Pro

595 600 605

Gly Phe Ser Gln Pro Asn Gly Thr Phe Asn Ala Asn Gln Val Phe Leu

610 615 620

Ala Asp Ile Asp Gly Ser Gly Thr Ala Asp Ile Ile Tyr Ala His Ser

625 630 635 640

Thr Tyr Leu Asp Ile Tyr Leu Asn Glu Ser Gly Asn Arg Phe Ser Ala

645 650 655

Pro Val Arg Leu Asn Leu Pro Glu Gly Val Met Phc Asp Asn Thr Cys

660 665 670

Gln Leu Gln Val Ser Asp Ile Gln Gly Leu Gly Ala Ala Ser Ile Val

675 680 685

Leu Thr Val Pro His Met Thr Pro Arg His Trp Arg Tyr Asp Phe Thr

690 695 700

His Asn Lys Pro Trp Leu Leu Asn Val Ile Asn Asn Asn Arg Gly Ala

705 710 715 720

Glu Thr Thr Leu Phe Tyr Arg Ser Ser Ala Gln Phe Trp Leu Asp Glu

725 730 735

Lys Ser Gln Ile Glu Glu Leu Gly Lys Phe Ala Ala Ser Tyr Leu Pro

740 745 750

Phe Pro Ile His Leu Leu Trp Arg Asn Glu Ala Leu Asp Glu Ile Thr

755 760 765

Gly Asn Arg Leu Thr Lys Val Met Asn Tyr Ala His Gly Ala Trp Asp

770 775 780

Gly Arg Glu Arg Glu Phe Cys Gly Phe Gly Arg Val Thr Gln Ile Asp

785 790 795 800

Thr Asp Glu Phe Ala Lys Gly Thr Thr Glu Lys Ala Pro Asp Glu Asn

805 810 815

Ile Tyr Pro Ser Arg Ser Ile Ser Trp Phe Ala Thr Gly Leu Pro Glu

820 825 830

Val Asp Ser Gln Leu Pro Ala Glu Tyr Trp Arg Gly Asp Asp Gln Ala

835 840 845

Phe Ala Gly Phe Thr Pro Arg Phe Thr Arg Tyr Glu Lys Gly Asn Ala

850 855 860

Gly Gln Glu Gly Gln Asp Thr Pro Ile Lys Glu Pro Thr Glu Thr Glu

865 870 875 880

Ala Tyr Trp Leu Asn Arg Ala Met Lys Gly Gln Leu Leu Arg Ser Glu

885 890 895

Val Tyr Gly Asp Asp Lys Thr Glu Lys Ala Lys Ile Pro Tyr Thr Val

900 905 910

Thr Glu Ala Arg Cys Gln Val Arg Leu Ile Pro Ser Asn Asp Glu Ala

915 920 925

Ala Pro Ser Ser Trp Thr Ser Ile Ile Glu Asn Arg Ser Tyr His Tyr

930 935 940

Glu Arg Ile Val Val Asp Pro Ser Cys Lys Gln Gln Val Val Leu Lys

945 950 955 960

Ala Asp Glu Tyr Gly Phe Pro Leu Ala Lys Val Asp Ile Ala Tyr Pro

965 970 975

Arg Arg Asn Lys Pro Ala Gln Asn Pro Tyr Pro Asp Ser Leu Pro Asp

980 985 990

Thr Leu Phe Ala Asp Ser Tyr Asp Asp Gln Gln Lys Gln Leu Tyr Leu

995 1000 1005

Thr Lys Gln Gln Gln Ser Tyr Tyr His Leu Thr Gln Gln Asp Asp

1010 1015 1020

Trp Val Leu Gly Leu Thr Asp Ser Arg Tyr Ser Glu Val Tyr His

1025 1030 1035

Tyr Ala Gln Thr Asp Ala Gln Ser Asp Ile Pro Lys Ala Gly Leu

1040 1045 1050

Ile Leu Glu Asp Leu Leu Lys Val Asp Gly Leu Ile Gly Lys Asp

1055 1060 1065

Lys Thr Phe Ile Tyr Leu Gly Gln Gln Arg Val Ala Tyr Val Gly

1070 1075 1080

Gly Asp Ala Glu Lys Pro Thr Arg Gln Val Arg Val Ala Tyr Thr

1085 1090 1095

Glu Thr Ala ALa Phe Asp Asp Asn Ala Leu His Ala Phe Asp Gly

1100 1105 1110

Val Ile Ala Pro Asp Glu Leu Thr Gln Gln Leu Leu Ala Gly Gly

1115 1120 1125

Tyr Leu Leu Val Pro Gln Ile Ser Asp Val Ala Gly Ser Ser Glu

1130 1135 1140

Lys Val Trp Val Ala Arg Gln Gly Tyr Thr Glu Tyr Gly Ser Ala

1145 1150 1155

Ala Gln Phe Tyr Arg Pro Leu Ile Gln Arg Lys Ser Leu Leu Thr

1160 1165 1170

Gly Lys Tyr Thr Leu Ser Trp Asp Thr His Tyr Cys Val Val Val

1175 1180 1185

Lys Thr Glu Asp Gly Ala Gly Met Thr Thr Gln Ala Lys Tyr Asp

1190 1195 1200

Tyr Arg Phe Leu Leu Pro Ala Gln Leu Thr Asp Ile Asn Asp Asn

1205 1210 1215

Gln His Ile Val Thr Phe Asn Ala Leu Gly Gln Val Thr Ser Ser

1220 1225 1230

Arg Phe Trp Gly Thr Glu Asn Gly Lys Ile Ser Gly Tyr Ser Thr

1235 1240 1245

Pro Glu Ser Lys Pro Phe Thr Val Pro Asp Thr Val Glu Lys Ala

1250 1255 1260

Leu Ala Leu Gln Pro Thr Ile Pro Val Ser Gln Cys Asn Ile Tyr

1265 1270 1275

Val Pro Asp Ser Trp Met Arg Leu Leu Pro Gln Gln Ser Leu Thr

1280 1285 1290

Gly Gln Leu Lys Glu Gly Glu Thr Leu Trp Asn Ala Leu His Arg

1295 1300 1305

Ala Gly Val Val Thr Glu Asp Gly Leu Ile Cys Glu Leu Ala Tyr

1310 1315 1320

Arg Arg Trp Ile Lys Arg Gln Ala Thr Ser Ser Met Met Ala Val

1325 1330 1335

Thr Leu Gln Gln Ile Leu Ala Gln Thr Pro Arg Gln Pro Pro His

1340 1345 1350

Ala Met Thr Ile Thr Thr Asp Arg Tyr Asp Ser Asp Ser Gln Gln

1355 1360 1365

Gln Leu Arg Gln Ser Ile Val Leu Ser Asp Gly Phe Gly Arg Val

1370 1375 1380

Leu Gln Ser Ala Gln Arg His Glu Ala Gly Glu Ala Trp Gln Arg

1385 1390 1395

Ala Glu Asp Gly Ser Leu Val Val Asp Asn Thr Gly Lys Pro Val

1400 1405 1410

Val Ala Asn Thr Thr Thr Arg Trp Ala Val Ser Gly Arg Thr Glu

1415 1420 1425

Tyr Asp Gly Lys Gly Gln Ala Ile Arg Ala Tyr Leu Pro Tyr Tyr

1430 1435 1440

Leu Asn Asp Trp Arg Tyr Val Ser Asp Asp Ser Ala Arg Asp Asp

1445 1450 1455

Leu Tyr Ala Asp Thr His Phe Tyr Asp Pro Leu Gly Arg Glu Tyr

1460 1465 1470

Gln Val Lys Thr Ala Lys Gly Phe Trp Arg Glu Asn Met Phe Met

1475 1480 1485

Pro Trp Phe Val Val Asn Glu Asp Glu Asn Asp Thr Ala Ala Arg

1490 1495 1500

Leu Thr Ser

1505

<210>3

<211>2889

<212>DNA

<213>伯氏致病杆菌

<400>3

atgaatgttt ttaatccaac tttatatgcc ggtacaccga ctgtcaccgt catggacaat 60

cgagggctgt cagtgcggga tattgcttat caccgtacaa cagcaggaga gcaggctgac 120

actcgcatca cccgccatca atacagtccc cataattttt taatcgagag cattgatcca 180

cgcctttttg atttgcaatc tcagagcacc ataaaaccta atttcaccta ctgtcctgcc 240

ttgaagggtg atgtcctacg gacagagagt gtggatgccg gacaaactgt cattttgagt 300

gacatcgaag gtcgtccgtt actgaatatc agtgcgatgg gtgtcgtcaa acactggcaa 360

tatgaagaga gtacattgcc ggggcgcttg ctcgctgtca gtgaacggaa gaatgaggct 420

tcaacacccc aaattattga acggtttatt tggtcgggaa atagcccatc agaaaaagat 480

cacaatttgg cgggaaaata tcttcgtcat tatgataccg ccggattaaa ccagcttaat 540

gctgtgtctc tgaccagcgt ggatctctca caatcccgtc agttattgca ggatgatgtc 600

acagcagatt ggagcggaag tgacgaatcc cagtggaaga cgcgactgag taacgacata 660

ttcacaaccg aaatcaccgc tgatgcggtt ggcaatttct tgactcagaa tgatgccaaa 720

agcaaccagc aacgattgtc ctatgatgtg gcagggcagt taaaggcaag ctggctgacg 780

ataaaaggcc agaatgagca ggtgatagtt aactccctga cttactccgc cgcagggcag 840

aaactgcgtg aagagcaggg taacggcgtt gtcactgaat actcctatga agcacaaacc 900

tggcgtttga taggtgtaac ggcttaccgt cagtcagata aaaaaagatt gcaggatctt 960

gtctataact atgatccggt cggtaatctc ctgaatattc gcaataatgc agaggcaacc 1020

cgtttctggc gtaatcagat agtagaacca gagaaccact atgcttatga ctcgctttat 1080

caactcatca gtgctagtgg tcgagaaatc gccagtatcg gtcagcaggg cagccggctg 1140

cctgtaccga ttattcctct tcctgccaat gacgatgttt atactcgcta cacccgcaca 1200

tatcactatg atcgcggtgg aaatctctgc cagatccggc attgcgctcc tgctacagat 1260

aataagtaca ccacaaagat caccgtatcg aatcgtagta atcgtgcagt atgggatacc 1320

ttgaccacag atcccgccaa agtggatacc ctgtttgatc atggagggca tcaacttcaa 1380

ctccagtcag gccagacttt atgttggaac tatcggggtg aactacagca aataacaaag 1440

atacagcgtg acgaaaaacc cgcagataaa gagcggtatc gctatggtgt tggggctgcg 1500

cgggtcgtga aaatcagcac acagcaggcg gggggaagca gccatgtgca gcgtgttgtt 1560

tatctgccgg ggttggaact acgcacaact cagcatgatg cgacattaat cgaagactta 1620

caggtgatta tcatgggtga agcaggacgt gctcaggtac gcgtacttca ttgggaaata 1680

ccaccaccgg ataatcttaa caatgactca ctgcgttaca gctacgatag tttgatgggt 1740

tccagtcagc ttgaattgga tggagcaggg cagattatta cgcaggaaga atactacccc 1800

tatggaggta cagcaatatg ggcggcaaga aaccagaccg aagccaatta caaaaccatt 1860

cgctactccg gcaaagagcg tgatgcgacg gggctttatt actacgggca ccgttattat 1920

cagccgtggc tagggcgctg gttgagcgca gatcccgccg gaaccgtgga cggactgaat 1980

ctatatcgaa tggtgaggaa taacccgatt acttaccggg atgcagatgg gcttgcgccg 2040

ataggcgata agatcagcga agggatttat gagcctgagt tgcgagttgg tcttgaacga 2100

gatgacccaa atgtcagaga ttatgaccgg gtttatcctg atacggccaa gacagagatg 2160

atcgaagcaa ctgcgaccac aattgctccc agtcaaatgt tatcggcgca tgcttttgca 2220

tctgtaccta tattgacaga tttgtttaat cctcaaacag caaggctttc tcaaaagaca 2280

acggatattg tattaaacac acaaggtgga ggcgatttaa tctttactgg catgaatatt 2340

aaaggtaagg gaaaagaatt taatgcatta aaaatcgttg atacttatgg cggagaaatg 2400

cctgatagca aaaccgctat ttcagcatat tggcttccgc aaggtgggta tactgatatt 2460

ccgatacatc cgactggaat acaaaagtat ttgtttacgc ctgcgtttag tggttgcact 2520

ctggcagtag ataagcttaa cgaaaataca ttacgggcgt atcacgtcga aggaagtaag 2580

gaagatgctc aatataataa tttagcagtt gcagcgcacg gagagggttt ggtcatggct 2640

atggaatttc ctgactatgg atttcataca gacaaaacag ggcaaagact aaggaacaca 2700

cagggatttg cgtttatgtc ctacaatcaa tcccagaaaa aatgggaaat tcattatcaa 2760

aggcaagcat tgacatcaaa caccggtatc atgaatgtta gtgctaaaaa caagattcga 2820

ttgaatgccc ccagtcatgt aaaaaatagc tcaatcaaag gaactgaaat aatgacgaca 2880

catttttaa 2889

<210>4

<211>962

<212>PRT

<213>伯氏致病杆菌

<400>4

Met Asn Val Phe Asn Pro Thr Leu Tyr Ala Gly Thr Pro Thr Val Thr

1 5 10 15

Val Met Asp Asn Arg Gly Leu Ser Val Arg Asp Ile Ala Tyr His Arg

20 25 30

Thr Thr Ala Gly Glu Gln Ala Asp Thr Arg Ile Thr Arg His Gln Tyr

35 40 45

Ser Pro His Asn Phe Leu Ile Glu Ser Ile Asp Pro Arg Leu Phe Asp

50 55 60

Leu Gln Ser Gln Ser Thr Ile Lys Pro Asn Phe Thr Tyr Cys Pro Ala

65 70 75 80

Leu Lys Gly Asp Val Leu Arg Thr Glu Ser Val Asp Ala Gly Gln Thr

85 90 95

Val Ile Leu Ser Asp Ile Glu Gly Arg Pro Leu Leu Asn Ile Ser Ala

100 105 110

Met Gly Val Val Lys His Trp Gln Tyr Glu Glu Ser Thr Leu Pro Gly

115 120 125

Arg Leu Leu Ala Val Ser Glu Arg Lys Asn Glu Ala Ser Thr Pro Gln

130 135 140

Ile Ile Glu Arg Phe Ile Trp Ser Gly Asn Ser Pro Ser Glu Lys Asp

145 150 155 160

His Asn Leu Ala Gly Lys Tyr Leu Arg His Tyr Asp Thr Ala Gly Leu

165 170 175

Asn Gln Leu Asn Ala Val Ser Leu Thr Ser Val Asp Leu Ser Gln Ser

180 185 190

Arg Gln Leu Leu Gln Asp Asp Val Thr Ala Asp Trp Ser Gly Ser Asp

195 200 205

Glu Ser Gln Trp Lys Thr Arg Leu Ser Asn Asp Ile Phe Thr Thr Glu

210 215 220

Ile Thr Ala Asp Ala Val Gly Asn Phe Leu Thr Gln Asn Asp Ala Lys

225 230 235 240

Ser Asn Gln Gln Arg Leu Ser Tyr Asp Val Ala Gly Gln Leu Lys Ala

245 250 255

Ser Trp Leu Thr Ile Lys Gly Gln Asn Glu Gln Val Ile Val Asn Ser

260 265 270

Leu Thr Tyr Ser Ala Ala Gly Gln Lys Leu Arg Glu Glu Gln Gly Asn

275 280 285

Gly Val Val Thr Glu Tyr Ser Tyr Glu Ala Gln Thr Trp Arg Leu Ile

290 295 300

Gly Val Thr Ala Tyr Arg Gln Ser Asp Lys Lys Arg Leu Gln Asp Leu

305 310 315 320

Val Tyr Asn Tyr Asp Pro Val Gly Asn Leu Leu Asn Ile Arg Asn Asn

325 330 335

Ala Glu Ala Thr Arg Phe Trp Arg Asn Gln Ile Val Glu Pro Glu Asn

340 345 350

His Tyr Ala Tyr Asp Ser Leu Tyr Gln Leu Ile Ser Ala Ser Gly Arg

355 360 365

Glu Ile Ala Ser Ile Gly Gln Gln Gly Ser Arg Leu Pro Val Pro Ile

370 375 380

Ile Pro Leu Pro Ala Asn Asp Asp Val Tyr Thr Arg Tyr Thr Arg Thr

385 390 395 400

Tyr His Tyr Asp Arg Gly Gly Asn Leu Cys Gln Ile Arg His Cys Ala

405 410 415

Pro Ala Thr Asp Asn Lys Tyr Thr Thr Lys Ile Thr Val Ser Asn Arg

420 425 430

Ser Asn Arg Ala Val Trp Asp Thr Leu Thr Thr Asp Pro Ala Lys Val

435 440 445

Asp Thr Leu Phe Asp His Gly Gly His Gln Leu Gln Leu Gln Ser Gly

450 455 460

Gln Thr Leu Cys Trp Asn Tyr Arg Gly Glu Leu Gln Gln Ile Thr Lys

465 470 475 480

Ile Gln Arg Asp Glu Lys Pro Ala Asp Lys Glu Arg Tyr Arg Tyr Gly

485 490 495

Val Gly Ala Ala Arg Val Val Lys Ile Ser Thr Gln Gln Ala Gly Gly

500 505 510

Ser Ser His Val Gln Arg Val Val Tyr Leu Pro Gly Leu Glu Leu Arg

515 520 525

Thr Thr Gln His Asp Ala Thr Leu Ile Glu Asp Leu Gln Val Ile Ile

530 535 540

Met Gly Glu Ala Gly Arg Ala Gln Val Arg Val Leu His Trp Glu Ile

545 550 555 560

Pro Pro Pro Asp Asn Leu Asn Asn Asp Ser Leu Arg Tyr Ser Tyr Asp

565 570 575

Ser Leu Met Gly Ser Ser Gln Leu Glu Leu Asp Gly Ala Gly Gln Ile

580 585 590

Ile Thr Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr Ala Ile Trp Ala

595 600 605

Ala Arg Asn Gln Thr Glu Ala Asn Tyr Lys Thr Ile Arg Tyr Ser Gly

610 615 620

Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly His Arg Tyr Tyr

625 630 635 640

Gln Pro Trp Leu Gly Arg Trp Leu Ser Ala Asp Pro Ala Gly Thr Val

645 650 655

Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn Pro Ile Thr Tyr

660 665 670

Arg Asp Ala Asp Gly Leu Ala Pro Ile Gly Asp Lys Ile Ser Glu Gly

675 680 685

Ile Tyr Glu Pro Glu Leu Arg Val Gly Leu Glu Arg Asp Asp Pro Asn

690 695 700

Val Arg Asp Tyr Asp Arg Val Tyr Pro Asp Thr Ala Lys Thr Glu Met

705 710 715 720

Ile Glu Ala Thr Ala Thr Thr Ile Ala Pro Ser Gln Met Leu Ser Ala

725 730 735

His Ala Phe Ala Ser Val Pro Ile Leu Thr Asp Leu Phe Asn Pro Gln

740 745 750

Thr Ala Arg Leu Ser Gln Lys Thr Thr Asp Ile Val Leu Asn Thr Gln

755 760 765

Gly Gly Gly Asp Leu Ile Phe Thr Gly Met Asn Ile Lys Gly Lys Gly

770 775 780

Lys Glu Phe Asn Ala Leu Lys Ile Val Asp Thr Tyr Gly Gly Glu Met

785 790 795 800

Pro Asp Ser Lys Thr Ala Ile Ser Ala Tyr Trp Leu Pro Gln Gly Gly

805 810 815

Tyr Thr Asp Ile Pro Ile His Pro Thr Gly Ile Gln Lys Tyr Leu Phe

820 825 830

Thr Pro Ala Phe Ser Gly Cys Thr Leu Ala Val Asp Lys Leu Asn Glu

835 840 845

Asn Thr Leu Arg Ala Tyr His Val Glu Gly Ser Lys Glu Asp Ala Gln

850 855 860

Tyr Asn Asn Leu Ala Val Ala Ala His Gly Glu Gly Leu Val Met Ala

865 870 875 880

Met Glu Phe Pro Asp Tyr Gly Phe His Thr Asp Lys Thr Gly Gln Arg

885 890 895

Leu Arg Asn Thr Gln Gly Phe Ala Phe Met Ser Tyr Asn Gln Ser Gln

900 905 910

Lys Lys Trp Glu Ile His Tyr Gln Arg Gln Ala Leu Thr Ser Asn Thr

915 920 925

Gly Ile Met Asn Val Ser Ala Lys Asn Lys Ile Arg Leu Asn Ala Pro

930 935 940

Ser His Val Lys Asn Ser Ser Ile Lys Gly Thr Glu Ile Met Thr Thr

945 950 955 960

His Phe

<210>5

<211>3822

<212>DNA

<213>伯氏致病杆菌

<400>5

gatctcacaa agaccaaaac aaaggggatg tatatttatt ctgacatgac cacaaaagtc 60

atgattgata gtgagatcaa aaattatcaa aacagcgttt accgagagtt cgatacattg 120

acccagcgac ggttaaataa ccgttatgcg gcgaattatg attatccgtc ttccgttgca 180

gtcagtagtg gttacgagtg gggcgattac tctctgagta tggtttatga cagtaaaatt 240

gcttccattg ctaccgtcgg aactacttca tcagagatca aattgaaaat cgatgccgac 300

ctgcgggtaa tttataacgg ggttgaaggc aggcagcgtc accaatgtgc tctgatgcaa 360

aaatttggtc agttaggtga taaatttatt gtttacgaag acctgaaaat tgacagagag 420

aatcagagtg caggcaataa caatctcttt tatcccgttt atcaatacag tggcaatgtc 480

agtaaattgt caaaagggcg tttattagtt tatagagaaa gttcatcatc ttatgtcaag 540

gcagatattg ggccagggca cgatccgctc attaatgaaa atgctcaaaa accttatggt 600

tatgttgaag acagcaaaaa tgaccccgcc gcgctgaaaa ataacatgac actgacggat 660

aacgcgggta tttctacgaa ggtcgcatca ccaagagata tcgatactgc tgtaacgccg 720

gcaaatatca cgattaaggc cagtgcaggc agcagtaaac ctgtagagtt taacgctggc 780

acatctgtca taaatctgcc caacaacaac ttggaagaaa tgatctataa cttccatgat 840

atggaattca ctatcccact gacagaattt aaggacaacc aagtcgaggt ggagatagtg 900

ctgaccggga aaacggatga tggccgggtt ctgggaagtg aaacctttaa ttttaccgtt 960

acacagaaaa ttctgaatga acagtcaggg ttgctgacgc tcaatactgc tgcgtctaaa 1020

gcccaatatc tgcaatgggg gccttaccgt acccgcatta ataccttatt tgccagaaat 1080

atggtggaac gggcagaaac gggcattgat accctgctga caatggatac ccaacaactg 1140

cctgaaccta aaatgggaga tgggggatat attagtgtca ccttacccaa atatgatcca 1200

gataagcatg gtagtaccag aaacgccgcg gtcacacttt atcaggaaaa agatggtgta 1260

gactcaacaa cgcattacgg cttctgggac gggtcgttaa cagatgcaga acaaaccatc 1320

aaactgttta ttccattaac tagcacgaaa gaacctttct ataacacgat tgattttcca 1380

tcttcgataa gtgacgggct tcaagttttt ctaaaaagcg ctaaggaagg tttgctggcc 1440

ggaaccttaa aaacagcgtt tactccatct gaggataaga aggccaatat tgtcttcacg 1500

gaatataccc ctgtttcggg tacgccaccc atgaaggttg aactgctgtc caaatattat 1560

gatcagccga tggattttaa cggcgccaac tccctctact tctgggaatt gttctattac 1620

agcccgatgc tggtagcgca gcgcttgttg caggaacaaa attttgatga agccaatcat 1680

tggctgaaat atgtttacag ccctgagggc tatatcgtca aaggtgagat tgcgccgtat 1740

cattggaatt gccggccact ggaagaagat acttcgtgga actctaaccc gctggattcc 1800

acagaccccg atgccgtcgc ccaagatgat ccgatgcact ataaagtttc taccttcatg 1860

cggatgctcg atctgctgat tgcccgtggc gacaaggctt accgccagct tgagcgggat 1920

actttgaatg aagccaagct ctggtatata caggcactga atctattggg ggatgagcag 1980

tttgtggcgc tggatggcaa ctggtctgaa cccacgttgg aaaccgcagc ggataagacg 2040

gtggaacagg attatcagca tgcgctgatg ttaattcgcc tggtacagcc cgccgaatat 2100

accgctaact cactgaccaa cctatttttg cctcaacaaa atgacaaact gaatggctac 2160

tggcaaacat tgaagcagcg cttgtataac ctgcgtcata acctcaccat tgatggcctg 2220

ccgctgtcac tgcctattta cgccaaacct gccgatccta aagccttgtt gagtgcggcg 2280

gtgaatgctt cccagggagg cacggatctg ccaaatccgg aaatgccact tcatcgtttc 2340

cccatcatgt tggataacgc gaagagcata gtcagtcaac tcattcagtt tggttctacc 2400

ttacagggga tcattgaacg tcaggatgca gaagcgctca acgaattgct gcaaaatcaa 2460

gcgcgtgaac tgacgctgat cagcattcag atgcagaata aaacgctgga agaattggat 2520

gcggaaaaag aagtactgaa acaatcccga ctaggggcgc aatcacgctt tgacagctat 2580

agcaagctgt acgatgaaaa catcaacgat ggcgaaaaaa ctgctatgga tttgcgtact 2640

gctgccagca cgataagtac tgccctggaa gccgctaaat tggcagaggc cggtgccgat 2700

atgttcccaa atatcttcgg tcttgctggt ggtggcagcc gatggggggc tatccctggc 2760

gcacttgctt ctgtgatggg ctttaccgcc ggcacactca atacgaaagc cgaacgaacc 2820

acacagtctg aaatttaccg ccgccgccgt caggagtggg aaattcagcg caccaatgca 2880

gatcatgaag ttaagcaaat tgacgctcaa ttgaaatcac tggaaatccg gcgtgaagcg 2940

gcagacatgc agaaaaccta tctggaaacc cagcaggctc agacacaggc acaattggaa 3000

ttcctgcaac gtaaattcag taacagagcg ttgtacaact ggatgcgggg tcgtctggcc 3060

gccatttact tccagttcta tgatcttgcc acctctcgtt gcctgatggc acagcaagcc 3120

taccagtggg aaaccaatga tacagcagcc agctttatca aatcgggggc atggcaggga 3180

acctatgctg gcctgctcgc cggcgagtct ctgatactga accttgtcca gatggaagat 3240

gccttcatga aaaaagatga acgggcattg gaaatcacgc gtaccgtttc gttggctgag 3300

gtttaccgtt ctctgcctga tgccgataaa ttcatacttc ctgacgcagt tgctgattta 3360

ttgaactccc cggggaaatc attcgggaaa gatcagaaca cactaaaaat tgagacgaat 3420

caactggaag catccgtaaa tctgtctggt ctcaacattt ggggagatta cccggaacaa 3480

cttggcgcgg ctcgtcgcat caaacaagtg agtgtttccc tgcctgcctt gcttggaccg 3540

tatcaggatg tacaggccat cttgagctat agcggtgaca tgaagggcat tcccaaaggt 3600

tgcagtgcta tcgcggtatc caatggcatg aatgacagcg ggcaattcca gttggatttc 3660

aatgacacca aatacctgcc atttgaaggg atcaatattc cgaaagataa agatcaaagt 3720

gcactggtgc tgagtttccc caacgcggac gctaaacaga aaacgatgtt gctcagtttg 3780

agcgacatca ttctgcacat tcgctacacc attcgcaaat aa 3822

<210>6

<211>1273

<212>PRT

<213>伯氏致病杆菌

<400>6

Asp Leu Thr Lys Thr Lys Thr Lys Gly Met Tyr Ile Tyr Ser Asp Met

1 5 10 15

Thr Thr Lys Val Met Ile Asp Ser Glu Ile Lys Asn Tyr Gln Asn Ser

20 25 30

Val Tyr Arg Glu Phe Asp Thr Leu Thr Gln Arg Arg Leu Asn Asn Arg

35 40 45

Tyr Ala Ala Asn Tyr Asp Tyr Pro Ser Ser Val Ala Val Ser Ser Gly

50 55 60

Tyr Glu Trp Gly Asp Tyr Ser Leu Ser Met Val Tyr Asp Ser Lys Ile

65 70 75 80

Ala Ser Ile Ala Thr Val Gly Thr Thr Ser Ser Glu Ile Lys Leu Lys

85 90 95

Ile Asp Ala Asp Leu Arg Val Ile Tyr Asn Gly Val Glu Gly Arg Gln

100 105 110

Arg His Gln Cys Ala Leu Met Gln Lys Phe Gly Gln Leu Gly Asp Lys

115 120 125

Phe Ile Val Tyr Glu Asp Leu Lys Ile Asp Arg Glu Asn Gln Ser Ala

130 135 140

Gly Asn Asn Asn Leu Phe Tyr Pro Val Tyr Gln Tyr Ser Gly Asn Val

145 150 155 160

Ser Lys Leu Ser Lys Gly Arg Leu Leu Val Tyr Arg Glu Ser Ser Ser

165 170 175

Ser Tyr Val Lys Ala Asp Ile Gly Pro Gly His Asp Pro Leu Ile Asn

180 185 190

Glu Asn Ala Gln Lys Pro Tyr Gly Tyr Val Glu Asp Ser Lys Asn Asp

195 200 205

Pro Ala Ala Leu Lys Asn Asn Met Thr Leu Thr Asp Asn Ala Gly Ile

210 215 220

Ser Thr Lys Val Ala Ser Pro Arg Asp Ile Asp Thr Ala Val Thr Pro

225 230 235 240

Ala Asn Ile Thr Ile Lys Ala Ser Ala Gly Ser Ser Lys Pro Val Glu

245 250 255

Phe Asn Ala Gly Thr Ser Val Ile Asn Leu Pro Asn Asn Asn Leu Glu

260 265 270

Glu Met Ile Tyr Asn Phe His Asp Met Glu Phe Thr Ile Pro Leu Thr

275 280 285

Glu Phe Lys Asp Asn Gln Val Glu Val Glu Ile Val Leu Thr Gly Lys

290 295 300

Thr Asp Asp Gly Arg Val Leu Gly Ser Glu Thr Phe Asn Phe Thr Val

305 310 315 320

Thr Gln Lys Ile Leu Asn Glu Gln Ser Gly Leu Leu Thr Leu Asn Thr

325 330 335

Ala Ala Ser Lys Ala Gln Tyr Leu Gln Trp Gly Pro Tyr Arg Thr Arg

340 345 350

Ile Asn Thr Leu Phe Ala Arg Asn Met Val Glu Arg Ala Glu Thr Gly

355 360 365

Ile Asp Thr Leu Leu Thr Met Asp Thr Gln Gln Leu Pro Glu Pro Lys

370 375 380

Met Gly Asp Gly Gly Tyr Ile Ser Val Thr Leu Pro Lys Tyr Asp Pro

385 390 395 400

Asp Lys His Gly Ser Thr Arg Asn Ala Ala Val Thr Leu Tyr Gln Glu

405 410 415

Lys Asp Gly Val Asp Ser Thr Thr His Tyr Gly Phe Trp Asp Gly Ser

420 425 430

Leu Thr Asp Ala Glu Gln Thr Ile Lys Leu Phe Ile Pro Leu Thr Ser

435 440 445

Thr Lys Glu Pro Phe Tyr Asn Thr Ile Asp Phe Pro Ser Ser Ile Ser

450 455 460

Asp Gly Leu Gln Val Phe Leu Lys Ser Ala Lys Glu Gly Leu Leu Ala

465 470 475 480

Gly Thr Leu Lys Thr Ala Phe Thr Pro Ser Glu Asp Lys Lys Ala Asn

485 490 495

Ile Val Phe Thr Glu Tyr Thr Pro Val Ser Gly Thr Pro Pro Met Lys

500 505 510

Val Glu Leu Leu Ser Lys Tyr Tyr Asp Gln Pro Met Asp Phe Asn Gly

515 520 525

Ala Asn Ser Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Ser Pro Met Leu

530 535 540

Val Ala Gln Arg Leu Leu Gln Glu Gln Asn Phe Asp Glu Ala Asn His

545 550 555 560

Trp Leu Lys Tyr Val Tyr Ser Pro Glu Gly Tyr Ile Val Lys Gly Glu

565 570 575

Ile Ala Pro Tyr His Trp Asn Cys Arg Pro Leu Glu Glu Asp Thr Ser

580 585 590

Trp Asn Ser Asn Pro Leu Asp Ser Thr Asp Pro Asp Ala Val Ala Gln

595 600 605

Asp Asp Pro Met His Tyr Lys Val Ser Thr Phe Met Arg Met Leu Asp

610 615 620

Leu Leu Ile Ala Arg Gly Asp Lys Ala Tyr Arg Gln Leu Glu Arg Asp

625 630 635 640

Thr Leu Asn Glu Ala Lys Leu Trp Tyr Ile Gln Ala Leu Asn Leu Leu

645 650 655

Gly Asp Glu Gln Phe Val Ala Leu Asp Gly Asn Trp Ser Glu Pro Thr

660 665 670

Leu Glu Thr Ala Ala Asp Lys Thr Val Glu Gln Asp Tyr Gln His Ala

675 680 685

Leu Met Leu Ile Arg Leu Val Gln Pro Ala Glu Tyr Thr Ala Asn Ser

690 695 700

Leu Thr Asn Leu Phe Leu Pro Gln Gln Asn Asp Lys Leu Asn Gly Tyr

705 710 715 720

Trp Gln Thr Leu Lys Gln Arg Leu Tyr Asn Leu Arg His Asn Leu Thr

725 730 735

Ile Asp Gly Leu Pro Leu Ser Leu Pro Ile Tyr Ala Lys Pro Ala Asp

740 745 750

Pro Lys Ala Leu Lcu Ser Ala Ala Val Asn Ala Ser Gln Gly Gly Thr

755 760 765

Asp Leu Pro Asn Pro Glu Met Pro Leu His Arg Phe Pro Ile Met Leu

770 775 780

Asp Asn Ala Lys Ser Ile Val Ser Gln Leu Ile Gln Phe Gly Scr Thr

785 790 795 800

Leu Gln Gly Ile Ile Glu Arg Gln Asp Ala Glu Ala Leu Asn Glu Leu

805 810 815

Leu Gln Asn Gln Ala Arg Glu Leu Thr Leu Ile Ser Ile Gln Met Gln

820 825 830

Asn Lys Thr Leu Glu Glu Leu Asp Ala Glu Lys Glu Val Leu Lys Gln

835 840 845

Ser Arg Leu Gly Ala Gln Ser Arg Phe Asp Ser Tyr Ser Lys Leu Tyr

850 855 860

Asp Glu Asn Ile Asn Asp Gly Glu Lys Thr Ala Met Asp Leu Arg Thr

865 870 875 880

Ala Ala Ser Thr Ile Ser Thr Ala Leu Glu Ala Ala Lys Leu Ala Glu

885 890 895

Ala Gly Ala Asp Met Phe Pro Asn Ile Phe Gly Leu Ala Gly Gly Gly

900 905 910

Ser Arg Trp Gly Ala Ile Pro Gly Ala Leu Ala Ser Val Met Gly Phe

915 920 925

Thr Ala Gly Thr Leu Asn Thr Lys Ala Glu Arg Thr Thr Gln Ser Glu

930 935 940

Ile Tyr Arg Arg Arg Arg Gln Glu Trp Glu Ile Gln Arg Thr Asn Ala

945 950 955 960

Asp His Glu Val Lys Gln Ile Asp Ala Gln Leu Lys Ser Leu Glu Ile

965 970 975

Arg Arg Glu Ala Ala Asp Met Gln Lys Thr Tyr Leu Glu Thr Gln Gln

980 985 990

Ala Gln Thr Gln Ala Gln Leu Glu Phe Leu Gln Arg Lys Phe Ser Asn

995 1000 1005

Arg Ala Leu Tyr Asn Trp Met Arg Gly Arg Leu Ala Ala Ile Tyr

1010 1015 1020

Phe Gln Phe Tyr Asp Leu Ala Thr Ser Arg Cys Leu Met Ala Gln

1025 1030 1035

Gln Ala Tyr Gln Trp Glu Thr Asn Asp Thr Ala Ala Ser Phe Ile

1040 1045 1050

Lys Ser Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Ala Gly

1055 1060 1065

Glu Ser Leu Ile Leu Asn Leu Val Gln Met Glu Asp Ala Phe Met

1070 1075 1080

Lys Lys Asp Glu Arg Ala Leu Glu Ile Thr Arg Thr Val Ser Leu

1085 1090 1095

Ala Glu Val Tyr Arg Ser Leu Pro Asp Ala Asp Lys Phe Ile Leu

1100 1105 1110

Pro Asp Ala Val Ala Asp Leu Leu Asn Ser Pro Gly Lys Ser Phe

1115 1120 1125

Gly Lys Asp Gln Asn Thr Leu Lys Ile Glu Thr Asn Gln Leu Glu

1130 1135 1140

Ala Ser Val Asn Leu Ser Gly Leu Asn Ile Trp Gly Asp Tyr Pro

1145 1150 1155

Glu Gln Leu Gly Ala Ala Arg Arg Ile Lys Gln Val Ser Val Ser

1160 1165 1170

Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile Leu

1175 1180 1185

Ser Tyr Ser Gly Asp Met Lys Gly Ile Pro Lys Gly Cys Ser Ala

1190 1195 1200

Ile Ala Val Ser Asn Gly Met Asn Asp Ser Gly Gln Phe Gln Leu

1205 1210 1215

Asp Phe Asn Asp Thr Lys Tyr Leu Pro Phe Glu Gly Ile Asn Ile

1220 1225 1230

Pro Lys Asp Lys Asp Gln Ser Ala Leu Val Leu Ser Phe Pro Asn

1235 1240 1245

Ala Asp Ala Lys Gln Lys Thr Met Leu Leu Ser Leu Ser Asp Ile

1250 1255 1260

Ile Leu His Ile Arg Tyr Thr Ile Arg Lys

1265 1270

<210>7

<211>4595

<212>DNA

<213>伯氏致病杆菌

<400>7

tctagaacta gtgtcgacta aagaagaagg agatatacca tgaaacaaga cagccaggac 60

atgacagtaa cacagctgtc cctgcccaaa gggggcggtg cgatcagtgg catgggtgac 120

actatcagca atgcagggcc ggatgggatg gcttcgcttt ccgtgccttt gcctatctct 180

gccggtcggg ggggcgcacc gaatttatcc ctgaactaca gtagcggagc aggaaacggg 240

tcatttggta ttggctggca atccagtacc atggctatca gccgtcgtac tcaacatggc 300

gtaccgcaat atcacggcga agatactttt ttatgtccga tgggagaagt gatggcggtt 360

gccgtcaatc agagcgggca acccgatgtg cgtaaaaccg ataaactatt aggcgggcaa 420

ctgcctgtta cttataccgt tacgcgtcat cagcccagaa atattcagca cttcagcaaa 480

cttgaatact ggcagccccc aacggatgtg gaaaccacgc ctttttggtt aatgtattca 540

cccgatggac aaattcacat tttcggaaaa actgagcagg ctcagatcgc taacccggca 600

gaggtttcac agattgccca atggcttttg gaagaaaccg taacaccagc gggagaacac 660

atttattacc agtatcgggc agaagacgat atcggttgtg atgacagcga aaaaaatgcc 720

caccctaatg ccagtgctca acgttatttg actcaggtga actacggcaa tattacacct 780

gaatccagcc tgcttgtgct gaagaatacg ccaccggcgg ataacgaatg gctattccat 840

ttggtttttg attatggtga acgagcgcag gaaataaaca cggttcctcc tttcaaagca 900

ccttcaaaca actggaaaat acggccagac cgtttctccc gctttgaata tggttttgag 960

gtgcgaaccc gccgcctgtg tcaacaaatt ctgatgttcc atcgcctgaa atcccttgca 1020

ggagaacaga ttgacggaga agaaatccct gccttggttg cccgtctgct tctcagttat 1080

gacctgaacg acagcgtgac aacccttacc gccattcggc aaatggcgta tgaaactgac 1140

gcaaccttaa tcgctttacc gccactggag tttgactatc agccctttga ggcaaaagtc 1200

acgcagaaat ggcaggaaat gcctcaattg gccggattga atgcccaaca accttaccaa 1260

ctcgtcgatc tctatggtga aggtatctcc ggcatcttgt atcaggacag acccggagca 1320

tggtggtatc aggcaccgat ccgtcagaaa aacgttgaag atattaacgc tgtcacctat 1380

agcccaataa accccttacc taagatcccc agccagcagg acagagcaac gttgatggat 1440

atcgacggtg atggacatct ggattgggtg atcgctggcg caggtattca ggggcggtac 1500

agtatgcagc cgaatggaga gtggacacac tttattccca tttctgcact gccaacagaa 1560

tattttcatc cacaggcaca actggcggat ctggtggggg ccgggttatc tgatttagcg 1620

ctgattggcc ccagaagtgt gcgtttatat gccaacgacc gaggaaactg gaaagcgggt 1680

attaatgtta tgccacctga tggtgtgaat ttgccgatat ttggtggtga tgccagcagt 1740

ctggtcgcat tttctgacat gttgggatcg ggacagcagc atttggtgga aattgccgct 1800

cagagcgtca aatgctggcc gaatctagga catggccgtt ttggtgcggc tattttgctg 1860

ccggggttta gccagccgaa tggaacattc aatgctaacc aagtttttct ggcagatatc 1920

gatggttccg gcaccgccga catcatctat gcacacagta cgtatctgga tatttacctg 1980

aacgaaagcg gcaaccgttt cagtgcaccc gttcggctta atttgccgga aggggtgatg 2040

tttgacaata cctgtcagtt acaggtgtcg gatattcaag gattgggcgc tgccagcatt 2100

gtactgaccg tacctcatat gacaccgcgc cattggcgtt atgattttac tcacaataaa 2160

ccttggctgc tcaatgtcat caacaacaat cgtggcgcag aaaccacgtt gttttaccgt 2220

agttctgccc aattctggct ggatgaaaaa agtcagatcg aagagctggg aaaatttgca 2280

gcgagttatc tgcctttccc catacatttg ttgtggcgca atgaggcgct ggatgaaatt 2340

actggtaatc gactgactaa ggtcatgaat tatgcccacg gtgcatggga tggcagagag 2400

agagaatttt gcggatttgg ccgtgtaacg caaattgata ccgacgaatt tgccaaggga 2460

accacagaga aagcgccgga tgaaaatatc tatccttccc gtagcataag ctggtttgcc 2520

acgggtttac cagaagtgga ttctcaactt ccggcagaat actggcgtgg tgacgatcag 2580

gcatttgccg gctttacacc gcgcttcact cgttatgaaa aaggtaatgc ggggcaagag 2640

gggcaggata ccccgattaa agaaccgacc gaaacagaag cgtattggct taaccgcgcc 2700

atgaaaggcc aattactgcg cagtgaagtc tatggtgacg acaaaacaga aaaagctaaa 2760

attccgtaca ccgtcacaga agctcgctgt caggtcagat taattcccag caatgacgaa 2820

gccgcgccgt cgtcttggac gtcgatcatt gaaaaccgca gttatcacta tgagcgtatc 2880

gtcgtcgatc cgagttgcaa acaacaggtc gtgctcaagg cggatgaata tggcttccca 2940

ctggcaaaag tagatatcgc ctatccacgg cgcaataaac cggcacagaa cccttatccg 3000

gattcgttac cggatactct gttcgccgat agctatgacg accagcaaaa acagttatat 3060

ctgacaaaac agcagcagag ctattaccac ctgacccagc aggatgattg ggttctgggt 3120

ttgacggata gccgatacag cgaagtttat cattatgcgc aaactgacgc tcaaagtgac 3180

atccccaagg cagggctgat attggaagac ctgctgaaag ttgacggcct gataggtaaa 3240

gacaagactt ttatctattt agggcagcag cgagtggctt atgtgggagg agatgcagaa 3300

aaaccgacac gtcaggtgcg ggtggcttat acagaaaccg ctgcttttga tgacaatgcg 3360

ctgcacgcct ttgatggcgt gattgcccct gatgaactga cgcaacagtt gctggcgggt 3420

ggatacctgc tcgtgccgca gatttctgat gtggcaggca gtagtgaaaa ggtatgggta 3480

gctcggcagg gatacaccga atacggcagt gctgctcaat tctaccggcc actcatccag 3540

cgcaaaagct tgctgaccgg aaaatatacc cttagttggg atacgcacta ttgtgtggtg 3600

gtaaaaaccg aagatggtgc gggaatgacc acgcaagcga agtacgatta ccgcttcctg 3660

cttccggcgc aattgacaga tatcaatgac aaccagcaca tcgtgacatt taatgcattg 3720

gggcaggtga cttccagccg tttctggggc acagaaaatg gcaaaataag cggttactcg 3780

acgccggaga gtaaaccgtt cacagtaccc gataccgtcg aaaaagccct tgccttgcaa 3840

ccgacgatcc cggtttcaca gtgcaacatt tatgtgccgg atagttggat gcggcttctg 3900

ccccaacagt ctctgactgg ccagctaaaa gagggggaaa ctttgtggaa cgcattacac 3960

cgggcgggtg tagtaacgga agacggtttg atctgtgaac tggcctatcg tcgttggatc 4020

aaacgtcagg caacgtcttc aatgatggcc gtgacattac agcaaatctt ggctcagact 4080

ccacgacaac ctccgcatgc catgacgatc acgacagatc gttatgacag cgattctcag 4140

cagcaacttc ggcagtcgat agtattgagt gatggttttg gtcgcgtatt gcaaagcgcc 4200

cagcgtcatg aagcaggaga ggcatggcag cgtgcagaag atggttcttt ggttgtcgat 4260

aataccggta aacccgttgt tgctaatacc acaacgcgct gggcagtatc cggtcgcaca 4320

gaatacgacg gcaaagggca ggcgatcaga gcttacctgc cttattatct caatgattgg 4380

cgctatgtca gtgatgacag cgcccgggat gacctgtacg ccgataccca tttttacgat 4440

cctctggggc gtgaatatca ggtaaaaacc gcgaaaggat tttggcgtga aaacatgttt 4500

atgccgtggt ttgtcgtcaa tgaagatgaa aatgacacag cagcacgttt aacatcttaa 4560

ttaatgcggc cgcaggcctc tgtaagactc tcgag 4595

<210>8

<211>2947

<212>DNA

<213>伯氏致病杆菌

<400>8

tctagaacta gtaggcctta aagaagagag agatatacca tgaatgtttt taatccaact 60

ttatatgccg gtacaccgac tgtcaccgtc atggacaatc gagggctgtc agtgcgggat 120

attgcttatc accgtacaac agcaggagag caggctgaca ctcgcatcac ccgccatcaa 180

tacagtcccc ataatttttt aatcgagagc attgatccac gcctttttga tttgcaatct 240

cagagcacca taaaacctaa tttcacctac tgtcctgcct tgaagggtga tgtcctacgg 300

acagagagtg tggatgccgg acaaactgtc attttgagtg acatcgaagg tcgtccgtta 360

ctgaatatca gtgcgatggg tgtcgtcaaa cactggcaat atgaagagag tacattgccg 420

gggcgcttgc tcgctgtcag tgaacggaag aatgaggctt caacacccca aattattgaa 480

cggtttattt ggtcgggaaa tagcccatca gaaaaagatc acaatttggc gggaaaatat 540

cttcgtcatt atgataccgc cggattaaac cagcttaatg ctgtgtctct gaccagcgtg 600

gatctctcac aatcccgtca gttattgcag gatgatgtca cagcagattg gagcggaagt 660

gacgaatccc agtggaagac gcgactgagt aacgacatat tcacaaccga aatcaccgct 720

gatgcggttg gcaatttctt gactcagaat gatgccaaaa gcaaccagca acgattgtcc 780

tatgatgtgg cagggcagtt aaaggcaagc tggctgacga taaaaggcca gaatgagcag 840

gtgatagtta actccctgac ttactccgcc gcagggcaga aactgcgtga agagcagggt 900

aacggcgttg tcactgaata ctcctatgaa gcacaaacct ggcgtttgat aggtgtaacg 960

gcttaccgtc agtcagataa aaaaagattg caggatcttg tctataacta tgatccggtc 1020

ggtaatctcc tgaatattcg caataatgca gaggcaaccc gtttctggcg taatcagata 1080

gtagaaccag agaaccacta tgcttatgac tcgctttatc aactcatcag tgctagtggt 1140

cgagaaatcg ccagtatcgg tcagcagggc agccggctgc ctgtaccgat tattcctctt 1200

cctgccaatg acgatgttta tactcgctac acccgcacat atcactatga tcgcggtgga 1260

aatctctgcc agatccggca ttgcgctcct gctacagata ataagtacac cacaaagatc 1320

accgtatcga atcgtagtaa tcgtgcagta tgggatacct tgaccacaga tcccgccaaa 1380

gtggataccc tgtttgatca tggagggcat caacttcaac tccagtcagg ccagacttta 1440

tgttggaact atcggggtga actacagcaa ataacaaaga tacagcgtga cgaaaaaccc 1500

gcagataaag agcggtatcg ctatggtgtt ggggctgcgc gggtcgtgaa aatcagcaca 1560

cagcaggcgg ggggaagcag ccatgtgcag cgtgttgttt atctgccggg gttggaacta 1620

cgcacaactc agcatgatgc gacattaatc gaagacttac aggtgattat catgggtgaa 1680

gcaggacgtg ctcaggtacg cgtacttcat tgggaaatac caccaccgga taatcttaac 1740

aatgactcac tgcgttacag ctacgatagt ttgatgggtt ccagtcagct tgaattggat 1800

ggagcagggc agattattac gcaggaagaa tactacccct atggaggtac agcaatatgg 1860

gcggcaagaa accagaccga agccaattac aaaaccattc gctactccgg caaagagcgt 1920

gatgcgacgg ggctttatta ctacgggcac cgttattatc agccgtggct agggcgctgg 1980

ttgagcgcag atcccgccgg aaccgtggac ggactgaatc tatatcgaat ggtgaggaat 2040

aacccgatta cttaccggga tgcagatggg cttgcgccga taggcgataa gatcagcgaa 2100

gggatttatg agcctgagtt gcgagttggt cttgaacgag atgacccaaa tgtcagagat 2160

tatgaccggg tttatcctga tacggccaag acagagatga tcgaagcaac tgcgaccaca 2220

attgctccca gtcaaatgtt atcggcgcat gcttttgcat ctgtacctat attgacagat 2280

ttgtttaatc ctcaaacagc aaggctttct caaaagacaa cggatattgt attaaacaca 2340

caaggtggag gcgatttaat ctttactggc atgaatatta aaggtaaggg aaaagaattt 2400

aatgcattaa aaatcgttga tacttatggc ggagaaatgc ctgatagcaa aaccgctatt 2460

tcagcatatt ggcttccgca aggtgggtat actgatattc cgatacatcc gactggaata 2520

caaaagtatt tgtttacgcc tgcgtttagt ggttgcactc tggcagtaga taagcttaac 2580

gaaaatacat tacgggcgta tcacgtcgaa ggaagtaagg aagatgctca atataataat 2640

ttagcagttg cagcgcacgg agagggtttg gtcatggcta tggaatttcc tgactatgga 2700

tttcatacag acaaaacagg gcaaagacta aggaacacac agggatttgc gtttatgtcc 2760

tacaatcaat cccagaaaaa atgggaaatt cattatcaaa ggcaagcatt gacatcaaac 2820

accggtatca tgaatgttag tgctaaaaac aagattcgat tgaatgcccc cagtcatgta 2880

aaaaatagct caatcaaagg aactgaaata atgacgacac atttttaatt aatgcggccg 2940

cctcgag 2947

<210>9

<211>7508

<212>DNA

<213>伯氏致病杆菌

<400>9

tctagaacta gtgtcgacta aagaagaagg agatatacca tgaaacaaga cagccaggac 60

atgacagtaa cacagctgtc cctgcccaaa gggggcggtg cgatcagtgg catgggtgac 120

actatcagca atgcagggcc ggatgggatg gcttcgcttt ccgtgccttt gcctatctct 180

gccggtcggg ggggcgcacc gaatttatcc ctgaactaca gtagcggagc aggaaacggg 240

tcatttggta ttggctggca atccagtacc atggctatca gccgtcgtac tcaacatggc 300

gtaccgcaat atcacggcga agatactttt ttatgtccga tgggagaagt gatggcggtt 360

gccgtcaatc agagcgggca acccgatgtg cgtaaaaccg ataaactatt aggcgggcaa 420

ctgcctgtta cttataccgt tacgcgtcat cagcccagaa atattcagca cttcagcaaa 480

cttgaatact ggcagccccc aacggatgtg gaaaccacgc ctttttggtt aatgtattca 540

cccgatggac aaattcacat tttcggaaaa actgagcagg ctcagatcgc taacccggca 600

gaggtttcac agattgccca atggcttttg gaagaaaccg taacaccagc gggagaacac 660

atttattacc agtatcgggc agaagacgat atcggttgtg atgacagcga aaaaaatgcc 720

caccctaatg ccagtgctca acgttatttg actcaggtga actacggcaa tattacacct 780

gaatccagcc tgcttgtgct gaagaatacg ccaccggcgg ataacgaatg gctattccat 840

ttggtttttg attatggtga acgagcgcag gaaataaaca cggttcctcc tttcaaagca 900

ccttcaaaca actggaaaat acggccagac cgtttctccc gctttgaata tggttttgag 960

gtgcgaaccc gccgcctgtg tcaacaaatt ctgatgttcc atcgcctgaa atcccttgca 1020

ggagaacaga ttgacggaga agaaatccct gccttggttg cccgtctgct tctcagttat 1080

gacctgaacg acagcgtgac aacccttacc gccattcggc aaatggcgta tgaaactgac 1140

gcaaccttaa tcgctttacc gccactggag tttgactatc agccctttga ggcaaaagtc 1200

acgcagaaat ggcaggaaat gcctcaattg gccggattga atgcccaaca accttaccaa 1260

ctcgtcgatc tctatggtga aggtatctcc ggcatcttgt atcaggacag acccggagca 1320

tggtggtatc aggcaccgat ccgtcagaaa aacgttgaag atattaacgc tgtcacctat 1380

agcccaataa accccttacc taagatcccc agccagcagg acagagcaac gttgatggat 1440

atcgacggtg atggacatct ggattgggtg atcgctggcg caggtattca ggggcggtac 1500

agtatgcagc cgaatggaga gtggacacac tttattccca tttctgcact gccaacagaa 1560

tattttcatc cacaggcaca actggcggat ctggtggggg ccgggttatc tgatttagcg 1620

ctgattggcc ccagaagtgt gcgtttatat gccaacgacc gaggaaactg gaaagcgggt 1680

attaatgtta tgccacctga tggtgtgaat ttgccgatat ttggtggtga tgccagcagt 1740

ctggtcgcat tttctgacat gttgggatcg ggacagcagc atttggtgga aattgccgct 1800

cagagcgtca aatgctggcc gaatctagga catggccgtt ttggtgcggc tattttgctg 1860

ccggggttta gccagccgaa tggaacattc aatgctaacc aagtttttct ggcagatatc 1920

gatggttccg gcaccgccga catcatctat gcacacagta cgtatctgga tatttacctg 1980

aacgaaagcg gcaaccgttt cagtgcaccc gttcggctta atttgccgga aggggtgatg 2040

tttgacaata cctgtcagtt acaggtgtcg gatattcaag gattgggcgc tgccagcatt 2100

gtactgaccg tacctcatat gacaccgcgc cattggcgtt atgattttac tcacaataaa 2160

ccttggctgc tcaatgtcat caacaacaat cgtggcgcag aaaccacgtt gttttaccgt 2220

agttctgccc aattctggct ggatgaaaaa agtcagatcg aagagctggg aaaatttgca 2280

gcgagttatc tgcctttccc catacatttg ttgtggcgca atgaggcgct ggatgaaatt 2340

actggtaatc gactgactaa ggtcatgaat tatgcccacg gtgcatggga tggcagagag 2400

agagaatttt gcggatttgg ccgtgtaacg caaattgata ccgacgaatt tgccaaggga 2460

accacagaga aagcgccgga tgaaaatatc tatccttccc gtagcataag ctggtttgcc 2520

acgggtttac cagaagtgga ttctcaactt ccggcagaat actggcgtgg tgacgatcag 2580

gcatttgccg gctttacacc gcgcttcact cgttatgaaa aaggtaatgc ggggcaagag 2640

gggcaggata ccccgattaa agaaccgacc gaaacagaag cgtattggct taaccgcgcc 2700

atgaaaggcc aattactgcg cagtgaagtc tatggtgacg acaaaacaga aaaagctaaa 2760

attccgtaca ccgtcacaga agctcgctgt caggtcagat taattcccag caatgacgaa 2820

gccgcgccgt cgtcttggac gtcgatcatt gaaaaccgca gttatcacta tgagcgtatc 2880

gtcgtcgatc cgagttgcaa acaacaggtc gtgctcaagg cggatgaata tggcttccca 2940

ctggcaaaag tagatatcgc ctatccacgg cgcaataaac cggcacagaa cccttatccg 3000

gattcgttac cggatactct gttcgccgat agctatgacg accagcaaaa acagttatat 3060

ctgacaaaac agcagcagag ctattaccac ctgacccagc aggatgattg ggttctgggt 3120

ttgacggata gccgatacag cgaagtttat cattatgcgc aaactgacgc tcaaagtgac 3180

atccccaagg cagggctgat attggaagac ctgctgaaag ttgacggcct gataggtaaa 3240

gacaagactt ttatctattt agggcagcag cgagtggctt atgtgggagg agatgcagaa 3300

aaaccgacac gtcaggtgcg ggtggcttat acagaaaccg ctgcttttga tgacaatgcg 3360

ctgcacgcct ttgatggcgt gattgcccct gatgaactga cgcaacagtt gctggcgggt 3420

ggatacctgc tcgtgccgca gatttctgat gtggcaggca gtagtgaaaa ggtatgggta 3480

gctcggcagg gatacaccga atacggcagt gctgctcaat tctaccggcc actcatccag 3540

cgcaaaagct tgctgaccgg aaaatatacc cttagttggg atacgcacta ttgtgtggtg 3600

gtaaaaaccg aagatggtgc gggaatgacc acgcaagcga agtacgatta ccgcttcctg 3660

cttccggcgc aattgacaga tateaatgac aaccagcaca tcgtgacatt taatgcattg 3720

gggcaggtga cttccagccg tttctggggc acagaaaatg gcaaaataag cggttactcg 3780

acgccggaga gtaaaccgtt cacagtaccc gataccgtcg aaaaagccct tgccttgcaa 3840

ccgacgatcc cggtttcaca gtgcaacatt tatgtgccgg atagttggat gcggcttctg 3900

ccccaacagt ctctgactgg ccagctaaaa gagggggaaa ctttgtggaa cgcattacac 3960

cgggcgggtg tagtaacgga agacggtttg atctgtgaac tggcctatcg tcgttggatc 4020

aaacgtcagg caacgtcttc aatgatggcc gtgacattac agcaaatctt ggctcagact 4080

ccacgacaac ctccgcatgc catgacgatc acgacagatc gttatgacag cgattctcag 4140

cagcaacttc ggcagtcgat agtattgagt gatggttttg gtcgcgtatt gcaaagcgcc 4200

cagcgtcatg aagcaggaga ggcatggcag cgtgcagaag atggttcttt ggttgtcgat 4260

aataccggta aacccgttgt tgctaatacc acaacgcgct gggcagtatc cggtcgcaca 4320

gaatacgacg gcaaagggca ggcgatcaga gcttacctgc cttattatct caatgattgg 4380

cgctatgtca gtgatgacag cgcccgggat gacctgtacg ccgataccca tttttacgat 4440

cctctggggc gtgaatatca ggtaaaaacc gcgaaaggat tttggcgtga aaacatgttt 4500

atgccgtggt ttgtcgtcaa tgaagatgaa aatgacacag cagcacgttt aacatcttaa 4560

ttaatgcggc cgcaggcctt aaagaagaga gagatatacc atgaatgttt ttaatccaac 4620

tttatatgcc ggtacaccga ctgtcaccgt catggacaat cgagggctgt cagtgcggga 4680

tattgcttat caccgtacaa cagcaggaga gcaggctgac actcgcatca cccgccatca 4740

atacagtccc cataattttt taatcgagag cattgatcca cgcctttttg atttgcaatc 4800

tcagagcacc ataaaaccta atttcaccta ctgtcctgcc ttgaagggtg atgtcctacg 4860

gacagagagt gtggatgccg gacaaactgt cattttgagt gacatcgaag gtcgtccgtt 4920

actgaatatc agtgcgatgg gtgtcgtcaa acactggcaa tatgaagaga gtacattgcc 4980

ggggcgcttg ctcgctgtca gtgaacggaa gaatgaggct tcaacacccc aaattattga 5040

acggtttatt tggtcgggaa atagcccatc agaaaaagat cacaatttgg cgggaaaata 5100

tcttcgtcat tatgataccg ccggattaaa ccagcttaat gctgtgtctc tgaccagcgt 5160

ggatctctca caatcccgtc agttattgca ggatgatgtc acagcagatt ggagcggaag 5220

tgacgaatcc cagtggaaga cgcgactgag taacgacata ttcacaaccg aaatcaccgc 5280

tgatgcggtt ggcaatttct tgactcagaa tgatgccaaa agcaaccagc aacgattgtc 5340

ctatgatgtg gcagggcagt taaaggcaag ctggctgacg ataaaaggcc agaatgagca 5400

ggtgatagtt aactccctga cttactccgc cgcagggcag aaactgcgtg aagagcaggg 5460

taacggcgtt gtcactgaat actcctatga agcacaaacc tggcgtttga taggtgtaac 5520

ggcttaccgt cagtcagata aaaaaagatt gcaggatctt gtctataact atgatccggt 5580

cggtaatctc ctgaatattc gcaataatgc agaggcaacc cgtttctggc gtaatcagat 5640

agtagaacca gagaaccact atgcttatga ctcgctttat caactcatca gtgctagtgg 5700

tcgagaaatc gccagtatcg gtcagcaggg cagccggctg cctgtaccga ttattcctct 5760

tcctgccaat gacgatgttt atactcgcta cacccgcaca tatcactatg atcgcggtgg 5820

aaatctctgc cagatccggc attgcgctcc tgctacagat aataagtaca ccacaaagat 5880

caccgtatcg aatcgtagta atcgtgcagt atgggatacc ttgaccacag atcccgccaa 5940

agtggatacc ctgtttgatc atggagggca tcaacttcaa ctccagtcag gccagacttt 6000

atgttggaac tatcggggtg aactacagca aataacaaag atacagcgtg acgaaaaacc 6060

cgcagataaa gagcggtatc gctatggtgt tggggctgcg cgggtcgtga aaatcagcac 6120

acagcaggcg gggggaagca gccatgtgca gcgtgttgtt tatctgccgg ggttggaact 6180

acgcacaact cagcatgatg cgacattaat cgaagactta caggtgatta tcatgggtga 6240

agcaggacgt gctcaggtac gcgtacttca ttgggaaata ccaccaccgg ataatcttaa 6300

caatgactca ctgcgttaca gctacgatag tttgatgggt tccagtcagc ttgaattgga 6360

tggagcaggg cagattatta cgcaggaaga atactacccc tatggaggta cagcaatatg 6420

ggcggcaaga aaccagaccg aagccaatta caaaaccatt cgctactccg gcaaagagcg 6480

tgatgcgacg gggctttatt actacgggca ccgttattat cagccgtggc tagggcgctg 6540

gttgagcgca gatcccgccg gaaccgtgga cggactgaat ctatatcgaa tggtgaggaa 6600

taacccgatt acttaccggg atgcagatgg gcttgcgccg ataggcgata agatcagcga 6660

agggatttat gagcctgagt tgcgagttgg tcttgaacga gatgacccaa atgtcagaga 6720

ttatgaccgg gtttatcctg atacggccaa gacagagatg atcgaagcaa ctgcgaccac 6780

aattgctccc agtcaaatgt tatcggcgca tgcttttgca tctgtaccta tattgacaga 6840

tttgtttaat cctcaaacag caaggctttc tcaaaagaca acggatattg tattaaacac 6900

acaaggtgga ggcgatttaa tctttactgg catgaatatt aaaggtaagg gaaaagaatt 6960

taatgcatta aaaatcgttg atacttatgg cggagaaatg cctgatagca aaaccgctat 7020

ttcagcatat tggcttccgc aaggtgggta tactgatatt ccgatacatc cgactggaat 7080

acaaaagtat ttgtttacgc ctgcgtttag tggttgcact ctggcagtag ataagcttaa 7140

cgaaaataca ttacgggcgt atcacgtcga aggaagtaag gaagatgctc aatataataa 7200

tttagcagtt gcagcgcacg gagagggttt ggtcatggct atggaatttc ctgactatgg 7260

atttcataca gacaaaacag ggcaaagact aaggaacaca cagggatttg cgtttatgtc 7320

ctacaatcaa tcccagaaaa aatgggaaat tcattatcaa aggcaagcat tgacatcaaa 7380

caccggtatc atgaatgtta gtgctaaaaa caagattcga ttgaatgccc ccagtcatgt 7440

aaaaaatagc tcaatcaaag gaactgaaat aatgacgaca catttttaat taatgcggcc 7500

gcctcgag 7508

<210>10

<211>7605

<212>DNA

<213>伯氏致病杆菌

<400>10

atgtataata cagaaaatat attaattagg cttaataggg aaagttccca ggaaccgatg 60

acattggctc atattatgcc aatctcattt tcagcattca ggaaagaagt caaagatacg 120

ctgaattggg gagaaagcca tcacctgtat ctagccgcca agaaagccga aaaagaaaac 180

aggatttttg aagcacgttt attatcccgc gccaatccgc agttaagggg ggctgttcgt 240

ctcggcattc agcaactctc gcagcggcaa agttacgata cgctatttgg cggtcggtcg 300

ggtaagtatg tattacccgg ctctgtcgcc tctatgttct caccggcagc ctacctgaca 360

gagctgtatc gggaatccag acacctgcat tcagaatcgt ccatctacca tcttgataag 420

cgtcgccctg atttgcaaag cataatgttg acgcaggaaa accaagatca aacactctcc 480

acacttgaac tatcaaatga cattctcttt gatggcataa aaaataagaa aaaactcaac 540

aaaaatgaag atgtactgaa aatgttgtct gattggcgtc tgagtggaaa tacgccttac 600

catcaaccct ttgaaaccct atctaacatt gtctcccagc ttgatcctca gctcagtcag 660

gttagtcagt cgccaaaagt gattggttta ttgtccccgg tcagcctatt ggggatatca 720

agtcaaattt caccagaact gtataaaatc ctgacggaag aaattacggc tgagaatgcg 780

caagacatgt ataagaaaaa tttcggtgac ttgccgattt ctgcactgtc taatcctaac 840

tatttgatga aatattatga tattgatgca gatactctcc gtgctgtaat gggtatctat 900

ggatcaggcc aaaacgatga tgaacccgca ttcatcagcg atcaggccat agtgacttac 960

cttgatgata aaaattcttt cgttacttac ctgattactc gcaccaaagg cgagacttat 1020

gactggcagg ttaattttat cgaagctatt cccacaaaag atggcaaatt aaaatattgg 1080

tataatttta aagctccggc ttccagtgca gtttccacca aaatttcgct gaatgggcag 1140

actatcttcg acagacctga ttggctgccg gagctcaata agacttattc agatatcgtt 1200

gatttcccca gtgatgttga tagaaaaaaa tttactctga aattcgaaag agcagcctct 1260

ggcagtggag gtagttttaa tacggatgcg acattctcaa ttgaaacggt attacctcaa 1320

ctctttttcc tcaaattgaa taaagttatt cgcctttaca aaaaaaccgg tatcacgctg 1380

gaacaaattg aaactgctgt ggattcagat aatgcccaac aacaaataac cgaaacaatt 1440

ctgaaaaaga tattttatac aacctactat attaataggt attatttgag tttcaatgat 1500

gcactggtgt tatgtaatac cgcaatatct cagcacagct ataatgatca gccttctcat 1560

tttgacctta tttttaataa cccgccattg aatggaaact attaccaatt gggcggggat 1620

aaaattcaag ttgatccaga tcaggcagat tatgaacaat ataatcaacg gcgtgaaatg 1680

ctcaagcacg cgttgaaagt taatgacagt gaattattca cactatctaa gattctggat 1740

caagaaaata cgtcaggtat cgacaataac cttgctacgg atttatctgc gctgtaccgc 1800

gtacgaatgc ttgcttacat tcaccaactt tctatcaatg aattggctat cctgctaaaa 1860

ctctcgccat atgctgaaga gtcttttaac aaaatcagta cggaaaagtt aatcgaagtc 1920

attgaatatc tttacagtat cacccagtgg ttacagacac agaaaatcag cgtttatacc 1980

ctgtatatga tgacgaccac aacctacagt acagttttat cacccgatat taacaatctg 2040

atcgagacgc tacgggcggg aatgcagaac aaaaccgtac cagacgatcc acttcaactt 2100

atcaagacct tggcaccctt cattgcagcg gcactgaaac tttcttcggc atttgtggct 2160

gagtcgatcc tgatatggat caacaagatc aaacccaatg gcatggatgt cgccgccttc 2220

tggaaatcca ttgagtctac aaaaaatccg atagaaccga acagcatggt attttgtcag 2280

gtgctggggc agttggcatt gatttattta gccacgcaac taacggaaaa tgctctgaat 2340

ctggcggtga caactaaagt gattatcggt cactccggca gcatcgatca tctgggcaaa 2400

gatactgaga cggtgagaca gcttagccgt tttgcgggat ggtgtaattc actgggcagc 2460

aatacagaca cagtactgac agctctgcaa agtaacaact tggatagcac tattctggcg 2520

agtgccatga ggatggatga gaggctgctt tcaaccgcca gtgaacaggc taaccttaat 2580

aaacaggttg cagaaaaaga taagtatgca gattggccag aaatagacag tgttctgcaa 2640

tggctagcag tggccaatgt gatgaaaacc agcccgaata agattaatgc tcttctgcaa 2700

ttggactatc tgaaagatca gaatactaca gaagtttctt acgaaacatg gagccaatcg 2760

gcggatatac tggcggctgg gctgaataat aatcaatcag atattctgaa acaagcctta 2820

gaggaagaag ccagtgccgc attaagccaa tattacatcc gtgaagttgt ggatagcgcg 2880

gctgaggtga tagatagaaa tgatctgtat ggttacctgc tgatagataa tcaaatctcc 2940

gcacaggtcg aaacgacacg gctggctgag gccattgcca gtatccagca atatatcaac 3000

cgtgcattga atggccgtga gagtacccct gccaccgatg tcatgacagg ccagttttat 3060

caggattggg atcgttataa caaacgctac agcacatggg cgggtgtttc cacgctggtt 3120

tactatcctg aaaactatat cgatccgacc atgcgtatcg gtcagaccca catgatggat 3180

gaattgctgc aatccgtcag ccagagtcaa ctcagtgttg ataccgttga agatgcgttt 3240

aaaacctatc tgacccgctt tgaacaaatt gccaacctga ctgtcgtcag tggctatcat 3300

gataatgtga acatttcaca agggaacagt taccttgtcg gtaaagggga aacggatgcc 3360

aaccaatatt attggcgcaa actggatcac agcaaatccc gtcagggcaa gattgccgcc 3420

aatgcgtgga gtgaatgggc aaaaattgac agcccggtca atccctatca gggcttaatt 3480

aagccggtta tctataaatc ccgcctgtat attgtctggc tggaaaaacg ggtgattact 3540

gtttcagaaa gcaaagacgg cgcaataaca tcgaaagata tcattaaata tgaaatcaaa 3600

atcgcccata tcagacatga tggcacatgg aatacgccta tcacgttaga tgtcagcgat 3660

atcttcagcg catataacga tacagacctg gccaatctgg ctatgtattg ctctgaatat 3720

acgggagaaa gtaccttact cttattactg tatgtcaaac aggctgatac ggcgggaaac 3780

aaagatctca caaagaccaa aacaaagggg atgtatattt attctgacat gaccacaaaa 3840

gtcatgattg atagtgagat caaaaattat caaaacagcg tttaccgaga gttcgataca 3900

ttgacccagc gacggttaaa taaccgttat gcggcgaatt atgattatcc gtcttccgtt 3960

gcagtcagta gtggttacga gtggggcgat tactctctga gtatggttta tgacagtaaa 4020

attgcttcca ttgctaccgt cggaactact tcatcagaga tcaaattgaa aatcgatgcc 4080

gacctgcggg taatttataa cggggttgaa ggcaggcagc gtcaccaatg tgctctgatg 4140

caaaaatttg gtcagttagg tgataaattt attgtttacg aagacctgaa aattgacaga 4200

gagaatcaga gtgcaggcaa taacaatctc ttttatcccg tttatcaata cagtggcaat 4260

gtcagtaaat tgtcaaaagg gcgtttatta gtttatagag aaagttcatc atcttatgtc 4320

aaggcagata ttgggccagg gcacgatccg ctcattaatg aaaatgctca aaaaccttat 4380

ggttatgttg aagacagcaa aaatgacccc gccgcgctga aaaataacat gacactgacg 4440

gataacgcgg gtatttctac gaaggtcgca tcaccaagag atatcgatac tgctgtaacg 4500

ccggcaaata tcacgattaa ggccagtgca ggcagcagta aacctgtaga gtttaacgct 4560

ggcacatctg tcataaatct gcccaacaac aacttggaag aaatgatcta taacttccat 4620

gatatggaat tcactatccc actgacagaa tttaaggaca accaagtcga ggtggagata 4680

gtgctgaccg ggaaaacgga tgatggccgg gttctgggaa gtgaaacctt taattttacc 4740

gttacacaga aaattctgaa tgaacagtca gggttgctga cgctcaatac tgctgcgtct 4800

aaagcccaat atctgcaatg ggggccttac cgtacccgca ttaatacctt atttgccaga 4860

aatatggtgg aacgggcaga aacgggcatt gataccctgc tgacaatgga tacccaacaa 4920

ctgcctgaac ctaaaatggg agatggggga tatattagtg tcaccttacc caaatatgat 4980

ccagataagc atggtagtac cagaaacgcc gcggtcacac tttatcagga aaaagatggt 5040

gtagactcaa caacgcatta cggcttctgg gacgggtcgt taacagatgc agaacaaacc 5100

atcaaactgt ttattccatt aactagcacg aaagaacctt tctataacac gattgatttt 5160

ccatcttcga taagtgacgg gcttcaagtt tttctaaaaa gcgctaagga aggtttgctg 5220

gccggaacct taaaaacagc gtttactcca tctgaggata agaaggccaa tattgtcttc 5280

acggaatata cccctgtttc gggtacgcca cccatgaagg ttgaactgct gtccaaatat 5340

tatgatcagc cgatggattt taacggcgcc aactccctct acttctggga attgttctat 5400

tacagcccga tgctggtagc gcagcgcttg ttgcaggaac aaaattttga tgaagccaat 5460

cattggctga aatatgttta cagccctgag ggctatatcg tcaaaggtga gattgcgccg 5520

tatcattgga attgccggcc actggaagaa gatacttcgt ggaactctaa cccgctggat 5580

tccacagacc ccgatgccgt cgcccaagat gatccgatgc actataaagt ttctaccttc 5640

atgcggatgc tcgatctgct gattgcccgt ggcgacaagg cttaccgcca gcttgagcgg 5700

gatactttga atgaagccaa gctctggtat atacaggcac tgaatctatt gggggatgag 5760

cagtttgtgg cgctggatgg caactggtct gaacccacgt tggaaaccgc agcggataag 5820

acggtggaac aggattatca gcatgcgctg atgttaattc gcctggtaca gcccgccgaa 5880

tataccgcta actcactgac caacctattt ttgcctcaac aaaatgacaa actgaatggc 5940

tactggcaaa cattgaagca gcgcttgtat aacctgcgtc ataacctcac cattgatggc 6000

ctgccgctgt cactgcctat ttacgccaaa cctgccgatc ctaaagcctt gttgagtgcg 6060

gcggtgaatg cttcccaggg aggcacggat ctgccaaatc cggaaatgcc acttcatcgt 6120

ttccccatca tgttggataa cgcgaagagc atagtcagtc aactcattca gtttggttct 6180

accttacagg ggatcattga acgtcaggat gcagaagcgc tcaacgaatt gctgcaaaat 6240

caagcgcgtg aactgacgct gatcagcatt cagatgcaga ataaaacgct ggaagaattg 6300

gatgcggaaa aagaagtact gaaacaatcc cgactagggg cgcaatcacg ctttgacagc 6360

tatagcaagc tgtacgatga aaacatcaac gatggcgaaa aaactgctat ggatttgcgt 6420

actgctgcca gcacgataag tactgccctg gaagccgcta aattggcaga ggccggtgcc 6480

gatatgttcc caaatatctt cggtcttgct ggtggtggca gccgatgggg ggctatccct 6540

ggcgcacttg cttctgtgat gggctttacc gccggcacac tcaatacgaa agccgaacga 6600

accacacagt ctgaaattta ccgccgccgc cgtcaggagt gggaaattca gcgcaccaat 6660

gcagatcatg aagttaagca aattgacgct caattgaaat cactggaaat ccggcgtgaa 6720

gcggcagaca tgcagaaaac ctatctggaa acccagcagg ctcagacaca ggcacaattg 6780

gaattcctgc aacgtaaatt cagtaacaga gcgttgtaca actggatgcg gggtcgtctg 6840

gccgccattt acttccagtt ctatgatctt gccacctctc gttgcctgat ggcacagcaa 6900

gcctaccagt gggaaaccaa tgatacagca gccagcttta tcaaatcggg ggcatggcag 6960

ggaacctatg ctggcctgct cgccggcgag tctctgatac tgaaccttgt ccagatggaa 7020

gatgccttca tgaaaaaaga tgaacgggca ttggaaatca cgcgtaccgt ttcgttggct 7080

gaggtttacc gttctctgcc tgatgccgat aaattcatac ttcctgacgc agttgctgat 7140

ttattgaact ccccggggaa atcattcggg aaagatcaga acacactaaa aattgagacg 7200

aatcaactgg aagcatccgt aaatctgtct ggtctcaaca tttggggaga ttacccggaa 7260

caacttggcg cggctcgtcg catcaaacaa gtgagtgttt ccctgcctgc cttgcttgga 7320

ccgtatcagg atgtacaggc catcttgagc tatagcggtg acatgaaggg cattcccaaa 7380

ggttgcagtg ctatcgcggt atccaatggc atgaatgaca gcgggcaatt ccagttggat 7440

ttcaatgaca ccaaatacct gccatttgaa gggatcaata ttccgaaaga taaagatcaa 7500

agtgcactgg tgctgagttt ccccaacgcg gacgctaaac agaaaacgat gttgctcagt 7560

ttgagcgaca tcattctgca cattcgctac accattcgca aataa 7605

<210>11

<211>2534

<212>PRT

<213>伯氏致病杆菌

<400>11

Met Tyr Asn Thr Glu Asn Ile Leu Ile Arg Leu Asn Arg Glu Ser Ser

1 5 10 15

Gln Glu Pro Met Thr Leu Ala His Ile Met Pro Ile Ser Phe Ser Ala

20 25 30

Phe Arg Lys Glu Val Lys Asp Thr Leu Asn Trp Gly Glu Ser His His

35 40 45

Leu Tyr Leu Ala Ala Lys Lys Ala Glu Lys Glu Asn Arg Ile Phe Glu

50 55 60

Ala Arg Leu Leu Ser Arg Ala Asn Pro Gln Leu Arg Gly Ala Val Arg

65 70 75 80

Leu Gly Ile Gln Gln Leu Ser Gln Arg Gln Ser Tyr Asp Thr Leu Phe

85 90 95

Gly Gly Arg Ser Gly Lys Tyr Val Leu Pro Gly Ser Val Ala Ser Met

100 105 110

Phe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ser Arg His

115 120 125

Leu His Ser Glu Ser Ser Ile Tyr His Leu Asp Lys Arg Arg Pro Asp

130 135 140

Leu Gln Ser Ile Met Leu Thr Gln Glu Asn Gln Asp Gln Thr Leu Ser

145 150 155 160

Thr Leu Glu Leu Ser Asn Asp Ile Leu Phe Asp Gly Ile Lys Asn Lys

165 170 175

Lys Lys Leu Asn Lys Asn Glu Asp Val Leu Lys Met Leu Ser Asp Trp

180 185 190

Arg Leu Ser Gly Asn Thr Pro Tyr His Gln Pro Phe Glu Thr Leu Ser

195 200 205

Asn Ile Val Ser Gln Leu Asp Pro Gln Leu Ser Gln Val Ser Gln Ser

210 215 220

Pro Lys Val Ile Gly Leu Leu Ser Pro Val Ser Leu Leu Gly Ile Ser

225 230 235 240

Ser Gln Ile Ser Pro Glu Leu Tyr Lys Ile Leu Thr Glu Glu Ile Thr

245 250 255

Ala Glu Asn Ala Gln Asp Met Tyr Lys Lys Asn Phe Gly Asp Leu Pro

260 265 270

Ile Ser Ala Leu Ser Asn Pro Asn Tyr Leu Met Lys Tyr Tyr Asp Ile

275 280 285

Asp Ala Asp Thr Leu Arg Ala Val Met Gly Ile Tyr Gly Ser Gly Gln

290 295 300

Asn Asp Asp Glu Pro Ala Phe Ile Ser Asp Gln Ala Ile Val Thr Tyr

305 310 315 320

Leu Asp Asp Lys Asn Ser Phe Val Thr Tyr Leu Ile Thr Arg Thr Lys

325 330 335

Gly Glu Thr Tyr Asp Trp Gln Val Asn Phe Ile Glu Ala Ile Pro Thr

340 345 350

Lys Asp Gly Lys Leu Lys Tyr Trp Tyr Asn Phe Lys Ala Pro Ala Ser

355 360 365

Ser Ala Val Ser Thr Lys Ile Ser Leu Asn Gly Gln Thr Ile Phe Asp

370 375 380

Arg Pro Asp Trp Leu Pro Glu Leu Asn Lys Thr Tyr Ser Asp Ile Val

385 390 395 400

Asp Phe Pro Ser Asp Val Asp Arg Lys Lys Phe Thr Leu Lys Phe Glu

405 410 415

Arg Ala Ala Ser Gly Ser Gly Gly Ser Phe Asn Thr Asp Ala Thr Phe

420 425 430

Ser Ile Glu Thr Val Leu Pro Gln Leu Phe Phe Leu Lys Leu Asn Lys

435 440 445

Val Ile Arg Leu Tyr Lys Lys Thr Gly Ile Thr Leu Glu Gln Ile Glu

450 455 460

Thr Ala Val Asp Ser Asp Asn Ala Gln Gln Gln Ile Thr Glu Thr Ile

465 470 475 480

Leu Lys Lys Ile Phe Tyr Thr Thr Tyr Tyr Ile Asn Arg Tyr Tyr Leu

485 490 495

Ser Phe Asn Asp Ala Leu Val Leu Cys Asn Thr Ala Ile Ser Gln His

500 505 510

Ser Tyr Asn Asp Gln Pro Ser His Phe Asp Leu Ile Phe Asn Asn Pro

515 520 525

Pro Leu Asn Gly Asn Tyr Tyr Gln Leu Gly Gly Asp Lys Ile Gln Val

530 535 540

Asp Pro Asp Gln Ala Asp Tyr Glu Gln Tyr Asn Gln Arg Arg Glu Met

545 550 555 560

Leu Lys His Ala Leu Lys Val Asn Asp Ser Glu Leu Phe Thr Leu Ser

565 570 575

Lys Ile Leu Asp Gln Glu Asn Thr Ser Gly Ile Asp Asn Asn Leu Ala

580 585 590

Thr Asp Leu Ser Ala Leu Tyr Arg Val Arg Met Leu Ala Tyr Ile His

595 600 605

Gln Leu Ser Ile Asn Glu Leu Ala Ile Leu Leu Lys Leu Ser Pro Tyr

610 615 620

Ala Glu Glu Ser Phe Asn Lys Ile Ser Thr Glu Lys Leu Ile Glu Val

625 630 635 640

Ile Glu Tyr Leu Tyr Ser Ile Thr Gln Trp Leu Gln Thr Gln Lys Ile

645 650 655

Ser Val Tyr Thr Leu Tyr Met Met Thr Thr Thr Thr Tyr Ser Thr Val

660 665 670

Leu Ser Pro Asp Ile Asn Asn Leu Ile Glu Thr Leu Arg Ala Gly Met

675 680 685

Gln Asn Lys Thr Val Pro Asp Asp Pro Leu Gln Leu Tle Lys Thr Leu

690 695 700

Ala Pro Phe Ile Ala Ala Ala Leu Lys Leu Ser Ser Ala Phe Val Ala

705 710 715 720

Glu Ser Ile Leu Ile Trp Ile Asn Lys Ile Lys Pro Asn Gly Met Asp

725 730 735

Val Ala Ala Phe Trp Lys Ser Ile Glu Ser Thr Lys Asn Pro Ile Glu

740 745 750

Pro Asn Ser Met Val Phe Cys Gln Val Leu Gly Gln Leu Ala Leu Ile

755 760 765

Tyr Leu Ala Thr Gln Leu Thr Glu Asn Ala Leu Asn Leu Ala Val Thr

770 775 780

Thr Lys Val Ile Ile Gly His Ser Gly Ser Ile Asp His Leu Gly Lys

785 790 795 800

Asp Thr Glu Thr Val Arg Gln Leu Ser Arg Phe Ala Gly Trp Cys Asn

805 810 815

Ser Leu Gly Ser Asn Thr Asp Thr Val Leu Thr Ala Leu Gln Ser Asn

820 825 830

Asn Leu Asp Ser Thr Ile Leu Ala Ser Ala Met Arg Met Asp Glu Arg

835 840 845

Leu Leu Ser Thr Ala Ser Glu Gln Ala Asn Leu Asn Lys Gln Val Ala

850 855 860

Glu Lys Asp Lys Tyr Ala Asp Trp Pro Glu Ile Asp Ser Val Leu Gln

865 870 875 880

Trp Leu Ala Val Ala Asn Val Met Lys Thr Ser Pro Asn Lys Ile Asn

885 890 895

Ala Leu Leu Gln Leu Asp Tyr Leu Lys Asp Gln Asn Thr Thr Glu Val

900 905 910

Ser Tyr Glu Thr Trp Ser Gln Ser Ala Asp Ile Leu Ala Ala Gly Leu

915 920 925

Asn Asn Asn Gln Ser Asp Ile Leu Lys Gln Ala Leu Glu Glu Glu Ala

930 935 940

Ser Ala Ala Leu Ser Gln Tyr Tyr Ile Arg Glu Val Val Asp Ser Ala

945 950 955 960

Ala Glu Val Ile Asp Arg Asn Asp Leu Tyr Gly Tyr Leu Leu Ile Asp

965 970 975

Asn Gln Ile Ser Ala Gln Val Glu Thr Thr Arg Leu Ala Glu Ala Ile

980 985 990

Ala Ser Ile Gln Gln Tyr Ile Asn Arg Ala Leu Asn Gly Arg Glu Ser

995 1000 1005

Thr Pro Ala Thr Asp Val Met Thr Gly Gln Phe Tyr Gln Asp Trp

1010 1015 1020

Asp Arg Tyr Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Thr

1025 1030 1035

Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro Thr Met Arg Ile

1040 1045 1050

Gly Gln Thr His Met Met Asp Glu Leu Leu Gln Ser Val Ser Gln

1055 1060 1065

Ser Gln Leu Ser Val Asp Thr Val Glu Asp Ala Phe Lys Thr Tyr

1070 1075 1080

Leu Thr Arg Phe Glu Gln Ile Ala Asn Leu Thr Val Val Ser Gly

1085 1090 1095

Tyr His Asp Asn Val Asn Ile Ser Gln Gly Asn Ser Tyr Leu Val

1100 1105 1110

Gly Lys Gly Glu Thr Asp Ala Asn Gln Tyr Tyr Trp Arg Lys Leu

1115 1120 1125

Asp His Ser Lys Ser Arg Gln Gly Lys Ile Ala Ala Asn Ala Trp

1130 1135 1140

Ser Glu Trp Ala Lys Ile Asp Ser Pro Val Asn Pro Tyr Gln Gly

1145 1150 1155

Leu Ile Lys Pro Val Ile Tyr Lys Ser Arg Leu Tyr Ile Val Trp

1160 1165 1170

Leu Glu Lys Arg Val Ile Thr Val Ser Glu Ser Lys Asp Gly Ala

1175 1180 1185

Ile Thr Ser Lys Asp Ile Ile Lys Tyr Glu Ile Lys Ile Ala His

1190 1195 1200

Ile Arg His Asp Gly Thr Trp Asn Thr Pro Ile Thr Leu Asp Val

1205 1210 1215

Ser Asp Ile Phe Ser Ala Tyr Asn Asp Thr Asp Leu Ala Asn Leu

1220 1225 1230

Ala Met Tyr Cys Ser Glu Tyr Thr Gly Glu Ser Thr Leu Leu Leu

1235 1240 1245

Leu Leu Tyr Val Lys Gln Ala Asp Thr Ala Gly Asn Lys Asp Leu

1250 1255 1260

Thr Lys Thr Lys Thr Lys Gly Met Tyr Ile Tyr Ser Asp Met Thr

1265 1270 1275

Thr Lys Val Met Ile Asp Ser Glu Ile Lys Asn Tyr Gln Asn Ser

1280 1285 1290

Val Tyr Arg Glu Phe Asp Thr Leu Thr Gln Arg Arg Leu Asn Asn

1295 1300 1305

Arg Tyr Ala Ala Asn Tyr Asp Tyr Pro Ser Ser Val Ala Val Ser

1310 1315 1320

Ser Gly Tyr Glu Trp Gly Asp Tyr Ser Leu Ser Met Val Tyr Asp

1325 1330 1335

Ser Lys Ile Ala Ser Ile Ala Thr Val Gly Thr Thr Ser Ser Glu

1340 1345 1350

Ile Lys Leu Lys Ile Asp Ala Asp Leu Arg Val Ile Tyr Asn Gly

1355 1360 1365

Val Glu Gly Arg Gln Arg His Gln Cys Ala Leu Met Gln Lys Phe

1370 1375 1380

Gly Gln Leu Gly Asp Lys Phe Ile Val Tyr Glu Asp Leu Lys Ile

1385 1390 1395

Asp Arg Glu Asn Gln Ser Ala Gly Asn Asn Asn Leu Phe Tyr Pro

1400 1405 1410

Val Tyr Gln Tyr Ser Gly Asn Val Ser Lys Leu Ser Lys Gly Arg

1415 1420 1425

Leu Leu Val Tyr Arg Glu Ser Ser Ser Ser Tyr Val Lys Ala Asp

1430 1435 1440

Ile Gly Pro Gly His Asp Pro Leu Ile Asn Glu Asn Ala Gln Lys

1445 1450 1455

Pro Tyr Gly Tyr Val Glu Asp Ser Lys Asn Asp Pro Ala Ala Leu

1460 1465 1470

Lys Asn Asn Met Thr Leu Thr Asp Asn Ala Gly Ile Ser Thr Lys

1475 1480 1485

Val Ala Ser Pro Arg Asp Ile Asp Thr Ala Val Thr Pro Ala Asn

1490 1495 1500

Ile Thr Ile Lys Ala Ser Ala Gly Ser Ser Lys Pro Val Glu Phe

1505 1510 1515

Asn Ala Gly Thr Ser Val Ile Asn Leu Pro Asn Asn Asn Leu Glu

1520 1525 1530

Glu Met Ile Tyr Asn Phe His Asp Met Glu Phe Thr Ile Pro Leu

1535 1540 1545

Thr Glu Phe Lys Asp Asn Gln Val Glu Val Glu Ile Val Leu Thr

1550 1555 1560

Gly Lys Thr Asp Asp Gly Arg Val Leu Gly Ser Glu Thr Phe Asn

1565 1570 1575

Phe Thr Val Thr Gln Lys Ile Leu Asn Glu Gln Ser Gly Leu Leu

1580 1585 1590

Thr Leu Asn Thr Ala Ala Ser Lys Ala Gln Tyr Leu Gln Trp Gly

1595 1600 1605

Pro Tyr Arg Thr Arg Ile Asn Thr Leu Phe Ala Arg Asn Met Val

1610 1615 1620

Glu Arg Ala Glu Thr Gly Ile Asp Thr Leu Leu Thr Met Asp Thr

1625 1630 1635

Gln Gln Leu Pro Glu Pro Lys Met Gly Asp Gly Gly Tyr Ile Ser

1640 1645 1650

Val Thr Leu Pro Lys Tyr Asp Pro Asp Lys His Gly Ser Thr Arg

1655 1660 1665

Asn Ala Ala Val Thr Leu Tyr Gln Glu Lys Asp Gly Val Asp Ser

1670 1675 1680

Thr Thr His Tyr Gly Phe Trp Asp Gly Ser Leu Thr Asp Ala Glu

1685 1690 1695

Gln Thr Ile Lys Leu Phe Ile Pro Leu Thr Ser Thr Lys Glu Pro

1700 1705 1710

Phe Tyr Asn Thr Tle Asp Phe Pro Ser Ser Ile Ser Asp Gly Leu

1715 1720 1725

Gln Val Phe Leu Lys Ser Ala Lys Glu Gly Leu Leu Ala Gly Thr

1730 1735 1740

Leu Lys Thr Ala Phe Thr Pro Ser Glu Asp Lys Lys Ala Asn Ile

1745 1750 1755

Val Phe Thr Glu Tyr Thr Pro Val Ser Gly Thr Pro Pro Met Lys

1760 1765 1770

Val Glu Leu Leu Ser Lys Tyr Tyr Asp Gln Pro Met Asp Phe Asn

1775 1780 1785

Gly Ala Asn Ser Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Ser Pro

1790 1795 1800

Met Leu Val Ala Gln Arg Leu Leu Gln Glu Gln Asn Phe Asp Glu

1805 1810 1815

Ala Asn His Trp Leu Lys Tyr Val Tyr Ser Pro Glu Gly Tyr Ile

L820 1825 1830

Val Lys Gly Glu Ile Ala Pro Tyr His Trp Asn Cys Arg Pro Leu

1835 1840 1845

Glu Glu Asp Thr Ser Trp Asn Ser Asn Pro Leu Asp Ser Thr Asp

1850 1855 1860

Pro Asp Ala Val Ala Gln Asp Asp Pro Met His Tyr Lys Val Ser

1865 1870 1875

Thr Phe Met Arg Met Leu Asp Leu Leu Ile Ala Arg Gly Asp Lys

1880 1885 1890

Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Asn Glu Ala Lys Leu

1895 1900 1905

Trp Tyr Ile Gln Ala Leu Asn Leu Leu Gly Asp Glu Gln Phe Val

1910 1915 1920

Ala Leu Asp Gly Asn Trp Ser Glu Pro Thr Leu Glu Thr Ala Ala

1925 1930 1935

Asp Lys Thr Val Glu Gln Asp Tyr Gln His Ala Leu Met Leu Ile

1940 1945 1950

Arg Leu Val Gln Pro Ala Glu Tyr Thr Ala Asn Ser Leu Thr Asn

1955 1960 1965

Leu Phe Leu Pro Gln Gln Asn Asp Lys Leu Asn Gly Tyr Trp Gln

1970 1975 1980

Thr Leu Lys Gln Arg Leu Tyr Asn Leu Arg His Asn Leu Thr Ile

1985 1990 1995

Asp Gly Leu Pro Leu Ser Leu Pro Ile Tyr Ala Lys Pro Ala Asp

2000 2005 2010

Pro Lys Ala Leu Leu Ser Ala Ala Val Asn Ala Ser Gln Gly Gly

2015 2020 2025

Thr Asp Leu Pro Asn Pro Glu Met Pro Leu His Arg Phe Pro Ile

2030 2035 2040

Met Leu Asp Asn Ala Lys Ser Ile Val Ser Gln Leu Ile Gln Phe

2045 2050 2055

Gly Ser Thr Leu Gln Gly Ile Ile Glu Arg Gln Asp Ala Glu Ala

2060 2065 2070

Leu Asn Glu Leu Leu Gln Asn Gln Ala Arg Glu Leu Thr Leu Ile

2075 2080 2085

Ser Ile Gln Met Gln Asn Lys Thr Leu Glu Glu Leu Asp Ala Glu

2090 2095 2100

Lys Glu Val Leu Lys Gln Ser Arg Leu Gly Ala Gln Ser Arg Phe

2105 2110 2115

Asp Ser Tyr Ser Lys Leu Tyr Asp Glu Asn Ile Asn Asp Gly Glu

2120 2125 2130

Lys Thr Ala Met Asp Leu Arg Thr Ala Ala Ser Thr Ile Ser Thr

2135 2140 2145

Ala Leu Glu Ala Ala Lys Leu Ala Glu Ala Gly Ala Asp Met Phe

2150 2155 2160

Pro Asn Ile Phe Gly Leu Ala Gly Gly Gly Ser Arg Trp Gly Ala

2165 2170 2175

Ile Pro Gly Ala Leu Ala Ser Val Met Gly Phe Thr Ala Gly Thr

2180 2185 2190

Leu Asn Thr Lys Ala Glu Arg Thr Thr Gln Ser Glu Ile Tyr Arg

2195 2200 2205

Arg Arg Arg Gln Glu Trp Glu Ile Gln Arg Thr Asn Ala Asp His

2210 2215 2220

Glu Val Lys Gln Ile Asp Ala Gln Leu Lys Ser Leu Glu Ile Arg

2225 2230 2235

Arg Glu Ala Ala Asp Met Gln Lys Thr Tyr Leu Glu Thr Gln Gln

2240 2245 2250

Ala Gln Thr Gln Ala Gln Leu Glu Phe Leu Gln Arg Lys Phe Ser

2255 2260 2265

Asn Arg Ala Leu Tyr Asn Trp Met Arg Gly Arg Leu Ala Ala Ile

2270 2275 2280

Tyr Phe Gln Phe Tyr Asp Leu Ala Thr Ser Arg Cys Leu Met Ala

2285 2290 2295

Gln Gln Ala Tyr Gln Trp Glu Thr Asn Asp Thr Ala Ala Ser Phe

2300 2305 2310

Ile Lys Ser Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Ala

2315 2320 2325

Gly Glu Ser Leu Ile Leu Asn Leu Val Gln Met Glu Asp Ala Phe

2330 2335 2340

Met Lys Lys Asp Glu Arg Ala Leu Glu Ile Thr Arg Thr Val Ser

2345 2350 2355

Leu Ala Glu Val Tyr Arg Ser Leu Pro Asp Ala Asp Lys Phe Ile

2360 2365 2370

Leu Pro Asp Ala Val Ala Asp Leu Leu Asn Ser Pro Gly Lys Ser

2375 2380 2385

Phe Gly Lys Asp Gln Asn Thr Leu Lys Ile Glu Thr Asn Gln Leu

2390 2395 2400

Glu Ala Ser Val Asn Leu Ser Gly Leu Asn Ile Trp Gly Asp Tyr

2405 2410 2415

Pro Glu Gln Leu Gly Ala Ala Arg Arg Ile Lys Gln Val Ser Val

2420 2425 2430

Ser Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile

2435 2440 2445

Leu Ser Tyr Ser Gly Asp Met Lys Gly Ile Pro Lys Gly Cys Ser

2450 2455 2460

Ala Ile Ala Val Ser Asn Gly Met Asn Asp Ser Gly Gln Phe Gln

2465 2470 2475

Leu Asp Phe Asn Asp Thr Lys Tyr Leu Pro Phe Glu Gly Ile Asn

2480 2485 2490

Ile Pro Lys Asp Lys Asp Gln Ser Ala Leu Val Leu Ser Phe Pro

2495 2500 2505

Asn Ala Asp Ala Lys Gln Lys Thr Met Leu Leu Ser Leu Ser Asp

2510 2515 2520

Ile Ile Leu His Ile Arg Tyr Thr Ile Arg Lys

2525 2530

Claims

1.具有针对害虫的毒素活性的分离蛋白质，其中编码所述蛋白质的核酸分子与选自SEQ ID NO：1、SEQ ID NO：3和SEQ ID NO：5的核酸探针的完全互补物在严格条件下杂交。

2.权利要求1的蛋白质，其中所述核酸分子与包含SEQ ID NO：10的核酸探针杂交。

3.权利要求1的蛋白质，其中所述蛋白质包含选自SEQ ID NO：2、SEQ ID NO：4和SEQ ID NO：6的氨基酸序列。

4.权利要求3的蛋白质，其包含SEQ ID NO：11。

5.分离的多核苷酸，其编码权利要求1的蛋白质。

6.含有权利要求5的多核苷酸的植物细胞。

7.含有权利要求6的细胞的转基因植物。

8.权利要求6的细胞，其中所述细胞在种子中。

9.纯化的细菌细胞培养物，所述细胞含有权利要求5的多核苷酸。

10.抑制昆虫的方法，其中所述方法包括提供权利要求1的蛋白质供所述昆虫摄食。

11.权利要求10的方法，其中所述蛋白质由植物产生并存在于植物中。

12.使用权利要求1的蛋白质产生的抗体。

13.权利要求12的抗体，其中所述抗体为多克隆抗体。

14.权利要求12的抗体，其中所述抗体为单克隆抗体。