CN111601892B - 蛋白质的制造方法 - Google Patents

蛋白质的制造方法 Download PDF

Info

Publication number
CN111601892B
CN111601892B CN201980007940.4A CN201980007940A CN111601892B CN 111601892 B CN111601892 B CN 111601892B CN 201980007940 A CN201980007940 A CN 201980007940A CN 111601892 B CN111601892 B CN 111601892B
Authority
CN
China
Prior art keywords
leu
asn
thr
ser
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980007940.4A
Other languages
English (en)
Other versions
CN111601892A (zh
Inventor
刘生浩
影山泰
寺井三佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kao Corp
Original Assignee
Kao Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kao Corp filed Critical Kao Corp
Publication of CN111601892A publication Critical patent/CN111601892A/zh
Application granted granted Critical
Publication of CN111601892B publication Critical patent/CN111601892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供一种用于在芽孢杆菌属细菌的菌体内高生产Cry蛋白质的方法。一种Cry蛋白质或含有该Cry蛋白质的培养产物的制造方法,包括:用将编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接并嵌入而成的表达质粒来转化芽孢杆菌属细菌,培养该转化细胞,其中,上述表达质粒是包含编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有80%以上的同一性并且参与复制起始的蛋白质的多核苷酸的质粒。

Description

蛋白质的制造方法
技术领域
本发明涉及使用了芽孢杆菌属细菌的Cry蛋白质的制造方法。
背景技术
一般而言,大多使用大肠杆菌,在其菌体内使蛋白质大量表达则作为称为包涵体(inclusion body、封入体)的不溶且非活化的凝集体(改性蛋白质)被回收,为了使蛋白质恢复生物活性,需要凝集体的可溶化和活性化(重折叠)的操作(非专利文献1)。即使这样也得不到活性型的蛋白质时,进行表达量的调节使得不形成包涵体(非专利文献2、3)。此外,在使异种蛋白质在菌体内生产时,由于异种蛋白质对宿主的影响等,也需要调整启动子的表达、或质粒拷贝数(非专利文献2、3)。
另一方面,在菌体外蛋白质的表达中,考虑包涵体的形成或宿主内的该蛋白质浓度的影响的必要性少,一直以来进行了组合高表达启动子和高拷贝数质粒的高表达化或解除启动子的抑制的研究(专利文献1)。另外,作为适于这样的菌体外蛋白质的生产的宿主,也报道了芽孢杆菌属细菌、特别是枯草杆菌是优异的(非专利文献4、5)。另外,枯草杆菌特别是从作为安全性高的微生物被认识这一点上来说,作为宿主也是有利的。
苏云金芽孢杆菌(Bacillus thuringiensis)是生产各种杀虫性结晶蛋白质(crystal protein、以下也称为“Cry蛋白质”),作为生物农药使用的微生物(非专利文献6)。一般而言,编码苏云金芽孢杆菌所具有的Cry蛋白质基因(cry基因)的质粒是进行θ型复制的低拷贝数的巨大质粒,相对于此,如编码枯草杆菌中发挥复制功能的序列编号9所示的复制蛋白质(RepB)的质粒这样进行滚环型的复制的质粒一般为高拷贝数,与上述的进行θ型复制的低拷贝数质粒不同(非专利文献7)。启示了使用这样的苏云金芽孢杆菌从其质粒上的Cry蛋白质基因(cry基因)在菌体内生产该Cry蛋白质时,cry基因的拷贝数达到饱和,生产量也不会随着拷贝数的增加而增加(非专利文献6)。另外,也观察到向高拷贝数质粒克隆cry基因则生理的平衡崩坏,阻碍孢子形成(非专利文献6)。另外,启示了Cry蛋白质的结晶构造的形成、可溶性与2级构造、附加的构成成分等的各种因子有关(非专利文献6),认为不能说能够通过单纯地增加cry基因表达来使该蛋白质高生产。例如,报道了在使来自苏云金芽孢杆菌的Cry5B蛋白质在枯草杆菌PY79中表达时,苏云金芽孢杆菌的该蛋白质的生产率为75mg/L,相对于此,在枯草杆菌PY79中的生产率只不过为10mg/L(非专利文献8、专利文献2)。另外,也报道了在乳酸链球菌中,使用高拷贝数质粒在高表达启动子的控制下表达Cry5B蛋白质基因时,苏云金芽孢杆菌的该蛋白质的生产率仅能检测出免疫印迹水平(非专利文献9)。
这样,研究了用于一般地提高菌体外蛋白质的表达的方法,但不能说能够应用于菌体内蛋白质的生产,特别是仍没有发现用于使Cry蛋白质高表达的高效的方法。
〔专利文献1〕国际专利公开第2011/049227号
〔专利文献2〕国际专利公开第2016/007355号
〔专利文献3〕国际专利公开第2017/123946号
〔非专利文献1〕Singh A,Upadhyay V,Upadhyay AK,Singh SM,Panda AK(2015)Protein recovery from inclusion bodies of Escherichia coli using mildsolubilization process.Microb Cell Fact.;25:14-41.
〔非专利文献2〕东端启贵(2013)将大肠杆菌作为宿主的异种蛋白质高表达的ABC(大腸菌を宿主とした異种タンパク質高発現的イロハ).生物工学,91,96-100
〔非专利文献3〕CHUMANN,Wolfgang and FERREIRA,Luis Carlos S.(2004)Production of recombinant proteins in Escherichia coli.Genet.Mol.Biol.[online].,27(3),442-453.
〔非专利文献4〕Gomes AR,Byregowda SM,Veeregowda BM,Balamurugan V(2016).An overview of heterologous expression host systems for the production ofrecombinant proteins.Adv.Anim.Vet.Sci.4(7):346-356.
〔非专利文献5〕Ferrer-Miralles and Villaverde(2013).Bacterial cellfactories for recombinant proteinproduction;expanding the catalogue.MicrobialCell Factories,12:113
〔非专利文献6〕HERVE′A.et al.How Does Bacillus thuringiensis Produce SOMuch Insecticidal Crystal Protein?,J.of Bacteriology 1995,177(21),6027-6032
〔非专利文献7〕Deng C,Peng Q,Song F,Lereclus D(2014)Regulation of crygene expression in Bacillus thuringiensis.Toxins.6:2194-2209
〔非专利文献8〕Yan Hu et al.Bacillus subtilis Strain Engineered forTreatment of Soil-Transmitted Helminth Diseases,Applied and EnvironmentalMicrobiology 2013,79(18):5527-5532
〔非专利文献9〕Durmaz E.et al.Intracellular and ExtracellularExpression of Bacillus thuringiensis Crystal Protein Cry5B in Lactococcuslactis for Use as an Anthelminthic,Applied and Environmental Microbiology2016,82(4):1286-1294
发明内容
本发明提供以下的1)~2)。
1)一种Cry蛋白质或含有该Cry蛋白质的培养产物的制造方法,其中,所述方法包括:用将编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接并嵌入而成的表达质粒来转化芽孢杆菌属细菌,培养该转化细胞,其中,上述表达质粒是包含编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有80%以上的同一性并且参与复制起始的蛋白质的多核苷酸的质粒。
2)一种用于在芽孢杆菌属细菌内表达Cry蛋白质的表达质粒,其中,所述表达质粒包含:编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有80%以上的同一性并且参与复制起始的蛋白质的多核苷酸,编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接而成。
附图说明
[图1-A]Cry5B表达质粒(pPsScry5B和pPsScry5Bt)的构建。箭头表示引物的位置和方向,在箭头的上或下标记引物的名称。
[图1-B]Cry5B表达质粒(pPscry5B和pPscry5Bt)的构建。箭头表示引物的位置和方向,在箭头的上或下标记引物的名称。
[图1-C]Cry5B表达质粒(pPvcry5B和pPvcry5Bt)的构建。箭头表示引物的位置和方向,在箭头的上或下标记引物的名称。
[图1-D]Cry5B表达质粒(pPvScry5B和pPvScry5Bt)的构建。箭头表示引物的位置和方向,在箭头的上或下标记引物的名称。
[图2]利用具有分泌信号的质粒的Cry5B和Cry5Bt的表达。
[图3]利用不具有分泌信号的质粒的Cry5B表达。
[图4-A]使用了枯草杆菌突变株的Cry5B表达(1)。
[图4-B]使用了枯草杆菌突变株的Cry5B表达(2)。
[图5]L1 growth分析中线虫的照片。
[图6]线虫的面积。以对照的面积为100%时的各Cry5B蛋白浓度的值。
[图7]利用不具有分泌信号的质粒的Cry5Bt表达。
[图8]灭蚊蛋白质表达质粒(pHY-Pscry4Aa、pHY-Pscry4Ba、pHY-Pscry11Aa、pHY-Pvcry4Aa、pHY-Pvcry4Ba、pHY-Pvcry11Aa)。
[图9]灭蚊蛋白质的表达。
具体实施方式
本发明涉及提供用于在芽孢杆菌属细菌的菌体内高生产Cry蛋白质的方法。
本发明的发明人对利用芽孢杆菌属细菌、优选枯草杆菌的Cry蛋白质的菌体内生产进行了研究,结果意外地发现,通过使用在菌体外蛋白质的生产所使用的特定的高表达质粒,在菌体内可以生产显著量的Cry蛋白质,该蛋白质具有与野生型同程度的活性。
根据本发明,可以提供使用了芽孢杆菌属细菌、优选枯草杆菌(Bacillussubtilis)的Cry蛋白质的高表达体系,通过使用该体系,能够高效地制造Cry蛋白质或含有Cry蛋白质的培养产物。
在本说明书中,氨基酸序列和核苷酸序列的同一性根据Lipman-Pearson法(Lipman,DJ.,Pearson.WR.:Science,227,1435-1441,1985)来计算。具体而言,使用遗传信息处理软件Genetyx-Win(软件开发)的同源性解析(Search homology)程序,将Unit sizeto compare(ktup)设为2进行解析,由此来算出。
在本说明书中,只要没有另外定义,关于氨基酸序列或核苷酸序列中的氨基酸或碱基的缺失、取代、添加或嵌入所使用的“1个或数个”例如可以指1~12个、优选为1~8个、更优选为1~4个。另外,在本说明书中,氨基酸或碱基的“添加”中包括向序列的一个末端和两个末端的1~数个的氨基酸的或碱基的添加。
在本说明书中,作为关于杂交的“严格条件下”,可以列举Molecular Cloning-ALABORATORY MANUAL THIRD EDITION(Joseph Sambrook,David W.Russell,Cold SpringHarbor Laboratory Press,2001)中记载的条件,例如,可以为在含有6×SSC(1×SSC的组成:0.15M氯化钠、0.015M柠檬酸钠、pH7.0)、0.5%SDS、5×Denhardt’s溶液和100mg/mL鲱鱼精DNA的溶液中与探针一起在65℃恒温8~16小时使其杂交的条件。
在本说明书中,基因的上游和下游分别是指与作为对象捕捉的基因或区域的5'侧和3'侧相连的区域。只要没有另外定义,基因的上游和下游不限定于各个从基因的翻译起始点开始的上游区域和基因的下游区域。
在本说明书中,转录起始控制区域是包含启动子和转录起始点的区域,翻译起始控制区域是相当于与起始密码子一起形成核糖体结合部位的Shine-Dalgarno(SD)序列的部位(Shine,J.,Dalgarno,L.:Proc.Natl.Acad.Sci.USA.,71,1342-1346,1974)。
在本发明中,Cry蛋白质是指苏云金芽孢杆菌(Bacillus thuringiensis)所产生的结晶性杀虫蛋白质。Cry蛋白质根据蛋白质的1级构造分类为从Cry1至Cry75的类(Microbiology and Molecular Biology Reviews(1998)62,807-813.Revision of theNomenclature for the Bacillus thuringiensis Pesticidal Crystal Proteins,http://www.lifesci.sussex.ac.uk/Home/Neil#Crickmore/Bt/.(2017年12月7日),各类根据序列相似性的程度进一步分类为子类。例如,属于Cry1类的蛋白存在100种以上。将主要的Cry蛋白质示于以下的表1-1~1-3。此外,该表中所示的登录序号为GenBankAccession No.。
其中,本发明的方法更适于Cry1A蛋白质、Cry1F蛋白质、Cry2A蛋白质、Cry34A蛋白质、Cry35A蛋白质、Cry3A蛋白质、Cry3B蛋白质、Cry21蛋白质、Cry14A蛋白质、Cry6A蛋白质、Cry13蛋白质、Cry5B蛋白质、Cry4Aa蛋白质、Cry4Ba蛋白质、Cry11Aa蛋白质的制造,更适于Cry5B蛋白质、Cry4Aa蛋白质、Cry4Ba蛋白质、Cry11Aa蛋白质的制造。
Cry5B蛋白质是已知对于土壤传播蠕虫症有效的杀线虫蛋白质(Cappello M etal.Proc.Natl.Acad.Sci.U.S.A.103:15154-15159,Hu Y et al.PLoS Negl.Trop.Dis.4:e614)。作为Cry5B的氨基酸序列的例子,由序列表的序列编号2表示,编码该蛋白质的基因的碱基序列由序列表的序列编号1表示。
Cry4Aa蛋白质、Cry4Ba蛋白质和Cry11Aa蛋白质作为对蚊子具有杀虫活性的蛋白质已知(FEMS Microbiol Lett 266(2007)163-169,Mhalakshmi A at al.AdvancesMicrobiol.2(2012)216-226)。
作为Cry4Aa的氨基酸序列的例子,由序列表的序列编号4表示,编码该蛋白质的基因的碱基序列由序列表的序列编号3表示。
作为Cry4Ba的氨基酸序列的例子,由序列表的序列编号6表示,编码该蛋白质的基因的碱基序列由序列表的序列编号5表示。
作为Cry11Aa的氨基酸序列的例子,由序列表的序列编号8表示,编码该蛋白质的基因的碱基序列由序列表的序列编号7表示。
总所周知这样的天然的蛋白质之中由于生态型(ecotype)等的不同存在基因的突变、或由于非常相似的同工酶的存在等引起存在具有1个至数个的氨基酸突变的突变蛋白质。
因此,本发明的Cry蛋白质中,在表1所示的Cry蛋白质之外,也包括在构成该蛋白质的氨基酸序列中添加或取代有1个至数个的氨基酸残基、或者缺失了1个至数个的氨基酸残基的氨基酸序列且具有相同的杀虫活性的该Cry蛋白质的突变体。
例如,Cry5B蛋白质、Cry4Aa蛋白质、蛋白质Cry4Ba、Cry11Aa蛋白质包含以下的(A)~(C)。
(A)由序列编号2、4、6或8所示的氨基酸序列构成的蛋白质
(B)由在序列编号2、4、6或8所示的氨基酸序列中缺失、取代、添加或嵌入了1个或数个的氨基酸的氨基酸序列构成并且具有杀虫活性的蛋白质
(C)由与序列编号2、4、6或8所示的氨基酸序列具有80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、更优选为97%以上、更优选为98%以上、更优选为99%以上的同一性的氨基酸序列构成并且具有杀虫活性的蛋白质
本发明的编码Cry蛋白质的基因(也称为cry基因)的种类没有特别限定,可以是天然来源的DNA、重组DNA、化学合成DNA的任意种,或者也可以是基因组DNA克隆、cDNA克隆的任意种。
本发明的cry基因典型而言是指上述表1所示的各cry基因,但是,本领域技术人员众所周知,在天然的基因之中,存在由于生态型(ecotype)等的不同引起的少数的突变、或由于非常相似的同工酶的存在引起的少数的突变。因此,本发明的cry基因不限定于仅表1所示的基因,也包括编码上述Cry蛋白质的全部基因。
例如,cry5B基因、cry4Aa基因、cry4Ba基因、cry11Aa基因包含以下的(a)~(f)。
(a)由序列编号1、3、5或7所示的核苷酸序列构成的多核苷酸
(b)由与序列编号1、3、5或7所示的核苷酸序列具有80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、更优选为97%以上、更优选为98%以上、更优选为99%以上的同一性的核苷酸序列构成并且编码具有杀虫活性的蛋白质的多核苷酸
(c)与由序列编号1、3、5或7所示的核苷酸序列构成的多核苷酸的互补链在严格条件下杂交并且编码具有杀虫活性的蛋白质的多核苷酸
(d)编码由序列编号2、4、6或8所示的氨基酸序列构成的蛋白质的多核苷酸
(e)编码由在序列编号2、4、6或8所示的氨基酸序列中缺失、取代、添加或嵌入了1个或数个的氨基酸的氨基酸序列构成并且具有杀虫活性的蛋白质的多核苷酸
(f)编码由与序列编号2所示的氨基酸序列具有80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、更优选为97%以上、更优选为98%以上、更优选为99%以上的同一性的氨基酸序列构成并且具有杀虫活性的蛋白质的多核苷酸
在本发明中,Cry蛋白质或含有Cry蛋白质的培养产物通过将上述的cry基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接并嵌入表达质粒,用该质粒来转化芽孢杆菌属细菌,对该转化细胞进行培养来制造,作为表达质粒,使用编码由序列编号9所示的氨基酸序列构成的复制蛋白质或在氨基酸序列上与其具有80%以上的同一性并且参与复制起始的蛋白质的多核苷酸的质粒。
复制蛋白质(Rep)是在质粒的复制起始发挥作用的起始蛋白,本发明中使用的质粒包含枯草杆菌中复制所需的序列编号9所示的复制蛋白质。例如,序列编号9所示的复制蛋白质存在于pAMα1。pAMα1的复制蛋白质存在2种,本发明中所使用的复制蛋白质为由序列编号9所示的氨基酸构成的蛋白质(RepB)。另外,与该蛋白质在氨基酸序列中具有80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、更优选为97%以上、更优选为98%以上、更优选为99%以上的同一性并且参与复制起始的蛋白质也能够与该蛋白质同样地使用。作为这样的质粒复制蛋白质,例如,包含在序列编号9所示的氨基酸序列中缺失、取代或添加了1个或数个的氨基酸的氨基酸序列。例如,可以列举专利第5361484号中记载的突变蛋白质、即、在序列编号9所示的氨基酸序列中选自(a)48位、(b)262位、(c)149位和(d)198位中的1个以上的氨基酸残基被特定的氨基酸残基取代而成的蛋白质。
上述质粒中,除了编码复制蛋白质的多核苷酸以外,还包含编码参与复制起始的蛋白质的多核苷酸等。另外,除了这些以外,该质粒中还能够适当含有耐药性基因、多克隆位点等。
作为在本发明中使用的合适的质粒,例如,可以列举pHY300PLK、专利第5361484号中记载的质粒等。
pHY300PLK用能够向大肠杆菌(Escherichia coli)和枯草杆菌(Bacillussubtilis)双方转化DNA的穿梭载体,由来自E.coli的质粒pACYC177和Streptococcusfaecalis的质粒pAMα1的DNA构建,在pAMα1的复制区域包含RepB。
在该质粒中将目的的编码Cry蛋白质的基因与包含σA因子依赖性启动子或σH因子依赖性启动子的控制区域和能够工作地连接,构建能够在枯草杆菌的菌体内生产Cry蛋白质的重组质粒(表达载体)。
这里,“与控制区域能够工作地连接的基因”是指配置为在该控制区域的控制下能够表达的基因。
这里,启动子定义为存在于规定的基因中的编码区域的上游并且具有与RNA聚合酶相互作用而控制该基因的转录的功能的区域。更具体而言,启动子是指规定的基因的编码区域的上游200~600碱基左右的区域。
另外,作为包含启动子的控制区域,可以列举转录起始控制区域和翻译起始控制区域。该控制区域优选具有提高宿主内的下游的基因的表达的功能,更优选具有使下游基因构成性表达或使其高表达的功能。
σA因子依赖性启动子和σH因子依赖性启动子在孢子形成微生物中,是在孢子形成期中在芽孢衣壳蛋白沉淀期之前发挥作用的启动子。
优选包含σA依赖性启动子或σH依赖性启动子的控制区域选自与编码Cry蛋白质的基因的起源微生物中的该基因的控制区域不同的控制区域。
作为σA因子依赖性启动子,没有特别限定,能够列举枯草杆菌噬菌体SP01启动子(Proc.Natl.Acd.Sci.USA.(1984)81:439-443.)、veg基因、amyE(淀粉酶)基因、aprE(枯草溶菌素)基因和S237(S237纤维素酶、日本特开2000-210081号公报)基因的启动子。作为σH因子依赖性启动子,没有特别限定,可以列举citG基因、spoVS基因和spoVG(Proc.Natl.Acd.Sci.USA.(1986)83:9438-9442.)基因的启动子。
在本发明中,作为σA因子依赖性启动子,更优选Bacillus sp.KSM-S237株的纤维素酶基因的启动子,作为σH因子依赖性启动子,更优选枯草杆菌Bacillus subtilisMarburg No.168(枯草杆菌168株)的spoVG基因(BG10112)的启动子。
作为包含σA因子依赖性启动子的控制区域,可以适当优选Bacillus sp.KSM-S237株的纤维素酶基因的控制区域。具体而言,该控制区域为该纤维素酶基因的转录起始控制区域和翻译起始区域(序列编号10)、优选为序列编号10所示的碱基序列、或者具有相对于该碱基序列为80%以上、更优选为90%以上、进一步优选为95%以上、更进一步优选为98%以上的同一性的碱基序列、或者上述任意的碱基序列的一部分缺失的碱基序列。具有相对于上述序列编号10所示的碱基序列为80%以上、更优选为90%以上、进一步优选为95%以上、更进一步优选为98%以上的同一性的碱基序列是指具有上述同一性并且保持作为σA因子依赖性启动子的基因的转录相关的功能和翻译相关的功能的序列。另外,上述碱基序列的一部分缺失的碱基序列是指缺失了上述碱基序列的一部分但是保持作为σA因子依赖性启动子的基因的转录相关的功能和翻译相关的功能的序列。其中,作为更优选的σA因子依赖性启动子,可以列举由序列编号11所示的碱基序列构成的启动子。该启动子是由在上述Bacillus sp.KSM-S237株的纤维素酶基因的控制区域中删除了Cre样序列得到的序列构成(日本特开2011-103875号公报)、相对于序列编号10所示的碱基序列具有95%的序列同一性的启动子。
这里,“作为σA因子依赖性启动子发挥作用”是指通过作为RNA聚合酶的σA因子特异地转录控制。该特异性能够通过在作为评价对象的多核苷酸的下游结合报告基因,在σA因子存在下和不存在下观察报告基因的表达来评价。
另外,作为包含σH因子依赖性启动子的控制区域,可以列举枯草杆菌Bacillussubtilis Marburg No.168(枯草杆菌168株)的spoVG基因的控制区域。具体而言,该控制区域是该spoVG基因(BG10112)的转录起始控制区域和翻译起始区域(序列编号12)、优选为序列编号12所示的碱基序列、或者具有相对于该碱基序列为80%以上、更优选为90%以上、进一步优选为95%以上、更进一步优选为98%以上的同一性的碱基序列、或者上述任意的碱基序列的一部分缺失的碱基序列。具有相对于上述序列编号12所示的碱基序列为80%以上、更优选为90%以上、进一步优选为95%以上、更进一步优选为98%以上的同一性的碱基序列指具有上述同一性并且保持作为σA因子依赖性启动子的基因的转录相关的功能和翻译相关的功能的序列。另外,上述碱基序列的一部分缺失的碱基序列是指缺失了上述碱基序列的一部分但是保持作为σA因子依赖性启动子的基因的转录相关的功能和翻译相关的功能的序列。这里,“作为σA因子依赖性启动子发挥作用”是指通过作为RNA聚合酶的σA因子特异地转录控制。该特异性能够通过在作为评价对象的多核苷酸的下游结合报告基因,在σA因子存在下和不存在下观察报告基因的表达来评价。
向包含上述cry基因、和上述控制区域的质粒的嵌入能够根据该领域中的通常的方法来进行。例如,将上述cry基因、和控制区域的片段通过PCR等进行扩增,利用限制酶法等将这些片段嵌入质粒并连接即可。或者,也可以制作预先连接上述基因和控制区域的片段而得到的片段,将其嵌入质粒。此时,在质粒上,从上游以控制区域片段、cry基因的片段的顺序连接。也能够简便地使用市售的连接试剂盒(例如,TAKARA BIO制等)。
作为将构建的质粒导入宿主细胞的方法,可以列举Sambrook,J.等,MolecularCloning,A Laboratory Manual(2nd edition),Cold Spring Harbor Laboratory,1.74(1989)中记载的氯化钙法或氯化钙/氯化铷法、电穿孔法、电注射法、利用PEG等的化学处理的方法、使用基因枪等的方法等。
作为导入上述表达质粒的宿主细胞,可以使用芽孢杆菌属细菌、优选为枯草杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)或短芽孢杆菌(Bacillusbrevis),这些可以为野生型也可以为实施了突变的细胞。作为属于芽孢杆菌属的微生物,具体而言,可以列举枯草杆菌(Bacillus subtilis)、蜡样芽孢杆菌(Bacillus cereus)、苏云金芽孢杆菌(Bacillus thuringiensis)、炭疽芽孢杆菌(Bacillus anthracis)、嗜热脂肪芽孢杆菌(Bacillus stearotheromophilus)、凝结芽孢杆菌(Bacillus coagulans)、巨大芽孢杆菌(Bacillus megaterium)、嗜碱耐盐芽孢杆菌(Bacillus halodurans)、短芽孢杆菌(Bacillus brevis(短短芽孢杆菌(Brevibacillus brevis)))、桥石短芽孢杆菌(Bacillus choshinensis(Brevibacillus choshinensis))、短小芽孢杆菌(Bacilluspumilus)、嗜碱芽孢杆菌(Bacillus alcalophilus)、溶淀粉芽孢杆菌(Bacilusamylolyticus)、解淀粉芽孢杆菌(Bacilus amyloliquefaciens)、地衣芽孢杆菌(Bacilusliqueniformis)、多粘芽孢杆菌(Bacillus polymyxa(Paenibacillus polymyxa))、球形芽孢杆菌(Bacillus sphaericus)、坚强芽孢杆菌(Bacillus firmus)、克劳氏芽孢杆菌(Bacillus clausii)、浸麻芽孢杆菌(Bacillus macerans)等。其中,短芽孢杆菌(Bacillusbrevis)分类为短芽孢杆菌属(Brevibacillus属),根据菌株的不同,有时记载为短短芽孢杆菌(Brevibacillus brevis)或桥石短芽孢杆菌(Brevibacillus choshinensis)等,多粘芽孢杆菌(Bacillus polymyxa)有时分类为类芽孢杆菌属(Paenibacillus属)并记载为多粘芽孢杆菌(Paenibacillus polymyxa),嗜热脂肪芽孢杆菌(Bacillusstearotheromophilus)有时分类为地芽孢杆菌属(Geobacillus属)并记载为嗜热脂肪土芽孢杆菌(Geobacillus stearotheromophilus)。但是,在本说明书,短芽孢杆菌(Bacillusbrevis)、多粘芽孢杆菌(Bacillus polymyxa)、和嗜热脂肪芽孢杆菌(Bacillusstearotheromophilus)均定义为作为属于芽孢杆菌属(Bacillus属)的细菌。即,在本发明中,称为属于芽孢杆菌属(Bacillus属)的微生物时,解释为作为包括记载为短短芽孢杆菌(Brevibacillus brevis)、桥石短芽孢杆菌(Brevibacillus choshinensis)的微生物、记载为多粘芽孢杆菌(Paenibacillus polymyxa)的微生物和嗜热脂肪土芽孢杆菌(Geobacillus stearotheromophilus)的微生物的意义。此外,属于上述芽孢杆菌属的微生物能够从各微生物保存机构购入。
作为野生型的芽孢杆菌属细菌,例如可以列举枯草杆菌Bacillus subtilisMarburg No.168(枯草杆菌168株),作为枯草杆菌突变株,只要适于Cry蛋白质的制造即可,没有特别限定,例如,可以列举在枯草杆菌野生株的基因组上缺失了对于生存、增殖、蛋白质生产不必须的区域的枯草杆菌株、缺失了特定的蛋白酶基因的枯草杆菌株、缺失了孢子形成期特异的σ因子基因的枯草杆菌株、或组合了这些突变的枯草杆菌株等。
缺失了基因组的大区域的枯草杆菌突变株与枯草杆菌野生株(例如,枯草杆菌168株)的基因组相比,具有缺失了其基因组中的大区域的基因组,例如可以列举日本专利4955358号中记载的突变株。例如,可以列举缺失了枯草杆菌野生株的基因组中的、选自prophage6(yoaV-yobO)区域、prophage1(ybbU-ybdE)区域、prophage4(yjcM-yjdJ)区域、PBSX(ykdA-xlyA)区域、prophage5(ynxB-dut)区域、prophage3(ydiM-ydjC)区域、spb(yodU-ypqP)区域、pks(pksA-ymaC)区域、skin(spoIVCB-spoIIIC)区域、pps(ppsE-ppsA)区域、prophage2(ydcL-ydeJ)区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、prophage7(yrkM-yraK、或yrkS-yraK)区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域中的区域的1个以上的枯草杆菌突变株,优选为缺失了全部prophage6(yoaV-yobO)区域、prophage1(ybbU-ybdE)区域、prophage4(yjcM-yjdJ)区域、PBSX(ykdA-xlyA)区域、prophage5(ynxB-dut)区域、prophage3(ydiM-ydjC)区域、spb(yodU-ypqP)区域、pks(pksA-ymaC)区域、skin(spoIVCB-spoIIIC)区域、pps(ppsE-ppsA)区域、prophage2(ydcL-ydeJ)区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、prophage7(yrkS-yraK)区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域的枯草杆菌MGB874株。该MGB874株能够由国立遗传学研究所NBRP(National BioResourceProject)获得(http://www.shigen.nig.ac.jp/bsub/kaoListAction.do)。另外,作为MGB874株的突变株,例如可以列举日本特开2017-79639号中记载的、以abrB基因或与其相当的基因恒定表达的方式进行基因构建并且kinA基因被缺失或失活的枯草杆菌突变株(MGB874abrB*ΔkinA)。
作为缺失了特定的蛋白酶基因的枯草杆菌株,例如可以列举专利4485341号中记载的、缺失了枯草杆菌的aprX基因和选自枯草杆菌的aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA中的1个以上的基因或使其失活了的枯草杆菌,优选为缺失了aprX、aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA的9个的基因的9重缺失株(Dpr9株)。
另外,作为缺失了孢子形成期特异的σ因子基因的枯草杆菌株,可以列举日本专利4336082号中记载的、缺失了sigF、sigG、和sigE中的1个以上的基因或使其失活的枯草杆菌株,优选为sigE缺失株(ΔsigE株)、sigF缺失株(ΔsigF株),更优选为sigF缺失株(ΔsigF株)。
从Cry蛋白质的生产的方面考虑,更优选使用上述MGB874株缺失了sigF的MGB874ΔsigF突变株,对上述Dpr9株缺失了sigF的Dpr9ΔsigF突变株。
本发明的Cry蛋白质能够通过将包含如上所述制备的表达载体的转化枯草杆菌用营养培养基进行培养来表达(生产)。营养培养基优选含有枯草杆菌(转化体)的生育所必需的碳源、无机氮源或有机氮源。作为碳源,例如,可以例示葡萄糖、右旋糖酐、可溶性淀粉、蔗糖、甲醇等。作为无机氮源或有机氮源,例如,可以例示铵盐类、硝酸盐类、氨基酸、玉米浆、蛋白胨、酪蛋白、肉提取物、大豆渣、土豆提取液等。另外,也可以根据期望含有其它的营养素(例如无机盐(例如,氯化钠、氯化钙、磷酸二氢钠、氯化镁)、维生素类、抗生素(例如四环素、新霉素、卡那霉素、壮观霉素、红霉素等)等)。培养可以通过本领域所知的方法进行。培养条件、例如温度、通气搅拌条件、培养基的pH和培养时间等可以适当选择使得大量生产本发明的蛋白质。
含有本发明的Cry蛋白质的根据上述培养得到的培养物可以通过离心分离、过滤等的操作收集宿主细胞、将其在适当的缓冲液(例如浓度为10M~100mM左右的Tris缓冲液、磷酸缓冲液、HEPES缓冲液、MES缓冲液等的缓冲液(期望为pH5.0~9.0的范围)、水中悬浊而得到。另外,也能够通过公知的细胞破碎法、例如通过适当组合溶菌酶、冻结熔融、超声波处理、法压壶、珠子破碎等来破坏细胞,通过离心分离回收Cry蛋白质。另外,也能够将上述培养物通过添加香芹酚等的具有杀菌效果的物质并进行孵育来进行杀菌处理(专利文献3)。
回收的Cry蛋白质能够利用蔗糖密度梯度法、重结晶法、离子交换层析法、凝胶过滤、疏水性层析法、等电点层析法、将对Cry蛋白质的多克隆抗体等作为配体的亲和柱等进行适当精制。
关于上述的实施方式,在本发明中还公开了以下的方式。
<1>一种Cry蛋白质或含有该Cry蛋白质的培养产物的制造方法,其中,所述方法包括:用将编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接并嵌入而成的表达质粒来转化芽孢杆菌属细菌,培养该转化细胞,上述表达质粒是包含编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、更优选为97%以上、更优选为98%以上、更优选为99%以上的同一性并且参与复制起始的蛋白质的多核苷酸的质粒。
<2>如<1>的方法,其中,包含σA依赖性启动子或σH依赖性启动子的控制区域与编码Cry蛋白质的基因的起源微生物中的该基因的控制区域不同。
<3>如<1>或<2>的方法,其中,包含σA依赖性启动子或σH依赖性启动子的控制区域为spoVG基因的控制区域或Bacillus sp.KSM-S237株的纤维素酶基因的控制区域。
<4>如<3>的方法,其中,Bacillus sp.KSM-S237株的纤维素酶基因的控制区域为该基因的转录起始控制区域和翻译起始区域。
<5>如<1>~<4>中任一项的方法,其中,芽孢杆菌属细菌为枯草杆菌、巨大芽孢杆菌(Bacillus megaterium)或短芽孢杆菌(Bacillus brevis)。
<6>如<1>~<4>中任一项的方法,其中,芽孢杆菌属细菌为枯草杆菌。
<7>如<6>的方法,其中,枯草杆菌为枯草杆菌168株。
<8>如<6>或<7>的方法,其中,枯草杆菌为具有缺失了选自prophage6区域、prophage1区域、prophage4区域、PBSX区域、prophage5区域、prophage3区域、spb区域、pks区域、skin区域、pps区域、prophage2区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、SKIN-Pro7区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域中的1个以上的区域的基因组的枯草杆菌。
<9>如<6>~<8>中任一项的方法,其中,枯草杆菌为缺失了aprX、aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA各基因的全部或使其失活了的枯草杆菌株。
<10>如<6>~<8>中任一项的方法,其中,枯草杆菌为缺失了选自sigE、sigF、sigG的基因的枯草杆菌株。
<11>如<6>~<8>中任一项的方法,其中,枯草杆菌为缺失了选自sigE、sigF的基因的枯草杆菌株。
<12>如<6>~<8>中任一项的方法,其中,枯草杆菌为缺失了sigF基因的枯草杆菌株。
<13>如<12>的方法,其中,枯草杆菌是选自枯草杆菌168株、MGB874株和Dpr9株中的枯草杆菌株或对其缺失了sigF基因的枯草杆菌株。
<14>如<6>~<8>中任一项的方法,其中,枯草杆菌是对枯草杆菌MGB874株以恒定表达abrB基因或与其相当的基因的方式进行基因构建并且kinA基因缺失或失活的枯草杆菌突变株。
<15>如<1>~<14>中任一项的方法,其中,Cry蛋白质为Cry5B。
<16>如<1>~<14>中任一项的方法,其中,Cry蛋白质为Cry5Bt。
<17>如<1>~<14>中任一项的方法,其中,Cry蛋白质为选自Cry4Aa、Cry4Ba和Cry11Aa的灭蚊蛋白质。
<18>一种用于在芽孢杆菌属细菌内表达Cry蛋白质的表达质粒,其中,所述表达质粒包含:编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、更优选为97%以上、更优选为98%以上、更优选为99%以上的同一性并且参与复制起始的蛋白质的多核苷酸,编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接而成。
<19>如<18>的表达质粒,其中,包含σA依赖性启动子或σH依赖性启动子的控制区域与编码Cry蛋白质的基因的起源微生物中的该基因的控制区域不同。
<20>如<18>或<19>的表达质粒,其中,包含σA依赖性启动子或σH依赖性启动子的控制区域包含spoVG基因的控制区域或Bacillus sp.KSM-S237株的纤维素酶基因的控制区域。
<21>如<20>的表达质粒,其中,Bacillus sp.KSM-S237株的纤维素酶基因的控制区域为该基因的转录起始控制区域和翻译起始区域。
<22>如<18>~<21>中任一项所述的表达质粒,其中,Cry蛋白质为Cry5B。
<23>如<18>~<21>中任一项所述的表达质粒,其中,Cry蛋白质为Cry5Bt。
<24>如<18>~<21>中任一项所述的表达质粒,其中,Cry蛋白质为选自Cry4Aa、Cry4Ba和Cry11Aa中的灭蚊蛋白质。
<25>一种芽孢杆菌属细菌,其中,所述芽孢杆菌属细菌导入了<18>~<24>中任一项所述的表达质粒。
<26><25>的芽孢杆菌属细菌为枯草杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)或短芽孢杆菌(Bacillus brevis)。
<27><26>的枯草杆菌为枯草杆菌168株。
<28><26>或<27>的枯草杆菌为具有缺失了选自prophage6区域、prophage1区域、prophage4区域、PBSX区域、prophage5区域、prophage3区域、spb区域、pks区域、skin区域、pps区域、prophage2区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、SKIN-Pro7区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域中的1个以上的区域的基因组的枯草杆菌株。
<29><26>~<28>中任一项所述的枯草杆菌为具有缺失了prophage6区域、prophage1区域、prophage4区域、PBSX区域、prophage5区域、prophage3区域、spb区域、pks区域、skin区域、pps区域、prophage2区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、SKIN-Pro7区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域的基因组的枯草杆菌株。
<30><26>~<29>中任一项所述的枯草杆菌为缺失了选自aprX、aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA中的1个以上的基因或使其失活了的枯草杆菌株。
<31><26>~<30>中任一项所述的枯草杆菌为缺失了aprX、aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA基因或使其失活了的枯草杆菌株。
<32><26>~<31>中任一项所述的枯草杆菌为缺失了选自sigE、sigF、sigG中的1个以上的基因或使其失活了的枯草杆菌株。
<33><26>~<32>中任一项所述的枯草杆菌为缺失了sigF基因或使其失活了的枯草杆菌株。
<34><26>~<33>中任一项所述的枯草杆菌为以恒定表达abrB基因或与其相当的基因的方式进行基因构建并且kinA基因缺失或失活的枯草杆菌。
<35>如<18>~<34>中任一项所述的表达质粒或枯草杆菌,其中,包含σA依赖性启动子的控制区域为Bacillus sp.KSM-S237株的纤维素酶基因的控制区域。
<36>如<35>所述的表达质粒或枯草杆菌,其中,Bacillus sp.KSM-S237株的纤维素酶基因的控制区域是相对于序列编号10所示的碱基序列具有80%以上、更优选为90%以上、进一步优选为95%以上、更进一步优选为98%以上的同一性并且作为σA因子依赖性启动子保持有基因的转录相关的功能和翻译相关的功能的序列。
<37>如<18>~<34>中任一项所述的表达质粒或枯草杆菌,其中,包含σH因子依赖性启动子的控制区域为枯草杆菌Bacillus subtilis Marburg No.168(枯草杆菌168株)的spoVG基因的控制区域。
<38>如<37>的表达质粒或枯草杆菌,其中,spoVG基因的控制区域为相对于序列编号12所示的碱基序列具有80%以上、更优选为90%以上、进一步优选为95%以上、更进一步优选为98%以上的同一性的碱基序列并且作为σH因子依赖性启动子保持有基因的转录相关的功能和翻译相关的功能的序列。
实施例
实施例1包含Cry5B蛋白质的培养物的制造
1.人工基因的合成
由GenScript公司(美国)人工合成了来自苏云金芽孢杆菌(Bacillusthuringiensis)YBT-1518的杀虫蛋白质基因cry5B(GenBank:CP005935.1、序列编号1)。合成的基因的3738bp克隆入pUC57的KpnI和HindIII位点,得到pUC57-cry5B。
2.表达质粒的构建
在全部的表达质粒的构建中,作为载体使用pHY300PLK(TAKARA BIO),作为终止子使用来自S237纤维素酶基因的序列。启动子来自S237纤维素酶基因[Hakamada et al,Biosci.Biotechnol.Biochem.,64(2000),2281-2289]或枯草杆菌168株的spoVG基因,信号序列来自S237纤维素酶或无,cry5B基因通过组合全长(cry5B)或缩短型(cry5Bt),制作了8种质粒(图1-A~D)。cry5B基因的全长(3738bp)由序列编号1表示,碱基序号第2095-3738号的碱基序列为在线虫的肠内分解的区域,碱基序号第1-2094号的碱基序列为编码分解后的活化Crystal toxin的序列[Hui et al,2012,Biochemistry,vol 11,p9911-21],全长型为全序列(第1-3738号)、缩短型为碱基序号第1-2094号的序列。
构建方法根据In-Fusion(注册商标)HD EcoDryTM Cloning Kit的操作说明书。各质粒的制作过程如图1-A~D所示。
2.1 pPsScry5B和pPsScry5Bt的构建
使用表2所示的vect+psF和vect+tR的引物组,以pHYS237 DNA为模板对含有S237的启动子、信号和终止子区域的载体进行扩增。接着,以pUC57-cry5B DNA为模板,使用cry5BpssF和cry5BtR(或T237-cry5BatRN)的引物组,通过PCR扩增cry5B基因全长(或缩短型)的插入物。接着,使用In-Fusion(注册商标)HD EcoDryTM Cloning Kit(Clontech公司),将载体和插入物连接之后,对大肠杆菌HB101感受态细胞(TAKARA BIO)转化。将通过四环素抗性筛选出来的转化体通过菌落PCR进行确认,命名为pPsScry5B(或pPsScry5Bt)(图1-A)。对于提取的质粒,进一步进行PCR确认,另外,使用限制酶EcoRI、SpeI和XbaI进行质粒的消化模式的确认。
[表2]
2.2 pPscry5B和pPscry5Bt的构建
使用表2所示的vect+pF和vect+tR的引物组,以pHYS237 DNA为模板,对含有S237的启动子、和终止子区域的载体进行扩增。接着,以pUC57-cry5B DNA为模板,使用cry5BpF和cry5BtR(或T237-cry5BatRN)的引物组,通过PCR扩增cry5B基因全长(或缩短型)的插入物。接着,使用In-Fusion(注册商标)HD EcoDryTM Cloning Kit(Clontech公司),将载体和插入物连接之后,对大肠杆菌HB101感受态细胞(TAKARA BIO)转化。将通过四环素抗性筛选出来的转化体通过菌落PCR进行确认,命名为pPscry5B(或pPscry5Bt)(图1-B)。对于提取的质粒,进一步进行PCR确认,另外,使用限制酶EcoRI、SpeI和XbaI进行质粒的消化模式的确认。
2.3 pPvcry5B和pPvcry5Bt的构建
使用表2所示的vectR和vect+tR的引物组,以pHYS237 DNA为模板对含有S237的终止子区域的载体进行扩增。接着,以pUC57-cry5B DNA为模板,使用cry5BaF和cry5BtR(或T237-cry5BatRN)的引物组,通过PCR扩增cry5B基因全长(或缩短型)的插入物。另外,使用Vect-PvgF和cry5Ba-PvgR的引物组,以枯草杆菌168株的基因组DNA为模板将spoVG基因的启动子区域作为第二个插入物进行扩增。接着,使用In-Fusion(注册商标)HD EcoDryTMCloning Kit(Clontech公司)将载体与2个插入物连接之后,对大肠杆菌HB101感受态细胞(TAKARA BIO)转化。将通过四环素抗性筛选出来的转化体通过菌落PCR进行确认,命名为pPvcry5B(或pPvcry5Bt)(图1-C)。对于提取的质粒,进一步进行PCR确认,另外,使用限制酶EcoRI、SpeI和XbaI进行质粒的消化模式的确认。
2.4 pPvScry5B和pPvScry5Bt的构建
使用表2所示的vectR和vect+tR的引物组,以pHYS237 DNA为模板对含有S237的终止子区域的载体进行扩增。接着,以pPsScry5B DNA为模板,使用S237F和cry5BtR(或T237-cry5BatRN)的引物组,通过PCR扩增连接有S237的信号序列的cry5B基因全长(或缩短型)的插入物。另外,使用Vect-PvgF和S237-PvgR的引物组,以枯草杆菌168株的基因组DNA为模板,将spoVG基因的启动子区域作为第二个插入物进行扩增。接着,使用In-Fusion(注册商标)HD EcoDryTM Cloning Kit(Clontech公司)将载体和2个插入物连接之后,对大肠杆菌HB101感受态细胞(TAKARA BIO)转化。将通过四环素抗性筛选出来的转化体通过菌落PCR进行确认,命名为pPvScry5B(或pPvScry5Bt)(图1-D)。对于提取的质粒,进一步进行PCR确认,另外,使用限制酶EcoRI、SpeI和XbaI进行质粒的消化模式的确认。
3.质粒的序列确认
对构建的8种质粒进行序列确认。通过PCR制备序列的模板,全长cry5B的4种质粒使用表2所示的frag1-F和frag1-R或frag2-F和frag2-R的引物分别制备5'侧和3'侧的片段。缩短型cry5B的4种质粒使用表2所示的frag1-F和frag2-R的引物进行片段的制备。对这些PCR产物使用表2所示的SEQ-P1~SEQ-P10的10个引物进行序列解析。解析的结果为全部的质粒没有突变,确认了如设计那样构建了全部质粒。
4.利用具有分泌信号的质粒在枯草杆菌野生株中的Cry5B蛋白质和缩短型Cry5B(Cry5Bt)蛋白质的表达
将构建的4种具有分泌信号的质粒(图1-A、D)转化到解除了色氨酸营养要求性的枯草杆菌168株(168T株)(日本特开2017-79640号公报),将所得到的转化体在含有四环素的2×L/mal培养基(胰化蛋白胨(Bacto-tryptone)2%(w/v)、酵母提取物1.0%(w/v)、氯化钠1.0%(w/v)、硫酸锰五水合物(和光纯药工业株式会社制)0.00075%(w/v)、麦芽糖一水合物(和光纯药工业株式会社制)7.5%(w/v)、四环素盐酸盐0.0015%(w/v))以30℃、250rpm振荡培养3天。将培养液1mL以15000rpm、4℃离心分离,分为培养上清和细胞。对制备的培养上清的Cry5B的表达用SDS-PAGE进行确认,结果,没有确认到Cry5B的条带(图2)。
5.利用不具有分泌信号的质粒在枯草杆菌野生株中的Cry5B蛋白质的表达
将构建的不具有分泌信号的质粒(图1-B、C)之中用于表达Cry5B蛋白质的2种质粒<5>、<6>(图3)转化到解除了色氨酸营养要求性的枯草杆菌168株(168T株),将所得到的转化体在2×L/mal培养基以30℃、250rpm振荡培养3天。将培养液1mL以15000rpm、4℃离心分离,分为培养上清和细胞。细胞团用1×PBS清洗之后,悬浊于1mL1×PBS,添加1mg/mL溶菌酶,在37℃保温1hr。接着,使用BIORUPTOR(Cosmo Bio),通过30秒×20次超声处理进行细胞破碎之后,以15000rpm、4℃离心分离30分钟,弃去上清,将沉淀悬浊于1mL 1×PBS,制成细胞破碎液。对制备的细胞破碎液的Cry5B的表达用SDS-PAGE进行确认,结果,确认到pHY-Pscry5B(<5>)和pHY-Pvcry5B(<6>)的高表达。pHY-Pscry5B和pHY-Pvcry5B为全长型的140kD,均与推定大小一致(图3)。
6.枯草杆菌突变株中的Cry5B蛋白质的表达(1)
将缺失了枯草杆菌野生株基因组的大区域的枯草杆菌突变株(MGB874株;日本专利4955358)、蛋白酶的9重缺失株(Dpr9株;日本专利4485341)、sigF缺失株(ΔsigF株;日本专利4336082)、MGB874ΔsigF株、Dpr9ΔsigF株分别作为宿主,进行pHY-Pscry5B的转化。MGB874ΔsigF株和Dpr9ΔsigF株、MGB874abrB*ΔkinA株(日本特开2017-79639号公报)用与ΔsigF株的构建同样的方法,以MGB874和Dpr9株为基础分别删除sigF来制成。与上述4同样地用2×L/mal培养基进行培养,对制备的细胞破碎液的Cry5B表达用SDS-PAGE进行解析。其结果可知,与野生株的168T株相比,MGB874株、Dpr9株、sigF缺失株、MGB874ΔsigF株、Dpr9ΔsigF株中表达的Cry5B的条带明显变粗(图4-A)。
7.枯草杆菌突变株中的Cry5B蛋白质的表达(2)
以sigE缺失株(ΔsigE株;日本专利4336082)为宿主进行pHY-Pscry5B的转化。与上述4同样地,用2×L/mal培养基进行培养,对制备的细胞破碎液的Cry5B表达用SDS-PAGE进行解析。其结果可知,在sigE缺失株中Cry5B的条带也明显变粗(图4-B)。
8.巨大芽孢杆菌(Bacillus megaterium)中的Cry5B蛋白质的表达
将用于表达Cry5B蛋白质的质粒pHY-Pscry5B通过原生质体转化法导入巨大芽孢杆菌(Bacillus megaterium)ATCC 14581株(以下14581株)。将所得到的重组株与实施例1的5同样,用2×L/mal培养基进行培养,对制备的细胞破碎液的Cry5B表达用SDS-PAGE进行解析。其结果,在导入了pHY-Pscry5B的转化体中,确认到了Cry5B的粗的条带。
9.表达的Cry5B蛋白质的定量
使用美国国立卫生研究所(National Institute of Health,NIH)开发的图像软件ImageJ(http://rsb.info.nih.gov/ij/download.html)进行SDS-PAGE上的条带的定量。进行作为标准蛋白质的牛血清白蛋白(BSA)(和光纯药工业株式会社制)和pHY-Pscry5B转化体中表达的Cry5B的SDS-PAGE,用Bio-SafeTM Coomassie(BIO-RAD)边振荡1小时边进行染色。用离子交换水脱色之后,进行凝胶的拍照。使用ImageJ,对SDS-PAGE的图像解析各条带的亮度,制作BSA的标准曲线。从该标准曲线计算Cry5B蛋白质的量(表3、表4、表5)。如表3所示,可知,枯草杆菌野生株中的Cry5B生产率为1.1g/L,比重组生产的文献值(75mg/L)高15倍。通过使用MGB874ΔsigF株,生产率进一步提高2倍以上。
[表3]
Cry5B蛋白质的生产率(1)
[表4]
Cry5B蛋白质的生产率(2)
宿主株 Cry5B生产量(g/L)
168T 1.2
ΔsigE 1.7
[表5]
Cry5B蛋白质的生产率(3)
宿主株 Cry5B生产量(g/L)
14581株 1.3
10.Cry5B的活性评价
10.1抱卵成虫的制备
将含有大肠杆菌(E.coli OP50-1)溶液(1g湿重/6mL S培养基)750μL、链霉素(1mg/mL)溶液100μL、L1幼虫(秀丽隐杆线虫(Caenorhabditis elegans))1000只的溶液滴加到NGM板,将其在20℃的培养箱内培养3~4天,得到抱卵成虫。
10.2第一期(L1)幼虫的制备
将培养着线虫的NGM板(表6)用S basal清洗3次左右,全部转移至15mL离心管。弃去上清,将沉淀的线虫转移至1.5mL Eppendorf管。稍微放置之后,除去上清直至1mL,向其中添加4M NaOH 250μL、次氯酸钠溶液(Wako)250μL,轻轻搅拌。静置3分钟之后,用台式小型离心分离机进行30秒左右的下旋(spin down)。残留沉淀物并除去上清,添加S basal直至1.5mL,轻轻搅拌之后进行30秒左右的下旋。重复该操作3次。将由此得到的卵的沉淀全部转移至直径35mm培养皿,在20℃培养约24小时,得到孵化的第一期幼虫(L1幼虫)。
10.3 L1 growth分析
根据Bischof等的方法(Methods in Molecular Biology,vol.331,pp139-154,C.elegans:Methods and applications,Edited by:K.Strange,Humana Press),进行L1growth分析。使用48孔平底板,在各孔中添加1g/35mL的大肠杆菌溶液20μL、1mg/mL链霉素20μL、L1幼虫10只、枯草杆菌所表达的Cry5B蛋白质适量,用S培养基(表7)将总量调整为200μL。Cry5B的蛋白质的量使用1.25、2.5、5μg/mL。对照使用导入了载体(pHY300PLK)的枯草杆菌。在20℃培养3天之后,用摄像机拍摄各孔的线虫的样子(图5)。使用Image J,对拍摄的图像描绘线虫的轮廓,计算面积。将其结果示于图6。通过使用Cry5B,显著抑制了线虫的生育,与对照相比,以1.25μg/mL的浓度也能够抑制生育的约80%。根据该结果,证明了枯草杆菌中表达的Cry5B具有对线虫的毒性。
·培养基成分(1)NGM:
[表6]
<A>
<B>
A和B分别灭菌后混合。
(2)S basal:0.1M NaCl,0.05M KHPO4(pH6.0)
(3)S培养基:
[表7]
<A>S basal
<B>
*微量金属水溶液:
A和B分别灭菌后混合。
11.利用不具有分泌信号的质粒在枯草杆菌野生株中的缩短型Cry5B(Cry5Bt)蛋白质的表达
将不具有分泌信号的缩短型Cry5B(Cry5Bt)的质粒pHY-Pscry5Bt<7>转化到解除了色氨酸营养要求性的枯草杆菌168株(168T株),将所得到的转化体在2×L/mal培养基以30℃、250rpm振荡培养3天。将培养液1mL以15000rpm、4℃离心分离,分为培养上清和细胞。细胞团用1×PBS清洗之后,悬浊于1mL 1×PBS,添加1mg/mL溶菌酶,在37℃保温1hr。接着,使用BIORUPTOR(Cosmo Bio),通过30秒×20次超声处理进行细胞破碎之后,以15000rpm、4℃离心分离30分钟,弃去上清,将沉淀悬浊于1mL 1×PBS,制成细胞破碎液。对制备的细胞破碎液的Cry5B的表达用SDS-PAGE进行确认(图7)。结果确认到了pHY-Pscry5Bt的高表达。蛋白质条带的大小为79kD,与缩短型Cry5B的推定大小一致。
实施例2灭蚊蛋白质(Cry4Aa、Cry4Ba、Cry11Aa)的制造
1.人工基因的合成
由GenScript公司(美国)人工合成了来自苏云金芽孢杆菌以色列亚种(Bacillusthuringiensis serovar israelensis)的杀虫蛋白质基因cry4Aa(GenBank:YP_001573833、序列编号3)、cry4Ba(GenBank:NC_010076、序列编号5)和cry11Aa(GenBank:NC_010076、序列编号7)。合成的基因克隆入pUC57的KpnI和HindIII位点,分别得到pUC57-cry4Aa、pUC57-cry4Ba和pUC57-cry11Aa的质粒。
2.表达质粒的构建
在全部的表达质粒的构建中,作为载体使用pHY300PLK,作为终止子使用来自S237纤维素酶基因的序列。启动子通过在本研究室有实际成绩的S237纤维素酶基因[Hakamadaet al,Biosci.Biotechnol.Biochem.,64(2000),2281-2289]或来自枯草杆菌168株的spoVG基因、与cry4Aa、cry4Ba、cry11Aa的3个基因的组合,进行图8所示的6种质粒的制作。pHY-Pscry4Aa、pHY-Pscry4Ba、pHY-Pscry11Aa使用S237纤维素酶基因的启动子,pHY-Pvcry4Aa、pHY-Pvcry4Ba、pHY-Pvcry11Aa使用枯草杆菌168株的spoVG基因的启动子。构建方法根据In-Fusion(R)HD EcoDryTM Cloning Kit的操作说明书来进行。
2.1 pHY-Pscry4Aa、pHY-Pscry4Ba和pHY-Pscry11Aa的构建
使用表8所示的vect+pF和vect+tR的引物组,以pHYS237 DNA为模板,对含有S237的启动子、和终止子区域的载体进行扩增。接着,以pUC57-cry4Aa DNA为模板,使用cry4AFPS和cry4ART的引物组,通过PCR扩增cry4Aa基因的插入物。接着,使用In-Fusion(注册商标)HD EcoDryTM Cloning Kit(Clontech公司),将载体和插入物连接之后,对大肠杆菌HB101感受态细胞(TAKARA BIO)转化。将通过四环素抗性筛选出来的转化体通过菌落PCR进行确认,命名为pHY-Pscry4Aa。对于提取的质粒,进一步进行PCR确认,另外,使用限制酶进行质粒的消化模式的确认。
与上述同样地,以pUC57-cry4Ba DNA为模板,使用cry4BFPS和cry4BRT的引物组,以cry4Ba基因、pUC57-cry11Aa DNA为模板,使用cry11AFPS和cry11ART的引物组,分别通过PCR扩增cry11Aa基因的插入物,进行pHY-Pscry4Ba和pHY-Pscry11Aa的构建。
[表8]
2.2 pHY-Pvcry4Aa、pHY-Pvcry4Ba、pHY-Pvcry11Aa的构建
使用表8所示的vect+pvgF和vect+tR的引物组,以pHY-Pscry5B(参考Cry5B的实施例)为模板,对含有spoVG基因的启动子、和S237纤维素酶基因的终止子区域的载体进行扩增。接着,以pUC57-cry4Aa DNA为模板,使用cry4AFPV和cry4ART的引物组,通过PCR扩增cry4Aa基因的插入物。接着,使用In-Fusion(注册商标)HD EcoDryTM Cloning Kit(Clontech公司),将载体和插入物连接之后,对大肠杆菌HB101感受态细胞(TAKARA BIO)转化。将通过四环素抗性筛选出来的转化体通过菌落PCR进行确认,命名为pHY-Pvcry4Aa。对于提取的质粒,进一步进行PCR确认,另外,使用限制酶,进行质粒的消化模式的确认。
与上述同样地,以pUC57-cry4Ba DNA为模板,使用cry4BFPV和cry4BRT的引物组,以cry4Ba基因、pUC57-cry11Aa DNA为模板,使用cry11AFPV和cry11ART的引物组,分别通过PCR扩增cry11Aa基因的插入物,进行pHY-Pvcry4Ba和pHY-Pvcry11Aa的构建。
3.枯草杆菌中灭蚊蛋白质的表达
将构建的6种质粒(图8)转化到解除了色氨酸营养要求性的枯草杆菌168株(168T株),将所得到的转化体在2×L/mal培养基以30℃、250rpm振荡培养3天。将培养液1mL以15000rpm、4℃离心分离,分为培养上清和细胞。细胞团用1×PBS清洗之后,悬浊于1mL 1×PBS,添加1mg/mL溶菌酶,在37℃保温1hr。接着,使用Biorupter(Cosmo Bio),通过30秒×20次超声处理进行细胞破碎之后,以15000rpm、4℃离心分离30分钟,弃去上清,将沉淀悬浊于1mL 1×PBS,制成细胞破碎液。对制备的细胞破碎液中的蛋白质的表达用SDS-PAGE进行确认。结果如图9所示,在所有质粒中确认到了高表达。
4.表达的灭蚊蛋白质的定量
使用美国国立卫生研究所(National Institute of Health,NIH)开发的图像软件ImageJ(http://rsb.info.nih.gov/ij/download.html)进行SDS-PAGE上的条带的定量。作为标准蛋白质使用牛血清白蛋白(BSA)。使用ImageJ对SDS-PAGE的图像解析各条带的亮度,制作BSA的标准曲线。从该标准曲线计算各灭蚊蛋白质的量。如表9所示,确认到0.6-0.7g/L的生产率。
[表9]
灭蚊蛋白质的生产率
质粒 灭蚊蛋白质的生产量(g/L)
pHY-Pscry4Aa 0.70
pHY-Pscry4Ba 0.69
pHY-Pscry4Aa 0.55
pHY-Pvcry4Aa 0.58
pHY-Pvcry4Ba 0.60
pHY-Pvcry4Aa 0.59
5.灭蚊蛋白质的活性评价
5.1蚊幼虫的制备
白纹伊蚊(Aedes albopictus)使用由SUMIKA TECHNOSERVICE株式会社购入的卵孵化得到的蚊幼虫。在塑料盘中装入1cm左右的水,装入产有卵的滤纸。作为每日孵化后的蚊幼虫用饵,给予热带鱼用的饲料(TetraMin Baby)。在活性评价中使用孵化后第5天的蚊幼虫。
5.2灭蚊活性评价
根据Leetachewa等的方法(BMB reports,47(2014),546-551),进行枯草杆菌中表达的Cry4Aa、Cry4Ba和Cry11Aa的灭蚊活性评价。使用24孔平底板,在各孔中调整为5日龄蚊幼虫10只、灭蚊蛋白质浓度50μg/mL、用水调整为1mL总量。在25℃放置24h后,数出死亡的蚊幼虫的只数,算出死亡率。其结果如表10所示。相对于对照的死亡率为0%,Cry4Aa、Cry4Ba、Cry11Aa分别为93.3%、93.3%和76.7%。从该结果,确认了枯草杆菌中表达的灭蚊蛋白质的高的灭蚊効果。
[表10]
灭蚊蛋白质对蚊幼虫的杀虫效果
灭蚊蛋白质 死亡率(%)
对照 0
Cry4Aa 93.3
Cry4Ba 93.3
Cry11Aa 76.7
序列表
<110> 花王株式会社
<120> 蛋白质的制造方法
<130> KS1616
<150> JP 2018-003491
<151> 2018-1-12
<160> 58
<170> PatentIn version 3.5
<210> 1
<211> 3738
<212> DNA
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<220>
<221> CDS
<222> (1)..(3738)
<400> 1
atg gca aca att aat gag ttg tat cca gtt cct tat aat gtg cta gct 48
Met Ala Thr Ile Asn Glu Leu Tyr Pro Val Pro Tyr Asn Val Leu Ala
1 5 10 15
cat cca att aaa gaa gtc gat gat cct tat tct tgg tca aat tta tta 96
His Pro Ile Lys Glu Val Asp Asp Pro Tyr Ser Trp Ser Asn Leu Leu
20 25 30
aag ggt ata caa gaa ggt tgg gaa gaa tgg gga aaa aca gga caa aaa 144
Lys Gly Ile Gln Glu Gly Trp Glu Glu Trp Gly Lys Thr Gly Gln Lys
35 40 45
aaa ctt ttt gaa gac cat ctt acg att gca tgg aat ctt tat aaa aca 192
Lys Leu Phe Glu Asp His Leu Thr Ile Ala Trp Asn Leu Tyr Lys Thr
50 55 60
gga aaa tta gat tat ttc gct ttg aca aaa gca tca ata tca ttg att 240
Gly Lys Leu Asp Tyr Phe Ala Leu Thr Lys Ala Ser Ile Ser Leu Ile
65 70 75 80
gga ttt att cca ggg gca gaa gca gca gtt ccc ttt att aat atg ttt 288
Gly Phe Ile Pro Gly Ala Glu Ala Ala Val Pro Phe Ile Asn Met Phe
85 90 95
gta gac ttt gtt tgg cct aaa tta ttt ggt gcg aat aca gaa gga aaa 336
Val Asp Phe Val Trp Pro Lys Leu Phe Gly Ala Asn Thr Glu Gly Lys
100 105 110
gat caa cag ttg ttt aat gct atc atg gat gca gtt aat aaa atg gta 384
Asp Gln Gln Leu Phe Asn Ala Ile Met Asp Ala Val Asn Lys Met Val
115 120 125
gat aat aag ttc tta agt tat aat ctt agt aca ctt aat aaa aca att 432
Asp Asn Lys Phe Leu Ser Tyr Asn Leu Ser Thr Leu Asn Lys Thr Ile
130 135 140
gaa gga ctt caa ggt aat tta ggc cta ttt caa aat gct ata caa gta 480
Glu Gly Leu Gln Gly Asn Leu Gly Leu Phe Gln Asn Ala Ile Gln Val
145 150 155 160
gcc att tgt caa ggc agt aca cca gaa aga gta att ttt gat caa aat 528
Ala Ile Cys Gln Gly Ser Thr Pro Glu Arg Val Ile Phe Asp Gln Asn
165 170 175
tgt aca cca tgt aat cca aat caa cct tgt aaa gat gat ttg gat aga 576
Cys Thr Pro Cys Asn Pro Asn Gln Pro Cys Lys Asp Asp Leu Asp Arg
180 185 190
gtt gct tca cgt ttt gat acg gct aat tct caa ttc aca cag cat tta 624
Val Ala Ser Arg Phe Asp Thr Ala Asn Ser Gln Phe Thr Gln His Leu
195 200 205
cca gaa ttt aaa aat cct tgg tcg gat gaa aac tct act cag gaa ttt 672
Pro Glu Phe Lys Asn Pro Trp Ser Asp Glu Asn Ser Thr Gln Glu Phe
210 215 220
aaa aga aca tct gtt gaa tta act tta cca atg tat aca aca gta gct 720
Lys Arg Thr Ser Val Glu Leu Thr Leu Pro Met Tyr Thr Thr Val Ala
225 230 235 240
acg tta cat ctt tta tta tat aaa gga tat ata gaa ttt atg aca aaa 768
Thr Leu His Leu Leu Leu Tyr Lys Gly Tyr Ile Glu Phe Met Thr Lys
245 250 255
tgg aat ttt cac aat gaa caa tat tta aat aat tta aag gta gaa tta 816
Trp Asn Phe His Asn Glu Gln Tyr Leu Asn Asn Leu Lys Val Glu Leu
260 265 270
caa caa ttg ata cac tca tat tca gaa act gtt cgt aca agt ttc ctt 864
Gln Gln Leu Ile His Ser Tyr Ser Glu Thr Val Arg Thr Ser Phe Leu
275 280 285
caa ttt tta cct acc ttg aat aat cgt tca aaa tca tcc gta aat gct 912
Gln Phe Leu Pro Thr Leu Asn Asn Arg Ser Lys Ser Ser Val Asn Ala
290 295 300
tat aac cgt tat gtc cgc aat atg act gtt aac tgt tta gat att gct 960
Tyr Asn Arg Tyr Val Arg Asn Met Thr Val Asn Cys Leu Asp Ile Ala
305 310 315 320
gct aca tgg cct aca ttt gat aca cat aat tat cat caa ggt ggt aaa 1008
Ala Thr Trp Pro Thr Phe Asp Thr His Asn Tyr His Gln Gly Gly Lys
325 330 335
tta gat tta act cgt att att ctt tca gat aca gca gga cca ata gaa 1056
Leu Asp Leu Thr Arg Ile Ile Leu Ser Asp Thr Ala Gly Pro Ile Glu
340 345 350
gaa tat act act ggc gac aaa act tca gga cct gaa cat agt aac att 1104
Glu Tyr Thr Thr Gly Asp Lys Thr Ser Gly Pro Glu His Ser Asn Ile
355 360 365
aca cca aat aat att cta gat aca cca tct cca aca tat cag cac tca 1152
Thr Pro Asn Asn Ile Leu Asp Thr Pro Ser Pro Thr Tyr Gln His Ser
370 375 380
ttt gta tct gtt gat tct att gta tat tct aga aaa gaa tta caa caa 1200
Phe Val Ser Val Asp Ser Ile Val Tyr Ser Arg Lys Glu Leu Gln Gln
385 390 395 400
tta gac ata gct act tat agt aca aat aat agt aat aat tgt cac cct 1248
Leu Asp Ile Ala Thr Tyr Ser Thr Asn Asn Ser Asn Asn Cys His Pro
405 410 415
tat gga tta cga ctt tca tat aca gat gga agc aga tat gat tat gga 1296
Tyr Gly Leu Arg Leu Ser Tyr Thr Asp Gly Ser Arg Tyr Asp Tyr Gly
420 425 430
gat aat caa cct gat ttt act act tcc aat aac aat tat tgt cat aat 1344
Asp Asn Gln Pro Asp Phe Thr Thr Ser Asn Asn Asn Tyr Cys His Asn
435 440 445
agc tat act gcc cct att aca ctt gtg aat gca cga cat tta tat aat 1392
Ser Tyr Thr Ala Pro Ile Thr Leu Val Asn Ala Arg His Leu Tyr Asn
450 455 460
gca aaa ggc tct tta caa aat gta gaa tct tta gtg gtt agt act gta 1440
Ala Lys Gly Ser Leu Gln Asn Val Glu Ser Leu Val Val Ser Thr Val
465 470 475 480
aat ggt gga agt ggt tca tgc att tgt gat gca tgg att aat tat tta 1488
Asn Gly Gly Ser Gly Ser Cys Ile Cys Asp Ala Trp Ile Asn Tyr Leu
485 490 495
cgt cct cct caa aca agt aaa aat gaa tca cgt cct gat caa aaa att 1536
Arg Pro Pro Gln Thr Ser Lys Asn Glu Ser Arg Pro Asp Gln Lys Ile
500 505 510
aat gtt ttg tat cca ata aca gaa act gta aat aag ggg act gga gga 1584
Asn Val Leu Tyr Pro Ile Thr Glu Thr Val Asn Lys Gly Thr Gly Gly
515 520 525
aat tta gga gtt att tct gcc tat gtt cca atg gaa ctt gta cca gaa 1632
Asn Leu Gly Val Ile Ser Ala Tyr Val Pro Met Glu Leu Val Pro Glu
530 535 540
aac gtt att gga gat gtt aat gct gat act aaa ttg cca ctt aca caa 1680
Asn Val Ile Gly Asp Val Asn Ala Asp Thr Lys Leu Pro Leu Thr Gln
545 550 555 560
tta aag ggc ttt cca ttt gaa aaa tat ggt tct gag tat aat aat cgg 1728
Leu Lys Gly Phe Pro Phe Glu Lys Tyr Gly Ser Glu Tyr Asn Asn Arg
565 570 575
ggt atc tct ctt gtt cgc gaa tgg ata aat ggt aac aat gca gtt aaa 1776
Gly Ile Ser Leu Val Arg Glu Trp Ile Asn Gly Asn Asn Ala Val Lys
580 585 590
ctt tct aat agt caa tct gtt ggc ata caa att acg aat caa acc aaa 1824
Leu Ser Asn Ser Gln Ser Val Gly Ile Gln Ile Thr Asn Gln Thr Lys
595 600 605
caa aaa tat gaa ata cgt tgc cgt tat gcg agt aaa gga gat aat aat 1872
Gln Lys Tyr Glu Ile Arg Cys Arg Tyr Ala Ser Lys Gly Asp Asn Asn
610 615 620
gtt tat ttt aat gtg gat tta agt gaa aat cca ttt aga aat tcc att 1920
Val Tyr Phe Asn Val Asp Leu Ser Glu Asn Pro Phe Arg Asn Ser Ile
625 630 635 640
tct ttt gga tct act gaa agt tct gtt gta gga gta caa ggt gaa aat 1968
Ser Phe Gly Ser Thr Glu Ser Ser Val Val Gly Val Gln Gly Glu Asn
645 650 655
gga aag tat ata ttg aaa tca atc aca acg gta gaa ata cct gct gga 2016
Gly Lys Tyr Ile Leu Lys Ser Ile Thr Thr Val Glu Ile Pro Ala Gly
660 665 670
agt ttc tat gtt cat ata aca aac caa ggt tct tca gat ctc ttt tta 2064
Ser Phe Tyr Val His Ile Thr Asn Gln Gly Ser Ser Asp Leu Phe Leu
675 680 685
gat cgt att gag ttt gtt cca aaa atc caa ttc caa ttc tgt gat aat 2112
Asp Arg Ile Glu Phe Val Pro Lys Ile Gln Phe Gln Phe Cys Asp Asn
690 695 700
aat aat ctt cac tgt gat tgt aat aac cct gtt gac acc gat tgt aca 2160
Asn Asn Leu His Cys Asp Cys Asn Asn Pro Val Asp Thr Asp Cys Thr
705 710 715 720
ttt tgt tgc gtt tgc act agt ctt act gat tgt gat tgt aat aac cct 2208
Phe Cys Cys Val Cys Thr Ser Leu Thr Asp Cys Asp Cys Asn Asn Pro
725 730 735
cgt ggc cta gat tgt acg cta tgt tgt cag gta gaa aat cag cta cct 2256
Arg Gly Leu Asp Cys Thr Leu Cys Cys Gln Val Glu Asn Gln Leu Pro
740 745 750
tct ttt gtg aca ctt aca gat tta caa aat att acg aca caa gta aat 2304
Ser Phe Val Thr Leu Thr Asp Leu Gln Asn Ile Thr Thr Gln Val Asn
755 760 765
gca tta gtt gca tcg agc gaa cat gat aca ctt gca aca gac gtg agt 2352
Ala Leu Val Ala Ser Ser Glu His Asp Thr Leu Ala Thr Asp Val Ser
770 775 780
gat tat gag att gaa gaa gtt gta ctg aaa gta gat gca tta tct ggt 2400
Asp Tyr Glu Ile Glu Glu Val Val Leu Lys Val Asp Ala Leu Ser Gly
785 790 795 800
gaa gtg ttt gga aaa gag aaa aaa gca ttg cgt aaa ttg gta aat cac 2448
Glu Val Phe Gly Lys Glu Lys Lys Ala Leu Arg Lys Leu Val Asn His
805 810 815
aca aaa cgt tta agc aaa gcg cgt aac ctc ttg ata gga gga aat ttt 2496
Thr Lys Arg Leu Ser Lys Ala Arg Asn Leu Leu Ile Gly Gly Asn Phe
820 825 830
gat aac ttg gat gct tgg tac aga ggc cga aat gta gta aac gta tct 2544
Asp Asn Leu Asp Ala Trp Tyr Arg Gly Arg Asn Val Val Asn Val Ser
835 840 845
gat cat gaa cta ttt aag agt gat cat gta tta ttg cca cca cca aca 2592
Asp His Glu Leu Phe Lys Ser Asp His Val Leu Leu Pro Pro Pro Thr
850 855 860
ctg tac tca tct tat atg ttc caa aaa gta gag gaa tcg aaa tta aaa 2640
Leu Tyr Ser Ser Tyr Met Phe Gln Lys Val Glu Glu Ser Lys Leu Lys
865 870 875 880
gcg aat aca cgt tat act gtg tct ggt ttt att gca cat gca gaa gat 2688
Ala Asn Thr Arg Tyr Thr Val Ser Gly Phe Ile Ala His Ala Glu Asp
885 890 895
tta gaa att gtt gtg tct cgt tat ggg caa gaa gtg aag aaa gtg gtt 2736
Leu Glu Ile Val Val Ser Arg Tyr Gly Gln Glu Val Lys Lys Val Val
900 905 910
caa gtt cca tat gga gaa gca ttc cca ttg aca tcg agg gga gcg att 2784
Gln Val Pro Tyr Gly Glu Ala Phe Pro Leu Thr Ser Arg Gly Ala Ile
915 920 925
tgt tgc cct cca cgt tct aca tgt aat gga aaa cct gct gat cca cat 2832
Cys Cys Pro Pro Arg Ser Thr Cys Asn Gly Lys Pro Ala Asp Pro His
930 935 940
ttc ttt agt tac agt att gat gtg gga aca tta gat gta gaa gca aac 2880
Phe Phe Ser Tyr Ser Ile Asp Val Gly Thr Leu Asp Val Glu Ala Asn
945 950 955 960
cct ggt atc gaa ttg ggt ctt cgt att gta gaa cga act gga atg gca 2928
Pro Gly Ile Glu Leu Gly Leu Arg Ile Val Glu Arg Thr Gly Met Ala
965 970 975
cgt gta agt aat tta gaa att cgt gaa gat cgt cca tta aag aaa aat 2976
Arg Val Ser Asn Leu Glu Ile Arg Glu Asp Arg Pro Leu Lys Lys Asn
980 985 990
gaa ctc cgc aat gta caa cgt gca gca aga aat tgg aga aca gca tat 3024
Glu Leu Arg Asn Val Gln Arg Ala Ala Arg Asn Trp Arg Thr Ala Tyr
995 1000 1005
gac caa gaa cgt gca gaa gta acg gcc ttg att caa cct gta tta 3069
Asp Gln Glu Arg Ala Glu Val Thr Ala Leu Ile Gln Pro Val Leu
1010 1015 1020
aat caa atc aat gcg ttg tat gaa aat gaa gat tgg aat cga gca 3114
Asn Gln Ile Asn Ala Leu Tyr Glu Asn Glu Asp Trp Asn Arg Ala
1025 1030 1035
att cgt tct gga gtt tct tat cat gac tta gaa gca att gtt tta 3159
Ile Arg Ser Gly Val Ser Tyr His Asp Leu Glu Ala Ile Val Leu
1040 1045 1050
cca aca tta cca aaa tta aat cat tgg ttt atg tct gat atg tta 3204
Pro Thr Leu Pro Lys Leu Asn His Trp Phe Met Ser Asp Met Leu
1055 1060 1065
ggg gaa caa ggt tcc att tta gct caa ttt caa gaa gca tta gat 3249
Gly Glu Gln Gly Ser Ile Leu Ala Gln Phe Gln Glu Ala Leu Asp
1070 1075 1080
cgt gcg tat acg caa ctc gaa gaa agt aca att ctg cat aat ggt 3294
Arg Ala Tyr Thr Gln Leu Glu Glu Ser Thr Ile Leu His Asn Gly
1085 1090 1095
cat ttc aca aca gat gca gca aat tgg acg ata gaa ggc gat gca 3339
His Phe Thr Thr Asp Ala Ala Asn Trp Thr Ile Glu Gly Asp Ala
1100 1105 1110
cat cat gcg ata tta gaa gat ggt aga cgc gta tta cgt ctt cca 3384
His His Ala Ile Leu Glu Asp Gly Arg Arg Val Leu Arg Leu Pro
1115 1120 1125
gat tgg tct tct agc gtt tca caa acc att gaa ata gaa aat ttt 3429
Asp Trp Ser Ser Ser Val Ser Gln Thr Ile Glu Ile Glu Asn Phe
1130 1135 1140
gat cca gat aaa gaa tat cag tta gtt ttc cat gca caa gga gaa 3474
Asp Pro Asp Lys Glu Tyr Gln Leu Val Phe His Ala Gln Gly Glu
1145 1150 1155
gga acg gtc tcc ctt caa cat ggt gaa gaa gga gaa tat gtg gaa 3519
Gly Thr Val Ser Leu Gln His Gly Glu Glu Gly Glu Tyr Val Glu
1160 1165 1170
aca cac ccg cat aag tct gcg aat ttt aca act tca cac cgt caa 3564
Thr His Pro His Lys Ser Ala Asn Phe Thr Thr Ser His Arg Gln
1175 1180 1185
gga gtc aca ttt gaa aca aat aaa gta aca gtt gaa att acc tca 3609
Gly Val Thr Phe Glu Thr Asn Lys Val Thr Val Glu Ile Thr Ser
1190 1195 1200
gaa gat gga gaa ttc cta gtc gat cat att gcg ctt gtg gaa gct 3654
Glu Asp Gly Glu Phe Leu Val Asp His Ile Ala Leu Val Glu Ala
1205 1210 1215
cct ctt cct aca gat gac caa agt tca gat gga aat acg act tcc 3699
Pro Leu Pro Thr Asp Asp Gln Ser Ser Asp Gly Asn Thr Thr Ser
1220 1225 1230
aat acg aat agc aat aca agt atg aat aat aat caa taa 3738
Asn Thr Asn Ser Asn Thr Ser Met Asn Asn Asn Gln
1235 1240 1245
<210> 2
<211> 1245
<212> PRT
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<400> 2
Met Ala Thr Ile Asn Glu Leu Tyr Pro Val Pro Tyr Asn Val Leu Ala
1 5 10 15
His Pro Ile Lys Glu Val Asp Asp Pro Tyr Ser Trp Ser Asn Leu Leu
20 25 30
Lys Gly Ile Gln Glu Gly Trp Glu Glu Trp Gly Lys Thr Gly Gln Lys
35 40 45
Lys Leu Phe Glu Asp His Leu Thr Ile Ala Trp Asn Leu Tyr Lys Thr
50 55 60
Gly Lys Leu Asp Tyr Phe Ala Leu Thr Lys Ala Ser Ile Ser Leu Ile
65 70 75 80
Gly Phe Ile Pro Gly Ala Glu Ala Ala Val Pro Phe Ile Asn Met Phe
85 90 95
Val Asp Phe Val Trp Pro Lys Leu Phe Gly Ala Asn Thr Glu Gly Lys
100 105 110
Asp Gln Gln Leu Phe Asn Ala Ile Met Asp Ala Val Asn Lys Met Val
115 120 125
Asp Asn Lys Phe Leu Ser Tyr Asn Leu Ser Thr Leu Asn Lys Thr Ile
130 135 140
Glu Gly Leu Gln Gly Asn Leu Gly Leu Phe Gln Asn Ala Ile Gln Val
145 150 155 160
Ala Ile Cys Gln Gly Ser Thr Pro Glu Arg Val Ile Phe Asp Gln Asn
165 170 175
Cys Thr Pro Cys Asn Pro Asn Gln Pro Cys Lys Asp Asp Leu Asp Arg
180 185 190
Val Ala Ser Arg Phe Asp Thr Ala Asn Ser Gln Phe Thr Gln His Leu
195 200 205
Pro Glu Phe Lys Asn Pro Trp Ser Asp Glu Asn Ser Thr Gln Glu Phe
210 215 220
Lys Arg Thr Ser Val Glu Leu Thr Leu Pro Met Tyr Thr Thr Val Ala
225 230 235 240
Thr Leu His Leu Leu Leu Tyr Lys Gly Tyr Ile Glu Phe Met Thr Lys
245 250 255
Trp Asn Phe His Asn Glu Gln Tyr Leu Asn Asn Leu Lys Val Glu Leu
260 265 270
Gln Gln Leu Ile His Ser Tyr Ser Glu Thr Val Arg Thr Ser Phe Leu
275 280 285
Gln Phe Leu Pro Thr Leu Asn Asn Arg Ser Lys Ser Ser Val Asn Ala
290 295 300
Tyr Asn Arg Tyr Val Arg Asn Met Thr Val Asn Cys Leu Asp Ile Ala
305 310 315 320
Ala Thr Trp Pro Thr Phe Asp Thr His Asn Tyr His Gln Gly Gly Lys
325 330 335
Leu Asp Leu Thr Arg Ile Ile Leu Ser Asp Thr Ala Gly Pro Ile Glu
340 345 350
Glu Tyr Thr Thr Gly Asp Lys Thr Ser Gly Pro Glu His Ser Asn Ile
355 360 365
Thr Pro Asn Asn Ile Leu Asp Thr Pro Ser Pro Thr Tyr Gln His Ser
370 375 380
Phe Val Ser Val Asp Ser Ile Val Tyr Ser Arg Lys Glu Leu Gln Gln
385 390 395 400
Leu Asp Ile Ala Thr Tyr Ser Thr Asn Asn Ser Asn Asn Cys His Pro
405 410 415
Tyr Gly Leu Arg Leu Ser Tyr Thr Asp Gly Ser Arg Tyr Asp Tyr Gly
420 425 430
Asp Asn Gln Pro Asp Phe Thr Thr Ser Asn Asn Asn Tyr Cys His Asn
435 440 445
Ser Tyr Thr Ala Pro Ile Thr Leu Val Asn Ala Arg His Leu Tyr Asn
450 455 460
Ala Lys Gly Ser Leu Gln Asn Val Glu Ser Leu Val Val Ser Thr Val
465 470 475 480
Asn Gly Gly Ser Gly Ser Cys Ile Cys Asp Ala Trp Ile Asn Tyr Leu
485 490 495
Arg Pro Pro Gln Thr Ser Lys Asn Glu Ser Arg Pro Asp Gln Lys Ile
500 505 510
Asn Val Leu Tyr Pro Ile Thr Glu Thr Val Asn Lys Gly Thr Gly Gly
515 520 525
Asn Leu Gly Val Ile Ser Ala Tyr Val Pro Met Glu Leu Val Pro Glu
530 535 540
Asn Val Ile Gly Asp Val Asn Ala Asp Thr Lys Leu Pro Leu Thr Gln
545 550 555 560
Leu Lys Gly Phe Pro Phe Glu Lys Tyr Gly Ser Glu Tyr Asn Asn Arg
565 570 575
Gly Ile Ser Leu Val Arg Glu Trp Ile Asn Gly Asn Asn Ala Val Lys
580 585 590
Leu Ser Asn Ser Gln Ser Val Gly Ile Gln Ile Thr Asn Gln Thr Lys
595 600 605
Gln Lys Tyr Glu Ile Arg Cys Arg Tyr Ala Ser Lys Gly Asp Asn Asn
610 615 620
Val Tyr Phe Asn Val Asp Leu Ser Glu Asn Pro Phe Arg Asn Ser Ile
625 630 635 640
Ser Phe Gly Ser Thr Glu Ser Ser Val Val Gly Val Gln Gly Glu Asn
645 650 655
Gly Lys Tyr Ile Leu Lys Ser Ile Thr Thr Val Glu Ile Pro Ala Gly
660 665 670
Ser Phe Tyr Val His Ile Thr Asn Gln Gly Ser Ser Asp Leu Phe Leu
675 680 685
Asp Arg Ile Glu Phe Val Pro Lys Ile Gln Phe Gln Phe Cys Asp Asn
690 695 700
Asn Asn Leu His Cys Asp Cys Asn Asn Pro Val Asp Thr Asp Cys Thr
705 710 715 720
Phe Cys Cys Val Cys Thr Ser Leu Thr Asp Cys Asp Cys Asn Asn Pro
725 730 735
Arg Gly Leu Asp Cys Thr Leu Cys Cys Gln Val Glu Asn Gln Leu Pro
740 745 750
Ser Phe Val Thr Leu Thr Asp Leu Gln Asn Ile Thr Thr Gln Val Asn
755 760 765
Ala Leu Val Ala Ser Ser Glu His Asp Thr Leu Ala Thr Asp Val Ser
770 775 780
Asp Tyr Glu Ile Glu Glu Val Val Leu Lys Val Asp Ala Leu Ser Gly
785 790 795 800
Glu Val Phe Gly Lys Glu Lys Lys Ala Leu Arg Lys Leu Val Asn His
805 810 815
Thr Lys Arg Leu Ser Lys Ala Arg Asn Leu Leu Ile Gly Gly Asn Phe
820 825 830
Asp Asn Leu Asp Ala Trp Tyr Arg Gly Arg Asn Val Val Asn Val Ser
835 840 845
Asp His Glu Leu Phe Lys Ser Asp His Val Leu Leu Pro Pro Pro Thr
850 855 860
Leu Tyr Ser Ser Tyr Met Phe Gln Lys Val Glu Glu Ser Lys Leu Lys
865 870 875 880
Ala Asn Thr Arg Tyr Thr Val Ser Gly Phe Ile Ala His Ala Glu Asp
885 890 895
Leu Glu Ile Val Val Ser Arg Tyr Gly Gln Glu Val Lys Lys Val Val
900 905 910
Gln Val Pro Tyr Gly Glu Ala Phe Pro Leu Thr Ser Arg Gly Ala Ile
915 920 925
Cys Cys Pro Pro Arg Ser Thr Cys Asn Gly Lys Pro Ala Asp Pro His
930 935 940
Phe Phe Ser Tyr Ser Ile Asp Val Gly Thr Leu Asp Val Glu Ala Asn
945 950 955 960
Pro Gly Ile Glu Leu Gly Leu Arg Ile Val Glu Arg Thr Gly Met Ala
965 970 975
Arg Val Ser Asn Leu Glu Ile Arg Glu Asp Arg Pro Leu Lys Lys Asn
980 985 990
Glu Leu Arg Asn Val Gln Arg Ala Ala Arg Asn Trp Arg Thr Ala Tyr
995 1000 1005
Asp Gln Glu Arg Ala Glu Val Thr Ala Leu Ile Gln Pro Val Leu
1010 1015 1020
Asn Gln Ile Asn Ala Leu Tyr Glu Asn Glu Asp Trp Asn Arg Ala
1025 1030 1035
Ile Arg Ser Gly Val Ser Tyr His Asp Leu Glu Ala Ile Val Leu
1040 1045 1050
Pro Thr Leu Pro Lys Leu Asn His Trp Phe Met Ser Asp Met Leu
1055 1060 1065
Gly Glu Gln Gly Ser Ile Leu Ala Gln Phe Gln Glu Ala Leu Asp
1070 1075 1080
Arg Ala Tyr Thr Gln Leu Glu Glu Ser Thr Ile Leu His Asn Gly
1085 1090 1095
His Phe Thr Thr Asp Ala Ala Asn Trp Thr Ile Glu Gly Asp Ala
1100 1105 1110
His His Ala Ile Leu Glu Asp Gly Arg Arg Val Leu Arg Leu Pro
1115 1120 1125
Asp Trp Ser Ser Ser Val Ser Gln Thr Ile Glu Ile Glu Asn Phe
1130 1135 1140
Asp Pro Asp Lys Glu Tyr Gln Leu Val Phe His Ala Gln Gly Glu
1145 1150 1155
Gly Thr Val Ser Leu Gln His Gly Glu Glu Gly Glu Tyr Val Glu
1160 1165 1170
Thr His Pro His Lys Ser Ala Asn Phe Thr Thr Ser His Arg Gln
1175 1180 1185
Gly Val Thr Phe Glu Thr Asn Lys Val Thr Val Glu Ile Thr Ser
1190 1195 1200
Glu Asp Gly Glu Phe Leu Val Asp His Ile Ala Leu Val Glu Ala
1205 1210 1215
Pro Leu Pro Thr Asp Asp Gln Ser Ser Asp Gly Asn Thr Thr Ser
1220 1225 1230
Asn Thr Asn Ser Asn Thr Ser Met Asn Asn Asn Gln
1235 1240 1245
<210> 3
<211> 3543
<212> DNA
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<220>
<221> CDS
<222> (1)..(3543)
<400> 3
atg aat cct tat caa aat aaa aat gaa tat gaa aca tta aat gct tca 48
Met Asn Pro Tyr Gln Asn Lys Asn Glu Tyr Glu Thr Leu Asn Ala Ser
1 5 10 15
caa aaa aaa tta aat ata tct aat aat tat aca aga tat cca ata gaa 96
Gln Lys Lys Leu Asn Ile Ser Asn Asn Tyr Thr Arg Tyr Pro Ile Glu
20 25 30
aat agt cca aaa caa tta tta caa agt aca aat tat aaa gat tgg ctc 144
Asn Ser Pro Lys Gln Leu Leu Gln Ser Thr Asn Tyr Lys Asp Trp Leu
35 40 45
aat atg tgt caa cag aat cag cag tat ggt gga gat ttt gaa act ttt 192
Asn Met Cys Gln Gln Asn Gln Gln Tyr Gly Gly Asp Phe Glu Thr Phe
50 55 60
att gat agt ggt gaa ctc agt gcc tat act att gta gtt ggg acc gta 240
Ile Asp Ser Gly Glu Leu Ser Ala Tyr Thr Ile Val Val Gly Thr Val
65 70 75 80
ctg act ggt ttc ggg ttc aca aca ccc tta gga ctt gct tta ata ggt 288
Leu Thr Gly Phe Gly Phe Thr Thr Pro Leu Gly Leu Ala Leu Ile Gly
85 90 95
ttt ggt aca tta ata cca gtt ctt ttt cca gcc caa gac caa tct aac 336
Phe Gly Thr Leu Ile Pro Val Leu Phe Pro Ala Gln Asp Gln Ser Asn
100 105 110
aca tgg agt gac ttt ata aca caa act aaa aat att ata aaa aaa gaa 384
Thr Trp Ser Asp Phe Ile Thr Gln Thr Lys Asn Ile Ile Lys Lys Glu
115 120 125
ata gca tca aca tat ata agt aat gct aat aaa att tta aac agg tcg 432
Ile Ala Ser Thr Tyr Ile Ser Asn Ala Asn Lys Ile Leu Asn Arg Ser
130 135 140
ttt aat gtt atc agc act tat cat aat cac ctt aaa aca tgg gag aat 480
Phe Asn Val Ile Ser Thr Tyr His Asn His Leu Lys Thr Trp Glu Asn
145 150 155 160
aat cca aac cca caa aat act cag gat gta agg aca caa atc cag cta 528
Asn Pro Asn Pro Gln Asn Thr Gln Asp Val Arg Thr Gln Ile Gln Leu
165 170 175
gtt cat tac cat ttt caa aat gtc att cca gag ctt gta aac tct tgt 576
Val His Tyr His Phe Gln Asn Val Ile Pro Glu Leu Val Asn Ser Cys
180 185 190
cct cct aat cct agt gat tgc gat tac tat aac ata cta gta tta tct 624
Pro Pro Asn Pro Ser Asp Cys Asp Tyr Tyr Asn Ile Leu Val Leu Ser
195 200 205
agt tat gca caa gca gca aac tta cat ctg act gta tta aat caa gcc 672
Ser Tyr Ala Gln Ala Ala Asn Leu His Leu Thr Val Leu Asn Gln Ala
210 215 220
gtc aaa ttt gaa gcg tat tta aaa aac aat cga caa ttc gat tat tta 720
Val Lys Phe Glu Ala Tyr Leu Lys Asn Asn Arg Gln Phe Asp Tyr Leu
225 230 235 240
gag cct ttg cca aca gca att gat tat tat cca gta ttg act aaa gct 768
Glu Pro Leu Pro Thr Ala Ile Asp Tyr Tyr Pro Val Leu Thr Lys Ala
245 250 255
ata gaa gat tac act aat tat tgt gta aca act tat aaa aaa gga tta 816
Ile Glu Asp Tyr Thr Asn Tyr Cys Val Thr Thr Tyr Lys Lys Gly Leu
260 265 270
aat tta att aaa acg acg cct gat agt aat ctt gat gga aat ata aac 864
Asn Leu Ile Lys Thr Thr Pro Asp Ser Asn Leu Asp Gly Asn Ile Asn
275 280 285
tgg aac aca tac aat acg tat cga aca aaa atg act act gct gta tta 912
Trp Asn Thr Tyr Asn Thr Tyr Arg Thr Lys Met Thr Thr Ala Val Leu
290 295 300
gat ctt gtt gca ctc ttt cct aat tat gat gta ggt aaa tat cca ata 960
Asp Leu Val Ala Leu Phe Pro Asn Tyr Asp Val Gly Lys Tyr Pro Ile
305 310 315 320
ggt gtc caa tct gaa ctt act cga gaa att tat cag gta ctt aac ttc 1008
Gly Val Gln Ser Glu Leu Thr Arg Glu Ile Tyr Gln Val Leu Asn Phe
325 330 335
gaa gaa agc ccc tat aaa tat tat gac ttt caa tat caa gag gat tca 1056
Glu Glu Ser Pro Tyr Lys Tyr Tyr Asp Phe Gln Tyr Gln Glu Asp Ser
340 345 350
ctt aca cgt aga ccg cat tta ttt act tgg ctt gat tct ttg aat ttt 1104
Leu Thr Arg Arg Pro His Leu Phe Thr Trp Leu Asp Ser Leu Asn Phe
355 360 365
tat gaa aaa gcg caa act act cct aat aat ttt ttc acc agc cat tat 1152
Tyr Glu Lys Ala Gln Thr Thr Pro Asn Asn Phe Phe Thr Ser His Tyr
370 375 380
aat atg ttt cat tac aca ctt gat aat ata tcc caa aaa tct agt gtt 1200
Asn Met Phe His Tyr Thr Leu Asp Asn Ile Ser Gln Lys Ser Ser Val
385 390 395 400
ttt gga aat cac aat gta act gat aaa tta aaa tct ctt ggt ttg gca 1248
Phe Gly Asn His Asn Val Thr Asp Lys Leu Lys Ser Leu Gly Leu Ala
405 410 415
aca aat att tat att ttt tta tta aat gtc ata agc tta gat aat aaa 1296
Thr Asn Ile Tyr Ile Phe Leu Leu Asn Val Ile Ser Leu Asp Asn Lys
420 425 430
tat cta aat gat tat aat aat att agt aaa atg gat ttt ttt ata act 1344
Tyr Leu Asn Asp Tyr Asn Asn Ile Ser Lys Met Asp Phe Phe Ile Thr
435 440 445
aat ggt act aga ctt ttg gag aaa gaa ctt aca gca gga tct ggg caa 1392
Asn Gly Thr Arg Leu Leu Glu Lys Glu Leu Thr Ala Gly Ser Gly Gln
450 455 460
ata act tat gat gta aat aaa aat att ttc ggg tta cca att ctt aaa 1440
Ile Thr Tyr Asp Val Asn Lys Asn Ile Phe Gly Leu Pro Ile Leu Lys
465 470 475 480
cga aga gag aat caa gga aac cct acc ctt ttt cca aca tat gat aac 1488
Arg Arg Glu Asn Gln Gly Asn Pro Thr Leu Phe Pro Thr Tyr Asp Asn
485 490 495
tat agt cat att tta tca ttt att aaa agt ctt agt atc cct gca aca 1536
Tyr Ser His Ile Leu Ser Phe Ile Lys Ser Leu Ser Ile Pro Ala Thr
500 505 510
tat aaa act caa gtg tat acg ttt gct tgg aca cac tct agt gtt gat 1584
Tyr Lys Thr Gln Val Tyr Thr Phe Ala Trp Thr His Ser Ser Val Asp
515 520 525
cct aaa aat aca att tat aca cat tta act acc caa att cca gct gta 1632
Pro Lys Asn Thr Ile Tyr Thr His Leu Thr Thr Gln Ile Pro Ala Val
530 535 540
aaa gcg aat tca ctt ggg act gct tct aag gtt gtt caa gga cct ggt 1680
Lys Ala Asn Ser Leu Gly Thr Ala Ser Lys Val Val Gln Gly Pro Gly
545 550 555 560
cat aca gga ggg gat tta att gat ttc aaa gat cat ttc aaa att aca 1728
His Thr Gly Gly Asp Leu Ile Asp Phe Lys Asp His Phe Lys Ile Thr
565 570 575
tgt caa cac tca aat ttt caa caa tcg tat ttt ata aga att cgt tat 1776
Cys Gln His Ser Asn Phe Gln Gln Ser Tyr Phe Ile Arg Ile Arg Tyr
580 585 590
gct tca aat gga agc gca aat act cga gct gtt ata aat ctt agt atc 1824
Ala Ser Asn Gly Ser Ala Asn Thr Arg Ala Val Ile Asn Leu Ser Ile
595 600 605
cca ggg gta gca gaa ctg ggt atg gca ctc aac ccc act ttt tct ggt 1872
Pro Gly Val Ala Glu Leu Gly Met Ala Leu Asn Pro Thr Phe Ser Gly
610 615 620
aca gat tat acg aat tta aaa tat aaa gat ttt cag tac tta gaa ttt 1920
Thr Asp Tyr Thr Asn Leu Lys Tyr Lys Asp Phe Gln Tyr Leu Glu Phe
625 630 635 640
tct aac gag gtg aaa ttt gct cca aat caa aac ata tct ctt gtg ttt 1968
Ser Asn Glu Val Lys Phe Ala Pro Asn Gln Asn Ile Ser Leu Val Phe
645 650 655
aat cgt tcg gat gta tat aca aac aca aca gta ctt att gat aaa att 2016
Asn Arg Ser Asp Val Tyr Thr Asn Thr Thr Val Leu Ile Asp Lys Ile
660 665 670
gaa ttt ctg cca att act cgt tct ata aga gag gat aga gag aaa caa 2064
Glu Phe Leu Pro Ile Thr Arg Ser Ile Arg Glu Asp Arg Glu Lys Gln
675 680 685
aaa tta gaa aca gta caa caa ata att aat aca ttt tat gca aat cct 2112
Lys Leu Glu Thr Val Gln Gln Ile Ile Asn Thr Phe Tyr Ala Asn Pro
690 695 700
ata aaa aac act tta caa tca gaa ctt aca gat tat gac ata gat caa 2160
Ile Lys Asn Thr Leu Gln Ser Glu Leu Thr Asp Tyr Asp Ile Asp Gln
705 710 715 720
gcc gca aat ctt gtg gaa tgt att tct gaa gaa tta tat cca aaa gaa 2208
Ala Ala Asn Leu Val Glu Cys Ile Ser Glu Glu Leu Tyr Pro Lys Glu
725 730 735
aaa atg ctg tta tta gat gaa gtt aaa aat gcg aaa caa ctt agt caa 2256
Lys Met Leu Leu Leu Asp Glu Val Lys Asn Ala Lys Gln Leu Ser Gln
740 745 750
tct cga aat gta ctt caa aac ggg gat ttt gaa tcg gct acg ctt ggt 2304
Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser Ala Thr Leu Gly
755 760 765
tgg aca aca agt gat aat atc aca att caa gaa gat gat cct att ttt 2352
Trp Thr Thr Ser Asp Asn Ile Thr Ile Gln Glu Asp Asp Pro Ile Phe
770 775 780
aaa ggg cat tac ctt cat atg tct ggg gcg aga gac att gat ggt acg 2400
Lys Gly His Tyr Leu His Met Ser Gly Ala Arg Asp Ile Asp Gly Thr
785 790 795 800
ata ttt ccg acc tat ata ttc caa aaa att gat gaa tca aaa tta aaa 2448
Ile Phe Pro Thr Tyr Ile Phe Gln Lys Ile Asp Glu Ser Lys Leu Lys
805 810 815
ccg tat aca cgt tac cta gta agg gga ttt gta gga agt agt aaa gat 2496
Pro Tyr Thr Arg Tyr Leu Val Arg Gly Phe Val Gly Ser Ser Lys Asp
820 825 830
gta gaa cta gtg gtt tca cgc tat ggg gaa gaa att gat gcc atc atg 2544
Val Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile Asp Ala Ile Met
835 840 845
aat gtt cca gct gat tta aac tat ctg tat cct tct acc ttt gat tgt 2592
Asn Val Pro Ala Asp Leu Asn Tyr Leu Tyr Pro Ser Thr Phe Asp Cys
850 855 860
gaa ggg tct aat cgt tgt gag acg tcc gct gtg ccg gct aac att ggg 2640
Glu Gly Ser Asn Arg Cys Glu Thr Ser Ala Val Pro Ala Asn Ile Gly
865 870 875 880
aac act tct gat atg ttg tat tca tgc caa tat gat aca ggg aaa aag 2688
Asn Thr Ser Asp Met Leu Tyr Ser Cys Gln Tyr Asp Thr Gly Lys Lys
885 890 895
cat gtc gta tgt cag gat tcc cat caa ttt agt ttc act att gat aca 2736
His Val Val Cys Gln Asp Ser His Gln Phe Ser Phe Thr Ile Asp Thr
900 905 910
ggg gca tta gat aca aat gaa aat ata ggg gtt tgg gtc atg ttt aaa 2784
Gly Ala Leu Asp Thr Asn Glu Asn Ile Gly Val Trp Val Met Phe Lys
915 920 925
ata tct tct cca gat gga tac gca tca tta gat aat tta gaa gta att 2832
Ile Ser Ser Pro Asp Gly Tyr Ala Ser Leu Asp Asn Leu Glu Val Ile
930 935 940
gaa gaa ggg cca ata gat ggg gaa gca ctg tca cgc gtg aaa cac atg 2880
Glu Glu Gly Pro Ile Asp Gly Glu Ala Leu Ser Arg Val Lys His Met
945 950 955 960
gag aag aaa tgg aac gat caa atg gaa gca aaa cgt tcg gaa aca caa 2928
Glu Lys Lys Trp Asn Asp Gln Met Glu Ala Lys Arg Ser Glu Thr Gln
965 970 975
caa gca tat gat gta gcg aaa caa gcc att gat gct tta ttc aca aat 2976
Gln Ala Tyr Asp Val Ala Lys Gln Ala Ile Asp Ala Leu Phe Thr Asn
980 985 990
gta caa gat gag gct tta cag ttt gat acg aca ctc gct caa att cag 3024
Val Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu Ala Gln Ile Gln
995 1000 1005
tac gct gag tat ttg gta caa tcg att cca tat gtg tac aat gat 3069
Tyr Ala Glu Tyr Leu Val Gln Ser Ile Pro Tyr Val Tyr Asn Asp
1010 1015 1020
tgg ttg tca gat gtt cca ggt atg aat tat gat atc tat gta gag 3114
Trp Leu Ser Asp Val Pro Gly Met Asn Tyr Asp Ile Tyr Val Glu
1025 1030 1035
ttg gat gca cga gtg gca caa gcg cgt tat ttg tat gat aca aga 3159
Leu Asp Ala Arg Val Ala Gln Ala Arg Tyr Leu Tyr Asp Thr Arg
1040 1045 1050
aat att att aaa aat ggt gat ttt aca caa ggg gta atg ggg tgg 3204
Asn Ile Ile Lys Asn Gly Asp Phe Thr Gln Gly Val Met Gly Trp
1055 1060 1065
cat gta act gga aat gca gac gta caa caa ata gat ggt gtt tct 3249
His Val Thr Gly Asn Ala Asp Val Gln Gln Ile Asp Gly Val Ser
1070 1075 1080
gta ttg gtt cta tct aat tgg agt gct ggc gta tct caa aat gtc 3294
Val Leu Val Leu Ser Asn Trp Ser Ala Gly Val Ser Gln Asn Val
1085 1090 1095
cat ctc caa cat aat cat ggg tat gtc tta cgt gtt att gcc aaa 3339
His Leu Gln His Asn His Gly Tyr Val Leu Arg Val Ile Ala Lys
1100 1105 1110
aaa gaa gga cct gga aat ggg tat gtc acg ctt atg gat tgt gag 3384
Lys Glu Gly Pro Gly Asn Gly Tyr Val Thr Leu Met Asp Cys Glu
1115 1120 1125
gag aat caa gaa aaa ttg acg ttt acg tct tgt gaa gaa gga tat 3429
Glu Asn Gln Glu Lys Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr
1130 1135 1140
att acg aag aca gta gat gta ttc cca gat aca gat cgt gta cga 3474
Ile Thr Lys Thr Val Asp Val Phe Pro Asp Thr Asp Arg Val Arg
1145 1150 1155
att gag ata ggc gaa acc gaa ggt tcg ttt tat atc gaa agc att 3519
Ile Glu Ile Gly Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser Ile
1160 1165 1170
gaa tta att tgc atg aac gag tga 3543
Glu Leu Ile Cys Met Asn Glu
1175 1180
<210> 4
<211> 1180
<212> PRT
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<400> 4
Met Asn Pro Tyr Gln Asn Lys Asn Glu Tyr Glu Thr Leu Asn Ala Ser
1 5 10 15
Gln Lys Lys Leu Asn Ile Ser Asn Asn Tyr Thr Arg Tyr Pro Ile Glu
20 25 30
Asn Ser Pro Lys Gln Leu Leu Gln Ser Thr Asn Tyr Lys Asp Trp Leu
35 40 45
Asn Met Cys Gln Gln Asn Gln Gln Tyr Gly Gly Asp Phe Glu Thr Phe
50 55 60
Ile Asp Ser Gly Glu Leu Ser Ala Tyr Thr Ile Val Val Gly Thr Val
65 70 75 80
Leu Thr Gly Phe Gly Phe Thr Thr Pro Leu Gly Leu Ala Leu Ile Gly
85 90 95
Phe Gly Thr Leu Ile Pro Val Leu Phe Pro Ala Gln Asp Gln Ser Asn
100 105 110
Thr Trp Ser Asp Phe Ile Thr Gln Thr Lys Asn Ile Ile Lys Lys Glu
115 120 125
Ile Ala Ser Thr Tyr Ile Ser Asn Ala Asn Lys Ile Leu Asn Arg Ser
130 135 140
Phe Asn Val Ile Ser Thr Tyr His Asn His Leu Lys Thr Trp Glu Asn
145 150 155 160
Asn Pro Asn Pro Gln Asn Thr Gln Asp Val Arg Thr Gln Ile Gln Leu
165 170 175
Val His Tyr His Phe Gln Asn Val Ile Pro Glu Leu Val Asn Ser Cys
180 185 190
Pro Pro Asn Pro Ser Asp Cys Asp Tyr Tyr Asn Ile Leu Val Leu Ser
195 200 205
Ser Tyr Ala Gln Ala Ala Asn Leu His Leu Thr Val Leu Asn Gln Ala
210 215 220
Val Lys Phe Glu Ala Tyr Leu Lys Asn Asn Arg Gln Phe Asp Tyr Leu
225 230 235 240
Glu Pro Leu Pro Thr Ala Ile Asp Tyr Tyr Pro Val Leu Thr Lys Ala
245 250 255
Ile Glu Asp Tyr Thr Asn Tyr Cys Val Thr Thr Tyr Lys Lys Gly Leu
260 265 270
Asn Leu Ile Lys Thr Thr Pro Asp Ser Asn Leu Asp Gly Asn Ile Asn
275 280 285
Trp Asn Thr Tyr Asn Thr Tyr Arg Thr Lys Met Thr Thr Ala Val Leu
290 295 300
Asp Leu Val Ala Leu Phe Pro Asn Tyr Asp Val Gly Lys Tyr Pro Ile
305 310 315 320
Gly Val Gln Ser Glu Leu Thr Arg Glu Ile Tyr Gln Val Leu Asn Phe
325 330 335
Glu Glu Ser Pro Tyr Lys Tyr Tyr Asp Phe Gln Tyr Gln Glu Asp Ser
340 345 350
Leu Thr Arg Arg Pro His Leu Phe Thr Trp Leu Asp Ser Leu Asn Phe
355 360 365
Tyr Glu Lys Ala Gln Thr Thr Pro Asn Asn Phe Phe Thr Ser His Tyr
370 375 380
Asn Met Phe His Tyr Thr Leu Asp Asn Ile Ser Gln Lys Ser Ser Val
385 390 395 400
Phe Gly Asn His Asn Val Thr Asp Lys Leu Lys Ser Leu Gly Leu Ala
405 410 415
Thr Asn Ile Tyr Ile Phe Leu Leu Asn Val Ile Ser Leu Asp Asn Lys
420 425 430
Tyr Leu Asn Asp Tyr Asn Asn Ile Ser Lys Met Asp Phe Phe Ile Thr
435 440 445
Asn Gly Thr Arg Leu Leu Glu Lys Glu Leu Thr Ala Gly Ser Gly Gln
450 455 460
Ile Thr Tyr Asp Val Asn Lys Asn Ile Phe Gly Leu Pro Ile Leu Lys
465 470 475 480
Arg Arg Glu Asn Gln Gly Asn Pro Thr Leu Phe Pro Thr Tyr Asp Asn
485 490 495
Tyr Ser His Ile Leu Ser Phe Ile Lys Ser Leu Ser Ile Pro Ala Thr
500 505 510
Tyr Lys Thr Gln Val Tyr Thr Phe Ala Trp Thr His Ser Ser Val Asp
515 520 525
Pro Lys Asn Thr Ile Tyr Thr His Leu Thr Thr Gln Ile Pro Ala Val
530 535 540
Lys Ala Asn Ser Leu Gly Thr Ala Ser Lys Val Val Gln Gly Pro Gly
545 550 555 560
His Thr Gly Gly Asp Leu Ile Asp Phe Lys Asp His Phe Lys Ile Thr
565 570 575
Cys Gln His Ser Asn Phe Gln Gln Ser Tyr Phe Ile Arg Ile Arg Tyr
580 585 590
Ala Ser Asn Gly Ser Ala Asn Thr Arg Ala Val Ile Asn Leu Ser Ile
595 600 605
Pro Gly Val Ala Glu Leu Gly Met Ala Leu Asn Pro Thr Phe Ser Gly
610 615 620
Thr Asp Tyr Thr Asn Leu Lys Tyr Lys Asp Phe Gln Tyr Leu Glu Phe
625 630 635 640
Ser Asn Glu Val Lys Phe Ala Pro Asn Gln Asn Ile Ser Leu Val Phe
645 650 655
Asn Arg Ser Asp Val Tyr Thr Asn Thr Thr Val Leu Ile Asp Lys Ile
660 665 670
Glu Phe Leu Pro Ile Thr Arg Ser Ile Arg Glu Asp Arg Glu Lys Gln
675 680 685
Lys Leu Glu Thr Val Gln Gln Ile Ile Asn Thr Phe Tyr Ala Asn Pro
690 695 700
Ile Lys Asn Thr Leu Gln Ser Glu Leu Thr Asp Tyr Asp Ile Asp Gln
705 710 715 720
Ala Ala Asn Leu Val Glu Cys Ile Ser Glu Glu Leu Tyr Pro Lys Glu
725 730 735
Lys Met Leu Leu Leu Asp Glu Val Lys Asn Ala Lys Gln Leu Ser Gln
740 745 750
Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser Ala Thr Leu Gly
755 760 765
Trp Thr Thr Ser Asp Asn Ile Thr Ile Gln Glu Asp Asp Pro Ile Phe
770 775 780
Lys Gly His Tyr Leu His Met Ser Gly Ala Arg Asp Ile Asp Gly Thr
785 790 795 800
Ile Phe Pro Thr Tyr Ile Phe Gln Lys Ile Asp Glu Ser Lys Leu Lys
805 810 815
Pro Tyr Thr Arg Tyr Leu Val Arg Gly Phe Val Gly Ser Ser Lys Asp
820 825 830
Val Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile Asp Ala Ile Met
835 840 845
Asn Val Pro Ala Asp Leu Asn Tyr Leu Tyr Pro Ser Thr Phe Asp Cys
850 855 860
Glu Gly Ser Asn Arg Cys Glu Thr Ser Ala Val Pro Ala Asn Ile Gly
865 870 875 880
Asn Thr Ser Asp Met Leu Tyr Ser Cys Gln Tyr Asp Thr Gly Lys Lys
885 890 895
His Val Val Cys Gln Asp Ser His Gln Phe Ser Phe Thr Ile Asp Thr
900 905 910
Gly Ala Leu Asp Thr Asn Glu Asn Ile Gly Val Trp Val Met Phe Lys
915 920 925
Ile Ser Ser Pro Asp Gly Tyr Ala Ser Leu Asp Asn Leu Glu Val Ile
930 935 940
Glu Glu Gly Pro Ile Asp Gly Glu Ala Leu Ser Arg Val Lys His Met
945 950 955 960
Glu Lys Lys Trp Asn Asp Gln Met Glu Ala Lys Arg Ser Glu Thr Gln
965 970 975
Gln Ala Tyr Asp Val Ala Lys Gln Ala Ile Asp Ala Leu Phe Thr Asn
980 985 990
Val Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu Ala Gln Ile Gln
995 1000 1005
Tyr Ala Glu Tyr Leu Val Gln Ser Ile Pro Tyr Val Tyr Asn Asp
1010 1015 1020
Trp Leu Ser Asp Val Pro Gly Met Asn Tyr Asp Ile Tyr Val Glu
1025 1030 1035
Leu Asp Ala Arg Val Ala Gln Ala Arg Tyr Leu Tyr Asp Thr Arg
1040 1045 1050
Asn Ile Ile Lys Asn Gly Asp Phe Thr Gln Gly Val Met Gly Trp
1055 1060 1065
His Val Thr Gly Asn Ala Asp Val Gln Gln Ile Asp Gly Val Ser
1070 1075 1080
Val Leu Val Leu Ser Asn Trp Ser Ala Gly Val Ser Gln Asn Val
1085 1090 1095
His Leu Gln His Asn His Gly Tyr Val Leu Arg Val Ile Ala Lys
1100 1105 1110
Lys Glu Gly Pro Gly Asn Gly Tyr Val Thr Leu Met Asp Cys Glu
1115 1120 1125
Glu Asn Gln Glu Lys Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr
1130 1135 1140
Ile Thr Lys Thr Val Asp Val Phe Pro Asp Thr Asp Arg Val Arg
1145 1150 1155
Ile Glu Ile Gly Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser Ile
1160 1165 1170
Glu Leu Ile Cys Met Asn Glu
1175 1180
<210> 5
<211> 3411
<212> DNA
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<220>
<221> CDS
<222> (1)..(3411)
<400> 5
atg aat tca ggc tat ccg tta gcg aat gac tta caa ggg tca atg aaa 48
Met Asn Ser Gly Tyr Pro Leu Ala Asn Asp Leu Gln Gly Ser Met Lys
1 5 10 15
aac acg aac tat aaa gat tgg cta gcc atg tgt gaa aat aac caa cag 96
Asn Thr Asn Tyr Lys Asp Trp Leu Ala Met Cys Glu Asn Asn Gln Gln
20 25 30
tat ggc gtt aat cca gct gcg att aat tct tct tca gtt agt acc gct 144
Tyr Gly Val Asn Pro Ala Ala Ile Asn Ser Ser Ser Val Ser Thr Ala
35 40 45
tta aaa gta gct gga gct atc ctt aaa ttt gta aac cca cct gca ggt 192
Leu Lys Val Ala Gly Ala Ile Leu Lys Phe Val Asn Pro Pro Ala Gly
50 55 60
act gtc tta acc gta ctt agc gcg gtg ctt cct att ctt tgg ccg act 240
Thr Val Leu Thr Val Leu Ser Ala Val Leu Pro Ile Leu Trp Pro Thr
65 70 75 80
aat act cca acg cct gaa aga gtt tgg aat gat ttc atg acc aat aca 288
Asn Thr Pro Thr Pro Glu Arg Val Trp Asn Asp Phe Met Thr Asn Thr
85 90 95
ggg aat ctt att gat caa act gta aca gct tat gta cga aca gat gca 336
Gly Asn Leu Ile Asp Gln Thr Val Thr Ala Tyr Val Arg Thr Asp Ala
100 105 110
aat gca aaa atg acg gtt gtg aaa gat tat tta gat caa tat aca act 384
Asn Ala Lys Met Thr Val Val Lys Asp Tyr Leu Asp Gln Tyr Thr Thr
115 120 125
aaa ttt aac act tgg aaa aga gag cct aat aac cag tcc tat aga aca 432
Lys Phe Asn Thr Trp Lys Arg Glu Pro Asn Asn Gln Ser Tyr Arg Thr
130 135 140
gca gta ata act caa ttt aac tta acc agt gcc aaa ctt cga gag acc 480
Ala Val Ile Thr Gln Phe Asn Leu Thr Ser Ala Lys Leu Arg Glu Thr
145 150 155 160
gca gtt tat ttt agc aac tta gta ggt tat gaa tta ttg tta tta cca 528
Ala Val Tyr Phe Ser Asn Leu Val Gly Tyr Glu Leu Leu Leu Leu Pro
165 170 175
ata tac gca caa gta gca aat ttc aat tta ctt tta ata aga gat ggc 576
Ile Tyr Ala Gln Val Ala Asn Phe Asn Leu Leu Leu Ile Arg Asp Gly
180 185 190
ctc ata aat gca caa gaa tgg tct tta gca cgt agt gct ggt gac caa 624
Leu Ile Asn Ala Gln Glu Trp Ser Leu Ala Arg Ser Ala Gly Asp Gln
195 200 205
cta tat aac act atg gtg cag tac act aaa gaa tat att gca cat agc 672
Leu Tyr Asn Thr Met Val Gln Tyr Thr Lys Glu Tyr Ile Ala His Ser
210 215 220
att aca tgg tat aat aaa ggt tta gat gta ctt aga aat aaa tct aat 720
Ile Thr Trp Tyr Asn Lys Gly Leu Asp Val Leu Arg Asn Lys Ser Asn
225 230 235 240
gga caa tgg att acg ttt aat gat tat aaa aga gag atg act att caa 768
Gly Gln Trp Ile Thr Phe Asn Asp Tyr Lys Arg Glu Met Thr Ile Gln
245 250 255
gta tta gat ata ctc gct ctt ttt gcc agt tat gat cca cgt cga tac 816
Val Leu Asp Ile Leu Ala Leu Phe Ala Ser Tyr Asp Pro Arg Arg Tyr
260 265 270
cct gcg gac aaa ata gat aat acg aaa cta tca aaa aca gaa ttt aca 864
Pro Ala Asp Lys Ile Asp Asn Thr Lys Leu Ser Lys Thr Glu Phe Thr
275 280 285
aga gag att tat aca gct tta gta gaa tct cct tct agt aaa tct ata 912
Arg Glu Ile Tyr Thr Ala Leu Val Glu Ser Pro Ser Ser Lys Ser Ile
290 295 300
gca gca ctg gag gca gca ctt aca cga gat gtt cat tta ttc act tgg 960
Ala Ala Leu Glu Ala Ala Leu Thr Arg Asp Val His Leu Phe Thr Trp
305 310 315 320
cta aag aga gta gat ttc tgg acc aat act ata tat caa gat tta aga 1008
Leu Lys Arg Val Asp Phe Trp Thr Asn Thr Ile Tyr Gln Asp Leu Arg
325 330 335
ttt tta tct gcc aat aaa att ggg ttt tca tat aca aat tct tct gca 1056
Phe Leu Ser Ala Asn Lys Ile Gly Phe Ser Tyr Thr Asn Ser Ser Ala
340 345 350
atg caa gaa agt gga att tat gga agt tct ggt ttt ggt tca aat ctt 1104
Met Gln Glu Ser Gly Ile Tyr Gly Ser Ser Gly Phe Gly Ser Asn Leu
355 360 365
act cat caa att caa ctt aat tct aat gtt tat aaa act tct atc aca 1152
Thr His Gln Ile Gln Leu Asn Ser Asn Val Tyr Lys Thr Ser Ile Thr
370 375 380
gat act agc tcc ccc tct aat cga gtt aca aaa atg gat ttc tac aaa 1200
Asp Thr Ser Ser Pro Ser Asn Arg Val Thr Lys Met Asp Phe Tyr Lys
385 390 395 400
att gat ggt act ctt gcc tct tat aat tca aat ata aca cca act cct 1248
Ile Asp Gly Thr Leu Ala Ser Tyr Asn Ser Asn Ile Thr Pro Thr Pro
405 410 415
gaa ggt tta agg acc aca ttt ttt gga ttt tca aca aat gag aac aca 1296
Glu Gly Leu Arg Thr Thr Phe Phe Gly Phe Ser Thr Asn Glu Asn Thr
420 425 430
cct aat caa cca act gta aat gat tat acg cat att tta agc tat ata 1344
Pro Asn Gln Pro Thr Val Asn Asp Tyr Thr His Ile Leu Ser Tyr Ile
435 440 445
aaa act gat gtt ata gat tat aac agt aac agg gtt tca ttt gct tgg 1392
Lys Thr Asp Val Ile Asp Tyr Asn Ser Asn Arg Val Ser Phe Ala Trp
450 455 460
aca cat aag att gtt gac cct aat aat caa ata tac aca gat gct atc 1440
Thr His Lys Ile Val Asp Pro Asn Asn Gln Ile Tyr Thr Asp Ala Ile
465 470 475 480
aca caa gtt ccg gcc gta aaa tct aac ttc ttg aat gca aca gct aaa 1488
Thr Gln Val Pro Ala Val Lys Ser Asn Phe Leu Asn Ala Thr Ala Lys
485 490 495
gta atc aag gga cct ggt cat aca ggg ggg gat cta gtt gct ctt aca 1536
Val Ile Lys Gly Pro Gly His Thr Gly Gly Asp Leu Val Ala Leu Thr
500 505 510
agc aat ggt act cta tca ggc aga atg gag att caa tgt aaa aca agt 1584
Ser Asn Gly Thr Leu Ser Gly Arg Met Glu Ile Gln Cys Lys Thr Ser
515 520 525
att ttt aat gat cct aca aga agt tac gga tta cgc ata cgt tat gct 1632
Ile Phe Asn Asp Pro Thr Arg Ser Tyr Gly Leu Arg Ile Arg Tyr Ala
530 535 540
gca aat agt cca att gta ttg aat gta tca tat gta tta caa gga gtt 1680
Ala Asn Ser Pro Ile Val Leu Asn Val Ser Tyr Val Leu Gln Gly Val
545 550 555 560
tct aga gga aca acg att agt aca gaa tct acg ttt tca aga cct aat 1728
Ser Arg Gly Thr Thr Ile Ser Thr Glu Ser Thr Phe Ser Arg Pro Asn
565 570 575
aat ata ata cct aca gat tta aaa tat gaa gag ttt aga tac aaa gat 1776
Asn Ile Ile Pro Thr Asp Leu Lys Tyr Glu Glu Phe Arg Tyr Lys Asp
580 585 590
cct ttt gat gca att gta ccg atg aga tta tct tct aat caa ctg ata 1824
Pro Phe Asp Ala Ile Val Pro Met Arg Leu Ser Ser Asn Gln Leu Ile
595 600 605
act ata gct att caa cca tta aac atg act tca aat aat caa gtg att 1872
Thr Ile Ala Ile Gln Pro Leu Asn Met Thr Ser Asn Asn Gln Val Ile
610 615 620
att gac aga atc gaa att att cca atc act caa tct gta tta gat gag 1920
Ile Asp Arg Ile Glu Ile Ile Pro Ile Thr Gln Ser Val Leu Asp Glu
625 630 635 640
aca gag aac caa aat tta gaa tca gaa cga gaa gtt gtg aat gca ctg 1968
Thr Glu Asn Gln Asn Leu Glu Ser Glu Arg Glu Val Val Asn Ala Leu
645 650 655
ttt aca aat gac gcg aaa gat gca tta aac att gga acg aca gat tat 2016
Phe Thr Asn Asp Ala Lys Asp Ala Leu Asn Ile Gly Thr Thr Asp Tyr
660 665 670
gac ata gat caa gcc gca aat ctt gtg gaa tgt att tct gaa gaa tta 2064
Asp Ile Asp Gln Ala Ala Asn Leu Val Glu Cys Ile Ser Glu Glu Leu
675 680 685
tat cca aaa gaa aaa atg ctg tta tta gat gaa gtt aaa aat gcg aaa 2112
Tyr Pro Lys Glu Lys Met Leu Leu Leu Asp Glu Val Lys Asn Ala Lys
690 695 700
caa ctt agt caa tct cga aat gta ctt caa aac ggg gat ttt gaa tcg 2160
Gln Leu Ser Gln Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser
705 710 715 720
gct acg ctt ggt tgg aca aca agt gat aat atc aca att caa gaa gat 2208
Ala Thr Leu Gly Trp Thr Thr Ser Asp Asn Ile Thr Ile Gln Glu Asp
725 730 735
gat cct att ttt aaa ggg cat tac ctt cat atg tct ggg gcg aga gac 2256
Asp Pro Ile Phe Lys Gly His Tyr Leu His Met Ser Gly Ala Arg Asp
740 745 750
att gat ggt acg ata ttt ccg acc tat ata ttc caa aaa att gat gaa 2304
Ile Asp Gly Thr Ile Phe Pro Thr Tyr Ile Phe Gln Lys Ile Asp Glu
755 760 765
tca aaa tta aaa ccg tat aca cgt tac cta gta agg gga ttt gta gga 2352
Ser Lys Leu Lys Pro Tyr Thr Arg Tyr Leu Val Arg Gly Phe Val Gly
770 775 780
agt agt aaa gat gta gaa cta gtg gtt tca cgc tat ggg gaa gaa att 2400
Ser Ser Lys Asp Val Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile
785 790 795 800
gat gcc atc atg aat gtt cca gct gat tta aac tat ctg tat cct tct 2448
Asp Ala Ile Met Asn Val Pro Ala Asp Leu Asn Tyr Leu Tyr Pro Ser
805 810 815
acc ttt gat tgt gaa ggg tct aat cgt tgt gag acg tcc gct gtg ccg 2496
Thr Phe Asp Cys Glu Gly Ser Asn Arg Cys Glu Thr Ser Ala Val Pro
820 825 830
gct aac att ggg aac act tct gat atg ttg tat tca tgc caa tat gat 2544
Ala Asn Ile Gly Asn Thr Ser Asp Met Leu Tyr Ser Cys Gln Tyr Asp
835 840 845
aca ggg aaa aag cat gtc gta tgt cag gat tcc cat caa ttt agt ttc 2592
Thr Gly Lys Lys His Val Val Cys Gln Asp Ser His Gln Phe Ser Phe
850 855 860
act att gat aca ggg gca tta gat aca aat gaa aat ata ggg gtt tgg 2640
Thr Ile Asp Thr Gly Ala Leu Asp Thr Asn Glu Asn Ile Gly Val Trp
865 870 875 880
gtc atg ttt aaa ata tct tct cca gat gga tac gca tca tta gat aat 2688
Val Met Phe Lys Ile Ser Ser Pro Asp Gly Tyr Ala Ser Leu Asp Asn
885 890 895
tta gaa gta att gaa gaa ggg cca ata gat ggg gaa gca ctg tca cgc 2736
Leu Glu Val Ile Glu Glu Gly Pro Ile Asp Gly Glu Ala Leu Ser Arg
900 905 910
gtg aaa cac atg gag aag aaa tgg aac gat caa atg gaa gca aaa cgt 2784
Val Lys His Met Glu Lys Lys Trp Asn Asp Gln Met Glu Ala Lys Arg
915 920 925
tcg gaa aca caa caa gca tat gat gta gcg aaa caa gcc att gat gct 2832
Ser Glu Thr Gln Gln Ala Tyr Asp Val Ala Lys Gln Ala Ile Asp Ala
930 935 940
tta ttc aca aat gta caa gat gag gct tta cag ttt gat acg aca ctc 2880
Leu Phe Thr Asn Val Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu
945 950 955 960
gct caa att cag tac gct gag tat ttg gta caa tcg att cca tat gtg 2928
Ala Gln Ile Gln Tyr Ala Glu Tyr Leu Val Gln Ser Ile Pro Tyr Val
965 970 975
tac aat gat tgg ttg tca gat gtt cca ggt atg aat tat gat atc tat 2976
Tyr Asn Asp Trp Leu Ser Asp Val Pro Gly Met Asn Tyr Asp Ile Tyr
980 985 990
gta gag ttg gat gca cga gtg gca caa gcg cgt tat ttg tat gat aca 3024
Val Glu Leu Asp Ala Arg Val Ala Gln Ala Arg Tyr Leu Tyr Asp Thr
995 1000 1005
aga aat att att aaa aat ggt gat ttt aca caa ggg gta atg ggg 3069
Arg Asn Ile Ile Lys Asn Gly Asp Phe Thr Gln Gly Val Met Gly
1010 1015 1020
tgg cat gta act gga aat gca gac gta caa caa ata gat ggt gtt 3114
Trp His Val Thr Gly Asn Ala Asp Val Gln Gln Ile Asp Gly Val
1025 1030 1035
tct gta ttg gtt cta tct aat tgg agt gct ggc gta tct caa aat 3159
Ser Val Leu Val Leu Ser Asn Trp Ser Ala Gly Val Ser Gln Asn
1040 1045 1050
gtc cat ctc caa cat aat cat ggg tat gtc tta cgt gtt att gcc 3204
Val His Leu Gln His Asn His Gly Tyr Val Leu Arg Val Ile Ala
1055 1060 1065
aaa aaa gaa gga cct gga aat ggg tat gtc acg ctt atg gat tgt 3249
Lys Lys Glu Gly Pro Gly Asn Gly Tyr Val Thr Leu Met Asp Cys
1070 1075 1080
gag gag aat caa gaa aaa ttg acg ttt acg tct tgt gaa gaa gga 3294
Glu Glu Asn Gln Glu Lys Leu Thr Phe Thr Ser Cys Glu Glu Gly
1085 1090 1095
tat att acg aag aca gta gat gta ttc cca gat aca gat cgt gta 3339
Tyr Ile Thr Lys Thr Val Asp Val Phe Pro Asp Thr Asp Arg Val
1100 1105 1110
cga att gag ata ggc gaa acc gaa ggt tcg ttt tat atc gaa agc 3384
Arg Ile Glu Ile Gly Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser
1115 1120 1125
att gaa tta att tgc atg aac gag tga 3411
Ile Glu Leu Ile Cys Met Asn Glu
1130 1135
<210> 6
<211> 1136
<212> PRT
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<400> 6
Met Asn Ser Gly Tyr Pro Leu Ala Asn Asp Leu Gln Gly Ser Met Lys
1 5 10 15
Asn Thr Asn Tyr Lys Asp Trp Leu Ala Met Cys Glu Asn Asn Gln Gln
20 25 30
Tyr Gly Val Asn Pro Ala Ala Ile Asn Ser Ser Ser Val Ser Thr Ala
35 40 45
Leu Lys Val Ala Gly Ala Ile Leu Lys Phe Val Asn Pro Pro Ala Gly
50 55 60
Thr Val Leu Thr Val Leu Ser Ala Val Leu Pro Ile Leu Trp Pro Thr
65 70 75 80
Asn Thr Pro Thr Pro Glu Arg Val Trp Asn Asp Phe Met Thr Asn Thr
85 90 95
Gly Asn Leu Ile Asp Gln Thr Val Thr Ala Tyr Val Arg Thr Asp Ala
100 105 110
Asn Ala Lys Met Thr Val Val Lys Asp Tyr Leu Asp Gln Tyr Thr Thr
115 120 125
Lys Phe Asn Thr Trp Lys Arg Glu Pro Asn Asn Gln Ser Tyr Arg Thr
130 135 140
Ala Val Ile Thr Gln Phe Asn Leu Thr Ser Ala Lys Leu Arg Glu Thr
145 150 155 160
Ala Val Tyr Phe Ser Asn Leu Val Gly Tyr Glu Leu Leu Leu Leu Pro
165 170 175
Ile Tyr Ala Gln Val Ala Asn Phe Asn Leu Leu Leu Ile Arg Asp Gly
180 185 190
Leu Ile Asn Ala Gln Glu Trp Ser Leu Ala Arg Ser Ala Gly Asp Gln
195 200 205
Leu Tyr Asn Thr Met Val Gln Tyr Thr Lys Glu Tyr Ile Ala His Ser
210 215 220
Ile Thr Trp Tyr Asn Lys Gly Leu Asp Val Leu Arg Asn Lys Ser Asn
225 230 235 240
Gly Gln Trp Ile Thr Phe Asn Asp Tyr Lys Arg Glu Met Thr Ile Gln
245 250 255
Val Leu Asp Ile Leu Ala Leu Phe Ala Ser Tyr Asp Pro Arg Arg Tyr
260 265 270
Pro Ala Asp Lys Ile Asp Asn Thr Lys Leu Ser Lys Thr Glu Phe Thr
275 280 285
Arg Glu Ile Tyr Thr Ala Leu Val Glu Ser Pro Ser Ser Lys Ser Ile
290 295 300
Ala Ala Leu Glu Ala Ala Leu Thr Arg Asp Val His Leu Phe Thr Trp
305 310 315 320
Leu Lys Arg Val Asp Phe Trp Thr Asn Thr Ile Tyr Gln Asp Leu Arg
325 330 335
Phe Leu Ser Ala Asn Lys Ile Gly Phe Ser Tyr Thr Asn Ser Ser Ala
340 345 350
Met Gln Glu Ser Gly Ile Tyr Gly Ser Ser Gly Phe Gly Ser Asn Leu
355 360 365
Thr His Gln Ile Gln Leu Asn Ser Asn Val Tyr Lys Thr Ser Ile Thr
370 375 380
Asp Thr Ser Ser Pro Ser Asn Arg Val Thr Lys Met Asp Phe Tyr Lys
385 390 395 400
Ile Asp Gly Thr Leu Ala Ser Tyr Asn Ser Asn Ile Thr Pro Thr Pro
405 410 415
Glu Gly Leu Arg Thr Thr Phe Phe Gly Phe Ser Thr Asn Glu Asn Thr
420 425 430
Pro Asn Gln Pro Thr Val Asn Asp Tyr Thr His Ile Leu Ser Tyr Ile
435 440 445
Lys Thr Asp Val Ile Asp Tyr Asn Ser Asn Arg Val Ser Phe Ala Trp
450 455 460
Thr His Lys Ile Val Asp Pro Asn Asn Gln Ile Tyr Thr Asp Ala Ile
465 470 475 480
Thr Gln Val Pro Ala Val Lys Ser Asn Phe Leu Asn Ala Thr Ala Lys
485 490 495
Val Ile Lys Gly Pro Gly His Thr Gly Gly Asp Leu Val Ala Leu Thr
500 505 510
Ser Asn Gly Thr Leu Ser Gly Arg Met Glu Ile Gln Cys Lys Thr Ser
515 520 525
Ile Phe Asn Asp Pro Thr Arg Ser Tyr Gly Leu Arg Ile Arg Tyr Ala
530 535 540
Ala Asn Ser Pro Ile Val Leu Asn Val Ser Tyr Val Leu Gln Gly Val
545 550 555 560
Ser Arg Gly Thr Thr Ile Ser Thr Glu Ser Thr Phe Ser Arg Pro Asn
565 570 575
Asn Ile Ile Pro Thr Asp Leu Lys Tyr Glu Glu Phe Arg Tyr Lys Asp
580 585 590
Pro Phe Asp Ala Ile Val Pro Met Arg Leu Ser Ser Asn Gln Leu Ile
595 600 605
Thr Ile Ala Ile Gln Pro Leu Asn Met Thr Ser Asn Asn Gln Val Ile
610 615 620
Ile Asp Arg Ile Glu Ile Ile Pro Ile Thr Gln Ser Val Leu Asp Glu
625 630 635 640
Thr Glu Asn Gln Asn Leu Glu Ser Glu Arg Glu Val Val Asn Ala Leu
645 650 655
Phe Thr Asn Asp Ala Lys Asp Ala Leu Asn Ile Gly Thr Thr Asp Tyr
660 665 670
Asp Ile Asp Gln Ala Ala Asn Leu Val Glu Cys Ile Ser Glu Glu Leu
675 680 685
Tyr Pro Lys Glu Lys Met Leu Leu Leu Asp Glu Val Lys Asn Ala Lys
690 695 700
Gln Leu Ser Gln Ser Arg Asn Val Leu Gln Asn Gly Asp Phe Glu Ser
705 710 715 720
Ala Thr Leu Gly Trp Thr Thr Ser Asp Asn Ile Thr Ile Gln Glu Asp
725 730 735
Asp Pro Ile Phe Lys Gly His Tyr Leu His Met Ser Gly Ala Arg Asp
740 745 750
Ile Asp Gly Thr Ile Phe Pro Thr Tyr Ile Phe Gln Lys Ile Asp Glu
755 760 765
Ser Lys Leu Lys Pro Tyr Thr Arg Tyr Leu Val Arg Gly Phe Val Gly
770 775 780
Ser Ser Lys Asp Val Glu Leu Val Val Ser Arg Tyr Gly Glu Glu Ile
785 790 795 800
Asp Ala Ile Met Asn Val Pro Ala Asp Leu Asn Tyr Leu Tyr Pro Ser
805 810 815
Thr Phe Asp Cys Glu Gly Ser Asn Arg Cys Glu Thr Ser Ala Val Pro
820 825 830
Ala Asn Ile Gly Asn Thr Ser Asp Met Leu Tyr Ser Cys Gln Tyr Asp
835 840 845
Thr Gly Lys Lys His Val Val Cys Gln Asp Ser His Gln Phe Ser Phe
850 855 860
Thr Ile Asp Thr Gly Ala Leu Asp Thr Asn Glu Asn Ile Gly Val Trp
865 870 875 880
Val Met Phe Lys Ile Ser Ser Pro Asp Gly Tyr Ala Ser Leu Asp Asn
885 890 895
Leu Glu Val Ile Glu Glu Gly Pro Ile Asp Gly Glu Ala Leu Ser Arg
900 905 910
Val Lys His Met Glu Lys Lys Trp Asn Asp Gln Met Glu Ala Lys Arg
915 920 925
Ser Glu Thr Gln Gln Ala Tyr Asp Val Ala Lys Gln Ala Ile Asp Ala
930 935 940
Leu Phe Thr Asn Val Gln Asp Glu Ala Leu Gln Phe Asp Thr Thr Leu
945 950 955 960
Ala Gln Ile Gln Tyr Ala Glu Tyr Leu Val Gln Ser Ile Pro Tyr Val
965 970 975
Tyr Asn Asp Trp Leu Ser Asp Val Pro Gly Met Asn Tyr Asp Ile Tyr
980 985 990
Val Glu Leu Asp Ala Arg Val Ala Gln Ala Arg Tyr Leu Tyr Asp Thr
995 1000 1005
Arg Asn Ile Ile Lys Asn Gly Asp Phe Thr Gln Gly Val Met Gly
1010 1015 1020
Trp His Val Thr Gly Asn Ala Asp Val Gln Gln Ile Asp Gly Val
1025 1030 1035
Ser Val Leu Val Leu Ser Asn Trp Ser Ala Gly Val Ser Gln Asn
1040 1045 1050
Val His Leu Gln His Asn His Gly Tyr Val Leu Arg Val Ile Ala
1055 1060 1065
Lys Lys Glu Gly Pro Gly Asn Gly Tyr Val Thr Leu Met Asp Cys
1070 1075 1080
Glu Glu Asn Gln Glu Lys Leu Thr Phe Thr Ser Cys Glu Glu Gly
1085 1090 1095
Tyr Ile Thr Lys Thr Val Asp Val Phe Pro Asp Thr Asp Arg Val
1100 1105 1110
Arg Ile Glu Ile Gly Glu Thr Glu Gly Ser Phe Tyr Ile Glu Ser
1115 1120 1125
Ile Glu Leu Ile Cys Met Asn Glu
1130 1135
<210> 7
<211> 1932
<212> DNA
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<220>
<221> CDS
<222> (1)..(1932)
<400> 7
atg gaa gat agt tct tta gat act tta agt ata gtt aat gaa aca gac 48
Met Glu Asp Ser Ser Leu Asp Thr Leu Ser Ile Val Asn Glu Thr Asp
1 5 10 15
ttt cca tta tat aat aat tat acc gaa cct act att gcg cca gca tta 96
Phe Pro Leu Tyr Asn Asn Tyr Thr Glu Pro Thr Ile Ala Pro Ala Leu
20 25 30
ata gca gta gct ccc atc gca caa tat ctt gca aca gct ata ggg aaa 144
Ile Ala Val Ala Pro Ile Ala Gln Tyr Leu Ala Thr Ala Ile Gly Lys
35 40 45
tgg gcg gca aag gca gca ttt tca aaa gta cta tca ctt ata ttc cca 192
Trp Ala Ala Lys Ala Ala Phe Ser Lys Val Leu Ser Leu Ile Phe Pro
50 55 60
ggt tct caa cct gct act atg gaa aaa gtt cgt aca gaa gtg gaa aca 240
Gly Ser Gln Pro Ala Thr Met Glu Lys Val Arg Thr Glu Val Glu Thr
65 70 75 80
ctt ata aat caa aaa tta agc caa gat cga gtc aat ata tta aac gca 288
Leu Ile Asn Gln Lys Leu Ser Gln Asp Arg Val Asn Ile Leu Asn Ala
85 90 95
gaa tat agg ggg att att gag gtt agt gat gta ttt gat gcg tat att 336
Glu Tyr Arg Gly Ile Ile Glu Val Ser Asp Val Phe Asp Ala Tyr Ile
100 105 110
aaa caa cca ggt ttt acc cct gca aca gcc aag ggt tat ttt cta aat 384
Lys Gln Pro Gly Phe Thr Pro Ala Thr Ala Lys Gly Tyr Phe Leu Asn
115 120 125
cta agt ggt gct ata ata caa cga tta cct caa ttt gag gtt caa aca 432
Leu Ser Gly Ala Ile Ile Gln Arg Leu Pro Gln Phe Glu Val Gln Thr
130 135 140
tat gaa gga gta tct ata gca ctt ttt act caa atg tgt aca ctt cat 480
Tyr Glu Gly Val Ser Ile Ala Leu Phe Thr Gln Met Cys Thr Leu His
145 150 155 160
tta act tta tta aaa gac gga atc cta gca ggg agt gca tgg gga ttt 528
Leu Thr Leu Leu Lys Asp Gly Ile Leu Ala Gly Ser Ala Trp Gly Phe
165 170 175
act caa gct gat gta gat tca ttt ata aaa tta ttt aat caa aaa gta 576
Thr Gln Ala Asp Val Asp Ser Phe Ile Lys Leu Phe Asn Gln Lys Val
180 185 190
tta gat tac agg acc aga tta atg aga atg tac aca gaa gag ttc gga 624
Leu Asp Tyr Arg Thr Arg Leu Met Arg Met Tyr Thr Glu Glu Phe Gly
195 200 205
aga ttg tgt aaa gtc agt ctt aaa gat gga ttg acg ttc cgg aat atg 672
Arg Leu Cys Lys Val Ser Leu Lys Asp Gly Leu Thr Phe Arg Asn Met
210 215 220
tgt aat tta tat gtg ttt cca ttt gct gaa gcc tgg tct tta atg aga 720
Cys Asn Leu Tyr Val Phe Pro Phe Ala Glu Ala Trp Ser Leu Met Arg
225 230 235 240
tat gaa gga tta aaa tta caa agc tct cta tca tta tgg gat tat gtt 768
Tyr Glu Gly Leu Lys Leu Gln Ser Ser Leu Ser Leu Trp Asp Tyr Val
245 250 255
ggt gtc tca att cct gta aat tat aat gaa tgg gga gga cta gtt tat 816
Gly Val Ser Ile Pro Val Asn Tyr Asn Glu Trp Gly Gly Leu Val Tyr
260 265 270
aag tta tta atg ggg gaa gtt aat caa aga tta aca act gtt aaa ttt 864
Lys Leu Leu Met Gly Glu Val Asn Gln Arg Leu Thr Thr Val Lys Phe
275 280 285
aat tat tct ttc act aat gaa cca gct gat ata cca gca aga gaa aat 912
Asn Tyr Ser Phe Thr Asn Glu Pro Ala Asp Ile Pro Ala Arg Glu Asn
290 295 300
att cgt ggc gtc cat cct ata tac gat cct agt tct ggg ctt aca gga 960
Ile Arg Gly Val His Pro Ile Tyr Asp Pro Ser Ser Gly Leu Thr Gly
305 310 315 320
tgg ata gga aac gga aga aca aac aat ttt aat ttt gct gat aac aat 1008
Trp Ile Gly Asn Gly Arg Thr Asn Asn Phe Asn Phe Ala Asp Asn Asn
325 330 335
ggc aat gaa att atg gaa gtt aga aca caa act ttt tat caa aat cca 1056
Gly Asn Glu Ile Met Glu Val Arg Thr Gln Thr Phe Tyr Gln Asn Pro
340 345 350
aat aat gag cct ata gcg cct aga gat att ata aat caa att tta act 1104
Asn Asn Glu Pro Ile Ala Pro Arg Asp Ile Ile Asn Gln Ile Leu Thr
355 360 365
gcg cca gca cca gca gac cta ttt ttt aaa aat gca gat ata aat gta 1152
Ala Pro Ala Pro Ala Asp Leu Phe Phe Lys Asn Ala Asp Ile Asn Val
370 375 380
aag ttc aca cag tgg ttt cag tct act cta tat ggg tgg aac att aaa 1200
Lys Phe Thr Gln Trp Phe Gln Ser Thr Leu Tyr Gly Trp Asn Ile Lys
385 390 395 400
ctc ggt aca caa acg gtt tta agt agt aga acc gga aca ata cca cca 1248
Leu Gly Thr Gln Thr Val Leu Ser Ser Arg Thr Gly Thr Ile Pro Pro
405 410 415
aat tat tta gca tat gat gga tat tat att cgt gct att tca gct tgc 1296
Asn Tyr Leu Ala Tyr Asp Gly Tyr Tyr Ile Arg Ala Ile Ser Ala Cys
420 425 430
cca aga gga gtc tca ctt gca tat aat cac gat ctt aca aca cta aca 1344
Pro Arg Gly Val Ser Leu Ala Tyr Asn His Asp Leu Thr Thr Leu Thr
435 440 445
tat aat aga ata gag tat gat tca cct act aca gaa aat att att gta 1392
Tyr Asn Arg Ile Glu Tyr Asp Ser Pro Thr Thr Glu Asn Ile Ile Val
450 455 460
ggg ttt gca cca gat aat act aag gac ttt tat tct aaa aaa tct cac 1440
Gly Phe Ala Pro Asp Asn Thr Lys Asp Phe Tyr Ser Lys Lys Ser His
465 470 475 480
tat tta agt gaa acg aat gat agt tat gta att cct gct ctg caa ttt 1488
Tyr Leu Ser Glu Thr Asn Asp Ser Tyr Val Ile Pro Ala Leu Gln Phe
485 490 495
gct gaa gtt tca gat aga tca ttt tta gaa gat acg cca gat caa gca 1536
Ala Glu Val Ser Asp Arg Ser Phe Leu Glu Asp Thr Pro Asp Gln Ala
500 505 510
aca gac ggc agt att aaa ttt gca cgt act ttc att agt aat gaa gct 1584
Thr Asp Gly Ser Ile Lys Phe Ala Arg Thr Phe Ile Ser Asn Glu Ala
515 520 525
aag tac tct att aga cta aac acc ggg ttt aat acg gca act aga tat 1632
Lys Tyr Ser Ile Arg Leu Asn Thr Gly Phe Asn Thr Ala Thr Arg Tyr
530 535 540
aaa tta att atc agg gta aga gta cct tat cgc tta cct gct gga ata 1680
Lys Leu Ile Ile Arg Val Arg Val Pro Tyr Arg Leu Pro Ala Gly Ile
545 550 555 560
cgg gta caa tct cag aat tcg gga aat aat aga atg cta ggc agt ttt 1728
Arg Val Gln Ser Gln Asn Ser Gly Asn Asn Arg Met Leu Gly Ser Phe
565 570 575
act gca aat gct aat cca gaa tgg gtg gat ttt gtc aca gat gca ttt 1776
Thr Ala Asn Ala Asn Pro Glu Trp Val Asp Phe Val Thr Asp Ala Phe
580 585 590
aca ttt aac gat tta ggg att aca act tca agt aca aat gct tta ttt 1824
Thr Phe Asn Asp Leu Gly Ile Thr Thr Ser Ser Thr Asn Ala Leu Phe
595 600 605
agt att tct tca gat agt tta aat tct gga gaa gag tgg tat tta tcg 1872
Ser Ile Ser Ser Asp Ser Leu Asn Ser Gly Glu Glu Trp Tyr Leu Ser
610 615 620
cag ttg ttt tta gta aaa gaa tcg gcc ttt acg acg caa att aat ccg 1920
Gln Leu Phe Leu Val Lys Glu Ser Ala Phe Thr Thr Gln Ile Asn Pro
625 630 635 640
tta cta aag tag 1932
Leu Leu Lys
<210> 8
<211> 643
<212> PRT
<213> 苏云金芽孢杆菌(Bacillus thuringiensis)
<400> 8
Met Glu Asp Ser Ser Leu Asp Thr Leu Ser Ile Val Asn Glu Thr Asp
1 5 10 15
Phe Pro Leu Tyr Asn Asn Tyr Thr Glu Pro Thr Ile Ala Pro Ala Leu
20 25 30
Ile Ala Val Ala Pro Ile Ala Gln Tyr Leu Ala Thr Ala Ile Gly Lys
35 40 45
Trp Ala Ala Lys Ala Ala Phe Ser Lys Val Leu Ser Leu Ile Phe Pro
50 55 60
Gly Ser Gln Pro Ala Thr Met Glu Lys Val Arg Thr Glu Val Glu Thr
65 70 75 80
Leu Ile Asn Gln Lys Leu Ser Gln Asp Arg Val Asn Ile Leu Asn Ala
85 90 95
Glu Tyr Arg Gly Ile Ile Glu Val Ser Asp Val Phe Asp Ala Tyr Ile
100 105 110
Lys Gln Pro Gly Phe Thr Pro Ala Thr Ala Lys Gly Tyr Phe Leu Asn
115 120 125
Leu Ser Gly Ala Ile Ile Gln Arg Leu Pro Gln Phe Glu Val Gln Thr
130 135 140
Tyr Glu Gly Val Ser Ile Ala Leu Phe Thr Gln Met Cys Thr Leu His
145 150 155 160
Leu Thr Leu Leu Lys Asp Gly Ile Leu Ala Gly Ser Ala Trp Gly Phe
165 170 175
Thr Gln Ala Asp Val Asp Ser Phe Ile Lys Leu Phe Asn Gln Lys Val
180 185 190
Leu Asp Tyr Arg Thr Arg Leu Met Arg Met Tyr Thr Glu Glu Phe Gly
195 200 205
Arg Leu Cys Lys Val Ser Leu Lys Asp Gly Leu Thr Phe Arg Asn Met
210 215 220
Cys Asn Leu Tyr Val Phe Pro Phe Ala Glu Ala Trp Ser Leu Met Arg
225 230 235 240
Tyr Glu Gly Leu Lys Leu Gln Ser Ser Leu Ser Leu Trp Asp Tyr Val
245 250 255
Gly Val Ser Ile Pro Val Asn Tyr Asn Glu Trp Gly Gly Leu Val Tyr
260 265 270
Lys Leu Leu Met Gly Glu Val Asn Gln Arg Leu Thr Thr Val Lys Phe
275 280 285
Asn Tyr Ser Phe Thr Asn Glu Pro Ala Asp Ile Pro Ala Arg Glu Asn
290 295 300
Ile Arg Gly Val His Pro Ile Tyr Asp Pro Ser Ser Gly Leu Thr Gly
305 310 315 320
Trp Ile Gly Asn Gly Arg Thr Asn Asn Phe Asn Phe Ala Asp Asn Asn
325 330 335
Gly Asn Glu Ile Met Glu Val Arg Thr Gln Thr Phe Tyr Gln Asn Pro
340 345 350
Asn Asn Glu Pro Ile Ala Pro Arg Asp Ile Ile Asn Gln Ile Leu Thr
355 360 365
Ala Pro Ala Pro Ala Asp Leu Phe Phe Lys Asn Ala Asp Ile Asn Val
370 375 380
Lys Phe Thr Gln Trp Phe Gln Ser Thr Leu Tyr Gly Trp Asn Ile Lys
385 390 395 400
Leu Gly Thr Gln Thr Val Leu Ser Ser Arg Thr Gly Thr Ile Pro Pro
405 410 415
Asn Tyr Leu Ala Tyr Asp Gly Tyr Tyr Ile Arg Ala Ile Ser Ala Cys
420 425 430
Pro Arg Gly Val Ser Leu Ala Tyr Asn His Asp Leu Thr Thr Leu Thr
435 440 445
Tyr Asn Arg Ile Glu Tyr Asp Ser Pro Thr Thr Glu Asn Ile Ile Val
450 455 460
Gly Phe Ala Pro Asp Asn Thr Lys Asp Phe Tyr Ser Lys Lys Ser His
465 470 475 480
Tyr Leu Ser Glu Thr Asn Asp Ser Tyr Val Ile Pro Ala Leu Gln Phe
485 490 495
Ala Glu Val Ser Asp Arg Ser Phe Leu Glu Asp Thr Pro Asp Gln Ala
500 505 510
Thr Asp Gly Ser Ile Lys Phe Ala Arg Thr Phe Ile Ser Asn Glu Ala
515 520 525
Lys Tyr Ser Ile Arg Leu Asn Thr Gly Phe Asn Thr Ala Thr Arg Tyr
530 535 540
Lys Leu Ile Ile Arg Val Arg Val Pro Tyr Arg Leu Pro Ala Gly Ile
545 550 555 560
Arg Val Gln Ser Gln Asn Ser Gly Asn Asn Arg Met Leu Gly Ser Phe
565 570 575
Thr Ala Asn Ala Asn Pro Glu Trp Val Asp Phe Val Thr Asp Ala Phe
580 585 590
Thr Phe Asn Asp Leu Gly Ile Thr Thr Ser Ser Thr Asn Ala Leu Phe
595 600 605
Ser Ile Ser Ser Asp Ser Leu Asn Ser Gly Glu Glu Trp Tyr Leu Ser
610 615 620
Gln Leu Phe Leu Val Lys Glu Ser Ala Phe Thr Thr Gln Ile Asn Pro
625 630 635 640
Leu Leu Lys
<210> 9
<211> 334
<212> PRT
<213> 枯草杆菌(Bacillus subtilis)
<400> 9
Met Gly Val Ser Phe Asn Ile Met Cys Pro Asn Ser Ser Ile Tyr Ser
1 5 10 15
Asp Glu Lys Ser Arg Val Leu Val Asp Lys Thr Lys Ser Gly Lys Val
20 25 30
Arg Pro Trp Arg Glu Lys Lys Ile Ala Asn Val Asp Tyr Phe Glu Leu
35 40 45
Leu His Ile Leu Glu Phe Lys Lys Ala Glu Arg Val Lys Asp Cys Ala
50 55 60
Glu Ile Leu Glu Tyr Lys Gln Asn Arg Glu Thr Gly Glu Arg Lys Leu
65 70 75 80
Tyr Arg Val Trp Phe Cys Lys Ser Arg Leu Cys Pro Met Cys Asn Trp
85 90 95
Arg Arg Ala Met Lys His Gly Ile Gln Ser Gln Lys Val Val Ala Glu
100 105 110
Val Ile Lys Gln Lys Pro Thr Val Arg Trp Leu Phe Leu Thr Leu Thr
115 120 125
Val Lys Asn Val Tyr Asp Gly Glu Glu Leu Asn Lys Ser Leu Ser Asp
130 135 140
Met Ala Gln Gly Phe Arg Arg Met Met Gln Tyr Lys Lys Ile Asn Lys
145 150 155 160
Asn Leu Val Gly Phe Met Arg Ala Thr Glu Val Thr Ile Asn Asn Lys
165 170 175
Asp Asn Ser Tyr Asn Gln His Met His Val Leu Val Cys Val Glu Pro
180 185 190
Thr Tyr Phe Lys Asn Thr Glu Asn Tyr Val Asn Gln Lys Gln Trp Ile
195 200 205
Gln Phe Trp Lys Lys Ala Met Lys Leu Asp Tyr Asp Pro Asn Val Lys
210 215 220
Val Gln Met Ile Arg Pro Lys Asn Lys Tyr Lys Ser Asp Ile Gln Ser
225 230 235 240
Ala Ile Asp Glu Thr Ala Lys Tyr Pro Val Lys Asp Thr Asp Phe Met
245 250 255
Thr Asp Asp Glu Glu Lys Asn Leu Lys Arg Leu Ser Asp Leu Glu Glu
260 265 270
Gly Leu His Arg Lys Arg Leu Ile Ser Tyr Gly Gly Leu Leu Lys Glu
275 280 285
Ile His Lys Lys Leu Asn Leu Asp Asp Thr Glu Glu Gly Asp Leu Ile
290 295 300
His Thr Asp Asp Asp Glu Lys Ala Asp Glu Asp Gly Phe Ser Ile Ile
305 310 315 320
Ala Met Trp Asn Trp Glu Arg Lys Asn Tyr Phe Ile Lys Glu
325 330
<210> 10
<211> 572
<212> DNA
<213> Bacillus sp.KSM-S237
<400> 10
gatttgccga tgcaacaggc ttatatttag aggaaatttc tttttaaatt gaatacggaa 60
taaaatcagg taaacaggtc ctgattttat ttttttgagt tttttagaga actgaagatt 120
gaaataaaag tagaagacaa aggacataag aaaattgcat tagttttaat tatagaaaac 180
gcctttttat aattatttat acctagaacg aaaatactgt ttcgaaagcg gtttactata 240
aaaccttata ttccggctct tttttaaaac agggggtaaa aattcactct agtattctaa 300
tttcaacatg ctataataaa tttgtaagac gcaatatgca tctctttttt tacgatatat 360
gtaagcggtt aaccttgtgc tatatgccga tttaggaagg ggggtagatt gagtcaagta 420
gtaataatat agataactta taagttgttg agaagcagga gagcatctgg gttactcaca 480
agttttttta aaactttaac gaaagcactt tcggtaatgc ttatgaattt agctatttga 540
ttcaattact ttaaaaatat ttaggaggta at 572
<210> 11
<211> 545
<212> DNA
<213> Bacillus sp.KSM-S237
<400> 11
gatttgccga tgcaacaggc ttatatttag aggaaatttc tttttaaatt gaatacggaa 60
taaaatcagg taaacaggtc ctgattttat ttttttgagt tttttagaga actgaagatt 120
gaaataaaag tagaagacaa aggacataag aaaattgcat tagttttaat tatagaaaac 180
gcctttttat aattatttat acctagaacg aaaatactgt ttctataaaa ccttatattc 240
cggctctttt ttaaaacagg gggtaaaaat tcactctagt attctaattt caacatgcta 300
taataaattt gtaagacgca atatgcatct ctttttttac gatatacttg tgctatatgc 360
cgatttagga aggggggtag attgagtcaa gtagtaataa tatagataac ttataagttg 420
ttgagaagca ggagagcatc tgggttactc acaagttttt ttaaaacttt aacgaaagca 480
ctttcggtaa tgcttatgaa tttagctatt tgattcaatt actttaaaaa tatttaggag 540
gtaat 545
<210> 12
<211> 193
<212> DNA
<213> 枯草杆菌(Bacillus subtilis)
<400> 12
taagaaaagt gattctggga gagccgggat cactttttta tttaccttat gcccgaaatg 60
aaagctttat gacctaattg tgtaactata tcctattttt tcaaaaaata ttttaaaaac 120
gagcaggatt tcagaaaaaa tcgtggaatt gatacactaa tgcttttata tagggaaaag 180
gtggtgaact act 193
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 13
gggaattcct gttataaaaa 20
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 14
atgatgttaa gaaagaaaac a 21
<210> 15
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 15
ataacaggaa ttccctaaga aaagtgattc tggga 35
<210> 16
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 16
tctttcttaa catcatagta gttcaccacc ttttcc 36
<210> 17
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 17
aactagttta atagattatt ggatttttgg aacaaactc 39
<210> 18
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 18
tatttaggag gtaatatgat ggcaacaatt aatgagtt 38
<210> 19
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 19
ccggcagctc ttgcaatggc aacaattaat gagtt 35
<210> 20
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 20
aactagttta atagattatt gattattatt catac 35
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 21
tgcaagagct gccggaaata 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 22
tctattaaac tagttatagg 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 23
attacctcct aaatattttt 20
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 24
gcaacaatta atgagttgta tcc 23
<210> 25
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 25
cgttcaaaat catccgtaaa tg 22
<210> 26
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 26
aaatgcatga accacttcca c 21
<210> 27
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 27
attggatttt tggaacaaac tc 22
<210> 28
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 28
taaaagtaga agacaaagga 20
<210> 29
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 29
cgatatatgt aagcggttaa c 21
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 30
caatttaaaa tcgctaccct 20
<210> 31
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 31
aactcattaa ttgttgccat agtagttcac caccttttcc 40
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 32
tttttataac aggaattccc 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 33
ggatcaactt tgggagagag 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 34
caagtagtaa taatatagat 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 35
gcaacaatta atgagttgta 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 36
agtacaccag aaagagtaat 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 37
tcaaggtggt aaattagatt 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 38
tcacgtcctg atcaaaaaat 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 39
tacctgctgg aagtttctat 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 40
acagaggccg aaatgtagta 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 41
acagcatatg accaagaacg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 42
gagaatatgt ggaaacacac 20
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 43
cataccctta cttgatcaaa ggttg 25
<210> 44
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 44
aacagggtta ttacaatcac agtga 25
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 45
aatggtaaca atgcagttaa acttt 25
<210> 46
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 46
aagcttctag agatctgcag gtcga 25
<210> 47
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 47
attacctcct aaatattttt 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 48
agtagttcac caccttttcc 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 49
tctattaaac tagttatagg 20
<210> 50
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 50
tatttaggag gtaatatgat gaatccttat caaaataa 38
<210> 51
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 51
ggaaaaggtg gtgaactact atgaatcctt atcaaaataa 40
<210> 52
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 52
cctataacta gtttaataga tcactcgttc atgcaaatta 40
<210> 53
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 53
tatttaggag gtaatatgat gaattcaggc tatccgtt 38
<210> 54
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 54
ggaaaaggtg gtgaactact atgaattcag gctatccgtt 40
<210> 55
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 55
cctataacta gtttaataga tcactcgttc atgcaaatta 40
<210> 56
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 56
tatttaggag gtaatatgat ggaagatagt tctttaga 38
<210> 57
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 57
ggaaaaggtg gtgaactact atggaagata gttctttaga 40
<210> 58
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成寡核苷酸(Synthetic oligonucleotide)
<400> 58
cctataacta gtttaataga ctactttagt aacggattaa 40

Claims (20)

1.一种在菌体内生产的Cry蛋白质或含有该Cry蛋白质的培养产物的制造方法,其中,
所述方法包括:
用将编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接并嵌入而成的表达质粒来转化枯草杆菌,培养该转化细胞,
所述表达质粒是包含编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有90%以上的同一性并且在质粒的复制起始发挥作用的蛋白质的多核苷酸的质粒,
所述枯草杆菌为选自以下1)~4)中的任意菌株:
1)具有缺失了prophage6区域、prophage1区域、prophage4区域、PBSX区域、prophage5区域、prophage3区域、spb区域、pks区域、skin区域、pps区域、prophage2区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、prophage7区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域中的全部区域的基因组的枯草杆菌株;
2)缺失了aprX、aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA中的全部基因或使其失活了的枯草杆菌株;
3)缺失了选自sigE和sigF的基因或使其失活了的枯草杆菌株;
4)对枯草杆菌MGB874株以恒定表达abrB基因或与其相当的基因的方式进行基因构建并且kinA基因缺失或失活的枯草杆菌突变株。
2.如权利要求1所述的方法,其中,
包含σA依赖性启动子或σH依赖性启动子的控制区域与编码Cry蛋白质的基因的起源微生物中的该基因的控制区域不同。
3.如权利要求1或2所述的方法,其中,
包含σA依赖性启动子的控制区域为Bacillus sp.KSM-S237株的纤维素酶基因的控制区域。
4.如权利要求1或2所述的方法,其中,
包含σH依赖性启动子的控制区域为spoVG基因的控制区域。
5.如权利要求3所述的方法,其中,
Bacillus sp.KSM-S237株的纤维素酶基因的控制区域为该纤维素酶基因的转录起始控制区域和翻译起始区域。
6.如权利要求4所述的方法,其中,
spoVG基因的控制区域为该spoVG基因的转录起始控制区域和翻译起始区域。
7.如权利要求1或2所述的方法,其中,
枯草杆菌为MGB874株。
8.如权利要求1或2所述的方法,其中,
枯草杆菌为缺失了sigF基因或使其失活了的枯草杆菌株。
9.如权利要求1或2所述的方法,其中,
Cry蛋白质为Cry5B。
10.如权利要求1或2所述的方法,其中,
Cry蛋白质为Cry5Bt。
11.如权利要求1或2所述的方法,其中,
Cry蛋白质为选自Cry4Aa、Cry4Ba和Cry11Aa的灭蚊蛋白质。
12.下述的表达质粒用于在枯草杆菌内表达Cry蛋白质的应用,其中,
所述表达质粒包含:编码由序列编号9所示的氨基酸序列构成的复制蛋白质、或在氨基酸序列上与其具有90%以上的同一性并且在质粒的复制起始发挥作用的蛋白质的多核苷酸,编码Cry蛋白质的基因与包含σA依赖性启动子或σH依赖性启动子的控制区域能够工作地连接而成,
所述枯草杆菌为选自以下1)~4)中的任意菌株:
1)具有缺失了prophage6区域、prophage1区域、prophage4区域、PBSX区域、prophage5区域、prophage3区域、spb区域、pks区域、skin区域、pps区域、prophage2区域、ydcL-ydeK-ydhU区域、yisB-yitD区域、yunA-yurT区域、cgeE-ypmQ区域、yeeK-yesX区域、pdp-rocR区域、ycxB-sipU区域、prophage7区域、sbo-ywhH区域、yybP-yyaJ区域和yncM-fosB区域中的全部区域的基因组的枯草杆菌株;
2)缺失了aprX、aprE、nprB、nprE、bpr、vpr、mpr、epr和wprA中的全部基因或使其失活了的枯草杆菌株;
3)缺失了选自sigE和sigF的基因或使其失活了的枯草杆菌株;
4)对枯草杆菌MGB874株以恒定表达abrB基因或与其相当的基因的方式进行基因构建并且kinA基因缺失或失活的枯草杆菌突变株。
13.如权利要求12所述的应用,其中,
包含σA依赖性启动子或σH依赖性启动子的控制区域与编码Cry蛋白质的基因的起源微生物中的该基因的控制区域不同。
14.如权利要求12或13所述的应用,其中,
包含σA依赖性启动子的控制区域包含Bacillus sp.KSM-S237株的纤维素酶基因的控制区域。
15.如权利要求12或13所述的应用,其中,
包含σH依赖性启动子的控制区域包含spoVG基因的控制区域。
16.如权利要求14所述的应用,其中,
Bacillus sp.KSM-S237株的纤维素酶基因的控制区域为该基因的转录起始控制区域和翻译起始区域。
17.如权利要求15所述的应用,其中,
spoVG基因的控制区域为该基因的转录起始控制区域和翻译起始区域。
18.如权利要求12或13所述的应用,其中,
Cry蛋白质为Cry5B。
19.如权利要求12或13所述的应用,其中,
Cry蛋白质为Cry5Bt。
20.如权利要求12或13所述的应用,其中,
Cry蛋白质为选自Cry4Aa、Cry4Ba和Cry11Aa的灭蚊蛋白质。
CN201980007940.4A 2018-01-12 2019-01-11 蛋白质的制造方法 Active CN111601892B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-003491 2018-01-12
JP2018003491A JP7218090B2 (ja) 2018-01-12 2018-01-12 タンパク質の製造方法
PCT/JP2019/000618 WO2019139108A1 (ja) 2018-01-12 2019-01-11 タンパク質の製造方法

Publications (2)

Publication Number Publication Date
CN111601892A CN111601892A (zh) 2020-08-28
CN111601892B true CN111601892B (zh) 2024-03-19

Family

ID=67219589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980007940.4A Active CN111601892B (zh) 2018-01-12 2019-01-11 蛋白质的制造方法

Country Status (5)

Country Link
US (1) US11661605B2 (zh)
EP (1) EP3739050A4 (zh)
JP (1) JP7218090B2 (zh)
CN (1) CN111601892B (zh)
WO (1) WO2019139108A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019142773A1 (ja) * 2018-01-16 2019-07-25 花王株式会社 M23aファミリープロテアーゼの製造方法
WO2023104846A1 (en) * 2021-12-10 2023-06-15 Novozymes A/S Improved protein production in recombinant bacteria

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995002695A1 (en) * 1993-07-15 1995-01-26 Abbott Laboratories Formation of and methods for the production of large bacillus thuringiensis crystals with increased pesticidal activity
US6270760B1 (en) * 1989-12-18 2001-08-07 Valent Biosciences, Inc. Production of Bacillus thuringiensis integrants
JP4336082B2 (ja) * 2001-05-29 2009-09-30 花王株式会社 宿主微生物
JP4485341B2 (ja) * 2004-12-20 2010-06-23 花王株式会社 組換え微生物
JP2017079639A (ja) * 2015-10-28 2017-05-18 花王株式会社 枯草菌変異株及びその利用

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH074233B2 (ja) * 1986-06-13 1995-01-25 工業技術院長 殺虫蛋白質産生枯草菌及びその製造法
JPH0611229B2 (ja) * 1986-07-10 1994-02-16 東亞合成化学工業株式会社 抗昆虫蛋白毒素産生枯草菌
JPS63133999A (ja) * 1986-11-27 1988-06-06 Agency Of Ind Science & Technol 誘導発現による蛋白質の製造法
JPH04278092A (ja) * 1991-03-01 1992-10-02 Toagosei Chem Ind Co Ltd 組換えベクター、形質転換枯草菌及び結晶毒素蛋白の製造方法
JP2000210081A (ja) 1999-01-21 2000-08-02 Kao Corp 耐熱性アルカリセルラ―ゼ遺伝子
WO2002097064A1 (fr) 2001-05-29 2002-12-05 Kao Corporation Micro-organismes hotes
US7364728B2 (en) * 2004-03-01 2008-04-29 Phyllom Llc Recombinant organisms producing insect toxins and methods for constructing same
JP4955358B2 (ja) * 2005-10-13 2012-06-20 花王株式会社 新規枯草菌変異株
US8389685B2 (en) * 2008-03-25 2013-03-05 Kao Corporation Vector encoding a plasmid replication protein and use thereof
JP5735775B2 (ja) 2009-10-21 2015-06-17 花王株式会社 改変プロモーター
JP5695325B2 (ja) * 2010-02-05 2015-04-01 花王株式会社 新規枯草菌変異株
WO2016007355A1 (en) 2014-07-07 2016-01-14 Aroian Raffi Van Anthelmintic probiotic compositions and methods
JP6791623B2 (ja) 2015-10-28 2020-11-25 花王株式会社 組換え微生物及びその利用
US11484568B2 (en) 2016-01-15 2022-11-01 University Of Massachusetts Anthelmintic compositions and methods
JP2018070565A (ja) * 2016-11-04 2018-05-10 学校法人近畿大学 双翅目昆虫用殺虫剤
DK3571217T3 (da) * 2017-01-23 2023-09-18 Danisco Us Inc Fremgangsmåder og sammensætninger til opnåelse af naturlig kompetence i bacillus-værtsceller
JP6873470B2 (ja) * 2017-04-05 2021-05-19 学校法人近畿大学 殺軟体動物剤

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6270760B1 (en) * 1989-12-18 2001-08-07 Valent Biosciences, Inc. Production of Bacillus thuringiensis integrants
WO1995002695A1 (en) * 1993-07-15 1995-01-26 Abbott Laboratories Formation of and methods for the production of large bacillus thuringiensis crystals with increased pesticidal activity
JP4336082B2 (ja) * 2001-05-29 2009-09-30 花王株式会社 宿主微生物
JP4485341B2 (ja) * 2004-12-20 2010-06-23 花王株式会社 組換え微生物
JP2017079639A (ja) * 2015-10-28 2017-05-18 花王株式会社 枯草菌変異株及びその利用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHI-YEA YANG等.Enterotoxigenicity and Cytotoxicity of Bacillus thuringiensis Strains and Development of a Process for Cry1Ac Production.《J. Agric. Food Chem.》.2002,全文. *
H. LUKE CARTER III等.New RNA polymerase ar factor under spoO control in Bacillus subtilis.《Proc. Natl. Acad. Sci. USA》.1986,全文. *
Hajime Yoshisue等.Identification of a promoter for the crystal protein-encoding gene cryIVB from Bacillus thuringiensis subsp. israelensis.《Gene》.1993,第137卷(第2期),摘要部分、第249页和图4. *
陈宏.《基因工程原理与应用》.北京:中国农业出版社,2004,第223页. *

Also Published As

Publication number Publication date
EP3739050A1 (en) 2020-11-18
US11661605B2 (en) 2023-05-30
CN111601892A (zh) 2020-08-28
JP7218090B2 (ja) 2023-02-06
WO2019139108A1 (ja) 2019-07-18
JP2019122270A (ja) 2019-07-25
US20200370059A1 (en) 2020-11-26
EP3739050A4 (en) 2022-01-12

Similar Documents

Publication Publication Date Title
US7544488B2 (en) Secretion, transcription and sporulation genes in Bacillus clausii
Calvio et al. Swarming differentiation and swimming motility in Bacillus subtilis are controlled by swrA, a newly identified dicistronic operon
US7884191B2 (en) Twin-arginine translocation in Bacillus
CN101084302B (zh) 重组微生物
JP2011004759A (ja) バチルスにおけるタンパク質発現の増大
CN111601892B (zh) 蛋白质的制造方法
CN101652468B (zh) 重组微生物
EP2133416A1 (en) Recombinant microorganism
DK2451954T3 (en) Modified promoter
Pan et al. Secretory expression of a heterologous protein, Aiio-AIO6BS, in Bacillus subtilis via a non-classical secretion pathway
CN101631862B (zh) 修饰微生物
DE69819168T2 (de) Erhöhung der proteinproduktion in gram-positiven mikroorganismen
US6506579B1 (en) Increasing production of proteins in gram-positive microorganisms using SecG
JP5847458B2 (ja) 改変rRNAオペロンを有する組換え微生物
KR100443889B1 (ko) 그람양성세균의 포자형성 조절방법
Vitikainen PrsA lipoprotein and posttranslocational folding of secretory proteins in Bacillus subtilis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant