CN103946393A - 用于高通量识别新型杀虫组合物的整合的方法及其用途 - Google Patents

用于高通量识别新型杀虫组合物的整合的方法及其用途 Download PDF

Info

Publication number
CN103946393A
CN103946393A CN201280048598.0A CN201280048598A CN103946393A CN 103946393 A CN103946393 A CN 103946393A CN 201280048598 A CN201280048598 A CN 201280048598A CN 103946393 A CN103946393 A CN 103946393A
Authority
CN
China
Prior art keywords
sequence
nucleic acid
nucleotide sequence
toxin
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280048598.0A
Other languages
English (en)
Inventor
C·J·格冉德里
T·理查森
J·S·科瑞卫
A·施瓦兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viridos Inc
Original Assignee
Synthetic Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synthetic Genomics Inc filed Critical Synthetic Genomics Inc
Publication of CN103946393A publication Critical patent/CN103946393A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Pest Control & Pesticides (AREA)
  • Cell Biology (AREA)
  • Insects & Arthropods (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

提供快速识别编码新型生物毒素的核酸序列的方法。特别地,描述快速取样和筛选用于目标新型序列的微生物染色体外遗传内容物的方法。提供包含生物毒素的编码序列的组合物、和多肽以及由它们产生的用途。组合物和方法用于例如赋予细菌、植物、植物细胞、组织和种子杀虫活性。

Description

用于高通量识别新型杀虫组合物的整合的方法及其用途
并入序列表
在所附序列表中的材料通过引用方式全部并入。名称为“SGI1530-1WO_ST25.txt”的所附文件由2012年8月17日创建,其大小为836Kb。在使用Window OS的电脑上通过Microsoft Word可打开文件。
技术领域
本发明通常涉及分子生物学领域。更具体而言,本发明涉及识别编码生物毒素的基因序列及其用途。
发明背景
许多微生物种类,尤其是抑制土壤和其他复合生态群落的产芽胞革兰氏阳性细菌菌株,产生大量蛋白质毒素,它们增加这些微生物生存和繁殖能力。许多这些细菌通常携带染色体外遗传物质,其包括可包含大量基因的质粒和附加体。通常,这些质粒编码的基因和附加体编码的基因使得上述细菌菌株具有重要特性。例如,使用最广泛的杀生性杀虫剂之一即Crystal(Cry),它是通过苏云金芽孢杆菌(Bacillusthuringiensis)(Bt)的亚种和菌株的染色体外遗传内容物编码的蛋白质。迄今为止,大量苏云金芽孢杆菌(Bt)菌株和来源于Bt的化合物被用作生物杀虫剂。Bt孢子含有晶体,该晶体主要包含一种或多种Cry和/或Cyt蛋白(也称为β-内毒素),而该Cry和/或Cyt蛋白对各种鳞翅目昆虫具有强效和特异性杀虫活性。Bt毒素用作保护作物的局部杀虫剂,而最近该蛋白在转基因植物中表达以赋予对害虫的抵抗性。产生这些细菌菌株的杀虫蛋白的基因由染色体外DNA编码。
尽管在过去二十年中,越来越流行在各种农业应用中使用微生物毒素和编码它们的基因,但对于商业应用前景潜能来发现和特征化微生物毒素基因仍然是复杂的过程。微生物是生物界最大组成部分,并被广泛认为是行星上进化和生化多样性的一个最大的来源。实际上,预估地球上微生物细胞的总数目至少1030个。原核细胞是单个有机体最大组成部分,其包含106至108个单独的基因型群。此外,报道细菌染色体外DNA的极大遗传多样性。因此,具有极大生物多样性的这些微生物遗传物质保留新型基因和化合物的大量未经开发的储库,这些新型基因和化合物具有商业应用的潜能。然而,目前使用的由微生物筛选商业上可行基因的方法通常不能有效地用于这些正在开发的资源上。例如,目前用于筛选芽孢杆菌属的新晶体毒素蛋白的方法从本技术开始就没有大的变化,并且主要依赖于耗时和相当低通量方法。识别商业上可行基因和蛋白的传统方法通常依赖于遵循目标功能。通常,产芽胞杆菌的新分离株由环境分离,随后经过漫长多步骤特征化方法,其包括:(1)识别形成晶体蛋白菌株的显微分析;(2)线虫和昆虫进食和杀伤测定法;(3)变性PCR分析和引物步移法以恢复全长毒素基因序列。这种方法的主要缺陷是不仅低通量、需要的时间长和付出的努力大,而且仅在已经完成所有尝试之后才能得到发现基因序列的事实。
新基因组学方法尝试尽快测序基因以及通过与已知基因的同一性来识别它们的功能。自从可得到用于该目的的分子生物工具开始,一直努力特征化微生物的基因组。为了更好地测序,通量需要技术变革,因此,多家商业公司和科学实验室提出多种达到超高通量测序的方法。这些方法通常包括测序和组合微生物的完全基因组,随后在可大概地识别新编码毒素序列之前进行基因组大部分基因的注释。然而,因为许多毒素基因位于微生物基因组的染色体外部分中,所以仍然不清楚为了识别具有商业价值的新遗传成分来测序给定有机体的完全基因组的效果如何。已经有特征化通过微生物的染色体外DNA携带的遗传物质、以及使用这些特征化作为快速识别具有商业用途的微生物基因的方法的少量系统尝试。这些系统方法之一之前描述在美国专利申请No.20100298207中,其中在识别毒素基因之前,将可具有目标毒素基因的细菌菌株的染色体外DNA内容物单独提取、测序、组合和注释。然而,因为该方法要求分离单独的微生物菌株并对其特征化和由单独培养的菌株中分离染色体外核酸,所以需要进一步改善。此外,当在单独处理的样品中为了识别新型毒素基因单独和独立地构建、测序和注释所有DNA文库时,需要进行劳动密集型克隆。
宏基因组是当今发展最快研究领域之一。术语来源于荟萃分析(meta-analysis)(统计上合并单独分析的过程)和基因组学(有机体的遗传物质的综合分析)的统计学概念。迄今为止,常见的宏基因组通常定义为对通过绕过获得测序用纯培养物要求下直接由环境样品或者相关样品系列获得的DNA应用高通量测序。某种程度上,常见宏基因组是微生物基因组的衍生,关键不同之处在于它绕过获得测序纯培养物的要求。此外,由团体而不是单独的个体获得样品。
尽管已经成功地使用宏基因组识别具有所需活性的酶,但它主要取决于环境DNA克隆文库的基于相对低通量功能的筛选或者基于测序的筛选。来自环境样品的完整基因的基于序列的宏基因组发现受到大部分环境的微生物种类复杂性和在低覆盖宏基因组组合的全长基因中随后稀有性限制。
因此,需要新型方法以便于快速和有效识别通过微生物的染色体外DNA内容物携带的有用的核苷酸序列。特别地,需要识别具有商业相关性的更多微生物毒素基因以及快速和有效进行。通过提供快速和有效捕集来自微生物基因组的遗传多样性以及识别商业目的编码新型毒素的序列的方法,而不需要微生物的完全基因组的劳动密集型和相对低通量克隆或者测序,本发明的一方面提供整合的筛选方法作为该长期以来需求的解决方案。
发明概要
在本公开中描述在微生物中快速和高效识别编码生物毒素的基因序列的方法。特别地,提供快速取样和筛选用于目标新型序列的微生物染色体外遗传内容物的方法。在本公开中也提供编码新型生物毒素的分离的核酸分子和包含这些核酸分子的组合物。此外,提供赋予诸如微生物、植物、植物细胞、组织、和种子的细胞和有机体杀虫活性的组合物和方法。根据本公开的核酸序列和分子可用于例如制备适合在包括微生物和植物的宿主有机体中转化和表达的DNA构建体或表达盒。核酸分子也可包含在靶有机体中设计最佳表达的合成序列,该靶有机体包括但不限于微生物或者植物。此外,在本公开中也涵盖对应于核酸分子的多肽、制备这些多肽的方法、和特异性结合那些多肽的抗体。
本发明的一方面涉及识别编码生物毒素的核酸序列的方法。本方法包括:(a)生成来自多种微生物分离株的染色体外DNA分子的混合群体;(b)建立宏基因组序列数据集,所述宏基因组序列数据集包括来源于所述染色体外DNA分子的混合群体的核酸序列;(c)处理所述宏基因组序列数据集的序列数据以定义至少一个核酸序列重叠群,以及(d)通过比较步骤(c)的所述至少一个核酸序列重叠群与已知生物毒素序列来识别编码生物毒素的核酸序列。
在一些实施方案中,根据本发明的该方面的方法可进一步包括测定微生物分离株的系统分类的步骤。在一些实施方案中,可针对产生至少一种生物毒素的能力预选多种微生物分离株。在一些优选的实施方案中,根据本发明的该方面的方法可进一步包括测定由步骤(d)识别的核酸序列是否编码新型生物毒素的步骤。在一个实施方案中,新型毒素的核酸序列与任何已知生物毒素序列具有小于30%同一性。在一些实施方案中,新型毒素的核酸序列与任何已知生物毒素序列具有小于60%、或小于70%、或小于80%、或小于90%、或小于95%、或小于98%、或小于99%序列同一性。在根据该方面的方法的某些实施方案中,多种微生物分离株包括至少12种微生物分离株。在一些实施方案中,多种微生物分离株包括至少24种、或者至少48种、或者至少50种、或者至少96种、或者至少200种、或者至少384种、或者至少400种、或者至少500种、或者至少1500种微生物分离株。在该方面的优选的实施方案中,微生物分离株至少一种是细菌。细菌可以但不限于为以下属:芽孢杆菌属(Bacillus):短芽孢杆菌属(Brevibacillus)、梭菌属(Clostridia)、类芽孢杆菌属(Paenibacillus)、光杆状菌属(Photorhabdus)、假单胞菌属(Pseudomonas)、沙雷氏菌属(Serratia)、链霉菌属(Streptomyces)、和致病杆菌属(Xenorhabdus)。在该方面的又一其他实施方案中,通过排除分子克隆的直接测序工序可构建宏基因组序列数据集。
根据本发明的另一方面也提供分离的核酸分子,其包含通过本文公开的高通量基因识别方法识别的核酸序列。
在又一方面中,本公开提供分离的核酸分子,其包含:在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核苷酸序列的补体、及其片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核苷酸序列的补体、及其片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的氨基酸序列的核酸序列。
本公开也提供核酸构建体,其包括本文所提供的多核苷酸。核酸构建体包括与核酸分子可操作连接的异源性核酸,所述核酸分子包含与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。在一些优选的实施方案中,异源性核酸是异源性启动子。在一些其他优选的实施方案中,根据本发明的该方面的核酸构建体是载体构建体。这些载体构建体用于在转基因细胞和转基因有机体中转化和表达根据本发明的多核苷酸和多肽,该转基因有机体包括但不限于转基因植物和转基因微生物。
在另一方面中,本公开进一步提供包括核酸构建体的宿主细胞,该核酸构建体包含与核酸分子可操作连接的异源性核酸,该核酸分子包含与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。在该方面的一些优选实施方案中,这些宿主细胞可以为植物细胞或者微生物细胞。
本公开也提供包含宿主细胞的宿主有机体,该宿主细胞包括核酸构建体,该核酸构建体包含与核酸分子可操作连接的异源性核酸,该核酸分子包含:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。在该方面的一些优选实施方案中,这些宿主有机体可以为植物或微生物。本公开也提供来源于本文所述的宿主有机体的生物样品和子代。
在本发明的另一方面中,公开赋予有机体杀虫活性的方法。本方法包括引入核酸分子至有机体内,该核酸分子包括:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。在优选的实施方案中,将核酸分子转录,从而导致如与对照有机体相比,有机体对害虫的抵抗性增加。
在又一方面中,本公开进一步提供分离的多肽。通过核酸分子来编码分离的多肽,所述核酸分子包括:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。在该方面的一些优选实施方案中,多肽可具有杀虫活性。
在本发明的另一方面中,提供包含通过核酸分子编码的多肽的组合物,该核酸分子包含:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。根据本发明的该方面的组合物可进一步包括一种或多种以下特征。多肽可以为分离的多肽。多肽可具有杀虫活性。组合物可进一步包括载体。这些载体可以为农业上可接受的载体。组合物可另外包含农业上有效量的杀虫剂化合物或组合物。另外的化合物或组合物可以为杀螨剂、杀细菌剂、杀真菌剂、杀虫剂、杀微生物剂、杀线虫剂、杀虫剂、或者肥料。可将组合物制备为配制物,其可以为乳化液、胶体、粉尘、颗粒、片状物、粉末、喷雾、或溶液。通过离心、浓缩、干燥、提取、过滤、均化、或沉淀微生物细胞的培养物可制备组合物。在又一其他实施方案中,组合物可包括按重量计约1%至约99%的本文提供的多肽。
在本发明的另一方面中也提供控制害虫的方法。本方法包括使害虫接触或进食害虫如本文所述的本发明的杀虫有效量的多肽。
在本发明的又一方面中,提供制备具有杀虫活性的多肽的方法。本发明包括在表达核酸分子的条件下培养包含核酸分子的宿主细胞,该核酸分子编码如本文所述的本发明的任意一种多肽。因此,通过核酸分子可编码多肽,该核酸分子包含:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。
在本公开中也提供纯化的抗体,该纯化的抗体特异性结合本文提供的任意一种多肽或其杀虫片段。通过核酸分子可编码多肽,该核酸分子包含:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的多肽的核酸序列。
由本发明的以下详细描述和权利要求,本发明的这些和其他目的和特征将变得更清晰。
发明详述
本发明涉及用于调节有机体(特别是植物或植物细胞)中对害虫的抵抗性的组合物和方法。提供快速和有效识别编码新型生物毒素的基因序列的方法。特别地,描述快速取样和筛选用于目标新型序列的微生物染色体外遗传内容物的方法。在本公开中也提供编码新型生物毒素的分离的核酸分子和包含这些核酸分子的组合物。此外,也提供赋予细菌、植物、植物细胞、组织和种子杀虫活性的组合物和方法。此外,涵盖对应于多核苷酸的氨基酸序列,也提供与这些氨基酸序列的抗体特异性结合。
特别地,本发明的核酸分子能够用于例如构建随后转化至目标有机体内的表达载体,其作为用于分离其他毒素基因的探针,以及通过本领域已知的方法来生成改变的杀虫蛋白,例如结构域切换或者DNA改组。核酸序列或氨基酸序列也可以为合成序列,设计其在包括但不限于微生物或植物的靶有机体中最佳表达。发现,本发明的多肽用于控制或杀死害虫群体,特别是鳞翅目、鞘翅目、和线虫害虫群体,以及用于制备具有杀虫活性的组合物。
此外,使用依照本公开的方法制备的微生物细胞和植物细胞可用于制备生物质、微生物产品、植物产品,例如,食物、饲料、生物燃料、化妆品、药物、保健营养品、营养品、或药品。
除非另有定义,否则本文所使用的所有技术术语、符号和其他科学术语或命名旨在具有通过本发明所属技术领域人员通常理解的意思。在一些情况下,为了清楚和/或为了方便引用,本文定义具有通常理解意思的术语,但是本文这些定义并入应当也可以理解为与本领域通常理解具有的巨大差异。使用通过本领域技术人员的常规方法较好理解和常规利用本文所描述和引用的许多技术和步骤。
除非文本另有明确示出,否则单数形式“一个”、“一种”、和“该”包括复数形式。例如,术语“细胞”包括一个或多个细胞,包括其混合物。
氨基酸:如本文所使用,术语“氨基酸”是指类似于天然存在的氨基酸的方式作用的天然存在的和合成的氨基酸、以及氨基酸同源物和氨基酸模拟物。天然存在的氨基酸为通过遗传密码编码的那些,包括D/L旋光异构体、以及之后经修饰的那些氨基酸,例如,羟脯氨酸、y-羧基谷氨酸、和O-磷酸丝氨酸。氨基酸同源物是指与天然存在的氨基酸具有相同基本化学结构的化合物,即,连接氢、羧基、氨基、和R基团(例如,高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍)的碳。这些同源物具有经修饰的R基团(例如,正亮氨酸)或者经修饰的肽主链,但保留与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有不同于氨基酸的基本化学结构、但以类似于天然存在的氨基酸的方式作用的化合物。
如本文可交换使用的术语“生物毒素”或“毒素”旨在表示针对一种或多种害虫具有毒性的多肽或者这些多肽的功能同源物,该害虫包括但不限于昆虫害虫,例如,多种鳞翅目、双翅目、和鞘翅目的成员、和线虫门的线虫成员。术语“生物毒素”有时用于明确地确定生物来源。在一些情况下,生物毒素蛋白由芽胞杆菌属分离。在其他实施方案中,毒素可由包括梭菌属和类芽孢杆菌属的其他微生物类别中分离。毒素蛋白包括来源于本文公开的全长核苷酸序列的氨基酸序列、以及由于使用可替换下游起始位点、或者由于制备具有杀虫活性的较短蛋白的操作的比全长序列短的氨基酸序列。在有机体中可进行操作,在消化蛋白之后,蛋白表达在害虫中。
组合物:“组合物”旨在表示惰性(例如,可检测试剂或者标记或液体载体)或者活性(例如杀虫剂)的活性剂和另外的化合物、载体或组分的组合。
如本文所使用的关于杀虫处理的术语“控制”或“使控制”或其语法等同形式理解为涵盖杀虫组合物对给定害虫的任何杀虫活性或抑虫(抑制、抵制、阻止、预防以及通常干扰害虫作用以防对寄主植物的损害)活性,从而影响害虫在各发育阶段的进食、生长、和/或行为的变化,其包括但不限于杀死昆虫、延迟生长、阻断生殖能力等。因此,术语“控制”或“使控制”或其语法等同形式不仅包括杀死,也包括例如抵制、预防、阻止、抑制或杀死卵发育或者孵化、抑制成熟或发育、以及对杀死幼虫或成年害虫。
对照有机体:如在本发明中所使用的“对照有机体”提供测量主题有机体或细胞的表型中变化的参照点,其可以为任何合适的有机体或细胞。对照有机体或细胞可包含例如:(a)即,相同基因型的野生型有机体或细胞作为在主题有机体或细胞中出现的遗传改变的起始材料;(b)相同基因型的有机体或细胞作为起始材料,但其经空白构建体(即,对目标特征没有未知作用的构建体,例如包含报道基因的构建体)转化;(c)在主题有机体或细胞的子代之间为非转化的分离子的有机体或细胞;(d)遗传上与主题有机体或细胞相同、但没有暴露于与主题有机体或细胞相同的处理(例如,杀虫剂处理)的有机体或细胞;(e)在未表达未知基因的条件下主题有机体或细胞自身;或者(f)在其未暴露于特定处理(例如杀虫剂或者杀虫剂和/或其他化学物质的组合)的条件下的主题有机体或细胞自身。在一些情况下,术语“对照有机体”是指为了识别在转基因或经遗传修饰的有机体中调控的表型来用于针对转基因或经遗传修饰的有机体比较的有机体或细胞。在一些情况下,“对照有机体”是指不含有在目标转基因有机体中存在的外源性核酸、但是具有如同这些转基因有机体的类似遗传背景的有机体。在一些其他情况下,如本文所使用的合适对照有机体或细胞可具有与主题有机体或细胞不同的基因型,但是可具有在主题有机体或细胞中出现的遗传改变的起始材料的杀虫剂敏感性性能。例如,如用于该公开的目的,“对照植物”是指为了识别在转基因或经遗传修饰的有机体中调控的表型来用于针对转基因或经遗传修饰的植物比较的植物细胞、种子、植物部位、植物组织、植物器官或者全株。在一些情况下,“对照植物”可表示不含有在目标转基因植物中存在的外源性核酸、但是具有如同这些转基因植物的类似遗传背景的植物。合适的对照植物可以为用于生成主题转基因植物的亲本品系的未经遗传改变或者非转基因植物。在一些情况下,合适的对照植物可以为来自转化试验的非转基因分离子、或者含有除目标外源性核酸之外的外源性核酸的转基因植物。
培养:如本文所使用,术语“培养”是指在合适的条件下在例如液体、半固体或固体培养基的各种培养基上或中繁殖细胞或有机体,其中细胞或有机体可以进行一些、如果不是所有的生物过程。例如,经培养的细胞可以生长或再生,并且能够进行生物和/或生化过程,其包括但不限于复制、转录、翻译。
结构域:“结构域”是能够用于特征化蛋白家族和/或蛋白的一部分在多肽中基本相邻氨基酸的基团。这些结构域具有可包含保守一级序列、二级结构、和/或三维构象的“指纹”或者“签名”。通常,结构域与具体体外和/或体内活性相关。结构域的长度可以为4个氨基酸至400个氨基酸,例如,4至50个氨基酸、或4至20个氨基酸、或4至10个氨基酸、或4至8个氨基酸、或25至100个氨基酸、或35至65个氨基酸、或35至55个氨基酸、或45至60个氨基酸、或200至300个氨基酸、或300至400个氨基酸。如本文其他处更详细公开,在科技文献和专利文献中大量描述表现出生物毒素活性的保守区和保守结构域。
有效量:如本文所使用,“有效量”是足够影响有益或所需结果的量。有效量可在一次或多次给药中施用。依据害虫和/或病害管理、治疗、抑制或保护,有效量是足够遏制、稳定、逆转、减缓或延迟靶害虫传播或病害状况的进展的量。因此,表达“杀虫有效量”在本文中用于指获得害虫发育水平和/或害虫传染水平相比于在未处理的对照中出现的那些水平的降低所需的杀虫剂处理量。对于每种杀虫物质或有机体,可由在具体环境中受影响的各种害虫经验测定杀虫有效量。通常,在合适处理条件下,相对于在未经处理的对照下出现的害虫传播水平和/或害虫发育水平,给定杀虫剂处理的有效量提供至少20%的降低,或者更通常为介于30至40%之间;更通常为介于50-60%之间;甚至更通常为介于70至80%之间;以及甚至更通常为介于90至95%之间。如上所讨论,在一次或多次给药中可施用杀虫有效量。
外源性:当相对于核酸使用时,“外源性”表示核酸是重组核酸构建体的一部分,而不是在它的天然环境中。例如,外源性核酸可以为由某一种类引入另一种类的序列,即,异源性核酸。通常,通过重组核酸构建体将这些外源性核酸引入其他种类。外源性核酸也可以为天然来自有机体以及被重新引入有机体的细胞内的序列。通过连接外源性核酸的非天然序列的存在,例如在重组核酸构建体中侧翼连接天然序列的非天然调节序列,包括天然序列的外源性核酸的外源性核酸通常可由天然存在的序列中区分出来。此外,可将稳定转化的外源性核酸整合在除发现天然序列的位置之外的位置处。应理解,可将外源性核酸引入祖细胞,而不是考虑中的细胞内。例如,含有外源性核酸的转基因植物可以是介于稳定转化植物和非转基因植物之间杂交子代。考虑这些子代包含外源性核酸。
表达:如本文所使用,“表达”是指通过转录转化多核苷酸的遗传信息至RNA内、以及通过在核糖体上mRNA的翻译转化多核苷酸的遗传信息至蛋白内的过程,转录通常通过酶—RNA多聚酶来催化。
功能同源物:如本文所使用的术语“功能同源物”描述具有至少一个共同特性的那些蛋白。这些特性包括序列相似性、生化活性、转录模式相似性和表型活性。通常,功能同源物是与参照多肽具有序列相似性、以及携带参照多肽的一种或多种生化或生理功能的多肽。功能同源物通常导致相同特性至相类似但不一定相同的程度。通常,在由于一种同源物的定量测定值为其他至少20%处;更通常,介于30至40%之间;更通常,介于50-60%之间;甚至更通常,介于70至80%之间;甚至更通常,介于90至95%之间;甚至更通常,介于其他的98至100%之间,功能同源蛋白得到相同特性。
功能同源物和参照多肽可以为天然存在的多肽,并且序列相似性可以由于趋同或趋同进化事件。因此,功能同源物有时在文献中称为同源物、直接同源物(ortholog)、或者间接同源物(paralog)。天然存在的功能同源物的变体可以自身为功能同源物,例如通过突变体或野生型编码序列编码的多肽。如本文所使用,通过生物毒素多肽的编码序列的定位诱变、或者通过结合来自不同天然存在的生物毒素多肽的编码序列的结构域也可产生功能同源物。术语“功能同源物”有时应用至编码功能同源多肽的核酸。
通过核苷酸和多肽序列比对的分析可识别功能同源物。例如,进行对核苷酸或多肽序列的数据库的询问可识别生物毒素多肽的同源物。序列分析可包括使用AHAS多肽的氨基酸序列作为参照序列的非冗余数据库的BLAST、交互式BLAST、或者PSI-BLAST分析。在一些情况下,氨基酸序列由核苷酸序列推导出。通常,在数据库中具有大于40%序列同一性的那些多肽是进一步评估作为生物毒素多肽适合性的候选物。氨基酸序列相似性使得可以进行保守氨基酸取代,例如一个疏水残基取代另一疏水残基或者一个极性残基取代另一极性残基。如果需要,可进行这些候选物的人工检索以缩小待进一步评估的候选物数目。通过选择具有在生物毒素多肽中存在的结构域(例如,保守功能结构域)的那些候选物可进行人工检索。
通过定位在生物毒素多肽的一级氨基酸序列内的区域能够识别保守区,该生物毒素多肽的一级氨基酸序列是重复的序列,其形成一些二级结构(例如,螺旋和β折叠),建立正或负电结构域,或者表示蛋白基序或结构域。参见例如,Pfam网址在万维网sanger.ac.uk/Software/Pfam/and pfam.janelia.org/.处描述多种蛋白基序和结构域的共有序列。在Pfam数据库处包括的信息详细内容描述在例如,Sonnhammer等人(Nucl.Acids Res.,26:320-322,1998)、Sonnhammer等人(Proteins,28:405-420,1997);和Bateman等人(Nucl.Acids Res.,27:260-262,1999)中。通过比对来自紧密相关种类的相同或相关多肽的序列也可测定保守区。紧密相关种类优选来自相同家族。在一些实施方案中,两个不同种类的序列比对就足够。如在本文其他处更加详细所公开,在科学文献和专利文献中大量描述保守区和保守功能结构域,该保守区和保守功能结构域表现出生物毒素活性。
通常,表现出至少约40%氨基酸序列同一性的多肽用于识别保守区。相关多肽的保守区表现出至少45%氨基酸序列同一性(例如,至少50%、至少60%、至少70%、至少80%、或至少90%氨基酸序列同一性)。在一些实施方案中,保守区表现出至少92%、94%、96%、98%、或99%氨基酸序列同一性。
异源序列:如本文所使用,术语“异源序列”涵盖异源性多肽和异源性核酸,它是指不是天然彼此可操作连接或者相邻的那些序列。例如,据认为,来自小麦的启动子与苏云金芽孢杆菌编码区序列为异源性。而且,据认为,编码小麦生长因子的基因的启动子与编码生长因子的小麦受体的序列为异源性。据认为,不是天然起源于相同基因作为编码序列的调控元件序列(例如UTR或3'端终止序列)与所述编码序列为异源性。彼此天然可操作连接和相邻的元件彼此非异源性。另一方面,这些相同元件仍然可操作连接,但是如果将其他填充序列置于它们之间,则它们会变成异源性。因此,表达氨基酸转运蛋白的小麦基因的启动子和编码序列彼此不是异源性,但是以新型方式可操作连接的小麦基因的启动子和编码序列为异源性。
如本文所使用,术语“杂交”通常是指核酸分子通过互补碱基链配对结合的能力。本发明的核酸分子或其片段能够在某些条件下特异性杂交其他核酸分子。如本文所使用,据认为,如果两个核酸分子能够形成逆平行、双链核酸结构,则该两个分子能够彼此特异性杂交。据认为,如果核酸分子表现出完全的互补性,则它为另一核酸分子的“补体”。如本文所使用,据认为,当一个分子的每一核苷酸与其他核苷酸互补,则分子表现出“完全互补性”。如果至少在常见“低严格性”条件下两个分子能够彼此杂交足以使得它们仍然能够彼此退火,则认为它们为“最小互补”。类似地,如果在常见“高严格性”条件下分子能够彼此杂交足以使得它们仍然能够彼此退火,则认为它们为“互补”。常见严格性条件由Sambrook等人描述在:Molecular Cloning,ALaboratory Manual,第2版,Cold Spring Harbor Press,Cold SpringHarbor,N.Y.(1989);以及由Haymes等人描述在:Nucleic AcidHybridization,A Practical Approach,IRL Press,Washington,D.C.(1985)中。因此,允许偏离完全互补性,只要这些偏离不会完全排除分子形成双链结构的能力。因此,为了使本发明的核酸分子或片段用作引物或探针,仅需要序列足够互补以在采用的特定溶剂和盐浓度下能够形成稳定双链结构。
促进DNA杂交的合适严格性条件包括:例如,在约45℃下6.0×氯化钠/柠檬酸钠(SSC),然后为在约50℃下通过2.0×SSC洗涤。此外,在洗涤步骤中温度可由在室温、约22℃的低严格性条件增加至在约65℃的高严格性条件。温度和盐均可变化,或者温度或盐浓度可保持恒定,但另一变量改变。关于这方面的信息可在Current Protocols inMolecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6中找到。例如,低严格性条件可用于选择与靶核酸序列具有较低序列同一性的核酸序列。人们希望采用例如约0.15M至约0.9M氯化钠、在约20℃至约55℃范围的温度的条件。高严格性条件可用于选择与所公开的核酸序列(Sambrook等人,1989,见上)具有较高同一性程度的核酸序列。高严格性条件通常包括在约2×SSC至约10×SSC(由在蒸馏水中含有3M氯化钠和0.3M柠檬酸钠的20×SSC储备溶液,pH7.0稀释)、约2.5×至约5×邓哈特溶液(Denhardt's solution)(由含有1%(w/v)牛血清清蛋白、1%(w/v)菲柯尔水溶性聚蔗糖(ficoll)、和1%(w/v)聚乙烯吡咯烷酮的50×储备溶液稀释)、约10mg/mL至约100mg/mL鱼精子DNA、和约0.02%(w/v)至约0.1%(w/v)SDS中在约50℃至约70℃下孵育数小时至过夜下核酸杂交。杂交通常通过数次洗涤步骤进行。这些洗涤步骤通常通过逐渐增加严格性来进行,其包括在约20℃至约70℃下0.5×SSC至约10×SSC、和0.01%(w/v)至约0.5%(w/v)SDS中15-min孵育。优选地,在65℃下在0.1×SSC中洗涤至少一次之后,核酸片段仍然为杂交。在优选的实施方案中,通过在65℃下在5×SSC,5×邓哈特溶液、100μg/mL剪切和变性的鲑鱼精子DNA、和1%(w/v)SDS中预杂交和杂交至少三个小时,并且在65℃下使用2×SSC,0.2%SDS洗涤两次来提供高严格性条件。
根据本申请的一些实施方案,本发明的核酸分子优选包含在低或高严格性条件下与在序列表中任意一个核酸序列、或其任意补体、或它们的任意片段杂交的核酸序列。
分离的分子和基本纯化的分子:当通过重组技术制备时,“分离的”或“纯化的”核酸分子或蛋白、或其生物活性部分基本上没有其他细胞物质、或培养基;或者当化学合成时,其基本上没有化学前体或其他化学物质。如本文所使用,术语“基本上纯化的”是指基本上与所有其他分子基本分离的分子,该其他分子通常与它在自然状态下缔合。更优选地,基本上纯化的分子是制备物时存在的主要种类,所述制备物来自人对多核苷酸或多肽的操作、或由人对多核苷酸或多肽的操作产生,但间接产生。基本上纯化的分子可以不含存在于天然混合物中的其他分子(排除溶剂)的大于60%、优选75%、更优选90%、以及最优选95%。术语“基本上纯化的”没有涵盖以它们天然状态存在的分子。对于核酸,在核酸来源的有机体细胞中“分离的”核酸优选不含天然侧翼连接核酸的序列(即,位于核酸的5'和3'端处的序列)。因此,如本文所使用的“分离的核酸”包括当将在核酸的天然存在的基因组中侧翼连接该核酸的一个或两个序列去除或者使其缺失时的天然存在的核酸。因此,分离的核酸包括但不限于并入载体或重组有机体内作为纯化的分子或者核酸分子存在的核酸。据认为,在包含基因组DNA限制酶切消化的例如cDNA文库、基因组文库、或凝胶切片内在数百至数百万个其他核酸之间存在的核酸不是分离的核酸。为了本发明,当用于表示核酸分子时,“分离的”也包括分离的染色体。例如,在各实施方案中,编码核酸分子的分离的毒素能够含有小于约5kb、4kb、3kb、2kb、1kb、0.5kb、或0.1kb的在核酸来源的细胞中天然侧翼连接核酸分子的核苷酸序列。基本上不含细胞物质的毒素蛋白包括具有小于约30%、20%、10%、或5%(以干重计)的无毒蛋白的蛋白的制剂(本文中通常称为“污染蛋白”)。
如本文可交换使用,术语“微生物分离株”或者“分离的微生物菌株”是指由具有多于一种微生物的样品或者由混合群体或微生物获得或得到的特定种、属、科、目或纲的微生物。如本文所使用,如应用于微生物(例如,细菌或者微型真菌)的术语“分离的”是指将微生物由它自然存在的环境中移除和/或纯化。因此,如本文所使用的“分离的微生物菌株”是由菌株的自然环境中移除和/或纯化的菌株。因此,“分离的”微生物不包括寄居在它天然存在环境中的微生物。而且,术语“分离的”不一定反映出微生物被纯化的程度。微生物的菌株的“基本上纯的培养物”是指基本上不包含除微生物所需菌株之外的其他微生物的培养物。换而言之,微生物的菌株的基本上纯的培养物基本上不含其他污染物,该污染物可包括微生物污染物以及非所需的化学污染物。而且,如本文所使用,“生物纯的”菌株旨在表示由在自然中菌株与之通常结合的物质中分离的菌株。注意,与其他菌株结合的菌株、或者与不是在自然中发现的菌株通常与之结合的化合物或材料结合的菌株也定义为“生物纯的”。当然,特定菌株的单一培养物为“生物纯的”。如本文所使用,分离的微生物菌株的术语“富集培养物”是指含有多于50%、60%、70%、80%、90%、或95%的分离的菌株的微生物培养物。
如本文所使用,宏基因组序列数据集是指由多种分离的微生物中随机抽样和由此获得的核酸序列数据的集合。术语宏基因组来源于荟萃分析(统计上联合单独分析的过程)和基因组学(有机体的遗传物质的综合分析)的统计概念。
核酸和多核苷酸:本文中术语“核酸”和“多核苷酸”可交换使用以及是指RNA和DNA,其包括cDNA、基因组DNA、合成DNA、和包含核酸同源物的DNA或RNA。多核苷酸可具有任何三维结构。核酸可以为双链或单链(即,有义链或反义链)。多核苷酸的非限制性例子包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、siRNA、微-RNA、核酶、cDNA、DNA/RNA杂交体、重组多核苷酸、分支多核苷酸、核酸探针和核酸引物。多核苷酸可包含非常见或修饰的核苷酸。
可操作连接:如本文所使用,“可操作连接”或“可操作联接”旨在表示介于两个或多个序列之间的功能性连接。例如,介于目标多核苷酸和调节序列(例如,启动子)之间的可操作联接是使得可表达目标多核苷酸的功能性连接。可操作联接的元件可以为相邻或非相邻。在此意义上,术语“可操作连接”是指在核酸分子中待转录的调节区和编码序列的定位,使得调节区有效地调节目标编码序列的转录或翻译。例如,为了可操作连接编码序列和调节区,编码序列的翻译阅读框架的翻译起始位点通常介于调节区的一个至约五十个核苷酸下游之间。然而,调节区可位于翻译起始位点的多达约5,000个核苷酸上游、或者转录起始位点的约2,000个核苷酸上游。当用于表示两个蛋白编码区的连接时,所谓“可操作连接”旨在表示编码区在相同翻译阅读框架中。当用于表示增强子的效果时,“可操作连接”表示:增强子增加特定目标多肽或多核苷酸的表达。在目标多核苷酸编码多肽处,产生的编码的多肽水平升高。
序列同一性的百分比:如本文所使用的与核酸序列或氨基酸序列相关的“序列同一性的百分比”或者“序列同一性%”是指当将两个序列最佳地比对时如与测试(“主题”)分子相比在参照(“询问”)分子的直线序列中相同核酸碱基或氨基酸残基的百分比。通过在由介于两个序列之间局部比对的长度限定的比较窗内比较两种最佳局部比对的序列来测定“序列同一性的百分比”。如与用于两个序列的最佳比对的参照序列(其不包含添加或缺失)相比较,在比较窗中氨基酸序列或核酸序列可包含添加或缺失(例如,缺口或突出物)。在两个序列之间的局部比对仅包括依据用于进行比对的算法(例如BLAST)的标准被认为充分类似的各序列的区段。通过测定相同核酸碱基或氨基酸残基出现在两个序列处位置的数目以得到相匹配的位置数目,将相匹配位置的数目除以在比较窗中位置的总数目,然后将结果乘以100来计算序列同一性的百分比。通过Smith和Waterman的局部同源性算法(Add.APL.Math.2:482,1981)、通过Needleman和Wunsch的全部同源性比对算法(J Mol.Biol.48:443,1970)、通过Pearson和Lipman的相似性方法检索(Proc.Natl.Acad.Sci.USA85:2444,1988)、通过这些算法的启发性实施(NCBI BLAST,WU-BLAST,BLAT,SIM,BLASTZ)、或者通过目视检查可进行用于比较的序列的最佳比对。为了本发明,使用BLASTX2.0版也可测定翻译的核苷酸序列的“同一性百分比”和BLASTN2.0版可测定多核苷酸序列的“同一性百分比”。鉴于已经识别用于比较的两序列,优选采用GAP和BESTFIT以测定它们的最佳比对。通常,使用5.00的缺口重量和0.30的缺口重量长度的默认值。在多核苷酸或多肽序列之间的术语“基本上序列同一性”是指与使用程序的参照序列相比包含具有至少50%序列同一性、优选至少70%、优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、和最优选至少96%、97%、98%或99%序列同一性的序列的多核苷酸或多肽。此外,如本文所使用的成对序列同源性或序列相似性是指在比对的两个序列之间相似的残基的百分比。已经在本领域中充分定义具有相似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯基丙氨酸、蛋氨酸、色氨酸)、β-支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(例如,酪氨酸、苯基丙氨酸、色氨酸、组氨酸)的氨基酸。
针对位于公共或专利数据库中主题核酸或氨基酸序列可检索询问核酸和氨基酸序列。使用美国国家生物技术信息中心(NationalCenter for Biotechnology Information)基本局部比对检索工具(BasicLocal Alignment Search Tool)(NCBI BLAST v2.18)程序可进行这些检索。NCBI BLAST程序可由美国国家生物技术信息中心网站上得到(blast.ncbi.nlm.nih.gov/Blast.cgi)。通常,可使用NCBI BLAST的以下参数:过滤器选项设置为“默认”;比较矩阵设置为"BLOSUM62”;缺口损失设置为“存在:11、延伸:1”;字号设置为3;预期值(E阈值)设置为1e-3;以及局部比对的最小长度设置为50%的询问序列长度。使用GenomeQuestTM软件(Gene-IT,Worcester Mass.USA)也可测定序列同一性和相似性。
害虫:如本文所使用,术语“害虫”或其语法等同形式理解为表示非所需有机体,其可包括但不限于通过寄居、攻击、侵扰、或传染它们来不利地影响植物和动物的细菌、真菌、植物(杂草)、线虫、昆虫、和其他致病性动物。因此,如本文所使用,术语“杀虫的”是指物质或组合物降低害虫(即,非所需有机体)生长速率的能力、或者增加害虫死亡率的能力。通过使用本领域已知的各种方法中任意一种,例如,通过定量在一段时间内生存害虫数目,能够定量害虫的生长速率。
如本文所使用,术语“杀螨的”、“杀蚜的”、“杀菌的”、“杀昆虫的”、“杀微生物的”或“杀线虫的”、或其语法等同形式理解为表示针对通过基础术语的分类学种类涵盖的有机体具有杀虫活性的物质或组合物以及也表示针对通过基础术语的口语用途涵盖的有机体具有杀虫活性的物质,其中口语用途可不严格遵循分类学种类。例如,术语“杀昆虫的”理解为表示针对通常已知为节肢动物门、昆虫纲的昆虫具有杀虫活性的物质。如本文所进一步提供,术语也理解为表示针对口语称为“昆虫”或“虫子”的其他有机体具有杀虫活性的物质,即使有机体可归类于不同于在分类学种类中的昆虫纲。根据该理解,鉴于术语“昆虫”的口语使用,术语“杀昆虫的”可用于表示针对蜘蛛(蛛形纲)具有活性的物质,特别是螨类(蜱螨/螨亚纲)。术语“杀螨的”理解为表示针对节肢动物门的螨类(蜱螨/螨目)、蛛形纲、蜱螨/螨亚纲具有杀虫活性的物质。术语“杀蚜的”理解为表示针对节肢动物门、昆虫纲、蚜科的蚜虫(蚜科)具有杀虫活性的物质。据理解,所有这些术语通过术语“杀虫的”或“杀虫剂”或者语法等同形式涵盖。也应理解,这些术语并不相互排斥,使得称为“杀虫剂”的物质可具有针对昆虫纲的任何科的有机体(包括蚜虫)、以及通过术语“昆虫”或“虫子”的其他口头使用涵盖的有机体(包括蜘蛛和螨类)。应理解,如果“杀虫剂”针对螨类具有杀虫活性,则“杀虫剂”也可称为“杀螨剂”,或者如果它们针对蚜虫具有杀虫活性,则称为杀蚜虫剂。
启动子:如本文所使用,“启动子”是在诸如植物细胞或微生物细胞的细胞中能够开始转录的核苷酸序列,以及能够推动或便于本发明的核苷酸序列或其片段的转录。这些启动子不需要具有微生物来源或植物来源。例如,来源于植物病毒的启动子(例如CaMV35S启动子)或者来源于根癌土壤杆菌(Agrobacterium tumefaciens)(例如T-DNA启动子)能够用于本发明的目的中。另一非限制性例子是tac启动子(参见例如,美国专利No.5,840,554),依照本发明在诸如荧光假单胞杆菌(Pseudornonas fluorescens)细胞的微生物宿主细胞中其可特别用于表达分子和序列。
多肽(与肽、蛋白也可交换使用):如本文所使用,术语“多肽”是指两个或多个亚单位氨基酸、氨基酸同源物、或其他拟肽类的化合物,无论其是否经翻译后修饰,例如磷酸化或糖基化。通过肽键或其他键可连接亚单位,例如,酯键或醚键。通过该定义涵盖全长多肽、截短的多肽、点突变体、插入突变体、剪接变体、嵌合蛋白、及其片段。
子代:如本文所使用,“子代”包括特定植物或植物系的后代。本植物的子代包括在F1、F2、F3、F4、F5、F6、和后代植物上形成的种子、或者在BC1、BC2、BC3、和后代植物上形成的种子、或者在F1BC1、F1BC2、F1BC3、和后代植物上形成的种子。名称F1是指通常不同的两个亲本之间杂交的子代。名称F2、F3、F4、F5和F6是指F1植物的自身或近缘授粉的子代的后代。
调节区:如本文所使用,术语“调节区”是指在给定宿主有机体中影响转录或翻译起始和速率、以及稳定性和/或转录或翻译产品的变异性的核苷酸序列。这些调节区可由异源性来源合成或得到。例如,在植物中使用的调节区不需要具有植物来源。调节序列包括但不限于启动子序列、增强子序列、应答元件、蛋白识别位点、诱导元件、蛋白结合序列、5'和3'非翻译区(UTR)、转录起始位点、终止序列、聚腺苷酸化序列、内含子、及其组合。调节区通常至少包含核心(基础)启动子。调节区也可至少包括一个控制元件,例如增强子序列、上游元件或上游激活区(UAR)。例如,合适的增强子是顺式调控元件(-212至-154),来自真蛸碱合酶(ocs)基因的上游区,其能够用于在植物细胞中推动生物毒素转基因的表达。
转基因有机体:如本文所使用,“转基因有机体”或“重组有机体”是指在它的基因组内包含异源性多核苷酸的有机体。通常,在基因组内稳定整合异源性多核苷酸,使得多核苷酸可传递至下一代。可将异源性多核苷酸单独或者作为重组表达盒的一部分整合至基因组内。本文所使用的“转基因”包括任何细胞、细胞系、愈伤组织、组织,其基因型由于异源性核酸的存在被改变。术语转基因包括由起始改变的那些转基因以及由起始转基因通过有性杂交或者无性繁殖生成的那些转基因。如本文所使用的术语转基因没有通过常见植物育种方法或者通过天然存在的事件,例如随机杂交受精、非重组病毒感染、非重组细菌转化、非重组转座、或自发突变来涵盖基因组(染色体或染色体外)的改变,
变体:当与多肽和核酸相关时,如分别与参照多肽或多核苷酸相比较,本文所使用的术语“变体”表示在它们碱基或氨基酸序列中具有合成或自然产生的一些差异的多肽、蛋白、或多核苷酸分子。例如,这些差异包括在参照多肽或多核苷酸中取代、插入、缺失或者这些改变的任意所需组合。多肽和蛋白变体可进一步由电荷改变和/或翻译后修饰(例如糖基化、甲基化、磷酸化等)组成。也通过本发明的组合物涵盖调节多核苷酸序列的“功能变体”。功能变体包括例如本发明的天然调节多核苷酸序列,其具有一个或多个核苷酸取代、缺失或插入以及在类似于天然启动子为活性的条件下其能够驱动可操作连接的多核苷酸序列的表达。通过定位诱变、诱发突变可生成本发明的功能变体,或者可作为等位变体(多态性)出现。当术语“变体”与微生物相关使用时,它通常是指具有它所属种类识别性特性、同时具有至少一种核苷酸序列变化或者相对亲本菌株可识别不同的特征的微生物菌株,其中该特征基于遗传(可遗传)。
载体:术语“载体”是指设计在不同宿主细胞之间转移的核酸构建体。如本文所使用,“载体”是指复制子,例如质粒、噬菌体、或粘粒,可向其内插入另外的DNA区段,从而使得插入的区段可复制。通常,当与合适控制元件缔合时,载体能够复制。因此,术语“载体”包括克隆载体和表达载体、以及病毒载体和整合载体。尤其,“表达载体”是包括调节区的载体,从而能够在宿主细胞(体内)中和/或无细胞环境(体内)表达DNA序列和片段。
只要各单独的出版物或专利申请具体和单独地指出通过引用方式并入,则在该说明书中提及的所有出版物和专利申请均以引用方式相同程度并入本文中。
本文没有承认任何参考文献构成现有技术。参考文献的讨论是引用它们作者陈述的意见,本申请人保留质疑所引用文件准确性和适当性的权利。应清楚了解,尽管本文中引用了大量现有技术出版物,但是该引用并未承认任何这些文件构成本领域常识。
本文给定的常见方法的讨论仅旨在示意目的。鉴于该公开,其他可选择方法和实施方案对于本领域普通技术人员显而易见。
染色体外遗传内容物和生物毒素
在细菌群体中存在的许多多样性存在于包括质粒和附加体的染色体外DNA内容物中。众所周知芽孢杆菌属菌株由于质粒内容物导致的菌株变化,特别是苏云金芽孢杆菌(“Bt”)。通过使用本发明的方法能够迅速发现杀昆虫的蛋白,例如主要在大的染色体外DNA分子上发现的苏云金芽孢杆菌δ-内毒素基因。而且,也已知许多梭菌属菌株具有大的染色体外质粒,并且已知这些质粒中一些含有致病因子和毒素,例如iota(ι)毒素(参见例如,Perelle等人,Infect.Immun.,61:5147-5156,1993;以及本文所引用的参考文献)。此外,已经显示,由于质粒内容物出现梭菌属菌株的多数变异性(参见例如,Katayam等人,Mol.Gen.Genet.250:17-28,1996)。因此,多种梭菌属菌株的染色体外DNA内容物解码会快速捕集大量遗传多样性。此外,已经报道在梭菌属中存在δ-内毒素基因同源物(Barloy等人,J.Bacteriol.178:3099-3105,1996)。
也已知许多微生物质粒含有致病因子,这对于细菌性病原体的传染性或严重程度很重要。因此,可能,许多通过质粒基因组表达的蛋白可具有疫苗的价值。例如,据报道,炭疽杆菌属的质粒pXO1和pXO2编码在炭疽感染时致病所需的蛋白。pXO2编码在细胞周围产生保护囊的蛋白。pXO1质粒编码炭疽毒素复合物、致死因子(LF)、水肿因子(EF)三种蛋白、和保护性抗原(PA)。PA蛋白(保护性抗原)形成炭疽疫苗的基础。细菌质粒的快速和有效解码会生成信息,由该信息人们可得到可用作有效疫苗的蛋白的数据库。
诱导肿瘤和共生的质粒在土壤杆菌属和根瘤菌属中常见(VanLarebeke等人,Nature,252:169-170,1974)。因此,细菌质粒(特别是来自已知植物病原体的那些)的解码可能识别在植物-病原体相互作用中包括的基因,该基因包括在毒力和无毒力中所涉及或需要的基因。
在非限制性示例中,通常在大的染色体外DNA分子上发现诸如苏云金芽孢杆菌δ-内毒素基因的杀虫蛋白。因此,来自芽孢杆菌属菌株(例如苏云金芽孢杆菌菌株)的染色体外DNA的分离和测序可能导致识别新型δ-内毒素基因。这些毒素基因对控制昆虫害虫极有价值。
苏云金芽孢杆菌是革兰氏阳性产芽胞土壤细菌。它的特征在于能够产生晶状内涵体,该晶状内涵体对某些昆虫目和种类具有特异性毒性,但是对植物和许多其他非靶向的有机体没有害处。常见深层发酵技术能够用于大量产生Bt孢子,这使得Bt细菌作为杀昆虫的组合物的来源很富商业潜力。包括苏云金芽孢杆菌菌株或它们的杀虫蛋白的组合物广泛地用作环境上可接受的杀虫剂以控制农业昆虫害虫或各种人或动物疾病的昆虫载体。
来自苏云金芽孢杆菌的晶体(Cry)蛋白(δ-内毒素)主要针对鳞翅目、双翅目、和鞘翅目幼虫具有强效杀虫活性。也已经报道,这些蛋白显示针对膜翅目、同翅目、虱目、食毛目、和蜱螨目害虫目类、以及其他无脊椎动物目类(例如线形动物亚门、扁形动物门、和肉鞭动物亚门(Sarcomastigorphora))的杀虫活性。目前有具有大量特异性和毒性的超过600种晶体蛋白的已知种类。这些晶体蛋白和对应的基因最开始主要根据它们结构和杀昆虫的谱系来分类(参见例如,Feitelson,Advanced Engineered Pesticides,编者Kim,L.,Marcel Dekker,Inc.,New York,N.Y.,pp.63-71,1993)。主要种类为鳞翅目-特异性(I)、鳞翅目-和双翅目-特异性(II)、鞘翅目-特异性(III)、双翅目-特异性(IV)、和线虫-特异性(V)和(VI)。蛋白被进一步分类为亚族;在各族内相关性更高的蛋白用分类字母命名,例如Cry1A、Cry1B、Cry1C等。给予在各分类内相关性甚至更紧密的蛋白名称,例如Cry1C1、Cry1C2。
最近命名是根据氨基酸序列同一性而不是昆虫靶特异性来描述Cry基因(Crickmore等人,Microbiol.and Mol.Bio.Reviews,62:807-813,1998)。在该分类中,各毒素命名为独特的名称,其并入第一排序(阿拉伯数字)、第二排序(大写字母)、第三排序(小写字母)、和第四排序(另一阿拉伯数字)。在新的分类中,在第一排序中罗马数字替代阿拉伯数字。具有小于45%序列同一性的蛋白具有不同的第一排序,而第二和第三排序的标准分别为78%和95%。
晶体蛋白通常没有表现出杀虫活性,直至它被消化和溶解在昆虫中肠中。消化的毒素原在昆虫消化道内通过蛋白酶类氢化成活性毒性分子。在靶幼虫的中肠中该毒素结合顶部刷状缘受体,并插入顶膜内,产生离子通道或小孔,使得幼虫死亡。
δ-内毒素通常具有五个保守序列结构域、和三个保守结构结构域(参见例如,de Maagd等人,Trends Genetics17:193-199,2001)。五个保守结构结构域由七个α螺旋组成以及包括膜插入和孔形成。结构域II由以希腊钥匙构象安排的三个β-折叠构成,以及结构域III以“果酱卷(jelly-roll)”形式由两个反平行β-折叠构成(de Maagd等人,2001,见上)。结构域II和III涉及受体识别和结合,因而被认为是对毒素特异性的决定因素。
除了δ-内毒素外,有许多其他已知种类的杀昆虫的和杀虫的蛋白毒素。在苏云金芽孢杆菌和蜡状芽孢杆菌中描述其他种类的杀虫蛋白,它们为植物杀虫蛋白或Vip蛋白。在植物生长中分泌Vip蛋白,而该蛋白没有表现出与Cry或Cyt的任何相似性。目前,所有已经描述的Vip相关序列归入三个不同家族,Vip1、Vip2、和Vip3。最近由苏云金芽孢杆菌命名委员会提出将这些蛋白分类为三个大类、七个子类、和更多亚类(Crickmore等人,2005,见www.lifesci.sussex.ac.uk/Home/Neil_Crickmore/Bt/)。Vip3蛋白具有不同的宿主范围,其包括多种主要的鳞翅目昆虫。类似于Cry毒素,在不同于通过Cry毒素识别的那些蛋白的特异性80-kDa和100-kDa膜蛋白的中肠上皮的表面处识别之前,必须通过蛋白酶类来激活Vip3A蛋白。最开始认为细胞凋亡是种活动方式,但是最近显示,类似于Cry毒素,激活的Vip3A毒素是能够在膜上形成稳定离子通道的成孔蛋白。Vip1和Vip2蛋白是对鞘翅目表现出毒性的二元毒素的两种组分。Vip1Aa1和Vip2Aa1通常对玉米根虫、特别是玉米根莹叶甲(Diabrotica virgifera virgifera)和长角黄瓜甲虫(Diabrotica longicornis)活性高。VIP1/VIP2毒素联合其他二元("A/B")毒素。通过相信包括受体介导的胞吞、之后的细胞毒化的机制,A/B毒素例如VIP、C2、CDT、CST、或炭疽杆菌水肿和致死毒素表现出对昆虫的强活性。
筛选方法的描述
本公开提供快速和有效识别和分离有用基因的整合的方法。本发明的一方面提供快速和高效识别在微生物中编码生物毒素的基因序列的方法。特别地,本方法使得可快速和有效地取样以及筛选目标新型序列的微生物的染色体外遗传内容物。本方法包括快速测序和特征化来源于微生物分离株的集合的染色体外DNA分子的混合群体。本方法靶向染色体外DNA以及避免重复的克隆和测序宿主染色体,从而使得人们可聚焦于通过染色体外DNA编码的基因,例如生物毒素。本方法包括:建立包括来源于染色体外DNA分子的混合群体的核苷酸序列的宏基因组数据集;针对已知序列处理和比较宏基因组数据集的注释的序列以识别新型核苷酸序列。在本发明的一些优选的方面中,在所有六个框架中可翻译经处理的DNA序列,并可针对已知蛋白序列来比较所得氨基酸序列。特别关注的微生物包括但不限于细菌、真菌、海藻等。
本文所述的整合的筛选方法可用于快速识别和克隆与已知基因具有同源性的新型基因。特别地,以上筛选方法可用于识别与已知基因具有较少同源性的新型基因,其通过诸如杂交的其他方法难以识别。
常见筛选工作流程由分离的微生物的集合生成开始,然后进行染色体外DNA的分离、高通量测序、序列阅读处理和组装。在序列数据采集和分析的过程中,根据序列阅读值、或者序列重叠群、或两者来命名基因。在该工作流程的多个阶段采用群体组合物分析(即宏基因组数据分析),通常需要数据库以便于分析。以下通过本公开详细描述该工作流程的所有步骤。
可由多种生态细胞中收集包括土壤、植物组织、昆虫和水样品的环境样品,该生态系统具有与靶作物具有系统发生相似性的天然植物。通过靶向寄居土壤、根际和叶隙中群体可在多阶段方法中进行植物相关的微生物的基于培养的分离。可单独地处理个别样品,可选择地,在进一步处理之前,将来自地理独特取样位置的多种样品收集至一起,使用单次分离事件其可特别地用于捕集在全部区域内微生物的多样性。在样品上可进行微生物细胞提取方法,然后为连续稀释和接种至高选择性显色培养基上,得到分离的苏云金芽孢杆菌(Bt)。Bt分离株可以为由菌落挑选、保存的、并且在制备的小体积培养物中单独生长用于染色体外DNA的随后提取。通过接种环境样品至各种富集物和分离培养基上和由已知档案通过基于它们的系统发育来选择特异性菌株以得到通常可由数百种单独分离培养物构成的复合培养物,可以类似的方式靶向非-Bt微生物的群体。然后可将大的构建体质粒提取试剂盒(QIAGEN,Inc.)用于由复合培养物中分离染色体外DNA。在本发明的一些实施方案中,可对QIAGEN推荐的工作流程进行修改以使得用于裂解革兰氏阳性细胞的裂解流程更加严格。然后可定量和制备具有最小基因组污染的所得纯化的染色体外DNA来用于下一次得到高通量测序。
由于通常可在复合培养物上进行染色体外DNA的提取,所得纯化的DNA样品是染色体外DNA的混合群体,该染色体外DNA通常来源于数百种个体分离株。
在分离之后,可对染色体外核酸的库进行高通量测序过程以生成宏基因组数据集。宏基因组序列数据的处理步骤可用于识别具有潜在目标活性的基因,该处理步骤包括组装、基因预测和注释。如以下详细所述,通过使用本发明的方法已经识别多种毒素基因,这些毒素基因属于Bt毒素的多种主要种类,包括Cry、VIP和Cyt基因。如在表1中所记载和序列表中所示,发现多种全长和部分新型编码生物毒素的基因,其中之前已经发现很多基因。
建立宏基因组序列数据集
宏基因组是当前发展最快的研究领域之一。术语来源于荟萃分析(统计上合并单独分析的过程)和基因组学(有机体的遗传物质的综合分析)的统计学概念。迄今为止,常见的宏基因组通常定义为对通过直接由环境样品或者相关样品系列获得的DNA应用高通量测序。某种程度上,常见宏基因组是微生物基因组的衍生,关键不同之处在于它绕过获得测序纯培养物的要求。此外,由团体而不是单独的个体获得样品。大体上,环境微生物群体的宏基因组分析可分成两个主要方法:宏基因组文库的基于功能和基于序列的筛选。两种筛选技术包括分离环境DNA和构建小-插入物或大-插入物文库(参见例如,Simon和Daniel,Appl.Environ.Microbiol.77:1153-1161,2011)。
尽管已经成功地使用宏基因组识别具有所需活性的酶,但它主要取决于环境DNA克隆文库的基于相对低通量功能的筛选或者基于测序的筛选。来自环境样品的完整基因的基于序列的宏基因组发现受到大部分环境的微生物种类复杂性和随后在低覆盖宏基因组组合的全长基因中的稀有性的限制。通过提供快速和有效捕集来自微生物基因组的遗传多样性以及识别商业目的新型序列的方法,而不需要克隆文库的劳动密集型构建或者测序微生物的完全基因组,根据本发明的一方面的整合的筛选方法提供该长期以来需求的解决方案。
本发明的一些实施方案涉及建立宏基因组序列数据集。如上所讨论,常见宏基因组通常定义为绕过获得测序用纯培养物的需求向直接由环境样品获得的DNA或者相关样品系列应用高通量测序。为了该申请,术语“宏基因组序列数据”是指来源于多种单独的微生物的随机取样的DNA序列数据。来自宏基因组序列数据集的序列数据通常分组至更大的重叠群内。通常,术语“重叠群”(来自“毗连”)是指共同表示核酸分子的共有区的一组重叠的核酸序列。在通常的基因组测序项目中,重叠群是指重叠序列数据(读数),其是由通过自底向上测序策略生成的小DNA片段的重新组装得到。该自底向上测序策略包括剪切基因组DNA成许多小片段(“底”)、测序这些片段、重新组装它们成重叠群内以及最终得到完全基因组(“上”)。因此,如本文所使用的术语“重叠群”是指延伸的毗连染色体外DNA,其包括多种重叠的读数。宏基因组数据集通常包括至少10Mbp、至少20Mbp、优选至少30Mbp、更优选至少40Mpb、和最优选至少50Mbp的短序列阅读数据,其随后可用于商业目的的基因和序列的在硅中序列挖掘,例如编码生物毒素的基因。
适合于实施本发明的方法的测序技术
通过使用各种技术可测定染色体外核酸分子的序列,特别是下一代高通量测序技术,其有时称为大规模并行测序技术。这些高通量测序技术是众所周知的以及描述在技术和科学文献中,例如,在Lin等人(Recent patents on Biomedical Engineering,1:60-67,2008)的综述中以及本文所引用的参考文献中。
在一些实施方案中,通过使用不需要分子克隆的直接测序工序可直接进行染色体外核酸分子的测序。尽管核酸分子的克隆相对直接,但核酸的直接测序通常消除亚克隆和生成许多鸟枪法文库的需要、最小化测序反应的数量、和显著加速获取序列信息和完整序列的组装。直接核酸测序的优势包括消除克隆假象以及文库或PCR反应的交叉污染。这对于生成紧密相关有机体的测序极其重要,这是由于它提供具有较少数目冗余测序反应的基因组的非偏见完整覆盖以及导致节约数据处理。核酸的直接测序的常见技术是本领域已知的。参见例如,Lin等人(2008,见上);Lilian等人,(Quarterly Rev.Biophysics,169-200,2002)。
通过多种常见测序方法之一也可进行染色体外核酸分子的测序。这些测序方法包括但不限于:常见基于凝胶的技术以及包括合成测序法(SBS)、连接测序法、杂交测序法的那些技术、和使用纳米晶体管阵列、扫描隧道显微镜、和纳米线分子传感器等的许多最新测序技术。
常见基于凝胶的技术本质上来源于由Sanger等人在1970年开发的方法(Sanger等人,1977),其包括通过链终止和凝胶分离来测序。在这些方法中,使用正常脱氧核苷三磷酸的‘终止子’-2',3'-双脱氧和阿拉伯核苷同源物用途来生成在各碱基处表示终止的核酸片段的混合群体。它们在电泳凝胶上运行,并且由凝胶中片段的顺序可“阅读”序列。通过Maxam和Gilbert(Proc.Natl.Acad.Sci.USA,1977)也开发出依赖在各碱基处核酸片段的化学降解的类似测序方法。
使用荧光团标记的、可逆-终止子核苷酸的合成测序法是合成测序法的最常见平台。它有时称为“荧光原位测序”(FISSEQ)。它通常包括以下这些步骤:使待测序的DNA附接固体表面,然后将可分裂的化学基团加入多聚酶和标记的核苷酸以帽接在脱氧核糖的3'-位置处的-OH基团,使得并入核苷酸而终止反应。由用于核苷酸的标记可阅读序列。焦磷酸测序技术是由Ronaghi等人开发的另一种SBS技术(Ronaghi等人,Anal.Biochem.242,1:84-9,1996;Ronaghi,Genome Res.11:3-11,2001)。简而言之,它基于在通过DNA多聚酶并入核苷酸之后释放无机PPi时在DNA合成时释放的焦磷酸盐(PPi)的检测。然后通过ATP硫酸化酶来转化释放的PPi。萤光素酶报道基因酶使用ATP以产生光,然后通过电荷耦合器件(CCD)照相机检测出该光。光信号与并入的核苷酸(例如A、TT、CCC等)的数量成比例,并且因为在测序周期中逐步加入G、A、T、和C核苷酸,所以容易得到DNA序列。焦磷酸测序已经发展为超高通量测序技术,其是多种技术的组合,例如连接光导纤维的携带沉积在微纤维皮升大小的反应池中的微小珠子的模板。基于焦磷酸测序技术的这些商业测序平台目前可市售,例如来自454Life Science/Roche Diagnostics的Genome Sequencer20System和Genome Sequencer FLX System;以及由VisigenBiotechnolgies Inc市售的“荧光共振能量转移(FRET)”技术(参见例如,美国专利申请No.US20070172869、US20070172860、和US200701728190。其他基于SBS的技术包括但不限于通过IntelligentBio-Systems Inc.(参见例如,欧洲专利申请No.EP1790736)市售的那些,Affymetrix Inc.(参见例如,美国专利申请No.US20070105131)也可使用。在本发明的一些实施方案中,特别优选来自Illumina Inc.的基因组AnalyzerTM系统(例如,美国专利申请No.US20077232656),其也是基于SBS技术。
本领域技术人员意识到,由模板DNA片段的两端点(也称为对端点、双端点或两端点的测序)生成序列数据以证实或帮助鸟枪法序列组装是有利的,并且通常是必要的。对端点测序也用于特征化基因组重排和插入和缺失,例如在癌症基因组特征化中。各种“两端点的测序”技术是众所周知的,例如在美国专利申请No.US20077244567、US20060024681、US20070172839、US20060292611、US20077270951、和US20077282337中描述的那些,并且这些技术可用于本发明的方法中。
在某些实施方案中,可使用基于聚合酶群落扩增(polonyamplificaiton)和FISSEQ的其他高通量测序方法。简而言之,聚合酶群落扩增是在薄聚丙烯酰胺膜上原位扩增DNA的方法。DNA运动限制在聚丙烯酰胺凝胶中,使得扩增的DNA位于凝胶中以及形成所谓“聚合酶群落”、多聚酶群落。至多五百万个聚合酶群落(即五百万次PCR)可在一片玻璃载玻片上。聚合酶群落测序方法的变化形式也可用于本发明的方法中,其包括聚合酶群落荧光-原位测序珠子和PMAGE(用于“基因表达的聚合酶群落多倍分析”,其联合聚合酶群落扩增和连接测序方法)。
也可用于本发明的操作的其他高通量测序技术、装置和系统包括涵盖纳米孔测序(参见例如,美国专利申请No.US20070190542、US20070042366、US20070048745、US20060231419、和US20070178507)、和杂交测序法(SBH)(参见例如,美国专利申请No.US20070178516、US20077276338、和US20060287833)的那些。
各种高通量连接测序法技术也可用于本发明的方法中。这些技术的例子包括但不限于“大规模并行签名测序”技术(参见例如,Brenner等人,Proc.Natl.Acad.Sci.USA,2000;美国专利申请No.US20006013445)。在该技术的一些版本中,通过乳化液多聚酶链反应将DNA分子平行扩增至微小珠子上。然后将数百万个珠子固定在聚丙烯酰胺凝胶中,并且使用连接测序法来测序。通过AppliedBiosystems/Life Inc.市售的装置和系统(例如SOLiD(Supported OligoLigation Detection))特别有用。也可使用最新版本,其基于联合乳化液PCR的类似的连接测序方法。
本领域技术人员意识到,部署用于产生更好质量组件和微生物宏基因组序列数据的注释的不同测序技术组合是有利的,并且通常是必要的。
用于分类识别的方法
一旦通过本发明所公开的筛选方法选择好微生物,则分类上识别它们通常是有益处的。本领域技术人员理解,通过各种技术可测定微生物分离株的系统分类,其包括但不限于:(1)杂交核酸探针至所述微生物分离株的核酸分子;(2)扩增所述微生物分离株的核酸分子;(3)免疫检测所述微生物分离株的分子;(4)测序来源于所述微生物分离株的核酸分子;或者两种或多种这些技术的组合。
因此,有机体识别可涉及达多种不同水平的分析,并且各分析可基于有机体的不同特征。这些分析可包括基于核酸的分析(例如,分析个别特异性基因,关于它们的存在或它们实际序列;或者表达特定基因或基因的家族)、基于蛋白的分析(例如,使用直接或间接酶测定法的功能水平、或者使用免疫检测技术的结构水平)等。
在进行单独的培养物的密集分子分析之前,它可用于证实微生物培养物来源单个细胞,因此它为纯的培养物(除此之外,如在本公开中其他处所讨论,将微生物有目的地混合)。可通常基于直接显微分析(确保在样品中所有细胞在检测时看起来相同)、染色特征、简单分子分析(例如简单的限制性酶切片段长度多态性(RFLP)测定)等区分微生物。然而,在本发明的某些实施方案中,因为在后续分析中混合的微生物培养物很明显,所以进行该纯度确认步骤不是绝对必要。
a.基于核酸的分析:在本发明的某些实施方案中,用于识别微生物所提供的方法包括由非常少量的细胞中扩增和测序基因。因此,所提供的方法克服了由稀释悬浮物中集中的细胞和它们DNA的问题。所提供的方法可用于通过基因序列识别细胞或者识别具有特定基因或基因家族的细胞。
术语“核酸扩增”通常是指在样品或样本中增加核酸分子拷贝数目的技术。用于核酸扩增的技术是本领域众所周知的。核酸扩增的例子是多聚酶链反应(PCR),其中在使得在样品中可杂交引物为核酸模板的条件下将由受试者中收集的生物样品接触一对寡核苷酸引物。在合适的条件下引物延伸,由模板离解,然后重新退火,延伸,和离解以扩增核酸拷贝的数目。体外扩增技术的其他例子包括链置换扩增;无转录的等温扩增;修复链反应扩增;连接酶链式反应;填缝连接酶链式反应扩增;偶联连接酶检测和PCR;以及无RNA转录的扩增。
除了本文提供的示意性例子引物之外,对于微生物单个种类或系统发生亲体,也已经设计引物、并在继续设计新的引物。通过本文描述的方法可使用这些窄靶向的引物以仅特异性筛选和/或识别目标微生物。
制备和使用核酸引物的方法描述在例如Sambrook等人(Molecular Cloning:A Laboratory Manual,CSHL,New York,1989)、Ausubel等人(编辑)(Current Protocols in Molecular Biology,John Wiley&Sons,New York,1998)中。例如,通过用于该目的的计算机程序,例如Primer(Whitehead Institute for Biomedical Research,Cambridge,Mass.)可由已知序列得到扩增引物对。本领域普通技术人员理解,特定探针或引物的特异性随着它长度增加而增加。因此,例如,包含编码rRNA的核苷酸或其侧翼区的30个连续核苷酸的引物退火靶序列,该靶序列比仅15个核苷酸的对应引物具有更高的特异性。因此,为了获得更高的特异性,可选择包含靶核苷酸序列的至少20、25、30、35、40、45、50个或更多连续核苷酸(例如16S rRNA)的探针和引物。
用于核酸应用(例如,PCR)的制备核酸常见技术包括苯酚/氯仿提取或者使用可由市场销售的许多DNA提取试剂盒中的一种。可扩增DNA的另一种方式是通过直接添加细胞至核酸扩增反应混合物以及依赖扩增的变性步骤以裂解细胞和释放DNA。
通过本领域众所周知的一种或多种标准技术可进一步特征化核酸扩增反应的产物,其包括电泳、限制性核酸内切酶切割模式、寡核苷酸杂交或者连接反应和/或核酸测序。当杂交技术用于细胞识别目的时,可使用各种探针标记方法,包括荧光标记、放射性标记和非放射性标记。
b.基于蛋白的分析:除了核酸的分析之外,直接基于特异性蛋白的存在(或缺乏)可特征化或识别使用本发明的方法选择的微生物。这些分析可基于指定的蛋白的活性,例如,通过酶测定法或者通过共同培养的有机体的应答、或者通过仅存在指定的蛋白(例如,其可通过使用免疫方法来测定,例如原位荧光免疫抗体染色)。
酶测定法:例如,荧光或显色底物同源物可并入生长培养基内(例如,微量滴定板培养物),然后孵育和筛选反应产物,从而基于酶活性来识别培养物。
协同培养应答:在本发明的一些实施方案中,基于协同培养的有机体(例如,报道基因有机体)的应答(或者应答程度)可测定通过微生物分离株携带的酶活性。
通过使至少一种抗体或抗体来源的分子结合分子、或者更特别地微生物的分子的表位,各种方法也可用于识别由来源环境选择和分离的微生物。
使用在包括Harlow和Lane(Antibodies,A Laboratory Manual,CSHL,New York,1988)的多篇文档中描述的标准工序可制备抗微生物蛋白抗体。通过使用或调整常规工序可容易地进行特定试剂基本上仅结合所需微生物蛋白的测定。一种合适的体外测定法利用Western印迹法(在许多标准文档中描述,包括Harlow和Lane;Antibodies,ALaboratory Manual,CSHL,New York,1988)。
抗体的较短片段(来源于抗体的分子,例如,FAb、Fv、和短链Fv(SCFv))也能够用作特异性结合剂。制备这些片段的方法为常规方法。
使用标准技术可进行在本发明的阵列上结合细胞的抗体的检测,例如提供可检测信号的ELISA测定法,例如荧光或发光信号。
本发明的多核苷酸和多肽
在本发明的另一方面中,本公开提供新型分离的核酸分子、干扰这些核酸分子的核酸分子、与这些核酸分子杂交的核酸分子、和由于DNA编码的简并性编码相同蛋白的分离的核酸分子。本申请的另外的实施方案进一步包括通过本发明的分离的核酸分子编码的多肽。
关于结构属性,例如核酸杂交另一核酸分子的能力、或者多肽通过抗体结合的能力(或者与这些结合的另外的分子竞争的能力),本发明的多核苷酸和多肽优选为“生物活性的”。可选择地,这些属性可以为催化性,因而包括分子介导化学反应或应答的能力。
本发明的多核苷酸和多肽也可以为重组的。如本文所使用,术语重组表示来自人对多核苷酸或多肽的操作或者由人对多核苷酸或多肽的操作产生(但是间接产生)的任何分子(例如DNA、肽等)。
本发明的核酸分子或其片段能够在某些条件下特异性杂交其他核酸分子。如本文所使用,据认为,如果两个核酸分子能够形成逆平行、双链核酸结构,则该两个分子能够彼此特异性杂交。据认为,如果核酸分子表现出完全的互补性,则它为另一核酸分子的“补体”。如本文所使用,据认为,当一个分子的每一核苷酸与其他核苷酸互补,则分子表现出“完全互补性”。如果至少在常见“低严格性”条件下两个分子能够以足以使得它们仍然能够彼此退火的稳定性彼此杂交,则认为它们为“最小互补的”。类似地,如果在常见“高严格性”条件下该分子能够以足以使得它们仍然能够彼此退火的稳定性彼此杂交,则认为它们为“互补的”。常见严格性条件由Sambrook等人描述在:MolecularCloning,A Laboratory Manual,第2版,Cold Spring Harbor Press,ColdSpring Harbor,N.Y.(1989);以及由Haymes等人描述在:Nucleic AcidHybridization,A Practical Approach,IRL Press,Washington,D.C.(1985)中。因此,允许偏离完全互补性,只要这些偏离不会完全排除分子形成双链结构的能力。因此,为了使本发明的核酸分子或片段用作引物或探针,仅需要序列足够互补以在采用的特定溶剂和盐浓度下能够形成稳定双链结构。
促进DNA杂交的合适严格性条件包括:例如,在约45℃下6.0X氯化钠/柠檬酸钠(SSC),然后为在约50℃下通过2.0X SSC洗涤。条件为本领域技术人员所已知,或者能够在Current Protocols inMolecular Biology,John Wiley&Sons,N.Y.6.3.1-6.3.6(1989)中找到。例如,在洗涤步骤中盐浓度可由在50℃下约2.0X SSC的低严格性至在50℃下约0.2X SSC的高严格性选择。此外,在洗涤步骤中温度可由在约22℃下室温的低严格性条件增加至在约65℃下的高严格性条件。温度和盐均可变化,或者温度或盐浓度可保持恒定,但其他变量可改变。
在优选的实施方案中,在中等严格性条件下,例如,在约2.0X SSC和约65℃下,本发明的核酸与在序列表中所示的一个或多个核酸序列或其补体特异性杂交。
在特别优选的实施方案中,本发明的核酸包括在高严格性的条件下与在序列表中所示的一个或多个核酸序列或其补体特异性杂交的那些核酸分子。
在另一实施方案中,本发明提供包含编码多肽的区域的核苷酸序列。编码的多肽可以为通过基因(通过多核苷酸表示)编码的完整的蛋白,或者可以为编码的蛋白的片段。优选地,本文提供的多核苷酸编码构成完整蛋白的基本上大部分、和更优选地构成完整蛋白的足够部分以提供相关生物活性的多肽。特别关注本发明的多核苷酸,其编码在生物毒素的制备中涉及的多肽。
本发明的核酸分子的亚型包括所公开的多核苷酸的片段,其由至少15个、优选至少16或17个、更优选至少18或19个、以及甚至更优选至少20个或更多连续核苷酸的寡核苷酸构成。这些寡核苷酸是具有在序列表中多核苷酸序列选择的序列的较大分子的片段,并且可用作例如用于检测本发明的多核苷酸的干扰分子、探针和引物。
在一些实施方案中,通过本发明也涵盖为这些编码毒素的核苷酸序列的片段的核酸分子。“毒素片段”旨在表示编码毒素蛋白的核苷酸序列的部分。核苷酸序列的片段可编码毒素蛋白的生物活性部分,或者它可以为使用以下所公开的方法能够用作杂交探针或PCR引物的片段。为毒素核苷酸序列的片段的核酸分子包含至少约50、100、200、300、400、500、600、700、800、900、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2150、2200、2250、2300、2350、2400、2450、2500、2550、2600、2650、2700、2750、2800、2850、2900、2950、3000、3050、3100、3150、3200、3250、3300、3350个毗连核苷酸、或者取决于特定用途在编码本文公开的核苷酸序列的全长毒素中存在的最大数目的核苷酸。术语“毗连核苷酸”旨在表示相邻紧密连接的核苷酸残基。本发明的核苷酸序列的片段编码保留毒素蛋白的生物活性、因而保留杀虫活性的蛋白片段。所谓“保留活性”旨在表示片段具有至少约30%、至少约50%、至少约70%、80%、90%、95%或更高毒素蛋白的杀虫活性。测定杀虫活性的方法是本领域众所周知的。参见例如,Czapla和Lang(J.Econ.Entomol.83:2480-2485,1990);Andrews等人(Biochem.J.252:199-206,1988);Marrone等人(J.of Economic Entomology78:290-293,1985);和美国专利No.5,743,477)。
编码本发明的蛋白的生物活性部分的编码毒素的核苷酸序列的片段编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100个毗连氨基酸、或者在本发明的全长毒素蛋白中存在的最大数目的氨基酸。在一些实施方案中,片段是溶蛋白性裂解片段。例如,相对于在序列表中示出的任何氨基酸序列,溶蛋白性裂解片段可具有至少约100个氨基酸、约120、约130、约140、约150、或约160个氨基酸的N-末端或C-末端截短。在一些实施方案中,本文所涵盖的片段由去除C-末端晶体结构域来产生,例如,通过蛋白酶解或者在编码序列中插入终止密码子。
本发明也关注本文所提供的多核苷酸的变体。这些变体可天然存在的变体,其包括来自相同或不同种类的同源性多核苷酸,也可以为非天然的变体,例如使用化学合成方法合成、或者使用重组DNA技术生成的多核苷酸。至于核苷酸序列,遗传密码的简并性提供使用不同碱基替代编码蛋白的基因序列的至少一个碱基、但不会导致待由基因产生的多肽的氨基酸序列被改变的可能性。因此,本发明的DNA也可具有通过依照遗传密码的简并性取代在序列表中由任何多核苷酸序列改变的任何碱基序列。容易公开得到描述密码子用途的参考文献。
熟练技术人员进一步理解,通过本发明的核苷酸序列的突变能够引入改变,从而导致编码的毒素蛋白的氨基酸序列的变化,而不改变蛋白的生物活性。因此,通过引入一个或多个核苷酸取代、添加、或缺失至对应的本文公开的核苷酸序列内能够产生不同的分离的核酸分子,使得可将一个或多个氨基酸取代、添加或缺失引入编码的蛋白内。通过标准技术能够引入突变,例如定位诱变或者PCR介导的诱变。通过本发明也涵盖这些不同的核苷酸序列。
例如,在一个或多个预测、非必需氨基酸残基处进行保守氨基酸取代。“非必需”氨基酸残基是由毒素蛋白的野生型序列改变、但不改变生物活性的残基,而生物活性需要“必需”氨基酸残基。“保守氨基酸取代”是使用具有相同侧链的氨基酸残基取代它的氨基酸残基的一种取代。在本领域中已经定义具有相同侧链的氨基酸残基的家族。这些家族包括具有碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯基丙氨酸、蛋氨酸、色氨酸)、β-支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(例如,酪氨酸、苯基丙氨酸、色氨酸、组氨酸)的氨基酸。
如本文其他处所讨论,δ-内毒素通常具有五个保守序列结构域、和三个保守结构结构域(参见例如,de Maagd等人,2001,见上)。第一保守结构结构域由七个α螺旋组成,并且包括膜插入和孔形成。结构域II由以希腊钥匙构象安排的三个β-折叠构成,以及结构域III以“果酱卷”形式由两个反平行β-折叠构成(de Maagd等人,2001,见上)。结构域II和III涉及受体识别和结合,因而被认为是对毒素特异性的决定因素。在保留功能的非保守区中可进行氨基酸取代。通常,保守氨基酸残基、或者位于保守基序内的氨基酸残基可进行这些取代,其中这些残基对蛋白活性为必需。保守和对蛋白活性为必需的残基的例子包括例如在本发明的氨基酸序列比对中包含的所有蛋白和已知毒素序列之间相同的残基。保守但允许保守氨基酸取代和仍然保留活性的残基的例子包括例如在本发明的氨基酸序列比对中包含的所有蛋白和已知毒素序列之间仅具有保守取代的残基。然而,本领域技术人员理解,在保守的残基中功能变体可具有最小保守或非保守改变。
可选择地,通过随机沿着部分或所有编码序列的突变,例如通过饱和诱变,可得到不同的核苷酸序列,并且可筛选所得突变体赋予毒素活性的能力,从而识别保留活性的突变体。在诱变之后,可重组表达编码的蛋白,并且使用标准测定法技术可测定蛋白的活性。
使用诸如PCR、杂交等的方法,可识别对应的毒素序列,这些序列与本发明的序列具有基本的同一性。参见例如,Sambrook和Russell(2001,见上)。
作为本文提供的多核苷酸的变体的本发明的多核苷酸通常证实与本文所提供的多核苷酸具有显著同一性。特别关注与本文所述的任何一个多核苷酸序列具有至少约50%序列同一性、至少约60%序列同一性、至少约70%序列同一性、至少约80%序列同一性、至少约85%序列同一性、和更优选至少约90%、95%或者甚至更高,例如96%、97%、98%或99%序列同一性的多核苷酸同源物。
熟练技术人员进一步理解,一旦识别新型毒素基因,则对应于新型毒素基因的核酸分子及其片段可用于识别微生物菌株或者分离株,其中染色体外遗传内容物天然包含与目标新型毒素基因的核酸序列相同的核酸序列。通过使用上述核酸分子或其片段能够容易地识别这些微生物菌株或分离株,从而筛选微生物群体。通过使用PCR或者基于DNA的杂交方法、基于抗体的杂交方法、以及其他众所周知的方法筛选细菌菌落是本领域常规的方法。
可采用本发明的核酸分子及其片段以得到相同种类的其他核酸分子。这些核酸分子包括具有蛋白的完整编码序列的核酸分子和启动子以及这些分子的侧翼序列。此外,这些核酸分子包括编码其他毒素的核酸分子或者基因家族成员。通过使用上述核酸分子或其片段能够容易地获得这些分子,从而筛选由产生毒素的微生物获得的cDNA文库或者染色体外DNA文库。生成这些文库的方法是本领域众所周知的。
也可采用本发明的核酸分子及其片段以得到核酸同源物。这些同源物包括在相同种类或其他有机体内不同等位基因的核酸分子,这包括全部或部分编码其他有机体的毒素蛋白同源物的核酸分子、诸如启动子和转录调控元件的遗传成分的序列。使用上述核酸分子或其片段能够容易地获得这些分子,从而筛选由这些微生物种类获得的cDNA文库或染色体外DNA文库。生成这些文库的方法是本领域众所周知的。因为稳定的杂交不需要完全互补性,所以这些同源性分子在它们核苷酸序列上可以不同于在序列表中一个或多个核苷酸或其补体中发现的那些核苷酸序列。因此,本发明的核酸分子也包括虽然能够特异性与核酸分子杂交但缺乏“完全互补性”的分子。在特定的实施方案中,3'或5'RACE的方法可用于获得这些序列。
本领域已知的各种方法中任意一种可用于获得一种或多种上述核酸分子。自动化核酸合成器可用于该目的。替代这些合成,所公开的核酸分子可用于限定引物对。使用多聚酶链反应能够使用该引物对,从而扩增和获得任何所需核酸分子或片段,这在本领域为标准。
而且,遗传密码的简并性也是本领域已知的,它使得不同的核苷酸序列可编码相同的蛋白或肽。
在本发明的方面中,由于在遗传密码中简并性,本发明的一种或多种核酸分子与编码毒素多肽或其片段的那些核酸分子在核苷酸序列上不同,该核苷酸序列选自在序列表中核苷酸序列,所以它们编码相同蛋白但是在核苷酸序列上不同。
本发明的另外进一步的方法也提供由于不同核苷酸序列编码具有一个或多个保守氨基酸残基的多肽的事实导致与编码毒素多肽或其片段的那些核酸分子在核苷酸序列上不同的一种或多种核酸分子,该核苷酸序列选自序列表中的核苷酸序列。应理解,能够编码这些保守取代的遗传密码子是本领域众所周知的。
本发明也提供通过本发明的多核苷酸编码的多肽。本领域中已知,在序列中一个或多个氨基酸可被其他氨基酸取代,它的电荷和极性与经取代的氨基酸类似,即保守氨基酸取代,这导致生物/功能沉默改变。在多肽序列内氨基酸的保守取代基可选自氨基酸所属种类的成员。氨基酸可分成以下四组:(1)酸性(带负电的)氨基酸,例如天冬氨酸和谷氨酸;(2)碱性(带正电的)氨基酸,例如精氨酸、组氨酸、和赖氨酸;(3)中和极性氨基酸,例如丝氨酸、苏氨酸、酪氨酸、天冬酰胺、和谷氨酰胺;以及(4)中和非极性(疏水性)氨基酸,例如甘氨酸、丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯基丙氨酸、色氨酸、半胱氨酸、和蛋氨酸。
通过取代在这些组之一内的一个氨基酸为在相同组内另一氨基酸可得到在天然多肽的序列内的保守氨基酸改变。本发明的多肽或其片段的生物功能等同物可具有约10个或更少的保守氨基酸改变、优选约7个或更少的保守氨基酸改变、以及最优选约5个或更少的保守氨基酸改变。在本发明的优选的实施方案中,多肽具有介于约5至约500个保守改变,更优选地介于约10至约300个保守改变,甚至更优选地介于约25至约150个保守改变,以及最优选为介于约5至约25个保守改变或者介于1至约5个保守改变。因此,编码核苷酸序列具有相应的碱基取代,这使得它可编码本发明的蛋白或片段的生物功能等同形式。
在本发明的另一方面中,生物毒素多肽也涵盖在本发明内。在该方面的实施方案中,所谓“生物毒素多肽”旨在表示氨基酸序列的多肽,其具有包含在序列表中所示任意一个氨基酸序列。在一些实施方案中,通过核酸分子来编码生物毒素多肽,该核酸分子包括:与在序列表中任意一个核苷酸序列对应的核酸序列;或者在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段。在一些实施方案中,生物毒素多肽表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性。
如在本文其他处更详细所述,当在重组有机体中表达或者控制害虫有机体时,生物毒素多肽能够有效地例如赋予这些有机体杀虫活性。这些生物毒素多肽通常包含表现出杀虫活性的至少一个结构域。申请人在本文描述的生物毒素多肽中已经鉴定出的表现出杀虫活性的Pfam结构域的例子包括内毒素_M(PF00555)结构域(参见例如,Li等人,Nature353:815–21,1991;Cygler等人,J.Mol.Biol.254(3):447–464,1995;Ghosh等人,Acta Crystallogr.D57:1101–1109,2001);蓖麻毒_B_凝集素(PF00652)结构域、气单胞菌溶素(PF01117)结构域(参见例如,Howard等人,J.Bacteriol.169:2869–71,1987;Parker等人,Nature367:292–5,1994);Bac_thur_毒素(PF01338)结构域(参见例如,Li等人,J.Mol.Biol.257:129-152,1996);ETX_MTX2(PF03318)结构域(参见例如,Thanabalu等人,Gene170:85-89,1996;Petit等人,J.Biol.Chem.276:15736-15740,2001);CBM_6(PF03422)结构域(参见例如,Henshaw等人,J.Biol.Chem.279:21552–21559,2004);二元_toxB(PF03495)结构域(参见例如,De Haan等人,Mol.Membr.Biol.21:77–92,2004;Perelle等人,Infect.Immun.61:5147–56,1993);ADPrib_exo_Tox(PF03496)结构域(参见例如,De Haan等人,2004,见上;Perelle等人,1993,见上);内毒素_C(PF03944)结构域(参见例如,Li等人,1991,见上;Cygler等人,1995,见上;Ghosh等人,2001,见上);内毒素_N(PF03945)结构域(参见例如,Li等人,1991,见上;Cygler等人,1995,见上;Ghosh等人,2001,见上);毒素_10(PF05431)结构域(参见例如,Humphreys等人,J.Invertebr.Pathol.71:184-185,1998);肉毒杆菌_HA-17(PF05588)结构域(参见例如,Hutson等人,J.Biol.Chem.271:10786-10792,1996);CryBP1(PF07029)结构域(参见例如,Dervyn等人,J.Bacteriol.177:2283-2291,1995;Zhang等人,J.Bacteriol.179:4336-4341,1997);PA14(PF07691)结构域(参见例如,Rigden等人,Trends Biochem.Sci.29:335-339,2004);和Fve(PF09259)结构域(参见例如,Paaventhan等人,J Mol Biol.332:461-470,2003)。具体Pfam结构域的更加详细描述可在各种信息来源处找到,例如www.sanger.ac.uk或者“pfam.janelia.org”。而且,预测包含一种或多种指示性Pfam结构域的具体多肽更加详细描述在所附序列表中。因此,基于它们与已知序列的相似性,在序列表中生物毒素序列的各种实际应用对于本领域技术人员显而易见。
也提供片段、生物活性部分及其变体,并且它们可用于实施本发明的方法。“片段”或“生物活性部分”包括包含与在序列表中所示的任意一个氨基酸序列具有充分同一性的氨基酸序列的多肽片段,并且该多肽片段表现出杀虫活性。毒素蛋白的生物活性部分可以为长度为例如,10、25、50、100或更多个氨基酸的多肽。通过重组技术可制备这些生物活性部分,并且这些生物活性部分可用于评估杀虫活性。测定杀虫活性的方法是本领域众所周知的。参见例如,Czapla和Lang J.Econ.Entomol.83:2480-2485(1990);Andrews等人,Biochem.J.252:199-206(1988);Marrone等人,J.of Economic Entomology78:290-293(1985);WO2011009182A2;和美国专利No.5,743,477。如在此所使用,片段包含在序列表中所示的任意一个氨基酸序列的至少8个毗连氨基酸。然而,本发明涵盖其他片段,例如在大于约10、20、30、50、100、150、200、250、300、350、400、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、或者1300个氨基酸的蛋白中的任意片段。
如本文中其他处所描述,所谓“变体”旨在表示具有与在序列表中所示的任意一个氨基酸序列具有至少约60%、65%、约70%、75%、约80%、85%、约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列的蛋白或多肽。变体也包括通过核酸分子编码的多肽,在严格性条件下该核酸分子与具有核苷酸序列的核酸分子杂交,该核苷酸序列包含序列表的任意一个核苷酸序列、或其补体。变体包括由于诱变在氨基酸序列上不同的多肽。通过本发明涵盖的变体蛋白具有生物活性,即,它们继续具有天然蛋白的所需生物活性,其仍然具有杀虫活性。测定杀虫活性的方法是本领域众所周知的。参见例如,Czapla和Lang(1990,见上);Andrews等人,Biochem.J.(1988,见上);Marrone等人,(1985,见上);PCT公开No.WO2011009182A2;以及美国专利No.5,743,477。
改变或改善的变体
据预计,通过各种方法可改变毒素的DNA序列,以及这些改变可导致编码蛋白的DNA序列与通过本发明的毒素编码的DNA序列在氨基酸序列上不同。以包括氨基酸取代、缺失、截短、和插入在序列表中所示序列的一个或多个氨基酸可改变该蛋白,其包括至多约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130个或更多氨基酸取代、缺失或插入。
这些操作的方法是本领域通常已知的。例如,通过在DNA中突变可制备毒素蛋白的氨基酸序列变体。通过多种诱变之一和/或在直接进化中也可完成这点。在一些方面中,在氨基酸序列中编码的改变基本上不会影响蛋白的功能。这些变体具有所需杀虫活性。然而,应理解,通过在本发明的组合物上使用这些技术可改善赋予杀虫活性的毒素的能力。例如,人们可在在DNA复制时表现出碱基错掺的高速率的宿主细胞中表达毒素,例如XL-1Red(Stratagene)。在这些菌株中繁殖之后,人们可分离毒素DNA(例如通过制备质粒DNA、或者通过PCR扩增和克隆所得PCR片段至载体内);在非诱变菌株中培养毒素突变;以及例如通过进行测试杀虫活性的测定法来识别具有杀虫活性的毒素基因。
可选择地,在基本上没有影响活性下,在氨基或羧基端可进行许多蛋白的蛋白序列的改变。这可包括通过例如PCR的现代分子方法引入的插入、缺失、或改变,该PCR包括借助于在PCR扩增中利用的寡核苷酸中并入氨基酸编码序列来改变或延伸蛋白编码序列的PCR扩增。可选择地,加入的蛋白序列可包括全部蛋白编码序列,例如本领域通常使用的那些序列以产生蛋白融合。这些融合蛋白通常用于:(1)增加目标蛋白的表达;(2)引入结合结构域、酶活性、或表位以促进蛋白纯化、蛋白检测、或本领域已知的其他实验用途;(3)靶向分泌或翻译蛋白至亚细胞器,例如革兰氏阳性细菌的细胞周质间隙、或者真核细胞的内质网,后者通常导致蛋白的糖基化。
本发明的变体核苷酸和氨基酸序列也涵盖来源于诱变和重组发生工序的序列,例如DNA改组。使用这些工序,一个或多个不同毒素蛋白编码区可用于生成具有所需性质的新的毒素蛋白。以这种方式,由相关的序列多核苷酸的群体生成重组多核苷酸的文库,该相关的序列多核苷酸包括具有基本序列同一性和能够体外或体内同源性重组的序列区域。例如,使用该方法,可将编码目标结构域的序列基序在本发明的毒素基因和其他已知毒素基因之间改组,从而获得新的编码具有改善目标性质(例如改善的杀虫活性)的蛋白的基因。这些DNA改组的策略是本领域已知的。
结构域切换或改组是生成改变的δ-内毒素蛋白的另一种机制。可将结构域II和III在δ-内毒素蛋白之间交换,这导致杂交或具有改善杀虫活性或靶谱系的嵌合毒素。生成重组蛋白和测试它们的杀虫活性的方法是本领域众所周知的。
熟练技术人员进一步理解,各种本领域众所周知的方法任一种可用于获得一种或多种上述多肽。可化学合成本发明的多肽,或者可选择地,可在诸如大肠杆菌、酵母、昆虫等的异源性表达体系中使用标准重组技术制备多肽。
细菌基因通常具有接近开放阅读框架起始处的多种蛋氨酸起始密码子。通常,在一个或多个这些起始密码子处翻译起始会导致生成功能蛋白。这些起始密码子可包括ATG密码子。然而,诸如芽胞杆菌属的细菌也识别密码子GTG作为起始密码子,并且在GTG密码子处开始翻译的蛋白在第一个氨基酸处包含蛋氨酸。而且,通常不事先测定这些密码子中何者在细菌中天然使用。因此,应理解,使用可替换蛋氨酸密码子之一也可导致生成编码杀虫活性的毒素蛋白。在本发明中涵盖这些毒素蛋白以及在本发明的方法中可使用这些毒素蛋白。
在序列表中信息
该说明书包含使用Patentln Version3.5得到的核苷酸和多肽序列信息。注释在序列表中所提供的生物毒素序列以标示各自序列的一个或多个已知同源物。一些序列包含"pfam"结构域,其表现出特定应用。通过各种来源更加详细地描述具体的pfam结构域,例如“www.sanger.ac.uk”或“pfam.janelia.org”。因此,基于它们与已知序列的相似性,在序列表中生物毒素序列的各种实际应用对本领域技术人员显而易见。
注释在序列表中所提供的生物毒素序列以标示各自序列的一个或多个已知同源物。一些序列包含"pfam"结构域,其表现出杀虫活性。申请人在本文描述的生物毒素多肽中已经鉴定出的表现出杀虫活性的Pfam结构域包括内毒素_M(PF00555)结构域、蓖麻毒B凝集素(PF00652)结构域、气单胞菌溶素(PF01117)结构域、Bac_thur_毒素(PF01338)结构域、ETX_MTX2(PF03318)结构域、CBM_6(PF03422)结构域、二元_toxB(PF03495)结构域、ADPrib_exo_Tox(PF03496)结构域、内毒素_C(PF03944)结构域、内毒素_N(PF03945)结构域、毒素_10(PF05431)结构域、肉毒杆菌_HA-17(PF05588)结构域、CryBP1(PF07029)结构域、PA14(PF07691)结构域、和Fve(PF09259)结构域。在序列表中一些生物毒素序列在具有各自序列的有价值应用(例如,赋予有机体杀虫活性、或者控制害虫有机体)的“其他特征”部分注释。因此,基于它们与已知序列的相似性,在序列表中生物毒素序列的各种实际应用对于本领域技术人员显而易见。
序列应用的另外的信息与公开数据库中序列具有相似性。标记"NCBI GI:"和"NCBI Desc:"的序列表的“其他特征”部分项目提供关于各序列的另外的信息。在一些情况下,可由www.ncbi.nlm.nih.gov检索到的相关的公开记录引用具有表现出注释的序列的用途数据的出版物。
由序列表的公开,可看到,取决于各单独的序列,本发明的核苷酸和多肽有时用于制备具有诸如杀虫活性的一种或多种改变的特性的转基因有机体。本发明进一步涵盖编码上述多肽的核苷酸,以及基于遗传密码的简并性其包括其可选择物,该上述多肽例如在序列表中包括的那些、及其补体和/或片段。
本发明的一些方面涉及分离和识别编码生物毒素的新型核苷酸序列的整合的方法。所谓“新型核苷酸序列”旨在表示与用于比较的数据库中任何序列具有小于约30%序列同一性、优选小于约60%序列同一性、更优选地小于约80%序列同一性、最优选小于约90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性的核苷酸序列。
也涵盖本发明的多肽、或其变体或片段的抗体。制备抗体的各种技术和方法是本领域众所周知的(参见例如,Harlow和Lane(1988)Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,ColdSpring Harbor,N.Y.;美国专利No.4,196,265),以及可用于制备根据本发明公开的抗体。
本发明方法的使用
本文描述的方法用于生成大的宏基因组序列数据集,其包含具有商业价值的基因序列。对细菌具有特异性的染色体外核酸的分离和测序具有优于目前基因识别方法的多种优势。首先,因为通过DNA序列识别基因,所以该方法更加可能识别与通过杂交可容易实现的已知基因具有较低DNA相似性的基因。其次,因为微生物菌株的染色体外基因组是总基因组大小的一部分(1-20%),所以可以快速取样许多相关或不相关细菌的染色体外基因组、和快速识别感兴趣的基因。再次,因为由于在染色体外遗传内容物中的差异导致的许多菌株间变异存在,所以该方法对捕集在细菌组中主要多样性差异非常有效。而且,该方法的效率随着存在的序列数据集的大小增加而增加。对于任何给定微生物,当检测的新型克隆物的百分比由50%降低至1%时,相对于测序完全基因组(对于15kb插入大小),本文公开的方法的效率可由3倍增加至16倍。
尽管本文仅描述具体细菌种类,但应理解,本发明的方法实际可应用至包含染色体外DNA的所有微生物,这就包括细菌和真菌种类。可由这些微生物分离染色体外DNA以及根据本发明的方法利用染色体外DNA以识别新型毒素基因。而且,应理解,不一定需要分离和/或纯化微生物细胞以分离和分析它的染色体外DNA内容物;即可将该方法用于来自混合群体、或者未知来源(例如环境样品)的样品。
因此,本发明的一些实施方案提供筛选具有毒素活性的编码多核苷酸的分子的微生物的混合群体、富集的样品、或其分离株的新型体系,只要微生物样品、菌株、或分离株至少包含通过染色体外DNA携带的毒素基因。本发明的方法使得可体外发现新型毒素分子,尤其是来源于未培养或培养的样品的新型毒素分子。使用本发明的方法能够分离、测序和筛选染色体外DNA的大的群体。如果需要,本发明的方法使得可由大量环境样品中体外筛选和识别多核苷酸和通过这些多核苷酸编码的多肽。
在另一实施方案中,在单独的提取之后可将多种分离株的染色体外核酸混合以得到适合于后续测序、组装、注释、和基因识别的染色体外核酸的群体。可选择地,在DNA提取步骤之前可合并多种微生物分离株,这也最终产生染色体外核酸的群体。可将两个或多个染色体外核酸群体混合或合并以获得染色体外核酸的混合群体。
由其可分离染色体外DNA的微生物包括诸如真细菌类和古生菌纲的原核微生物、更低级的真核微生物,例如真菌、藻类和原生动物门。微生物可以为由环境样品获得的培养的微生物或者未培养的微生物,并且其包括嗜极生物,例如嗜热细菌、超嗜热细菌、嗜冷生物和耐冷生物。特别关注包括但不限于以下细菌种类:芽孢杆菌属、短芽孢杆菌属、梭菌属、类芽孢杆菌属、光杆状菌属、假单胞菌属、沙雷氏菌属、链霉菌属、或致病杆菌属。
在一个特定非限制实例中,通常在大的染色体外DNA分子中发现诸如苏云金芽孢杆菌δ-内毒素基因的杀虫蛋白,因而通过使用本文公开的筛选方法可快速发现它们。因此,由诸如苏云金芽孢杆菌的芽孢杆菌属微生物的染色体外DNA分离和测序可能导致识别新型δ-内毒素基因。这些基因可用于开发控制昆虫害虫的新型组合物和方法。此外,也已知许多梭菌属微生物具有大的染色体外质粒,并且已知这些中一些包含致病因子以及诸如iota毒素的毒素(参见例如,Perelle等人,Infect.Immun.1993)。而且,显示,由于质粒内容物,梭菌属微生物的大量基因变化性会出现(参见例如,Katayam等人,Mol.Gen.Genet.1996)。通过本发明人涵盖,本文公开的方法能够用于筛选多种梭菌属分离株的染色体外DNA内容物,从而快速捕集大量遗传多样性。此外,已经报道在梭菌属中出现δ-内毒素基因的同源物(Barloy等人,J.Bacteriol.1996)。因此,依照本发明的筛选方法的应用也可用于识别在该种类的细菌中新型生物毒素基因。
此外,在土壤杆菌属和根瘤菌属微生物中诱导肿瘤和共生的质粒常见(例如,Van Larebeke等人,Nature1974)。因此,用于测序诱导细菌肿瘤和共生的质粒、特别是已知植物病原体的那些的依照本发明的筛选方法的应用可能识别在植物-病原体相互作用中涉及的新型基因,包括在毒力和无毒力中需要所涉及的基因。
使用本文所提供的方法可编码微生物的染色体外DNA内容物,该微生物的进一步的例子包括细菌沙雷氏菌属的种类,其中已知例如嗜线虫沙雷氏菌的pADAP质粒和变形斑病沙雷氏菌的pU143质粒的染色体外DNA包含毒力相关的区域(参见例如,Hurst等人,Plasmid,2011;Hurst等人,J.Bacteriol.2000)。在嗜线虫沙雷氏菌的pADAP质粒的毒力编码区内,称为sepABC的至少一个基因簇对于嗜线虫沙雷氏菌致病性很重要。Sep蛋白是杀虫蛋白的毒素复合物(Tc)家族的成员,其首先在线虫相关的细菌发光光杆状菌中识别。三种Tc蛋白Tc-A、Tc-B和Tc-C通常联合形成具有杀虫活性的复合物。第二pADAP毒力编码区包含18ORF,它的翻译产品与寄居在杀昆虫的细菌发光光杆状菌TTO1的基因组中的光杆状菌属毒力盒(PVC)相似。因此,本发明人也预期,依照本发明的筛选方法解码沙雷氏菌属细菌的染色体外遗传内容物的应用可识别在杀虫活性以及毒力和无毒力中涉及或需要的新型序列。
而且,在细菌群体中存在的许多多样性呈现在包括质粒的染色体外DNA内容物上。已知许多微生物质粒包含致病因子,这对通过细菌病原体的传染性或传染严重程度很重要。相应地,通过质粒基因组表达的许多蛋白可能具有作为疫苗的价值。例如,在炭疽感染时炭疽杆菌属的质粒pXO1和pXO2编码致病需要的蛋白。例如,pXO2编码在细菌周围产生保护囊的蛋白。pXO1质粒编码炭疽毒素复合物、致死因子(LF)、水肿因子(EF)三种蛋白、和保护性抗原(PA)。PA蛋白(保护性抗原)形成炭疽疫苗的基础。本申请人预计,通过使用本文公开的筛选方法快速和有效测序会生成信息,由该信息人们可得到可用作疫苗的蛋白的数据库。
本发明的分子的使用
在本发明的一方面中,人们可使用许多已知方法中一种以识别与目标多核苷酸序列相邻的DNA序列。例如,人们可进一步识别在微生物细胞中自然围绕新型多核苷酸序列的基因组区。通过生成杂交探针和筛选存在的染色体外DNA的文库,人们可完成这点。可选择地,人们可生成较大插入物的文库(例如粘粒文库)以及筛选可能包含与新型目标多核苷酸序列相邻的DNA的克隆物。例如,通过反向PCR人们可克隆和测序与已知DNA侧翼连接的区域(Sambrook和Russell,见上)。另外这些方法包括连接已知序列的接头至使用限制性内切酶消化的染色体外DNA,然后使用与寡聚接头同源的寡核苷酸和目标区同源的寡聚物生成PCR产物(例如本发明的新型多核苷酸序列的端序列。进行该工序的试剂盒(GENOMEWALKERTM,Clonetech)可市售。
例如,在杂交的工序中,所有的或者一部分的编码毒素的核苷酸序列能够用于筛选cDNA或基因组文库。构建这些cDNA和基因组文库的方法在本领域通常已知,并公开在Sambrook和Russell(2001,见上)中。所谓的杂交探针可以为基因组DNA片段、cDNA片段、RNA片段、或其他寡核苷酸,以及可以使用诸如32P的可检测基团或者任何其他可检测标志物,例如其他放射性同位素、荧光化合物、酶、或酶辅助因子,来标记该杂交探针。基于本文公开的已知编码毒素的核苷酸序列,通过标记合成寡核苷酸可制备用于杂交的探针。另外可使用基于在核苷酸序列或编码的氨基酸序列中保守核苷酸或氨基酸残基设计的简并的引物。探针通常包含在严格性条件下与本发明的编码毒素的核苷酸序列或其片段或变体的至少约12、至少约25、至少约50、75、100、125、150、175、200、250、300、350、或400个连续核苷酸杂交的核苷酸序列的区域。制备用于杂交的探针的方法通常是本领域已知的,并且公开在通过引用方式并入本文中的Sambrook和Russell(2001,见上)中。
使用探针将与它的靶序列杂交至大于其他序列可检测程度(例如,通常超过背景的至少2倍)的杂交条件可进行这些序列的杂交。杂交条件为序列依赖性,并且在不同情况下不同。通过控制杂交的严格性和/或洗涤条件,能够识别与探针100%互补的靶序列(同源性探测)。可选择地,可调节杂交条件以允许序列中一些错配,从而检测较低程度的相似性(异源性探测)。通常,探针的长度小于约1000个核苷酸,优选小于500个核苷酸,更优选小于200个核苷酸,以及更优选小于100个核苷酸。
尽管所得序列的许多商业用途由直接检查所得序列可明显看到,但人们可进行另外的步骤来识别所得序列或基因的进一步的商业用途。
赋予作物对害虫的抵抗力
在本发明的另一方面中,提供生成转基因有机体的方法,特别是表达具有杀虫活性的毒素的转基因植物,该方法通常包括引入核酸构建体至有机体内。例如,所谓“引入”旨在表示以构建体进入植物细胞内部的方式提供核酸构建体给植物。本发明的方法不要求使用引入核酸构建体至植物的特定方法,仅要求构建体进入植物的至少一个细胞内。可利用以下通过示例方式详细描述的方法以生成转基因植物,但是本发明不严格要求如何生成转基因植物细胞的方式。
本发明的转基因植物可表达本文公开的一个或多个杀虫的序列。在各实施方案中,转基因植物进一步包含昆虫抵抗力的一种或多种另外的基因,例如,控制鞘翅目、鳞翅目、异翅目、或线虫的一种或多种另外的基因。本领域技术人员应理解,转基因植物可包含赋予目标农学特征的任何基因。
引入核酸构建体至植物的各种方法是本领域已知的,它们包括但不限于稳定转化方法、瞬时转化方法、和病毒介导的方法。通过本领域描述的常见方法可随后分离表达毒素的植物,例如通过转化愈伤组织、选择转化的愈伤组织、和由这些转基因愈伤组织再生可育植物。在这些过程中,人们可使用任何基因作为可选择的标志物,只要在植物细胞中它的表达赋予识别或选择转化的细胞的能力。
表达载体
通过本发明的核酸分子编码的一种或多种多肽或其片段可在转化的细胞或转化的有机体中表达。例如,为了使用本发明的序列、或者它们或部分的组合和/或它们的突变体和/或融合体和/或变体,可制备重组核酸构建体,其包含插入载体的本发明的多核苷酸序列,并且其适合于转化植物细胞。使用标准重组DNA技术可制备构建体,并且通过土壤杆菌属介导的转化或者通过如下所引用的其他转化方法可将该构建体引入目标种类中。此外,可将本发明的微生物毒素序列修饰或密码子优化以得到或增强在诸如植物细胞的宿主细胞中对应多肽的表达。通常,表达这些毒素多肽的构建体含有驱动基因转录的启动子、以及使得转录终止和聚腺苷酸化的3'非翻译区。这些构建体的有机体是本领域众所周知的。在一些情况下,可用于工程化基因,使得分泌所得的肽,或者在植物细胞内靶向所得的肽。例如,可将基因工程化以包含信号肽,从而促进肽转移至内质网。也可优选工程化植物表达盒以包含内含子,使得表达需要内含子的mRNA处理。
载体主链可以为在本领域中使用的常见那些中任一种,例如例如质粒、病毒、人工染色体、BAC、YAC、PAC和载体,例如,细菌-酵母菌穿梭载体、λ噬菌体载体、T-DNA融合载体和质粒载体。
通常,构建体包含含有本发明的核酸分子的载体,该核酸分子具有任何所需转录和/或翻译调节序列,例如,启动子、UTR、和3'端终止序列。载体也可包括例如复制起点、核骨架附着区(SAR)、标志物、同源性序列、和内含子。载体也可包含赋予植物细胞可选择表型的标志物基因。标志物可优选编码杀菌剂抗性特征,特别是抗生素抗性,例如对诸如卡那霉素、博来霉素、或潮霉素抗性,或者除草剂抗性,例如对诸如甘草膦、氯磺隆或草铵膦抗性。
在一些情况下,重组DNA构建体可包括加入编码蛋白的DNA片段的异源性转录信号和/或翻译起始信号,从而使得随后可转录和翻译此类DNA片段。通过包括在本领域中常见的那些的各种技术可达到新的转录和翻译信号的加入。例如,基于PCR的方法或者标准重组DNA克隆技术可用于添加转录起始信号,以及框内加入新的ATG起始密码子至DNA片段的蛋白编码区。
应理解,多于一个调节区可存在于重组载体,例如,启动子、内含子、增强子、上游激活区、转录终止子、和诱导元件。例如,合适的增强子是来自真蛸碱合酶(ocs)基因的上游区的顺式调控元件(-212至-154)。Fromm等人,Plant Cell1:977-984(1989)。因此,多于一个调节区能够可操作连接目标核酸序列。
在本发明中可使用启动子,已知或发现在诸如植物细胞或微生物细胞的宿主细胞中该启动子导致DNA转录。这些启动子可由各种来源获得,例如微生物、植物和植物病毒。优选地,选择的特定启动子应当能够导致足够量的表达,从而使得产生有效量的蛋白以得到所需表型。除了已知在植物细胞中导致DNA转录的启动子之外,通过筛选在靶组织或细胞中选择性或优选表达的基因的植物cDNA文库或微生物cDNA文库可识别在本发明中使用的其他启动子。
待包括的启动子的选择取决于多种因素,这包括但不限于效率、选择能力、诱导能力、所需表达水平、和细胞-或组织-优选表达。相对于序列通过恰当地选择和定位启动子和其他调节区,本领域技术人员可常规地调节序列的表达。
载体或构建体也可包括运载肽。也可采用并入合适叶绿体运载肽。也可将翻译增强子并入作为载体DNA的一部分。DNA构建体可包含一个或多个5'非翻译的前导序列,其可用于增加基因产物由所得mRNA转录物表达。这些序列可来源于选择的启动子以表达基因或者能够特异性修饰这些序列以增加mRNA的翻译。由病毒RNA、由合适的真核或原核基因、或者由合成基因序列也可获得这些区。
构建体或载体也可包括具有目标编码区的核苷酸序列,其全部或部分用于终止该区的转录。例如,已经分离包括Tr73'序列和nos3'序列等的这些序列。
如果需要生成合适的多肽,则通常包括在编码区的3'-端处的聚腺苷酸化区。聚腺苷酸化区可来源于天然基因、各种其他植物基因或微生物基因、或者T-DNA,并且可在实验室合成该聚腺苷酸化区。
植物转化
通过各种技术可将本发明的核酸分子引入合适寄主植物的基因组或细胞内。取决于靶向转化的植物或植物细胞的类型,即,单子叶植物或双子叶植物,转化技术以及产生核苷酸序列至植物内的方案可变化。能够转化大量高级植物品种的这些技术是众所周知的,并且描述在技术和科技文献中。通过多种以下方法之一可进行转基因植物或转基因植物细胞的生成,该方法包括但不限于:通过注射、微注射、电穿孔DNA来转化植物细胞;融合细胞或原生质体;PEG介导的转化;使用基因枪(biolistic);以及通过使用例如根癌土壤杆菌或发根土壤杆菌或者其他细菌宿主的T-DNA。
此外,本领域技术人员众所周知的大量非稳定转化方法可以为本发明所需要的。这些方法包括但不限于瞬时表达和病毒转染。
叶绿体转化的方法是本领域众所周知的。参见例如,Svab等人,Proc.Natl.Acad.Sci.USA(1990);Svab和Maliga,Proc.Natl.Acad.Sci.USA(1993);Svab和Maliga,EMBO J.(1993)。本方法依赖DNA的粒子枪递送,其包含可选择的标志物和通过同源性重组使DNA靶向质体基因组。此外,通过如下方式能够完成质体转化:组织优选表达编码核的和定向质粒的RNA多聚酶来转活运载沉默质体的转基因。这些体系报道在McBride等人,Proc.Natl.Acad.Sci.USA(1994)中。
由转化的植物获得种子,并用于测定稳定性和遗传性。通常,培养两代或多代以确保稳定地维持和传送表型特征。
本领域技术人员意识到,在表达盒稳定并入转基因植物内以及确认可操作之后,通过有性杂交能够将它引入其他植物内。取决于待杂交的种类,能够使用大量标准育种技术中任一种。
也应理解,也可将两种不同的转基因植物配对以得到包含两种独立分离加入的外源性基因的后代。合适子代的自交可产生对两种加入的外源性基因均为纯合的植物。也涵盖作为植物繁殖的与亲本植物的反交和与非转基因植物的异交。
植物转化的评价
在引入异源性外来DNA至植物细胞内之后,通过各种方法能够证实异源性基因转化或整合至植物基因组内,例如分析与整合的基因相关的核酸、蛋白和代谢物。
在这些方法中,PCR分析是在移植至土壤内之前的早期阶段筛选转化的细胞、组织或嫩枝中存在并入的基因的一种快速的方法(Sambrook和Russell,Molecular Cloning:A Laboratory Manual.ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.2001)。使用对目标毒素基因特异的寡核苷酸引物或者土壤杆菌属载体背景等能够进行PCR。
通过基因组DNA的Southern印迹分析可证实植物转化(Sambrook和Russell,2001,见上)。通常,由转化体提取总DNA,使用合适的限制性内切酶消化,在琼脂糖凝胶中分馏和转移至硝化纤维或尼龙膜。然后根据标准技术使用例如放射标记的32P靶DNA片段探测膜或“印迹”以证实整合引入的基因至植物基因组内(Sambrook和Russell,2001,见上)。
在Northern印迹分析中,根据在本领域通常使用的标准工序,由转化体的具体组织中分离RNA,在甲醛琼脂糖凝胶中分馏,然后在尼龙滤器中测试印迹(例如,Sambrook和Russell,2001,见上)。然后通过本领域已知的方法通过使过滤器与来源于毒素的放射性探针杂交来测试通过毒素编码的RNA的表达(例如,Sambrook和Russell,2001,见上)。
在转基因植物上可进行Western印迹、生化测定法等以通过标准工序(例如,Sambrook和Russell,2001,见上)使用结合在毒素蛋白上存在的一个或多个表位的抗体来证实通过毒素基因编码的蛋白的存在。
如上所讨论,已经开发出使用植物细胞的大量标志物,例如其对氯霉素、氨基葡糖苷G418、潮霉素等具有抵抗力。编码在叶绿体代谢中涉及的产物的其他基因也可用作选择性标志物。此外,本文公开的基因也用作标志物以评估细菌细胞或植物细胞的转化。用于检测在植物、植物器官(例如,叶子、茎、根等)、种子、植物细胞、繁殖体、胚芽或其子代中转基因的存在的方法是本领域众所周知的。在一些实施方案中,通过测试杀虫活性可检测转基因的存在。
可测试表达毒素的增殖的植物的杀虫活性,并且可选择显示最佳活性的植物用于进一步育种。在本领域可获得用于测定杀虫活性的各种方法。通常,将蛋白混合和用于进食测定。参见例如,Marrone等人(1985,见上)。
原则上,任何植物品种均可采用根据本发明的方法和组合物。单子叶和双子叶植物品种为特别合适的。该方法优选用于用来生成在制备液体燃料分子和其他化学物质中使用的生物质的农业、园艺、和/或林业中重要或令人感兴趣的植物。
因此,本发明可在多种植物中使用,优选属于被子植物门和裸子植物门的植物。双子叶植物和单子叶植物的子类植物是特别适合的。双子叶植物属于以下目类:马兜铃目(Aristochiales)、菊目(Asterales)、扒打目(Batales)、桔梗目(Campanulales)、白花菜目(Capparales)、石竹目(Caryophyllales)、木麻黄目(Casuarinales)、卫矛目(Celastrales)、山茱萸目(Cornales)、岩梅目(Diapensales)、五桠果目(Dilleniales)、川绿断目(Dipsacales)、柿树目(Ebenales)、杜鹃花目(Ericales)、杜仲目(Eucomiales)、大戟目(Euphorbiales)、豆目(Fabales)、山毛榉目(Fagales)、龙胆目(Gentianales)、牦牛儿苗目(Geraniales)、小二仙草目(Haloragales)、金缕梅目(Hamamelidales)、八角茴香目(Illiciales)、胡桃目(Juglandales)、野芝麻目(Lamiales)、樟目(Laurales)、玉蕊目(Lecythidales)、莱脱纳目(Leitneriales)、木兰目(Magniolales)、锦葵目(Malvales)、杨梅目(Myricales)、桃金娘目(Myrtales)、睡莲目(Nymphaeales)、罂粟目(Papeverales)、胡椒目(Piperales)、车前草目(Plantaginales)、白花丹目(Plumbaginales)、河苔草目(Podostemales)、花葱目(Polemoniales)、远志目(Polygalales)、蓼目(Polygonales)、报春花目(Primulales)、山龙眼目(Proteales)、大花草目(Rafflesiales)、毛茛目(Ranunculales)、鼠李目(Rhamnales)、蔷薇目(Rosales)、茜草目(Rubiales)、杨柳目(Salicales)、檀香目(Santales)、无患子目(Sapindales)、瓶子草目(Sarraceniaceae)、玄参目(Scrophulariales)、山茶目(Theales)、昆蓝树目(Trochodendrales)、伞形目(Umbellales)、荨麻目(Urticales)、和堇菜目(Violales)。单子叶植物属于以下的目类:泽泻目(Alismatales)、天南星目(Arales)、槟榔目(Arecales)、凤梨目(Bromeliales)、鸭跖草目(Commelinales)、环花目(Cyclanthales)、莎草目(Cyperales)、谷精草目(Eriocaulales)、水鳖目(Hydrocharitales)、灯心草目(Juncales)、百合目(Lilliales)、茨藻目(Najadales)、蓝目(Orchidales)、露兜树目(Pandanales)、禾本目(Poales)、帚灯草目(Restionales)、霉草目(Triuridales)、香蒲目(Typhales)、以及姜目(Zingiberales)。属于裸子植物门的植物是苏铁目(Cycadales)、银杏目(Ginkgoales)、买麻藤目(Gnetales)、和松目(Pinales)。
合适的种类可包括以下属类的成员:秋葵属(Abelmoschus)、冷杉属(Abies)、槭属(Acer)、剪股颖属(Agrostis)、葱属(Allium)、六出花属(Alstroemeria)、凤梨属(Ananas)、穿心莲属(Andrographis)、须芒草属(Andropogon)、蒿属(Artemisia)、芦竹属(Arundo)、颠茄属(Atropa)、小檗属(Berberis)、甜菜属(Beta)、红木属(Bixa)、芸苔属(Brassica)、金盏花属(Calendula)、山茶属(Camellia)、喜树属(Camptotheca)、大麻属(Cannabis)、辣椒属(Capsicum)、红花属(Carthamus)、长春花属(Catharanthus)、三尖杉属(Cephalotaxus)、菊属(Chrysanthemum)、金鸡纳属(Cinchona)、西瓜属(Citrullus)、咖啡属(Coffea)、秋水仙属(Colchicum)、锦紫苏属(Coleus)、香瓜属(Cucumis)、南瓜属(Cucurbita)、狗牙根属(Cynodon)、曼陀罗属(Datura)、石竹属(Dianthus)、毛地黄属(Digitalis)、薯蓣属(Dioscorea)、油棕属(Elaeis)、麻黄属(Ephedra)、蔗茅属(Erianthus)、高根属(Erythroxylum)、桉树属(桉树)、羊茅属(Festuca)、草莓属(Fragaria)、雪花属(Galanthus)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、大麦属(Hordeum)、天仙子属(Hyoscyamus)、麻风树属(麻风树属)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、石松属(Lycopodium)、木薯属(Manihot)、苜蓿属(Medicago)、薄荷属(Mentha)、芒属(Miscanthus)、芭蕉属(Musa)、烟草属(Nicotiana)、稻属(Oryza)、黍属(Panicum)、罂粟属(Papaver)、银胶菊属(Parthenium)、狼尾草属(Pennisetum)、矮牵牛属(Petunia)、虉草属(Phalaris)、梯牧草属(Phleum)、松属(Pinus)、早熟禾属(Poa)、大戟属(Poinsettia)、杨属(Populus)、萝芙木属(Rauwolfia)、蓖麻属(Ricinus)、蔷薇属(Rosa)、甘蔗属(Saccharum)、柳属(Salix)、血根草属(Sanguinaria)、赛茛菪属(Scopolia)、黑麦属(Secale)、茄属(Solanum)、高粱属(Sorghum)、大米草属(Spartina)、菠菜属(Spinacea)、菊蒿属(Tanacetum)、红豆杉属(Taxus)、可可属(Theobroma)、小黑麦属(Triticosecale)、小麦属(Triticum)、北美穗草属(Uniola)、藜芦属(Veratrum)、蔓长春花属(Vinca)、葡萄属(Vitis)、和玉蜀黍属(Zea)。
本发明的方法和组合物优选用于对于农业、园艺、制备生物燃料分子和其他化学物质中使用的生物质、和/或林业而言重要或令人感兴趣的植物。非限制性例子包括例如柳枝稷(Panicum virgatum)(柳枝稷)、高粱(Sorghum bicolor)(蜀黍、苏丹草)、奇岗(Miscanthusgiganteus)(芒属)、甘蔗属(甘蔗)、大叶钻天杨(Populus balsamifera)(白杨)、玉蜀黍(Zea mays)(玉米)、大豆(Glycine max)(黄豆)、欧洲油菜(Brassica napus)(芸苔)、小麦(Triticum aestivum)(小麦)、陆地棉(Gossypium hirsutum)(棉花)、水稻(Oryza sativa)(稻谷)、向日葵(Helianthus annuus)(葵花)、紫花苜蓿(Medicago sativa)((苜蓿))、甜菜(Beta vulgaris)(甜菜)、御谷(Pennisetum glaucum)(珍珠稗)、黍属(Panicum spp.)、高粱属(Sorghum spp.)、芒属、甘蔗属、蔗茅属(Erianthusspp.)、杨属(Populus spp.)、大须芒草(Andropogon gerardii)(大须芒草)、象草(Pennisetum purpureum)(象草)、虉草(Phalaris arundinacea)(草芦)、狗牙根(Cynodon dactylon)(狗牙根)、苇状羊茅(Festuca arundinacea)(高羊茅)、草原网芽(Spartina pectinata)(草原网芽)、芦荻(Arundodonax)(芦竹)、黑麦(Secale cereale)(裸麦)、柳属(Salix spp.)(柳)、桉属(Eucalyptus spp.)(桉树)、小黑麦属(Triticosecale spp.)(小麦属--小麦X黑麦)、竹子、红花(Carthamus tinctorius)(红花)、麻风树(Jatrophacurcas)(麻风树属)、蓖麻(Ricinus communis)(蓖麻)、油棕(Elaeisguineensis)(油棕)、棕枣(Phoenix dactylifera)(枣椰树)、肯氏椰子(Archontophoenix cunninghamiana)(假槟榔)、金山葵(Syagrusromanzoffiana)(金山葵)、亚麻(Linum usitatissimum)(亚麻)、芥菜(Brassica juncea)、木薯(Manihot esculenta)(木薯)、番茄(Lycopersiconesculentum)(番茄)、莴苣(Lactuca saliva)(莴苣)、香蕉(Musaparadisiaca)(香蕉)、土豆(Solanum tuberosum)(土豆)、甘蓝(Brassicaoleracea)(花茎甘蓝、花椰菜、抱子甘蓝)、茶(Camellia sinensis)(茶)、草莓(Fragaria ananassa)(草莓)、可可(Theobroma cacao)(可可)、咖啡(Coffea arabica)(咖啡)、葡萄(Vitis vinifera)(葡萄)、菠萝(Ananascomosus)(菠萝)、甜椒(Capsicum annum)(辣椒&甜椒)、洋葱(Alliumcepa)(洋葱)、香瓜(Cucumis melo)(甜瓜)、黄瓜(Cucumis sativus)(黄瓜)、番南瓜(Cucurbita maxima)(南瓜)、南瓜(Cucurbita moschata)(南瓜)、菠菜(Spinacea oleracea)(菠菜)、西瓜(Citrullus lanatus)(西瓜)、秋葵(Abelmoschus esculentus)(秋葵)、茄子(Solanum melongena)(茄子)、罂粟(Papaver somniferum)(罂粟)、鬼罂粟(Papaver orientale)、浆果紫杉(Taxus baccata)、短叶红豆杉(Taxus brevifolia)、青蒿(Artemisia annua)、大麻(Cannabis saliva)、喜树(Camptothecaacuminate)、长春花(Catharanthus roseus)、长春花(Vinca rosea)、正鸡纳树(Cinchona officinalis)、秋水仙(Coichicum autumnale)、臭菘(Veratrum californica)、毛花洋地黄(Digitalis lanata)、毛地黄(Digitalispurpurea)、薯蓣属(Dioscorea spp.)、穿心莲(Andrographis paniculata)、颠茄(Atropa belladonna)、曼陀罗(Datura stomonium)、小檗属(Berberisspp.)、三尖杉属(Cephalotaxus spp.)、草麻黄(Ephedra sinica)、麻黄属(Ephedra spp.)、古柯(Erythroxylum coca)、雪花莲(Galanthus wornorii)、赛茛菪属(Scopolia spp.)、蛇足石杉(Lycopodium serratum)(蛇足石杉)、石松属(Lycopodium spp.)、蛇根木(Rauwolfia serpentina)、萝芙木属(Rauwolfia spp.)、血根草(Sanguinaria canadensis)、天仙子属(Hyoscyamus spp.)、金盏花(Calendula officinalis)、小白菊(Chrysanthemum parthenium)、毛喉鞘蕊花(Coleus forskohlii)、短舌匹菊(Tanacetum parthenium)、灰白银胶菊(Parthenium argentatum)(银胶菊)、橡胶树属(Hevea spp.)(橡胶)、留兰香(Mentha spicata)(薄荷)、洋薄荷(Mentha piperita)(薄荷)、红木(Bixa orellana)、六出花属、蔷薇属(玫瑰)、香石竹(康乃馨)、矮牵牛属(矮牵牛)、一品红(一品红)、烟草(烟草)、白羽扇豆(扁豆)、燕麦(燕麦)、剪股颖(剪股颖属)、颤杨(白杨)、松属(松树)、冷杉属(杉木)、槭属(枫木)、大麦(大麦)、草地早熟禾(兰草)、黑麦草属(黑麦草)、猫尾草(梯牧草)、和针叶树。令人感兴趣的是为能源生产种植的植物,所谓的能源作物,例如基于纤维素的能源作物如柳枝稷(柳枝稷)、高粱(高粱,苏丹草)、奇岗(芒属)、甘蔗属(甘蔗)、大叶钻天杨(白杨)、大须芒草(大须芒草)、象草(象草)、虉草(草芦)、狗牙根(狗牙根)、苇状羊茅(高羊茅)、草原网芽(草原网芽)、紫花苜蓿(苜蓿)、芦荻(芦竹)、黑麦(裸麦)、柳属(柳)、桉属(桉树)、小黑麦属(小麦属--小麦X黑麦)、竹制品,以及淀粉为基础的能源作物如玉蜀黍(玉米)和木薯(木薯)和蔗糖为基础的能源作物如甘蔗属(甘蔗)和甜菜(甜菜)、以及生物燃料生产能源作物如大豆(黄豆)、欧洲油菜(芸苔)、向日葵(向日葵)、红花(红花)、麻风树(麻风树属)、蓖麻(蓖麻)、油棕(非洲油棕)、油棕油茶(美国油棕)、椰子(椰子)、亚麻荠(野生亚麻)、水黄皮(水黄皮)、油橄榄(橄榄)、亚麻(亚麻)、海甘蓝(阿比西尼亚-羽衣甘蓝)、和芥菜。
在制备重组的微生物中本发明的分子的使用:
在害虫控制中或在工程化其他微生物作为杀虫试剂中采用包含根据本发明的核酸或多肽序列、或其变体的微生物菌株的常见方法是本领域已知的。参见例如,美国专利No.7,129,212;7,056,888;5,308,760;和5,039,523。
例如,包含本发明的核酸序列、或其变体的诸如芽孢杆菌属的微生物菌株、或者具有经遗传改变以包含杀虫的基因序列和蛋白的微生物可用于保护农业作物和产物抵抗害虫。在本发明的一方面中,使用当将细胞应用至靶害虫的环境时延长在细胞中产生的毒素的活性的试剂处理产生毒素(杀虫剂)的有机体的全部细胞,即未裂解的细胞。
可选择地,可将根据本发明的具有编码毒素的多肽克隆和引入假单胞菌属中,从而表达蛋白和在细菌的细胞壁中微囊化。在假单胞菌属中适合制备细菌毒素的各种技术是本领域已知的。微囊化的毒素能够单独喷雾应用或者与包含其他毒素的基于苏云金芽孢杆菌的杀虫剂轮流使用。
可选择地,通过引入编码毒素的序列至细胞宿主内能够制备生物杀虫剂。毒素基因的表达直接或间接导致生物杀虫剂的细胞内产生和维持。在该发明的一方面中,然后当将细胞应用于靶害虫的环境时,在延长在细胞中产生的毒素的活性条件下处理这些细胞。所得产物保留毒素的毒性。然后可依照常见技术配制这些天然囊封的杀虫剂,应用于靶害虫生存的环境,例如,土壤、水、和植物的叶子。参见例如,美国专利No.4,695,462;以及本文所引用的参考文献。可选择地,人们可配制表达本发明的基因的细胞,从而使得可应用所得材料作为杀虫剂。
杀虫的组合物
根据本发明的多肽通常以组合物的形式应用,并且可同时或连续与其他化合物或组合物施加至待处理的作物区域或植物。这些化合物和组合物可以为冷冻保护剂、去污剂、休眠喷洒油、肥料、杀虫的肥皂、聚合物、表面活性剂、除草剂、和/或在进行配制物的一次应用之后允许长期施用至靶区域的缓释或生物降解载体配制物。它们也可以为选择性化学杀菌剂、杀昆虫剂、除草剂、杀真菌剂、杀微生物剂、杀变形虫剂、杀害虫剂、杀线虫剂、杀软体动物剂、杀病毒剂、或者多种这些制剂的混合物,如果需要,可进一步连同农业上可接受的载体、表面活性剂或者通常在配制领域中使用的促进应用的佐剂。合适的载体和佐剂可以为固体或液体以及对应于在配制技术中通常采用的物质,例如,天然或再生矿物分散剂、物质、溶剂、增粘剂、润湿剂、粘合剂、或肥料。类似地,可将配制物制备至可食用的“诱饵”或者造型成害虫“陷阱”以使得可进食或消化杀虫配制物的靶害虫。
在一些实施方案中,依照本发明施用杀虫的多肽或者农业-生物化学组合物的方法包括叶子应用、种子涂覆和土壤应用,该组合物包含至少一种本发明的杀虫的多肽。应用的次数和应用的速率取决于通过对应害虫消化的强度。
可将组合物配制为粉末、粉尘、片状物、颗粒、喷雾剂、乳化液、胶体、溶液等,或者可通过包含多肽的细胞的培养物的诸如离心、浓缩、干燥、提取、过滤、均化或沉淀的这些常见方式来制备。在包含至少一种这些杀虫的多肽的所有这些组合物中,多肽可以以按重量计约1%至约99%的浓度存在。
通过本发明的方法在给定区域可将鞘翅目、双翅目、鳞翅目、或线虫害虫杀死或数目减少,或者可预防性应用于环境中以防通过易感染的害虫侵扰。优选害虫进食、或者接触杀虫有效量的多肽。如上所述,“杀虫有效量”旨在表示相对于在未处理对照下获得害虫发育水平和/或害虫传播水平下降所必需的杀虫剂或杀虫的处理的量。该量可根据以下这些因素变化:例如,待控制的具体靶害虫、具体环境、位置、植物、作物、或待处理的农业位置、环境条件、和方法、速率、浓度、稳定性、和应用杀虫有效量多肽组合物的量。根据气候条件、环境考虑和/或应用频率、和/或害虫侵扰的严重程度,配制物也可变化。
通过配制具有所需农业上可接受的载体的微生物细胞、孢子混悬物、细菌晶体、或分离的蛋白组分可制备本文所述的杀虫组合物。在合适的方式施用之前可配制组合物,例如冻干、冰冻干燥、烘干、或在水性载体、培养基或合适稀释剂中,例如盐水或其他缓冲剂。配制的组合物可以为粉尘或颗粒材料、或油中(植物或矿物油)的混悬液、或者水、或油/水乳化液的形式、或者作为可润湿粉末、或者联合适合农业应用的其他载体材料的形式。合适的农业载体可以为固体或液体,并且这是本领域众所周知的。术语“农业上可接受的载体”涵盖在杀虫剂配制技术中通常使用的所有佐剂、惰性组分、分散剂、表面活性剂、增粘剂、粘合剂等;这些均是杀虫剂配制技术人员所众所周知的。通过各种方式可将配制物与一种或多种固体或液体佐剂混合或者制备,例如,通过使用常见配制技术的合适佐剂的均匀混合、共混和/或研磨杀虫组合物。合适配制和应用方法描述在例如,美国专利申请No.US20090087863A1。
使用本发明的组合物也可处理植物,本发明的组合物包含一种或多种化学组合物,其包括一种或多种除草剂、杀虫剂、或杀真菌剂。示例性化合组合物包括:除草剂(S-)异丙甲草胺、甲草胺、酰嘧磺隆、莠去津、四唑嘧磺隆、氟丁酰草胺、苄嘧磺隆、苯达松、苯并双环酮、双草醚、除草定、溴苯腈、丁草胺、氟丙嘧草酯、氟酮唑草、膦基聚羧酸、氯嘧磺隆、氯磺隆、烯草酮、炔草酯、二氯吡啶酸、氯酯磺草胺(Cloransulam–methyl)、噻草酮、氰氟草、杀草隆、甜菜安、禾草灵、吡氟草胺、敌草隆、甜菜呋、乙氧嘧磺隆、精恶唑禾草灵、四唑酰草胺、吡氟草胺、吡氟禾草灵、吡氟禾草灵、氟酮磺隆、氟噻草胺、速收、伏草隆、氟草烟(Fluoroxypyr)、唑嘧磺草、氟磺胺草醚、草铵膦、甘草膦、氯吡嘧磺隆、Halosulfuron Gowan、甲氧咪草烟、灭草喹、咪草烟、咪唑磺隆、茚草酮、三嗪茚草胺(Indaziflam)、碘磺隆、碘苯腈、异丙隆、环草定、利谷隆、苯噻草胺、甲磺胺磺隆、甲基磺草酮、苯嗪草酮、吡草胺、嗪草酮、甲磺隆、MSMA、烟嘧磺隆、哒草伏、炔丙噁唑草(Oxadiargyl)、恶草灵、去稗安、亚砜吸磷(Oxidemethon-methyl)、乙氧氟草醚、百草枯、二甲戊乐灵、五氟磺草胺、甜菜宁、苯氧基类(Phenoxies)、氟吡酰草胺、唑啉草酯、抗蚜威、丙草胺、氟嘧磺隆、扑草净、敌稗、丙苯、戊炔草胺、磺酰草吡唑、吡嘧磺隆、稗草畏、环酯草醚、嘧磺草胺(Pyrimisulfan)、嘧硫钠、派罗克杀草砜(Pyroxasulfon)、甲氧磺草胺、二氯喹啉酸、喹草酸、精喹禾灵、砜嘧磺隆、嘧啶肟草醚、稀禾定、西玛津、磺草酮、磺、特糠酯酮、特波三酮、吡喃草酮、噻虫啉、噻虫嗪、噻苯隆、唑酮磺吩酸(Thiencarbazone)、噻吩磺隆、杀草丹、苯唑草酮、肟草酮、野麦畏、醚苯磺隆、苯磺隆、三氟啶磺隆、氟乐灵、氟乐胺苯磺隆、氟胺磺隆;杀虫剂:(S-)噻吩草胺、(S-)异丙甲草胺、4-[[(6-氯吡啶-3-基)甲基](2,2–二氟乙基)氨基]呋喃-2(5H)-酮、阿维菌素、乙酰甲胺磷、灭螨醌、啶虫脒、乙草胺、甲草胺、涕灭威、α-氯氰菊酯、阿维菌素、苏云金芽孢杆菌、丙硫克百威、β-氟氯氰菊酯、联苯肼酯、联苯菊酯、溴苯腈、噻嗪酮、硫线磷、西维因、克百威、杀螟丹、毒死蜱、毒死蜱、环虫酰胺、二氯吡啶酸、Clorphyriphos、可尼丁、Cyanopyrafen、Cyaxypyr、Cyazypyr、丁氟螨酯、氟氯氰菊酯/高效氟氯氰菊酯、氯氰菊酯、溴氰菊酯、二嗪农、麦草畏、乐果、呋虫胺(Dinetofuran)、呋虫胺、甲氨基阿维菌素苯甲酸盐、硫丹、高氰戊菊酯、乙虫腈、醚菊酯、苯线磷、苯丁-氧、杀螟硫磷、仲丁威、氟虫腈、氟啶虫酰胺、嘧螨酯、氟虫酰胺、氟噻草胺、甲酰胺磺隆、噻唑膦(Forthiazate)、γ和λ氯氟氰菊酯、高效氯氟氰菊酯的γ、γ/λ氯氟氰菊酯、γ-氯氟氰菊酯、草铵膦、甘草膦、噻螨酮(Hexthiazox)、吡虫啉、茚虫威、异丙威、异恶唑草酮、高效氯氟氰菊酯、λ-cyhalthrin、虱螨脲、马拉硫磷、甲基磺草酮、氰氟虫腙、甲胺磷(Metamidophos)、甲胺磷、灭虫、灭多威、甲氧虫酰肼、久效磷、双苯氟脲、有机磷、对硫磷、丙溴磷、拟除虫菊酯、啶虫丙醚(Pyridalyl)、吡丙醚、氯虫酰胺、螺螨酯(Spinodiclofen)、多杀菌素、Spinoteram、Spinotoram、螺螨酯、螨酯、螺虫乙酯、氟啶虫胺腈(Sulfoxaflor)、氟胺氰菊酯(tau-Fluvaleriate)、丁基嘧啶磷、七氟菊酯、特丁硫磷、噻虫啉、噻虫嗪、硫双灭多威(Thiocarb)、硫双威、三唑磷(Thriazophos)、唑虫酰胺、三唑磷、杀铃脲;杀真菌剂:嘧菌酯、啶酰菌胺、多菌灵、氯环丙酰胺、百菌清、氰霜唑、环氟菌胺、霜脲氰、环唑醇、嘧菌环胺、双氯氰菌胺、醚菌胺、EBDCs、克瘟散、氟环唑、噻唑菌胺、土菌灵、咪唑菌酮、环酰菌胺、种衣酯(Fenitropan)、氰菌胺、丁苯吗啉、嘧菌腙、氟啶胺、咯菌腈、氟嘧菌酯、粉唑醇、三乙膦酸、异稻瘟净、异菌脲、异丙菌胺、稻瘟灵、醚菌酯、精甲霜灵、甲霜灵/精甲霜灵、恶咪唑富马酸盐、戊菌隆、啶氧菌酯、噻菌灵、咪鲜胺、丙硫菌唑、唑菌胺酯、咯喹酮、喹氧灵、五氯硝基苯、硅氟唑、硫、戊唑醇、四氟醚、甲基硫菌灵、福美双、噻酰菌胺、三环唑、肟菌酯、乙烯菌核利、苯酰菌胺。
本发明的杀虫组合物可用于控制一种或多种农业上重要的害虫,其包括但不限于细菌、真菌、害虫、螨类、线虫、蜱虫等。昆虫害虫包括选自以下目:虱目、鞘翅目、革翅目、双翅目、半翅目、同翅目、膜翅目、等翅目、鳞翅目、食毛目、直翅目、蚤目、缨翅目、毛翅目等,特别是鞘翅目、双翅目和鳞翅目。
特别关注的线虫害虫包括:寄生线虫,例如根癌、孢囊、和病变线虫,其包括异皮线虫属、胞囊线虫属、和根结线虫属;特别是孢囊线虫的成员,其包括但不限于:禾谷孢囊线虫(谷类孢囊线虫);大豆对胞囊线虫(大豆孢囊线虫);甜菜孢囊线虫(甜菜孢囊线虫);以及马铃薯白线虫和马铃薯金线虫(马铃薯孢囊线虫)。病变线虫包括短体线虫属。
本发明的杀虫组合物优选用于控制主要作物的昆虫害虫,其包括但不限于:郁金香瘤瘦螨(Aceria tulipae)、小麦卷曲螨;拟绿蝽(Acrosternum hilare)、绿蝽、美洲黍潜叶蝇、玉米杂交潜叶蛾、小地老虎、小地蚕、西部灰地老虎(Agrotis orthogonia)、西部地老虎;黄呆蓟马、草蓟马;棉铃象甲、棉籽象鼻虫;大豆夜蛾(Anticarsiagemmatalis)、藜豆夜蛾;玉米根蚜虫(Anuraphis maidiradicis)、玉米根蚜、棉蚜、棉蚜虫;美洲谷长蝽(Blissus leucopterus leucopterus)、麦长蝽;胡萝卜金龟(Bothyrus gibbosus)、胡萝卜甲虫、甘蓝蚜、甘蓝蚜、麦茎鲷、麦茎蜂;玉米铜色跳甲(Chaetocnema pulicaria)、玉米跳甲、斑禾草螟(Chilo partellus)、高粱螟;葡萄鞘叶甲(Colaspis brunnea)、葡萄肖叶甲;高粱瘿蚊(Contarinia sorghicola)、高粱瘿蚊;玉米蚜;北方圆头犀金龟(Cyclocephala borealis)、北部隐金龟子(蛴螬);南方圆头犀金龟(Cyclocephala immaculata)、南部隐金龟子(蛴螬)、灰地种蝇(Delia platura)、种蝇、地种蝇属、根蛆、北部玉米根虫(Diabroticalongicornis barberi)、北方玉米根虫;南部玉米根虫(Diabroticaundecimpunctata howardi)、南方玉米根虫、西方玉米根虫(Diabroticavirgifera)、西部玉米根虫;西南玉米杆草螟(Diatraea grandiosella)、西南玉米螟虫;小鹿螟(Diatraea saccharalis)、甘蔗螟虫;小鹿螟(Diatraea saccharalis)、甘蔗螟虫;南美玉米苗斑螟(Elasmopalpuslignosellus)、小玉米秆螟;伪金针虫属(Eleodes)、宽胸叩头虫属(Conoderus)、和Aeolus属、金针虫;假眼小绿叶蚕豆蚜、马铃薯叶蝉;墨西哥豆甲虫(Epilachna varivestis)、墨西哥豆瓢虫;褐臭蝽(Euschistus servus)、棕色蝽;粒肤地老虎(Feltia subterranea)、颗粒地老虎;烟草蓟马(Franklinkiella fusca)、烟蓟马;谷实夜蛾(Helicovelpazea)、棉铃虫、谷实夜蛾(Helicovelpa zea)、棉铃虫、烟芽夜蛾、棉蚜虫;向日葵斑螟(Homoeosoma electellum)、向日葵螟;Hylemyacoarctate、小麦球飞;灰种蝇(Hylemya platura)、种蝇、三叶草叶象(Hypera punctata)、苜蓿叶象甲、稻象甲、稻水象鼻虫、美洲牧草盲蝽(Lygus lineolaris)、牧草盲蝽、麦长管蚜、英语谷物蚜虫、稽带夜蛾(Mamestra configurata)、贝莎粘虫;麦瘿蚊(Mayetiola destructor)、麻蝇;特异黑蝗(Melanoplus differentialis)、异黑蝗;红足黑蝗(Melanoplusfemurrubrum)、赤腿蚱蜢;血黑蝗、迁徙蝗虫;梳爪叩甲属(Melanotus)、金针虫;特异黑蝗(Meromyza americana)、麦秆蝇蛆、烟蚜、桃蚜;美洲麦杆蝇(Neolasioptera murtfeldtiana)、葵花籽蚊、热带稻叶蝉(Nephotettix nigropictus)、稻叶蝉、玉米螟、欧洲玉米螟虫、黑角负泥虫(Oulema melanopus)、谷类叶甲、棉红铃虫、棉红铃虫;麦岩螨(Petrobia latens)、棕色小麦螨;长毛食叶然金龟(Phyllophaga crinita)、蛴螬、黄曲十字花科、跳甲;苜猜绿夜蛾(Plathypena scabs)、苜猜绿夜蛾(green cloverworm)、小菜蛾、钻石背蛾;粳稻弧丽、日本金龟子、美洲粘虫(Pseudaletia unipunctata)、粘虫;棉盲蝽(Pseudatomoscelisseriatus)、棉盲蝽;大豆尺夜蛾(Pseudoplusia includens)、大豆夜蛾、玉米蚜、玉米蚜;俄罗斯小麦蚜虫、麦二叉蚜、二叉蚜;大豆蓟马(Sericothrips variabilis)、大豆蓟马;美甘蔗伪毛蚜(Sipha flava)、黄甘蔗蚜虫、麦红吸浆、小麦吸浆虫、象鼻虫(Sitophilus oryzae)、米象、窃蚁(Solenopsis milesta)、窃叶蚁;玉米象虫(Sphenophorus maidis)、玉米象虫、甜菜夜蛾、甜菜夜蛾、斜纹夜蛾、草地夜蛾;向日葵卷叶蛾(Suleima helianthana)、向日葵芽蛾;朱砂叶螨、朱砂叶螨、土耳其斯坦叶螨、草莓红蜘蛛、二斑叶螨、普通红叶螨、蓟马烟粉虱、棉蓟马、结翅粉虱(Trialeurodes abutilonea)、结翅粉虱;向日葵叶甲(Zygogramma exclamationis)、向日葵甲虫。
在该公开中,通过参考文献引用和并入各种信息来源。信息来源包括例如科学期刊杂志、专利文件、教科书、和万维网搜索不活动页面地址。引用这些信息来源仅为了提供在提交时间下本领域基本状况。尽管本领域技术人员可相信和使用各和每一信息来源的内容和技术以得到和使用本发明的实施方案,但是在具体信息来源中任何讨论和意见不应当以任何方式赞同这些评价是本领域普通接受的一般意见。
本文给出的一般方法的讨论仅为了示意目的。鉴于该公开,其他可选择方法和实施方案对于本领域技术人员显而易见,并且包括在本申请的精神和权限内。
应当理解,提供以下例子用于示意、而不是限制本发明。
实施例
实施例1:微生物的分离
第一次分离:在美国由多个取样位置收集微生物样品。由单独的根际样品得到各取样位置的复合微生物样品。由各单独的样品中取2克的根际土壤以及将它们合并在50mL Falcon管中来产生复合物。在复合之后使土壤均匀。
随后在Bt富集工序中使用复合微生物样品,该Bt富集工序包括使样品在包含显色底物和抑制其他细菌、酵母菌和霉菌生长的抑制性成分的显色平皿培养基(chromogenic plating medium)上生长。通常将该平皿培养基用于由混合的样品中同时识别蜡状芽孢杆菌和苏云金芽孢杆菌细菌(目录号M-0400,R&F Products)。该高选择性培养基通常仅可帮助识别蜡状芽孢杆菌和苏云金芽孢杆菌分离株,它们为蓝色菌落,而其他芽胞杆菌属形成白色菌落或者不生长。单独采集蓝色菌落(即蜡状芽孢杆菌和苏云金芽孢杆菌)至包含150μL/孔的2YT培养基的96-孔细胞培养板,并在30℃下孵育过夜。使用销将这些板分离得到2块新的96-孔板(平行测定)以及保存在-80℃下的20%丙三醇中。
第二次分离:将1克的复合土壤置于使用0.25M乙酸钠补充的10mL的LB培养基内,并在30℃下在振荡器中孵育4小时。随后,将这些孵育物连续稀释或者将它们直接接种至显色平皿培养基上,然后在30℃下孵育24小时。如上所述选择、孵育和保存蓝色菌落,即蜡状芽孢杆菌和苏云金芽孢杆菌。
将包含Bt富集分离株的起始96-孔板送检以通过16S rRNA测序来证实分离株的同一性。如下详细所述,进行该起始16S测序以验证富集和分离方法和证实回收的分离株为芽胞杆菌属。
细菌细胞裂解和取得的16S rRNA序列信息
将20μl等份的细胞悬液转移至包含20μl的2x裂解缓冲剂(100mM Tris HCL,pH8.0,2mM EDTA,pH8.0,1%SDS,400μg/ml蛋白酶K)的96-孔PCR板。裂解条件如下:55℃下30分钟、94℃下4分钟。将一等份的裂解产物用作PCR扩增的模板DNA的来源。通过使用M13-27F(SEQ ID NO:207)和1492R M13-尾(SEQ ID NO:208)引物的PCR来扩增16S rRNA序列。
对于16S rRNA区的扩增,在包含4μl的细菌裂解反应物、2uM的各引物(27F或1492R)、6%Tween-20、和10μl的2x ImmoMix(Bioline USA Inc,Taunton,MA)的20μl最终体积反应物中制备各PCR混合物。PCR条件如下:94℃下10分钟;94℃下30秒;52℃下30秒;72℃下75秒,30次循环;72℃下10分钟。将2-μl等份的PCR产物在1.0%琼脂糖凝胶上运行以证实预期尺寸的单带。纯化阳性带,并送检PCR测定。使用454技术在San Diego,Calif.的J.Craig VenterInstitute处进行前后引发方向的测序。
使用DDBJ/GenBank/EMBL数据库来进行测定的核苷酸序列的同源性检索。也使用GenomeQuestTM软件(Gene-IT,Worcester Mass.USA)来测定序列同一性和相似性。序列分析结果揭示:92Bt富集分离株、91分离株的序列具有16S rRNA基因,其与之间识别的蜡状芽孢杆菌和/或苏云金芽孢杆菌菌株的序列具有至少98%序列同一性。这些结果证实:预期的芽孢杆菌属细胞群体在显色平皿培养基上由选择步骤中回收。根据在显色平皿培养基上生长的大量蓝色菌落确实是蜡状芽孢杆菌和/或苏云金芽孢杆菌的观察,在蜡状芽孢杆菌和/或苏云金芽孢杆菌分离株的后续选择中16S测序步骤可成为任选的步骤。
无论是否需要系统发生重建,在Bioedit(在万维网www.mbio.ncsu.edu/bioedit/bioedit.html处)中比对核苷酸序列,然后人工精确。使用最大似然、HKY取代模式和默认设置在PHYML(在万维网pbil.univ-lyon1.fr/software/phyml_multi/处)中构建系统发生树。通过自举(bootstrapping)来获得分支支撑点(branch support)(100次平行测定)。
实施例2:来自微生物分离株的混合群体的染色体外DNA的纯化
开发出和优化细菌细胞裂解物的改善工序如下:
选择Bt富集分离株的亚型以证实细胞裂解物和染色体外DNA提取方法的效率。通过基本上按照在Andrup等人(Plasmid59:139-143,2008)描述的工序(少量修改)来进行来自Bt富集的分离株的染色体外DNA的制备。对于各分离株,使用50μL预培养物来接种7mL2×YT培养物,然后在30℃下在旋转振荡器(200rpm)上孵育过夜(12-16小时)。在4℃下以3250×g沉淀细胞30分钟,然后通过移液管轻轻地上下吸取细胞悬液几次,使其重新悬浮在100μL的提取缓冲剂(15%[wt/vol]蔗糖,40mM Tris,2mM EDTA,pH7.9)中。通过加入200μL的裂解溶液(3%[wt/vol]SDS,50mM Tris,pH12.5)来裂解细胞。在60℃下将裂解液加热30分钟,然后加入20μL的蛋白酶K(20mg/mL,Finnzymes,Thermo Scientifics)。通过颠倒数次将溶液混合,然后在37℃下孵育60分钟。将一毫升的苯酚-氯仿-异戊醇(25:24:1)加入,然后将溶液颠倒数次。在8000×.g离心7分钟之后,各次提取通常得到~250μL的上层水溶液,将其转移至新的管子中。将10μL等份的水溶液进行电泳以估算染色体外DNA和污染基因组DNA(如果有)的量。通过加入1μL(10mg/mL)的RNA酶(Fermentas)来去除通常能够干扰后续脉冲凝胶电泳(PFGE)步骤的污染RNA。脉冲凝胶电泳(PFGE)用于分离高分子量核酸。在加载至1%琼脂糖凝胶的各孔内之前,将来自DNA提取步骤的约40μL的水溶液与20μL的熔化的琼脂糖混合。在0.96×TAE缓冲剂中运行凝胶16小时。凝胶条件如下:在运行时起始转换时间为5秒;最后转换时间为20秒;6伏特/cm、120°角度、300-350mA。标准为Epigene Bac tracker、Lamba midrange、和Lamba ladder(New England Biolabs)。使用溴化乙锭(1μg/mL)之后着色凝胶,并在UV照射下目测。目测证实分离株具有染色体外DNA,许多具有大于100kb的尺寸。
使用QIAGEN 试剂制备染色体外DNA
QIAGEN的大构建体试剂盒用于由Bt分离株中提取染色体外DNA,其尝试由染色体外DNA中去除基因组DNA。尝试两种方法:(1)如通过制造商所推荐的QIAGEN方案;(2)开展修饰的细胞裂解流程以有助于裂解革兰氏阳性芽孢杆菌属细胞(因为最初方案在大肠杆菌,革兰氏阴性细菌中开展)。
方案1:如推荐进行QIAGEN方案。孵育步骤(QIAGEN方案的第5步)在室温下进行5分钟,然后在中和步骤之前在冰上孵育1.5小时。
方案2:修改QIAGEN的第5步,使其对于裂解芽孢杆菌属细胞更加严格。这包括在加入250μg/mL蛋白酶K的情况下,在60℃下在水浴中孵育30分钟和在37℃下孵育60分钟。
在30℃下旋转振荡器(200rpm)上使两百个Bt富集分离株单独在5mL Miller’s LB中生长16小时。在孵育之后,将单独的培养物合并以得到1L复合培养物。按照QIAGEN大构建体方案来沉淀和再悬浮该500mL复合培养物。芽孢杆菌属细菌的修改的裂解流程用于取代推荐的步骤5。如按照制造商所推荐来进行剩余的步骤。
在提取之后,将来自第2次乙醇沉淀步骤(步骤19)的最后沉淀物悬浮在500μL的TE缓冲剂(pH8.5)中,然后通过荧光计(Invitrogen)来荧光定量。将10μL的各提取物在1.0%琼脂糖凝胶上运行。凝胶结果的目测评估揭示:使用改善的工序(即方案2)提取的染色体外DNA在凝胶上作为大小为0.5至30-Kb的剪切的DNA出现。相反,按照制造商的提取推荐(即方案1)进行的对照提取没有生成DNA。
实施例3:宏基因组序列数据集建立:高通量测序、序列组装和注释
通过使用在PCT专利公开No.WO2010115156A2中描述的工序来基因枪测序、组装和注释由200种芽胞杆菌属分离株中纯化的染色体外核酸的库。根据制造商的推荐条件将DNA模版进行IlluminaGenome Analyzer IIx(GAIIx)平台的单通道。生成约2Gbp的75bp成对端阅读数。平均插入物大小为~200bp。然后使用CLC GenomicsWorkbench de-novo assembler(CLC Bio)来进行序列组装,其使用默认参数。组装具有18.3Mbp的总长度和702bp的N50值的总计28,098重叠群。
在平行测序实验中,也将DNA模板进行Illumina HiSeqTM2000测序系统的单通道,生成具有200bp的平均插入物大小的约15Gbp的75bp成对端阅读数。然后使用CLC Genomics Workbench de-novoassembler(CLC Bio)来进行序列组装,其使用默认参数。组装具有35.9Mbp的总长度和873bp的N50值的总计47,551个重叠群。
在2个数据集之间序列数据的质量显著改善,其中HiSeq数据提供更大的覆盖以及生成更多全长序列。
约35Mbp的剩余重叠群,即与Bt毒素数据库没有显示显著序列相似性以及大概表示染色体外DNA内容物的其他部分的组装的重叠群也通过如下所述的原核注释路线来进行。
通过如通过Liu等人[Bioinformatics,3月1日;24(5):597-605,2008]之前描述的Evigan共有基因预测方法,使用来自多处来源的合并证据由组装的重叠群中预测编码基因序列。首先根据在所有六个框架中发现的终止密码子来预测在宏基因组序列读数上所有候选ORF,并且使得可运行以包括部分ORF。然后使用针对NCBI非冗余蛋白数据库的Blastp检索来注释候选ORF翻译,并且FastHMM(在microbesonline.org/fasthmm/处)检索Pfam(Finn等人,Nucleic Acids Res.2008)和超家族(参见例如,Inskeep等人,PLoS,2010)结构域数据库。使用3个原核基因探测工具也得到De novo ORF预测:Glimmer[Delcher等人,Bioinformatics,3月15日;23(6):673-9,2007];Prodigal(在compbio.ornl.gov/prodigal/处);和Metagene[Brunet等人,Proc NatlAcad Sci USA,3月23日;101(12):4164-9,2004]。然后以无监管的方式使用Evigan合并来自blast/FastHMM检索的证据和de novo基因测定值。因为通过Evigan预测的起始位点不一定对应于起始密码子,所以将预测的ORF延伸至在相同编码框的最紧密起始密码子的上游。根据GC内容物首先通过二进制重叠群、然后在各10,000重叠群二进制上单独运行Evigan来进行共有区预测。
实施例4:将宏基因组序列数据集用于快速识别新型毒素基因
通过使用BLASTX算法比较针对由已知内毒素组成的数据库的序列来测试在实施例3中描述的组装和注释过程中导致的重叠群的编码新型内毒素的多核苷酸序列的存在。对组装和注释的序列的分析识别多种基因,其属于Bt毒素的许多主要种类,包括Cry、VIP和Cyt基因。总之,识别47个全长和56个部分新型毒素基因以及之前所发现的许多毒素基因。
表1:通过本发明的方法识别编码生物毒素的序列。使用具有默认设置值的GenomeQuestTM软件来测定各氨基酸序列的序列同一性。提供各多肽的示例性功能同源物。在所附序列表中也提供各序列的其他已知同源物。
实施例5:合成毒素基因的构建
在一些实验中,生成合成毒素序列。这些合成序列可具有相对于亲本毒素序列改变的DNA序列,以及编码与它对应的亲本毒素蛋白共线性的蛋白,但任选缺乏在许多δ-内毒素蛋白中存在的C-末端“晶体结构域”。
在一些其他实验中,设计合成基因的修饰版本,使得所得肽靶向植物细胞器,例如内质网或质外体。已知导致融合蛋白靶向植物细胞器的肽序列是本领域已知的。例如,已知来自白羽扇豆(Lupinus albus)(Miller等人,Plant Physiology127:594-606,2001)的酸性磷酸酶基因的N-末端区导致靶向内质网的异源性蛋白。如果所得融合蛋白也包含在C-末端处含有肽N-末端-赖氨酸-天冬氨酸-谷氨酸-亮氨酸(即"KDEL"基序)的内质网保留序列,则融合蛋白可靶向内质网。如果在C-末端处融合蛋白缺乏靶向内质网的序列,则蛋白可靶向内质网,但可最终在质外体中分离。
实施例6:在芽胞杆菌属细胞和假单胞菌属细胞中表达
在一些实验中,合成具有如本文所公开的序列的生物毒素以及通过使用已知克隆方法将其克隆至适合于芽胞杆菌属或假单胞菌属的载体内。对于转化,根据本领域已知的转化工序合适地制备芽胞杆菌属或假单胞菌属。在常见的生长培养基上,例如CYS培养基(10g/lBacto-酪胨;3g/l酵母提取物;6g/l KH2PO4;14g/l K2HPO4;0.5mMMgSO4;0.05mM MnCl2;0.05mM FeSO4),单独培养所得的包含具有毒素基因的载体的芽胞杆菌属或者假单胞菌属重组菌株,直至通过显微镜检查发现明显形成孢子。制备样品并且在生物测定法中测试其活性。
实施例7:在体外生物测定法中功能
将如在本申请中公开的编码毒素的DNA分子或者预测的毒素结构域单独地克隆至包含可选择的抗生素抗性标志物的合适的大肠杆菌表达载体内,然后转化具有单独质粒的大肠杆菌感受态细胞。对于各构建体,在使用抗生素补充的LB培养基中接种单个菌落,然后在37℃下生长过夜。第二天,使用1%的过夜培养物接种新鲜培养基,然后在37℃下生长至对数期。将各细胞沉淀悬浮在具有蛋白酶抑制剂的Tris缓冲液(20mM Tris-Cl缓冲液,pH7.4,200mM NaC1,1mMDTT),并且进行超声处理。通过SDS-PAGE分析证实毒素蛋白的表达。然后通过本领域已知的技术来纯化毒素蛋白(参见例如,Sambrook和Russell,2001,见上)。在利用合适对照的昆虫测定法中测试纯化的蛋白。板的5天读数显示:毒素蛋白具有针对小菜蛾和西南部玉米螟虫害虫的杀虫活性。
实施例8:杀虫活性的另外的测定法
通常多种方式评价杀虫的蛋白作为杀虫剂对害虫的能力。在本领域众所周知的一种方式是进行进食测定法。在这些进食测定中,将害虫暴露于包含待测试的毒素/化合物的样品、或者对照样品中。通常通过放置待测试的材料、或者这些材料的合适稀释物至诸如人工饵料的害虫摄食的材料上。待测试的材料可由液体、固体、或浆料构成。可将待测试的材料放置在表面上,然后使其干燥。可选择地,可将待测试的材料与熔化的人工饵料混合,然后分配至测定小室内。例如,测定小室可以为小杯、小碟、或者微量滴定板的孔。
抽吸害虫(例如蚜虫)的测定法可包括通过隔离物将测试材料由昆虫中分离,理想地为通过抽吸昆虫的吸嘴部分可穿刺的部分,从而使得可吸取测试材料。通常,将测试材料与进食的刺激物(例如蔗糖)混合以促进测试化合物的吸收。
测定法的其他类型可包括微注射测试材料至害虫的嘴、或消化道内,以及培育转基因植物,然后测试害虫进食转基因植物的能力。植物测试可包括分离通常消耗的植物部分,例如,由放有叶子的小笼子中,或者在包括昆虫的笼子中分离全部植物。测定昆虫的其他方法和途径是本领域已知的,并且可在例如Robertson和Preisler(PesticideBioassays with Arthropods,CRC Press,Science,1992)中找到。
实施例9:植物、植物细胞、和组织的转化
载体构建:使本发明的基因的各编码区独立地与在植物中表达的合适启动子和终止子序列连接。这些序列是本领域众所周知的,以及可包括在单子叶植物中表达的病毒CaMV35S启动子、稻谷肌动蛋白启动子或者玉米遍在蛋白启动子、在双子叶植物中表达的拟南芥属UBQ3启动子、以及NOS或OCS终止子。用于生成和证实启动子-基因-终止子构建体的技术也是本领域众所周知的。通过示意而非限制的方式提供以下例子。
在转化的植物中生成新型生物毒素蛋白
通过使用CaMV35S启动子(Howell和Hull,Virology1978)和遍在蛋白启动子(Christensen等人,Plant Mol.Biol.1992)的常规工序在合适的穿梭载体中制备如上述的包括生物毒素蛋白的全长或截短的形式的表达盒。在一些情况下,为了最佳化生物毒素蛋白在寄主植物中的表达效率,使得开放阅读框架的密码子用途适应寄主植物,使得可使用可选择的密码子,同时编码相同的蛋白。通过Reverse Translate软件生成这些改变的序列,该软件是可在万维网bioinformatics.org/sms2/rev_trans.html上找到的密码子优化软件。然后使用所得重组载体转化包括例如大麦、小麦、黑小麦、玉米、棉花、和稻谷细胞的植物细胞。
使用如在例如,Henzel等人(Inter.J.of Plant Genomics,2009);PCT申请No.WO92/09696和美国专利No.5,641,664中描述的受损的和酶降解的胚性愈伤组织通过土壤杆菌属介导的转化或者通过电穿孔来稳定转化大麦、小麦、黑小麦、玉米细胞。
通过如在例如,Umbeck等人,1987和美国专利No.5,004,863中描述的土壤杆菌属介导的转化来稳定地转化棉花细胞。
基本上通过Hiei等人,Plant J.Aug,6(2):271-82,1994;和PCT申请No.WO92/09696描述的以下方法稳定地转化稻谷细胞。
通过Northern印迹、Southern印迹、ELISA、和杀昆虫的作用、或者这些技术的组合来选择再生转化的玉米、棉花和稻谷植物。与具有昆虫抵抗力和转化表型的合适分离物的未经转化的对照植物相比,包含生物毒素序列的子代植物显示对昆虫的改善抵抗力。蛋白和RNA测量值显示:增加的昆虫抵抗力与在植物中新型Cry蛋白的较高表达相关。
本发明的毒素编码的序列对玉米细胞的土壤杆菌属介导的转化
玉米胚芽由8-12DAP穗中分离,并且那些大小0.8-1.5mm的胚芽用于转化。在合适孵育培养基中将胚芽接种,子叶盘面向上,并且任选在25℃下于暗处孵育过夜。然后使胚芽接触包含合适载体的土壤杆菌菌株,进行Ti质粒介导的转移5-10min,然后接种至协同培养基上3天(在25℃下于暗处)。在协同培养之后,将外植体转移至恢复期培养基中五天(在25℃下于暗处)。取决于利用的特定选择培养基的性质和特性,在合适的选择性培养基中孵育外植体至多八周。在选择周期之后,将所得愈伤组织转移至胚芽熟化培养基,直至观察到成熟的体细胞胚芽形成。然后将所得成熟的体细胞胚芽放置在较低光线下,然后如本领域已知开始再生的操作。使得所得嫩枝在生根培养基中生根,并将所得植物转移至育苗盆和作为转基因植物繁殖。
通过使用气溶胶束(aerosol beam)技术转化具有本发明的编码毒 素的序列的玉米细胞
玉米胚芽由8-12DAP穗中分离,并且那些大小0.8-1.5mm的胚芽用于转化。在例如DN62A5S培养基(3.98g/L N6盐水;1mL/L的1000×储液N6维生素类;800mg/L L-天冬酰胺;100mg/L肌醇;1.4g/L L-脯氨酸;100mg/L酪蛋白氨基酸;50g/L蔗糖;1mL/L的1mg/mL储液2,4-D)的合适孵育培养基中将胚芽接种,子叶盘面向上,并且在25℃下于暗处孵育过夜。将所得外植体转移至网格方块(30-40/板),然后转移至渗透培养基30-45分钟,随后转移至照射板(beamingplate)(参见例如,PCT申请No.WO200138514和美国专利No.5,240,842)。
使用基本上如在PCT申请No.WO200138514中描述的条件,使用气溶胶束加速器将设计在植物细胞中表达本发明的序列的DNA构建体在植物组织中加速生长。在照射之后,将胚芽在渗透培养基上孵育30分钟,然后在25℃下于暗处放置在孵育培养基上过夜。为了避免损害照射的外植体,在转移回收培养基之前,将它们孵育至少24小时。然后在25℃下于暗处将胚芽铺在回收的周期培养基上5天,转移至选择培养基。取决于利用的特定选择的性质和特性,在选择性培养基中孵育外植体至多八周。在选择周期之后,将所得愈伤组织转移至胚芽熟化培养基,直至观察到成熟的体细胞胚芽形成。然后将所得成熟的体细胞胚芽放置在较低光线下,然后通过本领域已知的方法开始再生的操作。使得所得嫩枝在生根培养基中生根,并将所得植物转移至育苗盆和作为转基因植物繁殖。
已经描述本发明的大量实施方案。然而,应理解,在没有违背本发明的精神和范围下,可将本文描述的实施方案的要素合并以得到另外的实施方案以及可得到各种变化形式。因此,其他实施方案、可选择形式和等同形式均在如本文所描述和要求保护的本发明的范围之内。
申请中标题仅为了方便读者,并不以任何方式限制本发明或者本发明的实施方案的范围。
在该说明书中所提及的所有出版物和专利申请通过引用并入本文,以达到如同明确且单独地指出各单独出版物或专利申请通过引用方式并入的程度。

Claims (20)

1.一种识别编码生物毒素的核酸序列的方法,所述方法包括:
生成来自多种微生物分离株的染色体外DNA分子的混合群体;
建立宏基因组序列数据集,所述宏基因组序列数据集包括来源于所述染色体外DNA分子的混合群体的核酸序列;
处理所述宏基因组序列数据集的序列数据以定义至少一个核酸序列重叠群;以及
通过比较步骤(c)的所述至少一个核酸序列重叠群与已知生物毒素序列来识别编码生物毒素的核酸序列。
2.根据权利要求1所述的方法,所述方法进一步包括测定所述微生物分离株的系统分类的步骤。
3.根据权利要求1所述的方法,其中预选所述多种微生物分离株产生至少一种生物毒素的能力。
4.根据权利要求1所述的方法,所述方法进一步包括测定由所述步骤(d)识别的所述核酸序列是否编码新型生物毒素的步骤,其中经识别的所述新型毒素的核酸序列与任何已知生物毒素序列具有小于30%序列同一性。
5.权利要求1所述的方法,其中所述多种微生物分离株包含至少12种微生物分离株。
6.根据权利要求1所述的方法,其中所述微生物分离株的至少一种为细菌。
7.根据权利要求6所述的方法,其中所述细菌具有选自以下的种属:芽孢杆菌属、短芽孢杆菌属、梭菌属、类芽孢杆菌属、光杆状菌属、假单胞菌属、沙雷氏菌属、链霉菌属、和致病杆菌属。
8.根据权利要求1所述的方法,其中通过排除分子克隆的直接测序工序来生成所述宏基因组序列数据集。
9.一种分离的核酸分子,其包含通过权利要求1-8中任一项所述的方法识别的核酸序列。
10.一种分离的核酸分子,其包含:
在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者
表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者
编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的氨基酸序列的核酸序列。
11.一种包含根据权利要求10所述的核酸分子的核酸构建体,其中所述核酸分子可操作连接异源性核酸。
12.一种包含根据权利要求11所述的核酸构建体的宿主细胞。
13.根据权利要求12所述的宿主细胞,其中所述宿主细胞是植物细胞或微生物细胞。
14.一种包含根据权利要求12所述的宿主细胞的宿主有机体。
15.一种来源于根据权利要求14所述的宿主有机体的生物样品或子代。
16.一种赋予有机体杀虫活性的方法,所述方法包括引入根据权利要求10所述的核酸分子至所述有机体,其中将所述核酸分子转录,从而导致如与对照有机体相比,所述有机体对害虫的抵抗性增加。
17.一种分离的多肽,其中所述多肽通过核酸分子来编码,所述核酸分子包含:
在高严格性的条件下与在序列表中任意一个核苷酸序列杂交的核酸序列、其补体或它们任一者的片段;或者
表现出与在序列表中任意一个氨基酸序列的70%或更大序列同一性的核酸序列、其补体或它们任一者的片段;或者
编码表现出与在序列表中任意一个氨基酸序列的50%或更大序列同一性的氨基酸序列的核酸序列。
18.根据权利要求17所述的多肽,其中所述多肽具有杀虫活性。
19.一种包含根据权利要求18所述的多肽的组合物。
20.一种控制害虫的方法,所述方法包括使所述害虫接触或进食所述杀虫有效量的根据权利要求18所述的多肽。
CN201280048598.0A 2011-08-19 2012-08-17 用于高通量识别新型杀虫组合物的整合的方法及其用途 Pending CN103946393A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161525674P 2011-08-19 2011-08-19
US61/525,674 2011-08-19
PCT/US2012/051466 WO2013028563A2 (en) 2011-08-19 2012-08-17 Integrated method for high-throughput identification of novel pesticidal compositions and uses therefor

Publications (1)

Publication Number Publication Date
CN103946393A true CN103946393A (zh) 2014-07-23

Family

ID=47747053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280048598.0A Pending CN103946393A (zh) 2011-08-19 2012-08-17 用于高通量识别新型杀虫组合物的整合的方法及其用途

Country Status (10)

Country Link
US (1) US20130227743A1 (zh)
EP (1) EP2744920A4 (zh)
JP (1) JP6230125B2 (zh)
CN (1) CN103946393A (zh)
AU (2) AU2012299142A1 (zh)
BR (1) BR112014003911A2 (zh)
CA (1) CA2844913A1 (zh)
EA (1) EA025208B1 (zh)
MX (1) MX2014002027A (zh)
WO (1) WO2013028563A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107849097A (zh) * 2015-06-22 2018-03-27 农业生物群落股份有限公司 杀虫基因和使用方法
CN108271390A (zh) * 2015-06-03 2018-07-10 农业生物群落股份有限公司 杀虫基因和使用方法
CN108359673A (zh) * 2018-05-08 2018-08-03 江苏省农业科学院 一种高效杀食用菌眼蕈蚊的Bt cry11基因、编码蛋白及其应用
CN109152369A (zh) * 2016-05-17 2019-01-04 先锋国际良种公司 使用针对鞘翅目有害生物的cyt1a突变体的方法
CN110214189A (zh) * 2016-09-06 2019-09-06 农业生物群落股份有限公司 杀虫基因和使用方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015148976A1 (en) * 2014-03-28 2015-10-01 Monsanto Technology Llc Pesticidal toxin proteins active against coleopteran insects
WO2016154602A1 (en) * 2015-03-26 2016-09-29 Epibiome, Inc. Compositions and methods for pest control
US20160345590A1 (en) * 2015-05-01 2016-12-01 Board Of Regents, The University Of Texas System Chlamydomonas Strains With Chloroplast-Expressed Cry Proteins For Biological Control Of Mosquitoes That Transmit Disease
PE20180775A1 (es) 2015-07-30 2018-05-07 Monsanto Technology Llc Proteinas inhibidoras de insectos novedosas
BR112018007638A2 (pt) * 2015-10-14 2018-11-06 Bayer Cropscience Ag gene da delta-endotoxina axmi554 e métodos para uso do mesmo
WO2019126479A1 (en) * 2017-12-22 2019-06-27 AgBiome, Inc. Pesticidal genes and methods of use
EP3874069A4 (en) * 2018-10-30 2022-12-21 Syngenta Participations AG INSECTICIDAL PROTEINS
WO2022072480A1 (en) * 2020-09-30 2022-04-07 Zymergen Inc. Methods to identify novel insecticidal proteins from complex metagenomic microbial samples
WO2024035660A2 (en) * 2022-08-06 2024-02-15 The Johns Hopkins University Methods, systems and kits for identifying bio active compounds and therapeutic methods and compositions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040014091A1 (en) * 2002-03-11 2004-01-22 Athenix Corporation Integrated system for high throughput capture of genetic diversity
US20080020377A1 (en) * 2004-03-26 2008-01-24 Wolfgang Hillen Peptide-Based Method for Monitorting Gene Expression in a Host Cell
US20090221501A1 (en) * 2003-01-21 2009-09-03 Dow Agrosciences Llc Mixing and matching tc proteins for pest control
US20100298207A1 (en) * 2009-02-27 2010-11-25 Athenix Corporation Pesticidal proteins and methods for their use

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2000601A (en) 1931-07-28 1935-05-07 Eastman Kodak Co Precipitation of cellulose esters
US2007727A (en) 1931-09-21 1935-07-09 Earl B Putt Flavoring and coloring extract
US2007724A (en) 1932-09-17 1935-07-09 Palli Stefano Tubular rubber tire with metal springs
US2007728A (en) 1932-11-22 1935-07-09 George Russell Safety toe cap
US2007723A (en) 1933-01-10 1935-07-09 Midd Alphonso Thomas A Douglas Manufacture of fish liver oils
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4695462A (en) 1985-06-28 1987-09-22 Mycogen Corporation Cellular encapsulation of biological pesticides
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
US5547839A (en) 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5240842A (en) 1989-07-11 1993-08-31 Biotechnology Research And Development Corporation Aerosol beam microinjector
JP3234598B2 (ja) 1990-11-23 2001-12-04 プラント・ジエネテイツク・システムズ・エヌ・ベー 単子葉植物の形質転換方法
US6051380A (en) 1993-11-01 2000-04-18 Nanogen, Inc. Methods and procedures for molecular biological analysis and diagnostics
US5308760A (en) 1992-01-10 1994-05-03 Washington Research Foundation Crystal proteins of Bacillus thuringiensis, genes encoding them, and host expressing them
US5743477A (en) 1992-08-27 1998-04-28 Dowelanco Insecticidal proteins and method for plant protection
US5527883A (en) 1994-05-06 1996-06-18 Mycogen Corporation Delta-endotoxin expression in pseudomonas fluorescens
US6093695A (en) * 1996-09-26 2000-07-25 Monsanto Company Bacillus thuringiensis CryET29 compositions toxic to coleopteran insects and ctenocephalides SPP
US6603063B1 (en) 1999-05-07 2003-08-05 Mycogen Corp. Plants and cells transformed with a nucleic acid from Bacillus thuringiensis strain KB59A4-6 encoding a novel SUP toxin
US7129212B2 (en) 1996-10-30 2006-10-31 Mycogen Corporation Polynucleotides, pesticidal proteins, and novel methods of using them
US6468523B1 (en) 1998-11-02 2002-10-22 Monsanto Technology Llc Polypeptide compositions toxic to diabrotic insects, and methods of use
CA2396392C (en) 1999-11-29 2015-04-21 Midwest Oilseeds, Inc. Methods and compositions for the introduction of molecules into cells
EP1337541B1 (en) 2000-10-06 2007-03-07 The Trustees of Columbia University in the City of New York Massive parallel method for decoding DNA and RNA
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
CA2517216A1 (en) 2003-02-28 2004-10-07 Brown University Nanopores, methods for using same, methods for making same and methods for characterizing biomolecules using same
EP1682680B2 (en) 2003-10-31 2018-03-21 AB Advanced Genetic Analysis Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
US20060231419A1 (en) 2005-04-15 2006-10-19 Barth Philip W Molecular resonant tunneling sensor and methods of fabricating and using the same
US7601499B2 (en) 2005-06-06 2009-10-13 454 Life Sciences Corporation Paired end sequencing
US20060287833A1 (en) 2005-06-17 2006-12-21 Zohar Yakhini Method and system for sequencing nucleic acid molecules using sequencing by hybridization and comparison with decoration patterns
US20070048745A1 (en) 2005-08-30 2007-03-01 Joyce Timothy H Systems and methods for partitioned nanopore analysis of polymers
US9121035B2 (en) * 2005-08-31 2015-09-01 Monsanto Technology Llc Insecticidal compositions and methods for making insect-resistant transgenic plants
US20070190542A1 (en) 2005-10-03 2007-08-16 Ling Xinsheng S Hybridization assisted nanopore sequencing
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
US20070178507A1 (en) 2006-01-31 2007-08-02 Wei Wu Method and apparatus for detection of molecules using nanopores
EP2041163A2 (en) * 2006-06-15 2009-04-01 Athenix Corporation A family of pesticidal proteins and methods for their use
ES2911327T3 (es) * 2008-06-25 2022-05-18 BASF Agricultural Solutions Seed US LLC Genes de toxinas y procedimientos para su uso
CA2754845A1 (en) * 2009-03-11 2010-12-09 Athenix Corporation Axmi-030 insecticidal protein from bacillus thuringiensis and methods for use
WO2010115156A2 (en) 2009-04-03 2010-10-07 Synthetic Genomics, Inc. Endophytic fungus and uses therefor
WO2011009182A2 (pt) 2009-07-24 2011-01-27 Embrapa - Empresa Brasileira De Pesquisa Agropecuária Molécula de ácido nucléico isolada, construção gênica, vetor, célula transgênica, método para obtenção de uma célula e de uma planta transgênica, polipeptídeo isolado e purificado, composição pesticida biodegradável, método para o controle de uma praga, método de obtenção de linhagens transgênicas resistentes a um inseto praga

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040014091A1 (en) * 2002-03-11 2004-01-22 Athenix Corporation Integrated system for high throughput capture of genetic diversity
US20090221501A1 (en) * 2003-01-21 2009-09-03 Dow Agrosciences Llc Mixing and matching tc proteins for pest control
US20080020377A1 (en) * 2004-03-26 2008-01-24 Wolfgang Hillen Peptide-Based Method for Monitorting Gene Expression in a Host Cell
US20100298207A1 (en) * 2009-02-27 2010-11-25 Athenix Corporation Pesticidal proteins and methods for their use

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SUZUKI ET AL.: "High-throughput transposon mutagenesis of corynebacterium glutamicum and construction of a single-gene disruptant mutant libray", 《APPL ENVIRON MICROBIOL》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108271390A (zh) * 2015-06-03 2018-07-10 农业生物群落股份有限公司 杀虫基因和使用方法
CN114805503A (zh) * 2015-06-03 2022-07-29 农业生物群落股份有限公司 杀虫基因和使用方法
CN107849097A (zh) * 2015-06-22 2018-03-27 农业生物群落股份有限公司 杀虫基因和使用方法
CN109152369A (zh) * 2016-05-17 2019-01-04 先锋国际良种公司 使用针对鞘翅目有害生物的cyt1a突变体的方法
CN110214189A (zh) * 2016-09-06 2019-09-06 农业生物群落股份有限公司 杀虫基因和使用方法
CN108359673A (zh) * 2018-05-08 2018-08-03 江苏省农业科学院 一种高效杀食用菌眼蕈蚊的Bt cry11基因、编码蛋白及其应用

Also Published As

Publication number Publication date
WO2013028563A2 (en) 2013-02-28
AU2012299142A1 (en) 2014-02-27
WO2013028563A3 (en) 2014-05-15
JP6230125B2 (ja) 2017-11-15
MX2014002027A (es) 2014-11-10
EP2744920A4 (en) 2015-06-03
JP2014526893A (ja) 2014-10-09
AU2018200012A1 (en) 2018-01-25
US20130227743A1 (en) 2013-08-29
EP2744920A2 (en) 2014-06-25
BR112014003911A2 (pt) 2017-03-14
CA2844913A1 (en) 2013-02-28
EA201490480A1 (ru) 2014-06-30
EA025208B1 (ru) 2016-11-30
AU2018200012A8 (en) 2018-02-22

Similar Documents

Publication Publication Date Title
CN103946393A (zh) 用于高通量识别新型杀虫组合物的整合的方法及其用途
CN102648281B (zh) Axmi‑205杀虫基因和它的使用方法
US20190249190A1 (en) Insect Inhibitory Toxin Family Active Against Hemipteran and/or Lepidopteran Insects
CN102656185B (zh) 杀虫基因的axmi-192家族和使用它们的方法
CN102369286B (zh) 变体axmi-r1δ-内毒素基因和使用它们的方法
CN102421905B (zh) 杀虫蛋白和使用它们的方法
CN101878222B (zh) AXMI-066:δ-内毒素蛋白及其使用方法
JP2022519289A (ja) 生物学的窒素固定による作物収穫高の一貫性の向上
EP2737069B1 (en) Axmi205 variant proteins and methods for their use
CN104263740A (zh) Axmi-il5、axmi-113、axmi-005、axmi-163 和axmi-184∶vip3a 杀虫蛋白及其使用方法
US20140212394A1 (en) Novel vip3 toxins and methods of use
CN104302662B (zh) 苏云金芽孢杆菌毒素基因axmi335及其使用方法
CN103975065A (zh) Axmi279杀虫基因及其使用方法
CN107129992A (zh) 用于控制植物有害生物的组合物和方法
CN103540599A (zh) 编码cry1ac的合成基因
CN107849098A (zh) 用于控制植物有害生物的组合物和方法
CN103635579B (zh) Axmi115变体灭虫基因及其使用方法
CN108473971A (zh) 抗虫性能增强的植物和涉及昆虫抗性基因的构建体和方法
CN109312354A (zh) 杀虫剂基因及使用方法
CN110214189A (zh) 杀虫基因和使用方法
CN109468314B (zh) 玉米事件dp-004114-3及其检测方法
CN110506117A (zh) 杀虫基因及使用方法
CN106998697A (zh) 用于控制植物有害生物的组合物和方法
CN111655853B (zh) 抗虫性能增强的植物和涉及害虫抗性基因的构建体和方法
CN106701789B (zh) 编码苏云金芽孢杆菌晶体蛋白质的基因及其的应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140723