CN108575091A - 杀昆虫蛋白及其使用方法 - Google Patents

杀昆虫蛋白及其使用方法 Download PDF

Info

Publication number
CN108575091A
CN108575091A CN201680074133.0A CN201680074133A CN108575091A CN 108575091 A CN108575091 A CN 108575091A CN 201680074133 A CN201680074133 A CN 201680074133A CN 108575091 A CN108575091 A CN 108575091A
Authority
CN
China
Prior art keywords
seq
xaa
residue
ser
asn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680074133.0A
Other languages
English (en)
Inventor
刘璐
A.鲁姆
J.K.奥拉
C.佩雷兹-奥特加
B.A.M.罗森
U.舍伦伯格
卫俊智
谢卫平
钟晓红
朱根海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
EIDP Inc
Original Assignee
Pioneer Hi Bred International Inc
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc, EI Du Pont de Nemours and Co filed Critical Pioneer Hi Bred International Inc
Publication of CN108575091A publication Critical patent/CN108575091A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N37/00Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
    • A01N37/42Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing within the same carbon skeleton a carboxylic group or a thio analogue, or a derivative thereof, and a carbon atom having only two bonds to hetero atoms with at the most one bond to halogen, e.g. keto-carboxylic acids
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Pest Control & Pesticides (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Dentistry (AREA)
  • Environmental Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Insects & Arthropods (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明提供了用于控制有害生物的组合物和方法。这些方法涉及用编码杀昆虫蛋白的核酸序列来转化生物体。具体地,这些核酸序列可用于制备具有杀昆虫活性的植物和微生物。因此,提供了经转化的细菌、植物、植物细胞、植物组织以及种子。组合物是细菌物种的杀昆虫核酸和蛋白。这些序列在用于随后转化到包括植物在内的目的生物体中的表达载体的构建中具有用途,充当用于分离其他同源(或部分同源的)基因的探针。这些杀有害生物蛋白可用于控制鳞翅目(Lepidopteran)、鞘翅目(C0leopteran)、双翅目(Dipteran)、真菌、半翅目(Hemipteran)和线虫有害生物群体、抑制其生长或将其杀灭,并且可用于生产具有杀昆虫活性的组合物。

Description

杀昆虫蛋白及其使用方法
相关申请的交叉引用
本申请要求于2015年12月18日提交的美国临时申请号 61/269482的优先权,该申请以其全文通过引用并入本文中。
以电子方式提交的序列表的引用
该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以 电子方式提交,文件名为“6048WOPCT_Sequence_Listing”,创建于 2016年9月19日,且具有172千字节大小,并与本说明书同时提交。 包含在该ASCII格式的文件中的序列表是说明书的一部分并通过引用 以其全文结合在此。
发明领域
本公开涉及分子生物学领域。提供了编码杀有害生物蛋白的新颖 基因。这些杀有害生物蛋白和编码它们的核酸序列可用于制备杀有害 生物配制品和生产转基因有害生物抗性植物。
背景技术
使用微生物剂(如真菌、细菌或其他昆虫物种)对具有农业意义 的昆虫有害生物进行生物防治,为合成型化学杀有害生物剂提供了环 境友好且有商业吸引力的替代方案。一般来说,使用生物杀有害生物 剂造成污染和环境危害的风险较低,并且生物杀有害生物剂提供比传 统广谱化学杀昆虫剂所特有的靶特异性更强。此外,生物杀有害生物 剂往往生产成本较低,并且因此能提高各种作物的经济产量。
已知芽孢杆菌属微生物的某些物种对于一系列昆虫有害生物具 有杀有害生物活性,这些昆虫有害生物包括鳞翅目(Lepidoptera)、 双翅目(Diptera)、鞘翅目(Coleoptera)、半翅目(Hemiptera)等。 苏云金芽孢杆菌(Bacillus thuringiensis,Bt)和日本金龟子芽孢杆菌 (Bacillus popilliae)是迄今为止发现的最成功的生物防治剂。昆虫致 病性还归因于幼虫芽孢杆菌(B.larvae)、缓病芽孢杆菌(B. lentimorbus)、球形芽孢杆菌(B.sphaericus)和蜡状芽孢杆菌(B.cereus) 的菌株。微生物杀昆虫剂,特别是从芽孢杆菌属菌株获得的那些微生 物杀昆虫剂,在农业上作为有害生物化学防治的替代方案起着重要作 用。
通过将作物植物进行遗传工程改造以生产来自芽孢杆菌属 (Bacillus)的杀有害生物蛋白,已经开发出昆虫抗性增强的作物植物。 例如,已经对玉米和棉花植物进行遗传工程改造以产生从苏云金芽孢 杆菌(Bacillus thuringiensis)株分离的杀有害生物蛋白。现在,这些 遗传工程化作物广泛应用于农业中,并且为农民提供了取代传统昆虫 防治方法的环境友好型替代方案。虽然它们已被证明在商业上非常成 功,但是这些遗传工程化抗昆虫作物植物仅针对窄范围的经济上重要 的昆虫有害生物提供抗性。在某些情况下,昆虫可以对不同杀昆虫化 合物产生抗性,这就导致需要鉴别用于有害生物防治的替代性生物防 治剂。
因此,仍然需要对昆虫有害生物具有不同范围的杀昆虫活性的新 颖杀有害生物蛋白质,例如针对鳞翅目和鞘翅目中的各种昆虫具有活 性的杀昆虫蛋白质,这些昆虫包括但不限于已对现存杀昆虫剂产生抗 性的昆虫有害生物。
发明内容
在一个方面,提供了用于对细菌、植物、植物细胞、组织以及种 子赋予杀有害生物活性的组合物和方法。组合物包含杀有害生物和杀 昆虫多肽的核酸分子编码序列、包含那些核酸分子的载体、以及包含 这些载体的宿主细胞。组合物还包括杀有害生物多肽序列和那些多肽 的抗体。组合物还包含经转化的细菌、植物、植物细胞、组织以及种 子。
在另一方面,提供了编码IPD082多肽的分离的或重组的核酸分 子,这些多肽包括氨基酸取代、缺失、插入、和其片段。提供了能够 编码SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、 SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、 SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、 SEQ ID NO:26、或SEQ ID NO:28以及氨基酸取代、缺失、插入、其 片段、及其组合的IPD082多肽的分离的或重组的核酸分子。还涵盖 了与实施例的核酸序列互补或与实施例的序列杂交的核酸序列。这些 核酸序列可以在DNA构建体或表达盒中使用,以用于在多种生物体 (包括微生物和植物)中进行转化和表达。这些核苷酸或氨基酸序列 可以是合成序列,这些合成序列已经被设计用于在生物体中表达,该 生物体包括但不限于:微生物或植物。
在另一方面涵盖IPD082多肽。还提供了SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 以及氨基酸取代、缺失、插入、其片段及其组合的分离的或重组的 IPD082多肽。
在另一方面,提供了用于产生多肽和使用那些多肽用来控制或杀 死鳞翅目、鞘翅目、线虫、真菌、和/或双翅目有害生物的方法。实施 例的转基因植物表达本文公开的杀有害生物序列中的一种或多种。在 不同的实施例中,该转基因植物进一步包含一种或多种另外的昆虫抗 性基因,例如,用于控制鞘翅目、鳞翅目、半翅目或线虫有害生物的 一种或多种另外的基因。本领域技术人员将理解,转基因植物可以包 含给予目的农艺性状的任何基因。
在另一方面,还包括用于检测在样品中的实施例的这些核酸和多 肽的方法。提供了用于检测样品中IPD082多肽的存在或检测编码 IPD082多肽的多核苷酸序列的存在的试剂盒。该试剂盒可以与实施检 测预期试剂的方法所需的所有试剂和对照样品,以及使用说明书一起 提供。
在另一方面,实施例的这些组合物和方法可用于产生具有增强的 有害生物抗性或耐受性的生物体。这些生物体以及包含这些生物体的 组合物对于农业目的是所希望的。实施例的组合物还可用于产生具有 杀有害生物活性的经改变或改进的蛋白质,或用于检测IPD082多肽 的存在。
附图说明
图1A-1E显示使用Vector套件的模块, IPD082Aa(SEQ ID NO:2)、IPD082Ab(SEQ ID NO:4)、IPD082He (SEQ ID NO:14)、IPD082Ia(SEQ ID NO:16)、IPD082Ig(SEQ ID NO:28)、IPD082Ib(SEQ ID NO:18)、IPD082Hd(SEQ ID NO:12)、IPD082Ie(SEQ ID NO:24)、IPD082If(SEQ ID NO:26)、IPD082Ha (SEQ ID NO:6)、IPD082Hb(SEQ ID NO:8)、IPD082Hc(SEQ ID NO:10)、IPD082Ic(SEQ ID NO:20)、和IPD082Id(SEQ IDNO:22) 的氨基酸序列比对。保守的C-末端区域(SEQ ID NO:32的残基 379-514)在IPD082Aa序列(SEQ ID NO:2)中以下划线表示。氨基 酸序列之间的相同和保守的氨基酸残基被突出显示。
图2显示IPD082多肽家族的系统发育树。
图3显示使用Vector套件的模块,IPD082 Ha (SEQ ID NO:6)和IPD082Hb(SEQ ID NO:8)的氨基酸序列比对。 保守的C-末端区域在序列下方指示。氨基酸序列之间的氨基酸序列多 样性被突出显示。
图4A-4B显示使用Vector套件的模块, IPD082Aa(SEQ ID NO:2)和IPD082Ab(SEQ ID NO:4)的氨基酸 序列比对。N-末端区域中重复的氨基酸序列基序在序列下方指示。保 守的C-末端区域在序列下方指示。氨基酸序列之间的氨基酸序列多样性被突出显示。位置由序列上方的表示,其中IPD082Aa多肽(SEQ ID NO:2)中的氨基酸取代在实例10中被鉴定,这些氨基酸取代可溶 解地表达并针对西方玉米根虫显示出杀昆虫活性。
图5显示使用Vector套件的模块,IPD082Hc (SEQ ID NO:10)、IPD082Ic(SEQ ID NO:20)、和IPD082Id(SEQ ID NO:22)的氨基酸序列比对。保守的C-末端区域在序列下方指示。 氨基酸序列之间的氨基酸序列多样性被突出显示。
图6A-6B显示使用Vector套件的模块, IPD082Hd(SEQ ID NO:12)、IPD082Ie(SEQ ID NO:24)、和IPD082If (SEQ ID NO:26)的氨基酸序列比对。保守的C-末端区域在序列下 方指示。氨基酸序列之间的氨基酸序列多样性被突出显示。
图7A-7B显示使用Vector套件的模块,IPD082Ia (SEQ ID NO:16)、IPD082Ib(SEQ ID NO:18)、和IPD082Ig(SEQ ID NO:28)的氨基酸序列比对。保守的C-末端区域在序列下方指示。 氨基酸序列之间的氨基酸序列多样性被突出显示。
图8显示使用Vector套件的模块,重复的氨基 酸序列基序Aa1(SEQ ID NO:2的残基21-68)、Ab1(SEQ ID NO:4 的残基1-48)、Aa3(SEQ ID NO:2的残基117-164)、Ab3(SEQ ID NO:4的残基97-144)、Aa4(SEQ ID NO:2的残基165-212)、Ab4 (SEQID NO:4的残基145-192)、Aa2(SEQ ID NO:2的残基69-116)、 Ab2(SEQ ID NO:4的残基49-96)、Aa6(SEQ ID NO:2的残基 263-306)、Ab6(SEQ ID NO:4的残基243-286)、Aa5(SEQ IDNO: 2的残基213-262)、和Ab5(SEQ ID NO:4的残基193-242)的氨基 酸序列比对。
图9显示使用Vector套件的模块,IPD082Aa (SEQ ID NO:2的残基379-514)、IPD082Ab(SEQ ID NO:4的残基 359-494)、IPD082Ia(SEQ ID NO:16的残基415-548)、IPD082Ig (SEQ ID NO:28的残基415-548)、IPD082Ib(SEQ ID NO:18的残 基419-552)、IPD082Hd(SEQ ID NO:12的残基227-359)、IPD082Ie (SEQ ID NO:24的残基568-700)、IPD082If(SEQ ID NO:26的残 基568-700)、IPD082Hc(SEQ ID NO:10的残基171-299)、IPD082Ic (SEQ ID NO:20的残基196-324)、IPD082Id(SEQ ID NO:22的残 基196-324)、IPD082Hb(SEQ ID NO:8的残基174-302)、和IPD082Ha (SEQ ID NO:6的残基174-302)的保守C-末端区域的氨基酸序列比 对。在氨基酸序列中的相同和保守的氨基酸残基被突出显示。
图10显示用于表达编码IPD082Aa多肽的多核苷酸作为N-末端 片段和C-末端片段的多顺反子表达盒的代表性示意图。将T7启动子 (T7-Pro)的单拷贝用于表达IPD082Aa-1多核苷酸和IPD082Aa-2多 核苷酸,所述多核苷酸编码作为具有间插因子Xa切割位点的10XHis 标记的(10-His)融合物的IPD082Aa的N-末端片段和作为IPD082Aa 的两个分离多肽的C-末端片段。显示针对IPD082Aa的多顺反子表达 盒的DNA序列(SEQ ID NO:32),其中T7-Pro/10XHis-IPD082Aa N- 末端融合多肽编码序列以下划线显示,并且IPD082Aa C-末端多肽编 码序列以双下划线显示。
图11显示使用T7启动子(T7-Pro)的两个拷贝,pETDuetTM-1 表达盒用于表达编码作为N-末端片段和C-末端片段的IPD082Aa多肽 的IPD082Aa-1和IPD082Aa-2多核苷酸的代表性示意图。
具体实施方式
应理解,本公开不局限于所描述的特定方法、方案、细胞系、属、 以及试剂,因此可以变化。还应当理解的是在此使用的术语是仅为了 描述具体实施例的目的,并且不旨在限制本公开的范围。
如本文所用,单数形式“一个/种(a/an)”以及“该”包括复数 个指示物,除非上下文中另外明确指明。因此,例如,提及“细胞” 包括多个这样的细胞,并且提及“蛋白质”包括本领域技术人员已知 的一种或多种蛋白质及其等效物等。本文使用的所有技术和科学术语 具有与本公开所属领域的普通技术人员通常所理解相同的含义,除非 另有明确说明。
本公开涉及用于控制有害生物的组合物和方法。这些方法涉及用 编码IPD082多肽的核酸序列转化生物体。具体地,实施例的核酸序 列可用于制备具有杀有害生物活性的植物和微生物。因此,提供了经 转化的细菌、植物、植物细胞、植物组织以及种子。组合物是细菌物 种的杀有害生物核酸和蛋白。这些核酸序列可用于表达载体的构建, 用于随后转化到目的生物体中,作为用于分离其他同源(或部分同源) 基因的探针,并且通过本领域已知的方法(如定点诱变、结构域交换 或DNA改组)用于生产经改变的IPD082多肽。IPD082多肽可用于 控制或杀灭鳞翅目、鞘翅目、双翅目、真菌、半翅目和线虫有害生物 群体,并可用于生产具有杀有害生物活性的组合物。目的昆虫有害生 物包括但不限于鳞翅目物种(包括但不限于:例如玉米穗蛾(CEW) (玉米穗虫(Helicoverpa zea))、欧洲玉米螟(ECB)(玉米螟(Ostrinia nubilalis))、小菜蛾,例如棉铃虫(Helicoverpa zea Boddie);大豆 尺蠖,例如大豆尺夜娥(Pseudoplusia includens Walker);和绒毛豆 毛虫,例如大豆夜蛾(Anticarsia gemmatalis Hübner))和鞘翅目物种 (包括但不限于西方玉米根虫(玉米根萤叶甲)-WCRW、南方玉米 根虫(斑点黄瓜甲虫(Diabrotica undecimpunctata howardi))-SCRW、 和北方玉米根虫(Northern corn rootworm,Diabrotica barberi) -NCRW)。
“杀有害生物毒素”或“杀有害生物蛋白”在此用于是指毒素或 与这种蛋白质具有同源性的蛋白质,该毒素具有针对以下一种或多种 有害生物的毒性活性,这些有害生物包括但不局限于:鳞翅目、双翅 目、半翅目以及鞘翅目或线虫门的成员。已经从生物体中分离出杀有 害生物蛋白,这些生物体包括例如,芽孢杆菌属物种(Bacillus sp.)、 假单胞菌属物种(Pseudomonas sp.)、发光杆菌属物种(Photorhabdus sp.)、致病杆菌属物种(Xenorhabdus sp.)、双酶梭菌(Clostridium bifermentans)以及鲍比氏类芽孢杆菌(Paenibacillus popilliae)。杀 有害生物蛋白包括但不限于:来自假单胞菌属物种(Pseudomonas sp.), 如PSEEN3174(Monalysin;(2011)PLoS Pathogens[公共科学图书馆]7:1-13)的杀昆虫蛋白;来自假单胞菌(Pseudomonas protegens) 菌株CHA0和Pf-5(以前称为荧光菌(fluorescens))(Pechy-Tarr, (2008)Environmental Microbiology[环境微生物学]10:2368-2386; GenBank登录号EU400157)的杀昆虫蛋白;来自台湾假单胞菌(Pseudomonas taiwanensis)(Liu等人,(2010)J.Agric.Food Chem.[农 业食品化学学报]58:12343-12349)和来自假产碱假单胞菌 (Pseudomonas pseudoalcaligenes)(Zhang等人,(2009)Annals of Microbiology[微生物学年报]59:45-50和Li等人,(2007)PlantCell Tiss. Organ Cult.[植物细胞组织和器官培养]89:159-168)的杀昆虫蛋白;来 自发光杆菌属物种和致病杆菌属物种(Hinchliffe等人,(2010)The Open Toxicology Journal[开放毒理学杂志],3:101-118和Morgan等 人,(2001)Applied and Envir.Micro.[应用与环境微生物学]67: 2062-2069)的杀昆虫蛋白;来自美国专利号6,048,838和美国专利号6,379,946的杀昆虫蛋白;美国专利公开号US 20140007292的PIP-1 多肽;美国专利公开号US 20140033361的AnP-1A和/或AnP-1B多 肽;美国序列号13/839702的PHI-4多肽;PCT序列号PCT/US14/51063 的PIP-47多肽、PCT序列号PCT/US14/55128的PIP-72多肽,以及δ- 内毒素,包括但不限于Cry1、Cry2、Cry3、Cry4、Cry5、Cry6、Cry7、 Cry8、Cry9、Cry10、Cry11、Cry12、Cry13、Cry14、Cry15、Cry16、 Cry17、Cry18、Cry19、Cry20、Cry21、Cry22、Cry23、Cry24、Cry25、 Cry26、Cry27、Cry28、Cry29、Cry30、Cry31、Cry32、Cry33、Cry34、 Cry35,Cry36、Cry37、Cry38、Cry39、Cry40、Cry41、Cry42、Cry43、 Cry44、Cry45、Cry46、Cry47、Cry49、Cry50、Cry51、Cry52、Cry53、 Cry54、Cry55、Cry56、Cry57、Cry58、Cry59、Cry60、Cry61、Cry62、 Cry63、Cry64、Cry65、Cry66、Cry67、Cry68、Cry69、Cry70、Cry71、 和Cry 72类的δ-内毒素基因和苏云金芽孢杆菌溶细胞cyt1和cyt2基 因。这些类别的苏云金芽孢杆菌杀昆虫蛋白的成员是本领域技术人员 熟知的(参见,Crickmore等人,“Bacillusthuringiensis toxin nomenclature[苏云金芽孢杆菌毒素命名法]”(2011),在lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/,可以使用“www”前缀 在万维网上访问该网址。
δ-内毒素的实例还包括但不限于:美国专利号5,880,275和 7,858,849的Cry1A蛋白;美国专利号8,304,604、8,304,605和8,476,226 的DIG-3或DIG-11毒素(cry蛋白(如Cry1A、Cry3A)的α螺旋1 和/或α螺旋2变体的N末端缺失);美国专利申请序列号10/525,318的Cry1B;美国专利号6,033,874的Cry1C;美国专利号5,188,960和 6,218,188的Cry1F;美国专利号7,070,982、6,962,705和6,713,063) 的Cry1A/F嵌合体;美国专利号7,064,249的Cry2蛋白如Cry2Ab蛋 白;Cry3A蛋白,包括但不限于:通过融合至少两种不同Cry蛋白的 可变区和保守区的独特组合产生的工程化杂合杀昆虫蛋白(eHIP) (美国专利申请公开号2010/0017914);Cry4蛋白;Cry5蛋白;Cry6 蛋白;美国专利号7,329,736、7,449,552、7,803,943、7,476,781、 7,105,332、7,378,499和7,462,760的Cry8蛋白;Cry9蛋白如Cry9A、Cry9B、Cry9C、Cry9D、Cry9E和Cry9F家族的成员;Cry15蛋白, 描述于以下文献中:Naimov等人(2008)Applied and Environmental Microbiology[应用与环境微生物学]74:7145-7151;美国专利号 6,127,180、6,624,145和6,340,593的Cry22、Cry34Ab1蛋白;美国专 利号6,248,535、6,326,351、6,399,330、6,949,626、7,385,107和7,504,229 的CryET33和cryET34蛋白;美国专利公开号2006/0191034、 2012/0278954,和PCT公开号WO 2012/139004的CryET33和CryET34 同源物;美国专利号6,083,499、6,548,291和6,340,593的Cry35Ab1 蛋白;Cry46蛋白、Cry 51蛋白、Cry二元毒素;TIC901或相关毒素; 美国专利申请公开号2008/0295207的TIC807;PCT US 2006/033867 的ET29、ET37、TIC809、TIC810、TIC812、TIC127、TIC128;美国 专利号8,236,757的AXMI-027、AXMI-036和AXMI-038;美国专利 号7,923,602的AXMI-031、AXMI-039、AXMI-040、AXMI-049;WO 2006/083891的AXMI-018、AXMI-020和AXMI-021;WO 2005/038032 的AXMI-010;WO 2005/021585的AXMI-003;美国专利申请公开号 2004/0250311的AXMI-008;美国专利申请公开号2004/0216186的 AXMI-006;美国专利申请公开号2004/0210965的AXMI-007;美国 专利申请号2004/0210964的AXMI-009;美国专利申请公开号 2004/0197917的AXMI-014;美国专利申请公开号2004/0197916的 AXMI-004;WO 2006/119457的AXMI-028和AXMI-029;WO 2004/074462的AXMI-007、AXMI-008、AXMI-0080rf2、AXMI-009、 AXMI-014和AXMI-004;美国专利号8,084,416的AXMI-150;美国 专利申请公开号2011/0023184的AXMI-205;美国专利申请公开号 2011/0263488的AXMI-011、AXMI-012、AXMI-013、AXMI-015、 AXMI-019、AXMI-044、AXMI-037、AXMI-043、AXMI-033、 AXMI-034、AXMI-022、AXMI-023、AXMI-041、AXMI-063和 AXMI-064;美国专利申请公开号2010/0197592的AXMI-R1和相关蛋 白;WO 2011/103248的AXMI221Z、AXMI222z、AXMI223z、 AXMI224z和AXMI225z;WO 2011/103247的AXMI218、AXMI219、AXMI220、AXMI226、AXMI227、AXMI228、AXMI229、AXMI230 和AXMI231;美国专利号8,334,431的AXMI-115、AXMI-113、 AXMI-005、AXMI-163和AXMI-184;美国专利申请公开号 2010/0298211的AXMI-001、AXMI-002、AXMI-030、AXMI-035和 AXMI-045;美国专利申请公开号2009/0144852的AXMI-066和 AXMI-076;美国专利号8,318,900的AXMI128、AXMI130、AXMI131、 AXMI133、AXMI140、AXMI141、AXMI142、AXMI143、AXMI144、 AXMI146、AXMI148、AXMI149、AXMI152、AXMI153、AXMI154、 AXMI155、AXMI156、AXMI157、AXMI158、AXMI162、AXMI165、 AXMI166、AXMI167、AXMI168、AXMI169、AXMI170、AXMI171、 AXMI172、AXMI173、AXMI174、AXMI175、AXMI176、AXMI177、 AXMI178、AXMI179、AXMI180、AXMI181、AXMI182、AXMI185、 AXMI186、AXMI187、AXMI188、AXMI189;美国专利申请公开号 2010/0005543的AXMI079、AXMI080、AXMI081、AXMI082、 AXMI091、AXMI092、AXMI096、AXMI097、AXMI098、AXMI099、 AXMI100、AXMI101、AXMI102、AXMI103、AXMI104、AXMI107、 AXMI108、AXMI109、AXMI110、AXMI111、AXMI112、AXMI114、 AXMI116、AXMI117、AXMI118、AXMI119、AXMI120、AXMI121、 AXMI122、AXMI123、AXMI124、AXMI1257、AXMI1268、AXMI127、 AXMI129、AXMI164、AXMI151、AXMI161、AXMI183、AXMI132、 AXMI138、AXMI137,具有美国专利号8,319,019的修饰的蛋白水解 位点的cry蛋白如Cry1A和Cry3A;美国专利申请公开号2011/0064710 的来自苏云金芽孢杆菌菌株VBTS 2528的Cry1Ac、Cry2Aa和Cry1Ca 毒素蛋白。Cry蛋白的杀昆虫活性是本领域技术人员所熟知的(综述 参见van Frannkenhuyzen,(2009)J.Invert.Path.[无脊椎动物病理学杂 志]101:1-16)。使用Cry蛋白作为转基因植物性状是本领域技术人员 所熟知的,并且Cry-转基因植物(包括但不限于表达以下的植物: Cry1Ac、Cry1Ac+Cry2Ab、Cry1Ab、Cry1A.105、Cry1F、Cry1Fa2、 Cry1F+Cry1Ac、Cry2Ab、Cry3A、mCry3A、Cry3Bb1、Cry34Ab1、 Cry35Ab1、Vip3A、mCry3A、Cry9c和CBI-Bt)已获得法规性审批(参 见,Sanahuja,(2011)Plant Biotech Journal[植物生物技术杂志] 9:283-300和CERA(2010)环境风险评估的转基因作物数据库中心 (CERA)(GM Crop Database Center forEnvironmental Risk Assessment(CERA)),ILSI研究基金会(ILSI ResearchFoundation), 华盛顿特区,网址为cera-gmc.org/index.php?action=gm_crop_database, 可以使用“www”前缀在万维网上访问该网址)。本领域技术人员熟 知的多于一种杀有害生物蛋白也可以在植物如Vip3Ab和Cry1Fa(US 2012/0317682);Cry1BE和Cry1F(US 2012/0311746);Cry1CA和 Cry1AB(US 2012/0311745);Cry1F和CryCa(US 2012/0317681); Cry1DA和Cry1BE(US 2012/0331590);Cry1DA和Cry1Fa(US 2012/0331589);Cry1AB和Cry1BE(US 2012/0324606);Cry1Fa 和Cry2Aa以及Cry1I和Cry1E(US 2012/0324605);Cry34Ab/35Ab 和Cry6Aa(US20130167269);Cry34Ab/VCry35Ab和Cry3Aa(US20130167268);以及Cry3A和Cry1Ab或Vip3Aa(US20130116170) 中表达。杀有害生物蛋白还包括杀昆虫脂肪酶,这些杀昆虫脂肪酶包 括美国专利号7,491,869的脂质酰基水解酶,以及胆固醇氧化酶,例 如来自链霉菌(Streptomyces)(Purcell等人,(1993)BiochemBiophys Res Commun[生物化学与生物物理研究通讯]15:1406-1413)。杀有害 生物蛋白还包括美国专利号5,877,012、6,107,279 6,137,033、7,244,820、 7,615,686、和8,237,020等的VIP(营养期杀昆虫蛋白)毒素。其他 VIP蛋白质是本领域技术人员熟知的(参见,lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/vip.html,其可以使用 “www”前缀在万维网上访问)。杀有害生物蛋白还包括毒素复合物 (TC)蛋白,该毒素复合物(TC)蛋白可从生物体如致病杆菌属、 发光杆菌属和类芽孢杆菌属获得(参见,美国专利号7,491,698和8,084,418)。一些TC蛋白具有“独立”杀昆虫活性并且其他TC蛋 白增强由相同给定生物体产生的独立毒素(stand-alone toxin)的活性。 可以通过源自不同属的来源生物体的一种或多种TC蛋白“增效剂” 来增强“独立”TC蛋白(例如来自发光杆菌属、致病杆菌属或类芽孢杆菌属)的毒性。有三种主要类型的TC蛋白。如本文所提及的, A类蛋白(“蛋白A”)是独立毒素。B类蛋白(“蛋白B”)和C 类蛋白(“蛋白C”)提高了A类蛋白的毒性。A类蛋白的实例是TcbA、TcdA、XptA1和XptA2。B类蛋白的实例是TcaC、TcdB、XptB1Xb 和XptC1Wi。C类蛋白的实例是TccC、XptC1Xb和XptB1Wi。杀有 害生物蛋白还包括蜘蛛、蛇和蝎毒蛋白。蜘蛛肽的实例包括但不限于 莱科毒素-1肽及其突变体(美国专利号8,334,366)。
在一些实施例中,IPD082多肽包含从本文公开的全长核酸序列 推导出的氨基酸序列,以及由于使用替代性下游起始位点、或由于加 工产生具有杀虫活性的较短蛋白而比全长序列短的氨基酸序列。加工 可以在表达该蛋白的生物体内或在摄取蛋白后的有害生物中发生。
因此,本文提供了赋予杀有害生物活性的新颖的分离的或重组的 核酸序列。还提供了IPD082多肽的氨基酸序列。由这些IPD082基因 翻译产生的蛋白允许细胞控制或杀灭摄取该蛋白质的有害生物。
IPD082蛋白及其变体和片段
本公开涵盖了IPD082多肽。本文中可互换地使用的“IPD082多 肽”和“IPD082蛋白”是指具有杀昆虫活性(包括但不限于对鳞翅目 和/或鞘翅目的一种或多种昆虫有害生物的杀昆虫活性)的多肽,并且 与SEQ ID NO:1的IPD082Aa多肽充分同源。多种IPD082多肽是预 期的。IPD082多肽的来源或相关的蛋白质包括选自但不限于假单胞菌 属(Pseudomonas)物种的细菌物种。
本文所使用的“充分同源”是指,使用标准参数、使用本文所述 的比对程序之一,与参比序列相比,具有至少约40%、45%、50%、 51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、 62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。在一 些实施例中,序列同源性针对IPD082多肽的全长序列。在一些实施 例中,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO: 8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、 SEQ ID NO:26、或SEQ ID NO:28相比,IPD082多肽具有至少约40%、 45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、 60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、 71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。在 本文中与序列同一性百分比一起使用时,术语“约”意指+/-0.5%。本 领域技术人员将认识到,考虑到氨基酸相似性等,可以适当地调整这 些值以确定蛋白质的相应同源性。在一些实施例中,使用ClustalW算 法在Vector程序套件(英杰公司(Invitrogen Corporation),卡 尔斯巴德,加利福尼亚州)的模块中在所有默认参数下计 算该序列同一性。在一些实施例中,序列同一性贯穿于多肽的整个长 度,使用具有所有默认参数的Vector程序套件(加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen Corporation))的模块 中的ClustalW算法进行计算。
如本文所用,术语“蛋白质”、“肽分子”、或“多肽”包括包 含五个或更多个氨基酸的任何分子。本领域熟知蛋白质、肽或多肽分 子可以进行改性,该改性包括翻译后改性,如但不限于二硫键形成、 糖基化、磷酸化或寡聚化。因此,如本文所用,术语“蛋白质”、“肽 分子”或“多肽”包括通过任何生物或非生物过程改性的任何蛋白质。 术语“氨基酸”是指所有天然存在的L-氨基酸。
在此使用的“重组蛋白”是指不再在其天然环境中的蛋白质,例 如在体外或重组细菌或植物宿主细胞中。基本上不含细胞材料的 IPD082多肽包括具有小于约30%、20%、10%或5%(以干重计)的 非杀有害生物蛋白的蛋白质的制剂(在此也称为“污染蛋白”)。
“片段”或“生物活性部分”包括包含与IPD082多肽充分同一 并且显示杀昆虫活性的氨基酸序列的多肽片段。IPD082多肽的“片段” 或“生物活性部分”包括含有与SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ IDNO:26、或SEQ ID NO:28中列出的氨基酸 序列充分同一的氨基酸序列的片段,其中该IPD082多肽具有杀昆虫 活性。这样的生物活性部分可以通过重组技术制备并评价杀昆虫活 性。在一些实施例中,IPD082多肽片段是来自相对于SEQ ID NO:2、 SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的N-末端和/或C-末端的至少1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、25、26、27、28、 29、30、31、32、33、34或更多个氨基酸的N-末端和/或C-末端截短, 例如通过蛋白质水解、通过初始密码子的插入、通过编码缺失的氨基 酸的密码子的缺失并伴随初始密码子的插入、和/或终止密码子的插 入。
本文使用的“变体”是指具有如下氨基酸序列的蛋白质或多肽, 该氨基酸序列与亲本氨基酸序列具有至少约50%、55%、60%、65%、 70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更高同一性。
IPD082多肽
在一些实施例中,IPD082多肽包含与SEQ ID NO:2、SEQ ID NO: 4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 的氨基酸序列具有至少约40%、45%、50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、 66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、 77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列,其中该IPD082多肽具有杀昆虫活 性。
在一些实施例中,IPD082多肽包含与贯穿SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28 的氨基酸序列的整个长度具有至少约80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更高同一性的氨基酸序列。
在一些实施例中,序列同一性贯穿于多肽的整个长度,使用具有 所有默认参数的Vector程序套件(加利福尼亚州卡尔斯巴德的 英杰公司(InvitrogenCorporation))的模块中的ClustalW 算法进行计算。
在一些实施例中,IPD082多肽包含与贯穿SEQ ID NO:2的氨基 酸序列的整个长度具有至少约80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%或更高同一性的氨基酸序列。
在一些实施例中,IPD082多肽包含与贯穿SEQ ID NO:2的氨基 酸序列的整个长度具有高于97%、98%、99%或更高同一性的氨基酸 序列。
在一些实施例中,IPD082多肽不包含SEQ ID NO:2、SEQ ID NO: 4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 的氨基酸序列。
在一些实施例中,IPD082多肽包含具有下式的氨基酸序列:
其中
位置40处的Xaa是Tyr或Phe;位置48处的Xaa是Phe、Gly、 Ala、Val、Leu、Ile、Met、Ser、Thr、Cys、Tyr、Asn、Glu、Lys或 His;位置58处的Xaa是Trp或Tyr;位置69处的Xaa是Met、Leu、 Ser、Thr或Asp;位置70处的Xaa是Gly或Asn;位置71处的Xaa 是Gln、Leu、Ser、Glu或His;位置72处的Xaa是Glu、Gly、Ala、 Pro、Cys或Asp;位置73处的Xaa是Thr、Val、Leu或Arg;位置 74处的Xaa是Ala、Leu、Met、Ser或Arg;位置77处的Xaa是Arg、 Gly、Ala、Trp、Tyr或Glu;位置78处的Xaa是Trp、Glu或His; 位置79处的Xaa是Asp、Val或Asn;位置80处的Xaa是Asn、Gly、 Ala、Val、Leu、Ser或Arg;位置81处的Xaa是Pro或Ser;位置95 处的Xaa是Phe或Tyr;位置96处的Xaa是Phe、Met、Trp或Lys; 位置106处的Xaa是Trp或Tyr;位置144处的Xaa是Phe、Ala、Ile、 Ser或Gln;位置173处的Xaa是Thr或Tyr;位置174处的Xaa是 Leu、Val、Asn、Glu或Lys;位置175处的Xaa是Asp、Gly、Ser、 Thr或Asp;位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys或 Asn;位置198处的Xaa是Lys或Asn;位置199处的Xaa是Asp或 Asn;位置235处的Xaa是Glu或Gln;位置242处的Xaa是Phe或 Trp;位置252处的Xaa是Trp、Phe或Cys;位置290处的Xaa是Phe 或Thr;位置300处的Xaa是Trp、Val或Glu;位置318处的Xaa是 Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、Asp、Glu、Lys或Arg; 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、Cys、 Tyr、Asn或Arg;位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、Arg或His;位置321处的Xaa是Tyr、Val、Leu、Ile、 Met、Phe、Ser、Thr、Cys、Tyr、Gln、Lys、Arg或His;位置322处 的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、Thr、Gln、Asp、 Lys或Arg;位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、 Arg、Asn或His;位置324处的Xaa是Ser、Ala、Val、Leu、Phe、 Pro、Ser、Thr、Gln或Arg;位置325处的Xaa是Thr、Gly、Val、 Leu、Met、Trp、Pro、Cys、Asn、Asp、Glu、Ala或Arg;位置326 处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、Cys、Asn、 Glu或Arg;位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、 Pro、Asn、Asp、Glu、Lys或Arg;位置330处的Xaa是Gln或Glu; 位置331处的Xaa是Ser或Gly;位置358处的Xaa是Ala、Ala、Ile 或Arg;位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、 Tyr或Lys;位置361处的Xaa是Ile、Met或Ser;位置362处的Xaa 是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu或Lys;位置364处的 Xaa是Val或Phe;位置365处的Xaa是Lys、Leu或Thr;位置366 处的Xaa是Asn或Gln;位置367处的Xaa是Gly、Gly、Ala、Val、 Leu、Thr或Gln;位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、 Cys、Asn或Arg;位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、 Tyr、Gln、Lys或Arg;位置403处的Xaa是Thr、Gly、Ala、Leu或 Asp;位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln或 Lys;位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp或Arg; 位置406处的Xaa是Leu或Val;位置407处的Xaa是Pro、Ala、Leu、Ser、Gln或His;位置408处的Xaa是Leu、Val、Met、Phe、Pro、 Ser或Asp;位置409处的Xaa是Tyr、Met或Ser;位置410处的Xaa 是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp或Glu;位置413处的 Xaa是Gln或Glu;位置424处的Xaa是Gly、Ala或Met;位置425 处的Xaa是Lys、Gly、Val、Phe或Arg;位置426处的Xaa是Ile、 Val或Leu;位置427处的Xaa是Leu、Val或Ile;位置429处的Xaa 是Lys、Val、Met或Ser;位置431处的Xaa是Asn或Glu;位置432 处的Xaa是Ser、Gly或Cys;位置433处的Xaa是Gln、Gly、Ile、 Thr、Asp或Glu;位置434处的Xaa是Leu、Gln或His;位置478 处的Xaa是Asn或His;位置479处的Xaa是Asp、Gly、Ala、Val、 Met、Pro、Ser、Thr、Tyr、Lys或His;位置480处的Xaa是Ser、 Ala、Phe、Asn、Asp、Glu或Arg;位置481处的Xaa是Ser或Trp; 位置484处的Xaa是Tyr、Phe或Asn;位置485处的Xaa是Lys、 Gly、Ala、Leu、Met、Pro、Ser、Thr、Gln、Glu或Arg;位置487处 的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn或Lys;位置488处的 Xaa是Ala、Phe、Asp或Arg;位置489处的Xaa是Ala、Gly、Val、 Pro、Cys、Asp或Lys;位置490处的Xaa是Val、Ala、Val、Leu、 Phe、Ser、Thr或Cys;位置491处的Xaa是Cys或Gly;位置492处 的Xaa是Phe或Ile;位置494处的Xaa是Tyr、Gly或Trp;位置496 处的Xaa是Leu、Ile、Met或Phe;位置497处的Xaa是Glu、Ala或 Asp;并且位置499处的Xaa是Phe、Ala或Met;并且任选地1至20 个氨基酸从N-末端缺失。
在一些实施例中,IPD082多肽包含由下式表示的氨基酸序列;
其中
位置40处的Xaa是Tyr或Phe;位置48处的Xaa是Phe、Gly、 Ala、Val、Leu、Ile、Met、Ser、Thr、Cys、Tyr、Asn、Glu、Lys或 His;位置58处的Xaa是Trp或Tyr;位置69处的Xaa是Met、Leu、 Ser、Thr或Asp;位置70处的Xaa是Gly或Asn;位置71处的Xaa 是Gln、Leu、Ser、Glu或His;位置72处的Xaa是Glu、Gly、Ala、 Pro、Cys或Asp;位置73处的Xaa是Thr、Val、Leu或Arg;位置 74处的Xaa是Ala、Leu、Met、Ser或Arg;位置77处的Xaa是Arg、 Gly、Ala、Trp、Tyr或Glu;位置78处的Xaa是Trp、Glu或His; 位置79处的Xaa是Asp、Val或Asn;位置80处的Xaa是Asn、Gly、 Ala、Val、Leu、Ser或Arg;位置81处的Xaa是Pro或Ser;位置95 处的Xaa是Phe或Tyr;位置96处的Xaa是Phe、Met、Trp或Lys; 位置106处的Xaa是Trp或Tyr;位置144处的Xaa是Phe、Ala、Ile、 Ser或Gln;位置173处的Xaa是Thr或Tyr;位置174处的Xaa是 Leu、Val、Asn、Glu或Lys;位置175处的Xaa是Asp、Gly、Ser、 Thr或Asp;位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys或 Asn;位置198处的Xaa是Lys或Asn;位置199处的Xaa是Asp或 Asn;位置235处的Xaa是Glu或Gln;位置242处的Xaa是Phe或 Trp;位置252处的Xaa是Trp、Phe或Cys;位置290处的Xaa是Phe 或Thr;位置300处的Xaa是Trp、Val或Glu;位置318处的Xaa是 Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、Asp、Glu、Lys或Arg; 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、Cys、 Tyr、Asn或Arg;位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、Arg或His;位置321处的Xaa是Tyr、Val、Leu、Ile、 Met、Phe、Ser、Thr、Cys、Tyr、Gln、Lys、Arg或His;位置322处 的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、Thr、Gln、Asp、 Lys或Arg;位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、 Arg、Asn或His;位置324处的Xaa是Ser、Ala、Val、Leu、Phe、 Pro、Ser、Thr、Gln或Arg;位置325处的Xaa是Thr、Gly、Val、 Leu、Met、Trp、Pro、Cys、Asn、Asp、Glu、Ala或Arg;位置326 处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、Cys、Asn、 Glu或Arg;位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、 Pro、Asn、Asp、Glu、Lys或Arg;位置330处的Xaa是Gln或Glu; 位置331处的Xaa是Ser或Gly;位置358处的Xaa是Ala、Ala、Ile 或Arg;位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、 Tyr或Lys;位置361处的Xaa是Ile、Met或Ser;位置362处的Xaa 是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu或Lys;位置364处的 Xaa是Val或Phe;位置365处的Xaa是Lys、Leu或Thr;位置366 处的Xaa是Asn或Gln;位置367处的Xaa是Gly、Gly、Ala、Val、 Leu、Thr或Gln;位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、 Cys、Asn或Arg;位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、 Tyr、Gln、Lys或Arg;位置403处的Xaa是Thr、Gly、Ala、Leu或 Asp;位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln或 Lys;位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp或Arg; 位置406处的Xaa是Leu或Val;位置407处的Xaa是Pro、Ala、Leu、Ser、Gln或His;位置408处的Xaa是Leu、Val、Met、Phe、Pro、 Ser或Asp;位置409处的Xaa是Tyr、Met或Ser;位置410处的Xaa 是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp或Glu;位置413处的 Xaa是Gln或Glu;位置424处的Xaa是Gly、Ala或Met;位置425 处的Xaa是Lys、Gly、Val、Phe或Arg;位置426处的Xaa是Ile、 Val或Leu;位置427处的Xaa是Leu、Val或Ile;位置429处的Xaa 是Lys、Val、Met或Ser;位置431处的Xaa是Asn或Glu;位置432 处的Xaa是Ser、Gly或Cys;位置433处的Xaa是Gln、Gly、Ile、 Thr、Asp或Glu;位置434处的Xaa是Leu、Gln或His;位置478 处的Xaa是Asn或His;位置479处的Xaa是Asp、Gly、Ala、Val、 Met、Pro、Ser、Thr、Tyr、Lys或His;位置480处的Xaa是Ser、 Ala、Phe、Asn、Asp、Glu或Arg;位置481处的Xaa是Ser或Trp; 位置484处的Xaa是Tyr、Phe或Asn;位置485处的Xaa是Lys、 Gly、Ala、Leu、Met、Pro、Ser、Thr、Gln、Glu或Arg;位置487处 的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn或Lys;位置488处的 Xaa是Ala、Phe、Asp或Arg;位置489处的Xaa是Ala、Gly、Val、 Pro、Cys、Asp或Lys;位置490处的Xaa是Val、Ala、Val、Leu、 Phe、Ser、Thr或Cys;位置491处的Xaa是Cys或Gly;位置492处 的Xaa是Phe或Ile;位置494处的Xaa是Tyr、Gly或Trp;位置496 处的Xaa是Leu、Ile、Met或Phe;位置497处的Xaa是Glu、Ala或 Asp;并且位置499处的Xaa是Phe、Ala或Met;并且任选地1至20 个氨基酸从N-末端缺失,其中该氨基酸序列与SEQ ID NO:2具有高 于97%同一性。
在一些实施例中,IPD082多肽包含具有下式的氨基酸序列:
其中
位置40处的Xaa是Tyr或Phe;位置48处的Xaa是Phe、Gly、 Ala、Val、Leu、Ile、Met、Ser、Thr、Cys、Tyr、Asn、Glu、Lys或 His;位置58处的Xaa是Trp或Tyr;位置69处的Xaa是Met、Leu、 Ser、Thr或Asp;位置70处的Xaa是Gly或Asn;位置71处的Xaa 是Gln、Leu、Ser、Glu或His;位置72处的Xaa是Glu、Gly、Ala、 Pro、Cys或Asp;位置73处的Xaa是Thr、Val、Leu或Arg;位置 74处的Xaa是Ala、Leu、Met、Ser或Arg;位置77处的Xaa是Arg、 Gly、Ala、Trp、Tyr或Glu;位置78处的Xaa是Trp、Glu或His; 位置79处的Xaa是Asp、Val或Asn;位置80处的Xaa是Asn、Gly、 Ala、Val、Leu、Ser或Arg;位置81处的Xaa是Pro或Ser;位置95 处的Xaa是Phe或Tyr;位置96处的Xaa是Phe、Met、Trp或Lys; 位置106处的Xaa是Trp或Tyr;位置144处的Xaa是Phe、Ala、Ile、 Ser或Gln;位置173处的Xaa是Thr或Tyr;位置174处的Xaa是 Leu、Val、Asn、Glu或Lys;位置175处的Xaa是Asp、Gly、Ser、 Thr或Asp;位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys或 Asn;位置198处的Xaa是Lys或Asn;位置199处的Xaa是Asp或 Asn;位置235处的Xaa是Glu或Gln;位置242处的Xaa是Phe或 Trp;位置252处的Xaa是Trp、Phe或Cys;位置290处的Xaa是Phe 或Thr;位置300处的Xaa是Trp、Val或Glu;位置318处的Xaa是 Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、Asp、Glu、Lys或Arg; 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、Cys、 Tyr、Asn或Arg;位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、Arg或His;位置321处的Xaa是Tyr、Val、Leu、Ile、 Met、Phe、Ser、Thr、Cys、Tyr、Gln、Lys、Arg或His;位置322处 的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、Thr、Gln、Asp、 Lys或Arg;位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、 Arg、Asn或His;位置324处的Xaa是Ser、Ala、Val、Leu、Phe、 Pro、Ser、Thr、Gln或Arg;位置325处的Xaa是Thr、Gly、Val、 Leu、Met、Trp、Pro、Cys、Asn、Asp、Glu、Ala或Arg;位置326 处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、Cys、Asn、 Glu或Arg;位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、 Pro、Asn、Asp、Glu、Lys或Arg;位置330处的Xaa是Gln或Glu; 位置331处的Xaa是Ser或Gly;位置358处的Xaa是Ala、Ala、Ile 或Arg;位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、 Tyr或Lys;位置361处的Xaa是Ile、Met或Ser;位置362处的Xaa 是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu或Lys;位置364处的 Xaa是Val或Phe;位置365处的Xaa是Lys、Leu或Thr;位置366 处的Xaa是Asn或Gln;位置367处的Xaa是Gly、Gly、Ala、Val、 Leu、Thr或Gln;位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、 Cys、Asn或Arg;位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、 Tyr、Gln、Lys或Arg;位置403处的Xaa是Thr、Gly、Ala、Leu或 Asp;位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln或 Lys;位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp或Arg; 位置406处的Xaa是Leu或Val;位置407处的Xaa是Pro、Ala、Leu、Ser、Gln或His;位置408处的Xaa是Leu、Val、Met、Phe、Pro、 Ser或Asp;位置409处的Xaa是Tyr、Met或Ser;位置410处的Xaa 是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp或Glu;位置413处的 Xaa是Gln或Glu;位置424处的Xaa是Gly、Ala或Met;位置425 处的Xaa是Lys、Gly、Val、Phe或Arg;位置426处的Xaa是Ile、 Val或Leu;位置427处的Xaa是Leu、Val或Ile;位置429处的Xaa 是Lys、Val、Met或Ser;位置431处的Xaa是Asn或Glu;位置432 处的Xaa是Ser、Gly或Cys;位置433处的Xaa是Gln、Gly、Ile、 Thr、Asp或Glu;位置434处的Xaa是Leu、Gln或His;位置478 处的Xaa是Asn或His;位置479处的Xaa是Asp、Gly、Ala、Val、 Met、Pro、Ser、Thr、Tyr、Lys或His;位置480处的Xaa是Ser、 Ala、Phe、Asn、Asp、Glu或Arg;位置481处的Xaa是Ser或Trp; 位置484处的Xaa是Tyr、Phe或Asn;位置485处的Xaa是Lys、 Gly、Ala、Leu、Met、Pro、Ser、Thr、Gln、Glu或Arg;位置487处 的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn或Lys;位置488处的 Xaa是Ala、Phe、Asp或Arg;位置489处的Xaa是Ala、Gly、Val、 Pro、Cys、Asp或Lys;位置490处的Xaa是Val、Ala、Val、Leu、 Phe、Ser、Thr或Cys;位置491处的Xaa是Cys或Gly;位置492处 的Xaa是Phe或Ile;位置494处的Xaa是Tyr、Gly或Trp;位置496 处的Xaa是Leu、Ile、Met或Phe;位置497处的Xaa是Glu、Ala或 Asp;并且位置499处的Xaa是Phe、Ala或Met;并且任选地1至20 个氨基酸从N-末端缺失,其中与SEQ ID NO:1或SEQ ID NO:2相比, 至少一个氨基酸是不同的。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有与如由式
XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXX XXFXXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90% 同一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、 Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、 Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置 2处的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、 Arg、Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、 Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg 或Ile;位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的 Xaa是Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、 Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、 His或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly; 位置12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位 置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或 Phe;位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的 Xaa是Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置 20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22 处的Xaa是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、 Thr或Gln;位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25 处的Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、 Thr、Leu、Val或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位 置29处的Xaa是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp; 位置33处的Xaa是Gln或Asn;位置34处的Xaa是Asn或Gln;位 置35处的Xaa是Leu、Ile、Val、Asn或Gln;位置36处的Xaa是 Lys、Asn、Glu、Ser、Arg、Gln、Thr或Asp;位置37处的Xaa是 Thr、Asp、Asn、Gln、Glu或Ser;位置38处的Xaa是His、Asn、 Gln、Lys或Arg;位置39处的Xaa是Tyr、Phe、Thr或Ser;位置40 处的Xaa是Trp、Tyr或Phe;位置42处的Xaa是Ile、Leu或Val; 位置43处的Xaa是Gln、Asn、Arg或Lys;位置47处的Xaa是Pro、 Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly 或缺失;并且位置50处的Xaa是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、Arg、 Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、 Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile; 位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是 Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、 Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His 或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置 12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13 处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是 Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的 Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa 是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln; 位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是 Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val 或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa 是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa 是Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是 Leu、Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、 Arg、Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、 Glu或Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置 39处的Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr 或Phe;位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、 Asn、Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处 的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50 处的Xaa是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有如由式XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、 Leu或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有如由式XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处的Xaa 是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu 或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有与SEQ ID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的至少一个氨基 酸序列基序。
在一些实施例中,IPD082多肽包含含有六个氨基酸序列基序的 N-末端区域,该氨基酸序列基序选自与SEQ ID NO:2的氨基酸残基 21-68、SEQ ID NO:4的残基1-48、SEQ IDNO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残 基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基243-286、 SEQ ID NO:2的残基213-262、和SEQ ID NO:4的残基193-242具有 至少90%同一性的氨基酸序列基序。
在一些实施例中,IPD082多肽包含含有至少一个氨基酸序列基 序的N-末端区域,该氨基酸序列基序对应于SEQ ID NO:2的氨基酸 残基21-68、SEQ ID NO:4的残基1-48、SEQID NO:2的残基117-164、 SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ IDNO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4 的残基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基 243-286、SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基 193-242。
在一些实施例中,IPD082多肽包含含有六个氨基酸序列基序的 N-末端区域,该氨基酸序列基序选自SEQ ID NO:2的氨基酸残基 21-68、SEQ ID NO:4的残基1-48、SEQ IDNO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残 基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基243-286、 SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基193-242的氨 基酸序列基序。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10 的残基1-131、SEQ ID NO:12的残基1-186、SEQ ID NO:16的残基 1-374、SEQ ID NO:18的残基1-379、SEQ ID NO:20的残基1-156、 SEQ ID NO:22的残基1-156、SEQ ID NO:24的残基1-528、SEQ ID NO: 26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列 同一性的氨基酸序列。
在一些实施例中,IPD082多肽包含N-末端区域,该N-末端区域 含有与SEQ ID NO:2的残基1-337具有至少80%序列同一性的氨基酸 序列。
在一些实施例中,IPD082多肽包含C-末端区域,该C-末端区域 含有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ IDNO: 24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQID NO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,IPD082多肽包含C-末端区域,该C-末端区域 含有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ IDNO: 24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQID NO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残 基174-302的氨基酸序列。
在另一个方面中,提供了通过连结IPD082基因的最初编码分离 的IPD082多肽的两个或更多个部分(以产生嵌合IPD082基因)而产 生的嵌合IPD082多肽。嵌合基因的翻译产生具有衍生自原始多肽中 的每个的区域、基序或结构域的单一嵌合IPD082多肽。在某些实施 例中,嵌合蛋白包含处于任意组合的SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的IPD082 多肽的部分、基序、或结构域。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:含有至少一个氨基酸 序列基序的N-末端区域,该氨基酸序列基序由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示,其中位置1处的Xaa是Met、 Val、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu或His;位置4处的Xaa 是Glu、Asp、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、 Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、Leu、Ser或Arg; 位置7处的Xaa是Asn或Ser;位置9处的Xaa是Arg、Thr、Gly、 Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Val、Glu、His或 Leu;位置11处的Xaa是Asp、Asn、Val或Gly;位置12处的Xaa 是Asn、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、 Ser或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val或Thr;位置19处的Xaa是Thr、Ala或Pro;位置20处的 Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、Glu、Thr或Gln;位置24 处的Xaa是Ile、Val或Gln;位置25处的Xaa是Ala、Gly或Tyr; 位置27处的Xaa是Arg、Ser或Ile;位置28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp; 位置35处的Xaa是Leu、Ile或Gln;位置36处的Xaa是Lys、Asn、 Glu、Ser或Asp;位置37处的Xaa是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位置39处的Xaa是Tyr或Ser;位 置40处的Xaa是Trp、Tyr或Phe;位置42处的Xaa是Ile或Val; 位置43处的Xaa是Gln或Lys;位置47处的Xaa是Pro、Ala或缺失; 位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并 且位置50处的Xaa是Lys、Ala或缺失。
在一些实施例中,嵌合IPD082多肽包含N-末端区域,该N-末端 区域含有由式XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处的Xaa 是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu 或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的氨基酸残 基21-68、SEQ IDNO:4的残基1-48、SEQ ID NO:2的残基117-164、 SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4 的残基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基 243-286、SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基 193-242具有至少90%同一性的至少一个氨基酸序列基序;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的氨基酸残 基21-68、SEQ IDNO:4的残基1-48、SEQ ID NO:2的残基117-164、 SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4 的残基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基 243-286、SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基 193-242具有至少90%同一性的至少一个氨基酸序列基序;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含六个氨基酸序列基序的N-末端区域,该氨基酸序列基序 选自与SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2 的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的氨基酸序列基 序;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含六个氨基酸序列基序的N-末端区域,该氨基酸序列基序 选自与SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2 的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的氨基酸序列基 序;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序选自对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残 基1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242的氨基酸序列基序;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序选自对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残 基1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242的氨基酸序列基序;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基 1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12 的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基 1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、 SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基1-337 具有至少80%序列同一性的氨基酸序列;
b)和C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ IDNO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQID NO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基 1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12 的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基 1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、 SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,嵌合IPD082多肽包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基1-337 具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,IPD082多肽包含SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的氨基 酸序列,与在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO: 16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、 SEQ ID NO:26、或SEQ ID NO:28的相应位置处的天然氨基酸相比, 所述氨基酸序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、 59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基酸 取代。
在一些实施例中,IPD082多肽包含如下氨基酸序列,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、 SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 或SEQID NO:28的相应位置处的天然氨基酸相比,所述氨基酸序列 具有处于任意组合的1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、 59、或60个氨基酸取代。
在一些实施例中,IPD082多肽包含如下氨基酸序列,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、 SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 或SEQID NO:28的相应位置处的天然氨基酸相比,所述氨基酸序列 具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、或29个氨基 酸取代。
在一些实施例中,IPD082多肽包含SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的氨基 酸序列。
对于杀昆虫蛋白家族的系统发育的、序列基序、和结构分析
可以使用序列和结构分析方法,该方法由四个部分构成:系统发 育树构建、蛋白质序列基序发现、二级结构预测、和蛋白质序列与二 级结构的比对。关于每个部分的详细信息的描述如下:
1)系统发育树构建
可以使用软件MEGA5进行系统发育分析。将蛋白质序列经受 ClustalW版本2分析(Larkin M.A等人(2007)Bioinformatics[生物信息 学]23(21):2947-2948),用于多重序列比对。然后通过基于JTT矩阵 的模型的最大似然量法推断进化历史。获得具有最高对数似然值的 树,以Newick格式导出,并进一步处理,以与出现在树中的相同顺 序提取序列ID。可以为每个杀昆虫蛋白家族手工识别代表亚科的几个 进化枝。
2)蛋白质序列基序发现
根据先前构建的系统发育树对蛋白质序列进行重新排序,并送入 MOTIF分析工具MEME(多重EM用于MOTIF启发)(Bailey T.L. 和Elkan C.,Proceedings of the SecondInternational Conference on Intelligent Systems for Molecular Biology[第二届国际分子生物学智能 系统会议论文集],第28-36页,AAAI出版社,门洛帕克,加利福尼 亚,1994)用于鉴定关键序列基序。MEME设置如下:最小位点数2, 最小基序宽度5,和最大基序数30。通过视觉观察确定了每个亚家族 独有的序列基序。贯穿整个基因家族的MOTIF分布在HTML网页中 可以是可视化的。相对于每个MOTIF的E-值的排名对MOTIF进行编 号。
3)二级结构预测
可以将PSIPRED(顶级二级结构预测方法)(Jones DT.(1999)J. Mol.Biol.[分子细胞生物学]292:195-202)用于蛋白质二级结构预测。 该工具使用基于PSI-BLAST输出的两个前馈神经网络提供准确的结 构预测。通过去除Uniref100中的低复杂度、跨膜和卷曲的螺旋区域 来创建PSI-BLAST数据库。PSIPRED结果包含预测的二级结构(α 螺旋:H,β链:E,以及卷曲:C)和给定蛋白质序列中每个氨基酸 的相应置信度得分。
4)蛋白质序列与二级结构的比对
可以开发脚本,以根据来自步骤1的所有蛋白质的多重蛋白质序 列比对来产生间隙二级结构比对。所有经比对的蛋白质序列和结构都 被连接成单个FASTA文件,并然后导入到MEGA中用于可视化和鉴 定保守结构。
在一些实施例中,IPD082多肽具有改性的物理性质。如本文使 用的,术语“物理性质”是指适合于描述蛋白质的物理化学特征的任 何参数。如本文使用的,“目的物理性质”和“目的性质”可互换使 用,以指正在研究和/或改性的蛋白质的物理性质。物理性质的实例包 括但不限于:蛋白质表面上的净表面电荷和电荷分布、蛋白质表面上 的净疏水性和疏水残基分布、表面电荷密度、表面疏水密度、表面电 离基团的总计数、表面张力、蛋白质大小及其在溶液中的分布、熔融 温度、热容量、和第二位力系数。物理性质的实例还包括,IPD082 多肽具有增加的表达、增加的溶解度、降低的植物毒性、和蛋白水解 片段在昆虫肠道中的可消化性。模拟胃液消化的模型是本领域技术人 员已知的(Fuchs,R.L.和J.D.Astwood.Food Technology[食品技术]50: 83-88,1996;Astwood,J.D.等人,NatureBiotechnology[生物技术]14: 1269-1273,1996;Fu TJ等人,J.Agric Food Chem.[农业与食品化学杂 志]50:7154-7160,2002)。
在一些实施例中,变体包括由于诱变而在氨基酸序列方面不同的 多肽。本公开所涵盖的变体蛋白质具有生物学活性,即它们仍然具有 天然蛋白质所需的生物学活性(即杀有害生物活性)。在一些实施例 中,该变体将具有至少约10%、至少约30%、至少约50%、至少约 70%、至少约80%或更高的天然蛋白质的杀昆虫活性。在一些实施例 中,变体可以具有比天然蛋白质改进的活性。
细菌基因通常在可读框的起始附近具有多个甲硫氨酸起始密码 子。经常,在这些起始密码子中的一个或多个处的翻译起始将导致一 种功能蛋白质的产生。这些起始密码子可以包括ATG密码子。然而, 细菌(如,芽孢杆菌属物种)还将该密码子GTG识别为起始密码子, 并且在GTG密码子处起始翻译的蛋白质在第一个氨基酸处包含甲硫 氨酸。在少数情况下,细菌系统中的翻译可以在TTG密码子处启动, 尽管在此事件中TTG编码甲硫氨酸。此外,常常不首先确定这些密码 子中的哪一些在细菌中自然地使用。因此,应当理解,使用这些可替 代的甲硫氨酸密码子之一也可能导致杀有害生物蛋白的产生。这些杀 有害生物蛋白涵盖于本公开之中,并且可以在本公开的这些方法中使 用。应当理解的是当在植物中表达时将有必要将替代起始密码子改变 为ATG以用于正确的翻译。
在其他实施例中,IPD082多肽可以表达为具有催化多步翻译后 蛋白质剪接的间插序列的前体蛋白。蛋白质剪接涉及从多肽切除间插 序列,并伴随连接侧翼序列以产生新的多肽(Chong等人,(1996), J.Biol.Chem.[生物化学杂志],271:22159-22168)。这种被称为内含 肽的间插序列或蛋白质剪接元件,通过在N末端和C末端剪接点处的 以下三个协调反应催化其自身的切除:N末端半胱氨酸或丝氨酸的酰 基重排;两个末端之间形成支链酯或硫酯中间体的酯交换反应,和与 内含肽C末端天冬酰胺的环化相偶联释放内含肽的肽键切割(Evans 等人,(2000),J.Biol.Chem.[生物化学杂志],275:9091-9094)。 阐明蛋白质剪接的机制导致了许多基于内含肽的应用(Comb等人, 美国专利号5,496,714;Comb等人,美国专利号5,834,247;Camarero 和Muir,(1999),J.Amer.Chem.Soc.[美国化学学会学报], 121:5597-5598;Chong等人,(1997),Gene[基因],192:271-281, Chong等人,(1998),Nucleic Acids Res.[核酸研究],26:5109-5115; Chong等人,(1998),J.Biol.Chem.[生物化学杂志],273:10567-10577; Cotton等人,(1999),J.Am.Chem.Soc.[美国化学会志],121:1100-1101;Evans等人,(1999),J.Biol.Chem.[生物化学杂志], 274:18359-18363;Evans等人,(1999),J.Biol.Chem.[生物化学杂 志],274:3923-3926;Evans等人,(1998),Protein Sci.[蛋白质科学], 7:2256-2264;Evans等人,(2000),J.Biol.Chem.[生物化学杂志], 275:9091-9094;Iwai和Pluckthun,(1999),FEBS Lett.[欧洲生化学 会联盟通讯],459:166-172;Mathys等人,(1999),Gene[基因], 231:1-13;Mills等人,(1998),Proc.Natl.Acad.Sci.USA[美国科学 院院报],95:3543-3548;Muir等人,(1998),Proc.Natl.Acad.Sci. USA[美国科学院院报],95:6705-6710;Otomo等人,(1999),Biochemistry[生物化学],38:16040-16044;Otomo等人,(1999), J.Biolmol.NMR[生物分子核磁共振杂志],14:105-114;Scott等人, (1999),Proc.Natl.Acad.Sci.USA[美国科学院院报], 96:13638-13643;Severinov和Muir,(1998),J.Biol.Chem.[生物化 学杂志],273:16205-16209;Shingledecker等人,(1998),Gene[基 因],207:187-195;Southworth等人,(1998),EMBO J.[欧洲分子 生物学杂志],17:918-926;Southworth等人,(1999),Biotechniques[生 物技术],27:110-120;Wood等人,(1999),Nat.Biotechnol.[自然 生物技术],17:889-892;Wu等人,(1998a),Proc.Natl.Acad.Sci. USA[美国科学院院报],95:9226-9231;Wu等人,(1998b),Biochim Biophys Acta[生物化学与生物物理学报],1387:422-432;Xu等人, (1999),Proc.Natl.Acad.Sci.USA[美国科学院院报],96:388-393;Yamazaki等人,(1998),J.Am.Chem.Soc.[美国化学会志], 120:5591-5592)。针对在植物转基因中应用内含肽,参见,Yang等 人,(Transgene Res[转基因研究],15:583-593(2006))和Evans等 人,(Annu.Rev.Plant Biol.[植物生物学年评],56:375-392(2005))。
在另一实施例中,IPD082多肽可以由两个单独的基因编码,其 中前体蛋白的内含肽来自两个称为分裂内含肽的基因,并且前体的两 部分通过肽键形成而连接起来。该肽键的形成通过内含肽介导的反式 剪接实现。为此目的,包含两个单独基因的第一和第二表达盒进一步 编码能够介导蛋白质反式剪接的内含肽。通过反式剪接,由第一和第 二片段编码的蛋白质和多肽可以通过肽键形成连接。反式剪接内含肽 可以选自包括真核生物、古细菌和真细菌在内的不同生物体的核仁和 细胞器基因组。可以使用的内含肽列在neb.com/neb/inteins.html上, 其可以使用“www”前缀在万维网上访问。编码内含肽的核苷酸序列可以分裂成5′和3′部分,该5′和3′部分分别编码内含肽的5′和3′部分。 可能使内含肽剪接不需要的序列部分(例如归巢内切核酸酶结构域) 缺失。将内蛋白编码序列分裂,使得5′和3′部分能够进行反式剪接。 为了选择内含肽编码序列的合适的分裂位点,可以遵循由Southworth, et al.,(1998)EMBO J.17:918-926[Southworth等人,(1998),欧洲分 子生物学杂志,17:918-926]公开的注意事项。在构建第一和第二表达 盒中,5’内含肽编码序列连接到编码IPD082多肽的N末端部分的第 一片段的3’末端,并且3’内含肽编码序列连接到编码IPD082多肽的 C末端部分的第二片段的5’末端。
通常,可以使用任何分裂内含肽来设计反式剪接配偶体,包括任 何天然存在或人工分裂的分裂内含肽。已知若干种天然存在的分裂内 含肽,例如:集胞藻属物种PCC6803的DnaE基因的分裂内含肽(参 见,Wu等人,(1998),Proc Natl Acad Sci USA[美国科学院院报], 95(16):9226-31和Evans等人,(2000),J Biol Chem.[生物化学杂志], 275(13):9091-4)和来自点状念珠藻的DnaE基因的分裂内含肽(参见, Iwai等人,(2006),FEBSLett.[欧洲生化学会联盟通讯], 580(7):1853-8)。非分裂内含肽在实验室中人为分裂以产生新的分裂 内含肽,例如:人工分裂Ssp DnaB内含肽(参见,Wu等人,(1998), BiochimBiophys Acta.[生物化学与生物物理学报],1387:422-32)和分 裂Sce VMA内含肽(参见,Brenzel等人,(2006),Biochemistry.[生 物化学],45(6):1571-8)和人工分裂的真菌微型内含肽(参见,Elleuche 等人,(2007),Biochem Biophys Res Commun.[生物化学与生物物理 学研究通讯],355(3):830-4)。还有把已知的内含肽编入目录的内含 肽数据库(参见,例如,可以在 bioinformatics.weizmann.ac.il/~pietro/inteins/Inteinstable.html处获得的 在线数据库,其可以使用“www”前缀在万维网上访问)。
天然存在的非分裂内含肽可能具有内切核酸酶活性或其他酶活 性,这些活性通常可以在设计人工分裂的分裂内含肽时被去除。这样 的迷你内含肽或最小化的分裂内含肽是本领域熟知的,并且通常小于 200个氨基酸残基长(参见,Wu等人,(1998),BiochimBiophys Acta.[生物化学与生物物理学报],1387:422-32)。合适的分裂内含肽 可以向其结构添加使其他纯化可行的多肽元件,条件是这些元件不会 抑制分裂内含肽的剪接,或以允许它们在拼接之前被去除的方式添 加。已经报道了使用包含以下的蛋白质的蛋白质剪接:细菌内含肽样 (BIL)结构域(参见,Amitai等人,(2003)Mol Microbiol.[分子微生 物学],47:61-73)和刺猬(Hog)自动加工结构域(当称为Hog/内含 肽超家族或HINT家族时,后者与内含肽组合;参见,Dassa等人, (2004),J Biol Chem.[生物化学杂志],279:32001-7))以及结构域 如还可用于制备人工分裂的内含肽的这些。特别地,可以通过分子生 物学方法来改性这些家族的非剪接成员,以引入或恢复在这些相关物 种中的剪接活性。最近的研究表明,当允许N末端分裂内含肽组分与 自然界中未发现的C末端裂解内含肽组分反应作为其“配偶体”时, 可以观察到剪接;例如,已经观察到使用与“自然”剪接配偶体具有 少至30%至50%同源性的配偶体进行剪接(参见,Dassa等人,(2007), Biochemistry.[生物化学],46(1):322-30)。不同分裂内含肽的其他这 种混合物已被证明是与另一个不反应的混合物(参见,Brenzel等人, (2006),Biochemistry.[生物化学],45(6):1571-8)。然而,使用常 规方法并且酶有运用创造性技能是情况下确定特定的一对多肽是否 能够彼此结合以提供功能性内含肽,在相关领域的技术人员的能力范 围内。
在一些实施例中,IPD082多肽是环状排列的变体。在某些实施 例中,IPD082多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的多肽的环状排列的变体, 或具有氨基酸取代、缺失、添加、或其组合的其变体。重组DNA方 法的发展使得有可能研究序列转座对蛋白质折叠、结构和功能的影 响。创建新序列中使用的方法类似于通过其氨基酸序列的线性改组对 天然存在的蛋白质对进行关联的方法(Cunningham等人,(1979)Proc. Natl.Acad.Sci.U.S.A.[美国科学院院报]76:3218-3222;Teather和Erfle,(1990)J.Bacteriol.[细菌学杂志]172:3837-3841;Schimming等人,(1992) Eur.J.Biochem.[欧洲生物化学杂志]204:13-19;Yamiuchi和 Minamikawa,(1991)FEBS Lett.[欧洲生化学会联合会快报] 260:127-130;MacGregor等人,(1996)FEBS Lett.[欧洲生化学会联合 会快报]378:263-266)。Goldenberg和Creighton描述了这种类型的重 排对蛋白质的第一次体外应用(J.Mol.Biol.[分子生物学杂志], 165:407-413,1983)。在创建环形排列的变体中,在原始序列的内部 位点(断点)处选择新的N末端,该新序列从断点与原始序列具有氨 基酸相同的次序,直到其达到原始C末端或其附近的氨基酸。在这一 点上,新序列直接或通过序列(接头)的另外部分连接到原始N末端 或其附近的氨基酸,并且新序列以原始序列相同的序列继续,直到其 达到原始序列的断点位点的N末端的氨基酸处于或附近的点,该残基 形成链的新C末端。接头的氨基酸序列的长度可以凭经验或以结构信 息的指导或通过使用两种方法的组合来选择。当没有结构信息可用 时,可以使用设计和采取必要的确认,而不会破坏杀有害生物多肽的 构型的能力(构象灵活;Karplus和Schulz,(1985),Naturwissenschaften[自然科学],72:212-213)制备小系列接头用于测 试,该设计的长度为了跨越从0至的范围而变化并且选择该设计 的序列以与表面暴露一致(亲水性,Hopp和Woods,(1983),Mol. Immunol.[分子免疫学],20:483-489;Kyte和Doolittle,(1982),J.Mol. Biol.[分子生物学杂志],157:105-132;溶剂暴露表面积,Lee和Richards,(1971),J.Mol.Biol.[分子生物学杂志],55:379-400)。 假设每个残基平均翻译为2.0至这意味着要测试的长度在0至 30个残基之间,其中0至15个残基为优选范围。这种经验性系列的 实例将是使用重复n次的盒序列如Gly-Gly-Gly-Ser构建接头,其中n 为1、2、3或4。本领域技术人员将认识到,存在许多长度或组成不 同的这样的序列,其可以用作接头,其中主要注意事项是它们是既不 过长也不过短的(参见Sandhu,(1992),Critical Rev.Biotech.[生物 技术评论],12:437-462);如果它们太长,熵效应可能会使三维折叠 不稳定,并且也可能使得折叠在动力学上是不切实际的,并且如果它 们太短,则它们可能由于扭转或空间应变使分子不稳定。蛋白质结构 信息分析的技术人员将认识到,使用定义为c-α碳之间距离的链末端 之间的距离可用于定义待使用的序列的长度,或至少限制在接头的经 验选择中必须测试的可能性的数量。他们还将认识到,在有时多肽链 末端的位置在源自X射线衍射或核磁共振光谱数据的结构模型中是 不明确的情况下,并且在当真实时的情况下,因此,需要考虑这种情 况,以便正确估计所需接头的长度。从其位置定义明确的那些残基选 择两个与链末端顺序接近的残基,并且使用它们的c-α碳之间的距离来计算它们之间的接头的近似长度。使用计算出的长度作为指导,然 后选择具有一定范围数量的残基(每个残基使用2至计算)的 接头。这些接头可以由原始序列组成,必要时缩短或延长,并且当延 长时,可以如上所述选择灵活的和亲水性的另外的残基;或任选地, 原始序列可以用一系列接头取代,一个实例是以上提及的 Gly-Gly-Gly-Ser盒方法;或任选地,可以使用具有适当总长度的原始 序列和新序列的组合。能够折叠到生物活性状态的杀有害生物多肽的 序列可以通过从原始多肽链中开始(氨基末端)和末端(羧基末端)位置的适当选择,同时使用如上所述的接头序列来制备。氨基和羧基 末端使用下面所述的方法从称为断点区域的序列的常见延伸中选出。 因此,通过从同一断点区域内选择氨基和羧基末端来产生新颖的氨基 酸序列。在许多情况下,新末端的选择将使得羧基末端的原始位置紧 邻氨基末端的位置。然而,本领域技术人员将认识到,区域内任何地 方的末端的选择可能起作用,并且这些将有效地导致新序列的氨基或 羧基部分的缺失或添加。蛋白质的主要氨基酸序列决定了折叠至表达 其生物功能所必需的三维结构是分子生物学的核心原则。本领域技术 人员已知使用单一蛋白晶体的x射线衍射或蛋白质溶液的核磁共振光 谱来获得和解释三维结构信息的方法。与断点区域的识别相关的结构 信息的实例包括蛋白质二级结构的位置和类型(α和3-10个螺旋,平 行和反向平行β片材,链逆转(chainreversal)和回转,以及环;Kabsch 和Sander,(1983)Biopolymers[生物聚合物]22:2577-2637);氨基酸 残基的溶剂暴露程度、残基彼此之间相互作用的程度和类型(Chothia,(1984)Ann.Rev.Biochem.[生物化学年鉴]53:537-572)以及沿多肽链 的构象的静态和动态分布(Alber和Mathews,(1987)Methods Enzymol.[酶学方法]154:511-533)。在某些情况下,关于残基的溶剂 暴露的其他信息是已知的;一个例子是必须位于该蛋白质表面的碳水化合物的翻译后附着位点。当实验结构信息不可获得或不可能获得 时,也可以使用方法来分析初级氨基酸序列,以便预测蛋白质三级和 二级结构,溶剂可及性以及回转和环的存在。当直接结构方法不可行 时,生物化学方法有时也适用于经验性地确定表面暴露;例如,在有 限的蛋白水解之后使用断链位点的识别来推断表面暴露(Gentile和 Salvatore,(1993)Eur.J.Biochem.[欧洲生物化学杂志]218:603-621)。 因此,使用实验衍生的结构信息或预测方法(例如,Srinivisan和Rose, (1995),Proteins:Struct.,Funct.&Genetics[蛋白质:结构,功能和 遗传学],22:81-99),检查亲本氨基酸序列根据它们是否对维持二级 和三级结构是必不可少的对区域进行分类。已知涉及周期性二级结构 (α和3-10个螺旋,平行和反平行β折叠)的区域内的序列的存在是 应该避免的区域。相似地,观察或预测具有低溶剂暴露程度的氨基酸 序列的区域更可能是蛋白质的所谓疏水核心的一部分,并且也应避免 选择氨基和羧基末端。相比之下,已知或预测为表面回转或循环的那 些区域,并且特别是已知生物活性所不需要的那些区域,是用于定位 多肽链极端的优选位点。基于上述标准优选的氨基酸序列的连续延伸 被称为断点区域。可以基本上遵循Mullins等人,(1994),J.Am.Chem. Soc.[美国化学会志],116:5529-5533中所描述的方法制备编码具有新 N末端/C末端的环形排列的IPD082多肽的多核苷酸,该多核苷酸包 含将原C末端与N末端分隔开的连接区。聚合酶链反应(PCR)扩增 的多个步骤用于重排编码蛋白质的一级氨基酸序列的DNA序列。可 以基于Horlick等人,(1992),Protein Eng.[蛋白质工程],5:427-431 中所描述的串联重复方法制备编码具有新N末端/C末端的环形排列 的IPD082多肽的多核苷酸,该多核苷酸包含将原C末端与N末端分 隔开的连接区。使用串联重复的模板DNA进行新的N末端/C末端基 因的聚合酶链反应(PCR)扩增。
在另一实施例中,提供了在其氨基酸序列中包含氨基酸序列的融 合蛋白,该氨基酸序列包含本公开的IPD082多肽或嵌合IPD082多肽。 用于设计和构建融合蛋白(以及编码它们的多核苷酸)的方法是本领 域技术人员已知的。编码IPD082多肽的多核苷酸可以融合到信号序 列,这些信号序列将指导IPD082多肽定位于原核或真核细胞的特定 区室和/或指导来自原核或真核细胞的实施例的IPD082多肽的分泌。 例如,在大肠杆菌中,人们可能希望指导蛋白质表达至周质空间。 IPD082多肽可以融合以便指导多肽表达至细菌周质空间的信号序列 或蛋白质(或其片段)的实例包括但不限于:pelB信号序列、麦芽糖 结合蛋白(MBP)信号序列、MBP、ompA信号序列,周质性大肠杆 菌不耐热肠毒素B亚基的信号序列和碱性磷酸酶的信号序列。用于构 建将指导蛋白质定位的融合蛋白的若干种载体是可商购的,如可从 New England Biolabs获得的pMAL系列的载体(特别是pMAL-p系 列)。在具体实施例中,IPD082多肽可以与pelB果胶酸裂解酶信号 序列融合,以增加革兰氏阴性菌中这些多肽的表达和纯化的效率(参 见,美国专利号5,576,195和5,846,818)。植物质体转运肽/多肽融合 是本领域熟知的(参见,美国专利号7,193,133)。质外体转运肽如稻 或大麦α-淀粉酶分泌信号也是本领域熟知的。质体转运肽通常与待靶 向的多肽(例如,融合配偶体)进行N末端融合。在一个实施例中, 融合蛋白基本上由待靶向的质体转运肽和IPD082多肽组成。在另一 个实施例中,融合蛋白包含待靶向的质体转运肽和多肽。在这样的实 施例中,质体转运肽优选位于融合蛋白的N末端。然而,另外的氨基 酸残基可以是在质体转运肽的N末端,条件是该融合蛋白至少部分地 靶向质体。在具体实施例中,质体转运肽在融合蛋白的N末端一半处, N末端三分之一处或N末端四分之一处。当插入质体时,大部分或全 部质体转运肽通常从融合蛋白上切割。由于特定的细胞间条件或所使 用的转运肽/融合配偶体的具体组合,在不同植物发育阶段,切割位置 可能在植物物种之间略有变化。在一个实施例中,质体转运肽切割是 均相的,使得切割位点在融合蛋白群体中是相同的。在另一个实施例 中,质体转运肽不是均匀的,使得融合蛋白群体中切割位点相差1-10 个氨基酸。质体转运肽能以若干种方式之一重组融合到第二种蛋白 质。例如,可以将限制性内切核酸酶识别位点引入到其C末端的相应 位置的转运肽的核苷酸序列中,并且可以将相同或相容的位点工程化 为在其N末端待靶向的蛋白质的核苷酸序列。必须注意设计这些位 点,以确保转运肽和第二个蛋白质的编码序列保持“框架”,以允许 合成所需的融合蛋白。在一些情况下,当引入新的限制性位点时,优 选除去第二种蛋白质的引发剂甲硫氨酸。在两个亲本分子上引入限制 性内切核酸酶识别位点,以及它们随后通过重组DNA技术连接可导 致在转运肽和第二蛋白质之间添加一个或多个额外的氨基酸。这通常 不影响靶向活性,只要转运肽切割位点保持可及,并且通过在其N末 端添加这些额外的氨基酸而不改变第二蛋白质的功能。可替代地,本 领域技术人员可以使用基因合成(Stemmer等人,(1995),Gene[基 因],164:49-53)或相似的方法在转运肽和第二蛋白质之间产生精确的 切割位点(有或没有其引发剂甲硫氨酸)。此外,转运肽融合可以有 意地包括切割位点下游的氨基酸。成熟蛋白质N末端的氨基酸可影响 转运肽将蛋白质靶向质体的能力和/或蛋白质进入后的切割效率。这可 能取决于待靶向的蛋白质。参见,例如,Comai等人,(1988),J.Biol. Chem.[生物化学杂志],263(29):15104-9。
在一些实施例中,提供了包含本公开的IPD082多肽或嵌合 IPD082多肽的融合蛋白,该蛋白由选自下组的式表示,该组由以下组 成:
R1-L-R2、R2-L-R1、R1-R2、或R2-R1
其中R1是本公开的IPD082多肽或嵌合IPD082多肽,并且R2是 目的蛋白。在一些实施例中,R1和R2是本公开的IPD082多肽或嵌合 IPD082多肽。该R1多肽直接或通过接头(L)区段融合至R2多肽。 术语“直接”定义在没有肽接头的情况下多肽连接的融合。因此,“L” 表示R1和R2在框架中融合的化学结合或多肽区段,最常见的是,L 是R1和R2通过酰胺键将R1的羧基末端连接到L的氨基末端并且将L 的羧基末端连接到R2的氨基末端的线性肽。“在框内融合”意指R1和R2的阅读框之间没有翻译终止或中断。连接基团(L)通常是长度 在1至500个氨基酸之间的多肽。连接两个分子的接头优选设计成(1) 允许两个分子彼此独立地折叠并且起作用,(2)不具有发展可能干扰 两种蛋白质的功能结构域的有序二级结构的倾向,(3)具有可与功能 性蛋白质结构域相互作用的最小的疏水或带电特征,并且(4)提供 R1和R2的空间分离,使得R1和R2可以与单个细胞上的相应受体同时 相互作用。通常,在柔性蛋白质区域中的表面氨基酸包括Gly、Asn 和Ser。期望包含Gly、Asn和Ser的氨基酸序列的几乎任何排列满足 上述接头序列的标准。其他中性的氨基酸,如Thr和Ala也可以用于 接头序列中。由于在接头序列中添加了独特的限制性位点以便于构建 融合体,另外的氨基酸也可以包括在接头中。
在一些实施例中,接头包含选自以下组的化学式的序列: (Gly3Ser)n、(Gly4Ser)n、(Gly5Ser)n、(GlynSer)n或(AlaGlySer)n,其中n 是整数。高度柔性接头的一个实例是存在于丝状噬菌体(例如,噬菌 体M13或fd)的pIII蛋白质内的富含(GlySer)的间隔子(Schaller 等人,1975)。该区域在pIII表面蛋白质的两个结构域之间提供长、 柔性的间隔子区域。还包括接头,在接头中包括内肽酶识别序列。这 样的切割位点对于分离融合物的各个组分以确定它们在体外是否适 当折叠和是否具有活性可能是有价值的。各种内肽酶的实例包括但不 限于:纤溶酶、肠激酶、激肽释放酶、尿激酶、组织纤溶酶原激活剂、 梭菌蛋白酶、凝乳酶、胶原酶、鲁塞尔氏蝰蛇毒蛋白酶、后脯氨酸切 割酶、V8蛋白酶、凝血酶和因子Xa。在一些实施例中,接头包含来 自多基因表达载体(MGEV)的氨基酸EEKKN(SEQ IDNO:68), 其如美国专利申请公开号US 2007/0277263中所公开的被液泡蛋白酶 切割。在其他实施例中,来自重链免疫球蛋白IgG、IgA、IgM、IgD 或IgE的铰链区域的肽接头区段在附着的多肽之间提供角度关系。特 别有用的是那些半胱氨酸被丝氨酸替换的铰链区域。本公开的接头包 括源自鼠IgGγ2b铰链区域的序列,其中半胱氨酸已经被变为丝氨酸。 融合蛋白不受所使用的接头序列的形式、大小或数目的限制,并且接 头的唯一要求是功能上不会与融合物的各个分子的折叠和功能产生 不利的干扰。
应当认识到,可以通过各种方法改变DNA序列,并且这些改变 可能导致编码具有与野生型(或天然)杀有害生物蛋白编码的氨基酸 序列不同的氨基酸序列的蛋白质的DNA序列。在一些实施例中, IPD082多肽可以按各种方式改变,这些方式包括与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28中任一项相比,一个或多个氨基酸的氨基酸取代、缺失、截短、 和插入,包括高达2、3、4、5、6、7、8、9、10、15、20、25、30、 35、40、45、50、55、60、65、70、75、80、85、90、100、105、110、 115、120、125、130、135、140、145或更多个氨基酸取代、缺失、 和/或插入或其组合。
在一些实施例中,IPD082多肽变体包含对应于处于任意组合的 SEQ ID NO:2的位置48、58、69、70、71、72、73、74、75、76、77、 78、79、80、96、106、144、154、173、174、175、176、242、252、 290、300、318、319、320、321、322、323、324、325、326、327、 358、359、360、361、362、363、364、365、366、367、368、369、 401、402、403、404、405、406、407、408、409、410、423、424、 425、426、427、428、429、430、431、432、433、434、478、479、 480、481、482、483、484、485、486、487、488、489、490、491、 492、493、494、495、496、497、或499的任一个或多个氨基酸取代。
在一些实施例中,IPD082多肽变体包含表7的任一个或更多个 活性的氨基酸取代。
这种操作的方法在本领域中是普遍已知的。例如,可以通过DNA 中的突变来制备IPD082多肽的氨基酸序列变体。这还可以通过几种 诱变形式之一和/或在定向进化中来完成。在一些方面,在该氨基酸序 列中所编码的变化将基本上不影响该蛋白质的功能。这样的变体将具 有所希望的杀有害生物活性。然而,应当理解,可以通过在本公开的 组合物上使用这些技术改进IPD082多肽赋予杀有害生物活性的能力。
例如,可以在一个或多个、预测的、非必需氨基酸残基处做出保 守性氨基酸取代。“非必需”氨基酸残基是可以从IPD082多肽的野 生型序列改变而来的并且不改变生物活性的残基。通过比对如在图1 中显示的相关的IPD082同源物,可以鉴定非必需氨基酸残基。“保 守的氨基酸取代”是其中用具有相似侧链的氨基酸残基替换该氨基酸 残基的取代。在本领域中已经限定了具有相似侧链的氨基酸残基的家 族。这些家族包括:具有碱性侧链的氨基酸(例如,赖氨酸、精氨酸、 组氨酸);具有酸性侧链的氨基酸(例如,天冬氨酸、谷氨酸);具 有极性的、带负电荷的残基及其酰胺的氨基酸(例如,天冬氨酸、天 冬酰胺、谷氨酸、谷氨酰胺);具有不带电极性侧链的氨基酸(例如, 甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸); 具有小脂肪族、非极性或微小极性的残基的氨基酸(例如,丙胺酸、 丝氨酸、苏氨酸、脯氨酸、甘胺酸);具有非极性侧链的氨基酸(例 如,丙胺酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫 氨酸、色氨酸);具有大脂肪族、非极性残基的氨基酸(例如,甲硫 氨酸、亮氨酸、异亮氨酸、缬氨酸、胱氨酸);具有β-支链侧链的氨 基酸(例如,苏氨酸、缬氨酸、异亮氨酸);具有芳香族侧链的氨基 酸(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸);具有大芳香族侧 链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸)。
氨基酸取代可以在保留功能的非保守性区域中进行。总体上,此 类取代并非针对保守的氨基酸残基、或针对在一个保守基序内的氨基 酸残基而进行,其中此类残基是蛋白质活性所必要的。保守的并且对 于蛋白质活性可能是必需的残基的实例包括例如,在与实施例的序列 相相似或相关的毒素的比对中所包含的全部蛋白质之间是相同的残 基(例如,在同源蛋白比对中相同残基)。保守的但可能允许保守的 氨基酸取代、并且仍保留活性的残基的实例包括例如,在与实施例的 序列相相似或相关的毒素的比对中所包含的全部蛋白质之间仅具有 保守性取代的残基(例如,在同源蛋白比对中所包含的全部蛋白质之间仅具有保守性取代的残基)。然而,本领域的技术人员应当理解, 功能性变体在保守的残基中可以具有少量的保守的或非保守的改变。 关于不影响目的蛋白质的生物活性的适当的氨基酸取代的指导可以 发现于Dayhoff等人,(1978),Atlas of Protein Sequence andStructure[蛋白质序列和结构图谱](国家生物医学研究基金会(Natl.Biomed.Res.Found.),华盛顿)的模型中,其通过引用结合在此。
在进行这种变化时,可考虑氨基酸的亲水指数。亲水氨基酸指数 在赋予蛋白质以交互性生物功能中的重要性在本领域中通常是被理 解的(Kyte和Doolittle,(1982),JMol Biol.[分子生物学杂志], 157(1):105-32)。接受的是该氨基酸的相对亲水特征有助于所得蛋白 的次级结构,该次级结构进而定义该蛋白与其他分子(例如酶、基质、 受体、DNA、抗体、抗原等等)的相互作用。
本领域已知某些氨基酸可以被具有相似亲水指数或评分的其他 氨基酸取代,并且仍然产生具有相似生物学活性的蛋白质,即仍然获 得生物功能等同的蛋白质。每个氨基酸基于其疏水性和电荷特征被指 定亲水指数(Kyte和Doolittle,同上)。这些是:异亮氨酸(+4.5); 缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱 氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘胺酸(-0.4); 苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3); 脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5); 天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。 在进行这种变化时,优选亲水性指数在+2以内的氨基酸取代,特别优 选在+1以内的氨基酸取代,并且甚至更特别优选+0.5以内的氨基酸取 代。
在本领域中也可以理解,可以基于亲水性有效地进行类似氨基酸 的取代。美国专利号4,554,101说明蛋白的最大局部平均亲水性(如 由其相邻氨基酸的亲水性支配的)与该蛋白的生物特性相关。
如美国专利号4,554,101中所详述的,以下亲水性值已被分配到 氨基酸残基:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0.+0.1); 谷氨酸(+3.0.+0.1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰 胺(+0.2);甘胺酸(0);苏氨酸(-0.4);脯氨酸(-0.5.+0.1); 丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3); 缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3); 苯丙氨酸(-2.5);色氨酸(-3.4)。
可替代地,可以在氨基或羧基的末端上对多种蛋白质的蛋白质序 列进行改变,而基本上不影响活性。这可以包括由现代分子方法所引 入的插入、缺失或改变,这些方法如PCR,包括PCR扩增,这些PCR 扩增借助于将氨基酸编码序列包括到在PCR扩增中所使用的寡核苷 酸之中而改变或延长了这种蛋白质编码序列。可替代地,所添加的蛋 白质序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产 生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋 白质的表达;(2)引入结合结构域、酶活性或表位以促进蛋白质纯化、 蛋白检测或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译 靶向亚细胞器,如革兰氏阴性菌的周质空间,植物的线粒体或叶绿体 或真核细胞的内质网,这些中的后者常常导致蛋白质的糖基化。
本披露的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组 的程序(如DNA改组)所衍生的序列。在这样的程序的情况下,可 以使用编码区域的一种或多种不同的IPD082多肽来产生具有所需性 质的新的IPD082多肽。以此方式,由一群相关的序列多核苷酸产生 重组多核苷酸文库,这些多核苷酸包含具有基本序列同一性并且能够 在体外或体内同源重组的序列区域。例如,使用这种方法,可以将编 码目的结构域的序列基序在杀有害生物基因与其他已知的杀有害生 物基因之间进行改组,以获得编码具有改进的目的性质(如增加的杀 昆虫活性)的新基因。这种DNA改组的策略在本领域中是已知的。 参见例如,Stemmer,(1994)Proc.Natl.Acad.Sci.USA[美国科学院院 报]91:10747-10751;Stemmer,(1994)Nature[自然]370:389-391; Crameri等人,(1997)Nature Biotech.[自然生物技术]15:436-438;Moore 等人,(1997)J Mol Biol[分子生物学杂志]272:336-347;Zhang等人, (1997)Proc.Natl.Acad.Sci.USA[美国科学院院报]94:4504-4509; Crameri等人,(1998),Nature[自然],391:288-291;以及美国专利 号5,605,793和5,837,458。
结构域交换或改组是用于产生改变的IPD082多肽的另一种机 制。可以在IPD082多肽之间交换结构域,导致具有改进的杀昆虫活 性或靶谱的杂交或嵌合毒素。用于产生重组蛋白质并测试其杀有害生 物活性的方法是本领域熟知的(参见,例如,Naimov等人,(2001)Appl. Environ.Microbiol.[应用与环境微生物学]67:5328-5330;de Maagd等 人,(1996)Appl.Environ.Microbiol.[应用与环境微生物 学]62:1537-1543;Ge等人,(1991)J.Biol.Chem.[生物化学杂 志]266:17954-17958;Schnepf等人,(1990)J.Biol.Chem.[生物化学杂 志]265:20923-20930;Rang等人,91999)Appl.Environ.Microbiol.[应 用与环境微生物学]65:2918-2925)。
IPD082多肽同源物的氨基酸序列的比对(图1)允许鉴定该家族 中的天然同源物之间高度保守的残基。
核酸分子及其变体和片段
提供了包含编码IPD082多肽或其生物活性部分的核酸序列的分 离或重组的核酸分子,以及足以用作杂交探针以识别编码具有序列同 源性区域的蛋白质的核酸分子的多种核酸分子。如本文使用的,术语 “核酸分子”是指DNA分子(例如,重组DNA、cDNA、基因组DNA、 质粒DNA、线粒体DNA)和RNA分子(例如,mRNA)以及使用核 苷酸类似物而产生的DNA或RNA的类似物。该核酸分子可以是单链 的或双链的,但优选地是双链的DNA。
在此使用的“分离的”核酸分子(或DNA)是指不再处于其天 然环境中,例如处于体外的核酸序列(或DNA)。在此使用的“重组” 核酸分子(或DNA)是指在重组细菌或植物宿主细胞中的核酸序列(或 DNA)。在一些实施例中,“分离的”或“重组的”核酸不含有天然 地位于在衍生出该核酸的生物体的基因组DNA中的该核酸侧翼的序 列(即,位于该核酸的5’和3’末端的序列)(优选蛋白质编码序列)。 出于本公开的目的,“分离的”或“重组的”当用于指核酸分子时不 包括分离的染色体。例如,在不同的实施例中,编码IPD082多肽的 重组核酸分子可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb 或0.1kb的核酸序列,该核酸序列在衍生出该核酸的细胞的基因组 DNA中天然地位于该核酸分子的侧翼。
在一些实施例中,与天然或基因组核酸序列相比,编码IPD082 多肽的分离的核酸分子在核酸序列中具有一个或多个变化。在一些实 施例中,天然或基因组核酸序列的变化包括但不限于:由于遗传密码 的简并性造成的核酸序列的变化;与天然或基因组序列相比,由于氨 基酸取代、插入、缺失和/或添加造成的核酸序列的变化;一个或多个 内含子的去除;一个或多个上游或下游调节区域的缺失;和与基因组 核酸序列相关的5’和/或3’非翻译区域的缺失。在一些实施例中,编码 IPD082多肽的核酸分子是非基因组序列。
考虑了编码IPD082多肽或相关蛋白质的多种多核苷酸。当可操 作地连接到合适的启动子、转录终止和/或聚腺苷酸化序列上时,这类 多核苷酸可用于在宿主细胞中生产IPD082多肽。这类多核苷酸还可 用作用于分离编码IPD082多肽或相关蛋白的同源或基本上同源的多 核苷酸的探针。
编码IPD082多肽的多核苷酸
编码IPD082多肽或相关蛋白质的多核苷酸的一个来源是假单胞 菌属细菌,该细菌包含编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO: 6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的IPD082多肽的 SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO: 17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、 或SEQ IDNO:27的IPD082多核苷酸。可以分别使用SEQ ID NO:1、 SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO: 19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、或SEQ ID NO: 27的多核苷酸以在重组细菌宿主(包括但不限于土壤杆菌、芽孢杆菌、 埃希氏杆菌、沙门氏菌、假单胞菌和根瘤菌细菌宿主细胞)中表达 IPD082多肽。这些多核苷酸还可用作用于分离编码IPD082多肽或相 关蛋白的同源或基本上同源的多核苷酸的探针。这样的探针可用于鉴 定源自假单胞菌属物种的同源或基本上同源的多核苷酸。
编码IPD082多肽的多核苷酸也可以从IPD082多肽序列从头合 成。该多核苷酸基因的序列可以通过使用遗传密码从IPD082多肽序 列中推导出来。计算机程序如“BackTranslate”(GCGTM包,阿克莱 瑞公司(Acclerys,Inc.),加利福尼亚州圣迭戈市)可用于将肽序列 转换成编码该肽的相应核苷酸序列。可用于获得相应的核苷酸编码序 列的IPD082多肽序列的实例包括但不限于SEQ ID NO:2、SEQ ID NO: 4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 的IPD082多肽。此外,可以对本披露的合成的IPD082多核苷酸序列 进行设计,使其在植物中表达。美国专利号5,500,365描述了用于合 成植物基因以改进由所合成的基因编码的蛋白质的表达水平的方法。 该方法涉及对外源转基因的结构基因序列的改性,使该外源转基因更 有效地被植物转录、加工、翻译和表达。在植物中表达良好的基因的 特征包括消除可能在基因转录物的编码区域中引起不希望的内含子 剪接或聚腺苷酸化的序列,同时基本上保留杀有害生物蛋白的有毒部 分的氨基酸序列。美国专利号5,689,052中公开了用于在单子叶植物中获得转基因的增强表达的类似方法。
在一些实施例中,编码IPD082多肽的核酸分子是具有在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、 SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、 SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、 或SEQID NO:27中列出的序列的多核苷酸,及其变体、片段和互补 序列及其变体、片段和互补序列。在本文中使用“互补序列”来指与 给定核酸序列充分互补的核酸序列,使得其可以与该给定核酸序列杂 交从而形成稳定的双链体。在本文中使用“多核苷酸序列变体”来指 除遗传密码的简并性之外编码相同多肽的核酸序列。
在一些实施例中,编码IPD082多肽的核酸分子是非基因组核酸 序列。如本文使用的,“非基因组核酸序列”或“非基因组核酸分子” 或“非基因组多核苷酸”是指与天然或基因组核酸序列相比,在核酸 序列中具有一个或多个变化的核酸分子。在一些实施例中,天然或基 因组核酸分子的变化包括但不限于:由于遗传密码的简并性造成的核 酸序列的变化;用于在植物中表达的核酸序列的优化;与天然或基因 组序列相比,将至少一个氨基酸取代、插入、缺失和/或添加引入的核 酸序列的变化;去除与该基因组核酸序列相关的一个或多个内含子; 插入一个或多个异源内含子;缺失与该基因组核酸序列相关的一个或 多个上游或下游调节区;插入一个或多个异源上游或下游调节区;缺 失与该基因组核酸序列相关的5′和/或3′非翻译区;插入异源5′和/或 3′非翻译区;和聚腺苷酸化位点的修饰。在一些实施例中,非基因组 核酸分子是合成的核酸序列。
在一些实施例中,编码IPD082多肽的核酸分子是具有以下核苷 酸序列的非基因组多核苷酸,该核苷酸序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQID NO:9、SEQ ID NO:11、 SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、或SEQ ID NO:27 的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、 58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、 69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一 性,其中该IPD082多肽具有杀昆虫活性。
在一些实施例中,核酸分子编码包含SEQ ID NO:2、SEQ ID NO: 4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 的氨基酸序列的IPD082多肽,与在SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的相应 位置处的天然氨基酸相比,所述氨基酸序列具有1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、 53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70或更多个氨基酸取代。
还提供了编码如下转录和/或翻译产物的核酸分子,这些转录和/ 或翻译产物随后被剪接以最终产生功能性IPD082多肽。剪接可以在 体外或体内完成,并且可以涉及顺式或反式剪接。用于剪接的底物可 以是多核苷酸(例如,RNA转录物)或多肽。多核苷酸的顺式剪接的 实例是去除插入到编码序列中的内含子并剪接两个侧翼外显子区域 以产生IPD082多肽编码序列。反式剪接的实例是通过将该编码序列 分离成两个或更多个片段来对多核苷酸进行加密,这些片段可以单独 转录并且然后被剪接以形成全长杀有害生物编码序列。使用可以引入 到构建体中的剪接增强子序列可以促进多肽的顺式或反式剪接(美国 专利号6,365,377和6,531,316)。因此,在一些实施例中,这些多核 苷酸并不直接编码全长IPD082多肽,而是编码IPD082多肽的一个或 多个片段。这些多核苷酸可用于通过涉及剪接的机制来表达功能性 IPD082多肽,其中剪接可以在多核苷酸(例如内含子/外显子)和/或 多肽(例如内含肽/外显肽)的水平上发生。这可以用于,例如,控制 杀有害生物活性的表达,因为如果在允许剪接过程以产生功能性产物 的环境中表达所有必需的片段,则仅表达功能性杀有害生物多肽。在 另一个实例中,将一个或多个插入序列引入多核苷酸中可促进与低同 源性多核苷酸的重组;使用针对该插入序列的内含子或内含肽便于去 除该间插序列,从而恢复经编码的变体的功能。
作为编码IPD082多肽的这些核酸序列的片段的核酸分子也涵盖 在实施例中。如本文使用的“片段”来指编码IPD082多肽的核酸序 列的一部分。核酸序列的片段可以编码IPD082多肽的生物活性部分, 或者它可以是可以使用下文公开的方法用作杂交探针或PCR引物的 片段。作为编码IPD082多肽的核酸序列的片段的核酸分子包含至少 约150、180、210、240、270、300、330或360个连续核苷酸或至多 存在于编码本文披露的IPD082多肽的全长核酸序列中的核苷酸数目, 这取决于预期用途。“连续核苷酸”在此用于时指彼此紧邻的核苷酸 残基。实施例的核酸序列的片段将编码保留IPD082多肽的生物学活 性并因此保留杀昆虫活性的蛋白质片段。“保留杀昆虫活性”在本文 中用于指具有全长IPD082Aa多肽(SEQ ID NO:2)的至少约10%、 至少约30%、至少约50%、至少约70%、80%、90%、95%或更高的 杀昆虫活性的多肽。在一些实施例中,该杀昆虫活性针对鳞翅目物种。 在一个实施例中,该杀昆虫活性针对鞘翅目物种。在一些实施例中, 该杀昆虫活性针对玉米根虫复合物的一种或多种昆虫有害生物:西方 玉米根虫,玉米根萤叶甲(Diabrotica virgifera);北方玉米根虫 northern corn rootworm,D.barberi);南方玉米根虫或斑点黄瓜甲 虫;斑点黄瓜甲虫,和墨西哥玉米根虫(Mexican corn rootworm,D. virgifera zeae)。在一个实施例中,该杀昆虫活性针对根萤叶甲属物 种。
在一些实施例中,编码IPD082多肽、编码蛋白质的生物活性部 分的核酸序列的片段将编码至少约15、20、30、50、75、100、125 个连续氨基酸或高达实施例的全长IPD082多肽中存在的总数量的氨 基酸。在一些实施例中,片段是来自相对于SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ IDNO:28 的N-末端和/或C-末端的至少约1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、31、32、33、34或更多个氨基酸的N-末端和/或C-末端截短或其变体,例如通过蛋白水解、初始密码子的插入、编 码缺失的氨基酸的序列的缺失并伴随终止密码子的插入或终止密码 子的插入。
在一些实施例中,IPD082多肽由与SEQ ID NO:1、SEQ ID NO:3、 SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、或SEQ ID NO:27的核酸 序列充分同源的核酸序列编码。在本文中使用“充分同源的”来指使 用在此所述的这些比对程序中的一个,使用标准参数,与参比序列相 比,具有至少约50%、55%、60%、65%、70%、75%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或更高序列同源性的氨基 酸或核酸序列。本领域技术人员将认识到,可以通过考虑简并性、氨 基酸相似性、阅读框定位等来适当地调整这些值以确定由两个核酸序 列编码的蛋白质的相应同源性。在一些实施例中,该序列同源性是针 对编码IPD082多肽的多核苷酸的全长序列或针对IPD082多肽的全长 序列。
在一些实施例中,该核酸编码与SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28相比具 有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更高序列同一性的IPD082多 肽。在一些实施例中,使用ClustalW算法在Vector程序套件(英 杰公司(Invitrogen Corporation),卡尔斯巴德,加利福尼亚州)的 模块中在所有默认参数下计算该序列同一性。在一些实施 例中,使用ClustalW算法在Vector NTI程序套件(英杰公司,卡尔斯 巴德,加利福尼亚州)的ALIGNX模块中在所有默认参数下计算该整 个全长多肽的序列同一性。
为了确定两种氨基酸序列或两种核酸序列的同一性百分比,出于 最佳比较目的,将序列进行比对。两个序列之间的百分比同一性是由 序列共享的相同位置的数量的函数(即,同一性百分比=相同位置数/ 位置总数(例如重叠位置)×100)。在一个实施例中,两个序列具有 相同的长度。在另一个实施例中,比较实在整个参考序列中进行(例 如,在整个SEQ ID NO:1中)。可使用类似于上述那些技术的技术, 在容许或不容许缺口的情况下确定两个序列之间的百分比同一性。在 计算百分比同一性中,典型地计数确切的匹配。
用于比较序列的数学算法的另一个非限制性实例是如下文献中 所述算法:Needleman和Wunsch,(1970)J.Mol.Biol.[分子生物学杂 志]48(3):443-453,使用GAP版本10软件来确定序列同一性或相似性, 使用以下默认参数:对于核酸序列的同一性%和相似性%,使用GAP 权重为50和长度权重为3,以及nwsgapdna.cmpii评分矩阵;对于氨 基酸序列的同一性%或相似性%,使用GAP权重为8和长度权重为2, 以及BLOSUM62评分程序。也可以使用等效的程序。在此使用的“等 效的程序”是指任何序列比较程序,该程序对于任何两个所讨论的序 列产生一个比对,当与GAP版本10所产生的对应的比对相比较时, 该比对具有相同的核苷酸残基配对以及相同的序列同一性百分比。
在一些实施例中,IPD082多核苷酸编码包含与贯穿SEQ ID NO: 2的氨基酸序列的整个长度具有至少约80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更高同一性的氨基酸序列的IPD082多肽。
在一些实施例中,IPD082多核苷酸编码包含与贯穿SEQ ID NO: 2的氨基酸序列的整个长度具有高于97%、98%、99%或更高同一性 的氨基酸序列的IPD082多肽。
在一些实施例中,IPD082多核苷酸编码包含具有下式的氨基酸 序列的IPD082多肽:
其中
位置40处的Xaa是Tyr或Phe;位置48处的Xaa是Phe、Gly、 Ala、Val、Leu、Ile、Met、Ser、Thr、Cys、Tyr、Asn、Glu、Lys或 His;位置58处的Xaa是Trp或Tyr;位置69处的Xaa是Met、Leu、 Ser、Thr或Asp;位置70处的Xaa是Gly或Asn;位置71处的Xaa 是Gln、Leu、Ser、Glu或His;位置72处的Xaa是Glu、Gly、Ala、 Pro、Cys或Asp;位置73处的Xaa是Thr、Val、Leu或Arg;位置 74处的Xaa是Ala、Leu、Met、Ser或Arg;位置77处的Xaa是Arg、 Gly、Ala、Trp、Tyr或Glu;位置78处的Xaa是Trp、Glu或His; 位置79处的Xaa是Asp、Val或Asn;位置80处的Xaa是Asn、Gly、 Ala、Val、Leu、Ser或Arg;位置81处的Xaa是Pro或Ser;位置95 处的Xaa是Phe或Tyr;位置96处的Xaa是Phe、Met、Trp或Lys; 位置106处的Xaa是Trp或Tyr;位置144处的Xaa是Phe、Ala、Ile、 Ser或Gln;位置173处的Xaa是Thr或Tyr;位置174处的Xaa是 Leu、Val、Asn、Glu或Lys;位置175处的Xaa是Asp、Gly、Ser、 Thr或Asp;位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys或 Asn;位置198处的Xaa是Lys或Asn;位置199处的Xaa是Asp或 Asn;位置235处的Xaa是Glu或Gln;位置242处的Xaa是Phe或 Trp;位置252处的Xaa是Trp、Phe或Cys;位置290处的Xaa是Phe 或Thr;位置300处的Xaa是Trp、Val或Glu;位置318处的Xaa是 Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、Asp、Glu、Lys或Arg; 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、Cys、 Tyr、Asn或Arg;位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、Arg或His;位置321处的Xaa是Tyr、Val、Leu、Ile、 Met、Phe、Ser、Thr、Cys、Tyr、Gln、Lys、Arg或His;位置322处 的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、Thr、Gln、Asp、 Lys或Arg;位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、 Arg、Asn或His;位置324处的Xaa是Ser、Ala、Val、Leu、Phe、 Pro、Ser、Thr、Gln或Arg;位置325处的Xaa是Thr、Gly、Val、 Leu、Met、Trp、Pro、Cys、Asn、Asp、Glu、Ala或Arg;位置326 处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、Cys、Asn、 Glu或Arg;位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、 Pro、Asn、Asp、Glu、Lys或Arg;位置330处的Xaa是Gln或Glu; 位置331处的Xaa是Ser或Gly;位置358处的Xaa是Ala、Ala、Ile 或Arg;位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、 Tyr或Lys;位置361处的Xaa是Ile、Met或Ser;位置362处的Xaa 是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu或Lys;位置364处的 Xaa是Val或Phe;位置365处的Xaa是Lys、Leu或Thr;位置366 处的Xaa是Asn或Gln;位置367处的Xaa是Gly、Gly、Ala、Val、 Leu、Thr或Gln;位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、 Cys、Asn或Arg;位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、 Tyr、Gln、Lys或Arg;位置403处的Xaa是Thr、Gly、Ala、Leu或 Asp;位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln或 Lys;位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp或Arg; 位置406处的Xaa是Leu或Val;位置407处的Xaa是Pro、Ala、Leu、Ser、Gln或His;位置408处的Xaa是Leu、Val、Met、Phe、Pro、 Ser或Asp;位置409处的Xaa是Tyr、Met或Ser;位置410处的Xaa 是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp或Glu;位置413处的 Xaa是Gln或Glu;位置424处的Xaa是Gly、Ala或Met;位置425 处的Xaa是Lys、Gly、Val、Phe或Arg;位置426处的Xaa是Ile、 Val或Leu;位置427处的Xaa是Leu、Val或Ile;位置429处的Xaa 是Lys、Val、Met或Ser;位置431处的Xaa是Asn或Glu;位置432 处的Xaa是Ser、Gly或Cys;位置433处的Xaa是Gln、Gly、Ile、 Thr、Asp或Glu;位置434处的Xaa是Leu、Gln或His;位置478 处的Xaa是Asn或His;位置479处的Xaa是Asp、Gly、Ala、Val、 Met、Pro、Ser、Thr、Tyr、Lys或His;位置480处的Xaa是Ser、 Ala、Phe、Asn、Asp、Glu或Arg;位置481处的Xaa是Ser或Trp; 位置484处的Xaa是Tyr、Phe或Asn;位置485处的Xaa是Lys、 Gly、Ala、Leu、Met、Pro、Ser、Thr、Gln、Glu或Arg;位置487处 的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn或Lys;位置488处的 Xaa是Ala、Phe、Asp或Arg;位置489处的Xaa是Ala、Gly、Val、 Pro、Cys、Asp或Lys;位置490处的Xaa是Val、Ala、Val、Leu、 Phe、Ser、Thr或Cys;位置491处的Xaa是Cys或Gly;位置492处 的Xaa是Phe或Ile;位置494处的Xaa是Tyr、Gly或Trp;位置496 处的Xaa是Leu、Ile、Met或Phe;位置497处的Xaa是Glu、Ala或 Asp;并且位置499处的Xaa是Phe、Ala或Met;并且任选地1至20 个氨基酸从N-末端缺失。
在一些实施例中,IPD082多核苷酸编码包含如下氨基酸序列的 IPD082多肽,该氨基酸序列与由下式表示的SEQ ID NO:2具有高于 97%同一性:
其中
位置40处的Xaa是Tyr或Phe;位置48处的Xaa是Phe、Gly、 Ala、Val、Leu、Ile、Met、Ser、Thr、Cys、Tyr、Asn、Glu、Lys或 His;位置58处的Xaa是Trp或Tyr;位置69处的Xaa是Met、Leu、 Ser、Thr或Asp;位置70处的Xaa是Gly或Asn;位置71处的Xaa 是Gln、Leu、Ser、Glu或His;位置72处的Xaa是Glu、Gly、Ala、 Pro、Cys或Asp;位置73处的Xaa是Thr、Val、Leu或Arg;位置 74处的Xaa是Ala、Leu、Met、Ser或Arg;位置77处的Xaa是Arg、 Gly、Ala、Trp、Tyr或Glu;位置78处的Xaa是Trp、Glu或His; 位置79处的Xaa是Asp、Val或Asn;位置80处的Xaa是Asn、Gly、 Ala、Val、Leu、Ser或Arg;位置81处的Xaa是Pro或Ser;位置95 处的Xaa是Phe或Tyr;位置96处的Xaa是Phe、Met、Trp或Lys; 位置106处的Xaa是Trp或Tyr;位置144处的Xaa是Phe、Ala、Ile、 Ser或Gln;位置173处的Xaa是Thr或Tyr;位置174处的Xaa是 Leu、Val、Asn、Glu或Lys;位置175处的Xaa是Asp、Gly、Ser、 Thr或Asp;位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys或 Asn;位置198处的Xaa是Lys或Asn;位置199处的Xaa是Asp或 Asn;位置235处的Xaa是Glu或Gln;位置242处的Xaa是Phe或 Trp;位置252处的Xaa是Trp、Phe或Cys;位置290处的Xaa是Phe 或Thr;位置300处的Xaa是Trp、Val或Glu;位置318处的Xaa是 Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、Asp、Glu、Lys或Arg; 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、Cys、 Tyr、Asn或Arg;位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、Arg或His;位置321处的Xaa是Tyr、Val、Leu、Ile、 Met、Phe、Ser、Thr、Cys、Tyr、Gln、Lys、Arg或His;位置322处 的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、Thr、Gln、Asp、 Lys或Arg;位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、 Arg、Asn或His;位置324处的Xaa是Ser、Ala、Val、Leu、Phe、 Pro、Ser、Thr、Gln或Arg;位置325处的Xaa是Thr、Gly、Val、 Leu、Met、Trp、Pro、Cys、Asn、Asp、Glu、Ala或Arg;位置326 处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、Cys、Asn、 Glu或Arg;位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、 Pro、Asn、Asp、Glu、Lys或Arg;位置330处的Xaa是Gln或Glu; 位置331处的Xaa是Ser或Gly;位置358处的Xaa是Ala、Ala、Ile 或Arg;位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、 Tyr或Lys;位置361处的Xaa是Ile、Met或Ser;位置362处的Xaa 是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu或Lys;位置364处的 Xaa是Val或Phe;位置365处的Xaa是Lys、Leu或Thr;位置366 处的Xaa是Asn或Gln;位置367处的Xaa是Gly、Gly、Ala、Val、 Leu、Thr或Gln;位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、 Cys、Asn或Arg;位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、 Tyr、Gln、Lys或Arg;位置403处的Xaa是Thr、Gly、Ala、Leu或 Asp;位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln或 Lys;位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp或Arg; 位置406处的Xaa是Leu或Val;位置407处的Xaa是Pro、Ala、Leu、Ser、Gln或His;位置408处的Xaa是Leu、Val、Met、Phe、Pro、 Ser或Asp;位置409处的Xaa是Tyr、Met或Ser;位置410处的Xaa 是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp或Glu;位置413处的 Xaa是Gln或Glu;位置424处的Xaa是Gly、Ala或Met;位置425 处的Xaa是Lys、Gly、Val、Phe或Arg;位置426处的Xaa是Ile、 Val或Leu;位置427处的Xaa是Leu、Val或Ile;位置429处的Xaa 是Lys、Val、Met或Ser;位置431处的Xaa是Asn或Glu;位置432 处的Xaa是Ser、Gly或Cys;位置433处的Xaa是Gln、Gly、Ile、 Thr、Asp或Glu;位置434处的Xaa是Leu、Gln或His;位置478 处的Xaa是Asn或His;位置479处的Xaa是Asp、Gly、Ala、Val、 Met、Pro、Ser、Thr、Tyr、Lys或His;位置480处的Xaa是Ser、 Ala、Phe、Asn、Asp、Glu或Arg;位置481处的Xaa是Ser或Trp; 位置484处的Xaa是Tyr、Phe或Asn;位置485处的Xaa是Lys、 Gly、Ala、Leu、Met、Pro、Ser、Thr、Gln、Glu或Arg;位置487处 的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn或Lys;位置488处的 Xaa是Ala、Phe、Asp或Arg;位置489处的Xaa是Ala、Gly、Val、 Pro、Cys、Asp或Lys;位置490处的Xaa是Val、Ala、Val、Leu、 Phe、Ser、Thr或Cys;位置491处的Xaa是Cys或Gly;位置492处 的Xaa是Phe或Ile;位置494处的Xaa是Tyr、Gly或Trp;位置496 处的Xaa是Leu、Ile、Met或Phe;位置497处的Xaa是Glu、Ala或 Asp;和位置499处的Xaa是Phe、Ala或Met;并且任选地1至20 个氨基酸从N-末端缺失。
在一些实施例中,IPD082多核苷酸编码包含具有下式的氨基酸 序列的IPD082多肽:
其中
位置40处的Xaa是Tyr或Phe;位置48处的Xaa是Phe、Gly、 Ala、Val、Leu、Ile、Met、Ser、Thr、Cys、Tyr、Asn、Glu、Lys或 His;位置58处的Xaa是Trp或Tyr;位置69处的Xaa是Met、Leu、 Ser、Thr或Asp;位置70处的Xaa是Gly或Asn;位置71处的Xaa 是Gln、Leu、Ser、Glu或His;位置72处的Xaa是Glu、Gly、Ala、 Pro、Cys或Asp;位置73处的Xaa是Thr、Val、Leu或Arg;位置 74处的Xaa是Ala、Leu、Met、Ser或Arg;位置77处的Xaa是Arg、 Gly、Ala、Trp、Tyr或Glu;位置78处的Xaa是Trp、Glu或His; 位置79处的Xaa是Asp、Val或Asn;位置80处的Xaa是Asn、Gly、 Ala、Val、Leu、Ser或Arg;位置81处的Xaa是Pro或Ser;位置95 处的Xaa是Phe或Tyr;位置96处的Xaa是Phe、Met、Trp或Lys; 位置106处的Xaa是Trp或Tyr;位置144处的Xaa是Phe、Ala、Ile、 Ser或Gln;位置173处的Xaa是Thr或Tyr;位置174处的Xaa是 Leu、Val、Asn、Glu或Lys;位置175处的Xaa是Asp、Gly、Ser、 Thr或Asp;位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys或 Asn;位置198处的Xaa是Lys或Asn;位置199处的Xaa是Asp或 Asn;位置235处的Xaa是Glu或Gln;位置242处的Xaa是Phe或 Trp;位置252处的Xaa是Trp、Phe或Cys;位置290处的Xaa是Phe 或Thr;位置300处的Xaa是Trp、Val或Glu;位置318处的Xaa是 Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、Asp、Glu、Lys或Arg; 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、Cys、 Tyr、Asn或Arg;位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、Arg或His;位置321处的Xaa是Tyr、Val、Leu、Ile、 Met、Phe、Ser、Thr、Cys、Tyr、Gln、Lys、Arg或His;位置322处 的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、Thr、Gln、Asp、 Lys或Arg;位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、 Arg、Asn或His;位置324处的Xaa是Ser、Ala、Val、Leu、Phe、 Pro、Ser、Thr、Gln或Arg;位置325处的Xaa是Thr、Gly、Val、 Leu、Met、Trp、Pro、Cys、Asn、Asp、Glu、Ala或Arg;位置326 处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、Cys、Asn、 Glu或Arg;位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、 Pro、Asn、Asp、Glu、Lys或Arg;位置330处的Xaa是Gln或Glu; 位置331处的Xaa是Ser或Gly;位置358处的Xaa是Ala、Ala、Ile 或Arg;位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、 Tyr或Lys;位置361处的Xaa是Ile、Met或Ser;位置362处的Xaa 是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu或Lys;位置364处的 Xaa是Val或Phe;位置365处的Xaa是Lys、Leu或Thr;位置366 处的Xaa是Asn或Gln;位置367处的Xaa是Gly、Gly、Ala、Val、 Leu、Thr或Gln;位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、 Cys、Asn或Arg;位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、 Tyr、Gln、Lys或Arg;位置403处的Xaa是Thr、Gly、Ala、Leu或 Asp;位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln或 Lys;位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp或Arg; 位置406处的Xaa是Leu或Val;位置407处的Xaa是Pro、Ala、Leu、Ser、Gln或His;位置408处的Xaa是Leu、Val、Met、Phe、Pro、 Ser或Asp;位置409处的Xaa是Tyr、Met或Ser;位置410处的Xaa 是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp或Glu;位置413处的 Xaa是Gln或Glu;位置424处的Xaa是Gly、Ala或Met;位置425 处的Xaa是Lys、Gly、Val、Phe或Arg;位置426处的Xaa是Ile、 Val或Leu;位置427处的Xaa是Leu、Val或Ile;位置429处的Xaa 是Lys、Val、Met或Ser;位置431处的Xaa是Asn或Glu;位置432 处的Xaa是Ser、Gly或Cys;位置433处的Xaa是Gln、Gly、Ile、 Thr、Asp或Glu;位置434处的Xaa是Leu、Gln或His;位置478 处的Xaa是Asn或His;位置479处的Xaa是Asp、Gly、Ala、Val、 Met、Pro、Ser、Thr、Tyr、Lys或His;位置480处的Xaa是Ser、 Ala、Phe、Asn、Asp、Glu或Arg;位置481处的Xaa是Ser或Trp; 位置484处的Xaa是Tyr、Phe或Asn;位置485处的Xaa是Lys、 Gly、Ala、Leu、Met、Pro、Ser、Thr、Gln、Glu或Arg;位置487处 的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn或Lys;位置488处的 Xaa是Ala、Phe、Asp或Arg;位置489处的Xaa是Ala、Gly、Val、 Pro、Cys、Asp或Lys;位置490处的Xaa是Val、Ala、Val、Leu、 Phe、Ser、Thr或Cys;位置491处的Xaa是Cys或Gly;位置492处 的Xaa是Phe或Ile;位置494处的Xaa是Tyr、Gly或Trp;位置496 处的Xaa是Leu、Ile、Met或Phe;位置497处的Xaa是Glu、Ala或 Asp;并且位置499处的Xaa是Phe、Ala或Met;并且任选地1至20 个氨基酸从N-末端缺失,其中与SEQ ID NO:1或SEQ ID NO:2相比, 至少一个氨基酸是不同的。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有与如由式 XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ IDNO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、 Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、 Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有与如由 XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、 Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的 Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有由式 XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置 2处的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、 Arg、Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、 Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg 或Ile;位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的 Xaa是Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、 Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、 His或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly; 位置12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位 置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或 Phe;位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的 Xaa是Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置 20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22 处的Xaa是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、 Thr或Gln;位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25 处的Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、 Thr、Leu、Val或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位 置29处的Xaa是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp; 位置33处的Xaa是Gln或Asn;位置34处的Xaa是Asn或Gln;位 置35处的Xaa是Leu、Ile、Val、Asn或Gln;位置36处的Xaa是 Lys、Asn、Glu、Ser、Arg、Gln、Thr或Asp;位置37处的Xaa是 Thr、Asp、Asn、Gln、Glu或Ser;位置38处的Xaa是His、Asn、 Gln、Lys或Arg;位置39处的Xaa是Tyr、Phe、Thr或Ser;位置40 处的Xaa是Trp、Tyr或Phe;位置42处的Xaa是Ile、Leu或Val; 位置43处的Xaa是Gln、Asn、Arg或Lys;位置47处的Xaa是Pro、 Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly 或缺失;并且位置50处的Xaa是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有由式 XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、Arg、 Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、 Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile; 位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是 Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、 Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His 或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置 12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13 处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是 Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的 Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa 是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是 Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val 或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa 是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa 是Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是 Leu、Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、 Arg、Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、 Glu或Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置 39处的Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr 或Phe;位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、 Asn、Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处 的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50 处的Xaa是Lys、Ala、Arg或缺失。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、 Leu或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处的Xaa 是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu 或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有与SEQ ID NO:2的氨基酸残基 21-68、SEQ ID NO:4的残基1-48、SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO: 4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残 基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基243-286、 SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基193-242具有 至少90%同一性的至少一个氨基酸序列基序。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有选自与SEQ ID NO:2的氨基酸残基 21-68、SEQ ID NO:4的残基1-48、SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO: 4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残 基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基243-286、 SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基193-242具有 至少90%同一性的氨基酸序列基序的六个氨基酸序列基序。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有对应于SEQ ID NO:2的氨基酸残基 21-68、SEQ ID NO:4的残基1-48、SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO: 4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残 基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基243-286、 SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基193-242的至 少一个氨基酸序列基序。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有选自对应于SEQ ID NO:2的氨基酸 残基21-68、SEQ ID NO:4的残基1-48、SEQ IDNO:2的残基117-164、 SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ IDNO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4 的残基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基 243-286、SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基 193-242的氨基酸序列基序的六个氨基酸序列基序。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8 的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12的残基 1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基1-379、 SEQ ID NO:20的残基1-156、SEQID NO:22的残基1-156、SEQ ID NO: 24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ IDNO:28的 残基1-374具有至少80%序列同一性的氨基酸序列。
在一些实施例中,IPD082多核苷酸编码包含N-末端区域的 IPD082多肽,该N-末端区域含有与SEQ ID NO:2的残基1-337具有 至少80%序列同一性的氨基酸序列。
在一些实施例中,IPD082多核苷酸编码包含C-末端区域的 IPD082多肽,该C-末端区域含有与SEQ ID NO:2的残基379-514、 SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO: 12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26 的残基568-700、SEQ ID NO:10的残基171-299、SEQ ID NO:20的 残基196-324、SEQ ID NO:22的残基196-324、SEQ ID NO:8的残基 174-302、或SEQ ID NO:6的残基174-302具有至少80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。
在一些实施例中,IPD082多核苷酸编码包含C-末端区域的 IPD082多肽,该C-末端区域含有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO: 28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12 的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的 残基568-700、SEQ ID NO:10的残基171-299、SEQ ID NO:20的残 基196-324、SEQ ID NO:22的残基196-324、SEQ ID NO:8的残基 174-302、或SEQ ID NO:6的残基174-302的氨基酸序列。
在一些实施例中,提供编码嵌合蛋白的多核苷酸,该嵌合蛋白含 有处于任意组合的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的IPD082多肽的部分、基序、 或结构域。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域含有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示,其中位置1处的Xaa是Met、 Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位 置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His; 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位 置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa 是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr 或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr 或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置 11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa 是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是 Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的 Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn; 位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr 或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或 缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置 24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、 Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile; 位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe 或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是 Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、 Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、 Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或 Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的 Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、 Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的 Xaa是Lys、Ala、Arg或缺失;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码包含N-末端区域的嵌合IPD082多 肽的IPD082多核苷酸,该N-末端区域含有由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、 Leu或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,提供了编码包含N-末端区域的嵌合IPD082多 肽的IPD082多核苷酸,该N-末端区域含有由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处的Xaa 是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu 或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序选自与SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242具有至少90%同一性的氨 基酸序列基序;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的氨基酸残 基21-68、SEQ IDNO:4的残基1-48、SEQ ID NO:2的残基117-164、 SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4 的残基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基 243-286、SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基 193-242具有至少90%同一性的至少一个氨基酸序列基序;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含六个氨基酸序列基序的N-末端区域,该氨基酸序列基序 选自与SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2 的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的氨基酸序列基 序;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含六个氨基酸序列基序的N-末端区域,该氨基酸序列基序 选自与SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2 的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的氨基酸序列基 序;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含至少一个氨基酸序列基序的N-末端区域,该氨基酸序列 基序对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序对应于SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)包含六个氨基酸序列基序的N-末端区域,这些氨基酸序列基 序对应于SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基 1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12 的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基 1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、 SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基1-337 具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含与SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基 1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12 的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基 1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、 SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,提供了编码嵌合IPD082多肽的IPD082多核苷 酸,该多核苷酸包含:
a)N-末端区域,该N-末端区域包含与SEQ ID NO:2的残基1-337 具有至少80%序列同一性的氨基酸序列;和
b)C-末端区域,该C-末端区域包含SEQ ID NO:2的残基 379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基 415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基 419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基 568-700、SEQ IDNO:26的残基568-700、SEQ ID NO:10的残基 171-299、SEQ ID NO:20的残基196-324、SEQID NO:22的残基 196-324、SEQ ID NO:8的残基174-302、或SEQ ID NO:6的残基 174-302的氨基酸序列。
在一些实施例中,IPD082多核苷酸编码包含SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO: 12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 的氨基酸序列的IPD082多肽,与在SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的相应 位置处的天然氨基酸相比,所述氨基酸序列具有1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、 53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70或更多个氨基酸取代。
在一些实施例中,IPD082多核苷酸编码包含如下氨基酸序列的 IPD082多肽,与在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO: 24、SEQ ID NO:26、或SEQ ID NO:28的相应位置处的天然氨基酸相 比,所述氨基酸序列具有处于任意组合的1、2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、或60个氨基酸取代。
在一些实施例中,IPD082多核苷酸编码包含氨基酸序列的 IPD082多肽,与在SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO: 24、SEQID NO:26、或SEQ ID NO:28的相应位置处的天然氨基酸相 比,所述氨基酸序列具有处于任意组合的1、2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、或29个氨基酸取代。
在一些实施例中,IPD082多核苷酸编码包含SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO: 12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28 的氨基酸序列的IPD082多肽。
这些实施例还涵盖编码IPD082多肽变体的核酸分子。编码核酸 序列的IPD082多肽的“变体”包括编码本文公开的IPD082多肽但是 由于遗传密码的简并性以及如上所述的充分同一的那些序列而存在 保守差异的那些序列。可以使用熟知的分子生物学技术(如下文概述 的聚合酶链反应(PCR)和杂交技术)来识别天然存在的等位基因变 体。变体核酸序列还包括经合成衍生的核酸序列,该核酸序列已经例 如通过使用定点诱变而产生,但是仍然编码如下所讨论的所公开的 IPD082多肽。
本公开提供编码本文公开的IPD082多肽中的任何一个的经分离 或重组的多核苷酸。本领域普通技术人员将容易理解,由于遗传密码 的简并性,存在许多编码本公开的IPD082多肽的核苷酸序列。
本领域技术人员将进一步了解,可以通过核酸序列的突变来引入 变化,从而导致已编码的IPD082多肽的氨基酸序列的改变,而不改 变这些蛋白质的生物活性。因此,变体核酸分子可以通过以下方式产 生:将一个或多个核苷酸取代、添加和/或缺失引入到在此所公开的相 应的核酸序列中,这样使得将一个或多个氨基酸取代、添加或缺失引 入到所编码的蛋白质中。可以通过标准技术(如定点诱变和PCR介导 的诱变)引入突变。本公开也涵盖此类变体核酸序列。
可替代地,可以通过沿编码序列的全部或部分随机引入突变(例 如通过饱和诱变)来制备变体核酸序列,并且可以筛选所得突变体赋 予杀有害生物活性以识别保留活性的突变体的能力。在诱变之后,这 种经编码的蛋白质可以进行重组地表达,并且这种蛋白质的活性可以 使用标准的测定技术来确定。
本公开的多核苷酸及其片段任选用作各种重组和递归(recursive) 重组反应的底物,除了例如Ausubel、Berger和Sambrook所述的标准 克隆方法之外,即,以产生具有所需性质的另外的杀有害生物多肽同 源物及其片段。各种这样的反应是已知的,包括由诸位发明人及其同 事开发的那些反应。用于生产在此列出的任何核酸的变体的方法(这 些方法包括将此多核苷酸与第二(或更多)多核苷酸递归重组,从而 形成变体多核苷酸文库)也是本公开的实施例,所产生的文库、包括 这些文库的细胞和通过这些方法产生的任何重组多核苷酸也是如此。 另外,这样的方法任选地包括基于杀有害生物活性从这些文库中选择变体多核苷酸,正如其中这样的递归重组在体外或体内进行。
各种多样性产生方案,包括核酸递归重组方案是可获得的并且在 本领域中被充分描述。该程序可以单独和/或组合使用以产生核酸或核 酸组的一种或多种变体,以及所编码蛋白质的变体。单独地或整体地, 这些程序提供了产生多样化核酸和核酸集合(包括例如核酸文库)的 稳健且广泛适用的方式,这些方式可用于,例如,具有新的和/或改进 的特征的核酸、蛋白质、途径、细胞和/或生物体的工程化或快速进化。
虽然在随后的讨论过程中作出明确的区分和分类,但是应当理 解,这些技术通常不是相互排斥的。实际上,各种方法可以单独使用 或组合、平行或串联使用,以便取得不同的序列变体。
在此描述的任何多样性产生程序的结果可以是一种或多种核酸 的产生,其可以选择或筛选具有或赋予所需性质的核酸或编码具有或 者赋予所需性质的蛋白的核酸。通过本领域技术人员可以在此或以其 他方式获得的一种或多种方法进行多样化之后,可以针对所需活性或 性质,例如,杀有害生物活性或,在所需pH下的这种活性等选择所 产生的任何核酸。这可以包括通过本领域任何测定来识别可以例如以 自动化或可自动化形式检测的任何活性,参见例如以下的杀昆虫活性 筛选的讨论。各种相关(或甚至不相关)的性质可以由执业者酌情串 联或平行评估。
用于产生改性的核酸序列的各种多样性产生程序的描述,例如编 码具有杀有害生物活性的多肽或其片段的那些可以在以下出版物和 其中引用的参考文献中找到:Soong等人,(2000)Nat Genet[自然遗传 学]25(4):436-439;Stemmer等人,(1999)TumorTargeting[肿瘤靶 向]4:1-4;Ness等人,(1999),Nat Biotechnol[自然生物技术], 17:893-896;Chang等人,(1999)Nat Biotechnol[自然生物技 术]17:793-797;Minshull和Stemmer,(1999),Curr Opin Chem Biol[生 物化学当代观点],3:284-290;Christians等人,(1999),Nat Biotechnol[自然生物技术],17:259-264;Crameri等人,(1998), Nature[自然],391:288-291;Crameri等人,(1997),Nat Biotechnol[自 然生物技术],15:436-438;Zhang等人,(1997),PNAS USA[美国 科学院院报],94:4504-4509;Patten等人,(1997),Curr Opin Biotechnol[当前生物技术的观点],8:724-733;Crameri等人,(1996),Nat Med[自然医学],2:100-103;Crameri等人,(1996),Nat Biotechnol[自然生物技术],14:315-319;Gates等人,(1996),J Mol Biol[分子生物学杂志],255:373-386;Stemmer,(1996)“Sexual PCR and Assembly PCR”[有性PCR和装配PCR],在:The Encyclopedia ofMolecular Biology.[分子生物学百科全书],VCH出版商,纽约,第 447-457页中;Crameri和Stemmer,(1995)BioTechniques[生物技 术]18:194-195;Stemmer等人,(1995),Gene[基因],164:49-53; Stemmer,(1995),Science[科学],270:1510;Stemmer,(1995), Bio/Technology[生物/技术],13:549-553;Stemmer,(1994),Nature[自 然],370:389-391和Stemmer,(1994),PNAS USA[美国科学院院报], 91:10747-10751。
产生多样性的突变方法包括例如定点诱变(Ling等人,(1997)Anal Biochem[分析生物化学]254(2):157-178;Dale等人,(1996)Methods Mol Biol[分子生物学方法]57:369-374;Smith,(1985),Ann Rev Genet[遗 传学年评],19:423-462;Botstein和Shortle,(1985),Science[科学], 229:1193-1201;Carter,(1986),Biochem J[生物化学杂志],237:1-7 和Kunkel,(1987),“The efficiency of oligonucleotide directedmutagenesis[寡核苷酸定向诱变的效率]”,在:Nucleic Acids& Molecular Biology[核酸与分子生物学](Eckstein和Lilley主编,施普 林格出版公司,柏林));使用含尿嘧啶的模板的诱变(Kunkel,(1985) PNAS USA 82:488-492;Kunkel等人,(1987)Methods Enzymol[酶学方 法]154:367-382以及Bass等人,(1988)Science[科学]242:240-245); 寡核苷酸定向诱变(Zoller和Smith,(1983)Methods Enzymol[酶学方 法]100:468-500;Zoller和Smith,(1987)Methods Enzymol[酶学方法] 154:329-350(1987);Zoller和Smith,(1982)Nucleic Acids Res[核酸研 究]10:6487-6500);经硫代磷酸改性的DNA诱变(Taylor等人,(1985) Nucl Acids Res[核酸研究]13:8749-8764;Taylor等人,(1985)Nucl Acids Res[核酸研究]13:8765-8787(1985);Nakamaye和Eckstein,(1986)Nucl Acids Res[核酸研究]14:9679-9698;Sayers等人,(1988)Nucl Acids Res[核酸研究]16:791-802以及Sayers等人,(1988)Nucl Acids Res[核 酸研究]16:803-814);使用有缺口的双链体DNA的诱变(Kramer等 人,(1984)Nucl Acids Res[核酸研究]12:9441-9456;Kramer和Fritz, (1987)Methods Enzymol[酶学方法]154:350-367;Kramer等人,(1988) Nucl Acids Res[核酸研究]16:7207以及Fritz等人,(1988)Nucl Acids Res[核酸研究]16:6987-6999)。
其他合适的方法包括点错配修复(Kramer等人,(1984)Cell[细胞] 38:879-887)、使用有修复缺陷的宿主菌株的诱变(Carter等人,(1985) Nucl Acids Res[核酸研究]13:4431-4443以及Carter,(1987)Methods in Enzymol[酶学方法]154:382-403)、缺失诱变(Eghtedarzadeh和 Henikoff,(1986)Nucl Acids Res[核酸研究]14:5115)、限制性-选择和 限制性-纯化(Wells等人,(1986)Phil Trans R Soc Lond A[伦敦皇家学 会哲学会刊系列A]317:415-423)、通过全基因合成的诱变(Nambiar 等人,(1984)Science[科学]223:1299-1301;Sakamar和Khorana,(1988) Nucl Acids Res[核酸研究]14:6361-6372;Wells等人,(1985)Gene[基 因]34:315-323以及等人,(1985)Nucl Acids Res[核酸研究] 13:3305-3316)、双链断裂修复(Mandecki,(1986)PNAS USA[美国 科学院院报],83:7177-7181以及Arnold,(1993)Curr Opin Biotech[生 物技术当代观点]4:450-455)。许多上述方法的另外的细节可以在酶 学方法第154卷中找到,其还描述了用各种诱变方法故障查找问题的 有用对照。
关于各种多样性产生方法的另外的细节可以在以下美国专利、 PCT公开物和申请和EPO公开物中找到:美国专利号5,723,323、美 国专利号5,763,192、美国专利号5,814,476、美国专利号5,817,483、 美国专利号5,824,514、美国专利号5,976,862、美国专利号5,605,793、 美国专利号5,811,238、美国专利号5,830,721、美国专利号5,834,252、 美国专利号5,837,458、WO 1995/22625、WO 1996/33207、WO 1997/20078、WO 1997/35966、WO1999/41402、WO 1999/41383、WO 1999/41369、WO 1999/41368、EP 752008、EP 0932670、WO1999/23107、WO 1999/21979、WO 1998/31837、WO 1998/27230、WO 1998/27230、WO 2000/00632、WO 2000/09679、WO 1998/42832、WO 1999/29902、WO 1998/41653、WO 1998/41622、WO 1998/42727、WO 2000/18906、WO 2000/04190、WO 2000/42561、WO 2000/42559、WO2000/42560、WO 2001/23401和PCT/US01/06775。
实施例的核苷酸序列还可以用于从细菌来源分离相应的序列,这 些细菌来源包括但不限于假单胞菌属(Pseudomonas)物种。以这种 方式,可以使用如PCR、杂交等方法来识别这样的序列(基于其与本 文所述序列的序列同源性)。实施例涵盖基于与在此阐明的全部序列 或其片段的序列同一性选择的序列。这些序列包含作为公开序列的直 向同源物的序列。术语“直向同源物”是指衍生自共同祖先基因并且 由于物种形成而在不同物种中发现的基因。当其核苷酸序列和/或其编 码的蛋白质序列共有如本文其他地方所定义的实质同一性时,在不同 物种中发现的基因被认为是直向同源物。直向同源物的功能通常在物种间是高度保守的。
在PCR方法中,可以设计寡核苷酸引物用于PCR反应,以从由 目的任何生物体提取的cDNA或基因组DNA扩增相应的DNA序列。 用于设计PCR引物以及PCR克隆的方法是本领域通常已知的并且公 开于Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册](第2版,冷泉港实验室出版社,普 莱恩维尤,纽约州))中,以下为“Sambrook”。还参见,InnisInnis 等人编辑,(1990)PCR Protocols:A Guide to Methodsand Applications[PCR方案:方法和应用指南](学术出版社,纽约州); Innis和Gelfand编辑,(1995)PCR Strategies[PCR策略](学术出版社, 纽约州);和Innis和Gelfand编辑,(1999)PCR Methods Manual[PCR 方法手册](学术出版社,纽约州)。已知的PCR方法包括但不限于: 使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引 物、载体特异性引物、部分错配引物等的方法。
为了从细菌收集物中鉴定潜在的IPD082多肽,可以使用蛋白质 印迹和/或ELISA方法用针对IPD082多肽和/或IPD082多肽产生的抗 体筛选细菌细胞裂解物。这种类型的测定能以高通量方式进行。可以 通过各种技术(例如基于抗体的蛋白质纯化和识别)进一步分析阳性 样品。产生抗体的方法是本领域公知的,如下文所述。
可替代地,基于质谱的蛋白质识别方法可以使用文献中的方案用 于识别IPD082多肽的同源物(Scott Patterson,(1998),10.22,1-24, Current Protocol in MolecularBiology published by John Wiley&Son Inc.[Scott Patterson,(1998),10.22,1-24,由约翰&威利父子公司 出版的当前分子生物学方案])。具体地,使用基于LC-MS/MS的蛋 白质识别方法将给定细胞裂解物或所需分子量富集样品(从与IPD082 多肽的相关分子量带的SDS-PAGE凝胶切除的)的MS数据与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、 SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 或SEQ ID NO:28的IPD082多肽及其同源物的序列信息结合。肽序 列中的任何匹配表明在样品中具有同源蛋白的可能性。可以使用另外 技术(蛋白质纯化和分子生物学)来分离蛋白质并识别同源物的序列。
在杂交方法中,全部或部分杀有害生物核酸序列可用于筛选 cDNA或基因组文库。用于构建此类cDNA和基因组文库的方法是本 领域通常已知的,并且公开于Sambrook和Russell,(2001),同上。 所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或 其他寡核苷酸,并且可以用一个可检测基团(如32P或任何其他可检 测的标志物,如其他放射性同位素、荧光化合物、酶或酶辅因子)进 行标记。用于杂交的探针可以通过标记基于在此公开的编码已知的 IPD082多肽的核酸序列的合成的寡核苷酸来制备。可以另外使用简并引物,这些简并引物是基于在该核酸序列或所编码的氨基酸序列中的 保守性核苷酸或氨基酸残基而设计的。这种探针典型地包含以下核酸 序列的区域,该核酸序列区域在严格条件下与编码本公开的IPD082 多肽的核酸序列或其片段或变体的至少约12个、至少约25个、至少 约50、75、100、125、150、175或200个连续核酸进行杂交。用于 制备用于杂交的探针的方法是本领域通常已知的,并且公开于 Sambrook和Russell,(2001),同上,其通过引用结合在此。
例如,编码本文公开的IPD082多肽的完整核酸序列或者其一个 或多个部分可以用作能够与编码IPD082多肽样序列和信使RNA的相 应核酸序列特异性杂交的探针。为了实现在不同的条件下的特异性杂 交,这样的探针包括以下序列,这些序列是独特的并且长度优选为至 少约10个核苷酸、或长度为至少约20个核苷酸。此类探针可以用于 通过PCR对来自所选生物体的相应杀有害生物序列进行扩增。可以使 用这种技术从所希望的生物体中分离另外的编码序列,或作为用于确 定生物体中存在编码序列的诊断试验。杂交技术包括铺板的DNA文 库的杂交筛选(斑块或群落;参见,例如,Sambrook等人,(1989), MolecularCloning:A Laboratory Manual[分子克隆:实验室手册](第2 版,冷泉港实验室出版社,冷泉港,纽约州)。
这种序列的杂交可以在严格条件下进行。“严格条件”或“严格 杂交条件”在此用于是指探针与其靶序列杂交的程度将比它与其他序 列杂交的程度可检测地更高(例如,比背景高至少2倍)的条件。严 格条件是序列依赖性的,并且在不同情况下将有所不同。通过控制杂 交和/或洗涤条件的严格性,可以识别与该探针100%互补的靶序列(同 源探测)。可替代地,也能够调节严格条件以允许序列中的某些错配, 以便检测到更低程度的相似性(异源探测)。通常,探针的长度为小 于约1000个核苷酸,优选地长度小于500个核苷酸。
组合物
还涵盖包含本公开的IPD082多肽的组合物。在一些实施例中提 供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的至少一个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3 处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置 4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5 处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、 Met、Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位 置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu; 位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的 Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、 Gln、Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、 Ser、Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的 Xaa是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置 21处的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23 处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是 Ile、Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位 置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处 的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位 置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn; 位置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与如由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同 一性的六个氨基酸序列基序,其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处的Xaa是Gly或Asn;位置3处的 Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;位置4处 的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;位置6处的Xaa是Ala、Met、 Leu、Ser或Arg;位置7处的Xaa是Asn、Gln、Thr或Ser;位置9 处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;位置 10处的Xaa是Trp、Ile、Val、Glu、His或Leu;位置11处的Xaa是 Asp、Asn、Glu、Gln、Val或Gly;位置12处的Xaa是Asn、Gln、 Ala、Val、Leu Ser、Arg或Gly;位置13处的Xaa是Pro、Ser、Thr 或Ala;位置14处的Xaa是Tyr或Phe;位置16处的Xaa是Ile、Ser、 Val、Leu或Thr;位置17处的Xaa是Gln或Asn;位置19处的Xaa 是Thr、Ala、Ser或Pro;位置20处的Xaa是Tyr或Phe;位置21处 的Xaa是Pro或缺失;位置22处的Xaa是Ala或缺失;位置23处的 Xaa是Ser、Glu、Asp、Asn、Thr或Gln;位置24处的Xaa是Ile、 Val、Leu、Asn或Gln;位置25处的Xaa是Ala、Gly或Tyr;位置 27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;位置28处的 Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa是Phe或Tyr;位置 30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa是Gln或Asn;位 置34处的Xaa是Asn或Gln;位置35处的Xaa是Leu、Ile、Val、 Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、 Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser; 位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置39处的Xaa 是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr或Phe;位置 42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、Asn、Arg 或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是 Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50处的Xaa 是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置 2处的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、 Arg、Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、 Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg 或Ile;位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的 Xaa是Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、 Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、 His或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly; 位置12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位 置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或 Phe;位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的 Xaa是Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置 20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22 处的Xaa是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、 Thr或Gln;位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25 处的Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、 Thr、Leu、Val或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位 置29处的Xaa是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp; 位置33处的Xaa是Gln或Asn;位置34处的Xaa是Asn或Gln;位 置35处的Xaa是Leu、Ile、Val、Asn或Gln;位置36处的Xaa是 Lys、Asn、Glu、Ser、Arg、Gln、Thr或Asp;位置37处的Xaa是 Thr、Asp、Asn、Gln、Glu或Ser;位置38处的Xaa是His、Asn、 Gln、Lys或Arg;位置39处的Xaa是Tyr、Phe、Thr或Ser;位置40 处的Xaa是Trp、Tyr或Phe;位置42处的Xaa是Ile、Leu或Val; 位置43处的Xaa是Gln、Asn、Arg或Lys;位置47处的Xaa是Pro、 Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly 或缺失;并且位置50处的Xaa是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置 2处的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、 Arg、Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、 Gly、Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg 或Ile;位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的 Xaa是Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、 Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、 His或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly; 位置12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位 置13处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或 Phe;位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的 Xaa是Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置 20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22 处的Xaa是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、 Thr或Gln;位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25 处的Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、 Thr、Leu、Val或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位 置29处的Xaa是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp; 位置33处的Xaa是Gln或Asn;位置34处的Xaa是Asn或Gln;位 置35处的Xaa是Leu、Ile、Val、Asn或Gln;位置36处的Xaa是 Lys、Asn、Glu、Ser、Arg、Gln、Thr或Asp;位置37处的Xaa是 Thr、Asp、Asn、Gln、Glu或Ser;位置38处的Xaa是His、Asn、 Gln、Lys或Arg;位置39处的Xaa是Tyr、Phe、Thr或Ser;位置40 处的Xaa是Trp、Tyr或Phe;位置42处的Xaa是Ile、Leu或Val; 位置43处的Xaa是Gln、Asn、Arg或Lys;位置47处的Xaa是Pro、 Ala或缺失;位置48处的Xaa是Gly或缺失;位置49处的Xaa是Gly 或缺失;并且位置50处的Xaa是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、Arg、 Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、 Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile; 位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是 Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、 Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His 或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置 12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13 处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是 Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的 Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa 是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln; 位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是 Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val 或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa 是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa 是Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是 Leu、Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、 Arg、Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、 Glu或Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置 39处的Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr 或Phe;位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、 Asn、Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处 的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50 处的Xaa是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有由式XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXF XXELLXXXX(SEQ ID NO:70)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Asp、Arg、 Lys、Ser、Leu或His;位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、 Ala、Pro或Cys;位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile; 位置6处的Xaa是Ala、Met、Leu、Ser或Arg;位置7处的Xaa是 Asn、Gln、Thr或Ser;位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、 Ala、Trp、Tyr或Glu;位置10处的Xaa是Trp、Ile、Val、Glu、His 或Leu;位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;位置 12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;位置13 处的Xaa是Pro、Ser、Thr或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val、Leu或Thr;位置17处的Xaa是 Gln或Asn;位置19处的Xaa是Thr、Ala、Ser或Pro;位置20处的 Xaa是Tyr或Phe;位置21处的Xaa是Pro或缺失;位置22处的Xaa 是Ala或缺失;位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln; 位置24处的Xaa是Ile、Val、Leu、Asn或Gln;位置25处的Xaa是 Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val 或Ile;位置28处的Xaa是Gln、Asn、Thr或Ser;位置29处的Xaa 是Phe或Tyr;位置30处的Xaa是Phe、Tyr或Trp;位置33处的Xaa 是Gln或Asn;位置34处的Xaa是Asn或Gln;位置35处的Xaa是 Leu、Ile、Val、Asn或Gln;位置36处的Xaa是Lys、Asn、Glu、Ser、 Arg、Gln、Thr或Asp;位置37处的Xaa是Thr、Asp、Asn、Gln、 Glu或Ser;位置38处的Xaa是His、Asn、Gln、Lys或Arg;位置 39处的Xaa是Tyr、Phe、Thr或Ser;位置40处的Xaa是Trp、Tyr 或Phe;位置42处的Xaa是Ile、Leu或Val;位置43处的Xaa是Gln、 Asn、Arg或Lys;位置47处的Xaa是Pro、Ala或缺失;位置48处 的Xaa是Gly或缺失;位置49处的Xaa是Gly或缺失;并且位置50 处的Xaa是Lys、Ala、Arg或缺失;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了包含含有N-末端区域的IPD082多肽的组 合物,该N-末端区域含有由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的至少一个氨基酸序列基序, 其中位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处 的Xaa是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、 Leu或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中,提供了包含含有N-末端区域的IPD082多肽的 组合物,该N-末端区域含有由式 XXXXXXXGXXXXXXAXQFXXXXXXXGXXXXYGQNXXXXXXF XXELLXXXX(SEQ ID NO:71)表示的六个氨基酸序列基序,其中 位置1处的Xaa是Met、Val、Leu、Ser、Thr或Asp;位置2处的Xaa 是Gly或Asn;位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu 或His;位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro或Cys; 位置5处的Xaa是Thr、Leu、Val、Arg或Ile;位置6处的Xaa是 Ala、Met、Leu、Ser或Arg;位置7处的Xaa是Asn或Ser;位置9 处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr或Glu;位置10处的Xaa 是Trp、Val、Glu、His或Leu;位置11处的Xaa是Asp、Asn、Val 或Gly;位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg或Gly; 位置13处的Xaa是Pro、Ser或Ala;位置14处的Xaa是Tyr或Phe; 位置16处的Xaa是Ile、Ser、Val或Thr;位置19处的Xaa是Thr、 Ala或Pro;位置20处的Xaa是Tyr或Phe;位置21处的Xaa是Pro 或缺失;位置22处的Xaa是Ala或缺失;位置23处的Xaa是Ser、 Glu、Thr或Gln;位置24处的Xaa是Ile、Val或Gln;位置25处的 Xaa是Ala、Gly或Tyr;位置27处的Xaa是Arg、Ser或Ile;位置 28处的Xaa是Gln或Ser;位置29处的Xaa是Phe或Tyr;位置30 处的Xaa是Phe、Tyr或Trp;位置35处的Xaa是Leu、Ile或Gln; 位置36处的Xaa是Lys、Asn、Glu、Ser或Asp;位置37处的Xaa 是Thr、Asp、Asn或Ser;位置38处的Xaa是His、Asn或Arg;位 置39处的Xaa是Tyr或Ser;位置40处的Xaa是Trp、Tyr或Phe; 位置42处的Xaa是Ile或Val;位置43处的Xaa是Gln或Lys;位置 47处的Xaa是Pro、Ala或缺失;位置48处的Xaa是Gly或缺失;位 置49处的Xaa是Gly或缺失;并且位置50处的Xaa是Lys、Ala或 缺失。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与SEQ ID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2 的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的至少一个氨基 酸序列基序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与SEQ ID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、 SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2 的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基 263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、 或SEQ ID NO:4的残基193-242具有至少90%同一性的至少一个氨基 酸序列基序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有选自与SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242具有至少90%同一性的氨 基酸序列基序的六个氨基酸序列基序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有选自与SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242具有至少90%同一性的氨 基酸序列基序的六个氨基酸序列基序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有对应于SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242的至少一个氨基酸序列基 序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有对应于SEQ IDNO:2的氨基酸残基21-68、SEQ ID NO:4的残基 1-48、SEQ ID NO:2的残基117-164、SEQ IDNO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242的至少一个氨基酸序列基 序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有选自对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残 基1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242的氨基酸序列基序的六个 氨基酸序列基序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有选自对应于SEQID NO:2的氨基酸残基21-68、SEQ ID NO:4的残 基1-48、SEQ ID NO:2的残基117-164、SEQID NO:4的残基97-144、 SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ IDNO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的 残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基 213-262、或SEQ ID NO:4的残基193-242的氨基酸序列基序的六个 氨基酸序列基序;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的 残基1-131、SEQ ID NO:12的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基1-379、SEQ ID NO:20的残基1-156、SEQ ID NO: 22的残基1-156、SEQID NO:24的残基1-528、SEQ ID NO:26的残 基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的 氨基酸序列;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与SEQ ID NO:2的残基1-337具有至少80%序列同一性的氨基酸序 列;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、 SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10 的残基171-299、SEQ IDNO:20的残基196-324、SEQ ID NO:22的 残基196-324、SEQ ID NO:8的残基174-302、或SEQID NO:6的残 基174-302具有至少80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更高同一性的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的 残基1-131、SEQ ID NO:12的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基1-379、SEQ ID NO:20的残基1-156、SEQ ID NO: 22的残基1-156、SEQID NO:24的残基1-528、SEQ ID NO:26的残 基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的 氨基酸序列;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中提供了组合物,这些组合物包含:
a)包含N-末端区域的第一IPD082多肽片段,该N-末端区域含 有与SEQ ID NO:2的残基1-337具有至少80%序列同一性的氨基酸序 列;和
b)包含C-末端区域的第二IPD082多肽片段,该C-末端区域含 有SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:16的残基415-548、SEQ ID NO:28的残基415-548、SEQ ID NO: 18的残基419-552、SEQ ID NO:12的残基227-359、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、SEQ ID NO:10的 残基171-299、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残 基196-324、SEQ ID NO:8的残基174-302、或SEQ IDNO:6的残基 174-302的氨基酸序列。
在一些实施例中,该组合物包含本公开的IPD082多肽。在一些 实施例中,该组合物包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO: 6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQID NO:24、SEQ ID NO:26、或SEQ ID NO:28的氨基酸序列的 多肽。在一些实施例中,该组合物包含本公开的嵌合IPD082多肽。 在一些实施例中,该组合物包含含有IPD082多肽的融合蛋白。
抗体
还涵盖了针对实施例的IPD082多肽或其变体或片段的抗体。本 公开的抗体包括保留其结合昆虫肠道中发现的IPD082多肽的能力的 多克隆和单克隆抗体及其片段。据信抗体、单克隆抗体或其片段能够 与分子结合,前提是该抗体、单克隆抗体或其片段能够与该分子特异 性反应,从而将该分子与抗体、单克隆抗体或其片段结合。术语“抗 体”(Ab)或“单克隆抗体”(Mab)意在包括能够结合半抗原的完 整分子及其片段或结合区域或结构域(例如,像Fab和F(ab).sub.2片 段)。此类片段通常通过蛋白水解切割(例如木瓜蛋白酶或胃蛋白酶) 产生。可替代地,可以通过应用重组DNA技术或通过合成化学来产 生半抗原结合片段。制备本公开的抗体的方法是本领域公知的。例如, 参见Antibodies,A LaboratoryManual[抗体,实验室手册],Ed Harlow 和David Lane(编辑),冷泉港实验室,纽约州,(1988),以及其 中引用的参考文献。阐述免疫学的一般原则的标准参考文献包括: Klein,J.Immunology:The Science of Cell-Noncell Discrimination[免疫 学:细胞-非细胞鉴别科学],纽约约翰威利父子公司(1982);Dennett 等人,Monoclonal Antibodies,Hybridoma:A New Dimension in Biological Analyses,Plenum Press,N.Y.(1980)[单克隆抗体,杂交瘤: 生物分析中的新维度,纽约普莱南出版社(1980)]以及Campbell,“Monoclonal Antibody Technology[单克隆抗体技术]”,Laboratory Techniques inBiochemistry and Molecular Biology[生物化学和分子生 物学中的实验室技术],第13卷,Burdon等人(编辑),阿姆斯特丹 爱思唯尔出版社(1984)。还参见,美国专利号4,196,265;4,609,893; 4,713,325;4,714,681;4,716,111;4,716,117和4,720,459。针对IPD082多肽或其抗原结合部分的抗体可以通过多种技术产生,这些技术包括 常规的单克隆抗体方法,例如以下文献中所述的标准体细胞杂交技 术:Kohler和Milstein,(1975)Nature[自然]256:495。还可以使用产生 单克隆抗体的其他技术,如B淋巴细胞的病毒或致癌性转化。用于制 备杂交瘤的动物系统是小鼠系统。分离用于融合的免疫的脾细胞的免 疫方案和技术是本领域已知的。融合配偶体(例如,小鼠骨髓瘤细胞) 和融合方法也是已知的。本公开的抗体和单克隆抗体可以通过利用 IPD082多肽作为抗原来制备。
提供了用于检测样品中IPD082多肽的存在或检测编码IPD082 多肽的核苷酸序列的存在的试剂盒。在一个实施例中,试剂盒提供了 用于检测组织样品中IPD082多肽的存在的基于抗体的试剂。在另一 个实施例中,试剂盒提供了用于检测编码IPD082多肽的一种或多种 多核苷酸的存在的经标记的核酸探针。将试剂盒与用于进行检测方法 的适当的试剂和对照物,以及试剂盒的使用说明书一起提供。
受体鉴别和分离
还涵盖了针对实施例的IPD082多肽或针对其变体或片段的受 体。用于鉴定受体的方法是本领域熟知的(参见,Hofmann等人, (1988),Eur.J.Biochem.[欧洲生物化学杂志],173:85-91;Gill等 人,(1995),J.Biol.Chem.[生物化学杂志],27277-27282)可以使用来自易感昆虫的刷状缘膜囊泡用于鉴定和分离识别IPD082多肽的 受体。除了引用文献中列出的放射性标记方法之外,可以将IPD082 多肽用荧光染料和其他常见标记如链霉亲和素进行标记。可以根据参 考文献中列出的方案制备易感昆虫(如大豆夜蛾和椿象)的刷状缘膜 囊泡(BBMV),并在SDS-PAGE凝胶上分离,并在合适的膜上印迹。 标记的IPD082多肽可以与BBMV的印迹膜一起孵育,并标记的 IPD082多肽可以用标记的报道基因识别。与IPD082多肽相互作用的 一个或多个蛋白质带的鉴定可以通过基于N-末端氨基酸气相测序或 基于质谱的蛋白质鉴定方法进行检测(Patterson,(1998),10.22,1-24, 由约翰&威利父子公司(John Wiley&Son Inc)出版的Current Protocol in Molecular Biology[当前分子生物学方案])。一旦鉴定出蛋白质,可 以从易感昆虫的基因组DNA或cDNA文库中克隆相应的基因,并且 可以直接用IPD082多肽测量结合亲和力。通过IPD082多肽的杀昆虫 活性的受体功能可以通过RNAi型的基因敲除法完成验证(Rajagopal 等人,(2002),J.Biol.Chem.[生物化学杂志],277:46849-46851)。
核苷酸构建体、表达盒和载体
在此使用术语“核苷酸构建体”并不旨在将实施例限制为包含 DNA的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体 特别是由核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合组成 的多核苷酸和寡核苷酸也可用于在此公开的方法中。实施例的核苷酸 构建体、核酸和核苷酸序列另外涵盖这种构建体、分子和序列的所有 互补形式。此外,实施例的核苷酸构建体、核苷酸分子和核苷酸序列 涵盖能用于实施例的转化植物方法的所有核苷酸构建体、分子和序 列,包括但不限于由脱氧核糖核苷酸、核糖核苷酸及其组合所构成的 那些。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子也包 括合成的类似物。实施例的核苷酸构建体、核酸和核苷酸序列还涵盖 核苷酸构建体的所有形式,这些形式包括但不限于单链形式、双链形 式、发夹、茎环结构等。
另一实施例涉及经转化的生物体,如选自以下的生物体:植物和 昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻的生物体。 转化的生物体包含实施例的DNA分子、包含DNA分子的表达盒或包 含表达盒的载体,它可以稳定地并入所转化生物体的基因组。
在DNA构建体中提供实施例的序列,用于在目的生物体中表达。 该构建体将包括可操作地连接至实施例的序列的5′和3′的调节序列。 如本文使用的,术语“可操作地连接”是指启动子和第二序列之间的 功能性连接,其中启动子序列启动并介导相应于第二序列的DNA序 列的转录。通常,可操作地连接意味着所连接的核酸序列是连续的, 并且在必要时在相同阅读框中连接两个蛋白质编码区域。该构建体可 以另外包含待共转化进生物体的至少一个另外的基因。可替代地,可 以在多DNA构建体上提供另外的基因。
提供的这种DNA构建体具有用于插入本公开的IPD082多肽基因 序列的多个限制性位点,该多肽基因序列将位于调节性区域的转录调 节之下。该DNA构建体可另外包含可选标记基因。
按5′到3′的转录方向,DNA构建体将通常包括:转录和翻译起始 区域(即,启动子)、实施例的DNA序列以及在用作宿主的生物体 内具有功能的转录和翻译终止区域(即,终止区域)。转录起始区域 (即,启动子)对于实施例的宿主生物体和/或序列,可以是天然的、 类似的、外源的或异源的。此外,该启动子可以是自然序列或者,可 替代地,是合成序列。如本文使用的,术语“外源”表示在引入启动 子的天然生物体中没有发现启动子。在启动子对于实施例的序列而言 是“外源的”或“异源的”的情况下,它是指该启动子对于实施例的 可操作地连接的序列而言不是天然的或天然存在的启动子。如本文使 用的,嵌合基因包含与转录起始区可操作地连接的编码序列,该转录 起始区对于该编码序列是异源的。当启动子是天然或自然的序列时, 可操作地连接的序列的表达改造自野生型表达,这导致表型的改变。
在一些实施例中,该DNA构建体包含编码实施例的IPD082多肽 的多核苷酸。
在一些实施例中,该DNA构建体包含编码实施例的嵌合IPD082 多肽的多核苷酸。
在一些实施例中,该DNA构建体包含多核苷酸,该多核苷酸编 码含有实施例的IPD082多肽的融合蛋白。
在一些实施例中,该DNA构建体包含多核苷酸,该多核苷酸含 有编码本公开的第一IPD082多肽的N-末端区域的第一编码序列和编 码本公开的第二IPD082多肽的C-末端区域的第二编码序列。
在一些实施例中,如图10中示意性显示地,提供DNA构建体。 在一些实施例中,如图11中示意性显示地,提供DNA构建体。
在一些实施例中,DNA构建体还可以包括转录增强子序列。如 本文使用的,术语“增强子”是指可以刺激启动子活性的DNA序列, 并且可以是插入以增强启动子的水平或组织特异性的启动子的先天 元件或异源元件。各种增强子是本领域已知的,包括例如,在植物中 具有基因表达增强特性的内含子(美国专利申请公开号 2009/0144863)、泛素内含子(即,玉米泛素内含子1(参见,例如, NCBI序列S94464))、ω增强子或ω主要增强子(Galiie等人,(1989), Molecular Biology of RNA[RNA的分子生物学],编辑:Cech(丽丝, 纽约)237-256和Galiie等人,(1987),Gene[基因],60:217-25)、 CaMV 35S增强子(参见,例如,Benfey等人,(1990),EMBO J.[欧 洲分子生物学杂志],9:1685-96)和也可以使用的美国专利号7,803,992 的增强子,其中每一个通过引用并入。以上转录增强子的列表并不意 指是限制性的。任何合适的转录增强子都可用于实施例中。
该终止区域可以与该转录起始区域一起是天然的,可以与目的可 操作地连接的DNA序列一起是天然的,可以与该宿主植物一起是天 然的,或者可以衍生自另一种来源(即,对于该启动子、目的序列、 该宿主植物、或其任何组合是外源的或异源的)。
方便的终止区可获自根癌农杆菌(A.tumefaciens)的Ti质粒,诸 如章鱼碱合酶和胭脂碱合酶终止区。还参见,Guerineau等人,(1991) Mol.Gen.Genet.[分子遗传和基因组学]262:141-144;Proudfoot,(1991) Cell[细胞]64:671-674;Sanfacon等人,(1991)GenesDev.[基因与发 育]5:141-149;Mogen等人,(1990)Plant Cell[植物细胞]2:1261-1272;Munroe等人,(1990)Gene[基因],91:151-158;Ballas等人,(1989) Nucleic Acids Res.[核酸研究]17:7891-7903以及Joshi等人,(1987) Nucleic Acid Res.[核酸研究]15:9627-9639。
适当时可以优化核酸以增加在宿主生物体中的表达。因此,当宿 主生物体是植物时,合成核酸可以使用植物偏好性密码子合成以改进 表达。对于宿主偏好性使用的讨论,参见,例如,Campbell和Gowri, (1990)Plant Physiol.[植物生理学]92:1-11。例如,虽然在单子叶和双 子叶植物物种中均可以表达实施例的核酸序列,但是可以改性序列, 以解决单子叶或双子叶植物特异的偏好和GC含量偏好,这是因为这 些偏好已经表现出了差异(Murray等人,(1989),Nucleic Acids Res.[核 酸研究],17:477-498)。因而,特定氨基酸的玉米偏好性密码子可 以源自玉米的已知基因序列。来自玉米植物的28种基因的玉米密码 子使用在Murray等人(同上)的表4中列出。本领域中可获得用于 合成植物偏好的基因的方法。参见,例如,美国专利号5,380,831,和 5,436,391,以及Murray等人,(1989),Nucleic Acids Res.[核酸研究], 17:477-498,和Liu H等人,Mol Bio Rep[分子生物学报告],37:677-684, 2010,通过引用结合在此。玉蜀黍(Zea maize)密码子使用表也可以 在kazusa.orjp//cgi-bin/show.cgi?species=4577上找到,其可以使用 www前缀进行访问。
大豆(Glycine max)密码子使用表如表4所示,并且也可以在 kazusa.orjp//cgi-bin/show.cgi?species=3847&aa=1&style=N上找到,其 可以使用www前缀进行访问。
在一些实施例中,编码IPD082多肽的重组核酸分子具有玉米优 化的密码子。
已知另外的序列修饰增强细胞宿主中的基因表达。这些包括清除 序列,这些序列编码假的聚腺苷化信号、外显子-内含子剪接位点信号、 转座子样重复和可能不利于基因表达的其他良好表征的序列。可以将 序列的GC含量调整至给定细胞宿主的平均水平,如参考在该宿主细 胞中表达的已知基因而计算的。如本文使用的,术语“宿主细胞”是 指包含载体并支持表达载体的复制和/或表达的细胞。宿主细胞可以是 原核细胞如大肠杆菌,或真核细胞如酵母、昆虫、两栖类或哺乳动物 细胞、或单子叶或双子叶植物细胞。单子叶宿主细胞的实例是玉米宿 主细胞。当可能时,修饰序列以避免出现预测的发夹二级mRNA结构。
表达盒可以另外包含5′前导序列。这些前导序列可以起到增强翻 译的作用。翻译前导序列是本领域已知的并且包括:小核糖核酸病毒 前导序列,例如,EMCV前导序列(脑心肌炎5’非编码区域) (Elroy-Stein等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:6126-6130);马铃薯Y病毒组前导序列,例如,TEV前导序列 (烟草蚀纹病毒)(Gallie等人,(1995)Gene[基因]165(2):233-238); MDMV前导序列(玉米矮花叶病毒)、人类免疫球蛋白重链结合蛋 白(BiP)(Macejak等人,(1991)Nature[自然]353:90-94);来自苜 蓿花叶病病毒的外壳蛋白mRNA的非翻译前导序列(AMV RNA 4) (Jobling等人,(1987)Nature[自然]325:622-625);烟草花叶病毒前 导序列(TMV)(Gallie等人,(1989)在MolecularBiology of RNA[RNA 的分子生物学],编辑:Cech(丽丝,纽约),第237-256页);和玉 米褪绿斑驳病毒前导序列(MCMV)(Lommel等人,(1991)Virology [病毒学]81:382-385)。还参见,Della-Cioppa等人,(1987),Plant Physiol.[植物生理学],84:965-968。此类构建体还可以包含“信号序 列”或“前导序列”,以促进该肽的共翻译成或翻译后运输至某些细 胞内结构,如叶绿体(或其他质体)、内质网或高尔基体。
如本文使用的,“信号序列”是指已知或怀疑导致跨细胞膜的共 翻译或翻译后肽运输的序列。在真核生物中,这典型地涉及分泌到高 尔基体内,其中具有某些产生的糖基化。细菌的杀昆虫毒素经常被合 成为原毒素,它们是在该靶标有害生物的肠中经蛋白水解激活 (Chang,(1987),Methods Enzymol.[酶学方法],153:507-516)。 在一些实施例中,该信号序列位于该天然的序列中,或可以源自实施 例的序列。如本文使用的,术语“前导序列”是指当翻译时产生足以 引发肽链与亚细胞器的共翻译转运的氨基酸序列的任何序列。因此, 这包括通过进入内质网内、进入液泡、质体(包括叶绿体、线粒体) 等中来对运输和/或糖基化进行靶向的前导序列。靶向叶绿体类囊体腔 室的核编码蛋白具有由基质靶向信号肽和腔靶向信号肽组成的特征 二分转运肽。基质靶向信息位于转运肽的氨基-近端部分。腔靶向信号 肽位于转运肽的羧基近端部分,并且包含用于靶向腔的所有信息。最 近对高等植物叶绿体的蛋白质组学的研究已经在许多核编码的腔蛋 白质的识别中实现(Kieselbach等人,FEBS LETT[欧洲生化学会联盟 通讯],480:271-276,2000;Peltier等人,Plant Cell[植物细胞],12:319-341, 2000;Bricker等人,Biochim.Biophys Acta[生物化学与生物物理学报], 1503:350-356,2001),根据本公开可能使用该核编码的腔蛋白质的腔 靶向信号肽。Kieselbach等人,Photosynthesis Research[光合作用研究], 78:249-264,2003报道了来自拟南芥属约80种蛋白质以及来自菠菜和 豌豆的同源蛋白。特别地,该出版物的表2(其通过引用并入本说明 书中)公开了通过其登录号鉴别的来自叶绿体腔的85种蛋白质(还 参见美国专利申请公开2009/09044298)。此外,最近公开的稻基因 组草拟版本(Goff等人,Science[科学],296:92-100,2002)是可以根 据本公开使用的用于腔靶向信号肽的合适来源。
本领域技术人员熟知的合适的叶绿体转运肽(CTP)还包含嵌合 CT,这些嵌合CT包括但不限于:来自以下的CTP的N末端结构域、 中心结构域或C末端结构域:稻1-脱氧-D木酮糖-5-磷酸合酶、稻- 超氧化物歧化酶、稻-可溶性淀粉合酶、稻-NADP-依赖性苹果酸酶、稻-磷酸2-脱氢-3-脱氧庚酸醛缩酶2、稻-L-抗坏血酸过氧化物酶5、稻 -磷酸葡聚糖水二激酶、玉米ssRUBISCO、玉米-β-葡糖苷酶、玉米- 苹果酸脱氢酶、玉米硫氧还蛋白M-型(美国专利申请公开 2012/0304336)。
可以针对在叶绿体中的表达来优化待靶向该叶绿体的IPD082多 肽基因,以解决植物核与该细胞器之间使用的差异。以此方式,目的 核酸可使用叶绿体偏好性密码子进行合成。参见,例如,美国专利号 5,380,831,通过引用结合在此。
在制备表达盒时,可以操作各种DNA片段,以提供处于适当方 向以及合适时,处于适当阅读框中的DNA序列。为此,可使用衔接 子(adapter)或接头以连接DNA片段,或可以涉及其他操纵以提供 方便的限制位点、去除多余的DNA、去除限制位点等。出于这个目的, 可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再 取代(例如转换和颠换)。
许多启动子可用于实施这些实施例。可基于所需结果,选择启动 子。核酸可与组成性、组织偏好性、可诱导的或其他启动子组合用于 在宿主生物体中的表达。用于植物宿主细胞中的合适的组成型启动子 包括,例如Rsyn7启动子的核心启动子和其他在WO 1999/43838和美 国专利号6,072,050中公开的组成型启动子;核心CaMV 35S启动子 (Odell等人,(1985)Nature[自然]313:810-812);稻肌动蛋白(McElroy 等人,(1990)Plant Cell[植物细胞]2:163-171);泛素(Christensen等 人,(1989)Plant Mol.Biol.[植物分子生物学]12:619-632和Christensen 等人,(1992)Plant Mol.Biol.[植物分子生物学]18:675-689);pEMU (Last等人,(1991)Theor.Appl.Genet.[理论与应用遗传学] 81:581-588);MAS(Velten等人,(1984)EMBO J.[欧洲分子生物学 学会杂志]3:2723-2730);ALS启动子(美国专利号5,659,026)等。 其他组成型启动子包括例如以下专利文献中所讨论的那些:美国专利 号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680; 5,268,463;5,608,142和6,177,611。
根据期望的结果,从诱导型启动子表达基因可能是有益的。用于 调节植物中实施例的核苷酸序列表达的特定的目的启动子是损伤诱 导型启动子。这种损伤诱导型启动子可以对由昆虫取食引起的损害作 出反应,并且包括马铃薯蛋白酶抑制剂(pin II)基因(Ryan,(1990) Ann.Rev.Phytopath.[植物病理学年鉴]28:425-449;Duan等人,(1996)Nature Biotechnology[自然生物技术]14:494-498);wun1和wun2,美 国专利号5,428,148;win1和win2(Stanford等人,(1989)Mol.Gen. Genet.[分子遗传和基因组学]215:200-208);系统素(McGurl等人, (1992)Science[科学]225:1570-1573);WIP1(Rohmeier等人,(1993) Plant Mol.Biol.[植物分子生物学]22:783-792;Eckelkamp等人,(1993) FEBSLetters[欧洲生物学化学会联盟通讯]323:73-76);MPI基因 (Corderok等人,(1994)PlantJ.[植物杂志]6(2):141-150)等,以上文 献通过引用并入本文。
此外,可以在实施例的方法和核苷酸构建体中使用病原体诱导型 启动子。这种病原体诱导型启动子包括来自病程相关蛋白(PR蛋白) 的那些,其在病原体感染后被诱导;例如,PR蛋白、SAR蛋白、β-1,3- 葡聚糖酶、几丁质酶等。参见,例如Redolfi等人(1983)Neth.J.Plant Pathol.[荷兰植物病理学杂志]89:245-254;Uknes等人(1992)Plant Cell[植物细胞]4:645-656;以及Van Loon(1985)Plant Mol.Virol.[植 物分子病毒学]4:111-116。还参见,WO 1999/43819,其通过引用结合 在此。
感兴趣的是在病原体侵染部位处或附近局部表达的启动子。参 见,例如,Marineau等人,(1987)Plant Mol.Biol.[植物分子生物学] 9:335-342;Matton等人,(1989)Molecular Plant-Microbe Interactions[分 子植物-微生物相互作用]2:325-331;Somsisch等人,(1986)Proc.Natl. Acad.Sci.USA[美国科学院院报]83:2427-2430;Somsisch等人,(1988) Mol.Gen.Genet.[分子遗传和基因组学]2:93-98和Yang,(1996)Proc. Natl.Acad.Sci.USA[美国科学院院报]93:14972-14977。还参见Chen 等人,(1996)Plant J.[植物杂志]10:955-966;Zhang等人,(1994)Proc. Natl.Acad.Sci.USA[美国科学院院报]91:2507-2511;Warner等人, (1993)Plant J.[植物杂志]3:191-201;Siebertz等人,(1989)Plant Cell[植 物细胞]1:961-968;美国专利号5,750,386(线虫诱导型)及其中引用 的参考文献。特别令人感兴趣的是玉米PRms基因的诱导型启动子, 其表达是由病原体串珠镰刀菌(Fusarium moniliforme)诱导的(参见 例如Cordero等人,(1992)Physiol.Mol.Plant Path.[生理学与分子植物 病理学]41:189-200)。
可以使用化学调节型启动子以通过应用外源化学调节剂来调节 植物中的基因表达。根据目标,启动子可以是化学诱导型启动子,其 中施用化学品来诱导基因表达,或化学抑制型启动子,其中施用化学 品来抑制基因表达。化学诱导型启动子是本领域已知的,并且包括但 不限于由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子、由用作萌 前除草剂的疏水亲电子化合物活化的玉米GST启动子、以及由水杨酸 活化的烟草PR-1a启动子。其他目的化学品调节型启动子包括类固醇 应答启动子(参见,例如,Schena等人,(1991),Proc.Natl.Acad. Sci.USA[美国科学院院报],88:10421-10425和McNellis等人,(1998),Plant J.[植物杂志],14(2):247-257中的糖皮质激素诱导型启动子)以 及四环素诱导型和四环素抑制型启动子(参见,例如,Gatz等人, (1991),Mol.Gen.Genet[分子遗传学和基因组学],227:229-237,以 及美国专利号5,814,618和5,789,156),其通过引用结合在此。
组织偏好性启动子可以用于靶向特定植物组织内的增强的 IPD082多肽表达。组织偏好性启动子包括描述于以下文献中的那些: Yamamoto等人,(1997)Plant J.[植物杂志]12(2):255-265;Kawamata 等人(1997)Plant Cell Physiol.[植物细胞生理学]38(7):792-803; Hansen等人(1997)Mol.Gen.Genet.[分子和普通遗传学] 254(3):337-343;Russell等人,(1997)Transgenic Res.[转基因研究] 6(2):157-168;Rinehart等人,(1996)Plant Physiol.[植物生理学] 112(3):1331-1341;Van Camp等人,(1996)PlantPhysiol.[植物生 理学]112(2):525-535;Canevascini等人,(1996)Plant Physiol.[植物生理学]112(2):513-524;Yamamoto等人,(1994)Plant Cell Physiol. [植物细胞生理学]35(5):773-778;Lam,(1994)Results Probl.Cell Differ.[细胞分化的结果和问题]20:181-196;Orozco等人,(1993) Plant Mol Biol.[植物分子生物学]23(6):1129-1138;Matsuoka等人, (1993)Proc Natl.Acad.Sci.USA[美国科学院院报]90(20):9586-9590和Guevara-Garcia等人,(1993)Plant J.[植物杂志]4(3):495-505。必要的 话,此类启动子可经改性用于弱表达。
叶偏好性启动子是本领域已知的。参见,例如,Yamamoto等人, (1997)Plant J.[植物杂志]12(2):255-265;Kwon等人,(1994)Plant Physiol.[植物生理学]105:357-67;Yamamoto等人,(1994)Plant Cell Physiol.[植物细胞生理学]35(5):773-778;Gotor等人,(1993)Plant J.[植物杂志]3:509-18;Orozco等人,(1993)Plant Mol.Biol.[植物分子生物学]23(6):1129-1138以及Matsuoka等人,(1993)Proc.Natl.Acad. Sci.USA[美国科学院院报]90(20):9586-9590。
根偏好性或根特异性的启动子是已知的,并且可以从来自文献中 的许多可获得的启动子来选择,或者从不同的相容物种从头分离。参 见例如Hire等人,(1992)PlantMol.Biol.[植物分子生物学] 20(2):207-218(大豆根特异性谷氨酰胺合成酶基因);Keller和 Baumgartner,(1991)Plant Cell[植物细胞]3(10):1051-1061(法国菜豆 的GRP1.8基因中的根特异性控制元件);Sanger等人,(1990)Plant Mol.Biol.[植物分子生物学]14(3):433-443(根癌农杆菌的甘露聚糖合 成酶(MAS)基因的根特异性启动子)以及Miao等人,(1991)Plant Cell[植物细胞]3(1):11-22(编码细胞溶质谷氨酰胺合成酶(GS)的全 长cDNA克隆,其在大豆的根和根瘤中表达)。还参见,Bogusz等人, (1990),Plant Cell[植物细胞],2(7):633-641,其中描述了从来自固 氮的非豆科植物榆科山黄麻(Parasponiaandersonii)以及相关的非固 氮的非豆科植物山黄麻(Trema tomentosa)的血红蛋白基因分离的两 个根特异性启动子。这些基因的启动子被连接至β-葡萄糖醛酸酶报道 基因并且被引入非豆科植物烟草(Nicotiana tabacum)以及豆科植物 百脉根(Lotuscorniculatus)两者中,并且在两个实例中根特异性启动 子活性被保留。Leach和Aoyagi(1991)描述了他们对发根土壤杆菌 的高表达的roIC和roID根诱导基因的启动子的分析(参见,Plant Science[植物科学](利默里克)79(1):69-76)。他们推断在那些启动 子中增强子和组织偏好性DNA决定簇不相关联。Teeri等人(1989) 使用与lacZ的基因融合以显示编码章鱼碱合酶的农杆菌属T-DNA基 因尤其是在根尖的表皮中有活性,并且TR2′基因在完整植物中具有根 特异性并且被叶组织中的创伤刺激,这是与杀昆虫的或杀幼虫的基因 一起使用的特征的特别所希望的组合(参见,EMBO J.[欧洲分子生物 学杂志],8(2):343-350)。与nptII(新霉素磷酸转移酶II)融合的TR1′ 基因显示相似的特征。另外的根偏好性启动子包括VfENOD-GRP3基 因启动子(Kuster等人,(1995),Plant Mol.Biol.[植物分子生物学], 29(4):759-772);和rolB启动子(Capana等人,(1994),Plant Mol. Biol.[植物分子生物学],25(4):681-691)。还参见,美国专利号 5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732和 5,023,179。在US 20130117883中公开了拟南芥根偏好性调节序列。
“种子偏好性”启动子包括“种子特异性”启动子(在种子发育 期间有活性的那些启动子如种子贮藏蛋白的启动子)以及“种子发芽 性”启动子(在种子发芽期间有活性的那些启动子)。参见,Thompson 等人,(1989),BioEssays[生物测定],10:108,其通过引用结合在 此。这样的种子优选的启动子包括但不限于Cim1(细胞分裂素诱导 的信息);cZ19B1(玉米19kDa玉米蛋白);和milps(肌醇-1-磷酸 合酶)(参见,美国专利号6,225,529,其通过引用结合在此)。γ-玉 米蛋白和Glb-1是胚乳特异性启动子。对于双子叶植物,种子特异性启动子包括但不限于,Kunitz型胰蛋白酶抑制剂3(KTi3)(Jofuku 和Goldberg,(1989)Plant Cell[植物细胞]1:1079-1093)、菜豆β-菜豆 素、油菜籽蛋白、β-伴大豆球蛋白、大豆球蛋白1、大豆凝集素、十 字花科蛋白等。对于单子叶植物,种子特异性启动子包括但不限于玉 米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋 白、g-玉米醇溶蛋白、蜡质、收缩素1、收缩素2、球蛋白1等。还参 见WO 2000/12733,其中公开了来自end1和end2基因的种子偏好性 启动子;通过引用结合在此。在双子叶植物中,种子特异性启动子包 括但不限于:来自拟南芥属的种皮启动子,pBAN;和来自拟南芥属 的早期种子启动子,p26、p63、和p63tr(美国专利号7,294,760和 7,847,153)。在特定组织中具有“优选”表达的启动子在该组织中比 在至少一种其他植物组织中更大程度地表达。一些组织偏好性启动子 几乎专门在特定组织中表达。
当希望低水平表达时,可使用弱启动子。通常,如本文使用的, 术语“弱启动子”是指以低水平驱动编码序列表达的启动子。低水平 表达旨在约1/1000转录物至约1/100,000转录物至约1/500,000转录物 之间的水平。可替代地,应当认识到,术语“弱启动子”还涵盖仅在 少数细胞中驱动表达但不在其他细胞中表达以给出完全低表达水平 的启动子。当启动子以不可接受的高水平驱动表达时,可以删除或改 性部分启动子序列以降低表达水平。
这样的弱组成型启动子包括,例如,Rsyn7启动子的核心启动子 (WO 1999/43838和美国专利号6,072,050),核心35S CaMV启动子 等。其他组成型启动子包括,例如以下专利文献中所公开的那些:美 国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785; 5,399,680;5,268,463;5,608,142和6,177,611,通过引用结合在此。
以上启动子的列表并不意指是限制性的。任何合适的启动子都可 用于实施例中。
通常,表达盒将包括可选标记基因,用于选择转化的细胞。利用 可选标记基因来选择经转化的细胞或组织。标志物基因包括编码抗生 素抗性的基因,如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转 移酶(HPT)的基因,以及赋予对除草剂化合物(如草胺磷、溴苯腈、 咪唑啉酮和2,4-二氯苯氧基乙酸(2,4-D))的抗性的基因。合适的可 选标记基因的其他实例包括但不限于编码耐氯霉素的基因(Herrera Estrella等人,(1983)EMBO J.[欧洲分子生物学学会杂志]2:987-992); 甲氨蝶呤(Herrera Estrella等人,(1983)Nature[自然]303:209-213和 Meijer等人,(1991)Plant Mol.Biol.[植物分子生物学]16:807-820); 链霉素(Jones等人,(1987)Mol.Gen.Genet.[分子遗传和基因组学] 210:86-91);壮观霉素(Bretagne-Sagnard等人,(1996)Transgenic Res.[转基因研究]5:131-137);博来霉素(Hille等人,(1990)Plant Mol. Biol.[植物分子生物学]7:171-176);磺酰胺类(Guerineau等人,(1990) Plant Mol.Biol.[植物分子生物学]15:127-136);溴草腈(Stalker等人, (1988)Science[科学]242:419-423);草甘膦(Shaw等人,(1986) Science[科学]233:478-481以及美国专利申请序列号10/004,357和 10/427,692);草丁膦(DeBlock等人,(1987)EMBO J.[欧洲分子生物 学学会杂志]6:2513-2518)。主要参见Yarranton,(1992)Curr.Opin. Biotech.[生物技术新见]3:506-511;Christopherson等人(1992)Proc. Natl.Acad.Sci.USA[美国科学院院报]89:6314-6318;Yao等人(1992) Cell[细胞]71:63-72;Reznikoff(1992)Mol.Microbiol.[分子微生物学] 6:2419-2422;Barkley等人(1980)The Operon[操纵子]中,第177-220 页;Hu等人(1987)Cell[细胞]48:555-566;Brown等人(1987)Cell[细 胞]49:603-612;Figge等人(1988)Cell[细胞]52:713-722;Deuschle等 人(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:5400-5404;Fuerst等人(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报] 86:2549-2553;Deuschle等人(1990)Science[科学]248:480-483;Gossen, (1993)博士学位论文,University ofHeidelberg[德国海德堡大学]; Reines等人(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报] 90:1917-1921;Labow等人(1990)Mol.Cell.Biol.[分子细胞生物学] 10:3343-3356;Zambretti等人(1992)Proc.Natl.Acad.Sci.USA[美国科 学院院报]89:3952-3956;Baim等人(1991)Proc.Natl.Acad.Sci.USA [美国科学院院报]88:5072-5076;Wyborski等人(1991)Nucleic Acids Res.[核酸研究]19:4647-4653;Hillenand-Wissman(1989)Topics Mol. Struc.Biol.[热点分子结构生物学]10:143-162;Degenkolb等人(1991)Antimicrob.Agents Chemother.[抗微生物剂]35:1591-1595;Kleinschnidt 等人(1988)Biochemistry[生物化学]27:1094-1104;Bonin,(1993)博 士学位论文,University ofHeidelberg[德国海德堡大学];Gossen等人 (1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:5547-5551; Oliva等人(1992)Antimicrob.Agents Chemother.[抗微生物剂]36:913-919;Hlavka等人,(1985)Handbook of Experimental Pharmacology[实验药理学手册],78卷(Springer-Verlag,Berlin[柏林施 普林格出版社])和Gill等人,(1988)Nature[自然]334:721-724。此类公 开内容通过引用结合在此。
以上可选择标记基因的列表并不意指是限制性的。任何可选标记 基因均可用于这些实施例中。
植物转化
这些实施例的方法涉及将多肽或多核苷酸引入到植物中。如本文 使用的,“引入”意指将该多核苷酸或多肽呈送给该植物,以这样的 方式使得该序列进入该植物细胞的内部。这些实施例的方法不取决于 用于将多核苷酸或多肽引入植物中的具体方法,只要该多核苷酸或多 肽进入该植物的至少一个细胞的内部即可。将多核苷酸或多肽引入植 物的方法是本领域已知的,该方法包括但不限于稳定转化法、瞬时转 化法和病毒介导法。
如本文使用的“稳定转化”意指经引入植物中的核苷酸构建体合 并到该植物的基因组中,并且能够被其子代遗传。如本文使用的“瞬 时转化”意指将多核苷酸引入该植物中并且不合并到该植物的基因组 中,或者将多肽引入植物中。如本文使用的“植物”是指整株植物、 植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、及其胚 胎和子代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮 培养细胞、原生质体、叶子细胞、根细胞、韧皮部细胞和花粉)。
转化方案以及将核苷酸序列引入植物中的方案可以根据要进行 转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而异。 将核苷酸序列引入到植物细胞中并随后插入到植物基因组中的适合 方法包括显微注射(Crossway等人,(1986)Biotechniuques[生物技术] 4:320-334)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA[美 国科学院院报]83:5602-5606)、农杆菌介导的转化(美国专利号 5,563,055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J[欧洲分子生物学学会杂志]3:2717-2722)以及弹道粒子加速(参见 例如,美国专利号4,945,050;5,879,918;5,886,244和5,932,782;Tomes等人(1995),Plant Cell,Tissue,and Organ Culture:Fundamental Methods[植物细胞、组织和器官培养:基本方法],Gamborg和Phillips 编辑(Springer-Verlag,Berlin[德国柏林施普林格出版公司]);和 McCabe等人,(1988)Biotechnology[生物技术]6:923-926);以及Lecl 转化法(WO 00/28058)。对于马铃薯转化法,参见Tu等人,(1998) Plant MolecularBiology[植物分子生物学]37:829-838和Chong等人, (2000)Transgenic Research[转基因研究]9:71-78。可以在以下文献中找 到另外的转化方法:Weissinger等人,(1988)Ann.Rev.Genet.[遗传学 年鉴]22:421-477;Sanford等人,(1987)Particulate Scienceand Technology[粒子科学与技术]5:27-37(洋葱);Christou等人,(1988) PlantPhysiol.[植物生理学]87:671-674(大豆);McCabe等人,(1988) Bio/Technology[生物/技术]6:923-926(大豆);Finer和McMullen,(1991) In Vitro Cell Dev.Biol.[体外细胞和发育生物学]27P:175-182(大豆); Singh等人,(1998)Theor.Appl.Genet.[理论与应用遗传学]96:319-324 (大豆);Datta等人,(1990)Biotechnology[生物技术]8:736-740(稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报] 85:4305-4309(玉米);Klein等人,(1988)Biotechnology[生物技术] 6:559-563(玉米);美国专利号5,240,855;5,322,783和5,324,646; Klein等人,(1988)Plant Physiol.[植物生理学]91:440-444(玉米); Fromm等人,(1990)Biotechnology[生物技术]8:833-839(玉米); Hooykaas-VanSlogteren等人,(1984)Nature[自然](伦敦)311:763-764; 美国专利号5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad. Sci.USA[美国科学院院报]84:5345-5349(百合科);De Wet等人, (1985)The Experimental Manipulation of Ovule Tissues[胚珠组织的实验 操作],Chapman等人编辑,(纽约朗文出版社),第197-209页(花 粉);Kaeppler等人,(1990)Plant Cell Reports[植物细胞报告]9:415-418 和Kaeppler等人,(1992)Theor.Appl.Genet.[理论与应用遗传学] 84:560-566(晶体介导的转化);D′Halluin等人(1992)Plant Cell[植 物细胞]4:1495-1505(电穿孔);Li等人,(1993),Plant CellReports[植 物细胞报道],12:250-255以及Christou和Ford,(1995),Annals of Botany[植物学年报],75:407-413(水稻);Osjoda等人,(1996) Nature Biotechnology[自然生物技术]14:745-750(经由根癌农杆菌 (Agrobacterium tumefaciens)的玉米);将其全部通过引用结合在此。
在特定实施例中,可以使用各种瞬时转化法向植物提供这些实施 例的序列。这种瞬时转化法包括但不限于将IPD082多肽或者其变体 和片段直接引入植物中或将IPD082多核苷酸转录物引入植物中。此 类方法包括例如显微注射或粒子轰击。参见,例如,Crossway等人, (1986)Mol Gen.Genet.[分子和普通遗传学]202:179-185;Nomura等 人,(1986)Plant Sci.[植物科学]44:53-58;Hepler等人,(1994)Proc.Natl. Acad.Sci.[美国科学院院报]91:2176-2180和Hush等人,(1994)The Journal of Cell Science[细胞科学杂志]107:775-784,以上所有文献都通 过引用并入本文。可替代地,使用本领域已知的技术可以将该IPD082 多核苷酸瞬时地转化至植物中。此类技术包括病毒载体系统,和以阻 止DNA后续释放的方式使多核苷酸沉淀。因此,可以从微粒结合的 DNA进行转录,但其被释放以整合至基因组的频率大大降低了。这种 方法包括使用包被有聚乙烯亚胺(PEI;西格玛(Sigma)#P3143)的 粒子。
用于在植物基因组的特定位置定向插入多核苷酸的方法是本领 域已知的。在一个实施例中,利用位点特异性重组系统实现多核苷酸 在所希望的基因组位置处的插入。参见,例如,WO 1999/25821、WO 1999/25854、WO 1999/25840、WO 1999/25855和WO 1999/25853,其 全部通过引用结合在此。简而言之,本实施例的多核苷酸可以包含在 侧翼为两个不相同重组位点的转移盒内。将转移盒引入植物中,该植 物已经稳定地将靶位点并入其基因组,该靶位点侧接对应转移盒位点 的两个不相同重组位点。提供适当的重组酶,并将该转移盒整合到靶 位点。由此,目的多核苷酸被整合在植物基因组中的特定染色体位置处。
植物转化载体可以由对于实现植物转化所需要的一个或多个 DNA载体构成。例如,本领域常见做法是利用由多于一个连续DNA 片段组成的植物转化载体。这些载体在本领域中通常被称为“双元载 体”。双元载体以及具有辅助质粒的载体最常用于农杆菌介导的转化, 其中实现有效转化所需的DNA片段的大小和复杂性相当大,并且将 功能分离到单独的DNA分子上是有利的。双元载体通常含有包含 T-DNA转移(如左边界和右边界)所需的顺式作用序列的质粒载体、 被设计成能够在植物细胞中表达的可选标记、和“目的基因”(经工 程改造成能够在植物细胞(理想的是转基因植物代的细胞)中表达的 基因)。在这种质粒载体上还存在着细菌复制所需要的序列。这些顺 式作用序列以一种方式进行排列以便允许有效转移到植物细胞中并 在其中进行表达。例如,该可选标记基因以及该杀有害生物基因位于 该左边界与右边界之间。通常第二质粒载体包含反式作用因子,这些 反式作用因子介导从农杆菌属到植物细胞的T-DNA转化。这种质粒 经常包含这些毒性功能(Vir基因),这些毒性功能允许由农杆菌属 侵染植物细胞,并且通过在边界序列上的切割以及vir-介导的DNA转 移来转移DNA,如在本领域中所理解的(Hellens and Mullineaux,(2000) Trends in Plant Science 5:446-451[Hellens和Mullineaux,(2000),植 物科学趋势,5:446-451])。几种类型的农杆菌菌株(例如LBA4404、 GV3101、EHA101、EHA105等)可用于植物转化。通过其他方法如 显微投影、显微镜注射、电穿孔、聚乙二醇等来转化植物不需要第二 质粒载体。
通常,植物转化方法涉及将异源DNA转移到靶植物细胞中(例 如未成熟或成熟的胚胎、悬浮培养物、未分化的愈伤组织、原生质体 等),随后施用最大阈值水平的适当选择(取决于可选标记基因)以 从一组未转化的细胞群中回收经转化的植物细胞。在将异源外源DNA 整合到植物细胞中之后,然后在培养基中施用最大阈值水平的适当选 择以杀死未转化的细胞,并通过定期转移到新鲜培养基中来分离并增 殖从该选择处理中存活的推定已转化的细胞。通过连续传代和使用合 适的选择进行攻击,识别并增殖了这些用该质粒载体转化的细胞。然 后,可以使用分子和生物化学的方法来证实整合到该转基因植物的基因组中的目的异源基因的存在。
典型地将外植体转移到新鲜供应的相同培养基中并将其常规培 养。随后,在被置于补充有最大阈值水平的选择试剂的再生培养基上 之后,这些转化的细胞分化成枝条。然后,将这些枝条转移到选择性 生根培养基中用于回收已生根的枝条或小植株。然后,该转基因小植 株长成成熟植物并且产生能育的种子(例如,Hiei等人,(1994), The PlantJournal[植物杂志],6:271-282;Ishida等人,(1996),Nature Biotechnology[自然生物科技],14:745-750)。典型地将外植体转移到 新鲜供应的相同培养基中并将其常规培养。用于生产转基因植物的技 术和方法的一般描述发现于以下文献中:Ayres和Park,(1994)Critical Reviews in Plant Science[植物科学评论]13:219-239以及Bommineni和Jauhar,(1997)Maydica[美迪卡杂志]42:107-120。由于已转化的材料 含有许多细胞,已转化的和未转化的细胞都存在于任何一块受试的目 标愈伤组织或组织或者细胞组中。杀灭未转化的细胞并允许已转化的 细胞增殖的能力产生已转化的植物培养物。通常,去除未转化的细胞 的能力是对已转化的植物细胞的快速回收和转基因植物的成功产生 的限制。
可依据常规方式将已转化的细胞培育成植株。参见,例如, McCormick等人(1986)Plant Cell Reports[植物细胞报告]5:81-84。这 些植物然后可以生长,并且用同样转化的菌株或不同的菌株授粉,并 且所得杂交体具有识别的所需表型特征的组成型或诱导型表达。可以 培养两代或更多代,以确保所需表型特征的表达稳定地保持并遗传, 并且然后收获种子以确保已经实现了所需表型特征的表达。
可以通过使植物与病毒或者病毒核酸接触而向植物提供实施例 的核苷酸构建体。通常,这类方法涉及将目的核苷酸构建体并入到病 毒DNA或RNA分子中。应当认识到,实施例的重组蛋白最初可以被 合成为病毒多蛋白的一部分,然后该病毒多蛋白的一部分可以通过在 体内或体外蛋白水解加工,以产生所希望的IPD082多肽。还认识到, 包含实施例的IPD082的至少一部分氨基酸序列的这种病毒多蛋白可 具有所需的杀有害生物活性。这类病毒多蛋白和编码它们的核苷酸序 列涵盖在这些实施例中。用于为植物提供核苷酸构建体并在这些植物 中产生已编码的蛋白质的方法(涉及病毒DNA或RNA分子)是本领 域已知的。参见例如美国专利号5,889,191;5,889,190;5,866,785; 5,589,367和5,316,931;通过引用结合在此。
用于转化叶绿体的方法是本领域已知的。参见例如,Svab等人, (1990)Proc.Natl.Acad.Sci.USA[美国科学院院报]87:8526-8530; Svab和Maliga,(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报] 90:913-917;Svab和Maliga,(1993)EMBO J.[欧洲分子生物学学会杂 志]12:601-606。该方法依赖于粒子枪递送含有可选标记的DNA和通 过同源重组将DNA靶向质体基因组。此外,通过组织优选表达核编 码的和质体定向的RNA聚合酶,可以通过沉默的质体携带的转基因 的反式激活来实现质体转化。这种系统已被报道于以下文献中: McBride等人,(1994)Proc.Natl.Acad.Sci.USA[美国科学院院报]91:7301-7305。
这些实施例进一步涉及实施例的已转化的植物的植物繁殖材料, 包括但不限于种子、块茎、球茎、鳞茎、叶以及根和芽的插条。
这些实施例可用于转化任何植物物种,包括但不限于单子叶植物 和双子叶植物。目的植物的实例包括但不限于玉米(玉蜀黍),芸苔 属(例如,甘蓝型油菜、芜菁、芥菜)(特别是可用作种子油来源的 那些芸苔属物种),苜蓿(紫花苜蓿(Medicago sativa)),稻(rice, Oryza sativa),黑麦(rye,Secale cereale),高粱(甜高粱(Sorghum bicolor),高粱(Sorghum vulgare)),粟(例如,珍珠粟(御谷(Pennisetum glaucum)),黍(粟米(Panicummiliaceum)),粟(谷子(Setaria italica)),穇子(龙爪稷(Eleusine coracana))),向日葵(sunflower, Helianthus annuus),红花(safflower,Carthamus tinctorius),小麦(wheat,Triticum aestivum),大豆(soybean,Glycine max),烟草 (tobacco,Nicotianatabacum),马铃薯(potato,Solanum tuberosum), 花生(peanut,Arachis hypogaea),棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum)),甘薯(番薯(Ipomoeabatatas)),木薯(cassava,Manihot esculenta),咖啡(咖啡属(Coffea spp.)),椰子(coconut,Cocos nucifera),菠萝(pineapple,Ananas comosus),柑橘树(柑橘属(Citrusspp.)),可可(cocoa,Theobroma cacao),茶树(tea,Camellia sinensis),香蕉(芭蕉属(Musa spp.)), 鳄梨(avocado,Persea americana),无花果(fig或(Ficus casica)), 番石榴(guava,Psidium guajava),芒果(mango,Mangifera indica), 橄榄(olive,Oleaeuropaea),木瓜(番木瓜(Carica papaya)), 腰果(cashew,Anacardium occidentale),澳洲坚果(macadamia, Macadamia integrifolia),巴旦杏(almond,Prunus amygdalus),甜菜(sugar beets,Beta vulgaris),甘蔗(甘蔗属(Saccharum spp.)), 燕麦,大麦,蔬菜,观赏植物和针叶树。
蔬菜包括番茄(tomatoes,Lycopersicon esculentum)、莴苣(例 如,莴苣(Lactuca sativa))、青豆(菜豆(Phaseolus vulgaris))、 利马豆(lima bean,Phaseoluslimensis)、豌豆(香豌豆属(Lathyrus spp.))和黄瓜属的成员诸如黄瓜(cucumber,C.sativus)、香瓜 (cantaloupe,C.cantalupensis)和甜瓜(musk melon,C.melo)。观 赏植物包括杜鹃(杜鹃花属(Rhododendron spp.))、绣球花(hydrangea, Macrophyllahydrangea)、木槿(hibiscus,Hibiscus rosasanensis)、 玫瑰(蔷薇属(Rosa spp.))、郁金香(郁金香属(Tulipa spp.))、 水仙(水仙属(Narcissus spp.))、矮牵牛(petunias,Petunia hybrida)、 康乃馨(carnation,Dianthus caryophyllus)、一品红(poinsettia,Euphorbia pulcherrima)和菊花。可以用于实践实施例的针叶树包括 (例如)松树诸如火炬松(loblolly pine,Pinus taeda)、湿地松(slash pine,Pinus elliotii)、西黄松(ponderosa pine,Pinus ponderosa)、 黑松(lodgepole pine,Pinus contorta)和辐射松(Monterey pine,Pinus radiata);花旗松(Douglas-fir,Pseudotsuga menziesii);西方铁杉 (Western hemlock,Tsuga canadensis);北美云杉(白云杉(Picea glauca));红杉(北美红杉(Sequoia sempervirens));枞树(true firs)诸如银杉(胶冷杉(Abiesamabilis))和胶枞(香脂冷杉(Abies balsamea));以及雪松,如西方红雪松(北美乔柏(Thuja plicata)) 和阿拉斯加黄雪松(黄扁柏(Chamaecyparis nootkatensis))。这些 实施例的植物包括作物植物(例如玉米、苜蓿、向日葵、芸苔属、大 豆、棉花、红花、花生、高粱、小麦、粟、烟草等),例如玉米和大 豆植物。
草皮草包括但不限于:一年生早熟禾(annual bluegrass,Poa annua);一年生黑麦草(黑麦草(Lolium multiflorum));加拿大早 熟禾(Canada bluegrass,Poacompressa);紫羊茅(Chewing’s fescue, Festuca rubra);细弱翦股颖(colonialbentgrass,Agrostis tenuis); 匍匐翦股颖(creeping bentgrass,Agrostispalustris);冰草(沙生冰 草(Agropyron desertorum));扁穗冰草(fairway wheatgrass,Agropyron cristatum);硬羊茅(长叶羊茅(Festuca longifolia));草地早熟禾(Kentucky bluegrass,Poa pratensis);鸭茅(orchardgrass,Dactylis glomerata);多年生黑麦草(perennial ryegrass,Lolium perenne); 红狐茅(紫羊茅(Festuca rubra));小糠草(redtop,Agrostis alba); 粗茎早熟禾(rough bluegrass,Poa trivialis);羊茅(sheep fescue, Festuca ovina);无芒雀麦(smooth bromegrass,Bromus inermis); 高羊茅(tall fescue,Festuca arundinacea);梯牧草(timothy,Phleum pratense);绒毛剪股颖(velvet bentgrass,Agrostis canina);碱茅 (weeping alkaligrass,Puccinelliadistans);蓝茎冰草(western wheatgrass,Agropyron smithii);狗牙根(狗牙根属(Cynodon spp.)); 圣奥古斯丁草(St.Augustine grass,Stenotaphrum secundatum);结缕 草(结缕属(Zoysia spp.));百喜草(Bahia grass,Paspalum notatum); 地毯草(carpet grass,Axonopus affinis);假俭草(centipede grass, Eremochloaophiuroides);隐花狼尾草(kikuyu grass,Pennisetum clandesinum);海滨雀稗(seashore paspalum,Paspalum vaginatum); 格兰马草(blue gramma,Boutelouagracilis);野牛草(buffalo grass, Buchloe dactyloids);垂穗草(sideoats gramma,Bouteloua curtipendula)。
目的植物包括提供目的种子的谷物类植物、油料种子植物和豆科 植物。目的种子包括谷物种子,例如玉米、小麦、大麦、稻、高粱、 黑麦、粟等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔属、 玉米、苜蓿、棕榈、椰子、亚麻、蓖麻、橄榄等。豆科植物包括豆类 和豌豆。豆类包括瓜尔豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿 豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。
植物转化评估
在将异源外源DNA引入植物细胞后,通过各种方法(例如分析 与已整合的基因相关的核酸、蛋白质和代谢物)证实异源基因在该植 物基因组中的转化或整合。
PCR分析是在移植到土壤中之前的早期阶段检查已转化的细胞、 组织或芽中已整合的基因存在的快速方法(Sambrook和Russell, (2001)Molecular Cloning:ALaboratory Manual[分子克隆:实验手 册],Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY[纽约 冷泉港冷泉港实验室出版社])。使用对目的基因或农杆菌属载体背景 等具有特异性的寡核苷酸引物进行PCR。
可以通过基因组DNA的DNA印迹分析来证实植物转化 (Sambrook和Russell,(2001),同上)。通常,从转化体中提取 总DNA,该转化体用适当的限制酶进行消化,在琼脂糖凝胶中进行分 馏并且转到硝酸纤维素或尼龙膜上。然后,根据标准的技术,用例如 放射性标记32P的靶DNA片段来探测该膜或“印迹”以证实引入的 基因整合到该植物基因组中(Sambrook和Russell,(2001),同上)。
在RNA印迹分析中,从该转化体的特定组织中分离了RNA,在 甲醛琼脂糖凝胶中进行分馏,并且根据本领域常规使用的标准程序来 印迹到尼龙滤膜上(Sambrook和Russell,(2001),同上)。然后, 通过在本领域内已知的方法,通过将该滤膜与源自杀有害生物基因的 放射性探针进行杂交来测试由该杀有害生物基因所编码的RNA的表 达(Sambrook和Russell,(2001),同上)。
可以对转基因植物进行蛋白质印迹、生物化学测定以及类似测 定,以便通过标准程序(Sambrook和Russell,(2001),同上)使 用与IPD082多肽上存在的一个或多个表位结合的抗体来证实由该杀 有害生物基因所编码的蛋白质的存在。
转基因植物中性状的堆叠
转基因植物可以包含在此披露的一种或多种杀昆虫多核苷酸与 一种或多种另外的多核苷酸的堆叠,导致产生或抑制多个多肽序列。 包含多核苷酸序列堆叠的转基因植物可以通过传统育种方法或通过 遗传工程方法中的一种或两种获得。这些方法包含但不限于:育种各 自包含感兴趣的多核苷酸的单个系,将包含在此披露的基因的转基因 植物与随后的基因转化并将基因共转化为单个植物细胞。如本文使用 的术语“堆叠”包括在同一植物中存在多个性状(即,将两个性状并 入核基因组中,将一个性状并入核基因组中,并且将一个性状并入质 体的基因组中,或者这两种性状都被并入质体的基因组中)。在一个 非限制性实例中,“堆叠性状”包括其中序列在物理上彼此相邻的分 子堆叠。如本文使用的性状是指源自特定序列或序列组群的表型。可 以使用包含多个基因或在多个载体上分别携带的基因的单一转化载 体进行基因的共转化。如果通过遗传转化植物来堆叠序列,则目的多 核苷酸序列可以在任意时间并以任意顺序组合。可以用共转化方案将 这些性状与转化盒的任何组合所提供的目的多核苷酸一起引入。例 如,如果要引入两个序列,则这两个序列可以包含在单独的转化盒(反 式)中或包含在相同的转化盒(顺式)中。这些序列的表达可以通过 相同的启动子或通过不同的启动子驱动。在某些情况下,可能所希望 的是引入一种将抑制所关注的聚核苷酸的表达的转化盒。此可以与其 他抑制盒或过度表达盒的任何组合进行组合以在该植物中产生所需 性状组合。进一步应当认识到,可以使用位点特异重组系统,来在希 望的基因组位置堆叠多核苷酸序列。参见,例如,WO 1999/25821、 WO1999/25854、WO 1999/25840、WO 1999/25855、和WO 1999/25853, 其全部通过引用结合在此。
在一些实施例中,编码本文公开的IPD082多肽、单独的或与一 种或多种另外的昆虫抗性性状相堆叠的多核苷酸可以与一种或多种 另外的输入性状(例如,除草剂抗性、真菌抗性、病毒抗性、胁迫耐 受性、抗病性、雄性不育性、茎秆强度等)或输出性状(例如,增加的产量、改性的淀粉、改进的油特性、平衡的氨基酸、高赖氨酸或甲 硫氨酸、增加的可消化性、改进的纤维品质、抗旱性等)相堆叠。因 此,多核苷酸实施例可用于提供具有灵活地且成本有效地防治任何数 量的农艺有害生物的能力的经改进的作物品质的完整农艺学方案。
可用于堆叠的转基因包括但不限于:
1.赋予昆虫抗性或抗病性并编码以下各项的转基因:
(A)植物抗病性基因。通常通过植物中抗病性基因(R)的产 物与病原体中相应的无毒性(Avr)基因的产物之间的特异性相互作 用来活化植物防御。可以用经克隆的抗性基因来转化植物品种,以设 计对特定病原菌株具有抗性的植物。参见,例如Jones等人(1994)Science[科学]266:789(cloning of the tomato Cf-9 gene for resistance toCladosporium fulvum[克隆番茄Cf-9基因以抵抗番茄叶霉病菌]); Martin等人(1993)Science[科学]262:1432(tomato Pto gene for resistance to Pseudomonas syringaepv.tomato encodes a protein kinase[用于抵抗丁香假单胞菌番茄致病变体的番茄Pto基因编码蛋白 激酶]);Mindrinos等人,(1994)Cell[细胞]78:1089(Arabidopsis RSP2gene for resistance to Pseudomonas syringae[拟南芥RSP2基因用于对抗 丁香假单胞菌]),McDowell和Woffenden,(2003)Trends Biotechnol.[生 物科技趋势]21(4):178-83以及Toyoda等人,(2002)Transgenic Res.[转 基因研究]11(6):567-82。与野生型植物相比,对疾病具有抗性的植物 对病原体更具抗性。
(B)编码苏云金芽孢杆菌蛋白质的基因,其衍生物或其上建模 的合成多肽。参见,例如,Geiser等人,(1986)Gene[基因]48:109, 其公开了Btδ-内毒素基因的克隆和核苷酸序列。此外,编码δ-内毒素 基因的DNA分子可购自美国典型培养物保藏中心(罗克维尔(Rockville),马里兰州),例如在登录号40098、67136、 31995和31998下。经遗传工程化的苏云金芽孢杆菌转基因的其他非 限制性实例在以下专利和专利申请中给出,并且特此通过引用并入本 文中:美国专利号5,188,960;5,689,052;5,880,275;5,986,177;6,023,013、6,060,594、6,063,597、6,077,824、6,620,988、6,642,030、 6,713,259、6,893,826、7,105,332;7,179,965、7,208,474;7,227,056、 7,288,643、7,323,556、7,329,736、7,449,552、7,468,278、7,510,878、 7,521,235、7,544,862、7,605,304、7,696,412、7,629,504、7,705,216、 7,772,465、7,790,846、7,858,849和WO 1991/14778;WO 1999/31248; WO2001/12731;WO 1999/24581和WO 1997/40162。
也可以堆叠编码杀有害生物蛋白的基因,该基因包括但不限于: 来自假单胞菌属的杀昆虫蛋白,如PSEEN3174(Monalysin,(2011) PLoS Pathogens[PLoS病原体],7:1-13),来自假单胞菌蛋白菌菌株 CHA0和Pf-5(此前为荧光假单胞菌(fluorescens))(Pechy-Tarr, (2008)Environmental Microbiology[环境微生物学]10:2368-2386:基因 库登录号EU400157);来自台湾假单胞菌(Pseudomonas taiwanensis) (Liu等人,(2010)J.Agric.Food Chem.[农业食品化学学 报]58:12343-12349)和来自假产碱假单胞菌(Pseudomonas pseudoalcaligenes)(Zhang等人,(2009)Annals of Microbiology[微生物学年报]59:45-50和Li等人,(2007)Plant Cell Tiss.Organ Cult.[植物 细胞组织和器官培养]89:159-168);来自发光杆菌属和致病杆菌属的 杀昆虫蛋白(Hinchliffe等人,(2010)The Open Toxinology Journal[开 放性毒理学杂志]3:101-118和Morgan等人,(2001)Applied and Envir. Micro.[应用与环境微生物学]67:2062-2069),美国专利号6,048,838 和美国专利号6,379,946;美国专利公开号US 20140007292的PIP-1 多肽;美国专利公开号US 20140033361的AfIP-1A和/或AfIP-1B多 肽;美国序列号13/839702的PHI-4多肽;PCT序列号PCT/US14/51063 的PIP-47多肽、PCT序列号PCT/US14/55128的PIP-72多肽、以及δ- 内毒素包括但不限于Cry1、Cry2、Cry3、Cry4、Cry5、Cry6、Cry7、 Cry8、Cry9、Cry10、Cry11、Cry12、Cry13、Cry14、Cry15、Cry16、 Cry17、Cry18、Cry19、Cry20、Cry21、Cry22、Cry23、Cry24、Cry25、 Cry26、Cry27、Cry28、Cry29、Cry30、Cry31、Cry32、Cry33、Cry34、Cry35、Cry36、Cry37、Cry38、Cry39、Cry40、Cry41、Cry42、Cry43、 Cry44、Cry45、Cry46、Cry47、Cry49、Cry50、Cry51、Cry52、Cry53、 Cry54、Cry55、Cry56、Cry57、Cry58、Cry59、Cry60、Cry61、Cry62、 Cry63、Cry64、Cry65、Cry66、Cry67、Cry68、Cry69、Cry70、Cry71、 和Cry72类的δ-内毒素基因和苏云金芽孢杆菌溶细胞Cyt1和Cyt2基 因。这些类别的苏云金芽孢杆菌杀昆虫蛋白的成员是本领域技术人员 熟知的(参见,Crickmore等人,“Bacillusthuringiensis toxin nomenclature[苏云金芽孢杆菌毒素命名法]”(2011),在lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/,可以使用“www”前缀 在万维网上访问该网址。
δ-内毒素的实例还包括但不限于:美国专利号5,880,275和 7,858,849的Cry1A蛋白;美国专利号8,304,604和8.304,605的DIG-3 或DIG-11毒素(cry蛋白(如Cry1A)的α螺旋1和/或α螺旋2变体 的N末端缺失),美国专利申请序列号10/525,318的Cry1B;美国专 利号6,033,874的Cry1C;美国专利号5,188,960,6,218,188的Cry1F; 美国专利号7,070,982的Cry1 A/F嵌合体;6,962,705和6,713,063); 美国专利号7,064,249的Cry2蛋白如Cry2Ab蛋白;Cry3A蛋白,包 括但不限于:通过融合至少两种不同Cry蛋白的可变区和保守区的独 特组合产生的工程化杂合杀昆虫蛋白(eHIP)(美国专利申请公开号 2010/0017914);Cry4蛋白;Cry5蛋白;Cry6蛋白;美国专利号 7,329,736、7,449,552、7,803,943、7,476,781、7,105,332、7,378,499和 7,462,760的Cry8蛋白;Cry9蛋白,如Cry9A、Cry9B、Cry9C、Cry9D、Cry9E、和Cry9F家族的成员;Cry15蛋白,描述于以下文献中:Naimov 等人(2008)Appliedand Environmental Microbiology[应用与环境微生 物学]74:7145-7151;美国专利号6,127,180、6,624,145和6,340,593 的Cry22、Cry34Ab1蛋白;美国专利号6,248,535、6,326,351、6,399,330、 6,949,626、7,385,107和7,504,229的CryET33和CryET34蛋白;美国 专利公开号2006/0191034、2012/0278954,和PCT公开号WO 2012/139004的CryET33和CryET34同源物;美国专利号6,083,499、 6,548,291和6,340,593的Cry35Ab1蛋白;Cry46蛋白、Cry 51蛋白、 Cry二元毒素;TIC901或相关毒素;US 2008/0295207的TIC807;PCT US 2006/033867的ET29、ET37、TIC809、TIC810、TIC812、TIC127、 TIC128;美国专利号8,236,757的AXMI-027、AXMI-036和AXMI-038; US7,923,602的AXMI-031、AXMI-039、AXMI-040、AXMI-049;WO2006/083891的AXMI-018、AXMI-020、和AXMI-021;WO 2005/038032 的AXMI-010;WO 2005/021585的AXMI-003;US 2004/0250311的 AXMI-008;US 2004/0216186的AXMI-006;US2004/0210965的 AXMI-007;US 2004/0210964的AXMI-009;US 2004/0197917的 AXMI-014;US 2004/0197916的AXMI-004;WO 2006/119457的 AXMI-028和AXMI-029;WO 2004/074462的AXMI-007、AXMI-008、 AXMI-0080rf2、AXMI-009、AXMI-014和AXMI-004;美国专利号 8,084,416的AXMI-150;US20110023184的AXMI-205;US 201I/0263488的AXMI-011、AXMI-012、AXMI-013、AXMI-015、 AXMI-019、AXMI-044、AXMI-037、AXMI-043、AXMI-033、 AXMI-034、AXMI-022、AXMI-023、AXMI-041、AXMI-063、和 AXMI-064;US 2010/0197592的AXMI-R1和相关蛋白;WO 2011/103248的AXMI221Z、AXMI222z、AXMI223z、AXMI224z和 AXMI225z;WO11/103247的AXMI218、AXMI219、AXMI220、 AXMI226、AXMI227、AXMI228、AXMI229、AXMI230、和AXMI231; 美国专利号8,334,431的AXMI-115、AXMI-113、AXMI-005、AXMI-163 和AXMI-184;US 2010/0298211的AXMI-001、AXMI-002、AXMI-030、 AXMI-035、和AXMI-045;US2009/0144852的AXMI-066和 AXMI-076;美国专利号8,318,900的AXMI128、AXMI130、AXMI131、AXMI133、AXMI140、AXMI141、AXMI142、AXMI143、AXMI144、 AXMI146、AXMI148、AXMI149、AXMI152、AXMI153、AXMI154、 AXMI155、AXMI156、AXMI157、AXMI158、AXMI162、AXMI165、AXMI166、AXMI167、AXMI168、AXMI169、AXMI170、AXMI171、 AXMI172、AXMI173、AXMI174、AXMI175、AXMI176、AXMI177、 AXMI178、AXMI179、AXMI180、AXMI181、AXMI182、AXMI185、AXMI186、AXMI187、AXMI188、AXMI189;US 2010/0005543的 AXMI079、AXMI080、AXMI081、AXMI082、AXMI091、AXMI092、 AXMI096、AXMI097、AXMI098、AXMI099、AXMI100、AXMI101、AXMI102、AXMI103、AXMI104、AXMI107、AXMI108、AXMI109、 AXMI110、AXMI111、AXMI112、AXMI114、AXMI116、AXMI117、 AXMI118、AXMI119、AXMI120、AXMI121、AXMI122、AXMI123、AXMI124、AXMI1257、AXMI1268、AXMI127、AXMI129、AXMI164、 AXMI151、AXMI161、AXMI183、AXMI132、AXMI138、AXMI137; 和美国专利号8,319,019的具有修饰的蛋白水解位点的Cry蛋白如 Cry1A和Cry3A;以及美国专利申请公开号2011/0064710的来自苏云 金芽孢杆菌菌株VBTS 2528的Cry1Ac、Cry2Aa和Cry1Ca毒素蛋白。 其他Cry蛋白是本领域技术人员熟知的(参见Crickmore等人, “Bacillus thuringiensis toxin nomenclature[苏云金芽孢杆菌毒素命名 法]”(2011),网址为lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/,可 以使用“www”前缀在万维网上访问)。Cry蛋白的杀昆虫活性是本 领域技术人员所熟知的(回顾参见van Frannkenhuyzen,(2009)J.Invert. Path.[无脊椎动物病理学杂志]101:1-16)。使用Cry蛋白作为转基因 植物性状是本领域技术人员所熟知的,并且Cry转基因植物(包括但 不限于Cry1Ac、Cry1Ac+Cry2Ab、Cry1Ab、Cry1A.105、Cry1F、 Cry1Fa2、Cry1F+Cry1Ac、Cry2Ab、Cry3A、mCry3A、Cry3Bb1、 Cry34Ab1、Cry35Ab1、Vip3A、mCry3A、Cry9c和CBI-Bt)已获得 监管部门的批准(参见,Sanahuja,(2011)Plant Biotech Journal[植物生物技术杂志]9:283-300和CERA(2010)转基因作物数据库环境风 险评估中心(CERA)(GMCrop Database Center for Environmental Risk Assessment),ILSI研究基金会,华盛顿特区,网址为 cera-gmc.org/index.php?action=gm_crop_database,可以使用“www” 前缀在万维网上访问)。本领域技术人员熟知的多于一种杀有害生物 蛋白也可以在植物中表达,这些杀有害生物蛋白如Vip3Ab和Cry1Fa (US 2012/0317682)、Cry1BE和Cry1F(US2012/0311746)、Cry1CA 和Cry1AB(US 2012/0311745)、Cry1F和CryCa(US 2012/0317681)、Cry1DA和Cry1BE(US 2012/0331590)、Cry1DA和Cry1Fa(US 2012/0331589)、Cry1AB和Cry1BE(US 2012/0324606)、以及Cry1Fa 和Cry2Aa、Cry1I或Cry1E(US 2012/0324605)。杀有害生物蛋白还 包括杀昆虫脂肪酶,这些杀昆虫脂肪酶包括美国专利号7,491,869的 脂质酰基水解酶,和胆固醇氧化酶,如来自链霉菌属(Purcell等人, (1993)Biochem BiophysRes Commun[生物化学与生物物理学研究通 讯]15:1406-1413)。杀有害生物蛋白还包括美国专利号5,877,012、 6,107,279、6,137,033、7,244,820、7,615,686和8,237,020中的VIP(营 养性杀昆虫蛋白)毒素等。其他VIP蛋白质是本领域技术人员熟知的 (参见,lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/vip.html,其可以 使用“www”前缀在万维网上访问)。杀有害生物蛋白还包括毒素复 合物(TC)蛋白,该毒素复合物(TC)蛋白可从生物体如致病杆菌 属、发光杆菌属和类芽孢杆菌属获得(参见,美国专利号7,491,698 和8,084,418)。一些TC蛋白具有“独立”杀昆虫活性并且其他TC 蛋白增强由相同给定生物体产生的独立毒素的活性。可以通过源自不 同属的来源生物体的一种或多种TC蛋白“增效剂”来增强“独立” TC蛋白(例如来自发光杆菌属、致病杆菌属或类芽孢杆菌属)的毒 性。有三种主要类型的TC蛋白。如本文所提及的,A类蛋白(“蛋 白A”)是独立毒素。B类蛋白(“蛋白B”)和C类蛋白(“蛋白 C”)提高了A类蛋白的毒性。A类蛋白的实例是TcbA、TcdA、XptA1 和XptA2。B类蛋白的实例是TcaC、TcdB、XptB1Xb和XptC1Wi。 C类蛋白的实例是TccC、XptC1Xb和XptB1Wi。杀有害生物蛋白还 包括蜘蛛、蛇和蝎毒蛋白。蜘蛛肽的实例包括但不限于莱科毒素-1肽 及其突变体(美国专利号8,334,366)。
(C)编码昆虫特异性激素或信息素(如蜕化类固醇和保幼激素) 的多核苷酸,其变体,基于其的模拟物,或者其拮抗剂或激动剂。参 见,例如Hammock等人,(1990)Nature[自然]344:458,该文献公 开了经克隆的保幼激素酯酶的杆状病毒表达是保幼激素的灭活剂。
(D)编码昆虫特异性肽的多核苷酸,其在表达时破坏受影响有 害生物的生理机能。例如,参见Regan,(1994)J.Biol.Chem.[生物化 学杂志]269:9的公开内容(表达克隆产生编码昆虫利尿激素受体的 DNA);Pratt等人,(1989)Biochem.Biophys.Res.Comm.[生物化学与 生物物理研究通讯]163:1243(在Diploptera puntata中识别出了阿洛 斯德汀(allostatin));Chattopadhyay等人,(2004)Critical Reviews in Microbiology[微生物学评论]30(1):33-54;Zjawiony,(2004)J Nat Prod [天然产物杂志]67(2):300-310;Carlini和Grossi-de-Sa,(2002) Toxicon[毒素]40(11):1515-1539;Ussuf等人,(2001)Curr Sci.[当代科 学]80(7):847-853以及Vasconcelos和Oliveira,(2004)Toxicon[毒素] 44(4):385-403。还参见,美国专利号5,266,317,作者Tomalski等人, 他们公开了编码昆虫特异性毒素的基因。
(E)编码如下酶的多核苷酸,该多核苷酸负责单萜、倍半萜烯、 类固醇、异羟肟酸、苯丙素衍生物或具有杀昆虫活性的其他非蛋白质 分子的超累积。
(F)编码参与生物活性分子的修饰(包括翻译后修饰)的酶的 多核苷酸;例如糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化 酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹 性蛋白酶、几丁质酶和葡聚糖酶,无论是天然还是合成的。参见,PCT 申请WO 1993/02197,所属人为Scott等人,该文献公开了愈创葡聚 糖酶(callase)基因的核苷酸序列。含有几丁质酶编码序列的DNA分 子可以例如从登录号39637和67152下的获得。还参见,Kramer 等人,(1993),Insect Biochem.Molec.Biol.[昆虫生物化学与分子生 物学],23:691,其教导编码烟草钩虫几丁质酶的cDNA的核苷酸序列, 和Kawalleck等人,(1993)Plant Molec.Biol.[植物分子生物学], 21:673,其提供欧芹ubi4-2多泛素基因的核苷酸序列,和美国专利号 6,563,020、7,145,060和7,087,810。
(G)编码刺激信号转导的分子的多核苷酸。例如,参见Botella 等人,(1994)PlantMolec.Biol.[分子细胞生物学]24:757,该文献公开 了绿豆钙调素cDNA克隆的核苷酸序列,以及Griess等人,(1994)Plant Physiol.[植物生理学]104:1467,他们提供了玉米钙调素cDNA克隆的 核苷酸序列。
(H)编码疏水力矩肽(hydrophobic moment peptide)的多核苷 酸。参见,PCT申请WO 1995/16776和美国专利号5,580,852,速普 肽(其抑制真菌植物病原体)的肽衍生物的披露和PCT申请WO 1995/18855和美国专利号5,607,914(教导了赋予疾病抗性的合成抗微生物肽)。
(I)编码膜通透酶,通道形成剂或通道阻断剂的多核苷酸。例 如,参见Jaynes等人,(1993)Plant Sci.[植物科学]89:43,该文献公开 了天蚕素-β裂解肽类似物的异源表达,以提供对烟草假单胞菌具有抗 性的转基因烟草植物。
(J)编码病毒侵入性蛋白质或由其衍生的复合毒素的基因。例 如,病毒外壳蛋白在转化的植物细胞中的积累赋予由外源蛋白基因来 源的病毒以及由相关病毒导致的病毒侵染和/或疾病发展的抗性。参 见,Beachy等人,(1990)Ann.Rev.Phytopathol.[植物病理学年评] 28:451。外壳蛋白介导的抗性已被赋予至转化植物抵抗:苜蓿花叶病 毒、黄瓜花叶病毒、烟草线条病毒、马铃薯X病毒、马铃薯Y病毒、 烟草蚀纹病毒、烟草脆裂病毒和烟草花叶病毒。同上。
(K)编码昆虫特异性抗体或由其衍生的免疫毒素的基因。因此, 靶向昆虫肠道中关键代谢功能的抗体将使受影响的酶失活,杀灭昆 虫。Cf.Taylor,et al.,Abstract#497,SEVENTH INT′L SYMPOSIUM ON MOLECULAR PLANT-MICROBE INTERACTIONS[Cf.Taylor等人,摘要#497,分子植物-微生物相互作用的第七届国际研讨会](爱 丁堡,苏格兰,1994)(通过生产单链抗体片段在转基因烟草中酶促 失活)。
(L)编码病毒特异性抗体的基因。参见,例如Tavladoraki等人, (1993)Nature[自然]366:469,其显示,表达重组抗体基因的转基因植 物不受病毒侵袭。
(M)编码由病原体或寄生虫在自然中产生的发育阻滞蛋白的多 核苷酸。因此,真菌内α-1,4-D-多聚半乳糖醛酸酶通过溶解植物细胞 壁homo-α-1,4-D-半乳糖醛酸酶来促进真菌定植和植物营养释放。参见 Lamb等人,(1992)Bio/Technology[生物技术]10:1436。以下文献描述 了编码豆内聚半乳糖醛酸酶抑制蛋白的基因的克隆和表征:Toubart 等人,(1992)Plant J.[植物杂志]2:367。
(N)编码由植物在自然中产生的发育抑制蛋白的多核苷酸。例 如,已在以下文献中表明表达大麦核糖体失活基因的转基因植物具有 增加的对真菌疾病的抗性:Logemann等人,(1992)Bio/Technology[生 物技术]10:305。
(O)参与系统获得抗性(SAR)反应的基因和/或发病机制相关 的基因。Briggs,(1995)Current Biology[当代生物学]5(2),Pieterse和 Van Loon,(2004)Curr.Opin.Plant Bio.[植物生物学新观点] 7(4):456-64,以及Somssich,(2003)Cell[细胞]113(7):815-6。
(P)抗真菌基因(Cornelissen和Melchers,(1993)Pl.Physiol.[植 物生理学]101:709-712,和Parijs等人,(1991)Planta[植物] 183:258-264,以及Bushnell等人,(1998)Can.J.of Plant Path.[加拿大 植物病理学杂志]20(2):137-149)。还参见,美国专利申请序列号 09/950,933;11/619,645;11/657,710;11/748,994;11/774,121以及美 国专利号6,891,085和7,306,946。LysM受体样激酶用于感知几丁质片 段,作为植物对真菌病原体防御反应的第一步(US 2012/0110696)。
(Q)解毒基因,如伏马菌素、白僵菌素、串珠镰刀菌素和玉米 赤霉烯酮及其结构上相关的衍生物。例如,参见美国专利号5,716,820; 5,792,931;5,798,255;5,846,812;6,083,736;6,538,177;6,388,171和 6,812,380。
(R)编码胱抑素和半胱氨酸蛋白酶抑制剂的多核苷酸。参见, 美国专利号7,205,453。
(S)防御素基因。参见,WO 2003/000863和美国专利号 6,911,577;6,855,865;6,777,592和7,238,781。
(T)赋予线虫抗性的基因。参见,例如PCT申请WO 1996/30517; PCT申请WO 1993/19181、WO 2003/033651,以及Urwin等人,(1998) Planta[植物]204:472-479,和Williamson,(1999)Curr Opin Plant Bio.[植物生物学新观点]2(4):327-31;美国专利号6,284,948和 7,301,069以及miR164基因(WO 2012/058266)。
(U)赋予对疫霉根腐病抗性的基因,如Rps 1、Rps 1-a、Rps 1-b、 Rps 1-c、Rps 1-d、Rps 1-e、Rps 1-k、Rps 2、Rps 3-a、Rps 3-b、Rps 3-c、Rps 4、Rps 5、Rps 6、Rps 7和其他Rps基因。参见,例如Shoemaker 等人,Phytophthora Root Rot Resistance Gene Mappingin Soybean[大豆 中疫霉根腐病抗性基因图谱],植物基因组第四次会议,加利福尼亚州圣迭戈(San Diego,Calif.)(1995)。
(V)赋予对褐茎腐病抗性的基因,如美国专利号5,689,035所述, 并为此通过引入并入本文。
(W)赋予对炭疽菌抗性的基因,如美国专利申请公开US 2009/0035765中所述,并为此通过引用并入本文。这包括可以用作单 一基因座转化的Rcg基因座。
2.赋予对除草剂的抗性的转基因,例如:
(A)编码对如下除草剂的抗性的多核苷酸,该除草剂抑制生长 点或分生组织,如咪唑啉酮或磺酰脲。这个类别的实例性基因编码突 变体ALS和AHAS酶,分别如以下文献中所述:Lee等人,(1988)EMBO J.[欧洲分子生物学学会杂志]7:1241和Miki等人,(1990)Theor.Appl. Genet.[理论与应用遗传学]80:449。还参见,美国专利号5,605,011; 5,013,659;5,141,870;5,767,361;5,731,180;5,304,732;4,761,373; 5,331,107;5,928,937和5,378,824;美国专利申请序号11/683,737和 国际公开WO 1996/33270。
(B)编码草甘膦抗性的蛋白质的多核苷酸(5-烯醇式丙酮酰-3- 磷酸莽草酸合酶(EPSP)和aroA基因给予的抗性)和其他膦酰基化 合物如草胺膦(草胺膦乙酰转移酶(PAT)和吸水链霉菌草胺膦乙酰 转移酶(bar)基因),以及吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。参见,例如Shah等人的美国专利号4,940,835, 其公开了EPSPS形式的能赋予草甘磷抗性的核苷酸序列。Barry等人 的美国专利号5,627,061也描述了编码EPSPS酶的基因。还参见,美 国专利号6,566,587;6,338,961;6,248,876;6,040,497;5,804,425;5,633,435;5,145,783;4,971,908;5,312,910;5,188,642;5,094,945、 4,940,835;5,866,775;6,225,114;6,130,366;5,310,667;4,535,060; 4,769,061;5,633,448;5,510,471;Re.36,449;RE 37,287E和5,491,288 以及国际公开EP 1173580;WO 2001/66704;EP1173581和EP 1173582,为此目的将以上专利通过引用结合在此。还给予植物草甘 磷抗性,使该植物表达编码草甘磷氧化还原酶的基因,这在美国专利 号5,776,760和5,463,175中进行了更全面地描述,为此目的将这两份 专利以引用方式并入本文。另外,可通过过量表达编码草甘磷N-乙酰 转移酶的基因,来给予植物草甘磷抗性。参见例如美国专利号 7,462,481;7,405,074以及美国专利申请公开号2008/0234130。编码突 变aroA基因的DNA分子可以在登录号39256下获得,并且 该突变基因的核苷酸序列公开于授予Comai的美国专利号4,769,061 中。欧洲申请号0333033(Kumada等人)和美国专利号4,975,374(Goodman等人)公开了赋予除草剂(如L-草铵膦)抗性的谷氨酰胺 合成酶基因的核苷酸序列。EP申请号0 242 246和0 242 236至 Leemans等人中提供了草丁膦乙酰基转移酶基因的核苷酸序列;De Greef等人,(1989),Bio/Technology[生物/技术],7:61描述了表达 编码草丁膦乙酰转移酶活性的嵌合bar基因的转基因植物的生产。还 参见,美国专利号5,969,213;5,489,520;5,550,318;5,874,265; 5,919,675;5,561,236;5,648,477;5,646,024;6,177,616和5,879,903, 为此目的将以上专利通过引用结合在此。赋予苯氧基丙酸和环己酮(如稀禾啶和吡氟氯禾灵)抗性的示例性基因是Acc1-S1、Acc1-S2 和Acc1-S3基因,其描述于以下文献中:Marshall等人,(1992)Theor. Appl.Genet.[理论与应用遗传学]83:435。
(C)编码对抑制光合作用的除草剂具有抗性的蛋白质的多核苷 酸,例如三嗪(psbA和gs+基因)和苄腈(腈水解酶基因)。Przibilla 等人,(1991)Plant Cell[植物细胞]3:169,描述了用编码突变体psbA 基因的质粒对衣藻进行转化。针对腈水解酶基因的核苷酸序列公开在 美国专利号4,810,648(Stalker)中,并且含有这些基因的DNA分子 可以在登录号53435,67441和67442下获得。编码谷胱甘肽 S-转移酶的DNA的克隆和表达描述于以下文献中:Hayes等人,(1992) Biochem.J.[生物化学杂志]285:173。
(D)已经发现,编码对乙酰醇酸合成酶具有抗性的蛋白质的多 核苷酸能产生表达这种对多种类型的除草剂具有抗性的酶的植物,并 已将该多核苷酸引入到多种植物中(参见,例如Hattori等人(1995)Mol Gen Genet.[分子和普通遗传学]246:419)。赋予除草剂抗性的其他基 因包括:编码大鼠细胞色素P4507A1和酵母NADPH-细胞色素P450 氧化还原酶的嵌合蛋白的基因(Shiota等人,(1994)Plant Physiol[植 物生理学]106:17),针对谷胱甘肽还原酶和超氧化物歧化酶的基因 (Aono等人,(1995)Plant Cell Physiol[植物细胞生理学]36:1687)和 各种磷酸转移酶的基因(Datta等人,(1992)Plant Mol Biol[植物分子 生理学]20:619)。
(E)编码靶向原卟啉原氧化酶(protox)(对于生产叶绿素所必 需的)的除草剂抗性的多核苷酸。原卟啉原氧化酶(protox)作为针 对各种除草化合物的靶标。这些除草剂还抑制存在的所有不同种类的 植物的生长,导致其完全破坏。美国专利号6,288,306、6,282,83和 5,767,373和国际公开WO 2001/12825中描述了包含对这些除草剂具 有抗性的改变的原卟啉原氧化酶活性的植物的发育。
(F)aad-1基因(最初来自鞘脂单胞菌(Sphingobium herbicidovorans))编码芳氧基链烷酸酯双加氧酶(AAD-1)蛋白。该 性状赋予对2,4-二氯苯氧基乙酸和芳氧基苯氧基丙酸酯(通常称为 “fop”除草剂,例如喹禾灵)除草剂的耐受性。用于植物中除草剂耐 受性的aad-1基因本身首先在WO 2005/107437中公开(还参见US 2009/0093366)。来自食酸丛毛单胞菌的aad-12基因,其编码芳氧基 链烷酸酯双加氧酶(AAD-12)蛋白,该蛋白通过用芳氧基链烷酸酯 部分(包括苯氧基生长素(例如2,4-D,MCPA)以及吡啶氧基生长素 (例如氯氟吡氧乙酸,三氯吡氧乙酸))使几种除草剂失活来赋予对 2,4-二氯苯氧基乙酸和吡啶氧基乙酸酯除草剂的耐受性。
(G)美国专利申请公开2003/0135879中所公开的用于给予麦草 畏耐受性的编码除草剂抗性的麦草畏单加氧酶的多核苷酸。
(H)美国专利号4,810,648中所公开的用于给予溴苯腈耐受性的 编码溴苯腈腈水解酶(Bxn)的多核苷酸分子。
(I)用于达草灭耐受性的编码八氢番茄红素(crtl)的多核苷酸 分子描述于以下文献中:Misawa等人,(1993)Plant J.[植物杂志] 4:833-840和Misawa等人,(1994)PlantJ.[植物杂志]6:481-489。
3.赋予或贡献于改变的谷物特征的转基因
如:
(A)改变的脂肪酸,例如,通过以下各项:
(1)下调硬脂酰-ACP以增加植物的硬脂酸含量。参见,Knultzon 等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:2624和WO 1999/64579(Genes to AlterLipid Profiles in Corn[改变玉米脂质谱的基 因])。
(2)通过FAD-2基因修饰提高油酸和/或通过FAD-3基因修饰降 低亚麻酸(参见,美国专利号6,063,947、6,323,392、6,372,965和WO 1993/11245)。
(3)改变共轭亚麻酸或亚油酸含量,如在WO 2001/12800中。
(4)改变LEC1、AGP、Dek1、Superal1、mi1 ps、和各种Ipa基 因如Ipa1、Ipa3、hpt或hggt。例如,参见WO 2002/42424、WO 1998/22604、WO 2003/011015、WO 2002/057439、WO2003/011015、 美国专利号6,423,886、6,197,561、6,825,397、和美国专利申请公开号 US2003/0079247、US 2003/0204870以及Rivera-Madrid等人,(1995) Proc.Natl.Acad.Sci.[国家科学院院报]92:5620-5624。
(5)编码用于制备长链多不饱和脂肪酸的δ-8去饱和酶(美国专 利号8,058,571和8,338,152),用于降低饱和脂肪的δ-9去饱和酶(美 国专利号8,063,269),用于改进ω-3脂肪酸谱的报春花属Δ6-去饱和 酶的基因。
(6)与脂质和糖代谢调节相关的分离的核酸和蛋白质,具体地, 在生产转基因植物和调节种子储存化合物(包括脂质、脂肪酸、淀粉 或种子贮藏蛋白)的水平的方法中使用的和在调节植物的种子大小、 种子数、种子重量、根长和叶片大小的方法中使用的脂质代谢蛋白 (LMP)(EP 2404499)。
(7)改变植物中糖诱导型2(HSI2)蛋白的高水平表达以增加或 减少植物中HSI2的表达。增加HSI2的表达增加油含量,然而降低 HSI2的表达降低脱落酸敏感性和/或增加抗旱性(美国专利申请公开 号2012/0066794)。
(8)细胞色素b5(Cb5)单独或与FAD2一起表达调节植物种子 中的油含量,特别是增加ω-3脂肪酸的水平,并改进ω-6与ω-3脂肪 酸的比例(美国专利申请公开号2011/0191904)。
(9)编码wrinkled1样多肽的核酸分子用于调节糖代谢(美国专利 号8,217,223)。
(B)经改变的磷含量,例如,通过
(1)引入植酸酶编码基因将促进植酸盐的分解,向经转化的植 物中添加更多的游离磷酸盐。例如,参见Van Hartingsveldt等人,(1993) Gene[基因]127:87,该文献公开了黑曲霉植酸酶基因的核苷酸序列。
(2)调节降低植酸盐含量的基因。例如,这可以在玉米中通过 以下方法来完成:克隆然后重新引入与一个或多个等位基因相关联的 DNA,例如在以低水平的植酸为特征的玉米突变体中经识别的LPA 等位基因,例如WO 2005/113778中所述;和/或改变肌醇激酶活性, 如WO 2002/059324、美国专利申请公开号2003/0009011、WO 2003/027243、美国专利申请公开号2003/0079247、WO 1999/05298、 美国专利号6,197,561、美国专利号6,291,224、美国专利号6,391,348、 WO 2002/059324、美国专利申请公开号2003/0079247、WO 1998/45448、WO 1999/55882、WO 2001/04147中所述。
(C)例如,通过改变影响淀粉分支模式的酶的基因而影响的改 变的碳水化合物,或改变硫氧还蛋白如NTR和/或TRX(参见,美国 专利号6,531,648,以此目的其通过引用结合)和/或γ玉米蛋白敲除 或突变体如cs27或TUSC27或en27的基因(参见,美国专利号 6,858,778和美国专利申请公开号2005/0160488、美国专利申请公开号 2005/0204418,以此目的其通过引用结合)。参见,Shiroza等人, (1988),J.Bacteriol.[细菌学杂志],170:810(链球菌突变果糖基转 移酶基因的核苷酸序列),Steinmetz等人,(1985),Mol.Gen.Genet.[分 子遗传学和基因组学],200:220(枯草芽孢杆菌果聚糖蔗糖酶基因的 核苷酸序列),Pen等人,(1992),Bio/Technology[生物/技术],10:292 (生产表达地衣芽孢杆菌α-淀粉酶的转基因植物),Elliot等人, (1993),Plant Molec.Biol.[植物分子生物学],21:515(番茄转化酶 基因的核苷酸序列),等人,(1993),J.Biol.Chem.[生物 化学杂志],268:22480(大麦α-淀粉酶基因的定点诱变)和Fisher等 人,(1993),Plant Physiol.[植物生理学],102:1045(玉米胚乳淀粉 分支酶II),WO 1999/10498(通过修饰UDP-D-木糖4-差向异构酶、 脆性1和2、Ref1、HCHL、C4H改进的可消化性和/或淀粉提取), 美国专利号6,232,529(通过改变淀粉水平(AGP)生产高油种子的方 法)。本文提及的脂肪酸修饰基因也可用于通过淀粉和油途径的相互 关系来影响淀粉含量和/或组成。
(D)改变的抗氧化剂含量或组成,如改变生育酚或生育三烯酚。 例如,参见,涉及操作抗氧化剂水平的美国专利号6,787,683、美国专 利申请公开号2004/0034886和WO2000/68393,和通过改变尿黑酸香 叶基转移酶(hggt)的WO 2003/082899。
(E)改变的必需种子氨基酸。例如,参见,美国专利号6,127,600 (增加种子中必需氨基酸积累的方法),美国专利号6,080,913(增加 种子中必需氨基酸积累的二元方法),美国专利号5,990,389(高赖氨 酸),WO 1999/40209(种子中氨基酸组成的变化),WO 1999/29882 (用于改变蛋白质氨基酸含量的方法),美国专利号5,850,016(种子 中氨基酸组成的改变),WO 1998/20133(具有增加必需氨基酸水平 的蛋白质),美国专利号5,885,802(高甲硫氨酸),美国专利号5,885,801 (高苏氨酸),美国专利号6,664,445(植物氨基酸生物合酶),美国 专利号6,459,019(增加的赖氨酸和苏氨酸),美国专利号6,441,274 (植物色氨酸合酶β亚基),美国专利号6,346,403(甲硫氨酸代谢酶), 美国专利号5,939,599(高硫),美国专利号5,912,414(增加的甲硫 氨酸),WO 1998/56935(植物氨基酸生物合酶),WO1998/45458 (具有较高百分比必需氨基酸的工程化种子蛋白),WO 1998/42831 (增加的赖氨酸),美国专利号5,633,436(增加的硫氨基酸含量), 美国专利号5,559,223(具有包含可编程水平的必需氨基酸的所定义结 构的合成贮藏蛋白,用于改进植物的营养价值),WO1996/01905(增 加的苏氨酸),WO 1995/15392(增加的赖氨酸),美国专利申请公 开号2003/0163838,美国专利申请公开号2003/0150014,美国专利申 请公开号2004/0068767,美国专利号6,803,498,WO 2001/79516。
4.控制雄性不育的基因:
有几种赋予遗传性雄性不育的方法,例如赋予雄性不育的基因组 内单独位置处的多个突变基因,如Brar等人在美国专利号4,654,465 和4,727,219中所公开的,以及染色体易位,如Patterson在美国专利 号3,861,709和3,710,511中所述。除了这些方法之外,Albertsen等人 在美国专利号5,432,068中描述了细胞核雄性不育的系统,该系统包 括:识别对雄性生育力至关重要的基因;沉默这种对雄性能育性至关 重要的天然基因;从基本的雄性能育性基因中除去天然启动子并用诱 导型启动子替换;将该遗传工程化基因插回入植物;并因此产生雄性 不育的植物,因为诱导型启动子不是“开”的,导致雄性能育性基因 不被转录。通过诱导或打“开”来恢复能育性,启动子进允许赋予雄 性能育性的基因被转录。
(A)在绒毡层特异性启动子的控制下以及应用化学品N-Ac-PPT 引入脱乙酰酶基因(WO 2001/29237)。
(B)引入各种雄蕊特异性启动子(WO 1992/13956、WO 1992/13957)。
(C)引入barnase和barstar基因(Paul等人,(1992)Plant Mol. Biol.[植物分子生物学]19:611-622)。
关于细胞核雄性和雌性不育系统和基因的另外的实例,也可参见 美国专利号5,859,341;6,297,426;5,478,369;5,824,524;5,850,014 和6,265,640,所有这些专利都通过引用结合在此。
5.创建用于位点特异性DNA整合的位点的基因
这包括引入可能用于FLP/FRT系统中的FRT位点和可能用于 Cre/Loxp系统中的Lox位点。例如,参见Lyznik等人(2003)Plant Cell Rep[植物细胞报告]21:925-932和WO1999/25821,以上文献通过引用 结合在此。可以使用的其他系统包括噬菌体Mu的Gin重组酶(Maeser 等人,(1991),Vicki Chandler,The Maize Handbook[玉米手册], 第118章(施普林格出版社,1994))、大肠杆菌的Pin重组酶(Enomoto 等人,1983)和pSRi质粒的R/RS系统(Araki等人,1992)。
6.影响非生物胁迫抗性的基因
包括但不限于开花,穗和种子发育,提高氮利用效率,改变氮反 应性,抗旱性或耐旱性,抗寒性或耐寒性,抗盐性或耐盐性以及在胁 迫下产量的增加。
(A)例如,参见:WO 2000/73475,其中通过改变苹果酸来改 变用水效率;美国专利5,892,009、5,965,705、5,929,305、5,891,859、 6,417,428、6,664,446、6,706,866、6,717,034、6,801,104、WO 2000/060089、WO 2001/026459、WO 2001/035725、WO 2001/034726、 WO2001/035727、WO 2001/036444、WO 2001/036597、WO 2001/036598、WO 2002/015675、WO2002/017430、WO 2002/077185、 WO 2002/079403、WO 2003/013227、WO 2003/013228、WO2003/014327、WO 2004/031349、WO 2004/076638、WO 199809521。
(B)WO 199938977描述了基因(包括CBF基因)以及有效减 轻冷冻、高盐度和干旱对植物的负面影响以及赋予植物表型其他积极 作用的转录因子。
(C)美国专利申请公开号2004/0148654和WO 2001/36596,其 中在植物中改变脱落酸,产生改良的植物表型,例如增加的产量和/ 或增加的对非生物胁迫的耐受性。
(D)WO 2000/006341、WO 2004/090143、美国专利号7,531,723 和6,992,237,其中改性细胞分裂素表达,产生具有增加的胁迫耐受性 (例如耐旱性和/或增加的产量)的植物。还可参见,WO 2002/02776、 WO 2003/052063、JP 2002/281975、美国专利号6,084,153、WO 2001/64898、美国专利号6,177,275和美国专利号6,107,547(提高氮 利用率和改变氮反应性)。
(E)关于乙烯改变,参见美国专利申请公开号2004/0128719、 美国专利申请公开号2003/0166197和WO 2000/32761。
(F)关于非生物胁迫的植物转录因子或转录调节子,参见例如 美国专利申请公开号2004/0098764或美国专利申请公开号 2004/0078852。
(G)增加液泡焦磷酸酶(如AVP1)表达的基因(美国专利号 8,058,515),用于提高产量;编码HSFA4或HSFA5的核酸(A4或 A5类的热休克因子)多肽,寡肽转运蛋白(OPT4样)多肽;Plastochron2 样(PLA2样)多肽或Wuschel相关同源盒1样(WOX1样)多肽(美 国专利申请公开号US 2011/0283420)。
(H)下调编码聚(ADP-核糖)聚合酶(PARP)蛋白的多核苷酸来 调节程序性细胞死亡(美国专利号8,058,510),用于增加活力。
(I)编码用于赋予抗旱性的DTP21多肽的多核苷酸(美国专利 申请公开号US2011/0277181)。
(J)编码ACC合酶3(ACS3)蛋白质的核苷酸序列,用于调节 发育、调节胁迫应答和调节胁迫耐受性(美国专利申请公开号 2010/0287669)。
(K)编码赋予耐旱表型(DTP)的蛋白质以赋予抗旱性的多核 苷酸(WO 2012/058528)。
(L)赋予耐旱性和耐盐性的生育酚环化酶(TC)基因(美国专 利申请公开号2012/0272352)。
(M)CAAX氨基末端家族蛋白质,用于胁迫耐受性(美国专利 号8,338,661)。
(N)SAL1编码基因中的突变具有增加的胁迫耐受性,包括增 加的抗旱性(美国专利申请公开号2010/0257633)。
(O)编码增加产量相关性状的多肽(选自由GRF多肽、RAA1 样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组)的核酸序列 的表达(美国专利申请公开号2011/0061133)。
(P)调节植物中编码III类海藻糖磷酸酯酶(TPP)多肽的核酸 的表达,用于增强植物中产量相关的性状,特别是增加种子产量(美 国专利申请公开号2010/0024067)。
影响植物生长和农艺性状的其他基因和转录因子如产量,开花, 植物生长和/或植物结构可以被引入或渗入植物,参见,例如,WO 1997/49811(LHY)、WO 1998/56918(ESD4)、WO 1997/10339和 美国专利号6,573,430(TFL)、美国专利号6,713,663(FT)、WO1996/14414(CON)、WO 1996/38560、WO 2001/21822(VRN1)、 WO 2000/44918(VRN2)、WO1999/49064(GI)、WO 2000/46358 (FR1)、WO 1997/29123、美国专利号6,794,560、美国专利号6,307,126 (GAI)、WO 1999/09174(D8和Rht)和WO 2004/076638和WO 2004/031349(转录因子)。
7.赋予增加的产量的基因
(A)由1-氨基环丙烷-1-羧酸脱氨酶多肽(ACCDP)编码核酸转 化的转基因作物植物,其中在作物植物中核酸序列的表达导致与植物 的野生型品种相比,植物的根生长增加和/或增加的产量,和/或对环 境胁迫的耐受性增加(美国专利号8,097,769)。
(B)已显示,使用种子偏好性启动子的玉米锌指蛋白基因 (Zm-ZFP1)的过表达能促进植物生长、增加每株植物的核数和总核 重量(美国专利申请公开号2012/0079623)。
(C)已显示,玉米侧生器官界限(LOB)结构域蛋白 (Zm-LOBDP1)的组成型过表达能增加每株植物的核数和总核重量 (美国专利申请公开号2012/0079622)。
(D)通过调节植物中编码VIM1(甲基化1中的变体)样多肽 或VTC2样(GDP-L-半乳糖磷酸化酶)多肽或DUF1685多肽或ARF6 样(生长素应答因子)多肽(WO 2012/038893)的核酸的表达来增强 植物中产量相关的性状。
(E)调节植物中编码Ste20样多肽或其同源物的核酸的表达, 得到相对于对照植物具有增加的产量的植物(EP 2431472)。
(F)编码用于修饰植物根系结构的核苷二磷酸酶激酶(NDK) 多肽及其同源物的基因(美国专利申请公开号2009/0064373)。
8.赋予植物可消化性的基因
(A)通过调节木聚糖合成酶的表达来改变存在于植物细胞壁中 的木聚糖水平(美国专利号8,173,866)。
在一些实施例中,堆叠的性状可以是已经获得包括但不限于具有 监管许可的事件的监管许可的性状或事件,这些监管许可是本领域技 术人员熟知的并且可以在环境风险评估中心 (cera-gmc.org/?action=gm_crop_database,其可以使用www前缀进行 访问)和在国际农业生物技术应用服务部门 (isaaa.org/gmapprovaldatabase/default.asp,其可以使用www前缀进行 访问)找到。
基因沉默
在一些实施例中,堆叠的性状可以处于一种或多种目的多核苷酸 沉默的形式,导致抑制一种或多种靶标有害生物多肽。在一些实施例 中,通过使用抑制DNA构建体来实现该沉默。
在一些实施例中,将编码IPD082多肽的多肽或其片段或变体的 一种或多种多核苷酸可以与编码具有如上所述的杀昆虫活性或农艺 性状的一种或多种多肽的一种或多种多核苷酸堆叠,并且任选地可以 进一步包括提供如下文所述一种或多种靶多核苷酸的基因沉默的一 种或多种多核苷酸。
“抑制DNA构建体”是重组DNA构建体,当被转化或稳定整 合到植物的基因组中时,导致该植物中靶基因的“沉默”。该靶基因 对于该植物可以是内源性的或转基因的。本文中关于靶基因使用的 “沉默”通常是指抑制由该靶基因表达的mRNA或蛋白质/酶的水平, 和/或酶活性或蛋白质功能性的水平。术语“抑制”包括调低、降低、 下降、减少、抑制、消除和预防。“沉默”或“基因沉默”并没有指 定机制,并且包括但不限于反义、共抑制、病毒抑制、发夹抑制、茎 环抑制、基于RNAi的方法和基于小RNA的方法。
抑制DNA构建体可以包含衍生自目的靶基因的区域,并且可以 包含目的靶基因的正义链(或反义链)的全部或部分核酸序列。取决 于将要使用的方法,该区域可以与目的基因的全部或部分正义链(或 反义链)100%相同或小于100%相同(例如,至少50%或者51%和 100%相同之间的任何整数)。
抑制DNA构建体是本领域所熟知的,一旦选择了目的靶基因就 很容易构建,并且包括但不限于共抑制构建体、反义构建体、病毒抑 制构建体、发夹抑制构建体、茎环抑制构建体、产生双链RNA的构 建体、以及(更普遍地)RNAi(RNA干扰)构建体和小RNA构建体 (如siRNA(短干扰RNA)构建体和miRNA(微小RNA)构建体)。
“反义抑制”是指能够抑制靶蛋白表达的反义RNA转录物的产 生。
“反义RNA”是指与靶标初级转录物或mRNA的全部或部分互 补、并且阻断靶标分离的核酸片段表达的RNA转录物(美国专利号 5,107,065)。反义RNA可与特定基因转录物的任何部分,即5′非编 码序列、3′非编码序列、内含子或编码序列互补。
“共抑制”是指能够抑制靶蛋白表达的正义RNA转录物的产生。 “正义”RNA是指包括mRNA并且可在细胞内或体外翻译成蛋白质 的RNA转录物。此前,已通过着眼于以正义方向过表达与天然mRNA 具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见,Vaucheret等人, (1998),PlantJ.[植物杂志],16:651-659和Gura,(2000),Nature[自 然],404:804-808)。
另一个变化描述了植物病毒序列用于指导近端mRNA编码序列 的抑制的用途(PCT公开号WO 1998/36083)。
最近的工作已经描述了并入互补方向上的全部或部分mRNA编 码序列的“发夹”结构的用途,该“发夹”结构产生了已表达的RNA 的潜在“茎-环”结构(PCT公开WO 1999/53050)。在这种情况下, 该茎由对应于相对于启动子在正义或反义方向上插入的目的基因的 多核苷酸形成,并且该环由目的基因的一些多核苷酸形成,这些多核 苷酸在该构建体中不具有互补序列。这增加了已回收的转基因植物中 共抑制或沉默的频率。对于发夹抑制的综述,参见Wesley等人,(2003) Methods in Molecular Biology,Plant FunctionalGenomics:Methods and Protocols[分子生物学中的方法,植物功能基因组:方法和方 案]236:273-286。
具有由来自待抑制的基因的至少30个核苷酸形成的茎和由随机 核苷酸序列形成环的构建体也已被有效地用于抑制(PCT公开WO 1999/61632)。
已经描述了使用聚-T和聚-A序列产生茎环结构中的茎(PCT公 开WO 2002/00894)。
然而另一种变型包括使用合成的重复序列来促进茎环结构中的 茎的形成。已经证实,用这样的重组DNA片段制备的转基因生物体 具有降低水平的由形成环的核苷酸片段编码的蛋白,如PCT公开WO 2002/00904中所述。
RNA干扰是指由短干扰性RNA(siRNA)介导的动物中序列特 异性转录后基因沉默的过程(Fire等人,(1998),自然,391:806)。 在植物中的对应过程通常称为转录后基因沉默(PTGS)或RNA沉默, 并且在真菌中又称为压制(quelling)。转录后基因沉默的过程被认为 是进化上保守的细胞防御机制,用于预防外源基因的表达,并且通常 为不同的区系(flora)和门(phyla)所共享(Fire等人,(1999)Trends Genet.[遗传学趋势]15:358)。这种防止外源基因表达的保护可能已经 响应于双链RNA(dsRNA)的产生而演变,这些双链RNA源自病毒 侵染或源自通过细胞应答将转座子元件随机整合到宿主基因组中,该 细胞应答特异性地破坏病毒基因组RNA的同源单链RNA。dsRNA在 细胞中的存在通过尚未完全表征的机制来触发RNAi应答。
细胞中长dsRNA的存在刺激被称为切丁酶(dicer)的核糖核酸 酶III酶的活性。切丁酶参与将dsRNA加工成称为短干扰RNA (siRNA)的dsRNA短片(Berstein等人,(2001)Nature[自然]409:363)。 衍生自切丁酶活性的短干扰RNA的长度通常为约21至约23个核苷酸并且包含约19个碱基对双链体(Elbashir等人,(2001)Genes Dev.[基 因与发展]15:188)。切丁酶也已经涉及从涉及翻译控制的保守结构的 前体RNA中切除21-和22-核苷酸时序小RNA(stRNA)(Hutvagner 等人,(2001)Science[科学]293:834)。RNAi应答也是内切核酸酶复 合物的特点,该内切核酸酶复合物通常被称为RNA诱导的沉默复合 物(RISC),其介导与siRNA双链体的反义链具有序列互补性的单 链RNA的切割。靶RNA的切割发生在与siRNA双链体的反义链互 补的区域的中间(Elbashir等人,(2001)Genes Dev.[基因与发展] 15:188)。此外,RNA干扰还可以涉及小RNA(例如miRNA)介导 的基因沉默,推测是通过调节染色质结构的细胞机制,并且从而防止 靶基因序列的转录(参见例如,Allshire,(2002)Science[科学] 297:1818-1819;Volpe等人,(2002)Science[科学]297:1833-1837;Jenuwein,(2002)Science[科学]297:2215-2218以及Hall等人,(2002) Science[科学]297:2232-2237)。因此,本公开的miRNA分子可用于 经由与RNA转录物的相互作用或者通过与特定基因序列的相互作用 来介导基因沉默,其中这种相互作用导致转录或转录后水平的基因沉 默。
进一步提供了允许产生自沉默元件的RNAi增加的方法和组合 物。在这类实施例中,这些方法和组合物采用第一多核苷酸,其包含 可操作地连接于在植物细胞中有活性的启动子的靶标有害生物序列 的沉默元件;以及第二多核苷酸,其包含抑制增强子元件,该抑制增 强子元件包含靶标有害生物序列或者与在植物细胞中有活性的启动 子可操作地连接的活性变体或其片段。具有抑制增强子元件的沉默元 件的组合表达导致从该沉默元件产生的抑制性RNA的扩增增加超过 了仅单独通过该沉默元件的表达可实现的增加程度。除了特异性 RNAi物种本身的扩增增加之外,这些方法和组合物进一步允许产生 可以增强破坏靶基因表达的有效性的多种RNAi物种群体。正如,当 抑制增强子元件在植物细胞中与沉默元件组合表达时,这些方法和组 合物可以允许在整个植物内系统地产生RNAi;生产比仅单独用沉默 元件构建体所能观察到的更大量的RNAi;以及更多的RNAi加载入 植物韧皮部中,从而通过RNAi方法更好地防治取食韧皮部的昆虫。 因此,各种方法和组合物提供了将抑制性RNA递送至靶生物体的改 进方法。参见,例如,美国专利申请公开2009/0188008。
如本文使用的,“抑制增强子元件”包含如下多核苷酸,该多核 苷酸包含待抑制的靶序列或者其活性片段或变体。应当认识到,抑制 增强子元件不需要与靶序列相同,但是该抑制增强子元件可以包含该 靶序列的变体,只要该抑制增强子元件与靶序列具有足够的序列同一 性,以允许由该沉默元件产生的RNAi的水平增加超过仅通过该沉默 元件的表达可达到的增加程度。类似地,该抑制增强子元件可以包含 该靶序列的片段,其中该片段具有足够的长度以允许由该沉默元件产 生的RNAi的水平增加超过仅通过该沉默元件表达可实现的增加程 度。
应当认识到,可以使用来自相同靶序列或来自不同靶序列或者来 自相同靶序列的不同区域的多种抑制增强子元件。例如,所使用的抑 制增强子元件可以包含衍生自靶序列的不同区域(即来自3′UTR、编 码序列、内含子和/或5′UTR)的靶序列片段。此外,如本文别处所述, 该抑制增强子元件可以包含在表达盒中,并且在具体实施例中,该抑 制增强子元件在与该沉默元件相同或不同的DNA载体或构建体上。 该抑制增强子元件可以可操作地连接到如本文公开的启动子上。应当 意识到,可以组成型或替代地表达抑制增强子元件,或可任选地,该 元件能以阶段特异性方式使用在此别处讨论的各种可诱导或组织偏 好性或发育调节的启动子产生。
在具体实施例中,使用沉默元件和抑制增强子元件两者时,RNAi 的系统性产生发生在整个植物中。在另外的实施例中,本公开的植物 或植物部分具有比用单独的沉默元件构建体的表达所能观察到的更 多的RNAi加载入植物韧皮部中,并且从而通过RNAi方法更好地防 治取食韧皮部的昆虫。在具体实施例中,本公开的植物、植物部分和 植物细胞可以进一步被表征为允许产生可以增强破坏靶基因表达的 有效性的RNAi物种的多样性。
在具体实施例中,沉默元件和抑制增强子元件的组合表达使植物 细胞、植物、植物部分、植物组织或韧皮部中抑制性RNA的浓度增 加超过单独表达该沉默元件时所能达到的增加水平。
如本文使用的,当与适当的对照植物相比时,“抑制性RNA的 水平增加”包括在具有该组合表达的植物中产生的RNAi水平的任何 统计学上显著的增加。例如,当与适当的对照相比时,植物、植物部 分或植物细胞中RNAi水平的增加可以包含植物、植物部分、植物细胞或韧皮部中RNAi水平的至少约1%、约1%-5%、约5%-10%、约 10%-20%、约20%-30%、约30%-40%、约40%-50%、约50%-60%、 约60-70%、约70%-80%、约80%-90%、约90%-100%或更高的增加。 在其他实施例中,当与适当的对照相比时,植物、植物部分、植物细 胞或韧皮部中RNAi水平的增加可以包含植物、植物部分、植物细胞 或韧皮部中RNAi水平的至少约1倍、约1倍-5倍、约5倍-10倍、 约10倍-20倍、约20倍-30倍、约30倍-40倍、约40倍-50倍、约 50倍-60倍、约60倍-70倍、约70倍-80倍、约80倍-90倍、约90 倍-100倍或更多倍的增加。用于控制蝽象和草盲蝽的沉默元件与抑制 增强子元件的组合表达的实例可以在美国专利申请公开2011/0301223 和美国专利申请公开2009/0192117中找到。
一些实施例涉及通过干扰核糖核酸(RNA)分子下调昆虫有害生 物物种中靶基因的表达。PCT公开WO 2007/074405描述了抑制包括 科罗拉多马铃薯甲虫在内的无脊椎动物有害生物中靶标基因表达的 方法。PCT公开WO 2005/110068描述了抑制无脊椎动物有害生物(特 别是包括西方玉米根虫)中靶标基因表达的方法,该方法作为防治昆 虫侵染的手段。此外,PCT公开WO 2009/091864描述了用于抑制来 自昆虫有害生物物种(包括来自草盲蝽属的有害生物)的靶标基因的 组合物和方法。核酸分子包括用于靶向液泡ATP酶H亚基的RNAi, 可用于控制如美国专利申请公开号2012/0198586中所述的鞘翅目有 害生物群体和侵染。PCT公开WO 2012/055982描述了抑制或下调如 下靶标基因的表达的核糖核酸(RNA或双链RNA),该靶标基因编 码:昆虫核糖体蛋白,如核糖体蛋白L19、核糖体蛋白L40或核糖体蛋白S27A;昆虫蛋白酶体亚基,如Rpn6蛋白,Pros 25,Rpn2蛋白, 蛋白酶体β1亚基蛋白或Prosβ2蛋白;COPI囊泡的昆虫β-外被体, COPI囊泡的γ-外被体,COPI囊泡的β′-外被体蛋白或ζ-外被体;昆虫 四跨膜蛋白2A蛋白,其是假定跨膜结构域蛋白;属于肌动蛋白家族 的昆虫蛋白,如肌动蛋白5C;昆虫泛素-5E蛋白;昆虫Sec23蛋白, 其是参与细胞内蛋白质转运的GTP酶活化剂;涉及运动活性的作为非 常规肌球蛋白的昆虫皱纹蛋白质;涉及核替代mRNA剪接调节的昆虫 曲颈蛋白;昆虫液泡H+ -ATP酶G亚基蛋白和昆虫Tbp-1如Tat结 合蛋白。美国专利申请公开2012/029750,US 20120297501、和 2012/0322660描述了干扰核糖核酸(RNA或双链RNA),其在昆虫 有害生物物种摄取时起作用以下调所述昆虫有害生物中靶基因的表 达,其中该RNA包含至少一个沉默元件,其中该沉默元件是包含退 火的互补链的双链RNA的区域,该双链RNA中的一条链包含与靶基 因内的靶核苷酸序列至少部分互补的核苷酸序列或由其组成。美国专 利申请公开2012/0164205描述了用于干扰双链核糖核酸(用于抑制无 脊椎动物有害生物)的潜在靶标,包括:Chd3同源序列、β-微管蛋白 同源序列、40kDa V-ATP酶同源序列、EF1α同源序列、26S蛋白质 体亚基p28同源序列、保幼激素环氧化物酶水解酶同源序列、溶胀依 赖氯通道蛋白同源序列、葡萄糖-6-磷酸1-脱氢酶蛋白同源序列、 Act42A蛋白同源序列、ADP-核糖因子1同源序列、转录因子IIB蛋 白同源序列、几丁质酶同源序列、泛素缀合酶同源序列、甘油醛-3- 磷酸脱氢酶同源序列、泛素B同源序列、保幼激素酯酶同源物、和α 微管蛋白同源序列。
在有害生物控制方面的用途
在有害生物控制或使其他生物体工程化中使用包含实施例的核 酸序列或其变体的菌株作为杀有害生物剂的一般方法是本领域已知 的。参见例如美国专利号5,039,523和EP 0480762A2。
可以选择已知占据一种或多种目的作物的“植物圈”(叶面、叶 际、根际和/或根面)的微生物宿主。选择这些微生物以便能够在具体 环境中成功地与野生型微生物竞争,为表达IPD082多肽的基因供给 稳定的维持和表达,并且理想的是,增加对该杀有害生物剂的保护使 其不受环境降解和失活的影响。
可替代地,通过将异源基因引入细胞宿主中来产生IPD082多肽。 异源基因的表达直接或间接地导致杀有害生物剂在细胞内产生和维 持。然后当将该细胞应用于一种或多种靶标有害生物的环境中时,在 延长该细胞中所产生的毒素的活性的条件下处理这些细胞。所得产物 保留该毒素的毒性。然后可以根据常规技术配制这些天然包封的 IPD082多肽,以施用于靶标有害生物所寄宿的环境(例如,土壤、水 和植物的叶子)中。参见,例如EPA0192319及其中引用的参考文献。
杀有害生物组合物
在一些实施例中,活性成分能以组合物的形式施用并且可以与其 他化合物同时或相继施用于需要处理的作物区域或植物。这些化合物 可以是在单次施用该配制品后允许长期对目标区域进行给予的肥料、 除草剂、冷冻保护剂、表面活性剂、洗涤剂、杀有害生物肥皂、休眠 油、聚合物和/或延时释放的或可生物降解的载体配制品。它们还可以 是选择性除草剂、化学杀昆虫剂、杀病毒剂、杀微生物剂、杀变形虫 剂、杀有害生物剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂 或这些制剂中的若干种的混合物,如果希望的话,与在配制品领域内 通常使用的其他农业上可接受的载体、表面活性剂或促进施用的佐剂一起。合适的载体和佐剂可以是固体或液体,并且相应于在配制技术 中常常采用的物质,例如天然的或再生的矿物质、溶剂、分散剂、湿 润剂、增粘剂、粘合剂或肥料。同样地,可将这些配制品制备成可食 用的“诱饵”或塑造成有害生物“陷阱”以允许由靶有害生物来摄食或摄取该杀有害生物配制品。
施用含有由细菌菌株产生的IPD082多肽中的至少一种的活性成 分或农用化学组合物的方法包括叶子施用、种子包衣和土壤施用。施 用次数和施用速度取决于相应有害生物侵染的强度。
可以将组合物配制成粉末、尘剂、丸剂、颗粒、喷雾、乳液、胶 体、溶液等,并且可以通过干燥、冻干、匀浆、萃取、过滤、离心、 沉降或浓缩包含该多肽的细胞培养物等常规方法进行制备。在所有这 类含有至少一种这样的杀有害生物多肽的组合物中,该多肽能以按重量计从约1%至约99%的浓度存在。
可以通过本公开的方法在给定区域中杀灭鳞翅目、双翅目、异翅 目、线虫、半翅目或鞘翅目有害生物或减少其数量,或者可以预防性 地将其施用于环境区域以防止易感有害生物的侵染。优选地,该有害 生物摄入杀有害生物有效量的多肽或与其接触。如本文使用的“杀有 害生物有效量”是指能够对至少一种有害生物造成死亡或显著减少有 害生物生长、取食或正常生理发育的有害生物的量。该量将根据例如 待防治的具体靶标有害生物,待处理的特定环境、地点、植物、作物 或农业场所,环境条件以及杀有害生物有效的多肽组合物施用的方 法、速率、浓度、稳定性和数量等因素而变化。配制品也可以根据气 候条件、环境因素和/或施用频率和/或有害生物侵袭的严重程度而变 化。
可以通过用所需的农业上可接受的载体配制细菌细胞、晶体和/ 或孢子悬浮液或分离的蛋白质组分来制备所需的杀有害生物剂组合 物。可以在施用之前以适当方式(如冻干、冷冻干燥、干燥)或者在 水性载体、培养基或合适的稀释剂(例如盐水或其他缓冲液)中配制 这些组合物。配制的组合物可以是尘剂或颗粒状物质的形式或者在油 (植物或矿物)或水或油/水乳液中的悬浮液或者作为可湿性粉剂或者 与适用于农业应用的任何其他载体材料组合的形式。合适的农业载体 可以是固体或液体,并且是本领域公知的。术语“农业上可接受的载 体”涵盖通常用于杀有害生物剂配制品技术的所有佐剂、惰性组分、 分散剂、表面活性剂、增粘剂、粘合剂等;这些是杀有害生物剂配制 品技术人员所熟知的。配制品可以与一种或多种固体或液体佐剂混 合,并通过各种方法(例如通过使用常规配制品技术将杀有害生物组 合物与合适的佐剂均匀混合、共混和/或研磨)制备。美国专利号 6,468,523中描述了合适的配制品和施用方法,其通过引用并入本文。 还可以用一种或多种化学组合物处理植物,该化学组合物包括一种或 多种除草剂、杀昆虫剂或杀真菌剂。示例性化学组合物包括:果实/蔬菜除草剂:莠去津、除草定、敌草隆、草甘膦、利谷隆、嗪草酮、西玛津、氟乐灵、吡氟禾草灵、草铵膦、氯吡嘧磺隆Gowan、百草枯、 戊炔草胺、烯禾啶、氟丙嘧草酯、氯吡嘧磺隆、茚嗪氟草胺(Indaziflam); 果实/蔬菜杀昆虫剂:涕灭威、苏云金芽孢杆菌(Bacillus thuriengiensis)、甲萘威、克百威、毒死蜱、氯氰菊酯、溴氰菊酯、 二嗪磷、马拉硫磷、阿维菌素、氟氯氰菊酯/β-氟氯氰菊酯、高氰戊菊 酯、λ-氯氟氰菊酯、灭螨醌、联苯肼酯、甲氧虫酰肼、双苯氟脲、环 虫酰肼、噻虫啉、呋虫胺、嘧螨酯、唑虫酰胺、噻虫胺、螺螨酯、γ- 氯氟氰菊酯、螺甲螨酯、多杀菌素、氯虫酰胺、氰虫酰胺、Spinoteram、 杀虫脲、螺虫乙酯、吡虫啉、氯虫双酰胺、硫双威、氰氟虫腙、氟啶 虫胺腈、丁氟螨酯、Cyanopyrafen、吡虫啉、噻虫胺、噻虫嗪、Spinotoram、 硫双威、氟啶虫酰胺、甲硫威、因灭汀-苯甲酸盐、茚虫威、噻唑磷、 苯线磷、硫线磷、蚊蝇醚、苯丁锡、噻螨酮、灭多威、4-[[(6-氯吡啶 -3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮;果实/蔬菜杀真菌剂: 多菌灵、百菌清、EBDC、硫、甲基硫菌灵、嘧菌酯、霜脲氰、氟啶 胺、乙膦酸、异菌脲、醚菌酯、甲霜灵/精甲霜灵、肟菌酯、噻唑菌胺、 丙森锌、肟菌酯、环酰菌胺、富马酸噁咪唑、氰霜唑、咪唑菌酮、苯 酰菌胺、啶氧菌酯、吡唑醚菌酯、环氟菌胺、啶酰菌胺;谷物除草剂: 异丙隆、溴苯腈、碘苯腈、苯氧基类、氯磺隆、炔草酸、禾草灵、吡 氟草胺、噁唑禾草灵、双氟磺草胺、氟草烟、甲磺隆、醚苯磺隆、氟 酮磺隆、碘磺隆、丙苯磺隆、氟吡酰草胺、甲磺胺磺隆、氟丁酰草胺、 唑啉草酯、酰嘧磺隆、噻吩磺隆甲基、苯磺隆、氟啶嘧磺隆、磺酰磺 隆、磺酰草吡唑、甲氧磺草胺、氟噻草胺、肟草酮、吡咯磺隆;谷物杀真菌剂:多菌灵、百菌清、嘧菌酯、环唑醇、嘧菌环胺、丁苯吗啉、 氟环唑、醚菌酯、喹氧灵、戊唑醇、肟菌酯、硅氟唑、啶氧菌酯、吡 唑醚菌酯、醚菌胺、丙硫菌唑、氟嘧菌酯;谷物杀昆虫剂:乐果、λ- 氯氟氰菊酯、溴氰菊酯、α-氯氰菊酯、β-氟氯氰菊酯、联苯菊酯、吡 虫啉、噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、Clorphyriphos、 甲胺磷、乙酰甲胺磷、抗蚜威、甲硫威;玉米除草剂:莠去津、甲草 胺、溴苯腈、乙草胺、麦草畏、二氯吡啶酸、(S-)二甲酚草胺、草铵 膦、草甘膦、异噁唑草酮、(S-)异丙甲草胺、甲基磺草酮、烟嘧磺隆、 氟嘧磺隆、砜嘧磺隆、磺草酮、甲酰胺磺隆、苯吡唑草酮、环磺酮 (Tembotrione)、嘧啶肟草醚、酮脲磺草吩酯、氟噻草胺、吡咯磺隆; 玉米杀昆虫剂:克百威、毒死蜱、联苯菊酯、氟虫腈、吡虫啉、λ-氯 氟氰菊酯、七氟菊酯、特丁硫磷、噻虫嗪、噻虫胺、螺甲螨酯、氯虫 双酰胺、杀虫脲、氯虫酰胺、溴氰菊酯、硫双威、β-氟氯氰菊酯、氯 氰菊酯、联苯菊酯、虱螨脲、杀虫隆、七氟菊酯、嘧丙磷、乙虫腈、 氰虫酰胺、噻虫啉、啶虫脒、呋虫胺、阿维菌素、甲硫威、螺螨酯、 螺虫乙酯;玉米杀真菌剂:种衣酯、福美双、丙硫菌唑、戊唑醇、肟 菌酯;稻除草剂:丁草胺、敌稗、四唑嘧磺隆、苄嘧磺隆、氰氟草酯、 杀草隆、四唑酰草胺、唑吡嘧磺隆、苯噻草胺、去稗安、吡嘧磺隆、 稗草畏、二氯喹啉酸、禾草丹、茚草酮、氟噻草胺、四唑酰草胺、氯 吡嘧磺隆、去稗安、苯并双环酮、环酯草醚、五氟磺草胺、双草醚、 丙炔噁草酮、乙氧嘧磺隆、丙草胺、甲基磺草酮、特呋三酮、噁草酮、 噁唑禾草灵、吡丙醚;稻杀昆虫剂:二嗪磷、杀螟硫磷、仲丁威、久 效磷、丙硫克百威、噻嗪酮、呋虫胺、氟虫腈、吡虫啉、异丙威、噻 虫啉、环虫酰肼、噻虫啉、呋虫胺、噻虫胺、乙虫腈、氯虫双酰胺、 氯虫酰胺、溴氰菊酯、啶虫脒、噻虫嗪、氰虫酰胺、多杀菌素、 Spinotoram、因灭汀-苯甲酸盐、氯氰菊酯、毒死蜱、杀螟丹、甲胺磷、醚菊酯、三唑磷、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃 -2(5H)-酮、克百威、丙硫克百威;稻杀真菌剂:甲基硫菌灵、嘧菌酯、 环丙酰菌胺、敌瘟磷、嘧菌腙、异稻瘟净、稻瘟灵、戊菌隆、噻菌灵、 咯喹酮、三环唑、肟菌酯、双氯氰菌胺、氰菌胺、硅氟唑、噻酰菌胺; 棉花除草剂:敌草隆、伏草隆、MSMA、乙氧氟草醚、扑草净、氟乐 灵、唑草酮、烯草酮、吡氟禾草灵-丁基、草甘膦、达草灭、二甲戊乐 灵、嘧硫草醚钠、三氟啶磺隆、得杀草、草铵膦、丙炔氟草胺、塞苯 隆;棉花杀昆虫剂:乙酰甲胺磷、涕灭威、毒死蜱、氯氰菊酯、溴氰 菊酯、马拉硫磷、久效磷、阿维菌素、啶虫脒、因灭汀-苯甲酸盐、吡 虫啉、茚虫威、λ-氯氟氰菊酯、多杀菌素、硫双威、γ-氯氟氰菊酯、 螺甲螨酯、啶虫丙醚、氟啶虫酰胺、氯虫双酰胺、杀虫脲、氯虫酰胺、 β-氟氯氰菊酯、螺虫乙酯、噻虫胺、噻虫嗪、噻虫啉、呋虫胺、氯虫 双酰胺、氰虫酰胺、多杀菌素、Spinotoram、γ-氯氟氰菊酯、4-[[(6-氯 吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、硫双威、阿维菌 素、氟啶虫酰胺、啶虫丙醚、螺甲螨酯、氟啶虫胺腈、丙溴磷、三唑 磷、硫丹;棉花杀真菌剂:土菌灵、甲霜灵、喹硫磷;大豆除草剂: 甲草胺、灭草松、氟乐灵、氯嘧磺隆-乙基、氯酯磺草胺、噁唑禾草灵、 氟磺胺草醚、吡氟禾草灵、草甘膦、甲氧咪草烟、灭草喹、咪草烟、 (S-)异丙甲草胺、嗪草酮、二甲戊乐灵、得杀草、草铵膦;大豆杀昆虫剂:λ-氯氟氰菊酯、灭多威、对硫磷、硫威(Thiocarb)、吡虫啉、 噻虫胺、噻虫嗪、噻虫啉、啶虫脒、呋虫胺、氯虫双酰胺、氯虫酰胺、 氰虫酰胺、多杀菌素、Spinotoram、因灭汀-苯甲酸盐、氟虫腈、乙虫 腈、溴氰菊酯、β-氟氯氰菊酯、γ和λ氯氟氰菊酯、4-[[(6-氯吡啶-3- 基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)-酮、螺虫乙酯、螺螨酯、杀虫 脲、氟啶虫酰胺、硫双威、β-氟氯氰菊酯;大豆杀真菌剂:嘧菌酯、 环唑醇、氟环唑、粉唑醇、吡唑醚菌酯、戊唑醇、肟菌酯、丙硫菌唑、 四氟醚唑;甜菜除草剂:杀草敏、甜菜安、乙氧氟草黄、甜菜宁、野 麦畏、二氯吡啶酸、吡氟禾草灵、环草定、苯嗪草酮、喹草酸、噻草 酮、氟胺磺隆、得杀草、喹禾灵;甜菜杀昆虫剂:吡虫啉、噻虫胺、 噻虫嗪、噻虫啉、啶虫脒、呋虫胺、溴氰菊酯、β-氟氯氰菊酯、γ/λ氯 氟氰菊酯、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟乙基)氨基]呋喃-2(5H)- 酮、七氟菊酯、氯虫酰胺、氰虫酰胺、氟虫腈、克百威;卡诺拉除草剂:二氯吡啶酸、禾草灵、吡氟禾草灵、草铵膦、草甘膦、吡草胺、 氟乐灵、胺苯磺隆、喹草酸、喹禾灵、烯草酮、得杀草;低芥酸菜籽杀真菌剂:嘧菌酯、多菌灵、咯菌腈、异菌脲、丙氯灵、烯菌酮;卡诺拉杀昆 虫剂:克百威、有机磷酸盐类、拟除虫菊酯、噻虫啉、溴氰 菊酯、吡虫啉、噻虫胺、噻虫嗪、啶虫脒、呋虫胺、β-氟氯氰菊酯、γ 以及λ氯氟氰菊酯、τ-氟氰胺菊酯、乙虫腈、多杀菌素、Spinotoram、 氯虫双酰胺、氯虫酰胺、氰虫酰胺、4-[[(6-氯吡啶-3-基)甲基](2,2-二氟 乙基)氨基]呋喃-2(5H)-酮。
在一些实施例中,除草剂是莠去津、除草定、敌草隆、氯磺隆、 甲磺隆、噻吩磺隆甲基、苯磺隆、乙草胺、麦草畏、异噁唑草酮、烟 嘧磺隆、砜嘧磺隆、嘧硫草醚钠、丙炔氟草胺、氯嘧磺隆-乙基、嗪草 酮、喹禾灵、精-异丙甲草胺、环己通(Hexazinne)或其组合。
在一些实施例中,杀昆虫剂是高氰戊菊酯、氯虫苯甲酰胺、灭多 威、茚虫威、草氨酰或其组合。
杀有害生物和杀昆虫活性
“有害生物”包括但不限于:昆虫、真菌、细菌、线虫、螨、蜱 等。昆虫有害生物包括选自以下各目的昆虫:鞘翅目、双翅目、膜翅 目、鳞翅目、食毛目、同翅目、半翅目、直翅目、缨翅目、革翅目、 等翅目、虱目、蚤目、毛翅目等,特别是鳞翅目和鞘翅目。
本领域的技术人员会知道,不是所有的化合物均对所有有害生物 同样有效。实施例的化合物显示针对昆虫有害生物的活性,其可以包 括经济上重要的农艺学、森林、温室、苗圃观赏植物、食物和纤维, 公共和动物健康,国内和商业结构,家庭和储存产品有害生物。
鳞翅目幼虫包括但不限于:夜蛾科(Noctuidae)中的夜蛾、地老 虎、尺蠖和实夜蛾亚科,草地贪夜蛾(Spodoptera frugiperda JE Smith) (秋夜蛾(fall armyworm));甜菜夜蛾(S.exigua Hübner)(甜菜 夜蛾(beet armyworm));斜纹夜蛾(S.litura Fabricius)(斜纹夜 蛾(tobacco cutworm),茶蚕(cluster caterpillar));蓓带夜蛾(Mamestraconfigurata Walker)(披肩粘虫(bertha armyworm));甘蓝夜蛾(M. brassicaeLinnaeus)(菜夜蛾(cabbage moth));小地老虎(Agrotis ipsilon Hufnagel)(黑切根虫(black cutworm));西方灰地老虎(A. orthogonia Morrison)(西部切根虫(westerncutworm));粒肤地老 虎(A.subterranea Fabricius)(粒肤切根虫(granulatecutworm)); 棉叶波纹夜蛾(Alabama argillacea Hübner)(棉叶虫(cotton leaf worm));粉纹夜蛾(Trichoplusia ni Hübner)(甘蓝银纹夜蛾(cabbage looper));大豆尺夜蛾(大豆夜蛾);梨豆夜蛾(黎豆夜蛾);粗 长须夜蛾(Hypena scabra Fabricius)(苜猜绿夜蛾(green cloverworm));烟芽夜蛾(Heliothis virescens Fabricius)(烟青虫 (tobaccobudworm));一星黏虫(Pseudaletia unipuncta Haworth) (夜蛾);粗皮委夜蛾(Athetismindara Barnes and Mcdunnough)(粗 皮切根虫(rough skinbed cutworm));暗缘地老虎(Euxoa messoria Harris)(暗黑切根虫(darksided cutworm));棉斑实蛾(Eariasinsulana Boisduval)(多刺螟蛉(spiny bollworm));翠纹钻夜蛾(E.vittellaFabricius)(斑点螟蛉(spotted bollworm));棉铃虫(Helicoverpa armigera Hübner)(美洲螟蛉(American bollworm));玉米穗虫(玉 米穗蛾(corn earworm)或棉螟蛉(cottonbollworm));斑马纹夜蛾 (Melanchra picta Harris)(斑马纹夜蛾(zebracaterpillar));柑橘 夜蛾(Egira(Xylomyges)curialis Grote)(柑橘地老虎(citruscutworm));来自螟蛾科欧洲玉米螟(Ostrinia nubilalis Hübner, European cornborer)的螟虫、鞘蛾、结网虫、锥形虫(coneworms)、 和雕叶虫(skeletonizers);脐橙螟蛾(Amyelois transitella Walker)(脐 橙螟(naval orangeworm));地中海粉螟(Anagastakuehniella Zeller) (地中海粉斑螟(Mediterranean flour moth));干果斑螟(Cadracautella Walker)(粉斑螟(almond moth));二化螟(Chilo suppressalis Walker) (稻螟虫(rice stem borer));斑禾草螟(C.partellus),(高粱螟 (sorghum borer));米螟(Corcyra cephalonica Stainton)(米蛾(rice moth));玉米根草螟(Crambuscaliginosellus Clemens)(玉米根网 虫(corn root webworm));早熟禾草螟(C.teterrellus Zincken)(早 熟禾草螟(bluegrass webworm));稻纵卷叶螟(Cnaphalocrocis medinalis Guenée)(稻纵卷叶螟(rice leaf roller))葡萄里予螟(Desmia funeralis Hübner)(葡萄野螟(grape leaffolder));甜瓜绢野螟 (Diaphaniahyalinata Linnaeus)(甜瓜野螟(melon worm));黄瓜 绢野螟(D.nitidalis Stoll)(泡菜虫(pickleworm));巨座玉米螟 (Diatraea grandiosella Dyar)(西南玉米秆草螟(southwestern corn borer))、蔗螟(D.saccharalis Fabricius)(甘蔗螟虫(surgarcaneborer));墨西哥稻螟(Eoreuma loftini Dyar)(墨西哥稻螟(Mexican rice borer));烟草粉斑螟(Ephestia elutella Hübner)(烟草飞蛾(tobacco (cacao)moth));大蜡螟(Galleria mellonella Linnaeus)(大蜡蛾(greater wax moth));稻切叶野螟(Herpetogramma licarsisalis Walker)(草 地螟(sod webworm));向日葵同斑螟(Homoeosoma electellum Hulst) (向日葵螟(sunflower moth));南美玉米苗斑螟(Elasmopalpus lignosellus Zeller)(小玉米茎蛀虫(lesser cornstalk borer));小蜡螟(Achroia grisella Fabricius)(小蜡蛾(lesser wax moth));草地 螟(Loxostegesticticalis Linnaeus)(草地螟(beet webworm));茶 树螟(Orthaga thyrisalisWalker)(茶树蛾(tea tree web moth)); 豆荚野螟(Maruca testulalis Geyer)(豆荚蛀螟(bean pod borer)); 印度谷螟(Plodia interpunctella Hübner)(印度谷螟(Indianmeal moth));三化螟(Scirpophaga incertulas Walker)(三化螟(yellow stem borer));温室螟(Udea rubigalis Guenée)(芹菜卷叶螟(celery leaftier));和卷蛾科(Tortricidae)中的卷叶虫、蚜虫、种实虫以及 果实虫,西部黑头长翅卷蛾(Aclerisgloverana Walsingham)(西部黑 头蚜虫(Western blackheaded budworm));东部黑头长翅卷蛾(A. variana Fernald)(东部黑头蚜虫(Eastern blackheaded budworm)); 果树黄卷蛾(Archips argyrospila Walker)(果树卷叶蛾(fruit tree leaf roller));罗萨娜黄卷蛾(A.rosana Linnaeus)(欧洲卷叶蛾(European leaf roller));和其他黄卷蛾属物种,苹小卷叶蛾(Adoxophyes orana Fischer von)(苹果小卷蛾(summer fruittortrix moth)); 条纹向日葵螟(Cochylis hospes Walsingham)(带状向日葵斑蛾(banded sunflower moth));榛小卷蛾(Cydia latiferreana Walsingham)(filbertworm);苹果蠹蛾(C.pomonella Linnaeus)(苹果蚕蛾(codling moth));杂色卷叶蛾(Platynota flavedana Clemens)(色稻纵卷叶 螟(variegated leafroller));荷兰石竹小卷蛾(P.stultana Walsingham) (杂食卷叶蛾(omnivorous leafroller));鲜食葡萄小卷蛾(Lobesia botrana Denis&Schiffermüller)(欧洲葡萄蛾(European grape vinemoth));苹白小卷蛾(Spilonota ocellana Denis&Schiffermüller)(苹 果芽小卷叶蛾(eyespotted bud moth));萄果实虫主虫(Endopiza viteana Clemens)(葡萄小卷叶蛾(grape berry moth));女贞细卷蛾(Eupoecilia ambiguella Hübner)(葡萄果蠹蛾(vinemoth));巴西苹果卷叶虫 (Bonagota salubricola Meyrick)(巴西苹果小卷叶蛾(Brazilian apple leafroller));东方果实蛾(Grapholita molesta Busck)(梨小食心虫(oriental fruit moth));向日葵芽蛾(Suleima helianthana Riley)(向 日葵芽蛾(sunflower bud moth))。带卷蛾属物种;卷叶蛾属物种。
鳞翅目中选择的其他农艺学有害生物包括但不限于秋星尺蠖 (Alsophilapometaria Harris)(秋星尺蠖(fall cankerworm));桃 条麦蛾(Anarsia lineatellaZeller)(桃条麦蛾(peach twig borer)); 栎橙纹犀额蛾(Anisota senatoria J.ESmith)(橙色斑纹橡木虫(orange striped oakworm));柞蚕(Antheraea pernyi Guérin-Méneville)(中 橡木柞蚕虫(Chinese Oak Tussah Moth));家蚕(Bombyx mori Linnaeus)(桑蚕(Silkworm));棉潜蛾(Bucculatrix thurberiella Busck)(棉 叶潜蛾(cotton leafperforator));纹黄豆粉蝶(Colias eurytheme Boisduval)(苜蓿粉蝶(alfalfacaterpillar));核桃舟蛾(Datana integerrima Grote&Robinson)(核桃天社蛾(walnutcaterpillar)); 落叶松毛虫(Dendrolimus sibiricus Tschetwerikov)(西伯利亚蚕蛾(Siberian silk moth)),白尺蠖蛾(Ennomos subsignaria Hübner)(榆 角尺蠖(elmspanworm));菩提尺蠖(Erannis tiliaria Harris)(椴 尺蠖(linden looper));黄毒蛾(Euproctis chrysorrhoea Linnaeus) (棕尾毒蛾(browntail moth));黑拟蛉蛾(Harrisina americana Guérin-Méneville)(野棉花夜蛾(grapeleaf skeletonizer));牧草天 蚕蛾(Hemileuca oliviae Cockrell)(牧草天蚕蛾(range caterpillar)); 美国白蛾(Hyphantria cunea Drury)(美国白蛾(fall webworm)); 番茄茎麦蛾(Keiferialycopersiceila Walsingham)(番茄蛲虫(tomato pinworm));东部铁杉尺蠖(Lambdinafiscellaria fiscellaria Hulst) (东部铁杉尺蠖(Eastern hemlock looper));西部铁杉尺蠖(L. fiscellaria lugubrosa Hulst)(西部铁杉尺蠖(Western hemlock looper));柳毒蛾(Leucoma salicis Linnaeus)(雪毒蛾(satin moth)); 舞毒蛾(Lymantria disparLinnaeus)(舞毒蛾(gypsy moth));番 茄天蛾(Manduca quinquemaculata Haworth,fivespotted hawk moth, tomato hornworm);烟草天蛾(M.sexta Haworth)(番茄天蛾(tomatohornworm),烟草天蛾(tobacco hornworm));冬尺蠖蛾(Operophtera brumata Linnaeus)(冬尺蠖蛾(winter moth));春尺蠖(Paleacrita vernata Peck)(春尺蠖(springcankerworm));美洲大芷凤蝶(Papilio cresphontes Cramer)(大黄带凤蝶(giantswallowtail),柑桔凤蝶 (orange dog));加州木角斗蛾(Phryganidia californicaPackard) (加州槲蛾(California oakworm));柑桔潜蛾(Phyllocnistis citrellaStainton)(柑桔潜叶蛾(citrus leafminer));斑幕潜叶蛾(Phyllonorycterblancardella Fabricius)(斑幕潜叶虫(spotted tentiform leafminer)); 欧洲粉蝶(Pieris brassicae Linnaeus)(大白粉蝶(large white butterfly));菜青虫(P.rapaeLinnaeus)(小白粉蝶(small white butterfly));暗脉菜粉蝶(P.napi Linnaeus)(绿脉菜粉蝶(green veined white butterfly));洋蓟葱羽蛾(Platyptilia carduidactylaRiley)(洋 蓟羽蛾(artichoke plume moth));小菜蛾(Plutella xylostella Linnaeus)(小菜蛾(diamondback moth));棉红铃虫(Pectinophora gossypiella Saunders)(粉螟蛉(pink bollworm));多形云粉蝶(Pontia protodice Boisduval and Leconte)(南方菜青虫(Southern cabbageworm)); 杂食尺蠖(Sabulodes aegrotata Guenée)(杂食尺蠖(omnivorous looper));红抚天社蛾(Schizura concinna J.E.Smith)(红疣天社蛾 (redhumped caterpillar));麦蛾(Sitotroga cerealella Olivier)(麦 蛾(Angoumois grainmoth));松异带蛾(Thaumetopoea pityocampa Schiffermuller)(松树列队毛虫(pineprocessionary caterpillar)); 幕谷蛾(Tineola bisselliella Hummel)(负袋夜蛾(webbing clothesmoth));番茄斑潜蝇(Tuta absoluta Meyrick)(番茄斑潜蝇 (tomatoleafminer));苹果巢蛾(Tponomeuta padella Linnaeus)(巢 蛾(ermine moth));Heliothis subflexa Guenée;天幕毛虫属 (Malacosoma)物种和古毒蛾属(Orgyia)物种
感兴趣的是鞘翅目的幼虫和成体,其包括来自长角象科 (Anthribidae)、豆象科(Bruchidae)和象甲科(Curculionidae)的 象鼻虫(包括但不限于:墨西哥棉铃象(Anthonomus grandis Boheman) (棉铃象甲(boll weevil));稻水象甲(Lissorhoptrusoryzophilus Kuschel)(稻水象虫(rice water weevil));谷象(Sitophilus granariusLinnaeus)(谷象(granary weevil));米象(S.oryzae Linnaeus)(米 象(rice weevil));三叶草叶象(Hypera punctata Fabricius)(车轴 草叶象虫(clover leaf weevil));密点细枝象(Cylindrocopturus adspersus LeConte)(向日葵茎象鼻虫(sunflower stemweevil)); 黄褐小爪象(Smicronyx fulvus LeConte)(红葵花籽象甲(red sunflowerseed weevil));灰色小爪象(S.sordidus LeConte)(灰葵花籽象甲 (gray sunflowerseed weevil));玉米隐啄象(Sphenophorus maidis Chittenden)(玉米象虫(maizebillbug)));叶甲科(Chrysomelidae) 的跳甲、黄瓜叶甲、根虫、叶甲、马铃薯叶甲以及潜叶虫(包括但不 限于:马铃薯叶甲(Leptinotarsa decemlineata Say)(马铃薯甲虫(Colorado potato beetle));玉米根萤叶甲(Diabrotica virgifera virgiferaLeConte)(西方玉米根虫);北方玉米根虫(D.barberi Smith and Lawrence)(北方玉米根虫(northern corn rootworm));黄瓜十 一星叶甲食根亚种(D.undecimpunctata howardiBarber)(南方玉米 根虫(southern corn rootworm));玉米铜色跳甲(Chaetocnemapulicaria Melsheimer)(玉米跳甲(corn flea beetle));十字花科跳甲(Phyllotretacruciferae Goeze)(十字花科蔬菜跳甲(Crucifer flea beetle));黄 曲条跳甲(Phyllotreta striolata)(黄曲条跳甲(stripped flea beetle)); 肖叶甲褐斑(Colaspis brunnea Fabricius)(葡萄肖叶甲(grape colaspis));橙足负泥虫(Oulemamelanopus Linnaeus)(谷叶甲虫 (cereal leaf beetle));向日葵叶甲(Zygogrammaexclamationis Fabricius)(向日葵叶甲(sunflower beetle)));来自瓢虫科(Coccinellidae)的甲虫(包括但不限于:墨西哥豆瓢虫(Epilachna varivestis Mulsant)(墨西哥豆瓢虫(Mexican bean beetle)));金 龟子和来自金龟子科(Scarabaeidae)的其他甲虫(包括但不限于:日 本丽金龟(Popillia japonica Newman)(日本金龟子(Japanesebeetle));北方圆头犀金龟(Cyclocephala borealis Arrow)(北方独 角仙(northernmasked chafer),白蛴螬(white grub));南方圆头 犀金龟(C.immaculata Olivier)(南方独角仙(southern masked chafer),白蛴螬(white grub));欧洲切根鳃金龟(Rhizotrogusmajalis Razoumowsky)(欧洲金龟子(European chafer));长毛食叶然金 龟(Phyllophagacrinita Burmeister)(白蛴螬(white grub));胡萝 卜金龟(Ligyrus gibbosus De Geer)(胡萝卜金龟(carrot beetle))); 来自皮蠹科的红缘皮蠹(carpet beetle);来自叩甲科,伪金针虫属物 种,梳爪叩头虫属物种的金针虫;宽胸叩头虫属物种;叩甲属 (Limonius)物种;缺隆叩甲属物种;Ctenicera属物种;Aeolus属物 种;来自小蠹科(Scolytidae)的树皮甲虫和来自拟步甲科 (Tenebrionidae)的甲虫。
感兴趣的是双翅目的成虫和未成熟的虫,包括潜叶虫玉米斑潜蝇 (Agromyzaparvicornis Loew)(玉米斑潜蝇(corn blotch leafminer)); 摇蚊科(包括但不限于:高粱瘿蚊(Contarinia sorghicola Coquillett) (高梁瘿蚊(sorghum midge));黑森瘿蚊(Mayetiola destructor Say) (黑森蝇(Hessian fly));麦红吸浆虫(Sitodiplosismosellana Géhin) (小麦吸浆虫(wheat midge));葵花籽蚊(Neolasiopteramurtfeldtiana Felt),(向日葵籽瘿蚊(sunflower seed midge)));果蝇(实蝇科(Tephritidae))、瑞典麦秆蝇(Oscinella frit Linnaeus)(果蝇(frit flies));蛆虫(包括但不限于:灰地种蝇(Delia platura Meigen)(种 蝇(seedcorn maggot));麦地种蝇(D.coarctata Fallen)(麦种蝇 (wheat bulb fly))和其他地种蝇属,美洲麦秆蝇(Meromyza americana Fitch)(美洲麦秆蝇(wheat stem maggot));家蝇(Muscadomestica Linnaeus)(家蝇(house flies));夏厕蝇(Fannia canicularis Linnaeus)、小舍蝇(F.femoralis Stein)(小家蝇(lesser houseflies));厩螫蝇 (Stomoxyscalcitrans Linnaeus)(螫蝇(stable flies));秋家蝇,角 蝇,绿头苍蝇,金蝇属;蝇属物种和其他麝香蝇(muscoid fly)有害 生物、马蝇虻属(Tabanus)物种;肤蝇胃蝇属(Gastrophilus)物种; 狂蝇属(Oestrus)物种;纹皮蝇皮蝇属(Hypoderma)物种;鹿蝇斑 虻属(Chrysops)物种;绵羊虱蝇(Melophagus ovinus Linnaeus)(绵 羊蜱)和其他短角亚目,蚊子伊蚊属(Aedes)物种;疟蚊属(Anopheles) 物种;家蚊属(Culex)物种;黑蝇原蚋属(Prosimulium)物种;蚋 属(Simulium)物种;吸血蠓、沙蝇、眼菌蚊(sciarid)和其他长角亚目(Nematocera)。
作为目的昆虫包括了半翅目和同翅目的成体和若虫,如但不限 于:来自球蚜科(Adelgidae)的球蚜、来自盲蝽科(Miridae)的盲蝽、 来自蝉科(Cicadidae)的蝉、叶蝉、小绿叶蝉属(Empoasca)物种; 来自叶蝉科的,来自菱蜡蝉科(Cixiidae)、青翅飞虱科(Flatidae)、 蜡蝉总科(Fulgoroidea)、瓢蜡蝉科(Issidae)和(Delphacidae)的 飞虱,来自角蝉科(Membracidae)的角蝉,来自木虱科(Psyllidae) 的木虱,来自粉虱科(Aleyrodidae)的粉虱,来自蚜科(Aphididae) 的蚜虫,来自根瘤蚜科(Phylloxeridae)的葡萄根瘤蚜,来自粉蚧科 (Pseudococcidae)的粉蚧,来自链介壳虫科(Asterolecanidae)、蚧 科(Coccidae)、粉蚧科(Dactylopiidae)、盾蚧科(Diaspididae)、 绒蚧科(Eriococcidae)、旌介壳虫科(Ortheziidae)、刺葵介壳虫科 (Phoenicococcidae)和绵蚧科(Margarodidae)的介壳虫,来自网蝽 科的网蝽,来自蝽科(Pentatomidae)的椿象,长蝽(cinch bug),土 长蝽属物种;和来自长蝽科(Lygaeidae)的其他籽长蝽、来自沫蝉科(Cercopidae)的沫蝉、来自缘蝽科(Coreidae)的南瓜缘蝽和来自红 蝽科(Pyrrhocoridae)的秋恙螨和棉蝽。
来自同翅目的农艺重要成员进一步包括但不限于:豌豆蚜 (Acyrthisiphonpisum Harris)(豌豆蚜虫(pea aphid));黑豆蚜(Aphis craccivora Koch)(蚕豆蚜(cowpea aphid));黑豆蚜(A.fabae Scopoli) (蚕豆蚜(black bean aphid));棉蚜(A.gossypii Glover)(棉蚜(cotton aphid),瓜叶菊蚜虫(melon aphid));玉米根蚜(A.maidiradicis Forbes) (玉米根蚜(corn root aphid));苹果黄蚜(A.pomi De Geer)(苹 蚜(apple aphid));绣线菊蚜(A.spiraecola Patch)(绣线菊蚜(spirea aphid));茄粗额蚜(Aulacorthum solani Kaltenbach)(指顶花无网 长管蚜(foxglave aphid));草莓钉蚜(Chaetosiphon fragaefolii Cockerell)(草莓毛管蚜(strawberry aphid));麦双尾蚜(Diuraphis noxia Kurdjumov/Mordvilko)(俄罗斯小麦蚜虫(Russian wheat aphid));车前圆尾蚜(Dysaphis plantaginea Paaserini)(苹粉红劣 蚜(rosy apple aphid));苹果绵蚜(Eriosoma lanigerum Hausmann) (苹果绵蚜(woolly apple aphid));甘蓝蚜(Brevicoryne brassicae Linnaeus)(菜蚜(cabbage aphid));桃粉大尾蚜(Hyalopteruspruni Geoffroy)(桃大尾蚜(mealy plum aphid));萝卜蚜(Lipaphis erysimiKaltenbach)(萝卜蚜(turnip aphid));麦无网长管蚜(Metopolophium dirrhodum Walker)(麦蚜虫(cereal aphid));马铃薯长管蚜 (Macrosiphum euphorbiae Thomas)(马铃薯蚜(potato aphid)); 桃蚜(Myzus persicae Sulzer)(桃蚜(peach-potato aphid,greenpeach aphid));莴苣衲长管蚜(Nasonovia ribisnigri Mosley)(莴苣蚜(lettuceaphid));瘿绵对属(Pemphigus)物种(根蚜虫(root aphids)和倍 蚜(gall aphids));玉米蚜(Rhopalosiphum maidis Fitch)(玉米蚜 (corn leaf aphid));禾谷缢管蚜(R.padiLinnaeus)(禾谷缢管蚜 (bird cherry-oat aphid));麦二叉蚜(Schizaphis graminumRondani) (麦二叉蚜(greenbug));牛鞭草蚜(Sipha flava Forbes)(甘蔗黄 蚜(yellowsugarcane aphid));麦长管蚜(Sitobion avenae Fabricius) (麦长管蚜(English grainaphid));苜蓿斑蚜(Therioaphis maculata Buckton)(苜蓿斑蚜(spotted alfalfaaphid));茶二叉蚜(Toxoptera aurantii Bayer de Fonscolombe)(黑色柑橘蚜(blackcitrus aphid)和 褐色橘蚜(T.citricida Kirkaldy)(桔二叉蚜(brown citrus aphid));球属(Adelges)物种(球蚜(adelgids));长山核桃根瘤蚜(Phylloxera devastatrixPergande)(山胡桃根瘤蚜(pecan phylloxera));烟粉虱 (Bemisia tabaci Gennadius)(烟粉虱(tobacco whitefly),甘薯粉虱 (sweetpotato whitefly));银叶粉虱(B.argentifolii Bellows&Perring) (银叶粉虱(silverleaf whitefly));柑橘粉虱(Dialeurodes citri Ashmead)(柑桔粉虱(citrus whitefly));结翅白粉虱(Trialeurodes abutiloneus)(带状翅白粉虱(bandedwinged whitefly)和温室粉虱(T.vaporariorum Westwood)(温室粉虱(greenhouse whitefly));马铃 薯小绿叶蝉(Empoasca fabae Harris)(马铃薯叶蝉(potato leafhopper));灰飞虱(Laodelphaxstriatellus Fallen)(灰飞虱(smaller brown planthopper));二点叶蝉(Macrolestesquadrilineatus Forbes) (紫菀叶蝉(aster leafhopper));黑尾叶蝉(Nephotettixcinticeps Uhler) (绿叶蝉(green leafhopper));二条斑黑尾叶蝉(N.nigropictus)(稻叶蝉(rice leafhopper));褐飞虱(Nilaparvata lugens )(褐 飞虱(brownplanthopper));玉米蜡蝉(Peregrinus maidis Ashmead) (玉米飞虱(cornplanthopper));白背飞虱(Sogatella furcifera Horvath) (白背飞虱(white-backedplanthopper));稻条背飞虱(Sogatodes orizicola Muir)(稻飞虱(rice delphacid));苹果白叶蝉(Typhlocyba pomaria McAtee)(苹白小叶蝉(white apple leafhopper));葡萄斑 叶蝉属(Erythroneoura)物种(葡萄叶蝉(grape leafhoppers));十 七年蝉(Magicicada septendecim Linnaeus)(周期蝉(periodical cicada));吹绵蚧(Iceryapurchasi Maskell)(吹绵蚧(cottony cushion scale));梨圆蚧(Quadraspidiotusperniciosus Comstock)(梨圆蚧 (San Jose scale));臀纹粉蚧(Planococcus citriRisso)(桔粉蚧(citrus mealybug));粉蚧属(Pseudococcus)物种(其他粉蚧系群);梨 木虱(Cacopsylla pyricola Foerster)(梨木虱(pear psylla));柿木 虱(Trioza diospyriAshmead)(柿木虱(persimmon psylla))。
来自半翅目的目的农艺重要物种包括但不限于:拟绿蝽 (Acrosternum hilareSay)(稻绿蝽(green stink bug));南瓜缘蝽 (Anasa tristis De Geer)(南瓜虫(squashbug));美洲谷长蝽(Blissus leucopterus leucopterus Say)(麦长蝽(chinch bug));方翅网蝽 (Corythuca gossypii Fabricius)(棉网蝽(cotton lace bug));番茄 蝽(Cyrtopeltis modesta Distant)(番茄蝽(tomato bug));棉蝽 (Dysdercus suturellus)(棉红蝽(cotton stainer)); 褐臭蝽(Euschistus servus Say)(褐臭蝽(brown stink bug));一斑 臭蝽(E.variolarius Palisot de Beauvois)(一斑臭蝽(one-spotted stink bug));长蝽属(Graptostethus)物种(果实蝽系群(complex of seedbugs));松叶根蝽(Leptoglossus corculus Say)(松叶根蝽(leaf-footed pine seedbug));美洲牧草盲蝽(Lygus lineolaris Palisot de Beauvois) (牧草盲蝽(tarnishedplant bug));牧草盲蝽(L.Hesperus Knight) (西部牧草盲蝽(Western tarnished plantbug));牧草盲蝽(L.pratensis Linnaeus)(牧草盲蝽(common meadow bug));长毛草盲蝽(L. rugulipennis Poppius)(长毛草盲蝽(European tarnished plant bug)); 长绿盲蝽(Lygocoris pabulinus Linnaeus)(苹绿盲蝽(common green capsid));稻绿蝽(Nezaraviridula Linnaeus)(南方绿椿象(southern green stink bug));美洲稻蝽(Oebaluspugnax Fabricius)(稻褐蝽 (rice stink bug));马利筋长蝽(Oncopeltus fasciatusDallas)(大 马利筋长蝽(large milkweed bug));棉跳盲蝽(Pseudatomoscelis seriatusReuter)(棉跳盲蝽(cotton fleahopper))。
此外,实施例可以对半翅目有效,如草莓蝽(Calocoris norvegicus Gmelin)(草莓长蝽(strawberry bug));Orthops campestris Linnaeus; 苹果盲蝽(Plesiocorisrugicollis Fallen)(苹盲蝽(apple capsid)); 番茄蝽(Cyrtopeltis modestusDistant)(番茄蝽(tomato bug));黑 斑烟盲蝽(Cyrtopeltis notatus Distant)(吸蝇(suckfly));白斑盲 蝽(Spanagonicus albofasciatus Reuter)(白斑盲蝽(whitemarkedfleahopper));皂荚蝽(Diaphnocoris chlorionis Say)(皂角蝽 (honeylocust plantbug));洋葱蝽(Labopidicola allii Knight)(葱 盲蝽(onion plant bug));棉盲蝽(Pseudatomoscelis seriatus Reuter) (棉盲蝽(cotton fleahopper));苜蓿褐盲蝽(Adelphocoris rapidus Say) (苜蓿褐盲蝽(rapid plant bug));四线盲蝽(Poecilocapsus lineatus Fabricius)(四线叶虫(four-lined plant bug));小长蝽(Nysius ericae Schilling)(多彩长蝽(false chinch bug));假麦长蝽(Nysiusraphanus Howard)(假麦长蝽(false chinch bug));稻绿蝽(Nezara viridula Linnaeus)(南方绿椿象(Southern green stink bug));扁盾蝽属 (Eurygaster spp.)物种;缘蝽属(Coreidae spp.)物种;红蝽属 (Pyrrhocoridae spp.)物种;谷蛾属(Tinidae spp.)物种;Blostomatidae 属物种;猎蝽科(Reduviidae)物种和臭虫科(Cimicidae)物种。
另外,包括蜱螨目(Acari)(螨类)的成体和幼虫,如小麦瘤瘿 螨(Aceriatosichella Keifer)(小麦卷叶螨(wheat curl mite));麦 岩螨(Petrobia latens Müller)(褐色小麦螨(brown wheat mite)); 在叶螨科(Tetranychidae)中蜘蛛螨和红螨,苹果全爪螨(Panonychus ulmi Koch)(欧洲红螨(European red mite));二斑叶螨(Tetranychus urticae Koch)(二点叶螨(two spotted spider mite));迈叶螨(T.mcdanieli McGregor)(迈叶螨(McDaniel mite));朱砂叶螨(T. cinnabarinusBoisduval)(朱砂叶螨(carmine spider mite));土耳 其斯坦叶螨(T.turkestaniUgarov&Nikolski)(土耳其斯坦叶螨 (strawberry spider mite));细须螨科中的葡萄短须螨,桔短须螨 (Brevipalpus lewisi McGregor)桔短须螨(citrus flat mite));瘿螨科(Eriophyidae)中的锈螨和芽瘿螨以及其他食叶螨和对人类和动物 健康重要的螨,即表皮螨科(Epidermoptidae)的尘螨、蠕形螨科 (Demodicidae)的毛囊螨、食甜螨科(Glycyphagidae)的谷螨,硬蜱 科(Ixodidae)的蜱。黑脚硬蜱(Ixodes scapularis Say)(鹿蜱 (deertick));全环硬蜱(I.holocyclus Neumann)(澳大利亚致瘫 痪埤(Australianparalysis tick));变异矩头蜱(Dermacentor variabilis Say)(美洲犬蜱(American dogtick));美洲钝眼蜱(Amblyomma americanum Linnaeus)(孤星蜱(lone star tick))以及在痒螨科、蒲 螨科和疥螨科中的痒螨和疥螨。
缨尾目(Thysanura)的昆虫有害生物是目的,如衣鱼(Lepisma saccharinaLinnaeus)(蠹虫(silverfish));斑衣鱼(Thermobia domestica Packard)(小灶衣鱼(firebrat))。
所覆盖的另外节肢动物有害生物包括:蛛蛛目中的蜘蛛如褐隐毒 蛛(Loxoscelesreclusa Gertsch and Mulaik)(褐皮花蛛(brown recluse spider))和黑寡妇蜘蛛(Latrodectus mactans Fabricius)(黑寡妇毒 蛛(black widow spider)),以及蚰蜒目(Scutigeromorpha)中的蜈 蚣如蚰蜒(Scutigera coleoptrata Linnaeus)(蚰蜒(housecentipede))。
感兴趣的昆虫包括椿象和其他相关昆虫的超家族,包括但不限于 属于以下各科的物种:蝽科(稻绿蝽、茶翅蝽(Halyomorpha halys)、 Piezodorus guildini、褐臭蝽、拟绿蝽、英雄美洲蝽(Euschistus heros)、 美洲蝽(Euschistus tristigmus)、拟绿蝽、褐蝽(Dichelops melacanthus)、 和蓓蝽(Bagrada hilaris)(蓓蝽(Bagrada Bug))),龟蝽科(Plataspidae) (筛豆龟蝽(Megacopta cribraria)-豆平腹蝽蟓(Bean plataspid)) 和土蝽科(Scaptocoris castanea-Root stink bug),以及鳞翅目物种包 括但不限于:小菜蛾,例如,玉米穗虫;大豆夜蛾,例如,大豆尺夜 蛾和黎豆夜蛾,例如,梨豆夜蛾。
用于测量杀有害生物活性的方法是本领域中所熟知的。参见,例 如,Czapla和Lang,(1990)J.Econ.Entomol.[经济昆虫学杂 志]83:2480-2485;Andrews,等人,(1988)Biochem.J.[生物化学杂 志]252:199-206;Marrone等人,(1985)J.of EconomicEntomology[经济 昆虫学杂志]78:290-293以及美国专利号5,743,477,所有这些通过引用一起全文结合在此。总体上,在摄食测定中混合并使用了这种蛋白质。 参见,例如,Marrone等人,(1985),J.of Economic Entomology[经 济昆虫学杂志],78:290-293。此类测定可以包括将植物与一种或多种 有害生物接触,并且确定该植物存活和/或造成这些有害生物死亡的能 力。
线虫包括寄生线虫如根结线虫、胞囊线虫、和腐线虫,包括异皮 线虫属物种、根结线虫属物种、和球异皮线虫属物种;特别是胞囊线 虫的成员,包括但不限于:大豆异皮线虫(大豆胞囊线虫);甜菜异 皮线虫(甜菜胞囊线虫);燕麦异皮线虫(谷物胞囊线虫(cerealcyst nematode))和马铃薯金线虫(Globodera rostochiensis)和马铃薯白 线虫(Globodera pailida)(马铃薯胞囊线虫(potato cyst nematodes))。 腐线虫包括短体线虫属物种。
种子处理
为了保护并提高产量生产和性状技术,种子处理方案可以为昆 虫、杂草和疾病提供另外的作物计划灵活性和成本有效的控制。种子 材料可以用包含化学或生物除草剂、除草剂安全剂、杀昆虫剂、杀真 菌剂、发芽抑制剂和增强剂、营养素、植物生长调节剂和活化剂、杀 细菌剂、杀线虫剂、杀鸟剂和/或杀软体动物剂的组合的组合物进行处 理,通常进行表面处理。这些化合物通常与配制品领域中通常使用的 其他载体、表面活性剂或促进施用的佐剂一起配制。这些包衣可通过 用液体配制品浸渍增殖材料或通过用组合的湿或干配制品进行涂覆 来施加。在以下提供了可用作种子处理的各种类型的化合物的实例: ThePesticide Manual:A World Compendium,C.D.S.Tomlin Ed., Published by theBritish Crop Production Council[农药手册:世界纲要, C.D.S.汤姆林编辑,由英国作物生产委员会出版],其通过引用结合在 此。
可用于作物种子的一些种子处理包括但不限于下列一种或多种: 脱落酸、阿拉酸式苯-S-甲基、阿维菌素、杀草强、阿扎康唑、固氮螺 菌属、印楝素、嘧菌酯、芽孢杆菌属物种(包括蜡状芽孢杆菌,坚果 芽孢杆菌,巨大芽孢杆菌,短小芽孢杆菌,球形芽孢杆菌,枯草芽孢 杆菌和/或苏云金芽孢杆菌物种中的一种或多种),短根瘤菌属物种(包 括bradyrhizobium betae、bradyrhizobium canariense、埃氏慢生根瘤菌、 西表岛慢生根瘤菌、慢生型大豆根瘤菌、bradyrhizobium liaonigense、 bradyrhizobium pachyrhizi和/或圆明慢生根瘤菌),克菌丹,萎锈灵, 壳聚糖,噻虫胺,铜,溴氰虫酰胺,苯醚甲环唑,氯唑灵,氟虫腈, 咯菌腈,氟嘧菌酯,氟喹唑,解草胺,氟草肟,超敏蛋白,抑霉唑, 吡虫啉,种菌唑,isoflavenoids,脂质几丁寡糖,代森锰锌,锰,代森 锰,精甲霜灵,甲霜灵,叶菌唑,腈菌唑,PCNB,氟唑菌苯胺,青 霉菌属,吡噻菌胺,氯菊酯,啶氧菌酯,丙硫菌唑,唑菌胺酯,氯虫苯甲酰胺,S-metolachlor,皂苷,氟唑环菌胺,TCMTB,戊唑醇,噻 苯咪唑,噻苯哒唑,硫威,福美双,甲基立枯磷,三唑醇,木霉属, 肟菌酯,灭菌唑和/或锌。PCNB种皮是指包含喹硫磷和氯唑灵的EPA 注册号00293500419。TCMTB是指2-(硫氰基甲基硫代)苯并噻唑。
可以测试具有特定转基因性状的种子品种和种子以确定哪些种 子处理方案和施用率可以补充这些品种和转基因性状以增加产量。例 如,具有良好产量潜力但丝黑穗病易感性的品种可以受益于使用提供 针对丝黑穗病的保护的种子处理,具有良好产量潜力但胞囊线虫易感 性的品种可以受益于使用提供针对胞囊线虫的保护的种子处理等。同 样,涵盖赋予昆虫抗性的转基因性状的品种可以从种子处理赋予的第 二种作用方式中获益,涵盖赋予除草剂抗性的转基因性状的品种可以 从用安全剂的种子处理中获益,这种安全剂增强植物对该除草剂的抗 性等。此外,当与种子处理组合时,正确使用种子处理所产生的良好 根系建立和早期出苗可能导致更有效的氮利用,更好的抗干旱能力以 及包含某种性状的一种或多种品种的产量潜力的总体增加。
用于杀灭昆虫有害生物和控制昆虫群体的方法
在一些实施例中,提供了用于杀灭昆虫有害生物的方法,该方法 包括将昆虫有害生物同时地或依次地与杀昆虫有效量的重组IPD082 多肽接触。在一些实施例中,提供了用于杀灭昆虫有害生物的方法, 该方法包括将昆虫有害生物与杀昆虫有效量的SEQ ID NO:1、SEQ ID NO:3的重组杀有害生物蛋白或其变体接触。
在一些实施例中,提供了用于控制昆虫有害生物群体的方法,该 方法包括将昆虫有害生物群体同时地或依次地与杀昆虫有效量的重 组IPD082多肽接触。在一些实施例中,提供了用于控制昆虫有害生 物群体的方法,该方法包括使该昆虫有害生物群体与杀昆虫有效量的 SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO: 18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、 或SEQ ID NO:28的重组IPD082多肽或其变体接触。如本文使用的 “控制有害生物群体”或“控制有害生物”是指对有害生物的任何影 响,导致对有害生物造成的损害的限制。控制有害生物包括但不限于 以一定方式杀灭有害生物、抑制有害生物发育、改变有害生物能育性 或生长,使得有害生物对植物造成较少的损害,减少所产生后代的数 量,产生适应力较弱的有害生物,产生易受捕食者攻击的有害生物或 阻止有害生物啃食植物。
在一些实施例中,提供了用于控制对杀有害生物蛋白具有抗性的 昆虫有害生物群体的方法,该方法包括将昆虫有害生物群体同时地或 依次地与杀昆虫有效量的重组IPD082多肽接触。在一些实施例中, 提供了用于控制对杀有害生物蛋白具有抗性的昆虫有害生物群体的 方法,该方法包括使该昆虫有害生物群体与杀昆虫有效量的SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、 SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 或SEQ ID NO:28的重组IPD082多肽或其变体接触。
在一些实施例中,提供了用于保护植物免受昆虫有害生物侵害的 方法,这些方法包括在植物或其细胞中使至少一种编码IPD082多肽 的重组多核苷酸表达。在一些实施例中,提供了用于保护植物免受昆 虫有害生物侵害的方法,该方法包括在该植物或其细胞中表达编码 SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO: 18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、 或SEQ ID NO:28的IPD082多肽或其变体的重组多核苷酸。
昆虫抗性管理(IRM)策略
苏云金芽孢杆菌δ-内毒素在转基因玉米植物中的表达已被证明 是控制农业重要昆虫有害生物的有效手段(Perlak等人,1990;1993)。 然而,昆虫已经进化,这些昆虫对在转基因植物中表达的苏云金芽孢 杆菌δ-内毒素是具有抗性的。如果这种抗性普遍存在,它将明显限制 包含编码这种苏云金芽孢杆菌δ-内毒素的基因的种质的商业价值。
增加转基因杀昆虫剂对靶标有害生物的有效性并且同时减少杀 昆虫剂抗性有害生物发展的一种方法是提供非转基因(即,非杀昆虫 蛋白)庇护所(一部分非杀昆虫作物/玉米),用于与生产对靶标有害 生物具有活性的单一杀昆虫蛋白的转基因作物一起使用。美国环境保 护局(epa.gov/oppbppdl/biopesticides/pips/bt_corn_refuge_2006.htm,其 可以使用www前缀进行访问)发布与生产一种对靶标有害生物具有 活性的单一Bt蛋白的转基因作物一起使用的要求。另外,国家玉米种 植者协会在他们的网站上也提供了有关庇护所要求的类似指导: (ncga.com/insect-resistance-management-fact-sheet-bt-corn,其可以使 用www前缀进行访问)。由于庇护区内的昆虫所造成的损失,较大 的庇护所可能会降低总产量。
增加转基因杀昆虫剂对靶标有害生物的有效性并且同时减少杀 昆虫剂抗性有害生物发展的另一种方法是具有杀昆虫基因的储存库, 该储存库可以有效地对抗昆虫有害生物的组,并通过不同的作用方式 显现其作用。
在植物中表达对相同昆虫物种有毒的两种或更多种杀昆虫组合 物,每种杀昆虫剂以有效水平表达是实现对抗性发展的控制的另一种 方法。这是基于以下原则:对两种不同行动模式的抗性演变比仅一种 远远更不可能。例如,Rouss概述了用于管理杀昆虫转基因作物的双 毒素策略,也称为“金字塔结构”或“堆叠”。(The Royal Society.Phil.Trans.R.Soc.Lond.B.[皇家学会伦敦皇家学会哲学会刊B系列], (1998)353:1777-1786)。每种都能有效抵抗靶标有害生物并几乎没有 或没有交叉抗性的两种不同蛋白质的堆叠或金字塔可以允许使用较 小的庇护所。美国环境保护局要求所种植非Bt玉米的结构性庇护所 (通常为5%)比单一性状产品(通常为20%)显著更少。存在提供 庇护所的IRM效应的各种方法,包括在田地中的各种几何种植模式和 包装好(in-bag)的种子混合物,如进一步通过Roush所讨论的。
在一些实施例中,本披露的IPD082多肽可用作与其他杀有害生 物蛋白(包括但不限于Bt毒素、致病杆菌属或发光杆菌属杀昆虫蛋白 等)组合(即,金字塔化)的昆虫抗性管理策略。
提供了在促进昆虫抗性管理的转基因植物中控制鳞翅目和/或鞘 翅目昆虫侵袭的方法,该方法包括在植物中表达具有不同作用模式的 至少两种不同的杀昆虫蛋白。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染 并促进昆虫抗性管理的方法中的这些杀昆虫蛋白中的至少一种包含 对鳞翅目和/或鞘翅目昆虫具有杀昆虫作用的IPD082多肽。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染 并促进昆虫抗性管理的方法中的至少一种杀昆虫蛋白包含对鳞翅目 和/或鞘翅目昆虫具有杀昆虫作用的SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的IPD082 多肽或其变体。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染 并促进昆虫抗性管理的方法包括在该转基因植物中表达IPD082多肽 和对具有不同作用模式的鳞翅目和/或鞘翅目昆虫具有杀昆虫作用的 Cry蛋白。
在一些实施例中,控制转基因植物中鳞翅目和/或鞘翅目昆虫侵染 并促进昆虫抗性管理的方法包括在转基因植物中的SEQ ID NO:2、 SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、或SEQ ID NO:28的IPD082多肽或其变体,以及对具有不同作用模式的鳞翅目 和/或鞘翅目昆虫具有杀昆虫作用的Cry蛋白。
还提供了降低鳞翅目和/或鞘翅目昆虫对在这些植物中表达杀昆 虫蛋白以控制这些昆虫物种的转基因植物产生抗性的可能性的方法, 该方法包括表达与具有不同作用方式的第二种杀昆虫蛋白组合的、对 这些昆虫物种具有杀昆虫作用的IPD082多肽。
还提供了用于转基因植物的有效鳞翅目和/或鞘翅目昆虫抗性管 理的手段,该手段包括在植物中以高水平共表达对鳞翅目和/或鞘翅目 具有毒性的两种或更多种杀昆虫蛋白,但是每种都展现出不同的实行 其杀灭活性的模式,其中两种或更多种杀昆虫蛋白包含IPD082多肽 和Cry蛋白。还提供了用于转基因植物的有效鳞翅目和/或鞘翅目昆虫 抗性管理的手段,该手段包括在植物中以高水平共表达对鳞翅目和/ 或鞘翅目具有毒性的两种或更多种杀昆虫蛋白,但是每种都展现出不 同的实行其杀灭活性的模式,其中该两种或更多种杀昆虫蛋白包括 SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO: 18、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24、SEQ ID NO:26、 或SEQ ID NO:28的IPD082多肽或其变体以及Cry蛋白。
此外,提供了用于获得让监管部门批准种植或商业化表达对鳞翅 目和/或鞘翅目昆虫具有杀昆虫作用的蛋白的植物的方法,包括参考、 提交或依据昆虫测定结合数据的步骤,该数据显示IPD082多肽不与 此类昆虫中的Cry蛋白的结合位点竞争。此外,提供了用于获得让监 管部门批准种植或商业化表达对鳞翅目和/或鞘翅目昆虫具有杀昆虫 作用的蛋白的植物的方法,包括参考、提交或依据昆虫测定结合数据 的步骤,该数据显示SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、或SEQ ID NO:28的IPD082多肽或其变体 不与此类昆虫中的Cry蛋白的结合位点竞争。
提高植物产量的方法
提供了用于提高植物产量的方法。这些方法包括提供表达编码本 文公开的杀有害生物多肽序列的多核苷酸的植物或植物细胞,并在有 害生物(该多肽对其具有杀有害生物活性)侵染的田地中种植该植物 或其种子。在一些实施例中,该多肽对鳞翅目、鞘翅目、双翅目、半 翅目或线虫有害生物具有杀有害生物活性,并且用鳞翅目、半翅目、 鞘翅目、双翅目或线虫有害生物侵染该田地。
如本文所定义的,植物的“产量”是指该植物生产的生物质的质 量和/或数量。如本文使用的“生物质”是指任何经测量的植物产物。 生物质产量的增加是所测量的植物产物的产量上的任何改进。提高植 物产量具有几个商业应用。例如,增加植物叶片生物质可以增加用于 人或动物消耗的叶菜类的产量。此外,增加叶片生物质可用于增加植 物衍生的药物或工业产品的产量。产量上的增加可以包括任何统计学 上显著的增加,包括但不限于,与不表达杀有害生物序列的植物相比, 产量上至少增加1%、至少增加3%、至少增加5%、至少增加10%、 至少20%增加、至少30%、至少50%、至少70%、至少100%或更 大的增加。
在具体方法中,由于表达本文公开的IPD082多肽的植物的经改 进的有害生物抗性使得植物产量得到提高。IPD082多肽的表达导致有 害生物侵染植物或在该植物上取食的能力下降,从而提高植物产量。
加工方法
进一步提供了加工植物、植物部分或种子以从包含IPD082多核 苷酸的植物、植物部分或种子获得食物或饲料产品的方法。可以对本 文提供的植物、植物部分或种子进行加工以产生通过加工具有商业价 值的植物、植物部分或种子获得的衍生物的油、蛋白质产物和/或副产 物。非限制性实例包括包含编码IPD082多肽的核酸分子的转基因种 子,其可以被加工以产生大豆油、大豆产品和/或大豆副产品。
“加工”是指用于获得任何大豆产品的任何物理和化学方法,包 括但不限于热调节(heat conditioning)、剥落和研磨、挤出、溶剂萃 取或水性浸泡以及全部或部分种子萃取。
以下实例是通过说明的方式但不是通过限制的方式来提供的。
实验
实例1 来自菌株SSP446D7的、对西方玉米根虫(WCRW)具有活性的杀昆虫蛋白的识
从在胰蛋白酶大豆培养基(大豆-酪蛋白消化培养基:胰蛋白胨- 17g/L、大豆蛋白胨-3g/L、葡萄糖-2.5g/L、氯化钠-5g/L和磷酸氢 二钾-2.5g/L)中生长并在26℃下伴随210rpm的振荡培养过夜的弗 村假单胞菌(Pseudomonas vranovensis)菌株SSP446D7的澄清细胞 裂解液中观察到对西方玉米根虫(玉米根萤叶甲(Diabrotica virgifera))的杀昆虫活性。这种杀昆虫活性表现出热敏感性和蛋白 酶敏感性,指示该活性具有蛋白质性质。
以30,000psi在Tris缓冲液(pH 9)中通过匀浆化使SSP446D7 的经洗涤的细胞沉淀裂解。通过离心以及过滤使粗裂解物澄清,然后 将其加载到Q-琼脂糖高效柱(GE医疗集团(GE Healthcare))上。 用线性梯度的氯化钠将与柱结合的蛋白质洗脱并分馏。将含有杀昆虫 活性的级分合并,并在pH 9的Tris缓冲液中调节至1M硫酸铵。然 后将经调节的活性池加载到已经在含有1M硫酸铵的pH 9的Tris缓 冲液中平衡的1mL苯基高效柱(GE医疗集团)上。用线性 梯度将结合蛋白质从1M硫酸铵洗脱至0M硫酸铵,同时收集级分。
通过来自苯基高效柱的活性级分的SDS-PAGE分析显示用 InstantBlueTM考马斯染色剂(捷能公司(Generon))染色后的对活性 负责的三条潜在条带。使用LC-MS/MS鉴定SSP446D7基因,该基因 编码对针对WCRW具有杀昆虫活性负责的蛋白质。当活性蛋白质在大肠杆菌中重组表达时,该基因被确认并显示出活性。该蛋白质被命 名为IPD082Aa(SEQID NO:2)。
实例2 IPD082Aa同源物的识别
可以通过在默认参数下进行BLAST(基本局部比对20搜索工具; Altschul等人,(1993)J.Mol.Biol.[分子生物学杂志]215:403-410;还 参见ncbi.nlm.nih.gov/BLAST/,可以通过使用www前缀登录该网址) 搜索来确定基因同一性以获得与包含于公开可用的BLAST“nr”数据 库(包括源自3维结构布鲁克海文蛋白质数据库(25SWISS-PROT蛋 白质序列数据库的最后一个主要版本)、EMBL和DDBJ数据库的所 有非冗余基因库CDS翻译、序列)中的序列的相似性。除了公共数据 库之外,还搜索了内部的数据库。分析SEQ ID NO:1的多核苷酸序列。 还分析了编码SEQ ID NO:2的氨基酸位置Y311至N516处的多核苷 酸序列以识别含有对于IPD082Aa的C-末端是同源物的更远缘相关的 蛋白质。IPD082同源物标识符、多肽序列标识符、和来源材料显示在 表1中。表2显示了基于ClustalW算法实施的,使用Vector程 序套件的模块(英杰公司(Invitrogen Corporation),卡尔斯巴德,加利福尼亚州),采用所有默认参数,用于全局比对的成对 的同一性关系的矩阵表。
表1
表2
实例3 IPD082Aa和同源物的大肠杆菌表达
使用分离自菌株SSP446D7的基因组DNA,用正向引物AATATCATATGCAAACTACTGTATCGGAAACCTTGGTTTC(SEQ ID NO:59)和反向引物AAGGATCCTTAGTTGCGCGTGTAAACCCCCTCGATGTTG(SEQ ID NO:60)对IPD082Aa基因(SEQ IDNO:1)进行PCR扩增。将所 得PCR产物进行DNA序列验证并亚克隆进具有N-末端His-10标记的pETl6B载体中,并亚克隆进具有C-末端His-10标记或不具有标记 的pET24a载体中。将含有IPD082Aa基因插入物的质粒DNA转化到 感受态的C41大肠杆菌细胞中用于重组蛋白质表达。使大肠杆菌细胞 在37℃下用羧苄青霉素或卡那霉素选择生长,直至OD600等于约 0.7-0.8,并然后添加1mM ITPG,并使细胞在16℃下进一步生长16 小时从而诱导蛋白质表达。根据制造商的方案,通过使用Ni-NTA琼 脂糖(凯杰公司(Qiagen),德国)的固定化金属离子色谱纯化经大 肠杆菌表达的His-标记的蛋白质。除了合成基因序列外,其他IPD082 同源物按类似的方式表达。
实例4 IPD082Aa同源物的分离表达
IPD082Aa的多顺反子表达
通过胰凝乳蛋白酶在氨基酸D338处切割IPD082Aa蛋白(SEQ ID NO:2),并在氨基酸A339处用玉米根虫肠道汁液孵育后以分别产生 38.2kDa(IPD082Aa-1-SEQ ID NO:34)和20.5kDa(IPD082Aa-2- SEQ ID NO:36)的蛋白质片段。使用在实例3中描述的表达条件,编码38.2kDa(IPD082Aa-1-SEQ ID NO:34)和20.5kDa(IPD082Aa-2 -SEQ ID NO:36)蛋白质片段的多核苷酸在多顺反子表达(SEQ ID NO:32)排列中共表达(图10),以产生可溶和活性的蛋白质。发现 38.2kDa(IPD082Aa-1-SEQ ID NO:34)和20.5kDa(IPD082Aa-2- SEQ ID NO:36)片段在共表达后缔合。当仅在两个片段中的一个片段 上放置His-标签时,通过固定化金属离子色谱纯化复合物。
IPD082 N-末端区域和C-末端区域的共表达
分别编码IPD082Aa的38.2kDa N-末端片段(IPD082Aa-1-SEQ ID NO:34)和20.5kDa C-末端片段(IPD082Aa-2-SEQ ID NO:36) 的多核苷酸,即SEQ ID NO:33和SEQ IDNO:35还在pETDuetTM-1 载体(EMD密理博公司(EMD Millipore),默克基团(Merck KGaA) 的生命科学业务,法兰克福街(Frankfurter Straβe)250,64293,达姆 施塔特,德国)中共表达(图11)。将编码IPD082同源物:IPD082Hb-2 (SEQ ID NO:37)、IPD082Ia-2(SEQ ID NO:39)、IPD082Ic-2(SEQ ID NO:41)、IPD082Ie-2(SEQ ID NO:43)、IPD082Ib-2(SEQ ID NO:45)、IPD082Hd-2(SEQ ID NO:47)、和IPD082Hc-2(SEQ ID NO: 49)的C-末端片段的类似的多核苷酸在包含IPD082Aa-1多核苷酸 (SEQ ID NO:33)的pETDuetTM-1载体中克隆为具有IPD082Aa-2 (SEQ ID NO:35)的嵌合融合物。
实例5 IPD082同源物的嵌合蛋白
IPD082嵌合蛋白
分别使用SEQ ID NO:33(IPD082Aa-1)、SEQ ID NO:45 (IPD082Ib-2)、SEQ ID NO:47(IPD082Hd-2)、和SEQ ID NO:49 (IPD082Hc-2)的多核苷酸在pET16B(EMD密理博公司(EMD Millipore),默克基团(Merck KGaA)的生命科学业务,法兰克福街 (FrankfurterStraβe)250,64293,达姆施塔特,德国)中构建编码 IPD082Aa(SEQ ID NO:34)的N-末端区域、和IPD082Ib(SEQ ID NO: 46)的C-末端区域、IPD082Hd(SEQ ID NO:48)、和IPD082Hc(SEQ ID NO:50)的嵌合蛋白的多核苷酸。将所得构建体(SEQ ID NO:51、 SEQ ID NO:53、和SEQ ID NO:55)表达,测试表达,并且如实例3 所描述将可溶的IPD082嵌合多肽(SEQ IDNO:52、SEQ ID NO:54、 和SEQ ID NO:56)进行纯化。
MBP融合物
由麦芽糖结合蛋白(MBP)将IPD082Aa-1与IPD082Aa-2连接, 并且使用pET16B载体在大肠杆菌中可溶解地表达3-蛋白质融合复合 物(SEQ ID NO:57)。将N-His标记的蛋白质复合物(SEQ ID NO:58) 通过Ni-NTA亲和纯化进行纯化,并显示出对IPD082Aa野生型蛋白质相似的活性。
将用于分离表达的克隆序列、IPD082Aa和同源物的嵌合蛋白和 融合蛋白总结在表3中。
表3
实例6 IPD082Aa和同源物的杀昆虫活性
如下所述,针对各种鳞翅目物种(欧洲玉米螟(Ostrinia nubilalis)、 玉米穗蛾(玉米穗虫(Helicoverpa zea))、黑切根虫(小地老虎(Agrotis ipsilon))、秋夜蛾(草地贪夜蛾(Spodoptera frugiperda))、大豆 夜蛾(大豆尺夜蛾(Pseudoplusia includens))、和黎豆夜蛾(Anticarsia gemmatalis));三种鞘翅目物种,西方玉米根虫(玉米根萤叶甲(Diabrotica virgifera))、北方玉米根虫(Diabrotica barberi)、和 南方玉米根虫(斑点黄瓜甲虫(Diabrotica undecimpunctata howardi)); 以及两种半翅目物种,西部牧草盲蝽(豆荚盲蝽(Lygus hesperus)) 和南方绿椿象(稻绿蝽(Nezara viridula))测定一系列浓度的经纯化 的IPD082Aa蛋白,并且计算用于50%个体的50%抑制(IC50)的浓 度。IPD082Aa(SEQ ID NO:2)的杀昆虫活性总结在表4中。
鳞翅目测定
在96孔板装置中包含经纯化的蛋白质的人工饮食上进行鳞翅目 摄食测定。将经纯化的蛋白质与鳞翅目特异性人工饮食以25μl蛋白 质和35ul饮食混合物的比例掺入。在每个孔放置两至五只新生幼虫 来摄食4天(欧洲玉米螟摄食5天)。结果表示为幼虫反应如生长抑 制呈阳性和/或死亡率。如果幼虫与摄食仅施用上述缓冲液的饮食的阴 性对照相似,那么结果表示为阴性。在欧洲玉米螟(玉米螟(Ostrinia nubilalis))、玉米穗蛾(玉米穗虫(Helicoverpa zea))、黑切根虫 (小地老虎(Agrotis ipsilon))、秋夜蛾(草地贪夜蛾(Spodoptera frugiperda))、大豆夜蛾(大豆尺夜蛾(Pseudoplusia includens))和 黎豆夜蛾(Anticarsia gemmatalis)上测定经纯化的蛋白质。
鞘翅目昆虫测定
在96孔板装置中包含经纯化的蛋白质的人工饮食上进行鞘翅目 摄食测定。将经纯化的蛋白质与鞘翅目特异性人工饮食以10μl蛋白 质和50ul饮食混合物的比例掺入。在每个孔放置两至五只新生幼虫 来摄食4天。结果表示为幼虫反应如生长抑制呈阳性和/或死亡率。如 果幼虫与摄食仅施用上述缓冲液的饮食的阴性对照相似,那么结果表 示为阴性。
半翅目测定
西部牧草盲蝽(豆荚盲蝽(Lygus hesperus))生物测定
在96孔生物测定板(BD Falcon 353910)中的每个孔中将20μl 经纯化的蛋白质与75ul草盲蝽属饵料(Bio-Serv F9644B)混合,并 用一片覆盖。将不同数量的豆荚盲蝽二龄若虫(2至7只) 置于96孔过滤板的每个孔中。然后将样品板翻转到过滤板上并用橡 皮筋保持在一起。测定在25℃下运行四天,并且然后对昆虫死亡率 和/或昆虫生长的生长抑制迟缓进行评分。
南方绿椿象(稻绿蝽(Nezara viridula))生物测定
将40ul经纯化的蛋白质与包装中的360ul草盲蝽属饵 料(Bio-ServF9644B)混合。将10至15只新蜕皮的第二龄若虫置于 聚苯乙烯培养皿(100mm×20mm)中,该培养皿衬有湿式滤纸(直径100mm)。在该平皿中包括水源。将生物测定在25℃下 在黑暗中孵育三天,并然后更换饮食/样品包。在总共6天后对死亡率 和生长延缓进行生物测定评分。
表4
昆虫 IC50(ppm) 影响
WCRW 5-10 死亡
NCRW 约11 死亡
SCRW 500-1000 适度生长延缓
FAW 500-800 严重生长延缓
BCW 在830ppm下无活性
CEW 100 死亡
ECB 约800 严重生长延缓
SBL 150-200 死亡
VBC 约800 适度生长延缓
WTPB 50 死亡
SGSB 在420ppm下无活性
如实例3中的描述,表达并纯化IPD082Aa的同源蛋白和嵌合区 域-交换的蛋白质,并且还测试针对WCRW的活性。来自IPD082Aa 的N-末端区域(SEQ ID NO:34)与同源物IPD082Hb-2(SEQ ID NO: 37)、IPD082Ia-2(SEQ ID NO:39)、IPD082Ic-2(SEQ ID NO:41)、IPD082Ie-2(SEQ ID NO:43)、IPD082Ib-2(SEQ ID NO:45)、 IPD082Hd-2(SEQ ID NO:47)、和IPD082Hc-2(SEQ ID NO:49)的 C-末端区域的共表达分别产生针对WCRW具有可检测活性的可溶性 活性蛋白质复合物。IPD082Aa的N-末端区域(SEQ ID NO:34)与 IPD082Ib(SEQID NO:46)、IPD082Hd(SEQ ID NO:48)、和IPD082Hc (SEQ ID NO:50)的C-末端区域之间的融合蛋白没有表达为可溶形 式。同源物IPD082Ib(SEQ ID NO:46)、IPD082Hd(SEQ ID NO:48)、 IPD082Hc(SEQ ID NO:50)、和IPD082He(SEQ ID NO:6)是无活 性的或不可溶的。结果汇总在表5中。
表5
实例7 在WCRW的mCry3A抗性菌株中没有IPD082Aa的交叉抗性
通过在mCry3A转基因玉米植物上选择WCRW来开发抗 mCry3A(RR>92倍)的WCRW菌株,其中该转基因玉米植物在根 部针对六个选择(F3、F6、F7、F8、F10、和F12幼虫)在>10,000ppm 的总蛋白质下具有T0水平的mCry3A表达。在幼虫用于IPD082Aa (SEQ ID NO:2)的交叉抗性测试之前,在mCry3A转基因玉米植物 上进行WCRW的另外选择,mCry3A在>30,000ppm的蛋白质在根中 具有较高的T0表达水平。
使用标准化的WCRW饮食掺入生物测定来评估IPD082Aa对 WCRW幼虫的影响。将WCRW新生幼虫置于含有生物测定饮食和杀 昆虫蛋白的平板上,每个浓度处理重复3次,每次生物测定开始后持 续4天。对昆虫死亡率和严重发育迟缓进行评分,并用于计算基于概率分析的抑制浓度(IC50和LC50)。抗性比率(RR)计算如下:RR =(抗性WCRW的LC/IC 50)/(易感WCRW的LC/IC 50)。如表6 所示,Cry3A抗性WCRW昆虫对IPD082Aa敏感。
表6
实例8-农杆菌介导的玉米的稳定转化
对于农杆菌介导的昆杀虫多肽的玉米转化,使用Zhao的方法(美 国专利号5,981,840和国际专利公开号WO 1998/32326,其内容通过引 用结合在此)。简而言之,从玉米中分离未成熟的胚,并且将胚与农 杆菌属悬浮液接触,其中细菌能够将编码本披露的杀昆虫多肽的多核 苷酸转移至至少一种未成熟胚的至少一个细胞中(步骤1:侵染步骤)。 在该步骤中,将未成熟胚胎浸泡在农杆菌属悬液中用于开始接种。使 这些胚胎与农杆菌属共培养一段时间(步骤2:共培养步骤)。将这 些未成熟的胚胎在有抗生素但没有选择剂的固体培养基上培养,用于 农杆菌属消除并用于经侵染的细胞的静置期。然后,接种的胚芽在含 有一种选择剂的培养基上培养,回收生长的转化的愈伤组织(步骤4: 选择步骤)。在含选择剂的固体培养基上培养这些未成熟胚胎,使经 转化的细胞选择性生长。然后将愈伤组织再生成植物(步骤5:再生 步骤),并将生长在选择培养基上的愈伤组织在固体培养基上培养以 再生植物。
为了检测叶组织中的杀昆虫多肽,将4个冻干叶穿孔/样品粉碎并 重新悬浮于含有0.1%TWEENTM 20的100μL PBS(PBST),含有1 片/7mL完整的迷你蛋白酶抑制剂(罗氏公司1183615301)的1%β- 巯基乙醇(B-ME)。将悬浮液超声处理2分钟,并且然后在4℃、20,000g下离心15分钟。向上清液等份1/3体积的3XLDS样品 缓冲液(InvitrogenTM,加利福尼亚州,美国)中,添加含有1片7mL 完整迷你蛋白酶抑制剂的1%B-ME。将反应物在80℃下加热10min, 并且然后离心。将上清液样品按照制造商(InvitrogenTM)说明书装载 在具有MES运行缓冲液的4%-12%Bis-Tris Midi凝胶上,并使用 装置(InvitrogenTM)转移到硝酸纤维素膜上。将硝酸纤维素膜 在含有5%脱脂奶粉的PBST中孵育2小时,然后在PBST中亲和纯化 的兔抗杀昆虫多肽中孵育过夜。将膜用PBST冲洗三次,并且然后在 PBST中孵育15分钟,并且然后冲洗两次5分钟,然后孵育2小时在 具有山羊抗兔HRP的PBST中持续3小时。使用ECL蛋白质印迹试 剂(GE医疗集团,目录号RPN2106)和MR膜可 以观察到所检测的蛋白质。为了检测根中的杀昆虫蛋白,将根冻干, 并且将每个样品2mg粉末重新悬浮于LDS中,添加含有1片/7mL 完整迷你蛋白酶抑制剂的1%B-ME。将反应在80℃下加热10分钟, 并且然后在4℃、20,000g下离心15分钟。将上清液样品按照制造商 (InvitrogenTM)说明书装载在具有MES运行缓冲液的4%-12% Bis-Tris Midi凝胶上,并使用装置(InvitrogenTM)转移到硝酸 纤维素膜上。将硝酸纤维素膜在含有5%脱脂奶粉的PBST中孵育2 小时,然后在PBST中亲和纯化的多克隆兔抗杀昆虫抗体中孵育过夜。 膜用PBST冲洗三次,并且然后在PBST中孵育15分钟,并且然后冲 洗两次5分钟,然后孵育2小时,在具有山羊抗兔HRP的PBST中持 续3小时。使用ECLTM蛋白质印迹试剂(GE医疗集团,目录号 RPN2106)和MR膜可以检测到抗体结合杀昆虫蛋 白。
使用本领域已知的标准生物测定法测试杀昆虫蛋白表达阳性的 转基因玉米植物的杀有害生物活性。这些方法包括例如根切除生物测 定和全植物生物测定。参见,例如,美国专利申请公开号US 2003/0120054和国际公开号WO 2003/018810。
实例9-用于在植物中表达杀昆虫多肽的表达载体构建体
可以构建植物表达载体以包括包含杀昆虫多肽编码序列的转基 因盒,该昆虫多肽编码序列在与增强子元件结合的紫茉莉花叶病毒 (MMV)启动子的控制下[Dey N和MaitiIB,1999,Plant Mol.Biol.[植 物分子生物学]40(5):771-82]。这些构建体可用于产生转基因玉米事件, 以测试通过本披露的杀昆虫多肽的表达提供的针对玉米根虫的功效。
事件的T0温室效应可以通过免受西方玉米根虫的根保护来测 量。使用由Oleson,等人,(2005),[J.Econ Entomol.(经济昆虫学 期刊)98(1):1-8]开发的方法,根据损伤的根的节点数测量根保护 (CRWNIS=玉米根虫节点损伤评分)。根损伤评分测量为从“0” 到“3”,其中“0”表示无可见根损伤,“1”表示1个根损害节点, “2”表示2个节点或根损害,并且“3”表示3个节点的根损害的最 大得分。中间得分(例如1.5)表示损害节点的额外分数(例如1.5个 所损伤的节点)。
实例10 影响蛋白质稳定性和IPD082Aa功能的氨基酸位置的识别
为识别影响蛋白质结构稳定性和IPD082Aa(SEQ ID NO:2)的 杀昆虫功能的氨基酸位置,在所选择的IPD082Aa(SEQ ID NO:2)内 的位置处进行饱和诱变。同时使用具有简并引物(安捷伦公司 (Agilent)的发光定点诱变试剂盒(Lightning Site-Directed Mutagenesis Kit))的定点诱变并通过基因的N-末端片 段(无突变)和C-末端片段(具有突变)的多PCR片段重叠组装(Gibson 组装克隆试剂盒,纽英伦生物技术公司(NewEngland Biolabs Inc)) 进入表达载体来产生突变体。在多PCR组装中,将2-4个相邻位置的 正向诱变引物合并,并使用通用反向引物pETl6b-IPD082-R1,TCAGCTTCCTTTCGGGCTTTGTTAGCAGCCGGATCCTTAGTTGC GCGTGTAAAC(SEQ ID NO:61)来进行C-末端片段的PCR扩增。 然后使用针对那些相邻位置的共有反向引物与通用正向引物pET16b-IPD082-F1, ACAGCAGCGGCCATATCGAAGGTCGTCATATGCAAACTACTGT ATCGGAAACCT(SEQID NO:62)来对相应的重叠N-末端片段进行 PCR扩增。例如,使用定点诱变,用正向引物IPD082Rep1-FNNK-F, ATCGCCGGACGTCAGTTCNNKTATGGCCAGAACCTGAAGA(SEQ ID NO:63)和反向引物IPD082Rep1-FNNK-R, TCTTCAGGTTCTGGCCATAMNNGAACTGACGTCCGGCGAT(SEQ ID NO:64)来诱变IPD082Aa(SEQ ID NO:2)的编码位置48。例如, 使用多PCR组装,用正向引物IPD082-M69NNK-F, CTGTTGCCAGGCGGCAAGNNKGGTCAGGAGACTGCCAATG (SEQ ID NO:65)和IPD082-G70NNK-F, CTGTTGCCAGGCGGCAAGATGNNKCAGGAGACTGCCAATG (SEQ ID NO:66)与反向引物pET16b-IPD082-R1(SEQ ID NO:61) 来产生在密码子中具有突变的C-末端片段,这些密码子编码 IPD082Aa(SEQ ID NO:2)的位置69和70。然后使用正向通用引物 pET16b-IPD082-F1(SEQ ID NO:62)和反向引物 IPD082-M69G70-gbR,CTTGCCGCCTGGCAACAG(SEQ IDNO:67) 以产生相应的N-末端片段,用于重叠组装。类似地,诱变引物被设计 用于在表7中列出的其他位置处进行诱变。同时将IPD082Aa多核苷 酸(SEQ ID NO:1)的天然DNA序列和IPD082Aa(SEQ ID NO:29) 的优化版本用作用于诱变的主链序列。将所得变体从文库转化到大肠 杆菌细胞后,对菌落进行序列识别(除非另有说明)。然后挑取独特 的克隆并在96孔板中培养以用于蛋白质表达。通过来自赛默科技公 司(Thermo Scientific)(3747 NMeridian Rd,罗克福德(Rockford), IL USA 61101)的蛋白质提取试剂中产生细胞裂解物,并筛 选用于WCRW杀昆虫活性。
进行三组诱变。在第一组中,靶向在IPD082Aa(SEQ ID NO:2) 的N-末端内的重复区域中的保守的位置。这些位置包括SEQ ID NO:2 的F48、F96、F144、F242、F290和W58、W106、W154、W252、以 及W300。在第二组中,针对单位置饱和诱变选择序列(SEQ ID NO:2 的氨基酸M69-N80、T173-G176、L318-A327、Q401-D410、和 N478-F499)区组。在第三个实验中,针对单位置饱和诱变选择序列 (SEQ ID NO:2的氨基酸A358-P369和G425-L436)的另外的区组。 来自第三个实验的克隆直接进入表达和昆虫测定,而无需序列验证。 针对位置A358-I361的每两个位置筛选四十八个克隆。针对位置 R362-P369和位置G423-L434的每两个位置筛选二十四个克隆。然后 对展示出WCRW活性的变体进行序列识别。
表7总结了在每个突变位置处识别的氨基酸取代,在细胞裂解物 中可溶解地表达的氨基酸取代变体,以及保留杀昆虫活性的氨基酸取 代变体。
表7
*=在测序前没有通过直接活性筛选而鉴定的活性分离物
对本公开的不同所示实施例的上述描述并不旨在是详尽的或者 限制范围于所公开的精确形式。虽然为了说明目的而在此描述了具体 实施例和实例,但是在本公开范围内,如相关领域的技术人员将认识 到的,不同的等效修饰是可能的。本文提供的教导可以应用于除了上 述实例之外的其他目的。根据上述教导,许多修改和变化是可能的, 因此它们在所附权利要求书的范围内。
可以根据上述详细描述进行这些改变和其他改变。通常,在以下 权利要求书中,所使用的术语不应被解释为将范围限制于说明书和权 利要求书中公开的具体实施例。
背景技术、详细描述和实例中引用的每个文献(包括专利、专利 申请、杂志文章、摘要、手册、书籍或其他公开内容)的全部公开内 容通过引用以其整体结合在此。
就使用的数字(例如量、温度、浓度等)而言,已努力确保其准 确性,但仍应允许有一些实验误差和偏差。除非另有说明,份为重量 份,分子量为平均分子量;温度是摄氏度;并且压力为大气压或接近 大气压。
序列表
<110> 先锋良种国际有限公司(Pioneer Hi-Bred International, Inc.)
E I.内穆尔杜邦公司(E I du Pont de Nemours and Company)
Liu, Lu
Lum, Amy
Oral, Jarred Kenneth
Perez-Ortega, Claudia
Rosen, Barbara Ann Marie
Schellenberger, Ute
Jun-zhi, Wei
Weiping, Xie
Xiaohong, Zhong
Genhai, Zhu
<120> 杀昆虫蛋白及其使用方法
<130> 6048-WO-PCT
<150> 62/269482
<151> 2015-12-18
<160> 71
<170> PatentIn 版本 3.5
<210> 1
<211> 1548
<212> DNA
<213> 弗村假单胞菌
<400> 1
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct ggacgcagat 1020
tcatccacga gctatcagcc tagttatgcc gttggttggt cgccctacct ggcggattgg 1080
atacgctacg tcaagaacgg cggcccgatc ttcaagtacc acgatcctgc cgagatcgat 1140
ggtgtcggca tactgctgcc catgcgcaac gggaagttgt atggggacca gctcaagcga 1200
cagattaccg aggaactgcc cctgtatgac aagtcccaag gtcactattc gtgggttctg 1260
acgccgggcg ggaaaatcct ctacaagtgg aactcccagc ttgagctcga cagtcgtcag 1320
tacacgcggc acagcgacct caaccaaggg cgcccggtta cctgtgccgg cgagttctac 1380
ctgactcggc gaagctcgaa catcttcctc acggagttgt acatcgagat caacgacagc 1440
tcgggccact acaagccatc agccgcagtc tgtttcaggt acgtgcttga ggagttcgag 1500
gcactgggca tcgacctgaa caacatcgag ggggtttaca cgcgcaac 1548
<210> 2
<211> 516
<212> PRT
<213> 弗村假单胞菌
<400> 2
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly
340 345 350
Trp Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly
355 360 365
Pro Ile Phe Lys Tyr His Asp Pro Ala Glu Ile Asp Gly Val Gly Ile
370 375 380
Leu Leu Pro Met Arg Asn Gly Lys Leu Tyr Gly Asp Gln Leu Lys Arg
385 390 395 400
Gln Ile Thr Glu Glu Leu Pro Leu Tyr Asp Lys Ser Gln Gly His Tyr
405 410 415
Ser Trp Val Leu Thr Pro Gly Gly Lys Ile Leu Tyr Lys Trp Asn Ser
420 425 430
Gln Leu Glu Leu Asp Ser Arg Gln Tyr Thr Arg His Ser Asp Leu Asn
435 440 445
Gln Gly Arg Pro Val Thr Cys Ala Gly Glu Phe Tyr Leu Thr Arg Arg
450 455 460
Ser Ser Asn Ile Phe Leu Thr Glu Leu Tyr Ile Glu Ile Asn Asp Ser
465 470 475 480
Ser Gly His Tyr Lys Pro Ser Ala Ala Val Cys Phe Arg Tyr Val Leu
485 490 495
Glu Glu Phe Glu Ala Leu Gly Ile Asp Leu Asn Asn Ile Glu Gly Val
500 505 510
Tyr Thr Arg Asn
515
<210> 3
<211> 1488
<212> DNA
<213> 恶臭假单胞菌
<400> 3
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcaccttc 60
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ttggttcatc 120
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg gtgggacaac 180
tcctatgcag tacaatttgc ttttagtgta ggagggcggc aatattttta cggacaaaat 240
ttagaaacaa attattggtt tattcaagag ttacttgctg gaggaaaaat gggacaagaa 300
acagctaacg gacgttggaa taacccctac gcgagccagt ttgccttctc cgtcggcggg 360
cgccagttct tttacgggca aaacctgaaa accaactact ggttcattca agaactgctt 420
gccggcggta agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 480
caatttccct tcagcgtcgg cggtagccag tatttctatg gccagaacat taacaaccgc 540
agctggttta ttaaagaact gctggcgggc ggcaaagtgg gcaaaaccac cgcgagcggc 600
cgctgggata acgcgtatgc ggtgcagttt gcgtatccgg cgcagcagta tggccgccag 660
tacttctatg gacagaacct ggataccaac tattggtttg tgcaggaact gctgcctgga 720
ggtgcgatgg gcgaagagat tatgaacggc cgctggggca atccgtatgc gacccagttt 780
gcgtatgaac agggcggcat tagctacttc tatggtcaga accagagcag caactattgg 840
tttattcagg aactgctgag cgataccgaa tataccgtgc gccgcctgcc gctgctggat 900
tatagcaact cagctagcgc agctcaggaa ggcgcgccgg gcgtgtgcct ggatgcgggc 960
agcagcacca gctatcagcc gagctatgcg gtgggctgga gcccgtatct ggcggattgg 1020
attcgctatg tgaagaacgg cggcccgatc ttcaagtatc atgatccggc ggaaattgat 1080
ggcgtgggca ttctgctgcc gatgcgcaac ggcaaactgt atggcgatca gctgaagcgt 1140
cagattaccg aagaactgcc gctgtatgag aagagcgaag gccattatag ctgggtgctg 1200
accccgggcg gcaagattct gtataaatgg aacagccagc tggaactgga tagccgccag 1260
tatacccgcc atagcgatct gaaccagggc cgcccggtga cctgcgcggg cgagttctat 1320
ctgacccgcc gcagcagcaa catcttcctg accgaactgt atattgaaat taacgatagc 1380
agcggccatt ataaaccgag cgcggcggtg tgctttcgct atgtgctgga agaatttgaa 1440
gcgctgggca ttgatctgaa caacattgaa ggcgtgtata cccgcaac 1488
<210> 4
<211> 496
<212> PRT
<213> 恶臭假单胞菌
<400> 4
Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn Pro Tyr Ala Ile
1 5 10 15
Gln Phe Thr Phe Ser Ile Ala Gly Arg Gln Phe Phe Tyr Gly Gln Asn
20 25 30
Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu Pro Gly Gly Lys
35 40 45
Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn Ser Tyr Ala Val
50 55 60
Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Tyr Phe Tyr Gly Gln Asn
65 70 75 80
Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu Ala Gly Gly Lys
85 90 95
Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn Pro Tyr Ala Ser
100 105 110
Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe Tyr Gly Gln Asn
115 120 125
Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu Ala Gly Gly Lys
130 135 140
Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly Pro Phe Ala Val
145 150 155 160
Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe Tyr Gly Gln Asn
165 170 175
Ile Asn Asn Arg Ser Trp Phe Ile Lys Glu Leu Leu Ala Gly Gly Lys
180 185 190
Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn Ala Tyr Ala Val
195 200 205
Gln Phe Ala Tyr Pro Ala Gln Gln Tyr Gly Arg Gln Tyr Phe Tyr Gly
210 215 220
Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu Leu Leu Pro Gly
225 230 235 240
Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp Gly Asn Pro Tyr
245 250 255
Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser Tyr Phe Tyr Gly
260 265 270
Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu Leu Leu Ser Asp
275 280 285
Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp Tyr Ser Asn Ser
290 295 300
Ala Ser Ala Ala Gln Glu Gly Ala Pro Gly Val Cys Leu Asp Ala Gly
305 310 315 320
Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp Ser Pro Tyr
325 330 335
Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro Ile Phe Lys
340 345 350
Tyr His Asp Pro Ala Glu Ile Asp Gly Val Gly Ile Leu Leu Pro Met
355 360 365
Arg Asn Gly Lys Leu Tyr Gly Asp Gln Leu Lys Arg Gln Ile Thr Glu
370 375 380
Glu Leu Pro Leu Tyr Glu Lys Ser Glu Gly His Tyr Ser Trp Val Leu
385 390 395 400
Thr Pro Gly Gly Lys Ile Leu Tyr Lys Trp Asn Ser Gln Leu Glu Leu
405 410 415
Asp Ser Arg Gln Tyr Thr Arg His Ser Asp Leu Asn Gln Gly Arg Pro
420 425 430
Val Thr Cys Ala Gly Glu Phe Tyr Leu Thr Arg Arg Ser Ser Asn Ile
435 440 445
Phe Leu Thr Glu Leu Tyr Ile Glu Ile Asn Asp Ser Ser Gly His Tyr
450 455 460
Lys Pro Ser Ala Ala Val Cys Phe Arg Tyr Val Leu Glu Glu Phe Glu
465 470 475 480
Ala Leu Gly Ile Asp Leu Asn Asn Ile Glu Gly Val Tyr Thr Arg Asn
485 490 495
<210> 5
<211> 918
<212> DNA
<213> 十字花科假单胞菌
<400> 5
atgacacctc cattcgacac cttcatcgac agcctttctg ttacagcttc cataaagaat 60
caaaactggg cgggcacgga cgacagcatc tatatctcga tgggccccct gggccagatg 120
cagttgttct gtgaagcccc cagggtgggg caactcatcc acgtggatat cgacattgcc 180
cggatgttcg gccgaccgcg tatctcgctc ggggaaattg acggactggc cctctaccag 240
gtgcccgtcg cacacccgat cgcttctgat gactgggcgc tggaatcggt gctgatcaaa 300
gccaatgaca tctacgccaa tacctcattc aaacgcatca acaaatggct gaggaaccca 360
tccgcgcact tgcaattcgt atggtcagga catgtccatt tctccgactg gaagaattcc 420
gaccatagat ccatcgatct caacgcccag acctatccga tcaggtggat gccctttatc 480
ggcgacctga tgcattggcg ctgttatgac ccgtcgaaaa tagacggcgt aggtcagttg 540
atcgggatgt gggacggcaa gttgatcggc aatcaactga agacacacac cagtgagctg 600
ctcgccccca acgaccagtc caatagttac acatgggtct acacacccga acacgccatt 660
atctataagc gctgggaaca tagcgaccgg gccaactatg taaggcatag ccagctcggc 720
agcggcaggc cggtcatgtg cgccggggag ttcagggtca ccgaacatca catggaccat 780
gtgatcgcca tggtcaacga tgcttccggg cattacaggc ccgacggcgg cgcctgcctg 840
cggtatgtcg ccgagaagtt cgatgccctg gggatcaata ccgagcacat cgaatggcga 900
tggcaagata cgaacgcc 918
<210> 6
<211> 306
<212> PRT
<213> 十字花科假单胞菌
<400> 6
Met Thr Pro Pro Phe Asp Thr Phe Ile Asp Ser Leu Ser Val Thr Ala
1 5 10 15
Ser Ile Lys Asn Gln Asn Trp Ala Gly Thr Asp Asp Ser Ile Tyr Ile
20 25 30
Ser Met Gly Pro Leu Gly Gln Met Gln Leu Phe Cys Glu Ala Pro Arg
35 40 45
Val Gly Gln Leu Ile His Val Asp Ile Asp Ile Ala Arg Met Phe Gly
50 55 60
Arg Pro Arg Ile Ser Leu Gly Glu Ile Asp Gly Leu Ala Leu Tyr Gln
65 70 75 80
Val Pro Val Ala His Pro Ile Ala Ser Asp Asp Trp Ala Leu Glu Ser
85 90 95
Val Leu Ile Lys Ala Asn Asp Ile Tyr Ala Asn Thr Ser Phe Lys Arg
100 105 110
Ile Asn Lys Trp Leu Arg Asn Pro Ser Ala His Leu Gln Phe Val Trp
115 120 125
Ser Gly His Val His Phe Ser Asp Trp Lys Asn Ser Asp His Arg Ser
130 135 140
Ile Asp Leu Asn Ala Gln Thr Tyr Pro Ile Arg Trp Met Pro Phe Ile
145 150 155 160
Gly Asp Leu Met His Trp Arg Cys Tyr Asp Pro Ser Lys Ile Asp Gly
165 170 175
Val Gly Gln Leu Ile Gly Met Trp Asp Gly Lys Leu Ile Gly Asn Gln
180 185 190
Leu Lys Thr His Thr Ser Glu Leu Leu Ala Pro Asn Asp Gln Ser Asn
195 200 205
Ser Tyr Thr Trp Val Tyr Thr Pro Glu His Ala Ile Ile Tyr Lys Arg
210 215 220
Trp Glu His Ser Asp Arg Ala Asn Tyr Val Arg His Ser Gln Leu Gly
225 230 235 240
Ser Gly Arg Pro Val Met Cys Ala Gly Glu Phe Arg Val Thr Glu His
245 250 255
His Met Asp His Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr
260 265 270
Arg Pro Asp Gly Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Phe Asp
275 280 285
Ala Leu Gly Ile Asn Thr Glu His Ile Glu Trp Arg Trp Gln Asp Thr
290 295 300
Asn Ala
305
<210> 7
<211> 918
<212> DNA
<213> 十字花科假单胞菌
<400> 7
atgacacctc cattcgacac cttcatcgac agcctttctg ttacagcttc cataaagaat 60
caaaactggg cgggcacgga cgacagcatc tatatctcga tgggccccct gggccagatg 120
caattgttct gcgaagcccc cagagtgggg caagtcatcc acgtggatat cgacattgcc 180
cggatgttcg gtcgagcacg tatctcgctc ggggaaattg acggactggc cctctaccag 240
gtgcccgtcg cacacccgat cgcttctgat gactgggcgc tgggatcggt gctgatcaaa 300
gccaatgaca tctatgccaa tacctcattc aaacggatcg acacatggct cagaaactca 360
tccgcgcact tgcaattcgt atggtcaggt catgttcact tctccgactg gaagaattcc 420
gaccatagat ccatcgatct cagcgcccag acctatccga tcaggtggat gccctttatc 480
ggcgacctga tgcattggcg ctgttatgac ccatcgaaaa tagacggcgt gggtcagttg 540
atcggaatgt gggacggtca gttgatcggc aatcaactga agacacacac cagtgaactg 600
ctcgccccca acgaccagtc caatagttac acatgggtct atacacccga acacgccatt 660
atctataagc gctgggagca tagcgaccgg gccaactacg tcaggcatag ccagcttggc 720
agtggcaggc cggtcatgtg tgccggggag ctcaaggtca ccgaacatcg tatggaccat 780
gtgatcgcca tggtcaacga tgcttccggg cattacaggc ccgacggcgg cgcctgcctg 840
cggtatgtgg ccgagaagtt cgaggccttg gggatcaata ccgagcatat cgaatggcga 900
tggcaagaca ggaacgcc 918
<210> 8
<211> 306
<212> PRT
<213> 十字花科假单胞菌
<400> 8
Met Thr Pro Pro Phe Asp Thr Phe Ile Asp Ser Leu Ser Val Thr Ala
1 5 10 15
Ser Ile Lys Asn Gln Asn Trp Ala Gly Thr Asp Asp Ser Ile Tyr Ile
20 25 30
Ser Met Gly Pro Leu Gly Gln Met Gln Leu Phe Cys Glu Ala Pro Arg
35 40 45
Val Gly Gln Val Ile His Val Asp Ile Asp Ile Ala Arg Met Phe Gly
50 55 60
Arg Ala Arg Ile Ser Leu Gly Glu Ile Asp Gly Leu Ala Leu Tyr Gln
65 70 75 80
Val Pro Val Ala His Pro Ile Ala Ser Asp Asp Trp Ala Leu Gly Ser
85 90 95
Val Leu Ile Lys Ala Asn Asp Ile Tyr Ala Asn Thr Ser Phe Lys Arg
100 105 110
Ile Asp Thr Trp Leu Arg Asn Ser Ser Ala His Leu Gln Phe Val Trp
115 120 125
Ser Gly His Val His Phe Ser Asp Trp Lys Asn Ser Asp His Arg Ser
130 135 140
Ile Asp Leu Ser Ala Gln Thr Tyr Pro Ile Arg Trp Met Pro Phe Ile
145 150 155 160
Gly Asp Leu Met His Trp Arg Cys Tyr Asp Pro Ser Lys Ile Asp Gly
165 170 175
Val Gly Gln Leu Ile Gly Met Trp Asp Gly Gln Leu Ile Gly Asn Gln
180 185 190
Leu Lys Thr His Thr Ser Glu Leu Leu Ala Pro Asn Asp Gln Ser Asn
195 200 205
Ser Tyr Thr Trp Val Tyr Thr Pro Glu His Ala Ile Ile Tyr Lys Arg
210 215 220
Trp Glu His Ser Asp Arg Ala Asn Tyr Val Arg His Ser Gln Leu Gly
225 230 235 240
Ser Gly Arg Pro Val Met Cys Ala Gly Glu Leu Lys Val Thr Glu His
245 250 255
Arg Met Asp His Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr
260 265 270
Arg Pro Asp Gly Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Phe Glu
275 280 285
Ala Leu Gly Ile Asn Thr Glu His Ile Glu Trp Arg Trp Gln Asp Arg
290 295 300
Asn Ala
305
<210> 9
<211> 909
<212> DNA
<213> 起皱假单胞菌
<400> 9
atgacggata ctattgtgga tactctgacc gtcaccgctt ccatcaccaa tgaacattgg 60
gctggtactg atgacacgct gtacgtaagc atgggtcctc tgagccagat gcaactgttc 120
tgtgaagccc cacgcgtagg tcagaccatc actgtggaaa tcgacctgcc gcgtctgttc 180
ggccgcccgc gcatttctct gtctgaaatt gatggtgtga ccttttacca acgtccggaa 240
gcgcacccga tcgccactga tgattgggaa ctggaatctg ttctgatcaa agccaacgac 300
atctatacca atctgtcttt caaacaagtg cgtcgctggc tgcgtaactc ctccagccac 360
ctgctggctg tatggtccgg ccacgttcac ttcagcgatt ggatgaactc cgatcaccgt 420
tctgttgacc tgaacgcgca gacgtatcct atccgttgga tgccatttat tggcgacctg 480
atgcactggc gttgttacga tccgtctaaa atcgacggtg tcggtcagct ggttggcatg 540
tgggatggta aactgatcgg caaccaactg aagagccaga ctagcgaaat gctgagcccg 600
aacgaccagt ctaacagcta cacctgggtt tatacccctg agaacagcat catctataaa 660
cgctgggaac acgctgatcg cgccaactac atccgccatt ctcagctggg ttctggccgc 720
ccggttatgt gcgccggcga gtttcgtatc cgtgaacacc gtatggaaca cgtgattgcg 780
atggttaacg atgcctccgg tcactaccgt ccggacggtg gtgcgtgcct gcgctacgtg 840
gccgagaaat ttgaagccct gggcatcaac accgaacaca ttgaatggca gtggcgttac 900
gcatctgac 909
<210> 10
<211> 303
<212> PRT
<213> 起皱假单胞菌
<400> 10
Met Thr Asp Thr Ile Val Asp Thr Leu Thr Val Thr Ala Ser Ile Thr
1 5 10 15
Asn Glu His Trp Ala Gly Thr Asp Asp Thr Leu Tyr Val Ser Met Gly
20 25 30
Pro Leu Ser Gln Met Gln Leu Phe Cys Glu Ala Pro Arg Val Gly Gln
35 40 45
Thr Ile Thr Val Glu Ile Asp Leu Pro Arg Leu Phe Gly Arg Pro Arg
50 55 60
Ile Ser Leu Ser Glu Ile Asp Gly Val Thr Phe Tyr Gln Arg Pro Glu
65 70 75 80
Ala His Pro Ile Ala Thr Asp Asp Trp Glu Leu Glu Ser Val Leu Ile
85 90 95
Lys Ala Asn Asp Ile Tyr Thr Asn Leu Ser Phe Lys Gln Val Arg Arg
100 105 110
Trp Leu Arg Asn Ser Ser Ser His Leu Leu Ala Val Trp Ser Gly His
115 120 125
Val His Phe Ser Asp Trp Met Asn Ser Asp His Arg Ser Val Asp Leu
130 135 140
Asn Ala Gln Thr Tyr Pro Ile Arg Trp Met Pro Phe Ile Gly Asp Leu
145 150 155 160
Met His Trp Arg Cys Tyr Asp Pro Ser Lys Ile Asp Gly Val Gly Gln
165 170 175
Leu Val Gly Met Trp Asp Gly Lys Leu Ile Gly Asn Gln Leu Lys Ser
180 185 190
Gln Thr Ser Glu Met Leu Ser Pro Asn Asp Gln Ser Asn Ser Tyr Thr
195 200 205
Trp Val Tyr Thr Pro Glu Asn Ser Ile Ile Tyr Lys Arg Trp Glu His
210 215 220
Ala Asp Arg Ala Asn Tyr Ile Arg His Ser Gln Leu Gly Ser Gly Arg
225 230 235 240
Pro Val Met Cys Ala Gly Glu Phe Arg Ile Arg Glu His Arg Met Glu
245 250 255
His Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Arg Pro Asp
260 265 270
Gly Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Phe Glu Ala Leu Gly
275 280 285
Ile Asn Thr Glu His Ile Glu Trp Gln Trp Arg Tyr Ala Ser Asp
290 295 300
<210> 11
<211> 1086
<212> DNA
<213> 起皱假单胞菌
<400> 11
atgtcttccg atggttgtct gattcagccg ttcaacgcga aagttctgga attcgaagac 60
ggtcaggtcc gtctgatgga ctatgacctg ctgcgtccag cgcacgctca ttggcagatc 120
cgtcacttcc gtcagcgccg tgcgtctatg gctgtgttcg aaccgcagcc actgggttac 180
atttctaaac tgagcatcac cgttaccatc gcgaacgtgt tctggggtgg taccagcgac 240
aaaattatgc tgactctgac ctccctggac aaagccgtcc gcctgtttga tgcgcctcac 300
gctggtgatt ccgttaccct ggatatcgac atccaggcta tgttcggcaa gccgtccatc 360
ccgatgcgtg atgtacatac catcctgttc taccaggaaa gccgcgcggt cagcggtggt 420
aacgaccaat ggaaactgga atccattgtt ctgaaagcta acgaccgtta cctgaacgac 480
tctctgcgta acattaaccg ttgggtttct ccgccgttcc gttctgctca catttcttgg 540
ggtagcacca tctcctggtg taattggcgc gacatccgtc acaatcgtca tattgatttt 600
aacggccaga cttacccggt aaccctgatg ccatatatcg gcgatctgaa agcttggcgc 660
aattacgatc cgtcttctat cgatggtgtg ggccagctga ttggtatgaa ccatggtcgt 720
ctgattggcg aaatcctgaa gacccgtgat tgcgaagcgc tgaagccgaa cgaaggcaac 780
aactcctata cctgggtgtt cactccggac ggcgctatca tctaccgcct gtggaaccat 840
gatgactccg caggttacat ccgtcacagc cagctgggtt ctggccgttc tgtgatctgt 900
gccggtgaat ttcgcatcga gcgtcgtgag gatatcgatg gtgttgtgga tgtgatcgca 960
atggtgaacg atgcctctgg ccattacaaa cctgacggtg gtgcgtgtct gggctctgtg 1020
gaggaaaaat tcaaagccct gggtatcccg accgaacaca tcacttggtc ttatcgcggt 1080
gccgcg 1086
<210> 12
<211> 362
<212> PRT
<213> 起皱假单胞菌
<400> 12
Met Ser Ser Asp Gly Cys Leu Ile Gln Pro Phe Asn Ala Lys Val Leu
1 5 10 15
Glu Phe Glu Asp Gly Gln Val Arg Leu Met Asp Tyr Asp Leu Leu Arg
20 25 30
Pro Ala His Ala His Trp Gln Ile Arg His Phe Arg Gln Arg Arg Ala
35 40 45
Ser Met Ala Val Phe Glu Pro Gln Pro Leu Gly Tyr Ile Ser Lys Leu
50 55 60
Ser Ile Thr Val Thr Ile Ala Asn Val Phe Trp Gly Gly Thr Ser Asp
65 70 75 80
Lys Ile Met Leu Thr Leu Thr Ser Leu Asp Lys Ala Val Arg Leu Phe
85 90 95
Asp Ala Pro His Ala Gly Asp Ser Val Thr Leu Asp Ile Asp Ile Gln
100 105 110
Ala Met Phe Gly Lys Pro Ser Ile Pro Met Arg Asp Val His Thr Ile
115 120 125
Leu Phe Tyr Gln Glu Ser Arg Ala Val Ser Gly Gly Asn Asp Gln Trp
130 135 140
Lys Leu Glu Ser Ile Val Leu Lys Ala Asn Asp Arg Tyr Leu Asn Asp
145 150 155 160
Ser Leu Arg Asn Ile Asn Arg Trp Val Ser Pro Pro Phe Arg Ser Ala
165 170 175
His Ile Ser Trp Gly Ser Thr Ile Ser Trp Cys Asn Trp Arg Asp Ile
180 185 190
Arg His Asn Arg His Ile Asp Phe Asn Gly Gln Thr Tyr Pro Val Thr
195 200 205
Leu Met Pro Tyr Ile Gly Asp Leu Lys Ala Trp Arg Asn Tyr Asp Pro
210 215 220
Ser Ser Ile Asp Gly Val Gly Gln Leu Ile Gly Met Asn His Gly Arg
225 230 235 240
Leu Ile Gly Glu Ile Leu Lys Thr Arg Asp Cys Glu Ala Leu Lys Pro
245 250 255
Asn Glu Gly Asn Asn Ser Tyr Thr Trp Val Phe Thr Pro Asp Gly Ala
260 265 270
Ile Ile Tyr Arg Leu Trp Asn His Asp Asp Ser Ala Gly Tyr Ile Arg
275 280 285
His Ser Gln Leu Gly Ser Gly Arg Ser Val Ile Cys Ala Gly Glu Phe
290 295 300
Arg Ile Glu Arg Arg Glu Asp Ile Asp Gly Val Val Asp Val Ile Ala
305 310 315 320
Met Val Asn Asp Ala Ser Gly His Tyr Lys Pro Asp Gly Gly Ala Cys
325 330 335
Leu Gly Ser Val Glu Glu Lys Phe Lys Ala Leu Gly Ile Pro Thr Glu
340 345 350
His Ile Thr Trp Ser Tyr Arg Gly Ala Ala
355 360
<210> 13
<211> 1482
<212> DNA
<213> 尖孢镰刀菌
<400> 13
atgcctgctc tggcggaccc ggtgaagctg tggaaaaacc gttgtgttcc atacgttgat 60
aacatctctt tcatgccgcc gcacaccaaa aaagtgcgcg aggttctgga tgagtgggaa 120
aaagcgtgtg gcatttcctt cgtgccgcgt cgtttcgagg acaattatgt aatcattcag 180
cctggtgacg gccagaccgc cattggcatg cagggcggtc cgcaggaagt attctttcct 240
gatccgatgg actctatggc ctacttcacc ggcaaacgtc gtggtcgtgc gctgcacgaa 300
ctgggtcaca ccctgggcct gatcaacgag cagtgccgtt ccgatcgtga cagcttcgtc 360
aactttgaat ggaagaacat cgcgaatggt gagagcaatg acgacttcaa agtgcgccag 420
agccacaacc tgaccgaata tgatcgtgat tccgttatga acgacccaga tccgaatgag 480
ggctggagct ctatggcgaa ccgtaacgta gctcgtacca tccgttggaa gaccgaccag 540
acctttatct tctccccgga aaagctgagc gaactggata aaaaagccat caaagataaa 600
tacgccgttg agacggtgcc gatgggcctg gaggttaaac tgtctcgttg gttcaacccg 660
tacgccgtac aagttccgtt ttccatcggt ggccgtcagt tcatttacgc gcagaatacc 720
ggtaccaaag attggttcac cgccgaactg aaaaacggtg atagcattgt tgatgtccag 780
ctgggccgtt ggaacaacgc ataccgtatt gctgttccgc tgaacatcga aggccagctg 840
tacctgttcg cgatgaacac cgataacaac tactggttca tccagcgtct gcaggatgat 900
ggtaagatgg gcactgaaac cgcaaacggc ttttggaaga acacttatga atctctgtgc 960
agcttttccg tggatggcaa aacttatatg tacggccaga accgttctaa caacgagtgg 1020
tttattcagg aactgctgcc gggtggcaaa atgggcctgc agacctccaa tggtacccat 1080
aagtatagct acgatatgca gttcccgtac agcgtagcag gccgtcagta cctgtaccgt 1140
taccgtgtgg aaggcaacta ttggactatt cgcgaactgc tgccaggtgg taacctgagc 1200
gagaaattta ccgacggcaa cctggacgaa cgctatcacg tgcagttctc ttactccatc 1260
ggcaataatg tgtatctgta cggtcagagc agctccacga tgtcttggtc tatccgtcgt 1320
ttcgaaggca ataaagtggg taacatgctg cagcgcggca gctggggtca gtactacgct 1380
gtgcagttcc cgctggccct gccgaatggc cgtcaaggtt tctacggtaa taacgcgagc 1440
ggtgacaaat ggtttattca agaactgctg aacatcccgg tg 1482
<210> 14
<211> 494
<212> PRT
<213> 尖孢镰刀菌
<400> 14
Met Pro Ala Leu Ala Asp Pro Val Lys Leu Trp Lys Asn Arg Cys Val
1 5 10 15
Pro Tyr Val Asp Asn Ile Ser Phe Met Pro Pro His Thr Lys Lys Val
20 25 30
Arg Glu Val Leu Asp Glu Trp Glu Lys Ala Cys Gly Ile Ser Phe Val
35 40 45
Pro Arg Arg Phe Glu Asp Asn Tyr Val Ile Ile Gln Pro Gly Asp Gly
50 55 60
Gln Thr Ala Ile Gly Met Gln Gly Gly Pro Gln Glu Val Phe Phe Pro
65 70 75 80
Asp Pro Met Asp Ser Met Ala Tyr Phe Thr Gly Lys Arg Arg Gly Arg
85 90 95
Ala Leu His Glu Leu Gly His Thr Leu Gly Leu Ile Asn Glu Gln Cys
100 105 110
Arg Ser Asp Arg Asp Ser Phe Val Asn Phe Glu Trp Lys Asn Ile Ala
115 120 125
Asn Gly Glu Ser Asn Asp Asp Phe Lys Val Arg Gln Ser His Asn Leu
130 135 140
Thr Glu Tyr Asp Arg Asp Ser Val Met Asn Asp Pro Asp Pro Asn Glu
145 150 155 160
Gly Trp Ser Ser Met Ala Asn Arg Asn Val Ala Arg Thr Ile Arg Trp
165 170 175
Lys Thr Asp Gln Thr Phe Ile Phe Ser Pro Glu Lys Leu Ser Glu Leu
180 185 190
Asp Lys Lys Ala Ile Lys Asp Lys Tyr Ala Val Glu Thr Val Pro Met
195 200 205
Gly Leu Glu Val Lys Leu Ser Arg Trp Phe Asn Pro Tyr Ala Val Gln
210 215 220
Val Pro Phe Ser Ile Gly Gly Arg Gln Phe Ile Tyr Ala Gln Asn Thr
225 230 235 240
Gly Thr Lys Asp Trp Phe Thr Ala Glu Leu Lys Asn Gly Asp Ser Ile
245 250 255
Val Asp Val Gln Leu Gly Arg Trp Asn Asn Ala Tyr Arg Ile Ala Val
260 265 270
Pro Leu Asn Ile Glu Gly Gln Leu Tyr Leu Phe Ala Met Asn Thr Asp
275 280 285
Asn Asn Tyr Trp Phe Ile Gln Arg Leu Gln Asp Asp Gly Lys Met Gly
290 295 300
Thr Glu Thr Ala Asn Gly Phe Trp Lys Asn Thr Tyr Glu Ser Leu Cys
305 310 315 320
Ser Phe Ser Val Asp Gly Lys Thr Tyr Met Tyr Gly Gln Asn Arg Ser
325 330 335
Asn Asn Glu Trp Phe Ile Gln Glu Leu Leu Pro Gly Gly Lys Met Gly
340 345 350
Leu Gln Thr Ser Asn Gly Thr His Lys Tyr Ser Tyr Asp Met Gln Phe
355 360 365
Pro Tyr Ser Val Ala Gly Arg Gln Tyr Leu Tyr Arg Tyr Arg Val Glu
370 375 380
Gly Asn Tyr Trp Thr Ile Arg Glu Leu Leu Pro Gly Gly Asn Leu Ser
385 390 395 400
Glu Lys Phe Thr Asp Gly Asn Leu Asp Glu Arg Tyr His Val Gln Phe
405 410 415
Ser Tyr Ser Ile Gly Asn Asn Val Tyr Leu Tyr Gly Gln Ser Ser Ser
420 425 430
Thr Met Ser Trp Ser Ile Arg Arg Phe Glu Gly Asn Lys Val Gly Asn
435 440 445
Met Leu Gln Arg Gly Ser Trp Gly Gln Tyr Tyr Ala Val Gln Phe Pro
450 455 460
Leu Ala Leu Pro Asn Gly Arg Gln Gly Phe Tyr Gly Asn Asn Ala Ser
465 470 475 480
Gly Asp Lys Trp Phe Ile Gln Glu Leu Leu Asn Ile Pro Val
485 490
<210> 15
<211> 1647
<212> DNA
<213> 蒙氏假单胞菌
<400> 15
atgtccagtt tcaacatcac ctggatgacg cgggcccagc tgcctgcgtt tccgccacag 60
atgagctttt cggctgccaa tcccgccagc acgaaaccgg atgatcaggc caggactccg 120
gttatccgct ggggccgtag cctggcctgc gtgctggagt cccgtcacca ccacgaccag 180
gcctgggtgg tagtctacgg tgatggcaag caattgaccg gcgtacaccc gctgcatgac 240
tttcgccata tcagccgtat ccagctggcc gccaacagcc atgccgtact gttgaccgac 300
agtgcgcagc gccagcaaac ggtcgaattc atccagctga aggcactgga tggcagtggt 360
ggtgccgggg accccgtgaa cggcctaccc agcggtatcc cgttcatgct taccaatggt 420
cgtgattacc tgatggcgga cgaggagggc gtgtgcctcg ccgtgaaccc ggatcccaag 480
gccatgcaat ggctctacag ggacgggcaa ctggtcaatg tcaccaccgg gcaggccttg 540
gggctcggga tctgcggcaa ggcgagcgca gcctcgggag atcgctggcg gctgtcttcc 600
aagggtgagc ttctctatgg cgatggcacc cgtaccttgt gcagtgctcc gatttcgggt 660
gaggtctggc tgcagcgacg aagcgaggtg ctgccttccg acgcctggcg ggtgcaactg 720
ccccagctcc cccgccgggg gcaggcgccg agcatggtcg tagacaaact gagcgtgtgc 780
ctcgctgtct ctgccgacta cagtgccgga acaggcgata ccctttcgtt ctcgatcaat 840
ggcagcgagc accgccagcc gttggccggc aacttcgagc gtggggcgca cttcaaggtc 900
gaggtcgacc tggccaagat gttccagcgc agcgtgatct atgccgatga gctgcgctcg 960
gtcgagatct accaggccag tgccgggggg tacggtccgg cctggaagat gcagtcgctg 1020
gacctgaagg tcaatgacca actgaacaac cgcgtggtag ggagtgacaa ccgctggatc 1080
gaggccaggg acggcgtggc atggcaaggc cgggtgaact ggctggactg gcgcaaggcc 1140
gatatctcgg cgcccctgga ctttgccggc tacacctacc cggtgcagtt gcagcaatgg 1200
ctgatcgacg tgctgaaatg gcgcagctat cagcctgaaa ccctcgatgg cgtctgccag 1260
ctgatcggcg aggagcgcgg ccagatactg gcgtatgagc tcaagagcgg cagactgacc 1320
tatctgcgcc ccaatactgc ccaggatgcc tacacctggg tctatacccc gcaaaaaagc 1380
attctggtca aattctggga ccagtccctg gaccgtacgc gctatacccg gcacagccag 1440
cttggcggtg gccagccggt ggtgtgcgcc ggagaaatgc gcatcgaccg caagaccacc 1500
agcaatgcgg tgagcgacat ccttggtctg gtcaatgatg cctccggaca ctacaagccc 1560
gatggcgggc agtgcctggg gcatgtcctg gaacggctcg aacaactggg gctggacacc 1620
acgcacaccg tggtttcgta caaggga 1647
<210> 16
<211> 549
<212> PRT
<213> 蒙氏假单胞菌
<400> 16
Met Ser Ser Phe Asn Ile Thr Trp Met Thr Arg Ala Gln Leu Pro Ala
1 5 10 15
Phe Pro Pro Gln Met Ser Phe Ser Ala Ala Asn Pro Ala Ser Thr Lys
20 25 30
Pro Asp Asp Gln Ala Arg Thr Pro Val Ile Arg Trp Gly Arg Ser Leu
35 40 45
Ala Cys Val Leu Glu Ser Arg His His His Asp Gln Ala Trp Val Val
50 55 60
Val Tyr Gly Asp Gly Lys Gln Leu Thr Gly Val His Pro Leu His Asp
65 70 75 80
Phe Arg His Ile Ser Arg Ile Gln Leu Ala Ala Asn Ser His Ala Val
85 90 95
Leu Leu Thr Asp Ser Ala Gln Arg Gln Gln Thr Val Glu Phe Ile Gln
100 105 110
Leu Lys Ala Leu Asp Gly Ser Gly Gly Ala Gly Asp Pro Val Asn Gly
115 120 125
Leu Pro Ser Gly Ile Pro Phe Met Leu Thr Asn Gly Arg Asp Tyr Leu
130 135 140
Met Ala Asp Glu Glu Gly Val Cys Leu Ala Val Asn Pro Asp Pro Lys
145 150 155 160
Ala Met Gln Trp Leu Tyr Arg Asp Gly Gln Leu Val Asn Val Thr Thr
165 170 175
Gly Gln Ala Leu Gly Leu Gly Ile Cys Gly Lys Ala Ser Ala Ala Ser
180 185 190
Gly Asp Arg Trp Arg Leu Ser Ser Lys Gly Glu Leu Leu Tyr Gly Asp
195 200 205
Gly Thr Arg Thr Leu Cys Ser Ala Pro Ile Ser Gly Glu Val Trp Leu
210 215 220
Gln Arg Arg Ser Glu Val Leu Pro Ser Asp Ala Trp Arg Val Gln Leu
225 230 235 240
Pro Gln Leu Pro Arg Arg Gly Gln Ala Pro Ser Met Val Val Asp Lys
245 250 255
Leu Ser Val Cys Leu Ala Val Ser Ala Asp Tyr Ser Ala Gly Thr Gly
260 265 270
Asp Thr Leu Ser Phe Ser Ile Asn Gly Ser Glu His Arg Gln Pro Leu
275 280 285
Ala Gly Asn Phe Glu Arg Gly Ala His Phe Lys Val Glu Val Asp Leu
290 295 300
Ala Lys Met Phe Gln Arg Ser Val Ile Tyr Ala Asp Glu Leu Arg Ser
305 310 315 320
Val Glu Ile Tyr Gln Ala Ser Ala Gly Gly Tyr Gly Pro Ala Trp Lys
325 330 335
Met Gln Ser Leu Asp Leu Lys Val Asn Asp Gln Leu Asn Asn Arg Val
340 345 350
Val Gly Ser Asp Asn Arg Trp Ile Glu Ala Arg Asp Gly Val Ala Trp
355 360 365
Gln Gly Arg Val Asn Trp Leu Asp Trp Arg Lys Ala Asp Ile Ser Ala
370 375 380
Pro Leu Asp Phe Ala Gly Tyr Thr Tyr Pro Val Gln Leu Gln Gln Trp
385 390 395 400
Leu Ile Asp Val Leu Lys Trp Arg Ser Tyr Gln Pro Glu Thr Leu Asp
405 410 415
Gly Val Cys Gln Leu Ile Gly Glu Glu Arg Gly Gln Ile Leu Ala Tyr
420 425 430
Glu Leu Lys Ser Gly Arg Leu Thr Tyr Leu Arg Pro Asn Thr Ala Gln
435 440 445
Asp Ala Tyr Thr Trp Val Tyr Thr Pro Gln Lys Ser Ile Leu Val Lys
450 455 460
Phe Trp Asp Gln Ser Leu Asp Arg Thr Arg Tyr Thr Arg His Ser Gln
465 470 475 480
Leu Gly Gly Gly Gln Pro Val Val Cys Ala Gly Glu Met Arg Ile Asp
485 490 495
Arg Lys Thr Thr Ser Asn Ala Val Ser Asp Ile Leu Gly Leu Val Asn
500 505 510
Asp Ala Ser Gly His Tyr Lys Pro Asp Gly Gly Gln Cys Leu Gly His
515 520 525
Val Leu Glu Arg Leu Glu Gln Leu Gly Leu Asp Thr Thr His Thr Val
530 535 540
Val Ser Tyr Lys Gly
545
<210> 17
<211> 1674
<212> DNA
<213> 假单胞菌属物种
<400> 17
atgtatggct tccatgttaa atggctgacg cgtcgtcagc tgcctccaat tccggcaacc 60
atgctgtttt ccggcaccca ccacgacgct cctggtcctg acggcgattt tgaacaggcg 120
gtgaccccag tgattacctg gggtaataac agcctgggtt gtgtcttcga cgataatgaa 180
catcacgatg cggcgtggct ggtagtctat ggtgacggcg aacagctgac cggcgcccac 240
ccgctgccgc acttccgtca cgtgatggac atccaggcgg ctccgtccgg cgtagcctgg 300
gtgctggttg atgaaaaagc gcgcaaagtt gagatctccc acctgctgct ggacggcctg 360
gacggtcgtg tcggtcgcga aacttctctg gaaggtatgc cggtaggcat tccgttttgt 420
ctgcgtaacg gtcgtgactt cctgatggct gatgaatctg gcgtacgcgt ggccgctctg 480
ccagacccgc tggcaatgca gtggatgtat caggacggcg aactgaccca cgttgctacg 540
caacaggtgc tgggcctggg cgttcgttgt aaaccggctg cgcaggatgg cgaccgttgg 600
catctgtctg cgcgtggtgt actgttctat ggcgaagaaa aacgcgctct gtgtgcagac 660
cctggtaacg gtgacgtctg gctgcaggct cacgtcgccg agagcccgga aggcctgtgg 720
caggtgcaaa tgccaggtca gacgcgtcgt aaccgtggca gcgctctgcg catttccacc 780
ctggctatcc acgtgcaggt atccaacgat ctgcgcagcg gcacctctga cgcagtgtac 840
ttctccgtaa acggttctgc gcaccgtcag ctgctggctc gtaacttcga tcgtggtagc 900
ctgctgcagg tggacgtgga cctgtcttcc atgttcgctg gccgtcagct ggtggccgat 960
gagctgcatt ccgtcgaact gtaccaggta tccggcgaag gttatggccc tgcttggcgc 1020
atgcagagcc tggatctggt agttaatgac gagctgtcta accgcctgct ggttgcagaa 1080
tctccgtggc tgctgccggc ccgtggcgcc tcttggaaag gcgtggtaaa ctggctggac 1140
tggcgtctga aaggtaagga aactccgctg gacttcactg gccgtacgta cccggttact 1200
tggcgcccgc tgctgtctga ttggctgtat tggcgtagct acgacgtgag caacatcgag 1260
ggtgtctgcc agctgattgg tgagcaggac ggtcgcgtgc tgggcttcga actggtgggt 1320
cagcgtcctg tttatctgga accaaatacg gctaacgact cttatacttg ggtctacacc 1380
cctcagggct ccattatcgt taaacgctgg gacaaagctg cgccgcgtgc gcactacatc 1440
actcactctc agctgggtat gggtgcgccg gtcgtatgcg cgggcgaaat gacgatcgtg 1500
cgtatgggcg cgggcgttgc ggtgcatgat atcctgggta tgatcaacga tgccagcggt 1560
cactacgtgc ctgatggcgg tgcctgcctg gcacatgttc gtgaacgtct ggctcagctg 1620
ggtctggata ccacccgtac caccgtagct ttccactccg gcaaacaagc agaa 1674
<210> 18
<211> 558
<212> PRT
<213> 假单胞菌属物种
<400> 18
Met Tyr Gly Phe His Val Lys Trp Leu Thr Arg Arg Gln Leu Pro Pro
1 5 10 15
Ile Pro Ala Thr Met Leu Phe Ser Gly Thr His His Asp Ala Pro Gly
20 25 30
Pro Asp Gly Asp Phe Glu Gln Ala Val Thr Pro Val Ile Thr Trp Gly
35 40 45
Asn Asn Ser Leu Gly Cys Val Phe Asp Asp Asn Glu His His Asp Ala
50 55 60
Ala Trp Leu Val Val Tyr Gly Asp Gly Glu Gln Leu Thr Gly Ala His
65 70 75 80
Pro Leu Pro His Phe Arg His Val Met Asp Ile Gln Ala Ala Pro Ser
85 90 95
Gly Val Ala Trp Val Leu Val Asp Glu Lys Ala Arg Lys Val Glu Ile
100 105 110
Ser His Leu Leu Leu Asp Gly Leu Asp Gly Arg Val Gly Arg Glu Thr
115 120 125
Ser Leu Glu Gly Met Pro Val Gly Ile Pro Phe Cys Leu Arg Asn Gly
130 135 140
Arg Asp Phe Leu Met Ala Asp Glu Ser Gly Val Arg Val Ala Ala Leu
145 150 155 160
Pro Asp Pro Leu Ala Met Gln Trp Met Tyr Gln Asp Gly Glu Leu Thr
165 170 175
His Val Ala Thr Gln Gln Val Leu Gly Leu Gly Val Arg Cys Lys Pro
180 185 190
Ala Ala Gln Asp Gly Asp Arg Trp His Leu Ser Ala Arg Gly Val Leu
195 200 205
Phe Tyr Gly Glu Glu Lys Arg Ala Leu Cys Ala Asp Pro Gly Asn Gly
210 215 220
Asp Val Trp Leu Gln Ala His Val Ala Glu Ser Pro Glu Gly Leu Trp
225 230 235 240
Gln Val Gln Met Pro Gly Gln Thr Arg Arg Asn Arg Gly Ser Ala Leu
245 250 255
Arg Ile Ser Thr Leu Ala Ile His Val Gln Val Ser Asn Asp Leu Arg
260 265 270
Ser Gly Thr Ser Asp Ala Val Tyr Phe Ser Val Asn Gly Ser Ala His
275 280 285
Arg Gln Leu Leu Ala Arg Asn Phe Asp Arg Gly Ser Leu Leu Gln Val
290 295 300
Asp Val Asp Leu Ser Ser Met Phe Ala Gly Arg Gln Leu Val Ala Asp
305 310 315 320
Glu Leu His Ser Val Glu Leu Tyr Gln Val Ser Gly Glu Gly Tyr Gly
325 330 335
Pro Ala Trp Arg Met Gln Ser Leu Asp Leu Val Val Asn Asp Glu Leu
340 345 350
Ser Asn Arg Leu Leu Val Ala Glu Ser Pro Trp Leu Leu Pro Ala Arg
355 360 365
Gly Ala Ser Trp Lys Gly Val Val Asn Trp Leu Asp Trp Arg Leu Lys
370 375 380
Gly Lys Glu Thr Pro Leu Asp Phe Thr Gly Arg Thr Tyr Pro Val Thr
385 390 395 400
Trp Arg Pro Leu Leu Ser Asp Trp Leu Tyr Trp Arg Ser Tyr Asp Val
405 410 415
Ser Asn Ile Glu Gly Val Cys Gln Leu Ile Gly Glu Gln Asp Gly Arg
420 425 430
Val Leu Gly Phe Glu Leu Val Gly Gln Arg Pro Val Tyr Leu Glu Pro
435 440 445
Asn Thr Ala Asn Asp Ser Tyr Thr Trp Val Tyr Thr Pro Gln Gly Ser
450 455 460
Ile Ile Val Lys Arg Trp Asp Lys Ala Ala Pro Arg Ala His Tyr Ile
465 470 475 480
Thr His Ser Gln Leu Gly Met Gly Ala Pro Val Val Cys Ala Gly Glu
485 490 495
Met Thr Ile Val Arg Met Gly Ala Gly Val Ala Val His Asp Ile Leu
500 505 510
Gly Met Ile Asn Asp Ala Ser Gly His Tyr Val Pro Asp Gly Gly Ala
515 520 525
Cys Leu Ala His Val Arg Glu Arg Leu Ala Gln Leu Gly Leu Asp Thr
530 535 540
Thr Arg Thr Thr Val Ala Phe His Ser Gly Lys Gln Ala Glu
545 550 555
<210> 19
<211> 984
<212> DNA
<213> 假单胞菌属物种
<400> 19
atgtaccacc agggcccagc aacgcggccg cagaatcggt gccttcttaa tcagagacag 60
aacgcaccct caatcatgac cgacaccatt gtagacaccc tgactgtgac agcctcgatc 120
accaacgaaa attgggccgg caccgacgac accctgtatg tgtccatggg ccctctcagt 180
cagatgcaat tattttgtga ggccccgcga gtcgggcaga ccatcacggt ggaaatcgac 240
ctgccaagac tgttcggccg cccccggatc tcattgtccg aaatcgacgg cctgaccttc 300
taccagatgc ccgaagccca cccaatcgct acagatgact gggagctgga ctccgtactg 360
atcaaggcca atgacatcta caccaacctg tccttcaagc aggtgcaccg ttggctcagg 420
aactcatcct cgcacttgct cgccgtatgg tcgggccatg tgcatttttc cgactggatg 480
aattccgaca agcgttcgat tgacctcaac gcccagacct acccgatcag gtggatgccc 540
tttatcggtg atctcatgca ctggcgttgc tatgacccgt cgaaaatcga cggcgtcggt 600
caactggtgg ggatgtggga cggccagttg atcggcaatc aactgaaatc gcaaaccagc 660
gaaatactct ctcccaacga ccagtccaac agctatacct gggtgtatac cccggaaaac 720
tccatcatct ataaacgctg ggaacatgct gaccgggcca actacatcag gcacagccaa 780
ctcggcagcg gcaggccagt catgtgcgct ggtgaattca ggatcaggga gcatcgcatg 840
gagcacgtca ttgccatggt caacgatgct tcggggcatt accgtcccga cggcggggcc 900
tgcctgcgct acgtggcgga gaaactcgag gccttgggca tcaatacgga atacatcgag 960
tggcagtgga gatacacctc cgac 984
<210> 20
<211> 328
<212> PRT
<213> 假单胞菌属物种
<400> 20
Met Tyr His Gln Gly Pro Ala Thr Arg Pro Gln Asn Arg Cys Leu Leu
1 5 10 15
Asn Gln Arg Gln Asn Ala Pro Ser Ile Met Thr Asp Thr Ile Val Asp
20 25 30
Thr Leu Thr Val Thr Ala Ser Ile Thr Asn Glu Asn Trp Ala Gly Thr
35 40 45
Asp Asp Thr Leu Tyr Val Ser Met Gly Pro Leu Ser Gln Met Gln Leu
50 55 60
Phe Cys Glu Ala Pro Arg Val Gly Gln Thr Ile Thr Val Glu Ile Asp
65 70 75 80
Leu Pro Arg Leu Phe Gly Arg Pro Arg Ile Ser Leu Ser Glu Ile Asp
85 90 95
Gly Leu Thr Phe Tyr Gln Met Pro Glu Ala His Pro Ile Ala Thr Asp
100 105 110
Asp Trp Glu Leu Asp Ser Val Leu Ile Lys Ala Asn Asp Ile Tyr Thr
115 120 125
Asn Leu Ser Phe Lys Gln Val His Arg Trp Leu Arg Asn Ser Ser Ser
130 135 140
His Leu Leu Ala Val Trp Ser Gly His Val His Phe Ser Asp Trp Met
145 150 155 160
Asn Ser Asp Lys Arg Ser Ile Asp Leu Asn Ala Gln Thr Tyr Pro Ile
165 170 175
Arg Trp Met Pro Phe Ile Gly Asp Leu Met His Trp Arg Cys Tyr Asp
180 185 190
Pro Ser Lys Ile Asp Gly Val Gly Gln Leu Val Gly Met Trp Asp Gly
195 200 205
Gln Leu Ile Gly Asn Gln Leu Lys Ser Gln Thr Ser Glu Ile Leu Ser
210 215 220
Pro Asn Asp Gln Ser Asn Ser Tyr Thr Trp Val Tyr Thr Pro Glu Asn
225 230 235 240
Ser Ile Ile Tyr Lys Arg Trp Glu His Ala Asp Arg Ala Asn Tyr Ile
245 250 255
Arg His Ser Gln Leu Gly Ser Gly Arg Pro Val Met Cys Ala Gly Glu
260 265 270
Phe Arg Ile Arg Glu His Arg Met Glu His Val Ile Ala Met Val Asn
275 280 285
Asp Ala Ser Gly His Tyr Arg Pro Asp Gly Gly Ala Cys Leu Arg Tyr
290 295 300
Val Ala Glu Lys Leu Glu Ala Leu Gly Ile Asn Thr Glu Tyr Ile Glu
305 310 315 320
Trp Gln Trp Arg Tyr Thr Ser Asp
325
<210> 21
<211> 987
<212> DNA
<213> 地中海假单胞菌
<400> 21
atgtaccacc agggcccggc aacgcggccg cagaatcggt gccttcttaa tcagagacag 60
aacgcaccct caatcatgac cgacaccatt gtagacaccc tgactgtgac agcctcgatc 120
accaacgaac attgggccgg caccgacgac accctgtatg tgtccatggg ccctctcagt 180
cagatgcaat tattctgtga agccccgcga gtcgggcaga ccatcacggt ggaaatcgat 240
attccaagac tgttcggccg cccgcggatc tcattgtccg aaatcgacgg cctgaccttc 300
taccagaggc ccgaagccca cccgatcgcc accgatgact gggagctgga ctccgtactg 360
atcaaggcca atgacatcta caccaatctg tccttcaaac aggttcatcg ttggctcagg 420
aactcttcct cgcacttgct cgccgtatgg tcgggccatg tgcatttttc cgattggatg 480
aattcggaca agcgatcgat cgatctcaac gcccagacct acccgatccg gtggatgccc 540
ttcatcggcg atctcatgca ctggcgttgc tatgacccat cgaaaatcga cggcgtcggt 600
caactggtgg ggatgtggga tggccagttg atcggtaacc aactgaaatc gcaaaccagc 660
gaaatactct cccccaacga tcagtccaac agctacacct gggtgtatac cccggaaaac 720
tccatcatct ataaacgctg ggaacatgct gaccgggcca actacatccg gcacagccaa 780
ctcggcagcg gcaggccggt catgtgcgcc ggggaattca ggatcaggga acatcgcatg 840
gagcacgtca ttgccatggt caacgatgcg tcgggacatt accgccccga tggcggagcc 900
tgcctgcgct acgtggcgga aaagttcgag gccctgggca tcaatacgga atacatcgac 960
tggcagtgga gagacacctc cgacgga 987
<210> 22
<211> 329
<212> PRT
<213> 地中海假单胞菌
<400> 22
Met Tyr His Gln Gly Pro Ala Thr Arg Pro Gln Asn Arg Cys Leu Leu
1 5 10 15
Asn Gln Arg Gln Asn Ala Pro Ser Ile Met Thr Asp Thr Ile Val Asp
20 25 30
Thr Leu Thr Val Thr Ala Ser Ile Thr Asn Glu His Trp Ala Gly Thr
35 40 45
Asp Asp Thr Leu Tyr Val Ser Met Gly Pro Leu Ser Gln Met Gln Leu
50 55 60
Phe Cys Glu Ala Pro Arg Val Gly Gln Thr Ile Thr Val Glu Ile Asp
65 70 75 80
Ile Pro Arg Leu Phe Gly Arg Pro Arg Ile Ser Leu Ser Glu Ile Asp
85 90 95
Gly Leu Thr Phe Tyr Gln Arg Pro Glu Ala His Pro Ile Ala Thr Asp
100 105 110
Asp Trp Glu Leu Asp Ser Val Leu Ile Lys Ala Asn Asp Ile Tyr Thr
115 120 125
Asn Leu Ser Phe Lys Gln Val His Arg Trp Leu Arg Asn Ser Ser Ser
130 135 140
His Leu Leu Ala Val Trp Ser Gly His Val His Phe Ser Asp Trp Met
145 150 155 160
Asn Ser Asp Lys Arg Ser Ile Asp Leu Asn Ala Gln Thr Tyr Pro Ile
165 170 175
Arg Trp Met Pro Phe Ile Gly Asp Leu Met His Trp Arg Cys Tyr Asp
180 185 190
Pro Ser Lys Ile Asp Gly Val Gly Gln Leu Val Gly Met Trp Asp Gly
195 200 205
Gln Leu Ile Gly Asn Gln Leu Lys Ser Gln Thr Ser Glu Ile Leu Ser
210 215 220
Pro Asn Asp Gln Ser Asn Ser Tyr Thr Trp Val Tyr Thr Pro Glu Asn
225 230 235 240
Ser Ile Ile Tyr Lys Arg Trp Glu His Ala Asp Arg Ala Asn Tyr Ile
245 250 255
Arg His Ser Gln Leu Gly Ser Gly Arg Pro Val Met Cys Ala Gly Glu
260 265 270
Phe Arg Ile Arg Glu His Arg Met Glu His Val Ile Ala Met Val Asn
275 280 285
Asp Ala Ser Gly His Tyr Arg Pro Asp Gly Gly Ala Cys Leu Arg Tyr
290 295 300
Val Ala Glu Lys Phe Glu Ala Leu Gly Ile Asn Thr Glu Tyr Ile Asp
305 310 315 320
Trp Gln Trp Arg Asp Thr Ser Asp Gly
325
<210> 23
<211> 2106
<212> DNA
<213> 伞菌假单胞菌
<400> 23
atgtcgctca atatttacct ggcacagata cgccatgtcc cacgctcccg cgccccgtcg 60
ttcgccgatc acctggaacc catctgggca gaggccggcc aggtgccgag catggagtcc 120
aatggccccc tcatcgtcat cagccagggc tgtatcgact actggccact caacaatctc 180
gagaatcccg gcgagctgca cctgctggcc tacggtccga cccgcgaact gctgggccag 240
aagctgctga aactgggcga ccagaagctg gtttccctgc acatcgagaa tgccgaatgg 300
ctggtcttcc tggatggaca ccacggccgc cacacccggg gccgctccat cctgcaggaa 360
accgcggaag atacccatca gtacttctgg atcatcaata cccgcagtga tgccgccctg 420
acctgggacg acgccagctc gacggtgacc ctcgaacccc tcgccgccag cagccagcag 480
atctgggtcg tcgacaacat cggcgccatc tttaccggcc ggggcaatcg acgcctgtcg 540
gctgtgccgg accctgccgg gacgccgtcg ctgcgcctgg tggaaagtga cgaagcgggc 600
catgaccagt ggaacatcga ccgtcagggc agcatccgct cgttcagcaa tgacctggcc 660
tggacgcaga ccgacgaacg gaccgtggaa ctcgccgagt actccgcgtc cccggcagaa 720
cgccagcaat ggtttttcaa gccctacatc gtttcgcctt tcacccacga caatcagctg 780
gcgcagttgc tgcccgagca gcccttctac ctcggcagcg acaagcacga gggctccagg 840
ctgttcttca acgcctcgcg cctgcaactg gtatcgctgg aggaccccgg cgagctggag 900
ggcgcctggc gctacgaaca ggaaaaactc atcgatctgg ccagcgggct ggccctgacc 960
gccaaggccg acaacatcca cctcgccgcg gccgatccgg cggatgccca ccagaactgg 1020
tacatgagca gcgatggtta cctgatccag cccctgtcag gaaaggtgct cgagttcgca 1080
gacgggcgga tagggctggt ggaatatgac ccgctgcgtg ccgaacgcct gtgctggcgg 1140
atccacccta tccgccagcg ccgcgccacc gacgtggtct ttcaacccaa gccattgggc 1200
tacatcagca aactgtcggt caccgtcact gtcgccaacg tcttctgggg cggcacttcg 1260
gacaagatca tgatgaccct gacctccctc gacaaagccg tgcgcctgtt cgacgccccc 1320
tgcgcgggcg actcggtcac cgtcgatatc gatatccagg cgatgttcgg caagcccagg 1380
atcccgatgc gcgatgtgca tacgatcctg ttctaccagg agtcgagagc cgaatcgggg 1440
ggcaacgacc agtggaagct ggaatccatc ctgctgaaag ccaacgaccg ctacctgaac 1500
gactcgctgc gcagcatcaa tcgctgggtt tcgccgccct accgttccgc ccatatttcc 1560
tggggcagta cgatttcctg gtgcaactgg cgggatatcc gctacaaccg gcacatagac 1620
ttcaacggcc agacctaccc ggtgacgctg atgccctata tcggcgacct gaaagcctgg 1680
cgcaactacg acccgtccag catcgacggc gtcgggcaac tgattggcat gaacaatggc 1740
cggttgatcg gcgagatcct gaaaacccgc gactgcgaag cgctcaggcc caatgacgac 1800
aacaacagct acacctgggt attcaccccg gaggggtcga tcatctaccg gttctggaac 1860
cacgacgaca gctcgggcta tgtccgccac agccagttgg gaaatggccg gccggtgatc 1920
tgcgcgggtg agttcagggt cgagagacga gcggatatcg atggggtggt ggatgtcatc 1980
gccatggtga acgacgcctc gggccactac aaacccgatg gcggcgcctg cctgggctcg 2040
gtcgaggaga agttcaaggc attgggcatc cccaccgaac acataaaatg gtcctacaag 2100
gagaag 2106
<210> 24
<211> 702
<212> PRT
<213> 伞菌假单胞菌
<400> 24
Met Ser Leu Asn Ile Tyr Leu Ala Gln Ile Arg His Val Pro Arg Ser
1 5 10 15
Arg Ala Pro Ser Phe Ala Asp His Leu Glu Pro Ile Trp Ala Glu Ala
20 25 30
Gly Gln Val Pro Ser Met Glu Ser Asn Gly Pro Leu Ile Val Ile Ser
35 40 45
Gln Gly Cys Ile Asp Tyr Trp Pro Leu Asn Asn Leu Glu Asn Pro Gly
50 55 60
Glu Leu His Leu Leu Ala Tyr Gly Pro Thr Arg Glu Leu Leu Gly Gln
65 70 75 80
Lys Leu Leu Lys Leu Gly Asp Gln Lys Leu Val Ser Leu His Ile Glu
85 90 95
Asn Ala Glu Trp Leu Val Phe Leu Asp Gly His His Gly Arg His Thr
100 105 110
Arg Gly Arg Ser Ile Leu Gln Glu Thr Ala Glu Asp Thr His Gln Tyr
115 120 125
Phe Trp Ile Ile Asn Thr Arg Ser Asp Ala Ala Leu Thr Trp Asp Asp
130 135 140
Ala Ser Ser Thr Val Thr Leu Glu Pro Leu Ala Ala Ser Ser Gln Gln
145 150 155 160
Ile Trp Val Val Asp Asn Ile Gly Ala Ile Phe Thr Gly Arg Gly Asn
165 170 175
Arg Arg Leu Ser Ala Val Pro Asp Pro Ala Gly Thr Pro Ser Leu Arg
180 185 190
Leu Val Glu Ser Asp Glu Ala Gly His Asp Gln Trp Asn Ile Asp Arg
195 200 205
Gln Gly Ser Ile Arg Ser Phe Ser Asn Asp Leu Ala Trp Thr Gln Thr
210 215 220
Asp Glu Arg Thr Val Glu Leu Ala Glu Tyr Ser Ala Ser Pro Ala Glu
225 230 235 240
Arg Gln Gln Trp Phe Phe Lys Pro Tyr Ile Val Ser Pro Phe Thr His
245 250 255
Asp Asn Gln Leu Ala Gln Leu Leu Pro Glu Gln Pro Phe Tyr Leu Gly
260 265 270
Ser Asp Lys His Glu Gly Ser Arg Leu Phe Phe Asn Ala Ser Arg Leu
275 280 285
Gln Leu Val Ser Leu Glu Asp Pro Gly Glu Leu Glu Gly Ala Trp Arg
290 295 300
Tyr Glu Gln Glu Lys Leu Ile Asp Leu Ala Ser Gly Leu Ala Leu Thr
305 310 315 320
Ala Lys Ala Asp Asn Ile His Leu Ala Ala Ala Asp Pro Ala Asp Ala
325 330 335
His Gln Asn Trp Tyr Met Ser Ser Asp Gly Tyr Leu Ile Gln Pro Leu
340 345 350
Ser Gly Lys Val Leu Glu Phe Ala Asp Gly Arg Ile Gly Leu Val Glu
355 360 365
Tyr Asp Pro Leu Arg Ala Glu Arg Leu Cys Trp Arg Ile His Pro Ile
370 375 380
Arg Gln Arg Arg Ala Thr Asp Val Val Phe Gln Pro Lys Pro Leu Gly
385 390 395 400
Tyr Ile Ser Lys Leu Ser Val Thr Val Thr Val Ala Asn Val Phe Trp
405 410 415
Gly Gly Thr Ser Asp Lys Ile Met Met Thr Leu Thr Ser Leu Asp Lys
420 425 430
Ala Val Arg Leu Phe Asp Ala Pro Cys Ala Gly Asp Ser Val Thr Val
435 440 445
Asp Ile Asp Ile Gln Ala Met Phe Gly Lys Pro Arg Ile Pro Met Arg
450 455 460
Asp Val His Thr Ile Leu Phe Tyr Gln Glu Ser Arg Ala Glu Ser Gly
465 470 475 480
Gly Asn Asp Gln Trp Lys Leu Glu Ser Ile Leu Leu Lys Ala Asn Asp
485 490 495
Arg Tyr Leu Asn Asp Ser Leu Arg Ser Ile Asn Arg Trp Val Ser Pro
500 505 510
Pro Tyr Arg Ser Ala His Ile Ser Trp Gly Ser Thr Ile Ser Trp Cys
515 520 525
Asn Trp Arg Asp Ile Arg Tyr Asn Arg His Ile Asp Phe Asn Gly Gln
530 535 540
Thr Tyr Pro Val Thr Leu Met Pro Tyr Ile Gly Asp Leu Lys Ala Trp
545 550 555 560
Arg Asn Tyr Asp Pro Ser Ser Ile Asp Gly Val Gly Gln Leu Ile Gly
565 570 575
Met Asn Asn Gly Arg Leu Ile Gly Glu Ile Leu Lys Thr Arg Asp Cys
580 585 590
Glu Ala Leu Arg Pro Asn Asp Asp Asn Asn Ser Tyr Thr Trp Val Phe
595 600 605
Thr Pro Glu Gly Ser Ile Ile Tyr Arg Phe Trp Asn His Asp Asp Ser
610 615 620
Ser Gly Tyr Val Arg His Ser Gln Leu Gly Asn Gly Arg Pro Val Ile
625 630 635 640
Cys Ala Gly Glu Phe Arg Val Glu Arg Arg Ala Asp Ile Asp Gly Val
645 650 655
Val Asp Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Lys Pro
660 665 670
Asp Gly Gly Ala Cys Leu Gly Ser Val Glu Glu Lys Phe Lys Ala Leu
675 680 685
Gly Ile Pro Thr Glu His Ile Lys Trp Ser Tyr Lys Glu Lys
690 695 700
<210> 25
<211> 2106
<212> DNA
<213> 伞菌假单胞菌
<400> 25
atgtcgctca atatttacct ggcgcagata cgccatatcc cacgctcccg cgccccgtcg 60
ttcgccgatc acctggaacc catctgggca gaggccggcc aggtgccgag catggagtcc 120
aatggtgccc tcatcgtcat cagccagggc tgtatcgact actggccact caacaatctc 180
gagaatcccg gcgagctgca tctgctggcc tacggtccga cgcgcgagct gctgggccag 240
aagctgctga aactgggcga ccagaagctg gtttccctgc acatcgagaa taccgagtgg 300
ttggtcttcc tggatggaca acacggccgc cacacccggg gccgctcgat cctgaaggaa 360
accgcggaag atacccacca gtacttctgg atcatcaata cccgcagcga tgccgccctg 420
gcctgggacg acgccagccc gacggtgacc ctggaacccc tcgccgccag cagccagcag 480
atctgggtcg tcgacaatat cggcgccatc tttaccggcc ggggcaatcg acgcctgtcg 540
gcggtgccgg acccggccgg gattccgtcg ctgcgcctgg tggaaagcga cgaagcgggc 600
catgaccagt ggaacatcga ccgccagggc agcatccgct cgttcagcaa tgacctggcc 660
tggacgcaga ccggcgaacg gaccgtggaa ctggccgagt actccgcgtc cccggcagaa 720
cgccaggaat ggtttttcaa gccctacatc gtttcgcctt tcacccacga caatcagctg 780
gcgcagttgc tgcccgagca gcccttctac ctcggcagcg acaagcacga gggctccagg 840
ctgttactca acgcctcgcg tctgcaactg gtatcgctgg aggatccccg ggagctggaa 900
ggcgcctggc gatacgaaca ggaaaaactg atcgatctcg ccagcgggct ggccctgacc 960
gccagagccg gcaacatcca cctcgccgct cccgatccgg cggatgccca tcagaactgg 1020
tacatgagca ccgacggtta cctgatccag cccctgtcag gaaaggtgct tgagttcgaa 1080
aacgggcgga tcgggctggt ggaatatgac acgctgcgtg ccgaacgcct gtactggcgg 1140
atccacccta tccgccagcg ccgcgccacc gacgtggtct ttcaacccaa gccattgggc 1200
tacatcagca agctgtcggt caccgtcact gtcgccaacg tcttctgggg cggcacttcg 1260
gacaagatca tgatgaccct gacctccctc gacaaagccg tgcgtctgtt cgacgcgccc 1320
tgcgcgggcg actcggtcac cgtcgatatc gatatccagg cgatgttcgg caagcccagg 1380
atcccgatgc gcgatgtgca tacgatcctg ttctaccagg agtcgagagc cgaatcgggg 1440
ggcaacgacc agtggaagct ggaatcgatc ctgctgaaag ccaacgaccg ctacctgaac 1500
gactcgctgc gcagcatcaa tcgctgggtt tcgccgccct accgttccgc ccatatttcc 1560
tggggcagta cgatttcctg gtgcaactgg cgggatatcc gctacaaccg gcacatagac 1620
ttcaacggcc agacctaccc ggtgacgctg atgccctata tcggcgacct gaaagcctgg 1680
cgcaactacg atccgtccag catcgacggc gtcgggcaat tgatcggcat gaacaatggc 1740
cggctgatcg gcgagatcct gaaaacccgc gactgcgaag ccctcaggcc caatgacgac 1800
aacaacagct acacctgggt attcaccccg gaggggtcga tcatctaccg gctctggaac 1860
cacgacgaca gtgccggcta tgtccgccac agccagttgg ggaacggcag gccggtgatc 1920
tgcgcgggcg aattcagggt cgagagacga gcggatatcg atggtgtggt ggatgtcatc 1980
gccatggtga acgacgcctc gggccattac aaacccgatg ggggcgcctg cctgggctcg 2040
gtcgaggaga agctcaaggc attgggcatc cccaccgaca gcataaagtg gtcctacaag 2100
gaaaag 2106
<210> 26
<211> 702
<212> PRT
<213> 伞菌假单胞菌
<400> 26
Met Ser Leu Asn Ile Tyr Leu Ala Gln Ile Arg His Ile Pro Arg Ser
1 5 10 15
Arg Ala Pro Ser Phe Ala Asp His Leu Glu Pro Ile Trp Ala Glu Ala
20 25 30
Gly Gln Val Pro Ser Met Glu Ser Asn Gly Ala Leu Ile Val Ile Ser
35 40 45
Gln Gly Cys Ile Asp Tyr Trp Pro Leu Asn Asn Leu Glu Asn Pro Gly
50 55 60
Glu Leu His Leu Leu Ala Tyr Gly Pro Thr Arg Glu Leu Leu Gly Gln
65 70 75 80
Lys Leu Leu Lys Leu Gly Asp Gln Lys Leu Val Ser Leu His Ile Glu
85 90 95
Asn Thr Glu Trp Leu Val Phe Leu Asp Gly Gln His Gly Arg His Thr
100 105 110
Arg Gly Arg Ser Ile Leu Lys Glu Thr Ala Glu Asp Thr His Gln Tyr
115 120 125
Phe Trp Ile Ile Asn Thr Arg Ser Asp Ala Ala Leu Ala Trp Asp Asp
130 135 140
Ala Ser Pro Thr Val Thr Leu Glu Pro Leu Ala Ala Ser Ser Gln Gln
145 150 155 160
Ile Trp Val Val Asp Asn Ile Gly Ala Ile Phe Thr Gly Arg Gly Asn
165 170 175
Arg Arg Leu Ser Ala Val Pro Asp Pro Ala Gly Ile Pro Ser Leu Arg
180 185 190
Leu Val Glu Ser Asp Glu Ala Gly His Asp Gln Trp Asn Ile Asp Arg
195 200 205
Gln Gly Ser Ile Arg Ser Phe Ser Asn Asp Leu Ala Trp Thr Gln Thr
210 215 220
Gly Glu Arg Thr Val Glu Leu Ala Glu Tyr Ser Ala Ser Pro Ala Glu
225 230 235 240
Arg Gln Glu Trp Phe Phe Lys Pro Tyr Ile Val Ser Pro Phe Thr His
245 250 255
Asp Asn Gln Leu Ala Gln Leu Leu Pro Glu Gln Pro Phe Tyr Leu Gly
260 265 270
Ser Asp Lys His Glu Gly Ser Arg Leu Leu Leu Asn Ala Ser Arg Leu
275 280 285
Gln Leu Val Ser Leu Glu Asp Pro Arg Glu Leu Glu Gly Ala Trp Arg
290 295 300
Tyr Glu Gln Glu Lys Leu Ile Asp Leu Ala Ser Gly Leu Ala Leu Thr
305 310 315 320
Ala Arg Ala Gly Asn Ile His Leu Ala Ala Pro Asp Pro Ala Asp Ala
325 330 335
His Gln Asn Trp Tyr Met Ser Thr Asp Gly Tyr Leu Ile Gln Pro Leu
340 345 350
Ser Gly Lys Val Leu Glu Phe Glu Asn Gly Arg Ile Gly Leu Val Glu
355 360 365
Tyr Asp Thr Leu Arg Ala Glu Arg Leu Tyr Trp Arg Ile His Pro Ile
370 375 380
Arg Gln Arg Arg Ala Thr Asp Val Val Phe Gln Pro Lys Pro Leu Gly
385 390 395 400
Tyr Ile Ser Lys Leu Ser Val Thr Val Thr Val Ala Asn Val Phe Trp
405 410 415
Gly Gly Thr Ser Asp Lys Ile Met Met Thr Leu Thr Ser Leu Asp Lys
420 425 430
Ala Val Arg Leu Phe Asp Ala Pro Cys Ala Gly Asp Ser Val Thr Val
435 440 445
Asp Ile Asp Ile Gln Ala Met Phe Gly Lys Pro Arg Ile Pro Met Arg
450 455 460
Asp Val His Thr Ile Leu Phe Tyr Gln Glu Ser Arg Ala Glu Ser Gly
465 470 475 480
Gly Asn Asp Gln Trp Lys Leu Glu Ser Ile Leu Leu Lys Ala Asn Asp
485 490 495
Arg Tyr Leu Asn Asp Ser Leu Arg Ser Ile Asn Arg Trp Val Ser Pro
500 505 510
Pro Tyr Arg Ser Ala His Ile Ser Trp Gly Ser Thr Ile Ser Trp Cys
515 520 525
Asn Trp Arg Asp Ile Arg Tyr Asn Arg His Ile Asp Phe Asn Gly Gln
530 535 540
Thr Tyr Pro Val Thr Leu Met Pro Tyr Ile Gly Asp Leu Lys Ala Trp
545 550 555 560
Arg Asn Tyr Asp Pro Ser Ser Ile Asp Gly Val Gly Gln Leu Ile Gly
565 570 575
Met Asn Asn Gly Arg Leu Ile Gly Glu Ile Leu Lys Thr Arg Asp Cys
580 585 590
Glu Ala Leu Arg Pro Asn Asp Asp Asn Asn Ser Tyr Thr Trp Val Phe
595 600 605
Thr Pro Glu Gly Ser Ile Ile Tyr Arg Leu Trp Asn His Asp Asp Ser
610 615 620
Ala Gly Tyr Val Arg His Ser Gln Leu Gly Asn Gly Arg Pro Val Ile
625 630 635 640
Cys Ala Gly Glu Phe Arg Val Glu Arg Arg Ala Asp Ile Asp Gly Val
645 650 655
Val Asp Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Lys Pro
660 665 670
Asp Gly Gly Ala Cys Leu Gly Ser Val Glu Glu Lys Leu Lys Ala Leu
675 680 685
Gly Ile Pro Thr Asp Ser Ile Lys Trp Ser Tyr Lys Glu Lys
690 695 700
<210> 27
<211> 1647
<212> DNA
<213> 蒙氏假单胞菌
<400> 27
atgtccagtt tcaacatcgc ctggatgacg cgggcccaac tgccggtgtt tccgccccag 60
atgagttttt cggctgcgaa ccccgccagt tcgaaaccgg atgatcaggc caggaccccg 120
gttattcgct ggggtcgtag cttggccttc gtgctggagt cccgcaacca ccatgaccag 180
gcctgggtgg tggtctacgg tgacggcaag caattgaccg gcgtacaccc cctccatgac 240
tttcgccaca tcagccgtat ccagctggcc ggcaacagtc aggcggtgct gttgaccgac 300
agtgcgcagc gccagcaaac gcttgaattc acccagctga agactctgga tggcagtggt 360
ggtgccgggg gctccgtgaa cggcctgccc agcggcatcc cgttcatgct caccaatggc 420
catgattacc tgatggcgga cgaggagggc gtgtgcctgg ccgtgaaccc tgatcccaag 480
accatgctgt gggtctacaa gagcgggcac ttggtcaatg ccaccacagg gcaggctctg 540
gggcttggaa tctgcggcaa ggcgagcgca gcttcgggag atcgctggcg gctgtcttca 600
aagggcgagc ttgtctatgg tgacggcagt cgtacgttgt gcagtgcgcc gacttcgggt 660
gaggtctggt tgcagcgacg aagcgaggcg ctgccttccg aagcctggcg ggtacgactg 720
ccccagctcc cccgccgggg tcaggcgccg agcatggtcg tagacaaact gaacgtgtgc 780
ctcgctgtct ctgtcgacta cagtgccgga acaggcgata ccctttcgtt ctcgatcaat 840
ggcagccagt accgacagcc gttggctggc aacttcgagc gtggggcgca cttcaaggtc 900
gaggtcgacc tggccaagat gttccagcgc agcgtgatct atgccgatga gctgcgctcg 960
gtcgagatct accaggccag tgcggggggg tacggcccgg cctggaagat gcagtcgctg 1020
gacctgaagg tcaatgacca actgaacaac cgcgtggtag ggagcgacaa ccgctggatc 1080
gaggccaggg acggcgtcgc atggcaaggc cgggtgaact ggctggactg gcgcaaggcc 1140
gatatctcgg cgcccctgga ctttgccggc tacacctacc cggtgcagtt gcagcaatgg 1200
ctgatcgacg tgctgaaatg gcgcagttat cagcctgaaa ccctcgatgg cgtctgccaa 1260
ctgatcggcg aggagcgcgg tcagatactg gcgtatgagc tcaagagcgg cagattgacc 1320
tatctgcgcc ccaatactgc ccaggatgcc tacacctggg tctatacccc gcaaaaaagc 1380
attctggtca agttctggga ccagtccctg gaccgtacgc gctatacccg gcacagccag 1440
cttggcggtg gccagccggt ggtgtgcgcc ggagaaatgc gcatcgaccg caagaccacc 1500
agcaacgcgg tgagcgacat ccttggtctg gtcaatgatg cctccggaca ctacaagccc 1560
gatggcgggc agtgcctggg gcatgtcctg gaacggctcg aacaactggg gctggacacc 1620
acgcaaaccg tggtttcgta caaggga 1647
<210> 28
<211> 549
<212> PRT
<213> 蒙氏假单胞菌
<400> 28
Met Ser Ser Phe Asn Ile Ala Trp Met Thr Arg Ala Gln Leu Pro Val
1 5 10 15
Phe Pro Pro Gln Met Ser Phe Ser Ala Ala Asn Pro Ala Ser Ser Lys
20 25 30
Pro Asp Asp Gln Ala Arg Thr Pro Val Ile Arg Trp Gly Arg Ser Leu
35 40 45
Ala Phe Val Leu Glu Ser Arg Asn His His Asp Gln Ala Trp Val Val
50 55 60
Val Tyr Gly Asp Gly Lys Gln Leu Thr Gly Val His Pro Leu His Asp
65 70 75 80
Phe Arg His Ile Ser Arg Ile Gln Leu Ala Gly Asn Ser Gln Ala Val
85 90 95
Leu Leu Thr Asp Ser Ala Gln Arg Gln Gln Thr Leu Glu Phe Thr Gln
100 105 110
Leu Lys Thr Leu Asp Gly Ser Gly Gly Ala Gly Gly Ser Val Asn Gly
115 120 125
Leu Pro Ser Gly Ile Pro Phe Met Leu Thr Asn Gly His Asp Tyr Leu
130 135 140
Met Ala Asp Glu Glu Gly Val Cys Leu Ala Val Asn Pro Asp Pro Lys
145 150 155 160
Thr Met Leu Trp Val Tyr Lys Ser Gly His Leu Val Asn Ala Thr Thr
165 170 175
Gly Gln Ala Leu Gly Leu Gly Ile Cys Gly Lys Ala Ser Ala Ala Ser
180 185 190
Gly Asp Arg Trp Arg Leu Ser Ser Lys Gly Glu Leu Val Tyr Gly Asp
195 200 205
Gly Ser Arg Thr Leu Cys Ser Ala Pro Thr Ser Gly Glu Val Trp Leu
210 215 220
Gln Arg Arg Ser Glu Ala Leu Pro Ser Glu Ala Trp Arg Val Arg Leu
225 230 235 240
Pro Gln Leu Pro Arg Arg Gly Gln Ala Pro Ser Met Val Val Asp Lys
245 250 255
Leu Asn Val Cys Leu Ala Val Ser Val Asp Tyr Ser Ala Gly Thr Gly
260 265 270
Asp Thr Leu Ser Phe Ser Ile Asn Gly Ser Gln Tyr Arg Gln Pro Leu
275 280 285
Ala Gly Asn Phe Glu Arg Gly Ala His Phe Lys Val Glu Val Asp Leu
290 295 300
Ala Lys Met Phe Gln Arg Ser Val Ile Tyr Ala Asp Glu Leu Arg Ser
305 310 315 320
Val Glu Ile Tyr Gln Ala Ser Ala Gly Gly Tyr Gly Pro Ala Trp Lys
325 330 335
Met Gln Ser Leu Asp Leu Lys Val Asn Asp Gln Leu Asn Asn Arg Val
340 345 350
Val Gly Ser Asp Asn Arg Trp Ile Glu Ala Arg Asp Gly Val Ala Trp
355 360 365
Gln Gly Arg Val Asn Trp Leu Asp Trp Arg Lys Ala Asp Ile Ser Ala
370 375 380
Pro Leu Asp Phe Ala Gly Tyr Thr Tyr Pro Val Gln Leu Gln Gln Trp
385 390 395 400
Leu Ile Asp Val Leu Lys Trp Arg Ser Tyr Gln Pro Glu Thr Leu Asp
405 410 415
Gly Val Cys Gln Leu Ile Gly Glu Glu Arg Gly Gln Ile Leu Ala Tyr
420 425 430
Glu Leu Lys Ser Gly Arg Leu Thr Tyr Leu Arg Pro Asn Thr Ala Gln
435 440 445
Asp Ala Tyr Thr Trp Val Tyr Thr Pro Gln Lys Ser Ile Leu Val Lys
450 455 460
Phe Trp Asp Gln Ser Leu Asp Arg Thr Arg Tyr Thr Arg His Ser Gln
465 470 475 480
Leu Gly Gly Gly Gln Pro Val Val Cys Ala Gly Glu Met Arg Ile Asp
485 490 495
Arg Lys Thr Thr Ser Asn Ala Val Ser Asp Ile Leu Gly Leu Val Asn
500 505 510
Asp Ala Ser Gly His Tyr Lys Pro Asp Gly Gly Gln Cys Leu Gly His
515 520 525
Val Leu Glu Arg Leu Glu Gln Leu Gly Leu Asp Thr Thr Gln Thr Val
530 535 540
Val Ser Tyr Lys Gly
545
<210> 29
<211> 1548
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌优化的密码子
<400> 29
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ttggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg gtgggacaac 240
ccctatgcag tacaatttgc ttttagtgta ggagggcggc aattttttta cggacaaaat 300
ttagaaacaa attattggtt tattcaagag ttacttgctg gaggaaaaat gggacaagaa 360
acagctaacg gacgttggaa taacccctac gcgagccagt ttgccttctc cgtcggcggg 420
cgccagttct tttacgggca aaacctgaaa accaactact ggttcattca agaactgctt 480
gccggcggta agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct ggacgcagat 1020
tcatccacga gctatcagcc tagttatgcc gttggttggt cgccctacct ggcggattgg 1080
atacgctacg tcaagaacgg cggcccgatc ttcaagtacc acgatcctgc cgagatcgat 1140
ggtgtcggca tactgctgcc catgcgcaac gggaagttgt atggggacca gctcaagcga 1200
cagattaccg aggaactgcc cctgtatgac aagtcccaag gtcactattc gtgggttctg 1260
acgccgggcg ggaaaatcct ctacaagtgg aactcccagc ttgagctcga cagtcgtcag 1320
tacacgcggc acagcgacct caaccaaggg cgcccggtta cctgtgccgg cgagttctac 1380
ctgactcggc gaagctcgaa catcttcctc acggagttgt acatcgagat caacgacagc 1440
tcgggccact acaagccatc agccgcagtc tgtttcaggt acgtgcttga ggagttcgag 1500
gcactgggca tcgacctgaa caacatcgag ggggtttaca cgcgcaac 1548
<210> 30
<211> 516
<212> PRT
<213> 弗村假单胞菌
<400> 30
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly
340 345 350
Trp Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly
355 360 365
Pro Ile Phe Lys Tyr His Asp Pro Ala Glu Ile Asp Gly Val Gly Ile
370 375 380
Leu Leu Pro Met Arg Asn Gly Lys Leu Tyr Gly Asp Gln Leu Lys Arg
385 390 395 400
Gln Ile Thr Glu Glu Leu Pro Leu Tyr Asp Lys Ser Gln Gly His Tyr
405 410 415
Ser Trp Val Leu Thr Pro Gly Gly Lys Ile Leu Tyr Lys Trp Asn Ser
420 425 430
Gln Leu Glu Leu Asp Ser Arg Gln Tyr Thr Arg His Ser Asp Leu Asn
435 440 445
Gln Gly Arg Pro Val Thr Cys Ala Gly Glu Phe Tyr Leu Thr Arg Arg
450 455 460
Ser Ser Asn Ile Phe Leu Thr Glu Leu Tyr Ile Glu Ile Asn Asp Ser
465 470 475 480
Ser Gly His Tyr Lys Pro Ser Ala Ala Val Cys Phe Arg Tyr Val Leu
485 490 495
Glu Glu Phe Glu Ala Leu Gly Ile Asp Leu Asn Asn Ile Glu Gly Val
500 505 510
Tyr Thr Arg Asn
515
<210> 31
<211> 918
<212> DNA
<213> 十字花科假单胞菌
<400> 31
atgacacctc cattcgacac cttcatcgac agcctttctg ttacagcttc cataaagaat 60
caaaactggg cgggcacgga cgacagcatc tatatctcga tgggccccct gggccagatg 120
cagttgttct gtgaagcccc cagggtgggg caactcatcc acgtggatat cgacattgcc 180
cggatgttcg gccgaccgcg tatctcgctc ggggaaattg acggactggc cctctaccag 240
gtgcccgtcg cacacccgat cgcttctgat gactgggcgc tggaatcggt gctgatcaaa 300
gccaatgaca tctacgccaa tacctcattc aaacgcatca acaaatggct gaggaaccca 360
tccgcgcact tgcaattcgt atggtcagga catgtccatt tctccgactg gaagaattcc 420
gaccatagat ccatcgatct caacgcccag acctatccga tcaggtggat gccctttatc 480
ggcgacctga tgcattggcg ctgttatgac ccgtcgaaaa tagacggcgt aggtcagttg 540
atcgggatgt gggacggcaa gttgatcggc aatcaactga agacacacac cagtgagctg 600
ctcgccccca acgaccagtc caatagttac acatgggtct acacacccga acacgccatt 660
atctataagc gctgggaaca tagcgaccgg gccaactatg taaggcatag ccagctcggc 720
agcggcaggc cggtcatgtg cgccggggag ttcagggtca ccgaacatca catggaccat 780
gtgatcgcca tggtcaacga tgcttccggg cattacaggc ccgacggcgg cgcctgcctg 840
cggtatgtcg ccgagaagtt cgatgccctg gggatcaata ccgagcacat cgaatggcga 900
tggcaagata cgaacgcc 918
<210> 32
<211> 1648
<212> DNA
<213> 人工序列
<220>
<223> 多顺反子表达序列
<400> 32
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct gtaatttgtt 1020
agttcatttg aagtgaagca aaattcaatt cccctgttac taacctactt acttgtttca 1080
cctcaaaggc tattgaaagg aaaataagat ggacgcagat tcatccacga gctatcagcc 1140
tagttatgcc gttggttggt cgccctacct ggcggattgg atacgctacg tcaagaacgg 1200
cggcccgatc ttcaagtacc acgatcctgc cgagatcgat ggtgtcggca tactgctgcc 1260
catgcgcaac gggaagttgt atggggacca gctcaagcga cagattaccg aggaactgcc 1320
cctgtatgac aagtcccaag gtcactattc gtgggttctg acgccgggcg ggaaaatcct 1380
ctacaagtgg aactcccagc ttgagctcga cagtcgtcag tacacgcggc acagcgacct 1440
caaccaaggg cgcccggtta cctgtgccgg cgagttctac ctgactcggc gaagctcgaa 1500
catcttcctc acggagttgt acatcgagat caacgacagc tcgggccact acaagccatc 1560
agccgcagtc tgtttcaggt acgtgcttga ggagttcgag gcactgggca tcgacctgaa 1620
caacatcgag ggggtttaca cgcgcaac 1648
<210> 33
<211> 1011
<212> DNA
<213> 人工序列
<220>
<223> IPD082Aa N-末端区域的编码序列
<400> 33
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct g 1011
<210> 34
<211> 337
<212> PRT
<213> 人工序列
<220>
<223> IPD082Aa N-末端区域
<400> 34
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu
<210> 35
<211> 540
<212> DNA
<213> 人工序列
<220>
<223> IPD082Aa C-末端区域的编码序列
<400> 35
atggacgcag attcatccac gagctatcag cctagttatg ccgttggttg gtcgccctac 60
ctggcggatt ggatacgcta cgtcaagaac ggcggcccga tcttcaagta ccacgatcct 120
gccgagatcg atggtgtcgg catactgctg cccatgcgca acgggaagtt gtatggggac 180
cagctcaagc gacagattac cgaggaactg cccctgtatg acaagtccca aggtcactat 240
tcgtgggttc tgacgccggg cgggaaaatc ctctacaagt ggaactccca gcttgagctc 300
gacagtcgtc agtacacgcg gcacagcgac ctcaaccaag ggcgcccggt tacctgtgcc 360
ggcgagttct acctgactcg gcgaagctcg aacatcttcc tcacggagtt gtacatcgag 420
atcaacgaca gctcgggcca ctacaagcca tcagccgcag tctgtttcag gtacgtgctt 480
gaggagttcg aggcactggg catcgacctg aacaacatcg agggggttta cacgcgcaac 540
<210> 36
<211> 180
<212> PRT
<213> 人工序列
<220>
<223> IPD082Aa C-末端区域
<400> 36
Met Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly
1 5 10 15
Trp Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly
20 25 30
Pro Ile Phe Lys Tyr His Asp Pro Ala Glu Ile Asp Gly Val Gly Ile
35 40 45
Leu Leu Pro Met Arg Asn Gly Lys Leu Tyr Gly Asp Gln Leu Lys Arg
50 55 60
Gln Ile Thr Glu Glu Leu Pro Leu Tyr Asp Lys Ser Gln Gly His Tyr
65 70 75 80
Ser Trp Val Leu Thr Pro Gly Gly Lys Ile Leu Tyr Lys Trp Asn Ser
85 90 95
Gln Leu Glu Leu Asp Ser Arg Gln Tyr Thr Arg His Ser Asp Leu Asn
100 105 110
Gln Gly Arg Pro Val Thr Cys Ala Gly Glu Phe Tyr Leu Thr Arg Arg
115 120 125
Ser Ser Asn Ile Phe Leu Thr Glu Leu Tyr Ile Glu Ile Asn Asp Ser
130 135 140
Ser Gly His Tyr Lys Pro Ser Ala Ala Val Cys Phe Arg Tyr Val Leu
145 150 155 160
Glu Glu Phe Glu Ala Leu Gly Ile Asp Leu Asn Asn Ile Glu Gly Val
165 170 175
Tyr Thr Arg Asn
180
<210> 37
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> IPD082Hb C-末端区域的编码序列
<400> 37
atggcagatt catccacgag ctatcagcct agttatgccg ttggttggtc gccctacctg 60
gcggattgga tacgctacgt caagaacggc ggcccgatct tcaagtacca cgatccttcg 120
aaaatagacg gcgtgggtca gttgatcgga atgtgggacg gtcagttgat cggcaatcaa 180
ctgaagacac acaccagtga actgctcgcc cccaacgacc agtccaatag ttacacatgg 240
gtctatacac ccgaacacgc cattatctat aagcgctggg agcatagcga ccgggccaac 300
tacgtcaggc atagccagct tggcagtggc aggccggtca tgtgtgccgg ggagctcaag 360
gtcaccgaac atcgtatgga ccatgtgatc gccatggtca acgatgcttc cgggcattac 420
aggcccgacg gcggcgcctg cctgcggtat gtggccgaga agttcgaggc cttggggatc 480
aataccgagc atatcgaatg gcgatggcaa gacaggaacg cc 522
<210> 38
<211> 174
<212> PRT
<213> 人工序列
<220>
<223> IPD082Hb C-末端区域
<400> 38
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
1 5 10 15
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
20 25 30
Ile Phe Lys Tyr His Asp Pro Ser Lys Ile Asp Gly Val Gly Gln Leu
35 40 45
Ile Gly Met Trp Asp Gly Gln Leu Ile Gly Asn Gln Leu Lys Thr His
50 55 60
Thr Ser Glu Leu Leu Ala Pro Asn Asp Gln Ser Asn Ser Tyr Thr Trp
65 70 75 80
Val Tyr Thr Pro Glu His Ala Ile Ile Tyr Lys Arg Trp Glu His Ser
85 90 95
Asp Arg Ala Asn Tyr Val Arg His Ser Gln Leu Gly Ser Gly Arg Pro
100 105 110
Val Met Cys Ala Gly Glu Leu Lys Val Thr Glu His Arg Met Asp His
115 120 125
Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Arg Pro Asp Gly
130 135 140
Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Phe Glu Ala Leu Gly Ile
145 150 155 160
Asn Thr Glu His Ile Glu Trp Arg Trp Gln Asp Arg Asn Ala
165 170
<210> 39
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> IPD082Ia C-末端区域的编码序列
<400> 39
atggcagatt catccacgag ctatcagcct agttatgccg ttggttggtc gccctacctg 60
gcggattgga tacgctacgt caagaacggc ggcccgatct tcaagtacca cgatcctgaa 120
accctcgatg gcgtctgcca gctgatcggc gaggagcgcg gccagatact ggcgtatgag 180
ctcaagagcg gcagactgac ctatctgcgc cccaatactg cccaggatgc ctacacctgg 240
gtctataccc cgcaaaaaag cattctggtc aaattctggg accagtccct ggaccgtacg 300
cgctataccc ggcacagcca gcttggcggt ggccagccgg tggtgtgcgc cggagaaatg 360
cgcatcgacc gcaagaccac cagcaatgcg gtgagcgaca tccttggtct ggtcaatgat 420
gcctccggac actacaagcc cgatggcggg cagtgcctgg ggcatgtcct ggaacggctc 480
gaacaactgg ggctggacac cacgcacacc gtggtttcgt acaaggga 528
<210> 40
<211> 176
<212> PRT
<213> 人工序列
<220>
<223> IPD082Ia C-末端区域
<400> 40
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
1 5 10 15
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
20 25 30
Ile Phe Lys Tyr His Asp Pro Glu Thr Leu Asp Gly Val Cys Gln Leu
35 40 45
Ile Gly Glu Glu Arg Gly Gln Ile Leu Ala Tyr Glu Leu Lys Ser Gly
50 55 60
Arg Leu Thr Tyr Leu Arg Pro Asn Thr Ala Gln Asp Ala Tyr Thr Trp
65 70 75 80
Val Tyr Thr Pro Gln Lys Ser Ile Leu Val Lys Phe Trp Asp Gln Ser
85 90 95
Leu Asp Arg Thr Arg Tyr Thr Arg His Ser Gln Leu Gly Gly Gly Gln
100 105 110
Pro Val Val Cys Ala Gly Glu Met Arg Ile Asp Arg Lys Thr Thr Ser
115 120 125
Asn Ala Val Ser Asp Ile Leu Gly Leu Val Asn Asp Ala Ser Gly His
130 135 140
Tyr Lys Pro Asp Gly Gly Gln Cys Leu Gly His Val Leu Glu Arg Leu
145 150 155 160
Glu Gln Leu Gly Leu Asp Thr Thr His Thr Val Val Ser Tyr Lys Gly
165 170 175
<210> 41
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> IPD082Ic C-末端区域的编码序列
<400> 41
atggcagatt catccacgag ctatcagcct agttatgccg ttggttggtc gccctacctg 60
gcggattgga tacgctacgt caagaacggc ggcccgatct tcaagtacca cgatccttcg 120
aaaatcgacg gcgtcggtca actggtgggg atgtgggacg gccagttgat cggcaatcaa 180
ctgaaatcgc aaaccagcga aatactctct cccaacgacc agtccaacag ctatacctgg 240
gtgtataccc cggaaaactc catcatctat aaacgctggg aacatgctga ccgggccaac 300
tacatcaggc acagccaact cggcagcggc aggccagtca tgtgcgctgg tgaattcagg 360
atcagggagc atcgcatgga gcacgtcatt gccatggtca acgatgcttc ggggcattac 420
cgtcccgacg gcggggcctg cctgcgctac gtggcggaga aactcgaggc cttgggcatc 480
aatacggaat acatcgagtg gcagtggaga tacacctccg ac 522
<210> 42
<211> 174
<212> PRT
<213> 人工序列
<220>
<223> IPD082Ic C-末端区域
<400> 42
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
1 5 10 15
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
20 25 30
Ile Phe Lys Tyr His Asp Pro Ser Lys Ile Asp Gly Val Gly Gln Leu
35 40 45
Val Gly Met Trp Asp Gly Gln Leu Ile Gly Asn Gln Leu Lys Ser Gln
50 55 60
Thr Ser Glu Ile Leu Ser Pro Asn Asp Gln Ser Asn Ser Tyr Thr Trp
65 70 75 80
Val Tyr Thr Pro Glu Asn Ser Ile Ile Tyr Lys Arg Trp Glu His Ala
85 90 95
Asp Arg Ala Asn Tyr Ile Arg His Ser Gln Leu Gly Ser Gly Arg Pro
100 105 110
Val Met Cys Ala Gly Glu Phe Arg Ile Arg Glu His Arg Met Glu His
115 120 125
Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Arg Pro Asp Gly
130 135 140
Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Leu Glu Ala Leu Gly Ile
145 150 155 160
Asn Thr Glu Tyr Ile Glu Trp Gln Trp Arg Tyr Thr Ser Asp
165 170
<210> 43
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> IPD082Ie C-末端区域的编码序列
<400> 43
atggcagatt catccacgag ctatcagcct agttatgccg ttggttggtc gccctacctg 60
gcggattgga tacgctacgt caagaacggc ggcccgatct tcaagtacca cgatccttcc 120
agcatcgacg gcgtcgggca actgattggc atgaacaatg gccggttgat cggcgagatc 180
ctgaaaaccc gcgactgcga agcgctcagg cccaatgacg acaacaacag ctacacctgg 240
gtattcaccc cggaggggtc gatcatctac cggttctgga accacgacga cagctcgggc 300
tatgtccgcc acagccagtt gggaaatggc cggccggtga tctgcgcggg tgagttcagg 360
gtcgagagac gagcggatat cgatggggtg gtggatgtca tcgccatggt gaacgacgcc 420
tcgggccact acaaacccga tggcggcgcc tgcctgggct cggtcgagga gaagttcaag 480
gcattgggca tccccaccga acacataaaa tggtcctaca aggagaag 528
<210> 44
<211> 176
<212> PRT
<213> 人工序列
<220>
<223> IPD082Ie C-末端区域
<400> 44
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
1 5 10 15
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
20 25 30
Ile Phe Lys Tyr His Asp Pro Ser Ser Ile Asp Gly Val Gly Gln Leu
35 40 45
Ile Gly Met Asn Asn Gly Arg Leu Ile Gly Glu Ile Leu Lys Thr Arg
50 55 60
Asp Cys Glu Ala Leu Arg Pro Asn Asp Asp Asn Asn Ser Tyr Thr Trp
65 70 75 80
Val Phe Thr Pro Glu Gly Ser Ile Ile Tyr Arg Phe Trp Asn His Asp
85 90 95
Asp Ser Ser Gly Tyr Val Arg His Ser Gln Leu Gly Asn Gly Arg Pro
100 105 110
Val Ile Cys Ala Gly Glu Phe Arg Val Glu Arg Arg Ala Asp Ile Asp
115 120 125
Gly Val Val Asp Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr
130 135 140
Lys Pro Asp Gly Gly Ala Cys Leu Gly Ser Val Glu Glu Lys Phe Lys
145 150 155 160
Ala Leu Gly Ile Pro Thr Glu His Ile Lys Trp Ser Tyr Lys Glu Lys
165 170 175
<210> 45
<211> 519
<212> DNA
<213> 人工序列
<220>
<223> IPD082Ib C-末端区域的编码序列
<400> 45
atggctgata gctctacgag ctaccagccg tcttacccgg ttacttggcg cccgctgctg 60
tctgattggc tgtattggcg tagctacgac gtgagcaaca tcgagggtgt ctgccagctg 120
attggtgagc aggacggtcg cgtgctgggc ttcgaactgg tgggtcagcg tcctgtttat 180
ctggaaccaa atacggctaa cgactcttat acttgggtct acacccctca gggctccatt 240
atcgttaaac gctgggacaa agctgcgccg cgtgcgcact acatcactca ctctcagctg 300
ggtatgggtg cgccggtcgt atgcgcgggc gaaatgacga tcgtgcgtat gggcgcgggc 360
gttgcggtgc atgatatcct gggtatgatc aacgatgcca gcggtcacta cgtgcctgat 420
ggcggtgcct gcctggcaca tgttcgtgaa cgtctggctc agctgggtct ggataccacc 480
cgtaccaccg tagctttcca ctccggcaaa caagcagaa 519
<210> 46
<211> 173
<212> PRT
<213> 人工序列
<220>
<223> IPD082Ib C-末端区域
<400> 46
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Pro Val Thr Trp
1 5 10 15
Arg Pro Leu Leu Ser Asp Trp Leu Tyr Trp Arg Ser Tyr Asp Val Ser
20 25 30
Asn Ile Glu Gly Val Cys Gln Leu Ile Gly Glu Gln Asp Gly Arg Val
35 40 45
Leu Gly Phe Glu Leu Val Gly Gln Arg Pro Val Tyr Leu Glu Pro Asn
50 55 60
Thr Ala Asn Asp Ser Tyr Thr Trp Val Tyr Thr Pro Gln Gly Ser Ile
65 70 75 80
Ile Val Lys Arg Trp Asp Lys Ala Ala Pro Arg Ala His Tyr Ile Thr
85 90 95
His Ser Gln Leu Gly Met Gly Ala Pro Val Val Cys Ala Gly Glu Met
100 105 110
Thr Ile Val Arg Met Gly Ala Gly Val Ala Val His Asp Ile Leu Gly
115 120 125
Met Ile Asn Asp Ala Ser Gly His Tyr Val Pro Asp Gly Gly Ala Cys
130 135 140
Leu Ala His Val Arg Glu Arg Leu Ala Gln Leu Gly Leu Asp Thr Thr
145 150 155 160
Arg Thr Thr Val Ala Phe His Ser Gly Lys Gln Ala Glu
165 170
<210> 47
<211> 531
<212> DNA
<213> 人工序列
<220>
<223> IPD082Hd C-末端区域的编码序列
<400> 47
atggccgatt cttctactag ctaccaacca tcctatgcag ttggttggtc cccgtatctg 60
gcggactgga ttcgctacgt gaaaaacggt ggcccgatct tcaagtatca cgatccgtct 120
tctatcgatg gtgtgggcca gctgattggt atgaaccatg gtcgtctgat tggcgaaatc 180
ctgaagaccc gtgattgcga agcgctgaag ccgaacgaag gcaacaactc ctatacctgg 240
gtgttcactc cggacggcgc tatcatctac cgcctgtgga accatgatga ctccgcaggt 300
tacatccgtc acagccagct gggttctggc cgttctgtga tctgtgccgg tgaatttcgc 360
atcgagcgtc gtgaggatat cgatggtgtt gtggatgtga tcgcaatggt gaacgatgcc 420
tctggccatt acaaacctga cggtggtgcg tgtctgggct ctgtggagga aaaattcaaa 480
gccctgggta tcccgaccga acacatcact tggtcttatc gcggtgccgc g 531
<210> 48
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> IPD082Hd C-末端区域
<400> 48
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
1 5 10 15
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
20 25 30
Ile Phe Lys Tyr His Asp Pro Ser Ser Ile Asp Gly Val Gly Gln Leu
35 40 45
Ile Gly Met Asn His Gly Arg Leu Ile Gly Glu Ile Leu Lys Thr Arg
50 55 60
Asp Cys Glu Ala Leu Lys Pro Asn Glu Gly Asn Asn Ser Tyr Thr Trp
65 70 75 80
Val Phe Thr Pro Asp Gly Ala Ile Ile Tyr Arg Leu Trp Asn His Asp
85 90 95
Asp Ser Ala Gly Tyr Ile Arg His Ser Gln Leu Gly Ser Gly Arg Ser
100 105 110
Val Ile Cys Ala Gly Glu Phe Arg Ile Glu Arg Arg Glu Asp Ile Asp
115 120 125
Gly Val Val Asp Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr
130 135 140
Lys Pro Asp Gly Gly Ala Cys Leu Gly Ser Val Glu Glu Lys Phe Lys
145 150 155 160
Ala Leu Gly Ile Pro Thr Glu His Ile Thr Trp Ser Tyr Arg Gly Ala
165 170 175
Ala
<210> 49
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> IPD082Hc C-末端区域的编码序列
<400> 49
atggcggact cttctacctc ttaccagcca tcctatgcag taggctggtc tccgtacctg 60
gcagactgga ttcgctatgt gaaaaacggt ggtccgatct tcaaatatca cgatccgtct 120
aaaatcgacg gtgtcggtca gctggttggc atgtgggatg gtaaactgat cggcaaccaa 180
ctgaagagcc agactagcga aatgctgagc ccgaacgacc agtctaacag ctacacctgg 240
gtttataccc ctgagaacag catcatctat aaacgctggg aacacgctga tcgcgccaac 300
tacatccgcc attctcagct gggttctggc cgcccggtta tgtgcgccgg cgagtttcgt 360
atccgtgaac accgtatgga acacgtgatt gcgatggtta acgatgcctc cggtcactac 420
cgtccggacg gtggtgcgtg cctgcgctac gtggccgaga aatttgaagc cctgggcatc 480
aacaccgaac acattgaatg gcagtggcgt tacgcatctg ac 522
<210> 50
<211> 174
<212> PRT
<213> 人工序列
<220>
<223> IPD082Hc C-末端区域
<400> 50
Met Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
1 5 10 15
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
20 25 30
Ile Phe Lys Tyr His Asp Pro Ser Lys Ile Asp Gly Val Gly Gln Leu
35 40 45
Val Gly Met Trp Asp Gly Lys Leu Ile Gly Asn Gln Leu Lys Ser Gln
50 55 60
Thr Ser Glu Met Leu Ser Pro Asn Asp Gln Ser Asn Ser Tyr Thr Trp
65 70 75 80
Val Tyr Thr Pro Glu Asn Ser Ile Ile Tyr Lys Arg Trp Glu His Ala
85 90 95
Asp Arg Ala Asn Tyr Ile Arg His Ser Gln Leu Gly Ser Gly Arg Pro
100 105 110
Val Met Cys Ala Gly Glu Phe Arg Ile Arg Glu His Arg Met Glu His
115 120 125
Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Arg Pro Asp Gly
130 135 140
Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Phe Glu Ala Leu Gly Ile
145 150 155 160
Asn Thr Glu His Ile Glu Trp Gln Trp Arg Tyr Ala Ser Asp
165 170
<210> 51
<211> 1530
<212> DNA
<213> 人工序列
<220>
<223> 编码序列IPD082Aa C-末端/ IPD082Ib N-末端嵌合型
<400> 51
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct ggacgctgat 1020
agctctacga gctaccagcc gtcttacccg gttacttggc gcccgctgct gtctgattgg 1080
ctgtattggc gtagctacga cgtgagcaac atcgagggtg tctgccagct gattggtgag 1140
caggacggtc gcgtgctggg cttcgaactg gtgggtcagc gtcctgttta tctggaacca 1200
aatacggcta acgactctta tacttgggtc tacacccctc agggctccat tatcgttaaa 1260
cgctgggaca aagctgcgcc gcgtgcgcac tacatcactc actctcagct gggtatgggt 1320
gcgccggtcg tatgcgcggg cgaaatgacg atcgtgcgta tgggcgcggg cgttgcggtg 1380
catgatatcc tgggtatgat caacgatgcc agcggtcact acgtgcctga tggcggtgcc 1440
tgcctggcac atgttcgtga acgtctggct cagctgggtc tggataccac ccgtaccacc 1500
gtagctttcc actccggcaa acaagcagaa 1530
<210> 52
<211> 510
<212> PRT
<213> 人工序列
<220>
<223> IPD082Aa C-末端/ IPD082Ib N-末端嵌合型
<400> 52
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Pro Val Thr
340 345 350
Trp Arg Pro Leu Leu Ser Asp Trp Leu Tyr Trp Arg Ser Tyr Asp Val
355 360 365
Ser Asn Ile Glu Gly Val Cys Gln Leu Ile Gly Glu Gln Asp Gly Arg
370 375 380
Val Leu Gly Phe Glu Leu Val Gly Gln Arg Pro Val Tyr Leu Glu Pro
385 390 395 400
Asn Thr Ala Asn Asp Ser Tyr Thr Trp Val Tyr Thr Pro Gln Gly Ser
405 410 415
Ile Ile Val Lys Arg Trp Asp Lys Ala Ala Pro Arg Ala His Tyr Ile
420 425 430
Thr His Ser Gln Leu Gly Met Gly Ala Pro Val Val Cys Ala Gly Glu
435 440 445
Met Thr Ile Val Arg Met Gly Ala Gly Val Ala Val His Asp Ile Leu
450 455 460
Gly Met Ile Asn Asp Ala Ser Gly His Tyr Val Pro Asp Gly Gly Ala
465 470 475 480
Cys Leu Ala His Val Arg Glu Arg Leu Ala Gln Leu Gly Leu Asp Thr
485 490 495
Thr Arg Thr Thr Val Ala Phe His Ser Gly Lys Gln Ala Glu
500 505 510
<210> 53
<211> 1542
<212> DNA
<213> 人工序列
<220>
<223> 编码序列IPD082Aa C-末端/ IPD082Hd N-末端嵌合型
<400> 53
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct ggacgccgat 1020
tcttctacta gctaccaacc atcctatgca gttggttggt ccccgtatct ggcggactgg 1080
attcgctacg tgaaaaacgg tggcccgatc ttcaagtatc acgatccgtc ttctatcgat 1140
ggtgtgggcc agctgattgg tatgaaccat ggtcgtctga ttggcgaaat cctgaagacc 1200
cgtgattgcg aagcgctgaa gccgaacgaa ggcaacaact cctatacctg ggtgttcact 1260
ccggacggcg ctatcatcta ccgcctgtgg aaccatgatg actccgcagg ttacatccgt 1320
cacagccagc tgggttctgg ccgttctgtg atctgtgccg gtgaatttcg catcgagcgt 1380
cgtgaggata tcgatggtgt tgtggatgtg atcgcaatgg tgaacgatgc ctctggccat 1440
tacaaacctg acggtggtgc gtgtctgggc tctgtggagg aaaaattcaa agccctgggt 1500
atcccgaccg aacacatcac ttggtcttat cgcggtgccg cg 1542
<210> 54
<211> 514
<212> PRT
<213> 人工序列
<220>
<223> IPD082Aa C-末端/ IPD082Hd N-末端嵌合型
<400> 54
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly
340 345 350
Trp Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly
355 360 365
Pro Ile Phe Lys Tyr His Asp Pro Ser Ser Ile Asp Gly Val Gly Gln
370 375 380
Leu Ile Gly Met Asn His Gly Arg Leu Ile Gly Glu Ile Leu Lys Thr
385 390 395 400
Arg Asp Cys Glu Ala Leu Lys Pro Asn Glu Gly Asn Asn Ser Tyr Thr
405 410 415
Trp Val Phe Thr Pro Asp Gly Ala Ile Ile Tyr Arg Leu Trp Asn His
420 425 430
Asp Asp Ser Ala Gly Tyr Ile Arg His Ser Gln Leu Gly Ser Gly Arg
435 440 445
Ser Val Ile Cys Ala Gly Glu Phe Arg Ile Glu Arg Arg Glu Asp Ile
450 455 460
Asp Gly Val Val Asp Val Ile Ala Met Val Asn Asp Ala Ser Gly His
465 470 475 480
Tyr Lys Pro Asp Gly Gly Ala Cys Leu Gly Ser Val Glu Glu Lys Phe
485 490 495
Lys Ala Leu Gly Ile Pro Thr Glu His Ile Thr Trp Ser Tyr Arg Gly
500 505 510
Ala Ala
<210> 55
<211> 1533
<212> DNA
<213> 人工序列
<220>
<223> 编码序列IPD082Aa C-末端/ IPD082Hc N-末端嵌合型
<400> 55
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct ggacgcggac 1020
tcttctacct cttaccagcc atcctatgca gtaggctggt ctccgtacct ggcagactgg 1080
attcgctatg tgaaaaacgg tggtccgatc ttcaaatatc acgatccgtc taaaatcgac 1140
ggtgtcggtc agctggttgg catgtgggat ggtaaactga tcggcaacca actgaagagc 1200
cagactagcg aaatgctgag cccgaacgac cagtctaaca gctacacctg ggtttatacc 1260
cctgagaaca gcatcatcta taaacgctgg gaacacgctg atcgcgccaa ctacatccgc 1320
cattctcagc tgggttctgg ccgcccggtt atgtgcgccg gcgagtttcg tatccgtgaa 1380
caccgtatgg aacacgtgat tgcgatggtt aacgatgcct ccggtcacta ccgtccggac 1440
ggtggtgcgt gcctgcgcta cgtggccgag aaatttgaag ccctgggcat caacaccgaa 1500
cacattgaat ggcagtggcg ttacgcatct gac 1533
<210> 56
<211> 511
<212> PRT
<213> 人工序列
<220>
<223> IPD082Aa C-末端/ IPD082Hc N-末端嵌合型
<400> 56
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly
340 345 350
Trp Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly
355 360 365
Pro Ile Phe Lys Tyr His Asp Pro Ser Lys Ile Asp Gly Val Gly Gln
370 375 380
Leu Val Gly Met Trp Asp Gly Lys Leu Ile Gly Asn Gln Leu Lys Ser
385 390 395 400
Gln Thr Ser Glu Met Leu Ser Pro Asn Asp Gln Ser Asn Ser Tyr Thr
405 410 415
Trp Val Tyr Thr Pro Glu Asn Ser Ile Ile Tyr Lys Arg Trp Glu His
420 425 430
Ala Asp Arg Ala Asn Tyr Ile Arg His Ser Gln Leu Gly Ser Gly Arg
435 440 445
Pro Val Met Cys Ala Gly Glu Phe Arg Ile Arg Glu His Arg Met Glu
450 455 460
His Val Ile Ala Met Val Asn Asp Ala Ser Gly His Tyr Arg Pro Asp
465 470 475 480
Gly Gly Ala Cys Leu Arg Tyr Val Ala Glu Lys Phe Glu Ala Leu Gly
485 490 495
Ile Asn Thr Glu His Ile Glu Trp Gln Trp Arg Tyr Ala Ser Asp
500 505 510
<210> 57
<211> 2745
<212> DNA
<213> 人工序列
<220>
<223> IPD082Aa C-末端/MBP/ IPD082Aa N-末端融合蛋白的编码序列
<400> 57
atgcaaacta ctgtatcgga aaccttggtt tccgggagtg atccacgtct gcaggtcagc 60
atgggcaacg aaacggccaa tggtcgttgg gataatccgt acgctatcca gttcacctac 120
tccatcgccg gacgtcagtt cttctatggc cagaacctga agacccacta ctggttcatc 180
caggaactgt tgccaggcgg caagatgggt caggagactg ccaatggtcg ctgggacaac 240
ccctatgcgg tccagttcgc cttttcggtt ggcggtcgtc aattcttcta cggccagaat 300
ctggagacca attactggtt tatccaggag ttgctggccg gtggcaagat gggccaggaa 360
accgccaatg gccgttggaa taacccctat gcgagccagt ttgccttttc cgtcggcggg 420
cgtcagttct tctacgggca gaacctgaaa accaactact ggttcatcca ggaactgctt 480
gccggcggca agatgggaca ggaaaccgcg aacggcaccc tggatggacc gttcgctgtt 540
caatttccct tcagcgtcgg cggtagccag tatttctacg ggcagaacat aaaggaccga 600
agctggttca tcaaggaact cctggccggc ggtaaggtag gcaaaacaac agccagcgga 660
cgttgggaca acgcctatgc tgttcagttc gcctatccgg ctgagcagta cggacgccag 720
tatttctatg gtcagaacct tgataccaac tactggttcg tccaggagct gttgccgggc 780
ggagcaatgg gcgaggaaat catgaacggg cggtggggca acccctacgc tacacagttt 840
gcctacgagc agggcggcat ctcctacttt tacggacaga accagtcgag taactactgg 900
ttcatccagg agttgctgtc cgataccgag tacacggtcc gccggcttcc gcttctcgac 960
tactccagct cgacatccgc tgcccagcag agtgcacccg gtgtctgcct ggaccaccat 1020
caccatcacc ataaaatcga agaaggtaaa ctggtaatct ggattaacgg cgataaaggc 1080
tataacggtc tcgctgaagt cggtaagaaa ttcgagaaag ataccggaat taaagtcacc 1140
gttgagcatc cggataaact ggaagagaaa ttcccacagg ttgcggcaac tggcgatggc 1200
cctgacatta tcttctgggc acacgaccgc tttggtggct acgctcaatc tggcctgttg 1260
gctgaaatca ccccggacaa agcgttccag gacaagctgt atccgtttac ctgggatgcc 1320
gtacgttaca acggcaagct gattgcttac ccgatcgctg ttgaagcgtt atcgctgatt 1380
tataacaaag atctgctgcc gaacccgcca aaaacctggg aagagatccc ggcgctggat 1440
aaagaactga aagcgaaagg taagagcgcg ctgatgttca acctgcaaga accgtacttc 1500
acctggccgc tgattgctgc tgacgggggt tatgcgttca agtatgaaaa cggcaagtac 1560
gacattaaag acgtgggcgt ggataacgct ggcgcgaaag cgggtctgac cttcctggtt 1620
gacctgatta aaaacaaaca catgaatgca gacaccgatt actccatcgc agaagctgcc 1680
tttaataaag gcgaaacagc gatgaccatc aacggcccgt gggcatggtc caacatcgac 1740
accagcaaag tgaattatgg tgtaacggta ctgccgacct tcaagggtca accatccaaa 1800
ccgttcgttg gcgtgctgag cgcaggtatt aacgccgcca gtccgaacaa agagctggca 1860
aaagagttcc tcgaaaacta tctgctgact gatgaaggtc tggaagcggt taataaagac 1920
aaaccgctgg gtgccgtagc gctgaagtct tacgaggaag agttggcgaa agatccacgt 1980
attgccgcca ctatggaaaa cgcccagaaa ggtgaaatca tgccgaacat cccgcagatg 2040
tccgctttct ggtatgccgt gcgtactgcg gtgatcaacg ccgccagcgg tcgtcagact 2100
gtcgatgaag ccctgaaaga cgcgcagact aattcgagct cgaacaacaa caacaataac 2160
aataacaaca acctcgggat cgagggaagg atttcagaat taggcatgca tgcagattca 2220
tccacgagct atcagcctag ttatgccgtt ggttggtcgc cctacctggc ggattggata 2280
cgctacgtca agaacggcgg cccgatcttc aagtaccacg atcctgccga gatcgatggt 2340
gtcggcatac tgctgcccat gcgcaacggg aagttgtatg gggaccagct caagcgacag 2400
attaccgagg aactgcccct gtatgacaag tcccaaggtc actattcgtg ggttctgacg 2460
ccgggcggga aaatcctcta caagtggaac tcccagcttg agctcgacag tcgtcagtac 2520
acgcggcaca gcgacctcaa ccaagggcgc ccggttacct gtgccggcga gttctacctg 2580
actcggcgaa gctcgaacat cttcctcacg gagttgtaca tcgagatcaa cgacagctcg 2640
ggccactaca agccatcagc cgcagtctgt ttcaggtacg tgcttgagga gttcgaggca 2700
ctgggcatcg acctgaacaa catcgagggg gtttacacgc gcaac 2745
<210> 58
<211> 915
<212> PRT
<213> 人工序列
<220>
<223> IPD082Aa C-末端/ MBP/IPD082Aa N-末端融合蛋白
<400> 58
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Tyr Ser Ile Ala Gly Arg Gln Phe Phe
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Trp Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asp Asn
65 70 75 80
Pro Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Phe
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Thr Leu Asp Gly
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Lys Asp Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Glu Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Phe Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Trp Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Phe Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Trp Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Leu Leu Asp
305 310 315 320
Tyr Ser Ser Ser Thr Ser Ala Ala Gln Gln Ser Ala Pro Gly Val Cys
325 330 335
Leu Asp His His His His His His Lys Ile Glu Glu Gly Lys Leu Val
340 345 350
Ile Trp Ile Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly
355 360 365
Lys Lys Phe Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu His Pro
370 375 380
Asp Lys Leu Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly
385 390 395 400
Pro Asp Ile Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln
405 410 415
Ser Gly Leu Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys
420 425 430
Leu Tyr Pro Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile
435 440 445
Ala Tyr Pro Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp
450 455 460
Leu Leu Pro Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp
465 470 475 480
Lys Glu Leu Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln
485 490 495
Glu Pro Tyr Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala
500 505 510
Phe Lys Tyr Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp
515 520 525
Asn Ala Gly Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys
530 535 540
Asn Lys His Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala
545 550 555 560
Phe Asn Lys Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp
565 570 575
Ser Asn Ile Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro
580 585 590
Thr Phe Lys Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala
595 600 605
Gly Ile Asn Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu
610 615 620
Glu Asn Tyr Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp
625 630 635 640
Lys Pro Leu Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala
645 650 655
Lys Asp Pro Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu
660 665 670
Ile Met Pro Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg
675 680 685
Thr Ala Val Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala
690 695 700
Leu Lys Asp Ala Gln Thr Asn Ser Ser Ser Asn Asn Asn Asn Asn Asn
705 710 715 720
Asn Asn Asn Asn Leu Gly Ile Glu Gly Arg Ile Ser Glu Leu Gly Met
725 730 735
His Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly Trp
740 745 750
Ser Pro Tyr Leu Ala Asp Trp Ile Arg Tyr Val Lys Asn Gly Gly Pro
755 760 765
Ile Phe Lys Tyr His Asp Pro Ala Glu Ile Asp Gly Val Gly Ile Leu
770 775 780
Leu Pro Met Arg Asn Gly Lys Leu Tyr Gly Asp Gln Leu Lys Arg Gln
785 790 795 800
Ile Thr Glu Glu Leu Pro Leu Tyr Asp Lys Ser Gln Gly His Tyr Ser
805 810 815
Trp Val Leu Thr Pro Gly Gly Lys Ile Leu Tyr Lys Trp Asn Ser Gln
820 825 830
Leu Glu Leu Asp Ser Arg Gln Tyr Thr Arg His Ser Asp Leu Asn Gln
835 840 845
Gly Arg Pro Val Thr Cys Ala Gly Glu Phe Tyr Leu Thr Arg Arg Ser
850 855 860
Ser Asn Ile Phe Leu Thr Glu Leu Tyr Ile Glu Ile Asn Asp Ser Ser
865 870 875 880
Gly His Tyr Lys Pro Ser Ala Ala Val Cys Phe Arg Tyr Val Leu Glu
885 890 895
Glu Phe Glu Ala Leu Gly Ile Asp Leu Asn Asn Ile Glu Gly Val Tyr
900 905 910
Thr Arg Asn
915
<210> 59
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> PCR引物
<400> 59
aatatcatat gcaaactact gtatcggaaa ccttggtttc 40
<210> 60
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> PCR引物
<400> 60
aaggatcctt agttgcgcgt gtaaaccccc tcgatgttg 39
<210> 61
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<400> 61
tcagcttcct ttcgggcttt gttagcagcc ggatccttag ttgcgcgtgt aaac 54
<210> 62
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<400> 62
acagcagcgg ccatatcgaa ggtcgtcata tgcaaactac tgtatcggaa acct 54
<210> 63
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<220>
<221> 尚未归类的特征
<222> (19)..(20)
<223> n是a、c、g、或t
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> k是g或t
<400> 63
atcgccggac gtcagttcnn ktatggccag aacctgaaga 40
<210> 64
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<220>
<221> 尚未归类的特征
<222> (20)..(20)
<223> m是a或c
<220>
<221> 尚未归类的特征
<222> (21)..(22)
<223> n是a、c、g、或t
<400> 64
tcttcaggtt ctggccatam nngaactgac gtccggcgat 40
<210> 65
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<220>
<221> 尚未归类的特征
<222> (19)..(20)
<223> n是a、c、g、或t
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> k是g或t
<400> 65
ctgttgccag gcggcaagnn kggtcaggag actgccaatg 40
<210> 66
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<220>
<221> 尚未归类的特征
<222> (22)..(23)
<223> n是a、c、g、或t
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> k是g或t
<400> 66
ctgttgccag gcggcaagat gnnkcaggag actgccaatg 40
<210> 67
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 诱变引物
<400> 67
cttgccgcct ggcaacag 18
<210> 68
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 融合接头
<400> 68
Glu Glu Lys Lys Asn
1 5
<210> 69
<211> 516
<212> PRT
<213> 人工序列
<220>
<223> IPD082变体
<220>
<221> 尚未归类的特征
<222> (40)..(40)
<223> 位置40处的Xaa是Tyr或Phe
<220>
<221> 尚未归类的特征
<222> (48)..(48)
<223> 位置48处的Xaa是Phe、Gly、Ala、Val、Leu、Ile、Met、Ser、
Thr、Cys、Tyr、Asn、Glu、Lys、或His
<220>
<221> 尚未归类的特征
<222> (58)..(58)
<223> 位置58处的Xaa是Trp或Tyr
<220>
<221> 尚未归类的特征
<222> (69)..(69)
<223> 位置69处的Xaa是Met、Leu、Ser、Thr、或Asp
<220>
<221> 尚未归类的特征
<222> (70)..(70)
<223> 位置70处的Xaa 是Gly或Asn
<220>
<221> 尚未归类的特征
<222> (71)..(71)
<223> 位置71处的Xaa是Gln、Leu、Ser、Glu、或His
<220>
<221> 尚未归类的特征
<222> (72)..(72)
<223> 位置72处的Xaa是Glu、Gly、Ala、Pro、Cys、或Asp
<220>
<221> 尚未归类的特征
<222> (73)..(73)
<223> 位置73处的Xaa是Thr、Val、Leu、或Arg
<220>
<221> 尚未归类的特征
<222> (74)..(74)
<223> 位置74处的Xaa是Ala、Leu、Met、Ser、或Arg
<220>
<221> 尚未归类的特征
<222> (77)..(77)
<223> 位置77处的Xaa是Arg、Gly、Ala、Trp、Tyr、或Glu
<220>
<221> 尚未归类的特征
<222> (78)..(78)
<223> 位置78处的Xaa是Trp、Glu、或His
<220>
<221> 尚未归类的特征
<222> (79)..(79)
<223> 位置79处的Xaa是Asp、Val、或Asn
<220>
<221> 尚未归类的特征
<222> (80)..(80)
<223> 位置80处的Xaa是Asn、Gly、Ala、Val、Leu、Ser、或Arg
<220>
<221> 尚未归类的特征
<222> (81)..(81)
<223> 位置81处的Xaa是Pro或Ser
<220>
<221> 尚未归类的特征
<222> (95)..(95)
<223> 位置95处的Xaa是Phe或Tyr
<220>
<221> 尚未归类的特征
<222> (96)..(96)
<223> 位置96处的Xaa是Phe、Met、Trp、或Lys
<220>
<221> 尚未归类的特征
<222> (106)..(106)
<223> 位置106处的Xaa是Trp或Tyr
<220>
<221> 尚未归类的特征
<222> (144)..(144)
<223> 位置144处的Xaa是Phe、Ala、Ile、Ser、或Gln
<220>
<221> 尚未归类的特征
<222> (173)..(173)
<223> 位置173处的Xaa是Thr或Tyr
<220>
<221> 尚未归类的特征
<222> (174)..(174)
<223> 位置174处的Xaa是Leu、Val、Asn、Glu、或Lys
<220>
<221> 尚未归类的特征
<222> (175)..(175)
<223> 位置175处的Xaa是Asp、Gly、Ser、Thr、或Asp
<220>
<221> 尚未归类的特征
<222> (176)..(176)
<223> 位置176处的Xaa是Gly、Gly、Ala、Leu、Phe、Cys、或Asn
<220>
<221> 尚未归类的特征
<222> (198)..(198)
<223> 位置198处的Xaa是Lys或Asn
<220>
<221> 尚未归类的特征
<222> (199)..(199)
<223> 位置199处的Xaa是Asp或Asn
<220>
<221> 尚未归类的特征
<222> (235)..(235)
<223> 位置235处的Xaa是Glu或Gln
<220>
<221> 尚未归类的特征
<222> (242)..(242)
<223> 位置242处的Xaa是Phe或Trp
<220>
<221> 尚未归类的特征
<222> (252)..(252)
<223> 位置252处的Xaa是Trp、Phe、或Cys
<220>
<221> 尚未归类的特征
<222> (290)..(290)
<223> 位置290处的Xaa是Phe或Thr
<220>
<221> 尚未归类的特征
<222> (300)..(300)
<223> 位置300处的Xaa是Trp、Val、或Glu
<220>
<221> 尚未归类的特征
<222> (318)..(318)
<223> 位置318处的Xaa是Leu、Ala、Val、Met、Phe、Cys、Asn、Gln、
Asp、Glu、Lys、或Arg
<220>
<221> 尚未归类的特征
<222> (319)..(319)
<223> 位置319处的Xaa是Leu、Gly、Ile、Met、Phe、Pro、Ser、Thr、
Cys、Tyr、Asn、或Arg
<220>
<221> 尚未归类的特征
<222> (320)..(320)
<223> 位置320处的Xaa是Asp、Gly、Ala、Val、Leu、Phe、Ser、Gln、
Arg、或His
<220>
<221> 尚未归类的特征
<222> (321)..(321)
<223> 位置321处的Xaa是Tyr、Val、Leu、Ile、Met、Phe、Ser、Thr、
Cys、Tyr、Gln、Lys、Arg、或His
<220>
<221> 尚未归类的特征
<222> (322)..(322)
<223> 位置322处的Xaa是Ser、Gly、Ala、Val、Leu、Ile、Met、Pro、
Thr、Gln、Asp、Lys、或Arg
<220>
<221> 尚未归类的特征
<222> (323)..(323)
<223> 位置323处的Xaa是Ser、Gly、Pro、Cys、Tyr、Lys、Arg、Asn、或
His
<220>
<221> 尚未归类的特征
<222> (324)..(324)
<223> 位置324处的Xaa是Ser、Ala、Val、Leu、Phe、Pro、Ser、Thr、
Gln、或Arg
<220>
<221> 尚未归类的特征
<222> (325)..(325)
<223> 位置325处的Xaa是Thr、Gly、Val、Leu、Met、Trp、Pro、Cys、
Asn、Asp、Glu、Ala、或Arg
<220>
<221> 尚未归类的特征
<222> (326)..(326)
<223> 位置326处的Xaa是Ser、Gly、Ala、Leu、Trp、Pro、Ser、Thr、
Cys、Asn、Glu、或Arg
<220>
<221> 尚未归类的特征
<222> (327)..(327)
<223> 位置327处的Xaa是Ala、Gly、Leu、Ile、Met、Trp、Pro、Asn、
Asp、Glu、Lys、或Arg
<220>
<221> 尚未归类的特征
<222> (330)..(330)
<223> 位置330处的Xaa是Gln或Glu
<220>
<221> 尚未归类的特征
<222> (331)..(331)
<223> 位置331处的Xaa是Ser或Gly
<220>
<221> 尚未归类的特征
<222> (358)..(358)
<223> 位置358处的Xaa是Ala、Ala、Ile、或Arg
<220>
<221> 尚未归类的特征
<222> (359)..(359)
<223> 位置359处的Xaa是Asp、Gly、Val、Leu、Trp、Ser、Thr、Tyr、或
Lys
<220>
<221> 尚未归类的特征
<222> (361)..(361)
<223> 位置361处的Xaa是Ile、Met、或Ser
<220>
<221> 尚未归类的特征
<222> (362)..(362)
<223> 位置362处的Xaa是Arg、Val、Leu、Met、Ser、Tyr、Asn、Glu、或
Lys
<220>
<221> 尚未归类的特征
<222> (364)..(364)
<223> 位置364处的Xaa是Val、或Phe
<220>
<221> 尚未归类的特征
<222> (365)..(365)
<223> 位置365处的Xaa是Lys、Leu、或Thr
<220>
<221> 尚未归类的特征
<222> (366)..(366)
<223> 位置366处的Xaa是Asn、或Gln
<220>
<221> 尚未归类的特征
<222> (367)..(367)
<223> 位置367处的Xaa是Gly、Gly、Ala、Val、Leu、Thr、或Gln
<220>
<221> 尚未归类的特征
<222> (401)..(401)
<223> 位置401处的Xaa是Gln、Gly、Ala、Trp、Thr、Cys、Asn、或Arg
<220>
<221> 尚未归类的特征
<222> (402)..(402)
<223> 位置402处的Xaa是Ile、Gly、Leu、Phe、Ser、Tyr、Gln、Lys、或
Arg
<220>
<221> 尚未归类的特征
<222> (403)..(403)
<223> 位置403处的Xaa是Thr、Gly、Ala、Leu、或Asp
<220>
<221> 尚未归类的特征
<222> (404)..(404)
<223> 位置404处的Xaa是Glu、Gly、Ala、Val、Ser、Tyr、Gln、或Lys
<220>
<221> 尚未归类的特征
<222> (405)..(405)
<223> 位置405处的Xaa是Glu、Ala、Val、Ile、Pro、Ser、Asp、或Arg
<220>
<221> 尚未归类的特征
<222> (406)..(406)
<223> 位置406处的Xaa是Leu、或Val
<220>
<221> 尚未归类的特征
<222> (407)..(407)
<223> 位置407处的Xaa是Pro、Ala、Leu、Ser、Gln、或His
<220>
<221> 尚未归类的特征
<222> (408)..(408)
<223> 位置408处的Xaa是Leu、Val、Met、Phe、Pro、Ser、或Asp
<220>
<221> 尚未归类的特征
<222> (409)..(409)
<223> 位置409处的Xaa是Tyr、Met、或Ser
<220>
<221> 尚未归类的特征
<222> (410)..(410)
<223> 位置410处的Xaa是Asp、Gly、Val、Leu、Ile、Trp、Tyr、Asp、或
Glu
<220>
<221> 尚未归类的特征
<222> (413)..(413)
<223> 位置413处的Xaa是Gln、或Glu
<220>
<221> 尚未归类的特征
<222> (424)..(424)
<223> 位置424处的Xaa是Gly、Ala、或Met
<220>
<221> 尚未归类的特征
<222> (425)..(425)
<223> 位置425处的Xaa是Lys、Gly、Val、Phe、或Arg
<220>
<221> 尚未归类的特征
<222> (426)..(426)
<223> 位置426处的Xaa是Ile、Val、或Leu
<220>
<221> 尚未归类的特征
<222> (427)..(427)
<223> 位置427处的Xaa是Leu、Val、或Ile
<220>
<221> 尚未归类的特征
<222> (429)..(429)
<223> 位置429处的Xaa是Lys、Val、Met、或Ser
<220>
<221> 尚未归类的特征
<222> (431)..(431)
<223> 位置431处的Xaa是Asn、或Glu
<220>
<221> 尚未归类的特征
<222> (432)..(432)
<223> 位置432处的Xaa是Ser、Gly、或Cys
<220>
<221> 尚未归类的特征
<222> (433)..(433)
<223> 位置433处的Xaa是Gln、Gly、Ile、Thr、Asp、或Glu
<220>
<221> 尚未归类的特征
<222> (434)..(434)
<223> 位置434处的Xaa是Leu、Gln、或His
<220>
<221> 尚未归类的特征
<222> (478)..(478)
<223> 位置478处的Xaa是Asn、或His
<220>
<221> 尚未归类的特征
<222> (479)..(479)
<223> 位置479处的Xaa是Asp、Gly、Ala、Val、Met、Pro、Ser、Thr、
Tyr、Lys、或His
<220>
<221> 尚未归类的特征
<222> (480)..(480)
<223> 位置480处的Xaa是Ser、Ala、Phe、Asn、Asp、Glu、或Arg
<220>
<221> 尚未归类的特征
<222> (481)..(481)
<223> 位置481处的Xaa是Ser、或Trp
<220>
<221> 尚未归类的特征
<222> (484)..(484)
<223> 位置484处的Xaa是Tyr、Phe、或Asn
<220>
<221> 尚未归类的特征
<222> (485)..(485)
<223> 位置485处的Xaa是Lys、Gly、Ala、Leu、Met、Pro、Ser、Thr、
Gln、Glu、或Arg
<220>
<221> 尚未归类的特征
<222> (487)..(487)
<223> 位置487处的Xaa是Ser、Gly、Val、Leu、Ile、Tyr、Asn、或Lys
<220>
<221> 尚未归类的特征
<222> (488)..(488)
<223> 位置488处的Xaa是Ala、Phe、Asp、或Arg
<220>
<221> 尚未归类的特征
<222> (489)..(489)
<223> 位置489处的Xaa是Ala、Gly、Val、Pro、Cys、Asp、或Lys
<220>
<221> 尚未归类的特征
<222> (490)..(490)
<223> 位置490处的Xaa是Val、Ala、Val、Leu、Phe、Ser、Thr、或Cys
<220>
<221> 尚未归类的特征
<222> (491)..(491)
<223> 位置491处的Xaa是Cys、或Gly
<220>
<221> 尚未归类的特征
<222> (492)..(492)
<223> 位置492处的Xaa是Phe、或Ile
<220>
<221> 尚未归类的特征
<222> (494)..(494)
<223> 位置494处的Xaa是Tyr、Gly、或Trp
<220>
<221> 尚未归类的特征
<222> (496)..(496)
<223> 位置496处的Xaa是Leu、Ile、Met、或Phe
<220>
<221> 尚未归类的特征
<222> (497)..(497)
<223> 位置497处的Xaa是Glu、Ala、或Asp
<220>
<221> 尚未归类的特征
<222> (499)..(499)
<223> 位置499处的Xaa是Phe、Ala、或Met
<400> 69
Met Gln Thr Thr Val Ser Glu Thr Leu Val Ser Gly Ser Asp Pro Arg
1 5 10 15
Leu Gln Val Ser Met Gly Asn Glu Thr Ala Asn Gly Arg Trp Asp Asn
20 25 30
Pro Tyr Ala Ile Gln Phe Thr Xaa Ser Ile Ala Gly Arg Gln Phe Xaa
35 40 45
Tyr Gly Gln Asn Leu Lys Thr His Tyr Xaa Phe Ile Gln Glu Leu Leu
50 55 60
Pro Gly Gly Lys Xaa Xaa Xaa Xaa Xaa Xaa Asn Gly Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Tyr Ala Val Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Xaa Xaa
85 90 95
Tyr Gly Gln Asn Leu Glu Thr Asn Tyr Xaa Phe Ile Gln Glu Leu Leu
100 105 110
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Arg Trp Asn Asn
115 120 125
Pro Tyr Ala Ser Gln Phe Ala Phe Ser Val Gly Gly Arg Gln Phe Xaa
130 135 140
Tyr Gly Gln Asn Leu Lys Thr Asn Tyr Trp Phe Ile Gln Glu Leu Leu
145 150 155 160
Ala Gly Gly Lys Met Gly Gln Glu Thr Ala Asn Gly Xaa Xaa Xaa Xaa
165 170 175
Pro Phe Ala Val Gln Phe Pro Phe Ser Val Gly Gly Ser Gln Tyr Phe
180 185 190
Tyr Gly Gln Asn Ile Xaa Xaa Arg Ser Trp Phe Ile Lys Glu Leu Leu
195 200 205
Ala Gly Gly Lys Val Gly Lys Thr Thr Ala Ser Gly Arg Trp Asp Asn
210 215 220
Ala Tyr Ala Val Gln Phe Ala Tyr Pro Ala Xaa Gln Tyr Gly Arg Gln
225 230 235 240
Tyr Xaa Tyr Gly Gln Asn Leu Asp Thr Asn Tyr Xaa Phe Val Gln Glu
245 250 255
Leu Leu Pro Gly Gly Ala Met Gly Glu Glu Ile Met Asn Gly Arg Trp
260 265 270
Gly Asn Pro Tyr Ala Thr Gln Phe Ala Tyr Glu Gln Gly Gly Ile Ser
275 280 285
Tyr Xaa Tyr Gly Gln Asn Gln Ser Ser Asn Tyr Xaa Phe Ile Gln Glu
290 295 300
Leu Leu Ser Asp Thr Glu Tyr Thr Val Arg Arg Leu Pro Xaa Xaa Xaa
305 310 315 320
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Gln Xaa Xaa Ala Pro Gly Val Cys
325 330 335
Leu Asp Ala Asp Ser Ser Thr Ser Tyr Gln Pro Ser Tyr Ala Val Gly
340 345 350
Trp Ser Pro Tyr Leu Xaa Xaa Trp Xaa Xaa Tyr Xaa Xaa Xaa Xaa Gly
355 360 365
Pro Ile Phe Lys Tyr His Asp Pro Ala Glu Ile Asp Gly Val Gly Ile
370 375 380
Leu Leu Pro Met Arg Asn Gly Lys Leu Tyr Gly Asp Gln Leu Lys Arg
385 390 395 400
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys Ser Xaa Gly His Tyr
405 410 415
Ser Trp Val Leu Thr Pro Gly Xaa Xaa Xaa Xaa Tyr Xaa Trp Xaa Xaa
420 425 430
Xaa Xaa Glu Leu Asp Ser Arg Gln Tyr Thr Arg His Ser Asp Leu Asn
435 440 445
Gln Gly Arg Pro Val Thr Cys Ala Gly Glu Phe Tyr Leu Thr Arg Arg
450 455 460
Ser Ser Asn Ile Phe Leu Thr Glu Leu Tyr Ile Glu Ile Xaa Xaa Xaa
465 470 475 480
Xaa Gly His Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Val Xaa
485 490 495
Xaa Glu Xaa Glu Ala Leu Gly Ile Asp Leu Asn Asn Ile Glu Gly Val
500 505 510
Tyr Thr Arg Asn
515
<210> 70
<211> 50
<212> PRT
<213> 人工序列
<220>
<223> N-末端重复基序
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr、或Asp
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 位置2处的Xaa是Gly、或Asn
<220>
<221> 尚未归类的特征
<222> (3)..(3)
<223> 位置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu、或
His
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> 位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro、或Cys
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> 位置5处的Xaa是Thr、Ser、Leu、Val、Arg、或Ile
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> 位置6处的Xaa是Ala、Met、Leu、Ser、或Arg
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> 位置7处的Xaa是Asn、Gln、Thr、或Ser
<220>
<221> 尚未归类的特征
<222> (9)..(9)
<223> 位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr、或
Glu
<220>
<221> 尚未归类的特征
<222> (10)..(10)
<223> 位置10处的Xaa是Trp、Ile、Val、Glu、His、或Leu
<220>
<221> 尚未归类的特征
<222> (11)..(11)
<223> 位置11处的Xaa是Asp、Asn、Glu、Gln、Val、或Gly
<220>
<221> 尚未归类的特征
<222> (12)..(12)
<223> 位置12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg、或Gly
<220>
<221> 尚未归类的特征
<222> (13)..(13)
<223> 位置13处的Xaa是Pro、Ser、Thr、或Ala
<220>
<221> 尚未归类的特征
<222> (14)..(14)
<223> 位置14处的Xaa是Tyr或Phe
<220>
<221> 尚未归类的特征
<222> (16)..(16)
<223> 位置16处的Xaa是Ile、Ser、Val、Leu、或Thr
<220>
<221> 尚未归类的特征
<222> (17)..(17)
<223> 位置17处的Xaa是Gln或Asn
<220>
<221> 尚未归类的特征
<222> (19)..(19)
<223> 位置19处的Xaa是Thr、Ala、Ser、或Pro
<220>
<221> 尚未归类的特征
<222> (20)..(20)
<223> 位置20处的Xaa是Tyr或Phe
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> 位置21处的Xaa是Pro或缺失
<220>
<221> 尚未归类的特征
<222> (22)..(22)
<223> 位置22处的Xaa是Ala或缺失
<220>
<221> 尚未归类的特征
<222> (23)..(23)
<223> 位置23处的Xaa是Ser、Glu、Asp、Asn、Thr、或Gln
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> 位置24处的Xaa是Ile、Val、Leu、Asn、或Gln
<220>
<221> 尚未归类的特征
<222> (25)..(25)
<223> 位置25处的Xaa是Ala、Gly、或Tyr
<220>
<221> 尚未归类的特征
<222> (27)..(27)
<223> 位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val、或Ile
<220>
<221> 尚未归类的特征
<222> (28)..(28)
<223> 位置28处的Xaa是Gln、Asn、Thr、或Ser
<220>
<221> 尚未归类的特征
<222> (29)..(29)
<223> 位置29处的Xaa是Phe、或Tyr
<220>
<221> 尚未归类的特征
<222> (30)..(30)
<223> 位置30处的Xaa是Phe、Tyr、或Trp
<220>
<221> 尚未归类的特征
<222> (33)..(33)
<223> 位置33处的Xaa是Gln或Asn
<220>
<221> 尚未归类的特征
<222> (34)..(34)
<223> 位置34处的Xaa是Asn、或Gln
<220>
<221> 尚未归类的特征
<222> (35)..(35)
<223> 位置35处的Xaa是Leu、Ile、Val、Asn、或Gln
<220>
<221> 尚未归类的特征
<222> (36)..(36)
<223> 位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、Thr、或Asp
<220>
<221> 尚未归类的特征
<222> (37)..(37)
<223> 位置37处的Xaa是Thr、Asp、Asn、Gln、Glu、或Ser
<220>
<221> 尚未归类的特征
<222> (38)..(38)
<223> 位置38处的Xaa是His、Asn、Gln、Lys、或Arg
<220>
<221> 尚未归类的特征
<222> (39)..(39)
<223> 位置39处的Xaa是Tyr、Phe、Thr、或Ser
<220>
<221> 尚未归类的特征
<222> (40)..(40)
<223> 位置40处的Xaa是Trp、Tyr、或Phe
<220>
<221> 尚未归类的特征
<222> (42)..(42)
<223> 位置42处的Xaa是Ile、Leu、或Val
<220>
<221> 尚未归类的特征
<222> (43)..(43)
<223> 位置43处的Xaa是Gln、Asn、Arg、或Lys
<220>
<221> 尚未归类的特征
<222> (47)..(47)
<223> 位置47处的Xaa是Pro、Ala、或缺失
<220>
<221> 尚未归类的特征
<222> (48)..(48)
<223> 位置48处的Xaa是Gly、或缺失
<220>
<221> 尚未归类的特征
<222> (49)..(49)
<223> 位置49处的Xaa是Gly、或缺失
<220>
<221> 尚未归类的特征
<222> (50)..(50)
<223> 位置处50的Xaa是Lys、Ala、Arg、或缺失
<400> 70
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa
1 5 10 15
Xaa Phe Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Tyr Gly
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Xaa Xaa Glu Leu Leu Xaa Xaa
35 40 45
Xaa Xaa
50
<210> 71
<211> 50
<212> PRT
<213> 人工序列
<220>
<223> N-末端重复基序
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 位置1处的Xaa是Met、Val、Leu、Ser、Thr、或Asp
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 位置2处的Xaa是Gly、或Asn
<220>
<221> 尚未归类的特征
<222> (3)..(3)
<223> 位置3处的Xaa是Asn、Gln、Glu、Lys、Ser、Leu、或His
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> 位置4处的Xaa是Glu、Asp、Thr、Gly、Ala、Pro、或Cys
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> 位置5处的Xaa是Thr、Leu、Val、Arg、或Ile
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> 位置6处的Xaa是Ala、Met、Leu、Ser、或Arg
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> 位置7处的Xaa是Asn或Ser
<220>
<221> 尚未归类的特征
<222> (9)..(9)
<223> 位置9处的Xaa是Arg、Thr、Gly、Ala、Trp、Tyr、或Glu
<220>
<221> 尚未归类的特征
<222> (10)..(10)
<223> 位置10处的Xaa是Trp、Val、Glu、His、或Leu
<220>
<221> 尚未归类的特征
<222> (11)..(11)
<223> 位置11处的Xaa是Asp、Asn、Val、或Gly
<220>
<221> 尚未归类的特征
<222> (12)..(12)
<223> 位置12处的Xaa是Asn、Ala、Val、Leu Ser、Arg、或Gly
<220>
<221> 尚未归类的特征
<222> (13)..(13)
<223> 位置13处的Xaa是Pro、Ser、或Ala
<220>
<221> 尚未归类的特征
<222> (14)..(14)
<223> 位置14处的Xaa是Tyr或Phe
<220>
<221> 尚未归类的特征
<222> (16)..(16)
<223> 位置16处的Xaa是Ile、Ser、Val、或Thr
<220>
<221> 尚未归类的特征
<222> (19)..(19)
<223> 位置19处的Xaa是Thr、Ala、或Pro
<220>
<221> 尚未归类的特征
<222> (20)..(20)
<223> 位置20处的Xaa是Tyr或Phe
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> 位置21处的Xaa是Pro或缺失
<220>
<221> 尚未归类的特征
<222> (22)..(22)
<223> 位置处的Xaa是 22是Ala、或缺失
<220>
<221> 尚未归类的特征
<222> (23)..(23)
<223> 位置23处的Xaa是Ser、Glu、Thr、或Gln
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> 位置24处的Xaa是Ile、Val、或Gln
<220>
<221> 尚未归类的特征
<222> (25)..(25)
<223> 位置25处的Xaa是Ala、Gly、或Tyr
<220>
<221> 尚未归类的特征
<222> (27)..(27)
<223> 位置27处的Xaa是Arg、Ser、或Ile
<220>
<221> 尚未归类的特征
<222> (28)..(28)
<223> 位置28处的Xaa是Gln或Ser
<220>
<221> 尚未归类的特征
<222> (29)..(29)
<223> 位置29处的Xaa是Phe或Tyr
<220>
<221> 尚未归类的特征
<222> (30)..(30)
<223> 位置30处的Xaa是Phe、Tyr、或Trp
<220>
<221> 尚未归类的特征
<222> (35)..(35)
<223> 位置35处的Xaa是Leu、Ile、或Gln
<220>
<221> 尚未归类的特征
<222> (36)..(36)
<223> 位置36处的Xaa是Lys、Asn、Glu、Ser、或Asp
<220>
<221> 尚未归类的特征
<222> (37)..(37)
<223> 位置37处的Xaa是Thr、Asp、Asn、或Ser
<220>
<221> 尚未归类的特征
<222> (38)..(38)
<223> 位置38处的Xaa是His、Asn、或Arg
<220>
<221> 尚未归类的特征
<222> (39)..(39)
<223> 位置39处的Xaa是Tyr或Ser
<220>
<221> 尚未归类的特征
<222> (40)..(40)
<223> 位置40处的Xaa是Trp、Tyr、或Phe
<220>
<221> 尚未归类的特征
<222> (42)..(42)
<223> 位置42处的Xaa是Ile或Va
<220>
<221> 尚未归类的特征
<222> (43)..(43)
<223> 位置43处的Xaa是Gln或Lys
<220>
<221> 尚未归类的特征
<222> (47)..(47)
<223> 位置47处的Xaa是Pro、Ala、或缺失
<220>
<221> 尚未归类的特征
<222> (48)..(48)
<223> 位置48处的Xaa是Gly或缺失
<220>
<221> 尚未归类的特征
<222> (49)..(49)
<223> 位置49处的Xaa是Gly或缺失
<220>
<221> 尚未归类的特征
<222> (50)..(50)
<223> 位置50处的Xaa是Lys、Ala、或缺失
<400> 71
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa
1 5 10 15
Gln Phe Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Tyr Gly
20 25 30
Gln Asn Xaa Xaa Xaa Xaa Xaa Xaa Phe Xaa Xaa Glu Leu Leu Xaa Xaa
35 40 45
Xaa Xaa
50

Claims (35)

1.一种重组杀昆虫多肽,其包含:
a)包含氨基酸序列基序的N-末端区域,该氨基酸序列基序与如由式
XXXXXXXGXXXXXXAXXFXXXXXXXGXXXXYGXXXXXXXXFXXELLXXXX(SEQ ID NO:70)表示的氨基酸序列具有至少90%同一性,其中
位置1处的Xaa是Met、Val、Ile、Leu、Ser、Thr或Asp;
位置2处的Xaa是Gly或Asn;
位置3处的Xaa是Asn、Gln、Glu、Asp、Arg、Lys、Ser、Leu或His;
位置4处的Xaa是Glu、Asp、Ser、Thr、Gly、Ala、Pro或Cys;
位置5处的Xaa是Thr、Ser、Leu、Val、Arg或Ile;
位置6处的Xaa是Ala、Met、Leu、Ser或Arg;
位置7处的Xaa是Asn、Gln、Thr或Ser;
位置9处的Xaa是Arg、Lys、Ser、Thr、Gly、Ala、Trp、Tyr或Glu;
位置10处的Xaa是Trp、Ile、Val、Glu、His或Leu;
位置11处的Xaa是Asp、Asn、Glu、Gln、Val或Gly;
位置12处的Xaa是Asn、Gln、Ala、Val、Leu Ser、Arg或Gly;
位置13处的Xaa是Pro、Ser、Thr或Ala;
位置14处的Xaa是Tyr或Phe;
位置16处的Xaa是Ile、Ser、Val、Leu或Thr;
位置17处的Xaa是Gln或Asn;
位置19处的Xaa是Thr、Ala、Ser或Pro;
位置20处的Xaa是Tyr或Phe;
位置21处的Xaa是Pro或缺失;
位置22处的Xaa是Ala或缺失;
位置23处的Xaa是Ser、Glu、Asp、Asn、Thr或Gln;
位置24处的Xaa是Ile、Val、Leu、Asn或Gln;
位置25处的Xaa是Ala、Gly或Tyr;
位置27处的Xaa是Arg、Ser、Lys、Thr、Leu、Val或Ile;
位置28处的Xaa是Gln、Asn、Thr或Ser;
位置29处的Xaa是Phe或Tyr;
位置30处的Xaa是Phe、Tyr或Trp;
位置33处的Xaa是Gln或Asn;
位置34处的Xaa是Asn或Gln;
位置35处的Xaa是Leu、Ile、Val、Asn或Gln;
位置36处的Xaa是Lys、Asn、Glu、Ser、Arg、Gln、Thr或Asp;
位置37处的Xaa是Thr、Asp、Asn、Gln、Glu或Ser;
位置38处的Xaa是His、Asn、Gln、Lys或Arg;
位置39处的Xaa是Tyr、Phe、Thr或Ser;
位置40处的Xaa是Trp、Tyr或Phe;
位置42处的Xaa是Ile、Leu或Val:
位置43处的Xaa是Gln、Asn、Arg或Lys;
位置47处的Xaa是Pro、Ala或缺失;
位置48处的Xaa是Gly或缺失;
位置49处的Xaa是Gly或缺失;和
位置50处的Xaa是Lys、Ala、Arg或缺失;和
b)包含与SEQ ID NO:2的残基379至514具有至少80%同一性的氨基酸序列的C-末端区域。
2.如权利要求1所述的重组杀昆虫多肽,其中该N-末端区域包含该氨基酸序列基序的六个重复序列。
3.如权利要求1或2所述的重组杀昆虫多肽,其中该氨基酸序列基序选自SEQ ID NO:2的氨基酸残基21-68、SEQ ID NO:4的残基1-48、SEQ ID NO:2的残基117-164、SEQ ID NO:4的残基97-144、SEQ ID NO:2的残基165-212、SEQ ID NO:4的残基145-192、SEQ ID NO:2的残基69-116、SEQ ID NO:4的残基49-96、SEQ ID NO:2的残基263-306、SEQ ID NO:4的残基243-286、SEQ ID NO:2的残基213-262、或SEQ ID NO:4的残基193-242。
4.如权利要求1所述的重组杀昆虫多肽,其中该多肽包含与SEQ ID NO:2的氨基酸序列具有高于97%同一性的氨基酸序列。
5.一种重组杀昆虫多肽,该多肽选自下组:
a)包含与SEQ ID NO:6具有高于80%同一性的氨基酸序列的多肽;
b)包含与SEQ ID NO:8具有高于80%同一性的氨基酸序列的多肽;
c)包含与SEQ ID NO:20具有高于96%同一性的氨基酸序列的多肽;
d)包含与SEQ ID NO:22具有高于96%同一性的氨基酸序列的多肽;
e)包含与SEQ ID NO:24具有高于85%同一性的氨基酸序列的多肽;
f)包含与SEQ ID NO:26具有高于85%同一性的氨基酸序列的多肽
g)包含与SEQ ID NO:16具有高于80%同一性的氨基酸序列的多肽;
h)包含与SEQ ID NO:28具有高于80%同一性的氨基酸序列的多肽;
i)包含SEQ ID NO:2的氨基酸序列的多肽;
j)包含SEQ ID NO:6的氨基酸序列的多肽;
k)包含SEQ ID NO:8的氨基酸序列的多肽
l)包含SEO ID NO:20的氨基酸序列的多肽;
m)包含SEQ ID NO:22的氨基酸序列的多肽;
n)包含SEQ ID NO:24的氨基酸序列的多肽;
o)包含SEQ ID NO:26的氨基酸序列的多肽;
p)包含SEQ ID NO:16的氨基酸序列的多肽;和
q)包含SEQ ID NO:28的氨基酸序列的多肽。
6.一种包含如权利要求1、2、3、4或5中所述的重组杀昆虫多肽的组合物。
7.一种组合物,该组合物包含:
a)含有N-末端区域的第一多肽片段,其包含与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的氨基酸序列;和
b)含有C-末端区域的第二多肽片段,其包含与SEQ ID NO:2的残基379-514、SEQ IDNO:4的残基359-494、SEQ ID NO:6的残基174-302、SEQ ID NO:8的残基174-302、SEQ IDNO:10的残基171-324、SEQ ID NO:12的残基227-359、SEQ ID NO:16的残基415-548、SEQ IDNO:18的残基419-552、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残基196-324、SEQ IDNO:24的残基568-700、SEQ ID NO:26的残基568-700、或SEQ ID NO:28的残基415-548具有至少80%序列同一性的氨基酸序列,其中该组合物具有杀昆虫活性。
8.一种嵌合多肽,该多肽包含:a)第一多肽的N-末端区域,其与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQID NO:10的残基1-131、SEQ ID NO:12的残基1-186、SEQ ID NO:16的残基1-374、SEQ IDNO:18的残基1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性;和b)第二多肽的C-末端区域,其与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:6的残基174-302、SEQ ID NO:8的残基174-302、SEQ ID NO:10的残基171-324、SEQ ID NO:12的残基227-359、SEQ ID NO:16的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残基196-324、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、或SEQ ID NO:28的残基415-548具有至少80%序列同一性,其中该N-末端区域与C-末端区域可操作地连接。
9.如权利要求8所述的嵌合多肽,其中该嵌合多肽包含与SEQ ID NO:52、SEQ ID NO:54、SE ID NO:56、或SEQ ID NO:58具有至少80%序列同一性的氨基酸序列。
10.一种重组多核苷酸,该多核苷酸编码如权利要求1、2、3、4或5中所述的杀昆虫多肽。
11.如权利要求10所述的重组多核苷酸,其中所述多核苷酸是非基因组多核苷酸。
12.一种重组多核苷酸,该多核苷酸编码如权利要求8或9所述的嵌合蛋白。
13.一种DNA构建体,该构建体包含与异源调节元件可操作地连接的、如权利要求10或11所述的重组多核苷酸。
14.一种DNA构建体,该构建体包含与异源调节元件可操作地连接的、如权利要求12所述的重组多核苷酸。
15.一种包含多核苷酸的DNA构建体,该多核苷酸包含第一编码序列和第二编码序列,所述第一编码序列编码第一杀昆虫多肽的N-末端区域,所述N-末端区域包含与SEQ ID NO:2的残基1-337、SEQ ID NO:4的残基1-317、SEQ ID NO:6的残基1-134、SEQ ID NO:8的残基1-134、SEQ ID NO:10的残基1-131、SEQ ID NO:12的残基1-186、SEQ ID NO:16的残基1-374、SEQ ID NO:18的残基1-379、SEQ ID NO:20的残基1-156、SEQ ID NO:22的残基1-156、SEQ ID NO:24的残基1-528、SEQ ID NO:26的残基1-528、或SEQ ID NO:28的残基1-374具有至少80%序列同一性的氨基酸序列,所述第二编码序列编码C-末端区域,所述C-末端区域包含与SEQ ID NO:2的残基379-514、SEQ ID NO:4的残基359-494、SEQ ID NO:6的残基174-302、SEQ ID NO:8的残基174-302、SEQ ID NO:10的残基171-324、SEQ ID NO:12的残基227-359、SEQ ID NO:16的残基415-548、SEQ ID NO:18的残基419-552、SEQ ID NO:20的残基196-324、SEQ ID NO:22的残基196-324、SEQ ID NO:24的残基568-700、SEQ ID NO:26的残基568-700、或SEQ ID NO:28的残基415-548具有至少80%序列同一性的氨基酸序列。
16.如权利要求15所述的DNA构建体,该构建体进一步包含与编码N-末端区域和C-末端区域的多核苷酸可操作地连接的异源性启动子,其中该启动子的单拷贝驱动两种编码序列的表达。
17.如权利要求15所述的DNA构建体,该构建体进一步包含与第一编码序列可操作地连接的第一异源性启动子和与第二编码序列可操作地连接的第二异源性启动子。
18.一种转基因植物或植物细胞,该转基因植物或植物细胞包含如权利要求13所述的DNA构建体。
19.一种转基因植物或植物细胞,该转基因植物或植物细胞包含如权利要求14所述的DNA构建体。
20.一种转基因植物或植物细胞,该转基因植物或植物细胞包含如权利要求15所述的DNA构建体。
21.一种转基因植物或植物细胞,该转基因植物或植物细胞包含如权利要求16所述的DNA构建体。
22.一种转基因植物或植物细胞,该转基因植物或植物细胞包含如权利要求17所述的DNA构建体。
23.一种重组多核苷酸,该多核苷酸编码如权利要求8或9所述的嵌合多肽。
24.一种DNA构建体,该构建体包含与异源性启动子可操作地连接的、如权利要求23所述的重组多核苷酸。
25.一种包含如权利要求24所述的DNA构建体的转基因植物。
26.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括使该昆虫有害生物与如权利要求1-5中任一项所述的杀昆虫多肽接触。
27.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括使该昆虫有害生物与如权利要求6所述的组合物接触。
28.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括使该昆虫有害生物与如权利要求7所述的组合物接触。
29.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括使该昆虫有害生物与如权利要求8或9所述的嵌合多肽接触。
30.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括在植物中表达如权利要求10或11所述的多核苷酸。
31.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括在植物中表达如权利要求12所述的多核苷酸。
32.如权利要求26-31中任一项所述的方法,其中所述有害生物物种或群体对至少一种Cry杀昆虫蛋白有抗性。
33.一种DNA构建体,该构建体包含编码SEQ ID NO:4、10、12、14或18的多肽的多核苷酸。
34.一种包含如权利要求33所述的DNA构建体的转基因植物。
35.一种抑制昆虫有害生物或有害生物群体生长或将其杀灭的方法,该方法包括在植物中表达如权利要求34所述的DNA构建体的多核苷酸。
CN201680074133.0A 2015-12-18 2016-12-08 杀昆虫蛋白及其使用方法 Pending CN108575091A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562269482P 2015-12-18 2015-12-18
US62/269482 2015-12-18
PCT/US2016/065531 WO2017105987A1 (en) 2015-12-18 2016-12-08 Insecticidal proteins and methods for their use

Publications (1)

Publication Number Publication Date
CN108575091A true CN108575091A (zh) 2018-09-25

Family

ID=57796969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680074133.0A Pending CN108575091A (zh) 2015-12-18 2016-12-08 杀昆虫蛋白及其使用方法

Country Status (5)

Country Link
US (1) US20180325119A1 (zh)
EP (1) EP3390431A1 (zh)
CN (1) CN108575091A (zh)
CA (1) CA3002995A1 (zh)
WO (1) WO2017105987A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021003797A2 (pt) 2018-08-29 2021-05-25 Pioneer Hi-Bred International, Inc. proteínas inseticidas e métodos para seu uso
EP3893647A1 (en) 2018-12-14 2021-10-20 Pioneer Hi-Bred International, Inc. Biologicals and their use in plants
WO2021076346A1 (en) 2019-10-18 2021-04-22 Pioneer Hi-Bred International, Inc. Maize event dp-202216-6 and dp-023211-2 stack
TW202142114A (zh) 2020-02-04 2021-11-16 美商陶氏農業科學公司 具有殺有害生物效用之組成物及與其相關之方法
BR112022027035A2 (pt) 2020-07-14 2023-04-11 Pioneer Hi Bred Int Proteínas inseticidas e métodos para uso das mesmas
CN116096903A (zh) 2020-08-10 2023-05-09 先锋国际良种公司 植物调节元件及其使用方法
TW202345696A (zh) 2022-05-18 2023-12-01 美商科迪華農業科技有限責任公司 具有殺有害生物效用之組成物及與其相關的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015023846A2 (en) * 2013-08-16 2015-02-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2015038734A2 (en) * 2013-09-13 2015-03-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN104651377A (zh) * 2013-11-25 2015-05-27 浙江大学 新型的杀虫蛋白
CN104968672A (zh) * 2012-07-02 2015-10-07 先锋国际良种公司 新型杀昆虫蛋白及其使用方法

Family Cites Families (330)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US628283A (en) 1898-05-25 1899-07-04 Edgar W Parsons Tramway.
US3710511A (en) 1971-04-21 1973-01-16 Univ Illinois Procedures for use of genic male sterility in production of commercial hybrid maize
US3861709A (en) 1973-07-12 1975-01-21 Amsted Ind Inc Shiftable fifth wheel construction
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
US4714681A (en) 1981-07-01 1987-12-22 The Board Of Reagents, The University Of Texas System Cancer Center Quadroma cells and trioma cells and methods for the production of same
US4716111A (en) 1982-08-11 1987-12-29 Trustees Of Boston University Process for producing human antibodies
US4713325A (en) 1983-06-14 1987-12-15 The Regents Of The University Of California Hybridomas producing monoclonal antibodies specific for FeLV p27
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4716117A (en) 1984-10-26 1987-12-29 Chiron Corporation Monoclonal antibodies to factor VIIIC
CA1207852A (en) 1984-02-29 1986-07-15 William D. Cornish Non-resonant microwave frequency halver
US4761373A (en) 1984-03-06 1988-08-02 Molecular Genetics, Inc. Herbicide resistance in plants
US5304732A (en) 1984-03-06 1994-04-19 Mgi Pharma, Inc. Herbicide resistance in plants
US5331107A (en) 1984-03-06 1994-07-19 Mgi Pharma, Inc. Herbicide resistance in plants
US4720459A (en) 1985-02-14 1988-01-19 Medical College Of Wisconsin Research Foundation, Inc. Myelomas for producing human/human hybridomas
US6492107B1 (en) 1986-11-20 2002-12-10 Stuart Kauffman Process for obtaining DNA, RNA, peptides, polypeptides, or protein, by recombinant DNA technique
GB2183661B (en) 1985-03-30 1989-06-28 Marc Ballivet Method for obtaining dna, rna, peptides, polypeptides or proteins by means of a dna recombinant technique
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4654465A (en) 1985-07-18 1987-03-31 Agracetus Genic male-sterile maize
US5576195A (en) 1985-11-01 1996-11-19 Xoma Corporation Vectors with pectate lyase signal sequence
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US5605011A (en) 1986-08-26 1997-02-25 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
US5378824A (en) 1986-08-26 1995-01-03 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
US5013659A (en) 1987-07-27 1991-05-07 E. I. Du Pont De Nemours And Company Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US4727219A (en) 1986-11-28 1988-02-23 Agracetus Genic male-sterile maize using a linked marker gene
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
DE69033816T2 (de) 1989-02-24 2002-08-08 Monsanto Technology Llc Synthetische pflanzengene und verfahren zu ihrer herstellung
US5110732A (en) 1989-03-14 1992-05-05 The Rockefeller University Selective gene expression in plants
US5188960A (en) 1989-06-27 1993-02-23 Mycogen Corporation Bacillus thuringiensis isolate active against lepidopteran pests, and genes encoding novel lepidopteran-active toxins
DE69133128T2 (de) 1990-04-12 2003-06-18 Syngenta Participations Ag Gewebe-spezifische Promotoren
US5432068A (en) 1990-06-12 1995-07-11 Pioneer Hi-Bred International, Inc. Control of male fertility using externally inducible promoter sequences
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5266317A (en) 1990-10-04 1993-11-30 University Of Georgia Research Foundation, Inc. Insect-specific paralytic neurotoxin genes for use in biological insect control: methods and compositions
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
ATE381622T1 (de) 1991-02-07 2008-01-15 Bayer Bioscience Nv Staubblatt spezifische promotoren aus mais
DE69233636D1 (de) 1991-02-08 2006-08-17 Bayer Bioscience Nv Staubblatt spezifische promotoren aus reis
MX9200621A (es) 1991-02-14 1993-02-01 Du Pont Gen de una proteina con alto contenido de azufre de una semilla y metodo para aumentar el contenido de azufre en aminoacidos de las plantas.
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
GB9115909D0 (en) 1991-07-23 1991-09-04 Nickerson Int Seed Recombinant dna
US5731180A (en) 1991-07-31 1998-03-24 American Cyanamid Company Imidazolinone resistant AHAS mutants
JPH07502163A (ja) 1991-08-09 1995-03-09 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 植物の栄養価改良用のプログラム可能水準の必須アミノ酸類を含有する規定された構造を有する合成貯蔵蛋白質
DE69230290T2 (de) 1991-08-27 2000-07-20 Novartis Ag Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz
EP0612208B1 (en) 1991-10-04 2004-09-15 North Carolina State University Pathogen-resistant transgenic plants
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
WO1993011245A1 (en) 1991-12-04 1993-06-10 E.I. Du Pont De Nemours And Company Fatty acid desaturase genes from plants
US5773691A (en) 1992-03-19 1998-06-30 E. I. Du Pont De Nemours And Company Chimeric genes and methods for increasing the lysine and threonine content of the seeds of plants
DK39692D0 (da) 1992-03-25 1992-03-25 Danisco Biologisk materiale
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
US6372965B1 (en) 1992-11-17 2002-04-16 E.I. Du Pont De Nemours And Company Genes for microsomal delta-12 fatty acid desaturases and hydroxylases from plants
US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
DE69428290T2 (de) 1993-01-13 2002-04-18 Pioneer Hi Bred Int Derivate von alpha-hordothionin mit höherem behalt an lysin
US5607914A (en) 1993-01-13 1997-03-04 Pioneer Hi-Bred International, Inc. Synthetic antimicrobial peptides
IL108814A0 (en) 1993-03-02 1994-06-24 Du Pont Improved feedcrops enriched in sulfur amino acids and methods for improvement
US5877012A (en) 1993-03-25 1999-03-02 Novartis Finance Corporation Class of proteins for the control of plant pests
US6107547A (en) 1993-10-06 2000-08-22 New York University Transgenic plants that exhibit enhanced nitrogen assimilation
AU704510B2 (en) 1993-11-30 1999-04-22 E.I. Du Pont De Nemours And Company Chimeric genes and methods for increasing the lysine content of the seeds of corn, soybean and rapeseed plants
US5580852A (en) 1993-12-17 1996-12-03 Pioneer Hi-Bred International, Inc. Derivatives of tachyplesin having inhibitory activity towards plant pathogenic fungi
US5689052A (en) 1993-12-22 1997-11-18 Monsanto Company Synthetic DNA sequences having enhanced expression in monocotyledonous plants and method for preparation thereof
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
IL113685A0 (en) 1994-05-13 1995-08-31 Du Pont Nucleic acid fragments chimeric genes and methods for increasing the methionine content of the seeds of plants
US5633363A (en) 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5767373A (en) 1994-06-16 1998-06-16 Novartis Finance Corporation Manipulation of protoporphyrinogen oxidase enzyme activity in eukaryotic organisms
ZA955629B (en) 1994-07-08 1997-01-06 Du Pont Chimeric genes and method for increasing the threonine content of the seeds of plants
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5792931A (en) 1994-08-12 1998-08-11 Pioneer Hi-Bred International, Inc. Fumonisin detoxification compositions and methods
GB9422083D0 (en) 1994-11-02 1994-12-21 Innes John Centre Genetic control of flowering
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US5994627A (en) 1995-03-31 1999-11-30 Common Wealth Scientific And Industrial Research Organisation Genetic sequences conferring nematode resistance in plants and uses therefor
EP0821729B1 (en) 1995-04-20 2006-10-18 Basf Aktiengesellschaft Structure-based designed herbicide resistant products
US5853973A (en) 1995-04-20 1998-12-29 American Cyanamid Company Structure based designed herbicide resistant products
CA2222673A1 (en) 1995-05-31 1996-12-05 Mitchell C. Tarczynski Methods of increasing accumulation of essential amino acids in seeds
PL323641A1 (en) 1995-06-02 1998-04-14 Pioneer Hi Bred Int Derivatives of alpha-hordothionine of high threonine content
PL323635A1 (en) 1995-06-02 1998-04-14 Pioneer Hi Bred Int Derivatives of alpha-hordothionine of high methionine content
GB9511196D0 (en) 1995-06-02 1995-07-26 Innes John Centre Genetic control of flowering
US5837876A (en) 1995-07-28 1998-11-17 North Carolina State University Root cortex specific gene promoter
GB9518731D0 (en) 1995-09-13 1995-11-15 Innes John Centre Flowering genes
GB9602796D0 (en) 1996-02-12 1996-04-10 Innes John Centre Innov Ltd Genetic control of plant growth and development
US6084153A (en) 1996-02-14 2000-07-04 The Governors Of The University Of Alberta Plants having enhanced nitrogen assimilation/metabolism
US5850016A (en) 1996-03-20 1998-12-15 Pioneer Hi-Bred International, Inc. Alteration of amino acid compositions in seeds
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6083499A (en) 1996-04-19 2000-07-04 Mycogen Corporation Pesticidal toxins
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
GB9613132D0 (en) 1996-06-21 1996-08-28 Innes John Centre Innov Ltd Genetic control of flowering
US5850026A (en) 1996-07-03 1998-12-15 Cargill, Incorporated Canola oil having increased oleic acid and decreased linolenic acid content
US6177275B1 (en) 1996-07-24 2001-01-23 New York University Plant nitrogen regulatory P-PII genes
US5892009A (en) 1996-09-04 1999-04-06 Michigan State University DNA and encoded protein which regulates cold and dehydration regulated genes
US6417428B1 (en) 1996-09-04 2002-07-09 Michael F. Thomashow Plant having altered environmental stress tolerance
US6706866B1 (en) 1996-09-04 2004-03-16 Michigan State University Plant having altered environmental stress tolerance
US6063756A (en) 1996-09-24 2000-05-16 Monsanto Company Bacillus thuringiensis cryET33 and cryET34 compositions and uses therefor
US6080913A (en) 1996-09-25 2000-06-27 Pioneer Hi-Bred International, Inc. Binary methods of increasing accumulation of essential amino acids in seeds
CA2270289C (en) 1996-11-01 2005-09-27 Pioneer Hi-Bred International, Inc. Proteins with enhanced levels of essential amino acids
US6232529B1 (en) 1996-11-20 2001-05-15 Pioneer Hi-Bred International, Inc. Methods of producing high-oil seed by modification of starch levels
US6017534A (en) 1996-11-20 2000-01-25 Ecogen, Inc. Hybrid Bacillus thuringiensis δ-endotoxins with novel broad-spectrum insecticidal activity
US6713063B1 (en) 1996-11-20 2004-03-30 Monsanto Technology, Llc Broad-spectrum δ-endotoxins
AU728202B2 (en) 1996-11-22 2001-01-04 Pioneer Hi-Bred International, Inc. Moniliformin detoxification compositions and methods
US5846812A (en) 1996-11-22 1998-12-08 Pioneer Hi-Bred International, Inc. Zearalenone detoxification compositions and methods
US5798255A (en) 1996-11-22 1998-08-25 Pioneer Hi-Bred International, Inc. Beauvericin detoxification compositions and methods
US5942664A (en) 1996-11-27 1999-08-24 Ecogen, Inc. Bacillus thuringiensis Cry1C compositions toxic to lepidopteran insects and methods for making Cry1C mutants
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
AU743305C (en) 1997-01-17 2006-03-30 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
JP4263248B2 (ja) 1997-03-18 2009-05-13 ノボザイムス アクティーゼルスカブ Dnaのシャッフリングによるライブラリーの作成方法
DK0973940T3 (da) 1997-03-18 2008-10-20 Novozymes As En in vitro-fremgangsmåde til konstruktion af et DNA-bibliotek
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
JP2001502923A (ja) 1997-03-27 2001-03-06 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 植物の種子のリシン含有量を増やすためのキメラ遺伝子及び方法
US7105724B2 (en) 1997-04-04 2006-09-12 Board Of Regents Of University Of Nebraska Methods and materials for making and using transgenic dicamba-degrading organisms
ES2246534T3 (es) 1997-04-08 2006-02-16 E.I. Du Pont De Nemours And Company Planta de soja que produce semillas con niveles reducidos de sacaridos de rafinosa y de acido fitico.
ZA981569B (en) 1997-04-08 1999-08-25 Du Pont An engineered seed protein having a higher percentage of essential amino acids.
EP0915909B1 (en) 1997-05-05 2007-06-13 Dow AgroSciences LLC Insecticidal protein toxins from xenorhabdus
BR9809967A (pt) 1997-06-06 2000-08-01 Du Pont Fragmento de ácido nucleico isolado, gene quimérico, célula hospedeira transformada, polipeptìdeo, método de alteração do nìvel de expressão de uma enzima, método de obtenção de um fragmento de ácido nucleico, produto e método para avaliação da capacidade de pelo menos um composto em inibir a atividade de uma enzima
AU7835198A (en) 1997-06-12 1998-12-30 E.I. Du Pont De Nemours And Company Plant amino acid biosynthetic enzymes
GB9712415D0 (en) 1997-06-13 1997-08-13 Innes John Centre Innov Ltd Genetic control of flowering
US6291224B1 (en) 1998-07-17 2001-09-18 Pioneer Hi-Bred International, Inc. Genes controlling phytate metabolism in plants and uses thereof
US6197561B1 (en) 1997-07-22 2001-03-06 Pioneer Hi-Bred International, Inc. Genes controlling phytate metabolism in plants and uses thereof
AU745464B2 (en) 1997-07-22 2002-03-21 Pioneer Hi-Bred International, Inc. Genes controlling phytate metabolism in plants and uses thereof
GB9717192D0 (en) 1997-08-13 1997-10-22 Innes John Centre Innov Ltd Genetic control of plant growth and development
PL339005A1 (en) 1997-08-27 2000-12-04 Pioneer Hi Bred Int Genes encoding enzymes of lignin synthesis track and their applications
US5929305A (en) 1997-10-14 1999-07-27 Michigan State University Plant material containing non-naturally introduced binding protein for regulating cold and dehydration regulatory genes
US6399383B1 (en) 1997-10-28 2002-06-04 Maxygen, Inc. Human papilloma virus vectors
US6596539B1 (en) 1997-10-31 2003-07-22 Maxygen, Inc. Modification of virus tropism and host range by viral genome shuffling
US6218188B1 (en) 1997-11-12 2001-04-17 Mycogen Corporation Plant-optimized genes encoding pesticidal toxins
JP3712255B2 (ja) 1997-12-08 2005-11-02 カリフォルニア・インスティチュート・オブ・テクノロジー ポリヌクレオチドおよびポリペプチド配列を生成するための方法
AR017831A1 (es) 1997-12-10 2001-10-24 Pioneer Hi Bred Int Metodo para alterar la composicion de aminoacidos de una proteina nativa de interes, proteina elaborada, y polinucleotido
US7053282B1 (en) 1998-02-09 2006-05-30 Pioneer Hi-Bred International, Inc. Alteration of amino acid compositions in seeds
WO1999041368A2 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Optimization of immunomodulatory properties of genetic vaccines
WO1999041383A1 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Antigen library immunization
AR014072A1 (es) 1998-02-26 2001-01-31 Pioneer Hi Bred Int Molecula de acido nucleico aislada que tiene una secuencia nucleotidica para un promotor que es capaz de iniciar una transcripcion constitutiva en unacelula de planta, construccion adn, vector, celula huesped, metodo para expresar en forma constitutiva una secuencia nucleotidica heteroloca en una
WO1999043819A1 (en) 1998-02-26 1999-09-02 Pioneer Hi-Bred International, Inc. Family of maize pr-1 genes and promoters
EP1064385A2 (en) 1998-03-20 2001-01-03 Plant Bioscience Limited Plant control genes
CA2325344C (en) 1998-04-08 2017-12-05 Commonwealth Scientific And Industrial Research Organisation Methods and means for obtaining modified phenotypes
US6225530B1 (en) 1998-04-15 2001-05-01 The Salk Institute For Biological Studies Flowering locus T (FT) and genetically modified plants having modulated flower development
WO1999055882A1 (en) 1998-04-24 1999-11-04 E.I. Du Pont De Nemours And Company Phytic acid biosynthetic enzymes
US6284948B1 (en) 1998-05-18 2001-09-04 Pioneer Hi-Bred International, Inc. Genes and methods for control of nematodes in plants
EP0959133A1 (en) 1998-05-22 1999-11-24 Centrum Voor Plantenveredelings- En Reproduktieonderzoek (Cpro-Dlo) A process for inhibiting expression of genes
US7008664B1 (en) 1998-06-11 2006-03-07 E. I. Du Pont De Nemours And Company Method for improving the carcass quality of an animal
KR20010071613A (ko) 1998-06-29 2001-07-28 추후기재 매우 다양한 라이브러리의 생산방법
US6538177B1 (en) 1998-07-15 2003-03-25 Pioneer Hi-Bred International, Inc. Compositions and methods for fumonisin detoxification
US6693185B2 (en) 1998-07-17 2004-02-17 Bayer Bioscience N.V. Methods and means to modulate programmed cell death in eukaryotic cells
GB9816681D0 (en) 1998-07-31 1998-09-30 Minnesota Mining & Mfg Cleaning pads formed from non-woven abrasive web material,especially for domestic use
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
US7179955B2 (en) 1998-08-17 2007-02-20 Pioneer Hi-Bred International, Inc. Maize cellulose synthases genes and uses thereof
AU772064B2 (en) 1998-08-17 2004-04-08 Pioneer Hi-Bred International, Inc. Maize cellulose synthases and uses thereof
US20040068767A1 (en) 1998-08-17 2004-04-08 Pioneer Hi-Bred International, Inc. Maize cellulose synthases and uses thereof
US6930225B2 (en) 1998-08-17 2005-08-16 Pioneer Hi-Bred Int'l Inc. Maize cellulose synthases and uses thereof
EP1104469B1 (en) 1998-08-20 2005-11-09 Pioneer Hi-Bred International, Inc. Seed-preferred promoters
WO2000012733A1 (en) 1998-08-28 2000-03-09 Pioneer Hi-Bred International, Inc. Seed-preferred promoters from end genes
US6346403B1 (en) 1998-09-08 2002-02-12 E.I. Du Pont De Nemours And Company Methionine metabolic enzymes
US6717034B2 (en) 2001-03-30 2004-04-06 Mendel Biotechnology, Inc. Method for modifying plant biomass
US20050086718A1 (en) 1999-03-23 2005-04-21 Mendel Biotechnology, Inc. Plant transcriptional regulators of abiotic stress
US6664446B2 (en) 1999-03-23 2003-12-16 Mendel Biotechnology, Inc. Transgenic plants comprising polynucleotides encoding transcription factors that confer disease tolerance
US20030041356A1 (en) 2001-03-27 2003-02-27 Lynne Reuber Methods for modifying flowering phenotypes
IL140441A0 (en) 1998-09-29 2002-02-10 Maxygen Inc Shuffling of codon altered genes
BR9914746A (pt) 1998-10-23 2001-10-30 Mycogen Corp Polinucleotìdeos otimizados em vegetaiscodificando proteìnas pesticidas deaproximadamente 15 kda e de aproximadamente 45kda
US6489542B1 (en) 1998-11-04 2002-12-03 Monsanto Technology Llc Methods for transforming plants to express Cry2Ab δ-endotoxins targeted to the plastids
US6825397B1 (en) 1998-11-09 2004-11-30 Pioneer Hi-Bred International, Inc. LEC1 trancriptional activator nucleic acids and methods of use thereof
ATE354283T1 (de) 1998-11-20 2007-03-15 Pioneer Hi Bred Int Verfahren zur verringerung der cholesterinkonzentration in tierprodukten
CA2352468A1 (en) 1998-11-25 2000-06-08 Joseph R. Ecker Ethylene-response-factor1 (erf1) in plants
US6531648B1 (en) 1998-12-17 2003-03-11 Syngenta Participations Ag Grain processing method and transgenic plants useful therein
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
EP1151409A1 (en) 1999-01-18 2001-11-07 Maxygen, Inc. Methods of populating data stuctures for use in evolutionary simulations
ES2341217T3 (es) 1999-01-19 2010-06-17 Maxygen, Inc. Recombinacion de acidos nucleicos mediada por oligonucleotidos.
GB9901927D0 (en) 1999-01-28 1999-03-17 John Innes Foundation Methods and means for modification of plant characteristics
GB9902660D0 (en) 1999-02-05 1999-03-31 Plant Bioscience Ltd Plant gene
US6323392B1 (en) 1999-03-01 2001-11-27 Pioneer Hi-Bred International, Inc. Formation of brassica napus F1 hybrid seeds which exhibit a highly elevated oleic acid content and a reduced linolenic acid content in the endogenously formed oil of the seeds
US6531316B1 (en) 1999-03-05 2003-03-11 Maxyag, Inc. Encryption of traits using split gene sequences and engineered genetic elements
US6365377B1 (en) 1999-03-05 2002-04-02 Maxygen, Inc. Recombination of insertion modified nucleic acids
US6835540B2 (en) 2001-03-16 2004-12-28 Mendel Biotechnology, Inc. Biosynthetic pathway transcription factors
AU3733000A (en) 1999-03-24 2000-10-09 Pioneer Hi-Bred International, Inc. Maize chitinases and their use in enhancing disease resistance in crop plants
JP2003525589A (ja) 1999-04-07 2003-09-02 メンデル・バイオテクノロジー・インコーポレーテッド 遺伝的形質育種法
US6992237B1 (en) 1999-04-16 2006-01-31 Pioneer Hi-Bred International Inc. Regulated expression of genes in plant seeds
US7531723B2 (en) 1999-04-16 2009-05-12 Pioneer Hi-Bred International, Inc. Modulation of cytokinin activity in plants
AU4498500A (en) 1999-05-07 2000-11-21 Board Of Regents Of The University And Community College System Of Nevada, The Phytyl/prenyltransferase nucleic acids, polypeptides and uses thereof
US6855865B2 (en) 1999-05-07 2005-02-15 E.I. Du Pont De Nemours And Company Nucleic acids encoding plant defensins and methods of use thereof
US6653535B1 (en) 1999-05-28 2003-11-25 Pioneer Hi-Bred International, Inc. Methods for modulating water-use efficiency or productivity in a plant by transforming with a DNA encoding a NAPD-malic enzyme operably linked to a guard cell or an epidermal cell promoter
US6441274B1 (en) 1999-06-16 2002-08-27 E. I. Du Pont De Nemours & Company Plant tryptophan synthase beta subunit
US6388171B1 (en) 1999-07-12 2002-05-14 Pioneer Hi-Bred International, Inc. Compositions and methods for fumonisin detoxification
WO2001004147A2 (en) 1999-07-12 2001-01-18 E.I. Du Pont De Nemours And Company Plant inositol polyphosphate phosphatase homologs
WO2001012825A1 (en) 1999-08-13 2001-02-22 Syngenta Participations Ag Herbicide-tolerant protoporphyrinogen oxidase
HUP0203560A3 (en) 1999-08-16 2008-04-28 Du Pont Method for the production of calendic acid, a fatty acid containing delta-8,10,12 conjugated double bonds and dimorphecolic acid, a fatty acid containing a 9-hydroxy group and delta-10,12 conjugated double bonds
US6423886B1 (en) 1999-09-02 2002-07-23 Pioneer Hi-Bred International, Inc. Starch synthase polynucleotides and their use in the production of new starches
GB9922071D0 (en) 1999-09-17 1999-11-17 Plant Bioscience Ltd Methods and means for modification of plant characteristics
AU1569801A (en) 1999-10-12 2001-04-23 Robert Creelman Flowering time modification
US6384304B1 (en) 1999-10-15 2002-05-07 Plant Genetic Systems N.V. Conditional sterility in wheat
WO2001034726A2 (en) 1999-10-21 2001-05-17 Fluor Corporation Methods and apparatus for high propane recovery
US20020178464A1 (en) 1999-11-10 2002-11-28 Whitehead Institute For Biomedical Research Proton transporters and uses in plants
PT1230345E (pt) 1999-11-17 2008-09-23 Mendel Biotechnology Inc Genes de tolerância a stress ambiental
CA2391879C (en) 1999-11-17 2006-04-25 Pioneer Hi-Bred International, Inc. Modulation of plant response to abscisic acid
US6248535B1 (en) 1999-12-20 2001-06-19 University Of Southern California Method for isolation of RNA from formalin-fixed paraffin-embedded tissue specimens
US7049115B2 (en) 2000-02-29 2006-05-23 E. I. Du Pont De Nemours & Company Genes encoding denitrification enzymes
WO2001079516A2 (en) 2000-04-14 2001-10-25 Pioneer Hi-Bred International, Inc. Maize cellulose synthases and uses thereof
US6777592B2 (en) 2000-04-14 2004-08-17 E.I. Du Pont Denemours And Company Arthropod defensins of Scolopendra canidens, Vaejovis carolinianus, and Argiope spp.
WO2002000904A2 (en) 2000-06-23 2002-01-03 E. I. Du Pont De Nemours And Company Recombinant constructs and their use in reducing gene expression
AU2001291656A1 (en) 2000-06-30 2002-01-08 Willem Broekaert Gene silencing vector
CN1137265C (zh) 2000-07-06 2004-02-04 中国科学院微生物研究所 一种提高植物氮素同化效率的方法
US6801104B2 (en) 2000-08-22 2004-10-05 Paratek Microwave, Inc. Electronically tunable combline filters tuned by tunable dielectric capacitors
WO2002015675A1 (en) 2000-08-22 2002-02-28 Mendel Biotechnology, Inc. Genes for modifying plant traits iv
CA2426751A1 (en) 2000-10-24 2002-07-25 E.I. Du Pont De Nemours And Company Plant transcription factors
US6858778B1 (en) 2000-11-07 2005-02-22 Pioneer Hi-Bred International, Inc. Plants transformed with a DNA construct comprising a nucleic acid molecule encoding an 18 kD α-globulin
US20050160488A1 (en) 2000-11-07 2005-07-21 Pioneer Hi-Bred International, Inc. Grain quality through altered expression of seed proteins
US7741533B2 (en) 2000-11-07 2010-06-22 Pioneer Hi-Bred International, Inc. Grain quality through altered expression of seed proteins
US7122658B1 (en) 2000-11-22 2006-10-17 Pioneer Hi-Bred International, Inc. Seed-preferred regulatory elements and uses thereof
AU2002247060A1 (en) 2001-01-12 2002-08-06 E.I. Dupont De Nemours And Company Novel inositol polyphosphate kinase genes and uses thereof
US6812380B2 (en) 2001-03-27 2004-11-02 Pioneer Hi-Bred International, Inc. Compositions and methods of zearalenone detoxification
JP2002281975A (ja) 2001-03-28 2002-10-02 Yamaguchi Technology Licensing Organization Ltd 大豆のナイトレートトランスポーター1遺伝子ファミリーに属する遺伝子
AR035799A1 (es) 2001-03-30 2004-07-14 Syngenta Participations Ag Toxinas insecticidas aisladas de bacillus thuringiensis y sus usos.
US6891085B2 (en) 2001-04-20 2005-05-10 Pioneer Hi-Bred International, Inc. Nucleic acid encoding the FUS6 antimicrobial polypeptide of Agrotis ipsilon and its use to enhance disease resistance in a plant
US20030166197A1 (en) 2001-05-10 2003-09-04 Ecker Joseph R. Ethylene insensitive plants
EP2270165A3 (en) 2001-06-22 2011-09-07 Pioneer Hi-Bred International, Inc. Defensin polynucleotides and methods of use
US7294759B2 (en) 2001-06-29 2007-11-13 E. I. Du Pont De Nemours And Company Alteration of oil traits in plants
AU2002355746A1 (en) 2001-08-02 2003-02-17 Pioneer Hi-Bred International, Inc. Methods for improving seed and grain characteristics
CA2456979C (en) 2001-08-09 2014-06-17 Mendel Biotechnology, Inc. Yield-related polynucleotides and polypeptides in plants
US7230167B2 (en) 2001-08-31 2007-06-12 Syngenta Participations Ag Modified Cry3A toxins and nucleic acid sequences coding therefor
WO2003027243A2 (en) 2001-09-27 2003-04-03 Pioneer Hi-Bred International, Inc. Phytate polynucleotides and methods of use
AU2002334894A1 (en) 2001-10-16 2003-04-28 Pioneer Hi-Bred International, Inc. Compositions and methods for promoting nematode resistance in plants
US7145060B2 (en) 2001-11-07 2006-12-05 Pioneer Hi-Bred International, Inc. Nucleic acid encoding a chitinase and methods of using it to make fungal resistant plants
US7087810B2 (en) 2001-11-07 2006-08-08 Muller Mathis L Isolated nucleic acids encoding proteins with chitinase activity and uses thereof
WO2003052063A2 (en) 2001-12-14 2003-06-26 The Nitrate Elimination Company, Inc. Simplified eukaryotic nitrate reductase
US7154029B2 (en) 2002-03-22 2006-12-26 E.I. Du Pont De Nemours And Company Compositions and methods for altering tocotrienol content
US20040128719A1 (en) 2002-06-21 2004-07-01 Klee Harry J. Materials and methods for tissue-specific targeting of ethylene insensitivity in transgenic plants
US7462760B2 (en) 2002-06-26 2008-12-09 Pioneer Hi-Bred International, Inc. Genes encoding plant protease-resistant pesticidal proteins and method of their use
BR0312064A (pt) 2002-06-26 2005-08-09 Du Pont Genes que codificam proteìnas com atividade pesticida
US20040078852A1 (en) 2002-08-02 2004-04-22 Thomashow Michael F. Transcription factors to improve plant stress tolerance
EP3249046B1 (en) 2002-09-18 2020-07-08 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
AR043328A1 (es) 2003-01-21 2005-07-27 Dow Agrosciences Llc Metodo para la inhibicion de insectos
US20040197917A1 (en) 2003-02-20 2004-10-07 Athenix Corporation AXMI-014, delta-endotoxin gene and methods for its use
WO2004074462A2 (en) 2003-02-20 2004-09-02 Athenix Corporation Delta-endotoxin genes and methods for their use
US7355099B2 (en) 2003-02-20 2008-04-08 Athenix Corporation AXMI-004, a delta-endotoxin gene and methods for its use
US7351881B2 (en) 2003-02-20 2008-04-01 Athenix Corporation AXMI-008, a delta-endotoxin gene and methods for its use
US20040216186A1 (en) 2003-02-20 2004-10-28 Athenix Corporation AXMI-006, a delta-endotoxin gene and methods for its use
US20040210964A1 (en) 2003-02-20 2004-10-21 Athenix Corporation AXMI-009, a delta-endotoxin gene and methods for its use
US20040210965A1 (en) 2003-02-20 2004-10-21 Athenix Corporation AXMI-007, a delta-endotoxin gene and methods for its use
WO2004087878A2 (en) 2003-03-28 2004-10-14 Monsanto Technology, Llc Novel plant promoters for use in early seed development
EP1613754A2 (en) 2003-04-04 2006-01-11 Pioneer Hi-Bred International, Inc. Modulation of cytokinin activity in plants
EP1644480B1 (en) 2003-07-07 2013-06-05 Monsanto Technology, LLC Insecticidal proteins secreted from bacillus thuringiensis and uses therefor
US7253343B2 (en) 2003-08-28 2007-08-07 Athenix Corporation AXMI-003, a delta-endotoxin gene and methods for its use
WO2005030967A2 (en) 2003-09-25 2005-04-07 Pioneer Hi-Bred International, Inc. Crop plant cystatin proteinase inhibitors and methods of use
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use
CA2450000A1 (en) 2003-12-18 2005-06-18 Alberta Research Council Inc. Method of creating plants with reduced level of saturated fatty acid in seed oil
BRPI0507896A (pt) 2004-02-20 2007-07-24 Pionner Hi Bred International lipases e métodos de utilização das mesmas na criação ou no aumento de resistência a insetos em plantas
CA2562022C (en) 2004-04-09 2016-01-26 Monsanto Technology Llc Compositions and methods for control of insect infestations in plants
PL1740039T3 (pl) 2004-04-30 2013-03-29 Dow Agrosciences Llc Nowe geny odporności na herbicydy
EP1756286B1 (en) 2004-05-20 2010-04-28 Pioneer-Hi-Bred International, Inc. Maize multidrug resistance-associated protein polynucleotides and methods of use
DE602005023727D1 (de) 2004-06-09 2010-11-04 Pioneer Hi Bred Int Plastiden transit peptide
EP2404499A3 (en) 2004-06-16 2012-05-02 BASF Plant Science GmbH Nucleic acid molecules encoding Lipid Metabolism Protein (LMP) and methods of use in plants
US7301069B2 (en) 2004-06-30 2007-11-27 Pioneer Hi-Bred International, Inc. Methods of protecting plants from pathogenic fungi and nematodes
EP2230247B1 (en) 2004-07-02 2013-05-29 Pioneer-Hi-Bred International, Inc. Antifungal polypeptides
AU2006210880B2 (en) 2005-01-31 2012-09-20 Athenix Corporation AXMI-018, AXMI-020, and AXMI-021, a family of delta-endotoxin genes and methods for their use
CN102925479A (zh) 2005-03-08 2013-02-13 巴斯福植物科学有限公司 增强表达的内含子序列
US7601498B2 (en) 2005-03-17 2009-10-13 Biotium, Inc. Methods of using dyes in association with nucleic acid staining or detection and associated technology
EP2130839B1 (en) 2005-04-01 2012-03-07 Athenix Corporation AXMI-036 a delta-endotoxin gene and methods for its use
US7622572B2 (en) 2005-05-02 2009-11-24 Athenix Corporation AXMI-028 and AXMI-029, a family of novel delta-endotoxin genes and methods for their use
US8119858B2 (en) 2005-07-06 2012-02-21 Cropdesign N.V. Plant yield improvement by Ste20-like gene expression
AU2006270321B2 (en) 2005-07-18 2012-03-08 Basf Plant Science Gmbh Yield increase in plants overexpressing the ACCDP genes
TW200730625A (en) 2005-08-24 2007-08-16 Pioneer Hi Bred Int Compositions providing tolerance to multiple herbicides and methods of use thereof
US20090044298A1 (en) 2005-09-16 2009-02-12 Bayer Cropscience S.A. Transplastomic Plants Expressing Lumen-Targeted Protein
PT2295584E (pt) 2005-09-16 2015-09-22 Devgen Nv Métodos com base em plantas transgénicas para infestações em plantas utilizando arn de interferência
US7449552B2 (en) 2006-04-14 2008-11-11 Pioneer Hi-Bred International, Inc. Bacillus thuringiensis cry gene and protein
US7329736B2 (en) 2006-04-14 2008-02-12 Pioneer Hi-Bred International, Inc. Bacillus thuringiensis cry gene and protein
JP2009537155A (ja) 2006-05-25 2009-10-29 ヘクシマ リミティッド 多重遺伝子発現媒体
WO2007147029A2 (en) 2006-06-14 2007-12-21 Athenix Corporation Axmi-031, axmi-039, axmi-040 and axmi-049, a family of delta-endotoxin genes and methods for their use
AR061491A1 (es) 2006-06-15 2008-09-03 Athenix Corp Una familia de proteinas pesticidas y metodos de uso de las mismas
BRPI0715354A2 (pt) 2006-08-07 2015-06-23 Univ Missouri Quinases semelhantes a receptor lysm para melhora da resposta de defesa de plantas contra fungos patogênicos
CN101600801B (zh) 2006-12-08 2013-01-02 先锋高级育种国际公司 新苏云金芽孢杆菌晶体多肽、多核苷酸及其组合物
EP2487244A1 (en) 2006-12-15 2012-08-15 CropDesign N.V. Plants having enhanced yield-related traits and a method for making the same
MX2009010062A (es) 2007-03-28 2009-10-13 Syngenta Participations Ag Proteinas insecticidas.
US7790156B2 (en) 2007-04-10 2010-09-07 E. I. Du Pont De Nemours And Company Δ-8 desaturases and their use in making polyunsaturated fatty acids
US8609936B2 (en) 2007-04-27 2013-12-17 Monsanto Technology Llc Hemipteran-and coleopteran active toxin proteins from Bacillus thuringiensis
CA2692475A1 (en) 2007-06-20 2008-12-24 The Australian National University Method for improving stress resistance in plants and materials therefor
EP2520655A3 (en) 2007-07-13 2012-12-26 BASF Plant Science GmbH Transgenic plants with increased stress tolerance and yield
BRPI0818941A2 (pt) 2007-08-29 2014-10-07 Pioneer Hi Bred Int "planta, métodos de alteração da arquitetura de raízes em plantas, de avaliação da arquitetura de raízes em plantas, de determinação de alteração de uma característica agronômica em uma planta, de transformação de células, de produção de plantas, polinucleotídeo, vetor e reconstrução de dna recombinante"
CN101855355B (zh) 2007-09-14 2016-06-22 巴斯夫植物科学有限公司 具有提高的产量相关性状的植物和用于制备该植物的方法
AU2008312468B2 (en) 2007-10-16 2014-07-31 BASF Agricultural Solutions Seed US LLC AXMI-066 and AXMI-076: delta-endotoxin proteins and methods for their use
US8173866B1 (en) 2008-01-11 2012-05-08 Pioneer Hi-Bred International, Inc. Modulation of plant xylan synthases
US20090188008A1 (en) 2008-01-17 2009-07-23 Pioneer Hi-Bred International, Inc. Compositions and methods for the suppression of target polynucleotides
US8809625B2 (en) 2008-01-17 2014-08-19 Pioneer Hi-Bred International, Inc. Compositions and methods for the suppression of target polynucleotides from Lygus
PE20140942A1 (es) 2008-06-25 2014-08-06 Athenix Corp Genes de toxinas y metodos para su uso
CA3183317A1 (en) 2008-07-02 2010-01-07 BASF Agricultural Solutions Seed US LLC Axmi-115, axmi-113, axmi-005, axmi-163 and axmi-184: insecticidal proteins and methods for their use
ATE497631T1 (de) 2008-10-08 2011-02-15 Research In Motion Ltd Zweistufiger einzeltaster
ES2534581T3 (es) 2008-12-23 2015-04-24 Athenix Corporation Gen AXMI-150 de la delta-endotoxina y métodos para su uso
CN104293804A (zh) 2009-01-23 2015-01-21 先锋国际良种公司 具有鳞翅目活性的新苏云金芽孢杆菌基因
CN104232679A (zh) 2009-01-28 2014-12-24 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物及其制备方法
EP2728007B1 (en) 2009-02-05 2017-01-25 Athenix Corporation Variant Axmi-R1 delta-endotoxin genes and methods for their use
US8318900B2 (en) 2009-02-27 2012-11-27 Athenix Corp. Pesticidal proteins and methods for their use
AR075818A1 (es) 2009-03-11 2011-04-27 Athenix Corp Axmi-001, axmi- 002, axmi-030 y axmi -035 y axmi -045: genes de toxina y metodos para su uso
US8033349B2 (en) 2009-03-12 2011-10-11 Ford Global Technologies, Inc. Auto-seek electrical connection for a plug-in hybrid electric vehicle
WO2010120862A1 (en) 2009-04-14 2010-10-21 Pioneer Hi-Bred International, Inc. Modulation of acc synthase improves plant yield under low nitrogen conditions
DK2419441T3 (en) 2009-04-17 2015-04-27 Dow Agrosciences Llc Insecticidal dig-3-cry toxins
US8334366B1 (en) 2009-04-29 2012-12-18 The United States Of America, As Represented By The Secretary Of Agriculture Mutant lycotoxin-1 peptide sequences for insecticidal and cell membrane altering properties
US20120066794A1 (en) 2009-05-28 2012-03-15 Nirmala Sharma Increased Seed Oil and Abiotic Stress Tolerance Mediated by HSI2
CA2765744A1 (en) 2009-06-16 2010-12-23 Justin Lira Dig-11 insecticidal cry toxins
US8575425B2 (en) 2009-07-02 2013-11-05 Athenix Corporation AXMI-205 pesticidal gene and methods for its use
US8551757B2 (en) 2009-09-11 2013-10-08 Valent Biosciences Corporation Bacillus thuringiensis isolate
US8916746B2 (en) 2009-10-30 2014-12-23 Japan Tobacco, Inc. Drought tolerant plants and related constructs and methods involving genes encoding DTP21 polypeptides
US20120272352A1 (en) 2009-10-30 2012-10-25 Syngenta Participations Ag Genes Conferring Drought and Salt Tolerance and Uses Thereof
US20120324605A1 (en) 2009-12-16 2012-12-20 Dow Agrosciences Llc Insectcidal protein combinations for controlling fall armyworm and european corn borer, and methods for insect resistance management
RU2593961C2 (ru) 2009-12-16 2016-08-10 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи КОМБИНИРОВАННОЕ ПРИМЕНЕНИЕ БЕЛКОВ CRY1Ca И CRY1Fa ДЛЯ БОРЬБЫ С РЕЗИСТЕНТНОСТЬЮ У НАСЕКОМЫХ
NZ601095A (en) 2009-12-16 2015-05-29 Dow Agrosciences Llc Combined use of cry1ca and cry1ab proteins for insect resistance management
CA2782636A1 (en) 2009-12-16 2011-06-23 Dow Agrosciences Llc Methods and compositions comprising vip3ab and cry1fa polypeptides for c ontrol of fall armyworm
RU2603257C2 (ru) 2009-12-16 2016-11-27 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи КОМБИНИРОВАННОЕ ПРИМЕНЕНИЕ БЕЛКОВ Cry1Da И Cry1Fa ДЛЯ ВЫРАБАТЫВАНИЯ РЕЗИСТЕНТНОСТИ К НАСЕКОМЫМ
CN102753696A (zh) 2009-12-16 2012-10-24 陶氏益农公司 组合使用Cry1Da与Cry1Be用于抗性昆虫的管理
BR112012014879A2 (pt) 2009-12-16 2015-11-10 Dow Agrosciences Llc gerenciamento de resistencia de inseto com combinacoes de proteinas cry1be e cry1f
BR112012014836A2 (pt) 2009-12-17 2015-08-25 Univ Missouri Genes vegetais associados ao conteúdo de óleos de sementes e processos de uso dos mesmos
AU2011218130B2 (en) 2010-02-18 2016-03-03 Athenix Corp. AXMI218, AXMI219, AXMI220, AXMI226, AXMI227, AXMI228, AXMI229, AXMI230, and AXMI231 delta-endotoxin genes and methods for their use
CA2790029C (en) 2010-02-18 2019-09-03 Athenix Corp. Axmi221z, axmi222z, axmi223z, axmi224z, and axmi225z delta-endotoxin genes and methods for their use
EP2560475B1 (en) 2010-04-23 2018-02-14 Dow AgroSciences LLC Combinations including cry34ab/35ab and cry3aa proteins to prevent development of resistance in corn rootworms (diabrotica spp.)
US8872001B2 (en) 2010-06-04 2014-10-28 Pioneer Hi Bred International Inc Compositions and methods for insecticidal control of stinkbugs
UA111592C2 (uk) 2010-07-07 2016-05-25 Сінгента Партісіпейшнс Аг Спосіб контролю над твердокрилими комахами-шкідниками
WO2012006426A2 (en) 2010-07-09 2012-01-12 Grassroots Biotechnology, Inc. Regulatory polynucleotides and uses thereof
CN103249836A (zh) 2010-09-24 2013-08-14 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法
US20120079622A1 (en) 2010-09-24 2012-03-29 Pioneer Hi-Bred International, Inc. Yield Enhancement in Plants by Modulation of a ZM-LOBDP1 Protein
US8772024B2 (en) 2010-09-27 2014-07-08 Pioneer Hi Bred International Inc Yield enhancement in plants by modulation of a ZM-ZFP1 protein
EP2633048B1 (en) 2010-10-27 2019-07-31 Devgen NV Down-regulating gene expression in insect pests
EP2633055A2 (en) 2010-10-28 2013-09-04 E.I. Du Pont De Nemours And Company Drought tolerant plants and related constructs and methods involving genes encoding dtp6 polypeptides
CA2815096A1 (en) 2010-10-29 2012-05-03 Xiang Huang Overexpression of plant mirnas for parasite control
BRPI1107329A2 (pt) 2010-12-30 2019-11-19 Dow Agrosciences Llc moléculas de ácido nucléico que direcionadas à subunidade h de atpase vacuolar que conferem resistência a pragas de coleópteros, vetor de transformação de planta, célula transformada, bem como métodos para controlar uma população de praga de coleóptero, controlar uma infestação pela dita praga, melhorar o rendimento de uma safra e para produzir uma célula transgênica
CA3048240C (en) 2011-02-11 2021-02-23 Monsanto Technology Llc Pesticidal nucleic acids and proteins and uses thereof
BR112013025834B1 (pt) 2011-04-07 2021-10-05 Monsanto Technology Llc Molécula de ácido nucleico recombinante codificadora de proteína pesticida, composição inibidora de insetos, e método para controlar uma praga de espécies de lepidóptero e/ou hemíptero
CN110452908A (zh) 2011-04-20 2019-11-15 德福根有限公司 在昆虫害虫中下调基因表达
US9150625B2 (en) 2011-05-23 2015-10-06 E I Du Pont De Nemours And Company Chloroplast transit peptides and methods of their use
US9475847B2 (en) 2012-07-26 2016-10-25 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US9394345B2 (en) 2013-03-15 2016-07-19 Pioneer Hi-Bred International, Inc. PHI-4 polypeptides and methods for their use

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104968672A (zh) * 2012-07-02 2015-10-07 先锋国际良种公司 新型杀昆虫蛋白及其使用方法
WO2015023846A2 (en) * 2013-08-16 2015-02-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2015038734A2 (en) * 2013-09-13 2015-03-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN104651377A (zh) * 2013-11-25 2015-05-27 浙江大学 新型的杀虫蛋白

Also Published As

Publication number Publication date
US20180325119A1 (en) 2018-11-15
EP3390431A1 (en) 2018-10-24
WO2017105987A1 (en) 2017-06-22
CA3002995A1 (en) 2017-06-22

Similar Documents

Publication Publication Date Title
US20200131529A1 (en) Phi-4 polypeptides and methods for their use
US10781458B2 (en) Insecticidal proteins and methods for their use
AU2016207026B2 (en) Insecticidal proteins and methods for their use
US11008585B2 (en) Insecticidal proteins and methods for their use
CN106232820A (zh) 杀昆虫蛋白及其使用方法
US11739344B2 (en) Insecticidal proteins from plants and methods for their use
CN106536545A (zh) 杀昆虫蛋白及其使用方法
CN109475096A (zh) 植物来源的杀昆虫蛋白及其使用方法
CN106232620A (zh) 杀昆虫蛋白及其使用方法
US20200055906A1 (en) Insecticidal proteins and methods for their use
CN108064233A (zh) 杀昆虫蛋白及其使用方法
US11840701B2 (en) Insecticidal proteins from plants and methods for their use
CN109788735A (zh) 来自植物的杀昆虫蛋白及其使用方法
CN108575091A (zh) 杀昆虫蛋白及其使用方法
CN108064303A (zh) 基于结构的用于修饰pip-72多肽及由其衍生的pip-72多肽的方法
CN110088123A (zh) 杀昆虫蛋白及其使用方法
KR20200123144A (ko) 바실러스가 농축된 게놈 라이브러리를 생성하고 새로운 cry 독소를 동정하기 위한 방법
KR20200127180A (ko) 살충 단백질 발견 플랫폼 및 이로부터 발견된 살충 단백질
CN105980566A (zh) 新型杀昆虫蛋白及其使用方法
US20230183734A1 (en) Insecticidal proteins and methods for their use
US20230235352A1 (en) Insecticidal proteins and methods for their use
US20240229064A9 (en) Insecticidal proteins from plants and methods for their use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180925

WD01 Invention patent application deemed withdrawn after publication