CN111542602A - 多节孢酸(Nodulisporic acid)的异源生物合成 - Google Patents

多节孢酸(Nodulisporic acid)的异源生物合成 Download PDF

Info

Publication number
CN111542602A
CN111542602A CN201880073882.0A CN201880073882A CN111542602A CN 111542602 A CN111542602 A CN 111542602A CN 201880073882 A CN201880073882 A CN 201880073882A CN 111542602 A CN111542602 A CN 111542602A
Authority
CN
China
Prior art keywords
seq
leu
ala
ser
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880073882.0A
Other languages
English (en)
Inventor
M·J·尼古尔森
S·A·凯珊
E·J·帕克
L·Y·布斯塔曼特·罗德里格斯
D·B·斯科特
K·C·范·德·比特纳
C·J·范·杜勒维勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victoria Link Ltd
Original Assignee
Victoria Link Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2017903956A external-priority patent/AU2017903956A0/en
Application filed by Victoria Link Ltd filed Critical Victoria Link Ltd
Publication of CN111542602A publication Critical patent/CN111542602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/30Microbial fungi; Substances produced thereby or obtained therefrom
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/188Heterocyclic compound containing in the condensed system at least one hetero ring having nitrogen atoms and oxygen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Environmental Sciences (AREA)
  • Dentistry (AREA)
  • Agronomy & Crop Science (AREA)
  • Pest Control & Pesticides (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

多节孢酸(Nodulisporic acid)(NA)包含因其强效杀虫活性而为人所知的一组吲哚二萜类化合物;然而,NA通过其天然产生菌Hypoxylon pulicicidum(多节孢属物种(Nodulisporium sp.))的生物合成格外难以实现。负责NA生产的基因的鉴定可以使生物合成途径的优化成为可能,以提供获得用于商业化应用的NA的途径。使用已发表的发酵方法获得有用量的NA具有挑战性,使得基因敲除研究成为确认基因功能的不可取的方法。可选地,H.pulicicidum基因在更鲁棒的宿主物种如蕈青霉(Penicillium paxilli)中的异源基因表达提供了快速鉴定在NA生物合成中发挥作用的基因的功能的一种方式。在本工作中,我们鉴定了多节孢酸F(NAF)的生物合成必需的四个次级代谢基因的功能,并在蕈青霉(P.paxilli)的基因组中重建了这些基因,以便能够在这种真菌中异源生产NAF。

Description

多节孢酸(Nodulisporic acid)的异源生物合成
技术领域
本发明总的来说涉及催化产生多节孢酸(Nodulisporic acid)(NA) 的至少一个生物化学反应的新的多肽,编码这些多肽的多核苷酸,制造这些多肽和多核苷酸的方法,以及使用这些多肽和多核苷酸通过在许可寄主中异源表达来生产至少一种NA的方法。
背景技术
丝状真菌产生多种多样的有趣且有用的化学化合物。一类这样的化合物即吲哚二萜(IDT)的成员,由于其广泛的化学多样性和伴随的生物活性包括抗MRSA1、抗癌2,3、抗H1N14、杀虫5和致震颤6活性而特别受关注。NA(图1)是由以前被分类为多节孢属物种(Nodulisporium sp.)的 Hypoxylon pulicicidum产生的一组具有显著生物活性的准雀稗灵样IDT7。多节孢酸A(NAA)10是特别重要的,因为它表现出针对吸血节肢动物的强效杀虫活性,同时对哺乳动物没有表现出可观察的不良影响5,8
从天然生产菌H.pulicicidum生物合成NA特别困难。报道的NA生物合成方法要求H.pulicicidum在高度富含营养物的培养基中在完全黑暗下生长21天9。由于在H.pulicicidum中NAA 10生物合成的困难性,因此使用已发表的发酵方法获得有用量的NAA10具有挑战性,并且商用量的NAA 10 的生产基本上无法实现。因此,已尝试化学合成NAA10,导致发现的合成多节孢酸F(NAF)5a10和多节孢酸D 7a11的机制,但NAA 10的全合成尚未实现12。因此,在本领域中对提供有用量的NAA 10的NAA 10合成和/ 或生物合成的新方法存在着需求。
本发明的目的是提供编码H.pulicicidum的NAA 10生物合成途径中的至少一种酶的多核苷酸,和/或提供使用这种载体在异源宿主中生产至少一种作为吲哚二萜化合物的NA和/或生产NAA 10的前体的方法,和/或至少为公众提供有用的选择。
在本说明书中,在对专利说明书、其他外部文献或其他信息源做出引用时,这通常是出于为本发明的特点的讨论提供背景的目的。除非另有特别说明,否则对此类外部文献的引用不应被解释为承认此类文献或此类信息源在任何管辖范围内是先有技术或形成本领域公知常识的一部分。
发明内容
一方面,本发明涉及一种分离的多肽,其包含选自NodW(SEQ ID NO: 3)、NodR(SEQID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ IDNO:18)、NodJ (SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO: 27)、NodD2(SEQID NO:30)、NodD1(SEQ ID NO:33)、NodY2 (SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)的氨基酸序列,或其有功能的变体或片段。
另一方面,本发明涉及一种分离的多核苷酸,其编码包含选自NodW (SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、 NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1 (SEQ IDNO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO: 33)、NodY2(SEQ ID NO:36)、NodZ(SEQID NO:39)、NodS(SEQ ID NO:50)和NodI(SEQ ID NO:56)的氨基酸序列的多肽或其有功能的变体或片段。
另一方面,本发明涉及一种分离的多核苷酸,其与选自nodW cDNA (SEQ ID NO:2)、nodW基因组DNA(SEQ ID NO:1)、nodR cDNA (SEQ ID NO:5)、nodR基因组DNA(SEQ IDNO:4)、nodX cDNA(SEQ ID NO:8)、nodX基因组DNA(SEQ ID NO:7)、nodM cDNA(SEQ ID NO:11)、nodM基因组DNA(SEQ ID NO:10)、nodB cDNA(SEQ ID NO:14)、nodB基因组DNA(SEQ IDNO:13)、nodO cDNA(SEQ ID NO:17)、nodO基因组DNA(SEQ ID NO:16)、nodJ cDNA(SEQ IDNO:20)、nodJ基因组DNA(SEQ ID NO:19)、nodC cDNA(SEQ ID NO:23)、nodC基因组DNA(SEQID NO:22)、nodY1 cDNA(SEQ ID NO:26)、nodY1基因组DNA(SEQ ID NO:25)、nodD2 cDNA(SEQ ID NO:29)、nodD2基因组DNA(SEQ ID NO:28)、nodD1 cDNA(SEQ ID NO:32)、nodD1基因组DNA(SEQ ID NO:31)、nodY2 cDNA(SEQ ID NO:35)、nodY2基因组DNA(SEQ ID NO:34)、nodZ cDNA(SEQ ID NO:38)、nodZ基因组DNA(SEQ ID NO:37)、nodS cDNA(SEQ ID NO:49)、nodS基因组DNA(SEQ ID NO:48)、nodI cDNA(SEQ ID NO:55)和nodI基因组DNA(SEQ ID NO:54)的核酸序列具有至少70%的核酸序列一致性。
另一方面,本发明涉及一种转录单位(TU),其包含至少一种根据本发明所述的分离的多核苷酸。
另一方面,本发明涉及一种载体,其编码根据本发明所述的分离的多肽。
另一方面,本发明涉及一种载体,其包含根据本发明所述的分离的核酸序列或TU。
另一方面,本发明涉及一种分离的宿主细胞,其包含根据本发明所述的分离的多肽、分离的多核苷酸、TU和/或载体。
另一方面,本发明涉及一种制造至少一种NA的方法,所述方法包括在分离的宿主细胞中异源表达根据本发明所述的至少一种多肽、分离的核酸序列、TU或载体。
另一方面,本发明涉及至少一种NA,其通过本发明所述的方法制造。
另一方面,本发明涉及一种来自于Hypoxylon spp.的分离的多肽或其有功能的片段或变体,其催化从3-香叶基香叶基吲哚(GGI)2产生NAA 10 的生物合成途径中的生物化学反应。
另一方面,本发明涉及一种分离的多核苷酸,其编码来自于Hypoxylon spp.,催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应的至少一种多肽或其有功能的变体或片段。
另一方面,本发明涉及一种制造至少一种Hypoxylon spp.多肽或其有功能的变体或片段的方法,所述方法包括在分离的宿主细胞中异源表达根据本发明所述的分离的核酸序列或载体。
另一方面,本发明涉及一种制造至少一种NA的方法,所述方法包括在分离的宿主细胞中异源表达催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应的至少一种多肽。
另一方面,本发明涉及一种分离的宿主细胞,其表达至少一种异源多肽,所述多肽催化导致从GGI 2形成NAA 10的生物合成途径中的底物的转化。
另一方面,本发明涉及一种分离的宿主细胞,其通过异源表达产生参与从GGI 2产生NAA 10的生物合成途径的至少一种多肽。
另一方面,本发明涉及一种生产至少一种NA的方法,所述方法包括将包含糖类的底物与用核酸转化的重组细胞相接触,所述转化导致所述重组细胞与转化之前的细胞相比选自NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB (SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、 NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、NodY2(SEQ IDNO:36)、 NodZ(SEQ ID NO:39)、NodS(SEQ ID NO:50)和NodI(SEQ ID NO: 56)的多肽或其有功能的变体或片段的活性水平提高,使得所述底物被代谢成至少一种NA。
另一方面,本发明涉及一种分离的Hypoxylon pulicicidum菌株,其包含编码产生NAA 10的生物合成途径中的酶的至少一种异源核酸序列。
另一方面,本发明涉及一种分离的Hypoxylon pulicicidum菌株,其表达至少两种不同的GGPPS酶。
另一方面,本发明涉及一种分离的Hypoxylon pulicicidum菌株,其包含引起NAA10的生物合成增加的遗传修饰。
另一方面,本发明涉及一种制造NAA 10的方法,所述方法包括在 Hypoxylonpulicicidum中表达至少一种异源核酸序列,其中所述至少一种异源核酸序列编码产生NAA10的生物合成途径中的酶。
上面讨论的本发明的不同方面的各种不同实施方式也在下面本发明的详细描述中阐述,但本发明不限于此。
从下面仅仅作为实例给出的描述并参考附图,本发明的其他方面可以变得显而易见。
附图说明
现在将参考附图中的图来描述本发明。
图1:已知多节孢酸(NA)的集合。
图2:吲哚二萜(IDT)生物合成途径中的分支点,其导致IDT结构的多样性。箭头表示IDT生物合成中的酶促步骤。
图3:蕈青霉(P.paxilli)敲除(KO)菌株的提取物的HPLC分析(271 nm)(灰色())表示不同的H.pulicicidum(Nod)酶和/或蕈青霉(P. paxilli)(Pax)酶(黑色(-))。黑色X覆盖了在蕈青霉(P.paxilli) KO菌株中没有表达的酶(迹线i.a、ii.a、iii.a、iv.a和v.a)。在蕈青霉(P. paxilli)KO菌株中新表达的酶被描绘在相应的KO菌株下方和它们的UV迹线附近(i.b、ii.b、iii.b、iv.b和v.b)。值得注意的是存在与emindole SB 4a 在相同保留时间处洗脱的化合物,但正如通过相应的406.31±0.01m/z EIC所证实的(图5、6和9),emindoleSB 4a仅存在于三个迹线中(ii.b、 iii.b和v.b)。迹线对应于如下所述的真菌的提取物:i.a=PN2290,i.b= pKV27:PN2690,ii.a=PN2257,ii.b=pKV63:PN2257,iii.a=PN2250,iii.b =pSK66:PN2250,iv.a=PN2250,iv.b=pKV74:PN2250,v.a=PN2257, v.b=pKV64:PN2257。
图4:pKV27:PN2290(nodC:ΔpaxC)的提取离子色谱图,示出了蕈青霉素6b的MS峰(5.3min,436.248±0.01m/z)。
图5:pKV63:PN2257(nodM:ApaxM)的提取离子色谱图,示出了 emindole SB 4a(19.3min,406.31±0.01m/z)但没有雀稗灵4b(17.6min, 422.305±0.01m/z)的MS峰。
图6:pSK66:PN2250(paxG、nodC、nodM和nodB:ΔPAX簇)的提取离子色谱图,示出了emindole SB 4a(19.3min,406.31±0.01m/z)但没有雀稗灵4b(17.6min,422.305±0.01m/z)的MS峰。
图7:pKV74:PN2250(paxG、paxC、paxM、nodB:ΔPAX簇)的提取离子色谱图,示出了雀稗灵4b(17.6min,422.305±0.01m/z)但没有 emindole SB 4a(19.3min,406.31±0.01m/z)的MS峰。
图8:来自于H.pulicicidum的预测的NA基因簇(A)和NAF 5a生物合成途径(B)的图示描绘。箭头表示各个基因并且箭头的装饰表示基因功能。图不是精确按比例的,并且不包括外显子/内含子结构。注意,所述基因簇缺少符合IDT合成中的第一个次级代谢步骤的GGPPS。
图9:pKV64:PN2257(nodM和nodW:ΔpaxM)的提取离子色谱图,示出了emindole SB4a(19.3min,406.31±0.01m/z)和NAF 5a(6.2min, 436.284±0.01m/z)的MS峰。
图10:pSK68:PN2250(paxG、nodC、nodM、nodB和nodW:ΔPAX 簇)的提取离子色谱图,示出了emindole SB 4a(19.3min,406.31±0.01 m/z)和NAF 5a(6.2min,436.284±0.01m/z)的MS峰。
图11:MIDAS 1级克隆的概述。
图12:MIDAS模块地址系统。
图13:MIDAS盒的概述。
图14:MIDAS多基因组装(3级)的原理。
图15:MIDAS格式的概述。
发明详述
定义
当在本说明书和权利要求书中使用时,术语“包含”意味着“至少部分由……构成”;也就是说当在本说明书和权利要求书中解释包括“包含”的陈述时,在每个陈述中以该术语作为开端的特点都需要存在,但其他特点也可以存在。相关术语例如“包含”应该以相似方式解释。
当在本文中使用时,术语“基本上由……构成”意味着指定的材料和步骤以及不实质性影响所宣称的发明的基本和新颖特征的材料和步骤。
当在本文中使用时,术语“由……构成”意味着所宣称的发明的指定的材料或步骤,不包括所述宣称中未指定的任何要素、步骤或成分。
术语“识别位点”和“限制性位点”在本文中可互换使用并且含义相同。这些术语当在本文中用于指称限制性酶时,意味着多核苷酸的一个或多个核酸序列,其定义了给定限制性酶在所述多核苷酸上的结合位点。
术语“吲哚二萜(IDT)化合物”或“吲哚二萜”是指源自于含有吲哚的前体、优选为吲哚-3-甘油磷酸酯1b和香叶基香叶基焦磷酸(GGPP) 1a的任何化合物。
在某些实施方式中,IDT化合物选自GGI 2、emindole SB 4a和NAF 5a。
术语“遗传构建物”是指已被偶联到另一个多核苷酸分子的多核苷酸分子,通常是双链DNA。在一个非限制性实例中,遗传构建物通过将第一多核苷酸分子插入到第二多核苷酸分子中,例如通过本领域中已知的限制/连接来制造。在某些实施方式中,遗传构建物包含组装在单一连续多核苷酸分子(在本文中也被称为“多基因构建物”)中的单一多核苷酸模块、至少两个多核苷酸模块或一系列多个多核苷酸模块,但不限于此。
术语“遗传构建物”是指已被偶联到另一个多核苷酸分子的多核苷酸分子,通常是双链DNA。在一个非限制性实例中,遗传构建物通过将第一多核苷酸分子插入到第二多核苷酸分子中,例如通过本领域中已知的限制/连接来制造。在某些实施方式中,遗传构建物包含组装在单一连续多核苷酸分子(在本文中也被称为“多基因构建物”)中的单一多核苷酸模块、至少两个多核苷酸模块或一系列多个多核苷酸模块,但不限于此。
遗传构建物可以含有允许多核苷酸分子的转录和任选地所述转录本翻译成多肽的必需元件。包含在所述基因构建物中和/或被其包含的多核苷酸分子可以源自于所述宿主细胞,或者可以源自于不同的细胞或生物体,和/或可以是重组多核苷酸。一旦进入所述宿主细胞内部,所述遗传构建物可能变得整合在所述宿主染色体DNA中。所述遗传构建物可能被连接到载体。
当在本文中使用时,术语“转录单位”(TU)是指包含为单一RNA 分子编码的核苷酸的序列的多核苷酸,其包括所述单一RNA分子的转录所必需的所有核苷酸序列,包括启动子、RNA编码序列和终止子,但不限于此。
当在本文中使用时,术语“转录单位模块”(TUM)是指包含编码单一RNA分子或其部分,或编码蛋白质编码序列(CDS)或其部分,或编码控制该RNA分子的转录的序列元件或其部分,或编码控制所述CDS 的翻译的序列元件或其部分的核苷酸的序列的多核苷酸。这些序列元件可以包括但不限于启动子、非翻译区(UTR)、终止子、多腺苷化信号、核糖体结合位点、转录增强子和翻译增强子。
当在本文中使用时,术语“多基因构建物”意味着作为包含至少两个TU的多核苷酸的遗传构建物。
当在本文中使用时,术语“标记”意味着编码选择标记或评分标记的多核苷酸中的核酸序列。
当在本文中使用时,术语“选择标记”是指当引入到细胞中时为所述细胞提供至少一种性状,允许在该性状存在或不存在的基础上对所述细胞进行选择的TU。在一个实施方式中,所述细胞在杀死不包含所述至少一种选择标记的细胞的条件下存活的基础上选择。
当在本文中使用时,术语“评分标记”是指当引入到细胞中时为所述细胞提供至少一种性状,允许在该性状存在或不存在的基础上对所述细胞进行评分的TU。在一个实施方式中,包含所述TU的细胞通过从多个细胞凭表型鉴定所述细胞来评分。
当在本文中使用时,术语“遗传元件”是指不是TU或不形成TU的一部分的任何多核苷酸序列。这些多核苷酸序列可以包括但不限于质粒和病毒的复制原点、着丝粒、端粒、重复序列、用于同源重组的序列、位点特异性重组序列和控制生物体之间的DNA转移的序列。
当在本文中使用时,术语“载体”是指可用于操作遗传材料,使得它可以被扩增、复制、操作、部分复制、修饰和/或表达但不限于此的任何类型的多核苷酸分子。在某些实施方式中,载体可用于将包含在该载体中的多核苷酸运输到细胞或生物体中。
当在本文中使用时,术语“源载体”是指感兴趣的多核苷酸序列可以被克隆到其中的载体。在某些实施方式中,所述多核苷酸序列是本文中所描述的TU和TUM。在某些实施方式中,源载体选自质粒、细菌人工染色体(BAC)、噬菌体人工染色体(PAC)、酵母人工染色体(YAC)、噬菌体、噬菌粒和粘粒。在某些实施方式中,包含感兴趣的多核苷酸序列的源载体被称为入门克隆。在某些实施方式中,所述入门克隆可用作穿梭或终载体用于接受其他多核苷酸序列。
当在本文中使用时,术语“穿梭载体”是指感兴趣的多核苷酸序列可以被克隆到其中并且可以从其对它们进行操作的载体。在某些实施方式中,所述多核苷酸序列是本文中所描述的TU和TUM。在某些实施方式中,穿梭载体选自质粒、BAC、PAC、YAC、噬菌体、噬菌粒和粘粒。在某些实施方式中,包含感兴趣的多核苷酸序列的穿梭载体可用作终载体用于接受其他多核苷酸序列。
当在本文中使用时,术语“终载体”是指感兴趣的多核苷酸序列可以被克隆到其中的载体。在某些实施方式中,所述多核苷酸序列是本文中所描述的TU和TUM。在某些实施方式中,终载体选自质粒、BAC、PAC、 YAC、噬菌体、噬菌粒和粘粒。在某些实施方式中,包含感兴趣的多核苷酸序列的终载体是入门克隆.。在某些实施方式中,所述入门克隆可用作终载体用于接受其他多核苷酸序列。
当在本文中使用时,术语“多核苷酸”意味着任何长度的单链或双链脱氧核糖核苷酸或核糖核苷酸聚合物,并且作为非限制性实例包括基因的编码和非编码序列、正义和反义序列、外显子、内含子、基因组DNA、 cDNA、pre-mRNA、mRNA、rRNA、siRNA、miRNA、tRNA、核酶、重组多核苷酸、分离和纯化的天然存在的DNA或RNA序列、合成的RNA 和DNA序列、核酸探针、引物、片段、遗传构建物、载体和修饰的多核苷酸。对核酸、核酸分子、核苷酸序列和多核苷酸序列的指称应该被同样地理解。
当在本文中使用时,术语“基因”是指遗传的生物学单元,其自我复制并位于特定染色体上的确定位置(基因座)处。在一个实施方式中,所述特定染色体是真核或细菌的染色体。术语细菌染色体在本文中可以与术语细菌基因组互换使用。
当在本文中使用时,术语“基因簇”是指位于同一染色体上紧密在一起的一组基因,其产物在细胞的初级或次级代谢的特定方面发挥协调作用。在一个实例中,基因簇包含一组CDS,其产物都参与构成生产给定代谢物、特别是次级代谢物的生物合成途径或阵列的一系列生物化学反应。
当在本文中使用时,术语“次级代谢物”是指不参与初级代谢的化合物,因此它们不同于更普遍的大分子例如构成生命的基本机制的蛋白质和核酸。
当用于指称酶活性时,术语“在其中……酶有活性的条件下”及其语法变化形式意味着所述酶将执行它的预期功能,例如限制性内切酶将在适合的限制性位点处切割核酸,并且DNA连接酶将两个多核苷酸共价联结在一起。
当在本文中使用时,术语“内源的”是指细胞、组织或生物体的组成成分,其源自于该细胞、组织或生物体或在该细胞、组织或生物体中天然产生。“内源的”组成成分可以是任何组成成分,包括但不限于多核苷酸、包括非核糖体多肽在内的多肽、脂肪酸或聚酮,但不限于此。
当在本文中使用时,术语“外源的”是指细胞、组织或生物体的任何组成成分,其不源自于该细胞、组织或生物体或不在该细胞、组织或生物体中天然产生。外源组成成分可以是例如已被引入到细胞、组织或生物体中的多核苷酸序列或在该细胞、组织或生物体中从该多核苷酸序列表达的多肽。
当在本文中用于指称根据本发明所述的多核苷酸序列时,“天然存在的”是指在自然界中发现的原始多核苷酸序列。出于本公开的目的,与野生多核苷酸序列一致的合成的多核苷酸序列被认为是天然存在的序列。对于天然存在的多核苷酸序列来说,重要的是构成所述多核苷酸的核苷酸碱基的真正序列从自然界发现或已知。
例如,野生型多核苷酸序列是天然存在的多核苷酸序列,但不限于此。天然存在的多核苷酸序列也指在自然界中发现的不同于野生型的变体多核苷酸序列。例如由杂交或水平基因转移造成的等位基因变体和天然存在的重组多核苷酸序列,但不限于此。
当在本文中用于指称根据本发明所述的多核苷酸序列时,“非天然存在的”是指在自然界中未发现的多核苷酸序列。非天然存在的多核苷酸序列的实例包括通过例如点突变、插入或缺失制造的人工产生的突变体和变体多核苷酸序列,但不限于此。非天然存在的多核苷酸序列还包括化学进化的序列。对于非天然存在的根据本发明所述的多核苷酸序列来说,重要的是构成所述多核苷酸的核苷酸碱基的真正序列未从自然界发现或已知。
当在本文中用于指称多核苷酸时,术语“野生型”是指多核苷酸的天然存在的非突变体形式。突变体多核苷酸意味着维持本领域中已知的突变例如点突变、插入、缺失、替换、扩增或易位的多核苷酸,但不限于此。
当在本文中用于指称多肽时,术语“野生型”是指多肽的天然存在的非突变体形式。野生型多肽是能够从野生型多核苷酸表达的多肽。
术语“编码序列”或“开放阅读框”(ORF)是指能够在适合的调控序列控制下产生转录产物和/或多肽的基因组DNA序列的正义链或cDNA 序列。所述CDS通过5’翻译起始密码子和3’翻译终止密码子的存在来识别。当插入到遗传构建物或表达盒中时,“编码序列”(CDS)在被可操作连接到启动子和/或其他调控元件时能够被表达。
“可操作连接”意味着所述待表达的序列被置于调控元件的控制之下。
当在本文中使用时,“调控元件”是指控制或影响多核苷酸插入片段从载体、遗传构建物或表达盒的表达的任何核酸序列元件,并且包括启动子、转录控制序列、翻译控制序列、复制原点、组织特异性调控元件、时间调控元件、增强子、多腺苷化信号、阻遏物和终止子。调控元件与将要从本文中所描述的遗传构建物、表达盒或载体表达的多核苷酸插入片段可以是“同源的”或“异源的”。当本文中所描述的遗传构建物、表达盒或载体存在于细胞中时,调控元件相对于细胞可以是“内源的”、“外源的”、“天然存在的”和/或“非天然存在的”。
术语“非编码区”是指在翻译起始位点上游和翻译终止位点下游的非翻译序列。这些序列分别也被称为5’UTR和3’UTR。这些区域包括转录起始和终止和翻译效率调控所需的元件。
终止子是终止转录的序列,并存在于被翻译序列下游基因的3’非翻译末端中。终止子是mRNA稳定性的重要决定因素,并且在某些情况下被发现具有空间调控功能。
术语“启动子”是指编码区上游的非转录顺式调控元件,其调控多核苷酸序列的转录。启动子包含指定转录起始位点和保守框的顺式起始元件。在一个非限制性实例中,细菌的启动子可以包含“Pribnow框”(也被称为-10区)和被转录因子结合并促进转录的其他基序。启动子对于待表达的多核苷酸序列来说可以是同源或异源的。当将要在细胞中表达多核苷酸序列时,启动子可以是内源或外源启动子。正如本领域中已知的,启动子可以是组成型启动子、诱导型启动子或调控型启动子。
当在本文中用于指称多核苷酸调控元件时,“同源的”意味着多核苷酸调控元件是本源和天然存在的多核苷酸调控元件。同源的多核苷酸调控元件可以被可操作连接到感兴趣的多核苷酸,使得所述感兴趣的多核苷酸可以从根据本发明的TU、遗传元件或载体表达。
当在本文中用于指称宿主生物体中的多核苷酸或多肽时,“同源的”意味着所述多核苷酸或多肽是本源和天然存在的多核苷酸或该宿主生物体内的多核苷酸。同源的多核苷酸可以被可操作连接到同源或异源的调控元件,使得同源多肽可以从包含本文中所描述的同源多核苷酸的TU、遗传元件或载体表达。
当在本文中用于指称宿主生物体中的多核苷酸或多肽时,“引入的同源的”意味着所述多核苷酸或多肽是本源和天然存在的多核苷酸或该宿主生物体内的多核苷酸,其已通过实验技术引入到所述生物体中。引入的同源的多核苷酸可以被可操作连接到同源或异源的调控元件,使得同源多肽可以从包含本文中所描述的同源多核苷酸的TU、遗传元件或载体表达。
当在本文中用于指称多核苷酸调控元件时,“异源的”意味着多核苷酸调控元件不是本源和天然存在的多核苷酸调控元件。异源的多核苷酸调控元件通常不伴有与它可操作连接的CDS。异源的调控元件可以被可操作连接到感兴趣的多核苷酸,使得所述感兴趣的多核苷酸可以从根据本发明的载体、遗传构建物或表达盒表达。这些启动子可以包括正常伴有其他基因、ORF或编码区的启动子,和/或从任何其他细菌、病毒、真核或哺乳动物细胞分离的启动子。
当在本文中用于指称宿主生物体中的多核苷酸或多肽时,“异源的”意味着所述多核苷酸或多肽不是该宿主生物体中本源和天然存在的多核苷酸或多肽。异源的多核苷酸可以被可操作连接到异源或同源的调控元件,使得异源多肽可以从包含本文中所描述的异源多核苷酸的TU、遗传元件或载体表达。
术语“异源表达”意味着异源多肽在宿主细胞中的表达。
“从GGI 2产生NAA 10的生物合成途径中的生物化学反应”意味着由特定酶之一催化的特定反应之一,所述特定酶参与将底物分子GGI 2通过下述中间体转化成NAA 10:单环氧化物化GGI 3a,emindole SB 4a,NAF 5a,NAE 6a,NAD 7a,NAC 8,NAB 9,并且不包括宿主细胞内可能具有类似功能但不作用于上面具体命名的中间体的类似酶。
多肽的“有功能的变体或其片段”是多肽的子序列,其执行该多肽的生物活性或结合所需的功能和/或提供所述多肽的三维结构。所述术语可以是指多肽、多肽的聚集体例如二聚体或其他多聚体、融合多肽、多肽片段、多肽变体或其能够执行所述多肽活性的功能性多肽衍生物。
当在本文中用于指称多核苷酸或多肽序列时,“分离的”描述了已从其天然细胞环境取出的序列。分离的分子可以通过本领域中已知并使用的任何方法或方法的组合来获得,包括生物化学、重组和合成技术。所述多核苷酸或多肽序列可以通过至少一个纯化步骤来制备。
当在本文中用于指称细胞或宿主细胞时,“分离的”描述了已从生物体或其天然环境获得或取出,并随后维持在本领域中已知的实验室环境中的细胞或宿主细胞。所述术语涵盖了单细胞本身以及包含在细胞培养物中的细胞或宿主细胞,并且可以包括单一细胞或单一宿主细胞。
当在本文中用于指称真菌宿主细胞时,术语“分离的宿主细胞”涵盖了单细胞真菌的单个细胞和丝状真菌的菌丝和菌丝体,包括有隔和无隔形式。
术语“重组的”是指从在天然背景下在其周围的序列中取出和/或与在其天然背景中不存在的序列重新组合的多核苷酸序列。“重组的”多肽序列从“重组的”多核苷酸序列通过翻译产生。
当在本文中使用时,术语“变体”是指与具体指定的序列不同的多核苷酸或多肽序列,其中一个或多个核苷酸或氨基酸残基被缺失、替换或添加。变体可能是天然存在的等位基因变体或非天然存在的变体。变体可能来自于同一物种或来自于其他物种,并且可能涵盖同源物、旁系同源物和直系同源物。在某些实施方式中,可用于本发明的多肽的变体具有与相应的野生型分子即亲代多肽或多核苷酸相同或相似的生物活性。
在某些实施方式中,本文中描述的多肽的变体具有与它们相应的野生型分子相似或基本上相似的生物活性。在某些实施方式中,所述相似是相似的活性和/或结合特异性。
在某些实施方式中,本文中描述的多肽的变体具有与它们相应的野生型分子不同的生物活性。在某些实施方式中,所述差异是改变的活性和 /或结合特异性。
对于多核苷酸和多肽来说,术语“变体”涵盖了本文中所定义的所有形式的多核苷酸和多肽。
变体多核苷酸序列与本发明的序列优选地表现出至少50%、至少60%、优选地至少70%、优选地至少71%、优选地至少72%、优选地至少73%、优选地至少74%、优选地至少75%、优选地至少76%、优选地至少77%、优选地至少78%、优选地至少79%、优选地至少80%、优选地至少81%、优选地至少82%、优选地至少83%、优选地至少84%、优选地至少85%、优选地至少86%、优选地至少87%、优选地至少88%、优选地至少89%、优选地至少90%、优选地至少91%、优选地至少92%、优选地至少93%、优选地至少94%、优选地至少95%、优选地至少96%、优选地至少97%、优选地至少98%和优选地至少99%的一致性。一致性在根据本发明的方法使用或鉴定的多核苷酸的至少8个核苷酸位置、优选地至少10个核苷酸位置、优选地至少15个核苷酸位置、优选地至少20个核苷酸位置、优选地至少27个核苷酸位置、优选地至少40个核苷酸位置、优选地至少50 个核苷酸位置、优选地至少60个核苷酸位置、优选地至少70个核苷酸位置、优选地至少80个核苷酸位置的比较窗口内,优选地在所述多核苷酸的整个长度内发现。
多核苷酸变体还涵盖了与一种或多种具体指定的序列表现出相似性的变体,其可能保留了那些序列的功能等同性,并且不能被合理地预测是通过随机机会发生的。
多核苷酸序列一致性和相似性可以由本领域技术人员容易地确定。
变体多核苷酸还涵盖与本文中描述的多核苷酸序列不同,但作为遗传密码简并性的结果编码与本发明的多核苷酸编码的多肽具有相似活性的多肽的多核苷酸。不改变多肽的氨基酸序列的序列变化是“沉默变异”。除了ATG(甲硫氨酸)和TGG(色氨酸)之外,其他用于相同氨基酸的密码子可以通过本领域公认的技术改变,以例如优化在特定宿主生物体中的密码子表达。
本发明还包括引起所编码的多肽序列中一个或几个氨基酸的保守替换而不显著改变其生物活性的多核苷酸序列变化。专业技术人员将会认识到用于制造表型沉默的氨基酸替换的方法(参见例如Bowie等,1990, Science 247,1306)。
对于多肽来说,术语“变体”还涵盖天然存在的、重组和合成生产的多肽。变体多肽序列与本发明的序列优选地表现出至少35%、优选地至少40%、优选地至少50%、优选地至少60%、优选地至少70%、优选地至少71%、优选地至少72%、优选地至少73%、优选地至少74%、优选地至少75%、优选地至少76%、优选地至少77%、优选地至少78%、优选地至少79%、优选地至少80%、优选地至少81%、优选地至少82%、优选地至少83%、优选地至少84%、优选地至少85%、优选地至少86%、优选地至少87%、优选地至少88%、优选地至少89%、优选地至少90%、优选地至少91%、优选地至少92%、优选地至少93%、优选地至少94%、优选地至少95%、优选地至少96%、优选地至少97%、优选地至少98%和优选地至少99%的一致性。一致性在根据本发明的方法使用或鉴定的多肽的至少2个氨基酸位置、优选地至少3个氨基酸位置、优选地至少4个氨基酸位置、优选地至少5个氨基酸位置、优选地至少7个氨基酸位置、优选地至少10个氨基酸位置、优选地至少15个氨基酸位置、优选地至少20个氨基酸位置的比较窗口内,优选地在所述多肽的整个长度内发现。
多肽变体还涵盖了与一种或多种具体指定的序列表现出相似性的变体,其可能保留了那些序列的功能等同性,并且不能被合理地预测是通过随机机会发生的。
多肽序列一致性和相似性可以由本领域技术人员容易地确定。
变体多肽包括其中氨基酸序列与本文中的多肽相差不影响所述肽的生物活性的一个或多个保守氨基酸或非保守替换、缺失、添加或插入的多肽。
保守替换通常包括一个氨基酸被另一个具有相似特征的氨基酸替换,例如在下述组内的替换:缬氨酸,甘氨酸;甘氨酸,丙氨酸;缬氨酸,异亮氨酸,亮氨酸;天冬氨酸,谷氨酸;天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸;赖氨酸,精氨酸;和苯丙氨酸,酪氨酸。
进化的生物序列的分析显示不是所有的序列变化都是同等可能的,这至少部分反映出保守与非保守替换在生物水平上的差异。例如,某些氨基酸替换可能频繁发生,而其他替换非常罕见。氨基酸残基的进化变化或替换可以通过也被称为替换矩阵的评分矩阵来建模。这些矩阵在生物信息学分析中用于鉴定序列之间的一致性关系,并且对于专业技术人员来说是已知的。
其他变体包括具有影响了肽稳定性的修饰的肽。这些类似物可能例如在所述肽序列中含有一个或多个非肽键(其代替了肽键)。还包括包含天然存在的L-氨基酸之外的残基例如D-氨基酸或非天然存在的合成氨基酸例如β或γ氨基酸和环状类似物的类似物。
替换、缺失、添加或插入可以通过本领域中已知的突变方法来制造。专业技术人员将会认识到用于制造表型沉默的氨基酸替换的方法。参见例如Bowie等,1990,Science247,1306,
当在本文中使用时,多肽也可以指称在合成期间或之后已被修饰的多肽,例如被生物素化、苯甲基化、糖基化、磷酸化、酰胺化、使用阻断 /保护基团衍生等。这些修饰可能提高所述多肽的稳定性或活性。
术语“调节多核苷酸或多肽的表达”打算涵盖其中对应于根据本发明待表达的多核苷酸的基因组DNA被修饰,因此导致本发明的多核苷酸或多肽的表达被调节的情况。所述基因组DNA的修饰可以通过遗传转化或本领域中已知的用于诱导突变的其他方法。所述“受调节的表达”可以涉及产生的信使RNA和/或多肽的量的增加或减少,并且也可以导致由产生的多核苷酸和多肽的序列的变化造成的多肽活性的提高或降低。
术语“调节多核苷酸或多肽的活性”打算涵盖其中对应于根据本发明待表达的多核苷酸的基因组DNA被修饰,因此导致本发明的多核苷酸的表达受调节或多肽的表达或活性受调节的情况。所述基因组DNA的修饰可以通过遗传转化或本领域中已知的用于诱导突变的其他方法。所述“受调节的活性”可以涉及产生的信使RNA和/或多肽的量的增加或减少,并且也可以导致由产生的多核苷酸和多肽的序列的变化造成的多肽的功能性活性的提高或降低。
对本文公开的数字范围(例如1至10)的引用,也打算包含对该范围内所有相关数字(例如1、1.1、2、3、3.9、4、5、6、6.5、7、8、9和 10)以及该范围内的任何合理的数字范围(例如2至8、1.5至5.5和3.1 至4.7)的引用,并且因此本文明确公开的所有范围的所有子范围均被明确公开。这些仅是具体打算的示例,并且在所列举的最小值和最大值之间的数值的所有可能的组合均应被认为在本申请中以类似的方式明确地陈述。
详细描述
自从蕈青霉(Penicillium paxilli)中用于IDT蕈青霉素6b的生物合成途径的鉴定6,13-16以来,7种其他IDT生物合成途径中的基因功能已被阐明17-22。这些IDT途径共有编码用于IDT生物合成中的前三个步骤的酶的同源基因(图2):(I)香叶基香叶基焦磷酸合酶(GGPPS),其将法呢基焦磷酸和异戊基焦磷酸转变成GGPP 1a,(II)香叶基香叶基转移酶(GGT),其催化GGPP 1a和吲哚-3-甘油磷酸酯1b的吲哚缩合以制造GGI 2,和(III) 区域选择性黄素腺嘌呤二核苷酸(FAD)依赖性环氧酶,其产生单和/或双环氧化的GGI产物3a/3b。在涉及IDT环化的第四个酶促步骤时,所述途径分化成四个关键分支,产生单/双加氧的反马氏衍生的环状核心如 emindole SB 4a和雀稗灵4b,或单/双加氧的马氏衍生的环状核心如 aflavinine 4c和emindole DB 4d。这些环状核心通常被装饰性酶进一步修饰,产生在IDT内看到的生物活性多样性。
NA是由Hypoxylon pulicicidum产生的生物活性IDT,其中NAA 10由于其针对吸血节肢动物的高效杀虫活性和缺少哺乳动物毒性而尤为重要5,8。然而,正如本文中所述,通过直接合成生产NAA 10尚未实现,并且这种化合物以即使在小规模商业化水平上有用的量的生物合成生产,如果不是完全不可能,也是难以实现的。
因此,本发明总的来说涉及一系列从真菌H.pulicicidum分离的基因,其组合在一起形成了介导NA的生产的基因簇,并涉及使用该基因簇在分离的宿主细胞、优选为分离的真菌细胞中指导NA的异源表达。使用最近开发的被称为模块化幂等DNA组装系统(MIDAS)的用于操作基因序列的技术,本发明人已在可选的真菌宿主蕈青霉(Penicillium paxilli)中重建了来自于H.pulicicidum的用于NAF 5a的生物合成途径。所述MIDAS平台和使用MIDAS平台的方法在本文和整体通过引用并入本文的相关专利申请AU2017903955中描述。
本发明人分析了H.pulicicidum的基因组序列,并鉴定到包含15个预测的编码序列(CDS)的基因簇:nodW cDNA(SEQ ID NO:2)和基因组DNA(SEQ ID NO:1),nodR cDNA(SEQID NO:5)和基因组DNA (SEQ ID NO:4),nodX cDNA(SEQ ID NO:8)和基因组DNA(SEQ IDNO:7),nodM cDNA(SEQ ID NO:11)和基因组DNA(SEQ ID NO: 10),nodB cDNA(SEQ ID NO:14)和基因组DNA(SEQ ID NO:13), nodO cDNA(SEQ ID NO:17)和基因组DNA(SEQ ID NO:16),nodJ cDNA(SEQ ID NO:20)和基因组DNA(SEQ ID NO:19),nodC cDNA (SEQ ID NO:23)和基因组DNA(SEQ ID NO:22),nodY1 cDNA(SEQ ID NO:26)和基因组DNA(SEQ ID NO:25),nodD2 cDNA(SEQ ID NO:29)和基因组DNA(SEQ ID NO:28),nodD1 cDNA(SEQ ID NO: 32)和基因组DNA(SEQ ID NO:31),nodY2 cDNA(SEQ ID NO:35) 和基因组DNA(SEQ ID NO:34),nodZ cDNA(SEQ ID NO:38)和基因组DNA(SEQ ID NO:37),nodS cDNA(SEO ID NO:49)和基因组DNA(SEQ ID NO:48),nodI cDNA(SEQ ID NO:55)和基因组DNA (SEQ ID NO:54),预期它们编码NAA 10的生物合成所必需的酶。
这个基因簇的边界通过鉴定与不产生多节孢酸的另一个Hypoxylon菌株中的等同基因组座位相比具有高度相似性和同线组织的两侧基因来确定。这些基因簇中的预测基因和它们的建议功能的详细情况在表1中示出。所述簇中的7个基因与其他IDT生物合成基因簇中发现的基因同源(表 2-6)。所述与来自于其他真菌的IDT生物合成基因同源的7个预测基因的蛋白质产物与它们在蕈青霉(P.paxilli)的PAX簇、微黄青霉(P. janthinellum)的JAN簇和/或壳青霉(P.crustosum)的PEN簇中的同源物具有至少35%的氨基酸一致性,并包括GGT(NodC(SEQ ID NO:24))、;两种FAD依赖性氧化酶(NodM(SEQ ID NO:12)和NodO(SEQID NO: 18))、IDT环化酶(NodB(SEQ ID NO:15))、两种异戊二烯基转移酶(NodD2(SEQ IDNO:30)和NodD1(SEQ ID NO:33))和一种细胞色素P450加氧酶(NodR(SEQ ID NO:6))。其他7个推测的ORF预测编码四种细胞色素P450加氧酶(NodW(SEQ ID NO:3)、NodX(SEQ ID NO:9)、NodJ(SEQ ID NO:21)和NodZ(SEQ ID NO:39))、一对旁系同源的FAD依赖性加氧酶(NodY1(SEQ ID NO:27)和NodY2 (SEQ ID NO:36))以及可能参与NA生物合成的具有未知功能的两种基因产物(NodS(SEQ ID NO:50)和NodI(SEQ ID NO:56))。与来自于Chaunopycnisalba(Tolypocladium album)的负责terpendole生物合成的TER基因簇17相似,所述NOD簇似乎不含次级代谢物特异性GGPPS基因。值得注意的是,本发明人在H.pulicicidum的基因组中只鉴定到一个编码 GGPPS的基因,其预测的蛋白质产物的氨基酸序列、其外显子/内含子结构及其在鉴定到的簇外部的位置,强烈建议它负责与蕈青霉(P.paxilli) 中的ggs1相似的初级代谢功能23
为了证实基因产物的功能并直接建立它们在NAA 10生物合成中的相应作用,本发明人构建了带有这些基因的各种不同组合的一系列质粒,然后将它们转化到适合的蕈青霉(P.paxilli)宿主(表7)中,用于NAA 10 前体的异源生产。因此,将H.pulicicidum的感兴趣的基因的CDS扩增(参见表8的引物)并克隆到MIDAS 1级终载体pML1中(表9)。在MIDAS 2 级时,将所述克隆的CDS置于异源启动子(ProUTR)和转录终止子 (UTRterm)模块的控制之下,以产生全长TU(表10),然后将其用于产生多基因质粒(表11)。本发明人使用了一套蕈青霉(P.paxilli)敲除菌株(表7)来执行功能互补和途径重建,以确定NOD簇中的基因的功能。在用多基因质粒转化蕈青霉(P.paxilli)宿主后,本发明人首先通过真菌提取物的正相薄层层析(TLC,结果未示出),随后通过反相液相色谱- 质谱(LC-MS)分析,确定了转化体的化学表型。正如通过高分辨率质谱 (HRMS)所确定的,本发明人通过半制备反相高效液相色谱(HPLC) 纯化了所述新表达的代谢物,并对化合物进行核磁共振(NMR)波谱分析(1H、13C和HSQC、HMBC、COSY),用于最终鉴定。
使用这种方法,本发明人鉴定到nodC(cDNA(SEQ ID NO:23)和基因组DNA(SEQ IDNO:22))是paxC(cDNA(SEQ ID NO:43)和基因组DNA(SEQ ID NO:42))的功能性直系同源物,并且NodC(SEQ ID NO:24)在H.pulicicidum中介导GGI 2的生产,这是IDT生物合成中的第二步(图3,迹线i.b,图4)。NodC(SEQ ID NO:24)与来自于蕈青霉(P.paxilli)的PaxC(SEQID NO:44)享有52.3%的氨基酸序列一致性(表2)。本发明人还鉴定到nodM(cDNA(SEQ IDNO:11)和基因组DNA(SEQ ID NO:10))是paxM(cDNA(SEQ ID NO:46)和基因组DNA(SEQ IDNO:45))的同源物,并且NodM(SEQ ID NO:12) 是GGI 2单环氧酶,其催化单环氧化的GGI 3a的生产(图3,迹线ii.b,图5)。 NodM(SEQ ID NO:12)与来自于蕈青霉(P.paxilli)的PaxM(SEQ ID NO:47)享有48.6%的序列一致性(表3)。值得注意的是,本发明人显示NodM(SEQID NO:12)具体来说是一种单环氧酶,不同于作为单或二环氧酶的PaxM(SEQ ID NO:47)。本发明人还证实了来自于H. pulicicidum的NodB(SEQ ID NO:15)充当IDT环化酶,其将单环氧化的 GGI产物3a环化以形成emindole SB 4a(图3,迹线iii.b,图6),并且nodB (cDNA(SEQ ID NO:14)和基因组DNA(SEQ ID NO:13))是来自于蕈青霉(P.paxilli)的paxB(cDNA(SEQ ID NO:52)和基因组DNA (SEQ ID NO:51))的功能性直系同源物(图3,迹线iv.b,图7)。来自于H.pulicicidum的NodB(SEQ ID NO:15)与来自于蕈青霉(P.paxilli) 的PaxB(SEQ ID NO:53)享有63%的一致性(表4)。
专用的NAA 10核心是NAF 5a,其通过emindole SB 4a的末端甲基碳 C5”的氧化产生(图8B)。因此,本发明人通过nodW(cDNA(SEQ ID NO: 2)和基因组DNA(SEQ ID NO:1))与nodM(cDNA(SEQ ID NO:11) 和基因组DNA(SEQ ID NO:10))在paxM(cDNA(SEQ ID NO:46)和基因组DNA(SEQ ID NO:45))缺失背景(PN2257)中的共表达导致NAF 5a的产生(图3,迹线v.b,图9),证实了这种氧化酶的身份是由 H.pulicicidum nodW(cDNA(SEQ ID NO:2)和基因组DNA(SEQ ID NO: 1))编码的P450加氧酶。
为了证实只有5个基因为在蕈青霉(P.paxilli)中生产NAF 5a所必需,并且为了确立在paxM KO菌株(PN2257)中没有来自于PAX簇的其他蕈青霉(P.paxilli)IDT基因对NAF5a生产有贡献,本发明人组装了包含来自于蕈青霉(P.paxilli)的paxG(基因组DNA(SEQ IDNO:40)) 和来自于H.pulicicidum的nodC(基因组DNA(SEQ ID NO:22))、 nodM(基因组DNA(SEQ ID NO:10))、nodB(基因组DNA(SEQ ID NO:13))和nodW(基因组DNA(SEQ ID NO:1))的多基因构建物。将这种多基因构建物转化到蕈青霉(P.paxilli)PAX基因簇敲除菌株(PN2250)中。正如预期,所述5个基因的表达显示出NAF 5a被生成(图 10),并指示这5个基因事实上为生物合成NAF 5a所需。
在本文描述的工作的基础上,本发明人公开了使用异源表达来鉴定交付NAA 10核心化合物NAF 5a的前五个步骤。具体来说,本发明人证实了来自于H.pulicicidum的四个以前未知的基因的功能:nodC(cDNA(SEQ ID NO:23)和基因组DNA(SEQ ID NO:22)),nodM(cDNA(SEQ ID NO:11)和基因组DNA(SEQ ID NO:10)),nodB(cDNA(SEQ ID NO: 14)和基因组DNA(SEQ ID NO:13))和nodW(cDNA(SEQ ID NO: 2)和基因组DNA(SEQ ID NO:1)),并发现了似乎不具有次级代谢 GGPPS基因但仍产生IDT的第二个丝状真菌物种H.pulicicidum。不希望受到理论限制,本发明人相信H.pulicicidum依靠它的初级代谢GGPPS为IDT 系统提供GGPP。次级代谢GGPPS的缺少可以解释为什么H.pulicicidum产生如此少量的NA。由H.pulicicidum产生的NA的量低对于解析生物合成详情和所述化合物或其衍生物的使用两者来说具有挑战性。使用MIDAS的高效基因组装和在蕈青霉(P.paxilli)中的异源表达,本发明人克服了这两个问题。此外,本发明人证实了蕈青霉(P.paxilli)由于其远远更加有利的生长条件,是用于异源表达研究的适合的宿主,其能够使本发明人与依靠H.pulicicidum的生物合成机器可能实现的相比更快且更容易地证实基因的功能。
NAF 5a在蕈青霉(P.paxilli)中的异源生产的生物合成途径的阐明,为能够充分鉴定来自于H.pulicicidum的负责引起完全功能化的NAA 10的产生的“装饰”步骤的基因产物提供了合理的成功预期。这种合理的预期来自于本发明人对预计编码异戊二烯基化以形成多节孢酸E 6a和氧化以形成多节孢酸D 7a所需的酶的核酸CDS的鉴定。每个这些核酸序列已从本文中描述的H.pulicicidum生物合成基因簇推断鉴定。总的来说,本文描述的本发明人的工作证实了IDT基因在异源宿主中的异源表达是一种可行的方法,其可用于生产以其他方式难以获得的天然产物,并且可能在许多工业领域中有用。
多肽
因此,一方面,本发明涉及一种分离的多肽,其包含选自NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM (SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO: 18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、 NodY2(SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)的氨基酸序列,或其有功能的变体或片段。
优选地,所述有功能的变体或片段与选自SEQ ID NO:NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM (SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO: 18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、 NodY2(SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)的氨基酸序列具有至少70%、优选地至少75%、优选地至少80%、优选地至少85%、优选地至少90%、优选地至少95%、优选地至少99%的氨基酸序列一致性。
优选地,所述包含NodW(SEQ ID NO:3)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为细胞色素P450加氧酶活性。
优选地,所述包含NodR(SEQ ID NO:6)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为细胞色素P450加氧酶活性。
优选地,所述包含NodX(SEQ ID NO:9)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为细胞色素P450加氧酶活性。
优选地,所述包含NodM(SEQ ID NO:12)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述包含NodB(SEQ ID NO:15)的分离的多肽或其有功能的变体或片段具有环化酶活性,优选为IDT环化酶活性。
优选地,所述包含NodO(SEQ ID NO:18)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述包含NodJ(SEQ ID NO:21)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为细胞色素P450加氧酶活性。
优选地,所述包含NodC(SEQ ID NO:24)的分离的多肽或其有功能的变体或片段具有转移酶活性,优选为GGT活性。
优选地,所述包含NodY1(SEQ ID NO:27)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述包含NodD2(SEQ ID NO:30)的分离的多肽或其有功能的变体或片段具有转移酶活性,优选为异戊二烯基转移酶活性。
优选地,所述包含NodD1(SEQ ID NO:33)的分离的多肽或其有功能的变体或片段具有转移酶活性,优选为异戊二烯基转移酶活性。
优选地,所述包含NodY2(SEQ ID NO:36)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述包含NodZ(SEQ ID NO:39)的分离的多肽或其有功能的变体或片段具有加氧酶活性,优选为细胞色素P450加氧酶活性。
在一个实施方式中,所述分离的多肽包含NodW(SEQ ID NO:3)、 NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO: 12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、 NodD2(SEQ IDNO:30)、NodD1(SEQ ID NO:33)、NodY2(SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ IDNO:50)和NodI (SEO ID NO:56),或其有功能的变体或片段。
在一个实施方式中,所述分离的多肽基本上由NodW(SEQ ID NO: 3)、NodR(SEQ IDNO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ (SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO: 27)、NodD2(SEQ IDNO:30)、NodD1(SEQ ID NO:33)、NodY2 (SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQID NO: 50)和NodI(SEQ ID NO:56)或其有功能的变体或片段构成。
在一个实施方式中,所述分离的多肽由SEQ ID NO:NodW(SEQ ID NO:3)、NodR(SEQID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ IDNO:18)、 NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO: 27)、NodD2(SEQID NO:30)、NodD1(SEQ ID NO:33)、NodY2 (SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)或其有功能的变体或片段。
多核苷酸
另一方面,本发明涉及一种编码多肽的分离的多核苷酸,所述多肽包含选自SEQID NO:NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、 NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO: 15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、 NodD1(SEQ ID NO:33)、NodY2(SEQ IDNO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO:50)和NodI(SEQ ID NO:56)的氨基酸序列或其有功能的变体或片段。
优选地,所述有功能的变体或片段与选自NodW(SEQ ID NO:3)、 NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO: 12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、 NodD2(SEQ IDNO:30)、NodD1(SEQ ID NO:33)、NodY2(SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ IDNO:50)和NodI (SEQ ID NO:56)的氨基酸序列或其有功能的变体或片段具有至少70%、优选地至少75%、优选地至少80%、优选地至少85%、优选地至少90%、优选地至少95%、优选地至少99%的氨基酸序列一致性。
优选地,所述分离的多核苷酸编码包含NodW(SEQ ID NO:3)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为细胞色素P450 加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodR(SEQ ID NO:6)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为细胞色素P450 加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodX(SEQ ID NO:9)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为细胞色素P450 加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodM(SEQ ID NO:12)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodB(SEQ ID NO:15)的多肽或其有功能的变体或片段,其具有环化酶活性,优选为IDT环化酶活性。
优选地,所述分离的多核苷酸编码包含NodO(SEQ ID NO:18)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodJ(SEQ ID NO:21)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为细胞色素P450 加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodC(SEQ ID NO:24)的多肽或其有功能的变体或片段,其具有转移酶活性,优选为GGT活性。
优选地,所述分离的多核苷酸编码包含NodY1(SEQ ID NO:27) 的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodD2(SEQ ID NO:30) 的多肽或其有功能的变体或片段,其具有转移酶活性,优选为异戊二烯基转移酶活性。
优选地,所述分离的多核苷酸编码包含NodD1(SEQ ID NO:33) 的多肽或其有功能的变体或片段,其具有转移酶活性,优选为异戊二烯基转移酶活性。
优选地,所述分离的多核苷酸编码包含NodY2(SEQ ID NO:36) 的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为FAD依赖性加氧酶活性。
优选地,所述分离的多核苷酸编码包含NodZ(SEQ ID NO:39)的多肽或其有功能的变体或片段,其具有加氧酶活性,优选为细胞色素P450 加氧酶活性。
在一个实施方式中,所述分离的多核苷酸编码包含NodW(SEQ ID NO:3)、NodR(SEQID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ IDNO:18)、 NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO: 27)、NodD2(SEQID NO:30)、NodD1(SEQ ID NO:33)、NodY2 (SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)的多肽或其有功能的变体或片段。
在一个实施方式中,所述分离的多核苷酸编码的多肽基本上由NodW (SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1 (SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、NodY2(SEQ ID NO:36)、NodZ(SEQ IDNO:39)、NodS(SEQ ID NO:50)和NodI(SEQ ID NO:56)或其有功能的变体或片段构成。
在一个实施方式中,所述分离的多核苷酸编码的多肽由NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM (SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO: 18)、NodJ(SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、 NodY2(SEQ ID NO:36)、NodZ(SEQ ID NO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)或其有功能的变体或片段构成。
另一方面,本发明涉及一种分离的多核苷酸,其与选自nodW cDNA (SEQ ID NO:2)、nodW基因组DNA(SEQ ID NO:1)、nodR cDNA (SEQ ID NO:5)、nodR基因组DNA(SEQ IDNO:4)、nodX cDNA (SEQ ID NO:8)、nodX基因组DNA(SEQ ID NO:7)、nodM cDNA (SEQ IDNO:11)、nodM基因组DNA(SEQ ID NO:10)、nodB cDNA (SEQ ID NO:14)、nodB基因组DNA(SEQID NO:13)、nodO cDNA (SEQ ID NO:17)、nodO基因组DNA(SEQ ID NO:16)、nodJ cDNA (SEQID NO:20)、nodJ基因组DNA(SEQ ID NO:19)、nodC cDNA (SEQ ID NO:23)、nodC基因组DNA(SEQ ID NO:22)、nodY1 cDNA (SEQ ID NO:26)、nodY1基因组DNA(SEQ ID NO:25)、nodD2cDNA (SEQ ID NO:29)、nodD2基因组DNA(SEQ ID NO:28)、nodD1 cDNA (SEQ ID NO:32)、nodD1基因组DNA(SEQ ID NO:31)、nodY2 cDNA (SEQ ID NO:35)、nodY2基因组DNA(SEQ IDNO:34)、nodZ cDNA (SEQ ID NO:38)、nodZ基因组DNA(SEQ ID NO:37)、nodS cDNA (SEQ IDNO:49)、nodS基因组DNA(SEQ ID NO:48)、nodI cDNA (SEQ ID NO:55)和nodI基因组DNA(SEQ ID NO:54)的核酸序列具有至少70%的核酸序列一致性。
优选地,所述分离的多核苷酸与选自nodWcDNA(SEQ ID NO:2)、 nodW基因组DNA(SEQ ID NO:1)、nodRcDNA(SEQ ID NO:5)、nodR 基因组DNA(SEQ ID NO:4)、nodX cDNA(SEQID NO:8)、nodX基因组DNA(SEQ ID NO:7)、nodM cDNA(SEQ ID NO:11)、nodM基因组DNA(SEQID NO:10)、nodB cDNA(SEQ ID NO:14)、nodB基因组DNA(SEQ ID NO:13)、nodO cDNA(SEQID NO:17)、nodO 基因组DNA(SEQ ID NO:16)、nodJ cDNA(SEQ ID NO:20)、nodJ 基因组DNA(SEQ ID NO:19)、nodC cDNA(SEQ ID NO:23)、nodC 基因组DNA(SEQ ID NO:22)、nodY1cDNA(SEQ ID NO:26)、nodY1 基因组DNA(SEQ ID NO:25)、nodD2 cDNA(SEQ ID NO:29)、nodD2 基因组DNA(SEQ ID NO:28)、nodD1 cDNA(SEQ ID NO:32)、nodD1 基因组DNA(SEQ IDNO:31)、nodY2 cDNA(SEQ ID NO:35)、nodY2 基因组DNA(SEQ ID NO:34)、nodZ cDNA(SEQID NO:38)、nodZ 基因组DNA(SEQ ID NO:37)、nodS cDNA(SEQ ID NO:49)、nodS 基因组DNA(SEQ ID NO:48)、nodI cDNA(SEQ ID NO:55)和nodI 基因组DNA(SEQ ID NO:54)的核酸序列具有至少75%、优选地至少 80%、优选地至少85%、优选地至少90%、优选地至少95%、优选地至少 99%的核酸序列一致性。
在一个实施方式中,所述分离的多核苷酸包含选自nodW cDNA (SEQ ID NO:2)、nodW基因组DNA(SEQ ID NO:1)、nodR cDNA (SEQ ID NO:5)、nodR基因组DNA(SEQ ID NO:4)、nodX cDNA (SEQ ID NO:8)、nodX基因组DNA(SEQ ID NO:7)、nodM cDNA (SEQ ID NO:11)、nodM基因组DNA(SEQ ID NO:10)、nodB cDNA (SEQ ID NO:14)、nodB基因组DNA(SEQ IDNO:13)、nodO cDNA (SEQ ID NO:17)、nodO基因组DNA(SEQ ID NO:16)、nodJ cDNA (SEQ IDNO:20)、nodJ基因组DNA(SEQ ID NO:19)、nodC cDNA (SEQ ID NO:23)、nodC基因组DNA(SEQID NO:22)、nodY1 cDNA (SEQ ID NO:26)、nodY1基因组DNA(SEQ ID NO:25)、nodD2 cDNA(SEQ ID NO:29)、nodD2基因组DNA(SEQ ID NO:28)、nodD1 cDNA (SEQ ID NO:32)、nodD1基因组DNA(SEQ ID NO:31)、nodY2 cDNA (SEQ ID NO:35)、nodY2基因组DNA(SEQ ID NO:34)、nodZ cDNA (SEQ ID NO:38)、nodZ基因组DNA(SEQ ID NO:37)、nodS cDNA (SEQ ID NO:49)、nodS基因组DNA(SEQ ID NO:48)、nodI cDNA (SEQ ID NO:55)和nodI基因组DNA(SEQID NO:54)的核酸序列。
在一个实施方式中,所述分离的多核苷酸基本上由选自nodW cDNA (SEQ ID NO:2)、nodW基因组DNA(SEQ ID NO:1)、nodR cDNA (SEQ ID NO:5)、nodR基因组DNA(SEQ IDNO:4)、nodX cDNA (SEQ ID NO:8)、nodX基因组DNA(SEQ ID NO:7)、nodM cDNA (SEQ IDNO:11)、nodM基因组DNA(SEQ ID NO:10)、nodB cDNA (SEQ ID NO:14)、nodB基因组DNA(SEQID NO:13)、nodO cDNA (SEQ ID NO:17)、nodO基因组DNA(SEQ ID NO:16)、nodJ cDNA (SEQID NO:20)、nodJ基因组DNA(SEQ ID NO:19)、nodC cDNA (SEQ ID NO:23)、nodC基因组DNA(SEQ ID NO:22)、nodY1 cDNA (SEQ ID NO:26)、nodY1基因组DNA(SEQ ID NO:25)、nodD2cDNA (SEQ ID NO:29)、nodD2基因组DNA(SEQ ID NO:28)、nodD1 cDNA (SEQ ID NO:32)、nodD1基因组DNA(SEQ ID NO:31)、nodY2 cDNA (SEQ ID NO:35)、nodY2基因组DNA(SEQ IDNO:34)、nodZ cDNA (SEQ ID NO:38)、nodZ基因组DNA(SEQ ID NO:37)、nodS cDNA (SEQ IDNO:49)、nodS基因组DNA(SEQ ID NO:48)、nodI cDNA (SEQ ID NO:55)和nodI基因组DNA(SEQ ID NO:54)的核酸序列构成。
在一个实施方式中,所述分离的多核苷酸由选自nodWcDNA(SEQ ID NO:2)、nodW基因组DNA(SEQ ID NO:1)、nodR cDNA(SEQ ID NO:5)、nodR基因组DNA(SEQ ID NO:4)、nodXcDNA(SEQ ID NO: 8)、nodX基因组DNA(SEQ ID NO:7)、nodM cDNA(SEQ ID NO:11)、 nodM基因组DNA(SEQ ID NO:10)、nodB cDNA(SEQ ID NO:14)、 nodB基因组DNA(SEQ ID NO:13)、nodO cDNA(SEQ ID NO:17)、 nodO基因组DNA(SEQ ID NO:16)、nodJ cDNA(SEQ ID NO:20)、nodJ基因组DNA(SEQ ID NO:19)、nodC cDNA(SEQ ID NO:23)、 nodC基因组DNA(SEQ ID NO:22)、nodY1 cDNA(SEQ ID NO:26)、 nodY1基因组DNA(SEQ ID NO:25)、nodD2 cDNA(SEQ IDNO:29)、 nodD2基因组DNA(SEQ ID NO:28)、nodD1 cDNA(SEQ ID NO:32)、 nodD1基因组DNA(SEQ ID NO:31)、nodY2 cDNA(SEQ ID NO:35)、 nodY2基因组DNA(SEQ ID NO:34)、nodZcDNA(SEQ ID NO:38)、 nodZ基因组DNA(SEQ ID NO:37)、nodS cDNA(SEQ ID NO:49)、 nodS基因组DNA(SEQ ID NO:48)、nodI cDNA(SEQ ID NO:55)和 nodI基因组DNA(SEQ ID NO:54)的核酸序列构成。
本发明的或本文中另外描述的核酸分子优选是分离的。它们可以使用本领域普通技术人员已知的各种不同技术从生物样品分离。例如,这些多核苷酸可以通过本领域中已知的聚合酶链反应(PCR)的使用来分离。本发明的核酸分子可以使用本文中所定义的源自于本发明的多核苷酸序列的引物来扩增。
用于分离多核苷酸的其他方法包括使用本发明的全部或一部分多核苷酸作为杂交探针。将标记的多核苷酸探针杂交到固定化在固相支持物例如硝酸纤维素滤膜或尼龙膜上的多核苷酸的技术,可用于筛选基因组或 cDNA文库。同样地,可以将探针偶联到珠子并杂交到靶序列。分离可以使用已知的技术方案例如磁性分离来实现。适合严紧性的杂交和清洗条件据信在本领域的技术范围之内。
多核苷酸片段可以通过本领域中公知的技术例如限制性内切酶消化和寡核苷酸合成来生产。
在本领域中公知的方法中,部分多核苷酸序列可用作探针以鉴定样品中相应的全长多核苷酸序列。这些方法包括本领域中已知的基于PCR 的方法、5’RACE和基于杂交的方法、基于计算机/数据库的方法。可以使用可检测的标记物例如放射性同位素、荧光、化学发光和生物发光标记物来便于检测。反向PCR也允许以基于已知区域的引物开始获取在本文中公开的多核苷酸序列两侧的未知序列,正如在本领域中已知和使用的。所述方法使用几种限制性酶在基因的已知区域中产生适合的片段。然后将所述片段通过分子内连接环化并用作PCR模板。从所述已知区域设计趋异的引物。为了物理组装全长克隆,可以如本领域中已知利用标准的分子生物学方法。允许扩增本发明的多核苷酸的引物和引物对也形成本发明的另一方面。
变体(包括直系同源物)可以通过所描述的方法来鉴定。变体多核苷酸可以使用本领域中已知的基于PCR的方法来鉴定。通常,可用于通过PCR扩增多核苷酸分子的变体的引物的多核苷酸序列可以基于编码相应的氨基酸序列的保守区的序列。
用于鉴定变体多核苷酸的其他方法包括如上所述使用指定多核苷酸的全部或部分作为杂交探针来筛选基因组或cDNA文库。通常,可以使用基于编码相应的氨基酸序列的保守区的序列的探针。杂交条件也可以比在筛选与探针一致的序列时使用的条件严紧性更低。
另一方面,本发明涉及一种TU,其包含至少一种本文中所描述的分离的多核苷酸。在一个实施方式中,所述TU被包含在载体、优选为表达载体中。在一个实施方式中,所述载体选自质粒、BAC、PAC、YAC、噬菌体、噬菌粒和粘粒。优选地,所述载体是质粒。
另一方面,本发明涉及一种载体,其编码根据本发明所述的分离的多肽或其有功能的变体或片段。
另一方面,本发明涉及一种载体,其包含根据本发明所述的分离的核酸序列。
在一个实施方式中,所述分离的核酸序列被包含在TU中。
在一个实施方式中,所述载体选自质粒、BAC、PAC、YAC、噬菌体、噬菌粒和粘粒。优选地,所述载体是质粒。在一个实施方式中,所述载体是表达载体。
包含本发明的多核苷酸的TU可以被并入到能够在体外或宿主细胞中表达该多核苷酸或在适用时本发明的编码多肽的任何适合的载体中。优选地,所述载体是表达载体。适合的表达载体的实例包括但不限于质粒DNA 载体、病毒DNA载体(例如腺病毒和腺相关病毒)或病毒RNA载体(例如反转录病毒载体)。在某些实施方式中,所述质粒和/或噬菌体载体可以选自下述载体或其变体,包括pUC18、pU19、Mp18、Mp19、ColE1、 PCR1和pKRC、λgt10和M13质粒例如pBR322、pACYC184、pT127、RP4、 p1J101、SV40和BPV。还包括载体例如但不限于粘粒、YAC、BAC穿梭载体例如pSA3、PAT28转座子(例如在US 5,792,294中描述的)等。
适合的病毒载体包括但不限于源自于腺病毒(AV)、腺相关病毒 (AAV)、反转录病毒(例如慢病毒(LV)、弹状病毒、鼠类白血病病毒)、疱疹病毒等的载体。本文中使用的病毒载体可以通过使用来自于其他病毒的包膜蛋白或其他表面抗原的假型包装,或通过替换不同的病毒衣壳蛋白进行适合的修饰,正如本领域中已知和使用的。
在一个实施方式中,所述表达载体包含至少一种、优选地至少两种、优选地至少三种、优选地至少四种、优选地至少五种、优选地至少六种、优选地至少七种、优选地至少八种、优选地至少九种、优选地至少10种本文中所描述的分离的多核苷酸。
在一个实施方式中,所述表达载体包含至少一种、优选地至少两种、优选地至少三种、优选地至少四种、优选地至少五种、优选地至少六种、优选地至少七种、优选地至少八种、优选地至少九种、优选地至少10种本文中所描述的TU。
在一个实施方式中,所述载体是克隆系统中的组分。在一个实施方式中,所述克隆系统对制造包含至少一种TU的基因构建物有用。
在一个实施方式中,所述载体被包含在载体组中,所述载体组是克隆系统的一部分。在一个实施方式中,所述克隆系统对制造包含至少一种 TU的基因构建物有用。
在一个实施方式中,所述克隆系统对制造包含至少一种TU的基因构建物有用。
在一个实施方式中,所述基因构建物是包含至少两种TU的多基因构建物。在一个实施方式中,所述多基因构建物包含至少三种、优选地至少四种、优选地至少五种、优选地至少六种、优选地至少七种、优选地至少八种、优选地至少九种、优选地至少十种TU。
本文中描述的TU可以包含一种或多种本发明的公开的多核苷酸序列和/或编码公开的多肽的多核苷酸。所述TU可以被构建成在体外或体内驱动参与NAA10的生物合成的至少一种多肽的表达。在一个实施方式中,所述TU包含可操作连接到5′或3′非翻译调控序列的本发明的多核苷酸。特定 TU的设计取决于各种不同因素,包括所述可操作连接的多核苷酸将要在其中表达的宿主细胞和所需的多核苷酸表达水平。
同样地,对TU来说,各种不同的启动子、增强子和/或其他遗传元件的选择取决于各种不同的因素,包括上文讨论的宿主细胞和表达水平。在一个实施方式中,所述TU包含可操作连接到本发明的多核苷酸的同源启动子。在另一个实施方式中,所述表达盒包含可操作连接到本发明的多核苷酸的异源启动子。在一个实施方式中,所述同源或异源启动子是可诱导、可阻遏或可调控的启动子。可以选择适合的启动子并在适合的条件下使用以指导本发明的多核苷酸的高水平表达。许多这样的元件被描述在文献中,并且可以通过商业化供应商获得。
仅仅作为实例,在所述表达盒中有用的启动子可以是任何适合的真核或原核启动子。在一个实施方式中,所述真核启动子可以是真核RNA 聚合酶I(pol I)、RNA聚合酶II(pol II)或RNA聚合酶III(pol III)。在特定细胞类型中可操作连接的多核苷酸的表达水平将由附近存在(或不存在)特定基因调控序列(例如增强子、沉默子等)决定。任何适合的启动子/增强子组合(参见真核启动子数据库EPDB)可用于驱动本发明的多核苷酸的表达。
在表达盒中有用的另外的启动子包括本领域中公知的B-内酰胺酶、碱性磷酸酶、色氨酸和tac启动子系统。酵母启动子包括3-磷酸甘油酸激酶、烯醇化酶、己糖激酶、丙酮酸脱羧酶、葡萄糖激酶和甘油醛-3-磷酸脱氢酶,但不限于此。
在表达盒中有用的原核启动子包括本领域中已知的组成型启动子 (例如噬菌体λ的int启动子和pBR322的β-内酰胺酶基因序列的bla启动子)和可调控启动子(例如lacZ、recA和gal)。表达可能也需要CDS 上游的核糖体结合位点。
在TU中有用的增强子包括SV40增强子、巨细胞病毒早期启动子增强子、珠蛋白、白蛋白、胰岛素等。
在一个实施方式中,TU可以由T3、T7或SP6细胞质表达系统驱动。
用于蛋白质表达的特定启动子/增强子/细胞类型组合的选择在分子生物学领域人员的普通技术之内(参见例如Sambrook等,(1989),其通过引用并入本文)。
另一方面,本发明涉及一种分离的宿主细胞,其包含根据本发明所述的分离的多肽、分离的多核苷酸、TU和/或分离的载体。
在一个实施方式中,所述分离的宿主细胞是原核或真核细胞。最常用作宿主细胞的原核生物是大肠埃希氏杆菌菌株。其他原核宿主包括假单胞菌、芽孢杆菌、沙雷氏菌、克雷伯氏菌、链霉菌、李斯特菌、沙门氏菌和分支杆菌,但不限于此。
在一个实施方式中,所述真核细胞是动物细胞、植物细胞、真菌细胞或原生生物细胞。在一个实施方式中,所述动物细胞是昆虫细胞或哺乳动物细胞。在一个实施方式中,所述真菌细胞是单细胞真菌宿主菌株的单细胞。在一个实施方式中,所述真菌细胞包含真菌菌丝或真菌宿主菌株的菌丝体。
在一个实施方式中,所述真菌细胞、真菌宿主菌株的菌丝或菌丝体来自于曲霉、木霉、脉孢菌、镰刀菌、被孢霉、金孢霉、假丝酵母、地霉、耶氏酵母、假囊酵母、粉夜蛾、阿舒囊霉、汉逊酵母、毕赤酵母、克鲁维酵母、裂殖酵母、红曲霉、踝节菌、Cryptonectria、内座壳、弯颈霉、肉座菌、赤霉、枝顶孢、伞菌、侧耳、青霉、草菇、火菇、香菇、木耳、灵芝、(根)毛霉、Riopus或酿酒酵母属,优选为青霉、曲霉菌、酿酒酵母、毕赤酵母、粉夜蛾和贪夜蛾属。优选地,所述真菌细胞来自于酿酒酵母属。优选地,所述真菌菌丝或菌丝体来自于青霉属,优选为蕈青霉(P.paxilli)。
另一方面,本发明涉及一种制造至少一种NA的方法,所述方法包括在分离的宿主细胞中异源表达根据本发明所述的至少一种多肽、分离的核酸序列、TU或载体。
在一个实施方式中,所述NA选自图1中描绘的一组NA。优选地,所述NA是NAF 5a或NAA 10,优选为NAA 10。
在一个实施方式中,所述多肽是根据本发明所述的多肽或有功能的变体或片段。
作为本发明的这一方面内的实施方式,具体设想了本文中针对本发明的涉及异源表达(包括适合的调控序列的选择)、表达盒、遗传元件、 TU、多基因构建物、宿主细胞和载体的任何其他方面所阐述的各种不同实施方式。
在特定实施方式中,所述多肽的异源表达包括在本文中所描述的分离的真菌宿主细胞中或分离的真菌菌株的菌丝体中,从本文中描述的至少一种载体表达根据本发明所述的至少一种多核苷酸或编码本发明的至少一种多肽的至少一种TU。在一个实施方式中,所述多肽是NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)或NodZ(SEQ ID NO:39),优选地所述多肽是催化从NAB 9向NAA 10的生物转化的酶。在一个实施方式中,所述真菌细胞或菌株是青霉属细胞或菌株,优选为蕈青霉(P.paxilli)。
在一个实施方式中,所述TU被包含在多基因构建物中,所述构建物包含至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种和/或至少10种编码根据本发明所述的多肽的多核苷酸。
另一方面,本发明涉及通过本发明的方法制造的至少一种NA。在一个实施方式中,所述NA选自图1中描绘的NA。优选地,所述NA是NAF 5a 或NAA 10,优选为NAA 10。
另一方面,本发明涉及来自于Hypoxylon spp.的一种分离的多肽或其有功能的变体或片段,其催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应。
另一方面,本发明涉及一种编码来自于Hypoxylon spp.的至少一种多肽的分离的多核苷酸,所述多肽催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应。
在一个实施方式中,所述分离的多肽是加氧酶,优选为细胞色素P450 加氧酶或FAD依赖性加氧酶。优选地,所述细胞色素P450加氧酶是NodW (SEQ ID NO:3)、NodR(SEQ IDNO:6)、NodX(SEQ ID NO:9)、 NodJ(SEQ ID NO:21)或NodZ(SEQ ID NO:39)。优选地,所述FAD 依赖性加氧酶是NodM(SEQ ID NO:12)、NodO(SEQ ID NO:18)、 NodY1(SEQ ID NO:27)或NodY2(SEQ ID NO:36)。在一个实施方式中,所述分离的多肽是转移酶,优选为GGT或异戊二烯基转移酶。优选地,所述GGT是NodC(SEQ ID NO:24)。优选地,所述异戊二烯基转移酶是NodD1(SEQ ID NO:33)或NodD2(SEQ ID NO:30)。在一个实施方式中,所述分离的多肽是IDT环化酶。优选地,所述IDT环化酶是NodB(SEQ ID NO:15)。在一个实施方式中,所述分离的多肽是 NodS(SEQ ID NO:50)。在一个实施方式中,所述分离的多肽是NodI (SEQ ID NO:56)。
在一个实施方式中,所述分离的多肽催化从GGI 2产生NAF 5a的生物合成途径中的生物化学反应。优选地,所述分离的多肽是GGT、FAD依赖性加氧酶、IDT环化酶或细胞色素P450加氧酶。优选地,所述GGT是NodC (SEQ ID NO:24)。优选地,所述FAD依赖性加氧酶是NodM(SEQ ID NO: 12)。优选地,所述IDT环化酶是NodB(SEQ ID NO:15)。优选地,所述细胞色素P450加氧酶是NodW(SEQ ID NO:3)。
在一个实施方式中,所述分离的多肽或其有功能的变体或片段由根据本发明所述的核酸编码。
另一方面,本发明涉及一种制造至少一种Hypoxylon spp.多肽或其有功能的变体或片段的方法,所述方法包括在分离的宿主细胞中异源表达根据本发明所述的分离的核酸序列、TU或载体。
在一个实施方式中,所述至少一种Hypoxylon spp.多肽是本文中为本发明的任何其他方面所设想的根据本发明所述的多肽。
在一个实施方式中,所述至少一种Hypoxylon spp.多肽是包含NodW (SEQ ID NO:3)的氨基酸序列的多肽或其有功能的变体或片段。优选地,所述多肽基本上由NodW(SEQ IDNO:3)构成或由其构成。在一个实施方式中,所述分离的宿主细胞包含青霉属、优选为蕈青霉(P.paxilli) 的真菌菌丝体。
为本发明的这一方面具体设想了为本发明的涉及异源表达(包括适合的调控序列的选择)、遗传元件、TU、多基因构建物、宿主细胞和载体的任何其他方面所阐述的各种不同实施方式。
另一方面,本发明涉及一种制造至少一种NA的方法,所述方法包括在分离的宿主细胞中异源表达催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应的至少一种多肽。
在一个实施方式中,所述至少一种多肽是加氧酶,优选为细胞色素 P450加氧酶或FAD依赖性加氧酶。优选地,所述细胞色素P450加氧酶是NodW(SEQ ID NO:3)、NodR(SEQ IDNO:6)、NodX(SEQ ID NO: 9)、NodJ(SEQ ID NO:21)或NodZ(SEQ ID NO:39)。优选地,所述FAD依赖性加氧酶是NodM(SEQ ID NO:12)、NodO(SEQ ID NO: 18)、NodY1(SEQ ID NO:27)或NodY2(SEQ ID NO:36)。在一个实施方式中,所述分离的多肽是转移酶,优选为GGT或异戊二烯基转移酶。优选地,所述GGT是NodC(SEQ ID NO:24)。优选地,所述异戊二烯基转移酶是NodD1(SEQ ID NO:33)或NodD2(SEQ ID NO:30)。在一个实施方式中,所述分离的多肽是IDT环化酶。优选地,所述IDT 环化酶是NodB(SEQ ID NO:15)。在一个实施方式中,所述分离的多肽是NodS(SEQ ID NO:50)。在一个实施方式中,所述分离的多肽是 NodI(SEQ ID NO:56)。
在一个实施方式中,所述至少一种多肽催化从GGI 2产生NAF 5a的生物合成途径中的生物化学反应。优选地,至少一种多肽是GGT、FAD依赖性加氧酶、IDT环化酶或细胞色素P450加氧酶。优选地,所述GGT是NodC (SEQ ID NO:24)。优选地,所述FAD依赖性加氧酶是NodM(SEQ ID NO: 12)。优选地,所述IDT环化酶是NodB(SEQ ID NO:15)。优选地,所述细胞色素P450加氧酶是NodW(SEQ ID NO:3)。
在一个实施方式中,所述至少一种多肽包含NodW(SEQ ID NO:3) 的氨基酸序列或其有功能的变体或片段。优选地,所述多肽基本上由NodW (SEQ ID NO:3)构成或由其构成。在一个实施方式中,所述分离的宿主细胞包含青霉属、优选为蕈青霉(P.paxilli)的真菌菌丝体。
为本发明的这一方面具体设想了为本发明的涉及异源表达(包括适合的调控序列的选择)、遗传元件、TU、多基因构建物、宿主细胞和载体的任何其他方面所阐述的各种不同实施方式。
另一方面,本发明涉及一种分离的宿主细胞,其表达在导致NAA10 的形成的生物合成途径中催化底物的转化的至少一种异源多肽。
在一个实施方式中,至少一种异源多肽在导致NAF5a的形成的生物合成途径中催化底物的转化。
在一个实施方式中,所述底物选自GGPP1a、吲哚-3-甘油磷酸酯1b、 GGI2、单环氧化的GGI3a、emindole SB4a、NAF5a、NAE6a、NAD7a、NAC8和NAB 9。
在一个实施方式中,所述转化选自缩合、氧化或环化。
在一个实施方式中,所述被转化的底物是GGPP 1a和吲哚-3-甘油磷酸酯1b,并且所述转化是缩合。
在一个实施方式中,所述被转化的底物是GGI 2,并且所述转化是氧化。
在一个实施方式中,所述被转化的底物是单环氧化的GGI 3a,并且所述转化是环化。
在一个实施方式中,所述被转化的底物是emindole SB 4a,并且所述转化是氧化。
在一个实施方式中,所述被转化的底物是NAF 5a,并且所述转化是缩合。
在一个实施方式中,所述被转化的底物是NAE 6a,并且所述转化是氧化。
在一个实施方式中,所述被转化的底物是NAD 7a,并且所述转化是氧化和缩合。
在一个实施方式中,所述被转化的底物是NAC 8,并且所述转化是氧化。
在一个实施方式中,所述被转化的底物是NAB 9,并且所述转化是氧化。
另一方面,本发明涉及一种分离的宿主细胞,其通过异源表达生产参与产生NAA10的生物合成途径中的至少一种多肽。
在一个实施方式中,所述至少一种多肽催化从GGI 2产生NAF 5a的生物合成途径中的生物化学反应。优选地,至少一种多肽是GGT、FAD依赖性加氧酶、IDT环化酶或细胞色素P450加氧酶。优选地,所述GGT是NodC (SEQ ID NO:24)。优选地,所述FAD依赖性加氧酶是NodM(SEQ ID NO: 12)。优选地,所述IDT环化酶是NodB(SEQ ID NO:15)。优选地,所述细胞色素P450加氧酶是NodW(SEQ ID NO:3)。
在为本发明的这一方面具体设想的某些实施方式中,所述至少一种多肽是如本文中为本发明的任何其他方面所定义的参与产生NAA 10的生物合成途径中的多肽。
在一个实施方式中,至少一种多肽是本发明的多肽或其有功能的变体或片段。在一个实施方式中,所述多肽或其有功能的变体或片段由本发明的核酸序列编码。
在一个实施方式中,所述至少一种多肽参与产生NAF 5a的生物合成途径。在一个实施方式中,所述至少一种多肽包含NodW(SEQ ID NO:3) 的氨基酸序列或其有功能的变体或片段。优选地,所述多肽基本上由NodW (SEQ ID NO:3)构成或由其构成。在一个实施方式中,所述分离的宿主细胞包含青霉素、优选为蕈青霉(P.paxilli)的真菌菌丝体。
为本发明的这一方面具体设想了为本发明的涉及异源表达(包括适合的调控序列的选择)、遗传元件、TU、多基因构建物、宿主细胞和载体的任何其他方面所阐述的各种不同实施方式。
另一方面,本发明涉及一种生产至少一种NA的方法,所述方法包括将包含糖类的底物与用核酸转化的重组细胞相接触,所述转化导致与转化之前的所述细胞相比选自NodW(SEQ ID NO:3)、NodR(SEQ ID NO: 6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ ID NO:21)、 NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、NodY2(SEQ ID NO:36)、 NodZ(SEQ ID NO:39)、NodS(SEQ ID NO:50)和NodI(SEQ ID NO: 56)的多肽或其有功能的变体或片段的水平或活性提高,使得所述底物被代谢成至少一种NA。
在一个实施方式中,所述核酸编码至少一种多肽,其催化从GGI 2产生NAF 5a的生物合成途径中的生物化学反应,优选地催化从emindole SB 4a产生NAF 5a的生物化学反应。
在一个实施方式中,所述重组宿主细胞是本文中所描述的本发明的分离的宿主细胞。
在一个实施方式中,所述糖类被包含在培养基中。在一个实施方式中,所述培养基是支持所述重组细胞的生长的CDYE或其变化形式。
在一个实施方式中,所述核酸编码至少一种多肽,所述多肽是加氧酶,优选是细胞色素P450加氧酶或FAD依赖性加氧酶。优选地,所述细胞色素P450加氧酶是NodW(SEQ IDNO:3)、NodR(SEQ ID NO:6)、 NodX(SEQ ID NO:9)、NodJ(SEQ ID NO:21)或NodZ(SEQ IDNO: 39)。优选地,所述FAD依赖性加氧酶是NodM(SEQ ID NO:12)、 NodO(SEQ ID NO:18)、NodY1(SEQ ID NO:27)或NodY2(SEQ ID NO:36)。在一个实施方式中,所述分离的多肽是转移酶,优选为GGT 或异戊二烯基转移酶。优选地,所述GGT是NodC(SEQ ID NO:24)。优选地,所述异戊二烯基转移酶是NodD1(SEQ ID NO:33)或NodD2 (SEQ ID NO:30)。在一个实施方式中,所述分离的多肽是IDT环化酶。优选地,所述IDT环化酶是NodB(SEQ ID NO:15)。在一个实施方式中,所述分离的多肽是NodS(SEQ ID NO:50)。在一个实施方式中,所述分离的多肽是NodI(SEQ ID NO:56)。
在一个实施方式中,所述核酸编码至少一种GGT、FAD依赖性加氧酶、IDT环化酶或细胞色素P450加氧酶。在一个实施方式中,所述核酸编码GGT、FAD依赖性加氧酶、IDT环化酶或细胞色素P450加氧酶中的至少两者,优选地至少三者,优选地至少四者。优选地,所述GGT是NodC (SEQ ID NO:24)。优选地,所述FAD依赖性加氧酶是NodM(SEQ ID NO:12)。优选地,所述IDT环化酶是NodB(SEQ ID NO:15)。优选地,所述细胞色素P450加氧酶是NodW(SEQ IDNO:3)。
在一个实施方式中,选自NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodX(SEQ IDNO:9)、NodM(SEQ ID NO:12)、NodB (SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ(SEQ IDNO:21)、 NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQID NO:33)、NodY2(SEQ ID NO:36)、 NodZ(SEQ ID NO:39)、NodS(SEQ ID NO:50)和NodI(SEQ ID NO: 56)的多肽或其有功能的变体或片段,包含本发明的NodW(SEQ ID NO: 3)、NodR(SEQ ID NO:6)、NodX(SEQ ID NO:9)、NodM(SEQ ID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodJ (SEQ ID NO:21)、NodC(SEQ ID NO:24)、NodY1(SEQ ID NO:27)、NodD2(SEQ ID NO:30)、NodD1(SEQ ID NO:33)、NodY2 (SEQ ID NO:36)、NodZ(SEQ IDNO:39)、NodS(SEQ ID NO: 50)和NodI(SEQ ID NO:56)的氨基酸序列或其有功能的变体或片段。
在一个实施方式中,所述多肽包含NodW(SEQ ID NO:3)的氨基酸序列或其有功能的变体或片段。优选地,所述多肽基本上由NodW(SEQ ID NO:3)构成或由其构成。在一个实施方式中,所述分离的宿主细胞包含青霉素、优选为蕈青霉(P.paxilli)的真菌菌丝体。
为本发明的这一方面具体设想了为本发明的涉及异源表达(包括适合的调控序列的选择)、遗传元件、TU、多基因构建物、宿主细胞和载体的任何其他方面所阐述的各种不同实施方式。
在一个实施方式中,所述至少一种异源或引入的同源核酸序列是选自本文中所描述的nodW、nodR、nodX、nodM、nodB、nodO、nodJ、 nodC、nodY1、nodD2、nodD1、nodY2、nodZ、nodS和nodI的至少一种 NAA 10生物合成基因。
在一个实施方式中,所述两种不同GGPPS酶之一通过在H. pulicicidum中异源表达来产生。
在一个实施方式中,所述两种不同GGPPS酶之一由编码GGPPS酶的本源H.pulicicidum基因的第二个拷贝编码。
另一方面,本发明涉及一种分离的Hypoxylon pulicicidum菌株,其包含导致NAA10的生物合成增加的遗传修饰。
在一个实施方式中,所述分离的菌株与H.pulicicidum的对照菌株、优选为H.pulicicidum ATCC 74245相比包含至少一种GGPPS酶的提高的表达。
在一个实施方式中,所述提高的表达是H.pulicicidum的本源的主要 GGPPS基因的通过遗传调控元件的修饰引起的提高的表达。
在一个实施方式中,遗传调控元件的修饰包括将所述本源的主要GGPPS基因可操作连接到可选的或修饰的启动子。
在一个实施方式中,遗传调控元件的修饰包括将本源的主要GGPPS 基因可操作连接到更鲁棒的本源启动子。在一个实施方式中,所述本源的主要GGPPS基因是引入的同源基因。
在一个实施方式中,所述提高的表达是对NAA 10生物合成有贡献的生物合成基因的异源表达的结果。
在一个实施方式中,所述提高的表达由与在Nod簇中鉴定的基因具有等同的生物化学功能的异源基因在H.pulicicidum中的表达造成,其中所述Nod簇如本文中所描述。
在一个实施方式中,所述提高的表达由修复NAA 10生物合成所需的底物化合物或生物合成中间体的供应限制的异源基因在H.pulicicidum中的表达造成。
在一个实施方式中,所述提高的表达由编码催化GGPP 1a和吲哚-3- 甘油磷酸酯1b的缩合以产生3-香叶基香叶基吲哚2的GGT的任何基因在H. pulicicidum中的异源表达造成。
在一个实施方式中,所述提高的表达由编码GGPPS的任何基因在H. pulicicidum中的异源表达造成。
在一个实施方式中,所述提高的表达由编码产生单环氧化的GGI产物 3a的FAD依赖性氧化酶的任何基因在H.pulicicidum中的异源表达造成。
在一个实施方式中,所述提高的表达由编码将单环氧化的GGI 3a环化以产生emindole SB 4a的酶的任何基因在H.pulicicidum中的异源表达造成。
在一个实施方式中,所述提高的表达由编码氧化emindole SB 4a以产生多节孢酸的酶的任何基因在H.pulicicidum中的异源表达造成。
在一个实施方式中,所述提高的表达由导致选自本文中所描述的 nodW、nodR、nodX、nodM、nodB、nodO,nodJ,nodC、nodY1、 nodD2、nodD1、nodY2、nodZ、nodS和nodI的NA生物合成基因的表达提高的至少一种遗传修饰造成。
另一方面,本发明涉及一种制造NAA 10的方法,所述方法包括在 Hypoxylonpulicicidum中表达至少一种异源核酸序列,其中所述至少一种异源核酸序列编码产生NAA10的生物合成途径中的酶。
为本发明的这一方面具体设想了为本发明的涉及本文中所描述的分离的Hypoxylon pulicicidum菌株、包括涉及NAA 10的增加的表达的任何其他方面所阐述的各种不同实施方式,并且还包括关于本文中所描述的异源表达(包括适合的调控序列的选择)、遗传元件、TU、多基因构建物、宿主细胞和载体所阐述的所有实施方式。
在本说明书中,在对专利说明书、其他外部文献或其他信息源做出引用时,这通常是出于为本发明的特点的讨论提供背景的目的。除非另有特别说明,否则对此类外部文献的引用不应被解释为承认此类文献或此类信息源在任何管辖范围内是先有技术或形成本领域公知常识的一部分。
现在将参考下述实施例,以非限制性方式来说明本发明。
实施例
材料和方法
用于基因组测序和TUM扩增的gDNA分离
用于基因组测序和TUM的PCR扩增的基因组DNA,按照Byrd等人的方法26并做出修改从蕈青霉(Penicillium paxilli)菌材
Figure BDA0002491759280000551
26601TM (PN2013)24和Hypoxylonpulicicidum菌株
Figure BDA0002491759280000552
74245TM,25分离。在125 mL锥形摇瓶中以25mL的等分试样制备Milli-
Figure BDA0002491759280000553
水中的无菌2.4%(w/v) DifcoTM马铃薯右旋糖肉汤(Becton,Dickinson andCompany,Maryland, U.S.A.),并用5×106个孢子或~1cm2新鲜研磨的菌丝体(用于非孢子生殖的菌株)接种。将培养物在22℃下振摇(200rpm)温育2-4天。将发酵液通过无菌尿布衬巾过滤,并将菌丝体用无菌水清洗三次。将菌丝体转移到无菌的15mL离心管,并在液氮中快速冷冻以冷冻干燥24-48小时。将15-20 mg冷冻干燥的菌丝体置于含有液氮的研钵中并研磨成粉。将磨碎的菌丝体转移到2mL管,并重悬浮在1mL提取缓冲液(150mM EDTA,50mMTris-HCl,和1%(w/v)月桂酰基肌氨酸钠)中。向管添加1.6mg蛋白酶K,并将内含物在37℃温育30min。将管以13,000rpm离心10min,并将上清液转移到新的2mL管。向所述管添加500μL苯酚和500μL氯仿,将内含物涡旋混合,然后以13,000rpm离心10min。将水性相转移到新的2mL管,并如上所述用500μL苯酚和500μL氯仿清洗两次。然后将水性相转移到新的2mL管,并用1mL氯仿清洗(涡旋振荡并以13,000rpm离心10min)。将水性相转移到新的2mL管并与1mL冷异丙醇混合。将DNA在-20℃沉淀过夜并以13,000rpm离心10min。舍弃上清液并将DNA重悬浮在1mL 1M NaCl中。将所述管在室温下温育10min,然后以13,000rpm离心10min以沉积多糖。将上清液转移到新的管并与1mL异丙醇混合。将所述管在室温下温育10min,然后以13,000rpm离心10min。舍弃上清液并向沉积物添加1mL冷70%乙醇而不重悬浮。将所述管以13,000rpm离心2min并舍弃上清液。将所述管以13,000rpm离心1min,并吸出残留的70%乙醇。将沉积物在室温下真空干燥,重悬浮在50μL Milli-
Figure BDA0002491759280000554
水中并储存在-20℃下。
MIDAS设计概述
MIDAS工具箱是基于金门组装技术27,其利用了IIS型限制性酶在单一反应中将多个DNA片段无缝联结在一起的能力。MIDAS利用三种IIS型限制性酶AarI、BsaI和BsmBI,它们在切割后产生用户定义的4bp单链突出端。通过这些用户定义的单链突出端的适合选择和每个DNA片段两侧的 IIS型位点的适合取向,可以使用一锅限制-连接反应将多个片段以有序(定向)方式组装在受体质粒(也称为终载体)中。所述受体质粒含有两侧带有IIS型酶的两个趋异取向的识别位点的标记基因(通常为用于蓝/白筛选的lacZα基因);这些元件被合称为“金门克隆盒”,在组装反应期间被插入片段代替。
与其他最近描述的基于金门的模块化组装技术28-32相同,使用 MIDAS的基因和多基因构建物的组装是一种层次化过程。在第一级 (MIDAS 1级)时,将功能性模块(启动子、CDS、转录终止子、标签等) 克隆到1级终载体(pML1)中,在那里它们形成可重复使用的序列验证的部件的文库。所述模块和终载体的互补设计确保在克隆到pML1中后,这些模块可以通过用BsaI消化从所述载体释放。
在第二级(2级)时,使用BsaI介导的金门反应将相容的成组序列验证的1级模块从pML1释放并组装到2级终载体(pML2)中,导致产生含有真核TU的2级质粒。同样地,设计规则确保每个组装的TU可以从所述pML2载体释放,这次是通过用AarI或BsmBI消化(取决于TU被组装在其中的pML2载体)。
在3级时,使用4arI或BsmBI介导的金门反应,将在2级时组装的 TU从pML2质粒释放并在3级终载体(pML3)中顺序组装在一起,以形成功能性多基因构建物,其然后可以被转化到所需的表达宿主中。
1级:模块克隆
在1级时,功能性TUM作为PCR产物或作为合成的多核苷酸序列(来自于基因合成公司)产生,并通过BsmBI介导的金门克隆被克隆到1级终载体(pML1)中。为了被克隆到pML1载体中,PCR引物被设计成使得每个扩增的TUM两侧带有两个趋同的BsmBI位点BsmBI[CTCG]和[AGAC]BsmBI,其在限制性酶切割后产生的粘性末端与pML1终载体中存在的BsmBI位点的粘性末端相容。因此,pML1中存在的金门克隆盒由在两侧具有两个趋异的BsmBI位点的lacZα评分标记构成: 5’-[CTCG]BsmBI-lacZα-BsmBI[AGAC]-3’(图11A)。
为了能够进行全长TU的后续(即2级)组装,每个TUM被设计成两侧带有在5’末端处的四个模块特异性核苷酸(NNNN)和在3’末端处的四个模块特异性核苷酸(NNNN),它们作为PCR引物序列的一部分被包括。扩增的模块和pML1载体的互补设计确保了当使用BsmBI介导的金门反应将扩增的TUM克隆到pML1中时,每个TUM变得两侧具有趋同的BsaI识别位点。并且当在随后的(即2级)BsaI介导的全长TU的金门组装期间将所述模块从pML1释放时,所述模块特异性核苷酸(NNNN和NNNN)变成 BsaI特异性4bp单链突出端。因此,PCR产物(或合成的多核苷酸)中每个模块的总体结构采取下述形式: 5’-BsmBI[CTCG]NNNN-TUM-NNNNtg[AGAC]BsmBI-3’(图11B),其在 BsmBI介导的克隆后在pML1中变成5’-BsaI[NNNN]-TUM-[NNNN]BsaI-3’ (图11C)。
由于每个TUM被它的两侧四核苷酸限定,因此这些模块特异性碱基有效地形成了每个TUM的地址系统,并且它们确定了它在组装的TU内的位置和取向。MoClo和GoldenBraid2.0的开发者已协力工作,以为广泛种类的TUM开发出用于植物表达的共同的语构或一套标准地址(在MoClo系统中被称为“融合位点”并且在GoldenBraid2.0中被称为“条形码”),以促进部件的可交换能力33,并且这种标准在这里也被采纳用于在丝状真菌中表达的TU的基于MIDAS的组装(图12)。
因此,对于丝状真菌表达来说,ProUTR模块(包含启动子、5’非翻译区(UTR)和ATG起始密码子)具有作为模块特异性5’核苷酸的GGAG 和作为模块特异性3’核苷酸的AATG(即5’-GGAG-ProUTR-AATG-3’),其中翻译起始密码子被下划线。同样地,CDS模块两侧具有AATG和GCTT (即5’-AATG-CDS-GCTT-3’),而UTRterm模块(由3’UTR和3’非转录区、包括多腺苷化信号构成)具有5’-GCTT-UTRterm-CGCT-3’的形式。用于扩增这三种类型的TUM的PCR引物的设计考虑因素示出在表12中。
在pML1中TUM的BsmBI介导的组装后,将反应转化到大肠杆菌菌株例如DH5α(或等同物)中并铺于增补有壮观霉素、IPTG和X-Gal的LB平板上。带有克隆的TUM的质粒通过筛选白色菌落来鉴定并通过测序确认。
在MIDAS 1级时,重要的是将所有内部AarI、BsaI和BsmBI识别位点屏蔽或从TUM消除。被称为“驯化”的屏蔽或消除这些禁止位点的过程可以通过下述方法实现:(i)在从基因合成公式订购所述序列时排除这些位点,(ii)定向突变,或(iii)使用与靶DNA形成三链体的屏蔽寡核苷酸,从而阻止限制性酶切割30。以以前将IIS型酶用于突变34和金门驯化目的27,35相同的方式,我们通过设计与内部IIS型限制性位点交叠并含有破坏所述位点的单核苷酸错配的引物(被称为驯化引物)驯化了 MIDAS模块。由于所述PCR产物被设计用于在MIDAS中使用BsmBI介导的金门反应组装在一起以在pML1中形成全长驯化TUM,因此重要的是所述MIDAS驯化引物被设计成具有在5’末端处产生相容的单链突出端的BsmBI限制性位点。
2级:TU组装
在2级时,使用BsaI介导的金门反应将相容的成组的克隆和序列验证的1级TUM(例如ProUTR、CDS和UTRterm模块)在pML2终载体中组装,导致产生含有完整的(即全长)真核TU的2级质粒(pML2入门克隆)。在较早时描述的模块地址标准确保TU的组装以有序、定向的方式进行,其中一个模块的3’末端与下一个模块的5’末端相容。
位于ProUTR模块的5’末端处的模块特异性碱基GGAG和位于 UTRterm模块的3’末端处的CGCT,与由pML2终载体的BsaI消化产生的单链突出端相容,因此这些碱基定义了2级组装的最外侧的克隆边界。
在MIDAS中,存在八种可以在其中组装TU的2级(pML2)终载体,其选择取决于在3级时产生的多基因质粒中TU的所需配置,即:(i) TU被添加到多基因组装体的所需次序,(ii)多基因质粒被组装的所需方向,和(iii)每个TU在多基因质粒中的所需取向。这些特点在下文进一步讨论。
所述pML2载体彼此的差异在于作为MIDAS运行的中心的特定核酸序列零件的排列。这些被合称为MIDAS盒的序列零件(图13)定义了 TU的2级组装并控制了在3级时产生的多基因构建物的组装。
每个MIDAS盒由下述特点所定义:(i)具有两侧带有趋异的BsaI 识别位点的金门克隆盒,(ii)AarI和BsmBI的识别位点的不同排列,和 (iii)lacZα评分标记的存在或不存在。这些特点被更详细描述。
与通常的金门克隆盒(其通常含有用于蓝/白筛选的lacZα基因)相反,所有8种pML2载体中的金门克隆盒含有两侧具有趋异的BsaI识别位点的突变体大肠杆菌pheS基因(由大肠杆菌氯霉素乙酰转移酶基因的启动子驱动)。这里使用的大肠杆菌pheS基因的Thr251Ala/Ala294Gly双重突变体为在增补有苯丙氨酸类似物4-氯-苯丙氨酸4CP的LB培养基上生长的细胞提供了高致死率36。在TU的BsaI介导的2级组装期间,所述突变体pheS基因从所述pML2载体中消除,并因此可以被用作负选择标记。
所述八种pML2载体取决于在MIDAS盒中分别存在或不存lacZα基因,在可以被分成两类“蓝色”和“白色”(参见图13)。存在四种“蓝色”pML2载体(由质粒名称中的“B”指示)和四种“白色”pML2载体 (由质粒名称中的“W”指示)。所述“蓝色”和“白色”载体的区别还在于它们的MIDAS盒中AarI和BsmBI限制性位点的相对配置。因此,在“蓝色”载体中,整个MIDAS盒在两侧带有趋同的BsmBI位点,并且在其中嵌套有两侧带有趋异的AarI位点的lacZα基因。在“白色”载体中,酶的配置调换(整个MIDAS盒在两侧带有趋同的AarI位点,并在其中嵌套有两个趋异的BsmBI位点),并且不存在lacZα基因。重要的是指出 pML2载体中的lacZα产色标记不在TU的2级金门组装期间用于蓝/白筛选(它被保留用于3级克隆),但TU应该在其中组装的“蓝色”或“白色”载体的选择必须在TU的2级组装期间做出,因为这将决定在3级时TU被添加到多基因构建物的次序。同样地,AarI和BsmBI位点也不被用于TU的2级组装;相反,它们是多基因构建物的3级组装的不可或缺的组成部分。这些考虑因素,包括(+)和(-)载体之间的差异,在下文3 级的描述下进一步讨论。
每个TU的取向(转录方向)可以通过将每个TU组装在pML2“正向”载体(由质粒名称中的“F”指示)或pML2“反向”载体(由质粒名称中的“R”指示)中自由地决定。所述pML2“反向”载体的BsaI识别位点(用于TU的金门组装)相对于pML2“正向”载体中的BsaI融合位点对调。因此,pML2“正向”载体的基于pheS的金门盒取向为
Figure BDA0002491759280000601
而pML2“反向”载体的BsaI识别位点对调:
Figure BDA0002491759280000611
其中箭头指示突变体 pheS基因的转录方向。
与克隆的1级模块相反,当将用组装反应转化的大肠杆菌DH5α细胞(或等同物)铺于增补有卡那霉素和4CP的LB平板上时,所述pML2终载体提供了卡那霉素抗性,允许针对1级模块骨架进行高效反选择,而突变体pheS基因提供了针对任何亲代pML2终质粒的强有力的负选择。
3级:多基因构建物的组装
在MIDAS 3级时,将在pML2质粒中组装的TU顺序装载(通过二元组装)到3级终载体(pML3)中以形成多基因构建物。
在3级时多基因构建物的组装关键是依赖于位于“蓝色”和“白色” pML2载体中的MIDAS盒中AarI和BsmBI限制性位点的本发明的相对配置;这些限制性位点在白色载体中与蓝色载体相比的嵌套和颠倒配置,是所述MIDAS多基因组装过程的决定性特点。在所述“蓝色”载体中,整个MIDAS盒具有两侧的趋同的BsmBI位点,并且在其中嵌套了两侧带有趋异的AarI位点的lacZα基因。在所述“白色”载体中,所述酶的配置是颠倒的(整个MIDAS盒具有两侧的趋同的AarI位点并且在其中嵌套有两个趋异的BsmBI位点),并且不存在lacZα基因。如图14中所示,限制性位点在“蓝色”和“白色”载体中的嵌套和颠倒意味着在“白色”MIDAS 盒中组装的TU可以使用AarI介导的金门反应插入到“蓝色”MIDAS盒中,相反,在“蓝色”MIDAS盒中组装的TU可以使用BsmBI介导的金门反应克隆到“白色”MIDAS盒中。这种克隆循环(即在“白色”与“蓝色”pML2入门克隆之间交替)可以无限重复。
在3级终载体pML3中存在的金门克隆盒由两侧带有趋异的AarI位点的lacZα基因构成:[CATT]AarI-lacZα-AarI[CGTA],因此所述MIDAS 3级组装总是使用pML3与已被组装在pML2“白色”终载体中的TU之间的AarI 介导的金门反应来启动(即总是添加所述第一TU)(图14)。然后将产生的质粒与克隆到pML2“蓝色”终载体中TU一起用于BsmBI介导的金门反应。遵照这种通过分别使用pML2“白色”和pML2“蓝色”入门克隆在 AarI和BsmBI介导的金门反应之间交替的方法,来添加另外的TU。因此,通过将TU克隆到所述多基因构建物中产生的每个质粒变成了用于下一轮 TU添加的终载体(图14)。
在每个克隆循环后,将大肠杆菌DH5a细胞(或等同物)用所述金门反应转化,铺于增补有壮观霉素、IPTG和X-Ga1的LB平板上,并通过蓝/ 白筛选来鉴定阳性克隆。壮观霉素选择已摄入3级质粒的细胞并针对任何 pML2质粒骨架进行反选择。值得注意的是,尽管pML2“蓝色”载体中存在的lacZα产色标记以前在TU的2级组装期间未被使用,但现在在多基因组装水平(3级)时,它被用于蓝/白筛选。因此,对于使用AarI介导的金门反应组装在所述多基因构建物中的TU来说,挑取白色菌落用于分析,而使用BsmBI介导的金门反应组装在所述多基因构建物中的TU通过挑取蓝色菌落进行分析(参见表13)。
在其最简单的配置中,MIDAS可以使用仅仅两个pML2终载体来实现多基因组装:一个“白色”载体和一个“蓝色”载体(图15A)。然而,全套八种pML2载体的提供能够实现对下述特点的最大用户控制:(i)每个TU被添加到所述生长中的多基因构建物的次序,(ii)每个TU的所需取向(也就是说转录方向),和(iii)组装的极性,即输入的TU被装载在所述多基因构建物中的方向。
首先并且如较早时所述,每个TU向所述生长中的多基因构建物添加的次序,由TU被组装在其中的“白色”或“蓝色”pML2终载体的选择来控制。
其次并且如以前在讨论2级特点时所述,TU的取向(转录方向)可以通过所述TU在其中组装的“正向”或“反向”pML2载体的选择自由地确定。将MIDAS扩展到包括以任一取向组装TU的选项,将载体套装扩展到四种pML2质粒(参见图13和图15B)。
第三,多基因组装的极性(即新的TU被添加到所述生长中的多基因组装体的方向)也可以被自由地确定,在这种情况下通过将TU组装在具有“正”(+)或“负”(-)极性的pML2终载体中(图13)。将pML2(+)入门克隆用于3级组装确保了下一个添加的TU将以与pML3中存在的SpecR基因的转录方向相同的方向添加,即在所述多基因构建物中下一个组装的 TU将被添加到使用pML2(+)入门克隆添加的TU的右侧(如图15A和图15B 中所示)。相反,将pML2(-)入门克隆用于3级组装迫使下一个TU以与pML3 中存在的SpecR基因的转录方向相反的方向添加,使得装载到所述多基因构建物中的下一个TU将被添加到使用pML2(-)入门克隆添加的TU的左侧。然而,如果使用两种极性的入门克隆(即pML2(+)和pML2(-)两者) 来建造所述多基因构建物,则这将为MIDAS提供切换新的TU被添加到所述3级组装体的方向的能力,并且对于图15C中示出的假定的组装来说,所有随后添加TU都将被嵌套在TU3与TU2之间。
细菌和真菌菌株
大肠杆菌的常规生长在37℃下在LB肉汤中进行。将化学感受态大肠杆菌HST08Stellar细胞(Clontech Laboratories,Inc.)用于质粒的常规转化和维护。在本研究中使用的蕈青霉(Penicillium paxilli)菌株示出在表7 中。
用于MIDAS 1级模块克隆的方案
PCR扩增的模块使用离心柱方案来纯化,并通过BsmBI介导的金门组装克隆到MIDAS 1级质粒pML1中。通常,将1-2μL(大约50-200ng)来自于微量制备的pML1质粒DNA与1-2μL每种纯化的PCR片段、1μL BsmBI(20U/μL)、1μL T4 DNA连接酶(20U/μL)和2μL 10×T4DNA 连接酶缓冲液在20μL的总反应体积中混合。将反应在37℃温育1至3小时,并通过热冲击将等分试样(通常2-3μL)转化到30μL大肠杆菌HST08 Stellar感受态细胞中。在恢复期(即添加250μL SOC培养基并在37℃温育 1小时)后,将转化混合物的等分试样铺于增补有50μg/mL壮观霉素、1mM IPTG和50μg/mL X-Ga1的LB琼脂平板上。将板在37℃温育过夜,并选择白色菌落用于分析。
用于MIDAS 2级TU绢装的方案
使用在1级时克隆的模块,通过BsaI介导的金门组装将全长TU组装到MIDAS 2级质粒中。通常,将40fmol pML2质粒DNA与每种1级入门克隆的40fmol质粒DNA、1μL BsaI-HF(20U/μL)、1μL T4 DNA 连接酶(20U/μL)和2μL 10×T4 DNA连接酶缓冲液在20μL的总反应体积中混合。将反应在DNA Engine PTC-200Peltier热循环仪(Bio-Rad) 中,使用下述参数进行温育:45个(37℃下2分钟和16℃下5分钟)的循环,然后在50℃下5分钟并在80℃下10分钟。如为1级组装所述将反应转化,并铺于含有75μg/mL卡那霉素和1.25mM 4CP的LB琼脂平板上。在37℃下过夜温育后,挑取菌落用于分析。
用于MIDAS 3级多基因组装的方案
将在2级时组装的全长TU,通过使用AarI(用于克隆在pML2“白色”载体中的TU)或BsmBI(用于克隆在pML2“蓝色”载体中的TU) 的交替金门组装,用于在3级终载体中产生多基因组装体。通常,将40fmol 3级终载体质粒DNA与40fmol 2级入门克隆质粒DNA、1μLBsaI-HF (20U/μL)、1μL T4 DNA连接酶(20U/μL)和2μL 10×T4 DNA连接酶缓冲液混合,总反应体积为20μL。反应在DNA Engine PTC-200Peltier 热循环仪(Bio-Rad)中,使用下述参数来温育:45个(37℃下2分钟和 16℃下5分钟)的循环,然后在50℃下5分钟并在80℃下10分钟。如为 1级组装所述将反应转化,并铺于增补有50μg/mL壮观霉素、1mM IPTG 和50μg/mL X-Gal的LB琼脂平板上。将平板在37℃下温育过夜。对于 AarI介导的组装反应来说,选择白色菌落用于分析,而对于BsmBI介导的组装反应来说,筛选蓝色菌落。
用于真菌工作的培养基和试剂
含有微量元素的CDYE(Czapex-Dox/酵母提取物)培养基使用去离子水制备,并含有3.34%(w/v)Czapex-Dox(Oxoid Ltd.,Hampshire, England)、0.5%(w/v)酵母提取物(Oxoid Ltd.,Hampshire,England)和 0.5%(v/v)微量元素溶液。对于琼脂平板来说,添加Select琼脂Invitrogen, California,U.S.A.)至1.5%(w/v)。
微量元素溶液在去离子水中制备,并含有0.004%(w/v)六水氯化钴 (II)(AjaxFinechem,Auckland,New Zealand)、0.005%(w/v)无水硫酸铜(II)(Scharlau,Barcelona,Spain)、0.05%(w/v)七水硫酸亚铁(II)(Merck, Darmstadt,Germany)、0.014%(w/v)四水硫酸锰(II)和0.05%(w/v)七水硫酸锌(Merck,Darmstadt,Germany)。所述溶液用1滴12M盐酸防腐。
再生(RG)培养基使用去离子水制备,并含有2%(w/v)麦芽提取物(Oxoid Ltd.,Hampshire,England)、2%(w/v)无水D(+)-葡萄糖(VWR International BVBA,Leuven,Belgium)、1%(w/v)真菌蛋白胨(Oxoid Ltd., Hampshire,England)和27.6%蔗糖(ECPLtd.Birkenhead,Auckland,New Zealand)。取决于所述培养基是用于平板(1.5%RGA)还是覆盖(0.8% RGA),分别添加Select琼脂(Invitrogen,California,U.S.A.)至1.5%或0.8%(w/v)。
真菌方案-原生质体制备
用于转化的真菌原生质体的制备按照Yelton等37并作出修改。将五个在100mL锥形摇瓶中的25mL含有微量元素的CDYE培养基的等分试样用5×106个孢子接种,并在28℃下振摇(200rpm)温育28小时。将来自于所有5个摇瓶的发酵液通过无菌尿布衬巾过滤,并将合并的菌丝体用无菌水清洗三次并用OM缓冲液(10mM Na2HPO4和1.2M MgSO4.7H2O,用100mMNaH2PO4.2H2O调整到pH 5.8)清洗一次。将菌丝体称重,每克菌丝体重悬浮在10mL过滤除菌的裂解酶类溶液(通过将来自于哈茨木霉(Trichoderma harzianum)的裂解酶类(Sigma)以10mg/mL重悬浮在 OM缓冲液中来制备)中,并在30℃下以80rpm振摇温育16小时。将原生质体通过无菌尿布衬巾过滤到250mL锥形摇瓶中。将过滤过的原生质体的等分试样(5mL)转移到无菌15mL离心管中,并用2mL ST缓冲液(0.6M山梨糖醇和0.1M pH 8.0的Tris-HCl)覆盖。将管在4℃下以 2600x g离心15分钟。将在每个管中在OM与ST缓冲液之间形成的白色原生质体层转移(以2mL的等分试样)到无菌15mL离心管中,通过用移液器重悬浮在5mL STC缓冲液(1M山梨糖醇,50mM pH 8.0的 Tris-HCI和50mM CaCl2)中轻柔清洗,并在4℃下以2600xg离心5分钟。倾析出上清液,并将来自于多个管的沉积的原生质体通过重悬浮合并在5mLSTC缓冲液的等分试样中。所述STC缓冲液清洗被重复三次,直至将原生质体合并在单个15mL离心管中。将最终的原生质体沉积物重悬浮在500μL STC缓冲液中,并用血细胞计数器估算原生质体浓度。将所述原生质体储用物稀释,以给出每mL STC缓冲液1.25×108个原生质体的终浓度。将原生质体的等分试样(100μL)立即用于真菌转化,将过量的原生质体保存在1.7mL微量离心管中的8%PEG溶液(将80μL原生质体添加到20μL 40%(w/v)PEG 4000在STC缓冲液中的溶液)中,并在 -80℃下储存。
真菌方案-蕈青霉(P.paxilli)的转化
从Vollmer和Yanosfsky38以及Oliver等39修改的真菌转化在含有新鲜制备在STC缓冲液中或储存在8%PEG溶液(如上所述)中的100μL (1.25×107)原生质体的1.7mL微量离心管中进行。向所述原生质体添加含有2μL亚精胺(50mM,在H2O中)、5μL肝素(5mg/mL,在STC 缓冲液中)和5μg质粒DNA(250μg/mL)的溶液,并在冰上温育30分钟后,添加900μL 40%PEG溶液(40%(w/v)PEG 4000在STC缓冲液中的溶液)。将所述转化混合物在冰上继续温育15-20分钟,转移到无菌 50mL管中的17.5mL 0.8%RGA培养基(预加温到50℃),颠倒混合,并将3.5mL等分试样分发到1.5%RGA平板上。在25℃下温育过夜后,将5mL 0.8%RGA(含有足够的遗传霉素以获得每mL固体培养基150μg 的终浓度)覆盖在每个平板上。将平板在25℃下继续温育4天,从各个菌落挑取孢子并在增补有150μg/mL遗传霉素的CDYE琼脂平板上划线。将划线的平板在25℃下继续温育4天。将来自于各个菌落的孢子悬浮在 50μL 0.01%(v/v)triton X-100中,并将所述孢子悬液的5×5μL等分试样转移到新的增补有150μg/mL遗传霉素的CDYE琼脂平板上。将孢子形成平板在25℃下温育4天,并如下所述制备孢子储用液。将来自于孢子形成平板的菌落塞悬浮在2mL 0.01%(v/v)triton X-100中,并将800μL悬浮的孢子与200μL 50%(w/v)甘油在1.7mL微量离心管中混合。使用孢子储用液接种50mLCDYE培养基,在液氮中快速冷冻并储存在-80 ℃下。
吲哚二萜生产和提取
将真菌转化体在塞有棉绒的250mL锥形摇瓶中,在50mL含有微量元素的CDYE培养基中,在振摇培养(≥200rpm)中在28℃生长7天。通过经尿布衬巾过滤从发酵液分离菌丝体,转移到50mL离心管(Lab
Figure BDA0002491759280000671
Thermo Fisher Scientific),并通过将菌丝体在2-丁酮中剧烈振摇 (≥200rpm)≥45分钟来提取IDT。
薄层层析
将2-丁酮上清液(含有提取的吲哚二萜)用于在固相硅胶60铝板 (Merck)上进行薄层层析(TLC)分析。吲哚二萜使用9∶1的氯仿∶乙腈或9∶1的二氯甲烷∶乙腈进行层析,并用艾氏试剂(1%(w/v)对二甲氨基苯甲醛在24%(v/v)HCl和50%乙醇中)可视化。
液相层析-质谱
从通过TLC测试为阳性的那些转化体制备用于液相层析-质谱 (LC-MS)的样品。因此,将1mL 2-丁酮上清液(含有提取的吲哚二萜) 的样品转移到1.7mL微量离心管,并将2-丁酮蒸发过夜。将内含物重悬浮在100%乙腈中,并通过0.2μm膜过滤到LC-MS小瓶中。将LC-MS样品在附连到
Figure BDA0002491759280000681
3000标准LC系统(Dionex,Thermo Fisher Scientific) 的反相Thermo Scientific Accucore 2.6μm C18(50×2.1mm)柱上进行层析,以0.200mL/分钟的流速运行,并使用多步梯度方法(表14),用含有0.01%甲酸的乙腈水溶液洗脱。质谱图在maXisTM II四级杆飞行时间质谱仪(Bruker)上通过在线分析来捕获。
用于NMR分析的大规模吲哚二萜纯化
如“吲哚二萜生产和提取”下所描述,将生产高水平的新的吲哚二萜的真菌转化体生长在≥1升含有微量元素的CDYE培养基中。将菌丝体合并在含有搅拌棒的1升Schott瓶中。添加2-丁酮并在搅拌(≥700rpm) 下提取吲哚二萜过夜。将提取物通过
Figure BDA0002491759280000682
545(J.T.
Figure BDA0002491759280000683
)过滤并干燥装载在具有旋转蒸发的硅胶上,通过硅胶柱进行粗品纯化,然后通过半制备HPLC进行最终纯化。将粗提液的1mL等分试样进样到附连到
Figure BDA0002491759280000684
3000标准LC柱(Dionex,Thermo Fisher Scientific)的半制备反相Phenomenex 5μm C18(2)
Figure BDA0002491759280000685
(250×15mm)柱中,以8.00mL/ 分钟的流速运行。对多步梯度方法进行优化,用于不同组吲哚二萜的纯化。每种吲哚二萜的纯度通过LC-MS来评估,并且结构通过NMR来鉴定。
NMR
在氘化氯仿中制备NMR样品。化合物通过标准的一维质子和碳-13 NMR、二维相关光谱(COSY)、异核单量子相关(HSQC)光谱和异核多键相关(HMBC)光谱来分析。
在本说明书中引用的表1-14阐述如下:
Figure BDA0002491759280000701
Figure BDA0002491759280000711
Figure BDA0002491759280000721
Figure BDA0002491759280000731
Figure BDA0002491759280000741
Figure BDA0002491759280000751
Figure BDA0002491759280000761
Figure BDA0002491759280000771
Figure BDA0002491759280000781
Figure BDA0002491759280000791
Figure BDA0002491759280000801
Figure BDA0002491759280000811
Figure BDA0002491759280000821
Figure BDA0002491759280000831
Figure BDA0002491759280000841
Figure BDA0002491759280000851
工业实用性
本发明在吲哚二萜化合物、特别是NA的生产中具有工业实用性。
参考文献
(1)Ogata,M.;Ueda,J.;Hoshi,M.;Hashimoto,J.;Nakashima,T.; Anzai,K.;Takagi,M.;Shin-ya,K.J.Antibiot.(Tokyo)2007,60(10),645- 648.
(2)Nakazawa,J.;Yajima,J.;Usui,T.;Ueki,M.;Takatsuki,A.; Imoto,M.;Toyoshima,Y.Y.;Osada,H.Chem.Biol.2003,10(2),131- 137.
(3)Sallam,A.A.;Ayoub,N.M.;Foudah,A.I.;Gissendanner,C.R.; Meyer,S.A.;E1 Sayed,K.A.Eur.J.Med.Chem.2013,70,594-606.
(4)Fan,Y.;Wang,Y.;Liu,P.;Fu,P.;Zhu,T.;Wang,W.;Zhu,W. J.Nat.Prod.2013,76(7),1328-1336.
(5)Meinke,P.T.;Smith,M.M.;Shoop,W.L.Curr.Top.Med. Chem.2002,2(7),655-674.
(6)Knaus,H.-G.;McManus,O.B.;Lee,S.H.;Schmalhofer,W.A.; Garcia-Calvo,M.;Helms,L.M.H.;SancheZ,M.;Giangiacomo,K.; Reuben,J.P.Biochemistry(Mosc.)1994,33(19),5819-5828.
(7)Bills,G.F.;González-Menéndez,V.;Martín,J.;Platas,G.; Fournier,J.;
Figure BDA0002491759280000861
D.;Stadler,M.PLOS ONE 2012,7(10),e46687.
(8)Shoop,W.L.;Gregory,L.M.;Zakson-Aiken,M.;Michael,B. F.;Haines,H.W.;Ondeyka,J.G.;Meinke,P.T.;Schmatz,D.M.J. Parasitol.2001,87(2),419-423.
(9)Byrne,K.M.;Smith,S.K.;Ondeyka,J.G.J.Am.Chem.Soc. 2002,124(24),7055-7060.
(10)Smith,A.B.;Davulcu,A.H.;Cho,Y.S.;Ohmoto,K.;Kürti,L.; Ishiyama,H.J.Org.Chem.2007,72(13),4596-4610.
(11)Zou,Y.;Melvin,J.E.;Gonzales,S.S.;Spafford,M.J.;Smith,A.B.J.Am.Chem.Soc.2015,137(22),7095-7098.
(12)Melvin,J.E.Diss.Available ProQuest 2014,1-273.
(13)Young,C.;McMillan,L.;Telfer,E.;Scott,B.Mol.Microbiol. 2001,39(3),754-764.
(14)Saikia,S.;Parker,E.J.;Koulman,A.;Scott,B.J.Biol.Chem. 2007,282(23),16829-16837.
(15)Scott,B.;Young,C.A.;Saikia,S.;McMillan,L.K.;Monahan,B.J.;Koulman,A.;Astin,J.;Eaton,C.J.;Bryant,A.;Wrenn,R.E.;Finch, S.C.;Tapper,B.A.;Parker,E.J.;Jameson,G.B.Toxins 2013,5(8), 1422-1446.
(16)Tagami,K.;Liu,C.;Minami,A.;Noike,M.;Isaka,T.;Fueki,S.; Shichijo,Y.;Toshima,H.;Gomi,K.;Dairi,T.;Oikawa,H.J.Am.Chem. Soc.2013,135(4),1260-1263.
(17)Motoyama,T.;Hayashi,T.;Hirota,H.;Ueki,M.;Osada,H. Chem.Biol.2012,19(12),1611-1619.
(18)Saikia,S.;Takemoto,D.;Tapper,B.A.;Lane,G.A.;Fraser,K.; Scott,B.FEBS Lett.2012,586(16),2563-2569.
(19)Tagami,K.;Minami,A.;Fujii,R.;Liu,C.;Tanaka,M.;Gomi, K.;Dairi,T.;Oikawa,H.ChemBio Chem 2014,15(14),2076-2080.
(20)Liu,C.;Tagami,K.;Minami,A.;Matsumoto,T.;Frisvad,J.C.; Suzuki,H.;Ishikawa,J.;Gomi,K.;Oikawa,H.Angew.Chem.Int.Ed. 2015,54(19),5748-5752.
(21)Tang,M.-C.;Lin,H.-C.;Li,D.;Zou,Y.;Li,J.;Xu,W.;Cacho, R.A.;Hillenmeyer,M.E.;Garg,N.K.;Tang,Y.J.Am.Chem.Soc.2015, 137(43),13724-13727.
(22)Liu,C.;Minami,A.;Dairi,T.;Gomi,K.;Scott,B.;Oikawa,H.Org.Lett.2016,18(19),5026-5029.
(23)Saikia,S.;Scott,B.Mol.Genet.Genomics 2009,282(3),257- 271.
(24)Itoh,Y.;Johnson,R.;Scott,B.Curr.Genet.1994,25(6),508- 513.
(25)Dombrowski,A.W.;Endris,R.G.;Helms,G.L.;Hensens,O. D.;Ondeyka,J.G.;Ostlind,D.A.;Polishook,J.D.;Zink,D.L.美国专利:5399582-抗寄生虫药剂(Antiparasitic agents),5399582,March 21, 1995.
(26)Byrd,A.D.;Schardl,C.L.;Songlin,P.J.;Mogen,K.L.;Siegel,M.R.Curr.Genet.1990,18(4),347-354.
(27)Engler,C.;Kandzia,R.;Marillonnet,S.PLOS ONE 2008,3 (11),e3647.
(28)Sarrion-Perdigones,A.;FalConi,E.E.;Zandalinas,S.I.;Juárez, P.;Fernández-del-Carmen,A.;Granell,A.;Orzaez,D.PLOS ONE 2011,6 (7),e21622.
(29)Sarrion-Perdigones,A.;Vazquez-Vilar,M.;Palaci,J.; Castelijns,B.;Forment,J.;Ziarsolo,P.;B1anca,J.;Granell,A.;Orzaez,D. Plant Physiol.2013,162(3),1618-1631.
(30)De Paoli,H.C.;Tuskan,G.A.;Yang,X.Sci.Rep.2016,6.
(31)Weber,E.;Engler,C.;Gruetzner,R.;Werner,S.;Marillonnet,S. PLOS ONE2011,6(2),e16765.
(32)Binder,A.;Lambert,J.;Morbitzer,R.;Popp,C.;Ott,T.;Lahaye, T.;Parniske,M.PLOS ONE 2014,9(2),e88218.
(33)Patron,N.J.;Orzaez,D.;Marillonnet,S.;Warzecha,H.; Matthewman,C.;Youles,M.;Raitskin,O.;Leveau,A.;Farré,G.;Rogers, C.;Smith,A.;Hibberd,J.;Webb,A.A.R.;Locke,J.;Schornack,S.; Ajioka,J.;Baulcombe,D.C.;Zipfel,C.;Kamoun,S.;Jones,J.D.G.; Kuhn,H.;Robatzek,S.;Van Esse,H.P.;Sanders,D.;Oldroyd,G.;Martin,C.;Field,R.;O’Connor,S.;Fox,S.;Wulff,B.;Miller,B.;Breakspear,A.;Radhakrishnan,G.;Delaux,P.-M.;Loqué,D.;Granell,A.;Tissier,A.; Shih,P.;Brutnell,T.P.;Quick,W.P.;Rischer,H.;Fraser,P.D.;Aharoni, A.;Raines,C.;South,P.F.;Ané,J.-M.;Hamberger,B.R.;Langdale,J.; Stougaard,J.;Bouwmeester,H.;Udvardi,M.;Murray,J.A.H.;Ntoukakis, V.;
Figure BDA0002491759280000881
P.;Denby,K.;Edwards,K.J.;Osbourn,A.;Haseloff,J.New Phytol.2015,208(1),13-19.
(34)Beck,R.;Burtscher,H.Nucleic Acids Res.1994,22(5),886- 887.
(35)Agmon,N.;Mitchell,L.A.;Cai,Y.;Ikushima,S.;Chuang,J.; Zheng,A.;Choi,W.-J.;Martin,J.A.;Caravelli,K.;Stracquadanio,G.; Boeke,J.D.ACSSynth.Biol.2015,4(7),853-859.
(36)Miyazaki,K.BioTechniques 2015,58(2),86-88.
(37)Yelton,M.M.;Hamer,J.E.;Timberlake,W.E.Proc.Natl. Acad.Sci.1984,81(5),1470-1474.
(38)Vollmer,S.J.;Yanofsky,C.Proc.Natl.Acad.Sci.1986,83 (13),4869-4873.
(39)Oliver,R.P.;Roberts,I.N.;Harling,R.;Kenyon,L.;Punt,P.J.;Dingemanse,M.A.;van den Hondel,C.A.M.J.J.Curr.Genet.1987,12 (3),231-233.
序列表
<110> VAN DE BITTNER, Kyle Cornelius
KESSANS, Sarah Adeline
SCOTT, David Barry
BUSTAMANTE RODRIGUEZ, Leyla Yolanda
NICHOLSON, Matthew Joseph
PARKER, Emily Jane
VAN DOLLEWEERD, Craig John
<120> 多节孢酸(Nodulisporic acid)的异源生物合成
<130> 831107 JBA/rla
<160> 56
<170> PatentIn version 3.5
<210> 1
<211> 1825
<212> DNA
<213> Hypoxylon pulicicidum
<400> 1
ttatgcccag atatttccag cccggggttc gaaaacaaga gaaaacgctg gtatatgaat 60
tatatagcaa tcgtatgctg gcgcagaggc ttcatggctc atcggccgcc caggcagaag 120
tctcagattg aatcttgaca ttatagagga aattaccata cgcatctcca tcatcgcgaa 180
aggtttaccg aggcatccgt acacacccac agagaaaggg atgaatgcat ctgggttgag 240
agtcaagtgt gattggctcg tccatcgctc cgggatgaac tcatctggcc tgacgaaatt 300
tctcttatct aaagacggca gagttaaaat taagctcaaa ggatgactgt atcgaatcga 360
tactaacccc tgtgtatcgt gtaagtgggc atggatacga gcatatgctc tggtataaac 420
tggccatcaa ggatcactcc accaggaccg gtctcccgct gcgagccgct catcactgct 480
ggatataaac ggagtgcttc gttgatgcaa ctgttgaggt aaggcatatt gactagggtg 540
gaggttggca taggcagtcc acctatattc atgtcatcaa cctctttttg aagaattgcc 600
tgcttgtctg gatgggttgc cagaagaaac aagatggcag taagggtcga tgctgtagag 660
tcgctaccgg ccacgacagc cagctcagaa tcatagacga ggtcatccgt atctttagac 720
tcgtcgtcta agagatggct gaatagatcg tgagtcatag ttggattctc cactgtgcgt 780
cagtcaggta tcctgattag tatgtaatta agtattacct acttgcttcc tttccactac 840
ctcctgtgag caccactgta gccaacttgt tgccttggac ctcaagaacg gtagattgcg 900
gagaaggatc aacgtccaag gcgcccacag aagtaacccc cctagttgct tgacagacct 960
cagttgcgtg aagccgggat gcgaaaggcc tttttgaatc atgttgaagg cctttccaaa 1020
tacaagccaa cccattgatt caaatgtgac tctttgcatc aattcagtta cttctaccgg 1080
ttgacctcct ctagatgaga gatagcccat gagttcttgg caacattgcc ggacatggcc 1140
ttcatgagct agcatagctg tatgctctat cagcatgaat cgcccacgcc agggttgtgt 1200
gatactcacc attaggactg aaggcctttt gccaaatttt cttccgtcgg aggtggaaat 1260
tcctgtccct tgtcatttga agggacttgt ggggataatt cacgtcgtag aatggacccc 1320
tggcacactt ggccaaatcg cgaatggcat tgaagttgtt gacggatatc tcacgaggcc 1380
ctgacacata gtctatcaac ttcgagttta tggcagagtt ggaaataggc tagaacttac 1440
taattcggac gaaatcgcca tagacactat gcatattctg tacttcaagg tgccattttc 1500
tatctacggc tgctgttttc atccatctca acgtgctcag cctggcggat accttgccgg 1560
ggaaatctct taagggatgc agaaacaacc gatatataat gattgaaaga cagatagaag 1620
agatatagca tagccaaact tggatgaaca taaaagtgat cccatataat cccactgcca 1680
acaacgagca tatgagcgca atggggcaag taatgaagca atggaacagg accggggcgt 1740
gcttgtccca ctctcctcgg atgaataaaa tagtatgaga taggacggct gccaggcaac 1800
tgatgcctaa aatagctaaa gtcat 1825
<210> 2
<211> 1599
<212> DNA
<213> Hypoxylon pulicicidum
<400> 2
ttatgcccag atatttccag cccggggttc gaaaacaaga gaaaacgctg gtatatgaat 60
tatatagcaa tcgtatgctg gcgcagaggc ttcatggctc atcggccgcc caggcagaag 120
tctcagattg aatcttgaca ttatagagga aattaccata cgcatctcca tcatcgcgaa 180
aggtttaccg aggcatccgt acacacccac agagaaaggg atgaatgcat ctgggttgag 240
agtcaagtgt gattggctcg tccatcgctc cgggatgaac tcatctggcc tgacgaaatt 300
tctcttatcc ctgtgtatcg tgtaagtggg catggatacg agcatatgct ctggtataaa 360
ctggccatca aggatcactc caccaggacc ggtctcccgc tgcgagccgc tcatcactgc 420
tggatataaa cggagtgctt cgttgatgca actgttgagg taaggcatat tgactagggt 480
ggaggttggc ataggcagtc cacctatatt catgtcatca acctcttttt gaagaattgc 540
ctgcttgtct ggatgggttg ccagaagaaa caagatggca gtaagggtcg atgctgtaga 600
gtcgctaccg gccacgacag ccagctcaga atcatagacg aggtcatccg tatctttaga 660
ctcgtcgtct aagagatggc tgaatagatc gtgagtcata gttggatttt gcttcctttc 720
cactacctcc tgtgagcacc actgtagcca acttgttgcc ttggacctca agaacggtag 780
attgcggaga aggatcaacg tccaaggcgc ccacagaagt aaccccccta gttgcttgac 840
agacctcagt tgcgtgaagc cgggatgcga aaggcctttt tgaatcatgt tgaaggcctt 900
tccaaataca agccaaccca ttgattcaaa tgtgactctt tgcatcaatt cagttacttc 960
taccggttga cctcctctag atgagagata gcccatgagt tcttggcaac attgccggac 1020
atggccttca tgagctagca tagcattagg actgaaggcc ttttgccaaa ttttcttccg 1080
tcggaggtgg aaattcctgt cccttgtcat ttgaagggac ttgtggggat aattcacgtc 1140
gtagaatgga cccctggcac acttggccaa atcgcgaatg gcattgaagt tgttgacgga 1200
tatctcacga ggcctaattc ggacgaaatc gccatagaca ctatgcatat tctgtacttc 1260
aaggtgccat tttctatcta cggctgctgt tttcatccat ctcaacgtgc tcagcctggc 1320
ggataccttg ccggggaaat ctcttaaggg atgcagaaac aaccgatata taatgattga 1380
aagacagata gaagagatat agcatagcca aacttggatg aacataaaag tgatcccata 1440
taatcccact gccaacaacg agcatatgag cgcaatgggg caagtaatga agcaatggaa 1500
caggaccggg gcgtgcttgt cccactctcc tcggatgaat aaaatagtat gagataggac 1560
ggctgccagg caactgatgc ctaaaatagc taaagtcat 1599
<210> 3
<211> 532
<212> PRT
<213> Hypoxylon pulicicidum
<400> 3
Met Thr Leu Ala Ile Leu Gly Ile Ser Cys Leu Ala Ala Val Leu Ser
1 5 10 15
His Thr Ile Leu Phe Ile Arg Gly Glu Trp Asp Lys His Ala Pro Val
20 25 30
Leu Phe His Cys Phe Ile Thr Cys Pro Ile Ala Leu Ile Cys Ser Leu
35 40 45
Leu Ala Val Gly Leu Tyr Gly Ile Thr Phe Met Phe Ile Gln Val Trp
50 55 60
Leu Cys Tyr Ile Ser Ser Ile Cys Leu Ser Ile Ile Ile Tyr Arg Leu
65 70 75 80
Phe Leu His Pro Leu Arg Asp Phe Pro Gly Lys Val Ser Ala Arg Leu
85 90 95
Ser Thr Leu Arg Trp Met Lys Thr Ala Ala Val Asp Arg Lys Trp His
100 105 110
Leu Glu Val Gln Asn Met His Ser Val Tyr Gly Asp Phe Val Arg Ile
115 120 125
Arg Pro Arg Glu Ile Ser Val Asn Asn Phe Asn Ala Ile Arg Asp Leu
130 135 140
Ala Lys Cys Ala Arg Gly Pro Phe Tyr Asp Val Asn Tyr Pro His Lys
145 150 155 160
Ser Leu Gln Met Thr Arg Asp Arg Asn Phe His Leu Arg Arg Lys Lys
165 170 175
Ile Trp Gln Lys Ala Phe Ser Pro Asn Ala Met Leu Ala His Glu Gly
180 185 190
His Val Arg Gln Cys Cys Gln Glu Leu Met Gly Tyr Leu Ser Ser Arg
195 200 205
Gly Gly Gln Pro Val Glu Val Thr Glu Leu Met Gln Arg Val Thr Phe
210 215 220
Glu Ser Met Gly Trp Leu Val Phe Gly Lys Ala Phe Asn Met Ile Gln
225 230 235 240
Lys Gly Leu Ser His Pro Gly Phe Thr Gln Leu Arg Ser Val Lys Gln
245 250 255
Leu Gly Gly Leu Leu Leu Trp Ala Pro Trp Thr Leu Ile Leu Leu Arg
260 265 270
Asn Leu Pro Phe Leu Arg Ser Lys Ala Thr Ser Trp Leu Gln Trp Cys
275 280 285
Ser Gln Glu Val Val Glu Arg Lys Gln Asn Pro Thr Met Thr His Asp
290 295 300
Leu Phe Ser His Leu Leu Asp Asp Glu Ser Lys Asp Thr Asp Asp Leu
305 310 315 320
Val Tyr Asp Ser Glu Leu Ala Val Val Ala Gly Ser Asp Ser Thr Ala
325 330 335
Ser Thr Leu Thr Ala Ile Leu Phe Leu Leu Ala Thr His Pro Asp Lys
340 345 350
Gln Ala Ile Leu Gln Lys Glu Val Asp Asp Met Asn Ile Gly Gly Leu
355 360 365
Pro Met Pro Thr Ser Thr Leu Val Asn Met Pro Tyr Leu Asn Ser Cys
370 375 380
Ile Asn Glu Ala Leu Arg Leu Tyr Pro Ala Val Met Ser Gly Ser Gln
385 390 395 400
Arg Glu Thr Gly Pro Gly Gly Val Ile Leu Asp Gly Gln Phe Ile Pro
405 410 415
Glu His Met Leu Val Ser Met Pro Thr Tyr Thr Ile His Arg Asp Lys
420 425 430
Arg Asn Phe Val Arg Pro Asp Glu Phe Ile Pro Glu Arg Trp Thr Ser
435 440 445
Gln Ser His Leu Thr Leu Asn Pro Asp Ala Phe Ile Pro Phe Ser Val
450 455 460
Gly Val Tyr Gly Cys Leu Gly Lys Pro Phe Ala Met Met Glu Met Arg
465 470 475 480
Met Val Ile Ser Ser Ile Met Ser Arg Phe Asn Leu Arg Leu Leu Pro
485 490 495
Gly Arg Pro Met Ser His Glu Ala Ser Ala Pro Ala Tyr Asp Cys Tyr
500 505 510
Ile Ile His Ile Pro Ala Phe Ser Leu Val Phe Glu Pro Arg Ala Gly
515 520 525
Asn Ile Trp Ala
530
<210> 4
<211> 1826
<212> DNA
<213> Hypoxylon pulicicidum
<400> 4
atgtttgata ttgattttgg cattctattt ccaatttcct gggaacaatc ccctatcttt 60
ctggctgttg ggctaatatt cgcatttgcg accttatctc cgtggctccg ttccggggaa 120
cgcctgatca atggtcgcga aggcttcgaa atactgtgga cgaatgcgaa gaagcgatat 180
caaacgaagg ggcgatctgt tatggaggca ggcttttcaa aggtaggata catcattgtc 240
tccaaatgaa agacatcaaa tcgtgccggg tcatatgtgc tgatacttgg agatagtaca 300
acgattcttt ctacatgatg acggatagtg gtaccgaaat ggtcctacac ccgagatacg 360
tcgacgagat ccggaacgac ccaaggttgg actttcacag atatatgaaa actgtaatag 420
aattcgatcc attttctata tatccgggct gacgtctacg tacgcgaggt cctacatggg 480
ctcagacaga aaggtggcga gataaaccga gatcttatcc aaaccaaatt gactagatct 540
gtgggtaagg ggttgtcgtc ctctagagaa tgcaggcaaa gggaaggaca agagtaaact 600
aatgcccatc cttgtatagg taggctcatt gggtccatat cggctgaaat cgaggacgcc 660
cttcacaatc gatgggaaga aggcgaaggt gaatatgaag agtaccttct agtgcttccc 720
cctgctgaaa tgcatacaga atggcatgag attgtattgc tctccgtaat gatcccggtt 780
gttgcgcaag gagtatccaa aatgtttgtc ggagatccat tgtgccgtaa caaggattgg 840
ataggtatga tcttaaggca tacaaggagt gtccagacag cactgcggtc ccttcgattg 900
tggccttact ttcttagacc acttgcagcc agatttctgc caacctgtcg acaagtcact 960
gcagaaatag aagaggccag gcgcatcatc aatccagtac ttgagaagaa gcgtgccgag 1020
aagctcgcaa tgattcagaa gggagaaaaa cctccagagc ccaacaccta catggattgg 1080
ttagaagaat ccgacaagga tgaattctat gacccagttg ttgctcagct gaagatttcc 1140
atggcagcta tacacgctac ctcggacctc ttatcgcaga caattttcag cctatgtgac 1200
agcccagagc tagtcaagga actgcgagcc gaagctgtgt ctgttatagg agcgtacggc 1260
tgggggaagg aagcaatcta caacctgaag ctgatggaca gcgtcctgaa ggagacgcaa 1320
cgcctaaaac ctatgcaaat cagtaagcgc cggtgccgcc gtgtggactt gctatcgcta 1380
atcgctttgc ctttgcttgc tctctagact tgacgcgact agctctagat cgcataaaac 1440
tttccgatgg cacggttatc cctaggggct ccaaagttct tatctcctgc cacaacatgt 1500
gggattcgaa cgtctacccc aacgcaaacc agtatgacgg tcatcgcttc tataaacttc 1560
ggcagcgcgc tggaatggag aattccgcac agctatcaac acctagtccg gatcatctgg 1620
gcttcggact gggaatgtat gcctgtcccg gtaggcatat cgcatcgacc gttatgaaag 1680
tcacactatg ccatatcctc ctgaagtatg acttcgaatt ggcggagggc tgcaccccta 1740
gagtgattga atatggtagt ttcttgttag ctgatccaac ggcgagagtt tctatcagac 1800
ggcggaaaga agagattcaa ctgtaa 1826
<210> 5
<211> 1536
<212> DNA
<213> Hypoxylon pulicicidum
<400> 5
atgtttgata ttgattttgg cattctattt ccaatttcct gggaacaatc ccctatcttt 60
ctggctgttg ggctaatatt cgcatttgcg accttatctc cgtggctccg ttccggggaa 120
cgcctgatca atggtcgcga aggcttcgaa atactgtgga cgaatgcgaa gaagcgatat 180
caaacgaagg ggcgatctgt tatggaggca ggcttttcaa agtacaacga ttctttctac 240
atgatgacgg atagtggtac cgaaatggtc ctacacccga gatacgtcga cgagatccgg 300
aacgacccaa ggttggactt tcacagatat atgaaaacta aaggtggcga gataaaccga 360
gatcttatcc aaaccaaatt gactagatct gtgggtaggc tcattgggtc catatcggct 420
gaaatcgagg acgcccttca caatcgatgg gaagaaggcg aaggtgaata tgaagagtac 480
cttctagtgc ttccccctgc tgaaatgcat acagaatggc atgagattgt attgctctcc 540
gtaatgatcc cggttgttgc gcaaggagta tccaaaatgt ttgtcggaga tccattgtgc 600
cgtaacaagg attggatagg tatgatctta aggcatacaa ggagtgtcca gacagcactg 660
cggtcccttc gattgtggcc ttactttctt agaccacttg cagccagatt tctgccaacc 720
tgtcgacaag tcactgcaga aatagaagag gccaggcgca tcatcaatcc agtacttgag 780
aagaagcgtg ccgagaagct cgcaatgatt cagaagggag aaaaacctcc agagcccaac 840
acctacatgg attggttaga agaatccgac aaggatgaat tctatgaccc agttgttgct 900
cagctgaaga tttccatggc agctatacac gctacctcgg acctcttatc gcagacaatt 960
ttcagcctat gtgacagccc agagctagtc aaggaactgc gagccgaagc tgtgtctgtt 1020
ataggagcgt acggctgggg gaaggaagca atctacaacc tgaagctgat ggacagcgtc 1080
ctgaaggaga cgcaacgcct aaaacctatg caaatcaact tgacgcgact agctctagat 1140
cgcataaaac tttccgatgg cacggttatc cctaggggct ccaaagttct tatctcctgc 1200
cacaacatgt gggattcgaa cgtctacccc aacgcaaacc agtatgacgg tcatcgcttc 1260
tataaacttc ggcagcgcgc tggaatggag aattccgcac agctatcaac acctagtccg 1320
gatcatctgg gcttcggact gggaatgtat gcctgtcccg gtaggcatat cgcatcgacc 1380
gttatgaaag tcacactatg ccatatcctc ctgaagtatg acttcgaatt ggcggagggc 1440
tgcaccccta gagtgattga atatggtagt ttcttgttag ctgatccaac ggcgagagtt 1500
tctatcagac ggcggaaaga agagattcaa ctgtaa 1536
<210> 6
<211> 511
<212> PRT
<213> Hypoxylon pulicicidum
<400> 6
Met Phe Asp Ile Asp Phe Gly Ile Leu Phe Pro Ile Ser Trp Glu Gln
1 5 10 15
Ser Pro Ile Phe Leu Ala Val Gly Leu Ile Phe Ala Phe Ala Thr Leu
20 25 30
Ser Pro Trp Leu Arg Ser Gly Glu Arg Leu Ile Asn Gly Arg Glu Gly
35 40 45
Phe Glu Ile Leu Trp Thr Asn Ala Lys Lys Arg Tyr Gln Thr Lys Gly
50 55 60
Arg Ser Val Met Glu Ala Gly Phe Ser Lys Tyr Asn Asp Ser Phe Tyr
65 70 75 80
Met Met Thr Asp Ser Gly Thr Glu Met Val Leu His Pro Arg Tyr Val
85 90 95
Asp Glu Ile Arg Asn Asp Pro Arg Leu Asp Phe His Arg Tyr Met Lys
100 105 110
Thr Lys Gly Gly Glu Ile Asn Arg Asp Leu Ile Gln Thr Lys Leu Thr
115 120 125
Arg Ser Val Gly Arg Leu Ile Gly Ser Ile Ser Ala Glu Ile Glu Asp
130 135 140
Ala Leu His Asn Arg Trp Glu Glu Gly Glu Gly Glu Tyr Glu Glu Tyr
145 150 155 160
Leu Leu Val Leu Pro Pro Ala Glu Met His Thr Glu Trp His Glu Ile
165 170 175
Val Leu Leu Ser Val Met Ile Pro Val Val Ala Gln Gly Val Ser Lys
180 185 190
Met Phe Val Gly Asp Pro Leu Cys Arg Asn Lys Asp Trp Ile Gly Met
195 200 205
Ile Leu Arg His Thr Arg Ser Val Gln Thr Ala Leu Arg Ser Leu Arg
210 215 220
Leu Trp Pro Tyr Phe Leu Arg Pro Leu Ala Ala Arg Phe Leu Pro Thr
225 230 235 240
Cys Arg Gln Val Thr Ala Glu Ile Glu Glu Ala Arg Arg Ile Ile Asn
245 250 255
Pro Val Leu Glu Lys Lys Arg Ala Glu Lys Leu Ala Met Ile Gln Lys
260 265 270
Gly Glu Lys Pro Pro Glu Pro Asn Thr Tyr Met Asp Trp Leu Glu Glu
275 280 285
Ser Asp Lys Asp Glu Phe Tyr Asp Pro Val Val Ala Gln Leu Lys Ile
290 295 300
Ser Met Ala Ala Ile His Ala Thr Ser Asp Leu Leu Ser Gln Thr Ile
305 310 315 320
Phe Ser Leu Cys Asp Ser Pro Glu Leu Val Lys Glu Leu Arg Ala Glu
325 330 335
Ala Val Ser Val Ile Gly Ala Tyr Gly Trp Gly Lys Glu Ala Ile Tyr
340 345 350
Asn Leu Lys Leu Met Asp Ser Val Leu Lys Glu Thr Gln Arg Leu Lys
355 360 365
Pro Met Gln Ile Asn Leu Thr Arg Leu Ala Leu Asp Arg Ile Lys Leu
370 375 380
Ser Asp Gly Thr Val Ile Pro Arg Gly Ser Lys Val Leu Ile Ser Cys
385 390 395 400
His Asn Met Trp Asp Ser Asn Val Tyr Pro Asn Ala Asn Gln Tyr Asp
405 410 415
Gly His Arg Phe Tyr Lys Leu Arg Gln Arg Ala Gly Met Glu Asn Ser
420 425 430
Ala Gln Leu Ser Thr Pro Ser Pro Asp His Leu Gly Phe Gly Leu Gly
435 440 445
Met Tyr Ala Cys Pro Gly Arg His Ile Ala Ser Thr Val Met Lys Val
450 455 460
Thr Leu Cys His Ile Leu Leu Lys Tyr Asp Phe Glu Leu Ala Glu Gly
465 470 475 480
Cys Thr Pro Arg Val Ile Glu Tyr Gly Ser Phe Leu Leu Ala Asp Pro
485 490 495
Thr Ala Arg Val Ser Ile Arg Arg Arg Lys Glu Glu Ile Gln Leu
500 505 510
<210> 7
<211> 2012
<212> DNA
<213> Hypoxylon pulicicidum
<400> 7
ctaatctgcg atggaccctg accctaaccc tgaccctgac ctgaatccgg acccctgctc 60
atcctcgtct ctcacaatct cacggcgtag atctgccggc caagttggcg catcgactcc 120
gttccctctc gtgcccacat tatacttgag ttcaatcgcg tcgtccttga atcgagcgat 180
aggccttact tgtatgaacg tcgtgttcaa cgcgccggac cggaatgggc cgaaaaattc 240
cctttgaaag agaatctcgc cgtcgaattt gtacaatgcc gttagcagct taggcagcat 300
gtattgcatg gagtggtagt gtctgaaaac aggtgcgtcg tgacggcgga acaggtcagt 360
ccaggtatgc tcgtcgtatg tcccgactga tcgaacaagc cattgattgt aatagttgat 420
tgatacctgg aaatactgta tgagcgataa ccagcgatag cgtatccggg ggctacctac 480
atcaaccctg tagcttcccc ctttctcggc tctttggaca agggcgtcca agacagccgt 540
ggacccgcat attccggtac tagaagatat gtcagtcagg ctgcaactct gctaccaagt 600
gaagaggtat ctctcgatcg gctcaccaat aatcagaatt gaacagagca ggagttacag 660
gctcttcaag acccatagca tggccgtacg aagtagaaat cccgcagcac gcatcgctaa 720
tctgctgcca gccgcttcta tggctccagg gtccatacca accatagcag ttctccctga 780
cgtaaataat accacgactg cggtcccgca ccagattgaa cacctcgtcg tagccaaagc 840
caaaacgttt catcacacct ggccgatagc tatctacaac cacatctgca tccaatatca 900
agtccctcag cttttggcgg tcagattcga catccaaccg tagccatgag ttccatttgc 960
cccaattcaa gtcttggtgt aacaccgaca tgtccgtgat gtctggggaa gtaacacgca 1020
ttacactagc ccccatctcc gcaagacttc gtgttatcgt cggacccgct atagcgcgcg 1080
ttaagtccac caccttcagc ccggccagcg gtctcttggg gctcgatgga gcgttaggat 1140
gatcaggcca ccaggctgct ggctgagaag aatttgggtc tctaatgacc tcatacagtc 1200
ccaccttgcc atttttctgg ccgtgctcgc tggcaaagta ctcagcggag ctgtagacaa 1260
tggtaccggc ttggcgatgt tcttcattta gcaaatggtc tagatgtgtg gcgtcatact 1320
ttgagagtct ttgttggatc ctgtcggtta cgacctcaga agtgtcttga acctcgcctt 1380
cgacgggcaa ccctagtgcc tgtagggtgg gctctggatt cattccccct ggaggaatat 1440
cgattagtct ctagattgac tcggcttgca agatcatacc gtgtgtatgg tagaaacggc 1500
catcctttgt tttatagata ttggtaatca atgcccgttg tagagatgcg ttggcgcgat 1560
gtttatctcg gttcggaaaa agttctgctg tcagtgtatc aaatggcgag aaaggacgga 1620
cttctcctct atcctcgatt tgggtgagca tgggggacat gaggaacaag gttgcgtggt 1680
ctctatctga tgttagacaa acggccagtg cttcatatac atcacaatcc gagaacttac 1740
gtgtttattg agacattgct agggcgtaca ccatacttcc gatgggccag ataattcagg 1800
aacgttgctt caaaggcttt caaagctgag atgctctctg cgagcctcca gttaacagga 1860
atgctaggct tgacgtttcc ctcgaaggag acaaatttgg cgatttcggc cagctcaggg 1920
ggaagatttg gcattagcgg attctctaga atttcgcgta tgaatacaga ttccgcttgc 1980
ttgggaactg tattatccgc acttgactcc at 2012
<210> 8
<211> 1782
<212> DNA
<213> Hypoxylon pulicicidum
<400> 8
ctaatctgcg atggaccctg accctaaccc tgaccctgac ctgaatccgg acccctgctc 60
atcctcgtct ctcacaatct cacggcgtag atctgccggc caagttggcg catcgactcc 120
gttccctctc gtgcccacat tatacttgag ttcaatcgcg tcgtccttga atcgagcgat 180
aggccttact tgtatgaacg tcgtgttcaa cgcgccggac cggaatgggc cgaaaaattc 240
cctttgaaag agaatctcgc cgtcgaattt gtacaatgcc gttagcagct taggcagcat 300
gtattgcatg gagtggtagt gtctgaaaac aggtgcgtcg tgacggcgga acaggtcagt 360
ccaggtatgc tcgtcgtatg tcccgactga tcgaacaagc cattgattgt aatagttgat 420
tgatacatca accctgtagc ttcccccttt ctcggctctt tggacaaggg cgtccaagac 480
agccgtggac ccgcatattc cggtacaata atcagaattg aacagagcag gagttacagg 540
ctcttcaaga cccatagcat ggccgtacga agtagaaatc ccgcagcacg catcgctaat 600
ctgctgccag ccgcttctat ggctccaggg tccataccaa ccatagcagt tctccctgac 660
gtaaataata ccacgactgc ggtcccgcac cagattgaac acctcgtcgt agccaaagcc 720
aaaacgtttc atcacacctg gccgatagct atctacaacc acatctgcat ccaatatcaa 780
gtccctcagc ttttggcggt cagattcgac atccaaccgt agccatgagt tccatttgcc 840
ccaattcaag tcttggtgta acaccgacat gtccgtgatg tctggggaag taacacgcat 900
tacactagcc cccatctccg caagacttcg tgttatcgtc ggacccgcta tagcgcgcgt 960
taagtccacc accttcagcc cggccagcgg tctcttgggg ctcgatggag cgttaggatg 1020
atcaggccac caggctgctg gctgagaaga atttgggtct ctaatgacct catacagtcc 1080
caccttgcca tttttctggc cgtgctcgct ggcaaagtac tcagcggagc tgtagacaat 1140
ggtaccggct tggcgatgtt cttcatttag caaatggtct agatgtgtgg cgtcatactt 1200
tgagagtctt tgttggatcc tgtcggttac gacctcagaa gtgtcttgaa cctcgccttc 1260
gacgggcaac cctagtgcct gtagggtggg ctctggattc attcccccgt gtgtatggta 1320
gaaacggcca tcctttgttt tatagatatt ggtaatcaat gcccgttgta gagatgcgtt 1380
ggcgcgatgt ttatctcggt tcggaaaaag ttctgctgtc agtgtatcaa atggcgagaa 1440
aggacggact tctcctctat cctcgatttg ggtgagcatg ggggacatga ggaacaaggt 1500
tgcgtggtct gtgtttattg agacattgct agggcgtaca ccatacttcc gatgggccag 1560
ataattcagg aacgttgctt caaaggcttt caaagctgag atgctctctg cgagcctcca 1620
gttaacagga atgctaggct tgacgtttcc ctcgaaggag acaaatttgg cgatttcggc 1680
cagctcaggg ggaagatttg gcattagcgg attctctaga atttcgcgta tgaatacaga 1740
ttccgcttgc ttgggaactg tattatccgc acttgactcc at 1782
<210> 9
<211> 593
<212> PRT
<213> Hypoxylon pulicicidum
<400> 9
Met Glu Ser Ser Ala Asp Asn Thr Val Pro Lys Gln Ala Glu Ser Val
1 5 10 15
Phe Ile Arg Glu Ile Leu Glu Asn Pro Leu Met Pro Asn Leu Pro Pro
20 25 30
Glu Leu Ala Glu Ile Ala Lys Phe Val Ser Phe Glu Gly Asn Val Lys
35 40 45
Pro Ser Ile Pro Val Asn Trp Arg Leu Ala Glu Ser Ile Ser Ala Leu
50 55 60
Lys Ala Phe Glu Ala Thr Phe Leu Asn Tyr Leu Ala His Arg Lys Tyr
65 70 75 80
Gly Val Arg Pro Ser Asn Val Ser Ile Asn Thr Asp His Ala Thr Leu
85 90 95
Phe Leu Met Ser Pro Met Leu Thr Gln Ile Glu Asp Arg Gly Glu Val
100 105 110
Arg Pro Phe Ser Pro Phe Asp Thr Leu Thr Ala Glu Leu Phe Pro Asn
115 120 125
Arg Asp Lys His Arg Ala Asn Ala Ser Leu Gln Arg Ala Leu Ile Thr
130 135 140
Asn Ile Tyr Lys Thr Lys Asp Gly Arg Phe Tyr His Thr His Gly Gly
145 150 155 160
Met Asn Pro Glu Pro Thr Leu Gln Ala Leu Gly Leu Pro Val Glu Gly
165 170 175
Glu Val Gln Asp Thr Ser Glu Val Val Thr Asp Arg Ile Gln Gln Arg
180 185 190
Leu Ser Lys Tyr Asp Ala Thr His Leu Asp His Leu Leu Asn Glu Glu
195 200 205
His Arg Gln Ala Gly Thr Ile Val Tyr Ser Ser Ala Glu Tyr Phe Ala
210 215 220
Ser Glu His Gly Gln Lys Asn Gly Lys Val Gly Leu Tyr Glu Val Ile
225 230 235 240
Arg Asp Pro Asn Ser Ser Gln Pro Ala Ala Trp Trp Pro Asp His Pro
245 250 255
Asn Ala Pro Ser Ser Pro Lys Arg Pro Leu Ala Gly Leu Lys Val Val
260 265 270
Asp Leu Thr Arg Ala Ile Ala Gly Pro Thr Ile Thr Arg Ser Leu Ala
275 280 285
Glu Met Gly Ala Ser Val Met Arg Val Thr Ser Pro Asp Ile Thr Asp
290 295 300
Met Ser Val Leu His Gln Asp Leu Asn Trp Gly Lys Trp Asn Ser Trp
305 310 315 320
Leu Arg Leu Asp Val Glu Ser Asp Arg Gln Lys Leu Arg Asp Leu Ile
325 330 335
Leu Asp Ala Asp Val Val Val Asp Ser Tyr Arg Pro Gly Val Met Lys
340 345 350
Arg Phe Gly Phe Gly Tyr Asp Glu Val Phe Asn Leu Val Arg Asp Arg
355 360 365
Ser Arg Gly Ile Ile Tyr Val Arg Glu Asn Cys Tyr Gly Trp Tyr Gly
370 375 380
Pro Trp Ser His Arg Ser Gly Trp Gln Gln Ile Ser Asp Ala Cys Cys
385 390 395 400
Gly Ile Ser Thr Ser Tyr Gly His Ala Met Gly Leu Glu Glu Pro Val
405 410 415
Thr Pro Ala Leu Phe Asn Ser Asp Tyr Cys Thr Gly Ile Cys Gly Ser
420 425 430
Thr Ala Val Leu Asp Ala Leu Val Gln Arg Ala Glu Lys Gly Gly Ser
435 440 445
Tyr Arg Val Asp Val Ser Ile Asn Tyr Tyr Asn Gln Trp Leu Val Arg
450 455 460
Ser Val Gly Thr Tyr Asp Glu His Thr Trp Thr Asp Leu Phe Arg Arg
465 470 475 480
His Asp Ala Pro Val Phe Arg His Tyr His Ser Met Gln Tyr Met Leu
485 490 495
Pro Lys Leu Leu Thr Ala Leu Tyr Lys Phe Asp Gly Glu Ile Leu Phe
500 505 510
Gln Arg Glu Phe Phe Gly Pro Phe Arg Ser Gly Ala Leu Asn Thr Thr
515 520 525
Phe Ile Gln Val Arg Pro Ile Ala Arg Phe Lys Asp Asp Ala Ile Glu
530 535 540
Leu Lys Tyr Asn Val Gly Thr Arg Gly Asn Gly Val Asp Ala Pro Thr
545 550 555 560
Trp Pro Ala Asp Leu Arg Arg Glu Ile Val Arg Asp Glu Asp Glu Gln
565 570 575
Gly Ser Gly Phe Arg Ser Gly Ser Gly Leu Gly Ser Gly Ser Ile Ala
580 585 590
Asp
<210> 10
<211> 1577
<212> DNA
<213> Hypoxylon pulicicidum
<400> 10
atgtctaccc ctgagttcaa ggtgataatc gttggcggct cccttgcggg tctaacattg 60
gcccattgcc tcctccgcgc cggaatttcc cacatcgttc ttgagagacg tagtgtaatc 120
gcaccagagg aaggtgcctc aatagggatt cttcctaatg gcgctcgtgt cttggatcaa 180
ctaggcatct atgaacatat tcaagacact actgagccat tgagtacagc tcatatacga 240
tatccagatg ggttctattt cagcagtcgc tatcccgaga tcataaaaga aaggtgagca 300
ctcccatgaa catatgccta tcgtttgcgc aatggctgac cccagcatgg ccgttcgtag 360
gtttgggtat ccgatagcct ttttaccccg gaggagactt ttggagattc tctatacatc 420
gtaccctgac cattctaaca tctataccaa caagaatgtg atcaaggtgc aaagccatga 480
taatcaagtt tctgtcttga cagaggatgg aaatacatat cgaggggatc ttgtggtggg 540
cgccgacggt gtcaacagtc gagttctatc tgaaatttgg aaattagcag gtaatccctc 600
tctcacgaaa cgggaaggaa gaggtcagtc gagatcttat aatattcgca tagcgactca 660
tacagacgtt gataataaac ttaggaagga ccatcgagta cgcttgtgtg tttgggatat 720
cctcgccaat ctcagacctc aagcccggcg agcaggttaa cgcgttctac gacggactca 780
caatcgtcac gatccatggt agaaacggag agatattctg gttttttatc aagaaactct 840
cgcgtcgcta tatctatccc gatctcatca gattacagca gaaagacgca gaagggatct 900
gtgaagaagc caagtcacta actgtctgga aaggtgttac attcggtgac atttgggaaa 960
gaagagaaac agcatcattg accgttttgg atgagttctt gcatcacact tggagttggg 1020
acagatcggt ttgtgtgggc gacagtatcc acaaggtata tgcctcctat ggtctgaagc 1080
acattaaggg gttggctaac gctgtcatat agatgactcc aaattttggc cagggtgcga 1140
atactgctat cgaggattct gccgctctag ccaatctact gcacagtttg atcaaggaga 1200
aacgagccga aaagccgact gactcagata tatcactgct tctgaggcag ttcaaatcac 1260
agcgtcttcg acgcgttcag aagatatata aaatgtcaag gtttgttacg cggcttcaag 1320
cgcgcgatgg gttgttgaat actcttctgg gacgccatta cgccccatat gcagcagatc 1380
ttccagctaa gattgcctct ggatgcatcg ctggtgcgga agttctggat tacctcccat 1440
tacccaaggt aactggggcg ggctggaata ggggccatcg tagatctacc atgtacatcc 1500
tgctaggatt cacaggggta ttcacctctg ctctggcgat ggtagtgtta ctccatatta 1560
gagacatcgc ttcatag 1577
<210> 11
<211> 1392
<212> DNA
<213> Hypoxylon pulicicidum
<400> 11
atgtctaccc ctgagttcaa ggtgataatc gttggcggct cccttgcggg tctaacattg 60
gcccattgcc tcctccgcgc cggaatttcc cacatcgttc ttgagagacg tagtgtaatc 120
gcaccagagg aaggtgcctc aatagggatt cttcctaatg gcgctcgtgt cttggatcaa 180
ctaggcatct atgaacatat tcaagacact actgagccat tgagtacagc tcatatacga 240
tatccagatg ggttctattt cagcagtcgc tatcccgaga tcataaaaga aaggtttggg 300
tatccgatag cctttttacc ccggaggaga cttttggaga ttctctatac atcgtaccct 360
gaccattcta acatctatac caacaagaat gtgatcaagg tgcaaagcca tgataatcaa 420
gtttctgtct tgacagagga tggaaataca tatcgagggg atcttgtggt gggcgccgac 480
ggtgtcaaca gtcgagttct atctgaaatt tggaaattag caggtaatcc ctctctcacg 540
aaacgggaag gaagaggaag gaccatcgag tacgcttgtg tgtttgggat atcctcgcca 600
atctcagacc tcaagcccgg cgagcaggtt aacgcgttct acgacggact cacaatcgtc 660
acgatccatg gtagaaacgg agagatattc tggtttttta tcaagaaact ctcgcgtcgc 720
tatatctatc ccgatctcat cagattacag cagaaagacg cagaagggat ctgtgaagaa 780
gccaagtcac taactgtctg gaaaggtgtt acattcggtg acatttggga aagaagagaa 840
acagcatcat tgaccgtttt ggatgagttc ttgcatcaca cttggagttg ggacagatcg 900
gtttgtgtgg gcgacagtat ccacaagatg actccaaatt ttggccaggg tgcgaatact 960
gctatcgagg attctgccgc tctagccaat ctactgcaca gtttgatcaa ggagaaacga 1020
gccgaaaagc cgactgactc agatatatca ctgcttctga ggcagttcaa atcacagcgt 1080
cttcgacgcg ttcagaagat atataaaatg tcaaggtttg ttacgcggct tcaagcgcgc 1140
gatgggttgt tgaatactct tctgggacgc cattacgccc catatgcagc agatcttcca 1200
gctaagattg cctctggatg catcgctggt gcggaagttc tggattacct cccattaccc 1260
aaggtaactg gggcgggctg gaataggggc catcgtagat ctaccatgta catcctgcta 1320
ggattcacag gggtattcac ctctgctctg gcgatggtag tgttactcca tattagagac 1380
atcgcttcat ag 1392
<210> 12
<211> 463
<212> PRT
<213> Hypoxylon pulicicidum
<400> 12
Met Ser Thr Pro Glu Phe Lys Val Ile Ile Val Gly Gly Ser Leu Ala
1 5 10 15
Gly Leu Thr Leu Ala His Cys Leu Leu Arg Ala Gly Ile Ser His Ile
20 25 30
Val Leu Glu Arg Arg Ser Val Ile Ala Pro Glu Glu Gly Ala Ser Ile
35 40 45
Gly Ile Leu Pro Asn Gly Ala Arg Val Leu Asp Gln Leu Gly Ile Tyr
50 55 60
Glu His Ile Gln Asp Thr Thr Glu Pro Leu Ser Thr Ala His Ile Arg
65 70 75 80
Tyr Pro Asp Gly Phe Tyr Phe Ser Ser Arg Tyr Pro Glu Ile Ile Lys
85 90 95
Glu Arg Phe Gly Tyr Pro Ile Ala Phe Leu Pro Arg Arg Arg Leu Leu
100 105 110
Glu Ile Leu Tyr Thr Ser Tyr Pro Asp His Ser Asn Ile Tyr Thr Asn
115 120 125
Lys Asn Val Ile Lys Val Gln Ser His Asp Asn Gln Val Ser Val Leu
130 135 140
Thr Glu Asp Gly Asn Thr Tyr Arg Gly Asp Leu Val Val Gly Ala Asp
145 150 155 160
Gly Val Asn Ser Arg Val Leu Ser Glu Ile Trp Lys Leu Ala Gly Asn
165 170 175
Pro Ser Leu Thr Lys Arg Glu Gly Arg Gly Arg Thr Ile Glu Tyr Ala
180 185 190
Cys Val Phe Gly Ile Ser Ser Pro Ile Ser Asp Leu Lys Pro Gly Glu
195 200 205
Gln Val Asn Ala Phe Tyr Asp Gly Leu Thr Ile Val Thr Ile His Gly
210 215 220
Arg Asn Gly Glu Ile Phe Trp Phe Phe Ile Lys Lys Leu Ser Arg Arg
225 230 235 240
Tyr Ile Tyr Pro Asp Leu Ile Arg Leu Gln Gln Lys Asp Ala Glu Gly
245 250 255
Ile Cys Glu Glu Ala Lys Ser Leu Thr Val Trp Lys Gly Val Thr Phe
260 265 270
Gly Asp Ile Trp Glu Arg Arg Glu Thr Ala Ser Leu Thr Val Leu Asp
275 280 285
Glu Phe Leu His His Thr Trp Ser Trp Asp Arg Ser Val Cys Val Gly
290 295 300
Asp Ser Ile His Lys Met Thr Pro Asn Phe Gly Gln Gly Ala Asn Thr
305 310 315 320
Ala Ile Glu Asp Ser Ala Ala Leu Ala Asn Leu Leu His Ser Leu Ile
325 330 335
Lys Glu Lys Arg Ala Glu Lys Pro Thr Asp Ser Asp Ile Ser Leu Leu
340 345 350
Leu Arg Gln Phe Lys Ser Gln Arg Leu Arg Arg Val Gln Lys Ile Tyr
355 360 365
Lys Met Ser Arg Phe Val Thr Arg Leu Gln Ala Arg Asp Gly Leu Leu
370 375 380
Asn Thr Leu Leu Gly Arg His Tyr Ala Pro Tyr Ala Ala Asp Leu Pro
385 390 395 400
Ala Lys Ile Ala Ser Gly Cys Ile Ala Gly Ala Glu Val Leu Asp Tyr
405 410 415
Leu Pro Leu Pro Lys Val Thr Gly Ala Gly Trp Asn Arg Gly His Arg
420 425 430
Arg Ser Thr Met Tyr Ile Leu Leu Gly Phe Thr Gly Val Phe Thr Ser
435 440 445
Ala Leu Ala Met Val Val Leu Leu His Ile Arg Asp Ile Ala Ser
450 455 460
<210> 13
<211> 803
<212> DNA
<213> Hypoxylon pulicicidum
<400> 13
ttattgagcc ttccgcgcat tgcttcgttc ttggccatgt tcgtatttct tcacattcca 60
cagacaaatt ccatagaggc tgtctaccgc aatgaataca ccgaggctcc atagtaccag 120
aggactattg agccagttga atgcctccga ccagtacatg tacctcaata tggcaaaccc 180
aaccacacaa ccggatccta taaagcgaga taacctatac cttgttattt atatgtcctc 240
aaagttctgt tgcataactt cggagcaaga agatggatta cctaccataa ggtatatgaa 300
gctccacgac tactacttct ccctagaagc tggcagaacc ccccgacgct tagcagtagc 360
tggcaagcca ctgcacccca agaatatcca agtgctggcc caatctctgc tgctagggct 420
agatggcccg tcaaggagcc caagacacct agtgcgaaaa tgagtgtgat gttgttcatc 480
acaagaggcg catgggccca ttcattcggc gcaaacctga tcgcggtgta catgactccg 540
agattgacta ccagtccagc tagaaacaca ccttgctcga tgcggctttt tgaagggtag 600
ataagaccat ataccatttc ccaagcaaag ttgcagcaaa gagccagcgg tgccatgctg 660
taagtctgtt cctggagcga ggtgtagatc atgccggcgt agtttatgag ccaacaaacg 720
cccattccga agacgaagat gtccgaaatc cattcgacgc gctgatattc aacgggtgca 780
ttggaacgat cgaatccatc cat 803
<210> 14
<211> 732
<212> DNA
<213> Hypoxylon pulicicidum
<400> 14
ttattgagcc ttccgcgcat tgcttcgttc ttggccatgt tcgtatttct tcacattcca 60
cagacaaatt ccatagaggc tgtctaccgc aatgaataca ccgaggctcc atagtaccag 120
aggactattg agccagttga atgcctccga ccagtacatg tacctcaata tggcaaaccc 180
aaccacacaa ccggatccta taaagcgaga taaccataag gtatatgaag ctccacgact 240
actacttctc cctagaagct ggcagaaccc cccgacgctt agcagtagct ggcaagccac 300
tgcaccccaa gaatatccaa gtgctggccc aatctctgct gctagggcta gatggcccgt 360
caaggagccc aagacaccta gtgcgaaaat gagtgtgatg ttgttcatca caagaggcgc 420
atgggcccat tcattcggcg caaacctgat cgcggtgtac atgactccga gattgactac 480
cagtccagct agaaacacac cttgctcgat gcggcttttt gaagggtaga taagaccata 540
taccatttcc caagcaaagt tgcagcaaag agccagcggt gccatgctgt aagtctgttc 600
ctggagcgag gtgtagatca tgccggcgta gtttatgagc caacaaacgc ccattccgaa 660
gacgaagatg tccgaaatcc attcgacgcg ctgatattca acgggtgcat tggaacgatc 720
gaatccatcc at 732
<210> 15
<211> 243
<212> PRT
<213> Hypoxylon pulicicidum
<400> 15
Met Asp Gly Phe Asp Arg Ser Asn Ala Pro Val Glu Tyr Gln Arg Val
1 5 10 15
Glu Trp Ile Ser Asp Ile Phe Val Phe Gly Met Gly Val Cys Trp Leu
20 25 30
Ile Asn Tyr Ala Gly Met Ile Tyr Thr Ser Leu Gln Glu Gln Thr Tyr
35 40 45
Ser Met Ala Pro Leu Ala Leu Cys Cys Asn Phe Ala Trp Glu Met Val
50 55 60
Tyr Gly Leu Ile Tyr Pro Ser Lys Ser Arg Ile Glu Gln Gly Val Phe
65 70 75 80
Leu Ala Gly Leu Val Val Asn Leu Gly Val Met Tyr Thr Ala Ile Arg
85 90 95
Phe Ala Pro Asn Glu Trp Ala His Ala Pro Leu Val Met Asn Asn Ile
100 105 110
Thr Leu Ile Phe Ala Leu Gly Val Leu Gly Ser Leu Thr Gly His Leu
115 120 125
Ala Leu Ala Ala Glu Ile Gly Pro Ala Leu Gly Tyr Ser Trp Gly Ala
130 135 140
Val Ala Cys Gln Leu Leu Leu Ser Val Gly Gly Phe Cys Gln Leu Leu
145 150 155 160
Gly Arg Ser Ser Ser Arg Gly Ala Ser Tyr Thr Leu Trp Leu Ser Arg
165 170 175
Phe Ile Gly Ser Gly Cys Val Val Gly Phe Ala Ile Leu Arg Tyr Met
180 185 190
Tyr Trp Ser Glu Ala Phe Asn Trp Leu Asn Ser Pro Leu Val Leu Trp
195 200 205
Ser Leu Gly Val Phe Ile Ala Val Asp Ser Leu Tyr Gly Ile Cys Leu
210 215 220
Trp Asn Val Lys Lys Tyr Glu His Gly Gln Glu Arg Ser Asn Ala Arg
225 230 235 240
Lys Ala Gln
<210> 16
<211> 1514
<212> DNA
<213> Hypoxylon pulicicidum
<400> 16
atggaggttt cctcaagtga aacactcccc attctatgga gaacgagtcc tccctcaaac 60
gactatgaaa atgcaagatg cagagtgttc aatggcaggc agcctgagca cttccccctt 120
gcaatagtca aggcaaacaa ggtcgagcat attgtagccg ccgtgaaact ggcagcagaa 180
ctagacgcct gtatcgccgt tcgttcgggc ggccacagcc tctcttgttg gactatacgc 240
catggggcga tccttattga cctcgaagat tatcagcact tgagctatga cgacgagatc 300
catgaagtgc aagcttcacc cagtacactt ggtgcggacc tacttacgtt ccttgcgaag 360
aaaaagaggt tctttcccgt aggtcactct ggagacattg gcttaggtgg ctatctcctt 420
cagggcggaa ttgggctcaa ttctcgggta tgaacgttga ccctacatac tcagtagctt 480
tcgaatactg acgatatctc tagggatatg ggtatgcctg tgaatacatt accgggcttg 540
atatcatcac cgctgatggt gaaatcaagc attgtgataa gacggaaaac tctgacctat 600
actgggctgc tcgtggagct ggaccgggta agttcctcaa agctgtctgt accagtgtgt 660
aagagttcta ataaagcaga attccctgca atcgttatac ggttcttcct gaagacgtgc 720
cccctcttgc cggtgtgtaa gcggagtaga tacgtctggc cggcggccat gtatgggaag 780
gtttttaagt ggcttgaaga ggtaagttta atcccaagga tctaggacgg caggggttaa 840
tctgatccgc gtctttacag ctattgaatt ccttgagcga ggacgtcgag attgccgttt 900
tcgggtttgt attgccccga ctcaaccagc caggcttagt cctccatgca acagcatttg 960
gtgactctag cgagaatgtc cgggaaaagc tcacgcctat catcaaaaat catcctccag 1020
ggactttctt ggctgaagat ttcgtgagca ccaacttccc cgaagactac gacttaggta 1080
aggataccat gccgcggggc gctcgctatt ttaccgacag cgtctttctc aagcccggta 1140
tcgacttcgt cgcaacctgc aaaggaatgt ttacggagct caaacatccc cgtgcattgg 1200
cgtactggca accgatgaag accaatattg atcgcatcct tcccgatatg gcgatgagca 1260
tccatagtca tcattacgtg tcactacttg ccatctatga agaccccagt gaggaccaac 1320
agcaaatatc ctggatcata gatcgtatga aaagtcttga gccggcaatc ctgggaactt 1380
tcatagggga tgcacaccca gtggaaaggc catctaatta ttggtccgag gaagctgaag 1440
aacgggtgat cactattggg cggaagtggg accctagtag tagaattcgg ggtattgtgt 1500
tgagcgatgc ctaa 1514
<210> 17
<211> 1347
<212> DNA
<213> Hypoxylon pulicicidum
<400> 17
atggaggttt cctcaagtga aacactcccc attctatgga gaacgagtcc tccctcaaac 60
gactatgaaa atgcaagatg cagagtgttc aatggcaggc agcctgagca cttccccctt 120
gcaatagtca aggcaaacaa ggtcgagcat attgtagccg ccgtgaaact ggcagcagaa 180
ctagacgcct gtatcgccgt tcgttcgggc ggccacagcc tctcttgttg gactatacgc 240
catggggcga tccttattga cctcgaagat tatcagcact tgagctatga cgacgagatc 300
catgaagtgc aagcttcacc cagtacactt ggtgcggacc tacttacgtt ccttgcgaag 360
aaaaagaggt tctttcccgt aggtcactct ggagacattg gcttaggtgg ctatctcctt 420
cagggcggaa ttgggctcaa ttctcgggga tatgggtatg cctgtgaata cattaccggg 480
cttgatatca tcaccgctga tggtgaaatc aagcattgtg ataagacgga aaactctgac 540
ctatactggg ctgctcgtgg agctggaccg gaattccctg caatcgttat acggttcttc 600
ctgaagacgt gccccctctt gccggtgtgt aagcggagta gatacgtctg gccggcggcc 660
atgtatggga aggtttttaa gtggcttgaa gagctattga attccttgag cgaggacgtc 720
gagattgccg ttttcgggtt tgtattgccc cgactcaacc agccaggctt agtcctccat 780
gcaacagcat ttggtgactc tagcgagaat gtccgggaaa agctcacgcc tatcatcaaa 840
aatcatcctc cagggacttt cttggctgaa gatttcgtga gcaccaactt ccccgaagac 900
tacgacttag gtaaggatac catgccgcgg ggcgctcgct attttaccga cagcgtcttt 960
ctcaagcccg gtatcgactt cgtcgcaacc tgcaaaggaa tgtttacgga gctcaaacat 1020
ccccgtgcat tggcgtactg gcaaccgatg aagaccaata ttgatcgcat ccttcccgat 1080
atggcgatga gcatccatag tcatcattac gtgtcactac ttgccatcta tgaagacccc 1140
agtgaggacc aacagcaaat atcctggatc atagatcgta tgaaaagtct tgagccggca 1200
atcctgggaa ctttcatagg ggatgcacac ccagtggaaa ggccatctaa ttattggtcc 1260
gaggaagctg aagaacgggt gatcactatt gggcggaagt gggaccctag tagtagaatt 1320
cggggtattg tgttgagcga tgcctaa 1347
<210> 18
<211> 448
<212> PRT
<213> Hypoxylon pulicicidum
<400> 18
Met Glu Val Ser Ser Ser Glu Thr Leu Pro Ile Leu Trp Arg Thr Ser
1 5 10 15
Pro Pro Ser Asn Asp Tyr Glu Asn Ala Arg Cys Arg Val Phe Asn Gly
20 25 30
Arg Gln Pro Glu His Phe Pro Leu Ala Ile Val Lys Ala Asn Lys Val
35 40 45
Glu His Ile Val Ala Ala Val Lys Leu Ala Ala Glu Leu Asp Ala Cys
50 55 60
Ile Ala Val Arg Ser Gly Gly His Ser Leu Ser Cys Trp Thr Ile Arg
65 70 75 80
His Gly Ala Ile Leu Ile Asp Leu Glu Asp Tyr Gln His Leu Ser Tyr
85 90 95
Asp Asp Glu Ile His Glu Val Gln Ala Ser Pro Ser Thr Leu Gly Ala
100 105 110
Asp Leu Leu Thr Phe Leu Ala Lys Lys Lys Arg Phe Phe Pro Val Gly
115 120 125
His Ser Gly Asp Ile Gly Leu Gly Gly Tyr Leu Leu Gln Gly Gly Ile
130 135 140
Gly Leu Asn Ser Arg Gly Tyr Gly Tyr Ala Cys Glu Tyr Ile Thr Gly
145 150 155 160
Leu Asp Ile Ile Thr Ala Asp Gly Glu Ile Lys His Cys Asp Lys Thr
165 170 175
Glu Asn Ser Asp Leu Tyr Trp Ala Ala Arg Gly Ala Gly Pro Glu Phe
180 185 190
Pro Ala Ile Val Ile Arg Phe Phe Leu Lys Thr Cys Pro Leu Leu Pro
195 200 205
Val Cys Lys Arg Ser Arg Tyr Val Trp Pro Ala Ala Met Tyr Gly Lys
210 215 220
Val Phe Lys Trp Leu Glu Glu Leu Leu Asn Ser Leu Ser Glu Asp Val
225 230 235 240
Glu Ile Ala Val Phe Gly Phe Val Leu Pro Arg Leu Asn Gln Pro Gly
245 250 255
Leu Val Leu His Ala Thr Ala Phe Gly Asp Ser Ser Glu Asn Val Arg
260 265 270
Glu Lys Leu Thr Pro Ile Ile Lys Asn His Pro Pro Gly Thr Phe Leu
275 280 285
Ala Glu Asp Phe Val Ser Thr Asn Phe Pro Glu Asp Tyr Asp Leu Gly
290 295 300
Lys Asp Thr Met Pro Arg Gly Ala Arg Tyr Phe Thr Asp Ser Val Phe
305 310 315 320
Leu Lys Pro Gly Ile Asp Phe Val Ala Thr Cys Lys Gly Met Phe Thr
325 330 335
Glu Leu Lys His Pro Arg Ala Leu Ala Tyr Trp Gln Pro Met Lys Thr
340 345 350
Asn Ile Asp Arg Ile Leu Pro Asp Met Ala Met Ser Ile His Ser His
355 360 365
His Tyr Val Ser Leu Leu Ala Ile Tyr Glu Asp Pro Ser Glu Asp Gln
370 375 380
Gln Gln Ile Ser Trp Ile Ile Asp Arg Met Lys Ser Leu Glu Pro Ala
385 390 395 400
Ile Leu Gly Thr Phe Ile Gly Asp Ala His Pro Val Glu Arg Pro Ser
405 410 415
Asn Tyr Trp Ser Glu Glu Ala Glu Glu Arg Val Ile Thr Ile Gly Arg
420 425 430
Lys Trp Asp Pro Ser Ser Arg Ile Arg Gly Ile Val Leu Ser Asp Ala
435 440 445
<210> 19
<211> 1694
<212> DNA
<213> Hypoxylon pulicicidum
<400> 19
ttacccaact agcagtggaa acttcgagtc gccttctgtg accctgaaat cccatttgtc 60
atccttgaat tcctttctct ctctgagagt caccatgaac tcccctgcag gtgtctgtat 120
ggaacttgca agtgttttca cgttggcctt gggaggaatc cactctccga gcacgggctc 180
catgtcaaac cgtaaaatca ccatggctac taccgctaat atctccccag atgcgaagtg 240
gcgcccagga cagatgttag gtgctgtccc gaaagactgg aacgcaacgc gtgtgacgtt 300
acggccactt cgcgatgtcc cactcttccc ctggccgaga tatcgatatg cgtcgaagct 360
atcccctgtt tcgccccata ctgacttttc gcgattaaca catcttgcag ggatcacgat 420
cacggacccc ttcttgaata gaactcgctc gttgaggatg gtatcctcat ggaccatgcg 480
cgtgactata gcattagacc tcatacggag gacctcctga aaggtaccga gaagcaaact 540
gcacttggcg cgtacagcgc tgagatcaat agtacgaact atccctccat cggtacctgg 600
atgcgtgtac acagcagaag ccacgagctc ttgtcgaaga tccctcagca aactcgggcg 660
tgagtaaatt tcgaaaaggg tccaaaatgt ggaaggcgca gtattcgata ggacacctat 720
cgcgttaaca atttccattc gagctatatc ttgtgtggtg attcccttgt tatattggac 780
ctcccatcga ccatacgtca tttccgagga gttttcgtgg cctcccaggt tgtaatactc 840
tgttagagcg tccacaacct tacgacgatc atctagggac tttcgtgctg tgagaaaggg 900
aaggacattg aggattatca tattcatatt cgacgcgaaa tccctacacc acgtatgagc 960
tcagcaattc ttacacagca ttggggttct attctgtgct ttgacctacc aaaaagccct 1020
ttcaacttct atggatcgga atggattcat aggaccgtaa accgagtctg tgctcgccat 1080
tgtgatagaa cgtttacacc atgcaaataa gtcgaatgcc gcttgtttct ggctttggag 1140
ttcgtctatt gagggcttta tagcctcgat catggaaaga ttcatggcat ccaagccatg 1200
tcctataagt gcgtgatgca tagcatgttg tagctcatcc acgatactac ctttaagcaa 1260
tttaagtcca ggcccactga caccacctac acgttctgcg gccagtgtaa attcgaacgt 1320
atcgaatcgt atattctggg actgtctttg aatagccggg actagctcgc tagacgtgat 1380
cacataaagc cttgatagtg gcatctggag cgagaaggcg ggaagtccat atttgtcact 1440
atctacaccg ttagtctatg tactatatac agcatatctt cctcgcttca actaagcaac 1500
atgtagaagt cttaaccata cttgagcttg gaaaaatacc caaagccgtc agtcgcgata 1560
ccaagtatgt gcccgatgag tggtaccgta ggggatatca aacggggctc gcgggggtcg 1620
agagcagctc tccatcgagt accgtacagc aggatgcaaa aagcgagagt tatgataata 1680
acgataagtt ccat 1694
<210> 20
<211> 1545
<212> DNA
<213> Hypoxylon pulicicidum
<400> 20
ttacccaact agcagtggaa acttcgagtc gccttctgtg accctgaaat cccatttgtc 60
atccttgaat tcctttctct ctctgagagt caccatgaac tcccctgcag gtgtctgtat 120
ggaacttgca agtgttttca cgttggcctt gggaggaatc cactctccga gcacgggctc 180
catgtcaaac cgtaaaatca ccatggctac taccgctaat atctccccag atgcgaagtg 240
gcgcccagga cagatgttag gtgctgtccc gaaagactgg aacgcaacgc gtgtgacgtt 300
acggccactt cgcgatgtcc cactcttccc ctggccgaga tatcgatatg cgtcgaagct 360
atcccctgtt tcgccccata ctgacttttc gcgattaaca catcttgcag ggatcacgat 420
cacggacccc ttcttgaata gaactcgctc gttgaggatg gtatcctcat ggaccatgcg 480
cgtgactata gcattagacc tcatacggag gacctcctga aaggtaccga gaagcaaact 540
gcacttggcg cgtacagcgc tgagatcaat agtacgaact atccctccat cggtacctgg 600
atgcgtgtac acagcagaag ccacgagctc ttgtcgaaga tccctcagca aactcgggcg 660
tgagtaaatt tcgaaaaggg tccaaaatgt ggaaggcgca gtattcgata ggacacctat 720
cgcgttaaca atttccattc gagctatatc ttgtgtggtg attcccttgt tatattggac 780
ctcccatcga ccatacgtca tttccgagga gttttcgtgg cctcccaggt tgtaatactc 840
tgttagagcg tccacaacct tacgacgatc atctagggac tttcgtgctg tgagaaaggg 900
aaggacattg aggattatca tattcatatt cgacgcgaaa tcccaaaaag ccctttcaac 960
ttctatggat cggaatggat tcataggacc gtaaaccgag tctgtgctcg ccattgtgat 1020
agaacgttta caccatgcaa ataagtcgaa tgccgcttgt ttctggcttt ggagttcgtc 1080
tattgagggc tttatagcct cgatcatgga aagattcatg gcatccaagc catgtcctat 1140
aagtgcgtga tgcatagcat gttgtagctc atccacgata ctacctttaa gcaatttaag 1200
tccaggccca ctgacaccac ctacacgttc tgcggccagt gtaaattcga acgtatcgaa 1260
tcgtatattc tgggactgtc tttgaatagc cgggactagc tcgctagacg tgatcacata 1320
aagccttgat agtggcatct ggagcgagaa ggcgggaagt ccatatttgt cattgagctt 1380
ggaaaaatac ccaaagccgt cagtcgcgat accaagtatg tgcccgatga gtggtaccgt 1440
aggggatatc aaacggggct cgcgggggtc gagagcagct ctccatcgag taccgtacag 1500
caggatgcaa aaagcgagag ttatgataat aacgataagt tccat 1545
<210> 21
<211> 514
<212> PRT
<213> Hypoxylon pulicicidum
<400> 21
Met Glu Leu Ile Val Ile Ile Ile Thr Leu Ala Phe Cys Ile Leu Leu
1 5 10 15
Tyr Gly Thr Arg Trp Arg Ala Ala Leu Asp Pro Arg Glu Pro Arg Leu
20 25 30
Ile Ser Pro Thr Val Pro Leu Ile Gly His Ile Leu Gly Ile Ala Thr
35 40 45
Asp Gly Phe Gly Tyr Phe Ser Lys Leu Asn Asp Lys Tyr Gly Leu Pro
50 55 60
Ala Phe Ser Leu Gln Met Pro Leu Ser Arg Leu Tyr Val Ile Thr Ser
65 70 75 80
Ser Glu Leu Val Pro Ala Ile Gln Arg Gln Ser Gln Asn Ile Arg Phe
85 90 95
Asp Thr Phe Glu Phe Thr Leu Ala Ala Glu Arg Val Gly Gly Val Ser
100 105 110
Gly Pro Gly Leu Lys Leu Leu Lys Gly Ser Ile Val Asp Glu Leu Gln
115 120 125
His Ala Met His His Ala Leu Ile Gly His Gly Leu Asp Ala Met Asn
130 135 140
Leu Ser Met Ile Glu Ala Ile Lys Pro Ser Ile Asp Glu Leu Gln Ser
145 150 155 160
Gln Lys Gln Ala Ala Phe Asp Leu Phe Ala Trp Cys Lys Arg Ser Ile
165 170 175
Thr Met Ala Ser Thr Asp Ser Val Tyr Gly Pro Met Asn Pro Phe Arg
180 185 190
Ser Ile Glu Val Glu Arg Ala Phe Trp Asp Phe Ala Ser Asn Met Asn
195 200 205
Met Ile Ile Leu Asn Val Leu Pro Phe Leu Thr Ala Arg Lys Ser Leu
210 215 220
Asp Asp Arg Arg Lys Val Val Asp Ala Leu Thr Glu Tyr Tyr Asn Leu
225 230 235 240
Gly Gly His Glu Asn Ser Ser Glu Met Thr Tyr Gly Arg Trp Glu Val
245 250 255
Gln Tyr Asn Lys Gly Ile Thr Thr Gln Asp Ile Ala Arg Met Glu Ile
260 265 270
Val Asn Ala Ile Gly Val Leu Ser Asn Thr Ala Pro Ser Thr Phe Trp
275 280 285
Thr Leu Phe Glu Ile Tyr Ser Arg Pro Ser Leu Leu Arg Asp Leu Arg
290 295 300
Gln Glu Leu Val Ala Ser Ala Val Tyr Thr His Pro Gly Thr Asp Gly
305 310 315 320
Gly Ile Val Arg Thr Ile Asp Leu Ser Ala Val Arg Ala Lys Cys Ser
325 330 335
Leu Leu Leu Gly Thr Phe Gln Glu Val Leu Arg Met Arg Ser Asn Ala
340 345 350
Ile Val Thr Arg Met Val His Glu Asp Thr Ile Leu Asn Glu Arg Val
355 360 365
Leu Phe Lys Lys Gly Ser Val Ile Val Ile Pro Ala Arg Cys Val Asn
370 375 380
Arg Glu Lys Ser Val Trp Gly Glu Thr Gly Asp Ser Phe Asp Ala Tyr
385 390 395 400
Arg Tyr Leu Gly Gln Gly Lys Ser Gly Thr Ser Arg Ser Gly Arg Asn
405 410 415
Val Thr Arg Val Ala Phe Gln Ser Phe Gly Thr Ala Pro Asn Ile Cys
420 425 430
Pro Gly Arg His Phe Ala Ser Gly Glu Ile Leu Ala Val Val Ala Met
435 440 445
Val Ile Leu Arg Phe Asp Met Glu Pro Val Leu Gly Glu Trp Ile Pro
450 455 460
Pro Lys Ala Asn Val Lys Thr Leu Ala Ser Ser Ile Gln Thr Pro Ala
465 470 475 480
Gly Glu Phe Met Val Thr Leu Arg Glu Arg Lys Glu Phe Lys Asp Asp
485 490 495
Lys Trp Asp Phe Arg Val Thr Glu Gly Asp Ser Lys Phe Pro Leu Leu
500 505 510
Val Gly
<210> 22
<211> 1125
<212> DNA
<213> Hypoxylon pulicicidum
<400> 22
atgtccttag gtttacagtg cttggcggca gtgttgtttt cggctttgtt ttcacttggg 60
gtcatcctag ttcatcttcc atggcgcgcc ttgaagtcaa aggacccgcg tgagcgaata 120
ttaggttcgc ccaaagaact ggttccaaca tgcccttacg aatatattcg aaatatatac 180
gggcgtcatc attgggcgcc ctttgtggcc aagttagcac cgaatctcaa agaaagtgat 240
tcagacaggt acacaatggt acttgaaatc atggactgca tacacctatg cctgattatg 300
gtcgatgatg tacgttcatc ttattatacg cctcttgttg gtgatagagg tgagagttgt 360
aaataactaa cccggactct cagattacag atgacagcga ctatcgtaaa ggccgcccag 420
cggcccatat catctatggc cgttcggaga cagctaaccg tgcttatctt cgtgtcagtc 480
agattataaa caagacaact caggacttcc cgcggctcgc cccgtgggtc acacagagtt 540
tggcagagat tctagagggc caggacatct cgctggtttg gcgacgagac ggcctcacta 600
gctttccaaa agctcacgac gagcgcgtga ttgcttatcg gtgcatgtca tctttgaaga 660
ctggcgcgct ttttaggttg ctagggaggc ttgtcttgga aaatcgttcc atggatgaca 720
cattgagtca ggttgggtaa gtgaactgta tccatcctga actcgacccc tttcacagtg 780
gcggaagcca atgctaaaac gtctagatac tattcacaat tacaaaatga ctgcaaaaat 840
gttttctcat ccgagtacgc aaaggcaaaa ggtactttag ctgaggactt acggaaccga 900
gagctgacgt atcctatcat cttggccctc aatgagcctg aaggatttta tattgagaaa 960
gcctttgagt ctggctcccc tcgtgacata caaaatgcaa tcggtgtaat acagagtgaa 1020
aacgtatacc gtgcttgttt ggacgagttg aaacaatatg aatcgaacgt cagagagtgg 1080
gttacactat ggggtagaaa ggagaaactc gatcttacgc attga 1125
<210> 23
<211> 981
<212> DNA
<213> Hypoxylon pulicicidum
<400> 23
atgtccttag gtttacagtg cttggcggca gtgttgtttt cggctttgtt ttcacttggg 60
gtcatcctag ttcatcttcc atggcgcgcc ttgaagtcaa aggacccgcg tgagcgaata 120
ttaggttcgc ccaaagaact ggttccaaca tgcccttacg aatatattcg aaatatatac 180
gggcgtcatc attgggcgcc ctttgtggcc aagttagcac cgaatctcaa agaaagtgat 240
tcagacaggt acacaatggt acttgaaatc atggactgca tacacctatg cctgattatg 300
gtcgatgata ttacagatga cagcgactat cgtaaaggcc gcccagcggc ccatatcatc 360
tatggccgtt cggagacagc taaccgtgct tatcttcgtg tcagtcagat tataaacaag 420
acaactcagg acttcccgcg gctcgccccg tgggtcacac agagtttggc agagattcta 480
gagggccagg acatctcgct ggtttggcga cgagacggcc tcactagctt tccaaaagct 540
cacgacgagc gcgtgattgc ttatcggtgc atgtcatctt tgaagactgg cgcgcttttt 600
aggttgctag ggaggcttgt cttggaaaat cgttccatgg atgacacatt gagtcaggtt 660
ggatactatt cacaattaca aaatgactgc aaaaatgttt tctcatccga gtacgcaaag 720
gcaaaaggta ctttagctga ggacttacgg aaccgagagc tgacgtatcc tatcatcttg 780
gccctcaatg agcctgaagg attttatatt gagaaagcct ttgagtctgg ctcccctcgt 840
gacatacaaa atgcaatcgg tgtaatacag agtgaaaacg tataccgtgc ttgtttggac 900
gagttgaaac aatatgaatc gaacgtcaga gagtgggtta cactatgggg tagaaaggag 960
aaactcgatc ttacgcattg a 981
<210> 24
<211> 326
<212> PRT
<213> Hypoxylon pulicicidum
<400> 24
Met Ser Leu Gly Leu Gln Cys Leu Ala Ala Val Leu Phe Ser Ala Leu
1 5 10 15
Phe Ser Leu Gly Val Ile Leu Val His Leu Pro Trp Arg Ala Leu Lys
20 25 30
Ser Lys Asp Pro Arg Glu Arg Ile Leu Gly Ser Pro Lys Glu Leu Val
35 40 45
Pro Thr Cys Pro Tyr Glu Tyr Ile Arg Asn Ile Tyr Gly Arg His His
50 55 60
Trp Ala Pro Phe Val Ala Lys Leu Ala Pro Asn Leu Lys Glu Ser Asp
65 70 75 80
Ser Asp Arg Tyr Thr Met Val Leu Glu Ile Met Asp Cys Ile His Leu
85 90 95
Cys Leu Ile Met Val Asp Asp Ile Thr Asp Asp Ser Asp Tyr Arg Lys
100 105 110
Gly Arg Pro Ala Ala His Ile Ile Tyr Gly Arg Ser Glu Thr Ala Asn
115 120 125
Arg Ala Tyr Leu Arg Val Ser Gln Ile Ile Asn Lys Thr Thr Gln Asp
130 135 140
Phe Pro Arg Leu Ala Pro Trp Val Thr Gln Ser Leu Ala Glu Ile Leu
145 150 155 160
Glu Gly Gln Asp Ile Ser Leu Val Trp Arg Arg Asp Gly Leu Thr Ser
165 170 175
Phe Pro Lys Ala His Asp Glu Arg Val Ile Ala Tyr Arg Cys Met Ser
180 185 190
Ser Leu Lys Thr Gly Ala Leu Phe Arg Leu Leu Gly Arg Leu Val Leu
195 200 205
Glu Asn Arg Ser Met Asp Asp Thr Leu Ser Gln Val Gly Tyr Tyr Ser
210 215 220
Gln Leu Gln Asn Asp Cys Lys Asn Val Phe Ser Ser Glu Tyr Ala Lys
225 230 235 240
Ala Lys Gly Thr Leu Ala Glu Asp Leu Arg Asn Arg Glu Leu Thr Tyr
245 250 255
Pro Ile Ile Leu Ala Leu Asn Glu Pro Glu Gly Phe Tyr Ile Glu Lys
260 265 270
Ala Phe Glu Ser Gly Ser Pro Arg Asp Ile Gln Asn Ala Ile Gly Val
275 280 285
Ile Gln Ser Glu Asn Val Tyr Arg Ala Cys Leu Asp Glu Leu Lys Gln
290 295 300
Tyr Glu Ser Asn Val Arg Glu Trp Val Thr Leu Trp Gly Arg Lys Glu
305 310 315 320
Lys Leu Asp Leu Thr His
325
<210> 25
<211> 1439
<212> DNA
<213> Hypoxylon pulicicidum
<400> 25
ttaagagatg ttggtggcga cgtactcctt tccaccacga attgctttga cgaccttgtc 60
atattcctcg taggcatgct cctggctgtt gtgctctgaa acccagtccc taagtggcac 120
ttctgggtac atgttgatgc cctggtccgg ctgttccacg ttgtgctgaa gagctgaagc 180
tcgtggcttt cttttcggga gggaaagaaa tatgagttag ctaccgtacg tatctacgat 240
gttcttattg ttgttagact gctttacgta cctgattttc tcagccacac ggagcgcgag 300
agggacgttc ccctttcctg cgagctcgag gcagattgcc acgactgcgg catcctcaat 360
gacaagagac tccccaatgg gagagtttag ggcggaaggg tgcgaagcgt cgccaatgag 420
aatcatgcgg ccctgaggag agacccatga tggaagctgt cccagctgaa gaacgggttc 480
atcaacaagg cttccagatg gcgcggcctg gacgaccgct tcgatgttgg ctttgaacgg 540
ccatgattgg atgggcttga ggaagtcttg tgcggtagca ggagttgatg acgtcttggc 600
tgagttagga gattcctaga agatactata agcaggtgct cgtccaacat gtacctcaag 660
aatacatacc accttgtaca tgttactaaa tgctacgttg cgaccacccc cacaagtgac 720
gatggtgaga caggcagttg gaccaggcac aaatatcatc tggtctactt cacccgctcc 780
ttggaggatc cattgggcgt ctgggtttcc ttttaggcta gcgatatcag ccctaccccg 840
gatgtgtgcg tatccgctgt gggttggctt gaggctggag cctgcgacgg agtctcggcc 900
tttgctgttc acaccatctg cccagatgat gcagtctgcc tgcagcttct ggccattggc 960
agagacgccg gcctgatcgc tctcctccca gtaatcagag atctcagttc cgaaccgcat 1020
gtcgattcca agagtcttcg catgatcgta aacgatcttg gtcagctccc gtcggaggat 1080
caggtacttg ttgctcgatg gtttccgaac ttcaatggtc tgaacctgct ttccggtggt 1140
gtcatacaca gatgcttggg tgttattaaa cttccaagca ttcaaggcct gacccacagc 1200
tccgttgccc catttagaga caatcacacc cgcattgttg tcaatcatga cggtgtcatc 1260
tattatccta gtcattaaat tgctcttgat agtgtgagtg tatacttacc gacgtaattg 1320
agatccttgg accgttccag tgcaatgaca gaatgcccct tttggtgaca ttctatcgct 1380
gtggtaagac cagccaagcc aagtccaacc acaattacac taacaccggt tgaagccat 1439
<210> 26
<211> 1296
<212> DNA
<213> Hypoxylon pulicicidum
<400> 26
ttaagagatg ttggtggcga cgtactcctt tccaccacga attgctttga cgaccttgtc 60
atattcctcg taggcatgct cctggctgtt gtgctctgaa acccagtccc taagtggcac 120
ttctgggtac atgttgatgc cctggtccgg ctgttccacg ttgtgctgaa gagctgaagc 180
tcgtgggatg ttcttattgt tgttagactg ctttacgtac ctgattttct cagccacacg 240
gagcgcgaga gggacgttcc cctttcctgc gagctcgagg cagattgcca cgactgcggc 300
atcctcaatg acaagagact ccccaatggg agagtttagg gcggaagggt gcgaagcgtc 360
gccaatgaga atcatgcggc cctgaggaga gacccatgat ggaagctgtc ccagctgaag 420
aacgggttca tcaacaaggc ttccagatgg cgcggcctgg acgaccgctt cgatgttggc 480
tttgaacggc catgattgga tgggcttgag gaagtcttgt gcggtagcag gagttgatga 540
cgtcttggct gagttaggag attccacctt gtacatgtta ctaaatgcta cgttgcgacc 600
acccccacaa gtgacgatgg tgagacaggc agttggacca ggcacaaata tcatctggtc 660
tacttcaccc gctccttgga ggatccattg ggcgtctggg tttcctttta ggctagcgat 720
atcagcccta ccccggatgt gtgcgtatcc gctgtgggtt ggcttgaggc tggagcctgc 780
gacggagtct cggcctttgc tgttcacacc atctgcccag atgatgcagt ctgcctgcag 840
cttctggcca ttggcagaga cgccggcctg atcgctctcc tcccagtaat cagagatctc 900
agttccgaac cgcatgtcga ttccaagagt cttcgcatga tcgtaaacga tcttggtcag 960
ctcccgtcgg aggatcaggt acttgttgct cgatggtttc cgaacttcaa tggtctgaac 1020
ctgctttccg gtggtgtcat acacagatgc ttgggtgtta ttaaacttcc aagcattcaa 1080
ggcctgaccc acagctccgt tgccccattt agagacaatc acacccgcat tgttgtcaat 1140
catgacggtg tcatctatta tcttaccgac gtaattgaga tccttggacc gttccagtgc 1200
aatgacagaa tgcccctttt ggtgacattc tatcgctgtg gtaagaccag ccaagccaag 1260
tccaaccaca attacactaa caccggttga agccat 1296
<210> 27
<211> 431
<212> PRT
<213> Hypoxylon pulicicidum
<400> 27
Met Ala Ser Thr Gly Val Ser Val Ile Val Val Gly Leu Gly Leu Ala
1 5 10 15
Gly Leu Thr Thr Ala Ile Glu Cys His Gln Lys Gly His Ser Val Ile
20 25 30
Ala Leu Glu Arg Ser Lys Asp Leu Asn Tyr Val Gly Lys Ile Ile Asp
35 40 45
Asp Thr Val Met Ile Asp Asn Asn Ala Gly Val Ile Val Ser Lys Trp
50 55 60
Gly Asn Gly Ala Val Gly Gln Ala Leu Asn Ala Trp Lys Phe Asn Asn
65 70 75 80
Thr Gln Ala Ser Val Tyr Asp Thr Thr Gly Lys Gln Val Gln Thr Ile
85 90 95
Glu Val Arg Lys Pro Ser Ser Asn Lys Tyr Leu Ile Leu Arg Arg Glu
100 105 110
Leu Thr Lys Ile Val Tyr Asp His Ala Lys Thr Leu Gly Ile Asp Met
115 120 125
Arg Phe Gly Thr Glu Ile Ser Asp Tyr Trp Glu Glu Ser Asp Gln Ala
130 135 140
Gly Val Ser Ala Asn Gly Gln Lys Leu Gln Ala Asp Cys Ile Ile Trp
145 150 155 160
Ala Asp Gly Val Asn Ser Lys Gly Arg Asp Ser Val Ala Gly Ser Ser
165 170 175
Leu Lys Pro Thr His Ser Gly Tyr Ala His Ile Arg Gly Arg Ala Asp
180 185 190
Ile Ala Ser Leu Lys Gly Asn Pro Asp Ala Gln Trp Ile Leu Gln Gly
195 200 205
Ala Gly Glu Val Asp Gln Met Ile Phe Val Pro Gly Pro Thr Ala Cys
210 215 220
Leu Thr Ile Val Thr Cys Gly Gly Gly Arg Asn Val Ala Phe Ser Asn
225 230 235 240
Met Tyr Lys Val Glu Ser Pro Asn Ser Ala Lys Thr Ser Ser Thr Pro
245 250 255
Ala Thr Ala Gln Asp Phe Leu Lys Pro Ile Gln Ser Trp Pro Phe Lys
260 265 270
Ala Asn Ile Glu Ala Val Val Gln Ala Ala Pro Ser Gly Ser Leu Val
275 280 285
Asp Glu Pro Val Leu Gln Leu Gly Gln Leu Pro Ser Trp Val Ser Pro
290 295 300
Gln Gly Arg Met Ile Leu Ile Gly Asp Ala Ser His Pro Ser Ala Leu
305 310 315 320
Asn Ser Pro Ile Gly Glu Ser Leu Val Ile Glu Asp Ala Ala Val Val
325 330 335
Ala Ile Cys Leu Glu Leu Ala Gly Lys Gly Asn Val Pro Leu Ala Leu
340 345 350
Arg Val Ala Glu Lys Ile Arg Tyr Val Lys Gln Ser Asn Asn Asn Lys
355 360 365
Asn Ile Pro Arg Ala Ser Ala Leu Gln His Asn Val Glu Gln Pro Asp
370 375 380
Gln Gly Ile Asn Met Tyr Pro Glu Val Pro Leu Arg Asp Trp Val Ser
385 390 395 400
Glu His Asn Ser Gln Glu His Ala Tyr Glu Glu Tyr Asp Lys Val Val
405 410 415
Lys Ala Ile Arg Gly Gly Lys Glu Tyr Val Ala Thr Asn Ile Ser
420 425 430
<210> 28
<211> 1372
<212> DNA
<213> Hypoxylon pulicicidum
<400> 28
atggactcta ccgggagaca gcctctcagc caggacgggc agccatggca agctcttgcc 60
tctggcttgg gatttccaga tgaagaccag aagtattggt ggtcagtcat ggcgccccta 120
ttaggggaac tgatgaaatg ggccaactat cctgttgata aacagtatct tgttcttgcg 180
ttctgccatg aatacatact tccattttgc ggacctcgtc caacggccga aggcggtatc 240
ttctggccca cgttgatcac caaggatggt actccgttcg agccgagcct taacttctac 300
aaaaataaag ccactctacg agttggatat gcgcctgcat gcgagctttc aggaagcaat 360
gacgacccta tcaatcaacg agccccaatt gcggcattgg agcaccaaaa gagagtccta 420
ccacagcaga atctcaaatg ggtggataat ttcaagaaag catggttcat cgataatgac 480
gacgcagtag ccttgaaggc acgcgtacat aacgagctct ttgaacaggc agccgtccaa 540
tgcttgatag gttatgtgtt ttccgactac acgcaggtca aggttgccat gagtcctctt 600
tggaagtcag tccagacagg ccagcaaatt tcgcgagtga tctgggacac ctttcgccag 660
cttggagacg atgcttccag ttacctagat tgcctatcag tgctagagga gtatactgag 720
tctaaacagg ccaaactagc acaagtacag ccttccttcg tcaatttcga tgtgaatctg 780
aagggggact accagcagtc gcgacttaag gtatactatg ctacaccatg cactgcattc 840
gacacgatgg tccaggtttt cactttgggc ggaaggctca agggccctga agttgaccat 900
gcgattgaat gccttcgtgt cctatggccc agcgtgcttg cagttcctga aaaccatccg 960
gacgaccaag acttgcctcg acggtaccac tctgtagcag tgacccagtt taacttcgag 1020
ctctggccgg gagcgaaact gcctgttccc cagatctatc tcccgactaa cttttacggt 1080
cgtgatgaat tggaaattgc ggagggccta gagggatttt tcaagactct tggctggagt 1140
gagcctttcc atgcctataa acagaattac attgcaacat ggttagtcta tcgcctttct 1200
ctcgctcatt gccctgatcc aatgaagtat tttactcaca cgatgtagtg ccacgcccga 1260
agggaaatgg aaagcgatcc aacacgacgt atcattctcg ttcaaggact caagcccata 1320
tgtgtcggtt tattataaac cagagctctc ggtcctatcc tcaccgtcgt ag 1372
<210> 29
<211> 1305
<212> DNA
<213> Hypoxylon pulicicidum
<400> 29
atggactcta ccgggagaca gcctctcagc caggacgggc agccatggca agctcttgcc 60
tctggcttgg gatttccaga tgaagaccag aagtattggt ggtcagtcat ggcgccccta 120
ttaggggaac tgatgaaatg ggccaactat cctgttgata aacagtatct tgttcttgcg 180
ttctgccatg aatacatact tccattttgc ggacctcgtc caacggccga aggcggtatc 240
ttctggccca cgttgatcac caaggatggt actccgttcg agccgagcct taacttctac 300
aaaaataaag ccactctacg agttggatat gcgcctgcat gcgagctttc aggaagcaat 360
gacgacccta tcaatcaacg agccccaatt gcggcattgg agcaccaaaa gagagtccta 420
ccacagcaga atctcaaatg ggtggataat ttcaagaaag catggttcat cgataatgac 480
gacgcagtag ccttgaaggc acgcgtacat aacgagctct ttgaacaggc agccgtccaa 540
tgcttgatag gttatgtgtt ttccgactac acgcaggtca aggttgccat gagtcctctt 600
tggaagtcag tccagacagg ccagcaaatt tcgcgagtga tctgggacac ctttcgccag 660
cttggagacg atgcttccag ttacctagat tgcctatcag tgctagagga gtatactgag 720
tctaaacagg ccaaactagc acaagtacag ccttccttcg tcaatttcga tgtgaatctg 780
aagggggact accagcagtc gcgacttaag gtatactatg ctacaccatg cactgcattc 840
gacacgatgg tccaggtttt cactttgggc ggaaggctca agggccctga agttgaccat 900
gcgattgaat gccttcgtgt cctatggccc agcgtgcttg cagttcctga aaaccatccg 960
gacgaccaag acttgcctcg acggtaccac tctgtagcag tgacccagtt taacttcgag 1020
ctctggccgg gagcgaaact gcctgttccc cagatctatc tcccgactaa cttttacggt 1080
cgtgatgaat tggaaattgc ggagggccta gagggatttt tcaagactct tggctggagt 1140
gagcctttcc atgcctataa acagaattac attgcaacat gtgccacgcc cgaagggaaa 1200
tggaaagcga tccaacacga cgtatcattc tcgttcaagg actcaagccc atatgtgtcg 1260
gtttattata aaccagagct ctcggtccta tcctcaccgt cgtag 1305
<210> 30
<211> 434
<212> PRT
<213> Hypoxylon pulicicidum
<400> 30
Met Asp Ser Thr Gly Arg Gln Pro Leu Ser Gln Asp Gly Gln Pro Trp
1 5 10 15
Gln Ala Leu Ala Ser Gly Leu Gly Phe Pro Asp Glu Asp Gln Lys Tyr
20 25 30
Trp Trp Ser Val Met Ala Pro Leu Leu Gly Glu Leu Met Lys Trp Ala
35 40 45
Asn Tyr Pro Val Asp Lys Gln Tyr Leu Val Leu Ala Phe Cys His Glu
50 55 60
Tyr Ile Leu Pro Phe Cys Gly Pro Arg Pro Thr Ala Glu Gly Gly Ile
65 70 75 80
Phe Trp Pro Thr Leu Ile Thr Lys Asp Gly Thr Pro Phe Glu Pro Ser
85 90 95
Leu Asn Phe Tyr Lys Asn Lys Ala Thr Leu Arg Val Gly Tyr Ala Pro
100 105 110
Ala Cys Glu Leu Ser Gly Ser Asn Asp Asp Pro Ile Asn Gln Arg Ala
115 120 125
Pro Ile Ala Ala Leu Glu His Gln Lys Arg Val Leu Pro Gln Gln Asn
130 135 140
Leu Lys Trp Val Asp Asn Phe Lys Lys Ala Trp Phe Ile Asp Asn Asp
145 150 155 160
Asp Ala Val Ala Leu Lys Ala Arg Val His Asn Glu Leu Phe Glu Gln
165 170 175
Ala Ala Val Gln Cys Leu Ile Gly Tyr Val Phe Ser Asp Tyr Thr Gln
180 185 190
Val Lys Val Ala Met Ser Pro Leu Trp Lys Ser Val Gln Thr Gly Gln
195 200 205
Gln Ile Ser Arg Val Ile Trp Asp Thr Phe Arg Gln Leu Gly Asp Asp
210 215 220
Ala Ser Ser Tyr Leu Asp Cys Leu Ser Val Leu Glu Glu Tyr Thr Glu
225 230 235 240
Ser Lys Gln Ala Lys Leu Ala Gln Val Gln Pro Ser Phe Val Asn Phe
245 250 255
Asp Val Asn Leu Lys Gly Asp Tyr Gln Gln Ser Arg Leu Lys Val Tyr
260 265 270
Tyr Ala Thr Pro Cys Thr Ala Phe Asp Thr Met Val Gln Val Phe Thr
275 280 285
Leu Gly Gly Arg Leu Lys Gly Pro Glu Val Asp His Ala Ile Glu Cys
290 295 300
Leu Arg Val Leu Trp Pro Ser Val Leu Ala Val Pro Glu Asn His Pro
305 310 315 320
Asp Asp Gln Asp Leu Pro Arg Arg Tyr His Ser Val Ala Val Thr Gln
325 330 335
Phe Asn Phe Glu Leu Trp Pro Gly Ala Lys Leu Pro Val Pro Gln Ile
340 345 350
Tyr Leu Pro Thr Asn Phe Tyr Gly Arg Asp Glu Leu Glu Ile Ala Glu
355 360 365
Gly Leu Glu Gly Phe Phe Lys Thr Leu Gly Trp Ser Glu Pro Phe His
370 375 380
Ala Tyr Lys Gln Asn Tyr Ile Ala Thr Cys Ala Thr Pro Glu Gly Lys
385 390 395 400
Trp Lys Ala Ile Gln His Asp Val Ser Phe Ser Phe Lys Asp Ser Ser
405 410 415
Pro Tyr Val Ser Val Tyr Tyr Lys Pro Glu Leu Ser Val Leu Ser Ser
420 425 430
Pro Ser
<210> 31
<211> 1354
<212> DNA
<213> Hypoxylon pulicicidum
<400> 31
atggatgctg cttcaactct tacgcatgca ccggtatctc agccatggca gtccctagct 60
caagggttgg ggttcgtcaa tgagcatgaa gggtactggt ggtctaagct tggacctcct 120
ctcggtaaaa tgatgaactg ggctcgatac tcgacatcgg aacagtacag agtcctagca 180
ttcctttaca aatatcttct ccctgcctgc ggcccaaagc ctggtgatga tggtgagctg 240
ttctggaagg ttttcatcag ctatgattac acgcccattc agctcagtct caattttcac 300
aatggcaaaa tgacgctgcg caccgcgaac ataccaatta gcgataaatc gggaaccgca 360
gacgacccaa tcaaccaaca agcttcggta gacgccataa tccgccagga acgagtgttg 420
ccatcccagg atctacgttg gttcaaccac tttgcatccc agtacttctt cgacaaggac 480
acggcagcct ctctaaagac caaggtcgat aagctccgag tccagcaggg agttcagtgt 540
atgctgagcc acgactttcc tgagcgtgat gtccaatgca aagtggcttt ctgcccgctt 600
tggaaagccg tcgctacagg tctttccaac aaggagatca tctgggattc gattctaggg 660
ctcggagatg acatcatccc atacaagcga gcgcttgctg tccttgaaca gtacacatcg 720
tccgaaaatg cagcgaaagc aggagtgcga cctgtattct tcgctttcga tacggtgtta 780
aaagataatt acaagagctc tcgtatcaag atctactacc tcacaacacg gacagccttc 840
aactctatgg tcgacatcta cacacttgga ggcctgctaa aagggcctga tatccaaaaa 900
ggagtagagg cccttgaagt gctctggaaa gccgtcctca acgtccccga ggggtggccc 960
gatgataaag atctacccat gaatccacac cgttgtgcgg cagtaatctt caattttgag 1020
ctgtggccag gagcagagtt tccgagtccc aaggcctatc tcccagccca ttattatggc 1080
cggcctgatt tggagatagc tgatggtatg gactacttct tcaagcagca agggttggat 1140
ggggtatatg gttcttacaa ggagaactat ttgaagtgct tgtacgacct cctcacctca 1200
ctcacatcta ccaagctatg gctaatagat cagaagtacg aactcacaga accaactcac 1260
agccctccac catgatattt ctttttcatt caaagggtcc aatgcctacg ttacggtgta 1320
ctacaagccc gagctatctc tagataccga gtag 1354
<210> 32
<211> 1302
<212> DNA
<213> Hypoxylon pulicicidum
<400> 32
atggatgctg cttcaactct tacgcatgca ccggtatctc agccatggca gtccctagct 60
caagggttgg ggttcgtcaa tgagcatgaa gggtactggt ggtctaagct tggacctcct 120
ctcggtaaaa tgatgaactg ggctcgatac tcgacatcgg aacagtacag agtcctagca 180
ttcctttaca aatatcttct ccctgcctgc ggcccaaagc ctggtgatga tggtgagctg 240
ttctggaagg ttttcatcag ctatgattac acgcccattc agctcagtct caattttcac 300
aatggcaaaa tgacgctgcg caccgcgaac ataccaatta gcgataaatc gggaaccgca 360
gacgacccaa tcaaccaaca agcttcggta gacgccataa tccgccagga acgagtgttg 420
ccatcccagg atctacgttg gttcaaccac tttgcatccc agtacttctt cgacaaggac 480
acggcagcct ctctaaagac caaggtcgat aagctccgag tccagcaggg agttcagtgt 540
atgctgagcc acgactttcc tgagcgtgat gtccaatgca aagtggcttt ctgcccgctt 600
tggaaagccg tcgctacagg tctttccaac aaggagatca tctgggattc gattctaggg 660
ctcggagatg acatcatccc atacaagcga gcgcttgctg tccttgaaca gtacacatcg 720
tccgaaaatg cagcgaaagc aggagtgcga cctgtattct tcgctttcga tacggtgtta 780
aaagataatt acaagagctc tcgtatcaag atctactacc tcacaacacg gacagccttc 840
aactctatgg tcgacatcta cacacttgga ggcctgctaa aagggcctga tatccaaaaa 900
ggagtagagg cccttgaagt gctctggaaa gccgtcctca acgtccccga ggggtggccc 960
gatgataaag atctacccat gaatccacac cgttgtgcgg cagtaatctt caattttgag 1020
ctgtggccag gagcagagtt tccgagtccc aaggcctatc tcccagccca ttattatggc 1080
cggcctgatt tggagatagc tgatggtatg gactacttct tcaagcagca agggttggat 1140
ggggtatatg gttcttacaa ggagaactat ttgaagtgct taagtacgaa ctcacagaac 1200
caactcacag ccctccacca tgatatttct ttttcattca aagggtccaa tgcctacgtt 1260
acggtgtact acaagcccga gctatctcta gataccgagt ag 1302
<210> 33
<211> 433
<212> PRT
<213> Hypoxylon pulicicidum
<400> 33
Met Asp Ala Ala Ser Thr Leu Thr His Ala Pro Val Ser Gln Pro Trp
1 5 10 15
Gln Ser Leu Ala Gln Gly Leu Gly Phe Val Asn Glu His Glu Gly Tyr
20 25 30
Trp Trp Ser Lys Leu Gly Pro Pro Leu Gly Lys Met Met Asn Trp Ala
35 40 45
Arg Tyr Ser Thr Ser Glu Gln Tyr Arg Val Leu Ala Phe Leu Tyr Lys
50 55 60
Tyr Leu Leu Pro Ala Cys Gly Pro Lys Pro Gly Asp Asp Gly Glu Leu
65 70 75 80
Phe Trp Lys Val Phe Ile Ser Tyr Asp Tyr Thr Pro Ile Gln Leu Ser
85 90 95
Leu Asn Phe His Asn Gly Lys Met Thr Leu Arg Thr Ala Asn Ile Pro
100 105 110
Ile Ser Asp Lys Ser Gly Thr Ala Asp Asp Pro Ile Asn Gln Gln Ala
115 120 125
Ser Val Asp Ala Ile Ile Arg Gln Glu Arg Val Leu Pro Ser Gln Asp
130 135 140
Leu Arg Trp Phe Asn His Phe Ala Ser Gln Tyr Phe Phe Asp Lys Asp
145 150 155 160
Thr Ala Ala Ser Leu Lys Thr Lys Val Asp Lys Leu Arg Val Gln Gln
165 170 175
Gly Val Gln Cys Met Leu Ser His Asp Phe Pro Glu Arg Asp Val Gln
180 185 190
Cys Lys Val Ala Phe Cys Pro Leu Trp Lys Ala Val Ala Thr Gly Leu
195 200 205
Ser Asn Lys Glu Ile Ile Trp Asp Ser Ile Leu Gly Leu Gly Asp Asp
210 215 220
Ile Ile Pro Tyr Lys Arg Ala Leu Ala Val Leu Glu Gln Tyr Thr Ser
225 230 235 240
Ser Glu Asn Ala Ala Lys Ala Gly Val Arg Pro Val Phe Phe Ala Phe
245 250 255
Asp Thr Val Leu Lys Asp Asn Tyr Lys Ser Ser Arg Ile Lys Ile Tyr
260 265 270
Tyr Leu Thr Thr Arg Thr Ala Phe Asn Ser Met Val Asp Ile Tyr Thr
275 280 285
Leu Gly Gly Leu Leu Lys Gly Pro Asp Ile Gln Lys Gly Val Glu Ala
290 295 300
Leu Glu Val Leu Trp Lys Ala Val Leu Asn Val Pro Glu Gly Trp Pro
305 310 315 320
Asp Asp Lys Asp Leu Pro Met Asn Pro His Arg Cys Ala Ala Val Ile
325 330 335
Phe Asn Phe Glu Leu Trp Pro Gly Ala Glu Phe Pro Ser Pro Lys Ala
340 345 350
Tyr Leu Pro Ala His Tyr Tyr Gly Arg Pro Asp Leu Glu Ile Ala Asp
355 360 365
Gly Met Asp Tyr Phe Phe Lys Gln Gln Gly Leu Asp Gly Val Tyr Gly
370 375 380
Ser Tyr Lys Glu Asn Tyr Leu Lys Cys Leu Ser Thr Asn Ser Gln Asn
385 390 395 400
Gln Leu Thr Ala Leu His His Asp Ile Ser Phe Ser Phe Lys Gly Ser
405 410 415
Asn Ala Tyr Val Thr Val Tyr Tyr Lys Pro Glu Leu Ser Leu Asp Thr
420 425 430
Glu
<210> 34
<211> 1562
<212> DNA
<213> Hypoxylon pulicicidum
<400> 34
atggcgcctg atagacttgg tcccgagggc acagcacgcc ccaattccag tggcatctca 60
gttatcgtgg tcggccttgg aattgctggc ctaacagctg caattgagtg ccaccggaag 120
ggccattcag tcattgcctt cgagcgaatg aaggatgtcg aaccctttgg tgagtttggc 180
ttcgaatccc catattggtt actccgccaa cctagtaaag gcgatagcat catcatcggc 240
agcaacggcg gccgtatttt cggcaaatgg ggccgcggtg aggtacgcaa tgctatgcaa 300
gcctggcgat atacgcctac ccatgccgac atttacgata ccgccggaag attcatggcc 360
cagtctgaga ttcccaaagc tgcggatgac atgtacttca ctcttcgagg cagactagcg 420
aagaccttct acgaacacgc acaaagcctc ggcattgata tgaggatggg gtcgaaagtg 480
actgaatttt gggaagacag caatcgggct ggaatcgttg tggaaggaga gaggtttgag 540
gccgactgtg ttatttgcgc tgatggcata cacagcaagt ctcgctcctt gttcacttct 600
ctaaacgctc aaccatttcg ttctggtttc tctattttca gggggaaagc ggacgctaat 660
gcgattattg ccgatcccga tgcgaaatgg atccttgacc agacagagaa caccgatcag 720
ttcaaagtgt ttctggggaa ggagatctgt gttgtcataa ttacctgcgg gctaggccgt 780
gcagtggtct gcagtgctat gcatagggtg agcaatacct atctcccaga taccaataat 840
atatagcagg taggctttgg actatatctt cctgttctgc tcacacaaga ctgccccagg 900
acctaaatga agcggaacag tcgtggtcga cccatgccaa cccggatgat ctattggacg 960
ccatcaaaga ctggccgtgc aggcgccaga tcgaaccaat cgttcggaag atatccgaag 1020
accagttcat cgactatccc cttctaactg tgtctccact ggacacgtgg gtatcccagc 1080
acgggcggat gattctaata ggagatgctg ctcatccatt ctttccgact tccggacaag 1140
gaggcgcaca agccatggag gatgcagctg tgcttgcaat ttgcctcgag ttggcaggga 1200
aaggaaacat ccccctggct cttcatgcaa cagaaaagat caggtctagt ttcccggccc 1260
ttcgggctac tctccctttc cattttatcc gttttcctta ctttcgctaa taccacgtaa 1320
cttccagaaa gagccgagct tcagtcctcc aactaaacag gacgtattca gaaggggttc 1380
aactagcacc tgcgctgccg aaatccaaag acagtatgtc tgttccaaat gttccagtaa 1440
tggattggat ctggcatcac tgctgccagt cctacgcata tgatgagttc gacaaggtag 1500
cggaggcgat tcaaagcggg agtgaataca ttccacataa tcttccagaa gatggtacgt 1560
ag 1562
<210> 35
<211> 1386
<212> DNA
<213> Hypoxylon pulicicidum
<400> 35
atggcgcctg atagacttgg tcccgagggc acagcacgcc ccaattccag tggcatctca 60
gttatcgtgg tcggccttgg aattgctggc ctaacagctg caattgagtg ccaccggaag 120
ggccattcag tcattgcctt cgagcgaatg aaggatgtcg aaccctttgg tgagtttggc 180
ttcgaatccc catattggtt actccgccaa cctagtaaag gcgatagcat catcatcggc 240
agcaacggcg gccgtatttt cggcaaatgg ggccgcggtg aggtacgcaa tgctatgcaa 300
gcctggcgat atacgcctac ccatgccgac atttacgata ccgccggaag attcatggcc 360
cagtctgaga ttcccaaagc tgcggatgac atgtacttca ctcttcgagg cagactagcg 420
aagaccttct acgaacacgc acaaagcctc ggcattgata tgaggatggg gtcgaaagtg 480
actgaatttt gggaagacag caatcgggct ggaatcgttg tggaaggaga gaggtttgag 540
gccgactgtg ttatttgcgc tgatggcata cacagcaagt ctcgctcctt gttcacttct 600
ctaaacgctc aaccatttcg ttctggtttc tctattttca gggggaaagc ggacgctaat 660
gcgattattg ccgatcccga tgcgaaatgg atccttgacc agacagagaa caccgatcag 720
ttcaaagtgt ttctggggaa ggagatctgt gttgtcataa ttacctgcgg gctaggccgt 780
gcagtggtct gcagtgctat gcatagggac ctaaatgaag cggaacagtc gtggtcgacc 840
catgccaacc cggatgatct attggacgcc atcaaagact ggccgtgcag gcgccagatc 900
gaaccaatcg ttcggaagat atccgaagac cagttcatcg actatcccct tctaactgtg 960
tctccactgg acacgtgggt atcccagcac gggcggatga ttctaatagg agatgctgct 1020
catccattct ttccgacttc cggacaagga ggcgcacaag ccatggagga tgcagctgtg 1080
cttgcaattt gcctcgagtt ggcagggaaa ggaaacatcc ccctggctct tcatgcaaca 1140
gaaaagatca gaaagagccg agcttcagtc ctccaactaa acaggacgta ttcagaaggg 1200
gttcaactag cacctgcgct gccgaaatcc aaagacagta tgtctgttcc aaatgttcca 1260
gtaatggatt ggatctggca tcactgctgc cagtcctacg catatgatga gttcgacaag 1320
gtagcggagg cgattcaaag cgggagtgaa tacattccac ataatcttcc agaagatggt 1380
acgtag 1386
<210> 36
<211> 461
<212> PRT
<213> Hypoxylon pulicicidum
<400> 36
Met Ala Pro Asp Arg Leu Gly Pro Glu Gly Thr Ala Arg Pro Asn Ser
1 5 10 15
Ser Gly Ile Ser Val Ile Val Val Gly Leu Gly Ile Ala Gly Leu Thr
20 25 30
Ala Ala Ile Glu Cys His Arg Lys Gly His Ser Val Ile Ala Phe Glu
35 40 45
Arg Met Lys Asp Val Glu Pro Phe Gly Glu Phe Gly Phe Glu Ser Pro
50 55 60
Tyr Trp Leu Leu Arg Gln Pro Ser Lys Gly Asp Ser Ile Ile Ile Gly
65 70 75 80
Ser Asn Gly Gly Arg Ile Phe Gly Lys Trp Gly Arg Gly Glu Val Arg
85 90 95
Asn Ala Met Gln Ala Trp Arg Tyr Thr Pro Thr His Ala Asp Ile Tyr
100 105 110
Asp Thr Ala Gly Arg Phe Met Ala Gln Ser Glu Ile Pro Lys Ala Ala
115 120 125
Asp Asp Met Tyr Phe Thr Leu Arg Gly Arg Leu Ala Lys Thr Phe Tyr
130 135 140
Glu His Ala Gln Ser Leu Gly Ile Asp Met Arg Met Gly Ser Lys Val
145 150 155 160
Thr Glu Phe Trp Glu Asp Ser Asn Arg Ala Gly Ile Val Val Glu Gly
165 170 175
Glu Arg Phe Glu Ala Asp Cys Val Ile Cys Ala Asp Gly Ile His Ser
180 185 190
Lys Ser Arg Ser Leu Phe Thr Ser Leu Asn Ala Gln Pro Phe Arg Ser
195 200 205
Gly Phe Ser Ile Phe Arg Gly Lys Ala Asp Ala Asn Ala Ile Ile Ala
210 215 220
Asp Pro Asp Ala Lys Trp Ile Leu Asp Gln Thr Glu Asn Thr Asp Gln
225 230 235 240
Phe Lys Val Phe Leu Gly Lys Glu Ile Cys Val Val Ile Ile Thr Cys
245 250 255
Gly Leu Gly Arg Ala Val Val Cys Ser Ala Met His Arg Asp Leu Asn
260 265 270
Glu Ala Glu Gln Ser Trp Ser Thr His Ala Asn Pro Asp Asp Leu Leu
275 280 285
Asp Ala Ile Lys Asp Trp Pro Cys Arg Arg Gln Ile Glu Pro Ile Val
290 295 300
Arg Lys Ile Ser Glu Asp Gln Phe Ile Asp Tyr Pro Leu Leu Thr Val
305 310 315 320
Ser Pro Leu Asp Thr Trp Val Ser Gln His Gly Arg Met Ile Leu Ile
325 330 335
Gly Asp Ala Ala His Pro Phe Phe Pro Thr Ser Gly Gln Gly Gly Ala
340 345 350
Gln Ala Met Glu Asp Ala Ala Val Leu Ala Ile Cys Leu Glu Leu Ala
355 360 365
Gly Lys Gly Asn Ile Pro Leu Ala Leu His Ala Thr Glu Lys Ile Arg
370 375 380
Lys Ser Arg Ala Ser Val Leu Gln Leu Asn Arg Thr Tyr Ser Glu Gly
385 390 395 400
Val Gln Leu Ala Pro Ala Leu Pro Lys Ser Lys Asp Ser Met Ser Val
405 410 415
Pro Asn Val Pro Val Met Asp Trp Ile Trp His His Cys Cys Gln Ser
420 425 430
Tyr Ala Tyr Asp Glu Phe Asp Lys Val Ala Glu Ala Ile Gln Ser Gly
435 440 445
Ser Glu Tyr Ile Pro His Asn Leu Pro Glu Asp Gly Thr
450 455 460
<210> 37
<211> 1844
<212> DNA
<213> Hypoxylon pulicicidum
<400> 37
atgataacag catccacttc cgtgtttggt ggcttaatcc ttgcctttat cttctcactt 60
ttatataaga ataagaagac ccgtatccca gcagaaatcg accgcgtaag gacgggaggt 120
ttcctagcac acattagagc ctttgggtgc aggttaggta cgcgagttga tgatattcgc 180
aatggatata ataaggttag ttgctcctat agctgctcac aacaaatact caacacatga 240
tatctcaata cgcagttcaa caaaaacggt aagccgtttg tgatccagga ttctaccttt 300
atcccacagg tcgtcatacc acctcaatac ctgggatggt tgaaggagca accagagaag 360
gctctttctg cagaaaccgt gaggctagaa cagcttggac ttcgctattt ggtccctagc 420
tcagatcccg agatggtcca tttgttgaca gacgtcgtgt gtcgctatct tacccgcaat 480
tttcaaagag tacaagagcg tttatatgag gagctccata tgagtacgga tgaaatcatg 540
gggctggagg caactgagtg gcgtcagatt tgtctccatg aagcgatgga aacgattctt 600
cgaaggatga ttagttgcgt cctgattggt ctcccatggt gtcgagatga ggaatgctta 660
aaatcgtgga ccggatttct tcactgcatg gccattgcag gaactattct aggggcagta 720
acaccttggt tcctacggcc actcctcgga ctactgctca agccgcccgt tggctatatg 780
cgcagaagat cactgcgtta tcttactccg atctttactg aaagatggaa aaaaattgag 840
aagcatgaga agagctcact gacgacgcgt gagctgccgg atgacttcgt aacatggtgt 900
attcaggagg tacggaatgg taatatgaaa gaaaaacacg atgctcttag ccttgcgtcg 960
gaatttctat tctttgtgag tcactctacg cgttggtatc atggtttccc atattcaata 1020
cgcgatgcga tggatcgagg ctctaacgag aacgcagtcg atcgcattct ttgacgcgcc 1080
tataggagct gcagaagtca ccatgctcga tcttctaagt gcggatccca caataggtta 1140
ctgggaaaag cttgtggaag aagccactac tgcattcaga acagacgagg actggattca 1200
tgcaggcact gtgtcaaaat tggcatacac ggacagcgca atcagggagt ctctacgccg 1260
aaaccctttc agcatccgaa acgtgacccg agaggtgata ggaaaagatg ggctaacact 1320
gccatccggt acgcgtctgc cacagggcac ttggatcacg accgctctcg ccaatataca 1380
tcatgatgca agattttact caaatcccac cgaataccag cctttccgtt ttgtggccag 1440
agacgcgttt cacacagagg ggaaagaggg tagcgaaaag gttttacagc cctctgaagc 1500
tatcttgacg agcacaattg atgaaaggct cttgacattc ggatatgggc gtcgagcatg 1560
gtacgaaatc caactgtctc ctagagtctc aaactcttat atcctgtctc cagtcgaacc 1620
tacctaggta ctaatgcttt tgcaattact gtagccccgg ccgatggttc gcttcacaca 1680
tactgaaaat gttgatcgcg tatatcacga tcaattatga catacagccc ttgacgggac 1740
cgccgaaaaa agtcaaattc gcagatttca ccgtgccatc gccgagtatc aaaatcattg 1800
tgcgccggaa gaatctcgct taccttaggc aacgtgagcg ttga 1844
<210> 38
<211> 1524
<212> DNA
<213> Hypoxylon pulicicidum
<400> 38
atgataacag catccacttc cgtgtttggt ggcttaatcc ttgcctttat cttctcactt 60
ttatataaga ataagaagac ccgtatccca gcagaaatcg accgcgtaag gacgggaggt 120
ttcctagcac acattagagc ctttgggtgc aggttaggta cgcgagttga tgatattcgc 180
aatggatata ataagttcaa caaaaacggt aagccgtttg tgatccagga ttctaccttt 240
atcccacagg tcgtcatacc acctcaatac ctgggatggt tgaaggagca accagagaag 300
gctctttctg cagaaaccgt gaggctagaa cagcttggac ttcgctattt ggtccctagc 360
tcagatcccg agatggtcca tttgttgaca gacgtcgtgt gtcgctatct tacccgcaat 420
tttcaaagag tacaagagcg tttatatgag gagctccata tgagtacgga tgaaatcatg 480
gggctggagg caactgagtg gcgtcagatt tgtctccatg aagcgatgga aacgattctt 540
cgaaggatga ttagttgcgt cctgattggt ctcccatggt gtcgagatga ggaatgctta 600
aaatcgtgga ccggatttct tcactgcatg gccattgcag gaactattct aggggcagta 660
acaccttggt tcctacggcc actcctcgga ctactgctca agccgcccgt tggctatatg 720
cgcagaagat cactgcgtta tcttactccg atctttactg aaagatggaa aaaaattgag 780
aagcatgaga agagctcact gacgacgcgt gagctgccgg atgacttcgt aacatggtgt 840
attcaggagg tacggaatgg agctgcagaa gtcaccatgc tcgatcttct aagtgcggat 900
cccacaatag gttactggga aaagcttgtg gaagaagcca ctactgcatt cagaacagac 960
gaggactgga ttcatgcagg cactgtgtca aaattggcat acacggacag cgcaatcagg 1020
gagtctctac gccgaaaccc tttcagcatc cgaaacgtga cccgagaggt gataggaaaa 1080
gatgggctaa cactgccatc cggtacgcgt ctgccacagg gcacttggat cacgaccgct 1140
ctcgccaata tacatcatga tgcaagattt tactcaaatc ccaccgaata ccagcctttc 1200
cgttttgtgg ccagagacgc gtttcacaca gaggggaaag agggtagcga aaaggtttta 1260
cagccctctg aagctatctt gacgagcaca attgatgaaa ggctcttgac attcggatat 1320
gggcgtcgag catgccccgg ccgatggttc gcttcacaca tactgaaaat gttgatcgcg 1380
tatatcacga tcaattatga catacagccc ttgacgggac cgccgaaaaa agtcaaattc 1440
gcagatttca ccgtgccatc gccgagtatc aaaatcattg tgcgccggaa gaatctcgct 1500
taccttaggc aacgtgagcg ttga 1524
<210> 39
<211> 507
<212> PRT
<213> Hypoxylon pulicicidum
<400> 39
Met Ile Thr Ala Ser Thr Ser Val Phe Gly Gly Leu Ile Leu Ala Phe
1 5 10 15
Ile Phe Ser Leu Leu Tyr Lys Asn Lys Lys Thr Arg Ile Pro Ala Glu
20 25 30
Ile Asp Arg Val Arg Thr Gly Gly Phe Leu Ala His Ile Arg Ala Phe
35 40 45
Gly Cys Arg Leu Gly Thr Arg Val Asp Asp Ile Arg Asn Gly Tyr Asn
50 55 60
Lys Phe Asn Lys Asn Gly Lys Pro Phe Val Ile Gln Asp Ser Thr Phe
65 70 75 80
Ile Pro Gln Val Val Ile Pro Pro Gln Tyr Leu Gly Trp Leu Lys Glu
85 90 95
Gln Pro Glu Lys Ala Leu Ser Ala Glu Thr Val Arg Leu Glu Gln Leu
100 105 110
Gly Leu Arg Tyr Leu Val Pro Ser Ser Asp Pro Glu Met Val His Leu
115 120 125
Leu Thr Asp Val Val Cys Arg Tyr Leu Thr Arg Asn Phe Gln Arg Val
130 135 140
Gln Glu Arg Leu Tyr Glu Glu Leu His Met Ser Thr Asp Glu Ile Met
145 150 155 160
Gly Leu Glu Ala Thr Glu Trp Arg Gln Ile Cys Leu His Glu Ala Met
165 170 175
Glu Thr Ile Leu Arg Arg Met Ile Ser Cys Val Leu Ile Gly Leu Pro
180 185 190
Trp Cys Arg Asp Glu Glu Cys Leu Lys Ser Trp Thr Gly Phe Leu His
195 200 205
Cys Met Ala Ile Ala Gly Thr Ile Leu Gly Ala Val Thr Pro Trp Phe
210 215 220
Leu Arg Pro Leu Leu Gly Leu Leu Leu Lys Pro Pro Val Gly Tyr Met
225 230 235 240
Arg Arg Arg Ser Leu Arg Tyr Leu Thr Pro Ile Phe Thr Glu Arg Trp
245 250 255
Lys Lys Ile Glu Lys His Glu Lys Ser Ser Leu Thr Thr Arg Glu Leu
260 265 270
Pro Asp Asp Phe Val Thr Trp Cys Ile Gln Glu Val Arg Asn Gly Ala
275 280 285
Ala Glu Val Thr Met Leu Asp Leu Leu Ser Ala Asp Pro Thr Ile Gly
290 295 300
Tyr Trp Glu Lys Leu Val Glu Glu Ala Thr Thr Ala Phe Arg Thr Asp
305 310 315 320
Glu Asp Trp Ile His Ala Gly Thr Val Ser Lys Leu Ala Tyr Thr Asp
325 330 335
Ser Ala Ile Arg Glu Ser Leu Arg Arg Asn Pro Phe Ser Ile Arg Asn
340 345 350
Val Thr Arg Glu Val Ile Gly Lys Asp Gly Leu Thr Leu Pro Ser Gly
355 360 365
Thr Arg Leu Pro Gln Gly Thr Trp Ile Thr Thr Ala Leu Ala Asn Ile
370 375 380
His His Asp Ala Arg Phe Tyr Ser Asn Pro Thr Glu Tyr Gln Pro Phe
385 390 395 400
Arg Phe Val Ala Arg Asp Ala Phe His Thr Glu Gly Lys Glu Gly Ser
405 410 415
Glu Lys Val Leu Gln Pro Ser Glu Ala Ile Leu Thr Ser Thr Ile Asp
420 425 430
Glu Arg Leu Leu Thr Phe Gly Tyr Gly Arg Arg Ala Cys Pro Gly Arg
435 440 445
Trp Phe Ala Ser His Ile Leu Lys Met Leu Ile Ala Tyr Ile Thr Ile
450 455 460
Asn Tyr Asp Ile Gln Pro Leu Thr Gly Pro Pro Lys Lys Val Lys Phe
465 470 475 480
Ala Asp Phe Thr Val Pro Ser Pro Ser Ile Lys Ile Ile Val Arg Arg
485 490 495
Lys Asn Leu Ala Tyr Leu Arg Gln Arg Glu Arg
500 505
<210> 40
<211> 1294
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 40
ttaaactctt cctttctcat tagtagggta ctccacttca agtagatcga gaatcttatg 60
aattccagga ttgggcccta aggaagtctc cagcttcttt acatagccac gagcctccgc 120
actaagtcga cttagggtct ccctagtata ttggaagctc cccgtcgact ccatgatctt 180
cacagcccgg attttgactg cttcgtcctc tgtgcgttgc tttagaatat cgagaagctc 240
ggagctctct ggagatgcac ggatgctgtg tatgatagga taggagaact tcccctccgt 300
caaatcttcc atcagccctt ttttctcagc atagagtccg ctctgcagat tcatatagtc 360
atcacgaatt tggaatataa cacccaatag ctcgacaagt ttagaaaagt cactgtaaaa 420
tactaattag cattgctgcg aagtgaccgt tatggattag aaacttacgt attcttgcgg 480
gattggatac gcatcaaatc gagggccagg ttgaaaagac ctccagtttt gtacataacc 540
atccgggtgt attcctcctc ggtcggacaa accaccatat cacgccaata taggtccatg 600
ccctggccaa gatgtagatc tagcagtgac cttgtaaata tttcgaaggc gcgggggtct 660
ccaatctctt tcaatcttgc ttgttggaga tagtaggcat agttggctga gttgatagtt 720
tgtgctacac cgtatacatc atgagccaca ggctttcctc tccggagccg tgatgcatct 780
tgaatatcat cgatactata atcaccatga tgttagaata gaacaggagc gctggggttg 840
gaaatctcac agaagggatg cagtgtgaag taagtttatt atatctttca caatagacaa 900
cttctcctct ggaagctgga gccatatgtt gaaggagtcg atcagcttgc ttcggatgtc 960
ttttcccgga atcgctagaa gatagtctag aggtccacga acaatctaag aagaacaaac 1020
gattggtata atgaaacaca aggggaatcc caagagcaat gacagaactg accttgttat 1080
actgaatagc aatatcgtca acgtcatctt ctagcacctg cactgttcta atcgtgcttg 1140
gtgctttgct ggaatcactc aggagtcttg ggaatccttg gaagtttgat tcccagtaat 1200
tatcagcaga taatgagtgt gaagctcccc aataattaag atgagatatt cctcgacgaa 1260
cgaagttcag agcttctgca aggatgtagg acat 1294
<210> 41
<211> 1116
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 41
ttaaactctt cctttctcat tagtagggta ctccacttca agtagatcga gaatcttatg 60
aattccagga ttgggcccta aggaagtctc cagcttcttt acatagccac gagcctccgc 120
actaagtcga cttagggtct ccctagtata ttggaagctc cccgtcgact ccatgatctt 180
cacagcccgg attttgactg cttcgtcctc tgtgcgttgc tttagaatat cgagaagctc 240
ggagctctct ggagatgcac ggatgctgtg tatgatagga taggagaact tcccctccgt 300
caaatcttcc atcagccctt ttttctcagc atagagtccg ctctgcagat tcatatagtc 360
atcacgaatt tggaatataa cacccaatag ctcgacaagt ttagaaaagt cagtattctt 420
gcgggattgg atacgcatca aatcgagggc caggttgaaa agacctccag ttttgtacat 480
aaccatccgg gtgtattcct cctcggtcgg acaaaccacc atatcacgcc aatataggtc 540
catgccctgg ccaagatgta gatctagcag tgaccttgta aatatttcga aggcgcgggg 600
gtctccaatc tctttcaatc ttgcttgttg gagatagtag gcatagttgg ctgagttgat 660
agtttgtgct acaccgtata catcatgagc cacaggcttt cctctccgga gccgtgatgc 720
atcttgaata tcatcgataa gaagggatgc agtgtgaagt aagtttatta tatctttcac 780
aatagacaac ttctcctctg gaagctggag ccatatgttg aaggagtcga tcagcttgct 840
tcggatgtct tttcccggaa tcgctagaag atagtctaga ggtccacgaa caatcttgtt 900
atactgaata gcaatatcgt caacgtcatc ttctagcacc tgcactgttc taatcgtgct 960
tggtgctttg ctggaatcac tcaggagtct tgggaatcct tggaagtttg attcccagta 1020
attatcagca gataatgagt gtgaagctcc ccaataatta agatgagata ttcctcgacg 1080
aacgaagttc agagcttctg caaggatgta ggacat 1116
<210> 42
<211> 1077
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 42
atgggcgtag cagggagcgg agttctttac tttcttttca acaatgtccc gagtcctcgc 60
ttctggttga agaaaaccca gttgatagga accgagaacc cagaaggcat aactggctac 120
gaatgccctt atgaatatct gcggaagtca tacggcaagc atcactgggc agcgttcgtt 180
gacaagctat cgcccaacct tcaaaatgag gatccagcta aataccgcat ggtgcttgaa 240
acaatggatg tcattcacct atgcttgatg atggtcgacg atgtaagatc atttgccatt 300
atatagaggc tttattatca ttgtatctaa cttctgattc ctagatctcc gatggaagcg 360
aatatcgcaa aggaaagccg gctgcgcaca aaatttatgg tgcgcctgaa acagcgaatc 420
gggcttatta tcgagttaca caaatattgg ctcaaactgc gacagaattc ccacgtcttt 480
cgccttggtt gatgactgat cttcgggata ttctcgaggg tcaagatatg tcccttgtct 540
ggcgccgaga cggagtcaat gggttccctg gaactgcatc ggagagaact gctgcttaca 600
agcgcatggt tctgctaaag acaggtggac tatttcgtct actcgggcat ctcactctcg 660
agaacaattc catggatgaa gcctttagca cccttgggta agaaagaaaa atattttcgg 720
cagccttctg aattttgcta atatttaatg attcctagct ggcattcgca attgcaaaat 780
gactgcaaga atgtctactc gtcggaatat gccaagatga agggcgttgt agcagaagat 840
ttgctcaatc gtgagatgac ataccccatc gtactcgcac tggacgcctc tggtggtcat 900
tgggtagagg cagctctaaa gtcgccctct cggcgaaacg tcggaaatgc cttgaagata 960
atacagtgcg actatgttcg agatgtttgc atggcagagc tggcgagatc tggtgccccg 1020
gttaaggaat ggttgaagtt atggaaacgg gaggagaagc ttgacctgaa ggcatga 1077
<210> 43
<211> 954
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 43
atgggcgtag cagggagcgg agttctttac tttcttttca acaatgtccc gagtcctcgc 60
ttctggttga agaaaaccca gttgatagga accgagaacc cagaaggcat aactggctac 120
gaatgccctt atgaatatct gcggaagtca tacggcaagc atcactgggc agcgttcgtt 180
gacaagctat cgcccaacct tcaaaatgag gatccagcta aataccgcat ggtgcttgaa 240
acaatggatg tcattcacct atgcttgatg atggtcgacg atatctccga tggaagcgaa 300
tatcgcaaag gaaagccggc tgcgcacaaa atttatggtg cgcctgaaac agcgaatcgg 360
gcttattatc gagttacaca aatattggct caaactgcga cagaattccc acgtctttcg 420
ccttggttga tgactgatct tcgggatatt ctcgagggtc aagatatgtc ccttgtctgg 480
cgccgagacg gagtcaatgg gttccctgga actgcatcgg agagaactgc tgcttacaag 540
cgcatggttc tgctaaagac aggtggacta tttcgtctac tcgggcatct cactctcgag 600
aacaattcca tggatgaagc ctttagcacc cttggctggc attcgcaatt gcaaaatgac 660
tgcaagaatg tctactcgtc ggaatatgcc aagatgaagg gcgttgtagc agaagatttg 720
ctcaatcgtg agatgacata ccccatcgta ctcgcactgg acgcctctgg tggtcattgg 780
gtagaggcag ctctaaagtc gccctctcgg cgaaacgtcg gaaatgcctt gaagataata 840
cagtgcgact atgttcgaga tgtttgcatg gcagagctgg cgagatctgg tgccccggtt 900
aaggaatggt tgaagttatg gaaacgggag gagaagcttg acctgaaggc atga 954
<210> 44
<211> 317
<212> PRT
<213> 蕈青霉(Penicillium paxilli)
<400> 44
Met Gly Val Ala Gly Ser Gly Val Leu Tyr Phe Leu Phe Asn Asn Val
1 5 10 15
Pro Ser Pro Arg Phe Trp Leu Lys Lys Thr Gln Leu Ile Gly Thr Glu
20 25 30
Asn Pro Glu Gly Ile Thr Gly Tyr Glu Cys Pro Tyr Glu Tyr Leu Arg
35 40 45
Lys Ser Tyr Gly Lys His His Trp Ala Ala Phe Val Asp Lys Leu Ser
50 55 60
Pro Asn Leu Gln Asn Glu Asp Pro Ala Lys Tyr Arg Met Val Leu Glu
65 70 75 80
Thr Met Asp Val Ile His Leu Cys Leu Met Met Val Asp Asp Ile Ser
85 90 95
Asp Gly Ser Glu Tyr Arg Lys Gly Lys Pro Ala Ala His Lys Ile Tyr
100 105 110
Gly Ala Pro Glu Thr Ala Asn Arg Ala Tyr Tyr Arg Val Thr Gln Ile
115 120 125
Leu Ala Gln Thr Ala Thr Glu Phe Pro Arg Leu Ser Pro Trp Leu Met
130 135 140
Thr Asp Leu Arg Asp Ile Leu Glu Gly Gln Asp Met Ser Leu Val Trp
145 150 155 160
Arg Arg Asp Gly Val Asn Gly Phe Pro Gly Thr Ala Ser Glu Arg Thr
165 170 175
Ala Ala Tyr Lys Arg Met Val Leu Leu Lys Thr Gly Gly Leu Phe Arg
180 185 190
Leu Leu Gly His Leu Thr Leu Glu Asn Asn Ser Met Asp Glu Ala Phe
195 200 205
Ser Thr Leu Gly Trp His Ser Gln Leu Gln Asn Asp Cys Lys Asn Val
210 215 220
Tyr Ser Ser Glu Tyr Ala Lys Met Lys Gly Val Val Ala Glu Asp Leu
225 230 235 240
Leu Asn Arg Glu Met Thr Tyr Pro Ile Val Leu Ala Leu Asp Ala Ser
245 250 255
Gly Gly His Trp Val Glu Ala Ala Leu Lys Ser Pro Ser Arg Arg Asn
260 265 270
Val Gly Asn Ala Leu Lys Ile Ile Gln Cys Asp Tyr Val Arg Asp Val
275 280 285
Cys Met Ala Glu Leu Ala Arg Ser Gly Ala Pro Val Lys Glu Trp Leu
290 295 300
Lys Leu Trp Lys Arg Glu Glu Lys Leu Asp Leu Lys Ala
305 310 315
<210> 45
<211> 1559
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 45
ttaaacttga agaaaataaa acttcagggc accctcgagg tcgaacatca ttgtaagaga 60
ggtatagaca atggttagtc caaatagata gatcataagt tgagtcaaat aactccagct 120
tcgcccctgt ttgctatact tctcccatcc accaccactt cgctttggcg tagggaggaa 180
atcacacatt gtgccatcag caatcgtttt tgacgccata tcagcaggca ggtcaccagc 240
gtatggtgcc caataccggc ttagcaggct atagattatg ccatcacgaa cctgaaaacg 300
aaccaagaat cgagagctct ggtagatagt attgacgcgc tcatatcgaa ggtcgcgata 360
tttttgcaaa aggaactcca tttgtgagga ggtgggaaag tatggtccag aggaaatccg 420
catctttcga aggagatttg ccagagcagc ggcatcctca atggccatat tagccccttg 480
accaacattg ggagtcattt tgtggacact gtctcctaag agcacgcagc ggccatggtg 540
ccagactttg aatgtatttt cttccagagc agtcattgaa gatgtctctc ttttgtccca 600
gagctcgcca aaagtaatgt tttcgtaaaa cttgacatcc ctgatctctt ctgccgcaat 660
agatgtttca tgggacgtgt agcgggggct gtcaggatac acgtatttct tgcccagctt 720
ttgaatgacg aaccaatata tgcgaccgtc ttttccatgg attgtgacaa tagtgagacc 780
atcgaataaa gcgttgactt gctcgccaag ttttaatccc ggcatcgccg atgaaatgcc 840
gaaaatacag cgaaactcga ccgtaagctc ttcgtacttg ttagcatgaa tgcaaagaca 900
tgaggcctgt tgatgctatc cactcactgg aactatcttg tttgatcttt gatacccgtc 960
tggcaattcc ccttgccttc catatctctc tgcggacgat gctgtggact ccatctgcgc 1020
cgacaagaag atccccacga taaacgtgtc cagttgtggt ggtaattagc actccatcat 1080
ccaatgattc aattgatgta actctttggc ccagacgtat tttgctggga tctggatacc 1140
ctttgtagag aatttcgagc atcttctgtc gatctagaaa cgctatagga aaaccgaacc 1200
tgttgcctca cgggtgccat tttagatgat aatgcaaaac tgtataagat caagataatt 1260
actgaccttt gatcgatgat ctttggatat gagctgctga agttgaaccc atcaggaagc 1320
ccaattgtag ctttgcttag cggttcgata tgctcttcaa cttgatcata gagctgaagc 1380
tgatccagca cgcgagctcc attcggcaga atgccgatgg atgctccaat ctgtggtgct 1440
ggatcgctgg ccttttccag gacaacatgt tttattcccg cacgatgtag acaatgtgcc 1500
aatgtcaatc ctccgatcga cccgcccaca atgataactt gaaactcggc cttttccat 1559
<210> 46
<211> 1434
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 46
ttaaacttga agaaaataaa acttcagggc accctcgagg tcgaacatca ttgtaagaga 60
ggtatagaca atggttagtc caaatagata gatcataagt tgagtcaaat aactccagct 120
tcgcccctgt ttgctatact tctcccatcc accaccactt cgctttggcg tagggaggaa 180
atcacacatt gtgccatcag caatcgtttt tgacgccata tcagcaggca ggtcaccagc 240
gtatggtgcc caataccggc ttagcaggct atagattatg ccatcacgaa cctgaaaacg 300
aaccaagaat cgagagctct ggtagatagt attgacgcgc tcatatcgaa ggtcgcgata 360
tttttgcaaa aggaactcca tttgtgagga ggtgggaaag tatggtccag aggaaatccg 420
catctttcga aggagatttg ccagagcagc ggcatcctca atggccatat tagccccttg 480
accaacattg ggagtcattt tgtggacact gtctcctaag agcacgcagc ggccatggtg 540
ccagactttg aatgtatttt cttccagagc agtcattgaa gatgtctctc ttttgtccca 600
gagctcgcca aaagtaatgt tttcgtaaaa cttgacatcc ctgatctctt ctgccgcaat 660
agatgtttca tgggacgtgt agcgggggct gtcaggatac acgtatttct tgcccagctt 720
ttgaatgacg aaccaatata tgcgaccgtc ttttccatgg attgtgacaa tagtgagacc 780
atcgaataaa gcgttgactt gctcgccaag ttttaatccc ggcatcgccg atgaaatgcc 840
gaaaatacag cgaaactcga ccgtaagctt ggaactatct tgtttgatct ttgatacccg 900
tctggcaatt ccccttgcct tccatatctc tctgcggacg atgctgtgga ctccatctgc 960
gccgacaaga agatccccac gataaacgtg tccagttgtg gtggtaatta gcactccatc 1020
atccaatgat tcaattgatg taactctttg gcccagacgt attttgctgg gatctggata 1080
ccctttgtag agaatttcga gcatcttctg tcgatctaga aacgctatag gaaaaccgaa 1140
cctttgatcg atgatctttg gatatgagct gctgaagttg aacccatcag gaagcccaat 1200
tgtagctttg cttagcggtt cgatatgctc ttcaacttga tcatagagct gaagctgatc 1260
cagcacgcga gctccattcg gcagaatgcc gatggatgct ccaatctgtg gtgctggatc 1320
gctggccttt tccaggacaa catgttttat tcccgcacga tgtagacaat gtgccaatgt 1380
caatcctccg atcgacccgc ccacaatgat aacttgaaac tcggcctttt ccat 1434
<210> 47
<211> 477
<212> PRT
<213> 蕈青霉(Penicillium paxilli)
<400> 47
Met Glu Lys Ala Glu Phe Gln Val Ile Ile Val Gly Gly Ser Ile Gly
1 5 10 15
Gly Leu Thr Leu Ala His Cys Leu His Arg Ala Gly Ile Lys His Val
20 25 30
Val Leu Glu Lys Ala Ser Asp Pro Ala Pro Gln Ile Gly Ala Ser Ile
35 40 45
Gly Ile Leu Pro Asn Gly Ala Arg Val Leu Asp Gln Leu Gln Leu Tyr
50 55 60
Asp Gln Val Glu Glu His Ile Glu Pro Leu Ser Lys Ala Thr Ile Gly
65 70 75 80
Leu Pro Asp Gly Phe Asn Phe Ser Ser Ser Tyr Pro Lys Ile Ile Asp
85 90 95
Gln Arg Phe Gly Phe Pro Ile Ala Phe Leu Asp Arg Gln Lys Met Leu
100 105 110
Glu Ile Leu Tyr Lys Gly Tyr Pro Asp Pro Ser Lys Ile Arg Leu Gly
115 120 125
Gln Arg Val Thr Ser Ile Glu Ser Leu Asp Asp Gly Val Leu Ile Thr
130 135 140
Thr Thr Thr Gly His Val Tyr Arg Gly Asp Leu Leu Val Gly Ala Asp
145 150 155 160
Gly Val His Ser Ile Val Arg Arg Glu Ile Trp Lys Ala Arg Gly Ile
165 170 175
Ala Arg Arg Val Ser Lys Ile Lys Gln Asp Ser Ser Lys Leu Thr Val
180 185 190
Glu Phe Arg Cys Ile Phe Gly Ile Ser Ser Ala Met Pro Gly Leu Lys
195 200 205
Leu Gly Glu Gln Val Asn Ala Leu Phe Asp Gly Leu Thr Ile Val Thr
210 215 220
Ile His Gly Lys Asp Gly Arg Ile Tyr Trp Phe Val Ile Gln Lys Leu
225 230 235 240
Gly Lys Lys Tyr Val Tyr Pro Asp Ser Pro Arg Tyr Thr Ser His Glu
245 250 255
Thr Ser Ile Ala Ala Glu Glu Ile Arg Asp Val Lys Phe Tyr Glu Asn
260 265 270
Ile Thr Phe Gly Glu Leu Trp Asp Lys Arg Glu Thr Ser Ser Met Thr
275 280 285
Ala Leu Glu Glu Asn Thr Phe Lys Val Trp His His Gly Arg Cys Val
290 295 300
Leu Leu Gly Asp Ser Val His Lys Met Thr Pro Asn Val Gly Gln Gly
305 310 315 320
Ala Asn Met Ala Ile Glu Asp Ala Ala Ala Leu Ala Asn Leu Leu Arg
325 330 335
Lys Met Arg Ile Ser Ser Gly Pro Tyr Phe Pro Thr Ser Ser Gln Met
340 345 350
Glu Phe Leu Leu Gln Lys Tyr Arg Asp Leu Arg Tyr Glu Arg Val Asn
355 360 365
Thr Ile Tyr Gln Ser Ser Arg Phe Leu Val Arg Phe Gln Val Arg Asp
370 375 380
Gly Ile Ile Tyr Ser Leu Leu Ser Arg Tyr Trp Ala Pro Tyr Ala Gly
385 390 395 400
Asp Leu Pro Ala Asp Met Ala Ser Lys Thr Ile Ala Asp Gly Thr Met
405 410 415
Cys Asp Phe Leu Pro Thr Pro Lys Arg Ser Gly Gly Gly Trp Glu Lys
420 425 430
Tyr Ser Lys Gln Gly Arg Ser Trp Ser Tyr Leu Thr Gln Leu Met Ile
435 440 445
Tyr Leu Phe Gly Leu Thr Ile Val Tyr Thr Ser Leu Thr Met Met Phe
450 455 460
Asp Leu Glu Gly Ala Leu Lys Phe Tyr Phe Leu Gln Val
465 470 475
<210> 48
<211> 1681
<212> DNA
<213> Hypoxylon pulicicidum
<400> 48
atggacaagc taccacagga aatcgtggac atcatcgtct tctttgccaa ctccaacgag 60
caagggaacc aatatcacat gcacggcccc gatgctaagc atcttgcgag acaattagtc 120
actgtttcca agaaattcca gcgcgccatc gagtgtgata cattcaaggt acttcatctc 180
gacttggacc gggctcgtga tgctcgtgat atcctttccc ggttctctag atggtcgcat 240
ctgagactac tagaatttac tgctatcctg cccgactatg acgaagttgc gtgcactcga 300
tatgagaacg ctgcagagaa agcagagaat tcgcgggtgt ttacggaaaa catcacagag 360
ttgttccacc ttctctctca atgcccagtt gcatgtgctt ctagacctgt ggtattgagg 420
gtagagatat attccaagac ggatcgcatc tgtgtcagcc acagtcttca aggccgtgtg 480
actcaaaagg agacgcacgc caagccagtg tctggtgaca taaggaggtg gaggtggaag 540
cggtcaaaac tacagcttga caagtcagtt cgtcttgcct caatcaaaca cctaaatata 600
cctgtcttcc agatgcaaag gcgcccgtta ttattccgac atgttgctgc tgatagcatt 660
atgcgattaa tatcagcaat gcctccctcc ctcaagttta ccgtcaaccg gttttcagat 720
accgaaaaga acgatcttgc tcatcgaatt gcacatcgtg agggtaagcg ttagggtctc 780
accattgatc gattaatatt cccacccatg cgttctctaa actaacatat ttccagatat 840
cgccaatgca atcgactctc ttcctaagct gatctcccca tactttcatg tggaatactt 900
gccccccctg gatcacaact tccaaccacc cgtactccac aatcacgata cgcagagcga 960
ttcggtctcc tgtgcaatac gcaggatcac ccagagatgc aaaagggtat tcgtcacagg 1020
tgtcctaggc tcaactgagc tgttctggcc aaatgtaaat tcggcccctg acccatactg 1080
gcactcgttg gaatttctgg atatttggta ccatcccatt accccgggtg gcaagtggct 1140
atttggatta gacccatttc tccatttcgg gtcggcgcga atgcaggctc gcgatctcta 1200
ttcgcgtcct gagccagtag aggggcgtgc ggatgaagat caacaagcat gtcaatttcg 1260
ctatacagca atccagcaac tcatggatga gttctatgta gcggcagcac gagctgcggc 1320
aaatatgcca aagttgaaga ggttggcttt ggtggtaacc caccaaccga gttggagaat 1380
tgatggtgct cccctacacc atttcgagtt ccgggcgtcc aaagacaatc atgcctcaat 1440
tacttggacc tcctcaccag tatttactcc tagtcaggct gttatcgatg cctggatgcg 1500
tgtatcctgc attcgcggct tgtctatgcg agtaaggcta accggacgtc cattcaacga 1560
cagaggtaat acgcgctatg tggatcccac cgatgatgac cctgatagtg tgcatgaaga 1620
ggaggaggat gacgaggagt atgacgaggg ggatagcgag gaggatgaag gggaggaatg 1680
a 1681
<210> 49
<211> 1608
<212> DNA
<213> Hypoxylon pulicicidum
<400> 49
atggacaagc taccacagga aatcgtggac atcatcgtct tctttgccaa ctccaacgag 60
caagggaacc aatatcacat gcacggcccc gatgctaagc atcttgcgag acaattagtc 120
actgtttcca agaaattcca gcgcgccatc gagtgtgata cattcaaggt acttcatctc 180
gacttggacc gggctcgtga tgctcgtgat atcctttccc ggttctctag atggtcgcat 240
ctgagactac tagaatttac tgctatcctg cccgactatg acgaagttgc gtgcactcga 300
tatgagaacg ctgcagagaa agcagagaat tcgcgggtgt ttacggaaaa catcacagag 360
ttgttccacc ttctctctca atgcccagtt gcatgtgctt ctagacctgt ggtattgagg 420
gtagagatat attccaagac ggatcgcatc tgtgtcagcc acagtcttca aggccgtgtg 480
actcaaaagg agacgcacgc caagccagtg tctggtgaca taaggaggtg gaggtggaag 540
cggtcaaaac tacagcttga caagtcagtt cgtcttgcct caatcaaaca cctaaatata 600
cctgtcttcc agatgcaaag gcgcccgtta ttattccgac atgttgctgc tgatagcatt 660
atgcgattaa tatcagcaat gcctccctcc ctcaagttta ccgtcaaccg gttttcagat 720
accgaaaaga acgatcttgc tcatcgaatt gcacatcgtg aggatatcgc caatgcaatc 780
gactctcttc ctaagctgat ctccccatac tttcatgtgg aatacttgcc ccccctggat 840
cacaacttcc aaccacccgt actccacaat cacgatacgc agagcgattc ggtctcctgt 900
gcaatacgca ggatcaccca gagatgcaaa agggtattcg tcacaggtgt cctaggctca 960
actgagctgt tctggccaaa tgtaaattcg gcccctgacc catactggca ctcgttggaa 1020
tttctggata tttggtacca tcccattacc ccgggtggca agtggctatt tggattagac 1080
ccatttctcc atttcgggtc ggcgcgaatg caggctcgcg atctctattc gcgtcctgag 1140
ccagtagagg ggcgtgcgga tgaagatcaa caagcatgtc aatttcgcta tacagcaatc 1200
cagcaactca tggatgagtt ctatgtagcg gcagcacgag ctgcggcaaa tatgccaaag 1260
ttgaagaggt tggctttggt ggtaacccac caaccgagtt ggagaattga tggtgctccc 1320
ctacaccatt tcgagttccg ggcgtccaaa gacaatcatg cctcaattac ttggacctcc 1380
tcaccagtat ttactcctag tcaggctgtt atcgatgcct ggatgcgtgt atcctgcatt 1440
cgcggcttgt ctatgcgagt aaggctaacc ggacgtccat tcaacgacag aggtaatacg 1500
cgctatgtgg atcccaccga tgatgaccct gatagtgtgc atgaagagga ggaggatgac 1560
gaggagtatg acgaggggga tagcgaggag gatgaagggg aggaatga 1608
<210> 50
<211> 535
<212> PRT
<213> Hypoxylon pulicicidum
<400> 50
Met Asp Lys Leu Pro Gln Glu Ile Val Asp Ile Ile Val Phe Phe Ala
1 5 10 15
Asn Ser Asn Glu Gln Gly Asn Gln Tyr His Met His Gly Pro Asp Ala
20 25 30
Lys His Leu Ala Arg Gln Leu Val Thr Val Ser Lys Lys Phe Gln Arg
35 40 45
Ala Ile Glu Cys Asp Thr Phe Lys Val Leu His Leu Asp Leu Asp Arg
50 55 60
Ala Arg Asp Ala Arg Asp Ile Leu Ser Arg Phe Ser Arg Trp Ser His
65 70 75 80
Leu Arg Leu Leu Glu Phe Thr Ala Ile Leu Pro Asp Tyr Asp Glu Val
85 90 95
Ala Cys Thr Arg Tyr Glu Asn Ala Ala Glu Lys Ala Glu Asn Ser Arg
100 105 110
Val Phe Thr Glu Asn Ile Thr Glu Leu Phe His Leu Leu Ser Gln Cys
115 120 125
Pro Val Ala Cys Ala Ser Arg Pro Val Val Leu Arg Val Glu Ile Tyr
130 135 140
Ser Lys Thr Asp Arg Ile Cys Val Ser His Ser Leu Gln Gly Arg Val
145 150 155 160
Thr Gln Lys Glu Thr His Ala Lys Pro Val Ser Gly Asp Ile Arg Arg
165 170 175
Trp Arg Trp Lys Arg Ser Lys Leu Gln Leu Asp Lys Ser Val Arg Leu
180 185 190
Ala Ser Ile Lys His Leu Asn Ile Pro Val Phe Gln Met Gln Arg Arg
195 200 205
Pro Leu Leu Phe Arg His Val Ala Ala Asp Ser Ile Met Arg Leu Ile
210 215 220
Ser Ala Met Pro Pro Ser Leu Lys Phe Thr Val Asn Arg Phe Ser Asp
225 230 235 240
Thr Glu Lys Asn Asp Leu Ala His Arg Ile Ala His Arg Glu Asp Ile
245 250 255
Ala Asn Ala Ile Asp Ser Leu Pro Lys Leu Ile Ser Pro Tyr Phe His
260 265 270
Val Glu Tyr Leu Pro Pro Leu Asp His Asn Phe Gln Pro Pro Val Leu
275 280 285
His Asn His Asp Thr Gln Ser Asp Ser Val Ser Cys Ala Ile Arg Arg
290 295 300
Ile Thr Gln Arg Cys Lys Arg Val Phe Val Thr Gly Val Leu Gly Ser
305 310 315 320
Thr Glu Leu Phe Trp Pro Asn Val Asn Ser Ala Pro Asp Pro Tyr Trp
325 330 335
His Ser Leu Glu Phe Leu Asp Ile Trp Tyr His Pro Ile Thr Pro Gly
340 345 350
Gly Lys Trp Leu Phe Gly Leu Asp Pro Phe Leu His Phe Gly Ser Ala
355 360 365
Arg Met Gln Ala Arg Asp Leu Tyr Ser Arg Pro Glu Pro Val Glu Gly
370 375 380
Arg Ala Asp Glu Asp Gln Gln Ala Cys Gln Phe Arg Tyr Thr Ala Ile
385 390 395 400
Gln Gln Leu Met Asp Glu Phe Tyr Val Ala Ala Ala Arg Ala Ala Ala
405 410 415
Asn Met Pro Lys Leu Lys Arg Leu Ala Leu Val Val Thr His Gln Pro
420 425 430
Ser Trp Arg Ile Asp Gly Ala Pro Leu His His Phe Glu Phe Arg Ala
435 440 445
Ser Lys Asp Asn His Ala Ser Ile Thr Trp Thr Ser Ser Pro Val Phe
450 455 460
Thr Pro Ser Gln Ala Val Ile Asp Ala Trp Met Arg Val Ser Cys Ile
465 470 475 480
Arg Gly Leu Ser Met Arg Val Arg Leu Thr Gly Arg Pro Phe Asn Asp
485 490 495
Arg Gly Asn Thr Arg Tyr Val Asp Pro Thr Asp Asp Asp Pro Asp Ser
500 505 510
Val His Glu Glu Glu Glu Asp Asp Glu Glu Tyr Asp Glu Gly Asp Ser
515 520 525
Glu Glu Asp Glu Gly Glu Glu
530 535
<210> 51
<211> 819
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 51
tcaatttgct tttttcggcc cgcttatgcc aagtgacttt tcgttacggt cgacgtacca 60
gaaacaaatt ccataaaacc catcgattga taaaaacacc acaagactcc acagtaccaa 120
aggactattc agccaaccga atgcttccga ccaatacatc caacgtaagc cggcaaaccc 180
aactgtacat gttgatccta agaagcggga agccctatag tacagaagat gagtacttgt 240
atttctgtca ctttggggaa gaaattccga ttcatcgggc atgaaatgag atcagacata 300
ccatagagta taggatgcgc cacgcgtact gcctcgacac aacagttgac tcaatccacc 360
aacgcttaga agaagttgac aaatgacggc cccccatgaa tatgccagcg caggcccgat 420
ttcaagggcc aatgcaacat gcccagagag aaagcccatg gtcgcgacga aaaatatcaa 480
ggaaatattg cgctcaacaa gcggcgcatg gccccactct cgggatgaaa acgttattgc 540
tgcgtacatg acaccaaagt tgatgaggag gcccatccag aatacacccc tctccaccgg 600
gcttttcgag ggaaagacca gacagtagac cagttcccac gcgatgttgc aacagagggg 660
cataatcgac attccgtaag tttcatgttt gaacgagatg tagaccattc cgatgtagtt 720
tatgatccat cctactccca tgccaacaac aaaaagatca gccaatggct taatcgcctg 780
gtactccgga ggagcttggg aaacatcaaa accgtccat 819
<210> 52
<211> 732
<212> DNA
<213> 蕈青霉(Penicillium paxilli)
<400> 52
tcaatttgct tttttcggcc cgcttatgcc aagtgacttt tcgttacggt cgacgtacca 60
gaaacaaatt ccataaaacc catcgattga taaaaacacc acaagactcc acagtaccaa 120
aggactattc agccaaccga atgcttccga ccaatacatc caacgtaagc cggcaaaccc 180
aactgtacat gttgatccta agaagcggga agcccataga gtataggatg cgccacgcgt 240
actgcctcga cacaacagtt gactcaatcc accaacgctt agaagaagtt gacaaatgac 300
ggccccccat gaatatgcca gcgcaggccc gatttcaagg gccaatgcaa catgcccaga 360
gagaaagccc atggtcgcga cgaaaaatat caaggaaata ttgcgctcaa caagcggcgc 420
atggccccac tctcgggatg aaaacgttat tgctgcgtac atgacaccaa agttgatgag 480
gaggcccatc cagaatacac ccctctccac cgggcttttc gagggaaaga ccagacagta 540
gaccagttcc cacgcgatgt tgcaacagag gggcataatc gacattccgt aagtttcatg 600
tttgaacgag atgtagacca ttccgatgta gtttatgatc catcctactc ccatgccaac 660
aacaaaaaga tcagccaatg gcttaatcgc ctggtactcc ggaggagctt gggaaacatc 720
aaaaccgtcc at 732
<210> 53
<211> 243
<212> PRT
<213> 蕈青霉(Penicillium paxilli)
<400> 53
Met Asp Gly Phe Asp Val Ser Gln Ala Pro Pro Glu Tyr Gln Ala Ile
1 5 10 15
Lys Pro Leu Ala Asp Leu Phe Val Val Gly Met Gly Val Gly Trp Ile
20 25 30
Ile Asn Tyr Ile Gly Met Val Tyr Ile Ser Phe Lys His Glu Thr Tyr
35 40 45
Gly Met Ser Ile Met Pro Leu Cys Cys Asn Ile Ala Trp Glu Leu Val
50 55 60
Tyr Cys Leu Val Phe Pro Ser Lys Ser Pro Val Glu Arg Gly Val Phe
65 70 75 80
Trp Met Gly Leu Leu Ile Asn Phe Gly Val Met Tyr Ala Ala Ile Thr
85 90 95
Phe Ser Ser Arg Glu Trp Gly His Ala Pro Leu Val Glu Arg Asn Ile
100 105 110
Ser Leu Ile Phe Phe Val Ala Thr Met Gly Phe Leu Ser Gly His Val
115 120 125
Ala Leu Ala Leu Glu Ile Gly Pro Ala Leu Ala Tyr Ser Trp Gly Ala
130 135 140
Val Ile Cys Gln Leu Leu Leu Ser Val Gly Gly Leu Ser Gln Leu Leu
145 150 155 160
Cys Arg Gly Ser Thr Arg Gly Ala Ser Tyr Thr Leu Trp Ala Ser Arg
165 170 175
Phe Leu Gly Ser Thr Cys Thr Val Gly Phe Ala Gly Leu Arg Trp Met
180 185 190
Tyr Trp Ser Glu Ala Phe Gly Trp Leu Asn Ser Pro Leu Val Leu Trp
195 200 205
Ser Leu Val Val Phe Leu Ser Ile Asp Gly Phe Tyr Gly Ile Cys Phe
210 215 220
Trp Tyr Val Asp Arg Asn Glu Lys Ser Leu Gly Ile Ser Gly Pro Lys
225 230 235 240
Lys Ala Asn
<210> 54
<211> 5083
<212> DNA
<213> Hypoxylon pulicicidum
<400> 54
atgggatatg gaccaggtac aagagcctct gcaggcgttt ctgattccgc attgaggggc 60
atgcaagaac tgacagcatt tttttcacca gagcttcata agacattaac tcgcgtacta 120
tctagctcta gatctgatgg cacgtcatta tttcacggtc gttcattgat ctctgaatcg 180
actcccgtaa cctccgataa tgagactcac ggcgttcttg gcctatcaac tctttacgaa 240
ccctcatttc ctactagcgc tacggccgat atcgtcttcg tccatggatt aggcggaggt 300
agtcgaaaaa catggtccta ttcccccgac cggtaccact actggcctca agcatggctt 360
gcgaacgact cggacttcgc agatatgcgc atccactcct tcggctataa gtccgactgg 420
gctgagcgac agcaaagcat cctcaatatt cgcgacttcg ccgaatcgtt agtcggagag 480
ctgaagaaca atcccggcat acgacgtagt aatacacgca tcatattcgt ttgccatagt 540
atgggcggat gcgtcgccaa aaaggcctac attatatcac gccaggatcc gacctgcaag 600
gacttagctg acagagtcca ctcgatattc tttctaggca ctccacacag gggcagtgat 660
cttgcagtga tcctgaagag gttgtctgtc atcgcttggg gctccaagcc gttcgtctcc 720
gacctcctgc ccgaatcgtc tacattgaga gatatcaacg acacatttcg tcactatgcg 780
tcggatctgc gcctctggtc cttttacgag acgattcccg ccaagcccag gattttgaac 840
aaaatcgtgg ttgagaggca ctcggcaacg cttggttacc caaacgaaga gattgttgct 900
atgaacgctg accaccgcca gttgtgcaaa ttcaaaagtc cggctgaccc taattacaag 960
atattacgaa atgccctcca cacggctgcc gatatgctaa ggtcattacc acctttggcc 1020
ttagccccct tagaacctcg tatcaacttg gcttccacac aacagcattc gaaccaagag 1080
aacgcaagcc aacgcttgag gtcctttcta ggcgtcgttg atacgccaga ggatgaactc 1140
catattcttc aactgtttca ggagccggga tcttgccggt ggttctcgga atcgaaagac 1200
ttcgtgtctt gggaatcgga agggtccccg agcatactgt ggctcacggg gagaccagcg 1260
tccggtaaat ccgtcctttc tagccacgtc atagagcaag tgaagtctct aggtgccttt 1320
tgcagttact ttttcttcaa gcaaagggag gctagcaagt ctacgctgag cgattgtttc 1380
cgctccattg cctttcagat ggccatacaa gatagtgaag tgatgaataa gctacttcaa 1440
ctcgaaggcg aatggatgac ctgggatatg agcgacgagc tgagcgtctg gagaaggctt 1500
ttcgtcaatg ggatcttcaa gctgccatcc atctcacagc acttctggat aatcgacggt 1560
gtcgatgaat gttctaattt caactccctt tttactaaga gaatcctcgc tacgcttcct 1620
agaggtattc gccttttcgc cagcagccgc catctagaag aaatccggcg cggtttggca 1680
cctcttgagt cgcgtgtgaa cctgcagtcc gtgtctgaaa ccgacactct tggtgatatg 1740
cggattttcg tgacttcgaa gctcagaggg ctagatcgcc ttgaaaatga tgacagtatc 1800
aatacaatgt gcgagaaaat ccttgggaag gcatccggtt ctttcttatg ggtccgactc 1860
gtacttcaag agttcgaaaa tgcttggact agcgaagcca tggatgctgt cttggatgaa 1920
atacctgtag atcttcaaga catgtatcgc cggatgcttc tgttaatgga gaaggatacg 1980
cgtacaatca agctcgccaa atccatcctg acgtgggccg ttctggcatg ccgaccgctc 2040
accgttgacg agctacgtct tgctgtgaag ctcgacgtta atgagacgct gcagagtgta 2100
agcaaggcga ttcctagttt atgccaccaa ctagtctttg tcgacagcgc taatagggtg 2160
cacatcttac atgcaaccgc ccgggaattt cttctcgacg aaactcttca gtcagagttt 2220
gctcttcatg gtgttgagaa gcacgcctct cttggctctc tactgcttcg gtatctcacc 2280
aacaccgcct ttaagttccg tgcgccaccg cggcggcagg gctcaggatt tcgcggtttt 2340
gcgaagcccg ttcatagtgt ttctcctgat ctatccctat tggactacgc agcttgcttc 2400
ttctctgagc acatataccg aggcgcctcg agagatgata ccttgatggc cgaactgtgt 2460
gccttcctaa agggcagaac tatcctctca tggattgaac acatcgctag aaatggagat 2520
cttggaggta ttaccaggac ggcgacagac ttacgtggat atctcggccg gaaactggaa 2580
catcttcctc ccacagatcc ctcggcctac cttgttgact gctgggtggc tgatctaatc 2640
cgggttgctg ccaagtttcg atttcagttg ctgacctgtc catcgtctat tcattacatt 2700
atcccatcat tctgtccatc agacactatt atctcgagga cctttgccaa tggtactcga 2760
ccttcgacaa taacagtcaa gggtatccct caagccacgt gggacgactg cttaacccgt 2820
atcgattttg agcgaggtcg agctaccgcc ttgagctatg gtacccaatt cttcgctgtt 2880
ggtttgtcga ccgggcagat ttcgctcttc gatccgcact ctgtccagcc cgtggcgaac 2940
cttgtccatc ctgaaagggt caagatgctg gagtttagct ccgacggaga atatcttgcc 3000
tcctctggca ctagaacttt gcttgtttgg cagccgaaat gtgggatgca gaagttgtca 3060
ttcccattgc agtcggagct tatcgctttt gttttcttaa gcggtgacga atttctttgt 3120
gctttcgcat ctggtgagct aactaaatgg taagatcacc tattcagacc tcacgaatca 3180
caacgccgcc tttcaaagct tcgtctttag atacagtact gattcttgac aacttaggcg 3240
tcttgacacg ggcgaacatg aaacaatctc ctggagaagc atgtgtgata cggatattac 3300
cggtactctg gatattcctg agcagccgcc aagctgcgcg gcgttctcta cagggggtga 3360
gactgtgctg cttgctgtgg gttaccgaaa ataccccata ttcatctggg acgcattgga 3420
gctacaattg ctgggacaat gcggagctga cgaaaacaat gggatagatg acatgacatt 3480
taatccaaac cctgagatat ctgcgctagt ggtctcctac aatgacggca ggttatgcct 3540
cttcgattac acgaccatga tgccgacgtt tactcgacaa agcgtattcg cgaacagtat 3600
tgcctgttcc ccggacggtc gaagtctcgt taccggcagt gtcaggggta tcattgaggt 3660
attcaaattc gaccaggacc ataccgggaa cacggtgcta gtccctatat acaatatcca 3720
agctttagat gactcgatcc gcagcgtagc ctttagcgct gatggcctgc gcttcgttga 3780
ccttcacgac caacaatgcc gcatttgggc acccgtgtct ctgatgcgga aggataacga 3840
actggagagc gtaagtggca ttgcgccgct tcctgccaaa atagtcacca tggccgacga 3900
ctccaatatc acagaaatca cgagtgcctt agctgtgtcc tctaacggcg gccgcgtcat 3960
tgcaggtaag agtaacggcg aggtctccgc gttttcggct gtcgatggga aagaattagg 4020
agtgctctat tcgcatggac gttgcgtatc cgttgtcaac gtcaccctag gagaagctcg 4080
taatttagtc atctcagcgg atgatgctgg cagggtgcta gtggtggaac tgacaacgtg 4140
cctgccagcc tcctcggccg cacagaagct gccagcggct catgttattc tagagcgccg 4200
attcggtgct gctgttgttg gtctactcgt taacccctcg gtggaccgcc ttctaattag 4260
tgggcgacat gtggatgaac tctgtgatct gccgtcgggc cgggttttgg gttcgatatc 4320
tcatgtcgtc ggtaccgcta catcgacaag agccgtagcc ttccagcatc cagccaacga 4380
ggcctggatc gtcttgatgc tcactaatac cgctcgggtt ttccgctggt ccgatttcca 4440
ggagttgact accgtgaacg gcatcctcct tcggaaacct tcgacagccg tagaggctcc 4500
tctccccacg cattcccggg ctttgaaaac accaaccacg ctcagctcat cgtatcattt 4560
taggcaagat tttgtcctcg agttgctcag aatatcgccc tccgtagctc cacgactcta 4620
cgtttggccg gtgtcagcat ttgatccggc aacagcacag ccggatcacc gagcgcaggt 4680
tcctagggaa gtgaatcttg acgccatcaa tgccggaatc ttggctgtgc ttggaatcgt 4740
aggtcagtct acggttctcc ttatggacgc caatctttgg gtatacagca tggagctccg 4800
cccaacgcaa gccacaccac aggcccaccc tggctttccc cctgaaacga cgatagttca 4860
ggacggacct gagccaatca cgcaacaaat tctgccggtg tttacaagga gacacttttt 4920
cgccctgagc gagtggcgca cagccggcga agagttgagg tgcgcggtag cgcagcattc 4980
tggtggcccg agtttcattt ttgccagtag gcagtacatc gtcgtcgttc aaggcggttt 5040
ggagttttcc gaggacatgg ctgtcggcca gcagagtgcg tag 5083
<210> 55
<211> 4995
<212> DNA
<213> Hypoxylon pulicicidum
<400> 55
atgggatatg gaccaggtac aagagcctct gcaggcgttt ctgattccgc attgaggggc 60
atgcaagaac tgacagcatt tttttcacca gagcttcata agacattaac tcgcgtacta 120
tctagctcta gatctgatgg cacgtcatta tttcacggtc gttcattgat ctctgaatcg 180
actcccgtaa cctccgataa tgagactcac ggcgttcttg gcctatcaac tctttacgaa 240
ccctcatttc ctactagcgc tacggccgat atcgtcttcg tccatggatt aggcggaggt 300
agtcgaaaaa catggtccta ttcccccgac cggtaccact actggcctca agcatggctt 360
gcgaacgact cggacttcgc agatatgcgc atccactcct tcggctataa gtccgactgg 420
gctgagcgac agcaaagcat cctcaatatt cgcgacttcg ccgaatcgtt agtcggagag 480
ctgaagaaca atcccggcat acgacgtagt aatacacgca tcatattcgt ttgccatagt 540
atgggcggat gcgtcgccaa aaaggcctac attatatcac gccaggatcc gacctgcaag 600
gacttagctg acagagtcca ctcgatattc tttctaggca ctccacacag gggcagtgat 660
cttgcagtga tcctgaagag gttgtctgtc atcgcttggg gctccaagcc gttcgtctcc 720
gacctcctgc ccgaatcgtc tacattgaga gatatcaacg acacatttcg tcactatgcg 780
tcggatctgc gcctctggtc cttttacgag acgattcccg ccaagcccag gattttgaac 840
aaaatcgtgg ttgagaggca ctcggcaacg cttggttacc caaacgaaga gattgttgct 900
atgaacgctg accaccgcca gttgtgcaaa ttcaaaagtc cggctgaccc taattacaag 960
atattacgaa atgccctcca cacggctgcc gatatgctaa ggtcattacc acctttggcc 1020
ttagccccct tagaacctcg tatcaacttg gcttccacac aacagcattc gaaccaagag 1080
aacgcaagcc aacgcttgag gtcctttcta ggcgtcgttg atacgccaga ggatgaactc 1140
catattcttc aactgtttca ggagccggga tcttgccggt ggttctcgga atcgaaagac 1200
ttcgtgtctt gggaatcgga agggtccccg agcatactgt ggctcacggg gagaccagcg 1260
tccggtaaat ccgtcctttc tagccacgtc atagagcaag tgaagtctct aggtgccttt 1320
tgcagttact ttttcttcaa gcaaagggag gctagcaagt ctacgctgag cgattgtttc 1380
cgctccattg cctttcagat ggccatacaa gatagtgaag tgatgaataa gctacttcaa 1440
ctcgaaggcg aatggatgac ctgggatatg agcgacgagc tgagcgtctg gagaaggctt 1500
ttcgtcaatg ggatcttcaa gctgccatcc atctcacagc acttctggat aatcgacggt 1560
gtcgatgaat gttctaattt caactccctt tttactaaga gaatcctcgc tacgcttcct 1620
agaggtattc gccttttcgc cagcagccgc catctagaag aaatccggcg cggtttggca 1680
cctcttgagt cgcgtgtgaa cctgcagtcc gtgtctgaaa ccgacactct tggtgatatg 1740
cggattttcg tgacttcgaa gctcagaggg ctagatcgcc ttgaaaatga tgacagtatc 1800
aatacaatgt gcgagaaaat ccttgggaag gcatccggtt ctttcttatg ggtccgactc 1860
gtacttcaag agttcgaaaa tgcttggact agcgaagcca tggatgctgt cttggatgaa 1920
atacctgtag atcttcaaga catgtatcgc cggatgcttc tgttaatgga gaaggatacg 1980
cgtacaatca agctcgccaa atccatcctg acgtgggccg ttctggcatg ccgaccgctc 2040
accgttgacg agctacgtct tgctgtgaag ctcgacgtta atgagacgct gcagagtgta 2100
agcaaggcga ttcctagttt atgccaccaa ctagtctttg tcgacagcgc taatagggtg 2160
cacatcttac atgcaaccgc ccgggaattt cttctcgacg aaactcttca gtcagagttt 2220
gctcttcatg gtgttgagaa gcacgcctct cttggctctc tactgcttcg gtatctcacc 2280
aacaccgcct ttaagttccg tgcgccaccg cggcggcagg gctcaggatt tcgcggtttt 2340
gcgaagcccg ttcatagtgt ttctcctgat ctatccctat tggactacgc agcttgcttc 2400
ttctctgagc acatataccg aggcgcctcg agagatgata ccttgatggc cgaactgtgt 2460
gccttcctaa agggcagaac tatcctctca tggattgaac acatcgctag aaatggagat 2520
cttggaggta ttaccaggac ggcgacagac ttacgtggat atctcggccg gaaactggaa 2580
catcttcctc ccacagatcc ctcggcctac cttgttgact gctgggtggc tgatctaatc 2640
cgggttgctg ccaagtttcg atttcagttg ctgacctgtc catcgtctat tcattacatt 2700
atcccatcat tctgtccatc agacactatt atctcgagga cctttgccaa tggtactcga 2760
ccttcgacaa taacagtcaa gggtatccct caagccacgt gggacgactg cttaacccgt 2820
atcgattttg agcgaggtcg agctaccgcc ttgagctatg gtacccaatt cttcgctgtt 2880
ggtttgtcga ccgggcagat ttcgctcttc gatccgcact ctgtccagcc cgtggcgaac 2940
cttgtccatc ctgaaagggt caagatgctg gagtttagct ccgacggaga atatcttgcc 3000
tcctctggca ctagaacttt gcttgtttgg cagccgaaat gtgggatgca gaagttgtca 3060
ttcccattgc agtcggagct tatcgctttt gttttcttaa gcggtgacga atttctttgt 3120
gctttcgcat ctggtgagct aactaaatgg cgtcttgaca cgggcgaaca tgaaacaatc 3180
tcctggagaa gcatgtgtga tacggatatt accggtactc tggatattcc tgagcagccg 3240
ccaagctgcg cggcgttctc tacagggggt gagactgtgc tgcttgctgt gggttaccga 3300
aaatacccca tattcatctg ggacgcattg gagctacaat tgctgggaca atgcggagct 3360
gacgaaaaca atgggataga tgacatgaca tttaatccaa accctgagat atctgcgcta 3420
gtggtctcct acaatgacgg caggttatgc ctcttcgatt acacgaccat gatgccgacg 3480
tttactcgac aaagcgtatt cgcgaacagt attgcctgtt ccccggacgg tcgaagtctc 3540
gttaccggca gtgtcagggg tatcattgag gtattcaaat tcgaccagga ccataccggg 3600
aacacggtgc tagtccctat atacaatatc caagctttag atgactcgat ccgcagcgta 3660
gcctttagcg ctgatggcct gcgcttcgtt gaccttcacg accaacaatg ccgcatttgg 3720
gcacccgtgt ctctgatgcg gaaggataac gaactggaga gcgtaagtgg cattgcgccg 3780
cttcctgcca aaatagtcac catggccgac gactccaata tcacagaaat cacgagtgcc 3840
ttagctgtgt cctctaacgg cggccgcgtc attgcaggta agagtaacgg cgaggtctcc 3900
gcgttttcgg ctgtcgatgg gaaagaatta ggagtgctct attcgcatgg acgttgcgta 3960
tccgttgtca acgtcaccct aggagaagct cgtaatttag tcatctcagc ggatgatgct 4020
ggcagggtgc tagtggtgga actgacaacg tgcctgccag cctcctcggc cgcacagaag 4080
ctgccagcgg ctcatgttat tctagagcgc cgattcggtg ctgctgttgt tggtctactc 4140
gttaacccct cggtggaccg ccttctaatt agtgggcgac atgtggatga actctgtgat 4200
ctgccgtcgg gccgggtttt gggttcgata tctcatgtcg tcggtaccgc tacatcgaca 4260
agagccgtag ccttccagca tccagccaac gaggcctgga tcgtcttgat gctcactaat 4320
accgctcggg ttttccgctg gtccgatttc caggagttga ctaccgtgaa cggcatcctc 4380
cttcggaaac cttcgacagc cgtagaggct cctctcccca cgcattcccg ggctttgaaa 4440
acaccaacca cgctcagctc atcgtatcat tttaggcaag attttgtcct cgagttgctc 4500
agaatatcgc cctccgtagc tccacgactc tacgtttggc cggtgtcagc atttgatccg 4560
gcaacagcac agccggatca ccgagcgcag gttcctaggg aagtgaatct tgacgccatc 4620
aatgccggaa tcttggctgt gcttggaatc gtaggtcagt ctacggttct ccttatggac 4680
gccaatcttt gggtatacag catggagctc cgcccaacgc aagccacacc acaggcccac 4740
cctggctttc cccctgaaac gacgatagtt caggacggac ctgagccaat cacgcaacaa 4800
attctgccgg tgtttacaag gagacacttt ttcgccctga gcgagtggcg cacagccggc 4860
gaagagttga ggtgcgcggt agcgcagcat tctggtggcc cgagtttcat ttttgccagt 4920
aggcagtaca tcgtcgtcgt tcaaggcggt ttggagtttt ccgaggacat ggctgtcggc 4980
cagcagagtg cgtag 4995
<210> 56
<211> 1664
<212> PRT
<213> Hypoxylon pulicicidum
<400> 56
Met Gly Tyr Gly Pro Gly Thr Arg Ala Ser Ala Gly Val Ser Asp Ser
1 5 10 15
Ala Leu Arg Gly Met Gln Glu Leu Thr Ala Phe Phe Ser Pro Glu Leu
20 25 30
His Lys Thr Leu Thr Arg Val Leu Ser Ser Ser Arg Ser Asp Gly Thr
35 40 45
Ser Leu Phe His Gly Arg Ser Leu Ile Ser Glu Ser Thr Pro Val Thr
50 55 60
Ser Asp Asn Glu Thr His Gly Val Leu Gly Leu Ser Thr Leu Tyr Glu
65 70 75 80
Pro Ser Phe Pro Thr Ser Ala Thr Ala Asp Ile Val Phe Val His Gly
85 90 95
Leu Gly Gly Gly Ser Arg Lys Thr Trp Ser Tyr Ser Pro Asp Arg Tyr
100 105 110
His Tyr Trp Pro Gln Ala Trp Leu Ala Asn Asp Ser Asp Phe Ala Asp
115 120 125
Met Arg Ile His Ser Phe Gly Tyr Lys Ser Asp Trp Ala Glu Arg Gln
130 135 140
Gln Ser Ile Leu Asn Ile Arg Asp Phe Ala Glu Ser Leu Val Gly Glu
145 150 155 160
Leu Lys Asn Asn Pro Gly Ile Arg Arg Ser Asn Thr Arg Ile Ile Phe
165 170 175
Val Cys His Ser Met Gly Gly Cys Val Ala Lys Lys Ala Tyr Ile Ile
180 185 190
Ser Arg Gln Asp Pro Thr Cys Lys Asp Leu Ala Asp Arg Val His Ser
195 200 205
Ile Phe Phe Leu Gly Thr Pro His Arg Gly Ser Asp Leu Ala Val Ile
210 215 220
Leu Lys Arg Leu Ser Val Ile Ala Trp Gly Ser Lys Pro Phe Val Ser
225 230 235 240
Asp Leu Leu Pro Glu Ser Ser Thr Leu Arg Asp Ile Asn Asp Thr Phe
245 250 255
Arg His Tyr Ala Ser Asp Leu Arg Leu Trp Ser Phe Tyr Glu Thr Ile
260 265 270
Pro Ala Lys Pro Arg Ile Leu Asn Lys Ile Val Val Glu Arg His Ser
275 280 285
Ala Thr Leu Gly Tyr Pro Asn Glu Glu Ile Val Ala Met Asn Ala Asp
290 295 300
His Arg Gln Leu Cys Lys Phe Lys Ser Pro Ala Asp Pro Asn Tyr Lys
305 310 315 320
Ile Leu Arg Asn Ala Leu His Thr Ala Ala Asp Met Leu Arg Ser Leu
325 330 335
Pro Pro Leu Ala Leu Ala Pro Leu Glu Pro Arg Ile Asn Leu Ala Ser
340 345 350
Thr Gln Gln His Ser Asn Gln Glu Asn Ala Ser Gln Arg Leu Arg Ser
355 360 365
Phe Leu Gly Val Val Asp Thr Pro Glu Asp Glu Leu His Ile Leu Gln
370 375 380
Leu Phe Gln Glu Pro Gly Ser Cys Arg Trp Phe Ser Glu Ser Lys Asp
385 390 395 400
Phe Val Ser Trp Glu Ser Glu Gly Ser Pro Ser Ile Leu Trp Leu Thr
405 410 415
Gly Arg Pro Ala Ser Gly Lys Ser Val Leu Ser Ser His Val Ile Glu
420 425 430
Gln Val Lys Ser Leu Gly Ala Phe Cys Ser Tyr Phe Phe Phe Lys Gln
435 440 445
Arg Glu Ala Ser Lys Ser Thr Leu Ser Asp Cys Phe Arg Ser Ile Ala
450 455 460
Phe Gln Met Ala Ile Gln Asp Ser Glu Val Met Asn Lys Leu Leu Gln
465 470 475 480
Leu Glu Gly Glu Trp Met Thr Trp Asp Met Ser Asp Glu Leu Ser Val
485 490 495
Trp Arg Arg Leu Phe Val Asn Gly Ile Phe Lys Leu Pro Ser Ile Ser
500 505 510
Gln His Phe Trp Ile Ile Asp Gly Val Asp Glu Cys Ser Asn Phe Asn
515 520 525
Ser Leu Phe Thr Lys Arg Ile Leu Ala Thr Leu Pro Arg Gly Ile Arg
530 535 540
Leu Phe Ala Ser Ser Arg His Leu Glu Glu Ile Arg Arg Gly Leu Ala
545 550 555 560
Pro Leu Glu Ser Arg Val Asn Leu Gln Ser Val Ser Glu Thr Asp Thr
565 570 575
Leu Gly Asp Met Arg Ile Phe Val Thr Ser Lys Leu Arg Gly Leu Asp
580 585 590
Arg Leu Glu Asn Asp Asp Ser Ile Asn Thr Met Cys Glu Lys Ile Leu
595 600 605
Gly Lys Ala Ser Gly Ser Phe Leu Trp Val Arg Leu Val Leu Gln Glu
610 615 620
Phe Glu Asn Ala Trp Thr Ser Glu Ala Met Asp Ala Val Leu Asp Glu
625 630 635 640
Ile Pro Val Asp Leu Gln Asp Met Tyr Arg Arg Met Leu Leu Leu Met
645 650 655
Glu Lys Asp Thr Arg Thr Ile Lys Leu Ala Lys Ser Ile Leu Thr Trp
660 665 670
Ala Val Leu Ala Cys Arg Pro Leu Thr Val Asp Glu Leu Arg Leu Ala
675 680 685
Val Lys Leu Asp Val Asn Glu Thr Leu Gln Ser Val Ser Lys Ala Ile
690 695 700
Pro Ser Leu Cys His Gln Leu Val Phe Val Asp Ser Ala Asn Arg Val
705 710 715 720
His Ile Leu His Ala Thr Ala Arg Glu Phe Leu Leu Asp Glu Thr Leu
725 730 735
Gln Ser Glu Phe Ala Leu His Gly Val Glu Lys His Ala Ser Leu Gly
740 745 750
Ser Leu Leu Leu Arg Tyr Leu Thr Asn Thr Ala Phe Lys Phe Arg Ala
755 760 765
Pro Pro Arg Arg Gln Gly Ser Gly Phe Arg Gly Phe Ala Lys Pro Val
770 775 780
His Ser Val Ser Pro Asp Leu Ser Leu Leu Asp Tyr Ala Ala Cys Phe
785 790 795 800
Phe Ser Glu His Ile Tyr Arg Gly Ala Ser Arg Asp Asp Thr Leu Met
805 810 815
Ala Glu Leu Cys Ala Phe Leu Lys Gly Arg Thr Ile Leu Ser Trp Ile
820 825 830
Glu His Ile Ala Arg Asn Gly Asp Leu Gly Gly Ile Thr Arg Thr Ala
835 840 845
Thr Asp Leu Arg Gly Tyr Leu Gly Arg Lys Leu Glu His Leu Pro Pro
850 855 860
Thr Asp Pro Ser Ala Tyr Leu Val Asp Cys Trp Val Ala Asp Leu Ile
865 870 875 880
Arg Val Ala Ala Lys Phe Arg Phe Gln Leu Leu Thr Cys Pro Ser Ser
885 890 895
Ile His Tyr Ile Ile Pro Ser Phe Cys Pro Ser Asp Thr Ile Ile Ser
900 905 910
Arg Thr Phe Ala Asn Gly Thr Arg Pro Ser Thr Ile Thr Val Lys Gly
915 920 925
Ile Pro Gln Ala Thr Trp Asp Asp Cys Leu Thr Arg Ile Asp Phe Glu
930 935 940
Arg Gly Arg Ala Thr Ala Leu Ser Tyr Gly Thr Gln Phe Phe Ala Val
945 950 955 960
Gly Leu Ser Thr Gly Gln Ile Ser Leu Phe Asp Pro His Ser Val Gln
965 970 975
Pro Val Ala Asn Leu Val His Pro Glu Arg Val Lys Met Leu Glu Phe
980 985 990
Ser Ser Asp Gly Glu Tyr Leu Ala Ser Ser Gly Thr Arg Thr Leu Leu
995 1000 1005
Val Trp Gln Pro Lys Cys Gly Met Gln Lys Leu Ser Phe Pro Leu
1010 1015 1020
Gln Ser Glu Leu Ile Ala Phe Val Phe Leu Ser Gly Asp Glu Phe
1025 1030 1035
Leu Cys Ala Phe Ala Ser Gly Glu Leu Thr Lys Trp Arg Leu Asp
1040 1045 1050
Thr Gly Glu His Glu Thr Ile Ser Trp Arg Ser Met Cys Asp Thr
1055 1060 1065
Asp Ile Thr Gly Thr Leu Asp Ile Pro Glu Gln Pro Pro Ser Cys
1070 1075 1080
Ala Ala Phe Ser Thr Gly Gly Glu Thr Val Leu Leu Ala Val Gly
1085 1090 1095
Tyr Arg Lys Tyr Pro Ile Phe Ile Trp Asp Ala Leu Glu Leu Gln
1100 1105 1110
Leu Leu Gly Gln Cys Gly Ala Asp Glu Asn Asn Gly Ile Asp Asp
1115 1120 1125
Met Thr Phe Asn Pro Asn Pro Glu Ile Ser Ala Leu Val Val Ser
1130 1135 1140
Tyr Asn Asp Gly Arg Leu Cys Leu Phe Asp Tyr Thr Thr Met Met
1145 1150 1155
Pro Thr Phe Thr Arg Gln Ser Val Phe Ala Asn Ser Ile Ala Cys
1160 1165 1170
Ser Pro Asp Gly Arg Ser Leu Val Thr Gly Ser Val Arg Gly Ile
1175 1180 1185
Ile Glu Val Phe Lys Phe Asp Gln Asp His Thr Gly Asn Thr Val
1190 1195 1200
Leu Val Pro Ile Tyr Asn Ile Gln Ala Leu Asp Asp Ser Ile Arg
1205 1210 1215
Ser Val Ala Phe Ser Ala Asp Gly Leu Arg Phe Val Asp Leu His
1220 1225 1230
Asp Gln Gln Cys Arg Ile Trp Ala Pro Val Ser Leu Met Arg Lys
1235 1240 1245
Asp Asn Glu Leu Glu Ser Val Ser Gly Ile Ala Pro Leu Pro Ala
1250 1255 1260
Lys Ile Val Thr Met Ala Asp Asp Ser Asn Ile Thr Glu Ile Thr
1265 1270 1275
Ser Ala Leu Ala Val Ser Ser Asn Gly Gly Arg Val Ile Ala Gly
1280 1285 1290
Lys Ser Asn Gly Glu Val Ser Ala Phe Ser Ala Val Asp Gly Lys
1295 1300 1305
Glu Leu Gly Val Leu Tyr Ser His Gly Arg Cys Val Ser Val Val
1310 1315 1320
Asn Val Thr Leu Gly Glu Ala Arg Asn Leu Val Ile Ser Ala Asp
1325 1330 1335
Asp Ala Gly Arg Val Leu Val Val Glu Leu Thr Thr Cys Leu Pro
1340 1345 1350
Ala Ser Ser Ala Ala Gln Lys Leu Pro Ala Ala His Val Ile Leu
1355 1360 1365
Glu Arg Arg Phe Gly Ala Ala Val Val Gly Leu Leu Val Asn Pro
1370 1375 1380
Ser Val Asp Arg Leu Leu Ile Ser Gly Arg His Val Asp Glu Leu
1385 1390 1395
Cys Asp Leu Pro Ser Gly Arg Val Leu Gly Ser Ile Ser His Val
1400 1405 1410
Val Gly Thr Ala Thr Ser Thr Arg Ala Val Ala Phe Gln His Pro
1415 1420 1425
Ala Asn Glu Ala Trp Ile Val Leu Met Leu Thr Asn Thr Ala Arg
1430 1435 1440
Val Phe Arg Trp Ser Asp Phe Gln Glu Leu Thr Thr Val Asn Gly
1445 1450 1455
Ile Leu Leu Arg Lys Pro Ser Thr Ala Val Glu Ala Pro Leu Pro
1460 1465 1470
Thr His Ser Arg Ala Leu Lys Thr Pro Thr Thr Leu Ser Ser Ser
1475 1480 1485
Tyr His Phe Arg Gln Asp Phe Val Leu Glu Leu Leu Arg Ile Ser
1490 1495 1500
Pro Ser Val Ala Pro Arg Leu Tyr Val Trp Pro Val Ser Ala Phe
1505 1510 1515
Asp Pro Ala Thr Ala Gln Pro Asp His Arg Ala Gln Val Pro Arg
1520 1525 1530
Glu Val Asn Leu Asp Ala Ile Asn Ala Gly Ile Leu Ala Val Leu
1535 1540 1545
Gly Ile Val Gly Gln Ser Thr Val Leu Leu Met Asp Ala Asn Leu
1550 1555 1560
Trp Val Tyr Ser Met Glu Leu Arg Pro Thr Gln Ala Thr Pro Gln
1565 1570 1575
Ala His Pro Gly Phe Pro Pro Glu Thr Thr Ile Val Gln Asp Gly
1580 1585 1590
Pro Glu Pro Ile Thr Gln Gln Ile Leu Pro Val Phe Thr Arg Arg
1595 1600 1605
His Phe Phe Ala Leu Ser Glu Trp Arg Thr Ala Gly Glu Glu Leu
1610 1615 1620
Arg Cys Ala Val Ala Gln His Ser Gly Gly Pro Ser Phe Ile Phe
1625 1630 1635
Ala Ser Arg Gln Tyr Ile Val Val Val Gln Gly Gly Leu Glu Phe
1640 1645 1650
Ser Glu Asp Met Ala Val Gly Gln Gln Ser Ala
1655 1660

Claims (19)

1.一种分离的多肽,其包含选自NodW(SEQ ID NO:3)、NodR(SEQ ID NO:6)、NodJ(SEQID NO:21)、NodY1(SEQ ID NO:27)、NodY2(SEQ ID NO:36)、NodX(SEQ ID NO:9)、NodM(SEQID NO:12)、NodB(SEQ ID NO:15)、NodO(SEQ ID NO:18)、NodC(SEQ ID NO:24)、NodD2(SEQID NO:30)、NodD1(SEQ ID NO:33)、NodZ(SEQ ID NO:39)和NodS(SEQ ID NO:50)的氨基酸序列,或其有功能的变体或片段。
2.一种分离的多核苷酸,其编码权利要求1所述的多肽。
3.一种分离的多核苷酸,其与选自SEQ ID NO:1、2、4、5、19、20、25、26、34、35、7、8、10、11、13、14、16、17、22、23、28、29、31、32、37、38、48和49的核酸序列具有至少70%、优选地至少80%、优选地至少90%、优选地至少95%、优选地99%的核酸序列一致性。
4.一种转录单位(TU),其包含至少一种权利要求3所述的分离的多核苷酸。
5.一种载体,其编码权利要求1所述的分离的多肽。
6.一种载体,其包含权利要求2或3所述的分离的多核苷酸或权利要求4所述的TU。
7.一种分离的宿主细胞,其包含权利要求1所述的分离的多肽、权利要求2或权利要求3所述的分离的多核苷酸、权利要求4所述的TU和/或权利要求5或权利要求6所述的载体。
8.一种制造至少一种多节孢酸(Nodulisporic acid)(NA)的方法,所述方法包括在分离的宿主细胞中异源表达至少一种权利要求1所述的分离的多肽、权利要求2或权利要求3所述的分离的多核苷酸、权利要求4所述的TU和/或权利要求5或权利要求6的载体。
9.一种来自于Hypoxylon spp.的分离的多肽或其有功能的片段或变体,其催化从3-香叶基香叶基吲哚(GGI)2产生NAA 10的生物合成途径中的生物化学反应。
10.一种分离的多核苷酸,其编码来自于Hypoxylon spp.,催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应的至少一种多肽或其有功能的变体或片段。
11.一种制造至少一种Hypoxylon spp.多肽或其有功能的变体或片段的方法,所述方法包括在分离的宿主细胞中异源表达权利要求2或权利要求3所述的分离的多核苷酸或权利要求5或权利要求6所述的载体。
12.一种制造至少一种NA的方法,所述方法包括在分离的宿主细胞中异源表达催化从GGI 2产生NAA 10的生物合成途径中的生物化学反应的至少一种多肽。
13.一种分离的宿主细胞,其表达至少一种异源多肽,所述多肽催化导致从GGI 2形成NAA 10的生物合成途径中的底物的转化。
14.一种分离的宿主细胞,其通过异源表达产生参与从GGI 2产生NAA 10的生物合成途径的至少一种多肽。
15.一种生产至少一种NA的方法,所述方法包括将包含糖类的底物与用核酸转化的重组细胞相接触,所述转化导致所述重组细胞与转化之前的细胞相比选自SEQ ID NO:3、6、21、27、36、9、12、15、18、24、30、33、39和50的多肽或其有功能的变体或片段的活性水平提高,使得所述底物被代谢成至少一种NA。
16.一种分离的Hypoxylon pulicicidum菌株,其包含编码产生NAA10的生物合成途径中的酶的至少一种异源核酸序列。
17.一种分离的Hypoxylon pulicicidum菌株,其表达至少两种不同的GGPPS酶。
18.一种分离的Hypoxylon pulicicidum菌株,其包含引起NAA 10的生物合成增加的遗传修饰。
19.一种制造NAA 10的方法,所述方法包括在Hypoxylon pulicicidum中表达至少一种异源核酸序列,其中所述至少一种异源核酸序列编码产生NAA 10的生物合成途径中的酶。
CN201880073882.0A 2017-09-29 2018-09-28 多节孢酸(Nodulisporic acid)的异源生物合成 Pending CN111542602A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2017903956A AU2017903956A0 (en) 2017-09-29 Heterologous biosynthesis of nodulisporic acid
AU2017903956 2017-09-29
PCT/IB2018/057528 WO2019064243A1 (en) 2017-09-29 2018-09-28 HETEROLOGICAL BIOSYNTHESIS OF NODULISPORIC ACID

Publications (1)

Publication Number Publication Date
CN111542602A true CN111542602A (zh) 2020-08-14

Family

ID=65901342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880073882.0A Pending CN111542602A (zh) 2017-09-29 2018-09-28 多节孢酸(Nodulisporic acid)的异源生物合成

Country Status (11)

Country Link
US (2) US11453882B2 (zh)
EP (1) EP3688174A4 (zh)
JP (1) JP2021500868A (zh)
CN (1) CN111542602A (zh)
AU (1) AU2018343310B2 (zh)
BR (1) BR112020006214A2 (zh)
CA (1) CA3076164A1 (zh)
CL (1) CL2020000814A1 (zh)
MX (1) MX2020003367A (zh)
WO (1) WO2019064243A1 (zh)
ZA (1) ZA202002050B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114940980A (zh) * 2022-06-02 2022-08-26 暨南大学 一类倍半萜聚酮合成基因及其应用
CN114350524B (zh) * 2022-01-07 2024-04-23 暨南大学附属第一医院(广州华侨医院) Mycoleptodiscin型吲哚倍半萜化合物、其生物合成方法及其用途

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1184423A (zh) * 1995-03-20 1998-06-10 麦克公司 球孢子酸衍生物
CN1700859A (zh) * 2002-10-02 2005-11-23 梅瑞尔有限公司 抗寄生虫的Nodulisporic acid衍生物点注制剂
US20070218461A1 (en) * 2003-12-22 2007-09-20 Bryan Gregory T Indole-Diterpene Biosynthesis
CN102272105A (zh) * 2008-11-14 2011-12-07 梅里亚有限公司 对映异构富集的芳基并唑-2-基氰基乙氨基杀寄生物化合物

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5399582A (en) 1993-11-01 1995-03-21 Merck & Co., Inc. Antiparasitic agents
US5792294A (en) 1995-11-16 1998-08-11 Otis Elevator Company Method of replacing sheave liner

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1184423A (zh) * 1995-03-20 1998-06-10 麦克公司 球孢子酸衍生物
CN1700859A (zh) * 2002-10-02 2005-11-23 梅瑞尔有限公司 抗寄生虫的Nodulisporic acid衍生物点注制剂
US20070218461A1 (en) * 2003-12-22 2007-09-20 Bryan Gregory T Indole-Diterpene Biosynthesis
CN102272105A (zh) * 2008-11-14 2011-12-07 梅里亚有限公司 对映异构富集的芳基并唑-2-基氰基乙氨基杀寄生物化合物

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GERALD F. BILLS: "Hypoxylon pulicicidum sp. nov. (Ascomycota, Xylariales), a Pantropical Insecticide-Producing Endophyte", PLOS ONE, 9 October 2012 (2012-10-09) *
KYLE C. VAN DE BITTNER: "Heterologous Biosynthesis of Nodulisporic Acid F", J. AM. CHEM. SOC, 28 December 2017 (2017-12-28) *
L. K. MCMILLAN: "Molecular analysis of two cytochrome P450 monooxygenase genes required for paxilline biosynthesis in Penicillium paxilli, and effects of paxilline intermediates on mammalian maxi-K ion channels", MOLECULAR GENETICS AND GENOMICS, 18 July 2003 (2003-07-18) *
NICHOLSON, M.J等: "cytochrome P450 oxygenase [Hypoxylon pulicicidum] ,GenBank: AUM60065.1", GENBANK DATABASE, 10 January 2018 (2018-01-10) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114350524B (zh) * 2022-01-07 2024-04-23 暨南大学附属第一医院(广州华侨医院) Mycoleptodiscin型吲哚倍半萜化合物、其生物合成方法及其用途
CN114940980A (zh) * 2022-06-02 2022-08-26 暨南大学 一类倍半萜聚酮合成基因及其应用
CN114940980B (zh) * 2022-06-02 2023-11-21 暨南大学 一类倍半萜聚酮合成基因及其应用

Also Published As

Publication number Publication date
EP3688174A4 (en) 2021-09-08
CL2020000814A1 (es) 2020-12-18
CA3076164A1 (en) 2019-04-04
US11453882B2 (en) 2022-09-27
US20230365976A1 (en) 2023-11-16
ZA202002050B (en) 2023-08-30
US20200299700A1 (en) 2020-09-24
AU2018343310A1 (en) 2020-04-23
MX2020003367A (es) 2020-07-29
EP3688174A1 (en) 2020-08-05
AU2018343310B2 (en) 2023-11-30
BR112020006214A2 (pt) 2020-12-01
WO2019064243A1 (en) 2019-04-04
JP2021500868A (ja) 2021-01-14

Similar Documents

Publication Publication Date Title
Fleetwood et al. A complex ergovaline gene cluster in Epichloë endophytes of grasses
AU2019253858B2 (en) Novel cytochrome p450 fusion protein
Wiemann et al. Biosynthesis of the red pigment bikaverin in Fusarium fujikuroi: genes, their function and regulation
EP3475417B1 (en) Compositions and methods for making benzylisoquinoline alkaloids, morphinan alkaloids, thebaine, and derivatives thereof
US20230365976A1 (en) Heterologous biosynthesis of nodulisporic acid
US10900056B2 (en) Use of octaketide synthases to produce kermesic acid and flavokermesic acid
Tsunematsu et al. Yeast-based genome mining, production and mechanistic studies of the biosynthesis of fungal polyketide and peptide natural products
JP4817590B2 (ja) ビオプテリン類の製造方法
Li et al. Towards understanding the biosynthetic pathway for ustilaginoidin mycotoxins in Ustilaginoidea virens
US10519460B2 (en) Use of heterologous expressed polyketide synthase and small molecule foldases to make aromatic and cyclic compounds
Yoshimi et al. Heterologous production of a novel cyclic peptide compound, KK-1, in Aspergillus oryzae
CN110691850A (zh) 生产折叶苔醇和/或补身醇的方法
CN107574178B (zh) 真菌人工染色体、组成、方法和用途
Wu et al. Identification of a Prunus MAX1 homolog as a unique strigol synthase
US10246697B2 (en) Colistin synthetases and corresponding gene cluster
CN114657155B (zh) 一种新型的非核糖体多肽合成酶拆分表达方法
Yu et al. High frequency of homologous gene disruption by single-stranded DNA in the taxol-producing fungus Pestalotiopsis microspora
US10550409B2 (en) Drimenol synthases III
JP5911071B2 (ja) プロトイルデンシンターゼ
Chang et al. The Aspergillus flavus fluP-associated metabolite promotes sclerotial production
Nusblat et al. C-5 (6) sterol desaturase from Tetrahymena thermophila: gene identification and knockout, sequence analysis, and comparison to other C-5 (6) sterol desaturases
Geistodt-Kiener et al. Yeast-based heterologous production of the Colletochlorin family of fungal secondary metabolites
Schüller et al. Genome analysis and elucidation of the biosynthetic pathway for the cRAS inhibitor rasfonin in Cephalotrichum gorgonifer
Edwards The Isolation and Characterization of a Putative p-Aminobenzoate Biosynthetic Gene in
JP2017503504A (ja) メレオライド生合成遺伝子クラスターおよびその使用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination