CN106488982A - 酶组合物及其用途 - Google Patents

酶组合物及其用途 Download PDF

Info

Publication number
CN106488982A
CN106488982A CN201580029529.9A CN201580029529A CN106488982A CN 106488982 A CN106488982 A CN 106488982A CN 201580029529 A CN201580029529 A CN 201580029529A CN 106488982 A CN106488982 A CN 106488982A
Authority
CN
China
Prior art keywords
seq
sequence
mature polypeptide
following
cellobiohydrolase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580029529.9A
Other languages
English (en)
Inventor
J·沙斯基
D·亚沃尔
D·莫耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Priority to CN202211411284.4A priority Critical patent/CN115975994A/zh
Publication of CN106488982A publication Critical patent/CN106488982A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0065Oxidoreductases (1.) acting on hydrogen peroxide as acceptor (1.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y111/00Oxidoreductases acting on a peroxide as acceptor (1.11)
    • C12Y111/01Peroxidases (1.11.1)
    • C12Y111/01006Catalase (1.11.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01037Xylan 1,4-beta-xylosidase (3.2.1.37)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01176Cellulose 1,4-beta-cellobiosidase (reducing end)(3.2.1.176)
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2201/00Pretreatment of cellulosic or lignocellulosic material for subsequent enzymatic treatment or hydrolysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2203/00Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Detergent Compositions (AREA)

Abstract

本发明涉及酶组合物以及生产这些组合物和使用这些组合物用于木质纤维素材料的糖化的方法。

Description

酶组合物及其用途
对序列表的引用
本申请包括计算机可读形式的序列表,将其通过引用结合在此。
发明背景
发明领域
本发明涉及酶组合物、生产这些酶组合物的重组真菌宿主细胞、以及生产和使用这些酶组合物的方法。
相关领域描述
作为世界上最大规模的可再生生物质资源的木质纤维素主要由木质素、纤维素、和半纤维素构成。纤维素是由β-1,4-键连接的葡萄糖(称为β-连接的葡聚糖)的聚合物。半纤维素由木聚糖构成,木聚糖是由1,4-β-糖苷-连接的D-吡喃木糖形成的多糖。
许多微生物产生水解这些β-连接的葡聚糖和木聚糖的酶。内切葡聚糖酶在任意位置消化该纤维素聚合物,使其易受纤维二糖水解酶的攻击。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是葡萄糖的水溶性β-1,4-连接的二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。木聚糖酶(例如,内切-1,4-β-木聚糖酶,EC 3.2.1.8)水解木聚糖中的内部β-1,4-木糖苷键(xylosidic linkage),以产生较小分子量的木糖和木-低聚体。β-木糖苷酶催化短β(1→4)-低聚木糖的外切水解,以将连续的D-木糖残基从非还原端移除。
将木质纤维素原料转化为乙醇具有如下优点,即大量原料的可获得性、避免燃烧或填埋材料的可取性、以及乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转变成葡萄糖,就容易通过酵母将葡萄糖发酵成乙醇。
在本领域,存在对如下新的酶组合物的需求,该新的酶组合物能更有效地解构纤维素或半纤维素材料。
本发明提供酶组合物以及生产和使用这些酶组合物的方法。
发明概述
本发明涉及酶组合物,这些酶组合物包括:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶;
其中该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:2的成熟多肽或由其组成的纤维二糖水解酶I;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶I,该氨基酸序列与SEQ ID NO:2的成熟多肽具有至少70%序列一致性;(iii)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少70%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下,例如非常高严格条件下,与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交;
其中该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的纤维二糖水解酶II;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶II,该氨基酸序列与SEQ ID NO:4的成熟多肽具有至少70%序列一致性;(iii)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如非常高严格条件下,与SEQ IDNO:3的成熟多肽编码序列或其全长互补体杂交;
其中该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:6的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:6的成熟多肽具有至少70%序列一致性;(iii)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列一致性;和(iv)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下,例如非常高严格条件下,与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交;
其中该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:10的成熟多肽或由其组成的、或者包含SEQ ID NO:12的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:10的成熟多肽或SEQ IDNO:12的成熟多肽具有至少70%序列一致性;(iii)由包含如下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列具有至少70%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下,例如非常高严格条件下,与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列或者其全长互补体杂交;并且
其中该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:14的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:14的成熟多肽具有至少70%序列一致性;(iii)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:13的成熟多肽编码序列具有至少70%序列一致性;和(iv)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下,例如非常高严格条件下,与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交。在一方面,这些酶组合物进一步包含内切葡聚糖酶I。在另一方面,这些酶组合物进一步包含内切葡聚糖酶II。在另一方面,这些酶组合物进一步包含内切葡聚糖酶I和内切葡聚糖酶II。在另一方面,这些酶组合物进一步或甚至进一步包含过氧化氢酶。
本发明还涉及重组真菌宿主细胞,包括编码本发明的这些酶组合物的多核苷酸。
本发明还涉及生产酶组合物的方法,这些方法包括:(a)在有益于生产该酶组合物的条件下培养本发明的一种或多种(例如,若干种)真菌宿主细胞;并且任选地(b)回收该酶组合物。
本发明还涉及用于降解纤维素或半纤维素材料的方法,这些方法包括:用本发明的酶组合物处理该纤维素或半纤维素材料。在一方面,这些方法进一步包括回收该降解的纤维素或半纤维素材料。
本发明还涉及用于产生一种发酵产物的方法,这些方法包括:(a)用本发明的酶组合物糖化纤维素或半纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵经糖化的纤维素或半纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
本发明进一步涉及发酵纤维素或半纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素或半纤维素材料,其中该纤维素或半纤维素材料被本发明的酶组合物糖化。在一方面,发酵纤维素或半纤维素材料产生发酵产物。在另一方面,这些方法进一步包括从该发酵中回收该发酵产物。
附图简要说明
图1示出质粒pJfyS159的限制性图谱。
图2示出质粒pGMEr169的限制性图谱。
图3示出质粒pJfyS157的限制性图谱。
图4示出质粒pAyGm10的限制性图谱。
图5示出质粒pQM35的限制性图谱。
图6示出质粒pSMai139的限制性图谱。
图7示出质粒pSMai143的限制性图谱。
图8示出质粒pAG122的限制性图谱。
图9示出质粒pAgJg131的限制性图谱。
图10示出质粒pLAQ564的限制性图谱。
图11示出质粒pSaMe-TaCat的限制性图谱。
图12显示,在50℃和pH 5.0下,持续5天,通过CTec2,将葡聚糖(预处理的玉米秸秆)与如下酶组合物相比较,该酶组合物包含以下各项:SEQ ID NO:2的纤维二糖水解酶I、SEQ ID NO:4的纤维二糖水解酶II、SEQ ID NO:16的内切葡聚糖酶、SEQ ID NO:18的内切葡聚糖酶、SEQ ID NO:36的β-葡糖苷酶变体、具有SEQ ID NO:8的纤维素水解增强活性的AA9(GH61)多肽、SEQ ID NO:34的过氧化氢酶、SEQ ID NO:10的GH10木聚糖酶、以及SEQID NO:14的β-木糖苷酶(“酶混合物1”)。
图13显示,在50℃和pH 5.0下,持续5天,通过CTec2,将葡聚糖(预处理的玉米秸秆)与如下酶组合物相比较,该酶组合物包含以下各项:SEQ ID NO:2的纤维二糖水解酶I、SEQ ID NO:4的纤维二糖水解酶II、SEQ ID NO:16的内切葡聚糖酶、SEQ ID NO:18的内切葡聚糖酶、SEQ ID NO:36的β-葡糖苷酶变体、具有SEQ ID NO:8的纤维素水解增强活性的AA9(GH61)多肽、SEQ ID NO:10的GH10木聚糖酶、以及SEQ ID NO:14的β-木糖苷酶(“酶混合物2”)。
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指羧基酯酶(EC 3.1.1.72),其催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthyl acetate)和对硝基苯乙酸酯(p-nitrophenyl acetate)的水解。可以在含有0.01%TWEENTM 20(聚氧乙烯脱水山梨糖醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM对硝基苯基乙酸酯作为底物来测定乙酰木聚糖酯酶活性。将一个单位的乙酰木聚糖酯酶定义为在pH 5、25℃下每分钟能够释放1微摩尔对硝基酚根阴离子的酶的量。
等位基因变体:术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个(若干个)替代形式中的任一种。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽方面无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指一种α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55),其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、包含(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。可以使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.),爱尔兰威克洛郡布瑞公司(Bray,Co.Wicklow,Ireland)以总体积200μl在40℃下持续30分钟,接着通过HPX-87H柱层析(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),赫拉克勒斯,加州,美国)进行阿拉伯糖分析来测定α-L-阿拉伯呋喃糖苷酶活性。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”是指可催化α-D-葡萄糖苷酸水解成为D-葡萄糖醛酸酯和醇的一种α-D-葡萄糖苷酸葡萄糖醛酸水解酶(EC 3.2.1.139)。可以根据德弗里斯(de Vries),1998,细菌学杂志(J.Bacteriol.)180:243-249来测定α-葡糖醛酸糖苷酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。
辅助活性9多肽:该术语“辅助活性9多肽”或“AA9多肽”意指分类为溶解性多糖单加氧酶(lytic polysaccharide monooxygenase)(昆兰(Quinlan)等人,2011,美国科学院院刊(Proc.Natl.Acad.Sci.USA)208:15079-15084;菲利普斯(Phillips)等人,2011,ACS化学生物学(ACS Chem.Biol.)6:1399-1406;林(Lin)等人,2012,结构(Structure)20:1051-1061)的多肽。根据亨利萨特(Henrissat),1991,生物化学杂志(Biochem.J.)280:309-316;以及亨利萨特和贝洛赫(Bairoch),1996,生物化学杂志316:695-696,AA9多肽之前被分类为糖苷水解酶家族61(GH61)。
AA9多肽通过具有纤维素分解活性的酶(例如,纤维素酶组合物)增强纤维素材料的水解。可以通过测量在以下条件下来自由该纤维素分解酶水解该纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来测定纤维素分解增强活性:1-50mg总蛋白/g预处理的玉米秸秆(PCS)中的纤维素,其中总蛋白包括50%-99.5%w/w纤维素分解酶蛋白和0.5%-50%w/w AA9多肽蛋白,在适合的温度(例如40℃-80℃,如40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)和适合的pH(例如,4-9,如4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下持续1-7天,与不具有纤维素分解增强活性的相等的总蛋白负载的对照水解(1-50mg纤维素分解蛋白/gPCS中的纤维素)进行比较。
可以使用1.5L(诺维信公司,巴格斯瓦德丹麦)和β-葡糖苷酶的混合物作为纤维素分解活性的来源来测定AA9多肽增强活性,其中该β-葡糖苷酶是以纤维素酶蛋白负载的至少2%-5%蛋白的重量存在的。在一方面,该β-葡糖苷酶是米曲霉β-葡糖苷酶(例如,根据WO 02/095014,在米曲霉中重组产生的)。在另一方面,该β-葡糖苷酶是烟曲霉β-葡糖苷酶(例如,如在WO 02/095014中描述的,在米曲霉中重组产生的)。
AA9多肽增强活性还可通过以下来确定:在40℃下将AA9多肽与0.5%磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶、以及0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时,接着测定从PASC释放的葡萄糖。
还可以根据WO 2013/028928测定高温组合物的AA9多肽增强活性。
AA9多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。
根据WO 2008/151043或WO 2012/122518,AA9多肽也可以在可溶性活化二价金属阳离子(例如锰或铜)的存在下使用。
该AA9多肽还可以在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料或半纤维素材料(如预处理的玉米秸杆)获得的液体的存在下使用(WO 2012/021394、WO 2012/021395、WO 2012/021396、WO 2012/021399、WO 2012/021400、WO 2012/021401、WO 2012/021408、以及WO 2012/021410)。
天冬氨酸蛋白酶:该术语“天冬氨酸蛋白酶”意指涉及一个或多个天冬氨酸残基以催化肽和蛋白中的肽键水解的蛋白酶。天冬氨酸蛋白酶是蛋白酶家族,这些蛋白酶通常在其活性位点具有两个高度保守的天冬氨酸,并且在酸性pH下具有最佳活性(思泽茨斯(Szecsi),1992,《斯堪的纳维亚临床和实验室调查杂志》(Scand.J.Clin.Lab.In vest.)增刊210:5-22)。根据由相川(Aikawa)等人,2001,生物化学杂志(J.Biochem.)129:791-794描述的程序,可以确定天冬氨酸蛋白酶的活性。
β-葡糖苷酶:术语“β-葡糖苷酶”意指一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。可以根据文丘里(Venturi)等人,2002,基础微生物学杂志(J.Basic Microbiol.)42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来测定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、pH 4.8下,在含有0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
β-木糖苷酶:该术语“β-木糖苷酶”意指催化短β-(1→4)-寡聚木糖的外切水解,以从非还原末端除去连续的D-木糖残基的β-D-木糖苷木糖水解酶(E.C.3.2.1.37)。可以在包含0.01%20的100mM柠檬酸钠中,在pH 5、40℃下,使用1mM对硝基苯基-β-D-木糖苷作为底物确定β-木糖苷酶活性。将一个单位的β-木糖苷酶定义为在40℃、pH 5下,在含有0.01%20的100mM柠檬酸钠中从1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。
过氧化氢酶:术语“过氧化氢酶”表示过氧化氢:过氧化氢氧化还原酶(EC3.1.11.1.6),该酶催化2H2O2转化为O2+2H2O。出于本发明的目的,根据美国专利编号5,646,025确定过氧化氢酶活性。一个单位的过氧化氢酶活性等于在测定条件下催化1微摩尔的过氧化氢氧化的酶的量。
cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
纤维二糖水解酶:该术语“纤维二糖水解酶”意指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖、或任何含有β-1,4-连接葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从而从链的还原性末端(纤维二糖水解酶I)或非还原性末端(纤维二糖水解酶II)释放纤维二糖(泰里(Teeri),1997,生物技术趋势(Trends in Biotechnology)15:160-167;泰里等人,1998,生物化学学会会刊(Biochem.Soc.Trans.)26:173-178)。可以根据里弗(Lever)等人,1972,分析生物化学(Anal.Biochem.)47:273-279;范·帝伯赫(van Tilbeurgh)等人,1982,欧洲生化学会联合会快报(FEBS Letters),149:152-156;范·帝伯赫和克莱森斯(Claeyssens),1985,欧洲生化学会联合会快报,187:283-288;以及汤美(Tomme)等人,1988,欧洲生物化学杂志(Eur.J.Biochem.)170:575-581所描述的程序来测定纤维二糖水解酶活性。
纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如,若干种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶,纤维二糖水解酶,β-葡糖苷酶,或其组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测定总纤维素分解酶活性,以及(2)测定个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如在张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481中所述的。可使用不溶性底物,包括沃特曼(Whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等,测量总纤维素分解酶活性。最常见的总纤维素分解活性测定是将瓦特曼№1滤纸用作底物的滤纸测定。该测定法是由国际纯粹与应用化学联合会(IUPAC)建立的(高斯(Ghose),1987,纯粹与应用化学(Pure Appl.Chem.)59:257-68)。
可以通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比,在一种或多种纤维素分解酶对纤维素材料的水解过程中产生/释放的糖的增加来测定纤维素分解酶活性:1-50mg的纤维素分解酶蛋白/g于预处理的玉米秸秆(PCS)中的纤维素(或其他预处理的纤维素材料),在适合的温度(如40℃-80℃,例如40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)和适合的pH(如4-9,例如,4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下持续3-7天。典型条件为:1ml反应,洗涤或未洗涤的PCS,5%不溶性固体(干重),50mM乙酸钠(pH 5),1mM MnSO4,50℃、55℃或60℃,72小时,通过HPX-87H柱层析(伯乐实验室有限公司,赫拉克勒斯,加州,美国)进行糖分析。
纤维素材料:术语“纤维素材料”意指含有纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也包含多糖,并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物,因此是线性β-(l-4)-D-葡聚糖,而半纤维素包括多种化合物,如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多态的,但发现其在植物组织中主要以平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键合至纤维素以及其他半纤维素,这有助于稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮、以及穗轴,或树的叶、枝、以及木材中。纤维素材料可以是,但不限于:农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、和木材(包括林业废弃物)(参见例如维塞劳格尔(Wiselogel)等人,1995,生物乙醇手册(Handbook on Bioethanol)(查尔斯E.怀曼(Charles E.Wyman),编著)中,第105-118页,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区;怀曼(Wyman),1994,生物资源技术(Bioresource Technology)50:3-16;林德(Lynd),1990,应用生物化学与生物技术(Applied Biochemistry and Biotechnology)24/25:695-719;马塞尔(Mosier)等人,1999,木质纤维素的生物转化的最近进展,生物化学工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology),斯卡皮尔(T.Scheper),总编辑,第65卷,第23-40页,施普林格出版公司(Springer-Verlag),纽约)。在此应该理解的是,纤维素可以处于木素纤维素,在混合基质中含有木质素、纤维素、和半纤维素的植物细胞壁材料的形式。在一方面,该纤维素材料是任何生物质材料。在另一方面,该纤维素材料是木质纤维素,该木质纤维素包括纤维素、半纤维素、以及木质素。
在一个实施例中,该纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸或木材(包括林业废弃物)。
在另一个实施例中,该纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、甘蔗秸秆、柳枝稷或麦秸。
在另一个实施例中,该纤维素材料是山杨、桉树、冷杉、松树、白杨、云杉或柳树。
在另一个实施例中,该纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如,)、或经磷酸处理的纤维素。
在另一个实施例中,该纤维素材料是一种水生生物质。如在此所用的,术语“水生生物质(aquatic biomass)”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可以是藻类、挺水植物、浮叶植物、或沉水植物。
纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理,如在此所描述。在优选方面中,对该纤维素材料进行预处理。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
对照序列:术语“控制序列”是指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
内切葡聚糖酶:该术语“内切葡聚糖酶”意指4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3-1,4葡聚糖如谷物β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)。还可以根据高斯(Ghose),1987,纯粹与应用化学(Pure and Appl.Chem.)59:257-268的程序,在pH 5、40℃下,使用羧甲基纤维素(CMC)作为底物测定内切葡聚糖酶活性。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指一种直链或环状DNA分子,该分子包括编码一种多肽的一种多核苷酸并且可操作地连接至提供用于其表达的控制序列。
阿魏酸酯酶:术语“阿魏酸酯酶”意指一种4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC 3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(FAE)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。可以在50mM乙酸钠(pH 5.0)中,使用0.5mM对硝基苯基阿魏酸酯作为底物测定对阿魏酰酯酶活性。一个单位的阿魏酸酯酶等于,在pH 5,25℃,每分钟能够释放1μmol的对硝基酚根阴离子的酶的量。
片段:该术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有酶活性。在一个方面中,片段包含酶的成熟多肽的至少85%,例如至少90%或至少95%的氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”是指水解半纤维素材料的一种或多种(例如,若干种)酶。参见例如,沙鲁姆(Shallom)和沙哈姆(Shoham),2003,微生物学当前观点(Current Opinion In Microbiology)6(3):219-228)。半纤维素酶是在植物生物质的降解中的关键组分。半纤维素酶的实例包括但不限于,乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。这些酶的底物半纤维素是支链和直链多糖的异质性组,其可通过氢键与植物细胞壁中的纤维素微纤维相结合,交联成坚固的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),或是水解乙酸或阿魏酸侧基的酯键的碳水化合物酯酶(CE)。这些催化模块基于它们一级序列的同源性,可以被分配到GH和CE家族中。具有总体相似的折叠的一些家族可以进一步被分组为以字母标记的氏族(例如,GH-A)。这些和其他碳水化合物活性酶的最具信息性和最新的分类可在碳水化合物活性酶(Carbohydrate-Active Enzymes)(CAZy)数据库中获得。可以根据高斯(Ghose)和比赛亚(Bisaria),1987,纯粹与应用化学(Pure&AppI.Chem.)59:1739-1752,在适合的温度如40℃-80℃,例如,40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃,以及适合的pH如4-9,例如,4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0下测量半纤维素分解酶活性。
半纤维素材料:该术语“半纤维素材料”意指包含半纤维素的任何材料。半纤维素包括木聚糖、葡糖醛酸木聚糖、阿拉伯糖基木聚糖、葡甘露聚糖以及木葡聚糖。这些多糖含有许多不同的糖单体。在半纤维素中的糖单体可以包括木糖、甘露糖、半乳糖、鼠李糖、以及阿拉伯糖。半纤维素含有大部分的D-戊糖糖类。在大多数情况下,木糖是以最大的量存在的糖单体,尽管在软木中甘露糖可以是最丰富的糖。木聚糖包含β-(1-4)-连接的木糖残基的主链。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物,其通过短的碳水化合物链分支。它们包括D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖,这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见,例如,埃伯林格罗瓦(Ebringerova)等人,2005,聚合物科学进展(Adv.Polym.Sci.)186:1-67。半纤维素材料在此也称为“含木聚糖的材料”。
用于半纤维素材料的来源基本上与在此描述的用于纤维素材料的那些来源相同。
在本发明的方法中,可以使用任何包含半纤维素的材料。在优选的方面,该半纤维素材料是木素纤维素。
宿主细胞:该术语“宿主细胞”意指易于用包含编码多肽的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。该术语“宿主细胞”涵盖亲本细胞的任何后代,由于复制期间发生的突变,该后代与其亲本细胞不完全相同。
分离的:术语“分离的”意指处于非天然存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质;(2)至少部分地从一个或多个或所有与它在自然界中相关的天然存在的成分中除去的任何物质,包括但不限于,任何酶、变体、核酸、蛋白质、肽或辅因子,也就是;(3)相对于在自然界中发现的物质经过人为改变的任何物质;或(4)相对于与它天然相关联的其他组分通过增加该物质的量(例如,在宿主细胞中的重组生产;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关联的启动子更强的启动子)而改变的任何物质。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一个方面,基于预测SEQID NO:2的氨基酸1至25是信号肽的SignalP 3.0程序(本特森(Bendtsen)等人,2004,分子生物学杂志(J.Mol.Biol.)340:783-795),纤维二糖水解酶I的成熟多肽是SEQ ID NO:2的氨基酸26至532。在另一方面,基于预测SEQ ID NO:4的氨基酸1至18是信号肽的SignalP3.0程序,纤维二糖水解酶II的成熟多肽是SEQ ID NO:4的氨基酸19至464。在另一方面,基于预测SEQ ID NO:6的氨基酸1至19是信号肽的SignalP 3.0程序,β-葡糖苷酶的成熟多肽是SEQ ID NO:6的氨基酸20至863。在另一方面,基于预测SEQ ID NO:36的氨基酸1至19是信号肽的SignalP 3.0程序,β-葡糖苷酶变体的成熟多肽是SEQ ID NO:36的氨基酸20至863。在另一方面,基于预测SEQ ID NO:8的氨基酸1至25是信号肽的SignalP 3.0程序,AA9多肽的成熟多肽是SEQ ID NO:8的氨基酸26至253。在另一方面,基于预测SEQ ID NO:10的氨基酸1至20是信号肽的SignalP 3.0程序,GH10木聚糖酶的成熟多肽是SEQ ID NO:10的氨基酸21至405。在另一方面,基于预测SEQ ID NO:12的氨基酸1至19是信号肽的SignalP 3.0程序,GH10木聚糖酶的成熟多肽是SEQ ID NO:12的氨基酸20至398。在另一方面,基于预测SEQID NO:14的氨基酸1至21是信号肽的SignalP 3.0程序,β-木糖苷酶的成熟多肽是SEQ IDNO:14的氨基酸22至796。在另一方面,基于预测SEQ ID NO:16的氨基酸1至22是信号肽的SignalP 3.0程序,内切葡聚糖酶I的成熟多肽是SEQ ID NO:16的氨基酸23至459。在另一方面,基于预测SEQ ID NO:18的氨基酸1至21是信号肽的SignalP 3.0程序,内切葡聚糖酶II的成熟多肽是SEQ ID NO:18的氨基酸22至418。在另一方面,基于预测SEQ ID NO:20的氨基酸1至17是信号肽的SignalP 3.0程序,里氏木霉纤维二糖水解酶I的成熟多肽是SEQ IDNO:20的氨基酸18至514。在另一方面,基于预测SEQ ID NO:22的氨基酸1至18是信号肽的SignalP 3.0程序,里氏木霉纤维二糖水解酶II的成熟多肽是SEQ ID NO:22的氨基酸19至471。在另一方面,基于预测SEQ ID NO:24的氨基酸1至19是信号肽的SignalP 3.0程序,里氏木霉β-葡糖苷酶的成熟多肽是SEQ ID NO:24的氨基酸20至744。在另一方面,基于预测SEQ ID NO:26的氨基酸1至19是信号肽的SignalP 3.0程序,里氏木霉木聚糖酶I的成熟多肽是SEQ ID NO:26的氨基酸20至229。在另一方面,基于预测SEQ ID NO:28的氨基酸1至19是信号肽的SignalP 3.0程序,里氏木霉木聚糖酶II的成熟多肽是SEQ ID NO:28的氨基酸20至223。在另一方面,基于预测SEQ ID NO:30的氨基酸1至16是信号肽的SignalP 3.0程序,里氏木霉木聚糖酶III的成熟多肽是SEQ ID NO:30的氨基酸17至347。在另一方面,基于预测SEQ ID NO:32的氨基酸1至20是信号肽的SignalP 3.0程序,里氏木霉β-木糖苷酶的成熟多肽是SEQ ID NO:32的氨基酸21至796。在另一方面,基于预测SEQ ID NO:34的氨基酸1至16是信号肽的SignalP 3.0程序,过氧化氢酶的成熟多肽是SEQ ID NO:34的氨基酸17至740。在另一方面,基于预测SEQ ID NO:106的氨基酸1至18是信号肽的SignalP 3.0程序,内切葡聚糖酶II的成熟多肽是SEQ ID NO:106的氨基酸19至335。在本领域中已知的是,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即,具有不同的C-末端和/或N-末端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有酶活性的成熟多肽的一种多核苷酸。在一方面,基于预测SEQ ID NO:1的核苷酸1至75编码信号肽的SignalP 3.0程序,纤维二糖水解酶I的成熟多肽编码序列是SEQ ID NO:1的核苷酸76至1727或其cDNA序列。在另一方面,基于预测SEQ ID NO:3的核苷酸1至54编码信号肽的SignalP 3.0程序,纤维二糖水解酶II的成熟多肽编码序列是SEQ ID NO:3的核苷酸55至1895或其cDNA序列。在另一方面,基于预测SEQ ID NO:5的核苷酸1至57编码信号肽的SignalP 3.0程序,β-葡糖苷酶的成熟多肽编码序列是SEQ ID NO:5的核苷酸58至3057或其cDNA序列。在另一方面,基于预测SEQ ID NO:35的核苷酸1至57编码信号肽的SignalP 3.0程序,β-葡糖苷酶变体的成熟多肽编码序列是SEQ ID NO:35的核苷酸58至3057或其cDNA序列。在另一方面,基于预测SEQID NO:7的核苷酸1至75编码信号肽的SignalP 3.0程序,AA9多肽的成熟多肽编码序列是SEQ ID NO:7的核苷酸76至832或其cDNA序列。在另一方面,基于预测SEQ ID NO:9的核苷酸1至123编码信号肽的SignalP 3.0程序,GH10木聚糖酶的成熟多肽编码序列是SEQ ID NO:9的核苷酸124至1517或其cDNA序列。在另一方面,基于预测SEQ ID NO:11的核苷酸1至57编码信号肽的SignalP 3.0程序,GH10木聚糖酶的成熟多肽编码序列是SEQ ID NO:11的核苷酸58至1194。在另一方面,基于预测SEQ ID NO:13的核苷酸1至63编码信号肽的SignalP3.0程序,β-木糖苷酶的成熟多肽编码序列是SEQ ID NO:13的核苷酸64至2388。在另一方面,基于预测SEQ ID NO:15的核苷酸1至66编码信号肽的SignalP 3.0程序,内切葡聚糖酶I的成熟多肽编码序列是SEQ ID NO:15的核苷酸67至1504或其cDNA序列。在另一方面,基于预测SEQ ID NO:17的核苷酸1至63编码信号肽的SignalP 3.0程序,内切葡聚糖酶II的成熟多肽编码序列是SEQ ID NO:17的核苷酸64至1504。在另一方面,基于预测SEQ ID NO:19的核苷酸1至51编码信号肽的SignalP 3.0程序,里氏木霉纤维二糖水解酶I的成熟多肽编码序列是SEQ ID NO:19的核苷酸52至1545或其cDNA序列。在另一方面,基于预测SEQ ID NO:21的核苷酸1至54编码信号肽的SignalP 3.0程序,里氏木霉纤维二糖水解酶II的成熟多肽编码序列是SEQ ID NO:21的核苷酸55至1608或其cDNA序列。在另一方面,基于预测SEQ IDNO:23的核苷酸1至57编码信号肽的SignalP 3.0程序,里氏木霉β-葡糖苷酶的成熟多肽编码序列是SEQ ID NO:23的核苷酸58至2612或其cDNA序列。在另一方面,基于预测SEQ IDNO:25的核苷酸1至57编码信号肽的SignalP 3.0程序,里氏木霉木聚糖酶I的成熟多肽编码序列是SEQ ID NO:25的核苷酸58至749或其cDNA序列。在另一方面,基于预测SEQ ID NO:27的核苷酸1至57编码信号肽的SignalP 3.0程序,里氏木霉木聚糖酶II的成熟多肽编码序列是SEQ ID NO:27的核苷酸58至778或其cDNA序列。在另一方面,基于预测SEQ ID NO:29的核苷酸1至48编码信号肽的SignalP 3.0程序,里氏木霉木聚糖酶III的成熟多肽编码序列是SEQ ID NO:29的核苷酸49至1349或其cDNA序列。在另一方面,基于预测SEQ ID NO:31的核苷酸1至60编码信号肽的SignalP 3.0程序,里氏木霉β-木糖苷酶的成熟多肽编码序列是SEQ ID NO:31的核苷酸61至2391或其cDNA序列。在另一方面,基于预测SEQ ID NO:33的核苷酸1至48编码信号肽的SignalP 3.0程序,过氧化氢酶的成熟多肽编码序列是SEQ ID NO:33的核苷酸49至2499或其cDNA序列。在另一方面,基于预测SEQ ID NO:105的核苷酸1至54编码信号肽的SignalP 3.0程序,内切葡聚糖酶II的成熟多肽编码序列是SEQ ID NO:105的核苷酸55至1005或其基因组DNA序列。
核酸构建体:术语“核酸构建体”意指单链-或双-链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接的:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。
预处理的纤维素或半纤维素材料:该术语“预处理的纤维素材料或半纤维素材料”意指通过热处理和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从生物质得到的纤维素材料或半纤维素材料。
预处理的玉米秸杆:术语“预处理的玉米秸杆”或“PCS”意指通过热和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从玉米秸杆得到的纤维素材料。
序列一致性:两个氨基酸序列之间或者两个核苷酸序列之间的关联度通过参数“序列一致性”来描述。
出于本发明的目的,使用尼德曼-翁施(Needleman-Wunsch)算法(尼德曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序所实施的。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(相同残基x 100)/(比对的长度-在比对中的空位总数)。
出于本发明的目的,使用尼德曼-翁施算法(尼德曼(Needleman)和翁施(Wunsch),1970,见上文)来确定两个脱氧核苷酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,见上文)(优选5.0.0版或更新版本)的尼德尔程序所实施的。使用的参数是空位开放罚分10、空位扩展罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记为“最高同一性(longestidentity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
严格条件:术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
对于至少100个核苷酸长度的探针,术语“中严格性条件”意指按照标准DNA印迹程序在42℃在5X SSPE、0.3%SDS、200微克/ml剪切和变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/毫升剪切并变性的鲑鱼精子DNA以及35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
子序列:术语“子序列”意指使一个或多个(例如,若干个)核苷酸从成熟多肽编码序列的5’端和/或3’端缺少的多核苷酸,其中该子序列编码具有酶活性的一个片段。在一个方面中,子序列包含酶的成熟多肽编码序列的至少85%,例如至少90%或至少95%的核苷酸。
枯草杆菌蛋白酶样丝氨酸蛋白酶:该术语“枯草杆菌蛋白酶样丝氨酸蛋白酶”意指一种具有类似于枯草杆菌蛋白酶的底物特异性的蛋白酶,其涉及丝氨酸残基用于催化多肽和蛋白质中的肽键的水解。枯草杆菌蛋白酶样蛋白酶(枯草杆菌酶)是由天冬氨酸、组氨酸和丝氨酸这三种氨基酸的催化三联体表征的丝氨酸蛋白酶。来自地衣芽抱杆菌(Bacilluslicheniformis)的原型枯草杆菌蛋白酶共享这些催化残基的安排(西埃泽恩(Siezen)和洛因伊森(Leunissen),1997,《蛋白质科学》(Protein Science)6:501-523)。可以使用在50℃下在pH 7.0的100mM NaCl-100mM MOPS中的合成底物,N-琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基酰苯胺(AAPF)(Bachem(瑞士巴亨)AG,Bubendorf,Switzerland)来确定枯草杆菌蛋白酶样丝氨酸蛋白酶活性,并且然后测量在405nm处的吸光度。
转化体:该术语“转化体”是指吸收细胞外DNA(外源、人工或修饰的)并且表达其中所包含的一个或多个基因的细胞。
转化:该术语“转化”是指将细胞外DNA引入细胞,即,由直接吸收产生的细胞的遗传改变、来自其环境且通过一层或多层细胞膜吸收的外源遗传物质(外源性DNA)的结合及表达。
胰蛋白酶样丝氨酸蛋白酶:该术语“胰蛋白酶样丝氨酸蛋白酶”意指具有类似于胰蛋白酶的底物特异性的蛋白酶,其涉及丝氨酸残基用于催化多肽和蛋白质中的肽键的水解。出于本发明的目的,根据迪能(Dienes)等人,2007,酶和微生物技术(Enzyme andMicrobial Technology)40:1087-1094描述的程序确定胰蛋白酶样丝氨酸蛋白酶活性。
变体:术语“变体”意指在一个或多个(例如几个)位置包含改变,即取代、插入和/或缺失的具有酶活性的多肽。取代意指占据一个位置的氨基酸由不同的氨基酸代替;缺失意指除去占据一个位置的氨基酸;以及插入意指在占据一个位置的氨基酸的毗邻处和紧邻处添加一个氨基酸。
全培养液制剂:该术语“全培养液制剂”是指由天然存在的来源产生的组合物,即,相对于由天然存在的微生物产生的纤维素分解酶和/或半纤维素分解酶,未被修饰的天然存在的微生物,或非天然存在的来源,即,相对于由非天然存在的微生物产生的纤维素分解酶和/或半纤维素分解酶,未被修饰的非天然存在的微生物,如,变体。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含有木聚糖的材料的生物活性。两种测定木聚糖分解活性的基础方法包括:(1)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡糖醛酸酯酶)。木聚糖分解酶的测定的最近进展总结于若干出版物中,这些出版物包括别雷(Biely)和普查德(Puchard),2006,食品与农业科学杂志(Journal of the Science of Food andAgriculture)86(11):1636-1647;斯帕尼克娃(Spanikova)和别雷,2006,欧洲生化学会联合会快报(FEBS Letters)580(19):4597-4601;赫尔曼(Herrmann)等人,1997,生物化学杂志(Biochemical Journal)321:375-381。
总木聚糖降解活性可以通过测定由不同类型的木聚糖(包括例如燕麦(oatspelt)木聚糖、山毛榉木木聚糖以及落叶松木木聚糖)形成的还原糖,或通过光度法测定从不同共价染色的木聚糖释放的染色的木聚糖片段来测量。一种常见的总木聚糖分解活性测定是基于由聚合4-O-甲基葡糖醛酸木聚糖产生还原糖,如描述于别雷(Bailey)等人,1992,用于木聚糖酶活性测定的多个实验室测试方法(Interlaboratory testing of methodsfor assay of xylanase activity),生物技术杂志(Journal of Biotechnology)23(3):257-270中。
还可以通过测量在以下典型条件下由一种或多种木聚糖降解酶引起的桦木木聚糖(西格玛化学有限公司(Sigma Chemical Co.,Inc.),圣路易斯,密苏里州,美国)水解的增加来测定木聚糖降解活性:1ml反应,5mg/ml底物(总固形物),5mg的木聚糖分解蛋白/g的底物,50mM的乙酸钠(pH 5),50℃,24小时,使用对羟基苯甲酸酰肼(PHBAH)测定法的糖分析,如莱韦尔(Lever),1972,分析生物化学(Anal.Biochem.)47:273-279中所述的。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(E.C.3.2.1.8),其催化木聚糖中的1,4-β-D-木糖苷键的内切水解。木聚糖酶活性可以在37℃下在0.01%X-100和200mM磷酸钠(pH 6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来确定。将一个单位的木聚糖酶活性定义为在37℃,pH 6下,在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青精。
发明详述
酶组合物
本发明涉及酶组合物,这些酶组合物包含:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶;
其中该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:2的成熟多肽或由其组成的纤维二糖水解酶I;(ii)与SEQ ID NO:2的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交;
其中该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的纤维二糖水解酶II;(ii)与SEQ ID NO:4的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交;
其中该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:6的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:6的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交;
其中该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:10的成熟多肽或由其组成的、或者包含SEQ ID NO:12的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:10的成熟多肽或SEQ IDNO:12的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列或者其全长互补体杂交;并且
其中该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:14的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:14的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:13的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交。
在一方面,AA9(GH61)多肽是任何具有纤维素分解增强活性的AA9多肽。AA9多肽的实例包括但不限于来自于以下各项的AA9多肽:土生梭孢壳霉(WO 2005/074647、WO 2008/148131和WO 2011/035027)、金黄色嗜热子囊菌(WO 2005/074656和WO 2010/065830)、里氏木霉(WO 2007/089290和WO 2012/149344)、嗜热毁丝霉(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/085868、WO 2009/033071、WO 2012/027374、及WO 2012/068236)、烟曲霉(WO 2010/138754)、嗜松青霉(WO 2011/005867)、嗜热子嚢菌属(WO 2011/039319)、青霉菌属(埃默森青霉菌)(WO 2011/041397和WO 2012/000892)、甲壳嗜热子囊菌(Thermoascus crustaceous)(WO 2011/041504)、棘孢曲霉(WO 2012/125925)、疏棉状嗜热丝孢菌(WO 2012/113340、WO 2012/129699、WO 2012/130964及WO 2012/129699)、Aurantiporus alborubescens(WO 2012/122477)、褐孢长毛盘菌(WO 2012/122477)、托姆青霉(WO 2012/122477)、柄篮状菌(WO 2012/135659)、特异腐质霉(WO 2012/146171)、樟绒枝霉(WO 2012/101206)、Talaromyces leycettanus(WO 2012/101206)、以及嗜热毛壳菌(WO 2012/101206)、埃默森篮状菌(WO 2012/000892)、韩国白腐菌(WO 2012/092676和WO2012/093149)、和嗜热篮状菌(Talaromyces thermophilus)(WO 2012/129697和WO 2012/130950);都通过引用以其全文结合在此。
在另一方面,具有纤维素分解增强活性的AA9多肽选自下组,该组由以下各项组成:(i)具有纤维素分解增强活性的AA9多肽,该多肽包含SEQ ID NO:8的成熟多肽或由其组成;(ii)具有纤维素分解增强活性的AA9多肽,该多肽包含如下氨基酸序列或由其组成,该氨基酸序列与SEQ ID NO:8的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)具有纤维素分解增强活性的AA9多肽,该多肽由包含以下核苷酸序列或由其组成的多核苷酸编码,该核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:7或其全长互补体的成熟多肽编码序列杂交。
在一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、和β-葡糖苷酶或其变体,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、和具有纤维素分解增强活性的AA9多肽,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、和GH10木聚糖酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和具有纤维素分解增强活性的AA9多肽,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和GH10木聚糖酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、和GH10木聚糖酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、GH10木聚糖酶、和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、和GH10木聚糖酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、GH10木聚糖酶和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶,如上所述。
在另一个实施例中,该酶组合物包含纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶,如上所述。
每个上述的酶组合物可以进一步或甚至进一步包含内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和切葡聚糖酶II。在一个实施例中,上述酶组合物可以进一步或甚至进一步包含内切葡聚糖酶I。在另一个实施例中,上述酶组合物可以进一步或甚至进一步包含内切葡聚糖酶II。在另一个实施例中,上述酶组合物可以进一步或甚至进一步包含内切葡聚糖酶I和内切葡聚糖酶II。
在一方面,该内切葡聚糖酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:16的成熟多肽或由其组成的I;(ii)与SEQ ID NO:16的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶I,该核苷酸序列与SEQ ID NO:15的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交。
在另一方面,该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ IDNO:18的成熟多肽或由其组成的II;(ii)与SEQ ID NO:18的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:17的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交。
在另一方面,该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ IDNO:106的成熟多肽或由其组成的II;(ii)与SEQ ID NO:106的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQID NO:105的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:105的成熟多肽编码序列或其全长互补体杂交。
在另一方面,该酶组合物进一步或甚至进一步包含木霉属内切葡聚糖酶I或其同系物。在另一方面,该酶组合物进一步包含里氏木霉内切葡聚糖酶I或其同系物。在另一方面,该酶组合物进一步包含里氏木霉Cel7B内切葡聚糖酶I(GENBANKTM登录号M15665)或其同系物。在另一方面,该里氏木霉内切葡聚糖酶I或其同系物是对宿主细胞是天然的。
在另一方面,该酶组合物进一步或甚至进一步包含木霉属内切葡聚糖酶II或其同系物。在另一方面,该酶组合物进一步包含里氏木霉内切葡聚糖酶II或其同系物。在另一方面,该酶组合物进一步包含里氏木霉Cel5A内切葡聚糖酶II(GENBANKTM登录号M19373)或其同系物。在另一方面,该里氏木霉内切葡聚糖酶II或其同系物是对宿主细胞是天然的。
每个上述的酶组合物可以进一步或甚至进一步包含过氧化氢酶。
在一方面,该过氧化氢酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的过氧化氢酶;(ii)与SEQ ID NO:34的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的过氧化氢酶;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的过氧化氢酶,该核苷酸序列与SEQ ID NO:33的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的过氧化氢酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:33的成熟多肽编码序列或其全长互补体杂交。
根据本领域熟知的方法,SEQ ID NO:1、3、5、7、9、11、13、15、17、33和105的多核苷酸或其子序列,以及SEQ ID NO:2、4、6、8、10、12、14、16、18、34和106的多肽或其片段,可以用于设计核酸探针以鉴定和克隆DNA编码酶。具体而言,这类探针可以用于按照标准DNA印迹程序与感兴趣细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的相应基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,核酸探针具有至少100个核苷酸长度,例如至少200个核苷酸长度、至少300个核苷酸长度、至少400个核苷酸长度、至少500个核苷酸长度、至少600个核苷酸长度、至少700个核苷酸长度、至少800个核苷酸长度、或至少900个核苷酸长度。DNA和RNA探针二者均可使用。典型地这些探针被标记用于检测相应的基因(例如用32P、3H、35S、生物素或亲合素)。这类探针涵盖于本发明中。
可以针对与上文所述的探针杂交并编码酶的DNA来筛选基因组DNA或cDNA文库。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其他分离技术分离基因组或其他DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其他合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1、3、5、7、9、11、13、15、17、33或105或其子序列杂交的克隆或DNA,将载体材料用于DNA印迹中。
出于本发明的目的,杂交指示该多核苷酸在极低到极高严格度条件下与对应于以下各项的经过标记的核酸探针杂交:(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、33或105;(ii)SEQ ID NO:1、3、5、7、9、11、13、15、17、33或105的成熟多肽编码序列;(iii)视情况而定,基因组DNA或其cDNA序列;(iv)其全长互补体;或(v)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段检测在这些条件下与核酸探针杂交的分子。
在一方面,该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、33、或105,或其成熟多肽编码序列。在另一方面,该核酸探针是编码SEQ ID NO:2、4、6、8、10、12、14、16、18、34、或106的多肽的多核苷酸;其成熟多肽;或其片段。
用于分离或克隆多核苷酸的技术在本领域中是已知的,并包括从基因组DNA或cDNA,或其组合分离。可以例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段,实现从基因组DNA克隆多核苷酸。参见例如,伊尼斯(Innis)等人,1990,PCR:方法和应用指南(PCR:A Guide to Methods andApplication),学术出版社(Academic Press),纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。该多核苷酸可以是多核苷酸的多肽编码区域的等位基因或种类变体。
也可以使用上述酶(或蛋白质)的蛋白工程化的变体。
在一方面,该变体是β-葡糖苷酶变体。在另一方面,该变体是烟曲霉β-葡糖苷酶变体。在另一方面,烟曲霉β-葡糖苷酶变体在对应于SEQ ID NO:6的位置100、283、456以及512的一个或多个(例如,若干个)位置处包括取代,其中该变体具有β-葡糖苷酶活性。
在实施例中,变体与亲本β-葡糖苷酶的氨基酸序列具有至少80%,例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但低于100%序列一致性。
在另一个实施例中,该变体与SEQ ID NO:6的成熟多肽具有至少80%,例如至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列一致性。
出于本发明的目的,使用披露于SEQ ID NO:6的全长多肽确定在另一个β-葡糖苷酶中的相应氨基酸残基,其中甲硫氨酸是位置1或其成熟多肽,其中N-末端是位置20(Gln)。将另一种β-葡糖苷酶的氨基酸序列与SEQ ID NO:6中披露的全长多肽或其成熟多肽进行比对,并且基于该比对,使用尼德曼-翁施算法(尼德曼和翁施,1970,分子生物学杂志48:443-453)来确定与SEQ ID NO:6中所披露的全长多肽或其成熟多肽的任何氨基酸残基相对应的氨基酸位置编号,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,遗传学趋势16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序所实施的。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
另一种β-葡糖苷酶中对应的氨基酸残基的鉴别可以通过使用若干计算机程序使用其对应的缺省参数比对多个多肽序列来确定,这些计算机程序包括但不限于MUSCLE(通过对数期望值的多序列比较;3.5版或更新版本;埃德加(Edgar),2004,核酸研究(NucleicAcids Research)32:1792-2797);MAFTT(6.857版或更新版本;加藤(Katoh)和库玛(Kuma),2002,核酸研究30:3059-3066;加藤等人,2005,核酸研究33:511-518;加藤和朝都(Toh),2007,生物信息学(Bioinformatics)23:372-374;加藤等人,2009,分子生物学中的方法(Methods in Molecular Biology)537:39-64;加藤和朝都,2010,生物信息学(Bioinformatics)26:1899-1900);以及采用ClustalW的EMBOSS EMMA(1.83版或更新版本;汤普森(Thompson)等人,1994,核酸研究(Nucleic Acids Research)22:4673-4680)。
对于氨基酸取代,使用以下命名法:原始氨基酸、位置、取代的氨基酸。因此,将在位置226处的苏氨酸与丙氨酸的置换命名为“Thr226Ala”或“T226A”。多个突变由加号(“+”)分隔,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”,代表在位置205和411分别将甘氨酸(G)置换为精氨酸(R),并且将丝氨酸(S)置换为苯丙氨酸(F)。
在一方面,变体包含在与位置100、283、456、以及512相对应的一个或多个(例如若干个)位置处的取代。在另一方面,变体包含在与位置100、283、456、以及512中的任何一个相对应的两个位置处的取代。在另一方面,变体包含在与位置100、283、456、以及512中的任何一个相对应的三个位置处的取代。在另一个方面,一种变体在对应于位置100、283、456以及512的每个位置处包括一个取代。
在另一方面,该变体包括在对应于位置100的位置处的取代或由其组成。在另一方面,与位置100相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Asp取代。在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D或由其组成。
在另一方面,该变体包括在对应于位置283的位置处的取代或由其组成。在另一方面,在对应于位置283的位置处的氨基酸是被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val,优选是被Gly取代。在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代S283G或由其组成。
在另一方面,该变体包括在对应于位置456的位置处的取代或由其组成。在另一方面,与位置456相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Glu取代。在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代N456E或由其组成。
在另一方面,该变体包括在对应于位置512的位置处的取代或由其组成。在另一方面,与位置512相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Tyr取代。在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F512Y或由其组成。
在另一方面,变体包括在对应于位置100和283的位置处的取代或由其组成,例如以上所述的那些。
在另一方面,变体包括在对应于位置100和456的位置处的取代或由其组成,例如以上所述的那些。
在另一方面,变体包括在对应于位置100和512的位置处的取代或由其组成,例如以上所述的那些。
在另一方面,变体包括在对应于位置283和456的位置处的取代或由其组成,例如以上所述的那些。
在另一方面,变体包括在对应于位置283和512的位置处的取代或由其组成,例如以上所述的那些。
在另一方面,变体包括在对应于位置456和512的位置处的取代或由其组成,例如以上所述的那些。
在另一方面,该变体包含在与位置100、283、以及456相对应的位置处的取代(如以上所描述的那些)或由这些取代组成。
在另一方面,该变体包含在与位置100、283、以及512相对应的位置处的取代(如以上所描述的那些)或由这些取代组成。
在另一方面,该变体包含在与位置100、456、以及512相对应的位置处的取代(如以上所描述的那些)或由这些取代组成。
在另一方面,该变体包含在与位置283、456、以及512相对应的位置处的取代(如以上所描述的那些)或由这些取代组成。
在另一方面,该变体包含在与位置100、283、456、以及512相对应的位置处的取代(如以上所描述的那些)或由这些取代组成。
在另一方面,该变体包括选自下组的一个或多个(例如,若干个)取代或由其组成,该组由F100D、S283G、N456E、和F512Y组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+S283G或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+N456E或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+F512Y或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代S283G+N456E或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代S283G+F512Y或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代N456E+F512Y或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+S283G+N456E或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+S283G+F512Y或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+N456E+F512Y或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代S283G+N456E+F512Y或由其组成。
在另一方面,该变体包括SEQ ID NO:6的全长多肽或其成熟多肽的取代F100D+S283G+N456E+F512Y或由其组成。
这些变体可以由720至863个氨基酸,例如720至739、740至759、760至779、780至799、800至819、820至839、以及840至863个氨基酸组成。
在一方面,变体β-葡糖苷酶包括SEQ ID NO:36的成熟多肽或由其组成。
这些变体在一个或多个(例如,若干个)其他位置上可进一步包含改变。
在一个实施例中,在本发明的酶组合物中的纤维二糖水解酶I的量是该酶组合物的总蛋白质的5%到60%,例如该酶组合物的总蛋白质的7.5%至55%、10%到50%、12.5%至45%、15%至40%、17.5%至35%、和20%到30%。
在另一个实施例中,在本发明的酶组合物中的纤维二糖水解酶II的量是该酶组合物的总蛋白质的2.0%到-40%,例如该酶组合物的总蛋白质的3.0%至35%、4.0%到30%、5%至25%、6%至20%、7%至15%、7.5%至12%、10%至20%、和11%至17%。
在另一个实施例中,在本发明的酶组合物中的β-葡糖苷酶的量是该酶组合物的总蛋白质的0%到30%,例如该酶组合物的总蛋白质的1%至27.5%、1.5%到25%、2%至22.5%、3%至20%、4%至19%、4.5%至18%、5%至17%、和6%至16%。
在另一个实施例中,在本发明的酶组合物中的AA9多肽的量是该酶组合物的总蛋白质的0%到50%,例如该酶组合物的总蛋白质的2.5%至45%、5%到40%、7.5%至35%、10%至30%、10%至25%、12.5%至25%、和15%至25%。
在另一个实施例中,在本发明的酶组合物中的木聚糖酶的量是该酶组合物的总蛋白质的0%到30%,例如该酶组合物的总蛋白质的0.125%至30%、0.25%至25%、0.5%至30%、1.0%至27.5%、1.5%至25%、2%至22.5%、0.5%至20%、2.5%至20%、3%至19%、3.5%至18%、4%至17%、0.75%至15%、和1%至10%。
在另一个实施例中,在本发明的酶组合物中的β-木糖苷酶的量是该酶组合物的总蛋白质的0%到50%,例如该酶组合物的总蛋白质的0.125%至30%、0.25%至25%、0.75%至17.5%、0.5%至30%、1.0%至27.5%、1.5%至25%、2%至22.5%、0.5%至20%、2.5%至20%、3%至19%、3.5%至18%、4%至17%、和1%至15%。
在另一个实施例中,在本发明的酶组合物中的内切葡聚糖酶I的量是该酶组合物的总蛋白质的0.5%到30%,例如该酶组合物的总蛋白质的1.0%至25%、2%至20%、4%至25%、5%至20%、16%至15%、和7%至12%。
在另一个实施例中,在本发明的酶组合物中的内切葡聚糖酶II的量是该酶组合物的总蛋白质的0.5%到30%,例如该酶组合物的总蛋白质的1.0%至25%、2%至20%、4%至25%、5%至20%、16%至15%、和7%至12%。
在另一个实施例中,在本发明的酶组合物中的过氧化氢酶的量是该酶组合物的总蛋白质的0%到25%,例如该酶组合物的总蛋白质的0.25%至20%、0.5%至15%、0.75%至10%、1%至9.5%、1.25%至9%、1.5%至8%、1.75%至8%、1.75%至7%、和1.75%至6%。
可以如实例17中所述确定蛋白质的量。
该酶组合物可以进一步或甚至进一步包含一个或多个(例如,若干种)选自下组的酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的AA9多肽、纤维素诱导蛋白(GENESEQP:ADW12302)、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀素(GENESEQP:BBA42745)。在另一方面,该纤维素酶优选是一种或多种(例如,若干种)选自下组的酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一方面,该半纤维素酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、β-葡聚糖酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。用于上述酶的这些来源可以是真菌的或细菌的,并且可以作为单域酶或包含多个催化结构域的多肽存在。
该酶组合物中的一种或多种(例如,若干种)酶可以是由该宿主菌株表达的野生型蛋白、重组蛋白、或由该宿主菌株表达的野生型蛋白和重组蛋白的组合。例如,一种或多种(例如,若干种)酶可以是细胞的天然蛋白质,将该细胞用作重组地表达该酶组合物的宿主细胞。
在另一方面,该酶组合物可以进一步包括木霉属菌株的全培养液制剂。在另一方面,该酶组合物可以进一步包括里氏木霉菌株的全培养液制剂。
在另一方面,该酶组合物可以进一步包括埃默森篮状菌菌株的全培养液制剂。
在另一方面,该酶组合物可以进一步包括毁丝霉属菌株全培养液制剂。在另一方面,该酶组合物可以进一步包括嗜热毁丝霉菌株全培养液制剂。
在另一方面,该酶组合物可以进一步包括霉属菌株的全培养液制剂的两种或更多种的组合(例如,里氏木霉全培养液制剂);毁丝霉属全培养液制剂(例如,嗜热毁丝霉属全培养液制剂);以及埃默森篮状菌菌株的全培养液制剂。
可以根据本领域已知的方法来制备酶组合物,并且这些酶组合物可以处于液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。
这些酶组合物可以产生自单一发酵或可以是两次或更多次发酵的共混物,例如,三次、四次、五次、六次、七次等发酵。例如,一次发酵可以产生纤维素酶(例如,内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶)并且第二次发酵可以产生半纤维素酶(例如,木聚糖酶和β-木糖苷酶),然后将这些产物以特定比率共混,例如该比率分别为10/90v/v、25/75v/v、50:50v/v、75:25v/v、或90/10v/v,以产生酶组合物。在另一个实例中,一次发酵可以产生纤维素酶(例如,内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶),第二次发酵可以产生半纤维素酶(例如,木聚糖酶和β-木糖苷酶),并且第三次发酵可以产生AA9(GH61)多肽,然后将这些产物以特定比率共混,例如该比率分别为10:80:20v/v/v、20:60:20v/v/v、40:40:20v/v/v、40:20:40v/v/v、或50:10:40v/v/v,以产生酶组合物。
这些酶组合物可以处于任何适于使用的形式,例如像除去或未除去细胞的粗发酵液、具有或不具有细胞碎片的细胞裂解液、半纯化或纯化的酶制剂、或作为酶的来源的宿主细胞(例如,里氏木霉、埃默森篮状菌、或嗜热毁丝霉)。所述酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。
这些酶组合物还可以是发酵液配制品或细胞组合物。发酵液产物进一步包含在发酵过程中使用的另外的成分,例如像,细胞(包括含有编码本发明的多肽的基因的宿主细胞,这些宿主细胞被用于产生多肽)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是含有一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。
术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制品。例如,当微生物培养物生长至饱和,在碳限制条件下孵育以允许蛋白合成(例如,由宿主细胞进行酶的表达)并且分泌到细胞培养基中时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。
在一个实施例中,该发酵液配制品和细胞组合物包括第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述两种或更多种的混合物;并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐,或前述两种或更多种的混合物。
在一个方面,该组合物包含一种或多种有机酸,并且任选地进一步含有活细胞、杀灭的细胞和/或细胞碎片。在一个实施例中,该组合物包括活细胞。在另一个实施例中,从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片,以提供不含这些组分的组合物。
这些发酵液配制品或细胞组合物可以进一步包括防腐剂和/或抗微生物(例如,抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。
该细胞杀灭的全培养液或组合物可以包含在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白质合成(例如,纤维素酶和/或一种或多种葡糖苷酶的表达)之后存在的细胞碎片。在一些实施例中,细胞杀灭的全培养液或组合物含有用过的细胞培养基、胞外酶、和杀死的丝状真菌细胞。在一些实施例中,可以使用本领域已知方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。
如在此描述的全培养液或细胞组合物典型地是液体浆料,但是可以含有不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以除去不溶性组分,以提供一种澄清的液体组合物。
可以通过WO 90/15861或WO 2010/096673所述的该方法产生本发明的全培养液配制品和细胞组合物。
在解构纤维素和半纤维素材料方面,本发明的酶组合物的有效量取决于若干因素,包括但不限于:纤维素或半纤维素材料、纤维素或半纤维素材料的浓度、该纤维素或半纤维素材料的一种或多种预处理、温度、时间、pH、以及发酵生物体(例如,用于同时糖化和发酵)的纳入。
在一方面,本发明的酶组合物对纤维素或半纤维素材料的有效量是约0.01至约50.0mg,例如约0.01至约40mg、约0.01至约30mg、约0.01至约20mg、约0.01至约10mg、约0.01至约5mg、约0.025至约1.5mg、约0.05至约1.25mg、约0.075至约1.25mg、约0.1至约1.25mg、约0.15至约1.25mg、或约0.25至约1.0mg蛋白质/g的纤维素或半纤维素材料。
在纤维素或半纤维素材料的解构方面,本发明的酶组合物在高温下是更有效的。相对于商用的基准混合物,本发明的酶组合物能够在显著更低的剂量下对纤维素或半纤维素材料进行有效转化。例如,在5mg酶蛋白/g纤维素下实现75%葡聚糖的转化率,但是用基准混合物的等效转化率需要大约14mg酶蛋白质/g纤维素(参见图12)。
核酸构建体
可以通过将一个或多个(例如,若干个)控制序列可操作地连接至该多核苷酸,构建包含编码酶或蛋白质的多核苷酸的核酸构建体,在与这些控制序列相容的条件下,来指导该编码序列在真菌宿主细胞中的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。这些核酸构建体可以包括一种或多种编码酶组分或组合物酶组分的多核苷酸。
该控制序列可以是启动子,即,被真菌宿主细胞识别以对编码酶或蛋白质的多核苷酸进行表达的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
用于指导核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下各项的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子,以及NA2-tpi启动子(一种修饰的启动子,其来自曲霉属中性α-淀粉酶基因,其中未翻译的前导子由曲霉属丙糖磷酸异构酶基因的未翻译的前导子替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导子由构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导子替代);以及其突变型启动子、截短型启动子、以及杂合型启动子。其他启动子描述于美国专利号6,011,147中,将该文献以其全文结合在此。
在酵母宿主中,从针对以下各项的基因获得有用的启动子:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。在罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488中描述了酵母宿主细胞的其他有用启动子。
控制序列还可以是由真菌宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3'-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
酵母宿主细胞的优选终止子从针对以下各项的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。在罗马诺斯(Romanos)等人,1992,上文中描述了酵母宿主细胞的其他有用终止子。
该控制序列还可以是前导序列,对真菌宿主细胞翻译很重要的非翻译mRNA区域。该前导子与编码多肽的多核苷酸的5’端可操作地连接。可以使用在宿主细胞中起作用的任何前导子。
用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得用于酵母宿主细胞的合适的前导子。
控制序列也可以是多聚腺苷化序列,一种与多核苷酸3’-末端可操作地连接并在转录时由真菌宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中有功能的任何多聚腺苷酸化序列。
丝状真菌宿主细胞的优选多聚腺苷酸化从针对以下各项的基因获得:构巢曲霉邻氨基苯甲酸酯合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰刀菌胰蛋白酶样蛋白酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、和里氏木霉内切葡聚糖酶V。
对于酵母宿主细胞有用的多聚腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990)。
控制序列也可以是编码与多肽的N-端连接并指导多肽进入细胞的分泌通路的信号肽的信号肽编码区。多核苷酸的编码序列的5’-端可以固有地包括在翻译阅读框架中与编码多肽的编码序列的区段天然地连接的一个信号肽编码序列。或者,编码序列的5’端可含有对于该编码序列为外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可简单地替换天然的信号肽编码序列以便增强该多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下各项的基因中获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、和里氏木霉葡聚糖内切酶V。
从酿酒酵母α-因子和酿酒酵母转化酶的基因获得用于酵母宿主细胞的有用信号肽。其他的有用的信号肽编码序列由罗曼诺斯(Romanos)等人(1992,上文)描述。
控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子的基因获得前肽编码序列。
在信号肽和前肽序列两者都在的情况下,将前肽序列紧邻多肽的N-末端定位并且将信号肽序列紧邻前肽序列的N-末端定位。
也可能令人希望的是添加调节序列,所述调节序列调节相对于真菌宿主细胞的生长的多肽的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子、米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。
表达载体
可以将重组表达载体进行构建,使其包含编码酶的多核苷酸、启动子、终止子、以及转录和翻译终止信号。各种核苷酸和控制序列可以连接在一起以产生重组表达载体,所述重组表达载体可以包含一个或多个合宜的限制性位点以允许在这样的位点插入或置换编码多肽的多核苷酸。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。这些重组表达载体可以包括一种或多种编码酶组分或组合物酶组分的多核苷酸。
重组表达载体可以是可以合宜地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。典型地,载体的选择将取决于载体与向其中待引入载体的宿主细胞的相容性。该载体可以是线性的或闭合的环状质粒。
该载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可以包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入宿主细胞的基因组中的总DNA)或转座子。
该载体优选包含允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
用于在丝状真菌宿主细胞中使用的选择性标记的实例包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hpt(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hpt以及pyrG基因。用于酵母宿主细胞的合适标记包括,但不限于,ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。
选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统,将该文献通过引用以其全文结合在此。在一个方面,双选择性标记是hpt-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,载体可以进一步包括使该载体能够在该真菌宿主细胞中自主复制的复制起点。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点(origin of replication)”或“质粒复制子(plasmidreplicator)”意指使得质粒或载体可在体内复制的多核苷酸。
在丝状真菌宿主细胞内有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。可以根据WO 00/24883中披露的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。
可以向真菌宿主细胞中插入多于一个拷贝的多核苷酸,以增加多肽的产量。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接以上所描述的元件以构建重组表达载体的程序是本领域的普通技术人员所熟知的(参见例如,萨姆布鲁克(Sambrook)等人,1989,分子克隆:实验手册(MolecularCloning,A Laboratory Manual),第2版,冷泉港(Cold Spring Harbor),纽约)。
宿主细胞
本发明还涉及重组真菌宿主细胞,该细胞包含编码酶组合物的多核苷酸,该酶组合物包含:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体,具有纤维素分解增强活性的AA9的多肽、GH10木聚糖酶和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶,如在此所述。这些重组真菌宿主细胞可以进一步或甚至进一步包含一种或多种编码内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和切葡聚糖酶II的多核苷酸,如在此所述。这些重组真菌宿主细胞可以进一步或甚至进一步包含编码过氧化氢酶的多核苷酸,如在此所述。
这些重组真菌宿主细胞可以进一步包含一种或多种编码选自下组的酶的多核苷酸,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的AA9多肽、纤维素诱导蛋白、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀素,如在此所述。这些酶中的一种或多种(例如,若干种)可以是野生型蛋白、重组蛋白、或野生型蛋白和重组蛋白的组合。
该宿主细胞可以是在酶或蛋白质的重组生产中有用的任何真菌细胞。该术语“宿主细胞”涵盖亲本细胞的任何后代,由于复制期间发生的突变,该后代与其亲本细胞不完全相同。
如在此所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定义,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大词典(Dictionary of The Fungi),第8版,1995,国际CAB,大学出版社(University Press),剑桥(Cambridge),英国)。
真菌宿主细胞可以是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化,为了本发明的目的,酵母应当如酵母的生物学与活性(Biology and Activities of Yeast)(斯金纳(Skinner),帕斯莫尔(Passmore)和达文波特(Davenport)编著,应用细菌学学会专题论文集系列9(Soc.App.Bacteriol.Symposium Series No.9),1980)所描述那样定义。
酵母宿主细胞可以是假丝酵母属细胞、汉逊酵母属细胞、克鲁维酵母属细胞、毕赤酵母属细胞、酵母菌属细胞、裂殖酵母或耶罗维亚酵母属细胞、如乳酸克鲁维酵母细胞、卡氏酵母细胞、酿酒酵母细胞、糖化酵母细胞、道格拉斯酵母(Saccharomyces douglasii)细胞、克鲁弗酵母细胞、诺地酵母细胞、卵形酵母细胞或解脂耶罗维亚酵母细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如霍克斯沃思等人,1995,上文定义)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可以是枝顶孢霉属细胞、曲霉属细胞、金担子菌属细胞、烟管菌属(Bjerkandera)细胞、拟蜡菌属细胞、金孢属细胞、鬼伞属细胞、革盖菌属(Coriolus)细胞、隐球菌属细胞、绒黑粉类酵母细胞、镰刀菌属细胞、腐质霉属细胞、巨座壳属细胞、毛霉属细胞、毁丝霉属细胞、新美鞭菌属细胞、脉孢菌属细胞、拟青霉属细胞、青霉属细胞、平革菌属细胞、射脉菌属(Phlebia)细胞、梨囊鞭菌属细胞、侧耳属细胞、裂褶菌属细胞、蓝状菌属细胞、嗜热子囊菌细胞、梭孢壳属细胞、弯颈霉属细胞、栓菌属(Trametes)细胞或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、埃默森篮状菌、土生梭孢霉、长域毛栓菌(Trametesvillosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
用一种或多种在此描述的构建体和/或载体,可以通过涉及原生质体形成、原生质体转化、以及以本身已知的方式进行细胞壁再生的过程来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法在马拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。用于嗜热毁丝霉转化的适合程序描述于WO 2000/020555中。用于埃默森篮状菌转化的适合程序描述于WO2011/054899和杰恩(Jain)等人,1992,分子遗传学与基因组学(Mol.Gen.Genet.)234:489中。可以使用以下文献中描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),引自阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编者,酵母遗传学与分子生物学指南(Guideto Yeast Genetics and Molecular Biology),酶学方法(Methods in Enzymology),第194卷,第182-187页,学术出版社公司(Academic Press,Inc.),纽约;Ito等人,1983,细菌学杂志(J.Bacteriol.)153:163;和Hinnen等人,1978,美国国家科学院院刊75:1920。
在一方面,该丝状真菌细胞可以是在酶或蛋白质的重组生产中有用的任何木霉属细胞。例如,木霉属细胞可以是哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。在另一方面,该木霉属细胞是哈茨木霉细胞。在另一方面,该木霉属细胞是康宁木霉细胞。在另一方面,该木霉属细胞是长枝木霉细胞。在另一方面,该木霉属细胞是里氏木霉细胞。在另一方面,该木霉属细胞是绿色木霉细胞。
在另一方面,该里氏木霉细胞是里氏木霉RutC30。在另一方面,该里氏木霉细胞是里氏木霉TV10。在另一方面,该里氏木霉细胞是里氏木霉RutC30的突变体。在另一方面,该里氏木霉细胞是里氏木霉TV10的突变体。在另一方面,该里氏木霉细胞是里氏木霉的形态突变体。参见例如WO 97/26330,将其通过引用以其全部内容结合在此。
在另一方面,该丝状真菌细胞可以是在酶或蛋白质的重组生产中有用的任何米曲霉细胞。
在另一方面,该丝状真菌细胞可以是在酶或蛋白质的重组生产中有用的任何黑曲霉细胞。
在另一方面,该丝状真菌细胞可以是在酶或蛋白质的重组生产中有用的任何嗜热毁丝霉细胞。
在另一方面,该丝状真菌细胞可以是在酶或蛋白质的重组生产中有用的任何埃默森篮状菌细胞。
可以通过破坏或删除这些基因、或它们的一个部分,将一种或多种(例如若干种)天然纤维素酶和/或半纤维素酶基因在丝状真菌宿主细胞(例如,木霉属)中灭活,这导致在相同条件下培养时,较其亲本细胞,突变体细胞产生较少或不产生纤维素酶和/或半纤维素酶。在一方面,该一种或多种(例如,若干种)纤维素酶基因编码选自下组的酶,该组由以下各项组成:纤维二糖水解酶I、纤维二糖水解酶II、内切葡聚糖酶I、内切葡聚糖酶II、β-葡糖苷酶、以及膨胀素。在另一方面,该一种或多种(例如,若干种)半纤维素酶基因编码选自下组的酶,该组由以下各项组成:木聚糖酶I、木聚糖酶II、木聚糖酶III、以及β-木糖苷酶。在另一方面,该一种或多种(例如,若干种)半纤维素基因编码选自下组的酶,该组由以下各项组成:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶和甘露糖苷酶。
可以使用本领域熟知的方法通过降低或消除编码纤维素酶或半纤维素酶的多核苷酸的表达来构建突变体细胞,例如插入、破坏、替换、或缺失。在优选的方面,将该多核苷酸灭活。例如,待修饰或失活的多核苷酸可以是活性必需的编码区或其部分,或编码区的表达所需的调节元件。这种调节或控制序列的实例可以是启动子序列或其功能部分,即足以影响该多核苷酸的表达的部分。可修饰的其他控制序列包括但不限于前导子、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录激活因子。
该多核苷酸的修饰或失活可以通过使亲本细胞经受诱变,并且选择该多核苷酸的表达被降低或消除的突变体细胞来进行。所述诱变可以是特异的或随机的,例如通过使用适宜的物理或化学诱变剂、通过使用适宜的寡核苷酸、或通过对DNA序列PCR产生诱变来进行。此外,诱变可通过使用这些诱变剂的任意组合来进行。
适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射,羟胺,N-甲基-N’-硝基-N-亚硝基胍(MNNG),邻甲基羟胺,亚硝酸,乙基甲磺酸(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。
当使用这些试剂时,诱变一般是在适宜条件下在所选的诱变处理试剂的存在下通过孵育有待诱变的亲本细胞并筛选和/或选择展示基因表达降低或不表达的突变体细胞来进行的。
该多核苷酸的修饰或失活也可以通过在基因中或在其转录或翻译所需的调控元件中插入、取代、或缺失一个或多个(例如,若干个)核苷酸来完成。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。此类修饰或失活可根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。尽管原则上,修饰可以在体内进行,即直接在表达待修饰的多核苷酸的细胞上进行,但是优选的是如下所示例地在体外进行修饰。
便利的消除或降低多核苷酸的表达的方法的实例是基于基因替换、基因缺失、或基因破坏技术的。例如,在基因破坏方法中,将对应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷的核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,该缺陷的核酸序列替换内源多核苷酸。令人希望的是,缺陷的多核苷酸还编码可用于选择其中该多核苷酸已经被修饰或破坏的转化体的标记。在一方面,用例如在此描述的那些选择性标记来破坏该多核苷酸。
该多核苷酸的修饰或失活也可以通过在细胞中抑制由该多核苷酸编码的酶的表达来完成,通过向该细胞给予或在其中表达一种双链RNA(dsRNA)分子,其中该dsRNA包含编码该酶的多核苷酸的子序列。在一个优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。
该dsRNA优选是一个小干扰RNA(siRNA)或微小RNA(miRNA)。在一个优选方面,该dsRNA是用于抑制转录的小干扰RNA。在另一个优选方面,该dsRNA是用于抑制翻译的微小RNA。在另一方面,该双链RNA(dsRNA)分子包含以下各项的成熟多肽编码序列的一部分:SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、和/或SEQ ID NO:31,以抑制该多肽在细胞中的表达。本发明不受限于任何特定作用机制,dsRNA能进入细胞,并引起相似或相同序列的单链RNA(ssRNA)的降解,所述RNA包括内源mRNA。当细胞被暴露于dsRNA时,来自同源基因的mRNA选择性地被一种叫做RNA干扰(RNAi)的过程所降解。
可以将dsRNAs用于基因沉默中,使用本发明的dsRNAi来选择性地降解RNA。可以在体外、离体或体内进行该过程。在一方面,可以使用这些dsRNA分子来在细胞、器官或动物中产生功能缺失突变。用于制备并使用dsRNA分子选择性降解RNA的方法在本领域中是熟知的;参见例如美国专利号6,489,127;6,506,559;6,511,824;以及6,515,109。
在一方面,编码纤维二糖水解酶I的基因是灭活的。在另一方面,编码木霉属纤维二糖水解酶I的基因是灭活的。在另一方面,编码里氏木霉纤维二糖水解酶I的基因是灭活的。在另一方面,该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:20的成熟多肽或由其组成的纤维二糖水解酶I;(ii)与SEQ ID NO:20的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQ ID NO:19的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:19的成熟多肽编码序列或其全长互补体杂交。
在另一方面,编码纤维二糖水解酶II的基因是灭活的。在另一方面,编码木霉属纤维二糖水解酶II的基因是灭活的。在另一方面,编码里氏木霉纤维二糖水解酶II的基因是灭活的。在另一方面,该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ IDNO:22的成熟多肽或由其组成的纤维二糖水解酶II;(ii)与SEQ ID NO:22的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:21的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交。
在另一方面,编码β-葡糖苷酶的基因是灭活的。在另一方面,编码木霉属β-葡糖苷酶的基因是灭活的。在另一方面,编码里氏木霉β-葡糖苷酶的基因是灭活的。在另一方面,该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:24的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQID NO:24的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:23的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:23的成熟多肽编码序列或其全长互补体杂交。
在另一方面,编码木聚糖酶的基因是灭活的。在另一方面,编码木霉属木聚糖酶的基因是灭活的。在另一方面,编码里氏木霉木聚糖酶的基因是灭活的。在另一方面,该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:26、SEQ ID NO:28、或SEQ ID NO:30的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:26、SEQ ID NO:28、或SEQ ID NO:30成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:25、SEQ ID NO:27、或SEQ ID NO:29成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:25、SEQ ID NO:27、或SEQ ID NO:29的成熟多肽编码序列或者其全长互补体杂交。
在另一方面,编码β-木糖苷酶的基因是灭活的。在另一方面,编码木霉属β-木糖苷酶的基因是灭活的。在另一方面,编码里氏木霉β-木糖苷酶的基因是灭活的。在另一方面,该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:32的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQID NO:32的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:31的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:31的成熟多肽编码序列或其全长互补体杂交。
在另一方面,纤维二糖水解酶I基因是失活的。在另一方面,木霉属纤维二糖水解酶I基因是灭活的。在另一方面,里氏木霉纤维二糖水解酶I基因是灭活的。在另一方面,木霉属纤维二糖水解酶II基因是灭活的。在另一方面,里氏木霉纤维二糖水解酶II基因是灭活的。在另一方面,木霉属β-葡糖苷酶基因是灭活的。在另一方面,里氏木霉β-葡糖苷酶基因是灭活的。在另一方面,木霉属木聚糖酶基因是灭活的。在另一方面,里氏木霉木聚糖酶基因是灭活的。在另一方面,木霉属β-木糖苷酶基因是灭活的。在另一方面,里氏木霉β-木糖苷酶基因是灭活的。
在另一方面,木霉属纤维二糖水解酶I基因和木霉属纤维二糖水解酶II基因是灭活的。在另一方面,里氏木霉纤维二糖水解酶I基因和里氏木霉纤维二糖水解酶II基因是灭活的。
在另一方面,两个或更多个(例如若干个)选自下组的基因是灭活的,该组由以下各项组成:纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶、木聚糖酶I、木聚糖酶II、木聚糖酶III和β-木糖苷酶。在另一方面,三个或更多个(例如若干个)选自下组的基因是灭活的,该组由以下各项组成:纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶、木聚糖酶I、木聚糖酶II、木聚糖酶III和β-木糖苷酶基因。在另一方面,四个或更多个(例如若干个)选自下组的基因是灭活的,该组由以下各项组成:纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶、木聚糖酶I、木聚糖酶II、木聚糖酶III和β-木糖苷酶基因。在另一方面,五个或更多个(例如若干个)选自下组的基因是灭活的,该组由以下各项组成:纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶、木聚糖酶I、木聚糖酶II、木聚糖酶III和β-木糖苷酶基因。在另一方面,六个或更多个(例如若干个)选自下组的基因是灭活的,该组由以下各项组成:纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶、木聚糖酶I、木聚糖酶II、木聚糖酶III和β-木糖苷酶基因。
在另一方面,纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶、木聚糖酶I、木聚糖酶II、木聚糖酶III和β-木糖苷酶基因是灭活的。
在另一方面,一种或多种(例如,若干种)蛋白酶基因是灭活的。在另一方面,该一种或多种(例如,若干种)蛋白酶基因是如在WO 2011/075677中描述的,是枯草杆菌蛋白酶样丝氨酸蛋白酶、天冬氨酸蛋白酶、和胰蛋白酶样丝氨酸蛋白酶基因,将该文献通过引用以其全文结合在此。
生产方法
本发明还涉及生产在此描述的本发明的酶组合物的方法,这些方法包括:(a)在有益于生产该酶组合物的条件下培养本发明的一种或多种(例如,若干种)真菌宿主细胞;并且任选地(b)回收该酶组合物。
这些真菌宿主细胞是在适合于使用本领域中已知的方法产生该酶组合物的一种营养培养基中培养的。例如,可以通过摇瓶培养,或者在适合的培养基中并在允许这些酶表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养该细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。适合的培养基从商业供应商可获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。
这些酶组合物的活性可以使用本领域中已知的方法进行确定。这些方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。
这些酶组合物可以使用本领域已知的方法回收。例如,可以通过常规程序从营养培养基回收该酶,所述常规程序包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。在一个方面中,回收整个发酵液。
用途
本发明还涉及用于使用本发明的这些酶组合物的以下方法。
本发明还涉及用于降解纤维素或半纤维素材料的方法,这些方法包括:用本发明的酶组合物处理该纤维素或半纤维素材料。在一方面,这些方法进一步包括回收该降解的纤维素或半纤维素材料。可以使用本领域已知的方法将来自纤维素或半纤维素材料的降解的可溶性产物与不溶性纤维素或半纤维素材料分开,这些方法例如像离心、过滤、或重力沉降。
本发明还涉及产生发酵产物的方法,这些方法包括:(a)用本发明的酶组合物糖化纤维素或半纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵经糖化的纤维素或半纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
本发明也涉及发酵纤维素或半纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素或半纤维素材料,其中该纤维素或半纤维素材料被本发明的酶组合物糖化。在一方面,发酵纤维素或半纤维素材料产生发酵产物。在另一方面,这些方法进一步包括从该发酵中回收该发酵产物。
本发明的方法可以用于将纤维素或半纤维素材料糖化为可发酵糖,并且将可发酵糖转化为多种有用的发酵产物,例如燃料(乙醇、正丁醇、异丁醇、生物柴油、喷气燃料)和/或平台化合物(例如酸、醇、酮、气体、油等)。由该纤维素或半纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。
根据本发明的纤维素或半纤维素材料的加工可以使用本领域常规的方法来完成。此外,可以使用被配置为根据本发明进行操作的任何常规的生物质处理装置进行本发明的工艺。
分开或同时的水解(糖化)和发酵包括但不限于:分开水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、杂合的水解和发酵(HHF)、分开水解和共发酵(SHCF)、杂合的水解和共发酵(HHCF),以及直接微生物转化(DMC),有时还被称为合并的生物加工(CBP)。SHF使用分开的处理步骤,以首先将纤维素或半纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在SSF中,纤维素或半纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(菲利皮迪斯·G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulose bioconversiontechnology),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production andUtilization),怀曼·C.E(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),179-212))。SSCF涉及多种糖的共发酵(希恩(Sheehan)和希默尔(Himmel),1999,生物技术进展(Biotechnol.Prog.)15:817-827)。HHF涉及一个分开的水解步骤,并且另外涉及一个同时糖化和水解步骤,这些步骤可以在同一反应器中进行。HHF过程中的步骤可以在不同的温度下进行,即高温酶糖化,接着在发酵菌株能够耐受的更低温度下进行SSF。DMC在一个或多个(例如,若干个)步骤中合并了所有的三个过程(酶生产、水解、和发酵),其中使用相同的生物生产用于将纤维素或半纤维素材料转化为可发酵糖的酶并且用于将可发酵糖转化为终产物的酶(林德(Lynd)等人,2002,微生物学与分子生物学评论(Microbiol.Mol.Biol.Reviews)66:506-577)。在此应该理解的是,可以在本发明的工艺的实践中使用本领域已知的包括预处理、酶水解(糖化)、发酵或其组合的任何方法。
常规的装置可以包括一个分批补料搅拌反应器、一个批式搅拌反应器、一个具有超滤作用的连续流搅拌反应器、和/或一个连续活塞流柱式反应器(continuous plug-flowcolumn reactor)(德卡斯特胡斯克拉兹(de Castilhos Corazza)等人,2003,技术学报(Acta Scientiarum.Technology)25:33-38;古萨考瓦(Gusakov)和斯尼特森(Sinitsyn),1985,酶学与微生物学技术(Enz.Microb.Technol.)7:346-352)、一个碾磨反应器(刘(Ryu)和李(Lee),1983,生物技术与生物工程(Biotechnol.Bioeng.)25:53-65)。另外的反应器类型包括:用于水解和/或发酵的流化床反应器、升流层(upflow blanket)反应器、固定化反应器、以及挤出机型反应器。
预处理。在实践本发明的工艺中,可以使用本领域中已知的任何预处理工艺来破坏纤维素或半纤维素材料的植物细胞壁组分(钱德拉(Chandra)等人,2007,生化工程/生物技术进展(Adv.Biochem.Engin./Biotechnol.)108:67-93;盖博(Galbe)和小林(Zacchi),2007,生化工程/生物技术进展,108:41-65;亨德里克斯(Hendriks)和塞曼(Zeeman),2009,生物资源技术(Bioresource Technology)100:10-18;莫西尔(Mosier)等人,2005,生物资源技术96:673-686;泰和拉德(Taherzadeh)和卡里米(Karimi),2008,分子科学国际杂志(Int.J.Mol.Sci.)9:1621-1651;杨(Yang)和怀曼,2008,生物燃料,生物产品和生物精制Biofpr.(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。
这些纤维素或半纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理。
常规的预处理包括但不限于,蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱性预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理和生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子液体以及γ辐射预处理。
可以在水解和/或发酵之前对纤维素或半纤维素材料进行预处理。预处理优选在水解前进行。可替代地,预处理可以与酶水解同时进行,以释放可发酵的糖,例如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(即使在没有酶的情况下)。
蒸汽预处理。在蒸汽预处理中,加热纤维素或半纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素、以及纤维素,以使纤维素和其他级分,例如,半纤维素可接近酶。使纤维素或半纤维素材料到达或通过反应锅,在该反应锅中注入蒸汽以将温度增加至所需的温度和压力并且将纤维素材料或包含木聚糖的材料保留在其中,持续所希望的反应时间。优选在140℃-250℃,例如160℃-200℃或170℃-190℃进行蒸汽预处理,其中最佳温度范围取决于化学催化剂的任选添加。蒸汽预处理的停留时间优选是1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最适停留时间取决于温度和化学催化剂的任选添加。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素或半纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆炸放料组合,这被称为蒸汽爆炸,即,快速闪变至大气压和材料湍流,以通过破碎增加可及的表面积(达夫(Duff)和默里(Murray),1996,生物资源技术(Bioresource Technology)855:1-33;盖博(Galbe)和小林(Zacchi),2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:618-628;美国专利申请号2002/0164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且所得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。
化学预处理:术语“化学处理”是指促进纤维素、半纤维素、和/或木质素的分离和/或释放的任何化学预处理。此种预处理可将晶体纤维素转化为无定形纤维素。适合的化学预处理工艺的实例包括例如稀酸预处理、石灰预处理、湿法氧化、氨纤维/冷冻膨胀(AFEX)、氨渗滤(APR)、离子液体、以及有机溶剂预处理。
经常在蒸汽预处理之前添加化学催化剂(例如H2SO4或SO2)(典型地是0.3%至5%w/w),该催化剂减少时间并降低温度、增加回收率、并改进酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术129-132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;塞斯尼尔(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。在稀酸预处理中,纤维素或半纤维素材料与稀酸(典型地是H2SO4)和水混合,以形成浆料,由蒸汽加热至希望的温度,并且在停留时间后闪变至大气压。可采用多种反应器设计来进行稀酸预处理,例如活塞流反应器、逆流反应器或连续逆流收缩床反应器(达夫(Duff)和默里(Murray),1996,生物资源技术(Bioresource Technology)855:1-33;谢尔(Schell)等人,2004,生物资源技术(Bioresource Technology)91:179-188;李(Lee)等人,1999,生物化学工程/生物技术进展(Adv.Biochem.Eng.Biotechnol.)65:93-115)。
还可以使用碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:氢氧化钠、石灰、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻膨胀(AFEX)预处理。
用氧化钙或氢氧化钙,在85℃-150℃的温度下进行石灰预处理,并且停留时间为从1小时到几天(怀曼(Wyman)等人,2005,生物资源技术(Bioresource Technology)96:1959-1966;莫西尔(Mosier)等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO2006/110899、WO 2006/110900以及WO 2006/110901披露了使用氨的预处理方法。
湿氧化是一种热预处理,其典型地在添加氧化剂(如过氧化氢或过压氧)的情况下在180℃-200℃下持续5-15分钟进行(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术64:139-151;帕罗内(Palonen)等人,2004,应用生物化学与生物技术117:1-17;瓦尔加等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。优选在1%-40%干物质,例如2%-30%干物质或5%-20%干物质进行预处理,并且通常通过添加碱,例如碳酸钠提高初始pH。
被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在某一停留时间后,在预处理过程中引入氧化剂。然后通过急骤蒸发至大气压结束预处理(WO2006/032282)。
氨纤维爆发(AFEX)涉及在如90℃-150℃的中等温度和如17至20巴的高压下,用液体或气态氨处理纤维素或半纤维素材料5至10分钟,其中干物质含量可以高达60%(格拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)98:23-35;俊达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术(Bioresource Technology)96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被裂解。
有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下提取30-60分钟而将纤维素或半纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素被去除。
适合的预处理方法的其他实例由谢尔(Schell)等人,2003,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)105-108:69-85,和马塞尔(Mosier)等人,2005,生物资源技术(Bioresource Technology)96:673-686,以及美国专利申请2002/0164730进行描述。
在一方面,化学预处理优选作为稀酸处理,并且更优选作为连续稀酸处理进行。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1至5,例如1至4或1至2.5的pH范围中进行。在一方面,酸浓度优选处于从0.01wt.%至10wt.%酸,例如0.05wt.%至5wt.%酸或0.1wt.%至2wt.%酸的范围内。使酸与纤维素或半纤维素材料相接触,并且保持在优选140℃-200℃,例如165℃-190℃范围内的温度下,持续从1至60分钟范围内的时间。
在另一个方面,预处理发生在含水浆料中。在优选方面,在预处理过程中纤维素或半纤维素材料以优选在10wt.%至80wt.%之间,例如20wt.%至70wt.%或30wt.%至60wt.%,如大约40wt.%的量存在。预处理的纤维素或半纤维素材料可以不洗涤或使用本领域已知的任何方法洗涤,例如,用水洗涤。
机械预处理或物理预处理:术语“机械预处理”或“物理预处理”是指促进颗粒粒度减小的任何预处理。例如,这种预处理可以涉及各种类型的研磨或碾磨(例如,干磨、湿磨、或振动球磨)。
纤维素或半纤维素材料可经物理(机械)和化学预处理。机械或物理预处理可以与以下相结合:蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如微波福射)或其组合。在一方面,高压意指在优选约100至约400psi,例如约150至约250psi范围中的压力。在另一方面,高温意指在约100℃至约300℃,例如约140℃至约200℃范围内的温度。在优选的方面,机械预处理或物理预处理在使用如上所定义的高压和高温的蒸汽枪水解器系统的分批过程中进行,例如可购自顺智公司(Sunds DefibratorAB),瑞典的Sunds水解器。根据需要,可以顺序或同时进行物理和化学预处理。
因此,在优选方面,使该纤维素或半纤维素材料经受物理(机械)或化学预处理或其任何组合,以促进纤维素、半纤维素、和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指可以促进纤维素、半纤维素和/或木质素从纤维素或半纤维素材料分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见,例如,舒·T.-A.(Hsu,T.-A.),1996,生物质的预处理(Pretreatment of biomass),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production and Utilization),怀曼C.E.(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;高希(Ghosh)和辛格(Singh),1993,应用微生物学进展(Adv.Appl.Microbiol.)39:295-333;麦克米兰·J.D.(McMillan,J.D.),1994,预处理木质纤维素生物质:综述(Pretreating lignocellulosic biomass:a review),用于燃料生产的生物质的酶转化(Enzymatic Conversion of Biomass for Fuels Production),希默尔·M.E.(Himmel,M.E.)、贝克·J.O.(Baker,J.O.)、以及奥弗伦·R.P.(Overend,R.P.)编辑,美国化学学会讨论会系列566(ACS Symposium Series 566),美国化学学会(AmericanChemical Society),华盛顿特区,第15章;贡·C.S.(Gong,C.S.)、卡奥·N.J.(Cao,N.J.)、杜·J.(Du,J.)、以及曹·G.T.(Tsao,G.T.),1999,由可再生资源生产乙醇(Ethanolproduction from renewable resources),生物化学工程/生物技术的进展(Advances inBiochemical Engineering/Biotechnology),舍佩尔·T.(Scheper,T.)编辑,施普林格出版社(Springer-Verlag),柏林,海德堡,德国,65:207-241);奥尔森(Olsson)和哈恩-哈格达尔(Hahn-Hagerdal),1996,酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦蓝德(Vallander)和埃里克松(Eriksson),1990,生物化学工程/生物技术的进展42:63-95)。
糖化。在水解步骤(还称为糖化)中,将(例如预处理的)纤维素或半纤维素材料水解,以将纤维素和/或半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖。在一个或多个阶段中,水解是由一种或多种本发明的酶组合物酶促进行。水解可以作为分批过程或系列分批过程进行。水解可以作为分批补料或连续过程、或系列分批补料或连续过程进行,其中将该纤维素材料或半纤维素材料逐渐进料至例如含有酶的水解溶液中。
酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中进行。在一方面,水解在适合于一种或多种酶的活性,即对于该一种或多种酶来说最佳的条件下进行。
糖化通常在受控的pH、温度以及混合条件下在搅拌釜反应器或发酵罐中进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如,总糖化时间可以持续长达200小时,但是典型地进行优选约4至约120小时,例如约12至约96小时或约24至约72小时。温度优选在约25℃至约80℃,例如约30℃至约70℃、约40℃至约60℃、或约50℃至55℃的范围内。pH优选在约3至约9,例如约3.5至约8、约4至约7、约4.2至约6、或约4.3至约5.5的范围内。
干固体含量在大约5到大约50wt.%的范围内,例如大约10至大约40wt.%,或大约20到大约30wt.%。
在一方面,在至少0.5%饱和度的浓度的溶解氧的存在下,进行该糖化。
在本发明的实施例中,糖化过程中的溶解氧浓度处于至少0.5%上至30%饱和度范围内,例如至少1%上至25%、至少1%上至20%、至少1%上至15%、至少1%上至10%、至少1%上至5%、和至少1%上至3%饱和度。在优选的实施例中,在糖化期的至少25%,例如在糖化期的至少50%或至少75%过程中,将溶解氧的浓度维持在至少0.5%上至30%的饱和度的浓度下,例如至少1%上至25%、至少1%上至20%、至少1%上至15%、至少1%上至10%、至少1%上至5%、至少1%上至3%饱和度。当该酶组合物包括氧化还原酶时,该溶解氧的浓度可以更高,达70%的饱和度。
向容器中添加氧,以在糖化过程中达到所希望的溶解氧浓度。可以通过经由扩散器或喷雾器添加压缩空气或通过其他已知的通气方法给容器、槽等通气而将溶解氧水平维持在所希望的范围内。可以在来自放置于容器/槽中的溶解氧传感器的反馈的基础上控制通气速率或该系统可以在没有反馈控制的情况下以恒定速率运行。在水解行列由多个串联的容器/槽组成的情况下,可以在这些容器/槽中的一个或多个或所有容器/槽中实施通气。通氧系统在本领域是熟知的。根据本发明,可以使用任何适合的通气系统。商业通气系统由例如英格兰德比的凯米尼尔公司(Chemineer)设计并且由例如美国密苏里州的保罗·穆勒公司(Paul Mueller Company)制造。
在本发明的方法中,可以在发酵之前或过程中,例如在糖化过程中,或在一种或多种发酵微生物的繁殖过程中或之后添加本发明的酶组合物。
发酵。可以通过一种或多种(例如,若干种)能够将糖直接或间接发酵为所希望的发酵产物的发酵微生物来发酵自水解的纤维素或半纤维素材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费性醇工业(例如啤酒和葡萄酒)、乳品工业(例如发酵的乳制品)、皮革工业和烟草工业的发酵方法。发酵条件取决于所希望的发酵产物和发酵生物,并且可以由本领域的普通技术人员容易地确定。
在发酵步骤中,作为预处理和酶水解步骤的结果的由纤维素或半纤维素材料释放的糖,由发酵生物体(例如酵母)发酵为产物,如,乙醇。水解(糖化)和发酵可以是分开的或同时的。
在实践本发明的发酵步骤中可以使用任何适合的水解的纤维素或半纤维素材料。该材料一般是基于经济学,即,每当量糖势的成本,以及对酶致转变的难降解性而进行选择。
术语“发酵培养基”在此可理解为指在添加一种或多种发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及在同时糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”是指适用于所希望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物。发酵生物可以是己糖和/或戊糖发酵生物、或其组合。己糖和戊糖发酵生物二者均是本领域中所熟知的。适合的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即,转化)成所希望的发酵产物。由林(Lin)等人,2006,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)69:627-642描述了产生乙醇的细菌和真菌发酵生物的实例。
能够发酵己糖的发酵微生物的实例包括细菌生物和真菌生物,如酵母。酵母包括以下各项的菌株:假丝酵母属、克鲁维酵母属、以及酵母菌属,例如萨纳瑞西斯假丝酵母(Candida sonorensis)、马克斯克鲁维酵母、以及酿酒酵母。
可以发酵处于其原生状态的戊糖的发酵微生物的实例包括细菌和真菌生物,如某一种酵母。发酵木糖的酵母包括假丝酵母属的菌株,优选是休哈塔假丝酵母(C.sheatae)或萨纳瑞西斯假丝酵母(C.sonorensis);以及毕赤酵母属的菌株,例如是树干毕赤酵母,像树干毕赤酵母CBS 5773。发酵戊糖的酵母包括管囊酵母属的菌株,优选是嗜鞣管囊酵母(P.tannophilus)。不能发酵戊糖(如木糖和阿拉伯糖)的生物可以通过本领域已知方法来进行遗传修饰而发酵戊糖。
能够有效地将己糖和戊糖发酵成乙醇的细菌的实例包括,例如,凝结芽孢杆菌、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、发酵植物多糖梭菌(Clostridium phytofermentans)、土芽孢杆菌属、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(Zymomonas mobilis)(菲利皮迪斯,G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulosebioconversion technology),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production and Utilization),怀曼,C.E(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),179-212)。
其他发酵生物包括以下各项的菌株:芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如萨纳瑞西斯假丝酵母、甲醇山梨糖假丝酵母(C.methanosorbosa)、迪丹斯假丝酵母(C.diddensiae)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、布朗克假丝酵母(C.blankii)、嗜虫假丝酵母(C.entomophilia)、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(C.pseudotropicalis)、博伊丁假丝酵母(C.boidinii)、产朊假丝酵母(C.utilis)、以及休哈塔假丝酵母;梭菌属,如丙酮丁醇梭菌、热纤维梭菌、以及发酵植物多糖梭菌;大肠杆菌,特别是已被遗传修饰以改善乙醇产率的大肠杆菌菌株;土芽孢杆菌属种;汉逊酵母属,如异常汉逊酵母(Hansenula anomala);克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(K.oxytoca);克鲁维酵母属,如马克斯克鲁维酵母(K.marxianus)、乳酸克鲁维酵母(K.lactis)、耐热克鲁维酵母(K.thermotolerans)、以及脆壁克鲁维酵母(K.fragilis);裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属(Thermoanaerobacter),如解糖热厌氧杆菌、以及发酵单胞菌属(Zymomonas),如运动发酵单胞菌。
适于乙醇生产的可商购的酵母包括,例如,AFT和XR(拉曼特殊化学公司(Lallemand Specialities,Inc.),美国)、ETHANOL酵母(乐斯富公司(Lesaffreet Co),派尼尔(pagnie),法国)、(AB毛里食品有限公司(AB Mauri Food Inc.),美国)、(雷姆科国际股份有限公司(Rymco International AG),丹麦)、GERTSTRANDTM(格特·斯特兰德公司(Gert Strand AB),瑞典)、和SUPERSTARTTM新鲜酵母(拉曼特殊化学公司,美国)。
在一方面,发酵微生物已经经过遗传修饰,以提供发酵戊糖的能力,如利用木糖的微生物、利用阿拉伯糖的微生物、以及共同利用木糖和阿拉伯糖的微生物。
将异源基因克隆到多种发酵微生物中已经构建出能够将己糖和戊糖转化成乙醇(共发酵)的生物(陈(Chen)和霍(Ho),1993,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)39-40:135-147;霍等人,1998,应用与环境微生物学(Appl.Environ.Microbiol.)64:1852-1859;科特(Kotter)和西拉塞(Ciriacy),1993,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)38:776-783;维尔福森(Walfridsson)等人,1995,应用与环境微生物学61:4184-4190;凯珀(Kuyper)等人,2004,欧洲微生物学会联合会酵母研究(FEMS Yeast Research)4:655-664;比尔(Beall)等人,1991,生物技术与生物工程(Biotech.Bioeng.)38:296-303;英格拉姆(Ingram)等人,1998,生物技术与生物工程58:204-214;张(Zhang)等人,1995,科学(Science)267:240-243;狄安妲(Deanda)等人,1996,应用与环境微生物学62:4465-4470;WO 2003/062430)。
在一方面,该发酵生物包括编码一种或多种纤维素分解酶、半纤维素分解酶和辅助酶的一个或多个多核苷酸。
本领域中公知的是,上述生物体还能用于产生其他物质,如本文所述。
典型地向降解的纤维素或半纤维素材料或水解物中添加发酵微生物,并且进行发酵持续约8至约96小时,例如约24至约60小时。温度典型地在约26℃至约60℃之间,例如约32℃或50℃,并且pH为约pH 3至约pH 8,例如pH 4至5、6、或7。
在一个方面,对降解的纤维素或半纤维素材料施用酵母和/或另一种微生物,并进行约12至约96小时,如通常为24-60小时发酵。在另一方面,温度优选在约20℃至约60℃之间,例如约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃,并且pH通常是从约pH 3至约pH 7,例如约pH 4至约pH 7。然而,一些发酵生物(例如细菌)具有更高的最适发酵温度。酵母或另一种微生物优选以每ml发酵液大约105至1012,优选从大约107至1010,特别是大约2×108个活细胞计数的量施用。关于使用酵母进行发酵的进一步指南可以见于例如“醇教材(The Alcohol Textbook)”(K·雅克(K.Jacques)、T.P.里昂(Lyons)以及D.R.凯尔索尔(Kelsall)编辑,诺丁汉大学出版社(Nottingham University Press),英国(UnitedKingdom)1999),将其通过引用结合在此。
发酵刺激剂可以与在此所描述的任何方法组合使用,以进一步改进发酵方法,特别是改进发酵微生物的性能,如,提高速度和乙醇产率。“发酵刺激剂”是指用于发酵微生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素A、B、C、D和E。例如参见阿尔弗雷多(Alfenore)等人,通过在进料分批方法过程中的一种维生素进料策略改进乙醇产生和酿酒酵母的存活力(Improving ethanolproduction and viability of Saccharomyces cerevisia by a vitamin feedingstrategy during fed-batch process),施普林格(2002),其通过引用结合在此。矿物质的实例包括可以供应含有P、K、Mg、S、Ca、Fe、Zn、Mn和Cu营养素的矿物质和矿物盐。
发酵产物:发酵产物可以是由发酵得到的任何物质。发酵产物可以是而不限于:醇(例如,阿拉伯糖醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇、以及木糖醇);烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷);环烷烃(例如,环戊烷、环己烷、环庚烷、以及环辛烷);烯烃(例如,戊烯、己烯、庚烯、以及辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、以及苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)、以及一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸、以及木糖酸);以及聚酮化合物。
在一方面,该发酵产物是醇。术语“醇”涵盖含有一个或多个羟基部分的物质。醇可以是而不限于:正丁醇、异丁醇、乙醇、甲醇、阿拉伯糖醇、丁二醇、乙二醇、甘油(glycerin)、丙三醇(glycerol)、1,3-丙二醇、山梨醇、或木糖醇。参见例如,宫(Gong)等人,1999,由可再生资源生产乙醇(Ethanol production from renewable resources),在生化工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology)中,舍佩尔,T.(Scheper,T.)编辑,施普林格出版社,柏林,海德堡,德国,65:207-241;西尔维拉(Silveira)和乔纳斯(Jonas),2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:400-408;尼加姆(Nigam)和辛格,1995,加工生物化学(Process Biochemistry)30(2):117-124;埃塞吉(Ezeji)等人,2003,微生物与生物技术世界杂志(World Journal of Microbiology and Biotechnology)19(6):595-603。
在另一方面,发酵产品是一种烷烃。该烷烃可以是非支链或支链烷烃。烷烃可以是而不限于:戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、或十二烷。
在另一方面,该发酵产物是一种环烷烃。环烷烃可以是而不限于:环戊烷、环己烷、环庚烷或环辛烷。
在另一个方面中,该发酵产物是一种烯烃。该烯烃可以是非支链或支链烯烃。烯烃可以是而不限于:戊烯、己烯、庚烯或辛烯。
在另一方面,该发酵产物是氨基酸。该有机酸可以是而不限于:天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、或苏氨酸。参见例如理查德(Richard)和马加里蒂(Margaritis),2004,生物技术和生物工程(Biotechnology and Bioengineering)87(4):501-515。
在另一个方面中,发酵产物是气体。气体可以是而不限于:甲烷、H2、CO2、或CO。参见例如,片冈(Kataoka)等人,1997,水科学与技术(Water Science and Technology)36(6-7):41-47;以及古纳森兰(Gunaseelan),1997,生物质与生物能源(Biomass andBioenergy)13(1-2):83-114。
在另一方面,发酵产品是异戊二烯。
在另一方面,该发酵产物是一种酮术语“酮”涵盖含有一个或多个酮部分的物质。酮可以是而不限于:丙酮。
在另一方面,发酵产物是一种有机酸。有机酸可以是而不限于:乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、或木糖酸)。参见,例如,陈(Chen)和李(Lee),1997,生物化学与生物技术(Biochem.Biotechnol.)63-65:435-448。
在另一方面,发酵产品是聚酮化合物。
回收。可以使用本领域中已知的任何方法可任选地从发酵培养基回收一种或多种发酵产物,这些方法包括但不限于,层析法、电泳程序、差别溶解度、蒸馏、或提取。例如,通过常规蒸馏方法从发酵的纤维素或半纤维素材料中分离和纯化醇。可以获得具有高达约96vol.%的纯度的乙醇,这可以用作例如燃料乙醇,饮用乙醇,即可饮用的中性烈酒,或工业乙醇。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实例
菌株
里氏木霉RutC30是最初分离株QM6A(蒙特尼考特(Montenecourt)和伊夫利(Eveleigh),1979,《化学进展丛书》(Adv.Chem.Ser.)181:289-301)的诱变的里氏木霉菌株。
里氏木霉菌株981-O8-D4是里氏木霉RutC30的诱变菌株。
里氏木霉AgJg115-104-7B1是菌株里氏木霉981-O8-D4菌株,该菌株含有破坏的ku70,使其缺乏DNA的非同源末端连接(WO 2011/07567)。
培养基和缓冲溶液
纤维素酶诱导培养基(CIM)由以下各项构成:20g的Arbocel天然的纤维素纤维(J.Rettenmaier USA LP)、10g的玉米浆固体、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4 7H2O、0.42ml的里氏木霉痕量金属溶液、2滴消泡剂、以及去离子水补足至1升;pH 6.0。
COVE板由以下各项构成:342.3g的蔗糖、20ml的COVE盐溶液、10ml的1M乙酰胺、10ml的1.5M CsCl、25g的诺布尔琼脂(Difco)、以及去离子水补足至1升。
COVE盐溶液由以下构成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量金属溶液、以及去离子水补足至1升。
COVE痕量金属溶液由以下构成:0.04g的NaB4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g或1g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、以及去离子水补足至1升。
LB+Amp培养基由以下各项构成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、以及加至1升的去离子水。在高压灭菌之后,添加在水中的1ml的100mg/ml的氨苄青霉素溶液。
覆盖PDA培养基由以下各项构成:39g的马铃薯右旋糖琼脂(Difco)和补足至1升的去离子水。
PDA板由以下各项构成:39g的马铃薯右旋糖琼脂(Difco)和补足至1升的去离子水。
PEG缓冲液由以下各项构成:500g的PEG 4000、10mM CaCl2、10mM Tris-HCl pH7.5,以及补足至1升的去离子水;过滤除菌。
SOC培养基由以下各项构成:20g的胰蛋白胨、5g的酵母提取物、0.5g的NaCl、10ml的250mM KCl、以及补足至1升的去离子水。
STC由以下各项构成:0.8M或1M山梨醇、10mM或25mM CaCl2、以及10mM Tris-HCl,pH 7.5;过滤除菌。
TAE缓冲液由以下各项构成:4.84g的Tris碱、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8)、以及补足至1升的去离子水。
TBE缓冲液由以下各项构成:10.8g的Tris碱、5g的硼酸、4ml的0.5M EDTA(pH 8)、以及加至1升的去离子水。
TE缓冲液由在去离子水中的1M Tris pH 8.0和0.5M EDTA pH8.0构成。
TrMM-G板由以下构成:20ml的COVE盐溶液、6g的(NH4)2SO4、0.6g的CaCl2、25g的诺布尔琼脂(Difco)、20g的葡萄糖以及去离子水补足至1升。
里氏木霉痕量金属溶液由以下构成:216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g的MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO4、336g的柠檬酸、以及去离子水补足至1升。
2XYT+Amp板由以下各项构成:10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠、15g的细菌琼脂(Bacto Agar)、以及加至1升的去离子水,在高压灭菌之后,添加2ml的50mg/ml的氨苄青霉素的过滤灭菌的溶液。
YP培养基由以下各项构成:10g的酵母提取物、20g的细菌蛋白胨、以及补足至1升的去离子水。
实例1:里氏木霉菌株AgJg115-104-7B1的原生质体生成和转化以删除里氏木霉42kDa天冬氨酸蛋白酶
使用改良的宾替拉(Penttila)等人,1987,基因(Gene)61:155-164的方案进行原生质体制备与转化。简言之,将里氏木霉菌株AgJg115-104-7B1在25ml的补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中在27℃下、伴随着以90rpm进行的温和搅拌培养17小时。将菌丝体通过使用密理博真空驱动一次性过滤系统(密理博公司(Millipore),贝德福德,马萨诸塞州,美国)过滤来收集,并用去离子水洗涤两次,并用1.2M山梨醇洗涤两次。通过在20ml的每ml含有15mg的200G(诺维信公司,鲍斯韦,丹麦(Novozymes A/S,Bagsvaerd,Denmark))和每ml含有0.36单位的壳多糖酶(西格玛化学有限公司,圣路易斯,密苏里州,美国(Sigma Chemical Co.,St.Louis,MO,USA))的1.2M山梨醇中在34℃下伴随着以90rpm的进行的温和震荡来悬浮经洗涤的菌丝体,持续15-25分钟,从而产生原生质体。将原生质体通过在400x g下离心7分钟来收集,并用冷的1.2M山梨醇洗涤两次。将原生质体使用血球计数器来计数,并重悬于STC中至终浓度为1x 108个原生质体/ml。将过量的原生质体在-80℃下储存于冷冻管中并冻结在Cryo 1℃冷冻容器(耐洁公司(Nalgene),罗契斯特,纽约,美国)中。
缺失构建体pAgJg118(WO 2011/075677)含有大肠杆菌潮霉素磷酸转移酶(hpt)基因和侧翼为直接重复的单纯疱疹病毒胸苷激酶(tk)基因。插入直接重复以促进hpt和tk可选择的标记物的切除并产生42kDa天冬氨酸蛋白酶基因的完全缺失。将96μg的转化质粒pAgJg118用Pme I消化。将消化反应物通过1%琼脂糖凝胶电泳使用TAE缓冲液来纯化,其中从该凝胶切出7.9kb DNA条带,并且使用凝胶提取试剂盒(凯杰公司,巴伦西亚,加州,美国)进行提取。简言之,将3体积的试剂盒-供应的缓冲液QG添加至该凝胶切片并在50℃下溶解持续大约10分钟。通过转移至该柱并且在13,000rpm下离心持续1分钟,将溶解的凝胶切片施用于试剂盒-供应的旋转柱。将该柱用750μl的试剂盒-供应的缓冲液PE洗涤并重复该离心。用25μl的试剂盒-供应的缓冲液EB洗脱DNA。将大约1μl的所得的经纯化的DNA片段添加至100μl的原生质体溶液中并轻轻混合。添加PEG缓冲液(250μl),混合,并且在34℃下孵育30分钟。然后添加STC(3ml),混合,并且涂布在补充有1M蔗糖的PDA板上。在28℃下孵育16小时后,将20ml的、每ml补充有35μg的潮霉素B的覆层PDA培养基添加至各平板。将这些板在28℃下孵育4-7天。将七种转化体传代培养到PDA板上以产生孢子。
将在42kDa天冬氨酸蛋白酶座基因处包含pAgJg118缺失载体的里氏木霉菌株AgJg115-104-7B1的转化体通过真菌菌落PCR进行筛选。将来自每种转化体的少量孢子悬浮于20μl的稀释缓冲液(Plant Direct PCR试剂盒,赛默飞世尔科技公司(ThermoFisher Scientific),沃尔瑟姆,马萨诸塞州,美国)中。将该孢子悬浮液用作PCR反应中的模板,来筛查天冬氨酸蛋白酶缺失。该反应由以下各项构成:0.5μl的孢子悬浮液、50pmol的引物069134(如下所示)、50pmol的引物067947(如下所示)、10μl的2X植物PCR缓冲液(植物直接PCR试剂盒(Plant Direct PCR Kit),赛默飞世尔科技公司(ThermoFisher Scientific,Inc.))、以及0.4μl的热启动II DNA多聚酶(植物直接PCR试剂盒,赛默飞世尔科技公司(Thermo Fisher Scientific,Inc.)),在20μl中反应。将该反应在(艾本德科技公司(EppendorfScientific,Inc.),美国纽约州韦斯特伯里(Westbury,NY,USA))中孵育,其被编程为:1个循环,在98℃持续5分钟;40个循环,每个在98℃持续5秒,58℃持续5秒,和72℃持续2分钟20秒;和1个循环,在72℃持续2分钟;以及10℃保持。引物069134位于5’侧翼区上游并且引物067947位于大肠杆菌潮霉素磷酸转移酶(hpt)基因编码区域的起始部位。如果将缺失载体整合到天冬氨酸蛋白酶基因座,该扩增的PCR片段应长2.4kb。命名为里氏木霉AgJg115-118-1的一个转化体被鉴定为具有缺失的天冬氨酸蛋白酶基因。
正向引物:
5’-CGCAATCTATCGAATAGCAG-3’(SEQ ID NO:37)
反向引物:
5’-CTACATCGAAGCTGAAAGCACGAGA-3’(SEQ ID NO:38)
将来自里氏木霉AgJg115-118-1的孢子涂布到TrMM-G板上,该板补充有1μM 5-氟-2'-脱氧尿苷(Fd U)并且在28℃下孵育6天。在PDA板上将九个分离株传代培养并在28℃下孵育6天。以如上所述的相似的方式,然后通过真菌菌落PCR筛选这些分离株以检查是否不存在hpt和tk标记。该PCR筛选由以下各项构成:0.5μl的每种孢子悬浮液、50pmol的下列的正向和反向引物、10μl的2X植物PCR缓冲液、以及0.4μl的热启动II DNA多聚酶,在20μl反应物中。
正向引物:
5’-CGCAATCTATCGAATAGCAG-3’(SEQ ID NO:39)
反向引物:
5’-GACGTGCAACTTCCTTCAAAC-3’(SEQ ID NO:40)
将这些反应在中孵育,其被编程为:1个循环,在98℃持续5分钟;40个循环,每个在98℃持续5秒,58℃持续5秒,和72℃持续1分钟45秒;和1个循环,在72℃持续1分钟;以及10℃保持。该正向引物位于5'侧翼区上游并且该反向引物位于3'侧翼区域下游。如果该天冬氨酸蛋白酶编码序列已经缺失,并且hpt和tk标记已经被环出,那么经扩增的PCR片段应长3.6kb。
将来自这些分离株的基因组DNA如以下所示地制备并通过Southern印迹分析,以确认42kDa天冬氨酸蛋白酶编码序列的缺失。
使这些里氏木霉AgJg115-118-1分离株在补充有在250ml带挡板的摇瓶中的2%葡萄糖(w/v)的50ml的YP培养基中在28℃下伴随着以200rpm的搅拌生长2天。通过使用(卡尔生化公司(Calbiochem),拉荷亚,加州,美国)过滤获得的菌丝体,用去离子水中洗涤两次,并在液氮中冷冻。根据该生产商的方案,除该裂解孵育延长到2小时外,将冷冻的菌丝体通过研钵及研杵磨成细粉,并使用Plant Maxi试剂盒(凯杰公司(QIAGEN Inc.),巴伦西亚,加州,美国)来分离总DNA。简言之,将5ml的试剂盒-供应的缓冲液AP1添加到在15ml圆锥形底部管中的1g的组织中,并在65℃下持续孵育2小时。然后添加1.8ml的试剂盒-供应的缓冲液AP2。使用LEGENDTM RT吊桶式离心机(赛默飞世尔科技公司(Thermo Fisher Scientific,Inc.),沃尔瑟姆,马萨诸塞州,美国(Waltham,MA,USA))将该管在冰上孵育5分钟并在3300rpm离心5分钟。将上清液转移至QIAShredderTM柱(凯杰公司(QIAGEN Inc.),巴伦西亚,加利福尼亚州,美国)中并重复该离心。将上清液转移到新的50ml锥形管中,其中向该锥形管中添加1.5体积的试剂盒-供应的缓冲液AP3/E并转移到试剂盒-供应的DNA旋转柱上,并且重复该离心。将该柱用12ml的试剂盒-供应的缓冲液AW洗涤并重复该离心。通过重复离心而无任何添加来干燥该柱。通过添加1ml的试剂盒-供应的缓冲液AE来洗脱该DNA并重复该离心。
对于Southern印迹分析,用10单位的Nco I在30μl反应体积中消化2μg的基因组DNA,并使用TAE缓冲液,将这些基因组DNA经受0.7%琼脂糖电泳。使用TURBOBLOTTERTM(沃特曼,英国肯特),将在该凝胶中的DNA脱嘌呤化、变性、进行中和、并且转移到超负荷尼龙膜(沃特曼,英国肯特)上。使用UV STRATALINKERTM(Stratagenee公司,拉荷亚,加州,美国),将该DNA进行UV交联到该膜上,并且在42℃下在20ml DIG Easy Hyb(罗氏诊断公司(Roche Diagnostics Corporation),印第安纳波利斯,印第安纳州,美国)中预杂交1小时。
将该膜与500bp地高辛标记的里氏木霉C 42kDa天冬氨酸蛋白酶基因探针杂交,其中使用如下所示的正向和反向引物通过PCR,通过掺入地高辛-11-dUTP合成该探针。
正向引物:
5’-CTTCTATCTTGGGATGCTTCACGATACGTGA-3’(SEQ ID NO:41)
反向引物:
5’-CGCGCCCTTGAATATCGGAGAAGGT-3’(SEQ ID NO:42)
该扩增反应由以下各项构成:5μl的10X Taq缓冲液(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国)、2.5μl的PCR DIG标记的混合物、5ng的pAgJg118、10pmol每种引物、2.5μl的10mM dNTP、5单位的Taq DNA多聚酶(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国)、以及36.5μl的水。将该反应在中孵育,其被编程为:1个循环,在95℃持续2分钟;30个循环,每个循环在95℃持续30秒,56℃持续30秒,和72℃持续40秒;和1个循环,在72℃持续15分钟;以及4℃保持。使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化该探针,从该凝胶切离,并使用凝胶提取试剂盒进行提取。简言之,将3体积的试剂盒-供应的缓冲液QG添加至该凝胶切片并在50℃下溶解持续大约10分钟。将溶解的凝胶切片转移至旋转柱,并且在13,000rpm下离心持续1分钟。将该柱用750μl的试剂盒-供应的缓冲液PE洗涤并然后重复该离心。用25μl的试剂盒-供应的缓冲液EB洗脱DNA。
将该探头煮沸持续5分钟,在冰上冷却持续2分钟,并添加至10ml的DIG Easy Hyb中以产生该杂交溶液。杂交在42℃下进行15-17小时。然后在室温下在2X SSC加0.1%SDS中在低严格条件下对该膜洗涤两次,接着在65℃下在0.5X SSC加0.1%SDS中进行两次高严格洗涤,每次15分钟。通过化学发光测定(罗氏诊断,印第安纳波利斯,印第安纳州,美国),根据该生产商的指示对探针-靶杂交体进行检测。Southern印迹分析对初级转化体里氏木霉AgJg115-118-1H1的鉴定为:包含该置换并且缺乏hpt/tk标记。
实例2:cbh2置换型载体pGMER169的构建
用以下所示的引物,将cbh2编码序列(SEQ ID NO:3[DNA序列]和SEQ ID NO:4[氨基酸序列])自作为模板的pP23YSW(WO 2012/103288)进行PCR扩增。突出下划线部分以匹配该pMJ09载体(美国20080233613)。
正向引物:
5’-ATAGTCAACCGCGGACTGCGCACCATGCGGTCTCTCCTGGCTCTTGCCCC-3’(SEQ ID NO:43)
反向引物:
5’-TCAGGCTTTCGCCACGGAGCTTAATTAATTAGAAAGAGGGGTTGGCGTTG-3’(SEQ ID NO:44)
该扩增反应由以下各项构成:10ng的pP23YSYW、200μM dNTP、0.5μM引物、1X反应缓冲液(纽英伦生物技术有限公司(New England Biolabs,Inc.)伊普斯威奇,马萨诸塞州,美国)、以及1单位的高保真DNA聚合酶(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国),最终体积为50μl。在 中孵育该扩增反应,程序为1个循环,在98℃下,持续30秒;30个循环,每个循环在98℃持续10秒,59℃持续30秒,以及72℃持续1分钟;以及一个循环,在72℃下,持续10分钟。
通过1%琼脂糖电泳使用TAE缓冲液来分离PCR产物,其中将1.9kb带从该凝胶中切除并用凝胶提取试剂盒(实例1)提取该DNA。使用无缝克隆和装配套件(生命技术(LifeTechnologies),卡尔斯巴德,加利福尼亚州,美国),将该片段插入Nco I/Pac I-消化的pMJ09。该反应由以下各项构成:4μl试剂盒-供应的5X酶缓冲液、100ng的pMJ09、54ng的PCR产物、和2μl的试剂盒-供应的酶混合物,在20μl反应体积中。将反应物在室温下孵育30分钟,并且然后置于冰上。然后通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育20分钟,使用8μl来转化ONETOP10大肠杆菌化学感受态细胞(英杰公司,卡尔斯巴德,加利福尼亚州,美国)。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下并伴随200rpm混合,将该管孵育1小时,并且转移200μl至150mm 2XYT+Amp板上,并在37℃下孵育过夜。将大肠杆菌菌落接种到在14ml法尔肯圆底聚丙烯管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,并伴随200rpm混合。使用9600(凯杰公司,巴伦西亚,加州,美国)将质粒DNA从得到的转化体中分离。用Sca I通过限制性酶切分析筛选这些得到的转化体,以确定该插入物的存在和方向。使用Applied Biosystems377XL自动DNA测序仪(应用生物系统有限公司(AppliedBiosystems Inc.),美国加州福斯特市(Foster City,CA,USA))和染料终止子化学(吉塞克(Giesecke)等人,1992,病毒学方法杂志(J.Virol.Methods)38:47-60)对阳性克隆进行DNA测序。将所得质粒命名为pAyGm8。
在氏木霉cbh2启动子和终止子的控制下,表达质粒pGMEr169包含SEQ ID NO:3的cbh2编码序列。使用如下所示的正向和反向引物,通过第一PCR从质粒pAYGm8扩增cbh2编码序列,来构建质粒pGMEr169。
正向引物:
5’-AGATCACCCTCTGTGTATTGCACCATGCGGTCTCTCCTGGCTCTTGCCCCT-3’(SEQ ID NO:45)
反向引物:
5'-CCGGTCACGAAAGCCTTAATTAACTATTAGAAAGAGGGGTTGGCGTTGGTAAG-3’(SEQ IDNO:46)
如下划线部分所示,该反向引物在该片段的3’端添加了Pac I限制性位点。
该扩增反应(50μl)由以下构成:50ng的质粒pAYGm8DNA、1XHF缓冲液(纽英伦生物技术有限公司(New England Biolabs,Inc.),美国麻萨诸塞州伊普斯威奇(Ipswich,MA,USA))、50pmol的每种引物、200μM每个dNTP、3%DMSO(纽英伦生物技术有限公司(New England Biolabs,Inc.),美国麻萨诸塞州伊普斯威奇(Ipswich,MA,USA))、以及1单位的高保真DNA多聚酶。在 上进行该反应,该反应被编程为:1个循环,在98℃下持续5分钟;35个循环,每个循环在98℃下持续30秒、60℃下持续30秒、以及72℃下持续2分钟;以及最终延伸循环,在72℃下持续7分钟。使用TBE缓冲液将已完成的PCR经受0.8%琼脂糖凝胶电泳,其中从该凝胶切下约1948bp PCR产物并且使用凝胶和PCR净化试剂盒(Macherey-Nagel有限公司,美国宾夕法尼亚州伯利恒(Bethlehem,PA,USA))进行纯化。
进行第二PCR反应进行以产生里氏木霉cbh2启动子片段,该片段含有与上述PCR产物的3’同源性并包括在其5'末端的Afl II限制性位点。使用以下正向和反向引物,将该片段进行PCR扩增自质粒pJfyS159(图1):
正向引物:
5'-GCTTAGGCCCTTAAGCTTAGGCCGGCTTGCTTACT-3'(SEQ ID NO:47)
反向引物:
5'-TACAAGC-3'(SEQ ID NO:48)
该正向引物在该片段的5’端添加了Afl II限制性位点,而该反向引物在其3’端(与上述(斜体的序列)的cbh2编码序列具有同源性的区域)添加。
该PCR(50μl)由以下各项构成:约50ng的质粒pJfyS159DNA、1XHF缓冲液、50pmol的以上每种引物、200μM每个dNTP、3%DMSO、以及1单位的高保真DNA聚合酶。在 上进行该反应,该反应被编程为:1个循环,在98℃下持续5分钟;35个循环,每个循环在98℃下持续30秒、60℃下持续30秒、以及72℃下持续1.5分钟;以及最终延伸循环,在72℃下持续7分钟。使用TBE缓冲液,将完成的PCR经受0.8%琼脂糖凝胶电泳,其中从该凝胶切下约1340bp PCR产物并且使用凝胶和PCR净化试剂盒进行纯化。
通过剪接通过重叠延伸(SOE)PCR,直接使用以上正向引物和来自以上cbh2PCR的反向引物,将1948bp和1340bp片段融合在一起,产生3237bp片段,其中在3237bp片段中,在cbh2编码序列上游添加里氏木霉cbh2启动子片段。
该PCR(50μl)由以下各项构成:针对约240ng模板DNA的总量的约120ng的每种的片段,1XHF缓冲液,50pmol的引物1201537,50pmol的引物1201280,200μM每个dATP、dCTP、dGTP、和dTP,1.5μl的100%DMSO,以及1单位的高保真DNA聚合酶。在 上进行该反应,该反应被编程为:1个循环,在98℃下持续3分钟;35个循环,每个循环在98℃下持续30秒、60℃下持续30秒、以及72℃下持续2.5分钟;以及最终延伸循环,在72℃下持续7分钟。使用TBE缓冲液,将完成的PCR经受0.8%琼脂糖凝胶电泳,其中从该凝胶切下约3237bp PCR产物并且使用凝胶和PCR净化试剂盒进行纯化。简言之,将2体积的缓冲液NT添加至该凝胶切片并将该样品在50℃下加热10分钟。将整个溶液转移到试剂盒-供应的离心式柱中。将该柱在13,000rpm下离心持续1分钟并且用试剂盒-供应的洗涤缓冲液NT3进行洗涤并再离心。将DNA用20μl的试剂盒-供应的洗脱缓冲液进行洗脱并且在13,000rpm下离心持续1分钟。
用Afl II和Pac I消化得到的3237bp片段,并将其连接到来自质粒pJfyS159的9044bp Afl II/Pac I片段。在37℃下,用Afl II和Pac I将约20μg的质粒pJfyS159消化过夜。在停止该消化反应前,将1μl的牛小肠碱性磷酸酶(纽英伦生物技术有限公司(NewEngland Biolabs,Inc.)伊普斯威奇,马萨诸塞州,美国)添加到pJfyS159-Afl II/Pac I消化中以将这些质粒末端去磷酸化。将该反应再次在37℃下孵育1小时。使用TBE缓冲液,将所得反应经受0.8%琼脂糖凝胶电泳,其中从该凝胶切下约9044bp PCR产物并且使用凝胶和PCR净化试剂盒进行纯化。在37℃下,将包含里氏木霉cbh2启动子和cbh2编码序列的3237bp PCR产物用限制性酶Afl II和Pac I消化持续3小时。将所得经消化的3209bp片段用凝胶和PCR净化试剂盒进行净化。
使用QUICK LIGATIONTM试剂盒(纽英伦生物技术有限公司(New England Biolabs,Inc.),美国麻萨诸塞州伊普斯威奇(Ipswich,MA,USA))进行该连接反应。该连接反应由以下各项构成:3μl的载体片段、3μl的里氏木霉cbh2启动子/cbh2编码序列插入物片段、4μl的无菌去离子水、10μl的2X快速连接缓冲液(纽英伦生物实验室(New England Biolabs)伊普斯威奇,马萨诸塞州,美国)、以及1μl的快速T4连接酶(纽英伦生物实验室(New EnglandBiolabs)伊普斯威奇,马萨诸塞州,美国)。将该连接反应在室温下孵育1小时。将5μl等分试样的该连接反应物转化入ONETOP10大肠杆菌化学感受态细胞中。简言之,将5μl的该连接反应物添加到一个含有这些感受态细胞的管中,并且将该混合物在冰上孵育持续30分钟。然后将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后将该管在37℃下在200rpm混合下孵育1小时,并将250μl转移至150mm 2XYT+Amp板,并在37℃下孵育过夜。为了所希望的插入物的适当插入,通过Hind III限制性酶切消化对若干得到的转化体进行筛选。将大肠杆菌转化体菌落接种到在14ml法尔肯圆底聚丙烯管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,并伴随在200rpm混合。使用9600分离质粒DNA。使用迷你质粒试剂盒(凯杰有限公司(QIAGEN Inc.),美国加州瓦伦西亚(Valencia,CA,USA))提取并纯化质粒DNA。为了最终的确认,将产生所希望的9168bp、2764bp、208bp、和113bp的Hind III带的四个转化体经受测序分析。使用应用生物系统(AppliedBiosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)执行DNA测序。在里氏木霉cbh2基因启动子和终止子的转录控制下,将得到的包含SEQ ID NO:3的cbh2编码序列的质粒命名为pGMER169(图2)。
实例3:在里氏木霉菌株AgJg115-118-1H1中的天然cbh2基因的置换
用Pme I消化大约200μg的质粒pGMEr169(实例2)。使用TAE缓冲液通过1%琼脂糖凝胶电泳对该消化反应进行纯化。从该凝胶切下9.6kb DNA带,并且使用凝胶提取试剂盒进行提取。用Pme I消化的pGMer169DNA(选择如在实例1中描述的潮霉素抗性(hpt))对里氏木霉菌株AgJg115-118-1H1(实例1)进行转化。获得35种转化体并且将每一种转移至PDA板并在28℃下孵育2-4天。利用使用植物直接PCR试剂盒的孢子PCR来鉴定转化体,这些转化体在cbh2基因座与pGMer169Pme I片段结整合。简言之,用无菌的1μl的接种环收集来自每种转化体的孢子,并转移到在0.2ml PCR带管中的15μl的试剂盒-供应的稀释缓冲液中,并在室温下孵育5分钟。将每种孢子悬浮液短暂地在条-离心(strip-fuge)微型离心机(西格玛奥德里奇公司(Sigma-Aldrich),圣路易斯,密苏里州,美国)中离心,并将1μl的每种上清液用于该孢子PCR反应中。该孢子PCR反应由以下各项构成:1X植物直接PCR缓冲液(包含dNTP和Mg)、10pmol的如下所示的基因特异性正向和反向引物、和0.4μl的II热启动DNA聚合酶。
正向引物(与SEQ ID NO:3的cbh2的5'侧翼具有同源性):
5’-CTCTATAGAGGAATCAGCGT-3’(SEQ ID NO:49)
反向引物1(与SEQ ID NO:3的cbh2具有同源性):
5’-TACACCTCGGACGAGTATTC-3’(SEQ ID NO:50)
反向引物2(与里氏木霉cbh2编码序列具有同源性):
5’-TCTAGAGGCACACTAGCTGC-3’(SEQ ID NO:51)
中孵育这些扩增反应,程序为1个循环,在98℃下,持续5分钟;40个循环,每个循环在98℃持续5秒,57℃持续5秒,以及72℃持续45秒;以及一个循环,在72℃下,持续1分钟。
使用TAE缓冲液,将完成的多个PCR反应经受0.8%琼脂糖凝胶电泳。具有该天然里氏木霉cbh2基因(该基因具有SEQ ID NO:3的cbh2编码序列)的正确置换的转化体产生2.1kb片段,而具有完整的天然cbh2基因的转化体产生1.7kb片段。
两种转化体产生正确置换片段并被选为孢子隔离。将来自6天龄的PDA板的孢子收集在4ml的0.01%20中,并用血细胞计数器来确定该孢子浓度。使用无菌水将孢子适当地稀释至103孢子/ml并将100个孢子涂布在PDA板上。将板在30℃下孵育2天。将来自每种转化体的分离的菌落用无菌的10μl接种环挑取并转移到新的50mm PDA板上并且在30℃下孵育。利用使用植物直接PCR试剂盒(上述的方案和引物)的孢子PCR来鉴定具有正确的基因置换的孢子分离株。选择正确的孢子分离株并且使用5-氟脱氧尿苷(Fd U)反向选择环出该hpt/tk标记。将来自该PDA板的孢子收集在4ml的0.01%20中,并将大约30μl的该孢子悬浮液添加至补充有1μM FdU的50mm TrMM-G板的中部。将这些FdU板在30℃下孵育6天。将菌丝体块从该生长区域的外边缘切除并转移至PDA板,并将该板在30℃下孵育。利用使用植物直接PCR试剂盒(如上所述)的孢子PCR来鉴定具有正确的hpt/tk标记的环出的分离株。
筛选hpt标记
正向引物(与hpt标记具有同源性):
5’-GGCATGACCTTTTGATGATCG-3’(SEQ ID NO:52)
反向引物(与里氏木霉cbh2基因座的3’侧翼具有同源性):
5’-TTACAACGTACCTACCTAGT-3’(SEQ ID NO:53)
筛选tk标记
正向引物(与里氏木霉cbh2基因座的5’侧翼具有同源性):
5’-CTCTATAGAGGAATCAGCGT-3’(SEQ ID NO:54)
反向引物(与tk标记具有同源性):
5’-CGTGTCCCCGATATGGGGTCGTGGG-3’(SEQ ID NO:55)
中孵育这些扩增反应,程序为1个循环,在98℃下,持续5分钟;40个循环,每个循环在98℃持续7秒,57℃持续7秒,以及72℃持续2分钟;以及一个循环,在72℃下,持续2分钟。
使用TAE缓冲液,将完成的一个或多个PCR反应经受0.8%琼脂糖凝胶电泳。仍然含有hpt标记的分离株产生1.8kb片段,并且仍然含有tk标记的分离株产生5.5kb片段。继续进行缺乏hpt和tk标记的分离株。
使用孵育环将来自6天龄的PDA板的孢子转移至1ml的0.01%20中,并用血细胞计数器来确定该孢子浓度。将孢子适当地稀释至103孢子/ml并将100个孢子涂布在PDA板上。将板在30℃下孵育2天。用无菌的10μl接种环挑取菌落并转移到新的50mm PDA板上并且在28℃下孵育5天。通过如上所述的孢子PCR,再次检查这些最终的分离株以确定是否不存在hpt标记。
如下所述制备来自这些最终分离株的基因组DNA,并通过Southern印迹分析对其进行分析。
使这些里氏木霉分离株每个在补充有在125ml带挡板的摇瓶中的2%葡萄糖(w/v)的25ml的YP培养基中在28℃下伴随着以200rpm的搅拌生长2天。通过在布氏漏斗中的沃特曼1滤纸通过真空过滤从每种培养物收获菌丝体。将菌丝体制剂各自在去离子水中洗涤两次,在真空下干燥,然后将其转移至2ml的微离心管中。在Savant ISS110速度真空浓缩器(SpeedVac concentrator)(赛默飞世尔科技,美国麻萨诸塞州沃尔瑟姆(Waltham,MA,USA))中将菌丝体制剂进行干燥大约16小时。将干燥菌丝体制剂研磨成细粉并使用MasterPureTM酵母DNA纯化试剂盒(中心公司(Epicentre),麦迪逊,威斯康星州,美国)分离总DNA。将相当于大约50μl体积的经研磨的菌丝体各自转移到2ml的微离心管中。将酵母细胞裂解溶液(300μl;中心公司(Epicentre),麦迪逊,威斯康星州,美国)添加至每个菌丝体样品中并涡旋每个样品。将每个样品在65℃下持续孵育20分钟。将这些样品放置在冰上5分钟。将MPC蛋白沉淀剂(150μl;中心公司,麦迪逊,威斯康星州,美国)添加至每个样品中,并且将这些样品涡旋10秒。在≥10,000rpm下在微离心机中离心样品10分钟。将这些上清液各自转移到干净的1.7ml的微离心管中并添加500μl的异丙醇。将这些样品通过倒置充分混合。在≥10,000rpm下通过离心在微型离心机中沉淀这些DNA持续10分钟。弃去这些上清液。将包含DNA的球粒用0.5ml的70%乙醇进行洗涤。在≥10,000rpm下在微离心机中离心样品4分钟。将乙醇用液管移除并将这些球粒在室温下空气干燥持续7分钟。将这些DNA球粒重悬在60μl的TE中。将1.5μl等分试样的5μg/μl RNase A添加至每管中并将这些样品在37℃下孵育30分钟。
对于Southern印迹分析,用20个单位的Hind III消化大约1μg的基因组DNA,并使用TAE缓冲液,将这些基因组DNA经受0.8%琼脂糖电泳。使用TURBOBLOTTERTM,将在该凝胶中的DNA脱嘌呤化、变性、进行中和、并且转移到超负荷尼龙膜上。使用UVSTRATALINKERTM,将该DNA进行UV交联到该膜上,并且在42℃下在20ml DIG Easy Hyb中预杂交1小时。
使用高保真热启动DNA聚合酶(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国)和以下所示的基因-特异性正向和反向引物生产用于杂交至里氏木霉cbh2基因的3’侧翼区域的探针的模板。
正向引物:
5’-TCTTGAGCCGCATCGCATAGA-3’(SEQ ID NO:56)
反向引物:
5’-TACGGTCAGCGCTCATGCGAA-3’(SEQ ID NO:57)
将五十皮摩尔的各以上引物用于如下PCR中,该PCR由以下各项构成:100ng的里氏木霉RutC30基因组DNA,1X PHUSIONTM高保真热启动DNA聚合酶缓冲液(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国),1μl的10mM的dATP、dTTP、dGTP和dCTP的共混物,以及1单位的高保真热启动DNA聚合酶,最终体积为50μl。使用5333epgradient S(艾本德科技有限公司,美国纽约韦斯特伯里)进行该扩增,其被编程为:1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒、60℃下持续30秒、以及72℃下持续1分钟30秒;以及1个循环,在72℃下持续10分钟。通过0.8%琼脂糖凝胶电泳使用TAE缓冲液来纯化完成的PCR,其中将0.46kb带从该凝胶中切除并用提取II试剂盒提取该DNA。简言之,将3体积的缓冲液NT添加至该凝胶切片并将该样品在50℃下加热10分钟。将整个溶液转移到试剂盒-供应的离心式柱中。将该柱在13,000rpm下离心持续1分钟并且用试剂盒-供应的洗涤缓冲液NT3进行洗涤并再离心。将DNA用30μl的试剂盒-供应的洗脱缓冲液进行洗脱并且在13,000rpm下离心持续1分钟。
使用PCR Dig探针合成试剂盒(罗氏诊断公司,印第安纳波利斯,印第安纳州,美国(U S A))用以上直接所示的正向和反向引物生产杂交至里氏木霉cbh2基因的3’侧翼区域的探针。
该50μl PCR反应物由以下各项构成:1X PCR DIG探针合成混合物、50pmol的每种引物、具有MgCl2的1X PCR缓冲液、24ng纯化的探针模板(如上所述)、以及2.6个单位的高保真DNA多聚酶(罗氏应用科学公司(Roche Applied Science),潘茨堡,德国)。循环参数如下:1个循环,在95℃持续2分钟;30个循环,每个循环在95℃持续30秒,59℃持续30秒,以及在72℃持续45秒;以及1个循环,在72℃持续7分钟。
将该探头煮沸持续5分钟,在冰上冷却持续2分钟,并添加至10ml的DIG Easy Hyb中以产生该杂交溶液。杂交在42℃下进行15-17小时。然后在室温下在2X SSC加0.1%SDS中在低严格条件下对该膜进行洗涤,接着在65℃下在0.5X SSC加0.1%SDS中进行两次高严格洗涤,每次15分钟。通过化学发光测定(罗氏诊断,印第安纳波利斯,印第安纳州,美国),根据该生产商的指示对探针-靶杂交体进行检测。Southern印迹分析鉴定包含该cbh2置换(3.3kb杂交片段)且并不包含该hpt/tk标记的最终孢子分离株。该天然里氏木霉cbh2基因座产生4.7kb杂交片段。选择一个孢子分离株作为该最终菌株并且命名为里氏木霉KM1000-34。
实例4:cbh1置换型载体pAyGm10的产生
为了构建质粒pAyGm7,将cbh1编码序列(SEQ ID NO:1[DNA序列]和SEQ ID NO:2[氨基酸序列])进行PCR扩增,该PCR来自具有如下所示引物的作为模板的质粒pP23YSY(WO2012/103293)。突出下划线部分以匹配进入质粒pMJ09(WO 2005/056772)的插入位点。
正向引物
5’-ATAGTCAACCGCGGACTGCGCACCATGGCCAGCCTCTTCTCTTTCAAGATG-3’(SEQ ID NO:58)
反向引物
5’-CAGGCTTTCGCCACGGAGCTTAATTAATTACAGGCACTGGTAGTAGTAGGGGTTC-3’(SEQ IDNO:59)
该扩增反应由以下各项构成:15ng的pP23YSY、200μM dNTP、0.5μM引物、1X反应缓冲液、以及1单位的高保真DNA聚合酶,最终体积为50μl。在中孵育该反应,程序为1个循环,在98℃下,持续30秒;30个循环,每个循环在98℃持续10秒,62℃持续30秒,以及72℃持续1分钟;以及一个循环,在72℃下,持续10分钟。
在PCR后,使用无缝克隆和装配套件将该片段直接插入Nco I/PacI-消化的pMJ09中。该反应由以下各项构成:4μl试剂盒-供应的5X酶缓冲液、100ng的pMJ09、45.8ng的PCR产物、和2μl的试剂盒-供应的酶混合物,在20μl反应体积中。将该反应物在室温下孵育30分钟并且然后置于冰上。然后通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育20分钟,使用1.3μl来转化ONETOP10大肠杆菌化学感受态细胞。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下并伴随200rpm混合,将该管孵育1小时,并且转移200μl至150mm 2XYT+Amp板上,并在37℃下孵育过夜。将大肠杆菌转化体菌落各自接种到在14ml法尔肯圆底聚丙烯管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,并伴随200rpm搅拌。使用9600,将质粒DNA从得到的转化体中分离。用Sal I通过限制性酶切分析筛选这些得到的转化体,以确定该插入物的存在和方向,并且使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)对阳性克隆进行DNA测序。将所得质粒命名为pAyGm7。
为了产生质粒pAyGm10,通过SOE PCR组合两个单独的PCR。首先,使用如下所示的正向和反向引物,从pJfyS157(图3)或pAyGm7对这些单独的片段进行扩增。
pJfyS157:
正向引物:
5’-CAGTTGGGTGCACGAGTGGGTTACATCGAACTGG-3’(SEQ ID NO:60)
反向引物:
5'-GAAAGAGAAGAGGCTGGCCATGGTGCGCAGTCCGCGGTTGACTATTG-3'(SEQ ID NO:61)
pAyGm7:
正向引物:
5’-CAATAGTCAACCGCGGACTGCGCACCATGGCCAGCCTCTTCTCTTTC-3’(SEQ ID NO:62)
反向补体引物:
5’-GCGTCAGGCTTTCGCCACGGAGC-3’(SEQ ID NO:63)
这些扩增反应由以下各项构成:10ng的对应的质粒模板、200μM dNTP、0.5μM引物、1XHF反应缓冲液、以及1单位的高保真DNA聚合酶,最终体积为50μl。两个PCR反应都在中孵育。pJfyS157的循环条件如下:1个循环,在98℃持续30秒;30个循环,每个循环在98℃持续10秒,70℃持续30秒,以及在72℃持续1分钟30秒;以及1个循环,在72℃持续10分钟。pAyGm7的循环条件如下:1个循环,在98℃持续30秒;30个循环,每个循环在98℃持续10秒,67℃持续30秒,以及在72℃持续1分钟;以及1个循环,在72℃持续10分钟。
通过1%琼脂糖电泳使用TAE缓冲液来分离这些PCR产物,其中将用于pAyGm10片段的1.6kb带和用于pJFYS157片段的2.8kb带从这些凝胶中切除并用凝胶提取试剂盒(实例1)进行提取。然后用分别具有SEQ ID NO:60和SEQ ID NO:63的正向和反向引物的SOE PCR一起剪切这两个片段。
该扩增反应由以下各项构成:125ng的pJFYS157片段和218ng的pAyGm7片段、200μMdNTP、0.5μM引物、1X反应缓冲液、以及1单位的高保真DNA聚合酶,最终体积为50μl。在中孵育该反应,程序为1个循环,在98℃下,持续30秒;30个循环,每个循环在98℃持续10秒,67℃持续30秒,以及72℃持续2分钟30秒;以及一个循环,在72℃下,持续10分钟。
然后将该PCR片段用Pac I和Xmn I进行消化,并经受PCR纯化试剂盒(凯杰有限公司(QIAGEN Inc.),美国加州瓦伦西亚(Valencia,CA,USA))。简言之,将5体积的试剂盒-供应的缓冲液PB1添加到该PCR反应中,并且随后通过传递至该柱并且在13,000rpm离心持续1分钟,将其添加到试剂盒-供应的旋转柱中。将该柱用750μl的试剂盒-供应的缓冲液PE洗涤并重复该离心。用25μl的试剂盒-供应的缓冲液EB洗脱DNA。使用T4DNA连接酶(罗氏,印第安纳波利斯,印第安纳州,美国),将4.4kb Pac I和Xmn I消化的PCR片段连接至Pac I和Xmn I消化的pJfyS157。该连接反应由以下各项构成:50ng的Pac I和Xmn I消化的pJfyS157、140ng的Pac I和Xmn I消化的4.4kb PCR片段、1X连接酶缓冲液(罗氏,印第安纳波利斯,印第安纳州,美国)、以及2单位的T4 DNA连接酶,最终体积为20μl。将该反应在室温下孵育10分钟,并且通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育20分钟,将5μl的该反应物转化入ONETOP10大肠杆菌化学感受态细胞中。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下并伴随200rpm混合,将该管孵育1小时,并且转移200μl至150mm2XYT+Amp板上,并在37℃下孵育过夜。将大肠杆菌转化体菌落接种到在14ml法尔肯圆底聚丙烯管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,并伴随200rpm搅拌。使用9600,将质粒DNA从得到的转化体中分离。用Hind III通过限制性酶切分析筛选这些得到的转化体,以确定该插入物的存在和方向,并且使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)对阳性克隆进行DNA测序。将所得质粒命名为pAyGm10(图4)。
实例5:天然里氏木霉cbh1的置换
将大约200μg的质粒pAyGm10(实例4)用Pme I消化。将消化反应物通过0.8%琼脂糖凝胶电泳使用TAE缓冲液来纯化,其中从该凝胶切出8.6kb DNA条带,并且使用提取试剂盒进行提取。将三体积的试剂盒供应的NT缓冲液添加至该凝胶切片上,并将该样品在50℃下加热10分钟。将该溶液转移到6个试剂盒-供应的离心式柱中。将这些柱在13,000rpm下离心持续1分钟并且用试剂盒-供应的洗涤缓冲液NT3进行洗涤并再离心。在65℃下,用70μl的试剂盒-供应的NE缓冲液/柱洗脱该DNA。组合6个经洗脱的DNA样品。用Pme I消化的pAyGm10DNA(选择如在实例1中描述的潮霉素抗性(hpt))对里氏木霉菌株KM1000-34(实例3)进行转化。获得五种转化体,并且挑取每一种并转移至PDA板并在30℃下孵育2-4天。采用使用植物直接PCR试剂盒的孢子PCR来鉴定转化体,这些转化体在里氏木霉cbh1基因座与pAyGm10Pme I片段整合。简言之,用无菌的1μl的接种环收集来自这些转化体的孢子,并转移到在0.2ml PCR带管中的15μl的试剂盒-供应的稀释缓冲液中,并在室温下孵育5分钟。将该孢子悬浮液短暂地在条-离心(strip-fuge)微型离心机(西格玛奥德里奇公司(Sigma-Aldrich),圣路易斯,密苏里州,美国)中离心,并将1μl的上清液用于该孢子PCR中。该20μl的孢子PCR反应物由以下各项构成:1X植物直接PCR缓冲液(包含dNTP和Mg)、10pmol的如下所示的基因特异性正向和反向引物、和0.4μl的II热启动DNA聚合酶。
筛选用于里氏木霉cbh1基因座的5’端的引物
正向引物(与cbh1基因座的5’侧翼具有同源性):
5’-GTAATTTGCCTGCTTGACCG-3’(SEQ ID NO:64)
反向引物(与SEQ ID NO:1的cbh1编码序列具有同源性):
5’-TGAAGATCTGGTAGGTTGTG-3’(SEQ ID NO:65)
筛选用于里氏木霉cbh1基因座的3’端的引物
正向引物(与hpt标记具有同源性):
5’-TCATTGACTGTCTGTCCTCT-3’(SEQ ID NO:66)
反向引物(与cbh1基因座的3’侧翼具有同源性):
5’-TACCATGACTGTCACGATAG-3’(SEQ ID NO:67)
中孵育该扩增反应,程序为1个循环,在98℃下,持续5秒;40个循环,每个循环在98℃持续5分钟,57℃持续5秒,以及72℃持续1分钟;以及一个循环,在72℃下,持续1分钟。
使用TAE缓冲液,将完成的一个或多个PCR反应经受1%琼脂糖凝胶电泳。具有该天然cbh1基因(该基因具有SEQ ID NO:1的cbh1编码序列)的正确置换的转化体产生具有5’端筛选引物的1.46kb片段和具有3’端筛选引物的1.64kb片段。
两个转化体产生正确的置换片段并被选择用于孢子分离和hpt/tk标记的环出。将来自6天龄的PDA板的孢子收集在5ml的0.01%20中,并用血细胞计数器来确定该孢子浓度。将孢子适当地稀释至103孢子/ml并将100个孢子涂布在PDA板上。将这些板在30℃下孵育2天。将来自每种转化体的九个菌落用无菌的10μl接种环挑取并转移到新的50mm PDA板上并且在30℃下孵育2天。如上所述地利用使用植物直接PCR试剂盒的孢子PCR来鉴定具有正确的基因置换的孢子分离株。
筛选用于里氏木霉cbh1基因座的5’端的引物
正向引物(与cbh1基因座的5’侧翼具有同源性):
5’-GTAATTTGCCTGCTTGACCG-3’(SEQ ID NO:68)
反向引物1(与SEQ ID NO:1的cbh1编码序列具有同源性):
5’-TGAAGATCTGGTAGGTTGTG-3’(SEQ ID NO:69)
反向引物2(与里氏木霉cbh1基因具有同源性):
5’-CGAGATGACGGCCAACTTCC-3’(SEQ ID NO:70)
筛选用于里氏木霉cbh1基因座的3’端的引物
正向引物1(与hpt标记具有同源性):
5’-TCATTGACTGTCTGTCCTCT-3’(SEQ ID NO:71)
正向引物2(与里氏木霉cbh1基因具有同源性):
5’-GGAAGTTGGCCGTCATCTCG-3’(SEQ ID NO:72)
反向引物(与里氏木霉cbh1基因座的3’侧翼具有同源性):
5’-TACCATGACTGTCACGATAG-3’(SEQ ID NO:73)
中孵育这些扩增反应,程序为1个循环,在98℃下,持续5分钟;40个循环,每个循环在98℃持续5秒,57℃持续5秒,以及72℃持续1分钟;以及一个循环,在72℃下,持续1分钟。
使用TAE缓冲液,将完成的一个或多个PCR反应经受0.8%琼脂糖凝胶电泳。具有该天然里氏木霉cbh1基因(该基因具有SEQ ID NO:1的cbh1编码序列)的正确置换的转化体产生具有5’端筛选引物的1.46kb片段。该天然的cbh1基因座产生具有5’端筛选引物的1.1kb片段。具有该天然里氏木霉cbh1基因(该基因具有SEQ ID NO:1的cbh1编码序列)的正确置换的转化体产生具有3’端筛选引物的1.64kb片段。该天然的cbh1基因座产生具有3’端筛选引物的3.0kb片段。
选择正确的孢子分离株并且使用5-氟脱氧尿苷(Fd U)反向选择环出该hpt/tk标记。将来自每个PDA板的小块菌丝体添加至补充有1μM FdU的50mm TrMM-G板的中部。将这些FdU板在30℃下孵育7天。将菌丝体块从每个板的生长区域的外边缘切除并转移至PDA板。将这些板在30℃下孵育2-4天。利用使用植物直接PCR试剂盒的孢子PCR来鉴定具有正确的hpt/tk标记环出的分离株。
筛选hpt/tk标记切除:
正向引物(与SEQ ID NO:1的cbh1编码序列具有同源性):
5’-TTCCCCAACCACGACCACCT-3’(SEQ ID NO:74)
反向引物(与里氏木霉cbh1的3’侧翼具有同源性):
5’-TACCATGACTGTCACGATAG-3’(SEQ ID NO:75)
筛选hpt标记:
正向引物(与hpt标记具有同源性):
5’-GGCATGACCTTTTGATGATCG-3’(SEQ ID NO:76)
反向引物(与里氏木霉cbh1的3’侧翼具有同源性):
5’-TACCATGACTGTCACGATAG-3’(SEQ ID NO:77)
中孵育这些扩增反应,程序为1个循环,在98℃下,持续5分钟;40个循环,每个循环在98℃持续5秒,57℃持续5秒,以及72℃持续1分钟;以及一个循环,在72℃下,持续1分钟。
使用TAE缓冲液,将完成的PCR反应经受0.8%琼脂糖凝胶电泳。使用hpt筛选引物,仍然含有hpt标记的分离株产生1.5kb片段。使用环出筛选引物,缺乏hpt和tk标记的分离株产生1.5kb片段。继续进行具有正确标记环出的分离株。
将来自6天龄的PDA板的孢子收集在5ml的0.01%20中,并用血细胞计数器来确定该孢子浓度。将孢子适当地稀释至103孢子/ml并将100个孢子涂布在PDA板上。将这些板在30℃下孵育2天。将来自每种转化体的八个菌落用无菌的10μl接种环挑取并转移到新的50mm PDA板上并且在30℃下孵育2天。利用使用植物直接PCR试剂盒(如上所述的方案)的孢子PCR来鉴定具有正确的基因置换和hpt/tk标记环出的最终的孢子分离株。用于hpt/tk标记环出的PCR引物和用于hpt标记的筛选描述如上。
制备最终的孢子分离株的基因组DNA(如在实例3中所述),并通过Southern印迹分析对其进行分析。对于Southern印迹分析,用20个单位的Bgl II和20个单位的Bam HI消化大约1μg的基因组DNA,并使用TAE缓冲液,将这些基因组DNA经受0.8%琼脂糖电泳。使用TURBOBLOTTERTM,将在该凝胶中的DNA脱嘌呤化、变性、进行中和、并且转移到超负荷尼龙膜上。使用UV STRATALINKERTM,将该DNA进行UV交联到该膜上,并且在42℃下在20ml DIG Easy Hyb中预杂交1小时。
使用PCR Dig探针合成试剂盒用以下所示的正向和反向引物生产杂交至cbh1基因的3’侧翼区域的探针。该PCR反应(50μl)由以下各项构成:1X Taq DNA聚合酶缓冲液(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国)、50pmol每种引物、0.5X PCR DIG探针合成混合物、0.5X dNTP储液(罗氏诊断,印第安纳波利斯,印第安纳州,美国)、100ng里氏木霉RutC30基因组DNA、以及2.5单位的Taq DNA多聚酶(纽英伦生物实验室(New EnglandBiolabs)伊普斯威奇,马萨诸塞州,美国)。在中孵育该扩增反应,程序为1个循环,在95℃下,持续2分钟;30个循环,每个循环在95℃持续30秒,60℃持续30秒,以及72℃持续40秒;以及一个循环,在72℃下,持续15分钟。
正向引物:
5’-AATGACCCATAGGGAGACAAACAGCATAAT-3’(SEQ ID NO:78)
反向引物:
5’-TGTTGGACGCAGGATTTTGGA-3’(SEQ ID NO:79)
通过1%琼脂糖凝胶电泳使用TAE缓冲液来纯化该0.56kb探针,其中将对应于该探针的带从该凝胶中切除并用凝胶提取试剂盒(实例1)进行提取。将该探头煮沸持续5分钟,并在冰上冷却持续2分钟,并然后添加至10ml的DIG Easy Hyb中以产生该杂交溶液。杂交在42℃下进行15-17小时。然后在室温下在2X SSC加0.1%SDS中在低严格条件下对该膜进行洗涤,接着在65℃下在0.5X SSC加0.1%SDS中进行两次高严格洗涤,每次15分钟。通过化学发光测定(罗氏诊断,印第安纳波利斯,印第安纳州,美国),根据该生产商的指示对探针-靶杂交体进行检测。Southern印迹分析鉴定包含该cbh1置换(2.5kb杂交片段)且并不包含该hpt/tk标记的最终孢子分离株。该天然里氏木霉cbh1基因座产生1.9kb杂交片段。选择一个孢子分离株作为该最终菌株并且命名为里氏木霉DLM-TlCBH-9。
实例6:在cbh1和cbh2置换的菌株里氏木霉DLM-TlCBH-9中的ku70基因的修复
在里氏木霉置换菌株DLM-TlCBH-9(实例5)中修复该天然里氏木霉ku70基因,以便促进在DNA的非同源末端连接中的菌株操作步骤,该步骤需要KU70蛋白质作用的功能。根据以上在实例1中描述的程序,用23x 2μg Pme I-线性化pTH239(WO 2013/028928)转化里氏木霉DLM-TlCBH-9。获得四十六种转化体并且将每一种分开地转移至PDA板并在30℃下孵育3天。
利用使用植物直接PCR试剂盒的孢子PCR来鉴定在ku70基因座处与pTH239修复盒整合的转化体。简言之,用无菌的1μl的接种环收集来自转化体的孢子,并转移到在0.2ml PCR带管中的20μl的试剂盒-供应的稀释缓冲液中,并在室温下孵育5分钟。将这些孢子悬浮液短暂地在条-离心(strip-fuge)微型离心机(西格玛奥德里奇公司(Sigma-Aldrich),圣路易斯,密苏里州,美国)中离心,并将1.5μl的每个上清液用于该孢子PCR中。该孢子PCR由以下各项构成:1X植物直接PCR缓冲液(包含dNTP和Mg)、1.25μM的如下列出的基因特异性正向和反向引物、和0.4μl的II热启动DNA聚合酶。
正向引物:
5’-CGCTGAAATGCGCCCGCCACCT-3’(SEQ ID NO:80)
反向引物:
5’-GGGCGGACAGACGGGGCAAA-3’(SEQ ID NO:81)
中孵育这些扩增反应,程序为1个循环,在98℃下,持续5分钟;40个循环,每个循环在98℃持续20秒,61℃持续20秒,以及72℃持续1分钟;以及一个循环,在72℃下,持续1分钟。
使用TAE缓冲液,将完成的多个PCR经受1%琼脂糖凝胶电泳,并且获得的46个转化体中的40个展示出1.4kb带,该带指示在ku70基因座处的pTH239的整合。使用5-氟脱氧尿苷(Fd U)反向选择,任意选择六个转化体以环出hpt/tk标记。将来自6天龄的板的孢子收集在10ml的0.01%20中,并用血细胞计数器来确定该孢子浓度。将孢子稀释至浓度为106孢子/ml,并将106、105、和104个孢子涂布在补充有1μM FdU的TrMM-G板上。用无菌的10μl接种环挑取菌落并转移到75mm PDA板上并且在30℃下孵育3天。
完成使用植物直接PCR试剂盒的孢子PCR来确定是否这些得到的孢子分离株正确地如上所述地用下列正向和反向引物切除这些标记。
正向引物:
5’-CGCTGAAATGCGCCCGCCACCT-3’(SEQ ID NO:82)
反向引物:
5’-CGTTCTCGCCGGCGTTTGCC-3’(SEQ ID NO:83)
多个PCR的组合物与那些上述的具有作为模板的FdU抗性孢子分离株的孢子溶液的组合物相同,并且循环参数如下:1个循环,在98℃持续5分钟;40个循环,每个在98℃持续20秒,61℃持续20秒,以及在72℃持续3分钟;以及1个循环,在72℃持续3分钟。
使用TAE缓冲液,将完成的PCR经受1%琼脂糖凝胶电泳,并且这些结果指示48个分离株中有25个正确地切除该盒。选择这些孢子分离株中的三个用于孢子纯化以确保同质性。对于每个孢子纯化,将1μl接种环与在PDA板上的分离株轻触,并转移至在15ml锥形底部管中的1ml的0.01%20。对每个管进行涡旋并将3μl等分试样转移至新的150mmPDA板并在30℃下孵育2天。用无菌的10μl接种环挑取菌落并转移到新PDA板上并且在30℃下孵育3天。重复孢子PCR以确保挑取的分离株包含修复的ku70基因座并且具有同质性。通过Southern印迹分析,对一种随机选择的分离株,命名为JfyS99-19B4,进行分析,以验证孢子PCR的结果,这些结果表明菌株对于该缺失都是纯合的并且正确地切除了标记,然后将Southern印迹分析用在所得到的孢子子代上。如以上在实例1中描述地生产基因组DNA,并用Nco I消化2μg。将DNA经受1%琼脂糖凝胶电泳并如在实例1中所述地将其转移至膜。使用以下区域特异性的正向和反向引物生产杂交至ku70基因的3’侧翼的探针。
正向引物:
5’-CAGAGAAAGGTAGCTGGAGAGC-3’(SEQ ID NO:84)
反向引物:
5’-GTCCATTTCGATTCCGCATAG-3’(SEQ ID NO:85)
使用上述探针用于杂交以及如在实例1中所述的随后的探针-DNA杂交体检测。Southern印迹分析的结果证实了以上孢子PCR的结果,这表明这些菌株正确地切除了这些标记,并且该ku70基因序列不再被破坏。这些菌株中的一种,命名为里氏木霉JfyS99-19B4,被任意地选择用于在此描述的纤维素酶的不同的可能的组合的表达。
实例7:AA9(GH61A)多肽表达载体pQM35的构建
在氏木霉cbh2启动子和终止子的控制下,构建质粒pQM35以包含AA9(GH61A)多肽表达盒。用以下所示的基因特异性正向和反向引物(1205256和1205257),将AA9多肽编码序列(SEQ ID NO:7[DNA序列]和SEQ ID NO:8[氨基酸序列])从质粒pDM286(WO 2013/028912)进行扩增。用以下所示的基因特异性正向和反向引物(1205258和1205259),将里氏木霉cbh2终止子从里氏木霉RutC30基因组DNA进行扩增。
1205256(InF-PeGH61-F):
ATCACCCTCTGTGTATTGCACCATGCTGTCTTCGACGACTCGC(SEQ ID NO:86)
1205257(InF-PeGH61-R):
GCCCGGTCACGAAAGCCTTATCGACTTCTTCTAGAACGTCGGC(SEQ ID NO:87)
1205258(InF-TrCbh2Term-F):
GCCGACGTTCTAGAAGAAGTCGATAAGGCTTTCGTGACCGGGC(SEQ ID NO:88)
1205259(InF-TrCBh2Term-R):
CAGGTGTCAGTCACCTCTAGTTAATTAACTCGGAGTTGTTATACGCTACTCG(SEQ ID NO:89)
该扩增反应由以下各项构成:100ng的模板、1μl的10mM dNTP、50pmol的每种正向和反向引物、1XGC缓冲液(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国)、以及1单位的高保真热启动DNA多聚酶,最终体积为50μl。将该扩增反应在 中孵育,其被编程为:1个循环,在98℃持续2分钟;35个循环,每个循环在98℃持续15秒,60℃持续30秒,和72℃持续1分钟;和1个循环,在72℃持续10分钟。通过0.7%琼脂糖凝胶电泳使用TAE缓冲液来分离这些PCR产物,其中将1kb AA9多肽基因片段和353bp里氏木霉cbh2终止子片段从该凝胶中切除并用凝胶和PCR净化试剂盒进行提取。简言之,将2体积的缓冲液NT1添加至该凝胶切片并在50℃下溶解10分钟,之后,将整个溶液转移到试剂盒-供应的离心式柱中。将该柱在13,000rpm下离心持续1分钟,并且用洗涤缓冲液NT3洗涤并再次离心。将DNA用20μl的试剂盒-供应的洗脱缓冲液进行洗脱并且在13,000rpm下离心持续1分钟。
使用引物1205256和1205259,将经纯化的AA9多肽编码序列和里氏木霉cbh2终止子组合在SOE PCR中。该SOE PCR由以下各项构成:10ng的887bp经纯化的扩增至pDM286的AA9多肽基因片段、10ng的353bp经纯化的里氏木霉cbh2终止子片段、1μl的10mM dNTP、1XPHUSIONTM HF缓冲液、以及1单位的PHUSIONTM高保真热启动DNA多聚酶,最终体积为45μl。在中孵育该扩增反应,程序为1个循环,在98℃下,持续2分钟;以及5个循环,每个循环在98℃持续15秒,60℃持续30秒,以及72℃持续1分钟30秒。将总体积为5μl的包含1X PHUSIONTM H缓冲液和50pmol的每种正向和反向引物的混合物添加至该SOE PCR,并继续35个循环,每个循环在98℃持续15秒,60℃持续30秒,并且72℃持续1分钟和30秒;以及1各循环,在72℃持续10分钟。用凝胶和PCR净化试剂盒对SOE PCR产物进行纯化。
使用IN-FUSIONTM HD克隆试剂盒(科隆达公司,帕洛阿尔托,加州,美国(Clontech,Palo Alto,CA,USA)),将经纯化的SOE PCR产物插入Pac I和Nco I消化的pAG121(实例10)。该反应物(10μl)由以下各项构成:1X IN-FUSIONTMHD酶混合物、用Nco I和Pac I消化的150ng的pAG121、以及57ng的经纯化的SOE PCR产物。将该反应在50℃下孵育15分钟。然后通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育5分钟,将2.5μl的该克隆反应物转化入ONETOP10感受态细胞中。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm混合,将该管孵育1小时,并将250μl转移至150mm 2XYT+Amp板上并在37℃孵育过夜。使用迷你质粒试剂盒(Plasmid MiniKit),将质粒DNA与得到的转化体相分离。包含如下插入的质粒被命名为pQM35(图5),该插入通过DNA测序使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)确认无PCR错误。
实例8:质粒pSMai139的构建
为了构建pSMai139,用如下所示引物,从作为模板的pMJ05(US2004/0248258)对特异腐质霉内切葡聚糖酶V全长编码区域进行PCR扩增。这些下划线部分是通过Car-F2正义引物引入的Sph I位点和Hind III位点。该粗体部分是通过Car-R2反义引物引入的Eco RI位点。
Car-F2正义引物:
5’-TATAAGCTTAAGCATGCGTTCCTCCCCCCTC-3’(SEQ ID NO:90)
Car-R2反义引物:
5’-CTGCAACAGGCACTGATGGTACCAG-3’(SEQ ID NO:91)
该扩增反应(50μl)由以下各项构成:1X ThermoPol反应缓冲液(纽英伦生物技术有限公司(New England Biolabs,Inc.),美国麻萨诸塞州伊普斯威奇(Ipswich,MA,USA))、0.3mM dNTP、10ng的pMJ05DNA、0.3μM Car-F2正义引物、0.3μM Car-R2反义引物、以及2.5单位的DNA多聚酶(纽英伦生物技术有限公司(New England Biolabs,Inc.),美国麻萨诸塞州伊普斯威奇(Ipswich,MA,USA))。在 5333epgradient S中孵育该反应,程序为30个循环,每个循环在94℃下,持续30秒,55℃持续30秒,以及72℃持续60秒(最终延伸15分钟)。将反应产物通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将900bp的产物带从该凝胶切离,并且使用凝胶提取试剂盒(实例1)进行纯化。然后用Eco RI和Hind III消化该900bp PCR片段,并经受PCR纯化试剂盒(实例4)。将质粒pMJ05用Eco RI和Hind III消化,并使用TAE缓冲液通过0.7%琼脂糖凝胶电泳分离,从凝胶切离,并使用凝胶提取试剂盒进行提取。
使用T4DNA连接酶(罗氏,印第安纳波利斯,印第安纳州,美国),将经900bp Eco RI和Hind III消化的PCR片段连接至经Eco RI和Hind III消化的pMJ05。该连接反应由以下各项构成:50ng的经Eco RI和Hind III消化的pMJ05、33ng的经Eco RI和Hind III消化的0.9kb PCR片段、1X连接酶缓冲液(罗氏,印第安纳波利斯,印第安纳州,美国)、以及2单位的T4DNA连接酶,最终体积为20μl。将该反应在15℃下孵育17小时,并且通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育5分钟,将2μl的该反应物转化入ONETOP10感受态细胞中。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm混合,将该管孵育1小时,并将250μl转移至150mm 2XYT+Amp板上并在37℃孵育过夜。用Sph I和Bam HI通过限制性酶切分析筛选这些得到的转化体,以确定该插入物的存在和方向,并且使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)对阳性克隆进行测序。将包含无PCR错误的特异腐质霉内切葡聚糖酶V编码区域的克隆命名为pSMai139(图6)。
实例9:质粒pSMai143的构建
使用如下所示的引物994148和994149,通过从里氏木霉RutC30基因组DNA扩增620bp的里氏木霉纤维二糖水解酶Cel6A启动子来构建质粒pSMai143。该下划线部分是通过引物994148引入的Sal I位点。该粗体部分是通过引物994149引入的“CAT”序列。
引物994148:
5’-ACGCGTCGACGAATTCTAGGCTAGGTATGCGAGGCA-3’(SEQ ID NO:92)
引物994149:
5’-GGTGCAATACACAGAGGGTG-3’(SEQ ID NO:93)
该扩增反应(50μl)由以下构成:1X ThermoPol反应缓冲液、0.3mM dNTP、100ng的里氏木霉RutC30基因组DNA、0.3μM 994148正义引物、0.3μM 994149反义引物、以及2.5单位的Vent DNA多聚酶。在5333epgradient S中孵育这些反应,程序为30个循环,每个循环在94℃下,持续60秒,55℃持续60秒,以及72℃持续60秒(最终延伸15分钟)。将这些反应产物通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将620bp的产物带从该凝胶切离,并且使用凝胶提取试剂盒(实例1)进行纯化。
用Sph I消化质粒pSMai139并用T4DNA多聚酶使3’-突出端平滑化,接着用Sal I进行消化。使用TAE缓冲液通过0.7%琼脂糖凝胶电泳分离该经消化的DNA,从凝胶切离,并使用凝胶提取试剂盒(实例1)进行提取。
使用T4DNA连接酶,将620bp Sal I消化的PCR片段连接至经Sph I和Sal I消化的pSMai139。该连接反应由以下各项构成:50ng的经Sph I和Sal I消化的pSMai139、22ng的经Sal I消化的0.62kb PCR片段、1X连接酶缓冲液、以及2单位的T4DNA连接酶,最终体积为20μl。将该反应在15℃下孵育17小时,并且通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育5分钟,将2μl的该反应物转化入ONETOP10感受态细胞中。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm混合,将该管孵育1小时,并将250μl转移至150mm 2XYT+Amp板上并在37℃孵育过夜。用Eco RI通过限制性酶切分析筛选这些得到的转化体,以确定该插入物的存在和方向,并对阳性克隆进行测序。一个不含PCR错误并且含有该里氏木霉cbh2启动子的克隆被命名为pSMai143(图7)。
实例10:质粒pAG121的构建
使用如下所示的引物,使用定点诱变试剂盒(Stratagenee公司,拉荷亚,加州,美国),通过在pSMai143(实例9)上进行定点诱变来构建具有Nco I限制性位点的表达载体pAG121。根据制造商的推荐,使用最终体积为50μl的20ng的质粒pAG121和如下所示的12.5μM的引物进行诱变。
Smai143SDM Fwd:
gtgtattgcaccatggcgttcctcccccctcc(SEQ ID NO:94)
Smai143SDM Rev:
ggaggggggaggaacgccatggtgcaataca(SEQ ID NO:95)
使用9600制备所得变体质粒pAG121。使用应用生物系统公司3130xl遗传分析仪对变体质粒构建体进行测序来证实改变。
在里氏木霉cbh2基因启动子和里氏木霉cbh1基因终止子的控制下,构建质粒pAG122以包含β-木糖苷酶编码序列(SEQ ID NO:13[DNA序列]和SEQ ID NO:14[氨基酸序列])。
设计了如下所示的两个合成的寡核苷酸引物以PCR扩增包含在质粒pENI191中的β-木糖苷酶编码序列(SEQ ID NO:13)。使用IN-FUSIONTM优越PCR克隆试剂盒(IN-FUSIONTMAdvantage PCR Cloning Kit)(美国加利福尼亚州山景城的克罗泰克实验有限公司(Clontech Laboratories,Inc.,Mountain View,CA,USA))将该片段直接地克隆到该表达载体pAG121中。粗体字母代表编码序列。其余序列与pAG121的插入位点同源。
正向引物:
5’-CCCTCTGTGTATTGCACC-3’(SEQ ID NO:96)
反向引物:
5’-GATCTGCGGCCGCGAATT-3’(SEQ ID NO:97)
将五十皮摩尔的各以上引物用于如下PCR中,该PCR由以下构成:10ng的pENI191,具有MgCl2的1X高保真PCR缓冲液(罗氏应用科学公司(Roche AppliedScience),潘茨堡,德国),dATP、dTTP、dGTP、和dCTP中的每种各0.25mM,以及2.6单位的高保真酶混合(罗氏应用科学公司(Roche Applied Science),潘茨堡,德国),最终体积为50μl。使用5333epgradient S执行扩增,其被编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续15秒、60.5℃下持续30秒、以及72℃下持续2分钟;以及最终延长,在72℃下持续15分钟。加热块然后进入4℃浸泡循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳对反应产物进行分离,其中在凝胶上观察到约2.4kb产物条带。使用凝胶提取试剂盒对PCR产物进行纯化。简言之,将3体积的试剂盒-供应的缓冲液QG添加至凝胶切片并溶解在50℃下持续大约10分钟。将溶解的凝胶切片施用于试剂盒-供应的旋转柱,并且在13,000rpm下离心持续1分钟。将该柱用750μl的试剂盒-供应的缓冲液PE洗涤并再次离心。用10μl的试剂盒-供应的缓冲液EB洗脱DNA。将质粒pAG121用Nco I和Kpn I消化,并使用TAE缓冲液通过1.0%琼脂糖凝胶电泳分离,其中将6.6kb带从该凝胶切离,并使用凝胶提取试剂盒进行提取。
使用产生pAG122的IN-FUSIONTM优越PCR克隆试剂盒将2.4kb基因片段和6.6kb经消化的载体连接在一起。该反应(20μl)由以下构成:1X IN-FUSIONTM缓冲液(美国加利福尼亚州山景城的克罗泰克实验有限公司(Clontech Laboratories,Inc.,Mountain View,CA,USA))、1X BSA、1μl的IN-FUSIONTM酶(美国加利福尼亚州山景城的克罗泰克实验有限公司(Clontech Laboratories,Inc.,Mountain View,CA,USA))(稀释为1:10)、100ng凝胶纯化的Nco I/Pac I消化的pMJ09、以及42ng经纯化的1.05kb PCR产物。将反应在37℃下孵育15分钟,并且然后在50℃下孵育15分钟。稀释之后,将该反应与50μl的TE缓冲液混合,将2.5μl的反应转化到大肠杆菌XL10Gold超感受态细胞(Stratagenee公司,拉荷亚,加州,美国)中。将大肠杆菌转化反应物涂布在2XYT加氨苄青霉素板上。使用9600制备质粒DNA。使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文),通过在一个质粒中进行DNA测序来确认该β-木糖苷酶编码序列插入。将该质粒命名为pAG122(图8)。
实例11:木聚糖酶表达载体pAgJg131的构建
构建质粒pAgJg131以包含里氏木霉纤维二糖水解酶1基因启动子和终止子以及木聚糖酶编码序列(SEQ ID NO:9[DNA序列]和SEQ ID NO:10[氨基酸序列])。设计如下所示的两个合成寡核苷酸引物以从质粒P24F62(WO 2013/019827)PCR扩增该木聚糖酶基因并引入侧翼区域用于插入到表达载体pMJ09(WO 05/056772)中。粗体字母代表编码序列,并且剩余序列与质粒pMJ09的插入位点同源。
正向引物:
5’-CCGCGGACTGCGCACC-3’(SEQ ID NO:98)
反向引物:
5’-TTCGCCACGGAGCTTA-3’(SEQ ID NO:99)
该扩增反应由以下各项构成:64.2ng的质粒P24F62、10μl的10mM dNTP、50pmol的每种正向和反向引物、1XGC缓冲液、以及2单位的高保真热启动DNA多聚酶,最终体积为50μl。将该扩增反应在中孵育,其被编程为:1个循环,在98℃持续30秒;30个循环,每个循环在98℃持续10秒,61℃持续10秒,和72℃持续45秒;和1个循环,在72℃持续10分钟。使用TAE缓冲液,通过1%琼脂糖凝胶电泳,将PCR产物进行分离,其中将1.5kb片段从该凝胶切离,并且使用凝胶提取试剂盒(实例1)进行提取。
然后用HD克隆试剂盒将片段克隆到pMJ09中。将质粒pMJ09用Nco I和Pac I消化。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离该载体,其中将7.2kb片段从该凝胶切离,并使用凝胶提取试剂盒(实例1)进行提取。将1.5kb基因片段和经消化的载体在产生该表达质粒pAgJg131的反应中连接在一起,在该反应中该木聚糖酶基因的转录在该里氏木霉cbh1启动子的控制下。该连接反应(10μl)由以下各项构成:1X IN-FUSIONTM HD酶混合物(科隆达公司,帕洛阿尔托,加州,美国(Clontech,Palo Alto,CA,USA))、用Nco I和Pac I消化的213ng的pMJ09、以及106ng的该木聚糖酶纯化的PCR产物。将该反应在50℃下孵育15分钟。通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育5分钟,将2.5μl体积的该克隆反应物用来转化ONETOP10感受态细胞。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm混合,将该管孵育1小时,并将250μl转移至150mm2XYT+Amp板上并在37℃孵育过夜。用凯杰(QIAprep)迷你制备型(Miniprep)试剂盒(凯杰公司,巴伦西亚,加利福尼亚州,美国),将质粒DNA与得到的转化体相分离。使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)通过DNA测序确认该插入。将所得质粒命名为pAgJg131(图9)。
实例12:过氧化氢酶表达载体pLAQ564的构建
指定了DNA序列来编码过氧化氢酶(SEQ ID NO:33[DNA序列]和SEQ ID NO:34[氨基酸序列])的氨基酸序列。特别地指定该基因用于在米曲霉中的表达并在任一端添加限制性位点以便于克隆。随后通过商业提供者合成该DNA。
使用T4DNA连接酶,将编码该过氧化氢酶的合成基因(SEQ ID NO:100)连接到作为Not I-Xho I片段的质粒pENI2516(美国专利号7,871,800)的多克隆位点,以产生构建体pLAQ564。将所构建的质粒转化到ONETOP10感受态细胞中。用凯杰(QIAprep)迷你制备型(Miniprep)试剂盒分离该质粒DNA。使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)通过DNA测序确认该插入。将所得质粒命名为pLAQ564(图10)。
实例13:过氧化氢酶表达载体pSaMe-TaCat的构建
构建质粒pSaMe-TaCat以包含可操作地连接至里氏木霉纤维二糖水解酶I基因启动子和终止子的SEQ ID NO:33的过氧化氢编码序列。设计如下所示的两个合成寡核苷酸引物以从质粒pLAQ564PCR扩增该过氧化氢酶基因并引入侧翼区域用于插入到表达载体pMJ09(WO 05/056772)中。粗体字母代表编码序列,并且剩余序列与pMJ09的插入位点同源。
正向引物:
5’-CGGACTGCGCACCATGCGAGCAATCGGCTTGTT-3’(SEQ ID NO:101)
反向引物:
5’-TCGCCACGGAGCTTATCACTCGGCGTCTTCGTCGA-3’(SEQ ID NO:102)
该扩增反应由以下各项构成:50ng的质粒pLAQ564、200μm dNTP、0.4μM引物、1XGC缓冲液、以及2单位的DNA多聚酶,最终体积为50μl。将该反应在中孵育,其被编程为:1个循环,在98℃持续30秒;30个循环,每个循环在98℃持续15秒,60℃持续15秒,和72℃持续45秒;和1个循环,在72℃持续7分钟。使用TAE缓冲液,通过1%琼脂糖凝胶电泳,将PCR产物进行分离,其中将2.2kb片段从该凝胶切离,并且使用提取II试剂盒(实例2)进行提取。
然后用HD克隆试剂盒将片段克隆到pMJ09中。将该载体用Nco I和Pac I来消化并且如上所述通过琼脂糖凝胶电泳来纯化。将2.2kb基因片段和经消化的载体在产生该表达质粒pSaMe-TaCat的反应中连接在一起,在该反应中该过氧化氢酶基因的转录在该里氏木霉cbh1启动子的控制下。该连接反应(10μl)由以下各项构成:1X IN-FUSIONTMHD酶混合、用Nco I和Pac I消化的200ng的pMJ09、以及122ng的该过氧化氢酶纯化的PCR产物。将该反应在37℃下孵育15分钟并在50℃下孵育15分钟。向该反应中添加40μl的TE。通过添加至包含这些感受态细胞的单次使用管中并将这些细胞在冰上孵育5分钟,使用2μl来转化ONETOP10感受态细胞。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm混合,将该管孵育1小时,并250μl转移至150mm2XYT+Amp板上并在37℃孵育过夜。使用9600,将质粒DNA与得到的转化体相分离。使用应用生物系统(Applied Biosystems)377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)通过DNA测序确认该插入。将所得质粒命名为pSaMe-TaCat(图11)。
实例14:β-葡糖苷酶表达载体的构建
质粒pEJG107描述于WO 05/047499中并包含可操作地连接至里氏木霉cbh1基因启动子和终止子的β-葡糖苷酶编码序列(SEQ ID NO:5[DNA序列]和SEQ ID NO:6[氨基酸序列])。质粒pDFng133-3描述于WO 2013028912中并包含可操作地连接至里氏木霉cbh1基因启动子和终止子的β-葡糖苷酶变体编码序列(SEQ ID NO:35[DNA序列]和SEQ ID NO:36[氨基酸序列])。
实例15:质粒pSaMe-TsGH10的构建
在里氏木霉纤维二糖水解酶I基因启动子和终止子的控制下,构建质粒pSaMe-TsGH10以包含GH10木糖苷酶编码序列(SEQ ID NO:11[DNA序列]和SEQ ID NO:12[氨基酸序列])。设计如下所示的两个合成的寡核苷酸引物以从质粒pDAU81#5(WO 2011/057083)PCR扩增该GH10编码序列并引入侧翼区域用于插入到表达载体pMJ09(WO 2005/056772)中。粗体字母代表编码序列,并且剩余序列与pMJ09的插入位点同源。
正向引物:
5’-CGGACTGCGCACC3’(SEQ ID NO:103)
反向引物:
5’-TCGCCACGGAGCTTA3’(SEQ ID NO:104)
按照下述的总体表达克隆方案,木聚糖酶的克隆:
将五十皮摩尔的各以上引物用于如下PCR中,该PCR由以下构成:来自pDAU81#5的50ng的质粒DNA,1μl的10mM的dATP、dTTP、dGTP、和dCTP的共混,5μl的10XPfxDNA多聚酶缓冲液(英杰公司,卡尔斯巴德,加利福尼亚州,美国),以及1单位的Pfx DNA多聚酶(英杰公司,卡尔斯巴德,加利福尼亚州,美国),最终体积为50μl。使用5333(艾本德科技公司(EppendorfScientific,Inc.),美国纽约州韦斯特伯里(Westbury,NY,USA))扩增该DNA片段,编程为一个循环,在94℃持续2分钟;以及30个循环,每个循环在94℃持续15秒,在55℃持续30秒钟,以及在68℃持续1分钟。在30个循环以后,将该反应在72℃下孵育10分钟并且然后冷却至4℃直到进一步处理。
将这些反应产物通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将1.2kb的产物带从该凝胶切离,并且使用凝胶提取试剂盒进行纯化。
然后用IN-FUSIONTM优越PCR克隆试剂盒将1.2kb片段克隆到pMJ09中。将该载体用Nco I和Pac I来消化并且如上所述通过琼脂糖凝胶电泳来纯化。将该基因片段和经消化的载体在产生该表达质粒pSaMe-TsGH10的反应中连接在一起,在该反应中SEQ ID NO:11的木聚糖酶编码序列的转录在该里氏木霉cbh1基因启动子和终止子的控制下。该连接反应物(50μl)由以下各项构成:1X IN-FUSIONTM反应缓冲液、1X BSA、1μl的IN-FUSIONTM酶(稀释1:10)、100ng的用Nco I和Pac I消化的pMJ09、以及100ng的木聚糖酶纯化的PCR产物。将反应物于室温保温30分钟。使用1μl的该反应物来转化大肠杆菌XL 10Gold细胞。在LB+Amp板上选择转化体。通过用Nco I和Kpn I的限制酶切消化检测包含pSaMe-TsGH10的大肠杆菌转化体并且使用9600制备质粒DNA。使用应用生物系统(AppliedBiosystems)3130xl遗传分析仪和染料终止子化学(吉塞克等人,1992,见上文)对来自pSaMe-TsGH10的木聚糖酶编码序列进行DNA测序,以确认正确的序列和构建体pSaMe-TsGH10的完成。
实例16:用于生产酶组合物的重组丝状真菌菌株的构建
用一种或多种在此描述的核酸构建体和/或表达载体,通过转化一种或多种丝状真菌宿主细胞(例如,里氏木霉JfyS99-19B4(实例6)),构建用于本发明的酶组合物的生产菌株。通过本领域已知的任一种方法进行原生质制备和转化,例如在此描述的方法之一涉及原生质形成、这些原生质的转化、和该细胞壁的再生。使用合适的选择性介质(例如用于amdS选择的COVE板)选择转化体。然后将这些转化体在合适的酶生产介质中生长,例如CIM,并且测定该培养液的上清液的酶活性并用在此描述的方法通过SDS-PAGE进行分析。然后将这些菌株在合适的酶生产介质中发酵以产生这些酶组合物。
实例17:通过BCA测定和无染色凝胶定量,实现单组分、培养液和培养液混合物的BCA-当量蛋白组合物的确定
通过BCA蛋白质测定和通过凝胶电泳,对蛋白质培养液样品、蛋白培养液混合物、和单组分蛋白进行定量。首先,将所有样品脱盐以去除干扰性盐和缓冲液。通过平衡具有作为柱缓冲液的50mM乙酸钠(pH 5)的10DG重力流脱盐柱(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国),接着施用3ml的包含感兴趣的蛋白的溶液,接着通过用4ml的柱缓冲液洗脱来捕获该脱盐样品,来实现这一点。使用BCATM蛋白质测定试剂盒(赛默飞世尔科技公司(Thermo Fisher Scientific,),沃尔瑟姆,马萨诸塞州,美国(Waltham,MA,USA))测量稀释的样品,其中该试剂盒通过2.0mg/mL BSA(赛默飞世尔科技公司(ThermoFisher Scientific,),沃尔瑟姆,马萨诸塞州,美国(Waltham,MA,USA))的蛋白标准稀释液进行校准。脱盐和BCA测定的组合的方法被称为“脱盐BCA”。
以例如来自发酵培养液的10μg脱盐蛋白加载TGX无染色TM无染色8%-16%凝胶(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)。此外,将分子的重量标准(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国;未染色的)和通过脱盐BCA测量的经纯化的单组分标准蛋白的稀释系列加载于5至0.3125μg/泳道之间。为了改进凝胶显带分辨率,通过添加0.2μl的Endo Hf(纽英伦生物技术有限公司,伊普斯威奇,马萨诸塞州,美国)并且在37℃下孵育过夜,首先将一些样品去糖基化。对于这些样品,将6.7至10μg的培养液蛋白质加载到凝胶上。根据制造商的推荐,将这些凝胶在200V进行电泳直到溴苯酚蓝色染料前部达到该凝胶的底部。在活化(5分钟)和在图像LabTM(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)扫描之前,用密理博水(密理博(Millipore),比勒利卡(Billerica)马萨诸塞州,美国),对凝胶进行漂洗5分钟。使用图像LabTM3.0软件(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)对图像实验室的蛋白条带密度进行定量,产生每个识别的蛋白质的“带体积”,其表示该带的总的整合的无染色染色密度,和“泳道体积”,其表示该泳道的总的整合的无染色的泳道凝胶染色密度。如果使用的话,任一单一蛋白带的无染色组成量表示为该带除以泳道中总染色的分数百分比(%无染色=“带体积”/“泳道体积”)。对于添加了Endo Hf酶的样品,从该泳道体积中减去用于Endo Hf量的带体积来产生调整的泳道体积,该体积代表没有Endo Hf的组合物。
使用纯化的单组分蛋白来产生带体积对比BCA蛋白加载反应曲线,其中将这些蛋白如通过脱盐BCA测定测量的按μg添加并如通过无染色定量的带体积进行检测。对于大多数蛋白,每μg蛋白的带体积的比率是大约500,000。由于它们有着相等的每μg蛋白的带体积比率,大多数蛋白的反应不需要调整,在这些测定的错误范围内(约5%)。如果蛋白显示出显著偏离该比值,如通过BCA测量那样在该蛋白质的带体积和该负载的μg蛋白之间建立校准曲线。这允许相对于该泳道体积调节带体积。
例如,如果带体积为320,000、泳道体积为2,000,000的酶Q显示带体积/μg BCA加载的蛋白Q的比率为400,000(预期值500,000(参见用于典型蛋白的无染色)的4/5),在该定量中的酶Q的带体积应该乘以5/4以预测正确的BCA-当量(至经调整的带体积400,000),并且对于酶Q,该泳道体积应该增加1/4(2,000,000+1/4*320,000=2,080,000,经调整的泳道体积)带体积。这导致了经调节的BCA-当量的蛋白Q的组成含量为400,000/2,080,000=19.2%。
类似地,如果酶Z显示出带体积/μg BCA蛋白质的比率为600,000(预期值的6/5),酶Z的带体积应该乘以5/6以预测正确的BCA-当量,并且对于酶Z,该泳道体积应该增加1/6带体积。
当针对全部蛋白(对于其存在经纯化的单组分)调节BCA-当量带体积及泳道体积时,,对于所有的培养液可以计算BCA-等效组合物经校正后的估计值。
实例18:预处理的玉米秸杆水解测定
在美国能源部国家可再生能源实验室(NREL)使用4%硫酸(基于生物质)在190℃下对玉米秸秆预处理6分钟。预处理的玉米秸秆(PCS)中的不溶于水的固体构成60.9%的固体,并且含有59.4%纤维素,5.3%半纤维素和27.0%木质素。通过两阶段硫酸水解,接着通过使用NREL标准分析程序#002的高效液相色谱分析糖来测定纤维素和半纤维素。木质素在用硫酸水解纤维素和半纤维素级分之后使用NREL标准分析程序#003以重量分析法测定。
使用50ml圆底离心管(耐洁公司(Nalgene),罗契斯特,纽约,美国)在19g的总反应质中对PCS进行水解。用氢氧化钠将未洗涤的PCS浆料的pH调节至4.75或5.0,并将15.5g浆液置于离心管中。制备酶组合物并且伴随水和缓冲液添加至在管中的PCS浆料中,以给出如下水解反应条件:20%总固体、50mM柠檬酸钠、和各种蛋白加载量(表示为mg蛋白质/克纤维素)。对所有酶加载量一式两份进行评估。在特定的温度下,将这些管加盖并且放在旋转培养箱中持续5天(120小时)。
水解后,使用0.22μm96孔过滤板(96-wellfilter plate)(密理博公司(Millipore),贝德福德,马萨诸塞州,美国)过滤样品并且如果不立即进行分析,将滤液在-20℃下冻结。在5mM H2SO4中,将滤液的体积稀释10倍,并使用HPLC系统(1100系列LC系统,安捷伦科技公司(Agilent Technologies Inc.),帕洛阿尔托,加州)测量经稀释的滤液中糖的浓度,该系统配备有如下各项:HyperREZTM XP;碳水化合物H+;粒度8μm,具有8%交联(7.7x 300mm)(赛墨科技公司,沃尔瑟姆,马萨诸塞州,美国)、0.2mm线内过滤器、自动孔-板取样器、梯度泵以及屈光指数检测器。使用的流动相是处于1.4ml/min的流速的5mM硫酸。在不同浓度下,相对于校准标准,将对应于纤维二糖、葡萄糖、木糖、阿拉伯糖、木糖醇、丙三醇、以及乙酸盐的屈光指数峰进行整合和定量。
使用MICROSOFT EXCELTM软件(微软,里奇兰,华盛顿,美国)来进行所有HPLC数据处理。对于每个水解样品,调整经测量的葡萄糖浓度用于适当的稀释因子,并且在水解之后通过从样品中的该葡萄糖浓度中减去在零时间点在未洗涤的PCS反应中的该背景葡萄糖浓度来确定酶促产生的葡萄糖的净浓度。使用由朱(Zhu)等人(生物资源技术(BioresourTechnol)102(3):2897-2903)发表的方法,基于释放自酶水解和该预处理原料的生物质组合物的糖,计算总体葡聚糖的转化。将二份数据点取平均值并且计算标准差。
实例19:在预处理的玉米秸秆的水解中的酶混合物1与CTec2的比较
将如下酶组合物与商业化酶CTec2(诺维信公司,巴格斯瓦德丹麦)相比较,该酶组合物包含以下各项:SEQ ID NO:2的纤维二糖水解酶I、SEQ ID NO:4的纤维二糖水解酶II、SEQ ID NO:16的内切葡聚糖酶I、SEQ ID NO:18的内切葡聚糖酶II、SEQ ID NO:36的β-葡糖苷酶变体、SEQ ID NO:8的具有纤维素水解增强活性的AA9(GH61)多肽、SEQ ID NO:34的过氧化氢酶、SEQ ID NO:10的GH10木聚糖酶、以及SEQ IDNO:14的β-木糖苷酶(命名为“酶混合物1”)。根据具有用于每种共混物的最佳条件的实例18,将这些酶组合物在20%TS下在未洗涤的PCS上进行比较。在pH 4.75下,将酶混合物1在55℃下水解,其中CTec2在50℃下并且在pH 5.0下水解持续5天。将所有组合物用于3、6、10和20mg蛋白质/g纤维素。使用微板BCATM蛋白测定试剂盒(赛默飞世尔科技,沃尔瑟姆,马萨诸塞州,美国)确定这些酶组合物的蛋白浓度,在该试剂盒中将牛血清白蛋白用作蛋白标准。
在图12中所示的这些结果表明,在所有的酶加载量上,“酶混合物1”比商业化酶CTec2具有显著地更高的水解。
实例20:在预处理的玉米秸秆的水解中的酶混合物2与CTec2的比较
将如下酶组合物与商业化酶CTec2相比较,该酶组合物包含以下各项:SEQID NO:2的纤维二糖水解酶I、SEQ ID NO:4的纤维二糖水解酶II、SEQ ID NO:16的内切葡聚糖酶I、SEQ ID NO:18的内切葡聚糖酶II、SEQ ID NO:36的β-葡糖苷酶变体、SEQ ID NO:8的具有纤维素水解增强活性的AA9(GH61)多肽、SEQ ID NO:10的GH10木聚糖酶、以及SEQ IDNO:14的β-木糖苷酶(命名为“酶混合物2”)。根据具有用于每种共混物的最佳条件的实例18,将这些酶组合物在20%TS下在未洗涤的PCS上进行比较。在pH 4.75下,将酶混合物1在55℃下水解,其中CTec2在50℃下并且在pH 5.0下水解持续5天。将所有组合物用于3、6、10和20mg蛋白质/g纤维素。使用微平板BCATM蛋白质测定试剂盒来确定这些酶组合物的蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
在图13中所示的这些结果表明,在所有的酶加载量上,“酶混合物2”比商业化酶CTec2具有显著地更高的水解。
本发明进一步由下述编号的段落描述:
[1]酶组合物,该酶组合物包括:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶;
其中该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:2的成熟多肽或由其组成的纤维二糖水解酶I;(ii)与SEQ ID NO:2的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交;
其中该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的纤维二糖水解酶II;(ii)与SEQ ID NO:4的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交;
其中该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:6的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:6的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交;
其中该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:10的成熟多肽或由其组成的、或者包含SEQ ID NO:12的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:10的成熟多肽或SEQ IDNO:12的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列或者其全长互补体杂交;并且
其中该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:14的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:14的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:13的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交。
[2]如段落1所述的酶组合物,其中该AA9多肽是任何具有纤维素分解增强活性的AA9多肽。
[3]根据段落1或2所述的酶组合物,其中具有纤维素分解增强活性的AA9多肽选自下组,该组由以下各项组成:(i)具有纤维素分解增强活性的AA9多肽,该多肽包含SEQ IDNO:8的成熟多肽或由其组成;(ii)具有纤维素分解增强活性的AA9多肽,该多肽包含如下氨基酸序列或由其组成,该氨基酸序列与SEQ ID NO:8的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)具有纤维素分解增强活性的AA9多肽,该多肽由包含以下核苷酸序列或由其组成的多核苷酸编码,该核苷酸序列与SEQ IDNO:7的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:7或其全长互补体的成熟多肽编码序列杂交。
[4]如段落1至3中任一段所述的酶组合物,其中该β-葡糖苷酶变体在对应于SEQID NO:6的全长多肽或其成熟多肽的位置100、283、456以及512的一个或多个位置处包括取代,其中该变体具有β-葡糖苷酶活性。
[5]如段落1-4中任一段所述的酶组合物,其中该变体的亲本β-葡糖苷酶是(a)包括SEQ ID NO:6的成熟多肽或由其组成的多肽;(b)与SEQ ID NO:6的成熟多肽具有至少80%序列一致性的多肽;(c)由在高或非常高严格条件下与以下杂交的多核苷酸编码的多肽:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补体;(d)由与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列具有至少80%序列一致性的多核苷酸编码的多肽;或(e)SEQ ID NO:6的成熟多肽的片段,它具有β-葡糖苷酶活性。
[6]如段落1-5中任一段所述的酶组合物,其中该变体与亲本β-葡糖苷酶的氨基酸序列具有至少80%,例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但低于100%序列一致性。
[7]如段落1-6中任一段所述的酶组合物,其中该变体与SEQ ID NO:6的成熟多肽具有至少80%,例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但低于100%序列一致性。
[8]如段落1-7中任一段所述的酶组合物,其中取代的数目是1-4个,如1、2、3或4个取代。
[9]如段落1-8中任一段所述的酶组合物,其中该变体在对应于位置100的位置处包含取代、在对应于位置283的位置处包含取代、在对应于位置456的位置处包含取代、和/或在对应于位置512的位置处包含取代。
[10]如段落9所述的酶组合物,其中在对应于位置100的位置处的取代是Asp、对应于位置283的位置处的取代是Gly、对应于位置456的位置处的取代是Glu、和/或对应于位置512的位置处的取代是Tyr。
[11]如段落1-10中任一段所述的酶组合物,其中该变体包含选自下组的一个或多个(例如若干个)取代,该组由F100D、S283G、N456E、和F512Y组成。
[12]如段落1-11中任一段所述的酶组合物,其中该变体包含如下这些取代:F100D+S283G;F100D+N456E;F100D+F512Y;S283G+N456E;S283G+F512Y;N456E+F512Y;F100D+S283G+N456E;F100D+S283G+F512Y;F100D+N456E+F512Y;S283G+N456E+F512Y;或F100D+S283G+N456E+F512Y。
[13]根据段落1-12中任一段所述的酶组合物,其中该变体包括SEQ ID NO:36或其成熟多肽或者由其组成。
[14]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、和β-葡糖苷酶或其变体。
[15]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、和具有纤维素分解增强活性的AA9多肽。
[16]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、和GH10木聚糖酶。
[17]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、和β-木糖苷酶。
[18]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和具有纤维素分解增强活性的AA9多肽。
[19]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和GH10木聚糖酶。
[20]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和β-木糖苷酶。
[21]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、和GH10木聚糖酶。
[22]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、和β-木糖苷酶。
[23]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、GH10木聚糖酶、和β-木糖苷酶。
[24]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、和GH10木聚糖酶。
[25]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、和β-木糖苷酶。
[26]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、GH10木聚糖酶、和β-木糖苷酶。
[27]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶。
[28]根据段落1-13中任一段所述的酶组合物,其中该组合物包括纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶。
[29]根据段落1-28中任一段所述的酶组合物,其中该酶组合物进一步包含一种或多种选自下组的酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的AA9多肽、纤维素诱导蛋白、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀素。
[30]如段落29所述的酶组合物,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[31]如段落30所述的酶组合物,其中该内切葡聚糖酶是内切葡聚糖酶I。
[32]如段落31所述的酶组合物,其中该内切葡聚糖酶I是木霉属内切葡聚糖酶I。
[33]如段落32所述的酶组合物,其中该木霉属内切葡聚糖酶I是里氏木霉内切葡聚糖酶I或其同系物。
[34]如段落31-33中任一项所述的酶组合物,其中该内切葡聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:16的成熟多肽或由其组成的内切葡聚糖酶I;(ii)与SEQ ID NO:16的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶I,该核苷酸序列与SEQ ID NO:15的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交。
[35]如段落30所述的酶组合物,其中该内切葡聚糖酶是内切葡聚糖酶II。
[36]如段落35所述的酶组合物,其中该内切葡聚糖酶II是木霉属内切葡聚糖酶II。
[37]如段落36所述的酶组合物,其中该木霉属内切葡聚糖酶II是里氏木霉内切葡聚糖酶II或其同系物。
[38]如段落35-37中任一项所述的酶组合物,其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:18的成熟多肽或由其组成的内切葡聚糖酶II;(ii)与SEQ ID NO:18的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:17的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交。
[39]根据段落35所述的酶组合物,其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:106的成熟多肽或由其组成的II;(ii)与SEQ ID NO:106的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:105的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:105的成熟多肽编码序列或其全长互补体杂交。
[40]如段落29所述的酶组合物,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[41]如段落1-40中任一段所述的酶组合物,该组合物进一步包括过氧化氢酶。
[42]根据段落41所述的酶组合物,其中该过氧化氢酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的过氧化氢酶;(ii)与SEQ ID NO:34的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的过氧化氢酶;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的过氧化氢酶,该核苷酸序列与SEQ ID NO:33的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的过氧化氢酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:33的成熟多肽编码序列或其全长互补体杂交。
[43]如段落1-42中任一段所述的酶组合物,该组合物进一步包括过木霉属全培养液制剂。
[44]如段落43所述的酶组合物,其中该木霉属全培养液制剂是里氏木霉全培养液制剂。
[45]如段落1-44中任一段所述的酶组合物,该组合物进一步包括毁丝霉菌株全培养液制剂。
[46]如段落47所述的酶组合物,其中该毁丝霉菌株全培养液制剂是嗜热毁丝霉全培养液制剂。
[47]如段落1-46中任一段所述的酶组合物,该组合物进一步包括埃默森篮状菌菌株全培养液制剂。
[48]如段落1-47中任一项所述的酶组合物,该酶组合物是发酵液配制品或细胞组合物。
[49]重组真菌宿主细胞,包含编码以下酶组合物的多核苷酸,该酶组合物包含:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶;
其中该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:2的成熟多肽或由其组成的纤维二糖水解酶I;(ii)与SEQ ID NO:2的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交;
其中该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的纤维二糖水解酶II;(ii)与SEQ ID NO:4的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交;
其中该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:6的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:6的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交;
其中该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:10的成熟多肽或由其组成的、或者包含SEQ ID NO:12的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:10的成熟多肽或SEQ IDNO:12的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列或者其全长互补体杂交;并且
其中该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:14的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:14的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:13的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交。
[50]如段落49所述的重组真菌宿主细胞,其中该AA9多肽是任何具有纤维素分解增强活性的AA9多肽。
[51]根据段落49或50所述的重组真菌宿主细胞,其中具有纤维素分解增强活性的AA9多肽选自下组,该组由以下各项组成:(i)具有纤维素分解增强活性的AA9多肽,该多肽包含SEQ ID NO:8的成熟多肽或由其组成;(ii)具有纤维素分解增强活性的AA9多肽,该多肽包含如下氨基酸序列或由其组成,该氨基酸序列与SEQ ID NO:8的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)具有纤维素分解增强活性的AA9多肽,该多肽由包含以下核苷酸序列或由其组成的多核苷酸编码,该核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQID NO:7或其全长互补体的成熟多肽编码序列杂交。
[52]如段落49至51中任一段所述的重组真菌宿主细胞,其中该β-葡糖苷酶变体在对应于SEQ ID NO:6的全长多肽或其成熟多肽的位置100、283、456以及512的一个或多个位置处包括取代,其中该变体具有β-葡糖苷酶活性。
[53]如段落49-52中任一段所述的重组真菌宿主细胞,其中该变体的亲本β-葡糖苷酶是(a)包括SEQ ID NO:6的成熟多肽或由其组成的多肽;(b)与SEQ ID NO:6的成熟多肽具有至少80%序列一致性的多肽;(c)由在高或非常高严格条件下与以下杂交的多核苷酸编码的多肽:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补体;(d)由与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列具有至少80%序列一致性的多核苷酸编码的多肽;或(e)SEQ IDNO:6的成熟多肽的片段,它具有β-葡糖苷酶活性。
[54]如段落49-53中任一段所述的重组真菌宿主细胞,其中该变体与亲本β-葡糖苷酶的氨基酸序列具有至少80%,例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但低于100%序列一致性。
[55]如段落49-54中任一段所述的重组真菌宿主细胞,其中该变体与SEQ ID NO:6的成熟多肽具有至少80%,例如,至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但低于100%序列一致性。
[56]如段落49-55中任一段所述的重组真菌宿主细胞,其中取代的数目是1-4个,如1、2、3或4个取代。
[57]如段落49-56中任一段所述的重组真菌宿主细胞,其中该变体在对应于位置100的位置处包含取代、在对应于位置283的位置处包含取代、在对应于位置456的位置处包含取代、和/或在对应于位置512的位置处包含取代。
[58]如段落57所述的重组真菌宿主细胞,其中在对应于位置100的位置处的取代是Asp、对应于位置283的位置处的取代是Gly、对应于位置456的位置处的取代是Glu、和/或对应于位置512的位置处的取代是Tyr。
[59]如段落49-58中任一段所述的重组真菌宿主细胞,其中该变体包含选自下组的一个或多个(例如若干个)取代,该组由G142S、Q183R、H266Q、和D703G组成。
[60]如段落49-59中任一段所述的重组真菌宿主细胞,其中该变体包含如下这些取代:F100D+S283G;F100D+N456E;F100D+F512Y;S283G+N456E;S283G+F512Y;N456E+F512Y;F100D+S283G+N456E;F100D+S283G+F512Y;F100D+N456E+F512Y;S283G+N456E+F512Y;或F100D+S283G+N456E+F512Y。
[61]根据段落49-60中任一段所述的重组真菌宿主细胞,其中该变体包括SEQ IDNO:36或其成熟多肽或者由其组成。
[62]根据段落49-61中任一段所述的重组真菌宿主细胞,其中这些重组真菌宿主细胞进一步包含一种或多种(例如,若干种)编码选自下组的一种或多种酶的多核苷酸,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的AA9多肽、纤维素诱导蛋白、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀素。
[63]如段落62所述的重组真菌宿主细胞,其中该纤维素酶是一种或多种选自下组的酶,该组由以下各项组成:内切葡聚糖酶、纤维二塘水解酶、以及β-葡糖苷酶。
[64]如段落63所述的重组真菌宿主细胞,其中该内切葡聚糖酶是内切葡聚糖酶I。
[65]如段落64所述的重组真菌宿主细胞,其中该内切葡聚糖酶I是木霉属内切葡聚糖酶I。
[66]如段落65所述的重组真菌宿主细胞,其中该木霉属内切葡聚糖酶I是里氏木霉内切葡聚糖酶I或其同系物。
[67]根据段落64-66所述的重组真菌宿主细胞,其中该内切葡聚糖酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:16的成熟多肽或由其组成的I;(ii)与SEQ IDNO:16的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶I,该核苷酸序列与SEQ ID NO:15的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交。
[68]如段落63所述的重组真菌宿主细胞,其中该内切葡聚糖酶是内切葡聚糖酶II。
[69]如段落68所述的重组真菌宿主细胞,其中该内切葡聚糖酶II是木霉属内切葡聚糖酶II。
[70]如段落69所述的重组真菌宿主细胞,其中该木霉属内切葡聚糖酶II是里氏木霉内切葡聚糖酶II或其同系物。
[71]根据段落68-70所述的重组真菌宿主细胞,其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:18的成熟多肽或由其组成的II;(ii)与SEQ IDNO:18的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:17的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQID NO:17的成熟多肽编码序列或其全长互补体杂交。
[72]根据段落68-70所述的重组真菌宿主细胞,其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:106的成熟多肽或由其组成的II;(ii)与SEQ IDNO:106的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的内切葡聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:105的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQID NO:105的成熟多肽编码序列或其全长互补体杂交。
[73]如段落62所述的重组真菌宿主细胞,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[74]如段落49-73中任一段所述的重组真菌宿主细胞,其中该细胞进一步包括编码过氧化氢酶的多核苷酸。
[75]根据段落74所述的重组真菌宿主细胞,其中该过氧化氢酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:34的成熟多肽或由其组成的过氧化氢酶;(ii)与SEQ IDNO:34的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的过氧化氢酶;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的过氧化氢酶,该核苷酸序列与SEQ ID NO:33的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的过氧化氢酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:33的成熟多肽编码序列或其全长互补体杂交。
[76]如段落49-75中任一段所述的重组真菌宿主细胞,其中这些酶中的一种或多种对于该重组真菌宿主细胞是天然的。
[77]如段落49-76中任一段所述的重组真菌宿主细胞,其中这些酶中的一种或多种对于该重组真菌宿主细胞是异源的。
[78]如段落49-77中任一段所述的重组真菌宿主细胞,其中该细胞是木霉属细胞。
[79]如段落78所述的重组真菌宿主细胞,其中该木霉属细胞选自下组,该组由以下各项组成:哈茨木霉、康宁木霉、长枝木霉、里氏木霉、以及绿色木霉。
[80]如段落78所述的重组真菌宿主细胞,其中该细胞是里氏木霉细胞。
[81]如段落49-77中任一段所述的重组真菌宿主细胞,其中该细胞是毁丝霉属细胞。
[82]如段落81所述的重组真菌宿主细胞,其中该细胞是嗜热毁丝霉细胞。
[83]如段落49-77中任一段所述的重组真菌宿主细胞,其中该细胞是埃默森篮状菌菌株细胞。
[84]根据段落49-83中任一项所述的重组真菌宿主细胞,其中对于该真菌宿主细胞而言为内源性的一种或多种纤维素酶基因、一种或多种半纤维素酶基因、或它们的组合已经被灭活。
[85]如段落84所述的重组真菌宿主细胞,其中该灭活的纤维素酶基因是纤维二糖水解酶I基因。
[86]根据段落85所述的重组真菌宿主细胞,其中该纤维二糖水解酶I基因编码选自下组的纤维二糖水解酶I,该组由以下各项组成:(i)包含SEQ ID NO:20的成熟多肽或由其组成的纤维二糖水解酶I;(ii)与SEQ ID NO:20的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQ ID NO:19的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:19的成熟多肽编码序列或其全长互补体杂交。
[87]如段落84-86中任一段所述的重组真菌宿主细胞,其中该灭活的纤维素酶基因是纤维二糖水解酶II基因。
[88]根据段落87所述的重组真菌宿主细胞,其中该纤维二糖水解酶II基因编码选自下组的纤维二糖水解酶II,该组由以下各项组成:(i)包含SEQ ID NO:22的成熟多肽或由其组成的纤维二糖水解酶I;(ii)与SEQ ID NO:22的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的纤维二糖水解酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:21的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交。
[89]如段落84-88中任一段所述的重组真菌宿主细胞,其中该灭活的纤维素酶基因是β-葡糖苷酶基因。
[90]根据段落89所述的重组真菌宿主细胞,其中该β-葡糖苷酶基因编码选自下组的β-葡糖苷酶,该组由以下各项组成:(i)包含SEQ ID NO:24的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:24的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:23的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:23的成熟多肽编码序列或其全长互补体杂交。
[91]如段落84-90中任一段所述的重组真菌宿主细胞,其中该灭活的半纤维素酶基因是木聚糖酶I基因。
[92]根据段落91所述的重组真菌宿主细胞,其中该木聚糖酶I基因编码选自下组的木聚糖酶I,该组由以下各项组成:(i)包含SEQ ID NO:26的成熟多肽或由其组成的木聚糖酶I;(ii)与SEQ ID NO:26的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的木聚糖酶I;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶I,该核苷酸序列与SEQ ID NO:25的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶I,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:25的成熟多肽编码序列或其全长互补体杂交。
[93]如段落84-92中任一段所述的重组真菌宿主细胞,其中该灭活的半纤维素酶基因是木聚糖酶II基因。
[94]根据段落93所述的重组真菌宿主细胞,其中该木聚糖酶II基因编码选自下组的木聚糖酶II,该组由以下各项组成:(i)包含SEQ ID NO:28的成熟多肽或由其组成的木聚糖酶II;(ii)与SEQ ID NO:28的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的木聚糖酶II;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶II,该核苷酸序列与SEQ ID NO:27的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶II,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:27的成熟多肽编码序列或其全长互补体杂交。
[95]如段落84-94中任一段所述的重组真菌宿主细胞,其中该灭活的半纤维素酶基因是木聚糖酶III基因。
[96]根据段落95所述的重组真菌宿主细胞,其中该木聚糖酶III基因编码选自下组的木聚糖酶III,该组由以下各项组成:(i)包含SEQ ID NO:30的成熟多肽或由其组成的木聚糖酶III;(ii)与SEQ ID NO:30的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的木聚糖酶III;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶III,该核苷酸序列与SEQ ID NO:29的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的木聚糖酶III,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:29的成熟多肽编码序列或其全长互补体杂交。
[97]如段落84-96中任一段所述的重组真菌宿主细胞,其中该灭活的半纤维素酶基因是β-木糖苷酶基因。
[98]根据段落97所述的重组真菌宿主细胞,其中该β-木糖苷酶基因编码选自下组的β-木糖苷酶,该组由以下各项组成:(i)包含SEQ ID NO:32的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:32的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:31的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:31的成熟多肽编码序列或其全长互补体杂交。
[99]一种生产酶组合物的方法,该方法包括:(a)在有益于生产该酶组合物的条件下培养如段落49-98中任一段所述的重组真菌宿主细胞中的一种或多种;并且任选地(b)回收该酶组合物。
[100]用于降解纤维素或半纤维素材料的方法,该方法包括:用如段落1-48中任一段所述的酶组合物处理该纤维素或半纤维素材料。
[101]如段落100所述的方法,其中对该纤维素或半纤维素材料进行了预处理。
[102]如段落100或101所述的方法,进一步包括回收该降解的纤维素或半纤维素材料。
[103]如段落102所述的方法,其中该降解的纤维素或半纤维素材料是糖。
[104]如段落103所述的方法,其中该糖选自下组,该组由以下各项组成:葡萄糖、木糖、甘露糖、半乳糖、以及阿拉伯糖。
[105]一种用于产生发酵产物的方法,该方法包括:(a)用如段落1-48中任一段所述的酶组合物糖化纤维素或半纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素或半纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
[106]如段落105所述的方法,其中对该纤维素或半纤维素材料进行了预处理。
[107]如段落105或106所述的方法,其中步骤(a)和(b)是在同时糖化和发酵中同时进行。
[108]如段落105-107中任一项所述的方法,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[109]一种发酵纤维素或半纤维素材料的方法,该方法包括:用一种或多种发酵微生物发酵该纤维素或半纤维素材料,其中用如段落1-48中任一段所述的酶组合物糖化该纤维素或半纤维素材料。
[110]如段落109所述的方法,其中发酵该纤维素或半纤维素材料产生一种发酵产物。
[111]如段落110所述的方法,进一步包括从该发酵中回收该发酵产物。
[112]如段落110或111所述的方法,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[113]如段落109-112中任一段所述的方法,其中在糖化之前,对该纤维素或半纤维素材料进行预处理。
本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明几个方面的说明。任何等同方面预期处于本发明的范围之内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这样的实施例也旨在落入所附权利要求的范围内。在有冲突的情况下,以包括定义的本披露为准。
序列表
<110> 诺维信公司(Novozymes A/S)
沙思凯,杰弗里(Shasky, Jeffrey)
雅弗,黛比(Yaver, Debbie)
莫耶,唐娜(Moyer, Donna)
<120> 酶组合物及其用途
<130> 12953-WO-PCT
<150> US 62/009,018
<151> 2014-06-06
<150> US 62/093,230
<151> 2014-12-17
<160> 106
<170> PatentIn 版本3.5
<210> 1
<211> 1730
<212> DNA
<213> Talaromyces leycettanus
<400> 1
atggcgtccc tcttctcttt caagatgtac aaggctgctc tcgtcctgtc ttctctcctg 60
gccgctacgc aggctcagca ggccggcact ctcacgacgg agacccatcc gtccctgaca 120
tggcagcaat gctcggccgg tggcagctgc accacccaga acggcaaggt cgtcatcgat 180
gcgaactggc gttgggtgca cagcacgagc ggaagcaaca actgctacac cggcaatacc 240
tgggacgcta ccctatgccc tgacgatgtg acctgcgccg ccaactgtgc gctggacggt 300
gccgactact cgggcaccta cggagtgacc accagcggca actccctccg cctcaacttc 360
gtcacccagg cgtcacagaa gaacgtcggc tcccgtcttt acctgatgga gaatgacaca 420
acctaccaga tcttcaagct gctgaaccag gagttcacct ttgatgtcga tgtgtccaac 480
ctgccgtaag tgacttacca tgaacccctg acgctatctt cttgttggct cccagctgac 540
tggccaattc aagctgcggc ttgaacggtg ctctctacct ggtggccatg gacgccgatg 600
gtggcatggc caagtacccc accaacaagg ctggtgccaa gtacggtacc gggtactgcg 660
actcccagtg tccccgcgac ctcaagttca tcaatggcga ggccaacgtc gagggctggc 720
agccgtcgtc caacgatccc aactctggca ttggcaacca cggatcctgc tgcgcggaga 780
tggatatctg ggaggccaac agcatctcca atgctgtcac tccccacccg tgcgacactc 840
ccggccaggt gatgtgcacc ggtaacaact gcggtggcac atacagcact actcgctatg 900
cgggcacttg cgatcccgac ggctgcgact tcaaccccta ccgcatgggc aaccacagct 960
tctacggccc taaacagatc gtcgatacca gctcgaagtt caccgtcgtg acgcagttcc 1020
tcacggatga cggcacctcc accggcaccc tctctgaaat ccgccgcttc tatgtccaga 1080
acggccaggt gatcccgaac tcggtgtcga ccatcagtgg cgtgagcggc aactccatca 1140
ccaccgagtt ctgcactgcc cagaagcagg ccttcggcga cacggacgac ttctcaaagc 1200
acggcggcct gtccggcatg agcgctgccc tctctcaggg tatggttctg gtcatgagtc 1260
tgtgggatga tgtgagtttg atggacaaac atgcgcgttg acaaagagtc aagcagctga 1320
ctgagatgtt acagcacgcc gccaacatgc tctggctcga cagcacctac ccgaccaacg 1380
cgacctcctc cacccccggt gccgcccgtg gaacctgcga catctcgtcc ggtgtccctg 1440
cggatgtcga atccaacgac cccaacgcct acgtggtcta ctcgaacatc aaggttggtc 1500
ccatcggctc gaccttcagc agcagcggct ctggatcttc ttcctctagc tccaccacta 1560
ccacgaccac cgcttcccca accaccacga cctcctccgc atcgagcacc ggcactggag 1620
tggcacagca ctggggccag tgtggtggac agggctggac cggccccaca acctgcgtca 1680
gcccttatac ttgccaggag ctgaaccctt actactacca gtgtctgtaa 1730
<210> 2
<211> 532
<212> PRT
<213> Talaromyces leycettanus
<400> 2
Met Ala Ser Leu Phe Ser Phe Lys Met Tyr Lys Ala Ala Leu Val Leu
1 5 10 15
Ser Ser Leu Leu Ala Ala Thr Gln Ala Gln Gln Ala Gly Thr Leu Thr
20 25 30
Thr Glu Thr His Pro Ser Leu Thr Trp Gln Gln Cys Ser Ala Gly Gly
35 40 45
Ser Cys Thr Thr Gln Asn Gly Lys Val Val Ile Asp Ala Asn Trp Arg
50 55 60
Trp Val His Ser Thr Ser Gly Ser Asn Asn Cys Tyr Thr Gly Asn Thr
65 70 75 80
Trp Asp Ala Thr Leu Cys Pro Asp Asp Val Thr Cys Ala Ala Asn Cys
85 90 95
Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr Tyr Gly Val Thr Thr Ser
100 105 110
Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Gln Ala Ser Gln Lys Asn
115 120 125
Val Gly Ser Arg Leu Tyr Leu Met Glu Asn Asp Thr Thr Tyr Gln Ile
130 135 140
Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asn
145 150 155 160
Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Leu Val Ala Met Asp Ala
165 170 175
Asp Gly Gly Met Ala Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr
180 185 190
Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile
195 200 205
Asn Gly Glu Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp Pro
210 215 220
Asn Ser Gly Ile Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp Ile
225 230 235 240
Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr Pro His Pro Cys Asp
245 250 255
Thr Pro Gly Gln Val Met Cys Thr Gly Asn Asn Cys Gly Gly Thr Tyr
260 265 270
Ser Thr Thr Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp Phe
275 280 285
Asn Pro Tyr Arg Met Gly Asn His Ser Phe Tyr Gly Pro Lys Gln Ile
290 295 300
Val Asp Thr Ser Ser Lys Phe Thr Val Val Thr Gln Phe Leu Thr Asp
305 310 315 320
Asp Gly Thr Ser Thr Gly Thr Leu Ser Glu Ile Arg Arg Phe Tyr Val
325 330 335
Gln Asn Gly Gln Val Ile Pro Asn Ser Val Ser Thr Ile Ser Gly Val
340 345 350
Ser Gly Asn Ser Ile Thr Thr Glu Phe Cys Thr Ala Gln Lys Gln Ala
355 360 365
Phe Gly Asp Thr Asp Asp Phe Ser Lys His Gly Gly Leu Ser Gly Met
370 375 380
Ser Ala Ala Leu Ser Gln Gly Met Val Leu Val Met Ser Leu Trp Asp
385 390 395 400
Asp His Ala Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn
405 410 415
Ala Thr Ser Ser Thr Pro Gly Ala Ala Arg Gly Thr Cys Asp Ile Ser
420 425 430
Ser Gly Val Pro Ala Asp Val Glu Ser Asn Asp Pro Asn Ala Tyr Val
435 440 445
Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Ser Ser
450 455 460
Ser Gly Ser Gly Ser Ser Ser Ser Ser Ser Thr Thr Thr Thr Thr Thr
465 470 475 480
Ala Ser Pro Thr Thr Thr Thr Ser Ser Ala Ser Ser Thr Gly Thr Gly
485 490 495
Val Ala Gln His Trp Gly Gln Cys Gly Gly Gln Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Val Ser Pro Tyr Thr Cys Gln Glu Leu Asn Pro Tyr Tyr
515 520 525
Tyr Gln Cys Leu
530
<210> 3
<211> 1898
<212> DNA
<213> Talaromyces leycettanus
<400> 3
atgcggtctc tcctggctct tgcccctacc ctgctcgcgc ctgttgttca ggctcagcaa 60
accatgtggg gtcaatgtaa gttcttttca ctgcttacca tgtataatct ttgatatcaa 120
gcatcatatc tgactcacgt tttaggcggt ggtcagggct ggaccggacc taccatctgt 180
gtagcaggcg cgacatgcag cacacagaac ccttgtaagt cgggccttca tcaaaacttc 240
aacatcacca cctcgatgga gcaggagttg acctgatctt tacccttagg gtatgcgcag 300
tgcaccccag cacctaccgc gccgacgacc ttgcaaacaa caactacgac gagctcgaaa 360
tcgtccacga ccacgagctc gaagtcgtcc acgaccacag gtggaagtgg cggtggaact 420
acgacctcaa cgtcagccac catcaccgcg gctccatctg gtaacccata ctccggatac 480
cagctctatg tgaaccagga atactcgtcc gaggtgtacg cgtctgctat tccttccctt 540
accggcactc tggtcgcgaa ggcaagcgcc gcggcagagg tgccatcttt cctgtggctg 600
taagtttttt tgaccttgaa tgaacgccct gtcctctacg agtggccgca ggagctaatt 660
gagatgccaa tgaacaggga cactgcctcc aaggtgccac tgatgggcac ttacttgcag 720
gatatccagg cgaagaacgc tgctggcgcc aaccccccat atgccggtca attcgtggtt 780
tacgacttgc cggatcgtga ttgcgctgca ttggccagca atggagagta ctccattgct 840
aacaatggtg ttgccaacta caaggcttac atcgactcca tccgcgcgct tcttgttcaa 900
tactcgaacg tccatgtcat ccttgtgatc ggtgagctat tgcagtctcg ctttaaagca 960
tttgactaga tcaatgtcgc taatggtacc taccgcacag agcccgacag cttggccaac 1020
cttgtcacca acctgaatgt tcagaagtgt gctaatgctc agagtgctta cctggagtgc 1080
atcaactatg ccctcactca gttgaacctc aagaacgttg ctatgtacat cgatgctggt 1140
gcgtgaacct tccctagtca gcccaaaata actgaaataa agagacggag tgtactgatt 1200
gtcatgcagg tcatgctgga tggctcggct ggcccgccaa ccttagcccg gccgctcaac 1260
tctttgcttc cgtataccag aatgcaagct ccccagctgc cgttcgcggc ctggcaacca 1320
acgtggccaa ctataatgcc tggtcgatcg ccacttgccc atcttacacc caaggcgacc 1380
ccaactgcga cgagcagaaa tacatcaacg ctctggctcc attgcttcag caacagggat 1440
ggtcatcagt tcactttatc accgataccg gtaagtctgc ctgtcctgcc aaccatgcgt 1500
tcaagagcgt tgcaatccta accatgctgg tatcttccag gccgtaacgg tgtccagcct 1560
accaagcaga atgcctgggg tgactggtgc aacgttatcg gaaccggctt cggtgtccgt 1620
cccaccacca acactggcga tccattggag gatgctttcg tctgggtcaa gcctggtggt 1680
gagagtgatg gtacttccaa ctccacttcg cctcgctacg acgcccactg cggttacagt 1740
gatgctcttc agcctgctcc tgaggctggt acctggttcg aggtaagctt ctgcatactg 1800
agatcgagaa tcctgaaagg gttaacctgc taatgcttcg gtgtttgata taggcttact 1860
ttgagcaact ccttaccaac gccaacccct ctttctaa 1898
<210> 4
<211> 464
<212> PRT
<213> Talaromyces leycettanus
<400> 4
Met Arg Ser Leu Leu Ala Leu Ala Pro Thr Leu Leu Ala Pro Val Val
1 5 10 15
Gln Ala Gln Gln Thr Met Trp Gly Gln Cys Gly Gly Gln Gly Trp Thr
20 25 30
Gly Pro Thr Ile Cys Val Ala Gly Ala Thr Cys Ser Thr Gln Asn Pro
35 40 45
Trp Tyr Ala Gln Cys Thr Pro Ala Pro Thr Ala Pro Thr Thr Leu Gln
50 55 60
Thr Thr Thr Thr Thr Ser Ser Lys Ser Ser Thr Thr Thr Ser Ser Lys
65 70 75 80
Ser Ser Thr Thr Thr Gly Gly Ser Gly Gly Gly Thr Thr Thr Ser Thr
85 90 95
Ser Ala Thr Ile Thr Ala Ala Pro Ser Gly Asn Pro Tyr Ser Gly Tyr
100 105 110
Gln Leu Tyr Val Asn Gln Glu Tyr Ser Ser Glu Val Tyr Ala Ser Ala
115 120 125
Ile Pro Ser Leu Thr Gly Thr Leu Val Ala Lys Ala Ser Ala Ala Ala
130 135 140
Glu Val Pro Ser Phe Leu Trp Leu Asp Thr Ala Ser Lys Val Pro Leu
145 150 155 160
Met Gly Thr Tyr Leu Gln Asp Ile Gln Ala Lys Asn Ala Ala Gly Ala
165 170 175
Asn Pro Pro Tyr Ala Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg
180 185 190
Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asn Asn
195 200 205
Gly Val Ala Asn Tyr Lys Ala Tyr Ile Asp Ser Ile Arg Ala Leu Leu
210 215 220
Val Gln Tyr Ser Asn Val His Val Ile Leu Val Ile Glu Pro Asp Ser
225 230 235 240
Leu Ala Asn Leu Val Thr Asn Leu Asn Val Gln Lys Cys Ala Asn Ala
245 250 255
Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala Leu Thr Gln Leu Asn
260 265 270
Leu Lys Asn Val Ala Met Tyr Ile Asp Ala Gly His Ala Gly Trp Leu
275 280 285
Gly Trp Pro Ala Asn Leu Ser Pro Ala Ala Gln Leu Phe Ala Ser Val
290 295 300
Tyr Gln Asn Ala Ser Ser Pro Ala Ala Val Arg Gly Leu Ala Thr Asn
305 310 315 320
Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Thr Cys Pro Ser Tyr Thr
325 330 335
Gln Gly Asp Pro Asn Cys Asp Glu Gln Lys Tyr Ile Asn Ala Leu Ala
340 345 350
Pro Leu Leu Gln Gln Gln Gly Trp Ser Ser Val His Phe Ile Thr Asp
355 360 365
Thr Gly Arg Asn Gly Val Gln Pro Thr Lys Gln Asn Ala Trp Gly Asp
370 375 380
Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr Asn
385 390 395 400
Thr Gly Asp Pro Leu Glu Asp Ala Phe Val Trp Val Lys Pro Gly Gly
405 410 415
Glu Ser Asp Gly Thr Ser Asn Ser Thr Ser Pro Arg Tyr Asp Ala His
420 425 430
Cys Gly Tyr Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr Trp
435 440 445
Phe Glu Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe
450 455 460
<210> 5
<211> 3060
<212> DNA
<213> 烟曲霉
<400> 5
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210> 6
<211> 863
<212> PRT
<213> 烟曲霉
<400> 6
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210> 7
<211> 835
<212> DNA
<213> 埃默森青霉素
<400> 7
atgctgtctt cgacgactcg caccctcgcc tttacaggcc ttgcgggcct tctgtccgct 60
cccctggtca aggcccatgg ctttgtccag ggcattgtca tcggtgacca attgtaagtc 120
cctctcttgc agttctgtcg attaactgct ggactgcttg cttgactccc tgctgactcc 180
caacagctac agcgggtaca tcgtcaactc gttcccctac gaatccaacc caccccccgt 240
catcggctgg gccacgaccg ccaccgacct gggcttcgtc gacggcacag gataccaagg 300
cccggacatc atctgccacc ggaatgcgac gcccgcgccg ctgacagccc ccgtggccgc 360
cggcggcacc gtcgagctgc agtggacgcc gtggccggac agccaccacg gacccgtcat 420
cacctacctg gcgccgtgca acggcaactg ctcgaccgtc gacaagacga cgctggagtt 480
cttcaagatc gaccagcagg gcctgatcga cgacacgagc ccgccgggca cctgggcgtc 540
ggacaacctc atcgccaaca acaatagctg gaccgtcacc attcccaaca gcgtcgcccc 600
cggcaactac gtcctgcgcc acgagatcat cgccctgcac tcggccaaca acaaggacgg 660
cgcccagaac tacccccagt gcatcaacat cgaggtcacg ggcggcggct ccgacgcgcc 720
tgagggtact ctgggcgagg atctctacca tgacaccgac ccgggcattc tggtcgacat 780
ttacgagccc attgcgacgt ataccattcc ggggccgcct gagccgacgt tctag 835
<210> 8
<211> 253
<212> PRT
<213> 埃默森青霉素
<400> 8
Met Leu Ser Ser Thr Thr Arg Thr Leu Ala Phe Thr Gly Leu Ala Gly
1 5 10 15
Leu Leu Ser Ala Pro Leu Val Lys Ala His Gly Phe Val Gln Gly Ile
20 25 30
Val Ile Gly Asp Gln Phe Tyr Ser Gly Tyr Ile Val Asn Ser Phe Pro
35 40 45
Tyr Glu Ser Asn Pro Pro Pro Val Ile Gly Trp Ala Thr Thr Ala Thr
50 55 60
Asp Leu Gly Phe Val Asp Gly Thr Gly Tyr Gln Gly Pro Asp Ile Ile
65 70 75 80
Cys His Arg Asn Ala Thr Pro Ala Pro Leu Thr Ala Pro Val Ala Ala
85 90 95
Gly Gly Thr Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His
100 105 110
Gly Pro Val Ile Thr Tyr Leu Ala Pro Cys Asn Gly Asn Cys Ser Thr
115 120 125
Val Asp Lys Thr Thr Leu Glu Phe Phe Lys Ile Asp Gln Gln Gly Leu
130 135 140
Ile Asp Asp Thr Ser Pro Pro Gly Thr Trp Ala Ser Asp Asn Leu Ile
145 150 155 160
Ala Asn Asn Asn Ser Trp Thr Val Thr Ile Pro Asn Ser Val Ala Pro
165 170 175
Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Asn
180 185 190
Asn Lys Asp Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Ile Glu Val
195 200 205
Thr Gly Gly Gly Ser Asp Ala Pro Glu Gly Thr Leu Gly Glu Asp Leu
210 215 220
Tyr His Asp Thr Asp Pro Gly Ile Leu Val Asp Ile Tyr Glu Pro Ile
225 230 235 240
Ala Thr Tyr Thr Ile Pro Gly Pro Pro Glu Pro Thr Phe
245 250
<210> 9
<211> 1520
<212> DNA
<213> Talaromyces leycettanus
<400> 9
atggtccatc tttcttccct ggccctggct ttggccgccg gctcgcagct gtatgtgatc 60
catgccatga ctcgagaagt gctcccaaaa ctgactccaa gtctcaatct tagtgcccaa 120
gctgcaggtc ttaacactgc tgccaaagcg attggaaagc tctatttcgg taccgcaacc 180
gacaacccgg agctgtccga cagcacatac atgcaggaga cggataacac cgatgatttc 240
ggccaactca ccccagctaa ctccatgaag gttcgctgac atcttagttc cccccccctt 300
ttgggaatct gcgcggagat atgctgagcc ttcaaaacta gtgggatgcc accgagccct 360
ctcagaacac cttcaccttc accaacggtg atcagatcgc aaaccttgct aagagcaacg 420
gtcagatgct gagatgccac aacctggtgt ggtacaacca gttgcccagc tggggtaagc 480
aaccggttct gttaatatca tcagcgtgac cgcatcgatc gtattgcgcg gagattggaa 540
agatttgcaa gctaatgtca ctacagtcac cagcggatct tggaccaatg ccacgcttct 600
tgcggccatg aagaaccaca tcaccaacgt tgtgacccac tacaagggac agtgctacgc 660
ttgggatgtt gtcaacgaag gtacgtttcg attcggcttc cctcggaccg tatctgcagg 720
caaaaaggtc aatcaattga caatcgtgat ccccagctct caacgatgat ggcacctacc 780
gatccaatgt cttctatcag tacatcggcg aggcatacat tcccattgcc tttgcgaccg 840
ctgccgccgc cgatccaaac gcgaagctct actacaacga ctacaacatt gagtaccccg 900
gcgccaaggc caccgccgcc cagaacatcg tcaagatggt caaggcttac ggcgcgaaaa 960
tcgacggtgt cggtctgcaa tctcacttca tcgttggcag cacccctagc cagagctccc 1020
agcagagcaa catggctgct ttcaccgcgc tcggcgtcga ggtcgccatc accgaactgg 1080
atatccgcat gacgttgcct tccaccagtg ctctcttggc ccagcaatcc accgattacc 1140
agagcactgt gtcggcttgc gtgaacactc cgaagtgcat tggtatcacc ctctgggact 1200
ggaccgacaa gtactcctgg gttcccaaca ccttctccgg ccaaggtgac gcctgcccct 1260
gggattctaa ctaccagaag aagcctgcct actacggtat cttgactgcg ctcggaggca 1320
gcgcttccac ctccaccacc accactctgg tgacctccac caggacttcg actacgacca 1380
gcacttcggc cacctccacg tctactggcg ttgctcagca ctggggccag tgcggtggta 1440
tcggctggac agggccgact acctgcgcta gcccctacac ctgccaggaa ctgaatccct 1500
actactacca gtgcctgtaa 1520
<210> 10
<211> 405
<212> PRT
<213> Talaromyces leycettanus
<400> 10
Met Val His Leu Ser Ser Leu Ala Leu Ala Leu Ala Ala Gly Ser Gln
1 5 10 15
Leu Ala Gln Ala Ala Gly Leu Asn Thr Ala Ala Lys Ala Ile Gly Lys
20 25 30
Leu Tyr Phe Gly Thr Ala Thr Asp Asn Pro Glu Leu Ser Asp Ser Thr
35 40 45
Tyr Met Gln Glu Thr Asp Asn Thr Asp Asp Phe Gly Gln Leu Thr Pro
50 55 60
Ala Asn Ser Met Lys Trp Asp Ala Thr Glu Pro Ser Gln Asn Thr Phe
65 70 75 80
Thr Phe Thr Asn Gly Asp Gln Ile Ala Asn Leu Ala Lys Ser Asn Gly
85 90 95
Gln Met Leu Arg Cys His Asn Leu Val Trp Tyr Asn Gln Leu Pro Ser
100 105 110
Trp Val Thr Ser Gly Ser Trp Thr Asn Ala Thr Leu Leu Ala Ala Met
115 120 125
Lys Asn His Ile Thr Asn Val Val Thr His Tyr Lys Gly Gln Cys Tyr
130 135 140
Ala Trp Asp Val Val Asn Glu Ala Leu Asn Asp Asp Gly Thr Tyr Arg
145 150 155 160
Ser Asn Val Phe Tyr Gln Tyr Ile Gly Glu Ala Tyr Ile Pro Ile Ala
165 170 175
Phe Ala Thr Ala Ala Ala Ala Asp Pro Asn Ala Lys Leu Tyr Tyr Asn
180 185 190
Asp Tyr Asn Ile Glu Tyr Pro Gly Ala Lys Ala Thr Ala Ala Gln Asn
195 200 205
Ile Val Lys Met Val Lys Ala Tyr Gly Ala Lys Ile Asp Gly Val Gly
210 215 220
Leu Gln Ser His Phe Ile Val Gly Ser Thr Pro Ser Gln Ser Ser Gln
225 230 235 240
Gln Ser Asn Met Ala Ala Phe Thr Ala Leu Gly Val Glu Val Ala Ile
245 250 255
Thr Glu Leu Asp Ile Arg Met Thr Leu Pro Ser Thr Ser Ala Leu Leu
260 265 270
Ala Gln Gln Ser Thr Asp Tyr Gln Ser Thr Val Ser Ala Cys Val Asn
275 280 285
Thr Pro Lys Cys Ile Gly Ile Thr Leu Trp Asp Trp Thr Asp Lys Tyr
290 295 300
Ser Trp Val Pro Asn Thr Phe Ser Gly Gln Gly Asp Ala Cys Pro Trp
305 310 315 320
Asp Ser Asn Tyr Gln Lys Lys Pro Ala Tyr Tyr Gly Ile Leu Thr Ala
325 330 335
Leu Gly Gly Ser Ala Ser Thr Ser Thr Thr Thr Thr Leu Val Thr Ser
340 345 350
Thr Arg Thr Ser Thr Thr Thr Ser Thr Ser Ala Thr Ser Thr Ser Thr
355 360 365
Gly Val Ala Gln His Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly
370 375 380
Pro Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Glu Leu Asn Pro Tyr
385 390 395 400
Tyr Tyr Gln Cys Leu
405
<210> 11
<211> 1197
<212> DNA
<213> 褐孢长毛盘菌
<400> 11
atgcgtacct tctcgtctct tctcggtgtt gcccttctct tgggtgcagc taatgcccag 60
gtcgcggttt ggggacagtg tggtggcatt ggttactctg gctcgacaac ctgcgctgcg 120
ggaacgactt gtgttaagct gaacgactac tactcccaat gccaacccgg cggtaccact 180
ttgacaacca ccaccaaacc cgccaccact accactacca ccacggcaac ttctccctca 240
tcttctcccg gattaaatgc cctggcacaa aagagcggcc ggtacttcgg tagtgcaact 300
gacaacccag agctctccga tgcggcatac attgccatcc tgagcaacaa aaacgagttt 360
gggatcatca cgcctggaaa ctcgatgaaa tgggatgcta ctgaaccgtc ccgcgggagt 420
ttctcgttca ctggtggaca gcaaattgtt gattttgcgc agggcaatgg gcaggctatc 480
agaggccata ctcttgtctg gtactcccag ttgccgtcct gggttactag cggaaacttc 540
gataaagcta cattgacatc gatcatgcaa aatcacatta caactcttgt cagccactgg 600
aagggccagc tcgcctactg ggatgttgtc aacgaagcat tcaacgatga tggcactttc 660
cgtcaaaacg tgttctacac aaccattgga gaggactaca tccagctcgc cttcgaagcc 720
gcccgtgccg ccgacccgac cgcaaagctc tgcatcaacg actacaacat cgagggcact 780
ggagccaagt caacagccat gtacaatctc gtctcgaagc tgaaatccgc cggcgttccc 840
atcgactgta ttggtgttca gggacacctc atcgtcggtg aagttcccac caccatccaa 900
gcaaaccttg cccagtttgc gtctttgggt gtggatgtcg cgatcacgga gctagatatc 960
agaatgacgc tgccatctac gactgcattg ctccagcagc aggctaagga ttacgtctcg 1020
gttgttacag cctgcatgaa tgttcccagg tgtatcggta tcaccatctg ggactacact 1080
gataaatact cttgggtgcc acaaaccttc agcggccagg gcgatgcttg cccatgggat 1140
gccaacctgc agaagaagcc agcctactcc gctattgcgt ctgctcttgc ggcttga 1197
<210> 12
<211> 398
<212> PRT
<213> 褐孢长毛盘菌
<400> 12
Met Arg Thr Phe Ser Ser Leu Leu Gly Val Ala Leu Leu Leu Gly Ala
1 5 10 15
Ala Asn Ala Gln Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Tyr
20 25 30
Ser Gly Ser Thr Thr Cys Ala Ala Gly Thr Thr Cys Val Lys Leu Asn
35 40 45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Gly Thr Thr Leu Thr Thr Thr
50 55 60
Thr Lys Pro Ala Thr Thr Thr Thr Thr Thr Thr Ala Thr Ser Pro Ser
65 70 75 80
Ser Ser Pro Gly Leu Asn Ala Leu Ala Gln Lys Ser Gly Arg Tyr Phe
85 90 95
Gly Ser Ala Thr Asp Asn Pro Glu Leu Ser Asp Ala Ala Tyr Ile Ala
100 105 110
Ile Leu Ser Asn Lys Asn Glu Phe Gly Ile Ile Thr Pro Gly Asn Ser
115 120 125
Met Lys Trp Asp Ala Thr Glu Pro Ser Arg Gly Ser Phe Ser Phe Thr
130 135 140
Gly Gly Gln Gln Ile Val Asp Phe Ala Gln Gly Asn Gly Gln Ala Ile
145 150 155 160
Arg Gly His Thr Leu Val Trp Tyr Ser Gln Leu Pro Ser Trp Val Thr
165 170 175
Ser Gly Asn Phe Asp Lys Ala Thr Leu Thr Ser Ile Met Gln Asn His
180 185 190
Ile Thr Thr Leu Val Ser His Trp Lys Gly Gln Leu Ala Tyr Trp Asp
195 200 205
Val Val Asn Glu Ala Phe Asn Asp Asp Gly Thr Phe Arg Gln Asn Val
210 215 220
Phe Tyr Thr Thr Ile Gly Glu Asp Tyr Ile Gln Leu Ala Phe Glu Ala
225 230 235 240
Ala Arg Ala Ala Asp Pro Thr Ala Lys Leu Cys Ile Asn Asp Tyr Asn
245 250 255
Ile Glu Gly Thr Gly Ala Lys Ser Thr Ala Met Tyr Asn Leu Val Ser
260 265 270
Lys Leu Lys Ser Ala Gly Val Pro Ile Asp Cys Ile Gly Val Gln Gly
275 280 285
His Leu Ile Val Gly Glu Val Pro Thr Thr Ile Gln Ala Asn Leu Ala
290 295 300
Gln Phe Ala Ser Leu Gly Val Asp Val Ala Ile Thr Glu Leu Asp Ile
305 310 315 320
Arg Met Thr Leu Pro Ser Thr Thr Ala Leu Leu Gln Gln Gln Ala Lys
325 330 335
Asp Tyr Val Ser Val Val Thr Ala Cys Met Asn Val Pro Arg Cys Ile
340 345 350
Gly Ile Thr Ile Trp Asp Tyr Thr Asp Lys Tyr Ser Trp Val Pro Gln
355 360 365
Thr Phe Ser Gly Gln Gly Asp Ala Cys Pro Trp Asp Ala Asn Leu Gln
370 375 380
Lys Lys Pro Ala Tyr Ser Ala Ile Ala Ser Ala Leu Ala Ala
385 390 395
<210> 13
<211> 2391
<212> DNA
<213> 埃默森篮状菌
<400> 13
atgatgactc ccacggcgat tctcaccgca gtggcggcgc tcctgcccac cgcgacatgg 60
gcacaggata accaaaccta tgccaattac tcgtcgcagt ctcagccgga cctgtttccc 120
cggaccgtcg cgaccatcga cctgtccttc cccgactgtg agaatggccc gctcagcacg 180
aacctggtgt gcaacaaatc ggccgatccc tgggcccgag ctgaggccct catctcgctc 240
tttaccctcg aagagctgat taacaacacc cagaacaccg ctcctggcgt gccccgtttg 300
ggtctgcccc agtatcaggt gtggaatgaa gctctgcacg gactggaccg cgccaatttc 360
tcccattcgg gcgaatacag ctgggccacg tccttcccca tgcccatcct gtcgatggcg 420
tccttcaacc ggaccctcat caaccagatt gcctccatca ttgcaacgca agcccgtgcc 480
ttcaacaacg ccggccgtta cggccttgac agctatgcgc ccaacatcaa tggcttccgc 540
agtcccctct ggggccgtgg acaggagacg cctggtgagg atgcgttctt cttgagttcc 600
acctatgcgt acgagtacat cacaggcctg cagggcggtg tcgacccaga gcatgtcaag 660
atcgtcgcga cggcgaagca cttcgccggc tatgatctgg agaactgggg caacgtctct 720
cggctggggt tcaatgctat catcacgcag caggatctct ccgagtacta cacccctcag 780
ttcctggcgt ctgctcgata cgccaagacg cgcagcatca tgtgctccta caatgcagtg 840
aatggagtcc caagctgtgc caactccttc ttcctccaga cgcttctccg agaaaacttt 900
gacttcgttg acgacgggta cgtctcgtcg gattgcgacg ccgtctacaa cgtcttcaac 960
ccacacggtt acgcccttaa ccagtcggga gccgctgcgg actcgctcct agcaggtacc 1020
gatatcgact gtggtcagac cttgccgtgg cacctgaatg agtccttcgt agaaggatac 1080
gtctcccgcg gtgatatcga gaaatccctc acccgtctct actcaaacct ggtgcgtctc 1140
ggctactttg acggcaacaa cagcgagtac cgcaacctca actggaacga cgtcgtgact 1200
acggacgcct ggaacatctc gtacgaggcc gcggtggaag gtatcaccct gctcaagaac 1260
gacggaacgc tgccgctgtc caagaaggtc cgcagcattg cgctcatcgg tccttgggcc 1320
aatgccacgg tgcagatgca gggtaactac tatggaacgc caccgtatct gatcagtccg 1380
ctggaagccg ccaaggccag tgggttcacg gtcaactatg cattcggtac caacatctcg 1440
accgattcta cccagtggtt cgcggaagcc atcgcggcgg cgaagaagtc ggacgtgatc 1500
atctacgccg gtggtattga caacacgatc gaggcagagg gacaggaccg cacggatctc 1560
aagtggccgg ggaaccagct ggatctgatc gagcagctca gccaggtggg caagcccttg 1620
gtcgtcctgc agatgggcgg tggccaggtg gattcgtcgt cactcaaggc caacaagaat 1680
gtcaacgctc tggtgtgggg tggctatccc ggacagtcgg gtggtgcggc cctgtttgac 1740
atccttacgg gcaagcgtgc gccggccggt cgtctggtga gcacgcagta cccggccgag 1800
tatgcgacgc agttcccggc caacgacatg aacctgcgtc cgaacggcag caacccggga 1860
cagacataca tctggtacac gggcacgccc gtgtatgagt tcggccacgg tctgttctac 1920
acggagttcc aggagtcggc tgcggcgggc acgaacaaga cgtcgacttt cgacattctg 1980
gaccttttct ccacccctca tccgggatac gagtacatcg agcaggttcc gttcatcaac 2040
gtgactgtgg acgtgaagaa cgtcggccac acgccatcgc cgtacacggg tctgttgttc 2100
gcgaacacga cagccgggcc caagccgtac ccgaacaaat ggctcgtcgg gttcgactgg 2160
ctgccgacga tccagccggg cgagactgcc aagttgacga tcccggtgcc gttgggcgcg 2220
attgcgtggg cggacgagaa cggcaacaag gtggtcttcc cgggcaacta cgaattggca 2280
ctgaacaatg agcgatcggt agtggtgtcg ttcacgctga cgggcgatgc ggcgactcta 2340
gagaaatggc ctttgtggga gcaggcggtt ccgggggtgc tgcagcaata a 2391
<210> 14
<211> 796
<212> PRT
<213> 埃默森篮状菌
<400> 14
Met Met Thr Pro Thr Ala Ile Leu Thr Ala Val Ala Ala Leu Leu Pro
1 5 10 15
Thr Ala Thr Trp Ala Gln Asp Asn Gln Thr Tyr Ala Asn Tyr Ser Ser
20 25 30
Gln Ser Gln Pro Asp Leu Phe Pro Arg Thr Val Ala Thr Ile Asp Leu
35 40 45
Ser Phe Pro Asp Cys Glu Asn Gly Pro Leu Ser Thr Asn Leu Val Cys
50 55 60
Asn Lys Ser Ala Asp Pro Trp Ala Arg Ala Glu Ala Leu Ile Ser Leu
65 70 75 80
Phe Thr Leu Glu Glu Leu Ile Asn Asn Thr Gln Asn Thr Ala Pro Gly
85 90 95
Val Pro Arg Leu Gly Leu Pro Gln Tyr Gln Val Trp Asn Glu Ala Leu
100 105 110
His Gly Leu Asp Arg Ala Asn Phe Ser His Ser Gly Glu Tyr Ser Trp
115 120 125
Ala Thr Ser Phe Pro Met Pro Ile Leu Ser Met Ala Ser Phe Asn Arg
130 135 140
Thr Leu Ile Asn Gln Ile Ala Ser Ile Ile Ala Thr Gln Ala Arg Ala
145 150 155 160
Phe Asn Asn Ala Gly Arg Tyr Gly Leu Asp Ser Tyr Ala Pro Asn Ile
165 170 175
Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly
180 185 190
Glu Asp Ala Phe Phe Leu Ser Ser Thr Tyr Ala Tyr Glu Tyr Ile Thr
195 200 205
Gly Leu Gln Gly Gly Val Asp Pro Glu His Val Lys Ile Val Ala Thr
210 215 220
Ala Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Gly Asn Val Ser
225 230 235 240
Arg Leu Gly Phe Asn Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr
245 250 255
Tyr Thr Pro Gln Phe Leu Ala Ser Ala Arg Tyr Ala Lys Thr Arg Ser
260 265 270
Ile Met Cys Ser Tyr Asn Ala Val Asn Gly Val Pro Ser Cys Ala Asn
275 280 285
Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Asn Phe Asp Phe Val Asp
290 295 300
Asp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn
305 310 315 320
Pro His Gly Tyr Ala Leu Asn Gln Ser Gly Ala Ala Ala Asp Ser Leu
325 330 335
Leu Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Leu Pro Trp His Leu
340 345 350
Asn Glu Ser Phe Val Glu Gly Tyr Val Ser Arg Gly Asp Ile Glu Lys
355 360 365
Ser Leu Thr Arg Leu Tyr Ser Asn Leu Val Arg Leu Gly Tyr Phe Asp
370 375 380
Gly Asn Asn Ser Glu Tyr Arg Asn Leu Asn Trp Asn Asp Val Val Thr
385 390 395 400
Thr Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Thr
405 410 415
Leu Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser
420 425 430
Ile Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Val Gln Met Gln Gly
435 440 445
Asn Tyr Tyr Gly Thr Pro Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala
450 455 460
Lys Ala Ser Gly Phe Thr Val Asn Tyr Ala Phe Gly Thr Asn Ile Ser
465 470 475 480
Thr Asp Ser Thr Gln Trp Phe Ala Glu Ala Ile Ala Ala Ala Lys Lys
485 490 495
Ser Asp Val Ile Ile Tyr Ala Gly Gly Ile Asp Asn Thr Ile Glu Ala
500 505 510
Glu Gly Gln Asp Arg Thr Asp Leu Lys Trp Pro Gly Asn Gln Leu Asp
515 520 525
Leu Ile Glu Gln Leu Ser Gln Val Gly Lys Pro Leu Val Val Leu Gln
530 535 540
Met Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ala Asn Lys Asn
545 550 555 560
Val Asn Ala Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Ala
565 570 575
Ala Leu Phe Asp Ile Leu Thr Gly Lys Arg Ala Pro Ala Gly Arg Leu
580 585 590
Val Ser Thr Gln Tyr Pro Ala Glu Tyr Ala Thr Gln Phe Pro Ala Asn
595 600 605
Asp Met Asn Leu Arg Pro Asn Gly Ser Asn Pro Gly Gln Thr Tyr Ile
610 615 620
Trp Tyr Thr Gly Thr Pro Val Tyr Glu Phe Gly His Gly Leu Phe Tyr
625 630 635 640
Thr Glu Phe Gln Glu Ser Ala Ala Ala Gly Thr Asn Lys Thr Ser Thr
645 650 655
Phe Asp Ile Leu Asp Leu Phe Ser Thr Pro His Pro Gly Tyr Glu Tyr
660 665 670
Ile Glu Gln Val Pro Phe Ile Asn Val Thr Val Asp Val Lys Asn Val
675 680 685
Gly His Thr Pro Ser Pro Tyr Thr Gly Leu Leu Phe Ala Asn Thr Thr
690 695 700
Ala Gly Pro Lys Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Trp
705 710 715 720
Leu Pro Thr Ile Gln Pro Gly Glu Thr Ala Lys Leu Thr Ile Pro Val
725 730 735
Pro Leu Gly Ala Ile Ala Trp Ala Asp Glu Asn Gly Asn Lys Val Val
740 745 750
Phe Pro Gly Asn Tyr Glu Leu Ala Leu Asn Asn Glu Arg Ser Val Val
755 760 765
Val Ser Phe Thr Leu Thr Gly Asp Ala Ala Thr Leu Glu Lys Trp Pro
770 775 780
Leu Trp Glu Gln Ala Val Pro Gly Val Leu Gln Gln
785 790 795
<210> 15
<211> 1507
<212> DNA
<213> 里氏木霉
<400> 15
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag gtgagcctga 780
tgccactact acccctttcc tggcgctctc gcggttttcc atgctgacat ggttttccag 840
ctactacggc cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt 900
caacacggac aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca 960
aaacggcgtc gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc 1020
cgcctcagcc tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct 1080
cgtgttcagc atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc 1140
cggcccctgc agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac 1200
gcacgtcgtc ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc 1260
gcccccgccc ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac 1320
ttcgagcagc ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag 1380
cgggtgcaag acgtgcacgt cgggcactac gtgccagtat agcaacgact gttcgtatcc 1440
ccatgcctga cgggagtgat tttgagatgc taaccgctaa aatacagact actcgcaatg 1500
cctttag 1507
<210> 16
<211> 459
<212> PRT
<213> 里氏木霉
<400> 16
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210> 17
<211> 1507
<212> DNA
<213> 里氏木霉
<400> 17
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag gtgagcctga 780
tgccactact acccctttcc tggcgctctc gcggttttcc atgctgacat ggttttccag 840
ctactacggc cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt 900
caacacggac aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca 960
aaacggcgtc gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc 1020
cgcctcagcc tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct 1080
cgtgttcagc atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc 1140
cggcccctgc agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac 1200
gcacgtcgtc ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc 1260
gcccccgccc ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac 1320
ttcgagcagc ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag 1380
cgggtgcaag acgtgcacgt cgggcactac gtgccagtat agcaacgact gttcgtatcc 1440
ccatgcctga cgggagtgat tttgagatgc taaccgctaa aatacagact actcgcaatg 1500
cctttag 1507
<210> 18
<211> 418
<212> PRT
<213> 里氏木霉
<400> 18
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Ala Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Asp
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Gly
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
<210> 19
<211> 1545
<212> DNA
<213> 里氏木霉
<400> 19
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tgtaa 1545
<210> 20
<211> 514
<212> PRT
<213> 里氏木霉
<400> 20
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210> 21
<211> 1611
<212> DNA
<213> 里氏木霉
<400> 21
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60
ctagaggagc ggcaagcttg ctcaagcgtc tggtaattat gtgaaccctc tcaagagacc 120
caaatactga gatatgtcaa ggggccaatg tggtggccag aattggtcgg gtccgacttg 180
ctgtgcttcc ggaagcacat gcgtctactc caacgactat tactcccagt gtcttcccgg 240
cgctgcaagc tcaagctcgt ccacgcgcgc cgcgtcgacg acttctcgag tatcccccac 300
aacatcccgg tcgagctccg cgacgcctcc acctggttct actactacca gagtacctcc 360
agtcggatcg ggaaccgcta cgtattcagg caaccctttt gttggggtca ctccttgggc 420
caatgcatat tacgcctctg aagttagcag cctcgctatt cctagcttga ctggagccat 480
ggccactgct gcagcagctg tcgcaaaggt tccctctttt atgtggctgt aggtcctccc 540
ggaaccaagg caatctgtta ctgaaggctc atcattcact gcagagatac tcttgacaag 600
acccctctca tggagcaaac cttggccgac atccgcaccg ccaacaagaa tggcggtaac 660
tatgccggac agtttgtggt gtatgacttg ccggatcgcg attgcgctgc ccttgcctcg 720
aatggcgaat actctattgc cgatggtggc gtcgccaaat ataagaacta tatcgacacc 780
attcgtcaaa ttgtcgtgga atattccgat atccggaccc tcctggttat tggtatgagt 840
ttaaacacct gcctcccccc ccccttccct tcctttcccg ccggcatctt gtcgttgtgc 900
taactattgt tccctcttcc agagcctgac tctcttgcca acctggtgac caacctcggt 960
actccaaagt gtgccaatgc tcagtcagcc taccttgagt gcatcaacta cgccgtcaca 1020
cagctgaacc ttccaaatgt tgcgatgtat ttggacgctg gccatgcagg atggcttggc 1080
tggccggcaa accaagaccc ggccgctcag ctatttgcaa atgtttacaa gaatgcatcg 1140
tctccgagag ctcttcgcgg attggcaacc aatgtcgcca actacaacgg gtggaacatt 1200
accagccccc catcgtacac gcaaggcaac gctgtctaca acgagaagct gtacatccac 1260
gctattggac gtcttcttgc caatcacggc tggtccaacg ccttcttcat cactgatcaa 1320
ggtcgatcgg gaaagcagcc taccggacag caacagtggg gagactggtg caatgtgatc 1380
ggcaccggat ttggtattcg cccatccgca aacactgggg actcgttgct ggattcgttt 1440
gtctgggtca agccaggcgg cgagtgtgac ggcaccagcg acagcagtgc gccacgattt 1500
gactcccact gtgcgctccc agatgccttg caaccggcgc ctcaagctgg tgcttggttc 1560
caagcctact ttgtgcagct tctcacaaac gcaaacccat cgttcctgta a 1611
<210> 22
<211> 471
<212> PRT
<213> 里氏木霉
<400> 22
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Arg Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210> 23
<211> 2615
<212> DNA
<213> 里氏木霉
<400> 23
atgggatttg gccgcaatgc tgccgagccc gagtgtttct gcaacgttat ccaggagatt 60
tgcgcttgcc caagagggag ttgacgggga gagtcccaac tggttccttc agtaacgcca 120
ccctggcaga ctatataact tgtggacaag actctgcttt gttgagttct tcctaccagt 180
cttgaccaag accattctgt tgagcccaat cagaaatgcg ttaccgaaca gcagctgcgc 240
tggcacttgc cactgggccc tttgctaggg cagacagtca gtatagctgg tccatactgg 300
gatgtatatg tatcctggag acaccatgct gactcttgaa tcaaggtagc tcaacatcgg 360
gggcctcggc tgaggcagtt gtacctcctg cagggactcc atggggaacc gcgtacgaca 420
aggcgaaggc cgcattggca aagctcaatc tccaagataa ggtcggcatc gtgagcggtg 480
tcggctggaa cggcggtcct tgcgttggaa acacatctcc ggcctccaag atcagctatc 540
catcgctatg ccttcaagac ggacccctcg gtgttcgata ctcgacaggc agcacagcct 600
ttacgccggg cgttcaagcg gcctcgacgt gggatgtcaa tttgatccgc gaacgtggac 660
agttcatcgg tgaggaggtg aaggcctcgg ggattcatgt catacttggt cctgtggctg 720
ggccgctggg aaagactccg cagggcggtc gcaactggga gggcttcggt gtcgatccat 780
atctcacggg cattgccatg ggtcaaacca tcaacggcat ccagtcggta ggcgtgcagg 840
cgacagcgaa gcactatatc ctcaacgagc aggagctcaa tcgagaaacc atttcgagca 900
acccagatga ccgaactctc catgagctgt atacttggcc atttgccgac gcggttcagg 960
ccaatgtcgc ttctgtcatg tgctcgtaca acaaggtcaa taccacctgg gcctgcgagg 1020
atcagtacac gctgcagact gtgctgaaag accagctggg gttcccaggc tatgtcatga 1080
cggactggaa cgcacagcac acgactgtcc aaagcgcgaa ttctgggctt gacatgtcaa 1140
tgcctggcac agacttcaac ggtaacaatc ggctctgggg tccagctctc accaatgcgg 1200
taaatagcaa tcaggtcccc acgagcagag tcgacgatat ggtgactcgt atcctcgccg 1260
catggtactt gacaggccag gaccaggcag gctatccgtc gttcaacatc agcagaaatg 1320
ttcaaggaaa ccacaagacc aatgtcaggg caattgccag ggacggcatc gttctgctca 1380
agaatgacgc caacatcctg ccgctcaaga agcccgctag cattgccgtc gttggatctg 1440
ccgcaatcat tggtaaccac gccagaaact cgccctcgtg caacgacaaa ggctgcgacg 1500
acggggcctt gggcatgggt tggggttccg gcgccgtcaa ctatccgtac ttcgtcgcgc 1560
cctacgatgc catcaatacc agagcgtctt cgcagggcac ccaggttacc ttgagcaaca 1620
ccgacaacac gtcctcaggc gcatctgcag caagaggaaa ggacgtcgcc atcgtcttca 1680
tcaccgccga ctcgggtgaa ggctacatca ccgtggaggg caacgcgggc gatcgcaaca 1740
acctggatcc gtggcacaac ggcaatgccc tggtccaggc ggtggccggt gccaacagca 1800
acgtcattgt tgttgtccac tccgttggcg ccatcattct ggagcagatt cttgctcttc 1860
cgcaggtcaa ggccgttgtc tgggcgggtc ttccttctca ggagagcggc aatgcgctcg 1920
tcgacgtgct gtggggagat gtcagccctt ctggcaagct ggtgtacacc attgcgaaga 1980
gccccaatga ctataacact cgcatcgttt ccggcggcag tgacagcttc agcgagggac 2040
tgttcatcga ctataagcac ttcgacgacg ccaatatcac gccgcggtac gagttcggct 2100
atggactgtg taagtttgct aacctgaaca atctattaga caggttgact gacggatgac 2160
tgtggaatga tagcttacac caagttcaac tactcacgcc tctccgtctt gtcgaccgcc 2220
aagtctggtc ctgcgactgg ggccgttgtg ccgggaggcc cgagtgatct gttccagaat 2280
gtcgcgacag tcaccgttga catcgcaaac tctggccaag tgactggtgc cgaggtagcc 2340
cagctgtaca tcacctaccc atcttcagca cccaggaccc ctccgaagca gctgcgaggc 2400
tttgccaagc tgaacctcac gcctggtcag agcggaacag caacgttcaa catccgacga 2460
cgagatctca gctactggga cacggcttcg cagaaatggg tggtgccgtc ggggtcgttt 2520
ggcatcagcg tgggagcgag cagccgggat atcaggctga cgagcactct gtcggtagcg 2580
tagcgcgagg agggtgaagg cggttgacct gtgac 2615
<210> 24
<211> 744
<212> PRT
<213> 里氏木霉
<400> 24
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
210 215 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210> 25
<211> 752
<212> DNA
<213> 里氏木霉
<400> 25
atggttgcct tttccagcct catctgcgct ctcaccagca tcgccagtac tctggcgatg 60
cccacaggcc tcgagcctga gagcagtgtc aacgtcacag agcgtggcat gtacgacttt 120
gttcttggag ctcacaatga tcatcgccgt cgtgctagca tcaactacga ccaaaactac 180
caaactggcg gacaagtcag ctattcgcct tccaacactg gcttctcagt gaactggaac 240
actcaagatg actttgttgt gggcgttggt tggacgactg gatcttctgc gtaggaggac 300
tcctcatcat tctgcacttt gaaagcatct tctgaccaaa agcttctctt agtcccatca 360
actttggcgg ctcttttagt gtcaacagcg gaactggcct gctttccgtc tatggctgga 420
gcaccaaccc actggttgag tactacatca tggaggacaa ccacaactac ccagcacagg 480
gtaccgtcaa gggaaccgtc accagcgacg gagccactta caccatctgg gagaataccc 540
gtgtcaacga gccttccatc cagggcacag cgaccttcaa ccagtacatt tccgtgcgga 600
actcgcccag gaccagcgga actgttactg tgcagaacca cttcaatgct tgggcctcgc 660
ttggcctgca ccttgggcag atgaactacc aggttgtcgc tgtcgaaggc tggggtggta 720
gtggttctgc ctcacagagt gtcagcaact ag 752
<210> 26
<211> 229
<212> PRT
<213> 里氏木霉
<400> 26
Met Val Ala Phe Ser Ser Leu Ile Cys Ala Leu Thr Ser Ile Ala Ser
1 5 10 15
Thr Leu Ala Met Pro Thr Gly Leu Glu Pro Glu Ser Ser Val Asn Val
20 25 30
Thr Glu Arg Gly Met Tyr Asp Phe Val Leu Gly Ala His Asn Asp His
35 40 45
Arg Arg Arg Ala Ser Ile Asn Tyr Asp Gln Asn Tyr Gln Thr Gly Gly
50 55 60
Gln Val Ser Tyr Ser Pro Ser Asn Thr Gly Phe Ser Val Asn Trp Asn
65 70 75 80
Thr Gln Asp Asp Phe Val Val Gly Val Gly Trp Thr Thr Gly Ser Ser
85 90 95
Ala Pro Ile Asn Phe Gly Gly Ser Phe Ser Val Asn Ser Gly Thr Gly
100 105 110
Leu Leu Ser Val Tyr Gly Trp Ser Thr Asn Pro Leu Val Glu Tyr Tyr
115 120 125
Ile Met Glu Asp Asn His Asn Tyr Pro Ala Gln Gly Thr Val Lys Gly
130 135 140
Thr Val Thr Ser Asp Gly Ala Thr Tyr Thr Ile Trp Glu Asn Thr Arg
145 150 155 160
Val Asn Glu Pro Ser Ile Gln Gly Thr Ala Thr Phe Asn Gln Tyr Ile
165 170 175
Ser Val Arg Asn Ser Pro Arg Thr Ser Gly Thr Val Thr Val Gln Asn
180 185 190
His Phe Asn Ala Trp Ala Ser Leu Gly Leu His Leu Gly Gln Met Asn
195 200 205
Tyr Gln Val Val Ala Val Glu Gly Trp Gly Gly Ser Gly Ser Ala Ser
210 215 220
Gln Ser Val Ser Asn
225
<210> 27
<211> 796
<212> DNA
<213> 里氏木霉
<400> 27
caagaagaca tcaacatggt ctccttcacc tccctcctcg ccggcgtcgc cgccatctcg 60
ggcgtcttgg ccgctcccgc cgccgaggtc gaatccgtgg ctgtggagaa gcgccagacg 120
attcagcccg gcacgggcta caacaacggc tacttctact cgtactggaa cgatggccac 180
ggcggcgtga cgtacaccaa tggtcccggc gggcagttct ccgtcaactg gtccaactcg 240
ggcaactttg tcggcggcaa gggatggcag cccggcacca agaacaagta agactaccta 300
ctcttacccc ctttgaccaa cacagcacaa cacaatacaa cacatgtgac taccaatcat 360
ggaatcggat ctaacagctg tgttttcaaa aaaaagggtc atcaacttct cgggcagcta 420
caaccccaac ggcaacagct acctctccgt gtacggctgg tcccgcaacc ccctgatcga 480
gtactacatc gtcgagaact ttggcaccta caacccgtcc acgggcgcca ccaagctggg 540
cgaggtcacc tccgacggca gcgtctacga catttaccgc acgcagcgcg tcaaccagcc 600
gtccatcatc ggcaccgcca ccttttacca gtactggtcc gtccgccgca accaccgctc 660
gagcggctcc gtcaacacgg cgaaccactt caacgcgtgg gctcagcaag gcctgacgct 720
cgggacgatg gattaccaga ttgttgccgt ggagggttac tttagctctg gctctgcttc 780
catcaccgtc agctaa 796
<210> 28
<211> 223
<212> PRT
<213> 里氏木霉
<400> 28
Met Val Ser Phe Thr Ser Leu Leu Ala Gly Val Ala Ala Ile Ser Gly
1 5 10 15
Val Leu Ala Ala Pro Ala Ala Glu Val Glu Ser Val Ala Val Glu Lys
20 25 30
Arg Gln Thr Ile Gln Pro Gly Thr Gly Tyr Asn Asn Gly Tyr Phe Tyr
35 40 45
Ser Tyr Trp Asn Asp Gly His Gly Gly Val Thr Tyr Thr Asn Gly Pro
50 55 60
Gly Gly Gln Phe Ser Val Asn Trp Ser Asn Ser Gly Asn Phe Val Gly
65 70 75 80
Gly Lys Gly Trp Gln Pro Gly Thr Lys Asn Lys Val Ile Asn Phe Ser
85 90 95
Gly Ser Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ser Val Tyr Gly Trp
100 105 110
Ser Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Phe Gly Thr
115 120 125
Tyr Asn Pro Ser Thr Gly Ala Thr Lys Leu Gly Glu Val Thr Ser Asp
130 135 140
Gly Ser Val Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser
145 150 155 160
Ile Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Arg Asn
165 170 175
His Arg Ser Ser Gly Ser Val Asn Thr Ala Asn His Phe Asn Ala Trp
180 185 190
Ala Gln Gln Gly Leu Thr Leu Gly Thr Met Asp Tyr Gln Ile Val Ala
195 200 205
Val Glu Gly Tyr Phe Ser Ser Gly Ser Ala Ser Ile Thr Val Ser
210 215 220
<210> 29
<211> 1352
<212> DNA
<213> 里氏木霉
<400> 29
atgaaagcaa acgtcatctt gtgcctcctg gcccccctgg tcgccgctct ccccaccgaa 60
accatccacc tcgaccccga gctcgccgct ctccgcgcca acctcaccga gcgaacagcc 120
gacctctggg accgccaagc ctctcaaagc atcgaccagc tcatcaagag aaaaggcaag 180
ctctactttg gcaccgccac cgaccgcggc ctcctccaac gggaaaagaa cgcggccatc 240
atccaggcag acctcggcca ggtgacgccg gagaacagca tgaagtggca gtcgctcgag 300
aacaaccaag gccagctgaa ctggggagac gccgactatc tcgtcaactt tgcccagcaa 360
aacggcaagt cgatacgcgg ccacactctg atctggcact cgcagctgcc tgcgtgggtg 420
aacaatatca acaacgcgga tactctgcgg caagtcatcc gcacccatgt ctctactgtg 480
gttgggcggt acaagggcaa gattcgtgct tgggtgagtt ttgaacacca catgcccctt 540
ttcttagtcc gctcctcctc ctcttggaac ttctcacagt tatagccgta tacaacattc 600
gacaggaaat ttaggatgac aactactgac tgacttgtgt gtgtgatggc gataggacgt 660
ggtcaatgaa atcttcaacg aggatggaac gctgcgctct tcagtctttt ccaggctcct 720
cggcgaggag tttgtctcga ttgcctttcg tgctgctcga gatgctgacc cttctgcccg 780
tctttacatc aacgactaca atctcgaccg cgccaactat ggcaaggtca acgggttgaa 840
gacttacgtc tccaagtgga tctctcaagg agttcccatt gacggtattg gtgagccacg 900
acccctaaat gtcccccatt agagtctctt tctagagcca aggcttgaag ccattcaggg 960
actgacacga gagccttctc tacaggaagc cagtcccatc tcagcggcgg cggaggctct 1020
ggtacgctgg gtgcgctcca gcagctggca acggtacccg tcaccgagct ggccattacc 1080
gagctggaca ttcagggggc accgacgacg gattacaccc aagttgttca agcatgcctg 1140
agcgtctcca agtgcgtcgg catcaccgtg tggggcatca gtgacaaggt aagttgcttc 1200
ccctgtctgt gcttatcaac tgtaagcagc aacaactgat gctgtctgtc tttacctagg 1260
actcgtggcg tgccagcacc aaccctcttc tgtttgacgc aaacttcaac cccaagccgg 1320
catataacag cattgttggc atcttacaat ag 1352
<210> 30
<211> 347
<212> PRT
<213> 里氏木霉
<400> 30
Met Lys Ala Asn Val Ile Leu Cys Leu Leu Ala Pro Leu Val Ala Ala
1 5 10 15
Leu Pro Thr Glu Thr Ile His Leu Asp Pro Glu Leu Ala Ala Leu Arg
20 25 30
Ala Asn Leu Thr Glu Arg Thr Ala Asp Leu Trp Asp Arg Gln Ala Ser
35 40 45
Gln Ser Ile Asp Gln Leu Ile Lys Arg Lys Gly Lys Leu Tyr Phe Gly
50 55 60
Thr Ala Thr Asp Arg Gly Leu Leu Gln Arg Glu Lys Asn Ala Ala Ile
65 70 75 80
Ile Gln Ala Asp Leu Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp
85 90 95
Gln Ser Leu Glu Asn Asn Gln Gly Gln Leu Asn Trp Gly Asp Ala Asp
100 105 110
Tyr Leu Val Asn Phe Ala Gln Gln Asn Gly Lys Ser Ile Arg Gly His
115 120 125
Thr Leu Ile Trp His Ser Gln Leu Pro Ala Trp Val Asn Asn Ile Asn
130 135 140
Asn Ala Asp Thr Leu Arg Gln Val Ile Arg Thr His Val Ser Thr Val
145 150 155 160
Val Gly Arg Tyr Lys Gly Lys Ile Arg Ala Trp Asp Val Val Asn Glu
165 170 175
Ile Phe Asn Glu Asp Gly Thr Leu Arg Ser Ser Val Phe Ser Arg Leu
180 185 190
Leu Gly Glu Glu Phe Val Ser Ile Ala Phe Arg Ala Ala Arg Asp Ala
195 200 205
Asp Pro Ser Ala Arg Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Arg Ala
210 215 220
Asn Tyr Gly Lys Val Asn Gly Leu Lys Thr Tyr Val Ser Lys Trp Ile
225 230 235 240
Ser Gln Gly Val Pro Ile Asp Gly Ile Gly Ser Gln Ser His Leu Ser
245 250 255
Gly Gly Gly Gly Ser Gly Thr Leu Gly Ala Leu Gln Gln Leu Ala Thr
260 265 270
Val Pro Val Thr Glu Leu Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala
275 280 285
Pro Thr Thr Asp Tyr Thr Gln Val Val Gln Ala Cys Leu Ser Val Ser
290 295 300
Lys Cys Val Gly Ile Thr Val Trp Gly Ile Ser Asp Lys Asp Ser Trp
305 310 315 320
Arg Ala Ser Thr Asn Pro Leu Leu Phe Asp Ala Asn Phe Asn Pro Lys
325 330 335
Pro Ala Tyr Asn Ser Ile Val Gly Ile Leu Gln
340 345
<210> 31
<211> 2564
<212> DNA
<213> 里氏木霉
<400> 31
ggacagccgg acgcaatggt gaataacgca gctcttctcg ccgccctgtc ggctctcctg 60
cccacggccc tggcgcagaa caatcaaaca tacgccaact actctgctca gggccagcct 120
gatctctacc ccgagacact tgccacgctc acactctcgt tccccgactg cgaacatggc 180
cccctcaaga acaatctcgt ctgtgactca tcggccggct atgtagagcg agcccaggcc 240
ctcatctcgc tcttcaccct cgaggagctc attctcaaca cgcaaaactc gggccccggc 300
gtgcctcgcc tgggtcttcc gaactaccaa gtctggaatg aggctctgca cggcttggac 360
cgcgccaact tcgccaccaa gggcggccag ttcgaatggg cgacctcgtt ccccatgccc 420
atcctcacta cggcggccct caaccgcaca ttgatccacc agattgccga catcatctcg 480
acccaagctc gagcattcag caacagcggc cgttacggtc tcgacgtcta tgcgccaaac 540
gtcaatggct tccgaagccc cctctggggc cgtggccagg agacgcccgg cgaagacgcc 600
tttttcctca gctccgccta tacttacgag tacatcacgg gcatccaggg tggcgtcgac 660
cctgagcacc tcaaggttgc cgccacggtg aagcactttg ccggatacga cctcgagaac 720
tggaacaacc agtcccgtct cggtttcgac gccatcataa ctcagcagga cctctccgaa 780
tactacactc cccagttcct cgctgcggcc cgttatgcaa agtcacgcag cttgatgtgc 840
gcatacaact ccgtcaacgg cgtgcccagc tgtgccaaca gcttcttcct gcagacgctt 900
ttgcgcgaga gctggggctt ccccgaatgg ggatacgtct cgtccgattg cgatgccgtc 960
tacaacgttt tcaaccctca tgactacgcc agcaaccagt cgtcagccgc cgccagctca 1020
ctgcgagccg gcaccgatat cgactgcggt cagacttacc cgtggcacct caacgagtcc 1080
tttgtggccg gcgaagtctc ccgcggcgag atcgagcggt ccgtcacccg tctgtacgcc 1140
aacctcgtcc gtctcggata cttcgacaag aagaaccagt accgctcgct cggttggaag 1200
gatgtcgtca agactgatgc ctggaacatc tcgtacgagg ctgctgttga gggcatcgtc 1260
ctgctcaaga acgatggcac tctccctctg tccaagaagg tgcgcagcat tgctctgatc 1320
ggaccatggg ccaatgccac aacccaaatg caaggcaact actatggccc tgccccatac 1380
ctcatcagcc ctctggaagc tgctaagaag gccggctatc acgtcaactt tgaactcggc 1440
acagagatcg ccggcaacag caccactggc tttgccaagg ccattgctgc cgccaagaag 1500
tcggatgcca tcatctacct cggtggaatt gacaacacca ttgaacagga gggcgctgac 1560
cgcacggaca ttgcttggcc cggtaatcag ctggatctca tcaagcagct cagcgaggtc 1620
ggcaaacccc ttgtcgtcct gcaaatgggc ggtggtcagg tagactcatc ctcgctcaag 1680
agcaacaaga aggtcaactc cctcgtctgg ggcggatatc ccggccagtc gggaggcgtt 1740
gccctcttcg acattctctc tggcaagcgt gctcctgccg gccgactggt caccactcag 1800
tacccggctg agtatgttca ccaattcccc cagaatgaca tgaacctccg acccgatgga 1860
aagtcaaacc ctggacagac ttacatctgg tacaccggca aacccgtcta cgagtttggc 1920
agtggtctct tctacaccac cttcaaggag actctcgcca gccaccccaa gagcctcaag 1980
ttcaacacct catcgatcct ctctgctcct caccccggat acacttacag cgagcagatt 2040
cccgtcttca ccttcgaggc caacatcaag aactcgggca agacggagtc cccatatacg 2100
gccatgctgt ttgttcgcac aagcaacgct ggcccagccc cgtacccgaa caagtggctc 2160
gtcggattcg accgacttgc cgacatcaag cctggtcact cttccaagct cagcatcccc 2220
atccctgtca gtgctctcgc ccgtgttgat tctcacggaa accggattgt ataccccggc 2280
aagtatgagc tagccttgaa caccgacgag tctgtgaagc ttgagtttga gttggtggga 2340
gaagaggtaa cgattgagaa ctggccgttg gaggagcaac agatcaagga tgctacacct 2400
gacgcataag ggttttaatg atgttgttat gacaaacggg tagagtagtt aatgatggaa 2460
taggaagagg ccatagtttt ctgtttgcaa accatttttg ccattgcgaa aaaaaaaaaa 2520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 2564
<210> 32
<211> 780
<212> PRT
<213> 里氏木霉
<400> 32
Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro
1 5 10 15
Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln
20 25 30
Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser
35 40 45
Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp
50 55 60
Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe
65 70 75 80
Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val
85 90 95
Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His
100 105 110
Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp
115 120 125
Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg
130 135 140
Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala
145 150 155 160
Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val
165 170 175
Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly
180 185 190
Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr
195 200 205
Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr
210 215 220
Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser
225 230 235 240
Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr
245 250 255
Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser
260 265 270
Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn
275 280 285
Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu
290 295 300
Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn
305 310 315 320
Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu
325 330 335
Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu
340 345 350
Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg
355 360 365
Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp
370 375 380
Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr
385 390 395 400
Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu
405 410 415
Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile
420 425 430
Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn
435 440 445
Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys
450 455 460
Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly
465 470 475 480
Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser
485 490 495
Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu
500 505 510
Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu
515 520 525
Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met
530 535 540
Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val
545 550 555 560
Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala
565 570 575
Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val
580 585 590
Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp
595 600 605
Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile
610 615 620
Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr
625 630 635 640
Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe
645 650 655
Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser
660 665 670
Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly
675 680 685
Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn
690 695 700
Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg
705 710 715 720
Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile
725 730 735
Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val
740 745 750
Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys
755 760 765
Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile
770 775 780
<210> 33
<211> 2502
<212> DNA
<213> 金黄色嗜热子囊菌
<400> 33
atgcgcgcaa ttggacttct gccaggcatc atcggcattg ctggtgctgc ctgtccttac 60
atgacaggcg agctgccgcg ctccttcgcc gagaaccctc atgctatcaa ccgtcgtgct 120
gagggtggtg gtggtgccgc tgccgagacg gagaagttcc tgtctcagtt ctacctgaac 180
gacaacgaca ccttcatgac caccgatgtt ggcggtccaa ttgaggatca gaacagtctc 240
agcgctggtg acagaggtcc taccctgctg gaggacttca tcctccgtca aaagatccag 300
cgctttgacc atgagcgggt aggttgatct ttactttcgg ccttcttcga gcggggtgat 360
attaaaacag gtaataggtg cccgagcgtg ctgtccatgc ccgaggagcg ggagcgcatg 420
gcgtgttcac atcctacgca gactggtcca acatcactgc cgcttccttc ctgtctgctg 480
caggaaagga gacacctgtc tttgtccggt tctccactgt agcaggaagc agaggaagcg 540
cagacacggc gcgtgacgtg cacggtttcg cgacgaggtt ctacacggat gaagggaact 600
tcggtaggca actatcatgc tctctttaaa tgttctcgat ctgacagcca gcagacattg 660
tcggcaacaa catccctgtc ttcttcattc aagatgcgat ccagttcccc gacctgatcc 720
atgctgtcaa gcccagcccg aacaacgaga tccctcaggc cgcaaccgcc catgactctg 780
cctgggactt tttcagccag cagccgagct ctttgcatac tctgttctgg gctatggccg 840
gtcatggcat tcctcgttcc tacaggaaca tggatggctt cggcatccac accttccgct 900
ttgtgacgga cgatggagct tccaagctcg tcaagttcca ctggacgtcg ctgcagggca 960
aggcgagcct tgtgtgggaa gaggcacagg ccgtggctgg aaagaacgcg gactatcacc 1020
gccaggactt gtgggacgca atcgaggctg gaaggtaccc tgagtgggag gtaggctctc 1080
cctgctatgt atggatgtgc cagaagctta ataatggcct agctcggcgt gcaaatcatg 1140
gatgaggaag accagctgcg ctttggcttc gatctgttgg acccgaccaa gatcgttccc 1200
gaggaatacg tgcccatcac gaagctcgga aagatgcagc tcaaccgcaa cccgctgaac 1260
tacttcgccg agactgaaca gatcatggtc agttcgccac cgtgttcggt tgctcgttgc 1320
tgaagtgcta acttgcaaca gttccaaccg ggtcacgttg tccgtggcat tgatttcacc 1380
gaggaccctc tgctccaggg acgtctcttc tcttacctcg acacccagct caaccgccac 1440
ggaggtccga acttcgagca gatccccatc aaccggccac gcactccaat tcacaacaac 1500
aaccgtgacg gagccggtat gctagcccat gtattccttt ctttatgcat ttttatatga 1560
tgcgttctaa cggcaacagc gcaaatgtac atccccctga acaaggcggc gtacaccccc 1620
aacactctga acaacggctc ccccaagcag gccaaccaga cggtcggaaa gggcttcttc 1680
acgactccag gccggacggc aagcggcagg cttgtgcgcg ccgtcagctc aaccttcgcc 1740
gacgtctggt cgcagcctcg tctgttctac aactccctcg tgccggcgga gcagcagttc 1800
ctgatcaacg cgatccgctt tgagacggcc cacatcacga gcgacgtcgt gaagaacaac 1860
gtcatcatcc agctgaaccg cgtgagcaac aacctcgcca agagagtcgc ccgggccatc 1920
ggtgtcgcgg agcccgagcc agacccaacc ttgtaccaca acaacaagac cgccaacgtc 1980
ggggtgttcg gcaagccgct cgccagactc gacggcctgc aggtcggggt cctcgccacc 2040
gtcaacaagc ccgactcgat caagcaggcc gccagcctga aggccagctt cgcggcggac 2100
aacgtcgacg tcaaggtcgt cgcggagcgc ctcgccgacg gcgtcgacga gacctactcg 2160
gccgccgacg cggtcaactt cgacgccatc ctggtcgcca acggcgctga gggcctcttc 2220
gcgcgcgaca gcttcaccgc caggccggcc aactcgacca ccgcgacgct ctaccccgcg 2280
ggccgcccgc tccagatcct ggtcgacggg ttccgctacg gcaagccggt cggggcgctc 2340
ggcagcggcg ccaaggcgct cgacgcagcg gagatttcga cgacccgggc cggcgtgtac 2400
gtcgccaact cgacgaccga cagcttcatc aatggcgtca gggacggtct gcggacgttc 2460
aagttcctgg accggttcgc gattgacgag gatgctgagt ga 2502
<210> 34
<211> 740
<212> PRT
<213> 金黄色嗜热子囊菌
<400> 34
Met Arg Ala Ile Gly Leu Leu Pro Gly Ile Ile Gly Ile Ala Gly Ala
1 5 10 15
Ala Cys Pro Tyr Met Thr Gly Glu Leu Pro Arg Ser Phe Ala Glu Asn
20 25 30
Pro His Ala Ile Asn Arg Arg Ala Glu Gly Gly Gly Gly Ala Ala Ala
35 40 45
Glu Thr Glu Lys Phe Leu Ser Gln Phe Tyr Leu Asn Asp Asn Asp Thr
50 55 60
Phe Met Thr Thr Asp Val Gly Gly Pro Ile Glu Asp Gln Asn Ser Leu
65 70 75 80
Ser Ala Gly Asp Arg Gly Pro Thr Leu Leu Glu Asp Phe Ile Leu Arg
85 90 95
Gln Lys Ile Gln Arg Phe Asp His Glu Arg Val Pro Glu Arg Ala Val
100 105 110
His Ala Arg Gly Ala Gly Ala His Gly Val Phe Thr Ser Tyr Ala Asp
115 120 125
Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Ser Ala Ala Gly Lys Glu
130 135 140
Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala Gly Ser Arg Gly Ser
145 150 155 160
Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr Arg Phe Tyr Thr
165 170 175
Asp Glu Gly Asn Phe Asp Ile Val Gly Asn Asn Ile Pro Val Phe Phe
180 185 190
Ile Gln Asp Ala Ile Gln Phe Pro Asp Leu Ile His Ala Val Lys Pro
195 200 205
Ser Pro Asn Asn Glu Ile Pro Gln Ala Ala Thr Ala His Asp Ser Ala
210 215 220
Trp Asp Phe Phe Ser Gln Gln Pro Ser Ser Leu His Thr Leu Phe Trp
225 230 235 240
Ala Met Ala Gly His Gly Ile Pro Arg Ser Tyr Arg Asn Met Asp Gly
245 250 255
Phe Gly Ile His Thr Phe Arg Phe Val Thr Asp Asp Gly Ala Ser Lys
260 265 270
Leu Val Lys Phe His Trp Thr Ser Leu Gln Gly Lys Ala Ser Leu Val
275 280 285
Trp Glu Glu Ala Gln Ala Val Ala Gly Lys Asn Ala Asp Tyr His Arg
290 295 300
Gln Asp Leu Trp Asp Ala Ile Glu Ala Gly Arg Tyr Pro Glu Trp Glu
305 310 315 320
Leu Gly Val Gln Ile Met Asp Glu Glu Asp Gln Leu Arg Phe Gly Phe
325 330 335
Asp Leu Leu Asp Pro Thr Lys Ile Val Pro Glu Glu Tyr Val Pro Ile
340 345 350
Thr Lys Leu Gly Lys Met Gln Leu Asn Arg Asn Pro Leu Asn Tyr Phe
355 360 365
Ala Glu Thr Glu Gln Ile Met Phe Gln Pro Gly His Val Val Arg Gly
370 375 380
Ile Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg Leu Phe Ser Tyr
385 390 395 400
Leu Asp Thr Gln Leu Asn Arg His Gly Gly Pro Asn Phe Glu Gln Ile
405 410 415
Pro Ile Asn Arg Pro Arg Thr Pro Ile His Asn Asn Asn Arg Asp Gly
420 425 430
Ala Ala Gln Met Tyr Ile Pro Leu Asn Lys Ala Ala Tyr Thr Pro Asn
435 440 445
Thr Leu Asn Asn Gly Ser Pro Lys Gln Ala Asn Gln Thr Val Gly Lys
450 455 460
Gly Phe Phe Thr Thr Pro Gly Arg Thr Ala Ser Gly Arg Leu Val Arg
465 470 475 480
Ala Val Ser Ser Thr Phe Ala Asp Val Trp Ser Gln Pro Arg Leu Phe
485 490 495
Tyr Asn Ser Leu Val Pro Ala Glu Gln Gln Phe Leu Ile Asn Ala Ile
500 505 510
Arg Phe Glu Thr Ala His Ile Thr Ser Asp Val Val Lys Asn Asn Val
515 520 525
Ile Ile Gln Leu Asn Arg Val Ser Asn Asn Leu Ala Lys Arg Val Ala
530 535 540
Arg Ala Ile Gly Val Ala Glu Pro Glu Pro Asp Pro Thr Leu Tyr His
545 550 555 560
Asn Asn Lys Thr Ala Asn Val Gly Val Phe Gly Lys Pro Leu Ala Arg
565 570 575
Leu Asp Gly Leu Gln Val Gly Val Leu Ala Thr Val Asn Lys Pro Asp
580 585 590
Ser Ile Lys Gln Ala Ala Ser Leu Lys Ala Ser Phe Ala Ala Asp Asn
595 600 605
Val Asp Val Lys Val Val Ala Glu Arg Leu Ala Asp Gly Val Asp Glu
610 615 620
Thr Tyr Ser Ala Ala Asp Ala Val Asn Phe Asp Ala Ile Leu Val Ala
625 630 635 640
Asn Gly Ala Glu Gly Leu Phe Ala Arg Asp Ser Phe Thr Ala Arg Pro
645 650 655
Ala Asn Ser Thr Thr Ala Thr Leu Tyr Pro Ala Gly Arg Pro Leu Gln
660 665 670
Ile Leu Val Asp Gly Phe Arg Tyr Gly Lys Pro Val Gly Ala Leu Gly
675 680 685
Ser Gly Ala Lys Ala Leu Asp Ala Ala Glu Ile Ser Thr Thr Arg Ala
690 695 700
Gly Val Tyr Val Ala Asn Ser Thr Thr Asp Ser Phe Ile Asn Gly Val
705 710 715 720
Arg Asp Gly Leu Arg Thr Phe Lys Phe Leu Asp Arg Phe Ala Ile Asp
725 730 735
Glu Asp Ala Glu
740
<210> 35
<211> 3060
<212> DNA
<213> 烟曲霉
<400> 35
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtgactgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
ggcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgccg agttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt tacatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210> 36
<211> 863
<212> PRT
<213> 烟曲霉
<400> 36
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Asp Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 37
cgcaatctat cgaatagcag 20
<210> 38
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 38
ctacatcgaa gctgaaagca cgaga 25
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 39
cgcaatctat cgaatagcag 20
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 40
gacgtgcaac ttccttcaaa c 21
<210> 41
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 41
cttctatctt gggatgcttc acgatacgtg a 31
<210> 42
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 42
cgcgcccttg aatatcggag aaggt 25
<210> 43
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 43
atagtcaacc gcggactgcg caccatgcgg tctctcctgg ctcttgcccc 50
<210> 44
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 44
tcaggctttc gccacggagc ttaattaatt agaaagaggg gttggcgttg 50
<210> 45
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 45
agatcaccct ctgtgtattg caccatgcgg tctctcctgg ctcttgcccc t 51
<210> 46
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 46
ccggtcacga aagccttaat taactattag aaagaggggt tggcgttggt aag 53
<210> 47
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 47
gcttaggccc ttaagcttag gccggcttgc ttact 35
<210> 48
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 48
aggggcaaga gccaggagag accgcatggt gcaatacaca gagggtgatc ttacaagc 58
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 49
ctctatagag gaatcagcgt 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 50
tacacctcgg acgagtattc 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 51
tctagaggca cactagctgc 20
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 52
ggcatgacct tttgatgatc g 21
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 53
ttacaacgta cctacctagt 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 54
ctctatagag gaatcagcgt 20
<210> 55
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 55
cgtgtccccg atatggggtc gtggg 25
<210> 56
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 56
tcttgagccg catcgcatag a 21
<210> 57
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 57
tacggtcagc gctcatgcga a 21
<210> 58
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 58
atagtcaacc gcggactgcg caccatggcc agcctcttct ctttcaagat g 51
<210> 59
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 59
caggctttcg ccacggagct taattaatta caggcactgg tagtagtagg ggttc 55
<210> 60
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 60
cagttgggtg cacgagtggg ttacatcgaa ctgg 34
<210> 61
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 61
gaaagagaag aggctggcca tggtgcgcag tccgcggttg actattg 47
<210> 62
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 62
caatagtcaa ccgcggactg cgcaccatgg ccagcctctt ctctttc 47
<210> 63
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 63
gcgtcaggct ttcgccacgg agc 23
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 64
gtaatttgcc tgcttgaccg 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 65
tgaagatctg gtaggttgtg 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 66
tcattgactg tctgtcctct 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 67
taccatgact gtcacgatag 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 68
gtaatttgcc tgcttgaccg 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 69
tgaagatctg gtaggttgtg 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 70
cgagatgacg gccaacttcc 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 71
tcattgactg tctgtcctct 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 72
ggaagttggc cgtcatctcg 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 73
taccatgact gtcacgatag 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 74
ttccccaacc acgaccacct 20
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 75
taccatgact gtcacgatag 20
<210> 76
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 76
ggcatgacct tttgatgatc g 21
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 77
taccatgact gtcacgatag 20
<210> 78
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 78
aatgacccat agggagacaa acagcataat 30
<210> 79
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 79
tgttggacgc aggattttgg a 21
<210> 80
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 80
cgctgaaatg cgcccgccac ct 22
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 81
gggcggacag acggggcaaa 20
<210> 82
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 82
cgctgaaatg cgcccgccac ct 22
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 83
cgttctcgcc ggcgtttgcc 20
<210> 84
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 84
cagagaaagg tagctggaga gc 22
<210> 85
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 85
gtccatttcg attccgcata g 21
<210> 86
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 86
atcaccctct gtgtattgca ccatgctgtc ttcgacgact cgc 43
<210> 87
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 87
gcccggtcac gaaagcctta tcgacttctt ctagaacgtc ggc 43
<210> 88
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 88
gccgacgttc tagaagaagt cgataaggct ttcgtgaccg ggc 43
<210> 89
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 89
caggtgtcag tcacctctag ttaattaact cggagttgtt atacgctact cg 52
<210> 90
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 90
tataagctta agcatgcgtt cctcccccct c 31
<210> 91
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 91
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210> 92
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 92
acgcgtcgac gaattctagg ctaggtatgc gaggca 36
<210> 93
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 93
catggtgcaa tacacagagg gtg 23
<210> 94
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 94
gtgtattgca ccatggcgtt cctcccccct cc 32
<210> 95
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 95
ggagggggga ggaacgccat ggtgcaatac a 31
<210> 96
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 96
ccctctgtgt attgcaccat gatgactccc acggcgat 38
<210> 97
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 97
gatctgcggc cgcgaatttt attgctgcag cacccccg 38
<210> 98
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 98
ccgcggactg cgcaccatgg tccatctttc ttccct 36
<210> 99
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 99
ttcgccacgg agcttattac aggcactggt agtagt 36
<210> 100
<211> 2223
<212> DNA
<213> 金黄色嗜热子囊菌
<400> 100
atgcgagcaa tcggcttgtt gcctggcatc atcggtatcg cgggtgccgc atgtccctac 60
atgacaggcg agctccctcg gtcgttcgcc gaaaaccctc acgccattaa caggcgagcg 120
gagggaggag gaggcgcagc agccgaaaca gaaaagttct tgtcccagtt ctatttgaac 180
gataacgaca cgttcatgac tacggatgtc ggtggaccga ttgaggacca gaactccctc 240
tcggcaggag atcgaggacc caccctcttg gaagatttca tcctccgtca gaaaattcag 300
cggttcgacc acgaaagggt gccggaacgc gcagtccatg cccgaggcgc aggtgcccat 360
ggcgtgttca cttcctacgc agactggtcg aacatcactg cagcgtcgtt cctctccgca 420
gcaggcaagg agacacccgt gttcgtcagg ttctcgactg tggcaggctc caggggatcg 480
gcagacactg cacgcgatgt ccatggtttc gccacaaggt tctataccga tgagggtaac 540
ttcgatatcg tgggcaacaa cattcccgtc ttcttcatcc aggacgccat ccagttcccc 600
gacttgatcc atgcggtgaa gccgtcgccc aacaacgaaa ttcctcaggc agccacagca 660
cacgattcgg catgggactt cttctcgcag cagccgtcgt cgttgcatac cctcttctgg 720
gccatggcag gacacggaat tcctcggtcc tatcgaaaca tggacggatt cggcatccac 780
accttcaggt tcgtcacaga cgatggagcg tcgaagttgg tgaagttcca ctggacctcc 840
ctccagggca aggcgtcgtt ggtctgggaa gaagcacagg ccgtcgcagg caaaaacgcc 900
gattaccaca ggcaggattt gtgggatgcg atcgaagcag gacgctatcc tgaatgggaa 960
ttgggtgtgc agatcatgga cgaagaagac cagttgcggt tcggattcga tttgttggac 1020
cctaccaaga tcgtccccga agaatacgtc cccatcacca aattgggcaa gatgcagttg 1080
aaccgtaacc cgttgaacta tttcgcggaa actgaacaga ttatgttcca gcctggccac 1140
gtggtgaggg gcatcgattt caccgaggac cctttgctcc agggccggtt gttctcgtac 1200
ctcgacaccc agctcaaccg gcatggcgga cccaacttcg agcagattcc catcaaccga 1260
cctcgcactc cgatccataa caacaacagg gatggtgcag cacagatgta catccccttg 1320
aacaaggcag cgtacactcc caacacgctc aacaacggtt cgcccaagca ggcgaaccag 1380
actgtgggca agggcttctt caccactcct ggacgcactg cctccggcag gctcgtccga 1440
gcggtctcgt cgactttcgc ggacgtctgg tcgcagccca ggctcttcta caactcgctc 1500
gtgcctgccg aacagcagtt cctcattaac gcaatccgat tcgagacggc ccacattacg 1560
tcggatgtgg tcaagaacaa cgtgatcatc cagctcaacc gagtctccaa caacttggcg 1620
aaacgggtgg caagggcgat cggcgtggcc gagcccgaac ccgaccccac cttgtaccac 1680
aacaacaaga cagcaaacgt gggcgtgttc ggaaagccgt tggccaggct cgacggattg 1740
caggtcggcg tcctcgcaac cgtcaacaag ccggactcca tcaagcaggc agcctccctc 1800
aaggcctcgt tcgcagcaga taacgtcgac gtcaaagtcg tcgcggagag gctcgcagat 1860
ggcgtggacg aaacctactc cgcagccgat gccgtcaact tcgacgcgat cctcgtggca 1920
aacggagccg agggattgtt cgcacgggac tcgttcacag cacgccctgc aaactcgacc 1980
actgccacac tctaccctgc aggccgaccg ctccagattt tggtggacgg attcaggtac 2040
ggcaagcctg tgggtgcact cggatcggga gcaaaggccc tcgatgcagc cgaaatctcg 2100
actacaaggg caggcgtcta tgtcgcgaac tcgacaaccg attccttcat caacggtgtc 2160
agggacggcc tccgtacttt caaattcctc gatcgcttcg ccatcgacga agacgccgag 2220
tga 2223
<210> 101
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 101
cggactgcgc accatgcgag caatcggctt gtt 33
<210> 102
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 102
tcgccacgga gcttatcact cggcgtcttc gtcga 35
<210> 103
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 103
cggactgcgc accatgcgta ccttctcgtc tctt 34
<210> 104
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 104
tcgccacgga gcttatcaag ccgcaagagc agacg 35
<210> 105
<211> 1008
<212> DNA
<213> 金黄色嗜热子囊菌
<400> 105
atgaagctcg gctctctcgt gctcgctctc agcgcagcta ggcttacact gtcggcccct 60
ctcgcagaca gaaagcagga gaccaagcgt gcgaaagtat tccaatggtt cggttcgaac 120
gagtccggtg ctgaattcgg aagccagaac cttccaggag tcgagggaaa ggattatata 180
tggcctgatc ccaacaccat tgacacattg atcagcaagg ggatgaacat ctttcgtgtc 240
ccctttatga tggagagatt ggttcccaac tcaatgaccg gctctccgga tccgaactac 300
ctggcagatc tcatagcgac tgtaaatgca atcacccaga aaggtgccta cgccgtcgtc 360
gatcctcata actacggcag atactacaat tctataatct cgagcccttc cgatttccag 420
accttctgga aaacggtcgc ctcacagttt gcttcgaatc cactggtcat cttcgacact 480
aataacgaat accacgatat ggaccagacc ttagtcctca atctcaacca ggccgctatc 540
gacggcatcc gttccgccgg agccacttcc cagtacatct ttgtcgaggg caattcgtgg 600
accggggcat ggacctggac gaacgtgaac gataacatga aaagcctgac cgacccatct 660
gacaagatca tatacgagat gcaccagtac ctggactctg acggatccgg gacatcagcg 720
acctgcgtat cttcgaccat cggtcaagag cgaatcacca gcgcaacgca gtggctcagg 780
gccaacggga agaagggcat catcggcgag tttgcgggcg gagccaacga cgtctgcgag 840
acggccatca cgggcatgct ggactacatg gcccagaaca cagacgtctg gactggcgcc 900
atctggtggg cggccgggcc gtggtgggga gactacatat tctccatgga gccggacaat 960
ggcatcgcgt atcagcagat acttcctatt ttgactccgt atctttga 1008
<210> 106
<211> 335
<212> PRT
<213> 金黄色嗜热子囊菌
<400> 106
Met Lys Leu Gly Ser Leu Val Leu Ala Leu Ser Ala Ala Arg Leu Thr
1 5 10 15
Leu Ser Ala Pro Leu Ala Asp Arg Lys Gln Glu Thr Lys Arg Ala Lys
20 25 30
Val Phe Gln Trp Phe Gly Ser Asn Glu Ser Gly Ala Glu Phe Gly Ser
35 40 45
Gln Asn Leu Pro Gly Val Glu Gly Lys Asp Tyr Ile Trp Pro Asp Pro
50 55 60
Asn Thr Ile Asp Thr Leu Ile Ser Lys Gly Met Asn Ile Phe Arg Val
65 70 75 80
Pro Phe Met Met Glu Arg Leu Val Pro Asn Ser Met Thr Gly Ser Pro
85 90 95
Asp Pro Asn Tyr Leu Ala Asp Leu Ile Ala Thr Val Asn Ala Ile Thr
100 105 110
Gln Lys Gly Ala Tyr Ala Val Val Asp Pro His Asn Tyr Gly Arg Tyr
115 120 125
Tyr Asn Ser Ile Ile Ser Ser Pro Ser Asp Phe Gln Thr Phe Trp Lys
130 135 140
Thr Val Ala Ser Gln Phe Ala Ser Asn Pro Leu Val Ile Phe Asp Thr
145 150 155 160
Asn Asn Glu Tyr His Asp Met Asp Gln Thr Leu Val Leu Asn Leu Asn
165 170 175
Gln Ala Ala Ile Asp Gly Ile Arg Ser Ala Gly Ala Thr Ser Gln Tyr
180 185 190
Ile Phe Val Glu Gly Asn Ser Trp Thr Gly Ala Trp Thr Trp Thr Asn
195 200 205
Val Asn Asp Asn Met Lys Ser Leu Thr Asp Pro Ser Asp Lys Ile Ile
210 215 220
Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Ala
225 230 235 240
Thr Cys Val Ser Ser Thr Ile Gly Gln Glu Arg Ile Thr Ser Ala Thr
245 250 255
Gln Trp Leu Arg Ala Asn Gly Lys Lys Gly Ile Ile Gly Glu Phe Ala
260 265 270
Gly Gly Ala Asn Asp Val Cys Glu Thr Ala Ile Thr Gly Met Leu Asp
275 280 285
Tyr Met Ala Gln Asn Thr Asp Val Trp Thr Gly Ala Ile Trp Trp Ala
290 295 300
Ala Gly Pro Trp Trp Gly Asp Tyr Ile Phe Ser Met Glu Pro Asp Asn
305 310 315 320
Gly Ile Ala Tyr Gln Gln Ile Leu Pro Ile Leu Thr Pro Tyr Leu
325 330 335

Claims (25)

1.一种酶组合物,该酶组合物包括:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶;
其中该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:2的成熟多肽或由其组成的纤维二糖水解酶I;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶I,该氨基酸序列与SEQ ID NO:2的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸包含SEQ ID NO:1的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交;
其中该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的纤维二糖水解酶II;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶II,该氨基酸序列与SEQ ID NO:4的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸包含SEQ ID NO:3的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交;
其中该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:6的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:6的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸包含SEQ ID NO:5的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交;
其中该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:10的成熟多肽或由其组成的、或包含SEQ ID NO:12的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:10的成熟多肽或SEQ ID NO:12的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的木聚糖酶,该多核苷酸包含SEQ ID NO:9的成熟多肽编码序列或由其组成或者包含SEQ ID NO:11的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列或者其全长互补体杂交;并且
其中该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:14的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:14的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸包含SEQ ID NO:13的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:13的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交。
2.根据权利要求1所述的酶组合物,其中该具有纤维素分解增强活性的AA9多肽选自下组,该组由以下各项组成:(i)具有纤维素分解增强活性的AA9多肽,该多肽包含SEQ ID NO:8的成熟多肽或由其组成;(ii)具有纤维素分解增强活性的AA9多肽,该多肽包含如下氨基酸序列或由其组成,该氨基酸序列与SEQ ID NO:8的成熟多肽具有至少70%序列一致性;(iii)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸包含SEQ ID NO:7的成熟多肽编码序列或由其组成;(iv)具有纤维素分解增强活性的AA9多肽,该多肽由包含以下核苷酸序列或由其组成的多核苷酸编码,该核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有至少70%序列一致性;和(v)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸在至少高严格条件下与SEQ ID NO:7的成熟多肽编码序列或其全长互补体杂交。
3.根据权利要求1或2所述的酶组合物,其中该β-葡糖苷酶变体包括选自下组的对应于SEQ ID NO:6或其成熟多肽的一个或多个取代,该组由以下各项组成:F100D、S283G、N456E、和F512Y。
4.根据权利要求3所述的酶组合物,其中该变体包括SEQ ID NO:36或其成熟多肽或者由其组成。
5.根据权利要求1-4中任一项所述的酶组合物,其包括纤维二糖水解酶I、纤维二糖水解酶II、和β-葡糖苷酶或其变体;纤维二糖水解酶I、纤维二糖水解酶II、和具有纤维素分解增强活性的AA9多肽;纤维二糖水解酶I、纤维二糖水解酶II、和GH10木聚糖酶;纤维二糖水解酶I、纤维二糖水解酶II、和β-木糖苷酶;纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和具有纤维素分解增强活性的AA9多肽;纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和GH10木聚糖酶;纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、和β-木糖苷酶;纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、和GH10木聚糖酶;纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、和β-木糖苷酶;纤维二糖水解酶I、纤维二糖水解酶II、GH10木聚糖酶、和β-木糖苷酶;纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、和GH10木聚糖酶;纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、和β-木糖苷酶;纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、GH10木聚糖酶、和β-木糖苷酶;纤维二糖水解酶I、纤维二糖水解酶II、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶;或纤维二糖水解酶I、纤维二糖水解酶II、β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶、和β-木糖苷酶。
6.根据权利要求1-5中任一项所述的酶组合物,其中该酶组合物进一步包括一种或多种选自下组的酶,该组由以下各项组成:内切葡聚糖酶I、内切葡聚糖酶II、纤维二糖水解酶I、纤维二糖水解酶II、纤维二糖水解酶III、β-葡糖苷酶、具有纤维素分解增强活性的AA9多肽、纤维素诱导蛋白、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木聚糖酶、木糖苷酶、葡糖醛酸糖苷酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀素。
7.根据权利要求6所述的酶组合物,其中该内切葡聚糖酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:16的成熟多肽或由其组成的内切葡聚糖酶I;(ii)包含如下氨基酸序列或由其组成的内切葡聚糖酶I,该氨基酸序列与SEQ ID NO:16的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸包含SEQ IDNO:15的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶I,该核苷酸序列与SEQ ID NO:15的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸在至少高严格条件下与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交;并且
其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:18的成熟多肽或由其组成的内切葡聚糖酶II;(ii)包含如下氨基酸序列或由其组成的内切葡聚糖酶II,该氨基酸序列与SEQ ID NO:18的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸包含SEQ ID NO:17的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:17的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交;或其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:106的成熟多肽或由其组成的内切葡聚糖酶II;(ii)包含如下氨基酸序列或由其组成的内切葡聚糖酶II,该氨基酸序列与SEQ ID NO:106的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸包含SEQ IDNO:105的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:105的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:105的成熟多肽编码序列或其全长互补体杂交。
8.根据权利要求6或7所述的酶组合物,其中该过氧化氢酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:34的成熟多肽或由其组成的过氧化氢酶;(ii)与SEQ ID NO:34的成熟多肽具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的过氧化氢酶;(iii)由包含以下核苷酸序列或由其组成的多核苷酸编码的过氧化氢酶,该核苷酸序列与SEQ ID NO:33的成熟多肽编码序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和(iv)由如下多核苷酸编码的过氧化氢酶,该多核苷酸在至少高严格条件下,例如,非常高严格条件下,与SEQ ID NO:33的成熟多肽编码序列或其全长互补体杂交。
9.根据权利要求1-8中任一项所述的酶组合物,其进一步包括木霉属全培养液制剂(例如,里氏木霉全培养液制剂);毁丝霉属全培养液制剂(例如,嗜热毁丝霉全培养液制剂);埃默森篮状菌全培养液制剂;或其组合。
10.根据权利要求1-9中任一项所述的酶组合物,该酶组合物是发酵液配制品或细胞组合物。
11.一种重组真菌宿主细胞,包含编码酶组合物的多核苷酸,该酶组合物包含:(A)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,和(iii)至少一种选自下组的酶,该组由以下各项组成:β-葡糖苷酶或其变体、具有纤维素分解增强活性的AA9多肽、GH10木聚糖酶和β-木糖苷酶;(B)(i)GH10木聚糖酶和(ii)β-木糖苷酶;或(C)(i)纤维二糖水解酶I,(ii)纤维二糖水解酶II,(iii)GH10木聚糖酶,和(iv)β-木糖苷酶;
其中该纤维二糖水解酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:2的成熟多肽或由其组成的纤维二糖水解酶I;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶I,该氨基酸序列与SEQ ID NO:2的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸包含SEQ ID NO:1的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交;
其中该纤维二糖水解酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:4的成熟多肽或由其组成的纤维二糖水解酶II;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶II,该氨基酸序列与SEQ ID NO:4的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸包含SEQ ID NO:3的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下,例如非常高严格条件下,与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交;
其中该β-葡糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:6的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:6的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸包含SEQ ID NO:5的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交;
其中该木聚糖酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:10的成熟多肽或由其组成的、或包含SEQ ID NO:12的成熟多肽或由其组成的木聚糖酶;(ii)包含如下氨基酸序列或由其组成的木聚糖酶,该氨基酸序列与SEQ ID NO:10的成熟多肽或SEQ ID NO:12的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的木聚糖酶,该多核苷酸包含SEQ ID NO:9的成熟多肽编码序列或由其组成或者包含SEQ ID NO:11的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的木聚糖酶,该多核苷酸在至少高严格条件下与SEQ ID NO:9的成熟多肽编码序列或SEQ ID NO:11的成熟多肽编码序列或者其全长互补体杂交;并且
其中该β-木糖苷酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:14的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:14的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸包含SEQ ID NO:13的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:13的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交。
12.根据权利要求11所述的重组真菌宿主细胞,其中该具有纤维素分解增强活性的AA9多肽选自下组,该组由以下各项组成:(i)具有纤维素分解增强活性的AA9多肽,该多肽包含SEQ ID NO:8的成熟多肽或由其组成;(ii)具有纤维素分解增强活性的AA9多肽,该多肽包含如下氨基酸序列或由其组成,该氨基酸序列与SEQ ID NO:8的成熟多肽具有至少70%序列一致性;(iii)具有纤维素分解增强活性的AA9多肽,该多肽由包含以下核苷酸序列或由其组成的多核苷酸编码,该核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有至少70%序列一致性;(iv)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸包含SEQ ID NO:7的成熟多肽编码序列或由其组成;和(v)具有纤维素分解增强活性的AA9多肽,该多肽由如下多核苷酸编码,该多核苷酸在至少高严格条件下与SEQ ID NO:7的成熟多肽编码序列或其全长互补体杂交。
13.根据权利要求11或12所述的重组真菌宿主细胞,其中该β-葡糖苷酶变体包括选自下组的对应于SEQ ID NO:6或其成熟多肽的一个或多个取代,该组由以下各项组成:F100D、S283G、N456E、和F512Y。
14.根据权利要求13所述的重组真菌宿主细胞,其中该变体包括SEQ ID NO:36或其成熟多肽或者由其组成。
15.根据权利要求11-14中任一项所述的重组真菌宿主细胞,其进一步包括一种或多种多核苷酸,该一种或多种多核苷酸编码一种或多种选自下组的酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶、具有纤维素分解增强活性的AA9多肽、纤维素诱导蛋白、木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、葡糖醛酸糖苷酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀蛋白。
16.根据权利要求15所述的重组真菌宿主细胞,其中该内切葡聚糖酶I选自下组,该组由以下各项组成:(i)包含SEQ ID NO:16的成熟多肽或由其组成的内切葡聚糖酶I;(ii)包含如下氨基酸序列或由其组成的内切葡聚糖酶I,该氨基酸序列与SEQ ID NO:16的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸包含SEQ ID NO:15的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶I,该核苷酸序列与SEQ ID NO:15的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的内切葡聚糖酶I,该多核苷酸在至少高严格条件下与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交;并且
其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:18的成熟多肽或由其组成的内切葡聚糖酶II;(ii)包含如下氨基酸序列或由其组成的内切葡聚糖酶II,该氨基酸序列与SEQ ID NO:18的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸包含SEQ ID NO:17的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:17的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交;或其中该内切葡聚糖酶II选自下组,该组由以下各项组成:(i)包含SEQ ID NO:106的成熟多肽或由其组成的内切葡聚糖酶II;(ii)包含如下氨基酸序列或由其组成的内切葡聚糖酶II,该氨基酸序列与SEQ ID NO:106的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸包含SEQ IDNO:105的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的内切葡聚糖酶II,该核苷酸序列与SEQ ID NO:105的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的内切葡聚糖酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:105的成熟多肽编码序列或其全长互补体杂交。
17.根据权利要求15或16所述的重组真菌宿主细胞,其中该过氧化氢酶选自下组,该组由以下各项组成:(i)包含SEQ ID NO:34的成熟多肽或由其组成的过氧化氢酶;(ii)包含如下氨基酸序列或由其组成的过氧化氢酶,该氨基酸序列与SEQ ID NO:34的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的过氧化氢酶,该多核苷酸包含SEQ ID NO:33的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的过氧化氢酶,该核苷酸序列与SEQ ID NO:33的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的过氧化氢酶,该多核苷酸在至少高严格条件下与SEQ IDNO:33的成熟多肽编码序列或其全长互补体杂交。
18.根据权利要求11-17中任一项所述的重组真菌宿主细胞,其中对于该真菌宿主细胞而言为内源性的一种或多种纤维素酶基因、一种或多种半纤维素酶基因、或它们的组合已经被灭活。
19.根据权利要求18所述的重组真菌宿主细胞,其中该灭活的一种或多种纤维素酶基因选自下组,该组由以下各项组成:纤维二糖水解酶I基因、纤维二糖水解酶II基因、以及β-葡糖苷酶基因;
其中该灭活的纤维二糖水解酶I基因选自下组,该组由以下各项组成:(i)包含SEQ IDNO:20的成熟多肽或由其组成的纤维二糖水解酶I;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶I,该氨基酸序列与SEQ ID NO:20的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸包含SEQ ID NO:19的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶I,该核苷酸序列与SEQ ID NO:19的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的纤维二糖水解酶I,该多核苷酸在至少高严格条件下与SEQ IDNO:19的成熟多肽编码序列或其全长互补体杂交;
其中该灭活的纤维二糖水解酶II基因选自下组,该组由以下各项组成:(i)包含SEQ IDNO:22的成熟多肽或由其组成的纤维二糖水解酶I;(ii)包含如下氨基酸序列或由其组成的纤维二糖水解酶II,该氨基酸序列与SEQ ID NO:22的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸包含SEQ ID NO:21的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的纤维二糖水解酶II,该核苷酸序列与SEQ ID NO:21的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的纤维二糖水解酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交;
其中该灭活的纤维素酶基因是选自下组的β-葡糖苷酶基因,该组由以下各项组成:(i)包含SEQ ID NO:24的成熟多肽或由其组成的β-葡糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-葡糖苷酶,该氨基酸序列与SEQ ID NO:24的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸包含SEQ ID NO:23的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-葡糖苷酶,该核苷酸序列与SEQ ID NO:23的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的β-葡糖苷酶,该多核苷酸在至少高严格条件下与SEQ ID NO:23的成熟多肽编码序列或其全长互补体杂交。
20.根据权利要求18或19所述的重组真菌宿主细胞,其中该灭活的一种或多种半纤维素酶基因选自下组,该组由以下各项组成:木聚糖酶I基因、木聚糖酶II基因、木聚糖酶III基因、和β-木糖苷酶基因;
其中该灭活的木聚糖酶I基因选自下组,该组由以下各项组成:(i)包含SEQ ID NO:26的成熟多肽或由其组成的木聚糖酶I;(ii)包含如下氨基酸序列或由其组成的木聚糖酶I,该氨基酸序列与SEQ ID NO:26的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的木聚糖酶I,该多核苷酸包含SEQ ID NO:25的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶I,该核苷酸序列与SEQ IDNO:25的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的木聚糖酶I,该多核苷酸在至少高严格条件下与SEQ ID NO:25的成熟多肽编码序列或其全长互补体杂交;
其中该灭活的木聚糖酶II基因选自下组,该组由以下各项组成:(i)包含SEQ ID NO:28的成熟多肽或由其组成的木聚糖酶II;(ii)包含如下氨基酸序列或由其组成的木聚糖酶II,该氨基酸序列与SEQ ID NO:28的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的木聚糖酶II,该多核苷酸包含SEQ ID NO:27的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶II,该核苷酸序列与SEQ ID NO:27的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的木聚糖酶II,该多核苷酸在至少高严格条件下与SEQ ID NO:27的成熟多肽编码序列或其全长互补体杂交;
其中该灭活的木聚糖酶III基因选自下组,该组由以下各项组成:(i)包含SEQ ID NO:30的成熟多肽或由其组成的木聚糖酶III;(ii)包含如下氨基酸序列或由其组成的木聚糖酶III,该氨基酸序列与SEQ ID NO:30的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的木聚糖酶III,该多核苷酸包含SEQ ID NO:29的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的木聚糖酶III,该核苷酸序列与SEQ ID NO:29的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的木聚糖酶III,该多核苷酸在至少高严格条件下与SEQ ID NO:29的成熟多肽编码序列或其全长互补体杂交;并且
其中该灭活的β-木糖苷酶基因选自下组,该组由以下各项组成:(i)包含SEQ ID NO:32的成熟多肽或由其组成的β-木糖苷酶;(ii)包含如下氨基酸序列或由其组成的β-木糖苷酶,该氨基酸序列与SEQ ID NO:32的成熟多肽具有至少70%序列一致性;(iii)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸包含SEQ ID NO:31的成熟多肽编码序列或由其组成;(iv)由包含如下核苷酸序列或由其组成的多核苷酸编码的β-木糖苷酶,该核苷酸序列与SEQ ID NO:31的成熟多肽编码序列具有至少70%序列一致性;和(v)由如下多核苷酸编码的β-木糖苷酶,该多核苷酸在至少高严格条件下与SEQ ID NO:31的成熟多肽编码序列或其全长互补体杂交。
21.一种生产酶组合物的方法,该方法包含:(a)在有益于生产该酶组合物的条件下培养如权利要求11-20中任一项所述的重组真菌宿主细胞中的一种或多种;并且任选地(b)回收该酶组合物。
22.一种用于降解纤维素或半纤维素材料的方法,该方法包括:用如权利要求1-10中任一项所述的酶组合物处理该纤维素或半纤维素材料。
23.一种用于生产发酵产物的方法,该方法包括:(a)用如权利要求1-10中任一项所述的酶组合物糖化纤维素或半纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素或半纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
24.一种发酵纤维素或半纤维素材料的方法,该方法包括:用一种或多种发酵微生物发酵该纤维素或半纤维素材料,其中用如权利要求1-10中任一项所述的酶组合物糖化该纤维素或半纤维素材料。
25.如权利要求24所述的方法,其中发酵该纤维素或半纤维素材料产生发酵产物并且进一步包括从该发酵回收该发酵产物。
CN201580029529.9A 2014-06-06 2015-06-04 酶组合物及其用途 Pending CN106488982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211411284.4A CN115975994A (zh) 2014-06-06 2015-06-04 酶组合物及其用途

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462009018P 2014-06-06 2014-06-06
US62/009,018 2014-06-06
US201462093230P 2014-12-17 2014-12-17
US62/093,230 2014-12-17
PCT/US2015/034179 WO2015187935A1 (en) 2014-06-06 2015-06-04 Enzyme compositions and uses thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211411284.4A Division CN115975994A (zh) 2014-06-06 2015-06-04 酶组合物及其用途

Publications (1)

Publication Number Publication Date
CN106488982A true CN106488982A (zh) 2017-03-08

Family

ID=53434485

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580029529.9A Pending CN106488982A (zh) 2014-06-06 2015-06-04 酶组合物及其用途
CN202211411284.4A Pending CN115975994A (zh) 2014-06-06 2015-06-04 酶组合物及其用途

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202211411284.4A Pending CN115975994A (zh) 2014-06-06 2015-06-04 酶组合物及其用途

Country Status (7)

Country Link
US (3) US10273515B2 (zh)
EP (1) EP3152315B1 (zh)
CN (2) CN106488982A (zh)
AU (2) AU2015269381B2 (zh)
DK (1) DK3152315T3 (zh)
MY (1) MY182924A (zh)
WO (1) WO2015187935A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2668266T3 (en) * 2011-01-26 2018-03-26 Novozymes Inc POLYPEPTIDES WITH CELLOBIO HYDROASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM
AU2012298713B2 (en) * 2011-08-24 2017-11-23 Novozymes, Inc. Methods for obtaining positive transformants of a filamentous fungal host cell
BR112014004190A2 (pt) 2011-08-24 2017-03-01 Novozymes Inc método para construir uma cepa fúngida filamentosa, cepa fúngida filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem
CA3019297A1 (en) * 2016-03-31 2017-10-05 Toray Industries, Inc. Method for producing protein
WO2019185681A1 (en) * 2018-03-28 2019-10-03 Dsm Ip Assets B.V. Enzyme composition
EP3894551A1 (en) * 2018-12-12 2021-10-20 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
EP4028536A1 (en) 2019-09-10 2022-07-20 DSM IP Assets B.V. Enzyme composition
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
BR112023020448A2 (pt) 2021-04-06 2023-11-21 Dsm Ip Assets Bv Composição enzimática
US20240218410A1 (en) 2021-04-06 2024-07-04 Dsm Ip Assets B.V. Enzyme composition
US20240218341A1 (en) 2021-04-06 2024-07-04 Dsm Ip Assets B.V. Enzyme composition
AU2022253636B2 (en) 2021-04-08 2024-09-19 Versalis S.P.A. Process for the preparation of a sugar product and a fermentation product

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102762714A (zh) * 2009-12-18 2012-10-31 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
WO2013019827A2 (en) * 2011-08-04 2013-02-07 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
CN102947442A (zh) * 2009-11-06 2013-02-27 诺维信股份有限公司 用于糖化纤维素材料的组合物
WO2013028912A2 (en) * 2011-08-24 2013-02-28 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell
CN103221538A (zh) * 2010-10-01 2013-07-24 诺维信股份有限公司 β-葡糖苷酶变体及其编码多核苷酸
CN103517985A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103517986A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103562382A (zh) * 2011-03-25 2014-02-05 诺维信公司 用于降解或转化纤维素材料的方法

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
DK0477280T3 (zh) 1989-06-13 1997-02-10 Genencor Int
CN1192108C (zh) 1994-06-03 2005-03-09 诺沃奇梅兹生物技术有限公司 纯化的毁丝霉属漆酶及编码该酶的核酸
EP0777737B1 (en) 1994-06-30 2005-05-04 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
US5646025A (en) 1995-05-05 1997-07-08 Novo Nordisk A/S Scytalidium catalase gene
JP3792725B2 (ja) 1996-01-19 2006-07-05 ノボザイムス,インコーポレイティド 糸状菌の形態変異体
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
DE69922978T2 (de) 1998-10-06 2005-12-08 Emalfarb, Mark Aaron, Jupiter Transformationsystem in filamentösen fungiziden chrysosporium-wirtszellen
DK1124949T3 (da) 1998-10-26 2006-11-06 Novozymes As Konstruktion og screening af et DNA-bibliotek af interesse i trådformede svampeceller
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
JP4620253B2 (ja) 1999-03-22 2011-01-26 ノボザイムス,インコーポレイティド 菌類細胞中で遺伝子を発現させるためのプロモーター
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
AU2002211665B2 (en) 2000-10-12 2005-10-20 Exelixis, Inc. Human Ect2 and methods of use
EP1395653A2 (en) 2001-05-18 2004-03-10 Novozymes A/S Polypeptides having cellobiase activity and polynucleotides encoding same
DE60325457D1 (de) 2002-01-23 2009-02-05 Royal Nedalco B V Fermentation von pentosezuckern
CN1836038B (zh) 2003-05-02 2011-04-06 诺维信股份有限公司 制备分泌型多肽的方法
WO2005047499A1 (en) 2003-10-28 2005-05-26 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
US8716023B2 (en) 2003-12-09 2014-05-06 Novozymes, Inc. Methods for eliminating or reducing the expression of a genes in a filamentous fungal strains
ES2469840T3 (es) 2004-01-30 2014-06-20 Novozymes Inc. Polip�ptidos con actividad de mejora celulol�tica y polinucle�tidos que los codifican
DK1733033T3 (da) 2004-02-06 2012-09-24 Novozymes Inc Polypeptider med cellulolytisk forbedrende aktivitet og polynukleotider, der koder for disse
DK176540B1 (da) 2004-09-24 2008-07-21 Cambi Bioethanol Aps Fremgangsmåde til behandling af biomasse og organisk affald med henblik på at udvinde önskede biologisk baserede produkter
WO2006110900A2 (en) 2005-04-12 2006-10-19 E. I. Du Pont De Nemours And Company Treatment of biomass to obtain ethanol
CA2623908A1 (en) 2005-09-30 2007-08-09 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
EP2010653A4 (en) 2006-04-19 2010-03-03 Novozymes North America Inc POLYPEPTIDES HAVING GLUCOAMYLASE ACTIVITY AND POLYNUCLEOTIDES ENCODING SAME
EP2121911A2 (en) 2007-01-18 2009-11-25 Danisco US, INC., Genencor Division Modified endoglucanase ii and methods of use
CN101784659B (zh) 2007-05-31 2016-05-18 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码它的多核苷酸
DK2064323T4 (da) 2007-05-31 2024-09-16 Novozymes Inc Fremgangsmåder til forøgelse af den cellulolyseforbedrende aktivitet af et polypeptid
EP2197893B1 (en) 2007-09-07 2013-07-24 Dyadic International, Inc. Novel fungal enzymes
US8455233B2 (en) 2007-12-19 2013-06-04 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US20100306881A1 (en) 2007-12-19 2010-12-02 Novozymes A/S Polypeptides having Cellulolytic Enhancing Activity and Polynucleotides Encoding Same
WO2009085864A2 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
KR20100105849A (ko) 2007-12-19 2010-09-30 노보자임스 에이/에스 셀룰로오스 가수분해 향상 활성을 가지는 폴리펩티드 및 그것을 암호화하는 폴리뉴클레오티드
EP2260105B1 (en) * 2008-02-29 2016-08-17 The Trustees Of The University Of Pennsylvania Production and use of plant degrading materials
US20110223671A1 (en) 2008-09-30 2011-09-15 Novozymes, Inc. Methods for using positively and negatively selectable genes in a filamentous fungal cell
EP2373788A1 (en) 2008-12-04 2011-10-12 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BRPI1008890A2 (pt) 2009-02-20 2015-08-25 Danisco Us Inc Formulações de caldos de fermentação
CA2763031A1 (en) 2009-05-29 2010-12-02 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
WO2011005867A1 (en) 2009-07-07 2011-01-13 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity activity and polynucleotides encoding same
EP3805348A3 (en) 2009-09-17 2021-07-14 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
ES2560805T3 (es) 2009-09-29 2016-02-22 Novozymes Inc. Polipéptidos con actividad mejoradora celulolítica y polinucleótidos que los codifican
CN102666846A (zh) 2009-09-30 2012-09-12 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
DK2483296T3 (en) 2009-09-30 2015-11-02 Novozymes Inc Polypeptides having cellulolytic enhancing activity and polynucleotides encoding them
IN2012DN03186A (zh) 2009-11-04 2015-09-25 Dsm Ip Assets Bv
CA2780198A1 (en) 2009-11-06 2011-05-12 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
BR112012033404B1 (pt) 2010-06-29 2021-05-18 Dsm Ip Assets B.V. célula recombinante, método para a preparação de um polipeptídeo, composição, método para o tratamento de um substrato que compreende material de carboidrato e uso de um polipeptídeo
WO2012021408A1 (en) 2010-08-12 2012-02-16 Novozymes, Inc. Compositions comprising a polypeptide having cellulolytic enhancing activity and a dioxy compound and uses thereof
WO2012027374A2 (en) 2010-08-23 2012-03-01 Dyadic International (Usa) Inc. Novel fungal carbohydrate hydrolases
WO2012068236A2 (en) 2010-11-16 2012-05-24 Dyadic International (Usa) Inc. Novel fungal oxidoreductases
WO2012093149A2 (en) 2011-01-06 2012-07-12 Dsm Ip Assets B.V. Novel cell wall deconstruction enzymes and uses thereof
WO2012092676A1 (en) 2011-01-06 2012-07-12 Valorbec Societe En Commandite, Representee Par Gestion Valeo S.E.C. Novel cell wall deconstruction enzymes and uses thereof
MX337985B (es) 2011-01-26 2016-03-30 Novozymes As Polipeptidos que tienen actividad de celobiohidrolasa y polinucleotidos que codifican los mismos.
EP2678352B1 (en) 2011-02-23 2017-12-06 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP3339442B1 (en) 2011-03-09 2022-05-11 Novozymes A/S Methods of increasing the cellulolytic enhancing activity of a polypeptide
US9409958B2 (en) 2011-03-10 2016-08-09 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BR112013023757A2 (pt) 2011-03-17 2017-06-06 Danisco Us Inc método para redução de viscosidade no processo de sacarificação
EP3333258A3 (en) * 2011-03-25 2018-07-25 Novozymes A/S Method for degrading or converting cellulosic material
WO2012135659A2 (en) 2011-03-31 2012-10-04 Novozymes A/S Methods for enhancing the degradation or conversion of cellulosic material
WO2012129699A1 (en) 2011-04-01 2012-10-04 Adrian Tsang Cell wall deconstruction enzymes of thermomyces lanuginosus and uses thereof
WO2012130950A1 (en) 2011-04-01 2012-10-04 Dsm Ip Assets B.V. Novel cell wall deconstruction enzymes of talaromyces thermophilus and uses thereof
WO2012146171A1 (en) 2011-04-25 2012-11-01 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN103797126A (zh) 2011-04-29 2014-05-14 诺维信股份有限公司 用于增强纤维素材料的降解或转化的方法
IN2014CN02100A (zh) 2011-08-24 2015-05-29 Novozymes Inc
DK2748314T3 (en) * 2011-08-24 2017-03-20 Novozymes Inc CELLULOLYTIC ENZYME COMPOSITIONS FROM ASPERGILLUS FUMIGATUS AND APPLICATIONS THEREOF
US20140308705A1 (en) * 2011-09-20 2014-10-16 Novozymes A/S Polypeptides Having Cellulolytic Enhancing Activity And Polynucleotides Encoding Same
EP2835431B1 (en) 2012-03-27 2017-12-20 Kanto Yakin Kogyo Co., Ltd. Heat treatment apparatus
CA2869047C (en) * 2012-03-30 2022-11-01 Novozymes North America, Inc. Processes of producing fermentation products
US8919528B2 (en) 2012-07-13 2014-12-30 Hewlett-Packard Industrial Printing Ltd. Nozzled device to align a substrate on a surface
WO2014130812A1 (en) * 2013-02-21 2014-08-28 Novozymes A/S Methods of saccharifying and fermenting a cellulosic material

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102947442A (zh) * 2009-11-06 2013-02-27 诺维信股份有限公司 用于糖化纤维素材料的组合物
CN102762714A (zh) * 2009-12-18 2012-10-31 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN103221538A (zh) * 2010-10-01 2013-07-24 诺维信股份有限公司 β-葡糖苷酶变体及其编码多核苷酸
CN103517985A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103517986A (zh) * 2011-01-26 2014-01-15 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103562382A (zh) * 2011-03-25 2014-02-05 诺维信公司 用于降解或转化纤维素材料的方法
WO2013019827A2 (en) * 2011-08-04 2013-02-07 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
WO2013028912A2 (en) * 2011-08-24 2013-02-28 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell

Also Published As

Publication number Publication date
US10570433B2 (en) 2020-02-25
CN115975994A (zh) 2023-04-18
MY182924A (en) 2021-02-05
DK3152315T3 (en) 2018-11-26
EP3152315B1 (en) 2018-08-15
AU2019206043B2 (en) 2021-10-21
US20170204441A1 (en) 2017-07-20
EP3152315A1 (en) 2017-04-12
US11174499B2 (en) 2021-11-16
AU2019206043A1 (en) 2019-08-01
US10273515B2 (en) 2019-04-30
WO2015187935A1 (en) 2015-12-10
AU2015269381A1 (en) 2016-11-24
US20190218584A1 (en) 2019-07-18
AU2015269381B2 (en) 2019-04-18
BR112016028559A2 (pt) 2018-01-30
US20200151397A1 (en) 2020-05-14

Similar Documents

Publication Publication Date Title
CN102947442B (zh) 用于糖化纤维素材料的组合物
AU2019206043B2 (en) Enzyme compositions and uses thereof
CN103958674B (zh) 具有木聚糖酶活性的多肽及其编码多核苷酸
CN102712916B (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN103221538B (zh) β-葡糖苷酶变体及其编码多核苷酸
CN105838698B (zh) 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN105164254B (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
CN108179139A (zh) 纤维素分解酶组合物及其用途
CN103703125B (zh) 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN103958672A (zh) Gh61多肽变体以及编码所述变体的多核苷酸
CN104755617B (zh) 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸
CN104245926A (zh) Gh61多肽变体以及编码其的多核苷酸
CN103958675A (zh) 具有木聚糖酶活性的多肽以及编码它们的多核苷酸
CN105452271A (zh) 木聚糖酶变体以及编码该木聚糖酶变体的多核苷酸
CN104870639A (zh) 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸
CN104039834B (zh) 具有纤维二糖水解酶活性的杂合多肽和编码它们的多核苷酸
CN105283546A (zh) 具有木聚糖酶活性的多肽以及对其进行编码的多核苷酸
CN104685052A (zh) 用于增强纤维素材料的降解或转化的方法
CN104736698A (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
CN103930438A (zh) 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸
CN104053666A (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN108467877A (zh) 用于降解或转化纤维素材料的方法
CN107002056A (zh) 碳水化合物结合模块变体以及编码它们的多核苷酸
CN104039959A (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN108350044A (zh) 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170308